pandas#

pandas ist eine Python-Bibliothek zur Datenanalyse, die in den letzten Jahren sehr populär geworden ist. Auf der Website, wird pandas so beschrieben:

»pandas ist ein schnelles, leistungsfähiges, flexibles und einfach zu bedienendes Open-Source-Tool zur Datenanalyse und -manipulation, das auf der Programmiersprache Python aufbaut.«

Genauer ist pandas ein In-Memory-Analysewerkzeug, das SQL-ähnliche Konstrukte, sowie statistische und analytische Werkzeuge bietet. Dabei baut pandas auf Cython und NumPy auf, wodurch es weniger speicherntensiv und schneller ist als reiner Python-Code. Meist wird pandas genutzt um

  • Excel zu ersetzen

  • einen ETL-Prozess zu realisieren

  • CSV- oder JSON-Daten zu verarbeiten

  • maschinelles Lernen vorzubereiten