CSV#
Überblick#
Unterstützung von Datenstrukturen |
-- |
CSV wird zum Speichern von Tabellendaten verwendet, ist aber im Gegensatz zu anderen hier besprochenen Serialisierungsformaten nicht für verschachtelte Daten geeignet. |
Standardisierung |
-- |
CSV ist nicht gut standardisiert: weder das Encoding noch die Trennung der Zelleninhalte (Komma, Semikolon etc.). |
Schema IDL |
-- |
Nein |
Sprachunterstützung |
++ |
Das CSV-Format wird in fast jeder Programmiersprache
gut unterstützt. Ein csv-Modul ist in der
Python-Standardbibliothek enthalten und pandas
läd eine CSV-Datei direkt als Auch wenn CSV das einzige hier besprochene Format ist, das gut von Tabellenkalkulationen wie Excel unterstützt wird, solltet ihr strukturiertere Excel-Dateien direkt einlesen, z.B. mit pandas read_excel. |
Menschliche Lesbarkeit |
+- |
CSV ist speziell bei Ganz- oder Dezimalzahlen mit gleicher Zeichenlänge gut lesbar. In allen anderen Fällen kann es schwierig werden, die entsprechenden Spalten zu identifizieren. |
Geschwindigkeit |
+ |
CSV kann sehr schnell serialisiert und deserialisiert werden. |
Dateigröße |
++ |
Nur Protocol Buffers (Protobuf) sollte kompakter sein. |
Beispiel#
5.1,0.222222222,3.5,0.625,1.4,0.06779661,0.2,0.041666667,setosa
4.9,0.166666667,3,0.416666667,1.4,0.06779661,0.2,0.041666667,setosa
4.7,0.111111111,3.2,0.5,1.3,0.050847458,0.2,0.041666667,setosa
4.6,0.083333333,3.1,0.458333333,1.5,0.084745763,0.2,0.041666667,setosa
5,0.194444444,3.6,0.666666667,1.4,0.06779661,0.2,0.041666667,setosa
...
Siehe auch