“Statistics are like bikinis. What they reveal is suggestive, but what they conceal is vital.” [Aaron Levenstein]

Abstract

Selbstverständlich kann man für jede Eingabe ein spezielles Datenprüfprogramm erzeugen.

Aber was wenn Sie beliebige Daten (in einer CSV Datei) durch eine allgemeine Datenanalyse untersuchen lassen wollten?

Für eine allgemeine numerische Analyse könnten Sie einfach Minimum, Durchschnitt und Maximum ermitteln und z. B. bezüglich Extremwerten warnen, die um mehr als 2.5 Standardabweichungen vom Durchschnitt abweichen. Bei Textdaten könnte ein Analyseprogramm die Häufigkeit von Worten und Zeichen ausgeben.

Beispiel

sbDatastats_Input

Hier würden Sie gern den numerischen Ausreißer 15 und die Textanomalie ‘#’ mit einem allgemeinen Analyseprogramm einfach erkennen, nicht wahr?

sbDataStats erzeugt diese Ausgabe:

Tabellenblatt und/oder Ausgabedatei Numstats:

sbDatastats_Numstats

Tabellenblatt und/oder Ausgabedatei Textstats:

sbDatastats_Textstats

Falls Sie bereit sind, ein wenig mehr Aufwand zu investieren, kann sbDataStats eine Limitdatei erzeugen, die Minimal- und Maximalwerte für alle numerischen Felder ermittelt (einschließlich Datumswerten, da diese in Excel auch als Zahlen dargestellt werden) sowie minimale und maximale Textlängen und genutzte Zeichen.

Wenn Sie dann diese Wertegrenzen auf Ihre notwendigen Werte anpassen und die veränderte Datei als Limit-Eingabedatei verwenden, können Sie Folgendes erhalten:

Beispiel für eine Limitdatei:

sbDatastats_LimitsIn

Beispiel für die Ausgabe im Tabellenblatt Workflow:

sbDatastats_Workflow

Die jetzige Version kann auch Bewegungen über zwei Zeitpunkte vergleichen. Bitte bedenken Sie, dass Sie dann eine Sortierspalte für jede Eingabedatei definieren müssen (falls es keine Algo One Datei ist - für diese benötigen Sie eine Algo One Header Datei).

Download

Die englischsprachige Dokumentation für diese Anwendung können Sie hier öffnen und lesen:

sbDatastats_Documentation.pdf [627 KB PDF file, ohne jegliche Gewährleistung]

Bitte den Haftungsausschluss im Impressum beachten.

sbDatastats.xlsm [180 KB Excel Datei, ohne jegliche Gewährleistung]