Big Data

Wird Big Data aktuelle Datawarehouses ersetzen?

Big Data – und alles was damit assoziiert wird – ist für mich die Erweiterung der Datentechnik um einen Mechanismus, der extrem viele Daten aufnehmen kann und damit vergleichbar mit der Verarbeitung der Sinneswahrnehmungen eines Menschen.

Über die Sinnesorgane werden extrem viele Informationen erfasst. Diese Daten werden aber nicht alle einzeln sortiert und strukturiert, sondern wir reagieren darauf aufgrund von Erfahrung und Wahrscheinlichkeiten in Millisekunden. Ein Fußballer muss alle Eindrücke wie Sonnen-/Flutlicht, Lauftempo, Ballgeschwindigkeit, Spielsituation, Gegnerposition, Zurufe der Trainer/Mitspieler etc. in Bruchteilen erfassen und bewerten. Er kann nicht erst warten, bis sein Kopf dies für ihn abgeschlossen hat. Ähnliches gilt für die Bewertung von Verkehrssituationen oder die Erziehung von Kindern :-).

Datawarehouse = Kopf

Der Kopf steht für die bisherige Art mit Daten umzugehen: das Datawarehouse. Der Kopf versucht aufgrund von exakten Daten eine vernünftige Entscheidung zu treffen, braucht dazu aber Zeit (zum Beispiel beim Aufbau eines IKEA Regals). Ähnliche Informationen führen dabei auch immer zur gleichen Entscheidung. Änderungen im Kopf und im Datawarehouse sind langwierig und anstrengend – man denke nur an den Versuch Essgewohnheiten, Zeitmanagement etc. zu ändern.

Big Data = Rückenmark und Sinnesorgane

Die Sinnesorgane und das Rückenmark stellen die Analogie zu Big Data und der statistischen Auswertung mittels „Machine Learning“ dar. Wie statistisch ausgewertet wird, stellt der Kopf zur Verfügung – aber die Auswertung erfolgt schnell und aufgrund der gerade verfügbaren Daten, die mit der zu bewertenden Situation zu tun haben.

Gute Spieler – um beim Fußballbeispiel zu bleiben – erkennen Muster im Spiel (ausprobiert in Data Labs), die Ihnen helfen erfolgreich zu sein und gewisse Spielsituationen schneller zu Ihren Gunsten auszuwerten. Thomas Müller sieht Torchancen an Stellen, wo andere keine sehen und überrascht damit regelmäßig sein Umfeld.

Diskussionen, ob Big Data den bisherigen Umgang mit Daten abschaffen wird, sind aus meiner Sicht nicht zutreffend. Es ist kein Ersatz, sondern eine Erweiterung im Umgang mit Daten. Das eine wird aber ohne das andere nicht auskommen.