Als Smart Data, auf Deutsch “kluge Daten”, werden Datensätze bezeichnet, die für einen direkten und effizienten Einsatz aufbereitet wurden. Folglich sind Smart Data nicht Rohdaten, sondern Daten die bereits konsolidiert, auf Datenqualität geprüft und im Optimalfall mit aussagekräftigen Analysen verarbeitet wurden.
Smart Data als Konzept zeigt das Problem in der heutigen Unternehmenswelt auf: Es gibt viele Daten und mit fortschreitender digitaler Transformation stehen diese auch zur Verfügung. Doch gibt es viele weitere Hürden: Von Datenqualität über eine verlässliche Aufbereitung bis hin zur Bereitstellung durch eine nachhaltige Infrastruktur. All diese Aspekte sind auf den ersten Blick auf Data Science, Big Data und Machine Learning nicht sichtbar – aber wenn ein Unternehmen sich mit Advanced Analytics beschäftigt, treten die Herausforderungen schnell zu Tage.
Warum ist Smart Data so wertvoll?
Wie bereits beschrieben beginnt sich die Datenbasis mit zunehmender digitaler Transformation zu etablieren. Doch durch die schiere Mengen an Daten in einem Unternehmen, kombiniert mit den meist geringen Kapazitäten in der Aufbereitung liegen das darin enthaltene Wissen oft brach. Der gemeine Angestellte kann dieses wertvolle “Öl” eben nicht fördern, dafür braucht es Spezialisten wie Data Scientists.
Und dies ist der Knackpunkt: Unternehmen haben viele Daten, bekommen sie aber nicht bereitgestellt, um sie auch einzusetzen. Daher sind alle Datensätze, die in die Kategorie “kluge Daten” fallen, eine wertvolle Addition zum Unternehmen, während die Rohdaten oft eher eine Last sind.
Folglich sind Daten für die meisten Unternehmen erst wertvoll, wenn sie “Smart Data” sind. Erst wenn sie für normale Anwender einsetzbar und verständlich aufbereitet sind, bringen sie Wert in die Organisation.
Der Smart Data Prozess visualisiert
Der Prozess um Daten in Smart Data zu verwandeln folgt sechs Schritten, die vor allem Prozesse aus Data Engineering, Data Governance und Data Science integriert:
- Datenakquise: Egal ob aus externen oder internen Quellen oder die Generierung von neuen Daten – als erstes müssen Daten generiert und akquiriert werden.
- Datenkonsolidierung: Teilweise optional, aber üblicherweise werden einzelne Datenquellen miteinander verbunden und auf eine gleiche Granularität gebracht, um ein einheitliches Bild zu liefern.
- Datenqualitätsanalyse: Hat man die Daten in ihrem Rohformat vorliegen, gilt es erst einmal, die Datenqualität zu überprüfen und gegebenenfalls zu korrigieren.
- Datenaggregation: Haben die Rohdaten eine hohe Qualität, werden sie meist auf ein aggregiertes Format gebracht. Dies ist sinnvoll für Visualisierung, aber auch für die Vorbereitung von Machine Learning oder anderen Algorithmen als Feature Engineering.
- Datenauswertung: Ob nun klassische Datenanalyse oder Advanced Analytics mit künstlicher Intelligenz – die Verwertung der Daten und die Überführung in aussagekräftige Informationen steht im Zentrum der Transformation von Rohdaten in Smart Data.
- Datenbereitstellung: Der letzte wichtige Aspekt wird oft übergangen. Denn es genügt nicht, ein tolles Machine Learning Modell zu kreieren, sondern die Analysen und Modelle müssen auch zum Einsatz kommen. Die Operationalisierung bildet den Abschluss und stellt die entstandenen Daten den relevanten Stakeholdern zur Nutzung zur Verfügung.
Smart Data vs. Big Data: Was ist der Unterschied?
Smart Data wird oft als Evolutionsstufe von Big Data dargestellt. Der Zusammenhang ist, dass sich das generelle Datenpotential und die Wahrnehmung vom Einsatz von Daten durch den Hype rund um Big Data potentiert hat. Im Praktischen stieß man dann jedoch schnell auf viele Herausforderungen, weshalb Smart Data als nächste Stufe definiert ist.
Somit ist der Zusammenhang sehr deutlich, jedoch gilt es nicht, dass Smart Data nur aus Big Data entstehen kann. Jede Art von Daten kann, wenn sie gut aufbereitet ist und Mehrwert liefert, in die Kategorie Smart Data fallen. Daher hat Big Data keine Exklusivität auf die Idee “kluge Daten”.
Smart Data vs. Advanced Analytics: Was ist der Unterschied?
Künstliche Intelligenz, maschinelles Lernen, Prädiktion und Prescriptive Analytics – es gibt viele Ausprägungen von Advanced Analytics. Ähnlich wie bei Big Data ist Smart Data sehr eng mit Advanced Analytics verknüpft, jedoch auch nicht der einzige Anwendungsfall. Auch klassische deskriptive Auswertungen können sehr hohe Auswirkungen haben, so sie genau auf die Bedürfnisse der Stakeholder zugeschnitten sind. Daher ist Advanced Analytics oft eine Art, Daten zu verarbeiten, aber eben nicht die einzige.
Die Rolle von „klugen Daten“ im Unternehmen
Während Smart Data als Begriff sicherlich eine gute Möglichkeit ist, den Unterschied zwischen existierenden und aufbereitenden Daten darzustellen, ist es für uns nur ein Wegbereiter. Das Ziel darf nicht sein, Daten in “Smart” und “Dumb” zu kategorisieren, sondern das holistische Bild zu etablieren.
Daher ist es wichtig, zu vermitteln, dass rein die Existenz von Daten noch keinen Wert liefert, aber sehr viel Arbeit nötig ist, sie aufzubereiten. Aber es gibt noch viel mehr, um zu verstehen, wie weitreichend der notwendige Einsatz ist.