Digitale Exzellenz
Digitale Exzellenz

Data Scientists brauchen ein analytisches Ökosystem

, 21. September 2020

Lesezeit: 3 Minuten

Data Scientists brauchen ein analytisches Ökosystem

In Unternehmen denken Entscheider häufig: Wir engagieren exzellente Data Scientists, und die verwandeln Daten in Geschäft oder zumindest Geschäftsideen. Die Unternehmen vergessen dabei, dass jeder Data Scientist nur so gut ist wie das analytische Ökosystem, in dem sie oder er sich bewegt.

Zwei Binsenweisheiten der Digitalisierung lauten: Der Mehrwert von Daten ist die Summe aus Relevanz, Qualität und Verwendung. Und: Nur wer Daten in Informationen und Erkenntnisse umwandeln kann, legt den Grundstein für eine erfolgreiche Unternehmenssteuerung. Der Zugang zu diesen Informationen ist entscheidend. Die Nutzer müssen auf den Punkt die für ihr Vorhaben, ihre Idee und ihre Anfrage richtigen Informationen parat haben und das vor allem schnell.

Klassische Datenarchitekturansätze bremsen allerdings eher den Zugang zu Informationen. Die Folge: Die Data Scientists oder Business Analysts, die eigentlich in Vollzeit die fachlichen Mehrwerte aus den Daten und Informationen herausarbeiten sollen, müssen sich in mühsamer Kleinarbeit die für sie relevanten Daten suchen. Zudem müssen sie diese Daten für ihre Zwecke passend aufbereiten und in ihre Arbeitsumgebung überführen – und das für jeden Anwendungsfall immer wieder neu. Da bleibt viel Zeit auf der Strecke, die eigentlich für ihre Kernaufgaben gedacht ist. Unternehmen verpassen deshalb die gewünschten Mehrwerte oder sind zu langsam bei deren Generierung.

Zu jedem Anwendungsfall die genau passende Datenarchitektur

In der digitalen Welt ist es somit erfolgskritisch, Data und Analytics schnell an neue Informationsbedürfnisse anzupassen. Die Trennung zwischen Datenmanagement und -analyse bleibt wichtig, damit Unternehmen das Potenzial der Daten und das ihrer Data Scientists ausschöpfen. Ein Unternehmen sollte ihnen deshalb das Data Engineering abnehmen. Und zwar durch den Aufbau eines flexiblen analytischen Ökosystems: Das besteht aus einer Referenzarchitektur, die eine flexible Wiederverwendbarkeit von Daten, Technologien und analytischen Komponenten ermöglicht.

Funktionale Komponentensicht auf eine analytische Ziellandschaft (Quelle: Sopra Steria)

In einer solchen multi-modalen Umgebung können Nutzer je nach Bedarf auf analytische Bestandteile zurückgreifen, ohne immer wieder bei null beginnen zu müssen. Je nachdem, was ein Anwender vorhat, stellt sie oder er eine Lösung durch die Kombination einzelner Bausteine zusammen. Mitarbeiter der Fachbereiche können so beispielsweise unter dem Stichwort „Controlled Self-Service BI“ Datenanalysen selbst kombinieren und in Form eines BI Dashboards optisch darstellen. Data Scientist können sich sehr flexibel die notwendigen Daten und auch analytischen Komponenten für die Erprobung eines neuen Anwendungsfall zusammenstellen. Dies bedingt eine definierte technische Heterogenität mit unterschiedlichen Speicher-, Integrations- und Analysetechnologien.

Knackpunkt Datenmanagement

Eine übergreifende Governance verwaltet diese Komponenten. Ein integriertes Datenqualitäts- und Metadatenmanagement stellt die nötige Datenqualität sicher, denn agile Data-Analytics-Prozesse erfordern eine stabile und vertrauenswürdige Datenbasis.

Gutes Datenmanagement überführt das Sammelsurium strukturierter, unstrukturierter, interner und externer, maschinengesteuerter und ereignisgesteuerter, Weblog- und Clickstream-Daten über industrialisierte Verfahren und Regeln in bedarfsgerechte Datenspeicher und Architekturen. Aus einer Datenanarchie wird eine Datendemokratie.

Datenintegration in ein analytisches Ökosystem (Quelle: Sopra Steria)

Damit gilt: Ganz gleich welche Rolle – ob Business Analyst, Data Engineer, Data Steward oder Data Scientist – alle arbeiten in EINEM analytischen Ökosystem, in dem die Regeln klar sind, möglichst jeder sich an diese Regeln hält und sich innerhalb dieses Systems so frei wie möglich bzw. erforderlich bewegen kann.


Sopra Steria erhebt auf Basis des objektiven Reifegradmodells biMM (Business Intelligence Maturity Model) regelmäßig den Reifegrad von BI- & Analytics-Landschaften, um zuverlässig Trends und Zusammenhänge zu erkennen und die nachhaltige Optimierung von datengetriebenen Prozessen anzustoßen.


Lesevorschlag: Blog Posts von Lars Schlömer, Leiter der BI Community von Sopra Steria zum Thema Data Analytics.

Foto: Getty Images / Donald Iain Smith