Digitale Exzellenz
Digitale Exzellenz

Graph-Datenbanken: Big Data, Small Problems

, 26. Oktober 2022

Fotocredit: Getty Images / Busakorn Pongparnit

Lesezeit: 6 Minuten

Graph-Datenbanken: Big Data, Small Problems

In einem konkreten Fall konnten wir zeigen, wie Graph-Datenbanken in Kombination mit menschlicher sowie Künstlicher Intelligenz dabei helfen, dass wir uns seltener über gestörte oder ausgefallene Mobilfunk- oder Internetnetze ärgern müssen. Aber es gibt noch mehr Anwendungsgebiete für die Technologie. Deshalb hier ein kleiner Deep Dive in die Welt der Netzwerk- und Graphen-Analyse.

Ein Team von Sopra Steria hat eine Analysesoftware (INA = Intelligent Network Analyzer) entwickelt, mit der sich Telekommunikationsunternehmen ein virtuelles Ebenbild (Digital Twin) ihres Netzes schaffen und so Netzkonfigurationen und ihre Auswirkungen vorab simulieren können. Das Interview mit allen Details lest ihr hier, eine Case Study von unserem Partner Neo4j hier.


Graph-Datenbanken helfen Telcos
Use Case: Wie Telekommunikationsunternehmen Graph-Datenbanken einsetzen, um Netzausfälle zu vermeiden.

Die Technologie und die Methodik hinter INA sind allerdings nicht nur etwas für Telekommunikationsunternehmen, sondern für viele Branchen, in denen komplexe Zusammenhänge sichtbar gemacht werden sollen und Organisationen so ihre Prozesse optimieren, Kosten senken oder nachhaltiger wirtschaften wollen. Anlass genug, die Graph-Datenbanken und die Intelligenz hinter INA einmal genauer vorzustellen, damit sich Unternehmen, Behörden und weitere Interessenten inspirieren lassen können.

Der Begriff Big Data ist ein wenig aus der Mode und überstrapaziert. Die Herausforderung ist damit aber nicht verschwunden, sondern präsenter denn je. Die gemanagten Datenmengen werden nun mal nicht kleiner. Das gilt ebenso für den Bedarf an Analyse und Erkenntnissen, um sich damit wiederum Wettbewerbsvorteile zu verschaffen, Kunden zufriedener zu machen und Innovationen voranzutreiben.

Graphen vs. Tabelle: nicht nur etwas fürs Auge

Eines der großen Einsatzgebiete ist die Netzwerkanalyse, um Kausalitäten zu ermitteln, zu messen und damit wiederum Produkte, Services und Abläufe zu verbessern. Die Krux an Big-Data-Analysen ist das Rechentempo. Viele Analysen sind nur dann wirtschaftlich, wenn die Ergebnisse sehr schnell vorliegen – nicht gerade in Echtzeit, aber dennoch superschnell. Datenbanken, insbesondere die einzelnen Typen, spielen eine wichtige Rolle. So genannte Graph-Datenbanken erweisen sich inzwischen als Mittel der Wahl – allein deshalb, weil sie Ergebnisse verbildlichen.

Das zeigt das Beispiel „Streckennetzanalyse“ im Zugverkehr sehr schön – links im Bild auf Basis einer klassischen relationalen Datenbank dargestellt, rechts mithilfe von Graph-Datenbanken. Nutzerinnen und Nutzer sparen sich hier viel Denkarbeit, weil sie die Ergebnisse sofort mit dem Auge erfassen können und nicht erst die Zahlen aus Tabellen verstehen müssen. Das Gehirn freut sich, denn die Denk-Akkus werden geschont.

Graph-Datenbanken - mögliche Streckenverbindungen zwischen Frankfurt und Berlin

Mögliche Streckenverbindungen zwischen Frankfurt und Berlin (Quelle: Classical geographer – Own work, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=7349561

Was die Abbildung oben noch zeigt: Die schnell wahrnehmbare Optik ist nicht der einzige Vorteil von Graph-Datenbanken gegenüber relationalen Kontrahenten. Die Landkarte hält eine Reihe weiterer Informationen parat, beispielsweise die jeweilige Geschwindigkeit auf den Streckenabschnitten und die Zugfrequenz.

Mit Graph-Datenbanken lassen sich zudem schneller komplexe Abfragen für Big-Data-Analysen durchführen und in nahezu Echtzeit anpassbare Digital Twins der Datenstrukturen darstellen. Mapping-Verzögerungen bei Veränderungen des realen Zwillings in der Darstellung des virtuellen Zwillings lassen sich so minimieren und Fehlentscheidungen sowie Rückschlüsse auf Basis falscher Annahmen vermeiden. Ein wichtiger Unterschied der Graph-Datenbanken zu relationalen: Sie betrachten die Beziehungen zwischen einzelnen Komponenten und nicht einzelne, losgelöste Zustände.

 Graph-Datenbanken versus relationale Datenbanken

Vergleich relationale Datenbanken mit Graph-Datenbanken

Anwendungsfälle für Graph-Datenbanken in Kombination mit Künstlicher Intelligenz

Die Graph-Technologie ist ein anerkanntes Schlüsselwerkzeug für die Aufdeckung von Beziehungen zwischen verschiedenen Daten, sagt Marktanalyst Gartner. Die Technologie lässt sich in einer ganzen Reihe von praktischen Anwendungen in Mehrwerte verwandeln, und das wird vielfach bereits gemacht. Drei Beispiele:

Icon GeldautomatBetrug aufdecken

Heutzutage haben sich die Cybersicherheitssysteme verbessert und erkennen Betrug leichter. Cyberbetrug wird daher durchgeführt von einem Ring aus mehreren gestohlenen und gefälschten Profilen, um eine Entdeckung zu vermeiden. Graph-Datenbanken gehen über einzelne Datenpunkte hinaus – die Analyse der Verbindungen im Netzwerk erhöht daher die Entdeckungswahrscheinlichkeit.

Icon FacebookZusammenhänge in sozialen Medien verstehen

Die Art und Weise, wie Unternehmen für ihre Produkte werben, hat sich von der analogen in die virtuelle Welt verschoben. Das Internet bietet immense Möglichkeiten für gezieltere und personalisierte Werbung.

In sozialen Medien verwendete Graph-Datenbanken zeigen Beziehungen zwischen Menschen in einem Netzwerk. Werbung kann auf der Grundlage von Annahmen über ähnliche Interessen gezielter eingesetzt werden. Das funktioniert allerdings bislang nur eingeschränkt, auch weil häufig Daten zum kompletten Nachzeichnen einer Customer Journey fehlen. So bekommen wir meist Werbung für ein Produkt ausgespielt, das wir bereits gekauft haben. Der Grund: Die Kaufinformation kommt beim Werbenden nicht an, beispielsweise weil die Systeme nicht verknüpft sind.

Lieferketten optimierenLieferketten optimieren

Lieferketten wurden und werden zunehmend diversifiziert. Entstanden sind hochkomplexe und vielschichtige Versorgungsnetzwerke. Externe Einflüsse wie z. B. eine Pandemie oder die aktuelle geopolitische Lage wirken sich massiv auf die Zuverlässigkeit der Lieferkette aus. Das lässt sich derzeit in Form von Lieferengpässen beobachten. Die Graph-Technologie entpuppt sich hier als wertvolle Gehilfin. Graph-Datenbanken ermöglichen eine schnelle Analyse von Abhängigkeiten im Netzwerk. Die Ausfallsicherheit, Zuverlässigkeit und das Management können verbessert werden.

CO2-Einsparpotenzial aufdeckenCO2-Einsparpotenzial aufdecken

Unternehmen setzen sich konkrete Ziele, den Ausstoß von Treibhausgasen zu reduzieren. Für das Aufspüren dieser Einsparmöglichkeiten können sie intelligente Hilfe gut gebrauchen. Speziell international agierende Organisationen sind oft Teil eines großen Netzwerkes und die Wechselwirkungen eigener Maßnahmen mit denen ihrer Lieferanten und Abnehmer schwer zu erfassen. Intelligente Software, die auf Graph-Datenbanken aufbaut, kann die Wechselwirkungen bildlich darstellen und Potenzial aufdecken.  Das funktioniert beispielsweise durch Simulationen und mithilfe digitaler Zwillinge (Digitale Twin) ihrer Organisation. Das Unternehmen stellt so unter Umständen fest, dass es auf bestimmte Hardware oder Prozesse verzichten kann, und spart damit Kosten und Energie.

Jobgarantie für Graph-Datenbanken

Die Liste der Anwendungen lässt sich mühelos erweitern – beispielsweise um Netzwerktopologien für Energienetze und das Erkennen von Abhängigkeiten in Verkehrsnetzen, siehe Bahn- oder Straßenverkehr. Geräte, Maschinen, Anlagen, Fahrzeuge, Gebäude und viele andere Dinge werden immer stärker vernetzt, und sie werden in Zukunft viel mehr als bislang miteinander kommunizieren. Damit steigt der Bedarf, die Wechselwirkungen in den Beziehungen zwischen all diesen physischen Geräten und Gegenständen zu verstehen und Anpassungen am besten in Form digitaler Zwillinge vorab zu simulieren. Die Graph-Technologie und Graph-Datenbanken werden somit immer häufiger zum Einsatz kommen, um Big Data in Small Problems zu verwandeln.