Haltungen, Meinungen und Emotionen zu Produkten und Dienstleistungen durch Fragebögen zu erforschen, ist in der digitalen Welt nicht mehr zeitgemäß. Gut, dass es mittlerweile Social Media gibt und künstliche Intelligenz (KI), um selbst Gefühlslagen aus Tweets und Posts herauszulesen – und das praktisch in Echtzeit. Hier der Theorieteil zur so genannten Sentimentanalyse.
Soziale Netzwerke wie Twitter, Facebook, Blogs und Chats erzeugen permanent Daten und sind für Personen und Unternehmen ein wichtiges Medium der Außendarstellung. Weltweit werden täglich mehr als 500 Millionen Tweets versendet, sagen Statistiken. Das sind rund 6.000 Tweets pro Sekunde. Ihren Nutzern ermöglichen soziale Plattformen eine freie und weitestgehend ungefilterte Meinungsäußerung. Auch zu Produkten und Dienstleistungen teilen Konsumenten Meinungen, Einstellungen, Erfahrungen und Gefühle in Hülle und Fülle.
Soziale Netzwerke werden damit zu einem unschätzbar wichtigen Untersuchungsgegenstand für Unternehmen, um die öffentliche Markenwahrnehmung zu messen. Im zeitlichen Verlauf oder sogar Realtime lassen sich Veränderungen in der Kundenwahrnehmung erfassen. Negative Reaktionen auf bestimmte Maßnahmen erkennen Unternehmen deutlich früher und können gezielt gegensteuern.
Analyse der Tonalität
Um zu messen, wie das Netz fühlt, nutzen Unternehmen die Sentimentanalyse – auch Opinion Mining genannt. Durch diese Form des Text Minings wird beurteilt, ob aus der Tonalität strukturierter und unstrukturierter Einträge in Facebook, Twitter und Co. eine eher positiv geäußerte oder eine negative Haltung zu erkennen ist.
Um ein aussagekräftiges Stimmungsbild zu erhalten, müssen Unternehmen entscheiden, ob sie Aussagen wörterbuchbasiert oder durch maschinelle Lernverfahren analysieren wollen. Das wörterbuchbasierte Verfahren beruht auf dem sogenannten Sentiment-Wortschatz, entwickelt von der Universität Leipzig. Zirka 1.700 positiv und mehr als 1.800 negativ konnotierte Wörter werden bezüglich ihrer Ausdrucksstärke im Intervall [-1,+1] gewichtet. Das Gesamtstimmungsbild berechnet sich durch das summierte Einzelgewicht der Worte der untersuchten Netzwerkeinträge.
Dieses Verfahren hat jedoch einen entscheidenden Nachteil: Zwar wird die Existenz der Wörter, die einer positiven oder negativen Stimmung zugeordnet sind, erkannt, aber nicht, wie sie zusammenwirken. Das Beispiel zweier fast identischer Sätze zeigt, wo die Grenzen der wörterbuchbasierten Analyse liegen:
- Der Blog-Artikel war so nicht interessant.
- Der Blog-Artikel war nicht so interessant.
Beide Aussagen unterscheiden sich in ihrer Tonalität. Daran lässt sich die Komplexität der Sentimentanalyse erkennen. Kleine Einschübe oder Ergänzungen können die Aussagekraft eines Satzes verändern.
Maschinelle Lernverfahren setzen Training voraus
Maschinelle Lernverfahren sind dem wörterbuchbasierten Ansatz in puncto Genauigkeit und Treffsicherheit überlegen. Doch bevor der CoBot vollautomatisiert arbeiten kann, muss er mit Beispieldaten vom Menschen trainiert werden. Hier gilt: Je mehr Trainingsdaten dem Computer vorgegeben werden, desto genauer wird das Analyseergebnis.
Maschinelle Lernverfahren haben darüber hinaus einen weiteren Vorteil: Den Softwarerobotern kann die Bedeutung von Nachrichten als Ganzes „antrainiert“ werden. Aussagen müssen nicht in einzelne Wortteile zerlegt werden. Im Zuge des Trainings wird zudem versucht, dem Computer Ironie und Sarkasmus beizubringen, denn diese Art von Konversation kann das Stimmungsbild verzerren. Da die Sentimentanalyse in der Regel themenbezogen eingesetzt wird, muss auch das Training der Maschine thematisch jedes Mal neu angepasst werden.
Vorschau: Vielfältige praktische Einsatzmöglichkeiten
Ein gutes Ergebnis von der Maschine erfordert damit zunächst viel Arbeit vom Menschen – konkret Investitionen. Ein Grund, warum diese Form der Datenanalyse erst am Anfang steht. Der erkennbare Fortschritt beim praktischen Einsatz künstlicher Intelligenz wird der Sentimentanalyse allerdings neuen Schub verleihen. Unternehmen können so zum Beispiel im Vorfeld von Preisänderungen austesten, wie Kunden reagieren könnten und ihre Maßnahmen sowie die Kommunikation darauf abstimmen.
Auf die praktischen Einsatzmöglichkeiten und auf ein konkretes Fallbeispiel aus der Kreditwirtschaft werden wir in einer der kommenden Wochen in einem weiteren Blogbeitrag genauer eingehen.