Science-Fiction in der Unternehmenskommunikation – Software lernt in x-beliebigen Sprachen Gedanken zu lesen
Der Super-Gau in der Unternehmenskommunikation: Die Abteilung geht in einem Meer von Kunden-SMS und –Mails unter und reagiert nicht mehr. Ein Startup aus Pilsen hat nun einen speziellen Algorithmus entwickelt, der aus zigtausenden Texten in allen möglichen Sprachen blitzschnell das Wesentliche ermittelt und ordnet. SentiSquare und sein Big-Data-Tool nutzen bereits Banken, Telekommunikationsanbieter und Autokonzerne.
„Wenn ein Operator etwa 40.000 SMS im Monat erhält, sind wir in der Lage, diejenigen Kunden herauszufiltern, die verärgert sind. Das sind dann vielleicht 200, also eine Menge, die das Unternehmen ohne Mühe bearbeiten kann. Alles dreht sich darum, dass die Firmen zufriedene Kunden haben“, erklärt Jan Tichý von SentiSquare.
Das Pilsener Startup-Unternehmen hat einen Algorithmus für die semantische Textanalyse von großen Datenmengen (Big Data) entwickelt. „Er kann Millionen Mal schneller lesen als ein Mensch und jede beliebige Sprache erlernen“, sagt Tichý. Das Programm funktioniert so, dass man Texte „einfüllt“, zum Beispiel Kunden-E-Mails, Kommentare auf sozialen Netzwerken oder auch Kurznachrichten. Die SentiSquare-Software verarbeitet sie zu handhabbaren Inhalten. „Sie stellt fest, was die Menschen zum Beispiel über ein Produkt denken, was für ein Meinungstrend in einer bestimmten Branche herrscht und wie sich Kundenwünsche verändern“, erklärt Tichý.
Je mehr Texte, umso besser
Der Algorithmus, der innerhalb von wenigen Tagen jede Sprache beherrschen kann, funktioniert so ähnlich wie bei einem Kleinkind, das seine Muttersprache erlernt. Zunächst nimmt er eine ungeheure Menge von Wörtern wahr, beginnt sie dann allmählich zu verstehen und bringt sie in den richtigen Zusammenhang. Das Kind beziehungsweise der Algorithmus kann umso besser arbeiten, je mehr Texte ihm zur Verfügung stehen.
SentiSquare wird zum Beispiel auch verwendet, wenn Unternehmen herausfinden wollen, wie erfolgreich ihre Kampagnen sind, oder einfach nur, um Zeit zu sparen: E-Mails etwa werden automatisch an die richtigen Empfänger in einem Unternehmen weitergeleitet.
Der Bereich der semantischen Textanalyse für Big Data hat sich in letzter Zeit rasant entwickelt. Kommentare, Bewertungen, Diskussionen – die Menschen kommunizieren immer mehr im Internet. Lösungen, die diese Wortflut beherrschbar und nutzbar machen, sind eine umkämpfte Zukunftsbranche. Natürlich bemühen sich auch die „Big Player“ auf dem Markt um solche Analyseverfahren. IBM zum Beispiel entwickelt gerade ein neues smartes Wörterbuch, das allerdings nur für eine Sprache, zum Beispiel Englisch, verwendet werden kann.
Keine Schlüsselwörter gebraucht
Die Lösung von SentiSquare kommt hingegen ganz ohne Vorkenntnisse einer bestimmten Sprache aus. Die Big-Data-Lösung, die seit 2014 auf dem Markt ist, braucht lediglich eine sehr große Menge von Texten, in die sie sich vertieft und die sie mit der Zeit „versteht“. „Wir sagen dem System nicht anhand von Schlüsselwörtern, wonach es suchen muss. Wir geben ihm nur Daten, und es sagt uns von selbst, worüber die Leute sprechen“, fügt Tichý hinzu. Auf diese Weise deckt es auch neue Themen auf, von denen Firmen noch nicht einmal selbst wissen. Ein weiterer Vorteil einer solchen Lösung besteht darin, dass sie sich auch für weniger verbreitete Sprachen wie zum Beispiel Tschechisch eignet, auf die sich große Konkurrenten nicht konzentrieren.
SentiSquare, das an der Westböhmischen Universität in Pilsen unter der Leitung von Josef Steinberger entwickelt wurde, hat außer in Tschechien auch Kunden in anderen Ländern. Sein Algorithmus bearbeitet zum Beispiel schon Texte auf Slowakisch, Deutsch, Englisch, Französisch, Spanisch oder auch Ungarisch. Zu den größten Kunden gehören Mobilfunkanbieter wie T-Mobile, Banken wie Česká spořitelna und ČSOB, aber auch E.on und Volkswagen. Das Startup, das etwa zehn Mitarbeiter beschäftigt, arbeitet auch mit Microsoft zusammen, und Tichýs Worten zufolge wächst es jedes Jahr um das Vierfache.