In unserem letzten Blog-Post wurden Anwendungsszenarien von ChatBots und ihre mögliche Integration in Unternehmensprozesse beschrieben. Dabei gibt es eine Vielzahl von Anbietern, die die hierfür benötigen Tools und Services bereitstellen. In diesem Post sollen die Konzepte von am Markt verfügbaren Plattformen erklärt, einige bekannte Anbieter näher betrachtet und anhand ihrer Vor- und Nachteile evaluiert werden.
Die zugrundeliegende Architektur einer derartigen Plattform ist anbieterübergreifend sehr ähnlich, die Grundkonzepte sind zumeist die gleichen. Über eine Benutzerschnittstelle können die Anwender mit dem System kommunizieren, dabei kann diese Schnittstelle unterschiedlichste Ausprägungen haben. Anwender können über Textnachrichten oder auch Sprache mit dem System interagieren. Oftmals findet dabei eine Integration in bestehende Systeme statt, wie beispielsweise Facebook Messenger, Google Hangout oder Amazon Alexa Skill. Aber auch komplett eigenständige Implementierungen sind möglich. Je nachdem, wie der Anwender mit dem System kommuniziert, wird zunächst die Sprache in Text umgewandelt. Danach, oder direkt, wird dieser Text analysiert und es werden verschiedene Aspekte aus dem Text extrahiert. Anhand dieser Aspekte erfolgt eine Ableitung der Intention des Anwenders und ein entsprechender Gesprächspfad wird gewählt. Hier werden die Angaben des Anwenders analysiert und über Backend-Systeme wird eine Antwort berechnet bzw. abgefragt (z.B.: Abfrage der Wetterdaten für Tag X am Ort Y). Auf Basis der berechneten Antwort-Parameter wird im nächsten Schritt die tatsächliche Antwort des Systems berechnet und an den Anwender zurückgegeben, auch hier wieder entweder als Text oder als Sprache.
Die Anzahl der Anbieter ist groß und auch der jeweilige Funktionsumfang unterscheidet sich. Die größten und sicherlich auch bekanntesten Anbieter am Markt sind IBM, Facebook, Amazon und Google.
IBM stellt mit IBM Watson Assistant eine Kommunikationsplattform mit grundlegender Funktionalität bereit, welche für spezifische Anwendungsfälle durch bestehende Lösungen erweitert werden kann. Die Plattform ist komplett und ausschließlich Cloud-basiert und nutzt eine proprietäre NLP (Natural Language Processing). NLP ist die Verarbeitung und Interpretation von “natürlichen” Texten. Die Integration von IBM Watson kann direkt durch IBM, aber auch durch Drittanbieter-Tools, erfolgen.
Facebook integriert die eigene Kommunikationsplattform direkt in den Facebook Messenger. Für NLP wird das Wit.ai Framework genutzt, welches jedoch in Besitz von Facebook ist. Aktuell laufen über 300.000 ChatBots auf dieser Plattform und können über 1,3 Milliarden potentielle Nutzer erreichen. Die Plattform läuft ausschließlich in der Cloud. Die Integration des Facebook Messengers in eigene Webseiten ist über Plugins möglich.
Amazon Web Services (AWS) bietet neben der aus dem Endbenutzer-Markt bekannten Amazon Alexa auch Enterprise Lösungen an. Hier spricht man von Amazon Lex und Amazon Alexa for business. Beide Plattformen werden ausschließlich in der Cloud betrieben. Für NLP verwendet Amazon ein proprietäres System, die Sprachausgabe wird durch Amazon Polly realisiert. Mit Amazon Connect ist es möglich, ChatBots und virtuelle Assistenten in verschiedenste Anwendungsszenarien zu integrieren.
Google stellt mit Dialogflow eine cloudbasierte Plattform zur Verfügung, die alle Schritte der Erstellung eines virtuellen Assistenten abdeckt. Eventuelle Berechnungen können über Firebase Funktionen “serverless” abgebildet werden. Für NLP hat Google ebenfalls ein proprietäres System entwickelt. Für über 30 Anwendungsfälle gibt es bereits vorgefertigte Assistenten, welche ohne aufwendige Anpassungen direkt eingesetzt werden können. Bei der Integration und der Sprachausgabe wurde mit Google Duplex ein deutlicher Fortschritt erzielt. Der Assistent ist dadurch in der Lage, beispielsweise telefonisch einen Friseurtermin für den Anwender zu vereinbaren. Die Sprachausgabe wirkt dabei menschlich und natürlich. Die Google Assistenten können in 14 verschiedene Plattformen integriert werden, darunter z.B.: Slack, Facebook Messenger, Amazon Alexa und natürlich Google Assistant.
Alles in allem ist die Anbieterwahl eng an den jeweiligen Anwendungsfall und die Kommunikationskanäle geknüpft. Eine generelle Empfehlung kann daher nicht ausgesprochen werden. Zu beachten sind jedoch insbesondere auch die genutzten Technologien bei NLP und Text-to-Speech. Hier zeigen sich Amazon und gerade auch Google im Endkundenbereich als Vorreiter. Google überzeugt zudem bei der Unterstützung verschiedenster Kommunikationskanäle.
In den nächsten Blogposts werden wir detaillierter auf mögliche Implementierungen eingehen und dabei die benötigten Systeme und Ressourcen betrachten.