Was ist Conversational AI?
Definition von Conversational AI
Mit Conversational AI können Menschen Unterhaltungen mit Maschinen simulieren. Durch die Kombination aus der Verarbeitung natürlicher Sprache (NLP, Natural Language Processing) und Machine Learning (ML) nutzt Conversational AI Daten, um Sprach- oder Texteingaben zu erhalten und wiederum Sprach- oder Textausgaben zu produzieren und so im Grunde ein Gespräch mit dem Nutzer oder der Nutzerin zu führen. Chatbots, virtuelle KI-Assistenten und sprachgesteuerte Assistenten sind alles Beispiele für Conversational AI.
Man könnte meinen, Conversational AI sei etwas Neues. Doch die erste Iteration war ein Chatbot, der Mitte der 1960er Jahre von Joseph Weizenbaum1 entwickelt wurde. ELIZA war der erste Psychotherapie-Roboter der Welt. Er verwendete NLP, um Muster bei den Inputs abzugleichen und Antworten zu generieren. Ganz grundsätzlich arbeitet Conversational AI noch heute so, nämlich mit Mustererkennung und prädiktiven Analysen. Der wesentliche Unterschied: ELIZA war auf die Skripte beschränkt, die im Produkt programmiert waren. Heute kann Conversational AI durch die Entwicklung von Large Language Models (LLMs) sowie Fortschritte bei Rechenleistung, Datenverfügbarkeit und ML kontinuierlich „dazulernen“. Dabei werden enorme Datenmengen ausgewertet, um Fragen zu beantworten. Aus diesem Grund ist die zeitgenössische Conversational AI vielseitig einsetzbar, von virtuellen Assistenten über Kundenservice-Chatbots bis hin zu automatisierten Supportsystemen.
Conversational AI erleichtert den Zugang zu Informationen, Waren und Dienstleistungen für alle. Zugleich werden dadurch die Kundenerlebnisse besser. Damit dieser Austausch für alle zugänglich wird, sodass die Nutzer nicht Informatik studiert haben müssen, um Antworten auf Anfragen zu erhalten, ist die Fähigkeit erforderlich, ein Gespräch in natürlicher Sprache zu führen. In Unternehmen kann Conversational AI die Arbeitsbelastung der Beschäftigten verringern und für weniger steile Lernkurven sorgen, was letztlich der betrieblichen Effizienz zugute kommt.
Wesentliche Komponenten von Conversational AI
Conversational AI umfasst die Verarbeitung natürlicher Sprache (Natural Language Processing, NLP), Machine Learning-Algorithmen (ML), Spracherkennung und Dialogmanagement-Systeme.
Verarbeitung natürlicher Sprache (NLP)
Die Verarbeitung natürlicher Sprache erleichtert Computern die Verarbeitung von und Kommunikation in menschlicher Sprache unter Verwendung von Tokenisierung, Wortartmarkierung, Erkennung benannter Entitäten (Named Entity Recognition) und Sentimentanalyse. Die Computerlinguistik untermauert diese Techniken und verwendet Datenanalysen zur Aufschlüsselung und Analyse von Sprache und Texten. Eine lexikalische Analyse weist den Zeichen in einer Abfrage Datenwerte zu. Bei einer grammatikalischen Analyse wird die Wortreihenfolge in einer Abfrage ermittelt und mit Tags versehen. Die syntaktische Analyse ermittelt anschließend die Bedeutung eines Wortes anhand seines syntaktischen Werts.
Beispielsweise im Satz „Ich bin erstaunt, wie leicht sich dieser Laptop anfühlt“ würde die syntaktische Analyse ergeben, dass das Wort „leicht“ ein Adjektiv ist, das den Ausdruck „dieser Laptop“ beschreibt. Bei der semantischen Analyse wird die Bedeutung eines Worts anhand des syntaktischen Ergebnisses im Kontext ermittelt, um die Einstellung oder die Absicht einer Abfrage zu bestimmen.
Um beim vorherigen Beispiel zu bleiben: Das Adjektiv „leicht“ könnte sich zwar auf Gewicht, Schwierigkeit oder Mangel an Substanz beziehen. Doch der syntaktische Kontext – in Kombination mit „erstaunt“ und „sich anfühlt“ – deutet auf eine positive Einstellung hin. Die semantische Analyse interpretiert „leicht“ als Ausdruck der Wertschätzung für die Tragbarkeit des Geräts anstatt als negative Konnotation.
So klingt Conversational AI nach einer Unterhaltung.
Machine Learning
Machine Learning verwendet Daten und Algorithmen, um die menschliche Lernfähigkeit nachzuahmen. Machine Learning-Algorithmen geben anhand der Daten, mit denen sie trainiert wurden, eine Prognose heraus, bewerten die Qualität der Prognose anhand einiger vordefinierter Parameter und aktualisieren oder optimieren den Entscheidungsprozess, um künftige Prognosen zu verbessern.
Ein Machine Learning-Modell kann auf drei unterschiedliche Arten trainiert werden: beaufsichtigt, teilweise beaufsichtigt und unbeaufsichtigt. Beaufsichtigtes Lernen verwendet gelabelte Datenbestände, um einen Algorithmus für Prognosen zu trainieren. Unbeaufsichtigte Machine Learning-Modelle werden mit Daten trainiert, die nicht gelabelt sind. So können die Algorithmen ohne menschliches Eingreifen Muster und Datengruppierungen erkennen. Teilweise beaufsichtigtes Lernen ist eine Kombination aus beaufsichtigten und unbeaufsichtigten Modellen. Die Erkenntnisse aus kleineren gelabelten Datenbeständen werden dabei auf größere nicht gelabelte Datenbestände angewendet.
Bei Anwendungsempfehlungs-Engines, virtuellen Assistenten und Spracherkennungstechnologien arbeitet Machine Learning Hand in Hand mit NLP.
Spracherkennung
Spracherkennung, auch Sprache-zu-Text genannt, ist die Fähigkeit einer Maschine, gesprochene Sprache in geschriebenen Text umzuwandeln. Spracherkennung greift auf NLP und ML-Algorithmen zurück, um Grammatik, Syntax, Struktur und Zusammensetzung eines Audiosignals zu analysieren, während Techniken für Sprachgewichtung, Sprecherbestimmung, Akustiktraining und Schimpfwortfilter das Modell trainieren.
Durch Sprachgewichtung wird die Erkennungsgenauigkeit erhöht. Dazu werden wiederkehrende Wörter klassifiziert. Die Spracherkennung kann auch beim Transkribieren eines Gesprächs verschiedene Teilnehmende identifizieren. Man spricht hier von Sprecherbestimmung. Dank Akustiktraining kann sich die Erkennungssoftware auf verschiedene Audioqualitäten einstellen, von unterschiedlichen akustischen Umgebungen bis hin zu verschiedenen Stimmattributen. Zur Bereinigung von Transkripten können Schimpfwortfilter eingesetzt werden, die beleidigende Sprache erkennen. Diese werden häufig bei Transkriptionsdiensten oder Diktatanwendungen eingesetzt.
Dialogmanagementsysteme
Dialogmanagementsysteme interpretieren Unterhaltungen zwischen Maschinen und Nutzern und ermitteln den Kontext. Sowohl in der Sprache als auch bei Texten stehen Dialogmanagementsysteme für die Vorgänge, die eine Maschine ausführt, um menschliche Nutzer zu „verstehen“ und mit ihnen zu „kommunizieren“. Ein Beispiel: Ein Nutzer stellt eine Anfrage an einen Chatbot für Reisebuchungen, weil er einen Flug buchen möchte. Der Bot reagiert mit einer Reihe von Nachfragen:
Nutzer: Ich möchte einen Flug buchen.
Bot: Hallo! Dabei kann ich Ihnen behilflich sein. Von wo möchten Sie abfliegen?
Nutzer: Montreal.
Bot: Abflug vom Flughafen YUL. Wie lautet Ihr Ziel?
Nutzer: Paris.
Bot: Hervorragend! Abflug von YUL und Ankunft am Flughafen CDG.
Dieser Unterhaltung liegt ein Dialogmanagementsystem zugrunde, das mithilfe von Richtlinienlernen und Feedbackmechanismen kontextbezogene und korrekte Antworten liefert. Es ermittelt die Anfrage, führt die nötigen nächsten Schritte aus und setzt den Dialog auf natürliche Weise fort. Durch ein effektives Dialogmanagement wird sichergestellt, dass die KI Unterhaltungen mit mehreren Wendungen und einen Kontextwechsel bewältigen kann.
Warum ist Conversational AI wichtig?
Conversational AI hat die Art und Weise beeinflusst, wie Menschen sinnstiftend mit Technologie im Alltag interagieren. Wie wichtig das ist, lässt sich an den Vorteilen ablesen:
- Verbesserte Betriebseffizienz: Von virtuellen Assistenten bis hin zu semantischen Suchanwendungen können Beschäftigte dank Conversational AI rasch Antworten erhalten und Aufgaben automatisieren, sodass sie sich verstärkt komplexeren und kreativeren Aufgaben widmen können. Da sie weniger Zeit für minuziöse, zeitraubende Tätigkeiten aufwenden müssen, schießen Produktivität und Betriebseffizienz in die Höhe.
- Verbesserter Kundenservice: Conversational AI liefert direkt personalisierte Antworten. Dies kommt der Kundenzufriedenheit und Kundeneinbindung zugute, da eine Rund-um-die Uhr-Verfügbarkeit geboten wird, die Wartezeiten verkürzt sowie unterschiedlichste Anfragen effizient bearbeitet werden. Gängige Probleme können schnell und korrekt gelöst werden. Daher können die Beschäftigten komplexere Aufgaben übernehmen. Die Folge ist ein effektiveres, schneller reagierendes Kundensupportsystem, das die Kundenbeziehungen stärkt und eine langfristige Bindung fördert.
- Höhere Skalierbarkeit: Conversational AI wirkt sich positiv auf die Fähigkeit eines Unternehmens aus, eine große Menge an Kundeninteraktionen zu bewältigen, weil das System mehreren Nutzern gleichzeitig antworten kann. Die Skalierbarkeit von Interaktionen steigert außerdem die Betriebseffizienz dank optimierter Prozesse, kürzerer Reaktionszeiten und geringerer Betriebskosten. Auf diese Weise kann das Unternehmen mit weniger Ressourcen mehr Kunden dienen und zugleich die Kundenzufriedenheit steigern, da die Probleme der Kunden gelöst werden, ohne dass diese auf einen Mitarbeiter angewiesen sind.
Nicht zuletzt ist Conversational AI aufgrund seiner Kosteneffizienz wichtig. Kleine und mittelständische Unternehmen profitieren davon, dass Conversational AI große Mengen an Interaktionen gleichzeitig bewältigen kann, und zwar rund um die Uhr. Dadurch lassen sich die Geschäftskosten für Schulungen und Gehälter erheblich reduzieren.
Ist Conversational AI dasselbe wie generative KI?
Conversational AI ist ein spezifischer Anwendungsbereich von generativer KI. Sie können jedoch unterschiedliche Ziele verfolgen, andere Outputs erzeugen und auf andere Trainingsmethoden zurückgreifen. Der Unterschied besteht darin, dass Conversational AI mithilfe von Prognosen eine Interaktion in beide Richtungen fortführt und aufrechterhält. Generative KI hingegen erzeugt Inhalte auf der Grundlage von Prompts.
Im Dialog mit einem Nutzer generiert Conversational AI Antworten durch Analysieren der Abfrage, Parsen einer Wissensdatenbank – einer lokalen Wissensdatenbank, die zu einem Unternehmen gehört und über Retrieval Augmented Generation (RAG) abgerufen wird, oder im Falle von ChatGPT des gesamten Internets – sowie Mustererkennung.
Das Ergebnis, das Conversational AI generiert, ist eine Prognose. Hierbei kommt dasselbe Prinzip zum Einsatz, durch das generative KI neue Inhalte „erzeugen“ kann. So können Conversational AI und generative KI beide Antworten liefern, die kontextbezogen sind.
Anwendungsfälle und Beispiele für Conversational AI
Von „Hey Siri“ bis hin zu virtuellen Assistenten und Chatbots in Banking-Apps ist Conversational AI branchenübergreifend im Einsatz. Einige häufige Anwendungsfälle:
Kundenservice und -support
Conversational AI wird häufig in Kundenservice- und -support-Anwendungen genutzt, vor allem in Form von Chatbots, die häufige Anfragen beantworten und bestimmte Aufgaben erledigen. Chatbots können häufig gestellte Fragen zu Versand, Abrechnung, Retouren und mehr klären. Zudem können sie als Einkaufsassistent Online-Support bieten. Dabei geben sie anhand des Suchverlaufs oder der vorherigen Käufe individuelle Empfehlungen heraus.
Gesundheitswesen
Im Gesundheitswesen kann Conversational AI die Einbindung der Patienten verbessern und das Personal bei Verwaltungsaufgaben entlasten. In manchen Arztpraxen kommt Spracherkennungstechnologie zum Einsatz, um die Interaktionen zwischen Arzt und Patient zu transkribieren und dafür zu sorgen, dass Anmerkungen zum Patienten und dessen Behandlung auf dem neuesten Stand und gründlich sind. Virtuelle Assistenten können außerdem Termine vereinbaren, medizinische Informationen bereitstellen sowie an die Einnahme von Medikamenten erinnern.
Security und Observability
Virtuelle Assistenten erfreuen sich in Technologie-Stacks für Security oder Observability zunehmender Beliebtheit. Durch die Nutzung von Suchtechnologie, die Verbindung zu lokalen Wissensdatenbanken und den Einsatz von Datenanalysen können IT-Anwender mithilfe virtueller Assistenten eine Vielzahl kontextspezifischer Fragen beantworten, auf Spezialwissen und -daten zugreifen sowie bestimmte Aufgaben automatisieren.
E‑Commerce
Im E-Commerce ist Conversational AI bereits gang und gäbe, um Kunden beim Online-Einkauf Unterstützung zu bieten. Ob in Form eines Chatbot oder eines virtuellen Assistenten ergänzt Conversational AI den Kundenservice der realen Mitarbeiter, indem sie häufig gestellte Fragen beantworten und individuelle Empfehlungen aussprechen. Da Conversational AI rund um die Uhr verfügbar ist, kann sie sich positiv auf das Kundenerlebnis auswirken und folglich die Umsätze steigern.
Kurse und Schulungen
Im Bereich Bildung wird Conversational AI für eine individuelle Betreuung, zur Beantwortung von Fragen der Lernenden und für interaktive Lernangebote eingesetzt. Sie bietet den Lernenden zusätzliche Ressourcen und unterstützt so die Lehrkräfte.
Was ist der Unterschied zwischen Chatbots und Conversational AI?
Chatbots sind zwar eine Form von Conversational AI, jedoch nur ein Anwendungsbereich von Conversational AI. Conversational AI ist ein Oberbegriff, der eine Vielzahl von NLP- und ML-Anwendungen abdeckt, beispielsweise Sprachassistenten, Technologien zur Umwandlung von Text zu Sprache (Text-to-speech, TTS) sowie Sprache zu Text (Speech-to-text, STT).
Chatbots werden mit regelbasierten Algorithmen darauf trainiert, bestimmte Aufgaben zu erledigen und vordefinierte Antworten zu geben. Daher werden sie für einfache Interaktionen verwendet. Bei komplexen oder differenzierten Unterhaltungen wird es bisweilen schwierig.
Sprachassistenten sind fortgeschrittenere Chatbots, die Spracherkennungstechnologie für die Interaktion mit Nutzern verwenden. Der Vorteil von Sprachassistenten besteht darin, dass sie kontaktlos bedient werden und eine Vielzahl von Befehlen in unterschiedlichen Zusammenhängen ausführen können, während die Nutzer kochen, putzen, Auto fahren usw.
Der Fähigkeit des Sprachassistenten, Nutzerinteraktionen zu verstehen und darauf zu reagieren, liegen TTS- und STT-Technologien zugrunde. Wenn ein Sprachassistent eine Aufforderung wie „Hey Siri“ hört, benötigt er STT, um sie zu erkennen und zu verstehen. Um mit „Ja“ zu antworten, muss er TTS verwenden, um die „gelernte“ Textantwort in eine Sprachantwort umzuwandeln.
Auch andere Technologien lassen sich mit Conversational AI integrieren, etwa die Sentimentanalyse. Ein Chatbot muss vielleicht negative Sprache erkennen, um im Rahmen eines effektiven Kundenservice empathisch zu antworten.
Entwicklung und Implementierung von Conversational AI
Am Anfang der Entwicklung und Implementierung von Conversational AI steht die Bestimmung des Kontexts, in dem sie erforderlich ist, und der Ziele, die sie erreichen muss. Ausgehend von diesen Entscheidungen können Sie effektive Unterhaltungsabläufe gestalten, die richtige Plattform auswählen und die Kennzahlen für den Erfolg festlegen.
Cloud-basierte Lösungen bieten Unternehmen Skalierbarkeit und Flexibilität, ohne dass eine umfangreiche On-Premises-Infrastruktur erforderlich ist. Durch Hosten von Conversational AI-Anwendungen auf Cloud-Plattformen können Unternehmen leistungsfähige KI-Tools nutzen, die nach Bedarf hochskaliert und wesentlich einfacher bereitgestellt werden können.
Unterhaltungsabläufe gestalten
Bei der Gestaltung von Unterhaltungsabläufen ordnen Sie Ihre User Journeys zu und greifen auf die am häufigsten gestellten Fragen (FAQs) zurück. FAQs bilden die Grundlage für die Entwicklung eines Conversational AI-Tools. Aus der User Journey lässt sich ableiten, welche Dialog-Prompts bei der Entwicklung Priorität haben. Wichtig ist, klein anzufangen. So können Sie einen Anwendungsfall erst einmal testen und den Ton des Outputs (freundlich, sachlich usw.) auf Ihre Marke und Anforderungen abstimmen.
Die richtige Plattform wählen
Die Auswahl der richtigen Conversational AI-Plattform beginnt mit klaren Zielvorgaben. Handelt es sich um einen Kundenservice-Chatbot, benötigen Sie mehrsprachige Funktionen oder Features zur Automatisierung? Als Nächstes können Sie die Fähigkeiten verschiedener Plattformen ermitteln und mit vorab trainierten Modellen auf ihre Eignung testen.
Bedenken Sie, ob die Plattform nahtlos in Ihre aktuellen Systeme integriert werden kann, und bewerten Sie die Fähigkeiten der beteiligten Menschen. Wie viel manueller Arbeitsaufwand ist erforderlich oder möglich, um Anpassungen vorzunehmen? Die Auswahl der richtigen Plattform hängt außerdem von Ihrem Anpassungsbedarf ab.
Erfolgskennzahlen festlegen
Nach der Implementierung müssen Sie je nach Ihren Zielen Kennzahlen für den Erfolg festlegen. Diese Erfolgskennzahlen sollten die Benutzerzufriedenheit, Antwortgenauigkeit, Antwortgeschwindigkeit und Interaktionsabschlussquote messen.
Datensicherheit und Datenschutz garantieren
Für die Entwicklung effektiver Conversational AI ist es unerlässlich, für Datenschutz und Datensicherheit zu sorgen. Durch Auswahl einer Plattform, die Maßnahmen für Datenschutz und -sicherheit integriert und während der Implementierung Richtlinien für Datenschutz/-sicherheit festlegt, können Unternehmen Compliance- und Regulierungsstandards einhalten. Um nicht an Vertrauen zu verlieren und juristische Probleme zu vermeiden, ist dies unvermeidbar.
Herausforderungen bei Conversational AI
Weiterentwicklungen bei NLP und ML haben wesentlich anspruchsvollere Conversational AI-Anwendungen hervorgebracht. Die Technologie hat jedoch weiterhin mit einigen Herausforderungen zu kämpfen:
- Unklare oder mehrdeutige Nutzereingaben zu verstehen, ist für Conversational AI ein gravierendes Problem. Tonfall, Sarkasmus, Rechtschreibfehler, Syntaxfehler und mehr können die KI verwirren und zu fehlerhaften, ungenauen oder nicht zufriedenstellenden Antworten führen.
- Akzepte und verschiedene Sprachen können Stimm- und Spracherkennungssoftware auf die Probe stellen. Die Technologie muss mit einer großen Bandbreite von Daten trainiert werden – ein ressourcenintensives Unterfangen.
- Auch Zuverlässigkeit und Genauigkeit sind für Conversational AI keine leichte Aufgabe. Unternehmen müssen Ressourcen bereitstellen, um die Qualität der Ausgabe ihrer Conversational AI-Tools zu prüfen und zu bewerten, um Halluzinationen zu vermeiden. Das kann viel Zeit und Ressourcen kosten.
Zudem können ethische Bedenken hinsichtlich der Verwendung von Conversational AI eine größere Herausforderung darstellen. Bei der Entwicklung von Conversational AI spielen unverfälschte Antworten und der Schutz der Nutzerdaten eine zentrale Rolle. Entwickler:innen müssen diese Schwierigkeiten meistern, um faire und vertrauenswürdige Systeme zu erschaffen.
Zukunftstrends bei Conversational AI
Während sich NLP, ML und Suchtechnologien weiterentwickeln, wird Conversational AI immer anspruchsvoller – von einem besseren Verständnis der eingaben bis hin zur besseren Emotions- und Sentimenterkennung. Die Personalisierungsmöglichkeiten von Conversational AI werden besser, wovon die Nutzererlebnisse profitieren.
Conversational AI-Tools werden wahrscheinlich auch in Zukunft vermehrt in IoT-Systeme und intelligente Geräte integriert, um Kundeninteraktionen mit Maschinen weiter zu verbessern.
Conversational AI mit Elastic
Elastic nutzt generative KI für seinen AI Assistant mit natürlicher Sprache, um SREs und Sicherheitsanalysten von der Erkennung bis zur Lösung anzuleiten. Mithilfe von Conversational AI fungiert der AI Assistant als Copilot zur Automatisierung und Optimierung von Prozessen. So werden Ingenieure und Analysten von Routineaufgaben entlastet und können sich komplexeren Problemen widmen.
Informieren Sie sich ausführlicher über Conversational AI mit Elastic
Ressourcen zu KI
- IBM bietet zusammen mit Elasticsearch die konversationelle Suche mit watsonx Assistant
- NLP und LLMs: Erläuterung der Unterschiede
- Erstellen eines Chatbots: Tipps und Fallstricke für Chatbot-Entwickler in einer KI-gesteuerten Welt
- Auf generativer KI basierende Elastic-Tools und ‑Funktionen
- Optimieren von Chatbots mit NLP und Vektorsuche bei Elasticsearch