Artikel

Erstellen einer Sprachschnittstelle mit Dialogflow

Mike Woudenberg

Mike Woudenberg

Aktualisiert Oktober 10, 2025
6 Minuten

Nehmen wir an, Sie haben einen guten Business Case für eine Sprachanwendung entdeckt und möchten nun selbst eine entwickeln. In diesem Artikel erläutert Xebia-Guru Mike Woudenberg berichtet über seine Erfahrungen mit Google Dialogflow, einer Software zur Modellierung von Sprachschnittstellen, um genau das zu tun.

Mit Dialogflow zahlen Sie für die Sprachverarbeitung als Service. Google kümmert sich um die Komplexität der Spracherkennung. Zwar sind für die Nutzung des Tools immer noch Programmierkenntnisse erforderlich, aber Sie können sich auf die Entwicklung der von Ihnen gewünschten Benutzerinteraktion konzentrieren. Google kümmert sich um die Verarbeitung natürlicher Sprache und entwickelt diese Technologie im Hintergrund weiter. Sie können eine funktionierende Sprachschnittstelle in drei einfachen Schritten erstellen:

Schritt 1: Trainieren

Nehmen wir an, Sie haben einen Online-Shop, in dem Ihre Kunden täglich Hunderte von Anrufen mit Fragen zum Bestellstatus tätigen, und Sie möchten, dass Dialogflow diesen Prozess automatisiert. Ihr erster Schritt ist eine Brainstorming-Sitzung, in der Sie eine große Anzahl von Fragen finden, die Ihre Kunden stellen könnten, und Sie verwenden diese, um das System zu trainieren - unten sehen Sie ein Beispiel für einen Webshop für Wohndekoration. Die hervorgehobenen Wörter in Abbildung 1 sind Dialogflow bekannt. Das System verwendet diese Parameter, um die richtige Antwort zu finden.

Schermafbeelding 2019-10-02 om 09.46.08
 Abbildung 1. Dialogflow-Trainingsphrasen

Schritt 2: Test

Als Nächstes werden Sie dies mit echten Benutzern testen. Gibt es irgendwelche Engpässe in dem Prozess? Wie oft treten sie auf? Sie passen den Prozess entsprechend an. Es ist ein schneller, iterativer Prozess, genau wie ein normaler Designablauf. Nur die Schnittstelle ist anders, denn es handelt sich um einen Sprachassistenten oder Agenten, wie es in der Dialogflow-Terminologie heißt.

Schritt 3: Abheben

Sobald alles getestet ist, gehen Sie live, aber das ist nicht das Ende der Entwicklung - die Pflege Ihrer Sprachlösung ist ein fortlaufender Prozess. Dialogflow verfügt über eine Schnittstelle, die Google Analytics ähnelt. Sie zeigt Ihnen, wo die Benutzer nicht mehr aktiv sind, welche Fragen sie stellen und welche Antworten sie auf Ihre Fragen geben. Unerwartete Ergebnisse können in das Trainingsset aufgenommen werden.  

Alles, was Sie schon immer über Dialogflow wissen wollten...

Nur wenige Dinge im Leben sind so einfach wie das Zählen bis drei. Wenn dies das Szenario für eine Sprachschnittstelle wäre, wären dies die Fragen über Dialogflow, die unsere Benutzer vermutlich stellen würden:

Gibt es Abkürzungen?

Natürlich gibt es die. Dialogflow verfügt über Vorlagen für Agenten, die eine bestimmte Aufgabe erledigen, wie z.B. das Einstellen eines Weckers oder die Bestellung von Getränken in einem Café, wie in Abbildung 2 gezeigt. Sie können diese als schnellen Startpunkt oder als Beispiel für Ihre eigenen automatisierten Aufgaben verwenden. Auf der Dialogflow-Website finden Sie eine Reihe von Handbüchern, die Ihnen auf Ihrem Weg helfen.

Schermafbeelding 2019-10-02 om 09.46.17
Abbildung 2. Dialogflow-Vorlagen für bestimmte Aufgaben

Wo ist der Zusatznutzen?

Dialogflow kann umfangreichere Informationen als nur einen einfachen Frage-Antwort-Dialog bereitstellen. Dies geschieht mithilfe einer Software, die API genannt wird und Anwendungen miteinander kommunizieren lässt. Wenn Ihre API beispielsweise auf Ihr Inventarsystem zugreifen kann, kann Dialogflow Informationen über einen bestimmten Auftragsstatus abrufen und diese Informationen an den Gesprächspartner weitergeben. Ohne eine solche Integration könnten Sie bestenfalls Ihre FAQs über einen Chatbot laufen lassen. Mit APIs gibt es viele zusätzliche Optionen.  

Ist Dialogflow auf Google-Dienste beschränkt?

Google kümmert sich um die Spracherkennung und die Verarbeitung natürlicher Sprache, aber die Software ist nicht auf den eigenen Sprachassistenten beschränkt, sondern kann mit verschiedenen anderen Systemen wie Facebook Messenger und Slack verbunden werden. Siri ist ein bisschen komplizierter - was Sie auf Dialogflow aufbauen, kann iOS-Apps ausführen, die wiederum Siri aufrufen.

Wo können Kunden meinen Sprachassistenten finden?

Wenn Ihre Sprachschnittstelle in Ihre bestehenden Kanäle integriert ist, werden sie sie von selbst finden. Momentan gibt es keinen App Store für Sprachanwendungen. Auf Google Assistant finden Sie eine Liste von Assistenten und Informationen darüber, was jeder von ihnen tut.   

Erzählen Sie mir von Personalisierung 

Es gibt verschiedene Möglichkeiten, den Dialog mit Ihren Benutzern anzupassen. Der einfachste Weg, die Identität eines Benutzers zu ermitteln, ist, ihn einfach in einem Gespräch zu fragen und seine Antworten zu integrieren. Während der Konversation können Sie verschiedene Variablen erfassen, wie z.B. das Alter, wie lange er schon Kunde ist usw., und die Konversation dann entsprechend anpassen. Sie brauchen also nicht immer eine Identität, um zu personalisieren, solange Sie etwas über den Benutzer wissen. Wenn Sie einen Schritt weiter gehen und den Benutzer mit seiner Kunden-ID in Ihrem Bestellsystem verknüpfen, ist eine echte kontextbezogene Kommunikation möglich.

Was ist mit der Privatsphäre?

Für Sprachanwendungen gelten die gleichen Regeln wie für andere Kanäle. Sie benötigen die Erlaubnis des Nutzers, seine Daten zu speichern, und dieser Vorgang muss den AVG-Vorschriften entsprechen. Google verlangt außerdem, dass Sie eine Datenschutzrichtlinie für Ihren Assistenten erstellen. Für Daten, die an die API von Google gesendet werden, gelten besondere Datenschutzbestimmungen.

Ist Dialogflow ein selbstlernendes System?

Eine der größten Stärken von Dialogflow ist seine - sich ständig verbessernde - Erkennungsfähigkeit, aber es wird Ihnen keine Antworten auf bisher unbekannte Fragen geben. Sie müssen diese Entwicklung manuell steuern, und zwar auf der Grundlage der Daten zum Benutzer-Engagement.  

Was sind die häufigsten Fallstricke bei Sprachanwendungen?

Der größte Engpass ist, dass das System die Frage eines Benutzers falsch interpretiert. Es kennt nicht die richtigen Variablen oder der Kontext des Anrufs wird falsch eingeschätzt und der Benutzer bricht daraufhin ab. Die Menschen haben wenig Geduld mit einem Sprachassistenten. Wenn das Gespräch zu lange dauert, wechseln sie wahrscheinlich zu einem anderen, effizienteren Kommunikationskanal.

Was kommt als Nächstes?

Dialogflow verbessert ständig die Erkennung natürlicher Sprache und erweitert die Anzahl der Möglichkeiten, sie zu verarbeiten. Das ist großartig, denn es macht Dinge wie das Einkaufen nur mit Ihrer Stimme viel einfacher. Sie sind nicht darauf beschränkt, jeweils nur einen Artikel aufzulisten, sondern können alles in einem einzigen Satz bestellen, und genau hier liegt das Wachstumspotenzial. Noch besser wird es, wenn der Sprachassistent anfängt, Muster zu erkennen: Sie haben wochenlang einen Karton Eier und ein Kilo Bananen bestellt - wollen Sie diese Bestellung diese Woche wiederholen? Diese Technologie kann auch in ganz anderen Bereichen eingesetzt werden, z.B. in der Gesundheitsfürsorge. Ein Chirurg hat vielleicht vier oder fünf Assistenten, die den Patienten überwachen - einen für den Blutdruck, einen anderen für die Herzfrequenz und so weiter. Ein Sprachassistent kann ein einziger Zugangspunkt für all diese Informationen sein.

Schermafbeelding 2019-10-02 om 09.43.21

 

Contact

Let’s discuss how we can support your journey.