Blog

Sprachgesteuerte Apps der nächste Hype?

Robert van Loghem

Aktualisiert Oktober 22, 2025
3 Minuten

In den 1980er Jahren gab es eine Fernsehserie namens Knight Rider, in der Michael Knight, ein Selbstjustizler, mit seinem Auto K.I.T.T. die Bösewichte bekämpfte. Das Besondere an dieser Serie war für mich das Auto. Mr. Knight konnte mit ihm sprechen und es verstand, was er sagte und meinte und antwortete sinnvoll. Manchmal warf er auch eine witzige Bemerkung ein. Es gab dem Auto eine Persönlichkeit, es war der Co-Star der Serie.

Siri Jetzt im Jahr 2011 hat Apple Siri veröffentlicht. Ein Assistent, mit dem Sie bestimmte Fragen stellen können, wie z.B. "Wie wird das Wetter morgen?", und der, genau wie das Auto K.I.T.T., mit der richtigen Information antwortet. Im obigen Fall also das Wetter für morgen, basierend auf Ihrem aktuellen Standort. Wenn ich Siri frage "Was ist DIE Antwort?", antwortet sie manchmal mit der Zahl 42, was für Nerds und Geeks eine ziemlich geistreiche Antwort ist (denn es ist DIE Antwort auf DIE Frage in Per Anhalter durch die Galaxis). So scheint mir Siri Persönlichkeit zu haben, es beantwortet Fragen mit einem bestimmten Geschmack. Für mich war es 2011 das erste Mal, dass man einem Gerät (einem Mobiltelefon) fast alles fragen konnte und es (versuchte), eine intelligente, witzige Antwort zu geben. Ein Hype? Ist die Tatsache, dass Sie mit Ihrem Telefon sprechen und es tatsächlich versteht, was Sie meinen und daraufhin antwortet, etwas, das wir in Zukunft häufiger sehen werden, oder ist das nur ein Hype?

Ich denke, das wird ein riesiger Erfolg und wird bleiben. Vergleichen Sie Folgendes: Wie viele Klicks und Sekunden brauche ich, um einen neuen Termin für morgen bei meinem Zahnarzt in meiner Heimatstadt zu vereinbaren? Wenn ich auf der Benutzeroberfläche berühre/klicke, brauche ich etwa 30 Sekunden. Wenn ich das Telefon bitte, einen Termin zu vereinbaren, brauche ich nur 4 Sekunden. Das ist viel schneller. Das Einzige, was ich tun musste, war, den Satz zu sagen: "Vereinbaren Sie morgen um neun Uhr einen Termin bei meinem Zahnarzt in meiner Heimatstadt". Bei der Verwendung von Touch hingegen musste ich einen neuen Termin anlegen, das Wort"Zahnarzt" und"Heimatstadt" eingeben, die Uhrzeit einstellen und dann speichern. Es gibt noch weitere Beispiele, bei denen die Sprachsteuerung viel schneller ist als die Verwendung von Touch.

  • Banking-App -"Überweisen Sie 300 Euro von meinem Sparkonto auf das Zahlungskonto meiner Frau", 5 Sekunden für Sprache, >15 Sekunden für Touch
  • Heizungs-App -"Ich komme 2 Stunden früher nach Hause, stellen Sie die Temperatur auf 19 Grad Celsius ein", 4 Sekunden für Sprache, >10 Sekunden für Touch Das nächste große Ding... Warum wird es also das nächste Ding in der Benutzerschnittstelle sein? Weil es nicht nur persönlicher (das Gerät kann wie ein Mensch reagieren) und natürlicher ist (Sie sagen Dinge, die Sie auch zu einem anderen Menschen sagen würden), sondern auch eine viel schnellere Art der Interaktion mit Ihrem Gerät darstellt. Durch die Berührung sind grafische Benutzeroberflächen viel einfacher zu bedienen (selbst Kleinkinder wissen, wie man zum nächsten Foto wischt). Bei der Verwendung von Sprache kann eine Person innerhalb weniger Sekunden eine komplexe Frage an ein Mobiltelefon stellen und das Gerät wird die Aufgabe ausführen. Auch Google holt auf und bringt Ende des Jahres den Assistant, auch bekannt als Siri, für Android auf den Markt, was bedeutet, dass sprachgesteuerte Apps zum Mainstream werden.In einem der nächsten Beiträge werde ich näher darauf eingehen, wie Sie Ihre eigene sprachgesteuerte App mit Hilfe von Advance Speech Recognition (ASR), natürlicher Sprachverarbeitung und Text to Speech (TTS) Technologien programmieren können. Es mag einfach klingen, aber es ist wirklich schwer, Menschen zu hören und zu verstehen, was sie sagen.

Verfasst von

Robert van Loghem

I'm always interested in the latest and greatest when it comes to; communication, infrastructure, user experience and coming up with some crazy creative solution which might seem as a weird combination ;) I use and spread the word about multimedia (podcasts, vodcasts, movies, comics) to effectively communicate concepts, ideas, documentation, past experiences and so on. Furthermore i am heavy into infrastructure but then the middleware part, like HTTP servers, Application Servers, Messaging, Virtualization, etc... I get really enthousiastic if the infrastructure is clustered, highly available and is critical to doing business! I also like to do development and thus "i eat my own dogfood".

Contact

Let’s discuss how we can support your journey.