Artikel

Anwendungen und Beispiele der natürlichen Sprachverarbeitung - Wie kann NLP für Ihr Unternehmen nützlich sein?

Aktualisiert Oktober 10, 2025
14 Minuten

NLP - kurz für Natural Language Processing - ist eine Form der Künstliche Intelligenz (KI), die es Computern ermöglicht um die natürliche menschliche Sprache zu verstehen und zu verarbeiten. NLP ist das Herzstück vieler digitaler Lösungen, die wir tagtäglich nutzen. In diesem Artikel werde ich Ihnen mehr darüber erzählen, wie es funktioniert und wo es aus geschäftlicher Sicht nützlich sein kann.

Im vorherigen NLP-Eintrag haben wir bereits die Grundlagen der natürlichen Sprachverarbeitung erläutert und darüber gesprochen, wie sie in beliebten kundenorientierten Lösungen funktioniert. Lesen Sie ihn, um ein Verständnis von NLP 101 zu erhalten.

 

 

 

Wie NLP eingesetzt wird - Business-Szenarien

 

Selbst wenn Sie kein NLP-Experte sind, wissen Sie wahrscheinlich, dass die Verarbeitung natürlicher Sprache das Herzstück vieler Softwaretools ist, die wir regelmäßig nutzen - von Suchmaschinen und Spamfiltern bis hin zu Übersetzungssoftware, Chatbots oder Grammatikkorrekturprogrammen. Aber abgesehen davon bietet NLP auch starke geschäftliche Vorteile für interne Geschäftsabläufe. In gewissem Sinne kann die natürliche Sprachverarbeitung sowohl an vorderster Front stehen und die Kundenerfahrungen direkt beeinflussen als auch im Hintergrund arbeiten, ohne dass der Kunde es je bemerkt.

Schauen wir uns einige Beispiele an, wie Letzteres aussehen kann.

 

Automatische Analyse von Produktbewertungen

 

Im Zeitalter der zunehmenden Digitalisierung sind Nutzerbewertungen in vielen Branchen zu einer wichtigen Währung geworden. Nehmen wir zum Beispiel den elektronischen Handel. Es ist kein Geheimnis, dass Meinungen im Internet über Erfolg oder Misserfolg von Einzelhandelsgeschäften entscheiden können. Aus diesem Grund müssen Nutzerbewertungen ernst genommen werden.

Wenn es sich jedoch um große Unternehmen handelt, kann das Lesen und Analysieren aller relevanten Internetmeinungen eine unmögliche Herausforderung sein. Und wenn ein Unternehmen das Feedback seiner Kunden ignoriert, könnten sich die Kunden übergangen fühlen oder das Geschäft als nicht vertrauenswürdig ansehen. Ganz zu schweigen davon, dass der E-Shop nicht einmal in der Lage sein wird, die allgemeine Kundenzufriedenheit zu messen.

Außerdem ist nicht jede Internet-Meinung relevant - es lohnt sich also nicht einmal, sie zu lesen. Das zeigt sich ganz deutlich an den Bewertungen, die nicht mit den Kommentaren übereinstimmen.

Natürliche Sprachverarbeitung ist ein praktisches Werkzeug, um diese Probleme zu lösen. Da NLP in der Lage ist, große Mengen an Textinformationen zu analysieren, kann es Nutzerbewertungen verarbeiten und verwertbare Erkenntnisse liefern. Auf diese Weise können E-Commerce-Verantwortliche schnell datengestützte Entscheidungen treffen, die Unzufriedenheit der Kunden minimieren und dafür sorgen, dass sich die Kunden respektiert fühlen.

 

Extrahieren von Informationen aus geschäftsrelevanten Inhalten

 

Alle Führungskräfte in der Wirtschaft sind auf Textinformationen angewiesen. Zu diesen Texten gehören E-Mails, Marktanalyseberichte oder sogar Pressemeldungen. Manchmal kann die Länge dieser schriftlichen Inhalte überwältigend sein. Schließlich hat der Tag nur 24 Stunden, und die E-Mails können sich bis ins Unendliche stapeln.

In diesem Fall hat NLP das Potenzial, als effektiver Mechanismus zur Extraktion nützlicher Informationen zu dienen. Mit Natural Language Processing können Führungskräfte eine zusammengefasste Version relevanter Texte erhalten und so die Zeit für die Durchsicht der Rohfassungen einsparen. So kann NLP ihre Zeit für sinnvollere Aufgaben aufsparen und ihren Arbeitsalltag immens verbessern.

 

Analysieren von Markttrends

 

Je nach den Besonderheiten des Unternehmens erhalten Unternehmen eine Vielzahl von Daten von Vertriebsabteilungen, Beratern, Supportzentren oder sogar direkt von den Kunden. Solche Daten sind meist textbasiert und eignen sich daher auch hervorragend für die NLP-Automatisierung.

Anders als bei den vorherigen Beispielen muss sich die natürliche Sprachverarbeitung jedoch nicht auf die Erstellung von Textzusammenfassungen und Erkenntnissen beschränken. In diesem theoretischen Geschäftsszenario wäre es eine nützliche Option, die Textinformationen in sinnvolle Themencluster zu klassifizieren - zum Beispiel in Marketing-Mixes (4Ps) oder einfache interne Klassen.

 

Alle NLP-Geschäftsszenarien haben eines gemeinsam

 

Die oben genannten Szenarien sind nur Beispiele für die automatische Informationsextraktion in Unternehmen. Je nach den geschäftlichen Anforderungen können die endgültigen Automatisierungsziele völlig unterschiedlich sein. Der Schwerpunkt ist jedoch immer derselbe: das Erkennen und Hervorheben wichtiger Informationen in einem Meer von Rohtext.

Und jetzt werde ich Ihnen mehr über die technischen Aspekte hinter diesem Prozess.

{{cta('24b03a01-d142-431c-9161-a0c1f6cdc6ab')}}

 

NLP-Techniken - Wie man Informationen aus Text extrahiert

 

Dies sind zahlreiche Techniken, die das NLP unterstützen. Sie alle gehören zum Interessensgebiet des Natural Language Understanding und werden bei der Verarbeitung natürlicher Sprache häufig eingesetzt.

Um Ihnen einen Überblick zu verschaffen, werde ich die gängigsten auflisten und erläutern, wie sie in bestimmten Situationen verwendet werden können.

 

Thema Modellierung

 

Die Themenmodellierung liefert Informationen über das Thema des Textes (falls dieses unbekannt ist). Die Themenmodellierung wird manchmal auch als "Textkategorisierung" bezeichnet. Diese Technik kann durch verschiedene Algorithmen unterstützt werden. Unter ihnen ist LDA einer der am häufigsten verwendeten.

LDA ist ein unüberwachter Algorithmus. Mit anderen Worten, er erkennt Themen ohne vorheriges Lernen an Beispielen. Dies führt jedoch auch dazu, dass der Text in abstrakte Themen unterteilt wird. Infolgedessen ist LDA nicht immer nützlich. Die Themen werden nummeriert und nicht benannt (da dies bei unüberwachten Methoden unmöglich ist). Das bedeutet, dass das Ergebnis überprüft werden muss und die Themen manuell identifiziert werden müssen. Dies kann jedoch schwierig sein, vor allem, wenn Sie kurze Texte analysieren. In diesem Fall liefern Techniken zur Modellierung von Themen in kurzen Texten (wie das Dirichlet Mixture Model) bessere Ergebnisse. Leider ist immer noch eine manuelle Analyse erforderlich.

Nachdem die Themen geclustert wurden, müssen die definierten Themen echten Gruppen zugewiesen werden. Wenn Sie z.B. 20 Themen haben und diese in 4 Kategorien unterbringen wollen, müssen Sie manuell entscheiden, welches Thema zu welcher Kategorie gehört. Nachdem Sie ein solches Modell erstellt haben, können Sie jeden neuen Text durch dieses Modell leiten und diesen Text automatisch einem (oder mehreren) Themen zuordnen.

Es ist auch möglich, halb-überwachte Lernprozesse zu verwenden - bei denen Sie das Modell in der Regel zunächst verankern. Dies ist möglich, wenn Sie wissen, welche Wörter für ein bestimmtes Thema am wichtigsten sind (wenn Ihr Thema z.B. "Preis" ist, könnten die Wörter "Preis", "USD", "niedriger", "erhöhen" von Bedeutung sein).

Schließlich können Sie auch überwachte Lernverfahren verwenden. Diese erfordern jedoch in der Regel eine große Anzahl von markierten Beispielen. Verschiedene ML-Algorithmen können dabei helfen - zum Beispiel neuronale Netze.

 

Erkennung von benannten Entitäten (NER)

 

NER ermöglicht es, wichtige Entitäten, die im Text erwähnt werden, zu identifizieren. Sie wird normalerweise verwendet, um Firmennamen, Marken, Ländernamen, Personennamen oder andere wichtige Ausdrücke zu finden. Normalerweise werden NER-Algorithmen vorab trainiert und zeigen Ergebnisse, die spezifisch für den Datensatz sind, auf dem sie trainiert wurden. Infolgedessen werden einige benannte Entitäten nicht erkannt, da die Entität während des Trainings möglicherweise nicht bekannt oder identifiziert wurde.

 

Damit der Algorithmus richtig funktioniert, sollten Sie das vorhandene Modell also weiter trainieren. Dadurch werden Sie es in die Lage versetzen, Entitäten richtig zu erkennen und zu kategorisieren - zum Beispiel zwischen Namen von Schauspielern und Sängern zu unterscheiden. Vorgefertigte Modelle liefern in der Regel einige vordefinierte Kategorien. Wenn Sie darauf aufbauend trainieren, können Sie die Kategorien bei Bedarf manipulieren. Darüber hinaus können Sie Ihre benannten Entitäten - die in Ihrem Unternehmen wichtig sind - anhängen, damit das Modell auch Ihre Entitäten findet.

Sie sollten auch darauf vorbereitet sein, dass der Text Rechtschreibfehler enthält. Solche Fehler sind für statistische Modelle oft eine Herausforderung. Beim Training eines Modells können Sie bestimmte Methoden implementieren, um diese Rechtschreibfehler zu erkennen, indem Sie einige mathematische Formeln verwenden - wie die Levenshtein-Distanz. Wenn Sie davon ausgehen, dass Ihre Texte viele Fehler enthalten (Benutzerbewertungen?), ist eine solche Implementierung unerlässlich.

 

Part-of-Speech-Tagging (POS)

 

POS ermöglicht die Erkennung, welcher Wortteil ein bestimmtes Wort im Satz ist. Dies ist wichtig für die Wortbedeutung: Wenn ein Wort zum Beispiel ein Adjektiv ist, kann es die zuvor entdeckte benannte Entität beschreiben. Diese Beschreibung kann für den Kontext eines bestimmten Satzes wichtig sein. Natürlich ist nicht jeder POS für die Informationsextraktion interessant. Deshalb ist der POS so wichtig, denn er ermöglicht es uns, uns auf die gültigen Teile der Textdaten zu konzentrieren.

Sie können zum Beispiel alle Substantive aus einem gegebenen Text extrahieren und die Subjekte und Objekte definieren. So können Sie schnell beurteilen, was in dem Text erwähnt wird, ohne ihn vollständig zu lesen. Sie können auch Adjektive mit Substantiven kombinieren und so definieren, wie die Objekte wahrgenommen werden.

 

Syntaktisches Parsing

 

Syntaktisches Parsing ist mit der Fähigkeit verbunden, zu definieren, wie verschiedene Wörter in einem Satz miteinander verbunden sind. Lassen Sie uns einen einfachen Satz betrachten:

" Mark hat schöne Äpfel gekauft ".

In diesem Beispiel, " Mark " das Subjekt, während das Wort " schön " die Äpfel beschreibt und nicht Mark.

Wenn wir nur POS-Tagging verwenden, könnten wir den Eindruck gewinnen, dass " schön " eine Beschreibung von Mark ist. Syntaktisches Parsing bewahrt uns vor einem solchen Fehler.

Außerdem sind einige Sätze nicht klar genug für POS-Tagging. Zum Beispiel:

" Mark isst Äpfel " oder " Äpfel fressen Mike " haben die gleichen POSs, aber die Sätze haben völlig unterschiedliche Bedeutungen, wobei der zweite Satz absurd ist. Glücklicherweise kann das syntaktische Parsing die tatsächlichen Abhängigkeiten zwischen den Wörtern erkennen.

 

Semantisches Parsing

 

Semantisches Parsing identifiziert die tatsächliche Bedeutung einer Phrase oder eines Satzes. Semantisches Parsing ist in der Regel mit der Suche nach Ähnlichkeiten zwischen Wörtern (aus verschiedenen Sätzen) verbunden. So kann semantisches Parsing zum Beispiel feststellen, dass das Wort " Pizza " in der Bedeutung ähnlich ist wie " Fast Food " oder " Pasta ". Dies ist in der Regel mit Hilfe von Worteinbettungen möglich - d.h. Methoden, bei denen Wörter/Sätze in Vektoren umgewandelt werden und der Abstand zwischen ihnen ermittelt wird.

 

Auflösung von Kernaussagen

 

Die Auflösung von Koreferenzen ist eine Methode zur Identifizierung verschiedener Wörter, die auf dieselben Objekte verweisen. Zum Beispiel:

"Angela lebt in Boston. Sie ist dort glücklich ."

" Sie " bedeutet " Angela ", während " dort " übersetzt wird mit " Boston ".

Die Auflösung von Koreferenzen basiert in der Regel auf vortrainierten neuronalen Netzwerken. Sie kann wertvolle Informationen liefern, wenn es um lange Texte geht. Stellen Sie sich vor, Sie sind auf der Suche nach Sätzen, die Ihre neue Marke beschreiben. Wenn Sie nach Sätzen suchen, die Ihren Markennamen direkt enthalten (unter Verwendung der Named Entity Recognition), können Sie leicht Sätze auslassen, in denen er durch ein Pronomen referenziert wird. Die Auflösung von Koreferenzen erweitert also Ihre Möglichkeiten, nützliche Informationen zu finden.

 

Extraktion von Beziehungen

 

Die Extraktion von Beziehungen baut auf dem semantischen Parsing auf und ermöglicht die Identifizierung von Beziehungen in einem gegebenen Text. Wenn wir zum Beispiel einen Text über die Heirat einer Person haben, können wir mit Hilfe von Algorithmen zur Beziehungsextraktion herausfinden, wer mit wem verheiratet ist. Die Extraktion von Beziehungen ist in der Regel ein komplexer Algorithmus, der mit einem großen Datensatz arbeitet.

 

Stimmungsanalyse

 

Die Sentiment-Analyse ist ein leistungsstarkes Werkzeug, um die Stimmung eines bestimmten Satzes zu erkennen. Sie können die Informationen in vielen Formen erhalten, aber die reine Stimmung (negativ, neutral, positiv) oder die Polarität (normalerweise von -1 bis 1, kontinuierlicher Bereich) sind die beliebtesten. Die Polarität bietet mehr Tiefe - zum Beispiel bedeuten die Polaritäten 0,65 und 0,98 beide "positive Stimmung", aber sie sind eindeutig nicht identisch.

Die Analyse von Stimmungen ist jedoch komplexer als es scheint.

Dieselbe Information kann positiv oder negativ sein, je nachdem, auf welches Unternehmen sie sich bezieht. Es liegt alles im Auge des Betrachters. Wenn zum Beispiel eine Stimmung für Ihren direkten Konkurrenten positiv ist, ist es aus Ihrer Sicht eher eine negative Information.

Darüber hinaus können Sätze gemischte Bedeutungen haben. Der Satz "Unternehmen A liefert seine Produkte an den Kunden, und die sind viel schlechter als die von Unternehmen B" hat zwei Einheiten und eine negative Grundstimmung. Aber natürlich richtet sich diese Stimmung nicht gegen Unternehmen B. Aber letztendlich können Sie den obigen Satz nicht in zwei Sätze aufteilen, weil dann die Gesamtbedeutung verloren geht.

Aber selbst mit diesen Problemen bietet die Stimmungsanalyse wertvolle Einblicke in Textinformationen. So können Sie zum Beispiel die Bewertungen in Ihrem Online-Shop anhand des Textinhalts des Kommentarbereichs überprüfen.

 

Text-Zusammenfassung

 

Texte können mit NLP-Methoden automatisch zusammengefasst werden. Dazu gibt es mehrere Techniken (z.B. TF-IDF), die relativ gute Ergebnisse liefern. Allerdings erfordern sie recht große Datensätze und Fließtext anstelle von einfachen, kurzen Kommentaren.

Es gibt eine Vielzahl von Techniken zur Textzusammenfassung, darunter auch sehr anspruchsvolle. Außerdem können diese Methoden sowohl für lange als auch für kurze Texte eingesetzt werden, wobei unterschiedliche Ansätze verwendet werden. Die beiden am weitesten verbreiteten Methoden der Textzusammenfassung sind die abstrakte und die extraktive Zusammenfassung. Bei der extraktiven Zusammenfassung wird versucht, die wichtigsten Teile des Textes zu identifizieren und eine Zusammenfassung auf der Grundlage der identifizierten Sätze zu erstellen. Bei der abstrahierenden Zusammenfassung wird versucht, den Text neu zu interpretieren und einen völlig neuen Inhalt zu liefern - in der Annahme, dass dieser neue Inhalt eine Zusammenfassung des ursprünglichen Inhalts ist.

 

 

NLP-Techniken - Extraktionsmethoden in Aktion

 

Die meisten der genannten Techniken können kombiniert werden, um möglichst präzise Erkenntnisse zu gewinnen. Stellen Sie sich z.B. den folgenden Aufbau vor, der darauf abzielen könnte, Informationen aus Kommentaren zu extrahieren:

 

  1. Verwenden Sie NER um Entitäten zu identifizieren.
  2. Verwenden Sie POS Tagging, um Substantive, Eigennamen und Adjektive zu finden (andere Entitäten können ebenfalls in diese Kategorie fallen).
  3. Verwenden Sie syntaktisches Parsing um Beziehungen zwischen den benannten Entitäten und ihren Deskriptoren zu erhalten.
  4. Verwenden Sie Stimmungsanalyse um die Stimmung des Kommentars zu identifizieren und die Stimmung mit benannten Entitäten zu verknüpfen.
  5. Verwenden Sie Themenmodellierung um die angegebenen Kommentare den vordefinierten Themen zuzuordnen.
  6. Verwenden Sie Textzusammenfassung entweder in Form eines Algorithmus zur Textzusammenfassung oder indem Sie die wichtigsten Phrasen und ihre Assoziationen herausnehmen.

 

 

NLP - Vorteile

 

Die Informationen, die durch unsere beispielhafte Einrichtung gewonnen werden, können dann auf viele verschiedene Arten genutzt werden:

  • Präsentieren Sie die gefundenen benannten Entitäten in einer gegebenen Menge von Sätzen.
  • Zeigen Sie die Stimmungsanalyse, die mit Sätzen mit den angegebenen Entitäten verbunden ist (oder die Gesamtverteilung der Stimmungsanalyse).
  • Zeigt die Assoziationen für die gegebene Phrase/das gegebene Wort/die gegebene Entität an.
  • Erlauben Sie das Speichern von nicht erkannten Phrasen als Phrasen, die später erkannt werden sollen (also - mit anderen Worten - markieren Sie etwas, das in einer späteren Analyse gefunden werden soll).
  • Zeigt die Kommentare an, die mit einer bestimmten Entität und einem bestimmten Sentiment verbunden sind.
  • Verbinden Sie gefundene benannte Entitäten in Gruppen und ermöglichen Sie die Analyse ihrer Verbindungen.
  • Analysieren Sie Trends - z.B. die Stimmung von Entitäten im Laufe der Zeit oder einen plötzlichen Rückgang der Stimmung für eine bestimmte Entität (wie Ihre Marke) oder ähnliches. Dies kann benutzerdefiniert sein.
  • Analysieren Sie die eingehenden Kommentare und erkennen Sie die zuvor gefundenen Korrelationen (z.B. Ihre Marke + eine negative Stimmung) und benachrichtigen Sie die betroffenen Parteien. Die Korrelationen können benutzerdefiniert sein.
  • Visualisieren Sie die Themen, um die am häufigsten verwendeten Wörter innerhalb des gegebenen Themas, die Stimmungsverteilung im Thema oder die Stimmung, die einer bestimmten benannten Entität im Thema zugeordnet ist, darzustellen. Sie können sich natürlich viele andere Visualisierungen vorstellen, die Sie aus den extrahierten Informationen gewinnen können.

 

Und viele mehr.

 

 

NLP - Werkzeuge

 

Wie in unserem ersten Artikel der Serie beschrieben, gibt es mehrere Tools, mit denen Sie die oben genannten Analysen durchführen können. Sie können Cloud-Dienste (wie Amazon Comprehend) oder die verfügbaren NLP-Bibliotheken (wie spaCy) verwenden. Comprehend bietet eine einfach zu bedienende API - aber aufgrund seiner geschlossenen Form ist es nicht vollständig anpassbar; es liefert jedoch viele Informationen und ermöglicht eine Nachschulung.

SpaCy hingegen unterstützt nahezu unbegrenzte Anpassungen und bietet eine Vielzahl von Tools und Pipelines, die zusätzliche Analysen ermöglichen (dies ist auch ein Weg, um mehrere Cloud-API-Anfragen für einen bestimmten Datensatz zu vermeiden). SpaCy bietet eine Reihe von vortrainierten Modellen von hoher Qualität und ermöglicht Berechnungen in großem Maßstab.

Schließlich ist es wichtig, daran zu denken, dass die spezifischen Tools selbst nicht die entscheidende Komponente sind. Es gibt wirklich viele davon. Die Priorität liegt darin, die für die Erreichung der Geschäftsziele relevante Verarbeitung zu identifizieren.

 

 

Verarbeitung natürlicher Sprache - Abschließende Überlegungen

 

Denken Sie daran, dass es aus der Unternehmensperspektive entscheidend ist, zu planen, wie die Datenanalyse durchgeführt werden soll und wie Sie die Ergebnisse zu verwenden gedenken. Dazu gehört auch die Antwort auf die folgenden Fragen:

  1. Wie die zukünftigen Maschinen mit Daten gefüttert werden könnten, welche Datenquellen geplant werden sollten, welche Beschränkungen die Datenverarbeitungspipelines erfüllen sollten.
  2. Welche Geschäftsfunktion würde die Ergebnisse nutzen und auf welcher Grundlage (da vorhergesagte Werte oder Geschäftserkenntnisse die Entscheidungsfindung unterstützen können)?
  3. Wie könnte der End2End-Geschäftsprozess für die Nutzung der Daten aussehen?
  4. Was sind die aktuellen Erwartungen bezüglich der Ausgabedaten?
  5. Wie können die Daten so präsentiert werden, dass sie den größtmöglichen geschäftlichen Nutzen bringen?

 

Die Arbeit an Geschäftsszenarien ist ein wesentlicher Bestandteil des gesamten Prozesses - zusammen mit dem eigentlichen Datenverarbeitungsstrom.

 

Und wenn Sie die Vorteile von maßgeschneiderten NLP-Lösungen nutzen möchten, steht Ihnen das Innovation Lab zur Verfügung.

Contact

Let’s discuss how we can support your journey.