Blog

Sicherer KI-Einsatz auch bei sensiblen Daten: Daten-Synthetisierung für Banken und Versicherungen

15 Jan, 2025
Xebia Background Header Wave

Sicherer KI-Einsatz auch bei sensiblen Daten durch Daten-Synthetisierung

Auch wenn seit vielen Jahren von durchgängigen digitalen Prozessen gesprochen wird: Bis heute ist der Schweizer Finanzsektor noch weit davon entfernt. Noch immer sind in den meisten Banken und Versicherungen Papierformulare, -briefe und -vereinbarungen im Einsatz, sowohl in der Beziehung zu Kunden wie zu Vertriebspartnern (Makler, Agenturen). Manche Informationen werden per Webformular oder E-Mail ausgetauscht. Andere liegen als PDF oder sogar als Fotos vor, etwa medizinische Aufnahmen oder Schadensmeldungen im Bereich der Kranken-, Unfall- oder Haftpflichtversicherungen.

Das macht das Erschliessen und Auswerten von Daten bereits schwierig genug. Aber auch wegen vieler rechtlicher Einschränkungen dürfen sensible personenbezogene Daten nur begrenzt verarbeitet werden. Nach einiger Zeit müssen sie sogar ganz wieder gelöscht werden. Ein Ausweg bietet sich hier dank der Weiterentwicklung der künstlichen Intelligenz: Sogenannte synthetische Daten ermöglichen es heute, personenbezogene Informationen stärker als bisher möglich für unternehmerische Zwecke zu nutzen, dabei aber weiter die strengen Vorschriften des Datenschutzes und Persönlichkeitsrechts einzuhalten.

Interne Daten gesetzeskonform erschliessen

Xebia berät insbesondere Banken und Versicherungen zu dieser technologisch nun ausgereiften Möglichkeit, den Mehrwert ihrer Kunden- und Verkaufsdaten gesetzeskonform zu erschliessen. Gearbeitet wird dabei nicht mit den echten Daten, sondern mit synthetischen, die auf Basis des Bestandes per KI erzeugt wurden. Dabei kann es sich um Text- und Zahleneinträge, aber auch andere Datenformate (z. B. durch generative KI erstellt Fotos oder Audiofiles) handeln. Meist werden sie spezifisch für Analysen und Vorhersagen erzeugt und sollen in Modellrechnungen die gleichen Verhaltensweisen wie der ursprüngliche Datenbestand zeigen. Synthetische Daten erlauben, anders als die Originale, auch zielgerichtete Manipulationen wie eine Vergrösserung (z. B. für Lasten-Tests), die Beseitigung von Extremwerten oder das Ausbalancieren unausgeglichener Datensätze.

Die Anonymisierung von Datensätzen ist seit langem üblich. Dabei handelt es sich jedoch immer noch um echte Daten, nur teilweise maskiert (z. B. Kundennamen und -adressen verborgen). Die Identifizierung einzelner Kunden ist dabei im Einzelfall immer noch möglich. Oft genügt schon die Kombination weniger Merkmale, um die echte Person einzukreisen.

Bei synthetischen Daten besteht dieses Risiko nicht. Sie werden algorithmisch vollständig neu erzeugt. Dafür wird der vorhandene echte Datenbestand per künstlicher Intelligenz analysiert und auf Basis der erkannten Muster ein zweiter Datenbestand komplett neu erstellt. Er hat aber die gleichen Informationsgehalte, Merkmale und Verhaltensweisen wie die Vorlage, was mittels spezifischer Metriken und Tests geprüft und bestätigt wird.

Völlige Wahrung von Privatsphäre und Datenschutz

Synthetische Daten erlauben zudem die einfache, längere betriebliche Nutzung von wertvollen, aber sensiblen Informationen unter völliger Wahrung von Privatsphäre und Datenschutz. Zu den typischen Anwendungen gehören Analysen der eigenen Produkte, Dienstleistungen, Kunden und Mitarbeiter, um Effizienz- und Innovationspotenziale zu identifizieren. Oft sind dabei gerade die seltensten Datenpunkte die wertvollsten, weil sie ungewöhnliche Geschäftsvorfälle repräsentieren. Sie können beispielsweise auf besonders ertragreiche oder kostenintensive Produkte und Kunden hinweisen, aber auch auf Betrugsfälle.

Hervorragend lassen sich auch Entscheidungsmodelle mittels synthetischer Daten trainieren, ohne die Privatsphäre der Kunden oder Datenschutzregelungen zu verletzen.

Beispiel

Per KI liessen sich künstlich 10’000 Kundenbewertungen erzeugen, um die korrekte Einordnung und Bearbeitung von Anfragen zu planen und einzuüben, ohne dass dafür echte Personendaten benutzt werden müssen. Trotz des grossen Volumens können wiederkehrende Themen und die Tonalität erkannt werden. Das erlaubt, die automatische Bearbeitung – vom Umgang mit Kommentaren auf der eigenen Webseite bis zur korrekten Vermittlung von Kundenanrufen – skalierbar aufzusetzen.

Viele Schweizer Unternehmen haben wegen der hohen rechtlichen Hürden und Risiken bisher noch gezögert, sie für unternehmerische Zwecke zu erschliessen und zu nutzen. Synthetische Daten – in Kombination mit entsprechender Beratung und Schulung – befreien von den bisherigen Einschränkungen und können damit zu einem neuen Innovationstreiber werden. Sie erlauben den genauen, analytischen Blick auf Produkte und Abläufe, Kunden und Mitarbeiter unter Einhaltung aller gesetzlichen Regelungen. Vielerorts heisst «Datenauswertung» noch immer, dass Mitarbeiter manuell ausgefüllte Excel-Files mit einigen Zahlenwerten herumschicken. Dank der neuen technologischen Möglichkeit der Synthetisierung lassen sich nun die grossen, wertvollen Datenbestände im Unternehmen erschliessen und nutzbar machen, und das sicherer und effektiver als je zuvor.

Zu Datenanalyse per KI beraten lassen

Wie Sie Ihre Datenbestände möglichst effektiv nutzen und Mitarbeiter von einfachen, aber massenhaft anfallenden Tätigkeiten entlasten, sagt Ihnen Jonas Dischl, CTO und Head of Data, Architecture & Engineering Xebia Schweiz. Sie erreichen ihn über: jonas.dischl@xebia.com

Questions?

Get in touch with us to learn more about the subject and related solutions