Blog

Umgang mit persönlichen Informationen in Ihren Daten

Ellis van der Slikke

Aktualisiert Oktober 16, 2025
4 Minuten

In einem meiner letzten Blogbeiträge haben wir eine Reihe von daten- und sicherheitsbezogenen Themen besprochen. Eines der besprochenen Themen war der Umgang mit personenbezogenen Daten (PII) und die Einhaltung von Vorschriften wie GDPR. In diesem Blog-Beitrag möchte ich etwas tiefer in dieses Thema eintauchen und einige Beispiele für Services nennen, die für den Umgang mit personenbezogenen Informationen in Ihren Daten mit AWS genutzt werden können.

Umgang mit persönlichen Informationen in Ihren Datenpipelines

Daten werden oft als das neue Öl oder Gold angesehen, je nachdem, ob Sie klebrige oder glänzende Dinge bevorzugen. Aus diesem Grund neigen Anwendungen dazu, so viele Daten wie möglich zu sammeln, um den größtmöglichen Nutzen daraus zu ziehen. Das Sammeln und Speichern all dieser Daten wird wahrscheinlich dazu führen, dass einige persönliche Informationen gespeichert werden.

Die Definition dessen, was als PII-Daten gilt, ist von Regulierungsbehörde zu Regulierungsbehörde unterschiedlich, z.B. spezifische Datenpunkte wie eine Kreditkartennummer oder ein Name im Gegensatz zum Sammeln ausreichender kontextbezogener Daten, die auf eine bestimmte Person schließen lassen. In diesem Blog-Beitrag liegt der Schwerpunkt auf dem Umgang mit bestimmten Datenpunkten, obwohl er auch als Grundlage für den Umgang mit kontextbezogenen Daten dienen kann.

Es ist jedoch nicht immer offensichtlich, ob Ihre Daten spezifische Informationen über Personen enthalten. Sie könnten zum Beispiel Benutzern erlauben, Dokumente hochzuladen. Diese Dokumente könnten möglicherweise sensible Daten enthalten, ohne dass Sie es merken. Zum Glück gibt es bei AWS einige Services, die bei der Erkennung dieser Art von Daten helfen können.

Amazon Verstehen

Amazon Comprehend ist ein Service, der die Verarbeitung natürlicher Sprache nutzt, um Texte zu analysieren und alle Arten von Erkenntnissen wie Stimmungen, Themen und Entitäten zu liefern. Amazon Comprehend erkennt jedoch auch PII in Ihrem Text. Gegenwärtig unterstützt Comprehend die Erkennung von PII nur auf Englisch. Wenn Sie eine der anderen von Comprehend unterstützten Sprachen verwenden, können Sie versuchen, Ihren eigenen benutzerdefinierten Klassifikator zu trainieren, um die fehlende Funktionalität zu umgehen.

Amazonas Macie

Amazon Macie wird von AWS als vollständig verwalteter Service für Datensicherheit und Datenschutz beschrieben. Er verfügt über eine Reihe von Funktionen, die Ihnen helfen, Ihre Sicherheit und Ihren Datenschutz zu verbessern. Eine davon ist die Erkennung von sensiblen Daten und PII-Daten in Ihren Objekten, die in S3-Buckets auf AWS gespeichert sind. Er kann Dokumente wie pdf und docx scannen, um eine beliebige Anzahl von Datentypen zu erkennen, die als sensibel oder persönlich angesehen werden können. Die Anzahl der Datentypen, die es erkennen kann, ist recht umfangreich, deckt aber möglicherweise nicht alle Ihre Anwendungsfälle ab. Einer der Vorzüge von Amazon Macie ist, dass Sie benutzerdefinierte Datenbezeichner registrieren können. Wenn Sie einen Bezeichner für eine niederländische Personenkennzahl hinzufügen möchten, geben Sie einfach den regulären Ausdruck und optional einige Schlüsselwörter an, um die Genauigkeit zu verbessern.

AWS Kleber

Die dritte Option, die ich Ihnen vorstellen möchte, ist die Verwendung von AWS Glue zur Erkennung von PII in Ihren Datenpipelines. Obwohl AWS Glue wahrscheinlich vor allem wegen seiner ETL-Funktionen verwendet wird, kann es auch ein paar nette kleine Tricks anwenden. Einer davon ist die Erkennung von PII in den Daten, die Ihre AWS-Datenpipelines durchlaufen. Genau wie bei Comprehend und Macie konzentriert es sich hauptsächlich auf US-Datentypen wie US-Passnummern oder Sozialversicherungsnummern sowie auf einige generische Typen wie Namen, E-Mail-Adressen und IP-Adressen. Wie bei Macie können Sie jedoch die Erkennungsfunktionen von AWS Glue erweitern, indem Sie Ihre eigenen benutzerdefinierten Bezeichner erstellen.

Amazonas Macie 1

Jetzt, da wir wissen, wo wir die persönlichen Daten tatsächlich speichern, können wir sie bearbeiten. Je nach Anwendungsfall können Sie damit beginnen, diese Teile der Daten zu redigieren oder sie einfach zu löschen. Im nächsten Abschnitt möchte ich Sie durch die Schritte zur Schwärzung von PII in Ihren AWS Glue-Datenpipelines führen.

Verfasst von

Ellis van der Slikke

Contact

Let’s discuss how we can support your journey.