• Startseite
  • Demo zur Extraktion von personenbezogenen Daten

Finden und Extrahieren von personenbezogenen und anderen Daten in Dokumenten und Bildern.

Demo zur Extraktion von personenbezogenen Daten

Worum geht es

Unsere Software findet sensible Informationen in Dokumenten. Hierbei kann es sich zum Beispiel um personenbezogene Daten (PII) handeln wie z.B. Kreditkartennummern oder Namen. Gefunden werden aber auch andere Informationen wie z.B. Zugehörigkeit zu ethnischen oder religiösen Gruppen.

Wir verwenden eine Kombination aus proprietären und quelloffenen Technologien und natürlich unsere eigenen Spezialzutaten, um die wesentlichen Datenpunkte in einem Dokument zu finden. Wir wenden nicht einfach blind vorgefertigte Listen oder reguläre Ausdrücke an, sondern berücksichtigen die Dokumentenstruktur, den sprachlichen Kontext und Verbindungen zu anderen Daten im gleichen Dokument.

Um unseren Ansatz live probieren zu können, folgen Sie bitte dem Link unten und registrieren sich mit Auth0. Falls Sie schon ein Auth0- oder Google-Konto haben, können Sie dieses direkt verwenden, um auf die Demo zuzugreifen.

Verarbeitungsschritte

Wie funktioniert es

  • Sie können entweder einen Text in die Textbox tippen oder z.B. aus einer Website per Copy & Paste übertragen. Sie können aber auch mit dem Beispieltext (Sample Text) beginnen oder eine lokale Datei hochladen. Das funktioniert für gängige Dokumenten- und Bilddateitypen (PDF, Word, Powerpoint, JPEG etc.).
  • Wenn Sie eine lokale Datei verarbeiten wollen, wählen Sie sie über die “Select File”-Option aus und warten Sie, während die Datei in Text konvertiert wird. Die Statusanzeige unte im Bild wird Sie über den Fortschritt informieren.
  • Sobald der Text in die Textbox übertragen wurde, können Sie die Analyse starten, indem Sie auf “Extract Entities” klicken.
  • Sobald alle Entitäten gefunden wurden, wird der Originaltext mit farblich hervorgehobenen Entitäten oben angezeigt und eine Tabelle mit Informationen zu Entititätstypen und den jeweiligen Werten unten auf der Seite.
  • Mit “Result”, “Split” und “Entities” kann die Anzeige jeweils auf die persönlichen Vorlieben angepasst werden.
  • Die Option “Clear” setzt die Seite zurück, so dass Sie ein neues Dokument analysieren können.

Was wird benötigt

  • Textbasierte Inhalte - entweder in Form eines Dokuments (z.B. PDF, Word, Powerpoint etc.) oder eines Bildes, das Text enthält
  • Ein Konto bei Auth0 (dies kann direkt auf der Seite angelegt werden) oder einen bereits existierenden Google-Account
Demo öffnen