? Schutz von/in Dark Data ? Gezielte Datenmaskierung von Namen in unstrukturierten Quellen wie PDF,

? Schutz von/in Dark Data ? Gezielte Datenmaskierung von Namen in unstrukturierten Quellen wie PDF, MS Office-Dokumenten, Bildern oder Textdateien ?

ID: 1991253

NER-Modelle und Sprachen: Lösung mit der Verwendung von Named Entity Recognition wie Tensorflow- und PyTorch ?



(PresseBox) - Tensorflow- und PyTorch-NER-Modelle: Die Erkennung von benannten Entitäten (Named Entity Recognition, NER) ist eine Art des maschinellen Lernens (ML), um benannte Entitäten im grammatikalischen Kontext von unstrukturiertem Text (Dokumenten) zu erkennen. NER wird benötigt, um Dinge wie Personennamen und Straßenadressen zu finden, da diese weder Mustern entsprechen, noch wahrscheinlich eine Übereinstimmung mit Werten in einer definierten Liste (Lookup Set) haben.

Da es sich bei vielen Entitäten wie Personennamen oder Adressen um persönlich identifizierbare Informationen (PII) handelt, verwendet IRI DarkShield NER, um solche Daten zu finden und zu maskieren. Während die Kenntnis des Namens einer Person allein vielleicht kein allzu großes Risiko darstellt, erhöht sich in Kombination mit anderen sensiblen Daten das Risiko, dass diese Person zum Ziel von Cyberkriminellen wird, wenn der Datensatz angegriffen wird.

IRI DarkShield unterstützt bereits seit Jahren den Import und das weitere Training von OpenNLP-Modellen zum Auffinden und Maskieren von benannten Entitäten. Neu in der DarkShield RPC API 2022 ist jedoch die Unterstützung für moderne Tensorflow und PyTorch NER Modelle. Dies ist eine bedeutende Verbesserung gegenüber dem ersten Satz schneller, aber weniger NER-Modelle auf Basis von OpenNLP.



NER-Modelle, einschließlich solcher aus Quellen wie dem Hugging Face Model Hub. Allein von diesem Hub sind NER-Modelle in über 100 Sprachen verfügbar. Viele dieser Modelle nutzen die Vorteile der relativ neuen Transformer-Architektur für maschinelles Lernen, um die Trainingszeiten zu verkürzen und die Genauigkeit zu verbessern.

Um den Transformers Search Matcher mit der DarkShield-API zu verwenden, empfehlen wir ein System mit einem Grafikprozessor, um die Inferenz der meisten Modelle zu beschleunigen (in der Regel um mindestens das 20-fache). Die DarkShield-API lädt beim Start des Servers automatisch die für den Transformers-Matcher erforderlichen Abhängigkeiten herunter.

Modelle werden entweder als lokales Verzeichnis oder aus dem Hugging Face Model Hub angegeben. Bei direkter Angabe aus dem Hugging Face Model Hub sollte das Python-Skript model_util.py aus dem Ordner plankton/utils vorher ausgeführt werden, um das Modell herunterzuladen. Diesem Skript können die Argumente des Modells und des Tokenizer-Namens (oft derselbe wie der Modellname) übergeben werden.

Wir werden die Erkennung von benannten Entitäten in englischen, türkischen und japanischen Texten anhand von drei verschiedenen NER-Modellen demonstrieren, die alle im Hugging Face Model Hub verfügbar sind. Hier finden Sie den detaillierten technischen Blog-Artikel!

Weltweite Referenzen: Seit über 40 Jahren nutzen unsere Kunden wie die NASA, American Airlines, Walt Disney, Comcast, Universal Music, Reuters, das Kraftfahrtbundesamt, das Bundeskriminalamt, die Bundesagentur für Arbeit, Rolex, Commerzbank, Lufthansa, Mercedes Benz, Osram,.. aktiv unsere Software für Big Data Wrangling und Schutz! Sie finden viele unserer weltweiten Referenzen hier und eine Auswahl deutscher Referenzen hier.

Partnerschaft mit IRI: Seit 1993 besteht unsere Kooperation mit IRI (Innovative Routines International Inc.) aus Florida, USA. Damit haben wir unser Portfolio um die Produkte CoSort, Voracity, DarkShield, FieldShield, RowGen, NextForm, FACT und CellShield erweitert. Nur die JET-Software GmbH besitzt die deutschen Vertriebsrechte für diese Produkte. Weitere Details zu unserem Partner IRI Inc. hier.

JET-Software entwickelt und vertreibt seit 1986 Software für die Datenverarbeitung für gängige Betriebssysteme wie BS2000/OSD, z/OS, z/VSE, UNIX & Derivate, Linux und Windows. Benötigte Portierungen werden bei Bedarf realisiert.

Wir unterstützen weltweit über 20.000 Installationen. Zu unseren langjährigen Referenzen zählen deutsche Bundes- und Landesbehörden, Sozial- und Privatversicherungen, Landes-, Privat- und Großbanken, nationale und internationale Dienstleister, der Mittelstand sowie Großunternehmen.

Weitere Infos zu dieser Pressemeldung:
Unternehmensinformation / Kurzprofil:

JET-Software entwickelt und vertreibt seit 1986 Software für die Datenverarbeitung für gängige Betriebssysteme wie BS2000/OSD, z/OS, z/VSE, UNIX & Derivate, Linux und Windows. Benötigte Portierungen werden bei Bedarf realisiert.
Wir unterstützen weltweit über 20.000 Installationen. Zu unseren langjährigen Referenzen zählen deutsche Bundes- und Landesbehörden, Sozial- und Privatversicherungen, Landes-, Privat- und Großbanken, nationale und internationale Dienstleister, der Mittelstand sowie Großunternehmen.



drucken  als PDF  PSE Solutions GmbH aus der Schweiz beteiligt sich an BLACKPIN und geht enge strategische Kooperation mit dem sicheren mobilen Messenger ein Ob klassisch oder digital biometrisch auf jeden Fall immer zuverlässig und sicher. Die moderne Verwaltung mit unterschiedlichen Buchungsmedien
Bereitgestellt von Benutzer: PresseBox
Datum: 30.06.2022 - 08:15 Uhr
Sprache: Deutsch
News-ID 1991253
Anzahl Zeichen: 5652

Kontakt-Informationen:
Ansprechpartner: Amadeus Thomas
Stadt:

Babenhausen


Telefon: 06073-711403

Kategorie:

Softwareindustrie



Diese Pressemitteilung wurde bisher 306 mal aufgerufen.


Die Pressemitteilung mit dem Titel:
"? Schutz von/in Dark Data ? Gezielte Datenmaskierung von Namen in unstrukturierten Quellen wie PDF, MS Office-Dokumenten, Bildern oder Textdateien ?"
steht unter der journalistisch-redaktionellen Verantwortung von

JET-Software GmbH (Nachricht senden)

Beachten Sie bitte die weiteren Informationen zum Haftungsauschluß (gemäß TMG - TeleMedianGesetz) und dem Datenschutz (gemäß der DSGVO).

? IBM Informix ? Zentrales Datenmanagement mit hoher Sicherheit, Performance und Zukunftsfähigkeit ? ...
Mit der IRI Workbench steht eine zentrale, plattformübergreifende Umgebung zur Verfügung, um Daten aus IBM Informix Informix effizient zu analysieren, zu integrieren, zu schützen und weiterzuverarbeiten. Die kostenlose Lösung läuft unter Windows, macOS und Linux und vereint alle relevanten Date

?Oracle Daten wirksam schützen? Echtzeit-Schutz durch intelligente, dynamische Maskierung in Oracle-Datenbanken ? ...
Oracle-Daten in Echtzeit schützen: Heben Sie Ihre Datensicherheit auf ein neues Niveau, denn IRI Ripcurrent kombiniert leistungsstarke Replikation mit intelligenter, dynamischer Datenmaskierung – speziell für Oracle-Datenbanken entwickelt. In Verbindung mit der zentralen IRI Workbench steuern Si

? Optimale Datenqualität ? Nachhaltige Datenqualität als Grundlage für verlässliche Entscheidungen ? ...
Hochwertige Daten sind ein zentraler Erfolgsfaktor für verlässliche Analysen, effiziente Geschäftsprozesse und eine nachhaltige Kostenkontrolle. Unzureichende Datenqualität führt häufig zu Fehlentscheidungen, redundanten Datenbeständen und ineffizienten Abläufen. Da Datenqualität in vielen


Weitere Mitteilungen von JET-Software GmbH


PSE Solutions GmbH aus der Schweiz beteiligt sich an BLACKPIN und geht enge strategische Kooperation mit dem sicheren mobilen Messenger ein ...
BLACKPIN beschäftigt sich mit agilem Arbeiten von morgen und baute für den B2B Bereich die letzten Jahre einen DSGVO konformen, sicheren mobilen Messenger. Nun gehen die Schwaben eine enge Kooperation mit der Schweizer Firma PSE Solutions GmbH ein. Die in Rothenburg ansässige Firma entwickelte ei

Persistent unter den Top-Unternehmen bei den Institutional Investor's 2022 Asia Executive Team Awards ...
Glaubwürdigkeit, solide Corporate-Governance-Praktiken und starke Führungsqualitäten Zusammenfassung der Nachrichten Persistent Systems (https://www.persistent.com/) (BSE: PERSISTENT) (NSE: PERSISTENT) wurde von hoch angesehenen Sell-Side-Analysten in der Rangliste "2022 Asia Executive T

Green Streets DataLink bietet einfachen Zugang zu einer Fülle von proprietären Gewerbeimmobilien-Daten ...
Anlageexperten können aktuelle, vertrauenswürdige und umfassende Green-Street-Daten direkt in ihre Finanzmodelle und täglichen Arbeitsabläufe einbetten, um Anlageanalysen besser zu unterstützen. Green Street (https://c212.net/c/link/?t=0&l=de&o=3579532-1&h=41086479&u=https%3A

Wolters Kluwer CCH® Tagetik veröffentlicht umfassenden Beschaffungsleitfaden für Corporate Performance Management Software ...
Wolters Kluwer, ein weltweit führender Anbieter von Fachinformationen, Softwarelösungen und Dienstleistungen, gibt den Launch seines „Umfassender Beschaffungsleitfaden für Corporate Performance Management-Software" bekannt, einem kostenfreien Online-Leitfaden, der Verbrauchern und Branchen


 

Werbung



Sponsoren

foodir.org The food directory für Deutschland
News zu Snacks finden Sie auf Snackeo.
Informationen für Feinsnacker finden Sie hier.

Firmenverzeichniss

Firmen die firmenpresse für ihre Pressearbeit erfolgreich nutzen
1 2 3 4 5 6 7 8 9 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z