? Data Lake ? Semi/un/strukturierte Rohdaten bündeln, für gezielte Datenbereinigung und Datenverarbeitung ?

ID: 2046939

Datenvereinheitlichung von verwandten Elementen im Datensee zu benutzerdefinierten Zielen für Datenforensik und Datenanalyse ?

(PresseBox) - Data Lake: Ein Data Lake ist ein einziger Speicher für Unternehmensdaten, der sowohl Rohdaten (die eine exakte Kopie der Quelldaten darstellen) als auch umgewandelte Daten enthält, die für Berichte und Analysen verwendet werden. Einige wollen, dass das Data Lake das traditionelle Data Warehouse ersetzt, während andere ihn eher als Staging-Bereich für die Einspeisung von Daten in bestehende Data Warehouse-Architekturen sehen.

Den See säubern: Ein Hauptproblem bei Datenseen ist, wie bei echten Seen, dass die Menschen nicht wissen, was sich in ihnen befindet oder wie sauber sie sind. In der Natur können unbekannte Dinge im Wasser das Ökosystem zerstören. Unbekannte Daten in einem Datensee können das Projekt zerstören.

Dan Linstedt rät dazu: Wenn es keine Struktur gibt, gibt es kein Verständnis und es gibt keine Vision, wie diese Daten verwendet werden können oder wie man überhaupt versteht, was man hat. Die Daten müssen klassifiziert und bereinigt werden, um sie in wertschöpfende Informationen für das Unternehmen umzuwandeln. Um mit diesen Daten irgendeine Art von Geschäftsinformationen nutzen zu können, müssen Sie damit beginnen, sie zu schichten, zu profilieren, zu verwalten und zu verstehen, damit Sie aus ihnen Ergebnisse erzielen können.

Fazit: Sie müssen den Daten genügend Vertrauen schenken, um Ihrer Analyse vertrauen zu können. Es ist also besser zu wissen und zu verwalten, was im Wasser ist. Wenn Sie IRI Voracity verwenden, können Sie Daten im See entdecken, integrieren, migrieren, verwalten und analysieren - oder testen - oder produktionsreife Ziele für andere Architekturen vorbereiten, wie ein Data Warehouse, Mart oder ODS - alles innerhalb einer verwalteten Metadaten-Infrastruktur!

Sie wollen auch in der Lage sein, den Data Lake durch verschiedene Datenbereinigungsoperationen zu säubern, zumindest so weit, wie Sie es können. Sie können Voracity nutzen, um die Datenqualität im Data Lake auf folgende Weise zu verbessern:

Finden - Entdecken, Profilieren und Klassifizieren von Daten unter Qualitätsgesichtspunkten

Filtern - Entfernen oder Speichern von bedingt ausgewählten oder doppelten Elementen

Vereinheitlichen - Daten, die durch Fuzzy-Match-Algorithmen gefunden wurden und Wahrscheinlichkeiten festlegen

Ersetzen - in Mustersuchen gefundene Daten durch Literal- oder Nachschlagewerte

Validieren - Identifizierung von Nullwerten und anderen Datenformaten durch Funktionen

Regulieren - Anwendung von Regeln, um Daten außerhalb des Bereichs oder des Kontexts zu finden und zu korrigieren

Synthetisieren - benutzerdefinierte zusammengesetzte Datentypen und neue Zeilen- oder Dateiformate

Standardisieren - Feldfunktions-APIs für Melissa Data oder Trillium verwenden

Wenn weniger Müll im See ist, wird auch weniger Müll in Ihren Analyseergebnissen auftauchen, und das Wasser wird auch für alle anderen sauberer sein.

Weltweite Referenzen: Seit über 40 Jahren nutzen unsere Kunden wie die NASA, American Airlines, Walt Disney, Comcast, Universal Music, Reuters, das Kraftfahrtbundesamt, das Bundeskriminalamt, die Bundesagentur für Arbeit, Rolex, Commerzbank, Lufthansa, Mercedes Benz, Osram,.. aktiv unsere Software für Big Data Wrangling und Schutz! Sie finden viele unserer weltweiten Referenzen hier und eine Auswahl deutscher Referenzen hier.

Partnerschaft mit IRI: Seit 1993 besteht unsere Kooperation mit IRI (Innovative Routines International Inc.) aus Florida, USA. Damit haben wir unser Portfolio um die Produkte CoSort, Voracity, DarkShield, FieldShield, RowGen, NextForm, FACT und CellShield erweitert. Nur die JET-Software GmbH besitzt die deutschen Vertriebsrechte für diese Produkte. Weitere Details zu unserem Partner IRI Inc. hier.

Das Unternehmen JET-Software GmbH wurde 1986 in Deutschland gegründet. Seit fast 4 Jahrzehnten entwickeln wir Software für Big Data Management und Schutz! Unsere Produkte sind für alle gängigen Betriebssysteme: Mainframe (BS2000/OSD, z/OS + z/VSE) und Open Systems (UNIX & Derivate, Linux + Windows).

Wir bieten Lösungen für schnellstes Datenmanagement (Datenprofilierung, Bereinigung, Integration, Migration und Reporting sowie Beschleunigung der BI/DB/ETL-Plattform von Drittanbietern) und datenzentrierten Schutz (PII/PHI-Klassifizierung, -Erkennung und -Deidentifizierung, sowie Re-ID-Risikobewertung und Generierung synthetischer Testdaten).

Zu unseren langjährigen Referenzen zählen deutsche Bundes- und Landesbehörden, Sozial- und Privatversicherungen, Landes-, Privat- und Großbanken, nationale und internationale Dienstleister, der Mittelstand sowie Großunternehmen.

Weitere Infos zu dieser Pressemeldung:

https://https://www.pressebox.de/newsroom/jet-software-gmbh

Unternehmensinformation / Kurzprofil:

Das Unternehmen JET-Software GmbH wurde 1986 in Deutschland gegründet. Seit fast 4 Jahrzehnten entwickeln wir Software für Big Data Management und Schutz! Unsere Produkte sind für alle gängigen Betriebssysteme: Mainframe (BS2000/OSD, z/OS + z/VSE) und Open Systems (UNIX & Derivate, Linux + Windows).
Wir bieten Lösungen für schnellstes Datenmanagement (Datenprofilierung, Bereinigung, Integration, Migration und Reporting sowie Beschleunigung der BI/DB/ETL-Plattform von Drittanbietern) und datenzentrierten Schutz (PII/PHI-Klassifizierung, -Erkennung und -Deidentifizierung, sowie Re-ID-Risikobewertung und Generierung synthetischer Testdaten).
Zu unseren langjährigen Referenzen zählen deutsche Bundes- und Landesbehörden, Sozial- und Privatversicherungen, Landes-, Privat- und Großbanken, nationale und internationale Dienstleister, der Mittelstand sowie Großunternehmen.

Einladung zum 8. Norddeutschen Qualitätstag in hybridem Format

Perlen Papier optimiert mit argvis; Maintenance Portal die Instandhaltung

Bereitgestellt von Benutzer: PresseBox
Datum: 16.05.2023 - 08:00 Uhr
Sprache: Deutsch
News-ID 2046939
Anzahl Zeichen: 5499

Kontakt-Informationen:
Ansprechpartner: Amadeus Thomas
Stadt:

Babenhausen

Telefon: +49 (6073) 711403

Kategorie:

Softwareindustrie

Diese Pressemitteilung wurde bisher 320 mal aufgerufen.

Die Pressemitteilung mit dem Titel:
"? Data Lake ? Semi/un/strukturierte Rohdaten bündeln, für gezielte Datenbereinigung und Datenverarbeitung ?"
steht unter der journalistisch-redaktionellen Verantwortung von

JET-Software GmbH (Nachricht senden)

Beachten Sie bitte die weiteren Informationen zum Haftungsauschluß (gemäß TMG - TeleMedianGesetz) und dem Datenschutz (gemäß der DSGVO).

PresseMitteilung löschen Pressemitteilung ändern PresseMitteilung beanstanden

? Data Lake ? Semi/un/strukturierte Rohdaten bündeln, für gezielte Datenbereinigung und Datenverarbeitung ?

Babenhausen

Softwareindustrie

? IBM Informix ? Zentrales Datenmanagement mit hoher Sicherheit, Performance und ...

?Oracle Daten wirksam schützen? Echtzeit-Schutz durch intelligente, dynamische ...

? Optimale Datenqualität ? Nachhaltige Datenqualität als Grundlage für verlä ...

Alle Meldungen von JET-Software GmbH

Neu hier ?

Werbung

Food-News

Facebook

Community

Sponsoren

Firmenverzeichniss