ARD-PAN führt Textmining-System von picturesafe ein

ARD-PAN führt Textmining-System von picturesafe ein

ID: 540168

Die sieben ARD-Rundfunkanstalten des PresseArchivNetzwerks(PAN) nutzen ein hochleistungsfähiges dio:semantic-System für die inhaltliche Erschließung ihres Presse-Archivs.



ARD-PAN führt Textmining-System von picturesafe einARD-PAN führt Textmining-System von picturesafe ein

(firmenpresse) - Das PresseArchivNetzwerk hat Ende 2010 unter Federführung des
Westdeutschen Rundfunks (WDR) eine neue, von allen Mitgliedern gemeinsam genutzte und mehrere Millionen Artikel umfassende Textdatenbank eingeführt. Ergänzend wurde die von picturesafe gelieferte Textmining-Komponente dio:semantic installiert und nach Abschluss der Abnahmetests Mitte 2011 in den Produktionsworkflow übernommen.

Das neue picturesafe-System umfasst die maschinelle Vorerschließung auf Basis der PAN-Klassifikation und des Regelwerks, sowie die Realisierung eines Statistik-Moduls für Qualitätsauswertungen. Darüber hinaus leistet es die Pflege der für das Textmining relevanten Filter, Parameter und das Update/Retraining der Klassifikation und der verwendeten Named Entities.

Das hierarchische PAN-Klassifikationssystem ist Basis für eine intelligente Recherche in der Textdatenbank. Über ausgereifte Suchfunktionalitäten können Artikel in den Sprachen Deutsch, Englisch, Französisch und Spanisch treffsicher und mit geringem Zeitaufwand gefunden werden. Relevantere Suchergebnisse werden auch dadurch erzielt, dass das PAN-Klassifikationssystem mit Datenfeldern der Sacherschließung, Aspekten und freien Deskriptoren in Beziehung steht. Weiterhin werden relevante Orte, Personen und Geografika anhand von Regeln identifiziert.
Das dio:semanic Textmining-System bildet diese Inhaltsstruktur vollständig ab. Um einen Artikel im PAN-Klassifikationssystem vollständig zuzuordnen, werden vier Wissensmodelle pro Sprache verwendet.

Bei vier unterstützten Sprachen im PAN-System werden insgesamt 16 Klassifizierung-Wissensmodelle eingesetzt, um eine optimale Analyse der Presseartikel zu gewährleisten.

Trotz der komplexen Aufgabe ist die notwendige Infrastruktur für die Anbindung des picturesafe-Textmining-Systems verhältnismäßig einfach gehalten, was zur Kostensenkung beiträgt. Das speicher- und performanceoptimierte Verfahren ermöglicht es dem dio:sematic pro Stunde über 300.000 Artikel zu analysieren oder in der Wissensbasis zu trainieren.



Die Ergebnisqualität des Textmining-Systems ist von zentraler
Wichtigkeit. Schon im Vorfeld wurden die Pressedaten des PAN vom Fraunhofer Institut wissenschaftlich analysiert, und damit die Qualitätsstandards für die Auftragsvergabe festgelegt. picturesafe erfüllte diese Standards und konnte sie im Produktivbetrieb nochmals steigern.

"Besonders erfreulich ist die produktive und angenehme Zusammenarbeit zwischen den Mitarbeitern des PAN und dem picturesafe Team" sagt Entwicklungsleiter Gerhard Wendorf. "Neben der technischen Leistungsfähigkeit des Systems, ist es wichtig das wir in allen Bereichen einen guten Draht zum Kunden haben. Auch im dokumentarischen Umfeld funktioniert die Abstimmung reibungslos. Unsere Diplom-Bibliothekare und Dokumentare sprechen die gleiche Sprache wie die Mitarbeiter in den Fachabteilungen des Kunden."

Apropos Sprache: dio:semantic beinhaltet mehrsprachige Linguistikmodule zur Analyse und Aufbereitung unstrukturierter Dokumente, welche die Basis für Klassifizierung, Clusterung, Ähnlichkeitsanalyse und zur Generierung von Tag Clouds und Textsummarys bilden.

Weitere Infos zu dieser Pressemeldung:

Themen in dieser Pressemitteilung:


Unternehmensinformation / Kurzprofil:

Die picturesafe media/data/bank GmbH entwickelt seit 1992 Softwarelösungen zum Management von Mediendaten und bietet Full Service von der Aufnahme bis zur Auslieferung digitaler Daten in Form von Texten, Bildern, Video- und Tondaten. Dazu werden marktetablierte Produkte deren Online- sowie DTP-Schnittstellen sowie die Entwicklung unternehmensspezifischer Individuallösungen angeboten. Die Produkte und Services von picturesafe gestalten Informations- und Medienproduktionsprozesse und steigern nachhaltig deren Produktivität. picturesafe hat seinen Firmensitz in Hannover und eine Niederlassung in Hamburg, Deutschland. Mehr Informationen: www.picturesafe.de



PresseKontakt / Agentur:

jansass GmbH
Jan Sass
Lemsahler Dorfstr. 4
22397 Hamburg
info(at)jansass.com
49 40 300 36 844
http://www.jansass.com



drucken  als PDF  an Freund senden  Die Börsenmedien AG hebt mit dem PLASSEN Verlag neues Imprint aus der Taufe Zweiter Biathlon-Weltcup aus Hochfilzen live im ZDF / Auftakt zu großem Wintersportwochenende
Bereitgestellt von Benutzer: Adenion
Datum: 14.12.2011 - 16:35 Uhr
Sprache: Deutsch
News-ID 540168
Anzahl Zeichen: 3423

Kontakt-Informationen:
Ansprechpartner: Oliver Bauer
Stadt:

Hamburg


Telefon: +49 40 37 41 27 - 811

Kategorie:

Medien und Unterhaltung


Meldungsart:
Anmerkungen:


Diese Pressemitteilung wurde bisher 871 mal aufgerufen.


Die Pressemitteilung mit dem Titel:
"ARD-PAN führt Textmining-System von picturesafe ein"
steht unter der journalistisch-redaktionellen Verantwortung von

picturesafe media/data/bank (Nachricht senden)

Beachten Sie bitte die weiteren Informationen zum Haftungsauschluß (gemäß TMG - TeleMedianGesetz) und dem Datenschutz (gemäß der DSGVO).

Picturesafe bringt den FOCUS auf den Amazon Kindle ...

Der Amazon Kindle E-Book-Reader verfügt über eine Bibliothek aus über 800.000 elektronischen Büchern; alleine 40.000 davon in deutscher Sprache. E-Paper-Ausgaben über Amazon und das 3G-basierte WhistleNet, sowie die von den Nutzern gerne akzepti ...

Alle Meldungen von picturesafe media/data/bank


 

Werbung



Facebook

Sponsoren

foodir.org The food directory für Deutschland
Informationen für Feinsnacker finden Sie hier.

Firmenverzeichniss

Firmen die firmenpresse für ihre Pressearbeit erfolgreich nutzen
1 2 3 4 5 6 7 8 9 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z