Published October 27, 2020 | Version v1
Conference paper Open

Concept Extractor - Ein flexibler und domänenspezifischer Web Service zur Beschlagwortung von Texten

Description

Der Beitrag beschreibt ein flexibles und modulares System zur automatischen Beschlagwortung von Texten, das auf einer Text Mining-Engine aufbaut. Da-bei liegt eine Methode der differentiellen Corpusanalyse zugrunde: Der zu verarbeitende Text wird im Vergleich mit einem unfangreichen Referenz-corpus analysiert und Unterschiede in relativen Häufigkeitsklassen dienen der Auswahl geeigneter Schlagworte. Zusätzlich kommen Datenbanken zum Ein-satz, die eine Expansion von Termen hinsichtlich Grundform, Schreibvarian-ten, Synonymen und Mehrwortbegriffen erlauben. Das System ist als web service realisiert und lässt sich problemlos in Content Management-Systeme integrieren.

Files

cc-isi2002-art12.pdf

Files (399.1 kB)

Name Size Download all
md5:855e116a80988ae37bc370718c79e5f7
399.1 kB Preview Download