Semantische Annotatoren: Verschlagwortung, Verstichwortung, Facetten-Bestimmung, ähnliche Artikel

Die semantischen Annotatoren sind Programme, die interessante Anreicherungen von Texten vornehmen. Solche Anreicherungen oder Annotationen können Schlagwörter (aus einem definierten Bestand) oder Stichwörter (ohne Einschränkungen) sein. Auf dieser Basis können auch Facetten des Archivs ermittelt werden, also z.B. welche konkreten Medikamente unter der Facette 'Medikament' eingeordnet werden konnten und welche Texte dazu gehören. Diese Facetten können in einer facettierten Suche (wie SEMPRIA-Search) oder anderen Systemen genutzt werden. Schließlich können auch die Artikel bestimmt werden, die einem gegebenen Artikel besonders ähneln. Damit können Infoboxen, Linkboxen, Themenseiten und Specials sinnvoll gefüllt werden.

Bei allen genannten Annotatoren ist hervorzuheben, dass wir keine Standardverfahren einsetzen, sondern auf den Ergebnissen unserer tiefen Sprachverstehens-Technologie aufsetzen. Das ist zwar etwas aufwändiger, aber dafür sind die Ergebnisse deutlich vollständiger und genauer. Zum Beispiel können oft Mehrdeutigkeiten sauber unterschieden werden. Der reparierte Lincoln, eine Stadt Lincoln und ein Mensch Lincoln werden unterschieden. Die unterschiedlichen Bedeutungen führen zu unterschiedlichen Stichwörtern, Facetten und abgeleiteten Ergebnissen. Auch die regionalen und fachlichen Besonderheiten eines Archivs werden umfangreich und clever berücksichtigt.

Die semantischen Annotatoren sind als preiswerte Module für SEMPRIA-Search verfügbar. Sie können auch als SaaS (Software-as-a-Service) oder Stand-Alone-Lösung eines Servers eingesetzt werden. Wir beraten Sie gern unkompliziert und umfassend.