Semantische Annotatoren (Verschlagwortung, Facetten-Bestimmung, ähnliche Artikel u.v.m.)

Die semantischen Annotatoren sind Programme, die interessante Anreicherungen von Texten vornehmen. Solche Anreicherungen oder Annotationen können Schlagwörter (aus einem definierten Bestand) oder Stichwörter (ohne Einschränkungen) sein. Auf dieser Basis können auch Facetten des Archivs ermittelt werden, also z.B. welche konkreten Medikamente unter der Facette 'Medikament' eingeordnet werden konnten und welche Texte dazu gehören. Diese Facetten können in einer facettierten Suche (wie SEMPRIA-Search) oder anderen Systemen genutzt werden. Schließlich können auch die Artikel bestimmt werden, die einem gegebenen Artikel besonders ähneln. Damit können Infoboxen, Linkboxen, Themenseiten und Specials sinnvoll gefüllt werden.

Bei allen genannten Annotatoren ist hervorzuheben, dass wir keine Standardverfahren einsetzen, sondern auf den Ergebnissen unserer tiefen Sprachverstehens-Technologie aufsetzen. Das ist zwar etwas aufwändiger, aber dafür sind die Ergebnisse deutlich vollständiger und genauer. Zum Beispiel können oft Mehrdeutigkeiten sauber unterschieden werden. Der reparierte Lincoln, eine Stadt Lincoln und ein Mensch Lincoln werden unterschieden. Die unterschiedlichen Bedeutungen führen zu unterschiedlichen Stichwörtern, Facetten und abgeleiteten Ergebnissen. Auch die regionalen und fachlichen Besonderheiten eines Archivs werden umfangreich und clever berücksichtigt.

Die semantischen Annotatoren sind als preiswerte Module für SEMPRIA-Search verfügbar. Sie können auch als SaaS (Software-as-a-Service) oder Stand-Alone-Lösung eines Servers eingesetzt werden. Wir beraten Sie gern unkompliziert und umfassend.

Texttechnologie-Funktionen

Abschließend eine Liste von Texttechnologie-Funktionen, die wir anbieten können; weitere, die auf diesen aufbauen oder diese virtuos kombinieren, sind jederzeit möglich.

  • automatische Verschlagwortung und Verstichwortung, Facetten
  • Lesbarkeitsbeurteilung für Texte
  • Auffinden von Wiederholungen (auf semantischer Ebene, nicht nur auf Zeichenebene)
  • Auffinden von Widersprüchen
  • Infoboxen, Linkboxen, Themenseiten und Specials
  • automatische Zusammenfassung (Abstracting)
  • semantische Versionsanalyse von Texten
  • Überprüfung von Terminologien (Organisations-weite Schreibungen und Fachbegriffe; positiv und negativ)
  • Abgleich von verschiedenen Katalogen (oder Preislisten)
  • Monitoring von Markt und Konkurrenten
  • Klassifikation von Support-Tickets und Kundenanfragen
  • Matching von längeren Texten (z.B. Ausschreibungen, Kompetenzprofile)
  • Erkennen und Klassifikation von Namen (Named Entity Recognition, Named Entity Classification)