Blogverzeichnis - Bloggerei.de

Sprachmaschinen: das Blog zu Sprachverstehen und Suchmaschinen


Semantische Suchvorschläge durch automatisches Verstehen von Dokumenten

Publikationsdatum: 2013-05-21
Schlagwörter: automatisches Sprachverstehen, semantische Analyse, Suchvorschläge, Google, Bedeutungsorientierung, Autovervollständigung

Es gibt immer mal wieder Fragen, warum denn die Suchvorschläge (auch Autovervollständigung oder Autocomplete genannt) von SEMPRIA-Search als Site-Search-Lösung so anders und angeblich so viel besser seien als die von Google etc. Daher möchten wir hier kurz die wichtigsten Unterschiede erklären. Vor dem Hintergrund der Gerichtsprozesse der letzten Monate ist dies auch juristisch und finanziell für manche Betreiber einer Site-Search relevant.

1. Unterschied. Berechnung auf Dokumenten (nicht auf Suchanfragen von Nutzern)

Google nutzt die Suchanfragen der Nutzer als Hauptquelle für die Berechnung von Suchvorschlägen. Wenn viele Nutzer das Stichwort „Larry Page“ (einer der beiden Google-Gründer) mit dem Stichwort „krank“ kombiniert haben, dann wird nach dem Eintippen des Namens als erster Suchvorschlag „Larry Page krank“ angeboten. So war es jedenfalls am heutigen 14.05.2013.

Wir bei SEMPRIA sehen die Daten der Nutzer als höchst schutzwürdig an. Deshalb werten wir niemals Nutzerdaten aus. Stattdessen verwenden wir clevere Algorithmen und Programme (aus Deutschland, für die deutsche Sprache), um typische inhaltliche Kombinationen von zwei Konzepten in den Dokumenten zu finden. Dies funktioniert auch bestens für Web-Sites, deren Betreiber nicht täglich tausende Suchanfragen auswerten können. Ein weiterer Vorteil für Site-Betreiber ist, dass Suchvorschläge auch aus druckfrischen Artikeln angezeigt werden, selbst wenn diese noch niemand gelesen hat!

2. Unterschied. Inhaltlicher Bezug der Begriffe in einem Suchvorschlag wird sorgfältig ermittelt (nicht ein unverstandener Haufen von Wörtern)

Suchvorschläge nach den statistischen Methoden von Google u.a. achten nur auf das Zusammenvorkommen der Suchbegriffe. Für den Zusammenhang zwischen den Begriffen und den Kontext braucht man aufwändiges Sprachverstehen, das nur bedeutungsorientierte Suchmaschinen besitzen. Bei der Suchanfrage „Entlassung“ schlägt das statistische Verfahren beispielsweise „Entlassung Hr. Y.“ vor, egal ob Hr. Y. entlässt oder entlassen wird oder Hr. Y. auch nur aus anderen Gründen in der Suchanfrage genannt ist (z.B. als Anwalt in Kündigungsfällen).

Durch Ausnutzung der Semantik der Dokumente kann man unterschiedliche Verwendungen auseinanderklamüsern. „Entlassung durch Hr. Y.“, „Entlassung des Hr. Y.“ usw.

3. Unterschied. Suchvorschläge sind moralisch und juristisch unproblematisch (soweit es die Dokumente auch sind)

Viele Site-Search-Betreiber drängen Ihre Software-Hersteller zu einer Sperrfunktion, um bei Beschwerden wegen ungewünschter Suchvorschläge schnell reagieren zu können. Neben diesen technischen Aufwand tritt der teure manuelle Verwaltungsaufwand.

Bei sprachverstehenden Suchmaschinen ist das Sperren von Suchvorschlägen nicht nötig, denn sie generieren Suchvorschläge allein aus den Dokumenten der Site und verbinden zwei Konzepte miteinander nur, wenn sie einen Zusammenhang erkennen konnten. Suchvorschläge behaupten also nicht mehr als ein Autor der Site zuvor. Wenn Sie jemand verklagt, dann wegen des Artikels und nicht wegen eines semantisch korrespondierenden Suchvorschlags. So schlägt SEMPRIA-Search niemals „Kritik an Firma Z“ nach Eintippen von „Firma Z“ vor, wenn Firma Z laut dem Dokumentbestand der Site niemals kritisiert wurde. Die Suchvorschläge sind also nach Möglichkeit korrekt vor dem Hintergrund der Dokumente der Site. Die andere Seite derselben Medaille ist die Vollständigkeit: wenn ein Dokument „Firma Z wetterte gegen“ enthält, dann schlägt die semantische Suchmaschine „Kritik durch Firma Z“ vor, wenn jemand „Firma Z“ tippt. Die intelligente Maschine liefert also wichtige Informationen, auch wenn sie oberflächlich (und für oberflächliche Suchmaschinen) nicht zur Suchanfrage zu passen scheinen.


Kommentare

Hier können Sie einen Kommentar abgeben.

Name:

E-Mail-Adresse (wird nicht veröffentlicht):

Ihr Kommentar: