Sprachmaschinen: das Blog zu Sprachverstehen und Suchmaschinen


Hilfreiches für die Nutzung von WILOT (bedeutungsorientierte Suche für Wikipedia)

Publikationsdatum: 2018-11-23
Letzte Änderung: 2018-11-26
Schlagwörter: semantische Suche, Fragebeantwortung, deutsche Wikipedia, WILOT, Maschinen-Sprech

WILOT ist eine bedeutungsorientierte Suchmaschine für die deutsche Wikipedia, also eine neue Wikipedia-Suche. Der Ansatz mag sich zwar von dem anderer Suchmaschinen unterscheiden, doch bedeutet das für Sie, den Nutzer/ die Nutzerin, keine große Umstellung. Wer WILOT einsetzt, wie er/sie es von herkömmlichen Suchmaschinen gewohnt ist, wird definitiv zufriedenstellende Ergebnisse bekommen. Werden jedoch zusätzlich ein paar Kleinigkeiten beachtet, kann WILOT sein volles Potential entfalten und die herkömmliche Suchmaschine in Präzision, Vollständigkeit und Recherchemöglichkeiten übertreffen.

Wir Internetnutzer haben uns, ob bewusst oder unbewusst, eine Art „Maschinen-Sprech“ angewöhnt. Wir tippen Ausdrücke in das Feld der Suchmaschine ein, die wir in der gesprochenen Sprache nicht in dieser Form benutzen würden. „Übernahme Dresdner Bank“, „Zeitung Stuttgart“, „größte Versicherung Deutschland“ sind ein paar Beispiele. Die Entstehung des „Maschinen-Sprech“ ist kein Zufall. Für viele traditionelle Suchmaschine sind nur Inhaltswörter entscheidend, Funktionswörter haben (ironischerweise) keinerlei Funktion. Einige Suchmaschinen gehen sogar einen Schritt weiter, und sperren Funktionswörter wie Artikel („der“, „die“, „das“, „ein“ ...), Präpositionen („auf“, „durch“, „wegen“ ...) und Konjunktionen („und“, „oder“, „weil“ ...) gleich vollständig. Dabei liegt genau dort das Potential für bessere Suchergebnisse.

Und da setzt WILOT an. Da eben nicht nur Inhaltswörter wiedergefunden, sondern (unter anderem) auch Funktionswörter verarbeitet, Satzstellung berücksichtigt und Synonymwissen eingesetzt wird, kann WILOT nicht nur nach Wörtern oder Zeichenketten, sondern nach ganzen Bedeutungen suchen. Dabei liegt das Problem des „Maschinen-Sprech“ darin, dass die Ausdrücke oft nicht eindeutig sind, und die Ergebnisse deshalb nicht sauber gefiltert werden können. „Übernahme Dresdner Bank“ könnte beispielsweise als „Übernahme der Dresdner Bank“ oder „Übernahme durch die Dresdner Bank“ verstanden werden. An diesem Beispiel lässt sich ablesen, dass Suchanfragen mithilfe von Funktionswörtern präzisiert werden können. Das funktioniert aber natürlich nur mit einer Suchmaschine wie WILOT, die diese auch verarbeiten kann.

Ein weiterer Vorteil dieses Ansatzes ist das Suchen mithilfe von Fragen. Denn auch durch eine Frage lässt sich die Suchanfrage eindeutig machen. So kann aus „Übernahme Dresdner Bank“ so etwas werden wie: „Wen übernahm die Dresdner Bank?“ oder aber „Wer übernahm die Dresdner Bank?“.

Im ersten Moment mag die Nutzung von WILOT vielleicht ein bisschen ungewohnt erscheinen. Doch wie die Beispiele zeigen, ist es nicht wirklich nötig, die Handhabung von WILOT zu erlernen. Vielmehr müssen einige schlechte Angewohnheiten, die uns von herkömmlichen Suchmaschinen beigebracht wurden, losgelassen werden. Die Suchmaschine WILOT funktioniert am besten, wenn man sie mit der Sprache füttert, die wir jeden Tag sprechen. Was könnte einfacher sein?

Wie bei jeder neuen Technik gibt es Kinderkrankheiten und anfängliche Begrenzungen. Deshalb hier ein paar praktische Tipps, wie man diese Grenzen nicht überschreitet:

Nicht unnötig kompliziert formulieren. Gute Anfragen haben meist 2 bis 8 Wörter. Mehrfachfragen werden aus Kostengründen noch nicht beantwortet. Beispiel: „Wer hat wen besucht?“ Keine Anfragen, die mehrere Treffer verrechnen müssten. Beispiel: „Wie viele MdBs sind Katholiken?“ Keine Fragen, die durch Zerlegung beantwortbar wären (Beispiel: „Wer war Außenminister, als die Berliner Mauer fiel?“ mit Zerlegung in „Wann fiel die Berliner Mauer?“ etc.). Sie sind noch nicht freigeschaltet, da die Antwortzeiten oft zu lang würden. Schreibfehler vermeiden, da für die Inhalte der riesigen Wikipedia unsere Rechtschreibkorrektur noch nicht bereit steht. Grammatische Zeiten (Tempora wie Gegenwart und Vergangenheit) spielen momentan keine Rolle, d.h. man könnte oben auch fragen: „Wann fällt die Berliner Mauer?“ Als Beispiel zum Nachsuchen sollen an dieser Stelle Käufe durch die Dresdner Bank (in Abgrenzung zum Kauf der Dresdner Bank durch die Commerzbank) dienen. So lässt sich ein deutlicher Unterschied zwischen der Standardsuche der Wikipedia und WILOT erkennen. Es folgen die Ergebnisse beider Suchmaschinen im Vergleich. Hinter der entsprechenden Suchanfrage ist angegeben, an welcher Stelle der Liste von Suchergebnissen sich das erste wirklich relevante Ergebnis befindet, das sich bereits anhand des gezeigten Textausschnittes als passend erweist:

AnfrageWikipediaWILOT
„Kauf Dresdner Bank“> 202
„Kauf durch die Dresdner Bank“> 201
„Wen kaufte die Dresdner Bank?“keine1

Wie unschwer zu erkennen ist, findet die Wikipedia-Standardsuche eine große Menge von Artikeln, die durchaus in irgendeiner Weise mit der Dresdner Bank zu tun haben. Trotzdem liegt noch immer eine große Menge an Informationen vor, die der Nutzer selbst filtern muss. Bei WILOT sieht die Sache anders aus. Durch Präzisieren der Suchanfrage können unpassende Ergebnisse (wie zum Beispiel das Aufkaufen der Dresdner Bank) ausgeschlossen oder zumindest auf die hinteren Positionen der Suchergebnisse geschoben werden. Das reduziert den manuellen Rechercheaufwand massiv. Doch an dieser Stelle sollten Sie sich vielleicht selbst ein Bild von WILOT und seinen Möglichkeiten machen; mit dem nötigen Grundwissen sind Sie nun ausgestattet. Direkt zu WILOT.


Kommentare

Hier können Sie einen Kommentar abgeben.

Name:

E-Mail-Adresse (wird nicht veröffentlicht):

Ihr Kommentar: