Sprachmaschinen: das Blog zu Sprachverstehen und Suchmaschinen


Der unsichtbare Ministerpräsident Stoppwort: Software-Defizite können Menschen benachteiligen

Publikationsdatum: 2017-11-01
Schlagwörter: Stoppwörter, Suchmaschinen, Index, bedeutungsorientierte Suche, Der Spiegel, Ministerpräsident Weil, Benachteiligung durch Software

Wenn man in den Websites von Zeitungen nach Politikern recherchiert, dann kann das Ergebnis sehr unterschiedlich sein. Bei einer Suchanfrage mit dem Nachnamen eines Politikers bekommt man, wenn alles gut geht, unter den ersten 20 Treffern fast ausschließlich Treffer, die irgendetwas mit der Person oder einem Namensvetter zu tun haben.

Anders ist es jedoch bei den armen Zeitgenossen, deren Namen wie ein Allerweltswort geschrieben wird. Bei der Niedersachsenwahl fiel das besonders beim Kandidaten der SPD auf, Herr Weil. Das kleine Wort „weil“, das einen kausalen Nebensatz an einen Hauptsatz anbindet (daher auch Konjunktion genannt), ist so weit verbreitet, dass es seit den Anfängen der Suchmaschinen in den 60er Jahren auf sogenannten Stoppwort-Listen gelandet ist. Die Wörter auf solchen Listen wurden nicht indexiert (also nicht von der Suchmaschine erfasst), um den Index nicht aufzublähen. Damit konnte man in vielen Suchsystemen nie erfolgreich nach „weil“ oder „Weil“ suchen.

In den letzten Jahren sind viele Suchmaschinen von Stoppwort-Listen abgegangen. Aber Menschen mit einem Nachnamen wie Herr Weil können sich nicht besonders darüber freuen: sie werden zwar nun gefunden, aber nur sporadisch, denn die meisten „Treffer“ der Zeitungssuchmaschinen gehören zum Konjunktions-Weil und nicht zum Koalitions-Weil. Beispielsuchen mit „Weil“ ergaben zwei Tage nach den Neuwahlen vom 15.10.2017: faz.net (5 von 80 betreffen Hr. Weil), sueddeutsche.de (13 von 50), taz.de (6 von 40). Und je mehr Niedersachsen wieder aus den bundespolitischen Schlagzeilen verschwindet, desto schlechter werden diese Quoten. Weil gänzlich unbekannt

SPIEGEL ONLINE (siehe Suche nach Weil) schießt aber den Vogel ab und antwortet: „Ihre Suche ergab keinen Treffer. Haben Sie sich vertippt?“ Erwischt! Der Spiegel setzt immer noch auf eine Stoppwort-Liste. Gerade in Zeiten, in denen die Medien mehr und mehr in die Kritik geraten und nicht selten mit Vorwürfen der Manipulation konfrontiert werden, sollten sich große Medienplattformen solche Techniklücken eigentlich nicht leisten.

Die Abkehr von Stoppwort-Listen hat von 0% Sichtbarkeit für die Weils dieser Welt zu einer teilweisen Sichtbarkeit bei einigen Websites geführt. Dies ist aber von den hohen Trefferquoten bei anderen Politikern immer noch Meilen entfernt. Da bleibt nur die Hoffnung, dass sich die bedeutungsorientierte Suche herumspricht und durchsetzt. Denn dort werden Suchanfragen wie „Weil“ auf die Suche nach einem Menschen (oder einem Ort) eingeschränkt, weil die Verwendung von Konjunktionen meist nur Linguisten interessiert. (Die Algorithmen zum Sprachverstehen, die bei der bedeutungsorientierten Suche den Mehrwert ermöglichen, können beim Indexieren der Dokumente meist genau zwischen der Konjunktion „weil“, einem Ort Weil und einem Menschen Weil unterscheiden.) Wenn man mit der Suchanfrage „Herr Weil“ sucht, dann werden auch die verschiedenen Orte dieses Namens und weibliche Träger dieses Namens weggefiltert. Somit werden die nützlichen Treffer zahlreicher und zugleich qualitativ besser. Die genaue und vollständige Recherche auch zu Personen mit ungewöhnlichen Namen ist also sehr wohl möglich.

Bild: © SEMPRIA GmbH


Kommentare

Hier können Sie einen Kommentar abgeben.

Name:

E-Mail-Adresse (wird nicht veröffentlicht):

Ihr Kommentar: