Blogverzeichnis - Bloggerei.de

Sprachmaschinen: das Blog zu Sprachverstehen und Suchmaschinen


Semantische Suche für Fachportale im Web

Publikationsdatum: 2013-11-21
Schlagwörter: tiefe semantische Suche, flache semantische Suche, semantische Suchmaschine, Fachportale, Google, SEMPRIA-Search, Drupal, Joomla, Plone, Typo3, WordPress

Ein gewagtes Experiment liegt hinter einem unserer Kunden und uns: wir mixten eine relativ kleine Web-Site (350 Fachartikel der Wissensdatenbank für Unternehmer, klein also verglichen mit Zeitungsarchiven) mit der großen Maschinerie einer tiefen semantischen Suche (intelligente Sprachverstehensprogramme, Millionen von Fakten und Regeln im Hintergrund). Das naheliegende Bedenken: Hier schießt man mit Kanonen auf Spatzen.

Wenige Wochen später können wir dieses Bedenken definitiv ausräumen. Denn erstens ist eine kleine, aber feine Web-Site kein Spatz, sondern eher eine weise Eule, die ihren Wald (Domäne) genau kennt und deren wertvolles Wissen man oft nur mit aufwändigen, intelligenten Verfahren recherchierbar machen kann. Zweitens ist eine tiefe semantische Suche keine große, ungenaue Kanone. Die bedeutungsorientierte Suche verfügt über viele passende oder anpassbare Spezialwerkzeuge, die beim Freilegen der Information sehr hilfreich sind.

  • So kann man durch semantische Suchvorschläge aus den Dokumenten Suchern helfen.
  • Man kann explorative Suchanfragen abschicken, zum Beispiel „Darlehen der KfW“.
  • Die semantische Sprachanalyse kann aufzeigen, inwieweit die Suchanfrage verstanden wurde. Zum Beispiel bleibt bei Google-Sprech „Darlehen KfW“ unklar, welche inhaltliche Beziehung zwischen den zwei Konzepten bestehen soll.
  • Und man kann sogar gezielte Fragen stellen, zum Beispiel „Wer ist Lambert Schuster?“.
Es war also ein gelungenes Experiment, sowohl für die Entwickler der Maschinerie (die SEMPRIA aus Düsseldorf), als auch für den Betreiber der Web-Site (den Unternehmensberater Lambert Schuster aus Köln).

Die Geschichte vom Schuster mit steigendem Absatz und vom Schuhmacher mit ledernen Absätzen

Folgende kleine Geschichte ereignete sich beim Anpassen der SEMPRIA-Suche für die Web-Site lambertschuster.de. In einer frühen Phase aktivierten wir u.a. die Erweiterung um Synonyme und Unterbegriffe. Dies ist im Kern das, was viele Suchmaschinen machen, die sich „semantisch“ nennen. (Am Ende des Artikels werden Sie verstehen, warum wir unsere Suchmaschine zurecht anders nennen: tief semantisch oder auch bedeutungsorientiert.) Die einfache semantische Erweiterung basierend auf oberflächlichen Wortformen ließ einen Tester dann aufschrecken. Bei Suche mit „Schuhmacher“ bekam man auf lambertschuster.de plötzlich 320 Treffer, weil die Anfrage zu „Schuster“ erweitert wurde. Grund: der Hauptautor der Website, Herr Lambert Schuster, wird nun mal in vielen Artikeln erwähnt.

Oft passiert so etwas bei flachen semantischen Suchmaschinen: Sie erhöhen die Vollständigkeit und verderben gleichzeitig die Genauigkeit. In diesem Fall findet sich im Heuhaufen der 319 falschen Treffer kaum der einzige richtige Treffer. Die Standardsuche ohne semantische Erweiterungen hilft hier übrigens auch nicht weiter. Google liefert keinen passenden Treffer, vgl. die Google-Suche nach „Schuhmacher“ auf lambertschuster.de. Auch die WordPress-Standardsuche nach „Schuhmacher“ auf lambertschuster.de bringt nichts.

Die Verwunderung über das Verhalten unserer Suchmaschine war kurz, denn schnell war klar, dass das tiefe Sprachverstehen aus Versehen ausgeschaltet worden war. Nach dem Einschalten lieferte die bedeutungsorientierte Suche SEMPRIA-Search genau einen hoch bewerteten Treffer für die Anfrage „Schuhmacher“. Und dort geht es wirklich um den Berufsstand der Schuster mit ledernen Absätzen und nicht um einen Herrn Schuster, der einem zu steigenden Absätzen verhelfen kann. Bingo! Versuchen Sie selbst mal die SEMPRIA-Suche nach „Schuhmacher“ auf lambertschuster.de

Das Suchsystem hat übrigens beim Indexieren von lambertschuster.de eine Präferenz für „Schuster“ gelernt. Daher sollte man, wenn man nach „Schuster“ im Sinne von „Schuhmacher“ suchen möchte, einen eindeutigen kleinen Kontext hinzufügen („ein Schuster“ oder „der Schuster“).

Und warum hilft dort tiefes Sprachverstehen?

  • Die vielen falschen Treffer der flachen semantischen Suche können vermieden werden , denn die tiefe semantische Suchmaschine unterscheidet zwischen einer Person mit Namen „Schuster“ und dem Berufsstand der Schuster. Solche Phänomene sind keine linguistischen Spitzfindigkeiten, sondern kommen an allen Ecken und Enden vor. Der Mensch kann mit ihnen virtuos umgehen, die Maschinen lernen es gerade.
  • Der einzige richtige Treffer wird gefunden, da die semantische Erweiterung bei SEMPRIA-Search korrekt funktioniert. Weitergehende Erweiterungen von ganzen Phrasen oder auch mehreren Phrasen mit ausformuliertem Zusammenhang werden auch unterstützt. Aber dies wird ein Thema eines eigenständigen Artikels sein.

Große Potenziale der tiefen semantischen Suche für Fachportale und Blogs

Und das erfolgreiche Experiment geht weiter. Anhand der Nutzung der Suche für spezialisierte Blogs oder Fachportale (auf technischer Basis z.B. von Drupal, Joomla, Plone, Typo3, WordPress) können wir die tiefe semantische Suche von SEMPRIA-Search gezielt weiterentwickeln. Dabei achten wir genau und individuell auf Lob und Verbesserungsvorschläge der Nutzer und Content-Autoren.

Sprechen Sie uns an, damit wir auch das Potenzial Ihrer Web-Site voll ausspielen können. Falls Sie noch unsicher sind: Wir können gern ausgewählte Seiten Ihrer Web-Site testweise und kostenlos indexieren.


Kommentar von Silke Wiegand
Datum: 2013-12-02 11:21

Ein sehr schöner Artikel, gut lesbar und mit der Geschichte zu Schuhmacher, Schuster, Absatz und Absätzen äußerst kurzweilig. Es ist schon erstaunlich - wir denken, dass so ein Computer alles kann und vieles weiß, und dann muss man feststellen, dass er, was die Sprache betrifft, an Dummheit kaum zu überbieten ist - kurios. Sie haben es treffend formuliert: "Der Mensch kann damit virtuos umgehen, die Maschinen lernen es gerade."

Ich bin gespannt, wie es mit der semantischen Suche weitergeht und wünsche Ihnen viel Erfolg.


Kommentar von Lambert Schuster
Datum: 2013-11-28 08:51

Das war eine spannende Zeit, und es hat sich gelohnt. Die Wissensdatenbank von lambertschuster.de/blog erfreut sich immer größerer Beliebtheit, liefert mit über 350 Artikeln einen beachtlichen Wissenspool für Unternehmer und Existenzgründer. Bei dieser Fülle an Wissen konnte der Benutzer sich mittlerweile nur schwer zurechtfinden. Abhilfe musste geschaffen werden mit einer intelligenten Suche.

Wir setzten ein Projektmanagement auf. In einer Phase von drei Monaten mussten SEMPRIA, IT und Auftraggeber (mit der Aufgabenstellung, Hand in Hand) zusammenarbeiten. Im Kick-off wurde ein Terminplan erstellt. Alle hielten sich minutiös daran. Am 14.10.2013 ging die Suche genau nach Plan online.

Seitdem besuchen noch mehr Benutzer die Wissensdatenbank. Sie bleiben länger und besuchen mehr Artikel. Ganz einfach: sie finden das, was sie suchen.

Ich kann nur jedem größeren Blog-Betreiber diese tolle Suche empfehlen.


Kommentare

Hier können Sie einen Kommentar abgeben.

Name:

E-Mail-Adresse (wird nicht veröffentlicht):

Ihr Kommentar: