Semantische Suche für WordPress, Drupal, Joomla, Mediawiki, Confluence und andere CMS.

Die kognitive Suchmaschine SEMPRIA-Search ist eine tiefe semantische Suche auch für Content-Management-Systeme wie WordPress und Typo3. Externe Nutzer können Ihre Website vollständiger und genauer durchsuchen. Mitarbeiter finden das gesuchte Wissen im Intranet, auch mit gezielten Fragen. Interaktive Suchvorschläge, die semantisch aus den Dokumenten erzeugt werden, helfen allen Nutzern, die Inhalte der Dokumente besser zu treffen.

Suche in Content-Management-Systemen.

Für Betreiber eines CMS, Wikis oder ECM (Enterprise Content Management) ist SEMPRIA-Search als Such-Plugin verfügbar. Die eigentliche Suchmaschine läuft konform nach DSGVO als Software-as-a-Service (SaaS) auf Servern deutscher Rechenzentren oder on-premises. Sie müssen sich um nichts kümmern. Die Suchlösung zeichnet sich aus durch faire Monatsgebühren ab 30 EUR (je nach Daten-Größe), wunschgemäße Vertragslaufzeit und Anpassungsleistungen.

Die (tiefe) semantische Suche SEMPRIA-Search bietet Feedback zu Schreibfehlern und Tippfehlern. Beim Indexieren jeder Seite wird die volle Semantik des Textes erschlossen. Dabei fallen Schreibfehler auf, die automatisch an den CMS-Betreiber gemeldet werden können. Auf Wunsch werden die Korrekturen automatisch durchgeführt, ggf. nach Lektorat.

Wie weiter?

Wie findet man eine passende Site-Search (Website-Suchmaschine, Homepage-Suchmaschine)?

In den letzten Jahren wurde die Google-Site-Search (Google Site Search, GSS) eingestellt. Damit teilt die GSS das Schicksal zahlreicher anderer Technologien wie der Google Search Appliance (GSA) und BOSS (Build your Own Search Service) von Yahoo. Dies illustriert nicht nur eine Internetlandschaft, die sich dank neuer Inhalte und Innovationen stets im Wandel befindet. Nebenbei drängt sich die Frage auf, welche Anforderungen eine zeitgemäße und robuste Site-Search in der heutigen Zeit erfüllen muss, um über einen längeren Zeitraum bestehen und dabei angemessene Nutzer- und Anbieterzufriedenheit gewährleisten zu können. Dabei vermischen sich die Wünsche und Vorstellungen des Nutzers der Suchmaschine, des Anbieters der Webseite und des Betreibers der Suchmaschine.

1. Einfache Suche, glücklicher Nutzer

Zwischen der Sprache, die ein Nutzer bei der Eingabe von Suchanfragen verwendet, und der, die eine Maschine tatsächlich versteht, gibt es für gewöhnlich recht deutliche Unterschiede. Eine intelligente Suchmaschine kann dem Nutzer allerdings ein gutes Stück entgegen kommen. Durch die Implementierung von Hintergrund- und Synonymwissen, kann eine Vielzahl von Problemen vermieden werden, die sonst allein dadurch entstehen, dass der Nutzer und die Maschine sprachlich nicht auf Augenhöhe sind. (Mehr dazu auf der Themenseite zu Synonymen.) Doch schon bevor die eigentliche Suche beginnt, kann die Maschine ihrem Nutzer das Leben erleichtern. Durch vernünftige Suchvorschläge beispielsweise. Dabei ist wichtig, dass es sich nicht bloß um häufige Anfragen aus dem Suchlog handelt (häufig von Nutzern getätigte Suchen), denn dies kann einige unangenehme Nebeneffekte haben. Nur weil eine Suchanfrage häufig gestellt wurde, heißt das beispielsweise noch lange nicht, dass das vorliegende Archiv den passenden Treffer beinhaltet. Ein anderer Ansatz, der insbesondere bei kleineren Archiven sinnvoll ist, besteht darin, die Suchvorschläge aus den zugrundeliegenden Dokumenten zu extrahieren. So beginnt die Suche schon bevor der Nutzer seine Anfrage vollständig eingegeben und abgeschickt hat. Das spart Zeit, Arbeit und Nerven.

2. Schutz für Nutzer und Anbieter

Eine Webseite mit einer Site-Search auszustatten, bedeutet in jedem Fall eine Öffnung nach außen. Gerade deshalb ist bei der Wahl des Betreibers einer Suchmaschine Vorsicht geboten. Nicht nur wird der Content dem Nutzer zugänglich gemacht, auch der Betreiber der jeweiligen Suchlösung erhält Zugang zu sämtlichen Inhalten. Aus dem Dreiecksgespann von Nutzer, Anbieter und Betreiber der Suchmaschine können einige kleine und größere Probleme entstehen, deren Lösung nicht selten eine Gratwanderung darstellt. Das Sammeln von Nutzerdaten kann die Suche verbessern und ist somit auf lange Sicht auch für den Nutzer von Vorteil, doch wieviel ist der einzelne Nutzer bereit preiszugeben? Da nicht jeder Nutzer vor dem Gebrauch jeder Suchmaschine die allgemeinen Geschäftsbedingungen unterschreibt, liegt es am Anbieter der Webseite, zu entscheiden, wie viele Informationen die Suchmaschine über das Verhalten des Nutzers erfährt. Aber auch für den Anbieter der Webseite ist nicht immer eindeutig ersichtlich, welche Daten die integrierte Site-Search sammelt und womöglich an den Betreiber übermittelt. Eine Klärung dieser Frage bedeutet häufig eine Expedition in kleingedruckte Klauseln, instabile internationale Regelungen oder sogar die ein oder andere obskure Gerüchteküche. Um dem zu entgehen, kann der Anbieter der Webseite sich beispielsweise für eine Suchlösung entscheiden, dessen Betreiber ein einheimisches Rechenzentrum in Anspruch nimmt, statt die Daten gleich mehrmals um den Globus zu schicken. Ein erster Schritt in Richtung Transparenz und Sicherheit ist somit getan.

3. Von Werbung bis White-Label

Werbung, insbesondere personalisierte Werbung, ist ein wichtiges Thema für Webseiten und für den Anbieter häufig eine wichtige Einnahmequelle. Neben der Verwendung von Cookies, kann ebensogut das Suchverhalten eines Nutzers dazu verwendet werden, die passenden Werbeinhalte zu ermitteln. Dabei gibt es zahlreiche Varianten. Ein Site-Search-Betreiber schreibt das Anbieten von Werbung obligatorisch vor, ein anderer überlässt diese Frage vielleicht dem Anbieter der Webseite, wiederum andere bieten erst gar keine Möglichkeit zur Werbeeinblendung an. Wie die Lösung auch aussieht, mit personalisierter Werbung kommen Schwierigkeiten, die durchaus mit der Datenschutzproblematik verwandt sind. Hat man die Notwendigkeit der Werbung zur Finanzierung der Site-Search erst einmal akzeptiert, kann man sich natürlich fragen, ob personalisierte Werbung nicht grundsätzlich besser ist als zufällige Werbeeinblendungen. Frei nach dem Motto: Wenn ich schon Werbung schauen muss, dann kann sie auch für etwas sein, was mich interessiert. Andere Nutzer könnten sich allerdings in ihrer Privatsphäre verletzt fühlen, wenn ihre Suchanfrage noch für etwas anderes verwendet wird als bloß für die Suche. Auch kann sich nicht jede Webseite die Schaltung von Werbung erlauben, sei es aufgrund der fragwürdigen Seriosität oder wegen eines Interessenskonflikts. In einigen Fällen muss nicht einmal der Firmenname des Site-Search-Betreibers angegeben werden. In einem solchen Fall spricht man von einer White-Label-Lösung. Eine solche wird nicht von jedem Betreiber angeboten und ist für gewöhnlich mit einem Aufpreis verbunden.

4. Individuelle Anpassung

So vielfältig die Webangebote und ihre Inhalte sind, so vielfältig muss auch eine Suchlösung sein. Eine Site-Search muss auf das Archiv, die Daten, und deren sprachlichen Besonderheiten angepasst werden, um ein optimales Ergebnis erzielen zu können. Auch die technischen Features, wie spezielle Suchparametern zu Metadaten, sind nicht in jedem Kontext gleich sinnvoll und können nicht unter allen Umständen das halten, was sid auf anderen Texten versprechen.

5. Technische Realisierung

Auf der Software-Seite ist momentan SaaS (Software-as-a-Service) eine beliebte Lösung, da sie oft flexible Vertragslaufzeiten ermöglicht und den Wartungsaufwand beim Anbieter auf ein Minimum reduzieren kann. Natürlich gibt es besonders bei manchen einfachen Site-Search-Lösungen die Möglichkeit, die Site-Search-Lösung in das CMS als Module oder Plugin eng zu integrieren. Auf der Hardware-Seite der technischen Realisierung gibt es wie bei anderen Software-Systemen zwei beliebte Varianten: die Site-Search läuft auf einem Rechner des Anbieters, bei SaaS wird die Site-Search vom Betreiber auf einem Rechner in einem Rechenzentrum (mit geeigneten rechtlichen Rahmenbedingungen) betrieben. Die Auslagerung ins Rechenzentrum bietet oft den größten Komfort für den Anbieter und die höchste Verfügbarkeit für den Nutzer.

6. Vertragsgestaltung

Bei der Gestaltung des Vertrags zwischen Betreiber der Site-Search und dem Anbieter stehen heutzutage drei Parameter im Vordergrund: Vertragslaufzeit, monatliche Gebühren versus einmalige Gebühren (wie für Einrichtung und Anpassungen) und schließlich ein Paket aus Leistungseckwerten. Zu den Leistungseckwerten gehören bei mächtigen Site-Search-Lösungen meist die folgenden vier: maximal mögliche Anzahl von Anfragen pro Stunde, Zahl und Größe der zu durchsuchenden Dokumente, Aktualisierungshäufigkeit für den Index der Site-Search, Aktualisierungsvolumen der Dokumente pro Monat oder Jahr.

Bild: © Fotolia