Fachglossar zu automatischem Sprachverstehen und semantischen Suchmaschinen

Dr. Sven Hartrumpf, Prof. Dr. Hermann Helbig

https://www.sempria.de/

2015-07-01; letzte Änderung: 2024-04-16

Glossar Sprachverstehen und semantische Suchmaschinen

Ableitung

ist die Gewinnung von neuen Ausdrücken aus einer Menge vorgegebener Ausdrücke nach bestimmten formalen Regeln, die sich nur auf die syntaktische Struktur, nicht aber auf den Inhalt, der Ausdrücke beziehen.

Adjektiv

ist ein Eigenschaftswort. Im Deutschen können Adjektive attributiv (bei einem Nomen, Beispiel: „das intelligente System“), prädikativ (mit einem Kopulaverb, Beispiel: „Die Lösung ist hervorragend.“) oder adverbiell (mit einem Verb, Beispiel: „Der Computer rechnet schnell.“ gebraucht werden.

Adjunkt

ist ein sprachlicher Ausdruck (A), der einen anderen Ausdruck (B) attributiv ergänzt, wobei A entweder bezüglich des B bedeutungseinschränkend wirkt („ein Haus (B) , das unseren Ansprüchen genügt (A)“) oder eine zusätzliche Qualifikation hinsichtlich B ausdrückt („unser (B) schönes (A) Haus (B)“).

Affix

ist ein Präfix (Vorsilbe, „auf-“ in „aufschreiben“) oder Suffix (Nachsilbe, „-ung“ in „Unterscheidung“).

Aggregation

ist die Zusammenfassung von Einzelelementen zu einer größeren Einheit.

Allgemeinbegriff

ist ein Begriff, der im Gegensatz zum Individualbegriff auf eine Gesamtheit von Gegebenheiten (Entitäten) zutrifft. Auch generischer Begriff genannt.

Anapher

ist ein rückwärts gerichteter Verweis in einem Text (anaphorische Referenz). Beispiel: „Als Maxi aus der Schule kam, aß eri ein Brötchen.“. Vgl. Katapher.

Annotation

ist eine Anmerkung zu einem Dokument. Diese kann informell in natürlicher Sprache verfasst sein (z.B. ein persönlicher Kommentar) oder stärker formalen Charakter tragen (z.B. Kurzdarstellung des Inhalts in einem geeigneten Format).

Antezedens

ist die vorausgehende Konstituente, auf die ein referierender Ausdruck (z.B. ein Pronomen) verweist.

Antonym

ist ein Gegenwort. Beispiele: „dunkel“ zu „hell“, „undefiniert“ zu „definiert“.

Apposition

ist eine attributive Ergänzung eines Nomens durch eine Substantivgruppe im gleichen Kasus („Karl der Kahle“, „dem Chirurgen, Herrn Dr. Schneider“, „Kanzlerin Merkel“).

Artefakt

ist ein künstlich geschaffenes Objekt bzw. der mit ihm verbundene Begriff.

Artikel

ist ein Begleiter. Dieses Funktionswort steht bei einem Substantiv. Im Deutschen unterscheidet man den bestimmten Artikel („der“) und den unbestimmten Artikel („ein“).

Assimilation

ist die Integration neu ankommender Informationen in einen bereits vorhandenen Informationsbestand in einem Frage-Antwort-System und ähnlichen Systemen. Dabei sind Referenzen aufzulösen, semantische Äquivalenzen zu entdecken, Doppelspeicherungen von identischen Begriffen zu vermeiden sowie die richtigen Unterordnungen zu bereits gespeicherten Oberbegriffen herzustellen.

Assoziativität

ist die Eigenschaft einer zweistelligen Operation R, die wie folgt charakterisiert wird: ((a R b) R c) = (a R (b R c)). Adjektiv: assoziativ.

Attribut

ist eine Beifügung oder modifizierende Bestimmung zu einem Satzglied. Adjektiv: attributiv.

attributiver Gebrauch

ist bei Adjektiven die Stellung als Attribut („der schwere Stein“). Vgl. prädikativer Gebrauch.

bedeutungsorientierte Suchmaschine

ist eine tiefe semantische Suchsoftware. Sie realisiert eine semantische Suchmaschine, die natürliche Sprache in Dokumenten und Suchanfragen tief und umfassend analysiert.

boolean

siehe:  boolesch.

boolesch

ist die Bezeichnung für einen Typ, der nur zwei Werte annehmen kann (diese werden meist als T oder F, 1 oder 0, + oder - usw. codiert).

Broker

ist ein Informationsvermittler in einem System mit verteilten Informations-Ressourcen, der zwischen Endnutzer und Informationsanbieter (Provider) steht und den Nutzer bei der Auswahl geeigneter Informationsquellen und bei der Beschaffung der Informationen unterstützt.

CL

steht für Computerlinguistik.

Computer-Lexikographie

ist ein Zweig der Computerlinguistik, der sich mit dem Inhalt und mit dem Aufbau von Wörterbüchern befasst, die für die automatische Sprachverarbeitung eingesetzt werden.

Computerlinguistik

ist ein interdisziplinärer Wissenschaftszweig, der sich mit der Theorie und Praxis der automatischen Sprachverarbeitung befasst und der zwischen Informatik und Linguistik angesiedelt ist. Im weitesten Sinne werden hierzu alle Methoden gezählt, die den Computer zur Bearbeitung linguistischer Fragestellungen benutzen (z.B. auch textstatistische Untersuchungen). Im engeren Sinne - diese Sicht wird in der KI eingenommen - gehören zu diesem Gebiet nur die Methoden, die sich mit der Automatisierung des Sprachverstehens befassen.

Constraint

ist eine einschränkende Bedingung (Voraussetzung), unter der eine Operation anwendbar ist oder unter der ein bestimmter Sachverhalt gilt.

Deduktion

ist eine besondere Form der Ableitung in logischen Kalkülen, die eng mit dem Begriff der Implikation verknüpft ist (formaler Aspekt des Schließens). Die Deduktion stellt eine Formalisierung des inhaltlichen Folgerungsbegriffes (Folgerung) dar.

Default-Regel

ist ein Teil eines regelhaftes Wissens, das in Abwesenheit anderer, spezifischerer Informationen als Standard-Annahme gilt (z.B. „Alle Menschen können sprechen.“). Dieses Wissen kann bei Vorliegen genauerer Informationen aufgegeben und durch letztere ersetzt werden.

Default

ist eine eine Standard-Annahme, die empirisch oder pragmatisch begründet ist und die so lange aufrechterhalten wird, wie sie nicht durch gegenteilige oder speziellere Informationen aufgehoben wird.

definit

ist ein in der Computerlinguistik insbesondere im Zusammenhang mit dem Artikelsystem verwendete Eigenschaft: bestimmter Artikel („der“, „die“, „das“) und unbestimmter Artikel („ein“). definit und indefinit bilden ein begriffliches Gegensatzpaar. Es charakterisiert aber auch unterschiedliche Typen von Referenzen („Max kaufte dieses Haus“ – bestimmte/definite Referenz; „Max kaufte ein Haus“ – unbestimmte/indefinite Referenz).

deiktische Form

ist ein sprachlicher Ausdruck, der sich auf die Dialogsituation (den situativen Kontext) bezieht, in der (dem) sie geäußert wird. Die deiktischen Formen beziehen sich insbesondere auf räumliche Aspekte der Dialogsituation („hier“, „dort“ u.a.), auf zeitliche Aspekte („gestern“, „im vorigen Jahr“ u.a.) und auf Personen („ich“, „Ihr“ u.a.).

Deklination

ist die Veränderung der Wörter im nominalen Bereich, d.h. von Nomen, Adjektiven, Artikeln, Pronomen und Zahlwörtern, nach bestimmten grammatischen Kategorien (im Deutschen nach Genus, Numerus und Kasus).

Derivation

ist eine Form der Wortbildung, bei der aus einem Wort durch Kombination mit einem Präfix oder Suffix neue Wörter entstehen. (In anderen Sprachen gibt es noch weitere Varianten.) Beispiel: aus „verkaufen“ „verkäuflich“, aus „verkäuflich“ „unverkäuflich“ und aus „unverkäuflich“ „Unverkäuflichkeit“.

Deskriptor

ist ein Inhaltswort, das zur Charakterisierung von Dokumenten eingesetzt wird und bei der Informationsrecherche zur Formulierung von Anfragen und zur Wiederauffindung dieser Dokumente dient.

Deverbativum

ist ein von einem Verb (z.B. „berechnen“) abgeleitetes Nomen (hier: „Berechnung“). Beide besitzen eine enge Beziehung hinsichtlich ihres Valenzrahmens.

Dezimalklassifikation

ist ein Klassifikationssystem bei dem die Klassen und ihre Subklassen mit Hilfe von (durch Punkte getrennten) Dezimalstellen bezeichnet werden. Jeder Dezimalstelle entspricht eine neue Ebene in der Klassenhierarchie. Beispiel: K - Künstliche Intelligenz (KI), K.0 - Grundlagen der KI, K.1 - Programmiersprachen der KI, K.1.1 - LISP, K.1.2 - PROLOG usw.

Disambiguierung

ist der Vorgang der Auflösung von Mehrdeutigkeiten beim Verstehen natürlicher Sprachen (sei es durch den Menschen oder durch CL-Programme). Die Disambiguierung ist eines der schwierigsten Probleme der automatischen Sprachverarbeitung, da Mehrdeutigkeiten den natürlichen Sprachen immanent sind. Obwohl zur Auflösung von Mehrdeutigkeiten in Systemen der Computerlinguistik mitunter Heuristiken eingesetzt werden, ist für eine vollständige Lösung des Problems ein tieferes Verstehen der sprachlichen Ausdrücke erforderlich.

Disjunktion

ist eine aussagenlogische Operation, die angenähert das natürlichsprachliche „oder“ ausdrückt. Eine Disjunktion (A ODER B) zweier Aussagen A, B ist genau dann wahr, wenn wenigstens eine der beiden Aussagen A bzw. B wahr ist.

ditransitives Verb

ist ein Verb, bei dem zwei Objekte als Valenzen angelegt sind, und zwar ein direktes Objekt (im Deutschen meist im Akkusativ) und ein indirektes Objekt (im Deutschen meist im Dativ). Beispiel: „Das Kind schenkt der Mutter ein Buch.“.

Entailment

ist eine semantische Implikation, die man meist für Wörter definiert. Beispiel eines Entailments zum Verb „verkaufen“: „A verkauft B an C“ impliziert semantisch: „C kauft B von A“. Entailments können beispielsweise in semantischen Suchmaschinen genutzt werden, um Paraphrasen zu bilden und diese als alternative Suchanfragen zu verwenden.

Entität

ist in Philosophie und Sprachwissenschaft die allgemeinste Kategorie von Begriffen (wörtlich: „Wesenheit“), über die etwas ausgesagt werden kann.

Extension

ist ein Bedeutungsaspekt, der den Umfang eines Begriffes, seine Beziehung zur realen Welt oder auch zu einer gedachten (möglichen) Welt zum Ausdruck bringt (vgl. Intension).

Facettensuche

ist eine Suche, bei der man Facetten des gesuchten Dokuments einschränken kann. Eine Facette eines Dokuments kann ein Metadatum sein wie Publikationsjahr oder eine semantische Eigenschaft wie das explizite oder implizite Vorhandensein einer benannten Entität („Westfalen“) oder eines Konzepts (Beispiel: „Uni“).

facettierte Suche

siehe:  Facettensuche

Faktizität

ist ein Merkmal eines Sachverhalts, das aussagt, ob dieser Sachverhalt prinzipiell einen Wahrheitswert hat oder nicht, oder ob er nur hypothetisch gesetzt ist. Dieses Merkmal lässt sich auch auf Objekte bzw. deren Existenz übertragen: ein hypothetisches Objekt ist demnach ein Objekt, über dessen Existenz bzw. Nicht-Existenz (zumindest in einem bestimmten Stadium der Erkenntnis) noch keine endgültige Entscheidung getroffen werden kann (Beispiel: „Quarks“).

fakultative Valenz

ist eine von einem Wort (insbesondere einem Verb, einem Adjektiv oder einem Nomen) semantisch geforderte Ergänzung, die aber in der Oberflächenstruktur eines Satzes, der das Wort enthält, sprachlich nicht unbedingt realisiert sein muss, damit der Satz grammatisch korrekt gebildet ist. Beispiele: „Max malt ein Bild.“, aber auch: „Max malt.“; „der dem Freund treue Max“, aber auch „der treue Max“; „Der Glaube an die Zukunft gibt Kraft.“, aber auch: „Der Glaube gibt Kraft.“. Vgl. obligatorische Valenz.

Featurestruktur

siehe:  Merkmalstruktur

Filler

ist eine Komponente eines Frame. Datentechnische Darstellung des Wertes eines Merkmals in einer Frame-Repräsentation.

finite Verbform

ist eine konjugierte Verbform, die durch die grammatischen Kategorien Person, Numerus, Tempus und Modus charakterisiert ist (in einigen Sprachen auch durch den Aspekt).

Flexion

ist eine Formveränderung der Wörter in bestimmten Sprachen (den sogenannten flektierenden Sprachen), die dazu dient, besondere grammatische Merkmale auszudrücken (s. auch Deklination, Konjugation, Komparation).

Folgerung

ist der semantische Aspekt des Schließens eines Ausdrucks B aus einem Ausdruck A, der beinhaltet, dass immer dann, wenn A in einem bestimmten Modellbereich gilt, auch B im gleichen Modellbereich gilt.

Frage-Antwort-System

ist ein KI-System, das Sprachverstehen im umfassendsten Sinne modelliert und sowohl die Eingabe von Informationsbeständen als auch die Abfrage der Wissensbasis in natürlicher Sprache vorsieht.

Frame

ist ein Schema zur Wissensrepräsentation, das eine bestimmte Entität (ein Objekt, einen Sachverhalt, ein Ereignis) oder eine Klasse von Entitäten innerhalb einer Hierarchie solcher Schemata mit Hilfe von Merkmals-Wert-Paaren beschreibt. Es ist ein Beschreibungsmuster, das in stereotyper Weise in den verschiedensten Situationen wiederkehrt. Die Merkmale eines Frames, auch Slots genannt, haben den Charakter von Variablen, die je nach zu beschreibender Entität durch spezifische Merkmalswerte, durch sogenannte Filler, zu belegen sind.

Funktionsverb

ist ein inhaltsarmes Verb, das nur zusammen mit einem seiner Komplemente eine volle Semantik besitzt. Beispiel: „stellen“ in „einen Antrag stellen“, „machen“ in „einen Vorschlag machen“. Funktionsverben blähen einen Satz unnötig auf (Behördensprache, Kanzleideutsch), falls man die Kombination aus Funktionsverb und Komplement durch ein aussagekräftiges Verb ersetzen kann (oben wären dies „beantragen“ und „vorschlagen“).

Funktionsverbgefüge

ist eine Kombination aus einem Funktionsverb und einem inhaltstragenden Komplement. Beispiel: „einen Vorwurf machen“ (statt „vorwerfen“).

Funktionswort

ist ein Wort, das keine Semantik besitzt, wenn es allein vorkommt. Zu Funktionswörtern gehören beispielsweise Artikel, Konjunktionen und Präpositionen. Funktionswörter werden in traditionellen Suchmaschinen oft als Stoppwort behandelt und von der Indexierung und Suche ausgeschlossen. Für semantische Suchmaschinen sind Funktionswörter jedoch sehr wichtig, um die Semantik größerer Einheiten (wie Sätze und Texte) zu bestimmen. Ein Wort, das kein Funktionswort ist, ist ein Inhaltswort.

gebrauchstheoretische Semantik

ist eine (auf den österreichisch-britischen Philosophen Wittgenstein, 1889–1951 zurückgehende) Definition der Bedeutung von Wörtern durch operationale Fragestellungen. Danach drückt sich deren Bedeutung durch ihren Gebrauch in der Sprache aus und nicht durch den Bezug zu einer wie auch immer gearteten Wirklichkeit.

generischer Begriff

bedeutet Allgemeinbegriff.

generisch

bedeutet allgemeingültig oder eine Klasse von Entitäten betreffend (Gegensatz: speziell).

Genitiv

ist der zweite Kasus in vielen Sprachen. Beispiel: „des Hauses“.

Genus verbi

ist eine Aktionsform des Verbs, mit der bestimmte Sichten auf eine Handlung ausgedrückt werden, nämlich ob sie aktiv ausgeführt wird (Aktiv) oder passiv erduldet wird (Passiv).

Genus

ist die Kategorie des Geschlechts, die für Wörter im nominalen Bereich zutrifft, wobei in manchen Sprachen (wie dem Deutschen) zwischen grammatischem Geschlecht (Femininum, Maskulinum, Neutrum) und natürlichem Geschlecht unterschieden wird (z.B. ist „das Mädchen“ grammatisch Neutrum, hat aber das natürliche Geschlecht weiblich, d.h. Referenz mit „es“ und „sie“ sind möglich).

Grammatik

ist die Darstellung der Gesetzmäßigkeiten einer Sprache durch ein System regelhafter Zusammenhänge, das insbesondere die Kombination lexikalischer Elemente zu wohlgeformten sprachlichen Konstrukten erklärt. Letztere nennt man dann auch grammatisch, und die dem Regelwerk widersprechenden Konstrukte ungrammatisch.

grammatisch

bezeichnet die Übereinstimmung mit einer Grammatik. Zur Grammatik gehörend.

Graphemik

ist die Lehre von der Schriftform der Sprache (der graphischen Form).

graphemisch

bedeutet sich auf die Graphemik bzw. auf die geschriebene Sprache beziehend.

Heuristik

ist eine empirisch gestützte und stark auf Intuition beruhende Methode (wörtliche Übersetzung etwa: intelligente Findehilfe), die es gestattet, in einem komplexen Problemlösungsprozess auf effektive Weise eine Lösung zu finden, wobei aber Lösungsmöglichkeiten durch Eingrenzung des Suchraums (Beschneiden des Suchbaums) verloren gehen können. Das kann im Extremfall dazu führen, dass bei Einsatz einer Heuristik überhaupt keine Lösung gefunden wird. Als Adjektiv wird heuristisch auch in folgendem Sinne verwendet: nicht sicher, nur mit einer gewissen Wahrscheinlichkeit zum Ziel führend.

Hierarchie

ist eine Menge von Elementen mit einer eindeutigen Überordnungsrelation, d.h. jedem Element der Struktur mit Ausnahme des Spitzenelements (Top-Element) ist genau ein Element übergeordnet. Die adäquate Darstellung einer Hierarchie in graphischer Form ist ein Baum, wobei dem Top-Element die Wurzel des Baumes entspricht.

Hilfsverb

ist ein Verb (wie „sein“ und „haben“), das keine eigene lexikalische Bedeutung besitzt, sondern zur Bildung der Zeiten, des Passivs und als Kopula zur Bildung von prädikativen Ausdrücken dient (wie in den Sätzen „Er hat gearbeitet.“, „Er wurde geheilt.“, „Er ist reich.“). Vgl. Vollverb.

Idiom

ist eine feste Formulierung (Redewendung), die eine unregelhafte Bedeutung hat. Beispiel: „Der Politiker wirft das Handtuch.“ im Sinne einer Aufgabe.

Implikation

ist (im Zusammenhang mit der natürlichen Sprache und im intuitiven Sinne) die Bezeichnung für die inhaltliche Folgerung (A B), die dann gilt, wenn ein Sprecher, der die Aussage A behauptet, nicht umhin kann, auch B als gültig anzuerkennen. Im Rahmen der Aussagen- bzw. Prädikatenlogik (auch als materiale Implikation bezeichnet) bezeichnet sie den wahrheitsfunktionalen Zusammenhang (A B) zwischen zwei Aussagen A und B, der genau dann falsch ist, wenn A den Wahrheitswert T (wahr) und B den Wahrheitswert F (falsch) hat, in allen übrigen Fällen ist diese Implikation wahr.

Indefinitpronomen

ist ein Pronomen, das Unbestimmtheit oder sogar Unkenntnis ausdrückt („irgendwer“, „jemand“, „kein“, „man“ u.a.).

indefinit

bildet ein Begriffspaar mit definit.

Individualbegriff

ist ein Begriff, dessen Begriffsumfang (Extension) sich auf ein einziges Individuum eines Gegenstandsbereichs bezieht. Gegensatz: Allgemeinbegriff.

Inferenzmethode

ist eine Methode zur Automatisierung des vernünftigen Schließens in der KI.

Inferenz

ist ein Einzelschritt in einem Verfahren des intelligenten Schließens oder Schlussfolgerns, wie z.B. deduktives oder induktives Schließen. Der Begriff Inferenz ist vom Englischen to infer (schließen/schlussfolgern) abgeleitet..

infinite Verbform

ist das Gegenstück zu einer finiten Verbform. Zu den infiniten Verbformen gehören die Partizipien und der Infinitiv.

Inhaltswort

ist ein Wort, das eine aussagekräftige Semantik trägt, auch wenn es allein betrachtet wird. Zu den Inhaltswörtern gehören Nomen, Adjektive und Verben. Vgl. Funktionswort.

Intension

ist ein Bedeutungsaspekt, der den Inhalt eines Begriffs, seine Beziehung zu anderen Begriffen zum Ausdruck bringt (vgl. Extension).

intransitives Verb

ist ein Verb, nach dem kein Objekt stehen darf („regnen“, „explodieren“ u.a.). Vgl. transitives Verb und ditransitives Verb.

Junktor

ist ein logischer Operator, der zwei Ausdrücke wahrheitsfunktionell miteinander verknüpft. Dazu wird auch der Negator als einstelliger logischer Operator gezählt.

Kardinalität

ist die Mächtigkeit einer Menge, die bei endlichen Mengen mit der Anzahl der Elemente übereinstimmt (auch Kardinalzahl genannt).

Kasus

ist eine grammatische Kategorie der Konstituenten einer Nominalphrase (insbesondere von Nomen, Artikel, Adjektiv und Pronomen), die eine bestimmte syntaktische Beziehung ausdrückt. Der Kasus kann entweder als reiner Kasus nur durch Flexionsformen oder als Präpositionalkasus ausgedrückt werden.

Katapher

ist ein vorwärts gerichteter Verweis in einem Text; kataphorische Referenz. Beispiel: „Als eri aus der Schule kam, aß Maxi ein Brötchen.“ Vgl. Anapher.

KI

steht für künstliche Intelligenz.

Knowledge acquisition

ist der Wissenserwerb.

Knowledge engineer

ist ein Wissensingenieur.

Knowledge enterer

ist ein Spezialist, der die Eingabe von Wissen in große Wissensbasen (oft mit Hilfe besonderer Tools) vornimmt.

Kognition

bezeichnet das Denken und die Erkenntnis (im Gegensatz zur Perzeption oder Wahrnehmung).

Kognitionswissenschaft

ist eine wissenschaftliche Disziplin, die Kategorien wie Denken, Wissen, Erkennen u.a. bei Menschen, Tieren und Maschinen unter einheitlichen methodischen Gesichtspunkten untersucht.

kognitiv

ist ein Adjektiv zu Kognition.

kognitive Adäquatheit

bedeutet die Entsprechung mit Grundprinzipien, welche die Kognitionswissenschaft für die Denkvorgänge postuliert.

kognitive Psychologie

ist ein Zweig der Psychologie, der sich mit den menschlichen Denkleistungen befasst.

Kohärenz

ist der innere Zusammenhang eines Textes.

Koindizierung

ist ein technisches Mittel, um die Referenzidentität verschiedener Ausdrücke in einem Text durch Indizierung auszudrücken. Referenzidentische Ausdrücke erhalten dabei denselben Index. Beispiel: „Maxi wäscht sichi.“ Vgl. Koreferenz.

Kollektivum

ist ein Wort, das in singularischer Form eine Gesamtheit von einzelnen Entitäten bezeichnet, und diese als Einheit zusammenfasst (z.B. „Gebirge“ – Gesamtheit von Bergen, „Mannschaft“ – Gesamtheit von Sportlern).

Kommunikationstheorie

ist eine wissenschaftliche Disziplin, die sich mit den Grundlagen der Verständigung bzw. des Informationsaustauschs mit Hilfe von Zeichensystemen befasst.

Kommutativität

ist eine Eigenschaft einer zweistelligen Operation, die wie folgt charakterisiert ist: (a R b) = (b R a). Adjektiv: kommutativ.

Komparation

ist eine morphologische Veränderung bestimmter Adjektive und Adverbien nach den Steigerungsstufen Positiv („stark“), Komparativ („stärker“) und Superlativ („am stärksten“).

Komplement

ist eine Konstituente als Ergänzung einer Valenz, die von einer anderen Konstituente ausgeht. Mitunter werden die Komplemente auch als Argumente bezeichnet.

Komposition

ist ein Prozess der Wortbildung, der aus mehreren Wörtern ein Wort (das Kompositum) bildet. Im Deutschen ist Komposition weit verbreitet und daher für Sprachverstehen und Suchmaschinen sehr wichtig.

Kompositum

ist ein zusammengesetztes Wort. Im Deutschen sind Komposita meist Nomen oder Adjektive. Beispiele: „Handelsstreit“ und „laufstark“. Für das Sprachverstehen bestehen die Aufgaben darin, die Teile des Kompositums zu erkennen, die richtige Lesart der Teile auszuwählen und die semantische Beziehung zwischen den Teilen zu bestimmen. Beispiel: „Staubecken“.

Konjugation

ist die Veränderung der Verbform nach den grammatischen Kategorien (im Deutschen: Person, Numerus, Tempus, Modus und Genus verbi).

Konjunktion

ist eine aussagenlogische Operation, die angenähert das natürlichsprachliche „und“ ausdrückt. Eine Konjunktion zweier Aussagen A, B ist genau dann wahr, wenn sowohl A als auch B wahr sind.

Konklusion

ist das Hinterglied (rechter Teil) einer Implikation oder einer Folgerungsbeziehung. Auch die Schlussfolgerung. Vgl. Prämisse.

Konnotation

ist eine mit einem Begriff assoziierte Nebenbedeutung, die der Grundbedeutung eine zusätzliche Wertung gibt.

Konsistenz

ist die Widerspruchsfreiheit einer Wissensbasis, die in wissensbasierten Systemen vor allem nach der Eingabe neuen Wissens und nach der Regel-Ausführung überprüft bzw. gesichert werden muss. Diese Prüfung wird von einem sogenannten Konsistenz-Checker durchgeführt.

Konstituentennegation

ist eine Negation, die nur einen Teil eines Satzes (nur eine Konstituente) betrifft. Beispiel: „Max hat nicht den Hirsch getroffen, sondern das Wildschwein.“. Vgl. Satznegation.

Konstituente

ist eine relativ geschlossene Einheit eines Satzes oder Textes, die aus ein oder mehreren Wörtern besteht und einen inneren Zusammenhang aufweist. Sie kann durch Weglasstest, Umstellungstest und Ersetzungstest ermittelt werden.

Konzept

bedeutet Begriff.

Kopula

ist die Verbindung von Subjekt und Prädikativum (Prädikatsnomen oder Prädikatsadjektiv). Beispiele: „Das Haus ist ein Schandfleck.“ und „Das Haus ist beeindruckend.“ Die Kopula wird auch Satzband genannt.

Kopulaverb

ist ein Verb, das eine Kopula bilden kann. Im Deutschen sind dies besonders „sein“ und „werden“. Beispiel: „Der Algorithmus ist eine Revolution.“

koreferent

ist ein Adjektiv zu Koreferenz.

Koreferenz

ist die Beziehung zwischen zwei sprachlichen Ausdrücken, die identische Referenz haben und damit sich auf dasselbe Objekt beziehen. Auch Fälle, bei denen die bezeichneten Objekte nicht identisch, sondern nur verbunden sind, werden als Koreferenz bezeichnet. Beispielsweise liegt folgender Koreferenz eine Teil-Ganzes-Beziehung zugrunde: „(Das Auto)i blieb liegen, da (der Motor)i defekt war.“

künstliche Intelligenz

ist eine wissenschaftliche Disziplin und eine Eigenschaft. Unter künstlicher Intelligenz in der ersten Bedeutung (abgekürzt: KI) versteht man ein Arbeitsgebiet, dessen Gegenstand es ist, Leistungen mit Hilfe technischer Systeme oder Rechnern zu realisieren, die folgende Bedingungen erfüllen. Ihre Hervorbringung verlangt nach allgemeinem Verständnis menschliche Intelligenz und für ihre Realisierung liegen keine speziell angepassten Algorithmen vor. Künstliche Intelligenz in der zweiten Bedeutung bezeichnet die Eigenschaft technischer Geräte (insbesondere eines Rechners), die gleiche oder wenigstens in bestimmten Aspekten angenäherte Intelligenz zu besitzen wie ein Mensch.

Lesart

ist eine Bedeutungsvariante eines mehrdeutigen Worts oder einer mehrdeutigen Wortgruppe. Beispiele: „Pferd“, Lesart 1: Tier, Lesart 2: Turngerät; „kalter Kaffee“, Lesart 1: kaltes Getränk (wörtliche Bedeutung), Lesart 2 : veraltete Mitteilung (übertragene Bedeutung).

Matrixsatz

ist ein Hauptsatz, in den ein anderer, untergeordneter Satz eingebettet ist.

Merkmalstruktur

ist ein Merkmals-Wert-Schema, das grammatischen Merkmalen (wie Genus und Numerus) bestimmte Werte (z.B. Femininum bzw. Plural) zuordnet und als Argument-Wert-Zuordnungstabelle einer Funktion mit endlichem Definitionsbereich und Wertebereich aufgefasst werden kann.

Metapher

ist ein bildlicher Ausdruck, der durch Bezeichnungsübertragung zwischen zwei Begriffen mit gemeinsamen Bedeutungskomponenten zustande kommt (Beispiel: „Haupt“ als oberster Körperteil, „das Haupt der Familie“). Im Gegensatz zur Metonymie ist die Metapher gerade dadurch charakterisiert, dass sich die Bedeutungen der beiden Begriffe überschneiden (in dem Beispiel in der gemeinsamen Komponente: oberster bzw. beherrschender Teil sein).

metaphorisch

bedeutet zu einer Metapher gehörend.

Metonymie

ist die Ersetzung eines Ausdrucks durch einen anderen Ausdruck, der zu ersterem in einem äußeren (räumlichen, zeitlichen oder kausalen) Bezug steht, wobei aber die Bedeutungskomponenten der Ausdrücke verschieden sind. Beispiel: „Nach Potsdam bekam Europa ein anderes politisches Gesicht.“ – Potsdam als Stadt wird für die Potsdamer Konferenz gesetzt. Analog: „Das weiße Haus“ für die Regierung der USA.

Modalität

ist eine Stellungnahme desjenigen, der eine Aussage formuliert, zur Gültigkeit der Aussage. Auch die Formalisierung dieses Konzepts in der Logik.

Modalverb

ist ein Verb, dass die Modalität einer Situation angibt. Zum Beispiel kann das Modalverb „müssen“ eine Notwendigkeit ausdrücken. Weitere Beispiele: „dürfen“, „können“, „sollen“. Das Zusammenspiel von Modalverben mit der Negation ist zwischen Sprachen teilweise anders. Bekanntes Beispiel für Deutsch und Englisch: „must not“ („nicht dürfen“), „need not“ („nicht müssen“).

Modell

ist ein Begriff, der in der Logik und in den Naturwissenschaften in unterschiedlicher Weise gebraucht wird. In der Physik nennt man den Übergang von einem realen Gegenstandsbereich (z.B. der Welt der Atome) zu einer mathematischen Beschreibung durch eine Formel (in diesem Fall ist das die Schrödinger-Gleichung) mathematische Modellierung. Das ist ein Schritt der Abstraktion. In der Logik bedeutet Festlegung eines Modells für eine Ausdrucksmenge einen Schritt der Konkretisierung, d.h. einen Übergang von einem formalen Bereich in einen semantischen Gegenstandsbereich. Daran ändert auch die Tatsache nichts, dass der Gegenstandsbereich selbst durch formale mathematische Gebilde, wie z.B. algebraische Strukturen, gegeben sein kann.

Modus

ist eine grammatische Kategorie des Verbs, die die Einstellung des Sprechers zu der vom Verb getragenen Aussage charakterisiert (neutrale Aussage, Befehl, Irrealität des Sachverhalts).

MultiNet

ist ein Formalismus zur Bedeutungsrepräsentation, der zu den erweiterten semantischen Netzen gehört. Die Knoten des Netzes werden bezüglich Sorte und sogenannter Layer-Merkmale beschrieben. Das Inventar an Kantenbeschriftungen (Rollen) ist vordefiniert und umfasst circa 130 Relationen.

naiver Nutzer

ist ein Anwender eines technischen Systems, der keine spezielle Vorbildung bezüglich der Bedienung oder Funktionsweise dieses Systems erhalten hat oder diese auch gar nicht erwerben will. Systeme, die für naive Nutzer (das können durchaus Spezialisten auf ihrem Gebiet sein) entwickelt werden, benötigen eine ergonomisch besonders gut durchdachte Nutzeroberfläche und geeignete Kommunikationsmöglichkeiten zwischen Mensch und Maschine (z.B. ein natürlichsprachliches Interface).

natural language interface

siehe:  natürlichsprachliche Schnittstelle.

natürlichsprachliche Schnittstelle

ist eine Nutzerschnittstelle zu einem Softwareprodukt oder System, das eine Kommunikation des Nutzers mit diesem System in natürlicher Sprache ermöglicht.

NLI

bezeichnet eine natürlichsprachliche Schnittstelle (Englisch: natural language interface).

Nomen

ist ein Namenwort oder Substantiv. Beispiel: „Haus“ oder „Informatik“.

nominal

bedeutet zum Nomen gehörig.

Nominalphrase

ist eine Substantivgruppe. Eine Nominalphrase besteht im Kern aus einem Nomen. Hinzukommen modifizierende Wörtern (wie vorangehende Adjektive und Artikel, „das schnelle, rote Auto“) und Ergänzungen als nachfolgende Präpositionalphrase oder Nominalphrase im Genitiv („das Auto des teuren Herstellers“ oder „das Auto aus Deutschland“).

Nominalisierung

ist eine Art der Wortbildung, bei der aus einem Wort, das kein Nomen ist, ein Nomen gemacht wird. Beispiel: „Beantragung“ (aus dem Verb „beantragen“), „Anfälligkeit“ (aus dem Adjektiv „anfällig“).

Nullartikel

ist eine Artikelform ohne sprachlichen Ausdruck, der in Grammatiken der Computerlinguistik eingesetzt wird, um Nominalphrasen einheitlich behandeln zu können („Kinder“, „die Kinder“). Unter Einbeziehung dieses Konstrukts beginnt im Deutschen jede Nominalphrase mit einem Artikel.

Numerus

ist eine grammatische Kategorie der Zahl. Im Deutschen und vielen anderen Sprachen wird unterschieden nach Einzahl (Singular) und Mehrzahl (Plural). Die Kategorie ist charakteristisch für die Wörter der Nominalphrase und für Verben.

Oberbegriff

siehe:  Unterbegriff.

Oberflächenstruktur

ist eine Darstellungsform eines Satzes oder Textes, so wie er dem Hörer oder Leser dargeboten wird.

Objektsatz

ist ein Satz, der die syntaktische Funktion eines grammatischen Objekts einnimmt. Beispiel: „Er sah den Sonnenuntergang.“ (normales Objekt), „Er sah, dass die Sonne unterging.“ (Objektsatz).

obligatorische Valenz

ist eine von einem Wort (insbesondere Verb, Adjektiv oder Nomen) geforderte Ergänzung, die unbedingt in der Oberflächenstruktur eines Satzes, der das Wort enthält, sprachlich realisiert sein muss, damit der Satz grammatisch korrekt gebildet ist. Obligatorische Valenz ist bei Adjektiven und Nomen wesentlich seltener anzutreffen als bei Verben. Beispiele: „Max wohnt in Bonn.“, nicht: (*) „Max wohnt.“, „Max war dem Freund behilflich.“. Vgl. fakultative Valenz.

Ontologie

ist eine Teildisziplin der Philosophie, die sich mit der Struktur der Wirklichkeit und ihrer Abhängigkeit bzw. Unabhängigkeit vom erkennenden Subjekt befasst. Wesentlicher Gegenstand der Ontologie ist die klassifizierende Ordnung des Seins nach bestimmten Merkmalen, weshalb eine solche systematische Ordnung von Begriffen, die eine strukturelle Gliederung der Realität widerspiegelt, selbst eine Ontologie genannt wird.

Parser

ist ein Programm, das die Aufgabe des Parsing erledigt. Obwohl seit über 50 Jahren an Parsern geforscht wird, erreichen diese Programme noch keine vollständige und korrekte Abdeckung der natürlichen Sprachen.

Parsing

ist der Prozess der Analyse eines natürlichsprachlichen Konstrukts (eines Satzes, eines Textes usw.), der sich auf eine vorgegebene Grammatik stützt. Dabei wird festgestellt, ob dieses Konstrukt in dem von der Grammatik beschriebenen Sprachausschnitt liegt oder nicht. Im ersteren Fall wird im Ergebnis des Parsing zusätzlich eine (vom verwendeten Grammatiktyp bestimmte grammatische Struktur) des zu analysierenden Konstrukts abgeleitet.

Person

ist eine grammatische Kategorie des Verbs und der Personalpronomen mit drei Werten. 1. Person – Sprecher bzw. Gruppe, die Sprecher einschließt. 2. Person – der Angesprochene bzw. die Gruppe, die diesen einschließt. 3. Person – Jemand oder etwas, über den bzw. über das gesprochen wird.

Phonetik

ist die Lehre von den Lauten einer Sprache. Lautlehre.

phonetisch

bedeutet sich auf die Lautgestalt der Sprache bzw. auf die Phonetik beziehend.

Polyhierarchie

ist die Überlagerung mehrerer einfacher Hierarchien. Während eine einfache Hierarchie durch einen Baum mit genau einer Wurzel dargestellt werden kann, entspricht einer Polyhierarchie ein Graph mit mehreren Wurzeln (die Überlagerung mehrerer Bäume).

Prädikat

ist der Teil einer Aussage, der von einem Subjekt behauptet wird.

Prädikation

ist das Formulieren einer Aussage über eine Entität (z.B. Zuerkennung oder Aberkennung von Eigenschaften, Beteiligtsein an Ereignissen usw.). Verb: prädizieren.

prädikativer Gebrauch

ist bei Adjektiven die Stellung als Teil des Prädikats („der Stein ist schwer“). Vgl. attributiver Gebrauch.

Präfix

ist eine Nachsilbe wie „nach-“ in „nachschicken“. Vgl. Suffix.

Prämisse

ist das Vorderglied (linker Teil) einer Implikation oder Folgerungsbeziehung. Auch: die Voraussetzung. Vgl. Konklusion.

Präpositionalkasus

ist eine Kasusform, die mit Hilfe einer Präposition ausgedrückt wird (wie z.B. de für Genitiv im Französischen oder o für Präpositiv im Russischen usw.).

Proadverb

ist ein Wort, das syntaktisch die Stellung von Adverbialbestimmungen einnimmt und sich semantisch wie ein Pronomen verhält (z.B. steht „dort“ im Satz als Stellvertreter für eine Adverbialbestimmung des Ortes mit gleichzeitiger Referenzwirkung auf eine bestimmte Lokation).

Referent

ist ein Objekt oder Sachverhalt der Realität, auf den sich ein sprachlicher Ausdruck bezieht. Davon abgeleitet werden auch sprachliche Ausdrücke oder formale Konstrukte, auf die sich andere Ausdrücke beziehen, als Referenten bezeichnet.

Referenz

ist die Beziehung zwischen einem sprachlichen Ausdruck und einem Objekt oder Sachverhalt der Realität. Beispielsweise bezieht sich der Ausdruck „Palermo“ (meist) auf eine Stadt in Sizilien.

reflexives Verb

ist ein Verb, das (im Deutschen) ein Reflexivpronomen nach sich zieht. Man unterscheidet zwei Gruppen: a) die echt reflexiven Verben (auch formal-reflexiv genannt): diese Verben verlangen ein Reflexivpronomen, das nicht durch eine andere Nominalphrase ersetzt werden darf („Ich verbitte mir die Störung.“ – nicht aber: (*) „Ich verbitte dem Freund die Störung.“). Diese Verben können im allgemeinen nicht reziprok verwendet werden: (*) „Wir verbitten uns (im Sinne von gegenseitig) die Störung“. b) die unecht reflexiven Verben (auch semantisch-reflexiv genannt): bei diesen Verben kann das Reflexivpronomen durch eine andere Nominalphrase ersetzt werden („Das Kind betrachtet sich.“ – „Das Kind betrachtet den Schmuck.“. Diese Verben dürfen i.a. auch reziprok verwendet werden: „Die Kinder betrachten sich (gegenseitig).“.

Reflexivpronomen

ist ein Pronomen, das sich auf das Subjekt des gleichen Satzes bezieht. Dabei unterscheidet man echte Reflexivpronomen, die nicht durch eine andere Nominalphrase ersetzt werden dürfen („Er freut sich.“), und unechte Reflexivpronomen, bei denen das möglich ist („Er wäscht sich.“ – „Er wäscht das Gesicht.“). Genaugenommen liegt dieser Unterscheidung eine Eigenschaft des Verbs (und nicht des Pronomens) zugrunde (s. reflexives Verb).

Rektion

ist eine Form der Unterordnung einer Konstituente, bei der die Kasusform des untergeordneten Worts durch das syntaktisch übergeordnete (regierende) Wort bestimmt wird. Beispiel: der Kasus in einer Präpositionalphrase hängt im Deutschen von der Präposition ab: „mit Männern“ vs. „gegen Männer“.

Rolle

ist eine semantische Einstufung von Mitspielern in einem Sachverhalt. Das Inventar an Rollen hängt vom semantischen Formalismus ab. Typische semantische Rollen sind Agent oder Handelnder (AGT) und unbeteiligtes Objekt (OBJ).

Rubrikator

ist eine Stelle in einem Ordnungssystem bzw. ein Bezeichner für eine Klasse in einem Klassifikationssystem. Beispiele: K.1.2 - PROLOG ; K.12.3 - Expertensysteme in einer Dezimalklassifikation zur Beschreibung von KI-Gebieten.

Sachverhalt

ist eine komplexe situative Gegebenheit (in einem verallgemeinerten Sinn), der entweder eine reale Entsprechung zukommen kann (Fakt, realer Sachverhalt) oder die nur hypothetisch gedacht sind (hypothetischer Sachverhalt oder Pseudosachverhalt).

Satznegation

ist eine Negation, die sich auf den ganzen Satz bezieht („Max hat nichts getroffen.“). Vgl. Konstituentennegation.

Schlagwort

ist ein Wort (oder manchmal auch eine Wortgruppe), das der Erschließung eines Volltextes in einem Archiv dient. Ein Schlagwort wird aus dem Volltext entnommen oder daraus abgeleitet. Im Gegensatz zu einem Stichwort wird es mit einer vordefinierten Liste von erlaubten Kandidaten (Schlagwort-Katalog) abgeglichen.

Selektion

ist die Auswahl von Wörtern oder Phrasen mit einer bestimmten paradigmatischen Charakterisierung für deren syntaktische Einbindung in einen sprachlichen Ausdruck.

Selektionsbeschränkung

ist eine Bedingung, die festlegt, welche Wörter mit welchen anderen Wörtern in einem sprachliche Ausdruck (z.B. in einem Satz) kombiniert werden dürfen.

Semantik

ist der Zweig der Zeichenlehre (Semiotik), der sich mit dem Inhalt von symbolischen Ausdrücken befasst. Gleichzeitig Bezeichnung für die Bedeutung natürlichsprachlicher Ausdrücke.

semantische Suchmaschine

ist eine besondere Suchmaschine, die (im Gegensatz zu traditionellen Suchmaschinen) die Semantik von Suchanfrage und die Semantik der durchsuchten Texte auswertet. Eine semantische Suchmaschine kann falsche Treffer vermeiden und zusätzliche richtige Treffer finden. Dies gilt besonders für tiefe semantische Suchmaschinen. Google und andere Websuchmaschinen sind keine tiefen semantischen Suchmaschinen, auch wenn sie im sogenannten Wissensgraph und anderen Bereichen semantisch aufbereitete Informationen verwenden.

semantisches Netz

ist eine Repräsentation der Bedeutung von (meist natürlichsprachlich gegebenen) Informationen in Form eines markierten, orientierten Graphen. Dabei entsprechen den Knoten des Graphen Begriffe der natürlichen Sprache; den Kanten des Graphen entsprechen Beziehungen zwischen diesen Begriffen.

situativer Kontext

ist der außersprachliche Wissenshintergrund für eine sprachliche Äußerung. Er beschreibt die Konstellation von Sachen und Personen (einschließlich Sprecher und Hörer), in die die Äußerung eingebettet ist, sowie deren Einordnung in Raum und Zeit. Der situative Kontext ist ganz wesentlich für die aktuelle Bedeutung einer sprachlichen Äußerung. Ohne Kenntnis des situativen Kontexts ist die Wahrheit von Äußerungen wie „Hier ist es aber kalt.“ oder „Dieses Auto taugt nichts.“ nicht entscheidbar.

Slot

ist ein Bestandteil eines Frame, der ein Merkmal des durch den Frame repräsentierten Begriffs beschreibt. Ein Slot wird technisch als auszufüllende Leerstelle betrachtet. Er wird durch einen Namen und Bedingungen charakterisiert, die angeben, welche Elemente als Filler für den Slot in Frage kommen.

Stichwort

ist ein Wort (oder manchmal auch eine Wortgruppe), das der Erschließung eines Volltextes in einem Archiv dient. Ein Stichwort wird aus dem Volltext entnommen und wird im Gegensatz zu einem Schlagwort nicht mit einer vordefinierten Liste von erlaubten Kandidaten abgeglichen.

Stoppwort

ist ein Wort, das traditionelle Suchmaschinen von Indexierung und Suche ausschließen, weil diese Wörter sehr häufig sind und nur im Kontext verstanden werden können. Beispiele: „für“ und „dieser“. Meistens werden Funktionswörter (Funktionswort) als Stoppwörter genommen.

Substantiv

ist ein Nomen oder Namenwort.

Substantivgruppe

ist eine Nominalphrase

Suffix

ist eine Nachsilbe wie „bar“ in „unterscheidbar“. Vgl. Präfix.

Synonym

ist ein Wort (oder eine Phrase), das mit einem anderen Wort (oder einer anderen Phrase) weitestgehend übereinstimmende oder sehr ähnliche Bedeutung hat. Beispiele: „Rechner“ und „Computer“; „Junggeselle“, „unverheirateter erwachsener Mann“. Streng genommen gibt es kaum Wörter, die vollständig synonym sind.

Syntax

ist ein Zweig der Zeichenlehre (Semiotik), der sich mit dem formalen Aufbau von symbolischen Ausdrücken befasst. Gleichzeitig Bezeichnung für die strukturellen Beziehungen der Wörter eines natürlichsprachlichen Konstrukts zueinander.

Tempus

ist eine Zeitform des Verbs, die eine Einordnung des gesamten vom Verb getragenen Sachverhalts in einen größeren zeitlichen Ablauf zum Ausdruck bringt.

Textkohärenz

ist ein Merkmal eines Textes, nach dem eine Ansammlung von Sätzen zu einer in sich geschlossenen Textstruktur verbunden wird. Die Textkohärenz wird durch Proformen, bestimmte zeitliche Abfolge der geschilderten Sachverhalte, Thema-Rhema-Gliederung u.a. gewährleistet.

Thesaurus

ist ein vorbereitetes, normiertes Wörterbuch eines Sachgebietes, dessen Eintragungen (Deskriptoren) mit Hilfe eines relativ kleinen Bestandes an semantischen Relationen miteinander verknüpft sind. Typischerweise werden hierzu die Relationen der begrifflichen Subordination (SUB), der Synonymie (SYNO), der assoziativen Beziehung (ASSOC) und einige andere verwendet. Ein Thesaurus widerspiegelt die Begriffswelt eines bestimmten Anwendungsgebiets und dient bei der Informationsrecherche zur Unterstützung der Formulierung von Suchanfragen.

Tiefenkasus

ist ein verallgemeinerter gemeinsamer Inhalt, der jeweils verschiedenen grammatischen Kasus in den einzelnen Sprachen mit ausgeprägtem Kasussystem auf semantischer Ebene zugrundeliegt. Der Begriff geht auf den amerikanischen Sprachwissenschaftler Fillmore zurück.

Tiefenrelation

ist eine spezielle semantische Relation zur Repräsentation der kognitiven Rolle, die ein Teilnehmer in einer Handlung spielt. Die mitunter auch gebrauchte Bezeichnung Tiefenkasusrelation ist darauf zurückzuführen, dass diese kognitiven Rollen in vielen Sprachen mit Hilfe des Kasussystems ausgedrückt werden. Beispiel: „Er arbeitet mit dem Hammer.“ – das Instrument der Handlung, ausgedrückt durch den Tiefenkasus INSTR(ument), kann im Deutschen mit Hilfe der Präposition „mit“ und dem Dativ an das Verb angeschlossen werden; im Russischen wird für die Beschreibung des gleichen Zusammenhangs der reine Instrumental (5. Fall) verwendet: On rabotaet molotom.

Tiefenstruktur

ist eine Darstellung der syntaktischen Struktur oder des semantischen Gehalts eines natürlichsprachlichen Konstrukts bei der automatischen Verarbeitung natürlicher Sprache (syntaktische bzw. semantische Tiefenstruktur).

Topikalisierung

ist eine Überführung einer Konstituente, die nicht Subjekt ist, in eine funktional ausgezeichnete Stellung am Satzanfang. Dadurch wird die Konstituente zum Topik bzw. Thema (hängt mit der Gliederung von Sätzen in Topik und Fokus bzw. Thema und Rhema zusammen). Beispiel: Verwendung von „Dem Jungen gab Peter das Geld.“ anstatt der Normalstellung „Peter gab dem Jungen das Geld.“.

transitives Verb

ist ein Verb, bei dem ein Objekt als Valenz angelegt ist, das im Deutschen meist im Akkusativ steht. Beispiel: „lesen“ im Sinn von „Das Mädchen liest ein Buch.“. Vgl. intransitives Verb und ditransitives Verb.

Transitivität

ist eine Eigenschaft einer zweistelligen Relation, wenn gilt ((x R y) UND (y R z)) dann auch (x R z).

Unterbegriff

ist ein Begriff, der spezieller als ein anderer Begriff (Oberbegriff) ist. Beispiel: „Dom“ ist ein Unterbegriff von „Kirche“. Die Beziehung von einem Unterbegriff zu seinem Oberbegriff nennt man auch Subordination. Eine Ansammlung von Subordinationen bildet eine Hierarchie.

Verb

ist ein Tuwort. Im Deutschen unterscheidet man Vollverb („sagen“), Hilfsverb („sein“) und Modalverb („sollen“).

Vererbung

ist (in der künstlichen Intelligenz, Wissensverarbeitung u.a.) die Übertragung von Eigenschaften von einem übergeordneten Begriff (Oberbegriff) auf einen untergeordneten Begriff (Unterbegriff) in einer Hierarchie von Begriffen.

Verschlagwortung

ist die Zuordnung von Schlagwörtern (Schlagwort) zu einem Volltext (z.B. eines Archivs). Man kann diesen Vorgang automatisieren. Vgl. Verstichwortung.

Verstichwortung

ist die Zuweisung von Stichwörtern (Stichwort) zu einem Volltext (z.B. eines Archivs). Dieser Vorgang kann ganz oder teilweise automatisiert werden. Bei Einsatz von tiefem Sprachverstehen kann die automatische Verstichwortung die Qualität einer manuellen Verstichwortung erreichen.

Vollverb

ist ein Verb, das eine eigene lexikalische Bedeutung besitzt und eine Handlung, einen Zustand oder ein Geschehnis beschreibt (wie in den Sätzen „Max singt.“, „Max ist in München.“, „Es regnet.“). Das zweite Beispiel zeigt, dass „sein“ neben seiner Funktion als Hilfsverb auch in einer anderen Bedeutung („wohnen“ oder „sich befinden“) als Vollverb fungieren kann. Vgl. Hilfsverb.

Wissenserwerb

ist ein breites Spektrum von Techniken zum Aufbau von Wissen für Expertensysteme, Sprachverstehenssystemen u.ä., das von psychologischen Methoden des Brainstorming oder Fragebogen-Techniken bis hin zur rechnergestützten Abfrage von Experten mit Hilfe der automatischen Verarbeitung natürlicher Sprache reicht.

Wissensingenieur

ist ein Spezialist, der die Entwicklung wissensbasierter Systeme, insbesondere von Expertensystemen, betreibt. Eine seiner Aufgaben ist die Unterstützung des Wissenserwerbs und der Extraktion von Wissen aus dem Erfahrungsschatz eines menschlichen Experten.

Wortbildung

ist die Bildung neuer Wörter aus bestehenden Wörtern. Die wichtigsten Prozesse der Wortbildung sind Komposition und Derivation.