Fachglossar zu automatischem Sprachverstehen und semantischen Suchmaschinen

Dr. Sven Hartrumpf, Prof. Dr. Hermann Helbig

https://www.sempria.de/

2015-07-01; letzte Änderung: 2021-01-15

Glossar Sprachverstehen und semantische Suchmaschinen

Ableitung
ist die Gewinnung von neuen Ausdrücken aus einer Menge vorgegebener Ausdrücke nach bestimmten formalen Regeln, die sich nur auf die syntaktische Struktur, nicht aber auf den Inhalt, der Ausdrücke beziehen.
Adjektiv
ist ein Eigenschaftswort. Im Deutschen können Adjektive attributiv (bei einem Nomen, Beispiel: „das intelligente System“), prädikativ (mit einem Kopulaverb, Beispiel: „Die Lösung ist hervorragend.“) oder adverbiell (mit einem Verb, Beispiel: „Der Computer rechnet schnell.“ gebraucht werden.
Adjunkt
ist ein sprachlicher Ausdruck (A), der einen anderen Ausdruck (B) attributiv ergänzt, wobei A entweder bezüglich des B bedeutungseinschränkend wirkt („ein Haus (B) , das unseren Ansprüchen genügt (A)“) oder eine zusätzliche Qualifikation hinsichtlich B ausdrückt („unser (B) schönes (A) Haus (B)“).
Affix
ist ein Präfix (Vorsilbe, „auf-“ in „aufschreiben“) oder Suffix (Nachsilbe, „-ung“ in „Unterscheidung“).
Aggregation
ist die Zusammenfassung von Einzelelementen zu einer größeren Einheit.
Allgemeinbegriff
ist ein Begriff, der im Gegensatz zum Individualbegriff auf eine Gesamtheit von Gegebenheiten (Entitäten) zutrifft. Auch generischer Begriff genannt.
Anapher
ist ein rückwärts gerichteter Verweis in einem Text (anaphorische Referenz). Beispiel: „Als Maxi aus der Schule kam, aß eri ein Brötchen.“. Vgl. Katapher.
Annotation
ist eine Anmerkung zu einem Dokument. Diese kann informell in natürlicher Sprache verfasst sein (z.B. ein persönlicher Kommentar) oder stärker formalen Charakter tragen (z.B. Kurzdarstellung des Inhalts in einem geeigneten Format).
Antezedent
ist die vorausgehende Konstituente, auf die ein referierender Ausdruck (z.B. ein Pronomen oder ein Artikel) verweist.
Antonym
ist ein Gegenwort. Beispiele: „dunkel“ zu „hell“, „undefiniert“ zu „definiert“.
Apposition
ist eine attributive Ergänzung eines Nomens durch eine Substantivgruppe im gleichen Kasus („Karl der Kahle“, „dem Chirurgen, Herrn Dr. Schneider“, „Kanzlerin Merkel“).
Artefakt
ist ein künstlich geschaffenes Objekt bzw. der mit ihm verbundene Begriff.
Artikel
ist ein Begleiter. Dieses Funktionswort steht bei einem Substantiv. Im Deutschen unterscheidet man den bestimmten Artikel („der“) und den unbestimmten Artikel („ein“).
Assimilation
ist die Integration neu ankommender Informationen in einen bereits vorhandenen Informationsbestand in einem Frage-Antwort-System und ähnlichen Systemen. Dabei sind Referenzen aufzulösen, semantische Äquivalenzen zu entdecken, Doppelspeicherungen von identischen Begriffen zu vermeiden sowie die richtigen Unterordnungen zu bereits gespeicherten Oberbegriffen herzustellen.
Assoziativität
ist die Eigenschaft einer zweistelligen Operation R, die wie folgt charakterisiert wird: ((a R b) R c) = (a R (b R c)). Adjektiv: assoziativ.
Attribut
ist eine Beifügung oder modifizierende Bestimmung zu einem Satzglied. Adjektiv: attributiv.
attributiver Gebrauch
ist bei Adjektiven die Stellung als Attribut („der schwere Stein“). Vgl. prädikativer Gebrauch.
bedeutungsorientierte Suchmaschine
ist eine tiefe semantische Suchsoftware. Sie realisiert eine semantische Suchmaschine, die natürliche Sprache in Dokumenten und Suchanfragen tief und umfassend analysiert.
boolean
siehe:  boolesch.
boolesch
ist die Bezeichnung für einen Typ, der nur zwei Werte annehmen kann (diese werden meist als T oder F, 1 oder 0, + oder - usw. codiert).
Broker
ist ein Informationsvermittler in einem System mit verteilten Informations-Ressourcen, der zwischen Endnutzer und Informationsanbieter (Provider) steht und den Nutzer bei der Auswahl geeigneter Informationsquellen und bei der Beschaffung der Informationen unterstützt.
CL
steht für Computerlinguistik.
Computer-Lexikographie
ist ein Zweig der Computerlinguistik, der sich mit dem Inhalt und mit dem Aufbau von Wörterbüchern befasst, die für die automatische Sprachverarbeitung eingesetzt werden.
Computerlinguistik
ist ein interdisziplinärer Wissenschaftszweig, der sich mit der Theorie und Praxis der automatischen Sprachverarbeitung befasst und der zwischen Informatik und Linguistik angesiedelt ist. Im weitesten Sinne werden hierzu alle Methoden gezählt, die den Computer zur Bearbeitung linguistischer Fragestellungen benutzen (z.B. auch textstatistische Untersuchungen). Im engeren Sinne - diese Sicht wird in der KI eingenommen - gehören zu diesem Gebiet nur die Methoden, die sich mit der Automatisierung des Sprachverstehens befassen.
Constraint
ist eine einschränkende Bedingung (Voraussetzung), unter der eine Operation anwendbar ist oder unter der ein bestimmter Sachverhalt gilt.
Deduktion
ist eine besondere Form der Ableitung in logischen Kalkülen, die eng mit dem Begriff der Implikation verknüpft ist (formaler Aspekt des Schließens). Die Deduktion stellt eine Formalisierung des inhaltlichen Folgerungsbegriffes (Folgerung) dar.
Default-Regel
ist ein Teil eines regelhaftes Wissens, das in Abwesenheit anderer, spezifischerer Informationen als Standard-Annahme gilt (z.B. „Alle Menschen können sprechen.“). Dieses Wissen kann bei Vorliegen genauerer Informationen aufgegeben und durch letztere ersetzt werden.
Default
ist eine eine Standard-Annahme, die empirisch oder pragmatisch begründet ist und die so lange aufrechterhalten wird, wie sie nicht durch gegenteilige oder speziellere Informationen aufgehoben wird.
definit
ist ein in der Computerlinguistik insbesondere im Zusammenhang mit dem Artikelsystem verwendete Eigenschaft: bestimmter Artikel („der“, „die“, „das“) und unbestimmter Artikel („ein“). definit und indefinit bilden ein begriffliches Gegensatzpaar. Es charakterisiert aber auch unterschiedliche Typen von Referenzen („Max kaufte dieses Haus“ – bestimmte/definite Referenz; „Max kaufte ein Haus“ – unbestimmte/indefinite Referenz).
deiktische Form
ist ein sprachlicher Ausdruck, der sich auf die Dialogsituation (den situativen Kontext) bezieht, in der (dem) sie geäußert wird. Die deiktischen Formen beziehen sich insbesondere auf räumliche Aspekte der Dialogsituation („hier“, „dort“ u.a.), auf zeitliche Aspekte („gestern“, „im vorigen Jahr“ u.a.) und auf Personen („ich“, „Ihr“ u.a.).
Deklination
ist die Veränderung der Wörter im nominalen Bereich, d.h. von Nomen, Adjektiven, Artikeln, Pronomen und Zahlwörtern, nach bestimmten grammatischen Kategorien (im Deutschen nach Genus, Numerus und Kasus).
Derivation
ist eine Form der Wortbildung, bei der aus einem Wort durch Kombination mit einem Präfix oder Suffix neue Wörter entstehen. (In anderen Sprachen gibt es noch weitere Varianten.) Beispiel: aus „verkaufen“ „verkäuflich“, aus „verkäuflich“ „unverkäuflich“ und aus „unverkäuflich“ „Unverkäuflichkeit“.
Deskriptor
ist ein Inhaltswort, das zur Charakterisierung von Dokumenten eingesetzt wird und bei der Informationsrecherche zur Formulierung von Anfragen und zur Wiederauffindung dieser Dokumente dient.
Deverbativum
ist ein von einem Verb (z.B. „berechnen“) abgeleitetes Nomen (hier: „Berechnung“). Beide besitzen eine enge Beziehung hinsichtlich ihres Valenzrahmens.
Dezimalklassifikation
ist ein Klassifikationssystem bei dem die Klassen und ihre Subklassen mit Hilfe von (durch Punkte getrennten) Dezimalstellen bezeichnet werden. Jeder Dezimalstelle entspricht eine neue Ebene in der Klassenhierarchie. Beispiel: K - Künstliche Intelligenz (KI), K.0 - Grundlagen der KI, K.1 - Programmiersprachen der KI, K.1.1 - LISP, K.1.2 - PROLOG usw.
Disambiguierung
ist der Vorgang der Auflösung von Mehrdeutigkeiten beim Verstehen natürlicher Sprachen (sei es durch den Menschen oder durch CL-Programme). Die Disambiguierung ist eines der schwierigsten Probleme der automatischen Sprachverarbeitung, da Mehrdeutigkeiten den natürlichen Sprachen immanent sind. Obwohl zur Auflösung von Mehrdeutigkeiten in Systemen der Computerlinguistik mitunter Heuristiken eingesetzt werden, ist für eine vollständige Lösung des Problems ein tieferes Verstehen der sprachlichen Ausdrücke erforderlich.
Disjunktion
ist eine aussagenlogische Operation, die angenähert das natürlichsprachliche „oder“ ausdrückt. Eine Disjunktion (A ODER B) zweier Aussagen A, B ist genau dann wahr, wenn wenigstens eine der beiden Aussagen A bzw. B wahr ist.
ditransitives Verb
ist ein Verb, bei dem zwei Objekte als Valenzen angelegt sind, und zwar ein direktes Objekt (im Deutschen meist im Akkusativ) und ein indirektes Objekt (im Deutschen meist im Dativ). Beispiel: „Das Kind schenkt der Mutter ein Buch.“.
Entailment
ist eine semantische Implikation, die man meist für Wörter definiert. Beispiel eines Entailments zum Verb „verkaufen“: „A verkauft B an C“ impliziert semantisch: „C kauft B von A“. Entailments können beispielsweise in semantischen Suchmaschinen genutzt werden, um Paraphrasen zu bilden und diese als alternative Suchanfragen zu verwenden.
Entität
ist in Philosophie und Sprachwissenschaft die allgemeinste Kategorie von Begriffen (wörtlich: „Wesenheit“), über die etwas ausgesagt werden kann.
Extension
ist ein Bedeutungsaspekt, der den Umfang eines Begriffes, seine Beziehung zur realen Welt oder auch zu einer gedachten (möglichen) Welt zum Ausdruck bringt (vgl. Intension).
Facettensuche
ist eine Suche, bei der man Facetten des gesuchten Dokuments einschränken kann. Eine Facette eines Dokuments kann ein Metadatum sein wie Publikationsjahr oder eine semantische Eigenschaft wie das explizite oder implizite Vorhandensein einer benannten Entität („Westfalen“) oder eines Konzepts (Beispiel: „Uni“).
facettierte Suche
siehe:  Facettensuche
Faktizität
ist ein Merkmal eines Sachverhalts, das aussagt, ob dieser Sachverhalt prinzipiell einen Wahrheitswert hat oder nicht, oder ob er nur hypothetisch gesetzt ist. Dieses Merkmal lässt sich auch auf Objekte bzw. deren Existenz übertragen: ein hypothetisches Objekt ist demnach ein Objekt, über dessen Existenz bzw. Nicht-Existenz (zumindest in einem bestimmten Stadium der Erkenntnis) noch keine endgültige Entscheidung getroffen werden kann (Beispiel: „Quarks“).
fakultative Valenz
ist eine von einem Wort (insbesondere einem Verb, einem Adjektiv oder einem Nomen) semantisch geforderte Ergänzung, die aber in der Oberflächenstruktur eines Satzes, der das Wort enthält, sprachlich nicht unbedingt realisiert sein muss, damit der Satz grammatisch korrekt gebildet ist. Beispiele: „Max malt ein Bild.“, aber auch: „Max malt.“; „der dem Freund treue Max“, aber auch „der treue Max“; „Der Glaube an die Zukunft gibt Kraft.“, aber auch: „Der Glaube gibt Kraft.“. Vgl. obligatorische Valenz.
Featurestruktur
siehe:  Merkmalstruktur
Filler
ist eine Komponente eines Frame. Datentechnische Darstellung des Wertes eines Merkmals in einer Frame-Repräsentation.
finite Verbform
ist eine konjugierte Verbform, die durch die grammatischen Kategorien Person, Numerus, Tempus und Modus charakterisiert ist (in einigen Sprachen auch durch den Aspekt).
Flexion
ist eine Formveränderung der Wörter in bestimmten Sprachen (den sogenannten flektierenden Sprachen), die dazu dient, besondere grammatische Merkmale auszudrücken (s. auch Deklination, Konjugation, Komparation).
Folgerung
ist der semantische Aspekt des Schließens eines Ausdrucks B aus einem Ausdruck A, der beinhaltet, dass immer dann, wenn A in einem bestimmten Modellbereich gilt, auch B im gleichen Modellbereich gilt.
Frage-Antwort-System
ist ein KI-System, das Sprachverstehen im umfassendsten Sinne modelliert und sowohl die Eingabe von Informationsbeständen als auch die Abfrage der Wissensbasis in natürlicher Sprache vorsieht.
Frame
ist ein Schema zur Wissensrepräsentation, das eine bestimmte Entität (ein Objekt, einen Sachverhalt, ein Ereignis) oder eine Klasse von Entitäten innerhalb einer Hierarchie solcher Schemata mit Hilfe von Merkmals-Wert-Paaren beschreibt. Es ist ein Beschreibungsmuster, das in stereotyper Weise in den verschiedensten Situationen wiederkehrt. Die Merkmale eines Frames, auch Slots genannt, haben den Charakter von Variablen, die je nach zu beschreibender Entität durch spezifische Merkmalswerte, durch sogenannte Filler, zu belegen sind.
Funktionsverb
ist ein inhaltsarmes Verb, das nur zusammen mit einem seiner Komplemente eine volle Semantik besitzt. Beispiel: „stellen“ in „einen Antrag stellen“, „machen“ in „einen Vorschlag machen“. Funktionsverben blähen einen Satz unnötig auf (Behördensprache, Kanzleideutsch), falls man die Kombination aus Funktionsverb und Komplement durch ein aussagekräftiges Verb ersetzen kann (oben wären dies „beantragen“ und „vorschlagen“).
Funktionsverbgefüge
ist eine Kombination aus einem Funktionsverb und einem inhaltstragenden Komplement. Beispiel: „einen Vorwurf machen“ (statt „vorwerfen“).
Funktionswort
ist ein Wort, das keine Semantik besitzt, wenn es allein vorkommt. Zu Funktionswörtern gehören beispielsweise Artikel, Konjunktionen und Präpositionen. Funktionswörter werden in traditionellen Suchmaschinen oft als Stoppwort behandelt und von der Indexierung und Suche ausgeschlossen. Für semantische Suchmaschinen sind Funktionswörter jedoch sehr wichtig, um die Semantik größerer Einheiten (wie Sätze und Texte) zu bestimmen. Ein Wort, das kein Funktionswort ist, ist ein Inhaltswort.
gebrauchstheoretische Semantik
ist eine (auf den österreichisch-britischen Philosophen Wittgenstein, 1889–1951 zurückgehende) Definition der Bedeutung von Wörtern durch operationale Fragestellungen. Danach drückt sich deren Bedeutung durch ihren Gebrauch in der Sprache aus und nicht durch den Bezug zu einer wie auch immer gearteten Wirklichkeit.
generischer Begriff
bedeutet Allgemeinbegriff.
generisch
bedeutet allgemeingültig oder eine Klasse von Entitäten betreffend (Gegensatz: speziell).
Genitiv
ist der zweite Kasus in vielen Sprachen. Beispiel: „des Hauses“.
Genus verbi
ist eine Aktionsform des Verbs, mit der bestimmte Sichten auf eine Handlung ausgedrückt werden, nämlich ob sie aktiv ausgeführt wird (Aktiv) oder passiv erduldet wird (Passiv).
Genus
ist die Kategorie des Geschlechts, die für Wörter im nominalen Bereich zutrifft, wobei in manchen Sprachen (wie dem Deutschen) zwischen grammatischem Geschlecht (Femininum, Maskulinum, Neutrum) und natürlichem Geschlecht unterschieden wird (z.B. ist „das Mädchen“ grammatisch Neutrum, hat aber das natürliche Geschlecht weiblich, d.h. Referenz mit „es“ und „sie“ sind möglich).
Grammatik
ist die Darstellung der Gesetzmäßigkeiten einer Sprache durch ein System regelhafter Zusammenhänge, das insbesondere die Kombination lexikalischer Elemente zu wohlgeformten sprachlichen Konstrukten erklärt. Letztere nennt man dann auch grammatisch, und die dem Regelwerk widersprechenden Konstrukte ungrammatisch.
grammatisch
bezeichnet die Übereinstimmung mit einer Grammatik. Zur Grammatik gehörend.
Graphemik
ist die Lehre von der Schriftform der Sprache (der graphischen Form).
graphemisch
bedeutet sich auf die Graphemik bzw. auf die geschriebene Sprache beziehend.
Heuristik
ist eine empirisch gestützte und stark auf Intuition beruhende Methode (wörtliche Übersetzung etwa: intelligente Findehilfe), die es gestattet, in einem komplexen Problemlösungsprozess auf effektive Weise eine Lösung zu finden, wobei aber Lösungsmöglichkeiten durch Eingrenzung des Suchraums (Beschneiden des Suchbaums) verloren gehen können. Das kann im Extremfall dazu führen, dass bei Einsatz einer Heuristik überhaupt keine Lösung gefunden wird. Als Adjektiv wird heuristisch auch in folgendem Sinne verwendet: nicht sicher, nur mit einer gewissen Wahrscheinlichkeit zum Ziel führend.
Hierarchie
ist eine Menge von Elementen mit einer eindeutigen Überordnungsrelation, d.h. jedem Element der Struktur mit Ausnahme des Spitzenelements (Top-Element) ist genau ein Element übergeordnet. Die adäquate Darstellung einer Hierarchie in graphischer Form ist ein Baum, wobei dem Top-Element die Wurzel des Baumes entspricht.
Hilfsverb
ist ein Verb (wie „sein“ und „haben“), das keine eigene lexikalische Bedeutung besitzt, sondern zur Bildung der Zeiten, des Passivs und als Kopula zur Bildung von prädikativen Ausdrücken dient (wie in den Sätzen „Er hat gearbeitet.“, „Er wurde geheilt.“, „Er ist reich.“). Vgl. Vollverb.
Idiom
ist eine feste Formulierung (Redewendung), die eine unregelhafte Bedeutung hat. Beispiel: „Der Politiker wirft das Handtuch.“ im Sinne einer Aufgabe.
Implikation
ist (im Zusammenhang mit der natürlichen Sprache und im intuitiven Sinne) die Bezeichnung für die inhaltliche Folgerung (A B), die dann gilt, wenn ein Sprecher, der die Aussage A behauptet, nicht umhin kann, auch B als gültig anzuerkennen. Im Rahmen der Aussagen- bzw. Prädikatenlogik (auch als materiale Implikation bezeichnet) bezeichnet sie den wahrheitsfunktionalen Zusammenhang (A B) zwischen zwei Aussagen A und B, der genau dann falsch ist, wenn A den Wahrheitswert T (wahr) und B den Wahrheitswert F (falsch) hat, in allen übrigen Fällen ist diese Implikation wahr.
Indefinitpronomen
ist ein Pronomen, das Unbestimmtheit oder sogar Unkenntnis ausdrückt („irgendwer“, „jemand“, „kein“, „man“ u.a.).
indefinit
bildet ein Begriffspaar mit definit.
Individualbegriff
ist ein Begriff, dessen Begriffsumfang (Extension) sich auf ein einziges Individuum eines Gegenstandsbereichs bezieht. Gegensatz: Allgemeinbegriff.
Inferenzmethode
ist eine Methode zur Automatisierung des vernünftigen Schließens in der KI.
Inferenz
ist ein Einzelschritt in einem Verfahren des intelligenten Schließens oder Schlussfolgerns, wie z.B. deduktives oder induktives Schließen. Der Begriff Inferenz ist vom Englischen to infer (schließen/schlussfolgern) abgeleitet..
infinite Verbform
ist das Gegenstück zu einer finiten Verbform. Zu den infiniten Verbformen gehören die Partizipien und der Infinitiv.
Inhaltswort
ist ein Wort, das eine aussagekräftige Semantik trägt, auch wenn es allein betrachtet wird. Zu den Inhaltswörtern gehören Nomen, Adjektive und Verben. Vgl. Funktionswort.
Intension
ist ein Bedeutungsaspekt, der den Inhalt eines Begriffs, seine Beziehung zu anderen Begriffen zum Ausdruck bringt (vgl. Extension).
intransitives Verb
ist ein Verb, nach dem kein Objekt stehen darf („regnen“, „explodieren“ u.a.). Vgl. transitives Verb und ditransitives Verb.
Junktor
ist ein logischer Operator, der zwei Ausdrücke wahrheitsfunktionell miteinander verknüpft. Dazu wird auch der Negator als einstelliger logischer Operator gezählt.
Kardinalität
ist die Mächtigkeit einer Menge, die bei endlichen Mengen mit der Anzahl der Elemente übereinstimmt (auch Kardinalzahl genannt).
Kasus
ist eine grammatische Kategorie der Konstituenten einer Nominalphrase (insbesondere von Nomen, Artikel, Adjektiv und Pronomen), die eine bestimmte syntaktische Beziehung ausdrückt. Der Kasus kann entweder als reiner Kasus nur durch Flexionsformen oder als Präpositionalkasus ausgedrückt werden.
Katapher
ist ein vorwärts gerichteter Verweis in einem Text; kataphorische Referenz. Beispiel: „Als eri aus der Schule kam, aß Maxi ein Brötchen.“ Vgl. Anapher.
KI
steht für künstliche Intelligenz.
Knowledge acquisition
ist der Wissenserwerb.
Knowledge engineer
ist ein Wissensingenieur.
Knowledge enterer
ist ein Spezialist, der die Eingabe von Wissen in große Wissensbasen (oft mit Hilfe besonderer Tools) vornimmt.
Kognition
bezeichnet das Denken und die Erkenntnis (im Gegensatz zur Perzeption oder Wahrnehmung).
Kognitionswissenschaft
ist eine wissenschaftliche Disziplin, die Kategorien wie Denken, Wissen, Erkennen u.a. bei Menschen, Tieren und Maschinen unter einheitlichen methodischen Gesichtspunkten untersucht.
kognitiv
ist ein Adjektiv zu Kognition.
kognitive Adäquatheit
bedeutet die Entsprechung mit Grundprinzipien, welche die Kognitionswissenschaft für die Denkvorgänge postuliert.
kognitive Psychologie
ist ein Zweig der Psychologie, der sich mit den menschlichen Denkleistungen befasst.
Kohärenz
ist der innere Zusammenhang eines Textes.
Koindizierung
ist ein technisches Mittel, um die Referenzidentität verschiedener Ausdrücke in einem Text durch Indizierung auszudrücken. Referenzidentische Ausdrücke erhalten dabei denselben Index. Beispiel: „Maxi wäscht sichi.“ Vgl. Koreferenz.
Kollektivum
ist ein Wort, das in singularischer Form eine Gesamtheit von einzelnen Entitäten bezeichnet, und diese als Einheit zusammenfasst (z.B. „Gebirge“ – Gesamtheit von Bergen, „Mannschaft“ – Gesamtheit von Sportlern).
Kommunikationstheorie
ist eine wissenschaftliche Disziplin, die sich mit den Grundlagen der Verständigung bzw. des Informationsaustauschs mit Hilfe von Zeichensystemen befasst.
Kommutativität
ist eine Eigenschaft einer zweistelligen Operation, die wie folgt charakterisiert ist: (a R b) = (b R a). Adjektiv: kommutativ.
Komparation
ist eine morphologische Veränderung bestimmter Adjektive und Adverbien nach den Steigerungsstufen Positiv („stark“), Komparativ („stärker“) und Superlativ („am stärksten“).
Komplement
ist eine Konstituente als Ergänzung einer Valenz, die von einer anderen Konstituente ausgeht. Mitunter werden die Komplemente auch als Argumente bezeichnet.
Komposition
ist ein Prozess der Wortbildung, der aus mehreren Wörtern ein Wort (das Kompositum) bildet. Im Deutschen ist Komposition weit verbreitet und daher für Sprachverstehen und Suchmaschinen sehr wichtig.
Kompositum
ist ein zusammengesetztes Wort. Im Deutschen sind Komposita meist Nomen oder Adjektive. Beispiele: „Handelsstreit“ und „laufstark“. Für das Sprachverstehen bestehen die Aufgaben darin, die Teile des Kompositums zu erkennen, die richtige Lesart der Teile auszuwählen und die semantische Beziehung zwischen den Teilen zu bestimmen. Beispiel: „Staubecken“.
Konjugation
ist die Veränderung der Verbform nach den grammatischen Kategorien (im Deutschen: Person, Numerus, Tempus, Modus und Genus verbi).
Konjunktion
ist eine aussagenlogische Operation, die angenähert das natürlichsprachliche „und“ ausdrückt. Eine Konjunktion zweier Aussagen A, B ist genau dann wahr, wenn sowohl A als auch B wahr sind.
Konklusion
ist das Hinterglied (rechter Teil) einer Implikation oder einer Folgerungsbeziehung. Auch die Schlussfolgerung. Vgl. Prämisse.
Konnotation
ist eine mit einem Begriff assoziierte Nebenbedeutung, die der Grundbedeutung eine zusätzliche Wertung gibt.
Konsistenz
ist die Widerspruchsfreiheit einer Wissensbasis, die in wissensbasierten Systemen vor allem nach der Eingabe neuen Wissens und nach der Regel-Ausführung überprüft bzw. gesichert werden muss. Diese Prüfung wird von einem sogenannten Konsistenz-Checker durchgeführt.
Konstituentennegation
ist eine Negation, die nur einen Teil eines Satzes (nur eine Konstituente) betrifft. Beispiel: „Max hat nicht den Hirsch getroffen, sondern das Wildschwein.“. Vgl. Satznegation.
Konstituente
ist eine relativ geschlossene Einheit eines Satzes oder Textes, die aus ein oder mehreren Wörtern besteht und einen inneren Zusammenhang aufweist. Sie kann durch Weglasstest, Umstellungstest und Ersetzungstest ermittelt werden.
Konzept
bedeutet Begriff.
Kopula
ist die Verbindung von Subjekt und Prädikativum (Prädikatsnomen oder Prädikatsadjektiv). Beispiele: „Das Haus ist ein Schandfleck.“ und „Das Haus ist beeindruckend.“ Die Kopula wird auch Satzband genannt.
Kopulaverb
ist ein Verb, das eine Kopula bilden kann. Im Deutschen sind dies besonders „sein“ und „werden“. Beispiel: „Der Algorithmus ist eine Revolution.“
koreferent
ist ein Adjektiv zu Koreferenz.
Koreferenz
ist die Beziehung zwischen zwei sprachlichen Ausdrücken, die identische Referenz haben und damit sich auf dasselbe Objekt beziehen. Auch Fälle, bei denen die bezeichneten Objekte nicht identisch, sondern nur verbunden sind, werden als Koreferenz bezeichnet. Beispielsweise liegt folgender Koreferenz eine Teil-Ganzes-Beziehung zugrunde: „(Das Auto)i blieb liegen, da (der Motor)i defekt war.“
künstliche Intelligenz
ist eine wissenschaftliche Disziplin und eine Eigenschaft. Unter künstlicher Intelligenz in der ersten Bedeutung (abgekürzt: KI) versteht man ein Arbeitsgebiet, dessen Gegenstand es ist, Leistungen mit Hilfe technischer Systeme oder Rechnern zu realisieren, die folgende Bedingungen erfüllen. Ihre Hervorbringung verlangt nach allgemeinem Verständnis menschliche Intelligenz und für ihre Realisierung liegen keine speziell angepassten Algorithmen vor. Künstliche Intelligenz in der zweiten Bedeutung bezeichnet die Eigenschaft technischer Geräte (insbesondere eines Rechners), die gleiche oder wenigstens in bestimmten Aspekten angenäherte Intelligenz zu besitzen wie ein Mensch.
Lesart
ist eine Bedeutungsvariante eines mehrdeutigen Worts oder einer mehrdeutigen Wortgruppe. Beispiele: „Pferd“, Lesart 1: Tier, Lesart 2: Turngerät; „kalter Kaffee“, Lesart 1: kaltes Getränk (wörtliche Bedeutung), Lesart 2 : veraltete Mitteilung (übertragene Bedeutung).
Matrixsatz
ist ein Hauptsatz, in den ein anderer, untergeordneter Satz eingebettet ist.
Merkmalstruktur
ist ein Merkmals-Wert-Schema, das grammatischen Merkmalen (wie Genus und Numerus) bestimmte Werte (z.B. Femininum bzw. Plural) zuordnet und als Argument-Wert-Zuordnungstabelle einer Funktion mit endlichem Definitionsbereich und Wertebereich aufgefasst werden kann.
Metapher
ist ein bildlicher Ausdruck, der durch Bezeichnungsübertragung zwischen zwei Begriffen mit gemeinsamen Bedeutungskomponenten zustande kommt (Beispiel: „Haupt“ als oberster Körperteil, „das Haupt der Familie“). Im Gegensatz zur Metonymie ist die Metapher gerade dadurch charakterisiert, dass sich die Bedeutungen der beiden Begriffe überschneiden (in dem Beispiel in der gemeinsamen Komponente: oberster bzw. beherrschender Teil sein).
metaphorisch
bedeutet zu einer Metapher gehörend.
Metonymie
ist die Ersetzung eines Ausdrucks durch einen anderen Ausdruck, der zu ersterem in einem äußeren (räumlichen, zeitlichen oder kausalen) Bezug steht, wobei aber die Bedeutungskomponenten der Ausdrücke verschieden sind. Beispiel: „Nach Potsdam bekam Europa ein anderes politisches Gesicht.“ – Potsdam als Stadt wird für die Potsdamer Konferenz gesetzt. Analog: „Das weiße Haus“ für die Regierung der USA.
Modalität
ist eine Stellungnahme desjenigen, der eine Aussage formuliert, zur Gültigkeit der Aussage. Auch die Formalisierung dieses Konzepts in der Logik.
Modalverb
ist ein Verb, dass die Modalität einer Situation angibt. Zum Beispiel kann das Modalverb „müssen“ eine Notwendigkeit ausdrücken. Weitere Beispiele: „dürfen“, „können“, „sollen“. Das Zusammenspiel von Modalverben mit der Negation ist zwischen Sprachen teilweise anders. Bekanntes Beispiel für Deutsch und Englisch: „must not“ („nicht dürfen“), „need not“ („nicht müssen“).
Modell
ist ein Begriff, der in der Logik und in den Naturwissenschaften in unterschiedlicher Weise gebraucht wird. In der Physik nennt man den Übergang von einem realen Gegenstandsbereich (z.B. der Welt der Atome) zu einer mathematischen Beschreibung durch eine Formel (in diesem Fall ist das die Schrödinger-Gleichung) mathematische Modellierung. Das ist ein Schritt der Abstraktion. In der Logik bedeutet Festlegung eines Modells für eine Ausdrucksmenge einen Schritt der Konkretisierung, d.h. einen Übergang von einem formalen Bereich in einen semantischen Gegenstandsbereich. Daran ändert auch die Tatsache nichts, dass der Gegenstandsbereich selbst durch formale mathematische Gebilde, wie z.B. algebraische Strukturen, gegeben sein kann.
Modus
ist eine grammatische Kategorie des Verbs, die die Einstellung des Sprechers zu der vom Verb getragenen Aussage charakterisiert (neutrale Aussage, Befehl, Irrealität des Sachverhalts).
MultiNet
ist ein Formalismus zur Bedeutungsrepräsentation, der zu den erweiterten semantischen Netzen gehört. Die Knoten des Netzes werden bezüglich Sorte und sogenannter Layer-Merkmale beschrieben. Das Inventar an Kantenbeschriftungen (Rollen) ist vordefiniert und umfasst circa 130 Relationen.
naiver Nutzer
ist ein Anwender eines technischen Systems, der keine spezielle Vorbildung bezüglich der Bedienung oder Funktionsweise dieses Systems erhalten hat oder diese auch gar nicht erwerben will. Systeme, die für naive Nutzer (das können durchaus Spezialisten auf ihrem Gebiet sein) entwickelt werden, benötigen eine ergonomisch besonders gut durchdachte Nutzeroberfläche und geeignete Kommunikationsmöglichkeiten zwischen Mensch und Maschine (z.B. ein natürlichsprachliches Interface).
natural language interface
siehe:  natürlichsprachliche Schnittstelle.
natürlichsprachliche Schnittstelle
ist eine Nutzerschnittstelle zu einem Softwareprodukt oder System, das eine Kommunikation des Nutzers mit diesem System in natürlicher Sprache ermöglicht.
NLI
bezeichnet eine natürlichsprachliche Schnittstelle (Englisch: natural language interface).
Nomen
ist ein Namenwort oder Substantiv. Beispiel: „Haus“ oder „Informatik“.
nominal
bedeutet zum Nomen gehörig.
Nominalphrase
ist eine Substantivgruppe. Eine Nominalphrase besteht im Kern aus einem Nomen. Hinzukommen modifizierende Wörtern (wie vorangehende Adjektive und Artikel, „das schnelle, rote Auto“) und Ergänzungen als nachfolgende Präpositionalphrase oder Nominalphrase im Genitiv („das Auto des teuren Herstellers“ oder „das Auto aus Deutschland“).
Nominalisierung
ist eine Art der Wortbildung, bei der aus einem Wort, das kein Nomen ist, ein Nomen gemacht wird. Beispiel: „Beantragung“ (aus dem Verb „beantragen“), „Anfälligkeit“ (aus dem Adjektiv „anfällig“).
Nullartikel
ist eine Artikelform ohne sprachlichen Ausdruck, der in Grammatiken der Computerlinguistik eingesetzt wird, um Nominalphrasen einheitlich behandeln zu können („Kinder“, „die Kinder“). Unter Einbeziehung dieses Konstrukts beginnt im Deutschen jede Nominalphrase mit einem Artikel.
Numerus
ist eine grammatische Kategorie der Zahl. Im Deutschen und vielen anderen Sprachen wird unterschieden nach Einzahl (Singular) und Mehrzahl (Plural). Die Kategorie ist charakteristisch für die Wörter der Nominalphrase und für Verben.
Oberbegriff
siehe:  Unterbegriff.
Oberflächenstruktur
ist eine Darstellungsform eines Satzes oder Textes, so wie er dem Hörer oder Leser dargeboten wird.
Objektsatz
ist ein Satz, der die syntaktische Funktion eines grammatischen Objekts einnimmt. Beispiel: „Er sah den Sonnenuntergang.“ (normales Objekt), „Er sah, dass die Sonne unterging.“ (Objektsatz).
obligatorische Valenz
ist eine von einem Wort (insbesondere Verb, Adjektiv oder Nomen) geforderte Ergänzung, die unbedingt in der Oberflächenstruktur eines Satzes, der das Wort enthält, sprachlich realisiert sein muss, damit der Satz grammatisch korrekt gebildet ist. Obligatorische Valenz ist bei Adjektiven und Nomen wesentlich seltener anzutreffen als bei Verben. Beispiele: „Max wohnt in Bonn.“, nicht: (*) „Max wohnt.“, „Max war dem Freund behilflich.“. Vgl. fakultative Valenz.
Ontologie
ist eine Teildisziplin der Philosophie, die sich mit der Struktur der Wirklichkeit und ihrer Abhängigkeit bzw. Unabhängigkeit vom erkennenden Subjekt befasst. Wesentlicher Gegenstand der Ontologie ist die klassifizierende Ordnung des Seins nach bestimmten Merkmalen, weshalb eine solche systematische Ordnung von Begriffen, die eine strukturelle Gliederung der Realität widerspiegelt, selbst eine Ontologie genannt wird.
Parser
ist ein Programm, das die Aufgabe des Parsing erledigt. Obwohl seit über 50 Jahren an Parsern geforscht wird, erreichen diese Programme noch keine vollständige und korrekte Abdeckung der natürlichen Sprachen.
Parsing
ist der Prozess der Analyse eines natürlichsprachlichen Konstrukts (eines Satzes, eines Textes usw.), der sich auf eine vorgegebene Grammatik stützt. Dabei wird festgestellt, ob dieses Konstrukt in dem von der Grammatik beschriebenen Sprachausschnitt liegt oder nicht. Im ersteren Fall wird im Ergebnis des Parsing zusätzlich eine (vom verwendeten Grammatiktyp bestimmte grammatische Struktur) des zu analysierenden Konstrukts abgeleitet.
Person
ist eine grammatische Kategorie des Verbs und der Personalpronomen mit drei Werten. 1. Person – Sprecher bzw. Gruppe, die Sprecher einschließt. 2. Person – der Angesprochene bzw. die Gruppe, die diesen einschließt. 3. Person – Jemand oder etwas, über den bzw. über das gesprochen wird.
Phonetik
ist die Lehre von den Lauten einer Sprache. Lautlehre.
phonetisch
bedeutet sich auf die Lautgestalt der Sprache bzw. auf die Phonetik beziehend.
Polyhierarchie
ist die Überlagerung mehrerer einfacher Hierarchien. Während eine einfache Hierarchie durch einen Baum mit genau einer Wurzel dargestellt werden kann, entspricht einer Polyhierarchie ein Graph mit mehreren Wurzeln (die Überlagerung mehrerer Bäume).
Prädikat
ist der Teil einer Aussage, der von einem Subjekt behauptet wird.
Prädikation
ist das Formulieren einer Aussage über eine Entität (z.B. Zuerkennung oder Aberkennung von Eigenschaften, Beteiligtsein an Ereignissen usw.). Verb: prädizieren.
prädikativer Gebrauch
ist bei Adjektiven die Stellung als Teil des Prädikats („der Stein ist schwer“). Vgl. attributiver Gebrauch.
Präfix
ist eine Nachsilbe wie „nach-“ in „nachschicken“. Vgl. Suffix.
Prämisse
ist das Vorderglied (linker Teil) einer Implikation oder Folgerungsbeziehung. Auch: die Voraussetzung. Vgl. Konklusion.
Präpositionalkasus
ist eine Kasusform, die mit Hilfe einer Präposition ausgedrückt wird (wie z.B. de für Genitiv im Französischen oder o für Präpositiv im Russischen usw.).
Proadverb
ist ein Wort, das syntaktisch die Stellung von Adverbialbestimmungen einnimmt und sich semantisch wie ein Pronomen verhält (z.B. steht „dort“ im Satz als Stellvertreter für eine Adverbialbestimmung des Ortes mit gleichzeitiger Referenzwirkung auf eine bestimmte Lokation).
Referent
ist ein Objekt oder Sachverhalt der Realität, auf den sich ein sprachlicher Ausdruck bezieht. Davon abgeleitet werden auch sprachliche Ausdrücke oder formale Konstrukte, auf die sich andere Ausdrücke beziehen, als Referenten bezeichnet.
Referenz
ist die Beziehung zwischen einem sprachlichen Ausdruck und einem Objekt oder Sachverhalt der Realität. Beispielsweise bezieht sich der Ausdruck „Palermo“ (meist) auf eine Stadt in Sizilien.
reflexives Verb
ist ein Verb, das (im Deutschen) ein Reflexivpronomen nach sich zieht. Man unterscheidet zwei Gruppen: a) die echt reflexiven Verben (auch formal-reflexiv genannt): diese Verben verlangen ein Reflexivpronomen, das nicht durch eine andere Nominalphrase ersetzt werden darf („Ich verbitte mir die Störung.“ – nicht aber: (*) „Ich verbitte dem Freund die Störung.“). Diese Verben können im allgemeinen nicht reziprok verwendet werden: (*) „Wir verbitten uns (im Sinne von gegenseitig) die Störung“. b) die unecht reflexiven Verben (auch semantisch-reflexiv genannt): bei diesen Verben kann das Reflexivpronomen durch eine andere Nominalphrase ersetzt werden („Das Kind betrachtet sich.“ – „Das Kind betrachtet den Schmuck.“. Diese Verben dürfen i.a. auch reziprok verwendet werden: „Die Kinder betrachten sich (gegenseitig).“.
Reflexivpronomen
ist ein Pronomen, das sich auf das Subjekt des gleichen Satzes bezieht. Dabei unterscheidet man echte Reflexivpronomen, die nicht durch eine andere Nominalphrase ersetzt werden dürfen („Er freut sich.“), und unechte Reflexivpronomen, bei denen das möglich ist („Er wäscht sich.“ – „Er wäscht das Gesicht.“). Genaugenommen liegt dieser Unterscheidung eine Eigenschaft des Verbs (und nicht des Pronomens) zugrunde (s. reflexives Verb).
Rektion
ist eine Form der Unterordnung einer Konstituente, bei der die Kasusform des untergeordneten Worts durch das syntaktisch übergeordnete (regierende) Wort bestimmt wird. Beispiel: der Kasus in einer Präpositionalphrase hängt im Deutschen von der Präposition ab: „mit Männern“ vs. „gegen Männer“.
Rolle
ist eine semantische Einstufung von Mitspielern in einem Sachverhalt. Das Inventar an Rollen hängt vom semantischen Formalismus ab. Typische semantische Rollen sind Agent oder Handelnder (AGT) und unbeteiligtes Objekt (OBJ).
Rubrikator
ist eine Stelle in einem Ordnungssystem bzw. ein Bezeichner für eine Klasse in einem Klassifikationssystem. Beispiele: K.1.2 - PROLOG ; K.12.3 - Expertensysteme in einer Dezimalklassifikation zur Beschreibung von KI-Gebieten.
Sachverhalt
ist eine komplexe situative Gegebenheit (in einem verallgemeinerten Sinn), der entweder eine reale Entsprechung zukommen kann (Fakt, realer Sachverhalt) oder die nur hypothetisch gedacht sind (hypothetischer Sachverhalt oder Pseudosachverhalt).
Satznegation
ist eine Negation, die sich auf den ganzen Satz bezieht („Max hat nichts getroffen.“). Vgl. Konstituentennegation.
Schlagwort
ist ein Wort (oder manchmal auch eine Wortgruppe), das der Erschließung eines Volltextes in einem Archiv dient. Ein Schlagwort wird aus dem Volltext entnommen oder daraus abgeleitet. Im Gegensatz zu einem Stichwort wird es mit einer vordefinierten Liste von erlaubten Kandidaten (Schlagwort-Katalog) abgeglichen.
Selektion
ist die Auswahl von Wörtern oder Phrasen mit einer bestimmten paradigmatischen Charakterisierung für deren syntaktische Einbindung in einen sprachlichen Ausdruck.
Selektionsbeschränkung
ist eine Bedingung, die festlegt, welche Wörter mit welchen anderen Wörtern in einem sprachliche Ausdruck (z.B. in einem Satz) kombiniert werden dürfen.
Semantik
ist der Zweig der Zeichenlehre (Semiotik), der sich mit dem Inhalt von symbolischen Ausdrücken befasst. Gleichzeitig Bezeichnung für die Bedeutung natürlichsprachlicher Ausdrücke.
semantische Suchmaschine
ist eine besondere Suchmaschine, die (im Gegensatz zu traditionellen Suchmaschinen) die Semantik von Suchanfrage und die Semantik der durchsuchten Texte auswertet. Eine semantische Suchmaschine kann falsche Treffer vermeiden und zusätzliche richtige Treffer finden. Dies gilt besonders für tiefe semantische Suchmaschinen. Google und andere Websuchmaschinen sind keine tiefen semantischen Suchmaschinen, auch wenn sie im sogenannten Wissensgraph und anderen Bereichen semantisch aufbereitete Informationen verwenden.
semantisches Netz
ist eine Repräsentation der Bedeutung von (meist natürlichsprachlich gegebenen) Informationen in Form eines markierten, orientierten Graphen. Dabei entsprechen den Knoten des Graphen Begriffe der natürlichen Sprache; den Kanten des Graphen entsprechen Beziehungen zwischen diesen Begriffen.
situativer Kontext
ist der außersprachliche Wissenshintergrund für eine sprachliche Äußerung. Er beschreibt die Konstellation von Sachen und Personen (einschließlich Sprecher und Hörer), in die die Äußerung eingebettet ist, sowie deren Einordnung in Raum und Zeit. Der situative Kontext ist ganz wesentlich für die aktuelle Bedeutung einer sprachlichen Äußerung. Ohne Kenntnis des situativen Kontexts ist die Wahrheit von Äußerungen wie „Hier ist es aber kalt.“ oder „Dieses Auto taugt nichts.“ nicht entscheidbar.
Slot
ist ein Bestandteil eines Frame, der ein Merkmal des durch den Frame repräsentierten Begriffs beschreibt. Ein Slot wird technisch als auszufüllende Leerstelle betrachtet. Er wird durch einen Namen und Bedingungen charakterisiert, die angeben, welche Elemente als Filler für den Slot in Frage kommen.
Stichwort
ist ein Wort (oder manchmal auch eine Wortgruppe), das der Erschließung eines Volltextes in einem Archiv dient. Ein Stichwort wird aus dem Volltext entnommen und wird im Gegensatz zu einem Schlagwort nicht mit einer vordefinierten Liste von erlaubten Kandidaten abgeglichen.
Stoppwort
ist ein Wort, das traditionelle Suchmaschinen von Indexierung und Suche ausschließen, weil diese Wörter sehr häufig sind und nur im Kontext verstanden werden können. Beispiele: „für“ und „dieser“. Meistens werden Funktionswörter (Funktionswort) als Stoppwörter genommen.
Substantiv
ist ein Nomen oder Namenwort.
Substantivgruppe
ist eine Nominalphrase
Suffix
ist eine Nachsilbe wie „bar“ in „unterscheidbar“. Vgl. Präfix.
Synonym
ist ein Wort (oder eine Phrase), das mit einem anderen Wort (oder einer anderen Phrase) weitestgehend übereinstimmende oder sehr ähnliche Bedeutung hat. Beispiele: „Rechner“ und „Computer“; „Junggeselle“, „unverheirateter erwachsener Mann“. Streng genommen gibt es kaum Wörter, die vollständig synonym sind.
Syntax
ist ein Zweig der Zeichenlehre (Semiotik), der sich mit dem formalen Aufbau von symbolischen Ausdrücken befasst. Gleichzeitig Bezeichnung für die strukturellen Beziehungen der Wörter eines natürlichsprachlichen Konstrukts zueinander.
Tempus
ist eine Zeitform des Verbs, die eine Einordnung des gesamten vom Verb getragenen Sachverhalts in einen größeren zeitlichen Ablauf zum Ausdruck bringt.
Textkohärenz
ist ein Merkmal eines Textes, nach dem eine Ansammlung von Sätzen zu einer in sich geschlossenen Textstruktur verbunden wird. Die Textkohärenz wird durch Proformen, bestimmte zeitliche Abfolge der geschilderten Sachverhalte, Thema-Rhema-Gliederung u.a. gewährleistet.
Thesaurus
ist ein vorbereitetes, normiertes Wörterbuch eines Sachgebietes, dessen Eintragungen (Deskriptoren) mit Hilfe eines relativ kleinen Bestandes an semantischen Relationen miteinander verknüpft sind. Typischerweise werden hierzu die Relationen der begrifflichen Subordination (SUB), der Synonymie (SYNO), der assoziativen Beziehung (ASSOC) und einige andere verwendet. Ein Thesaurus widerspiegelt die Begriffswelt eines bestimmten Anwendungsgebiets und dient bei der Informationsrecherche zur Unterstützung der Formulierung von Suchanfragen.
Tiefenkasus
ist ein verallgemeinerter gemeinsamer Inhalt, der jeweils verschiedenen grammatischen Kasus in den einzelnen Sprachen mit ausgeprägtem Kasussystem auf semantischer Ebene zugrundeliegt. Der Begriff geht auf den amerikanischen Sprachwissenschaftler Fillmore zurück.
Tiefenrelation
ist eine spezielle semantische Relation zur Repräsentation der kognitiven Rolle, die ein Teilnehmer in einer Handlung spielt. Die mitunter auch gebrauchte Bezeichnung Tiefenkasusrelation ist darauf zurückzuführen, dass diese kognitiven Rollen in vielen Sprachen mit Hilfe des Kasussystems ausgedrückt werden. Beispiel: „Er arbeitet mit dem Hammer.“ – das Instrument der Handlung, ausgedrückt durch den Tiefenkasus INSTR(ument), kann im Deutschen mit Hilfe der Präposition „mit“ und dem Dativ an das Verb angeschlossen werden; im Russischen wird für die Beschreibung des gleichen Zusammenhangs der reine Instrumental (5. Fall) verwendet: On rabotaet molotom.
Tiefenstruktur
ist eine Darstellung der syntaktischen Struktur oder des semantischen Gehalts eines natürlichsprachlichen Konstrukts bei der automatischen Verarbeitung natürlicher Sprache (syntaktische bzw. semantische Tiefenstruktur).
Topikalisierung
ist eine Überführung einer Konstituente, die nicht Subjekt ist, in eine funktional ausgezeichnete Stellung am Satzanfang. Dadurch wird die Konstituente zum Topik bzw. Thema (hängt mit der Gliederung von Sätzen in Topik und Fokus bzw. Thema und Rhema zusammen). Beispiel: Verwendung von „Dem Jungen gab Peter das Geld.“ anstatt der Normalstellung „Peter gab dem Jungen das Geld.“.
transitives Verb
ist ein Verb, bei dem ein Objekt als Valenz angelegt ist, das im Deutschen meist im Akkusativ steht. Beispiel: „lesen“ im Sinn von „Das Mädchen liest ein Buch.“. Vgl. intransitives Verb und ditransitives Verb.
Transitivität
ist eine Eigenschaft einer zweistelligen Relation, wenn gilt ((x R y) UND (y R z)) dann auch (x R z).
Unterbegriff
ist ein Begriff, der spezieller als ein anderer Begriff (Oberbegriff) ist. Beispiel: „Dom“ ist ein Unterbegriff von „Kirche“. Die Beziehung von einem Unterbegriff zu seinem Oberbegriff nennt man auch Subordination. Eine Ansammlung von Subordinationen bildet eine Hierarchie.
Verb
ist ein Tuwort. Im Deutschen unterscheidet man Vollverb („sagen“), Hilfsverb („sein“) und Modalverb („sollen“).
Vererbung
ist (in der künstlichen Intelligenz, Wissensverarbeitung u.a.) die Übertragung von Eigenschaften von einem übergeordneten Begriff (Oberbegriff) auf einen untergeordneten Begriff (Unterbegriff) in einer Hierarchie von Begriffen.
Verschlagwortung
ist die Zuordnung von Schlagwörtern (Schlagwort) zu einem Volltext (z.B. eines Archivs). Man kann diesen Vorgang automatisieren. Vgl. Verstichwortung.
Verstichwortung
ist die Zuweisung von Stichwörtern (Stichwort) zu einem Volltext (z.B. eines Archivs). Dieser Vorgang kann ganz oder teilweise automatisiert werden. Bei Einsatz von tiefem Sprachverstehen kann die automatische Verstichwortung die Qualität einer manuellen Verstichwortung erreichen.
Vollverb
ist ein Verb, das eine eigene lexikalische Bedeutung besitzt und eine Handlung, einen Zustand oder ein Geschehnis beschreibt (wie in den Sätzen „Max singt.“, „Max ist in München.“, „Es regnet.“). Das zweite Beispiel zeigt, dass „sein“ neben seiner Funktion als Hilfsverb auch in einer anderen Bedeutung („wohnen“ oder „sich befinden“) als Vollverb fungieren kann. Vgl. Hilfsverb.
Wissenserwerb
ist ein breites Spektrum von Techniken zum Aufbau von Wissen für Expertensysteme, Sprachverstehenssystemen u.ä., das von psychologischen Methoden des Brainstorming oder Fragebogen-Techniken bis hin zur rechnergestützten Abfrage von Experten mit Hilfe der automatischen Verarbeitung natürlicher Sprache reicht.
Wissensingenieur
ist ein Spezialist, der die Entwicklung wissensbasierter Systeme, insbesondere von Expertensystemen, betreibt. Eine seiner Aufgaben ist die Unterstützung des Wissenserwerbs und der Extraktion von Wissen aus dem Erfahrungsschatz eines menschlichen Experten.
Wortbildung
ist die Bildung neuer Wörter aus bestehenden Wörtern. Die wichtigsten Prozesse der Wortbildung sind Komposition und Derivation.