Glossar Sprachverstehen und semantische Suchmaschinen
Ableitung
ist die Gewinnung von neuen Ausdrücken aus einer Menge
vorgegebener Ausdrücke nach bestimmten formalen Regeln, die sich nur
auf die syntaktische Struktur, nicht aber auf den Inhalt, der Ausdrücke
beziehen.
Adjektiv
ist ein Eigenschaftswort. Im Deutschen können Adjektive attributiv
(bei einem Nomen, Beispiel: „das intelligente System“), prädikativ (mit
einem Kopulaverb, Beispiel: „Die Lösung ist hervorragend.“) oder
adverbiell (mit einem Verb, Beispiel: „Der Computer rechnet schnell.“
gebraucht werden.
Adjunkt
ist ein sprachlicher Ausdruck (A), der einen anderen Ausdruck (B)
attributiv ergänzt, wobei A entweder bezüglich des B
bedeutungseinschränkend wirkt („ein Haus (B) , das unseren Ansprüchen
genügt (A)“) oder eine zusätzliche Qualifikation hinsichtlich B ausdrückt
(„unser (B) schönes (A) Haus (B)“).
Affix
ist ein Präfix (Vorsilbe, „auf-“ in „aufschreiben“) oder Suffix
(Nachsilbe, „-ung“ in „Unterscheidung“).
Aggregation
ist die Zusammenfassung von Einzelelementen zu einer größeren
Einheit.
Allgemeinbegriff
ist ein Begriff, der im Gegensatz zum Individualbegriff
auf eine Gesamtheit von Gegebenheiten (Entitäten) zutrifft. Auch
generischer Begriff genannt.
Anapher
ist ein rückwärts gerichteter Verweis in einem Text (anaphorische
Referenz). Beispiel: „Als Maxi aus der Schule kam, aß eri ein Brötchen.“.
Vgl. Katapher.
Annotation
ist eine Anmerkung zu einem Dokument. Diese kann informell in
natürlicher Sprache verfasst sein (z.B. ein persönlicher Kommentar) oder
stärker formalen Charakter tragen (z.B. Kurzdarstellung des Inhalts in
einem geeigneten Format).
Antezedent
ist die vorausgehende Konstituente, auf die ein referierender
Ausdruck (z.B. ein Pronomen oder ein Artikel) verweist.
Antonym
ist ein Gegenwort. Beispiele: „dunkel“ zu „hell“, „undefiniert“ zu
„definiert“.
Apposition
ist eine attributive Ergänzung eines Nomens durch eine
Substantivgruppe im gleichen Kasus („Karl der Kahle“, „dem Chirurgen,
Herrn Dr. Schneider“, „Kanzlerin Merkel“).
Artefakt
ist ein künstlich geschaffenes Objekt bzw. der mit ihm verbundene
Begriff.
Artikel
ist ein Begleiter. Dieses Funktionswort steht bei einem Substantiv.
Im Deutschen unterscheidet man den bestimmten Artikel („der“) und den
unbestimmten Artikel („ein“).
Assimilation
ist die Integration neu ankommender Informationen in einen
bereits vorhandenen Informationsbestand in einem Frage-Antwort-System
und ähnlichen Systemen. Dabei sind Referenzen aufzulösen, semantische
Äquivalenzen zu entdecken, Doppelspeicherungen von identischen
Begriffen zu vermeiden sowie die richtigen Unterordnungen zu bereits
gespeicherten Oberbegriffen herzustellen.
Assoziativität
ist die Eigenschaft einer zweistelligen Operation R, die wie folgt
charakterisiert wird: ((a R b) R c) = (a R (b R c)). Adjektiv: assoziativ.
Attribut
ist eine Beifügung oder modifizierende Bestimmung zu einem
Satzglied. Adjektiv: attributiv.
attributiver Gebrauch
ist bei Adjektiven die Stellung als Attribut („der
schwere Stein“). Vgl. prädikativer Gebrauch.
bedeutungsorientierte Suchmaschine
ist eine tiefe semantische Suchsoftware. Sie realisiert eine semantischeSuchmaschine, die natürliche Sprache in Dokumenten und Suchanfragen
tief und umfassend analysiert.
boolean
siehe: boolesch.
boolesch
ist die Bezeichnung für einen Typ, der nur zwei Werte annehmen
kann (diese werden meist als T oder F, 1 oder 0, + oder - usw. codiert).
Broker
ist ein Informationsvermittler
in einem System mit verteilten Informations-Ressourcen, der zwischen
Endnutzer und Informationsanbieter (Provider) steht und den Nutzer bei
der Auswahl geeigneter Informationsquellen und bei der Beschaffung der
Informationen unterstützt.
CL
steht für Computerlinguistik.
Computer-Lexikographie
ist ein Zweig der Computerlinguistik, der sich mit
dem Inhalt und mit dem Aufbau von Wörterbüchern befasst, die für die
automatische Sprachverarbeitung eingesetzt werden.
Computerlinguistik
ist ein interdisziplinärer Wissenschaftszweig, der sich
mit der Theorie und Praxis der automatischen Sprachverarbeitung
befasst und der zwischen Informatik und Linguistik angesiedelt ist.
Im weitesten Sinne werden hierzu alle Methoden gezählt, die den
Computer zur Bearbeitung linguistischer Fragestellungen benutzen (z.B.
auch textstatistische Untersuchungen). Im engeren Sinne - diese Sicht wird
in der KI eingenommen - gehören zu diesem Gebiet nur die Methoden, die
sich mit der Automatisierung des Sprachverstehens befassen.
Constraint
ist eine einschränkende Bedingung (Voraussetzung), unter der eine
Operation anwendbar ist oder unter der ein bestimmter Sachverhalt gilt.
Deduktion
ist eine besondere Form der Ableitung in logischen Kalkülen, die
eng mit dem Begriff der Implikation verknüpft ist (formaler Aspekt des
Schließens). Die Deduktion stellt eine Formalisierung des inhaltlichen
Folgerungsbegriffes (Folgerung) dar.
Default-Regel
ist ein Teil eines regelhaftes Wissens, das in Abwesenheit
anderer, spezifischerer Informationen als Standard-Annahme gilt (z.B.
„Alle Menschen können sprechen.“). Dieses Wissen kann bei Vorliegen
genauerer Informationen aufgegeben und durch letztere ersetzt werden.
Default
ist eine eine Standard-Annahme, die empirisch oder pragmatisch
begründet ist und die so lange aufrechterhalten wird, wie sie nicht durch
gegenteilige oder speziellere Informationen aufgehoben wird.
definit
ist ein in der Computerlinguistik insbesondere im Zusammenhang
mit dem Artikelsystem verwendete Eigenschaft: bestimmter Artikel
(„der“, „die“, „das“) und unbestimmter Artikel („ein“). definit und
indefinit bilden ein begriffliches Gegensatzpaar. Es charakterisiert aber
auch unterschiedliche Typen von Referenzen („Max kaufte dieses
Haus“ – bestimmte/definite Referenz; „Max kaufte ein Haus“ –
unbestimmte/indefinite Referenz).
deiktische Form
ist ein sprachlicher Ausdruck, der sich auf die
Dialogsituation (den situativen Kontext) bezieht, in der (dem) sie geäußert
wird. Die deiktischen Formen beziehen sich insbesondere auf räumliche
Aspekte der Dialogsituation („hier“, „dort“ u.a.), auf zeitliche Aspekte
(„gestern“, „im vorigen Jahr“ u.a.) und auf Personen („ich“, „Ihr“ u.a.).
Deklination
ist die Veränderung der Wörter im nominalen Bereich, d.h.
von Nomen, Adjektiven, Artikeln, Pronomen und Zahlwörtern, nach
bestimmten grammatischen Kategorien (im Deutschen nach Genus,
Numerus und Kasus).
Derivation
ist eine Form der Wortbildung, bei der aus einem Wort durch
Kombination mit einem Präfix oder Suffix neue Wörter entstehen.
(In anderen Sprachen gibt es noch weitere Varianten.) Beispiel: aus
„verkaufen“ „verkäuflich“, aus „verkäuflich“ „unverkäuflich“ und aus
„unverkäuflich“ „Unverkäuflichkeit“.
Deskriptor
ist ein Inhaltswort, das zur Charakterisierung von Dokumenten
eingesetzt wird und bei der Informationsrecherche zur Formulierung von
Anfragen und zur Wiederauffindung dieser Dokumente dient.
Deverbativum
ist ein von einem Verb (z.B. „berechnen“) abgeleitetes Nomen
(hier: „Berechnung“). Beide besitzen eine enge Beziehung hinsichtlich ihres
Valenzrahmens.
Dezimalklassifikation
ist ein Klassifikationssystem bei dem die Klassen und
ihre Subklassen mit Hilfe von (durch Punkte getrennten) Dezimalstellen
bezeichnet werden. Jeder Dezimalstelle entspricht eine neue Ebene in
der Klassenhierarchie. Beispiel: K - Künstliche Intelligenz (KI), K.0 -
Grundlagen der KI, K.1 - Programmiersprachen der KI, K.1.1 - LISP,
K.1.2 - PROLOG usw.
Disambiguierung
ist der Vorgang der Auflösung von Mehrdeutigkeiten
beim Verstehen natürlicher Sprachen (sei es durch den Menschen oder
durch CL-Programme). Die Disambiguierung ist eines der schwierigsten
Probleme der automatischen Sprachverarbeitung, da Mehrdeutigkeiten
den natürlichen Sprachen immanent sind. Obwohl zur Auflösung
von Mehrdeutigkeiten in Systemen der Computerlinguistik mitunter
Heuristiken eingesetzt werden, ist für eine vollständige Lösung des
Problems ein tieferes Verstehen der sprachlichen Ausdrücke erforderlich.
Disjunktion
ist eine aussagenlogische Operation, die angenähert das
natürlichsprachliche „oder“ ausdrückt. Eine Disjunktion (A ODER B)
zweier Aussagen A, B ist genau dann wahr, wenn wenigstens eine der
beiden Aussagen A bzw. B wahr ist.
ditransitives Verb
ist ein Verb, bei dem zwei Objekte als Valenzen angelegt
sind, und zwar ein direktes Objekt (im Deutschen meist im Akkusativ)
und ein indirektes Objekt (im Deutschen meist im Dativ). Beispiel: „Das
Kind schenkt der Mutter ein Buch.“.
Entailment
ist eine semantische Implikation, die man meist für Wörter
definiert. Beispiel eines Entailments zum Verb „verkaufen“: „A verkauft
B an C“ impliziert semantisch: „C kauft B von A“. Entailments
können beispielsweise in semantischen Suchmaschinen genutzt werden,
um Paraphrasen zu bilden und diese als alternative Suchanfragen zu
verwenden.
Entität
ist in Philosophie und Sprachwissenschaft die allgemeinste Kategorie
von Begriffen (wörtlich: „Wesenheit“), über die etwas ausgesagt werden
kann.
Extension
ist ein Bedeutungsaspekt, der den Umfang eines Begriffes, seine
Beziehung zur realen Welt oder auch zu einer gedachten (möglichen) Welt
zum Ausdruck bringt (vgl. Intension).
Facettensuche
ist eine Suche, bei der man Facetten des gesuchten Dokuments
einschränken kann. Eine Facette eines Dokuments kann ein Metadatum
sein wie Publikationsjahr oder eine semantische Eigenschaft wie
das explizite oder implizite Vorhandensein einer benannten Entität
(„Westfalen“) oder eines Konzepts (Beispiel: „Uni“).
facettierte Suche
siehe: Facettensuche
Faktizität
ist ein Merkmal eines Sachverhalts, das aussagt, ob dieser
Sachverhalt prinzipiell einen Wahrheitswert hat oder nicht, oder ob er
nur hypothetisch gesetzt ist. Dieses Merkmal lässt sich auch auf Objekte
bzw. deren Existenz übertragen: ein hypothetisches Objekt ist demnach
ein Objekt, über dessen Existenz bzw. Nicht-Existenz (zumindest in einem
bestimmten Stadium der Erkenntnis) noch keine endgültige Entscheidung
getroffen werden kann (Beispiel: „Quarks“).
fakultative Valenz
ist eine von einem Wort (insbesondere einem Verb, einem
Adjektiv oder einem Nomen) semantisch geforderte Ergänzung, die aber
in der Oberflächenstruktur eines Satzes, der das Wort enthält, sprachlich
nicht unbedingt realisiert sein muss, damit der Satz grammatisch korrekt
gebildet ist. Beispiele: „Max malt ein Bild.“, aber auch: „Max malt.“;
„der dem Freund treue Max“, aber auch „der treue Max“; „Der Glaube
an die Zukunft gibt Kraft.“, aber auch: „Der Glaube gibt Kraft.“.
Vgl. obligatorische Valenz.
Featurestruktur
siehe: Merkmalstruktur
Filler
ist eine Komponente eines Frame. Datentechnische Darstellung des
Wertes eines Merkmals in einer Frame-Repräsentation.
finite Verbform
ist eine konjugierte Verbform, die durch die grammatischen
Kategorien Person, Numerus, Tempus und Modus charakterisiert ist (in
einigen Sprachen auch durch den Aspekt).
Flexion
ist eine Formveränderung der Wörter in bestimmten Sprachen (den
sogenannten flektierenden Sprachen),
die dazu dient, besondere grammatische Merkmale auszudrücken (s. auch
Deklination, Konjugation, Komparation).
Folgerung
ist der semantische Aspekt des Schließens eines Ausdrucks B aus
einem Ausdruck A, der beinhaltet, dass immer dann, wenn A in einem
bestimmten Modellbereich gilt, auch B im gleichen Modellbereich gilt.
Frage-Antwort-System
ist ein
KI-System, das Sprachverstehen im umfassendsten Sinne modelliert und
sowohl die Eingabe von Informationsbeständen als auch die Abfrage der
Wissensbasis in natürlicher Sprache vorsieht.
Frame
ist ein Schema zur Wissensrepräsentation, das eine bestimmte Entität
(ein Objekt, einen Sachverhalt, ein Ereignis) oder eine Klasse von
Entitäten innerhalb einer Hierarchie solcher Schemata mit Hilfe von
Merkmals-Wert-Paaren beschreibt. Es ist ein Beschreibungsmuster, das
in stereotyper Weise in den verschiedensten Situationen wiederkehrt.
Die Merkmale eines Frames, auch Slots genannt, haben den Charakter
von Variablen, die je nach zu beschreibender Entität durch spezifische
Merkmalswerte, durch sogenannte Filler, zu belegen sind.
Funktionsverb
ist ein inhaltsarmes Verb, das nur zusammen mit einem seiner
Komplemente eine volle Semantik besitzt. Beispiel: „stellen“ in „einen
Antrag stellen“, „machen“ in „einen Vorschlag machen“. Funktionsverben
blähen einen Satz unnötig auf (Behördensprache, Kanzleideutsch), falls
man die Kombination aus Funktionsverb und Komplement durch ein
aussagekräftiges Verb ersetzen kann (oben wären dies „beantragen“ und
„vorschlagen“).
Funktionsverbgefüge
ist eine Kombination aus einem Funktionsverb und
einem inhaltstragenden Komplement. Beispiel: „einen Vorwurf machen“
(statt „vorwerfen“).
Funktionswort
ist ein Wort, das keine Semantik besitzt, wenn es
allein vorkommt. Zu Funktionswörtern gehören beispielsweise Artikel,
Konjunktionen und Präpositionen. Funktionswörter werden in
traditionellen Suchmaschinen oft als Stoppwort behandelt und
von der Indexierung und Suche ausgeschlossen. Für semantischeSuchmaschinen sind Funktionswörter jedoch sehr wichtig, um die
Semantik größerer Einheiten (wie Sätze und Texte) zu bestimmen. Ein
Wort, das kein Funktionswort ist, ist ein Inhaltswort.
gebrauchstheoretische Semantik
ist eine (auf den österreichisch-britischen
Philosophen Wittgenstein, 1889–1951 zurückgehende) Definition der
Bedeutung von Wörtern durch operationale Fragestellungen. Danach
drückt sich deren Bedeutung durch ihren Gebrauch in der Sprache aus und
nicht durch den Bezug zu einer wie auch immer gearteten Wirklichkeit.
generischer Begriff
bedeutet Allgemeinbegriff.
generisch
bedeutet allgemeingültig oder eine Klasse von Entitäten betreffend
(Gegensatz: speziell).
Genitiv
ist der zweite Kasus in vielen Sprachen. Beispiel: „des Hauses“.
Genus verbi
ist eine Aktionsform des Verbs, mit der bestimmte Sichten auf
eine Handlung ausgedrückt werden, nämlich ob sie aktiv ausgeführt wird
(Aktiv) oder passiv erduldet wird (Passiv).
Genus
ist die Kategorie des Geschlechts, die für Wörter im nominalen Bereich
zutrifft, wobei in manchen Sprachen (wie dem Deutschen) zwischen
grammatischem Geschlecht (Femininum, Maskulinum, Neutrum) und
natürlichem Geschlecht unterschieden wird (z.B. ist „das Mädchen“
grammatisch Neutrum, hat aber das natürliche Geschlecht weiblich, d.h.
Referenz mit „es“ und „sie“ sind möglich).
Grammatik
ist die Darstellung der Gesetzmäßigkeiten einer Sprache durch ein
System regelhafter Zusammenhänge, das insbesondere die Kombination
lexikalischer Elemente zu wohlgeformten sprachlichen Konstrukten
erklärt. Letztere nennt man dann auch grammatisch, und die dem
Regelwerk widersprechenden Konstrukte ungrammatisch.
grammatisch
bezeichnet die Übereinstimmung mit einer Grammatik. Zur
Grammatik gehörend.
Graphemik
ist die Lehre von der Schriftform der Sprache (der graphischen
Form).
graphemisch
bedeutet sich auf die Graphemik bzw. auf die geschriebene
Sprache beziehend.
Heuristik
ist eine empirisch gestützte und stark auf Intuition beruhende
Methode (wörtliche Übersetzung etwa: intelligente Findehilfe), die es
gestattet, in einem komplexen Problemlösungsprozess auf effektive
Weise eine Lösung zu finden, wobei aber Lösungsmöglichkeiten durch
Eingrenzung des Suchraums (Beschneiden des Suchbaums) verloren gehen
können. Das kann im Extremfall dazu führen, dass bei Einsatz einer
Heuristik überhaupt keine Lösung gefunden wird. Als Adjektiv wird
heuristisch auch in folgendem Sinne verwendet: nicht sicher, nur mit einer
gewissen Wahrscheinlichkeit zum Ziel führend.
Hierarchie
ist eine Menge von Elementen mit einer eindeutigen
Überordnungsrelation, d.h. jedem Element der Struktur mit Ausnahme des
Spitzenelements (Top-Element) ist genau ein Element übergeordnet. Die
adäquate Darstellung einer Hierarchie in graphischer Form ist ein Baum,
wobei dem Top-Element die Wurzel des Baumes entspricht.
Hilfsverb
ist ein Verb (wie „sein“ und „haben“), das keine eigene lexikalische
Bedeutung besitzt, sondern zur Bildung der Zeiten, des Passivs und
als Kopula zur Bildung von prädikativen Ausdrücken dient (wie in
den Sätzen „Er hat gearbeitet.“, „Er wurde geheilt.“, „Er ist reich.“).
Vgl. Vollverb.
Idiom
ist eine feste Formulierung (Redewendung), die eine unregelhafte
Bedeutung hat. Beispiel: „Der Politiker wirft das Handtuch.“ im Sinne
einer Aufgabe.
Implikation
ist (im Zusammenhang mit der natürlichen Sprache und im
intuitiven Sinne) die Bezeichnung für die inhaltliche Folgerung (A ⇒ B),
die dann gilt, wenn ein Sprecher, der die Aussage A behauptet, nicht umhin
kann, auch B als gültig anzuerkennen. Im Rahmen der Aussagen- bzw.
Prädikatenlogik (auch als materiale Implikation bezeichnet) bezeichnet
sie den wahrheitsfunktionalen Zusammenhang (A → B) zwischen zwei
Aussagen A und B, der genau dann falsch ist, wenn A den Wahrheitswert
T (wahr) und B den Wahrheitswert F (falsch) hat, in allen übrigen Fällen
ist diese Implikation wahr.
Indefinitpronomen
ist ein Pronomen, das Unbestimmtheit oder sogar
Unkenntnis ausdrückt („irgendwer“, „jemand“, „kein“, „man“ u.a.).
indefinit
bildet ein Begriffspaar mit definit.
Individualbegriff
ist ein Begriff, dessen Begriffsumfang (Extension) sich auf
ein einziges Individuum eines Gegenstandsbereichs bezieht. Gegensatz:
Allgemeinbegriff.
Inferenzmethode
ist eine Methode zur Automatisierung des vernünftigen
Schließens in der KI.
Inferenz
ist ein Einzelschritt in einem Verfahren des intelligenten Schließens
oder Schlussfolgerns, wie z.B. deduktives oder induktives Schließen. Der
Begriff Inferenz ist vom Englischen to infer (schließen/schlussfolgern)
abgeleitet..
infinite Verbform
ist das Gegenstück zu einer finiten Verbform. Zu den
infiniten Verbformen gehören die Partizipien und der Infinitiv.
Inhaltswort
ist ein Wort, das eine aussagekräftige Semantik trägt, auch
wenn es allein betrachtet wird. Zu den Inhaltswörtern gehören Nomen,
Adjektive und Verben. Vgl. Funktionswort.
Intension
ist ein Bedeutungsaspekt, der den Inhalt eines Begriffs, seine
Beziehung zu anderen Begriffen zum Ausdruck bringt (vgl. Extension).
intransitives Verb
ist ein Verb, nach dem kein Objekt stehen darf („regnen“,
„explodieren“ u.a.). Vgl. transitives Verb und ditransitives Verb.
Junktor
ist ein logischer Operator, der zwei Ausdrücke wahrheitsfunktionell
miteinander verknüpft. Dazu wird auch der Negator als einstelliger
logischer Operator gezählt.
Kardinalität
ist die Mächtigkeit einer Menge, die bei endlichen Mengen mit
der Anzahl der Elemente übereinstimmt (auch Kardinalzahl genannt).
Kasus
ist eine grammatische Kategorie der Konstituenten
einer Nominalphrase (insbesondere von Nomen, Artikel, Adjektiv und
Pronomen), die eine bestimmte syntaktische Beziehung ausdrückt. Der
Kasus kann entweder als reiner Kasus nur durch Flexionsformen oder als
Präpositionalkasus ausgedrückt werden.
Katapher
ist ein vorwärts gerichteter Verweis in einem Text; kataphorische
Referenz. Beispiel: „Als eri aus der Schule kam, aß Maxi ein Brötchen.“
Vgl. Anapher.
KI
steht für künstliche Intelligenz.
Knowledge acquisition
ist der Wissenserwerb.
Knowledge engineer
ist ein Wissensingenieur.
Knowledge enterer
ist ein Spezialist, der die Eingabe von Wissen in große
Wissensbasen (oft mit Hilfe besonderer Tools) vornimmt.
Kognition
bezeichnet das Denken und die Erkenntnis (im Gegensatz zur
Perzeption oder Wahrnehmung).
Kognitionswissenschaft
ist eine wissenschaftliche Disziplin, die Kategorien
wie Denken, Wissen, Erkennen u.a. bei Menschen, Tieren und Maschinen
unter einheitlichen methodischen Gesichtspunkten untersucht.
kognitiv
ist ein Adjektiv zu Kognition.
kognitive Adäquatheit
bedeutet die Entsprechung mit Grundprinzipien,
welche die Kognitionswissenschaft für die Denkvorgänge postuliert.
kognitive Psychologie
ist ein Zweig der Psychologie, der sich mit den
menschlichen Denkleistungen befasst.
Kohärenz
ist der innere Zusammenhang eines Textes.
Koindizierung
ist ein technisches
Mittel, um die Referenzidentität verschiedener Ausdrücke in einem Text
durch Indizierung auszudrücken. Referenzidentische Ausdrücke erhalten
dabei denselben Index. Beispiel: „Maxi wäscht sichi.“ Vgl. Koreferenz.
Kollektivum
ist ein Wort, das in singularischer Form eine Gesamtheit von
einzelnen Entitäten bezeichnet, und diese als Einheit zusammenfasst (z.B.
„Gebirge“ – Gesamtheit von Bergen, „Mannschaft“ – Gesamtheit von
Sportlern).
Kommunikationstheorie
ist eine wissenschaftliche Disziplin, die sich mit den
Grundlagen der Verständigung bzw. des Informationsaustauschs mit Hilfe
von Zeichensystemen befasst.
Kommutativität
ist eine Eigenschaft einer zweistelligen Operation, die wie
folgt charakterisiert ist: (a R b) = (b R a). Adjektiv: kommutativ.
Komparation
ist eine morphologische Veränderung bestimmter Adjektive und
Adverbien nach den Steigerungsstufen Positiv („stark“), Komparativ
(„stärker“) und Superlativ („am stärksten“).
Komplement
ist eine Konstituente als Ergänzung einer Valenz, die von einer
anderen Konstituente ausgeht. Mitunter werden die Komplemente auch
als Argumente bezeichnet.
Komposition
ist ein Prozess der Wortbildung, der aus mehreren Wörtern
ein Wort (das Kompositum) bildet. Im Deutschen ist Komposition weit
verbreitet und daher für Sprachverstehen und Suchmaschinen sehr wichtig.
Kompositum
ist ein zusammengesetztes Wort. Im Deutschen sind Komposita
meist Nomen oder Adjektive. Beispiele: „Handelsstreit“ und „laufstark“.
Für das Sprachverstehen bestehen die Aufgaben darin, die Teile des
Kompositums zu erkennen, die richtige Lesart der Teile auszuwählen und
die semantische Beziehung zwischen den Teilen zu bestimmen. Beispiel:
„Staubecken“.
Konjugation
ist die Veränderung der Verbform nach den grammatischen
Kategorien (im Deutschen: Person, Numerus, Tempus, Modus und Genus
verbi).
Konjunktion
ist eine aussagenlogische Operation, die angenähert das
natürlichsprachliche „und“ ausdrückt. Eine Konjunktion zweier Aussagen
A, B ist genau dann wahr, wenn sowohl A als auch B wahr sind.
Konklusion
ist das Hinterglied (rechter Teil) einer Implikation oder einer
Folgerungsbeziehung. Auch die Schlussfolgerung. Vgl. Prämisse.
Konnotation
ist eine mit einem Begriff assoziierte Nebenbedeutung, die der
Grundbedeutung eine zusätzliche Wertung gibt.
Konsistenz
ist die Widerspruchsfreiheit einer Wissensbasis, die in
wissensbasierten Systemen vor allem nach der Eingabe neuen Wissens und
nach der Regel-Ausführung überprüft bzw. gesichert werden muss. Diese
Prüfung wird von einem sogenannten Konsistenz-Checker durchgeführt.
Konstituentennegation
ist eine Negation, die nur einen Teil eines Satzes (nur
eine Konstituente) betrifft. Beispiel: „Max hat nicht den Hirsch getroffen,
sondern das Wildschwein.“. Vgl. Satznegation.
Konstituente
ist eine relativ geschlossene Einheit eines Satzes oder Textes, die
aus ein oder mehreren Wörtern besteht und einen inneren Zusammenhang
aufweist. Sie kann durch Weglasstest, Umstellungstest und Ersetzungstest
ermittelt werden.
Konzept
bedeutet Begriff.
Kopula
ist die Verbindung von Subjekt und Prädikativum (Prädikatsnomen
oder Prädikatsadjektiv). Beispiele: „Das Haus ist ein Schandfleck.“ und
„Das Haus ist beeindruckend.“ Die Kopula wird auch Satzband genannt.
Kopulaverb
ist ein Verb, das eine Kopula bilden kann. Im Deutschen sind
dies besonders „sein“ und „werden“. Beispiel: „Der Algorithmus ist eine
Revolution.“
koreferent
ist ein Adjektiv zu Koreferenz.
Koreferenz
ist die Beziehung zwischen zwei sprachlichen Ausdrücken, die
identische Referenz haben und damit sich auf dasselbe Objekt beziehen.
Auch Fälle, bei denen die bezeichneten Objekte nicht identisch, sondern
nur verbunden sind, werden als Koreferenz bezeichnet. Beispielsweise liegt
folgender Koreferenz eine Teil-Ganzes-Beziehung zugrunde: „(Das Auto)i
blieb liegen, da (der Motor)i defekt war.“
künstliche Intelligenz
ist eine wissenschaftliche Disziplin und
eine Eigenschaft. Unter künstlicher Intelligenz in der ersten Bedeutung
(abgekürzt: KI) versteht man ein Arbeitsgebiet, dessen Gegenstand es ist,
Leistungen mit Hilfe technischer Systeme oder Rechnern zu realisieren,
die folgende Bedingungen erfüllen. Ihre Hervorbringung verlangt nach
allgemeinem Verständnis menschliche Intelligenz und für ihre Realisierung
liegen keine speziell angepassten Algorithmen vor. Künstliche Intelligenz
in der zweiten Bedeutung bezeichnet die Eigenschaft technischer Geräte
(insbesondere eines Rechners), die gleiche oder wenigstens in bestimmten
Aspekten angenäherte Intelligenz zu besitzen wie ein Mensch.
Lesart
ist eine Bedeutungsvariante eines mehrdeutigen Worts oder einer
mehrdeutigen Wortgruppe. Beispiele: „Pferd“, Lesart 1: Tier, Lesart
2: Turngerät; „kalter Kaffee“, Lesart 1: kaltes Getränk (wörtliche
Bedeutung), Lesart 2 : veraltete Mitteilung (übertragene Bedeutung).
Matrixsatz
ist ein Hauptsatz, in den ein anderer, untergeordneter Satz
eingebettet ist.
Merkmalstruktur
ist ein Merkmals-Wert-Schema, das grammatischen
Merkmalen (wie Genus und Numerus) bestimmte Werte (z.B. Femininum
bzw. Plural) zuordnet und als Argument-Wert-Zuordnungstabelle einer
Funktion mit endlichem Definitionsbereich und Wertebereich aufgefasst
werden kann.
Metapher
ist ein bildlicher Ausdruck, der durch Bezeichnungsübertragung
zwischen zwei Begriffen mit gemeinsamen Bedeutungskomponenten
zustande kommt (Beispiel: „Haupt“ als oberster Körperteil, „das Haupt
der Familie“). Im Gegensatz zur Metonymie ist die Metapher gerade
dadurch charakterisiert, dass sich die Bedeutungen der beiden Begriffe
überschneiden (in dem Beispiel in der gemeinsamen Komponente: oberster
bzw. beherrschender Teil sein).
metaphorisch
bedeutet zu einer Metapher gehörend.
Metonymie
ist die Ersetzung eines Ausdrucks durch einen anderen Ausdruck,
der zu ersterem in einem äußeren (räumlichen, zeitlichen oder kausalen)
Bezug steht, wobei aber die Bedeutungskomponenten der Ausdrücke
verschieden sind. Beispiel: „Nach Potsdam bekam Europa ein anderes
politisches Gesicht.“ – Potsdam als Stadt wird für die Potsdamer
Konferenz gesetzt. Analog: „Das weiße Haus“ für die Regierung der USA.
Modalität
ist eine Stellungnahme desjenigen, der eine Aussage formuliert, zur
Gültigkeit der Aussage. Auch die Formalisierung dieses Konzepts in der
Logik.
Modalverb
ist ein Verb, dass die Modalität einer Situation angibt. Zum
Beispiel kann das Modalverb „müssen“ eine Notwendigkeit ausdrücken.
Weitere Beispiele: „dürfen“, „können“, „sollen“. Das Zusammenspiel von
Modalverben mit der Negation ist zwischen Sprachen teilweise anders.
Bekanntes Beispiel für Deutsch und Englisch: „must not“ („nicht dürfen“),
„need not“ („nicht müssen“).
Modell
ist ein Begriff, der in der Logik und in den Naturwissenschaften in
unterschiedlicher Weise gebraucht wird. In der Physik nennt man den
Übergang von einem realen Gegenstandsbereich (z.B. der Welt der Atome)
zu einer mathematischen Beschreibung durch eine Formel (in diesem
Fall ist das die Schrödinger-Gleichung) mathematische Modellierung. Das
ist ein Schritt der Abstraktion. In der Logik bedeutet Festlegung eines
Modells für eine Ausdrucksmenge einen Schritt der Konkretisierung,
d.h. einen Übergang von einem formalen Bereich in einen semantischen
Gegenstandsbereich. Daran ändert auch die Tatsache nichts, dass der
Gegenstandsbereich selbst durch formale mathematische Gebilde, wie z.B.
algebraische Strukturen, gegeben sein kann.
Modus
ist eine grammatische Kategorie des Verbs, die die Einstellung des
Sprechers zu der vom Verb getragenen Aussage charakterisiert (neutrale
Aussage, Befehl, Irrealität des Sachverhalts).
MultiNet
ist ein Formalismus zur Bedeutungsrepräsentation, der zu den
erweiterten semantischen Netzen gehört. Die Knoten des Netzes werden
bezüglich Sorte und sogenannter Layer-Merkmale beschrieben. Das
Inventar an Kantenbeschriftungen (Rollen) ist vordefiniert und umfasst
circa 130 Relationen.
naiver Nutzer
ist ein Anwender eines technischen Systems, der keine spezielle
Vorbildung bezüglich der Bedienung oder Funktionsweise dieses Systems
erhalten hat oder diese auch gar nicht erwerben will. Systeme, die für
naive Nutzer (das können durchaus Spezialisten auf ihrem Gebiet sein)
entwickelt werden, benötigen eine ergonomisch besonders gut durchdachte
Nutzeroberfläche und geeignete Kommunikationsmöglichkeiten zwischen
Mensch und Maschine (z.B. ein natürlichsprachliches Interface).
natural language interface
siehe: natürlichsprachliche Schnittstelle.
natürlichsprachliche Schnittstelle
ist eine Nutzerschnittstelle zu einem
Softwareprodukt oder System, das eine Kommunikation des Nutzers mit
diesem System in natürlicher Sprache ermöglicht.
NLI
bezeichnet eine natürlichsprachliche Schnittstelle (Englisch: natural
language interface).
Nomen
ist ein Namenwort oder Substantiv. Beispiel: „Haus“ oder
„Informatik“.
nominal
bedeutet zum Nomen gehörig.
Nominalphrase
ist eine Substantivgruppe. Eine Nominalphrase besteht
im Kern aus einem Nomen. Hinzukommen modifizierende Wörtern (wie
vorangehende Adjektive und Artikel, „das schnelle, rote Auto“) und
Ergänzungen als nachfolgende Präpositionalphrase oder Nominalphrase
im Genitiv („das Auto des teuren Herstellers“ oder „das Auto aus
Deutschland“).
Nominalisierung
ist eine Art der Wortbildung, bei der aus einem Wort, das
kein Nomen ist, ein Nomen gemacht wird. Beispiel: „Beantragung“ (aus
dem Verb „beantragen“), „Anfälligkeit“ (aus dem Adjektiv „anfällig“).
Nullartikel
ist eine Artikelform ohne sprachlichen Ausdruck, der in Grammatiken
der Computerlinguistik eingesetzt wird, um Nominalphrasen einheitlich
behandeln zu können („Kinder“, „die Kinder“). Unter Einbeziehung dieses
Konstrukts beginnt im Deutschen jede Nominalphrase mit einem Artikel.
Numerus
ist eine grammatische Kategorie der Zahl. Im Deutschen und
vielen anderen Sprachen wird unterschieden nach Einzahl (Singular) und
Mehrzahl (Plural). Die Kategorie ist charakteristisch für die Wörter der
Nominalphrase und für Verben.
Oberbegriff
siehe: Unterbegriff.
Oberflächenstruktur
ist eine Darstellungsform eines Satzes oder Textes, so
wie er dem Hörer oder Leser dargeboten wird.
Objektsatz
ist ein Satz, der die syntaktische Funktion eines grammatischen
Objekts einnimmt. Beispiel: „Er sah den Sonnenuntergang.“ (normales
Objekt), „Er sah, dass die Sonne unterging.“ (Objektsatz).
obligatorische Valenz
ist eine von einem Wort (insbesondere Verb,
Adjektiv oder Nomen) geforderte Ergänzung, die unbedingt in der
Oberflächenstruktur eines Satzes, der das Wort enthält, sprachlich
realisiert sein muss, damit der Satz grammatisch korrekt gebildet ist.
Obligatorische Valenz ist bei Adjektiven und Nomen wesentlich seltener
anzutreffen als bei Verben. Beispiele: „Max wohnt in Bonn.“, nicht: (*)
„Max wohnt.“, „Max war dem Freund behilflich.“. Vgl. fakultativeValenz.
Ontologie
ist eine Teildisziplin der Philosophie, die sich mit der Struktur
der Wirklichkeit und ihrer Abhängigkeit bzw. Unabhängigkeit vom
erkennenden Subjekt befasst. Wesentlicher Gegenstand der Ontologie
ist die klassifizierende Ordnung des Seins nach bestimmten Merkmalen,
weshalb eine solche systematische Ordnung von Begriffen, die eine
strukturelle Gliederung der Realität widerspiegelt, selbst eine Ontologie
genannt wird.
Parser
ist ein Programm, das die Aufgabe des Parsing erledigt. Obwohl seit
über 50 Jahren an Parsern geforscht wird, erreichen diese Programme noch
keine vollständige und korrekte Abdeckung der natürlichen Sprachen.
Parsing
ist der Prozess der Analyse eines natürlichsprachlichen Konstrukts
(eines Satzes, eines Textes usw.), der sich auf eine vorgegebene Grammatik
stützt. Dabei wird festgestellt, ob dieses Konstrukt in dem von der
Grammatik beschriebenen Sprachausschnitt liegt oder nicht. Im ersteren
Fall wird im Ergebnis des Parsing zusätzlich eine (vom verwendeten
Grammatiktyp bestimmte grammatische Struktur) des zu analysierenden
Konstrukts abgeleitet.
Person
ist eine grammatische Kategorie des Verbs und der Personalpronomen
mit drei Werten. 1. Person – Sprecher bzw. Gruppe, die Sprecher
einschließt. 2. Person – der Angesprochene bzw. die Gruppe, die diesen
einschließt. 3. Person – Jemand oder etwas, über den bzw. über das
gesprochen wird.
Phonetik
ist die Lehre von den Lauten einer Sprache. Lautlehre.
phonetisch
bedeutet sich auf die Lautgestalt der Sprache bzw. auf die
Phonetik beziehend.
Polyhierarchie
ist die Überlagerung mehrerer einfacher Hierarchien.
Während eine einfache Hierarchie durch einen Baum mit genau einer
Wurzel dargestellt werden kann, entspricht einer Polyhierarchie ein Graph
mit mehreren Wurzeln (die Überlagerung mehrerer Bäume).
Prädikat
ist der Teil einer Aussage, der von einem Subjekt behauptet wird.
Prädikation
ist das Formulieren einer Aussage über eine Entität (z.B.
Zuerkennung oder Aberkennung von Eigenschaften, Beteiligtsein an
Ereignissen usw.). Verb: prädizieren.
prädikativer Gebrauch
ist bei Adjektiven die Stellung als Teil des Prädikats
(„der Stein ist schwer“). Vgl. attributiver Gebrauch.
Präfix
ist eine Nachsilbe wie „nach-“ in „nachschicken“. Vgl. Suffix.
Prämisse
ist das Vorderglied (linker Teil) einer Implikation oder
Folgerungsbeziehung. Auch: die Voraussetzung. Vgl. Konklusion.
Präpositionalkasus
ist eine Kasusform, die mit Hilfe einer Präposition
ausgedrückt wird (wie z.B. de für Genitiv im Französischen oder o für
Präpositiv im Russischen usw.).
Proadverb
ist ein Wort,
das syntaktisch die Stellung von Adverbialbestimmungen einnimmt und
sich semantisch wie ein Pronomen verhält (z.B. steht „dort“ im Satz als
Stellvertreter für eine Adverbialbestimmung des Ortes mit gleichzeitiger
Referenzwirkung auf eine bestimmte Lokation).
Referent
ist ein Objekt oder Sachverhalt der Realität, auf den sich ein
sprachlicher Ausdruck bezieht. Davon abgeleitet werden auch sprachliche
Ausdrücke oder formale Konstrukte, auf die sich andere Ausdrücke
beziehen, als Referenten bezeichnet.
Referenz
ist die Beziehung zwischen einem sprachlichen Ausdruck und einem
Objekt oder Sachverhalt der Realität. Beispielsweise bezieht sich der
Ausdruck „Palermo“ (meist) auf eine Stadt in Sizilien.
reflexives Verb
ist ein Verb, das (im Deutschen) ein Reflexivpronomen nach
sich zieht. Man unterscheidet zwei Gruppen: a) die echt reflexiven
Verben (auch formal-reflexiv genannt): diese Verben verlangen ein
Reflexivpronomen, das nicht durch eine andere Nominalphrase ersetzt
werden darf („Ich verbitte mir die Störung.“ – nicht aber: (*)
„Ich verbitte dem Freund die Störung.“). Diese Verben können im
allgemeinen nicht reziprok verwendet werden: (*) „Wir verbitten uns
(im Sinne von gegenseitig) die Störung“. b) die unecht reflexiven
Verben (auch semantisch-reflexiv genannt): bei diesen Verben kann
das Reflexivpronomen durch eine andere Nominalphrase ersetzt werden
(„Das Kind betrachtet sich.“ – „Das Kind betrachtet den Schmuck.“.
Diese Verben dürfen i.a. auch reziprok verwendet werden: „Die Kinder
betrachten sich (gegenseitig).“.
Reflexivpronomen
ist ein Pronomen, das sich auf das Subjekt des gleichen
Satzes bezieht. Dabei unterscheidet man echte Reflexivpronomen, die
nicht durch eine andere Nominalphrase ersetzt werden dürfen („Er freut
sich.“), und unechte Reflexivpronomen, bei denen das möglich ist („Er
wäscht sich.“ – „Er wäscht das Gesicht.“). Genaugenommen liegt dieser
Unterscheidung eine Eigenschaft des Verbs (und nicht des Pronomens)
zugrunde (s. reflexives Verb).
Rektion
ist eine Form der Unterordnung einer Konstituente, bei der
die Kasusform des untergeordneten Worts durch das syntaktisch
übergeordnete (regierende) Wort bestimmt wird. Beispiel: der Kasus in
einer Präpositionalphrase hängt im Deutschen von der Präposition ab:
„mit Männern“ vs. „gegen Männer“.
Rolle
ist eine semantische Einstufung von Mitspielern in einem Sachverhalt.
Das Inventar an Rollen hängt vom semantischen Formalismus ab. Typische
semantische Rollen sind Agent oder Handelnder (AGT) und unbeteiligtes
Objekt (OBJ).
Rubrikator
ist eine Stelle in einem Ordnungssystem bzw. ein Bezeichner
für eine Klasse in einem Klassifikationssystem. Beispiele: K.1.2 -
PROLOG ; K.12.3 - Expertensysteme in einer Dezimalklassifikation
zur Beschreibung von KI-Gebieten.
Sachverhalt
ist eine komplexe situative Gegebenheit (in einem
verallgemeinerten Sinn), der entweder eine reale Entsprechung zukommen
kann (Fakt, realer Sachverhalt) oder die nur hypothetisch gedacht sind
(hypothetischer Sachverhalt oder Pseudosachverhalt).
Satznegation
ist eine Negation, die sich auf den ganzen Satz bezieht („Max
hat nichts getroffen.“). Vgl. Konstituentennegation.
Schlagwort
ist ein Wort (oder manchmal auch eine Wortgruppe), das der
Erschließung eines Volltextes in einem Archiv dient. Ein Schlagwort wird
aus dem Volltext entnommen oder daraus abgeleitet. Im Gegensatz zu
einem Stichwort wird es mit einer vordefinierten Liste von erlaubten
Kandidaten (Schlagwort-Katalog) abgeglichen.
Selektion
ist die Auswahl von Wörtern oder Phrasen mit einer bestimmten
paradigmatischen Charakterisierung für deren syntaktische Einbindung in
einen sprachlichen Ausdruck.
Selektionsbeschränkung
ist eine Bedingung, die festlegt, welche Wörter mit
welchen anderen Wörtern in einem sprachliche Ausdruck (z.B. in einem
Satz) kombiniert werden dürfen.
Semantik
ist der Zweig der Zeichenlehre (Semiotik), der sich mit dem Inhalt
von symbolischen Ausdrücken befasst. Gleichzeitig Bezeichnung für die
Bedeutung natürlichsprachlicher Ausdrücke.
semantische Suchmaschine
ist eine besondere Suchmaschine, die (im Gegensatz zu traditionellen
Suchmaschinen) die Semantik von Suchanfrage und die Semantik der
durchsuchten Texte auswertet. Eine semantische Suchmaschine kann
falsche Treffer vermeiden und zusätzliche richtige Treffer finden. Dies
gilt besonders für tiefe semantische Suchmaschinen. Google und andere
Websuchmaschinen sind keine tiefen semantischen Suchmaschinen, auch
wenn sie im sogenannten Wissensgraph und anderen Bereichen semantisch
aufbereitete Informationen verwenden.
semantisches Netz
ist eine Repräsentation der Bedeutung von (meist
natürlichsprachlich gegebenen) Informationen in Form eines markierten,
orientierten Graphen. Dabei entsprechen den Knoten des Graphen
Begriffe der natürlichen Sprache; den Kanten des Graphen entsprechen
Beziehungen zwischen diesen Begriffen.
situativer Kontext
ist der außersprachliche Wissenshintergrund für eine
sprachliche Äußerung. Er beschreibt die Konstellation von Sachen und
Personen (einschließlich Sprecher und Hörer), in die die Äußerung
eingebettet ist, sowie deren Einordnung in Raum und Zeit. Der situative
Kontext ist ganz wesentlich für die aktuelle Bedeutung einer sprachlichen
Äußerung. Ohne Kenntnis des situativen Kontexts ist die Wahrheit von
Äußerungen wie „Hier ist es aber kalt.“ oder „Dieses Auto taugt nichts.“
nicht entscheidbar.
Slot
ist ein Bestandteil eines Frame, der ein Merkmal des durch den
Frame repräsentierten Begriffs beschreibt. Ein Slot wird technisch als
auszufüllende Leerstelle betrachtet. Er wird durch einen Namen und
Bedingungen charakterisiert, die angeben, welche Elemente als Filler für
den Slot in Frage kommen.
Stichwort
ist ein Wort (oder manchmal auch eine Wortgruppe), das der
Erschließung eines Volltextes in einem Archiv dient. Ein Stichwort
wird aus dem Volltext entnommen und wird im Gegensatz zu einem
Schlagwort nicht mit einer vordefinierten Liste von erlaubten Kandidaten
abgeglichen.
Stoppwort
ist ein Wort, das traditionelle Suchmaschinen von Indexierung und
Suche ausschließen, weil diese Wörter sehr häufig sind und nur im Kontext
verstanden werden können. Beispiele: „für“ und „dieser“. Meistens werden
Funktionswörter (Funktionswort) als Stoppwörter genommen.
Substantiv
ist ein Nomen oder Namenwort.
Substantivgruppe
ist eine Nominalphrase
Suffix
ist eine Nachsilbe wie „bar“ in „unterscheidbar“. Vgl. Präfix.
Synonym
ist ein Wort (oder eine Phrase), das mit einem anderen Wort (oder
einer anderen Phrase) weitestgehend übereinstimmende oder sehr ähnliche
Bedeutung hat. Beispiele: „Rechner“ und „Computer“; „Junggeselle“,
„unverheirateter erwachsener Mann“. Streng genommen gibt es kaum
Wörter, die vollständig synonym sind.
Syntax
ist ein Zweig der Zeichenlehre (Semiotik), der sich mit dem formalen
Aufbau von symbolischen Ausdrücken befasst. Gleichzeitig Bezeichnung
für die strukturellen Beziehungen der Wörter eines natürlichsprachlichen
Konstrukts zueinander.
Tempus
ist eine Zeitform des Verbs, die eine Einordnung des gesamten vom
Verb getragenen Sachverhalts in einen größeren zeitlichen Ablauf zum
Ausdruck bringt.
Textkohärenz
ist ein Merkmal eines Textes, nach dem eine Ansammlung
von Sätzen zu einer in sich geschlossenen Textstruktur verbunden wird.
Die Textkohärenz wird durch Proformen, bestimmte zeitliche Abfolge der
geschilderten Sachverhalte, Thema-Rhema-Gliederung u.a. gewährleistet.
Thesaurus
ist ein vorbereitetes, normiertes Wörterbuch eines Sachgebietes, dessen
Eintragungen (Deskriptoren) mit Hilfe eines relativ kleinen Bestandes
an semantischen Relationen miteinander verknüpft sind. Typischerweise
werden hierzu die Relationen der begrifflichen Subordination (SUB), der
Synonymie (SYNO), der assoziativen Beziehung (ASSOC) und einige
andere verwendet. Ein Thesaurus widerspiegelt die Begriffswelt eines
bestimmten Anwendungsgebiets und dient bei der Informationsrecherche
zur Unterstützung der Formulierung von Suchanfragen.
Tiefenkasus
ist ein verallgemeinerter gemeinsamer Inhalt, der jeweils
verschiedenen grammatischen Kasus in den einzelnen Sprachen mit
ausgeprägtem Kasussystem auf semantischer Ebene zugrundeliegt. Der
Begriff geht auf den amerikanischen Sprachwissenschaftler Fillmore
zurück.
Tiefenrelation
ist eine spezielle semantische Relation zur Repräsentation
der kognitiven Rolle, die ein Teilnehmer in einer Handlung spielt. Die
mitunter auch gebrauchte Bezeichnung Tiefenkasusrelation ist darauf
zurückzuführen, dass diese kognitiven Rollen in vielen Sprachen mit
Hilfe des Kasussystems ausgedrückt werden. Beispiel: „Er arbeitet mit
dem Hammer.“ – das Instrument der Handlung, ausgedrückt durch
den Tiefenkasus INSTR(ument), kann im Deutschen mit Hilfe der
Präposition „mit“ und dem Dativ an das Verb angeschlossen werden; im
Russischen wird für die Beschreibung des gleichen Zusammenhangs der
reine Instrumental (5. Fall) verwendet: On rabotaet molotom.
Tiefenstruktur
ist eine Darstellung der syntaktischen Struktur oder
des semantischen Gehalts eines natürlichsprachlichen Konstrukts bei
der automatischen Verarbeitung natürlicher Sprache (syntaktische
bzw. semantische Tiefenstruktur).
Topikalisierung
ist eine Überführung einer Konstituente, die nicht Subjekt
ist, in eine funktional ausgezeichnete Stellung am Satzanfang. Dadurch
wird die Konstituente zum Topik bzw. Thema (hängt mit der Gliederung
von Sätzen in Topik und Fokus bzw. Thema und Rhema zusammen).
Beispiel: Verwendung von „Dem Jungen gab Peter das Geld.“ anstatt der
Normalstellung „Peter gab dem Jungen das Geld.“.
transitives Verb
ist ein Verb, bei dem ein Objekt als Valenz angelegt ist, das
im Deutschen meist im Akkusativ steht. Beispiel: „lesen“ im Sinn von „Das
Mädchen liest ein Buch.“. Vgl. intransitives Verb und ditransitivesVerb.
Transitivität
ist eine Eigenschaft einer zweistelligen Relation, wenn gilt ((x R
y) UND (y R z)) dann auch (x R z).
Unterbegriff
ist ein Begriff, der spezieller als ein anderer Begriff
(Oberbegriff) ist. Beispiel: „Dom“ ist ein Unterbegriff von „Kirche“.
Die Beziehung von einem Unterbegriff zu seinem Oberbegriff nennt man
auch Subordination. Eine Ansammlung von Subordinationen bildet eine
Hierarchie.
Verb
ist ein Tuwort. Im Deutschen unterscheidet man Vollverb („sagen“),
Hilfsverb („sein“) und Modalverb („sollen“).
Vererbung
ist (in der künstlichen Intelligenz, Wissensverarbeitung u.a.)
die Übertragung von Eigenschaften von einem übergeordneten Begriff
(Oberbegriff) auf einen untergeordneten Begriff (Unterbegriff) in einer
Hierarchie von Begriffen.
Verschlagwortung
ist die Zuordnung von Schlagwörtern (Schlagwort)
zu einem Volltext (z.B. eines Archivs). Man kann diesen Vorgang
automatisieren. Vgl. Verstichwortung.
Verstichwortung
ist die Zuweisung von Stichwörtern (Stichwort) zu
einem Volltext (z.B. eines Archivs). Dieser Vorgang kann ganz oder
teilweise automatisiert werden. Bei Einsatz von tiefem Sprachverstehen
kann die automatische Verstichwortung die Qualität einer manuellen
Verstichwortung erreichen.
Vollverb
ist ein Verb, das eine eigene lexikalische Bedeutung besitzt und eine
Handlung, einen Zustand oder ein Geschehnis beschreibt (wie in den
Sätzen „Max singt.“, „Max ist in München.“, „Es regnet.“). Das zweite
Beispiel zeigt, dass „sein“ neben seiner Funktion als Hilfsverb auch in
einer anderen Bedeutung („wohnen“ oder „sich befinden“) als Vollverb
fungieren kann. Vgl. Hilfsverb.
Wissenserwerb
ist ein breites Spektrum von Techniken zum Aufbau von
Wissen für Expertensysteme, Sprachverstehenssystemen u.ä., das von
psychologischen Methoden des Brainstorming oder Fragebogen-Techniken
bis hin zur rechnergestützten Abfrage von Experten mit Hilfe der
automatischen Verarbeitung natürlicher Sprache reicht.
Wissensingenieur
ist ein Spezialist, der die Entwicklung wissensbasierter
Systeme, insbesondere von Expertensystemen, betreibt. Eine seiner
Aufgaben ist die Unterstützung des Wissenserwerbs und der Extraktion
von Wissen aus dem Erfahrungsschatz eines menschlichen Experten.
Wortbildung
ist die Bildung neuer Wörter aus bestehenden Wörtern.
Die wichtigsten Prozesse der Wortbildung sind Komposition und
Derivation.