Semantische Nähe

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Semantische Nähe ist ein Konzept, das die Ähnlichkeit von Dokumenten oder Begriffen nach Art ihres Inhaltes (Bedeutung, Semantik) beschreibt. Veranschaulichen kann man semantische Nähe mit Hilfe von „Landkarten“, in denen ähnliche Dokumente oder Begriffe nahe aneinandergerückt werden, unähnliche aber weiter auseinander. Dies geschieht z. B. – oft unwillkürlich – bei der Erstellung von Mind Maps.

Es existieren auch für das Web diverse Visualisierungstools, mit deren Hilfe die semantische Nähe von Webseiten(inhalten) veranschaulicht wird (KartOO, WebBrain).

Die Definition der semantischen Nähe ist ein wichtiges Problemfeld bei der Nutzung von Ontologien zur semantischen Annotation und der semantischen Suche, insbesondere im semantischen Web.

Formalisierung der semantischen Nähe[Bearbeiten]

Liegen Begriffe in einer Baumstruktur geordnet vor, wie z. B. bei Taxonomien, so lässt sich die semantische Nähe zweier Begriffe als die Länge des kürzesten Pfades zwischen den Begriffsknoten definieren.

Hat man Angaben über die Häufigkeit des Vorkommens (p) der hierarchisierten Begriffe t, z. B. aus der Analyse eines Textkorpus, so können diese mittels ihres Informationsgehaltes I quantifiziert werden:

I(t) = - \log p(t)

Eine Metrik für den Begriffsbaum kann dann folgendermaßen definiert werden:

\Delta I(t_1,t_2) = I(t_2) - I(t_1), wenn t1 Überklasse von t2 ist und

\Delta I(t_3,t_2) = \Delta I(t_3,t_1) + \Delta I(t_2,t_1), wenn t1 gemeinsame Überklasse von t2 und t3 ist.

Erweiterungen dieser einfachen Vorschrift beziehen die Dichte der Baumknoten und die absolute Tiefe in der Baumstruktur mit ein.

Siehe auch: Informationstheorie

Weblinks[Bearbeiten]