Volltextindexierung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Die Artikel Volltextrecherche und Volltextindex überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zusammenzuführen (→ Anleitung). Beteilige dich dazu an der betreffenden Redundanzdiskussion. Bitte entferne diesen Baustein erst nach vollständiger Abarbeitung der Redundanz und vergiss nicht, den betreffenden Eintrag auf der Redundanzdiskussionsseite mit {{Erledigt|1=~~~~}} zu markieren. Nichtich 01:27, 25. Dez. 2011 (CET)
Dieser Artikel oder Abschnitt bedarf einer Überarbeitung. Hilf mit, ihn zu verbessern, und entferne anschließend diese Markierung.

Volltextindexierung ist die (automatische) Erfassung sämtlicher Wörter eines Textes im Index. Ausgenommen davon sind in der Regel Stoppwörter.

Volltextindexierung wird entweder ergänzend zu intellektuell vergebenen Deskriptoren eingesetzt oder dient gänzlich als Ersatz für ein intellektuelles Ordnungssystem.

Ein populärer Irrglaube ist, dass Volltextindizes grundsätzlich besser sind als von Menschen erstellte Ordnungssysteme. Ein weniger populärer Irrglaube ist, dass Volltextindizes nur verwendet werden (sollten), wenn Zeit und Geld für ein funktionierendes Ordnungssystem fehlen - eher richtig ist es, dass "Volltextindexierung" nicht gegen Ordnungssysteme bestehen kann.

Vorteile[Bearbeiten | Quelltext bearbeiten]

Indexierung mittels Volltextindexierung hat eine Erhöhung des Recalls eines Retrievalsystems zur Folge, zumal dadurch im Normalfall die Anzahl der Stichwörter höher ist.

Der Rechercheur kann ohne Kenntnis des Ordnungssystems suchen.

Als Ergänzung zu einem Intellektuellen Ordnungssystem kann der Volltextindex als "Backbone" dienen.

Nachteile[Bearbeiten | Quelltext bearbeiten]

Die Precision eines Retrievalsystems geht durch den Einsatz von Volltextindizierung enorm zurück. Wird ein Begriff in einem Text nur am Rande erwähnt, ist das Dokument trotzdem unter diesem zu finden.

Die Suche im Volltextindex dauert länger, da Volltextindizes inhärent größer sind als intellektuell erstellte. Das mag, auf eine einzelne Suche bezogen, zwar im Bereich von Bruchteilen von Sekunden liegen, ist aber mit steigender Nutzerzahl eines Retrievalsystems nicht mehr zu vernachlässigen.

Zusammenfassung[Bearbeiten | Quelltext bearbeiten]

Volltextindizes fungieren, selbst wenn gepaart mit Ranking-Algorithmen, im Allgemeinen als wenig passable Retrieval-Werkzeuge (siehe auch Google) und eher als Unterstützung von intellektuellen Ordnungssystemen.

Siehe auch[Bearbeiten | Quelltext bearbeiten]