KSTEM

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Der von Robert Krovetz entwickelte KSTEM-Algorithmus basiert auf morphologischen Regeln und einem Stammlexikon, mit dessen Hilfe er versucht, ein fehlerhaftes Stemming zu vermeiden. KSTEM entfernt Suffixe solange von einem Wort, bis es die durch Regeln reduzierte Wortform im Lexikon findet. Nur wenige Suffixe werden entfernt, wenn das neu zu stemmende Wort nicht im Wörterbuch steht. Wortformen, die im Lexikon gefunden werden, werden nicht gestemmt, da man annimmt, dass sie nicht weiter ableitbar sind.

Literatur[Bearbeiten | Quelltext bearbeiten]

  • R. Krovetz: Viewing Morphology as an Inference Process. In: Proceedings of the Sixteenth Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, S. 191–203, 1993 [1]