Klassifikationsverfahren

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Die Artikel Klassifikator (Informatik) und Klassifikationsverfahren überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zusammenzuführen (→ Anleitung). Beteilige dich dazu an der betreffenden Redundanzdiskussion. Bitte entferne diesen Baustein erst nach vollständiger Abarbeitung der Redundanz und vergiss nicht, den betreffenden Eintrag auf der Redundanzdiskussionsseite mit {{Erledigt|1=~~~~}} zu markieren. º the Bench º WikiWartung 01:57, 6. Mär. 2009 (CET)

Klassifikationsverfahren sind Methoden und Kriterien zur Einteilung von Objekten oder Situationen in Klassen, das heißt zur Klassifizierung. Ein solches Verfahren wird auch als Klassifikator bezeichnet. Viele Verfahren lassen sich als Algorithmus implementieren; man spricht dabei auch von maschineller oder automatischer Klassifikation. Klassifikationsverfahren sind immer anwendungsbezogen, so dass viele verschiedene Methoden existieren.

Klassifikationsverfahren spielen unter anderem bei der Mustererkennung, in der Künstlichen Intelligenz und der Dokumentationswissenschaft beziehungsweise dem Information Retrieval eine Rolle. Zur Beurteilung eines Klassifikators können verschiedene Kenngrößen ermittelt werden.

Arten von Klassifikationsverfahren[Bearbeiten]

Da eine streng hierarchische Einteilung von Klassifikationsverfahren kaum möglich ist, lassen sie sich am besten anhand verschiedener Eigenschaften einteilen:

  • Manuelle und automatische Verfahren
  • Numerische und nichtnumerische Verfahren
  • Statistische und verteilungsfreie Verfahren
  • Überwachte und nichtüberwachte Verfahren
  • Fest dimensionierte und lernende Verfahren
  • Parametrische und nichtparametrische Verfahren

Manuelle und automatische Verfahren[Bearbeiten]

Siehe zum Beispiel manuelle Indexierung und automatische Indexierung.

Bei automatischen Verfahren findet die Klassizifierung mittels eines automatischen Prozesses durch Software statt. Der Prozess der maschinellen Klassifikation kann als formale Methode des Entscheidens in neuen Situationen aufgrund erlernter Strukturen bezeichnet werden. Die maschinelle Klassifikation ist ein Teilgebiet des Maschinellen Lernens.

Genauer ist dies die Erzeugung eines Algorithmus (der lernende Algorithmus), der - angewandt auf bekannte und schon klassifizierte Fälle (die Datenbasis) - Strukturen berechnet. Diese neu erlernten Strukturen ermöglichen es einem weiteren Algorithmus (der auswertende Algorithmus), einen neuen und bisher unbekannten Fall aufgrund der beobachteten Attribute und deren Ausprägungen einer der bekannten Ziel-Klassen zuzuordnen.

Statistische und verteilungsfreie Verfahren[Bearbeiten]

Statistische Verfahren basieren auf Dichteberechnungen und Wahrscheinlichkeiten, während verteilungsfreie Verfahren klare Trennflächen zur Trennung der Klassen benutzen. Die Grenzen zwischen den einzelnen Klassen im Merkmalsraum können durch eine Diskriminanzfunktionen angeben werden.

Beispiele für statistische Verfahren sind der Bayes-Klassifikator, der Fuzzy-Pattern-Klassifikator oder Kerndichteschätzer. Die Berechnung von Trennflächen ist durch sogenannte Support-Vector-Maschinen möglich.

Überwachte und nicht überwachte Verfahren[Bearbeiten]

Das Erzeugen von Strukturen aus vorhandenen Daten wird auch als Mustererkennung, Diskriminierung oder überwachtes Lernen bezeichnet. Dabei werden Klasseneinteilungen vorgegeben (dies kann auch durch Stichproben geschehen). Im Gegensatz dazu existiert nichtüberwachtes Lernen, bei dem die Klassen der Daten nicht vorgegeben sind, sondern auch diese erlernt werden müssen. Dabei können allerdings beim Bestärkenden Lernen (engl.: reinforcement learning) Informationen hinzukommen, ob eine Klasseneinteilung richtig oder falsch war. Ein Beispiel für unüberwachte Verfahren ist die Clusteranalyse.

Parametrische und nichtparametrische Verfahren[Bearbeiten]

Parametrische Verfahren beruhen auf parametrischen Wahrscheinlichkeitsdichten, während nichtparametrischen Verfahren (z.B. Nächste-Nachbarn-Klassifikation) auf lokale Dichteberechnungen basieren.

Beispiele[Bearbeiten]

Siehe auch[Bearbeiten]

Literatur[Bearbeiten]

  • O. Oberhauser: Automatisches Klassifizieren: Entwicklungsstand – Methodik – Anwendungsbereiche. Frankfurt/Main [u.a.]: Peter Lang, 2005. ISBN 3-631-53684-4.
  • Andrew R. Webb: Statistical Pattern Recognition. John Wiley & Sons, 2 ed., Jul. 2002
  • Richard O. Duda, P. E. Hart, and D. G. Stork: Pattern Classification (2nd Edition). John Wiley & Sons, 2. ed., 2000
  • C. M. Bishop: Neural Networks for Pattern Recognition. Oxford University Press, 1996
  • D. Michie, D. J. Spiegelhalter, C. C. Taylor (Ed.): Machine Learning, neural and statistical Classification. Elis Horwood 1994