Automatische Klassifizierung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Die automatische Klassifikation steht im Gegensatz zur manuellen Klassifizierung, bei der die zu klassifizierenden Objekte aufgrund ihrer Merkmale von Menschen manuell kategorisiert oder in Klassen eingeteilt werden. In technischen Prozessen soll durch eine maschinelle, automatische Klassifikation eine Kategorisierung von Objekten ohne menschliche Hilfe erreicht werden. Prinzipiell kann die automatische Klassifizierung genauer und schneller als die manuelle Klassifizierung erfolgen. Somit ist die automatische Klassifikation ein fundamentales Verfahren für eine Reihe von technischen Systemen und Anwendungen. Beispiele für die automatische Klassifikation sind das Sortieren von Ausschuss durch Maschinen, das computergestützte Kartografieren und die Zuordnung von Dokumenten im Dokumentenmanagement zu Dokumentenklassen.

Oft wird Clusteranalyse als gleichwertig zur automatischen Klassifikation angesehen. Es gibt hier aber ein paar subtile Unterschiede: In der Clusteranalyse liegt das Augenmerk darauf, zuvor unbekannte Strukturen möglichst akkurat zu erfassen, während bei der automatischen Klassifikation das Augenmerk darauf liegt, die gefundene Struktur gut auf weitere Instanzen verallgemeinern zu können. Ein Clusteranalyse-Verfahren wie der k-Means-Algorithmus ist dafür beispielsweise gut geeignet, aber viele fortgeschrittene Clusteranalyse-Verfahren können nicht einfach in einen Klassifikator umgewandelt werden. Dies führt oft zu Missverständnissen zwischen diesen Teildisziplinen.

Siehe auch: Mustererkennung, Klassifikator (Informatik), Klassifikationsverfahren (starke Überschneidung mit diesem Artikel)


Zur Klassifikation gibt es verschiedene Mittel:

Arten der Klassifizierung[Bearbeiten]

Siehe auch: Clusteranalyse

Hinweis: Wenn im Folgenden von Pixeln und Reflexion gesprochen wird, handelt es sich dabei um die Analyse von Satellitenbildern. Das ist nur eine mögliche Anwendung von Clusteringverfahren!

automatische Klassifizierung[Bearbeiten]

Bei der automatischen Klassifikation werden Bildpunkte als so genannte Cluster von einem Computersystem anhand der automatischen statistischen Auswertung aus Primärdaten ohne weitere Informationen in verschiedenen Reflexionsgraden gebündelt. Der Vorteil liegt darin, dass in relativ kurzer Zeit alle möglichen Klassifizierungen (Klassen) erkannt werden. Daher wird die automatische Klassifizierung oft der überwachten automatischen Klassifikation vorgeschaltet.

überwachte automatische Klassifikation[Bearbeiten]

Die überwachte automatische Klassifikation arbeitet ebenfalls mit Clustern, die aber durch den Bildauswerter anhand weiterer Informationen über das zu klassifizierende Gebiet gebildet werden und die Grundlage für die automatische Erkennung bilden.

Der Vorteil liegt bei der späteren automatischen Erkennung von Clustern z.B. gleicher Vegetation mit uneinheitlichen Reflexionsgraden, die sich aus inhomogenen Gesundheits- oder Wachstumszuständen ergeben können.

Verfahren der geringsten Distanz[Bearbeiten]

Diese Methode (engl. Minimum Euclidean Distance) geht davon aus, das diejenigen Reflexionsgrade eines Clusters, die im Erkennungsgebiet dicht nebeneinander liegen, auch zusammengehören. Für jeden Cluster werden dazu Mittelwerte der Reflexionsgrade gebildet, anhand deren noch unklassifizierte Pixel jeweils zum am Nächsten liegenden Cluster zugeordnet werden.

Verfahren der größten Wahrscheinlichkeit[Bearbeiten]

Die Maximum-Likelihood-Methode definiert Clusterzugehörigkeit über Wahrscheinlichkeitsverteilungen. Meist werden parametrische Verteilungen angenommen. Die Verteilungsparameter und die Clusterzugehörigkeit werden jeweils abwechselnd geschätzt (EM-Verfahren).

Vor- und Nachteile[Bearbeiten]

Der erfolgreiche Einsatz der automatischen Klassifikation hängt wesentlich von der Homogenität des Gebietes ab.

  • Großflächige, reliefarme Landwirtschafts- oder Waldgebiete sind hervorragend geeignet.
  • Inhomogene, komplexe, stark variierende Gebiete wie Städte bereiten größere Probleme.

Der größte Nachteil ist, dass es sich in jedem Fall um eine Zusammenfassung und Vereinfachung von komplexen Sachverhalten der Natur handelt. Daher gibt es keine 100%ig richtige Klassifizierung.

Beispiele[Bearbeiten]

Clusterbestimmung[Bearbeiten]

Automatische Clusterbildung
Manuelle Clusterbildung
Automatische Klassifizierung

durch den Computer. Bildung von 28 verschiedenen Clustern.

Überwachte automatische Klassifikation.

Bildung von Trainingsgebieten durch den Bildauswerter.

Klassifikation[Bearbeiten]

Klassifikation
Klassifikation
Klassifikation nach dem

Verfahren der geringsten Distanz.

Klassifikation nach dem

Verfahren der größten Wahrscheinlichkeit.