Unüberwachtes Lernen

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
QS-Informatik

Dieser Artikel wurde wegen inhaltlicher Mängel auf der Qualitätssicherungsseite der Redaktion Informatik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Informatik auf ein akzeptables Niveau zu bringen. Hilf mit, die inhaltlichen Mängel dieses Artikels zu beseitigen, und beteilige dich an der Diskussion! (+)

Unüberwachtes Lernen (englisch unsupervised learning) bezeichnet maschinelles Lernen ohne im Voraus bekannte Zielwerte sowie ohne Belohnung durch die Umwelt. Die (Lern-) Maschine versucht, in den Eingabedaten Muster zu erkennen, die vom strukturlosen Rauschen abweichen.[1] Ein Künstliches neuronales Netz orientiert sich an der Ähnlichkeit zu den Inputwerten und adaptiert die Gewichte entsprechend. Es können verschiedene Dinge gelernt werden. Beliebt sind die automatische Segmentierung (Clustering) oder die Komprimierung von Daten zur Dimensionsreduktion.

Segmentierung[Bearbeiten]

Hier werden ähnliche Muster durch eine Segmentierung auf ähnliche Segmente abgebildet.

Ein sehr vereinfachtes Beispiel: Man stelle sich verschiedene Früchte vor (Äpfel, Birnen, Erdbeeren, Orangen), die alle in einem gemeinsamen Korb liegen. Der Korb beinhaltet also die Menge der zu „segmentierenden“ Daten. Nun ist eine Frucht wahllos herauszunehmen. Danach sind Ähnlichkeiten mit den bereits auf dem Boden vorhandenen Früchten zu suchen. Wenn etwas Passendes gefunden wurde, soll die Frucht dazugelegt werden. Wenn nicht, dann legt man sie irgendwo hin, wo Platz ist. Damit ist solange fortzufahren, bis alle Früchte gemäß ihren Eigenschaften (Aussehen, Geruch, Farbe, Geschmack etc.) „segmentiert“ wurden. Auf dem Boden liegen jetzt verschiedene Haufen von Früchten, mal größer, kleiner oder gleich je nach Häufigkeit des Auftretens. Das sind praktisch gesehen die Cluster.

Komprimierung[Bearbeiten]

Hierbei wird versucht, viele Eingabewerte in einer kompakteren Form zu repräsentieren, wobei möglichst wenig Information verloren gehen soll. Die Hauptkomponentenanalyse kann zum Beispiel als Komprimierverfahren verstanden werden, wenn die unwichtigsten Komponenten der Daten weggelassen werden.
Das entspricht praktisch einem linearen Autoencoder; dies ist ein mehrschichtiges künstliches neuronales Netz, dessen Zielwerte die Eingabewerte sind, wobei eine versteckte Schicht mit weniger Knoten als Eingabewerte als „Flaschenhals“ dient. Die Aktivierungen dieser Neuronen sind die komprimierten Daten, aus denen dann möglichst gut die ursprünglichen Daten wieder rekonstruiert (dekomprimiert) werden sollen.

Siehe auch[Bearbeiten]

Literatur[Bearbeiten]

Einzelnachweise[Bearbeiten]

  1. Zoubin Ghahramani: Unsupervised Learning (PDF-Datei; 362 kB), In Proceedings of Advanced Lectures on Machine Learning. 2003, 72–112.