Vektorquantisierung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Dieser Artikel oder nachfolgende Abschnitt ist nicht hinreichend mit Belegen (beispielsweise Einzelnachweisen) ausgestattet. Die fraglichen Angaben werden daher möglicherweise demnächst entfernt. Bitte hilf der Wikipedia, indem du die Angaben recherchierst und gute Belege einfügst. Näheres ist eventuell auf der Diskussionsseite oder in der Versionsgeschichte angegeben. Bitte entferne zuletzt diese Warnmarkierung.
Kein einziger Einzelnachweis und auch keine Literaturangaben. --Martin Thoma 14:00, 6. Dez. 2015 (CET)

Die Vektorquantisierung ist ein Verfahren zur Kompression oder Identifikation von Datensätzen.

Die Datensätze werden in Merkmalsvektoren zusammengefasst. Die Idee des Verfahrens besteht darin, diesen Merkmalsvektoren denjenigen Vektor aus einer Tabelle zuzuordnen, der dem betrachteten Merkmalsvektor am ähnlichsten ist. Statt alle Daten des Merkmalsvektors zu speichern, wird nur der Index dieses ähnlichsten Vektors benötigt, siehe auch Datenbankindex.

Die Vektorquantisierung besteht aus zwei Schritten. Im ersten Schritt, dem Training, muss die Tabelle (Codebuch) mit häufig vorkommenden Merkmalsvektoren erstellt werden. Im zweiten Schritt wird für weitere Vektoren jeweils der Codebuchvektor mit dem geringsten Abstand bestimmt. Zur Datenübertragung wird nur der Index des Codebuchvektors benötigt, der auch ein Vektor sein kann, wenn das Codebuch mehrdimensional ist. Der korrespondierende Dekoder muss über das gleiche Codebuch verfügen und kann dann aus dem Index eine Approximation des ursprünglichen Vektors erzeugen.

Eine weitere Anwendungsmöglichkeit besteht in der Zuordnung von Datensätzen zu bestimmten Mustern wie in der Spracherkennung. In diesem Fall wird der Abstand zwischen dem Merkmalsvektor und dem Codebuchvektor benutzt, um zu entscheiden, ob der betrachtete Datensatz einem Muster entspricht.

Siehe auch[Bearbeiten | Quelltext bearbeiten]