Moment (Bildverarbeitung)

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Momente, siehe Momente einer Verteilung, sind in der Bildverarbeitung bestimmte gewichtete Mittelwerte aus den Helligkeitswerten der einzelnen Pixel eines Bildes. Sie werden gewöhnlich so gewählt, dass sie gewünschte Eigenschaften des Bildes widerspiegeln oder gewisse geometrische Interpretationen besitzen. Momente sind hilfreich, um einzelne Objekte in einem segmentierten Bild zu beschreiben. Grundlegende Eigenschaften von Bildern, die durch Momente berechnet werden können, sind Fläche (oder Summe der Helligkeitswerte), Schwerpunkt und Ausrichtung.

Nicht zentrierte Momente[Bearbeiten]

Für eine zweidimensionale stetige Funktion f(x,y) ist das Moment (p+q)-ten Grades definiert als

 M_{pq}=\int\limits_{-\infty}^{\infty} \int\limits_{-\infty}^{\infty} x^py^qf(x,y) \,dx\, dy

für p,q = 0,1,2, \ldots

Auf digitale Grauwertbilder mit der Grauwertfunktion g(x,y) angewandt ergeben sich die nicht zentrierten Momente M_{ij} aus

M_{ij} = \sum_x \sum_y x^i y^j g(x,y)

In einigen Fällen können die nicht zentrierten Momente berechnet werden indem die Grauwertfunktion als Wahrscheinlichkeitsdichtefunktion aufgefasst wird. Dazu teilt man obige Formel durch

\sum_x \sum_y g(x,y)

Laut dem Eindeutigkeitstheorem von Athanasios Papoulis (1991) existieren Momente jeglichen Grades, wenn f(x,y) stückweise stetig ist und nur in einem endlichen Teil der xy-Ebene ungleich Null wird. In diesem Fall ist die Folge von Momenten ( M_{pq} ) durch f(x,y) eindeutig bestimmt. Ebenso bestimmt ( M_{pq} ) die Funktion f(x,y) eindeutig. In der Praxis reichen jedoch meist wenige Momente niedrigen Grades aus um ein Bild hinreichend genau zu charakterisieren.

Beispiele[Bearbeiten]

Einfache Bildeigenschaften, die durch nicht zentrierte Momente bestimmt werden können, sind unter anderen:

  • Fläche (für Binärbilder) oder Summe der Grauwerte (für Grauwertbilder): M_{00}
  • Schwerpunkt: \{\bar{x},\ \bar{y} \} = \left\{ \frac{M_{10}}{M_{00}}, \frac{M_{01}}{ M_{00}} \right\}

Zentrale Momente (translationsinvariante Momente)[Bearbeiten]

Zentrale Momente sind invariant bezüglich Translationen, sie sind definiert als

 \mu_{pq} = \int\limits_{-\infty}^{\infty} \int\limits_{-\infty}^{\infty} (x - \bar{x})^p(y - \bar{y})^q f(x,y) \, dx 

\, dy


Auf digitale Grauwertbilder mit der Grauwertfunktion g(x,y) angewandt ergeben sich die Zentralen Momente Mij aus

\mu_{ij} = \sum_{x} \sum_{y} (x - \bar{x})^i(y - \bar{y})^j g(x,y)

Die zentralen Momente bis zum Grad 3 sind:

\mu_{00} = M_{00},\,\!
\mu_{01} = 0,\,\!
\mu_{10} = 0,\,\!
\mu_{11} = M_{11} - \bar{x} M_{01} = M_{11} - \bar{y} M_{10},
\mu_{20} = M_{20} - \bar{x} M_{10},
\mu_{02} = M_{02} - \bar{y} M_{01},
\mu_{21} = M_{21} - 2 \bar{x} M_{11} - \bar{y} M_{20} + 2 \bar{x}^2 M_{01},
\mu_{12} = M_{12} - 2 \bar{y} M_{11} - \bar{x} M_{02} + 2 \bar{y}^2 M_{10},
\mu_{30} = M_{30} - 3 \bar{x} M_{20} + 2 \bar{x}^2 M_{10},
\mu_{03} = M_{03} - 3 \bar{y} M_{02} + 2 \bar{y}^2 M_{01}.

Es kann gezeigt werden dass:

\mu_{pq} = \sum_{m}^p \sum_{n}^q {p\choose m} {q\choose n}(-\bar{x})^{(p-m)}(-\bar{y})^{(q-n)}  M_{mn}

Beispiele[Bearbeiten]

Informationen über die Ausrichtung des Bildes können gewonnen werden, indem man zuerst die drei zentralen Momente zweiten Grades verwendet, um eine Kovarianzmatrix zu berechnen.

\mu'_{20} = \mu_{20} / \mu_{00} = M_{20}/M_{00} - \bar{x}^2
\mu'_{02} = \mu_{02} / \mu_{00} = M_{02}/M_{00} - \bar{y}^2
\mu'_{11} = \mu_{11} / \mu_{00} = M_{11}/M_{00} - \bar{x}\bar{y}

Die Kovarianzmatrix des Bildes g(x,y) ist dann

\operatorname{cov}[I(x,y)] = \begin{bmatrix} \mu'_{20}  & \mu'_{11} \\ \mu'_{11} & \mu'_{02} \end{bmatrix}.

Die Eigenvektoren dieser Matrix entsprechen der großen und kleinen Halbachse der Helligkeitswerte. Somit kann die Ausrichtung des Bildes aus dem Winkel des Eigenvektors mit dem größten Eigenwert bestimmt werden. Es kann gezeigt werden, dass dieser Winkel Θ durch die folgende Formel berechnet werden kann.


\Theta = \frac{1}{2} \arctan \left( \frac{2\mu'_{11}}{\mu'_{20} - \mu'_{02}} \right)

Die Eigenwerte der Kovarianzmatrix sind

 \lambda_i = \frac{\mu'_{20} + \mu'_{02}}{2}  \pm \frac{\sqrt{4{\mu'}_{11}^2 + ({\mu'}_{20}-{\mu'}_{02})^2  }}{2},

Die Exzentrizität des Bildes ist

 \sqrt{1 - \frac{\lambda_2}{\lambda_1}}.

skalierungsinvariante Momente[Bearbeiten]

Es können Momente ηi j mit i + j ≥ 2 konstruiert werden, die invariant bezüglich Skalierung und Translation sind, indem man das entsprechende zentrale Moment durch das entsprechend skalierte Moment vom Grad 0 teilt.

\eta_{ij} = \frac{\mu_{ij}} 
                        {\mu_{00}^{\left(1 + \frac{i+j}{2}\right)}}\,\!

rotationsinvariante Momente[Bearbeiten]

Es ist weiterhin möglich, Momente zu konstruieren, die zusätzlich invariant bezüglich einer Bildrotation sind. Häufig benutzt wird die Hu-Menge invarianter Momente.


 \begin{align}
   I_1 =\ & \eta_{20} + \eta_{02} \\
   I_2 =\ & (\eta_{20} - \eta_{02})^2 + (2\eta_{11})^2 \\
   I_3 =\ & (\eta_{30} - 3\eta_{12})^2 + (3\eta_{21} - \eta_{03})^2 \\
   I_4 =\ & (\eta_{30} + \eta_{12})^2 + (\eta_{21} + \eta_{03})^2 \\
   I_5 =\ & (\eta_{30} - 3\eta_{12}) (\eta_{30} + \eta_{12})[ (\eta_{30} + \eta_{12})^2 - 3 (\eta_{21} + \eta_{03})^2] + \\
        \ & (3\eta_{21} - \eta_{03}) (\eta_{21} + \eta_{03})[ 3(\eta_{30} + \eta_{12})^2 -  (\eta_{21} + \eta_{03})^2] \\
   I_6 =\ & (\eta_{20} - \eta_{02})[(\eta_{30} + \eta_{12})^2 - (\eta_{21} + \eta_{03})^2] + 4\eta_{11}(\eta_{30} + 

\eta_{12})(\eta_{21} + \eta_{03}) \\
   I_7 =\ & (3\eta_{21} - \eta_{03})(\eta_{30} + \eta_{12})[(\eta_{30} + \eta_{12})^2 - 3(\eta_{21} + \eta_{03})^2] - \\
        \ & (\eta_{30} - 3\eta_{12})(\eta_{21} + \eta_{03})[3(\eta_{30} + \eta_{12})^2 - (\eta_{21} + \eta_{03})^2]
 \end{align}

Das erste, I1, ist ungefähr gleichzusetzen mit dem Trägheitsmoment um den Schwerpunkt des Bildes, wenn die Helligkeitswerte der Pixel als physikalische Dichte interpretiert werden.

Anwendungsbeispiele[Bearbeiten]

Momente sind für zweierlei Dinge gut geeignet. Zum einen dienen sie zur Klassifikation von Objekten in binarisierten, also Schwarzweiß-Bildern, welche das Ergebnis einer Vorverarbeitung sind, die entscheidet, welche Teile eines Bildes zu einem Objekt gehören (schwarz = 1) und welche nicht (weiß = 0). Auch ein Bild, das außer Schwarz und Weiß auch Grauwerte enthält, weil sich der vorverarbeitende Algorithmus nicht immer sicher war, ob ein Pixel zum Objekt oder zum Hintergrund gehört, ist verwertbar, indem die Graustufen auf den Wertebereich [0, 1] normiert werden.

Am Beispiel der Texterkennung sieht man, dass ein "T" und ein "I" zwar links–rechts-symmetrisch sind und sich somit im Schwerpunkt \bar{x} nicht unterscheiden, allerdings sich im Moment \mu_{20} durch die unterschiedliche Varianz unterscheiden und außerdem im Moment \mu_{03} stark abweichen. Für dieses Moment sollte aufgrund der Oben–Unten-Symmetrie für "I" ein Wert nahe 0 herauskommen, während ein gescanntes T oben deutlich mehr Pixel aufweist als unten und hier einen stark negativen Wert erhält (für nach unten zunehmende y-Werte).

Zum anderen kann mit Momenten die Anordnung beliebiger extrahierter Features aus Bildern oder ähnlichem zueinander verglichen werden. Hat man beispielsweise mittels eines Eckenfinders einige Ecken extrahiert, lässt sich mithilfe der Momente feststellen, in welchem Teil des Bildes innerhalb einer Bildfolge (=Video) Veränderung stattfindet. Verwendet man hierfür die translationsinvarianten zentralen Momente, so ist die Erkennung stabil gegenüber Wackeln der Kamera.

Weblinks[Bearbeiten]

Quellen[Bearbeiten]