Kovarianzmatrix

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Die Kovarianzmatrix \operatorname{Cov}(X) (selten auch Varianz-Kovarianz-Matrix bzw. \Sigma_X) verallgemeinert in der Wahrscheinlichkeitstheorie den Einfluss der Varianz einer eindimensionalen Zufallsvariable auf eine mehrdimensionale, d. h. auf einen Zufallsvektor X = (X_1,\ldots,X_n)^T.

Definition[Bearbeiten | Quelltext bearbeiten]

Die Kovarianzmatrix als Matrix aller paarweisen Kovarianzen der Elemente des Zufallsvektors enthält Informationen über seine Streuung und über Korrelationen zwischen seinen Komponenten:

\begin{align}
\operatorname{Cov}(X) & = \bigl(\operatorname{Cov}(X_i, X_j)\bigr)_{i,j=1,\ldots,n}\\
                      & = \begin{pmatrix}
\operatorname{Cov}(X_1,X_1) & \cdots & \operatorname{Cov}(X_1,X_n) \\
\vdots & \ddots & \vdots \\
\operatorname{Cov}(X_n,X_1) & \cdots& \operatorname{Cov}(X_n,X_n)
\end{pmatrix} \in\R^{n,n}
\end{align}

mit

  • der Kovarianz \operatorname{Cov}(X_i, X_j) der reellen Zufallsvariablen X_i und X_j.

Beziehung zum Erwartungswert des Zufallsvektors[Bearbeiten | Quelltext bearbeiten]

Ist \mu = \operatorname{E}(X) der Erwartungswert des Zufallsvektors, so gilt

\begin{align}
\operatorname{Cov}(X) & = \operatorname{E}\bigl((X - \mu)(X - \mu)^T\bigr)\\
                      & = \operatorname{E}(X X^T)  - \mu \mu^T
\end{align}

Hierbei sind Erwartungswerte von Vektoren und Matrizen komponentenweise zu verstehen.

Ein Zufallsvektor, der einer gegebenen Kovarianzmatrix gehorchen und den Erwartungswert \mu haben soll, kann wie folgt simuliert werden:
zunächst ist die Kovarianzmatrix zu zerlegen (z. B. mit der Cholesky-Zerlegung):

\operatorname{Cov}(X) = DD^T

anschließend lässt sich der Zufallsvektor berechnen zu

X = D \xi + \mu

mit

Eigenschaften[Bearbeiten | Quelltext bearbeiten]

  • Für i=j gilt: \operatorname{Cov}(X_i, X_i)=\operatorname{Var}(X_i). Somit enthält die Kovarianzmatrix auf der Hauptdiagonalen die Varianzen der einzelnen Komponenten des Zufallsvektors. Alle Elemente auf der Hauptdiagonalen sind daher nicht-negativ.
  • Eine reelle Kovarianzmatrix ist symmetrisch, da die Kovarianz zweier Zufallsvariablen symmetrisch ist.
  • Die Kovarianzmatrix ist positiv semidefinit: Wegen der Symmetrie ist jede Kovarianzmatrix mittels Hauptachsentransformation diagonalisierbar, wobei die Diagonalmatrix wieder eine Kovarianzmatrix ist. Da auf der Diagonale nur Varianzen stehen, ist die Diagonalmatrix folglich positiv semidefinit und somit auch die ursprüngliche Kovarianzmatrix.
  • Umgekehrt kann jede symmetrische positiv semidefinite d\times d-Matrix als Kovarianzmatrix eines d-dimensionalen Zufallsvektors aufgefasst werden.
  • Aufgrund der Diagonalisierbarkeit, wobei die Eigenwerte (auf der Diagonale) wegen der positiven Semidefinitheit nicht-negativ sind, können Kovarianzmatrizen als Ellipsoide dargestellt werden.
  • Für alle Matrizen A\in\R^{m\times n} gilt \operatorname{Cov}(AX) = A\,\operatorname{Cov}(X)A^T.
  • Für alle Vektoren b\in\R^n gilt \operatorname{Cov}(X+b) = \operatorname{Cov}(X).
  • Sind X und Y unkorrelierte Zufallsvektoren, dann gilt \operatorname{Cov}(X+Y) = \operatorname{Cov}(X)+\operatorname{Cov}(Y).
  • Sind die Zufallsvariablen standardisiert, so enthält die Kovarianzmatrix gerade die Korrelationskoeffizienten.

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Literatur[Bearbeiten | Quelltext bearbeiten]