Kovarianz (Stochastik)
Die Kovarianz ist in der Stochastik ein nichtstandardisiertes Zusammenhangsmaß für einen monotonen Zusammenhang zweier Zufallsvariablen mit gemeinsamer Wahrscheinlichkeitsverteilung.
Inhaltsverzeichnis |
Definition [Bearbeiten]
Sind
und
zwei reelle, integrierbare Zufallsvariablen, deren Produkt ebenfalls integrierbar ist, d. h., die Erwartungswerte
,
und
existieren, dann heißt
die Kovarianz von
und
. Die geforderte Existenz der Erwartungswerte ist insbesondere erfüllt, wenn
und
quadratintegrierbar sind, also wenn
und
gilt.
Eigenschaften und Rechenregeln [Bearbeiten]
Interpretation der Kovarianz [Bearbeiten]
- Die Kovarianz ist positiv, wenn
und
einen monotonen Zusammenhang besitzen, d. h., hohe (niedrige) Werte von
gehen mit hohen (niedrigen) Werten von
einher. - Die Kovarianz ist hingegen negativ, wenn
und
einen gegensinnigen monotonen Zusammenhang aufweisen, d. h., hohe Werte der einen Zufallsvariablen gehen mit niedrigen Werten der anderen Zufallsvariablen einher und umgekehrt. - Ist das Ergebnis null, so besteht kein monotoner Zusammenhang zwischen
und
(Nichtmonotone Beziehungen sind aber möglich.).
Die Kovarianz gibt zwar die Richtung einer Beziehung zwischen zwei Zufallsvariablen an, über die Stärke des Zusammenhangs wird aber keine Aussage getroffen. Dies liegt an der Linearität der Kovarianz. Um einen Zusammenhang vergleichbar zu machen, muss die Kovarianz normiert werden. Die gebräuchlichste Normierung mittels der Standardabweichung führt zum Korrelationskoeffizienten.
Verschiebungssatz [Bearbeiten]
Zur oft einfacheren Berechnung der Kovarianz kann man auch den Verschiebungssatz als alternative Darstellung der Kovarianz anwenden.
Satz (Verschiebungssatz für die Kovarianz):
Beweis:
Beziehung zur Varianz [Bearbeiten]
Satz: Die Kovarianz ist eine Verallgemeinerung der Varianz, denn es gilt
Beweis:
Die Varianz ist demnach die Kovarianz einer Zufallsvariablen mit sich selbst.
Mit Hilfe der Kovarianzen lässt sich auch die Varianz einer Summe von quadratintegrierbaren Zufallsvariablen berechnen. Allgemein gilt
Speziell für die Summe zweier Zufallsvariablen gilt daher die Formel
Linearität, Symmetrie und Definitheit [Bearbeiten]
Satz: Die Kovarianz ist eine positiv semidefinite symmetrische Bilinearform auf dem Vektorraum der quadratisch integrierbaren Zufallsvariablen.
Es gelten also die folgenden drei Sätze:
Satz (Bilinearität): Für
gilt:
Beweis:
Die Kovarianz ist offensichtlich invariant unter der Addition von Konstanten zu den Zufallsvariablen. In der zweiten Gleichung ist die Kovarianz wegen der Symmetrie auch im ersten Argument linear.
Satz (Symmetrie):
Beweis:
Satz (Positive Semidefinitheit):
Beweis:
Insgesamt folgt wie für jede positiv semidefinite symmetrische Bilinearform die Cauchy-Schwarzsche Ungleichung
Die Linearität der Kovarianz hat zur Folge, dass die Kovarianz vom Maßstab der Zufallsvariablen abhängt. So erhält man beispielsweise die zehnfache Kovarianz, wenn man anstatt
die Zufallsvariable
betrachtet. Insbesondere hängt der Wert der Kovarianz von den verwendeten Maßeinheiten der Zufallsvariablen ab. Da diese Eigenschaft die absoluten Werte der Kovarianz schwer interpretierbar macht, betrachtet man bei der Untersuchung auf einen linearen Zusammenhang zwischen
und
häufig stattdessen den maßstabsunabhängigen Korrelationskoeffizienten
Unkorreliertheit und Unabhängigkeit [Bearbeiten]
Definition (Unkorreliertheit): Sei
und folglich
, dann heißen die Zufallsvariablen
und
unkorreliert.
Satz: Seien
und
stochastisch unabhängige Zufallsvariablen, so gilt 
Beweis: Für stochastisch unabhängige Zufallsvariablen gilt
, i. e.
Der Umkehrschluss gilt im Allgemeinen aber nicht; es gilt der
Satz: Sei
, so sind die Zufallsvariablen
und
im Allgemeinen nicht stochastisch unabhängig.
Beweis: Sei
eine im Intervall [-1, 1] gleichverteilte Zufallsvariable und
. Offenkundig sind
und
voneinander abhängig. Zudem gilt
Stochastisch unabhängige Zufallsvariablen, deren Kovarianz existiert, sind also auch unkorreliert. Umgekehrt bedeutet Unkorreliertheit aber nicht zwingend, dass die Zufallsvariablen stochastisch unabhängig sind, denn es kann eine nichtmonotone Abhängigkeit bestehen, die die Kovarianz nicht erfasst.
Weitere Beispiele für unkorrelierte, aber stochastisch abhängige Zufallsvariablen:
- Seien
und
Zufallsvariablen mit
und 
- Dann gilt
und
, 
- Es folgt
und ebenfalls
, also 
- Andererseits sind
und
wegen
nicht stochastisch unabhängig.
- Seien die Zufallsvariablen
und
bernoulliverteilt mit Parameter
und unabhängig, dann sind
und
unkorreliert, aber nicht unabhängig.
- Die Unkorreliertheit ist klar, denn

- Aber
und
sind nicht unabhängig, denn es ist 
Beispiele [Bearbeiten]
- Sei
zweidimensional multinormalverteilt und
mit
so gilt für die Kovarianz:
- Sei
zweidimensional multinomialverteilt (
), so gilt:
Siehe auch [Bearbeiten]
Literatur [Bearbeiten]
- Norbert Henze: Stochastik für Einsteiger. 7. Auflage. Vieweg Verlag, Wiesbaden 2008, ISBN 978-3-8348-0423-5, Kap. 21.
![\operatorname{Cov}(X,Y) := \operatorname E\bigl[(X - \operatorname E(X)) \cdot (Y - \operatorname E(Y))\bigr]](http://upload.wikimedia.org/math/f/6/8/f681a2965fa2dad8616630ea0c0df194.png)

![\begin{align}
\operatorname{Cov}(X,Y) &= \operatorname E\bigl[(XY - X\operatorname E(Y) - Y\operatorname E(X) + \operatorname E(X)\operatorname E(Y))\bigr]\\
&= \operatorname{E}(XY) - \operatorname{E}(X) \operatorname{E}(Y) - \operatorname{E}(Y) \operatorname{E}(X) + \operatorname{E}(X) \operatorname{E}(Y)\\
&= \operatorname{E}(XY) - \operatorname{E}(X) \operatorname{E}(Y) \qquad \Box
\end{align}](http://upload.wikimedia.org/math/1/8/4/184bf48c51c5dc3684653cc2224d416d.png)

![\begin{align}
\operatorname{Cov}(X,X) &= \operatorname E\bigl[(X - \operatorname E(X))^2\bigr]\\
&= \operatorname{Var}(X) \qquad \Box \end{align}](http://upload.wikimedia.org/math/7/2/1/7213f6961b924783234b75107fb7d63a.png)



![\operatorname{Cov}[X,(eY+f)+(gZ+h)] = e\operatorname{Cov}(X,Y) + g\operatorname{Cov}(X,Z).](http://upload.wikimedia.org/math/4/8/3/4838848fe0ec68603ad9f47d272501e4.png)
![\begin{align}
\operatorname{Cov}(aX+b,cY+d) &= \operatorname E\bigl[(aX+b - \operatorname E(aX+b)) \cdot (cY+d - \operatorname E(cY+d))\bigr]\\
&= \operatorname E\bigl[(aX - a\operatorname E(X)) \cdot (cY - c\operatorname E(Y))\bigr]\\
&= ac\operatorname E\bigl[(X - \operatorname E(X)) \cdot (Y - \operatorname E(Y))\bigr]\\
&= ac\operatorname{Cov}(X,Y)
\end{align}](http://upload.wikimedia.org/math/f/3/7/f37e0178d0a08aa0256a4fce0187d660.png)
![\begin{align}
\operatorname{Cov}[X,(eY+f)+(gZ+h)] &= \operatorname E\bigl[(X - \operatorname E(X)) \cdot (eY+f+gZ+h - \operatorname E(eY+f+gZ+h))\bigr]\\
&= \operatorname E\bigl[(X - \operatorname E(X)) \cdot (eY - e\operatorname E(Y) + gZ - g\operatorname E(Z))\bigr]\\
&= \operatorname E\bigl[(X - \operatorname E(X)) \cdot e(Y - \operatorname E(Y)) + (X - \operatorname E(X)) \cdot g(Z - \operatorname E(Z))\bigr]\\
&= e\operatorname E\bigl[(X - \operatorname E(X)) \cdot (Y - \operatorname E(Y))\bigr] + g\operatorname E\bigl[(X - \operatorname E(X)) \cdot (Z - \operatorname E(Z))\bigr]\\
&= e\operatorname{Cov}(X,Y) + g\operatorname{Cov}(X,Z) \qquad \Box
\end{align}](http://upload.wikimedia.org/math/9/7/e/97e09672cb5a721955922a25437868ec.png)

![\begin{align}
\operatorname{Cov}(X,Y) &= \operatorname E\bigl[(Y - \operatorname E(Y)) \cdot (X - \operatorname E(X))\bigr]\\
&= \operatorname{Cov}(Y,X) \qquad \Box
\end{align}](http://upload.wikimedia.org/math/c/a/a/caa8874fc75a35e524f4e2b8b054f99a.png)






und 
und
, 
und ebenfalls
, also
nicht stochastisch unabhängig.
und unabhängig, dann sind
und
unkorreliert, aber nicht unabhängig.

zweidimensional
mit
so gilt für die Kovarianz:
), so gilt: