Kovarianz (Stochastik)

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Dieser Artikel behandelt die Kovarianz zweier Zufallsvariablen; für die Kovarianz einer Datenreihe/Stichprobe siehe Stichprobenkovarianz.

Die Kovarianz ist in der Stochastik ein nichtstandardisiertes Zusammenhangsmaß für einen monotonen Zusammenhang zweier Zufallsvariablen mit gemeinsamer Wahrscheinlichkeitsverteilung. Der Wert dieser Kenngröße macht tendenzielle Aussagen darüber, ob hohe Werte der einen Zufallsvariablen eher mit hohen oder eher mit niedrigen Werten der anderen Zufallsvariablen einhergehen.

Definition[Bearbeiten | Quelltext bearbeiten]

Sind und zwei reelle, integrierbare Zufallsvariablen, deren Produkt ebenfalls integrierbar ist, d. h., die Erwartungswerte , und existieren, dann heißt

die Kovarianz von und . Die geforderte Existenz der Erwartungswerte ist insbesondere erfüllt, wenn und quadratintegrierbar sind, also wenn und gilt.

Eigenschaften und Rechenregeln[Bearbeiten | Quelltext bearbeiten]

Interpretation der Kovarianz[Bearbeiten | Quelltext bearbeiten]

  • Die Kovarianz ist positiv, wenn und einen monotonen Zusammenhang besitzen, d. h., hohe (niedrige) Werte von gehen mit hohen (niedrigen) Werten von einher.
  • Die Kovarianz ist hingegen negativ, wenn und einen gegensinnigen monotonen Zusammenhang aufweisen, d. h., hohe Werte der einen Zufallsvariablen gehen mit niedrigen Werten der anderen Zufallsvariablen einher und umgekehrt.
  • Ist das Ergebnis null, so besteht kein monotoner Zusammenhang zwischen und (Nichtmonotone Beziehungen sind aber möglich.).

Die Kovarianz gibt zwar die Richtung einer Beziehung zwischen zwei Zufallsvariablen an, über die Stärke des Zusammenhangs wird aber keine Aussage getroffen. Dies liegt an der Linearität der Kovarianz. Um einen Zusammenhang vergleichbar zu machen, muss die Kovarianz normiert werden. Die gebräuchlichste Normierung mittels der Standardabweichung führt zum Korrelationskoeffizienten.

Verschiebungssatz[Bearbeiten | Quelltext bearbeiten]

Zur oft einfacheren Berechnung der Kovarianz kann man auch den Verschiebungssatz als alternative Darstellung der Kovarianz anwenden.

Satz (Verschiebungssatz für die Kovarianz):

Beweis:

Beziehung zur Varianz[Bearbeiten | Quelltext bearbeiten]

Satz: Die Kovarianz ist eine Verallgemeinerung der Varianz, denn es gilt

Beweis:

Die Varianz ist demnach die Kovarianz einer Zufallsvariablen mit sich selbst.

Mit Hilfe der Kovarianzen lässt sich auch die Varianz einer Summe von quadratintegrierbaren Zufallsvariablen berechnen. Allgemein gilt

Speziell für die Summe zweier Zufallsvariablen gilt daher die Formel

Linearität, Symmetrie und Definitheit[Bearbeiten | Quelltext bearbeiten]

Satz: Die Kovarianz ist eine positiv semidefinite symmetrische Bilinearform auf dem Vektorraum der quadratisch integrierbaren Zufallsvariablen.

Es gelten also die folgenden drei Sätze:

Satz (Bilinearität): Für gilt:

Beweis:

Die Kovarianz ist offensichtlich invariant unter der Addition von Konstanten zu den Zufallsvariablen. In der zweiten Gleichung ist die Kovarianz wegen der Symmetrie auch im ersten Argument linear.

Satz (Symmetrie):

Beweis:

Satz (Positive Semidefinitheit):

Beweis:

Insgesamt folgt wie für jede positiv semidefinite symmetrische Bilinearform die Cauchy-Schwarzsche Ungleichung

Die Linearität der Kovarianz hat zur Folge, dass die Kovarianz vom Maßstab der Zufallsvariablen abhängt. So erhält man beispielsweise die zehnfache Kovarianz, wenn man anstatt die Zufallsvariable betrachtet. Insbesondere hängt der Wert der Kovarianz von den verwendeten Maßeinheiten der Zufallsvariablen ab. Da diese Eigenschaft die absoluten Werte der Kovarianz schwer interpretierbar macht, betrachtet man bei der Untersuchung auf einen linearen Zusammenhang zwischen und häufig stattdessen den maßstabsunabhängigen Korrelationskoeffizienten

Unkorreliertheit und Unabhängigkeit[Bearbeiten | Quelltext bearbeiten]

Definition (Unkorreliertheit): Sei und folglich , dann heißen die Zufallsvariablen und unkorreliert.

Satz: Seien und stochastisch unabhängige Zufallsvariablen, so gilt

Beweis: Für stochastisch unabhängige Zufallsvariablen gilt , d. h.

Der Umkehrschluss gilt im Allgemeinen nicht. Ein Gegenbeispiel ist gegeben durch eine im Intervall gleichverteilte Zufallsvariable und . Offenkundig sind und voneinander abhängig. Es gilt aber

.

Stochastisch unabhängige Zufallsvariablen, deren Kovarianz existiert, sind also auch unkorreliert. Umgekehrt bedeutet Unkorreliertheit aber nicht zwingend, dass die Zufallsvariablen stochastisch unabhängig sind, denn es kann eine nichtmonotone Abhängigkeit bestehen, die die Kovarianz nicht erfasst.

Weitere Beispiele für unkorrelierte, aber stochastisch abhängige Zufallsvariablen:

  • Seien und Zufallsvariablen mit und
Dann gilt und ,
Es folgt und ebenfalls , also
Andererseits sind und wegen nicht stochastisch unabhängig.
  • Seien die Zufallsvariablen und bernoulliverteilt mit Parameter und unabhängig, dann sind und unkorreliert, aber nicht unabhängig.
Die Unkorreliertheit ist klar, denn
Aber und sind nicht unabhängig, denn es ist

Beispiele[Bearbeiten | Quelltext bearbeiten]

  • Sei zweidimensional multinormalverteilt und mit
so gilt für die Kovarianz:
  • Sei zweidimensional multinomialverteilt (), so gilt:

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Literatur[Bearbeiten | Quelltext bearbeiten]