Varianz (Stochastik)

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Dieser Artikel behandelt den theoretischen Varianzbegriff. Zur empirischen Varianz siehe Stichprobenvarianz.
Dichtefunktionen zweier normalverteilter Zufallsvariablen mit gleichem Erwartungswert aber unterschiedlichen Varianzen. Die waagerechte Achse zeigt den Wert, die senkrechte die Häufigkeit.
Die rote Kurve hat eine geringere Varianz (entsprechend der Breite) als die grüne.
Die Quadratwurzel der Varianz, die Standardabweichung, kann bei der Normalverteilung an den Wendepunkten ersehen werden.

In der Stochastik ist die Varianz eine wichtige Kenngröße der Wahrscheinlichkeitsverteilung einer reellen Zufallsvariablen. Sie beschreibt die erwartete quadratische Abweichung der Zufallsvariablen von ihrem Erwartungswert. Damit stellt die Varianz das zweite zentrale Moment der Zufallsvariablen dar. Die Quadratwurzel der Varianz wird Standardabweichung der Zufallsvariablen genannt.

Die Varianz ist translationsinvariant und eine homogene Funktion zweiten Grades. Die Varianz einer Summe unkorrelierter Zufallsvariablen ist gleich der Summe ihrer Varianzen. Ein wichtiges Hilfsmittel zur Berechnung der Varianz stellt der Verschiebungssatz dar. Die Varianz kann mit einem Varianzschätzer, etwa ihrer empirischen Entsprechung, der Stichprobenvarianz, geschätzt werden.

Definition[Bearbeiten | Quelltext bearbeiten]

Es sei eine reelle Zufallsvariable, die integrierbar ist, das heißt, es gilt . Dann existiert ihr Erwartungswert , und man definiert die Varianz von wie folgt:

Ist quadratisch integrierbar, gilt also , so ist die Varianz endlich. Die Varianz wird auch als , oder einfach als notiert.

Berechnung bei diskreten Zufallsvariablen[Bearbeiten | Quelltext bearbeiten]

Eine reelle Zufallsvariable mit einem endlichen oder abzählbar unendlichen Wertebereich wird diskret genannt. Ihre Varianz berechnet sich dann als

Hierbei ist die Wahrscheinlichkeit, dass den Wert annimmt, und

der Erwartungswert von . Die Summen erstrecken sich jeweils über alle Werte, die die Zufallsvariable annehmen kann.

Berechnung bei stetigen Zufallsvariablen[Bearbeiten | Quelltext bearbeiten]

Wenn eine Zufallsvariable eine Wahrscheinlichkeitsdichtefunktion hat, gilt

wobei

Rechenregeln[Bearbeiten | Quelltext bearbeiten]

Verschiebungssatz[Bearbeiten | Quelltext bearbeiten]

Varianzen lassen sich oft einfacher mit Hilfe des Verschiebungssatzes

berechnen, da hierzu außer dem Erwartungswert von nur noch der Erwartungswert von bestimmt werden muss.
Diskret bedeutet das:

Am Computer ist diese Art der Berechnung aber zu vermeiden, da es bei der Verwendung von Fließkommazahlen leicht zu katastrophaler Auslöschung kommen kann.

Lineare Transformation[Bearbeiten | Quelltext bearbeiten]

Für reelle Zahlen und gilt

Dies kann mittels des Verschiebungssatzes hergeleitet werden:

Insbesondere für und folgt

Varianz von Summen von Zufallsvariablen[Bearbeiten | Quelltext bearbeiten]

Für die Varianz einer beliebigen Summe von Zufallsvariablen gilt allgemein

Hierin bezeichnet die Kovarianz der Zufallsvariablen und und es wurde verwendet, dass gilt. Speziell für zwei Zufallsvariablen und ergibt sich beispielsweise

Sind die Zufallsvariablen paarweise unkorreliert, das heißt ihre Kovarianzen sind alle gleich Null, dann folgt:

Dieser Satz wird auch als Gleichung von Bienaymé bezeichnet. Er gilt insbesondere dann, wenn die Zufallsvariablen unabhängig sind, denn aus Unabhängigkeit folgt Unkorreliertheit.

Charakteristische Funktion[Bearbeiten | Quelltext bearbeiten]

Die Varianz einer Zufallsvariablen lässt sich auch mit Hilfe ihrer charakteristischen Funktion darstellen. Wegen und folgt nämlich mit dem Verschiebungssatz

Momenterzeugende Funktion[Bearbeiten | Quelltext bearbeiten]

Da für die momenterzeugenden Funktion der Zusammenhang

gilt, lässt sich die Varianz damit auf folgende Weise berechnen:

Wahrscheinlichkeitserzeugende Funktion[Bearbeiten | Quelltext bearbeiten]

Auch mit der wahrscheinlichkeitserzeugenden Funktion

lässt sich für diskrete die Varianz berechnen. Es gilt dann

,

falls der linksseitige Grenzwert existiert.

Kumulantenerzeugende Funktion[Bearbeiten | Quelltext bearbeiten]

Die kumulantenerzeugende Funktion einer Zufallsvariable ist definiert als

.

Leitet man sie zweimal ab und wertet sie an der Stelle 0 aus, so erhält man die Varianz:

.

Die zweite Kumulante ist also die Varianz.

Varianz einer zusammengesetzten Zufallsvariable[Bearbeiten | Quelltext bearbeiten]

Ist eine zusammengesetzte Zufallsvariable, sprich sind unabhängige Zufallsvariablen und sind die identisch verteilt und ist auf definiert, so lässt sich darstellen als

.

Existieren die zweiten Momente von , so gilt

.

Diese Aussage ist auch als Blackwell-Girshick-Gleichung bekannt.

Beziehung zur Kovarianz[Bearbeiten | Quelltext bearbeiten]

Die Kovarianz steht mit der Varianz in folgender Beziehung:

.

Die folgt direkt aus den Definitionen. Des Weiteren gilt die Cauchy-Schwarzsche Ungleichung

,

da die Kovarianz eine positiv semidefinite Bilinearform ist.

Beispiele[Bearbeiten | Quelltext bearbeiten]

Diskrete Zufallsvariable[Bearbeiten | Quelltext bearbeiten]

Gegeben ist eine diskrete Zufallsvariable , welche die Werte , und mit je den Wahrscheinlichkeiten , und annimmt. Der Erwartungswert beträgt

und die Varianz ist demnach

Mit dem Verschiebungssatz erhält man ebenfalls

Für die Standardabweichung ergibt sich damit

Stetige Zufallsvariable[Bearbeiten | Quelltext bearbeiten]

Eine stetige Zufallsvariable habe die Dichtefunktion

.

Mit dem Erwartungswert von

und dem Erwartungswert von

berechnet sich die Varianz mit Hilfe des Verschiebungssatzes als

Verwandte Begriffe[Bearbeiten | Quelltext bearbeiten]

Fasst man die Varianz als Streumaß der Verteilung einer Zufallsvariable auf, so ist sie mit den folgenden Streumaßen verwandt:

In der Statistik gibt es noch weitere empirische Streumaße, die sich aber nicht alle sinnvoll für Verteilungen definieren lassen.

Verallgemeinerungen[Bearbeiten | Quelltext bearbeiten]

Im Falle eines reellen Zufallsvektors mit quadratisch integrierbaren Komponenten verallgemeinert sich die Varianz zu der Kovarianzmatrix eines Zufallsvektors:

Dabei ist der Vektor der Erwartungswerte. Der Eintrag der -ten Zeile und -ten Spalte der Kovarianzmatrix ist . In der Diagonale stehen also die Varianzen der einzelnen Komponenten.

Analog zu bedingten Erwartungswerten lassen sich beim Vorliegen von Zusatzinformationen, wie beispielsweise den Werten einer weiteren Zufallsvariablen, bedingte Varianzen betrachten.

Weblinks[Bearbeiten | Quelltext bearbeiten]