Erwartungswert

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Der Erwartungswert (selten und doppeldeutig Mittelwert) ist ein Grundbegriff der Stochastik. Der Erwartungswert einer Zufallsvariablen beschreibt die Zahl, die die Zufallsvariable im Mittel annimmt. Er ergibt sich zum Beispiel bei unbegrenzter Wiederholung des zugrunde liegenden Experiments als Durchschnitt der Ergebnisse. Das Gesetz der großen Zahlen beschreibt, in welcher Form genau die Durchschnitte der Ergebnisse bei wachsender Anzahl der Experimente gegen den Erwartungswert streben, oder anders gesagt, wie die Stichprobenmittelwerte bei wachsender Stichprobengröße gegen den Erwartungswert konvergieren.

Er bestimmt die Lokalisation (Lage) der Verteilung der Zufallsvariablen und ist vergleichbar mit dem empirischen arithmetischen Mittel einer Häufigkeitsverteilung in der deskriptiven Statistik. Er berechnet sich als nach Wahrscheinlichkeit gewichtetes Mittel der Werte, die die Zufallsvariable annimmt. Er muss selbst jedoch nicht einer dieser Werte sein. Insbesondere kann der Erwartungswert die Werte \pm \infty annehmen.

Weil der Erwartungswert nur von der Wahrscheinlichkeitsverteilung abhängt, wird vom Erwartungswert einer Verteilung gesprochen, ohne Bezug auf eine Zufallsvariable. Der Erwartungswert einer Zufallsvariablen kann als Schwerpunkt der Wahrscheinlichkeitsmasse betrachtet werden und wird daher als ihr erstes Moment bezeichnet.

Motivation[Bearbeiten | Quelltext bearbeiten]

Die Augenzahlen beim Würfelwurf können als unterschiedliche Ausprägungen einer Zufallsvariablen X betrachtet werden. Weil die (tatsächlich beobachteten) relativen Häufigkeiten sich gemäß dem Gesetz der großen Zahlen mit wachsendem Stichprobenumfang n den theoretischen Wahrscheinlichkeiten der einzelnen Augenzahlen annähern, muss der Mittelwert gegen den Erwartungswert von X streben. Zu dessen Berechnung werden die möglichen Ausprägungen mit ihrer theoretischen Wahrscheinlichkeit gewichtet.

\operatorname{E}(X) =1\cdot P(X=1)+2\cdot P(X=2)+3\cdot P(X=3)+4\cdot P(X=4)+5\cdot P(X=5)+6\cdot P(X=6)\,
=(1 + 2 + 3 + 4 + 5 + 6)\cdot \tfrac16 = 3{,}5.

Wie die Ergebnisse der Würfelwürfe ist der Mittelwert vom Zufall abhängig. Im Unterschied dazu ist der Erwartungswert eine feste Kennzahl der Verteilung der Zufallsvariablen X.

Die Definition des Erwartungswerts steht in Analogie zum gewichteten Mittelwert von empirisch beobachteten Zahlen. Hat zum Beispiel eine Serie von zehn Würfelversuchen die Ergebnisse 4, 2, 1, 3, 6, 3, 3, 1, 4, 5 geliefert, kann der zugehörige Mittelwert

\bar x=(4 + 2 + 1 + 3 + 6 + 3 + 3 + 1 + 4 + 5)\cdot\tfrac1{10} = 3{,}2

alternativ berechnet werden, indem zunächst gleiche Werte zusammengefasst und nach ihrer relativen Häufigkeit gewichtet werden:

\bar x = \tfrac 2{10}\cdot 1 +  \tfrac 1{10}\cdot  2 + \tfrac 3{10}\cdot  3 +  \tfrac 2{10}\cdot  4 +  \tfrac 1{10}\cdot  5 +  \tfrac 1{10}\cdot  6 = 3{,}2.

Allgemein lässt der Mittelwert der Augenzahlen in n Würfen sich wie

1\cdot h_n(1)+2\cdot h_n(2)+3\cdot h_n(3)+4\cdot h_n(4)+5\cdot h_n(5)+6\cdot h_n(6),

schreiben, worin h_n(k) die relative Häufigkeit der Augenzahl k bezeichnet.

Definitionen[Bearbeiten | Quelltext bearbeiten]

Ist eine Zufallsvariable diskret oder besitzt sie eine Dichte, so existieren die folgenden Formeln für den Erwartungswert.

Erwartungswert einer diskreten reellen Zufallsvariablen[Bearbeiten | Quelltext bearbeiten]

Im reellen diskreten Fall errechnet sich der Erwartungswert als die Summe der Produkte aus den Wahrscheinlichkeiten jedes möglichen Ergebnisses des Experiments und den „Werten“ dieser Ergebnisse.

Ist X eine reelle diskrete Zufallsvariable, die die Werte (x_i)_{i \in I} mit den jeweiligen Wahrscheinlichkeiten (p_i)_{i \in I} annimmt (mit I als abzählbarer Indexmenge), so errechnet sich der Erwartungswert \operatorname{E}(X) im Falle der Existenz mit:

\operatorname{E}(X)=\sum_{i\in I} x_i p_i=\sum_{i \in I} x_i P(X=x_i)

Es ist zu beachten, dass dabei nichts über die Reihenfolge der Summation ausgesagt wird (siehe summierbare Familie).

Ist I = \mathbb{N}, so besitzt X genau dann einen endlichen Erwartungswert \operatorname{E}(X), wenn die Konvergenzbedingung

\lim_{a\rightarrow \infty}\sum_{i=1}^a |x_i|p_i = \sum_{i=1}^\infty |x_i|p_i <\infty erfüllt ist, d. h. die Reihe für den Erwartungswert absolut konvergent ist.

Zur Berechnung ist für nichtnegative Zufallsvariable oft die folgende Eigenschaft hilfreich[1]

 \operatorname{E}(X)=\sum\limits_{i=1}^\infty P(X\geq i).

Erwartungswert einer reellen Zufallsvariablen mit Dichtefunktion[Bearbeiten | Quelltext bearbeiten]

Der Erwartungswert balanciert die Wahrscheinlichkeitsmasse – hier die Masse unter der Dichte einer Beta(α,β)-Verteilung mit Erwartungswert α/(α+β).

Hat eine reelle Zufallsvariable X eine Wahrscheinlichkeitsdichtefunktion f, das heißt hat das Bildmaß P^X diese Dichte bezüglich dem Lebesgue-Maß \lambda, so berechnet sich der Erwartungswert im Falle der Existenz als

(1) \displaystyle\quad \operatorname E(X)= \int_{\mathbb{R}} x f(x)\,\mathrm{d}\lambda(x).

In vielen Anwendungsfällen liegt (im Allgemeinen uneigentliche) Riemann-Integrierbarkeit vor und es gilt:

(2) \displaystyle\quad \operatorname E(X)=\int_{-\infty}^\infty x f(x)\,\mathrm{d}x.

Gleichwertig zu dieser Gleichung ist, wenn F Verteilungsfunktion von X ist:

(3) \displaystyle\quad\operatorname E(X)=\int_0^\infty (1-F(x))\,\mathrm{d}x - \int_{-\infty}^0 F(x)\,\mathrm{d}x.

(2) und (3) sind unter der gemeinsamen Voraussetzung (f ist Dichtefunktion und F ist Verteilungsfunktion von X) äquivalent, was mit schulgemäßen Mitteln bewiesen werden kann.[2]

Für nichtnegative Zufallsvariablen folgt daraus die wichtige Beziehung zur Zuverlässigkeitsfunktion R(t)=1-F(t)

 \operatorname{E}(X) = \int_0^\infty ( 1-F(t) ) \, \mathrm{d}t = \int_0^\infty R(t)  \, \mathrm{d}t.

Allgemeine Definition[Bearbeiten | Quelltext bearbeiten]

Der Erwartungswert wird entsprechend als das Integral bezüglich des Wahrscheinlichkeitsmaßes definiert: Ist X eine P-integrierbare oder P-quasiintegrierbare Zufallsvariable von einem Wahrscheinlichkeitsraum (\Omega,\Sigma,P) nach (\overline{\R},\mathcal{B}), wobei \mathcal{B} die Borelsche σ-Algebra über \overline{\R}:=\R\cup\{-\infty,\infty\} ist, so wird definiert

\operatorname{E}(X) = \int_\Omega X \,\mathrm{d}P = \int_\Omega X(\omega)\mathrm{d}P(\omega)\,.

Die Zufallsvariable X besitzt genau dann einen Erwartungswert, wenn sie quasiintegrierbar ist, also die Integrale

\int_\Omega X^+(\omega)\,\mathrm{d}P(\omega) und \int_\Omega X^-(\omega)\,\mathrm{d}P(\omega)

nicht beide unendlich sind, wobei X^+ und X^- den Positiv- sowie den Negativteil von X bezeichnen. In diesem Fall kann \operatorname{E}(X) = \infty oder \operatorname{E}(X) = -\infty gelten.

Der Erwartungswert ist genau dann endlich, wenn X integrierbar ist, also die obigen Integrale über X^+ und X^- beide endlich sind. Dies ist äquivalent mit

\int_\Omega |X(\omega)|\,\mathrm{d}P(\omega) < \infty .

In diesem Fall schreiben viele Autoren, der Erwartungswert existiere oder X sei eine Zufallsvariable mit existierendem Erwartungswert, und schließen damit den Fall \infty bzw. -\infty aus.

Erwartungswert von zwei Zufallsvariablen mit gemeinsamer Dichtefunktion[Bearbeiten | Quelltext bearbeiten]

Haben die integrierbaren Zufallsvariablen X und Y eine gemeinsame Wahrscheinlichkeitsdichtefunktion f(x,y), so berechnet sich der Erwartungswert einer Funktion g(X,Y) von X und Y nach dem Satz von Fubini zu

\operatorname{E}(g(X,Y))=\int_{-\infty}^\infty \int_{-\infty}^\infty g(x,y) f(x,y)\,\mathrm{d}x \,\mathrm{d}y.

Der Erwartungswert von g(X,Y) ist nur dann endlich, wenn das Integral

\int_{-\infty}^\infty \int_{-\infty}^\infty \left| g(x,y) \right| f(x,y)\,\mathrm{d}x\,\mathrm{d}y

endlich ist.

Insbesondere ist:

\operatorname{E}(X)=\int_{-\infty}^\infty \int_{-\infty}^\infty x f(x,y)\,\mathrm{d}x\,\mathrm{d}y

Aus der Randdichte errechnet sich der Erwartungswert wie bei univariaten Verteilungen:

\operatorname{E}(X)=\int_{-\infty}^\infty x f_X(x)\,\mathrm{d}x .

Dabei ist die Randdichte f_X(x) gegeben durch

f_X(x)=\int_{-\infty}^\infty f(x,y)\,\mathrm{d}y .

Elementare Eigenschaften[Bearbeiten | Quelltext bearbeiten]

Linearität[Bearbeiten | Quelltext bearbeiten]

Der Erwartungswert ist linear, es gilt also für beliebige, nicht notwendigerweise unabhängige Zufallsvariablen  X_1, X_2 , dass

 \operatorname{E}(aX_1+bX_2 )=a\operatorname{E}(X_1)+b\operatorname{E}(X_2)

ist. Als Spezialfälle ergeben sich

\operatorname{E}(cX+d)=c\operatorname{E}(X)+d,
\operatorname{E}(cX)=c\operatorname{E}(X)

und

\operatorname{E}(d) = d.

Die Linearität lässt sich auch auf endliche Summen erweitern:

\operatorname{E}\left(\sum_{i=1}^nX_i\right)=\sum_{i=1}^n\operatorname{E}(X_i)

Die Linearität des Erwartungswertes folgt aus der Linearität des Integrals.

Monotonie[Bearbeiten | Quelltext bearbeiten]

Ist  X \leq Y fast sicher, und existieren  \operatorname{E}(X), \operatorname{E}(Y) , so gilt

 \operatorname{E}(X) \leq \operatorname{E}(Y) .

Wahrscheinlichkeiten als Erwartungswerte[Bearbeiten | Quelltext bearbeiten]

Wahrscheinlichkeiten von Ereignissen lassen sich auch über den Erwartungswert ausdrücken. Für jedes Ereignis A gilt

\operatorname{P}(A) = \operatorname{E}(\chi_A)\,,

wobei \chi_A die Indikatorfunktion von A ist.

Dieser Zusammenhang ist oft nützlich, etwa zum Beweis der Tschebyschow-Ungleichung.

Dreiecksungleichung[Bearbeiten | Quelltext bearbeiten]

Es gilt

 \left|\operatorname E (X)\right| \leq \operatorname E (|X|)

und

 \operatorname E (|X+Y|) \leq \operatorname E (|X|)+\operatorname E (|Y|)

Beispiele[Bearbeiten | Quelltext bearbeiten]

Würfeln[Bearbeiten | Quelltext bearbeiten]

Das Experiment sei ein Würfelwurf. Als Zufallsvariable X betrachten wir die gewürfelte Augenzahl, wobei jede der Zahlen 1 bis 6 mit einer Wahrscheinlichkeit von jeweils 1/6 gewürfelt wird.

\operatorname{E}(X)=\sum_{i=1}^6 i\cdot \frac{1}{6} = 3{,}5

Wenn beispielsweise 1000 Mal gewürfelt wird, das Zufallsexperiment 1000 mal wiederholt wird, die geworfenen Augenzahlen zusammenzählt und durch 1000 dividiert, ergibt sich mit hoher Wahrscheinlichkeit ein Wert in der Nähe von 3,5. Es ist jedoch unmöglich, diesen Wert mit einem einzigen Würfelwurf zu erzielen.

St. Petersburger Spiel[Bearbeiten | Quelltext bearbeiten]

Das St. Petersburger Spiel ist ein Spiel, dessen zufälliger Gewinn X einen unendlichen Erwartungswert hat. Es wird eine Münze geworfen. Zeigt sie Kopf, werden 2 Euro gegeben und das Spiel ist beendet, zeigt sie Zahl, darf nochmals geworfen werden. Fällt nun Kopf, gibt es 4 Euro und das Spiel ist beendet, folgt wieder Zahl, so darf ein drittes Mal geworfen werden. Der Erwartungswert des Gewinnes X ist unendlich:

\operatorname{E}(X)= 2\cdot\frac{1}{2} + 4\cdot\frac{1}{4} + 8\cdot\frac{1}{8} + \cdots = 1 + 1 + \cdots = \infty.

Zufallsvariable mit Dichte[Bearbeiten | Quelltext bearbeiten]

Gegeben ist die reelle Zufallsvariable X mit der Dichtefunktion

f(x) = \begin{cases} \frac 1x, & 3 \le x \le 3\mathrm{e}, \\
& \\
0, & \text {sonst}, \end{cases}

wobei \mathrm{e} die Eulersche Konstante bezeichnet.

Der Erwartungswert von X berechnet sich als

\begin{align}
  \operatorname E(X)&= \int_{-\infty}^\infty x f(x)\,\mathrm{d}x = \int_{-\infty}^3 x \cdot 0\,\mathrm{d}x + \int_3^{3\mathrm{e}} x \cdot \frac 1x\,\mathrm{d}x + \int_{3\mathrm{e}}^\infty x \cdot 0 \,\mathrm{d}x\\
                    &= 0 + \int_3^{3\mathrm{e}} 1\,\mathrm{d}x + 0 = [x]^{3\mathrm{e}}_3 = 3\mathrm{e}-3 = 3(\mathrm{e}-1).
\end{align}

Allgemeine Definition[Bearbeiten | Quelltext bearbeiten]

Gegeben sei der Wahrscheinlichkeitsraum (\Omega, \Sigma, P) mit \Omega = \{\omega_1, \omega_2 , \omega_3\}, \Sigma die Potenzmenge von \Omega und P(\{\omega_i\})=\tfrac{1}{3} für i=1,2,3. Der Erwartungswert der Zufallsvariablen X \colon \Omega \to \R mit X(\omega_1) = X(\omega_2) = 1 und X(\omega_3) = 2 ist

\operatorname{E}(X) = \int_\Omega X \, \mathrm{d}P = X(\omega_1)P(\{\omega_1\}) + X(\omega_2)P(\{\omega_2\}) + X(\omega_3)P(\{\omega_3\}) = 1 \cdot \frac{1}{3} + 1 \cdot \frac{1}{3} + 2 \cdot \frac{1}{3} = \frac{4}{3}.

Da X eine diskrete Zufallsvariable ist mit P(X=1) = P(\{\omega_1, \omega_2\}) = \tfrac{2}{3} und P(X=2) = P(\{\omega_3\}) = \tfrac{1}{3}, kann der Erwartungswert alternativ auch berechnet werden als

\operatorname{E}(X) = 1 \cdot P(X=1) + 2 \cdot P(X=2) = 1 \cdot \frac{2}{3} + 2 \cdot \frac{1}{3} = \frac{4}{3}.

Weitere Eigenschaften[Bearbeiten | Quelltext bearbeiten]

Sigma-Additivität[Bearbeiten | Quelltext bearbeiten]

Sind alle Zufallsvariablen  (X_i)_{i\in \mathbb{N}} fast sicher nichtnegativ, so lässt sich die endliche Additivität sogar zur  \sigma -Additivität erweitern:

 \operatorname{E} \left( \sum_{i=1}^\infty X_i\right)=\sum_{i=1}^\infty\operatorname{E}(X_i)

Erwartungswert des Produkts von n stochastisch unabhängigen Zufallsvariablen[Bearbeiten | Quelltext bearbeiten]

Wenn die Zufallsvariablen X_i stochastisch voneinander unabhängig und integrierbar sind, gilt:

\operatorname{E}\!\left(\prod_{i=1}^n X_{i}\right) = \prod_{i=1}^n \operatorname{E}(X_{i})

insbesondere auch

 \operatorname{E}\!\left(X_iX_j\right) = \operatorname{E}\!\left(X_i\right) \cdot \operatorname{E}\!\left(X_j\right) für i \neq j

Erwartungswert einer zusammengesetzten Zufallsvariable[Bearbeiten | Quelltext bearbeiten]

Ist  Y eine zusammengesetzte Zufallsvariable, sprich sind  N, X_1, X_2, \dots unabhängige Zufallsvariablen und sind die  X_i identisch verteilt und ist  N auf  \mathbb{N}_0 definiert, so lässt sich  Y darstellen als

 Y:=\sum_{i=1}^NX_i .

Existieren die ersten Momente von  N, X_1, X_2, \dots , so gilt

 \operatorname{E}(Y)=\operatorname{E}(N)\operatorname{E}(X_1) .

Diese Aussage ist auch als Formel von Wald bekannt.

Monotone Konvergenz[Bearbeiten | Quelltext bearbeiten]

Sind die nichtnegativen Zufallsvariablen  (X_i)_{i \in \mathbb{N}} fast sicher punktweise monoton wachsend und konvergieren fast sicher gegen eine weitere Zufallsvariable  X , so gilt

 \lim_{i \to \infty} \operatorname{E}(X_i)=\operatorname{E}(X) .

Dies ist der Satz von der monotonen Konvergenz in der wahrscheinlichkeitstheoretischen Formulierung.

Berechnung mittels der kumulantenerzeugenden Funktion[Bearbeiten | Quelltext bearbeiten]

Die kumulantenerzeugende Funktion einer Zufallsvariable ist definiert als

 g_X(t)=\ln \operatorname{E} (e^{tX}) .

Wird sie abgeleitet und an der Stelle 0 ausgewertet, so ist der Erwartungswert:

\operatorname{E}(X) = g'_X(0) .

Die erste Kumulante ist also der Erwartungswert.

Berechnung mittels der charakteristischen Funktion[Bearbeiten | Quelltext bearbeiten]

Die charakteristische Funktion einer Zufallsvariable  X ist definiert als  \varphi_X(t):=\operatorname{E}(e^{itX}) . Mit ihrer Hilfe lässt sich durch Ableiten der Erwartungswert der Zufallsvariable bestimmen:

 \operatorname{E}(X)=\frac{\varphi_X'(0)}{\mathrm i} .

Berechnung mittels der momenterzeugenden Funktion[Bearbeiten | Quelltext bearbeiten]

Ähnlich wie die charakteristische Funktion ist die momenterzeugende Funktion definiert als

M_X(t):=E\left(e^{tX}\right).

Auch hier lässt sich der Erwartungswert einfach bestimmen als

 \operatorname{E}(X)=M_X'(0) .

Dies folgt daraus, dass der Erwartungswert das erste Moment ist und die k-ten Ableitungen der momenterzeugenden Funktion an der 0 genau die k-ten Momente sind.

Berechnung mittels der wahrscheinlichkeitserzeugenden Funktion[Bearbeiten | Quelltext bearbeiten]

Wenn X nur natürliche Zahlen als Werte annimmt, lässt sich der Erwartungswert für auch mithilfe der wahrscheinlichkeitserzeugenden Funktion

m_X(t):=E\left(t^X\right).

berechnen. Es gilt dann

\operatorname{E}\left[X \right] =  \lim_{t \uparrow 1} m_X'(t),

falls der linksseitige Grenzwert existiert.

Beste Approximation[Bearbeiten | Quelltext bearbeiten]

Ist  X eine Zufallsgröße auf einem Wahrscheinlichkeitsraum (\Omega,\Sigma,P), so beschreibt  \operatorname{E} \left( X \right) die beste Approximation an  X im Sinne der Minimierung von  \operatorname{E} \left(  \left( X-a \right)^2  \right) , wobei a eine reelle Konstante ist. Dies folgt aus dem Satz über die beste Approximation, da

 \langle X-E(X), b \rangle =0

für alle konstanten  b ist, wobei  \langle .,. \rangle das  L^2 -Standardnormalskalarprodukt bezeichne. Diese Auffassung des Erwartungswertes macht die Definition der Varianz als minimaler mittlerer quadratischer Abstand sinnvoll.

Erwartungswerte von Funktionen von Zufallsvariablen[Bearbeiten | Quelltext bearbeiten]

Wenn Y=g(X) wieder eine Zufallsvariable ist, so kann der Erwartungswert von Y, statt mittels der Definition, auch mittels der Formel bestimmt werden:

\operatorname{E}(Y)=\operatorname{E}(g(X))=\int_{-\infty}^\infty g(x) f_X(x)\,\mathrm{d}x

Auch in diesem Fall existiert der Erwartungswert nur, wenn

\int_{-\infty}^\infty \left| g(x) \right| f_X(x)\,\mathrm{d}x

konvergiert.

Bei einer diskreten Zufallsvariablen wird eine Summe verwendet:

\operatorname{E}(Y)=\operatorname{E}(g(X))=\sum_i g(x_i)  p_X(x_i).

Ist die Summe nicht endlich, dann muss die Reihe absolut konvergieren, damit der Erwartungswert existiert.

Verwandte Konzepte und Verallgemeinerungen[Bearbeiten | Quelltext bearbeiten]

Lageparameter[Bearbeiten | Quelltext bearbeiten]

Wird der Erwartungswert als Schwerpunkt der Verteilung einer Zufallsvariable aufgeasst, so handelt es sich um einen Lageparameter. Dieser gibt an, wo sich der Hauptteil der Verteilung befindet. Weitere Lageparameter sind

  1. Der Modus: Der Modus gibt an, an welcher Stelle die Verteilung ein Maximum hat, sprich bei diskreten Zufallsvariablen die Ausprägung mit der größten Wahrscheinlichkeit und bei stetigen Zufallsvariable die Maximastellen der Dichtefunktion. Der Modus existiert zwar im Gegensatz zum Erwartungswert immer, muss aber nicht eindeutig sein. Beispiele für nichteindeutige Modi sind bimodale Verteilungen.
  2. Der Median ist ein weiterer gebräuchlicher Lageparameter. Er gibt an, welcher Wert auf der x-Achse die Wahrscheinlichkeitsdichte so trennt, dass links und rechts des Medians jeweils die Hälfte der Wahrscheinlichkeit anzutreffen ist. Auch der Median existiert immer, muss aber (je nach Definition) nicht eindeutig sein.

Momente[Bearbeiten | Quelltext bearbeiten]

Wird der Erwartungswert als erstes Moment aufgefasst, so ist er eng verwandt mit den Momenten höherer Ordnung. Da diese wiederum durch den Erwartungswert in Verknüpfung mit einer Funktion  g(\cdot ) definiert werden, sind sie gleichsam ein Spezialfall. Einige der bekannten Momente sind:

  • Die Varianz: Zentriertes zweites Moment, g(X)=(X-\mu_x)^2. Hierbei ist \mu_X der Erwartungswert.
  • Die Schiefe: Zentriertes drittes Moment, normiert auf die dritte Potenz der Standardabweichung  \sigma_X . Es ist  g(X)=\frac{(X-\mu_X)^3}{\sigma_X^3} .
  • Die Wölbung: Zentriertes viertes Moment, normiert auf  \sigma_X^4 . Es ist  g(X)=\frac{(X-\mu_X)^4}{\sigma_X^4} .

Bedingter Erwartungswert[Bearbeiten | Quelltext bearbeiten]

Der bedingte Erwartungswert ist eine Verallgemeinerung des Erwartungswertes auf den Fall, dass Gewisse Ausgänge des Zufallsexperiments bereits bekannt sind. Damit lassen sich bedingte Wahrscheinlichkeiten verallgemeinern und auch die bedingte Varianz definieren. Der bedingte Erwartungswert spielt eine wichtige Rolle in der Theorie der stochastischen Prozesse.

Begriff und Notation[Bearbeiten | Quelltext bearbeiten]

Das Konzept des Erwartungswertes geht auf Christiaan Huygens zurück. In einer Abhandlung über Glücksspiele von 1656, „Van rekeningh in spelen van geluck“ bezeichnet Huygens den erwarteten Gewinn eines Spiels als „het is my soo veel weerdt“. Frans van Schooten verwendete in seiner Übersetzung von Huygens' Text ins Lateinische den Begriff expectatio. Bernoulli übernahm in seiner Ars conjectandi den von van Schooten eingeführten Begriff in der Form valor expectationis.[3]

Im westlichen Bereich wird für den Operator  \operatorname{E}\left(X\right) verwendet, speziell in anglophoner Literatur \operatorname{E}\left[X\right].

In der russischsprachigen Literatur findet sich die Bezeichnung M(X).[4]

Die Bezeichnung \mu_X betont die Eigenschaft als nicht vom Zufall abhängiges erstes Moment. In der Physik findet die Bra-Ket-Notation Verwendung.[5] Insbesondere wird \langle X \rangle statt \operatorname{E}(X) für den Erwartungswert einer Größe X geschrieben.

Quantenmechanischer Erwartungswert[Bearbeiten | Quelltext bearbeiten]

Ist \psi(r,t)=\langle r|\psi(t)\rangle die Wellenfunktion eines Teilchens in einem bestimmten Zustand |\psi(t)\rangle und ist \hat O ein Operator, so ist

\langle \hat O \rangle_{|\psi(t)\rangle}:=
\langle\psi(t)|\hat O |\psi(t)\rangle=
\int_{M^2} \mathrm{d}^n r\, \mathrm{d}^n r^\prime\, \psi^\star (r,t)\langle r|\hat O|r^\prime\rangle\psi(r^\prime,t)

der quantenmechanische Erwartungswert von \hat O im Zustand |\psi(t)\rangle. M ist hierbei der Ortsraum, in dem sich das Teilchen bewegt, n ist die Dimension von M, und ein hochgestellter Stern steht für komplexe Konjugation.

Lässt sich \hat O als formale Potenzreihe O(\hat r,\hat p) schreiben (und das ist oft so), so wird die Formel verwendet

\langle \hat O\rangle_\psi = \int_M \mathrm{d}^n r\, \psi^\star(r,t) O(r,\frac{\hbar}{i}\nabla_r)\psi(r,t).

Der Index an der Erwartungswertsklammer wird nicht nur wie hier abgekürzt, sondern manchmal auch ganz weggelassen.

Beispiel

Der Erwartungswert des Aufenthaltsorts in Ortsdarstellung ist

\langle\hat r\rangle =
\int_M \mathrm{d}^n r\, \psi^\star(r,t)r\psi(r,t)=
\int_M \mathrm{d}^n r\, r|\psi(r,t)|^2 =\int_M \mathrm{d}^n r\, rf(r,t).

Der Erwartungswert des Aufenthaltsorts in Impulsdarstellung ist

\langle\hat r\rangle =
\int_M \mathrm{d}^n p\,\Psi^\star(p,t)i\hbar\vec\nabla_p\Psi(p,t),

wobei wir die Wahrscheinlichkeitsdichtefunktion der Quantenmechanik im Ortsraum identifiziert haben. In der Physik wird \rho (rho) statt f geschrieben.

Erwartungswert von Matrizen[Bearbeiten | Quelltext bearbeiten]

Ist X eine m \times n Matrix, dann ist der Erwartungswert der Matrix definiert als:


\operatorname{E}\left(X\right)
=
\operatorname{E}\left(
\begin{bmatrix}
 x_{1,1} & x_{1,2} & \cdots & x_{1,n} \\
 x_{2,1} & x_{2,2} & \cdots & x_{2,n} \\
 \vdots \\
 x_{m,1} & x_{m,2} & \cdots & x_{m,n}
\end{bmatrix}\right)
=
\begin{bmatrix}
 \operatorname{E}(x_{1,1}) & \operatorname{E}(x_{1,2}) & \cdots & \operatorname{E}(x_{1,n}) \\
 \operatorname{E}(x_{2,1}) & \operatorname{E}(x_{2,2}) & \cdots & \operatorname{E}(x_{2,n}) \\
 \vdots \\
 \operatorname{E}(x_{m,1}) & \operatorname{E}(x_{m,2}) & \cdots & \operatorname{E}(x_{m,n})
\end{bmatrix}

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Literatur[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Ross, S. M.:Introduction to probability models, Academic Press, 2007, 9. Auflage, S. 143, ISBN 0-12-598062-0
  2. H. Wirths : Der Erwartungswert - Skizzen zur Begriffsentwicklung von Klasse 8 bis 13. In : Mathematik in der Schule 1995/Heft 6, S. 330–-343
  3. Norbert Henze: Stochastik für Einsteiger. Vieweg+Teubner, 2008. ISBN 978-3-8348-9465-6. S. 79.
  4. Siehe etwa A. N. Širjaev: Wahrscheinlichkeit 1988, S. 52 ff !
  5. John Aldrich: Earliest Uses of Symbols in Probability and Statistics. online