A-posteriori-Wahrscheinlichkeit

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Die A-posteriori-Wahrscheinlichkeit ist ein Begriff aus der bayesschen Statistik. Sie beschreibt den Wissensstand über einen unbekannten Umweltzustand \theta a posteriori, das heißt nach der Beobachtung einer mit \theta in statistischer Abhängigkeit stehenden Zufallsgröße X.

Definition[Bearbeiten]

Folgende Situation ist gegeben: \theta ist ein unbekannter Umweltzustand (z. B. ein Parameter einer Wahrscheinlichkeitsverteilung), der auf der Basis von Beobachtungen x einer Zufallsgröße X geschätzt werden soll.

Gegeben sei eine Verteilung für den Parameter \theta vor der Beobachtung der Stichprobe. Diese Verteilung wird auch A-priori-Verteilung genannt.

Weiterhin sei die Dichte (bzw. im diskreten Fall: die Wahrscheinlichkeitsfunktion) der bedingten Verteilung der Stichprobe unter der Bedingung \theta=\theta_0 gegeben. Diese Dichte (bzw. Wahrscheinlichkeitsfunktion) wird im folgenden mit f(x|\theta_0) bezeichnet.

Die A-posteriori-Verteilung ist die Verteilung des Populationsparameters \theta unter der Bedingung, dass für die Zufallsgröße X der Wert x beobachtet wurde. Die A-posteriori-Verteilung wird mit Hilfe des Satzes von Bayes aus der A-priori-Verteilung und der bedingten Verteilung der Stichprobe unter der Bedingung \theta=\theta_0 berechnet.

A-posteriori-Verteilung[Bearbeiten]

Für stetige A-priori-Verteilungen[Bearbeiten]

Eine stetige A-priori-Verteilung liegt dann vor, wenn die A-priori-Verteilung auf der Menge der reellen Zahlen \R oder auf einem Intervall in \R definiert ist. Beispiele für stetige A-priori-Verteilungen sind:

  • die Normalverteilung (hier ist der Parameterraum \Theta die Menge der reellen Zahlen) oder
  • die Gleichverteilung auf dem Intervall [0;1] (hier ist der Parameterraum \Theta das Intervall [0;1]).

Im Folgenden steht g(\theta) für die auf dem Parameterraum \Theta definierte A-priori-Dichte von \theta.

In diesem Fall kann die A-posteriori-Dichte h(\theta|x) folgendermaßen berechnet werden:[1]

h(\theta_0\mid x) = \frac{f(x\mid \theta_0) \, g(\theta_0)}{\displaystyle\int_\Theta f(x \mid\theta') \, g(\theta') \, d\theta'} \!

Für diskrete A-priori-Verteilungen[Bearbeiten]

Im folgenden Abschnitt steht P(\theta=\theta_0) für die diskrete A-priori-Wahrscheinlichkeit, dass der Parameter \theta den Wert \theta_0 annimmt. Eine diskrete A-priori-Verteilung ist auf einer endlichen Menge oder auf einer Menge mit abzählbar unendlichem Träger definiert.

Die A-posteriori-Wahrscheinlichkeit wird im Folgenden mit P(\theta=\theta_0|x) bezeichnet und kann auf folgende Weise berechnet werden:[1]

P(\theta=\theta_0|x) = \frac{f(x|\theta_0) \, P(\theta=\theta_0)}{\displaystyle\sum_{\theta' \in \Theta} f(x|\theta') \, P(\theta=\theta')} \!

Bedeutung in der bayesianischen Statistik[Bearbeiten]

In der bayesianischen Statistik stellt die A-posteriori-Verteilung den neuen, durch Vorwissen und Beobachtung bestimmten Kenntnisstand über die Verteilung des Parameters \theta nach der Beobachtung der Stichprobe dar.

Damit ist die A-posteriori-Verteilung die Grundlage zur Berechnung aller Punktschätzer (siehe Bayes-Schätzer) und Konfidenzintervalle in der bayesianischen Statistik.[1]

Beispiel[Bearbeiten]

In einer Urne befinden sich rote und schwarze Kugeln. Es ist bekannt, dass der Anteil roter Kugeln entweder bei 40 % oder aber bei 60 % liegt. Um Genaueres herauszufinden, werden (mit Zurücklegen) 11 Kugeln aus der Urne gezogen. Es werden 4 rote und 7 schwarze Kugeln gezogen.

Die Zufallsgröße „Anzahl gezogener roter Kugeln“ wird im Folgenden mit X bezeichnet, der tatsächlich beobachtete Wert der Zufallsgröße mit x.

Die Zufallsgröße X ist binomialverteilt mit unbekanntem Parameter \theta, wobei \theta nur einen der Werte 0{,}4 oder 0{,}6 annehmen kann. Da kein weiteres Vorwissen bekannt ist, wird als A-priori-Verteilung für \theta eine diskrete Gleichverteilung angenommen, d. h.

Pr(\theta=0{,}4)=Pr(\theta=0{,}6)=0{,}5.

Die Wahrscheinlichkeitsfunktion für X=x ergibt sich aus der Binomialverteilung zu

f(X=4\mid\theta=\theta_0)={11 \choose 4} \;  {\theta_0}^4 \; (1-\theta_0)^7.

Man erhält daher für \theta=0{,}4

f(X=4\mid\theta=0{,}4)={11 \choose 4}\; 0{,}4^4 \;0{,}6^7=0{,}236.

Für \theta=0{,}6 erhält man

f(X=4\mid\theta=0{,}6)={11 \choose 4} \; 0{,}6^4 \; 0{,}4^7=0{,}07.

Die A-posteriori-Verteilung kann nun mit Hilfe des Satzes von Bayes berechnet werden. Für \theta=0{,}4 erhält man als A-posteriori-Wahrscheinlichkeit

P(\theta=0{,}4\mid x=4)=\frac{0{,}5 \cdot 0{,}236}{0{,}5 \cdot 0{,}236 + 0{,}5 \cdot 0{,}07 }=0{,}77.

Für \theta=0{,}6 ergibt sich die A-posteriori-Wahrscheinlichkeit

P(\theta=0{,}6\mid x=4)=\frac{0{,}5 \cdot 0{,}07}{0{,}5 \cdot 0{,}236 + 0{,}5 \cdot 0{,}07 }=0{,}23.

Somit ist man sich nach Ziehung der Stichprobe mit Wahrscheinlichkeit 0{,}77 sicher, dass der Anteil roter Kugeln in der Urne 40 % beträgt.

Einzelnachweise[Bearbeiten]

  1. a b c Bernhard Rüger (1988), S. 152 ff.

Literatur[Bearbeiten]

  • Bernhard Rüger: Induktive Statistik. Einführung für Wirtschafts- und Sozialwissenschaftler. R. Oldenbourg Verlag, München Wien 1988. ISBN 3-486-20535-8
  • Hans-Otto Georgii: Stochastik - Einführung in die Wahrscheinlichkeitstheorie und Statistik. de Gruyter Verlag, Berlin New York 2007. ISBN 978-3-11-019349-7