Beta-Binomialverteilung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Die Beta-Binomialverteilung ist eine univariate diskrete Wahrscheinlichkeitsverteilung, welche als eine Art Verallgemeinerung der Binomialverteilung angesehen werden kann, da in dieser die Wahrscheinlichkeit von x Erfolgen auf n bei gegebener Wahrscheinlichkeit eines Einzelerfolges angegeben wird, während in der Beta-Binomialverteilung die Erfolgswahrscheinlichkeit nur ungenau bekannt ist und durch eine Betaverteilung B(a,b) beschrieben wird. Es handelt sich somit um eine Mischverteilung.

Die Beta-Binomialverteilung hat drei Parameter: n, a, b

Definition[Bearbeiten]

Eine Zufallsvariable X hat eine Beta-Binomialverteilung mit den Parametern n \in \N_0, a > 0 und b > 0, in Zeichen X \sim BeB(n,a,b), wenn für alle x aus dem Träger \{0,1,\ldots,n\} gilt:

P(X=x) = C {n \choose x} \Gamma(a+x) \Gamma(b+n-x).

Dabei wird die Konstante C folgendermaßen berechnet

C = \frac{\Gamma(a+b)}{\Gamma(a) \Gamma(b) \Gamma (a+b+n)}

mit der Gammafunktion \Gamma.

Eine alternative Schreibweise ist

P(X=x) = {n \choose x} \frac{\Beta(a+x , b+n-x)}{\Beta (a, b)},

wobei \Beta die Betafunktion ist.

Eigenschaften[Bearbeiten]

Der Erwartungswert hängt von allen drei Parametern ab:

E(X) = n \frac{a}{a+b},

so wie auch die Varianz:

Var(X) = n \frac{a b}{(a+b)^2} \frac{a+b+n}{a+b+1}.

Die Schiefe wird angegeben mit

(a + b + 2 n)\frac{b-a}{a+b+2} \sqrt{\frac{1+a+b}{n a b (n+a+b)}}

Spezialfälle[Bearbeiten]

Falls a=1 und b=1, dann handelt es sich um eine diskrete Gleichverteilung mit P(X=x)=\tfrac1{n+1}, da der Träger n+1 Werte beinhaltet.

Anwendungsbereiche[Bearbeiten]

Die Beta-Binomialverteilung wird typischerweise in Fällen angewendet, bei denen man üblicherweise eine Binomialverteilung benutzen würde, aber nicht davon ausgehen kann, dass alle Einzelereignisse dieselbe Wahrscheinlichkeit haben einzutreten, sondern diese Wahrscheinlichkeiten mehr oder minder glockenförmig um einen Wert liegen.

Will man zum Beispiel wissen, wie viele Glühlampen innerhalb der nächsten 12 Monaten ausfallen werden, geht aber davon aus, dass die Wahrscheinlichkeit eines Ausfalls einer Glühlampe zwischen verschiedenen Lieferkartons abweicht, dann ist eine Beta-Binomialverteilung angebracht.

Empirisch kann man vermuten, mit einer Beta-Binomialverteilung zu tun zu haben, obwohl man eher an ein Binomialmodell denken würde, falls die Daten mehr streuen als von der Binomialverteilung vorgesehen.

Beispiel[Bearbeiten]

Modell in der Bayesschen Statistik[Bearbeiten]

Eine Urne enthält eine unbekannte Anzahl von Bällen, von denen man aus anderen Stichproben weiß, dass der Anteil roter Bälle von einer Betaverteilung B(a,b) beschrieben wird.

Es sollen n-mal Bälle gezogen werden (mit Zurücklegen). Die Wahrscheinlichkeit, dass x mal ein roter Ball gezogen wird, ist in der Beta-Binomialverteilung BeB(n,a,b).

Zahlenbeispiel[Bearbeiten]

Ausgehend von einer kompletten Unwissenheit der apriori Verteilung, die mit einer Beta(1,1) beschrieben wird (Alternativen sind z. B. Beta(\tfrac 12,\tfrac 12)), wird eine "Vorstudie" mit einer Ziehung (mit Wiederholung) von 15 Bällen organisiert. Einer dieser Bälle ist rot. Somit wird die a posteriori Verteilung mit der Beta(1+1,1+14)=Beta(2,15) beschrieben.

Die eigentliche "Studie" sieht eine Ziehung von 40 Bällen vor. Gefragt ist die Wahrscheinlichkeit, dass genau zwei Mal ein roter Ball gezogen wird.

Da in dieser zweiten Ziehung die Wahrscheinlichkeit P(X=x) jene einer BeB(40,2,15) ist, lässt sie sich wie folgt berechnen:

P(X=2, n=40, a=2, b=15) = C {40 \choose 2} \Gamma(2+2) \Gamma(15+40-2),

wobei

C = \frac{\Gamma(2+15)}{\Gamma(2) \Gamma(15) \Gamma (2+15+40)}

und da {40 \choose 2} =  780 und außerdem allgemein \Gamma(k) = (k-1)!\, ist, erhält man

Die im Beispiel benutzten Zufallsvariablen

\begin{align}P(X=2 | n=40, a=2, b=15) &= \frac{16!}{1 \cdot 14! \cdot 56!} (780 \cdot 6 \cdot 52!) \\
&= 780 \cdot 6 \cdot \frac{16!}{14!} \cdot \frac{54!}{56!} = \frac{780}{53} \cdot  \frac{6}{54} \cdot  \frac{15}{55} \cdot \frac{16}{56}\\
&= \frac{260}{53}  \cdot  \frac{2}{77} = 0{,}12741975 = 12{,}74 \%.
\end{align}
 

Dieses Ergebnis weicht wesentlich von jenem, welches mit einer „einfachen“ Binomialverteilung B(n=40, p=\tfrac 1{15}) berechnet worden wäre, ab. In diesem Fall wäre das Ergebnis P(X=2,n=40, p=\tfrac1{15})= 25{,}19 \%.

Aus der Grafik wird ersichtlich, dass die „einfache“ Binomialverteilung B(n=40, p=\tfrac 1{15}) weniger Ergebnisse „zulässt“ als die BeB(n=40,a=2,b=15). Dies geschieht, da man in dem Bayesianischen Modell nicht vernachlässigt, dass der „wahre“ Anteil an roten Bällen im Grunde unbekannt ist, und somit die Ergebnisse stärker streuen.

Literatur[Bearbeiten]

Siehe auch[Bearbeiten]

Weblinks[Bearbeiten]