Verallgemeinerte Binomialverteilung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Verallgemeinerte Binomialverteilung
Wahrscheinlichkeitsverteilung
Pmf genBinom.png
Verteilungsfunktion
Cdf genBinom.png
Parameter \mathbf{p}\in [0,1]^n — Erfolgswahrscheinlichkeiten für jeden der n Versuche
Träger k \in \{0, \dots,n\}
Dichtefunktion \sum\limits_{A\in B_k} \prod\limits_{i\in A} p_i \prod\limits_{j\in A^c} (1-p_j)
Verteilungsfunktion \sum\limits_{l=0}^k \sum\limits_{A\in B_l} \prod\limits_{i\in A} p_i \prod\limits_{j\in A^c}{(1-p_j)}
Erwartungswert \sum\limits_{i=1}^n p_i
Varianz  \sum\limits_{i=1}^n (1 - {p_i}){p_i}
Schiefe \frac{\sum\limits_{i=1}^n {\left( 1-2{p_i} \right)\left( 1-{{p}_{i}} \right){{p}_{i}}}}{(\sum\limits_{i=1}^n (1 - {p_i}){p_i})^{\frac{3}{2}}}
Wölbung 3+ \frac{\sum\limits_{i=1}^n {\left( 1 - 6(1 - p_i){p_i} \right)\left( 1 - p_i \right)p_i}}{(\sum\limits_{i=1}^n (1 - {p_i}){p_i})^{4}}
Momenterzeugende Funktion \prod\limits_{j=1}^n (1-{p_j}+{p_j}{e^{t}})
Charakteristische Funktion \prod\limits_{j=1}^n (1-{p_j}+{p_j}{e^{it}})

Die Verallgemeinerte Binomialverteilung ist eine diskrete Wahrscheinlichkeitsverteilung. Sie ist definiert als die Summe von unabhängigen, nicht notwendigerweise identisch verteilten Zufallsvariablen, welche einer Bernoulli-Verteilung unterliegen.

Die Verallgemeinerte Binomialverteilung beschreibt also die Erfolge einer Serie von unabhängigen Versuchen, welche jeweils genau zwei Ergebnisse annehmen kann. Der Unterschied zur Binomialverteilung besteht darin, dass jedem Versuch eine andere Erfolgswahrscheinlichkeit zugeordnet werden kann.

Es ist auch möglich die Verallgemeinerte Binomialverteilung als Summe von unabhängigen, nicht identischen, binomial-verteilten Zufallsvariablen festzulegen, wobei die Bernoulli Zufallsgrößen mit identischen Erfolgswahrscheinlichkeiten zu binomial-verteilten Zufallsvariablen zusammengefasst werden.

Im Englischen wird die Verallgemeinerte Binomialverteilung auch oft als Poisson binomial distribution bezeichnet.

Definition der Verallgemeinerten Binomialverteilung[Bearbeiten]

Eine diskrete Zufallsvariable X folgt einer Verallgemeinerten Binomialverteilung mit Parametervektor p, wenn sie die folgende Wahrscheinlichkeitsfunktion besitzt [1]

\rho_X(k)=\sum\limits_{A\in B_k} \prod\limits_{i\in A} p_i \prod\limits_{j\in A^c} (1-p_j),

wobei p=(p_{1},\dots ,p_{n}) den Vektor der Erfolgswahrscheinlichkeiten pro Versuch und k die Gesamtanzahl der Erfolge bei n Versuchen bezeichnet.

Schreibweise: X \sim GB(p)

B_k ist die Menge aller k-elementigen Teilmengen, die aus dem Träger \{1,2,\dots ,n\} gebildet werden können. A^c ist das Komplement von A, das heißt A^c=\{1,2,\dots ,n\}\backslash A.

Die zugehörige Verteilungsfunktion lautet [2]

F_X(k)= P(X\le k) =\sum\limits_{l=0}^k \sum\limits_{A\in B_l} \prod\limits_{i\in A} p_i \prod\limits_{j\in A^c}{(1-p_j)}

Alternative Parametrisierung[Bearbeiten]

Die Verallgemeinerte Binomialverteilung kann ebenso als Summe von binomial-verteilten Zufallsgrößen definiert werden, indem die Bernoulli Zufallsvariablen mit gleichen Erfolgswahrscheinlichkeiten zu binomial-verteilten Zufallsgrößen zusammengefasst werden.

GB(k|p)=GB(k|pr,nr),

wobei der Parametervektor pr=(pr_{1},\dots ,pr_{r}) die Erfolgswahrscheinlichkeiten von r binomial-verteilten Zufallsvariablen enthält und der Parametervektor nr=(nr_{1},\dots ,nr_{r}) die jeweils zugehörige Anzahl an Versuchen.

Es gilt somit p=(p_{1},\dots ,p_{n})=(pr_{1}\cdot 1_{nr_{1}}^{T},\dots ,pr_{r}\cdot 1_{nr_{r}}^{T}). Hierbei ist 1_{nr_{i}}^{T} der Einsvektor der Länge nr_{i}, bestehend aus lauter Einsen.

Eigenschaften der Verallgemeinerten Binomialverteilung[Bearbeiten]

X sei im Folgenden eine Zufallsvariable, die einer Verallgemeinerten Binomialverteilung folgt X \sim GB(p).

Erwartungswert[Bearbeiten]

Die Verallgemeinerte Binomialverteilung besitzt den Erwartungswert

E(X)=\sum\limits_{i=1}^n p_i

Varianz[Bearbeiten]

Die Verallgemeinerte Binomialverteilung besitzt die Varianz

 Var(X) =\sum\limits_{i=1}^n (1 - {p_i}){p_i}

Schiefe[Bearbeiten]

Die Verallgemeinerte Binomialverteilung besitzt die Schiefe

v(X)=\frac{\sum\limits_{i=1}^n {\left( 1-2{p_i} \right)\left( 1-{{p}_{i}} \right){{p}_{i}}}}{(\sum\limits_{i=1}^n \left(1 - {p_i}){p_i}\right)^{\frac{3}{2}}}

Wölbung[Bearbeiten]

Die Verallgemeinerte Binomialverteilung besitzt die Wölbung

\beta_{2}=3+ \frac{\sum\limits_{i=1}^n {\left( 1 - 6(1 - p_i){p_i} \right)\left( 1 - p_i \right)p_i}}{(\sum\limits_{i=1}^n \left(1 - {p_i}){p_i}\right)^{2}}

Charakteristische Funktion[Bearbeiten]

Die charakteristische Funktion der Verallgemeinerten Binomialverteilung lautet:

\varphi_{X}(t)=\prod\limits_{j=1}^n (1-{p_j}+{p_j}{e^{it}})

Momenterzeugende Funktion[Bearbeiten]

Die momenterzeugende Funktion der Verallgemeinerten Binomialverteilung lautet:

M_{X}(t)=\prod\limits_{j=1}^n (1-{p_j}+{p_j}{e^{t}})

Beziehung zu anderen Verteilungen[Bearbeiten]

Spezialfall Binomialverteilung[Bearbeiten]

Wenn alle Erfolgswahrscheinlichkeiten gleich sind, das heißt p_{i}=p_{j} \; \forall i,j=1\dots,n, dann ergibt sich aus der Verallgemeinerten Binomialverteilung die Binomialverteilung.

Approximation durch die Poisson-Verteilung [2][Bearbeiten]

Für eine sehr große Anzahl an Versuchen n und sehr kleine, aber unterschiedliche Erfolgswahrscheinlichkeiten p_{1},\dots ,p_{n} kann die Wahrscheinlichkeitsfunktion der Verallgemeinerten Binomialverteilung durch die Poisson-Verteilung approximiert werden.

\rho_{X}(k)\approx \frac{\lambda^k}{k!}\cdot \mathrm{e}^{-\lambda}

Der Parameter \lambda ist gleich dem Erwartungswert der Verallgemeinerten Binomialverteilung.

Approximation durch die Normalverteilung [2][Bearbeiten]

Die Verteilungsfunktion der Verallgemeinerten Binomialverteilung kann für eine sehr große Anzahl an Versuchen n durch die Normalverteilung approximiert werden.

 F_{X}(k)\approx \Phi(\frac{k+0.5-\mu}{\sigma}),\ k=0,\dots ,n

Der Parameter \mu entspricht dem Erwartungswert und \sigma der Standardabweichung der Verallgemeinerten Binomialverteilung. \Phi(\cdot) ist die Verteilungsfunktion der Standardnormalverteilung.

Beispiele[Bearbeiten]

Radarkontrolle[Bearbeiten]

Ein Angestellter muss an jedem Arbeitstag zwei verschiedene Routen fahren. Die Wahrscheinlichkeiten in eine Radarkontrolle zu geraten sind 0.5\% für Route 1 und 1\% für Route 2.

Wie hoch sind die Wahrscheinlichkeiten an einem Arbeitstag in 0,1,2 Kontrollen zu geraten?

Die zufällige Anzahl von Radarkontrollen R kann als Summe von zwei Bernoulli-verteilten Zufallsvariablen R_1 für Route 1 und R_2 für Route 2 modelliert werden: R=R_1+R_2, mit

R_1=\begin{cases} 1,   & \mbox{Kontrolle mit Wahrscheinlichkeit } 0.005 \\
                            0, & \mbox{keine Kontrolle mit Wahrscheinlichkeit } 0.995               \end{cases}
R_2=\begin{cases} 1,   & \mbox{Kontrolle mit Wahrscheinlichkeit } 0.01 \\
                            0, & \mbox{keine Kontrolle mit Wahrscheinlichkeit } 0.99               \end{cases}

Da R_1 und R_2 unterschiedliche Erfolgswahrscheinlichkeiten besitzen, kann man dieses Beispiel nicht mit Hilfe der Binomialverteilung lösen.

R folgt einer Verallgemeinerten Binomialverteilung mit Parametervektor p=(0.005,0.01).

Die gesuchten Wahrscheinlichkeiten können folgendermaßen berechnet werden:

  • 0 Kontrollen: P(R=0)

P(R=0)=P(R_1=0)\cdot P(R_2=0)=0.995\cdot 0.99=0.98505=98.505\%

  • 1 Kontrolle: P(R=1)

P(R=1)=P(R_1=1)\cdot P(R_2=0)+P(R_1=0)\cdot P(R_2=1)=0.005\cdot 0.99+0.995 \cdot 0.01=0.0149=1.49\%

  • 2 Kontrollen: P(R=2)

P(R=2)=P(R_1=1)\cdot P(R_2=1)=0.005\cdot 0.01=0.00005=0.005\%

Herstellungsprozess[Bearbeiten]

In einer Fabrik werden Geräte produziert und anschließend einer Qualitätskontrolle unterzogen. Es können 3 verschiedene Fehlertypen auftreten. Die Wahrscheinlichkeiten, dass ein spezieller Fehlertyp auftritt sind 4\% für den Fehler vom Typ 1 und jeweils 7\% für die Fehlertypen 2 und 3.

Wie hoch sind die Wahrscheinlichkeiten dafür, dass ein Gerät mit 0,1,2,3 Fehlern produziert wird?

Die zufällige Anzahl von Fehlern F kann als Summe von drei Bernoulli-verteilten Zufallsvariablen F_1, F_2 und F_3 geschrieben werden: F=F_1+F_2+F_3, mit

F_1=\begin{cases} 1,   & \mbox{Fehler mit Wahrscheinlichkeit } 0.04 \\
                            0, & \mbox{kein Fehler mit Wahrscheinlichkeit } 0.96               \end{cases}
F_2=F_3=\begin{cases} 1,   & \mbox{Fehler mit Wahrscheinlichkeit } 0.07 \\
                            0, & \mbox{kein Fehler mit Wahrscheinlichkeit } 0.93               \end{cases}

F besitzt eine Verallgemeinerten Binomialverteilung mit Parametervektor p=(0.04,0.07,0.07).

Alternativ kann die Parametrisierung pr=(0.04,0.07),\ nr=(1,2) gewählt werden, indem die identischen Bernoulli Zufallsvariablen zu einer binomialverteilten Zufallsvariable zusammengefasst werden.

Die gesuchten Wahrscheinlichkeiten können folgendermaßen berechnet werden:

  • 0 Fehler: P(F=0)

P(F=0)=P(F_1=0)\cdot P(F_2=0)\cdot P(F_3=0)=0.96\cdot 0.93\cdot 0.93=0.830304=83.0304\%

  • 1 Fehler: P(F=1)

P(F=1)=P(F_1=1)\cdot P(F_2=0) \cdot P(F_3=0)+P(F_1=0)\cdot P(F_2=1) \cdot P(F_3=0)
	+P(F_1=0)\cdot P(F_2=0) \cdot P(F_3=1)=

0.04\cdot 0.93\cdot 0.93+0.96\cdot 0.07\cdot 0.93+0.96\cdot 0.93\cdot 0.07=0.159588=15.9588\%

  • 2 Fehler: P(F=2)

P(F=2)=P(F_1=1)\cdot P(F_2=1) \cdot P(F_3=0)+P(F_1=0)\cdot P(F_2=1) \cdot P(F_3=1)
	+P(F_1=1)\cdot P(F_2=0) \cdot P(F_3=1)=

0.04\cdot 0.07\cdot 0.93+0.96\cdot 0.07\cdot 0.07+0.04\cdot 0.93\cdot 0.07=0.009912=0.9912\%

  • 3 Fehler: P(F=3)

P(F=3)=P(F_1=1)\cdot P(F_2=1) \cdot P(F_3=1)=0.04\cdot 0.07\cdot 0.07=0.000196=0.0196\%

Anwendung & Berechnung[Bearbeiten]

Die Verallgemeinerte Binomialverteilung kommt in vielen Bereichen zum Einsatz; z.B. Umfragen, Herstellungsprozesse, Qualitätssicherung. Oft wird allerdings eine Approximation benutzt, da die exakte Berechnung sehr aufwändig ist. Ohne entsprechende Software sind selbst einfache Modelle mit wenigen Bernoulli Zufallsvariablen kaum zu berechnen.

Zufallszahlen[Bearbeiten]

Zur Erzeugung von Zufallszahlen kann die Inversionsmethode verwendet werden.

Siehe auch[Bearbeiten]

Literatur[Bearbeiten]

  • M.Fisz, Wahrscheinlichkeitsrechnung und mathematische Statistik, VEB Deutscher Verlag der Wissenschaften, 1973, p. 164 ff.
  • K.J. Klauer, Kriteriumsorientierte Tests, Verlag für Psychologie, Hogrefe, 1987, Göttingen, p. 208 ff.

Einzelnachweise[Bearbeiten]

  1. On the Number of Successes in Independent Trials. (PDF; 1,6 MB) Y.H.Wang, Statistica Sinica, Vol.3, 1993, p.295-312. Abgerufen am 23. September 2013.
  2. a b c On Computing the Distribution Function for the Sum of Independent and Non-identical Random Indicators. (PDF; 110 kB) Y.Hong, Blacksburg, USA, 5. April 2011. Abgerufen am 23. September 2013.