Multinomialverteilung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Die Multinomialverteilung oder Polynomialverteilung ist eine diskrete Wahrscheinlichkeitsverteilung. Man kann sie als multivariate Verallgemeinerung der Binomialverteilung auffassen. Sie hat in der Bayesschen Statistik als A-priori-Verteilung die Dirichlet-Verteilung.

Definition und Modell[Bearbeiten]

Seien n,k \in \mathbb{N}_0 und  p_1, \dotsc, p_k \in [0,1] mit p_1+ \dotsb +p_k = 1. Dann ist die Zähldichte der Multinomialverteilung M(n,(p_1,\dotsc,p_k)) gegeben durch

f(n_1, \dotsc, n_k) \;=\; \begin{cases} {n \choose n_1, \dotsc, n_k} \; p_1^{n_1} \dotsm p_k^{n_k} & \mbox{wenn } n_1, \dotsc, n_k \in \mathbb{N}_0\mbox{ und } n_1 + \dotsb + n_k = n \\ 0 & \mbox{sonst} \end{cases}.

Hierbei ist  {n \choose n_1, \dotsc, n_k} = \frac{n!}{n_1!\dotsm n_k!} der Multinomialkoeffizient.

Anwendung und Motivation[Bearbeiten]

Die Multinomialverteilung kann ausgehend von einem Urnenmodell mit Zurücklegen motiviert werden. In einer Urne sind k Sorten Kugeln. Der Anteil der Sorten Kugeln in der Urne ist p_i, (i \in \{1, \dotsc, k\}). Der Urne wird n-mal jeweils eine Kugel entnommen, ihre Eigenschaft (Sorte) notiert und die Kugel danach wieder in die Urne zurückgelegt.

Man interessiert sich nun für die Anzahl x_i der Kugeln einer jeden Sorte i in dieser Stichprobe. Da X_1, \dotsc, X_k der Multinomialverteilung folgen, besitzt die Stichprobe x_1, \dotsc, x_k die Wahrscheinlichkeit:

P(X_1=x_1, X_2=x_2, \dotsc, X_k=x_k)= \frac {n!}{x_1! \cdot x_2! \dotsm x_k!}p_1^{x_1} \cdot p_2^{x_2} \dotsm p_k^{x_k}
.

Nimmt man eine Urne mit k=6 Sorten Kugeln mit jeweils einer Kugel pro Sorte, so erhält man den klassischen Würfel: Man wirft diesen n-mal, hat dabei k=6 mögliche Ausgänge und interessiert sich dafür, wie groß die Wahrscheinlichkeit dafür ist, dass X_1 gerade x_1-mal auftritt, X_2 gerade x_2-mal und so weiter. Weiter beschreiben die jeweiligen p die Wahrscheinlichkeiten der Würfelflächen und somit, ob es sich um einen fairen oder unfairen Würfel handelt.

Eigenschaften[Bearbeiten]

Erwartungswert[Bearbeiten]

Für jedes i ist die Zufallsvariable X_i binomialverteilt mit den Parametern n und p_i, hat also den Erwartungswert

\operatorname{E}(X_i) = np_i

Varianz[Bearbeiten]

Für die Varianz gilt

\operatorname{Var}(X_i) = n p_i (1-p_i).

Kovarianz und Korrelationskoeffizient[Bearbeiten]

Die Kovarianz zweier Zufallsvariablen X_i und X_j mit i\ne j berechnet sich als

\operatorname{Cov}(X_i,X_j) = -n p_i p_j ,

und für den Korrelationskoeffizient (nach Pearson) folgt:

  \varrho(X_i,X_j) = -\sqrt{\frac{p_i}{1-p_i}\frac{p_j}{1-p_j}} .

Wahrscheinlichkeitserzeugende Funktion[Bearbeiten]

Die multivariate wahrscheinlichkeitserzeugende Funktion ist

m_X(t)=\left( \sum_{i=1}^k p_i t_i \right)^n

Beispiel[Bearbeiten]

Im einer Schulklasse sind 31 Schüler, 12 aus Dorf A, 11 aus Dorf B und 8 aus Dorf C. Jeden Tag wird ein Schüler ausgelost, der die Tafel wischen muss. Wie groß ist die Wahrscheinlichkeit, dass in einer Woche kein Schüler aus Dorf A, zwei Schüler aus Dorf B und 3 Schüler aus Dorf C die Tafel wischen müssen? es ist  n_1=0 , n_2=2, n_3=3 und  p_1= \frac{12}{31}, p_2= \frac{11}{31}, p_3= \frac{8}{31} , da jeder Schüler gleichwahrscheinlich gezogen werden soll. Dann ist  M((0,2,3),p_1,p_2,p_3)=\frac{5!}{0!2!3!} \left(\frac{11}{31}\right)^2\left(\frac{8}{31}\right)^3 = \frac{10\cdot 11^2 \cdot 8^3}{31^5} \approx 0 {,}022

Beziehung zu anderen Verteilungen[Bearbeiten]

Beziehung zur Binomialverteilung[Bearbeiten]

Im Spezialfall k=2 ergibt sich die Binomialverteilung, genauer ist M(n,(p,1-p)) die gemeinsame Verteilung von X und n-X für eine B(n,p)-verteilte Zufallsvariable X.

Beziehung zur multivariaten hypergeometrischen Verteilung[Bearbeiten]

Die Multinomialverteilung und die multivariate hypergeometrische Verteilung sind miteinander verwandt, da sie aus demselben Urnenmodell hervorgehen. Einziger Unterschied ist, dass bei der multivariaten hypergeometrischen Verteilung ohne Zurücklegen gezogen wird. Die multivariate hypergeometrische Verteilung lässt sich unter gewissen Umständen durch die Multinomialverteilung approximieren, siehe hierfür den Artikel über die multivariate hypergeometrische Verteilung.

Literatur[Bearbeiten]

  • Ulrich Krengel: Einführung in die Wahrscheinlichkeitstheorie und Statistik. 8. Auflage, Vieweg, 2005. ISBN 978-3-834-80063-3
  • Hans-Otto Georgii: Stochastik: Einführung in die Wahrscheinlichkeitstheorie und Statistik, 4. Auflage, de Gruyter, 2009. ISBN 978-3-110-21526-7
  • Christian Hesse: Angewandte Wahrscheinlichkeitstheorie: eine fundierte Einführung mit über 500 realitätsnahen Beispielen und Aufgaben, Vieweg, Braunschweig/Wiesbaden 2003, ISBN 978-3-528-03183-1.