Multinomialverteilung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Die Multinomialverteilung oder Polynomialverteilung ist eine diskrete Wahrscheinlichkeitsverteilung. Man kann sie als multivariate Verallgemeinerung der Binomialverteilung auffassen.

Definition und Modell[Bearbeiten]

Seien n,k \in \mathbb{N}_0 und  p_1, \dotsc, p_k \in [0,1] mit p_1+ \dotsb +p_k = 1. Dann ist die Zähldichte der Multinomialverteilung M(n,(p_1,\dotsc,p_k)) gegeben durch

f(n_1, \dotsc, n_k) \;=\; \begin{cases} {n \choose n_1, \dotsc, n_k} \; p_1^{n_1} \dotsm p_k^{n_k} & \mbox{wenn } n_1, \dotsc, n_k \in \mathbb{N}_0\mbox{ und } n_1 + \dotsb + n_k = n \\ 0 & \mbox{sonst} \end{cases}.

Hierbei ist  {n \choose n_1, \dotsc, n_k} = \frac{n!}{n_1!\dotsm n_k!} der Multinomialkoeffizient.

Im Spezialfall k=2 ergibt sich die Binomialverteilung, genauer ist M(n,(p,1-p)) die gemeinsame Verteilung von X und n-X für eine B(n,p)-verteilte Zufallsvariable X.

Anwendung und Motivation[Bearbeiten]

Die Multinomialverteilung kann ausgehend von einem Urnenmodell mit Zurücklegen motiviert werden. In einer Urne sind k Sorten Kugeln. Der Anteil der Sorten Kugeln in der Urne ist p_i, (i \in \{1, \dotsc, k\}). Der Urne wird n-mal jeweils eine Kugel entnommen, ihre Eigenschaft (Sorte) notiert und die Kugel danach wieder in die Urne zurückgelegt.

Man interessiert sich nun für die Anzahl x_i der Kugeln einer jeden Sorte i in dieser Stichprobe. Da X_1, \dotsc, X_k der Multinomialverteilung folgen, besitzt die Stichprobe x_1, \dotsc, x_k die Wahrscheinlichkeit:

P(X_1=x_1, X_2=x_2, \dotsc, X_k=x_k)= \frac {n!}{x_1! \cdot x_2! \dotsm x_k!}p_1^{x_1} \cdot p_2^{x_2} \dotsm p_k^{x_k}
.

Nimmt man eine Urne mit k=6 Sorten Kugeln mit jeweils einer Kugel pro Sorte, so erhält man den klassischen Würfel: Man wirft diesen n-mal, hat dabei k=6 mögliche Ausgänge und interessiert sich dafür, wie groß die Wahrscheinlichkeit dafür ist, dass X_1 gerade x_1-mal auftritt, X_2 gerade x_2-mal und so weiter. Weiter beschreiben die jeweiligen p die Wahrscheinlichkeiten der Würfelflächen und somit, ob es sich um einen fairen oder unfairen Würfel handelt.

Eigenschaften[Bearbeiten]

Für jedes i ist die Zufallsvariable X_i binomialverteilt mit den Parametern n und p_i, hat also den Erwartungswert

\operatorname{E}(X_i) = np_i

und die Varianz

\operatorname{Var}(X_i) = n p_i (1-p_i).

Die Kovarianz zweier Zufallsvariablen X_i und X_j mit i\ne j berechnet sich als

\operatorname{Cov}(X_i,X_j) = -n p_i p_j ,

und für den Korrelationskoeffizient (nach Pearson) folgt:

  \varrho(X_i,X_j) = -\sqrt{\frac{p_i}{1-p_i}\frac{p_j}{1-p_j}} .

Die Multinomialverteilung hat in Bayesscher Statistik als A-priori-Verteilung die Dirichlet-Verteilung.