Dirichlet-Verteilung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Beispiele einer Dirichlet-Verteilung mit K=3 für verschiedene Parametervektoren α. Im Uhrzeigersinn von oben links: α=(6, 2, 2), (3, 7, 5), (6, 2, 6), (2, 3, 4).

Die Dirichletverteilung (nach Peter Gustav Lejeune Dirichlet) ist eine Familie von stetigen, multivariaten Wahrscheinlichkeitsverteilungen.

Sie ist die multivariate Erweiterung der Beta-Verteilung und die konjugierte A-priori-Verteilung der multinomialen Verteilung in Bayesscher Statistik. Ihre Dichtefunktion gibt die Wahrscheinlichkeiten von K verschiedenen, exklusiven Ereignissen an, wenn jedes Ereignis \alpha_i -1 mal beobachtet wurde.

Veranschaulichung[Bearbeiten]

Die multinomiale Verteilung gibt die Wahrscheinlichkeiten p_1 bis p_k für k unterschiedliche Ereignisse an, also z.B. wie wahrscheinlich es ist, in einem Wurf eine Eins, Zwei, Drei, Vier, Fünf oder Sechs zu würfeln. Im Gegensatz dazu gibt die Dirichlet-Verteilung an, wie wahrscheinlich eine solche Verteilung auftritt. Im Falle einer Würfelfabrik könnte die Dirichlet-Verteilung also angeben, wie wahrscheinlich die Verteilungen der Würfelergebnisse bei den fabrizierten Würfeln sind. Funktionieren die Maschinen der Würfelfabrik korrekt, wäre die Wahrscheinlichkeit für alles andere als die uniforme Verteilung (alle Augenzahlen sind gleich wahrscheinlich) sehr gering. Das entspräche einem Parametervektor \alpha mit gleichen und sehr hohen Elementen wie etwa (1000,1000,1000,1000,1000,1000). Hingegen würde \alpha = (1000, 500, 500, 500, 500, 500) bedeuten, dass die Maschinen Würfel fabrizieren, bei denen die Augenzahl Eins doppelt so häufig vorkommt wie jede andere Augenzahl. Und dies fast ausnahmslos, da die Werte wiederum sehr hoch sind und damit die Varianz niedrig. Wären die Werte in \alpha aber z.B. alle 0{,}1, dann würden Würfel hergestellt werden, die eine starke Tendenz zu einer Augenzahl haben. Welche die bevorzugte Augenzahl eines Würfels ist, wäre dabei zufällig, da alle Werte in \alpha gleich sind. Je kleiner die Werte, desto ausgeprägter wäre die Unfairness der meisten Würfel, und desto seltener wären Würfel ohne eine bevorzugte Augenzahl.

Dichtefunktion[Bearbeiten]

Die Dirichletverteilung der Ordnung K ≥ 2 mit den Parametern \alpha_1, ..., \alpha_K >0 hat folgende Dichtefunktion:

f(x_1,\dots, x_{K}; \alpha_1,\dots, \alpha_K) = \frac{1}{\mathrm{B}(\alpha)} \prod_{i=1}^K x_i^{\alpha_i - 1}

für alle x_1, ..., x_{K-1} \ge 0 mit x_1 + ... + x_{K-1} \le 1 und x_{K}=1-(x_{1}+...+x_{K-1}). Daher ist die Summe aller Wahrscheinlichkeiten x_{i},i=1...K gleich 1.

Die normierende Konstante ist die multinomiale Betafunktion, welche durch Gammafunktionen dargestellt werden kann:

\mathrm{B}(\alpha) = \frac{\prod_{i=1}^K \Gamma(\alpha_i)}{\Gamma\bigl(\sum_{i=1}^K \alpha_i\bigr)},\qquad\alpha=(\alpha_1,\dots,\alpha_K).

Weblinks[Bearbeiten]