Mischverteilung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Der Begriff Mischverteilung oder zusammengesetzte Verteilung stammt aus der Wahrscheinlichkeitsrechnung.

Es wird zur Einführung ein Merkmal X betrachtet, das zwei Grundgesamtheiten G1 und G2 entstammt. Im stochastischen Modell handelt es sich also eigentlich um zwei Zufallsvariablen X1 und X2, idealerweise vom gleichen Verteilungstyp. Die Anteile der beiden Merkmale sind a1 und a2. Beobachtet wird die Verteilung von X, die bestimmt wird von der totalen Wahrscheinlichkeit

P(X \le x) =  P(X \le x|X \mbox{ aus } G_1) \cdot a_1 + P(X \le x|X \mbox{ aus } G_2) \cdot a_2

bzw. als Mischverteilung mit den entsprechenden Verteilungen

P(X \le x) =  F_1(x) \cdot a_1 + F_2(x) \cdot a_2.

Inhaltsverzeichnis

[Bearbeiten] Definition

Lässt sich die Dichtefunktion einer stetigen Zufallsvariablen X als


f(x) = \sum_{k=1}^K a_k f_k ( x)

schreiben, so sagt man, dass X einer Mischverteilung folgt. Dabei sind die fk(x) Dichtefunktionen von stetigen Zufallsvariablen Xk und die ak Wahrscheinlichkeiten mit


\sum_{k=1}^{K} a_k = 1
.

Man kann leicht zeigen, dass unter diesen Bedingungen auch


\int_{-\infty}^{\infty} f(x) dx = 1

gilt.

Entsprechend ergibt sich die Wahrscheinlichkeitsfunktion der diskreten Mischverteilung als


f(x_i) = \sum_{k=1}^K a_k f_k (x_i)

[Bearbeiten] Eigenschaften

Für die Momente von X gilt:


E(X^p) = \sum_{k=1}^K a_k \, E(X_k^p),~p \in \{1,2,3,...\}.

Dies folgt (im stetigen Fall) aus


E(X^p) = \int_{-\infty}^{\infty} x^p f(x) dx = \int_{-\infty}^{\infty} x^p \left( \sum_{k=1}^K a_k f_k 

(x) \right) dx = \sum_{k=1}^K a_k \left( \int_{-\infty}^{\infty} x^p f_k(x) dx \right).

Eine analoge Rechnung ergibt die Formel für den diskreten Fall.

[Bearbeiten] Beispiel

Verteilung des Gewichts der Forellen (g)

Ein Forellenzüchter verkauft Forellen in großen Mengen. Es wird im Herbst beim Leeren der Teiche eine Bestandsaufnahme gemacht. Dabei werden die herausgefischten Forellen gewogen. Es ergibt sich die Verteilung des Gewichts, wie in der Grafik zu ersehen ist. Die Zweigipfligkeit der Verteilung deutet auf eine Mischverteilung hin. Es stellt sich heraus, dass die Forellen zwei verschiedenen Teichen entstammen. Die Forellengewichte aus dem ersten Teich sind normalverteilt mit dem Erwartungswert 400 g und der Varianz 4900 g2 und die aus dem zweiten Teich mit dem Erwartungswert 600 g und der Varianz 8100 g2. Aus dem ersten Teich stammen 40% der Forellen, aus dem zweiten 60%. Es ergibt sich die Dichtefunktion f(x) = 0,4 \cdot \frac {1}{70 \cdot \sqrt{2\pi}} e^{-\frac {1}{2} \left(\frac{x-400}{70}\right)^2} + 0,6  \cdot \frac {1}{90 \cdot \sqrt{2\pi}} e^{-\frac {1}{2} \left(\frac{x-600}{90}\right)^2} (siehe Abbildung).

[Bearbeiten] Siehe auch

Bayessches Theorem, Diskriminanzanalyse, Kontaminierte Normalverteilung

Meine Werkzeuge
Namensräume
Varianten
Aktionen
Navigation
Mitmachen
Drucken/exportieren
Werkzeuge
In anderen Sprachen