Wahrscheinlichkeitsverteilung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Die Wahrscheinlichkeitsverteilung, häufig kurz Verteilung, ist ein Begriff der Wahrscheinlichkeitstheorie, der auch in der Mathematischen Statistik eine zentrale Bedeutung besitzt. Eine Wahrscheinlichkeitsverteilung ist jeweils einer Zufallsvariablen zugeordnet. Dabei beschreibt die Wahrscheinlichkeitsverteilung, mit welchen Wahrscheinlichkeiten die Zufallsvariable ihre möglichen Werte annimmt.

Der Begriff der Wahrscheinlichkeitsverteilung ist das theoretische Pendant zur empirisch ermittelbaren Häufigkeitsverteilung, die Gegenstand der deskriptiven Statistik ist.

Verteilung (grün) und Verteilungsfunktion (rot) beim Wurf eines symmetrischen Würfels

Beispielsweise wird der Wurf eines symmetrischen Würfels dadurch beschrieben, dass jedes der sechs möglichen Ergebnisse 1, 2, ..., 6 mit der Wahrscheinlichkeit 1/6 eintritt. Diese Wahrscheinlichkeiten lassen sich näherungsweise empirisch im Rahmen einer genügend langen Versuchsreihe bestimmen, in der das der Zufallsvariablen zugrunde liegende Zufallsexperiment wiederholt ausgeführt wird, um daraus die relativen Häufigkeiten zu bestimmen.

Typen von Wahrscheinlichkeitsverteilungen[Bearbeiten]

Diskrete Verteilungen[Bearbeiten]

Verteilungsfunktion einer diskreten Verteilung

Von einer diskreten Verteilung spricht man, wenn sich der Wertebereich der Zufallsvariablen X auf eine endliche oder abzählbare Menge konzentriert. Diskrete Verteilungen lassen sich durch eine Wahrscheinlichkeitsfunktion (oder Zähldichte) \rho(x)= P(X = x) beschreiben, die die Wahrscheinlichkeit für jeden einzelnen Wert x angibt.

Beispiele für diskrete Verteilungen sind die Binomialverteilung und die Hypergeometrische Verteilung, die die Anzahl der Erfolge beim Ziehen aus einer Urne mit bzw. ohne Zurücklegen beschreiben. Eine weitere diskrete Verteilung ist die Poisson-Verteilung, die man aus der Binomialverteilung erhalten kann, wenn man die Erfolgswahrscheinlichkeit immer weiter reduziert und gleichzeitig die Anzahl der Ziehungen um denselben Faktor erhöht.

Stetige Verteilungen[Bearbeiten]

Verteilungsfunktion einer stetigen Verteilung

Stetige (kontinuierliche) Verteilungen werden durch eine stetige Verteilungsfunktion F(x) \, = \, P(X \le x) charakterisiert. Die zugehörige Zufallsvariable besitzt dann einen überabzählbaren Wertebereich, wobei die Wahrscheinlichkeit für jeden einzelnen Wert gleich 0 ist.

Die wohl wichtigste stetige Verteilung ist die Normalverteilung. Ihre Wahrscheinlichkeitsdichte bzw. deren Graph wird auch Gauß-Funktion, Gauß-Kurve, Gauß-Glocke oder Glockenkurve genannt. Viele Häufigkeitsverteilungen, die sich in Natur und Gesellschaft beobachten lassen, können näherungsweise durch eine Normalverteilung beschrieben werden.

Stetige Wahrscheinlichkeitsverteilungen sind in der Mathematischen Statistik bei diversen Formen eines Hypothesentests unverzichtbar, wenn ein Testergebnis zu bewerten ist.

Sonstige Verteilungen[Bearbeiten]

Verteilungsfunktion einer weder diskreten noch stetigen Verteilung

Die beiden Begriffe diskrete Verteilung und stetige Verteilung sind nicht komplementär, da es zum Beispiel Mischformen von beiden Typen gibt.

Beschreibung von Wahrscheinlichkeitsverteilungen[Bearbeiten]

Zur Beschreibung von Wahrscheinlichkeitsverteilungen verwendet man je nach Typ der Zufallsvariablen

Wahrscheinlichkeitsmaß[Bearbeiten]

Allgemein für jede beliebige Zufallsvariable verwendbar ist ein Wahrscheinlichkeitsmaß, d. h. eine Funktion \mu, die jedem Ereignis A eine Wahrscheinlichkeit \mu(A) zuordnet. In der Wahrscheinlichkeitstheorie versteht man unter der Verteilung einer Zufallsvariable X das Wahrscheinlichkeitsmaß \mu(A) = P(X\in A), welches die Wahrscheinlichkeiten erfasst, mit denen die Zufallsvariable bestimmte Werte annimmt (Bildmaß von X).

Wahrscheinlichkeitsfunktion[Bearbeiten]

Wahrscheinlichkeitsfunktionen eignen sich zur Beschreibung von diskreten Wahrscheinlichkeitsverteilungen. Man erhält dann die Wahrscheinlichkeit eines beliebigen Ereignisses A als Summe:

 P(X \in A) \, = \, \sum_{x\in A} \rho(x)    bzw.     \mu(A) \, = \, \sum_{x\in A} \rho(x)

Verteilungsfunktion und Dichte[Bearbeiten]

Bei stetigen Verteilungen lassen sich Wahrscheinlichkeiten nicht als Summen von Einzelwahrscheinlichkeiten berechnen, da für stetige Zufallsvariablen X stets P(X=x) = 0 gilt. Sie lassen sich jedoch oft als Integrale über eine Dichtefunktion (oder Wahrscheinlichkeitsdichte) f(x) darstellen (stetige Verteilungen im engeren Sinne):

P(a \le X \le b) \, = \, \int_a^b f(x)\,dx    bzw.    \; \mu([a,b]) \, = \, \int_a^b f(x)\,dx

Verteilungen auf den reellen Zahlen können allgemein durch die (kumulative) Verteilungsfunktion (engl. cumulative distribution function, cdf) F(x) beschrieben werden. Sie gibt an, mit welcher Wahrscheinlichkeit die Zufallsvariable einen Wert kleiner oder gleich x annimmt:

F(x) \, = \, P(X \le x)

bzw.

F(x) \, = \, \mu\left(\left]-\infty, x\right]\right)

Wenn die Verteilungsfunktion differenzierbar ist, ist ihre Ableitung eine Dichtefunktion der Verteilung. Für eine Verteilungsfunktion F gilt stets F(-\infty)=0 und F(\infty)=1.

Charakterisierung von Wahrscheinlichkeitsverteilungen durch Kennzahlen[Bearbeiten]

Eine ungefähre Charakterisierung einer Zufallsvariablen ist durch diverse Kennzahlen möglich, die allesamt aus der Wahrscheinlichkeitsverteilung berechnet werden können:

Sehr grobe Aussagen über die Verteilung einer Zufallsvariablen bei alleiniger Kenntnis von Erwartungswert und Varianz macht die Tschebyscheff-Ungleichung.

Beziehungen zwischen verschiedenen Zufallsvariablen[Bearbeiten]

Die Beziehung zwischen zwei oder mehr Zufallsvariablen wird durch ihre gemeinsame Verteilung beschrieben. Eigenschaften, die auf dieser Basis charakterisiert werden können, sind insbesondere die stochastische Unabhängigkeit sowie die Unkorreliertheit.

Spezielle Wahrscheinlichkeitsverteilungen[Bearbeiten]

Wichtige stetige Wahrscheinlichkeitsverteilungen[Bearbeiten]

Drei Glockenkurven (Dichtefunktion normalverteilter Zufallsgrößen)
Dichten verschiedener beta-verteilter Zufallsgrößen
Dichtefunktion der F-Verteilung mit ausgewählten Freiheitsgraden m und n

Viele Wahrscheinlichkeitsverteilungen lassen sich bei großer Stichprobe durch die Normalverteilung approximieren. Viele natur-, wirtschafts- und ingenieurswissenschaftliche Vorgänge lassen sich durch die Normalverteilung entweder exakt oder in sehr guter Näherung beschreiben (vor allem Prozesse, die in mehreren Faktoren unabhängig voneinander in verschiedene Richtungen wirken).

Die Chi-Quadrat-Verteilung ist eine so genannte Stichprobenverteilung, die bei der Schätzung von Verteilungsparametern, beispielsweise der Varianz, Anwendung findet.

Über der gesamten Zahlengeraden:

Für konvexe Kombinationen mehrerer Verteilungen siehe Mischverteilung, ihr Sonderfall ist die

Über einem endlichen Intervall [a,b], im einfachsten Fall [0,1]:

Über einem halbseitig unendlichen Intervall, üblicherweise als [0,∞] angenommen:

Verteilungsklassen[Bearbeiten]

Eine Verteilungsklasse oder Verteilungsfamilie besteht aus Verteilungen gleichen Typs. Man teilt sie anhand unterschiedlicher mathematischer Eigenschaften ein. Weiterhin wird noch zwischen parametrischen und nichtparametrischen Klassen unterschieden.

Zur Klasse der parametrischen Klassen gehört die exponentielle Familie. Sie vereinigt:

Die Familie der Beta-Verteilungen wird „die zur Binomial-Verteilung konjugierte Verteilungsklasse“ genannt.

Die Panjer-Verteilung vereint Negative Binomialverteilung, Binomialverteilung und Poisson-Verteilung in einer Verteilungsklasse.

Man sondiert die Verteilungsfamilie auch mit einem monotonen Dichtequotienten, die Dominierte Verteilungsfamilie, und Alpha-stabile Verteilungen auf Grund von verschiedenen Aspekten.

Siehe auch[Bearbeiten]

Literatur[Bearbeiten]

Weblinks[Bearbeiten]

 Wikibooks: Einführung in Zufallsvariablen – Lern- und Lehrmaterialien