Hypergeometrische Verteilung
Die hypergeometrische Verteilung ist eine diskrete Wahrscheinlichkeitsverteilung in der Stochastik.
Es wird von einer dichotomen Grundgesamtheit ausgegangen. Dieser Gesamtheit werden in einer Stichprobe zufällig
Elemente nacheinander ohne Zurücklegen entnommen. Die hypergeometrische Verteilung gibt dann Auskunft darüber, mit welcher Wahrscheinlichkeit in der Stichprobe eine bestimmte Anzahl von Elementen vorkommt, die die gewünschte Eigenschaft haben. Bedeutung kommt dieser Verteilung daher etwa bei Qualitätskontrollen zu.
Die hypergeometrische Verteilung wird modellhaft dem Urnenmodell ohne Zurücklegen zugeordnet (siehe auch Kombination ohne Wiederholung). Man betrachtet speziell in diesem Zusammenhang eine Urne mit zwei Sorten Kugeln. Es werden
Kugeln ohne Zurücklegen entnommen. Die Zufallsvariable
ist die Zahl der Kugeln der ersten Sorte in dieser Stichprobe.
Die hypergeometrische Verteilung beschreibt also die Wahrscheinlichkeit dafür, dass bei
gegebenen Elementen („Grundgesamtheit des Umfangs
“), von denen
die gewünschte Eigenschaft besitzen, beim Herausgreifen von
Probestücken („Stichprobe des Umfangs
“) genau
Treffer erzielt werden, d.h. die Wahrscheinlichkeit für
Erfolge in
Versuchen.
Ein beispielhaftes Problem: In einer Urne befinden sich 45 Kugeln, 20 davon sind gelb. Wie hoch ist die Wahrscheinlichkeit in einer 10-elementigen Stichprobe genau 4 gelbe Kugeln zu ziehen? – Das Beispiel wird unten durchgerechnet.
Inhaltsverzeichnis |
Definition[Bearbeiten]
Die hypergeometrische Verteilung ist abhängig von drei Parametern:
- der Anzahl
der Elemente einer Grundgesamtheit. - der Anzahl
der Elemente mit einer bestimmten Eigenschaft in dieser Grundmenge (die Anzahl möglicher Erfolge). - der Anzahl
der Elemente in einer Stichprobe.
Die Verteilung gibt nun Auskunft darüber, wie wahrscheinlich es ist, dass sich
Elemente mit der zu prüfenden Eigenschaft (Erfolge bzw. Treffer) in der Stichprobe befinden. Der Ergebnisraum
ist daher
.
Eine diskrete Zufallsgröße
unterliegt der hypergeometrischen Verteilung mit den Parametern
,
und
, wenn sie die Wahrscheinlichkeiten
für
besitzt. Dabei bezeichnet
den Binomialkoeffizienten „N über n“.
Die Verteilungsfunktion
gibt dann die Wahrscheinlichkeit an, dass höchstens
Elemente mit der zu prüfenden Eigenschaft in der Stichprobe sind. Diese kumulierte Wahrscheinlichkeit ist die Summe
.
Eigenschaften der hypergeometrischen Verteilung[Bearbeiten]
Symmetrie[Bearbeiten]

Erwartungswert[Bearbeiten]
Der Erwartungswert der hypergeometrisch verteilten Zufallsvariable
ist
.
Varianz[Bearbeiten]
Die Varianz der hypergeometrisch verteilten Zufallsvariable
ist
,
wobei der letzte Bruch der so genannte Korrekturfaktor (Endlichkeitskorrektur) beim Modell ohne Zurücklegen ist.
Charakteristische Funktion[Bearbeiten]
Die charakteristische Funktion hat die folgende Form:
Beziehung zu anderen Verteilungen[Bearbeiten]
Beziehung zur Binomialverteilung[Bearbeiten]
Im Gegensatz zur Binomialverteilung werden bei der hypergeometrischen Verteilung die Stichproben nicht wieder in das Reservoir zur erneuten Auswahl zurückgelegt. Ist der Umfang
der Stichprobe relativ klein (etwa
) im Vergleich zum Umfang
der Grundgesamtheit, unterscheiden sich die durch die Binomialverteilung bzw. die hypergeometrische Verteilung berechneten Wahrscheinlichkeiten nicht wesentlich voneinander. In diesen Fällen wird dann oft die Approximation durch die mathematisch einfacher zu handhabende Binomialverteilung vorgenommen.
Beziehung zur Pólya-Verteilung[Bearbeiten]
Die hypergeometrische Verteilung ist ein Spezialfall der Pólya-Verteilung (wähle
).
Beispiele[Bearbeiten]
In einem Behälter befinden sich 45 Kugeln, davon sind 20 gelb. Es werden 10 Kugeln ohne Zurücklegen entnommen.
Die hypergeometrische Verteilung gibt die Wahrscheinlichkeit dafür an, dass genau x = 0, 1, 2, 3, …, 10 der entnommenen Kugeln gelb sind.
Ein Beispiel für die Anwendung der hypergeometrischen Verteilung ist das Lotto: Beim Zahlenlotto gibt es 49 nummerierte Kugeln; davon werden bei der Auslosung 6 gezogen; auf dem Lottoschein werden 6 Zahlen angekreuzt.
gibt die Wahrscheinlichkeit dafür an, genau x = 0, 1, 2, 3, …, 6 "Treffer" zu erzielen.
- Wahrscheinlichkeit beim deutschen Lotto
Ausführliches Rechenbeispiel für die Kugeln[Bearbeiten]
Zu dem oben aufgeführten Beispiel der farbigen Kugeln soll die Wahrscheinlichkeit ermittelt werden, dass genau 4 gelbe Kugeln resultieren.
| Gesamtanzahl der Kugeln | ![]() |
| Anzahl mit der Eigenschaft „gelb“ | ![]() |
| Umfang der Stichprobe | ![]() |
| Davon angestrebt gelb | ![]() |
Also
.
Die Wahrscheinlichkeit ergibt sich aus:
- Anzahl der Möglichkeiten, genau 4 gelbe (und damit genau 6 violette) Kugeln auszuwählen
- geteilt durch
- Anzahl der Möglichkeiten, genau 10 Kugeln beliebiger Farbe auszuwählen
Es gibt
Möglichkeiten, genau 4 gelbe Kugeln auszuwählen.
Es gibt
Möglichkeiten, genau 6 violette Kugeln auszuwählen.
Da jede „gelbe Möglichkeit“ mit jeder „violetten Möglichkeit“ kombiniert werden kann, ergeben sich
Möglichkeiten für genau 4 gelbe und 6 violette Kugeln.
Es gibt insgesamt
Möglichkeiten, 10 Kugeln zu ziehen.
Wir erhalten also die Wahrscheinlichkeit
,
das heißt, in rund 27 Prozent der Fälle werden genau 4 gelbe (und 6 violette) Kugeln entnommen.
Alternativ kann das Ergebnis auch mit folgender Gleichung gefunden werden
Es befinden sich in der Stichprobe vom Umfang
nämlich 4 gelbe Kugeln. Die restlichen gelben Kugeln (16) befinden sich in den 35 übriggebliebenen Kugeln, die nicht zur Stichprobe gehören.
Zahlenwerte zu den Beispielen[Bearbeiten]
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| x | Anzahl möglicher Ergebnisse |
Wahrscheinlichkeit in % |
|---|---|---|
| 0 | 6.096.454 | 43,5965 |
| 1 | 5.775.588 | 41,3019 |
| 2 | 1.851.150 | 13,2378 |
| 3 | 246.820 | 1,765 |
| 4 | 13.545 | 0,0969 |
| 5 | 258 | 0,0018 |
| 6 | 1 | 0,0000072 |
| ∑ | 13.983.816 | 100,0000 |
| Erwartungswert | 0,7347 | |
| Varianz | 0,5776 | |
Weblinks[Bearbeiten]
- Universität Konstanz – Interaktive Animation
-
Wikibooks: Hypergeometrische Verteilung – Lern- und Lehrmaterialien
Diskrete univariate Verteilungen für endliche Mengen:
Benford | Bernoulli | beta-binomial | binomial | kategorial | hypergeometrisch | Rademacher | Zipf | Zipf-Mandelbrot
Diskrete univariate Verteilungen für unendliche Mengen:
Boltzmann | Conway-Maxwell-Poisson | negativ binomial | erweitert negativ binomial | Compound-Poisson | diskret uniform | discrete-Phase-Type | Gauss-Kuzmin | geometrisch | logarithmisch | parabolisch-fraktal | Poisson | Poisson-Gamma | Skellam | Yule-Simon | Zeta
Kontinuierliche univariate Verteilungen mit kompaktem Intervall:
Beta | Cantor | Kumaraswamy | raised Cosine | Dreieck | U-quadratisch | stetig uniform | Wigner-Halbkreis
Kontinuierliche univariate Verteilungen mit halboffenem Intervall:
Beta prime | Bose-Einstein | Burr | Chi-Quadrat | Coxian | Erlang | Exponential | F | Fermi-Dirac | Folded normal | Fréchet | Gamma | Gamma-Gamma | Extremwert | verallgemeinert invers Gauß | halblogistisch | halbnormal | Hotellings T-Quadrat | hyper-exponentiale | hypoexponential | invers Chi-Quadrat | scale-invers Chi-Quadrat | Invers Normal | Invers Gamma | Lévy | log-normal | log-logistisch | Maxwell-Boltzmann | Maxwell-Speed | Nakagami | nichtzentriert Chi-Quadrat | Pareto | Phase-Type | Rayleigh | relativistisch Breit-Wigner | Rice | Rosin-Rammler | shifted Gompertz | truncated normal | Type-2-Gumbel | Weibull | Wilks’ Lambda
Kontinuierliche univariate Verteilungen mit unbeschränktem Intervall:
Cauchy | Extremwert | exponential Power | Fishers z | Fisher-Tippett (Gumbel) | generalized hyperbolic | Hyperbolic-secant | Landau | Laplace | alpha-stabil | logistisch | normal (Gauß) | normal-invers Gauß’sch | Skew-normal | Studentsche t | Type-1-Gumbel | Variance-Gamma | Voigt
Diskrete multivariate Verteilungen:
Ewen | multinomial | Dirichlet compound multinomial
Kontinuierliche multivariate Verteilungen:
Dirichlet | generalized Dirichlet | multivariat normal | multivariat Student | normalskaliert invers Gamma | Normal-Gamma
Multivariate Matrixverteilungen:
Invers Wishart | Matrix-normal | Wishart
;
(blau),
(grün) und
(rot)
der Elemente mit einer bestimmten Eigenschaft in dieser Grundmenge (die Anzahl möglicher Erfolge).
der Elemente in einer Stichprobe.
.
.
,







,