Binomialverteilung
| Binomialverteilung | |
| Dichtefunktion |
|
| Verteilungsfunktion |
|
| Parameter | , ![]() |
|---|---|
| Träger | ![]() |
| Wahrscheinlichkeitsfunktion | ![]() |
| Verteilungsfunktion | ![]() |
| Erwartungswert | ![]() |
| Median | ![]() |
| Modus | oder ![]() |
| Varianz | ![]() |
| Schiefe | ![]() |
| Wölbung | ![]() |
| Entropie | ![]() ![]() |
| Momenterzeugende Funktion | ![]() |
| Charakteristische Funktion | ![]() |

mit
und
wie im Pascalschen DreieckDie Wahrscheinlichkeit, dass eine Kugel in einem Galtonbrett mit 8 Ebenen (
) ins mittlere Fach fällt (
) ist
.Die Binomialverteilung ist eine der wichtigsten diskreten Wahrscheinlichkeitsverteilungen.
Sie beschreibt die Anzahl der Erfolge in einer Serie von gleichartigen und unabhängigen Versuchen, die jeweils genau zwei mögliche Ergebnisse haben („Erfolg“ oder „Misserfolg“). Solche Versuchs-Serien werden auch Bernoulli-Prozesse genannt.
Ist p die Erfolgswahrscheinlichkeit bei einem Versuch und die Anzahl der Versuche n, dann bezeichnet man mit
oder
die Wahrscheinlichkeit, genau k Erfolge zu erzielen (siehe Abschnitt Definition).
Die Binomialverteilung und der Bernoulli-Versuch können mit Hilfe des Galtonbretts veranschaulicht werden. Dabei handelt es sich um eine mechanische Apparatur, in die man n Kugeln wirft. Diese fallen dann zufällig in eines von mehreren Fächern, wobei die Aufteilung der Binomialverteilung entspricht. Je nach Konstruktion sind unterschiedliche Parameter p möglich.
Obwohl die Binomialverteilung bereits lange vorher bekannt war, wurde der Begriff zum ersten Mal 1911 in einem Buch von George Udny Yule verwendet.[1]
Definition der Binomialverteilung[Bearbeiten]
Die diskrete Wahrscheinlichkeitsverteilung mit Wahrscheinlichkeitsfunktion
für 
heißt die Binomialverteilung zu den Parametern
(Anzahl der Versuche) und
(der Erfolgs- oder Trefferwahrscheinlichkeit). Statt
schreibt man auch
.
Die zur Erfolgswahrscheinlichkeit
komplementäre Ausfallwahrscheinlichkeit
wird häufig mit
abgekürzt. Wie für eine Wahrscheinlichkeitsverteilung notwendig, müssen sich die Wahrscheinlichkeiten für alle möglichen Werte k zu 1 summieren. Dies ergibt sich aus dem binomischen Lehrsatz wie folgt
.
Eine nach
verteilte Zufallsgröße
heißt binomialverteilt mit den Parametern
und
. Damit hat sie die Verteilungsfunktion
.
Herleitung als Laplace-Wahrscheinlichkeit[Bearbeiten]
Versuchsschema: Eine Urne enthält N nummerierte Bälle, davon sind M schwarz und
weiß. Die Wahrscheinlichkeit, einen schwarzen Ball zu ziehen, ist also p=M/N. Es werden einzeln und nacheinander, rein zufällig, insgesamt n Bälle entnommen, untersucht und wieder zurückgelegt.
Wir berechnen die Anzahl der Möglichkeiten, in denen man k schwarze Bälle findet und daraus die sogenannte Laplace-Wahrscheinlichkeit („Anzahl der für das Ereignis günstigen Möglichkeiten geteilt durch Gesamtanzahl der (gleichwahrscheinlichen) Möglichkeiten“).
In jeder der n Ziehungen gibt es N Möglichkeiten, insgesamt also
Möglichkeiten für die Auswahl der Bälle. Damit genau k dieser n Bälle schwarz sind, müssen genau k der n Ziehungen einen schwarzen Ball aufweisen. Für jeden schwarzen Ball gibt es M Möglichkeiten, und für jeden weißen Ball N–M Möglichkeiten. Die k schwarzen Bälle können noch auf
mögliche Weisen über die n Ziehungen verteilt sein, also gibt es
Fälle worin genau k schwarze Bälle ausgewählt worden sind. Die Wahrscheinlichkeit
, unter n Bällen genau k schwarze zu finden ist also
Eigenschaften der Binomialverteilung[Bearbeiten]
Symmetrie[Bearbeiten]
- Die Binomialverteilung ist in den Spezialfällen
,
und
symmetrisch und ansonsten asymmetrisch. - Die Binomialverteilung besitzt die Eigenschaft

Erwartungswert[Bearbeiten]
Die Binomialverteilung besitzt den Erwartungswert
.
Beweis[Bearbeiten]
Den Erwartungswert μ errechnet man direkt aus der Definition
und dem binomischen Lehrsatz zu
oder alternativ mit der Summenregel für Erwartungswerte, wenn man berücksichtigt, dass die identischen Einzelprozesse
der Bernoulli-Verteilung mit
genügen, zu
B(n,p)-verteilt, und
Alternativ kann man auch mit Hilfe des Binomiums folgenden Beweis geben:
,
also ist:
und:
Mit
und
folgt das gewünschte Ergebnis.
Varianz[Bearbeiten]
Die Binomialverteilung besitzt die Varianz
mit
.
Beweis[Bearbeiten]
Es sei X eine B(n,p)-verteilte Zufallsvariable. Die Varianz bestimmt sich direkt aus dem Verschiebungssatz
zu
oder alternativ aus der Summenregel für die Varianz unabhängiger Zufallsvariablen, wenn man berücksichtigt, dass die identischen Einzelprozesse
der Bernoulli-Verteilung mit
genügen, zu
Die zweite Gleichheit gilt, da die Einzelexperimente unabhängig sind, so dass die Einzelvariablen unkorreliert sind.
Variationskoeffizient[Bearbeiten]
Aus Erwartungswert und Varianz erhält man den Variationskoeffizienten
Schiefe[Bearbeiten]
Die Schiefe ergibt sich zu
Wölbung[Bearbeiten]
Die Wölbung lässt sich ebenfalls geschlossen darstellen als
Maximum[Bearbeiten]
Das Maximum wird für
bei
und für
bei
angenommen. Falls
eine natürliche Zahl ist, ist
auch bei
maximal. Falls der Erwartungswert eine natürliche Zahl ist, ist der Erwartungswert die Maximalstelle.
Beweis[Bearbeiten]
Sei ohne Einschränkung
. Wir betrachten den Quotienten
.
Nun gilt
falls
und
falls
.
Und nur im Fall, dass
, hat der Quotient den Wert 1, d.h.
.
(Die Aussage ist damit bewiesen.)
Charakteristische Funktion[Bearbeiten]
Die charakteristische Funktion hat die Form
Erzeugende Funktion[Bearbeiten]
Für die erzeugende Funktion erhält man
Momenterzeugende Funktion[Bearbeiten]
Die momenterzeugende Funktion der Binomialverteilung lautet
Summe binomialverteilter Zufallsgrößen[Bearbeiten]
Für die Summe
zweier unabhängiger binomialverteilter Zufallsgrößen
und
mit den Parametern
,
und
,
erhält man die Einzelwahrscheinlichkeiten
also wieder eine binomialverteilte Zufallsgröße, jedoch mit den Parametern
und
.
Wenn die Summe
bekannt ist, folgt jede der Zufallsvariablen
und
unter dieser Bedingung einer hypergeometrischen Verteilung. Dazu berechnet man die bedingte Wahrscheinlichkeit:
Dies stellt eine hypergeometrische Verteilung dar.
Allgemein gilt: Wenn die
Zufallsvariablen
stochastisch unabhängig sind und den Binomialverteilungen
genügen, dann ist auch die Summe
binomialverteilt, jedoch mit den Parametern
und
.
Beziehung zu anderen Verteilungen[Bearbeiten]
Beziehung zur Bernoulli-Verteilung[Bearbeiten]
Ein Spezialfall der Binomialverteilung für n = 1 ist die Bernoulli-Verteilung. Die Summe von unabhängigen und identischen Bernoulli-verteilten Zufallsgrößen genügt demnach der Binomialverteilung.
Übergang zur Normalverteilung[Bearbeiten]
Im Grenzfall
konvergiert die Binomialverteilung gegen eine Normalverteilung, d. h. die Normalverteilung kann als brauchbare Näherung der Binomialverteilung verwendet werden, wenn der Stichprobenumfang hinreichend groß und der Anteil der gesuchten Ausprägung nicht zu klein ist. (vgl. den Satz von Moivre-Laplace)
Es gilt:
und
. Durch Einsetzung in die Verteilungsfunktion der Normalverteilung folgt:
Eine Faustregel besagt, dass diese Näherung brauchbar ist, sofern
und
, oder auch
. Je asymmetrischer die Binomialverteilung, umso größer muss
sein, bevor die Normalverteilung eine brauchbare Näherung liefert.
Übergang zur Poisson-Verteilung[Bearbeiten]
Eine asymptotisch asymmetrische Binomialverteilung, deren Erwartungswert
für große
und kleine
gegen eine Konstante
konvergiert, kann man durch die Poisson-Verteilung annähern. Der Wert
ist dann für alle in der Grenzwertbildung betrachteten Binomialverteilungen wie auch für die resultierende Poissonverteilung der Erwartungswert. Diese Annäherung wird auch als Poissonscher Grenzwertsatz oder als das Gesetz seltener Ereignisse bezeichnet.
Eine Faustregel besagt, dass diese Näherung brauchbar ist, wenn
und
.
Die Poisson-Verteilung ist also die Grenzverteilung der Binomialverteilung für große
und kleine
.
Beziehung zur geometrischen Verteilung[Bearbeiten]
Die Zahl der Misserfolge bis zum erstmaligen Eintritt eines Erfolgs wird durch die geometrische Verteilung beschrieben.
Beziehung zur negativen Binomialverteilung[Bearbeiten]
Die negative Binomialverteilung hingegen beschreibt die Wahrscheinlichkeitsverteilung der Anzahl der Versuche, die erforderlich sind, um in einem Bernoulli-Prozess eine vorgegebene Anzahl von Erfolgen zu erzielen.
Beziehung zur Hypergeometrischen Verteilung[Bearbeiten]
Bei der Binomialverteilung werden die ausgewählten Stichproben wieder zur Auswahlmenge zurückgeführt, können also zu einem späteren Zeitpunkt erneut ausgewählt werden. Werden im Gegensatz dazu die Stichproben nicht zur Grundgesamtheit zurückgegeben, dann kommt die Hypergeometrische Verteilung zur Anwendung. Beide gehen bei großem Umfang
der Grundgesamtheit und geringem Umfang
der Stichproben ineinander über. Als Faustregel gilt, dass für
die Binomialverteilung der mathematisch anspruchsvolleren Hypergeometrischen Verteilung vorgezogen werden kann, da sie nur unwesentlich voneinander abweichende Ergebnisse liefern.
Beziehung zur Multinomial-Verteilung[Bearbeiten]
Die Binomialverteilung ist ein Spezialfall der Multinomialverteilung.
Beziehung zur Panjer-Verteilung[Bearbeiten]
Die Binomialverteilung ist ein Spezialfall der Panjer-Verteilung, welche die Verteilungen Binomialverteilung, Negative Binomialverteilung und Poisson-Verteilung in einer Verteilungsklasse vereint.
Beziehung zur Betaverteilung[Bearbeiten]
Für viele Anwendungen ist es nötig, die Verteilungsfunktion
konkret auszurechnen (beispielsweise bei statistischen Tests oder für Konfidenzintervalle).
Hier hilft die folgende Beziehung zur Betaverteilung
.
Diese lautet für ganzzahlige positive Parameter a und b:
Um die Gleichung
zu beweisen, kann man folgendermaßen vorgehen:
- Die linke und rechte Seite stimmen für p=0 überein (beide Seiten sind gleich 1).
- Die Ableitungen nach p stimmen für die linke und rechte Seite der Gleichung überein, sie sind nämlich beide gleich :

Beziehung zur Pólya-Verteilung[Bearbeiten]
Die Binomialverteilung ist ein Spezialfall der Pólya-Verteilung (wähle c=0).
Beispiele[Bearbeiten]
Symmetrische Binomialverteilung (p = 1/2)[Bearbeiten]
Dieser Fall tritt auf beim n-fachen Münzwurf mit einer fairen Münze (Wahrscheinlichkeit für Kopf gleich der für Zahl, also gleich 1/2). Die erste Abbildung zeigt die Binomialverteilung für
und für verschiedene Werte von
als Funktion von
. Diese Binomialverteilungen sind spiegelsymmetrisch um den Wert
:
Dies ist in der zweiten Abbildung veranschaulicht. Die Breite der Verteilung wächst proportional zur Standardabweichung
. Der Funktionswert bei
, also das Maximum der Kurve, sinkt proportional zu
.
Dementsprechend kann man Binomialverteilungen mit unterschiedlichem
aufeinander skalieren, indem man die Abszisse
durch
teilt und die Ordinate mit
multipliziert (dritte Abbildung oben).
Die nebenstehende Graphik zeigt noch einmal reskalierte Binomialverteilungen, nun für andere Werte von n und in einer Auftragung, die besser verdeutlicht, dass sämtliche Funktionswerte mit steigendem n gegen eine gemeinsame Kurve konvergieren. Indem man die Stirling-Formel auf die Binomialkoeffizienten anwendet, erkennt man, dass diese Kurve (im Bild schwarz durchgezogen) eine Gaußsche Glockenkurve ist:
.
Dies ist die Wahrscheinlichkeitsdichte zur Standard-Normalverteilung
. Im zentralen Grenzwertsatz wird dieser Befund so verallgemeinert, dass auch Folgen anderer diskreter Wahrscheinlichkeitsverteilungen gegen die Normalverteilung konvergieren.
In der zweiten nebenstehenden Graphik die gleichen Daten in einer halblogarithmischen Auftragung, die zu empfehlen ist, wenn man überprüfen möchte, ob auch seltene Ereignisse, die um mehrere Standardabweichungen vom Erwartungswert abweichen, einer Binomial- oder Normalverteilung folgen.
Ziehen von Kugeln[Bearbeiten]
In einem Behälter befinden sich 80 Kugeln, davon sind 16 gelb. Es wird 5-mal eine Kugel entnommen und anschließend wieder zurückgelegt. Wegen des Zurücklegens ist die Wahrscheinlichkeit, eine gelbe Kugel zu ziehen, bei allen Entnahmen gleich groß, und zwar 16/80 = 1/5. Die Verteilung
gibt die Wahrscheinlichkeit dafür an, dass genau
der entnommenen Kugeln gelb sind. Als Beispiel rechnen wir k=3:
In ungefähr 5% der Fälle zieht man also genau 3 gelbe Kugeln.
| B(k | 0,2; 5) | |
| k | Wahrscheinlichkeit in % |
| 0 | 32,768 |
| 1 | 40,96 |
| 2 | 20,48 |
| 3 | 5,12 |
| 4 | 0,64 |
| 5 | 0,032 |
| ∑ | 100 |
| Erw.Wert | 1 |
| Varianz | 0.8 |
Anzahl Personen mit Geburtstag am Wochenende[Bearbeiten]
Die Wahrscheinlichkeit, dass eine Person in diesem Jahr an einem Wochenende Geburtstag hat, betrage (der Einfachheit halber) 2/7. In einem Raum halten sich 10 Personen auf. Die Verteilung
gibt (im vereinfachten Modell) die Wahrscheinlichkeit dafür an, dass genau
der Anwesenden in diesem Jahr an einem Wochenende Geburtstag haben.
| B(k | 2/7; 10) | |
| k | Wahrscheinlichkeit in % (gerundet) |
| 0 | 3,46 |
| 1 | 13,83 |
| 2 | 24,89 |
| 3 | 26,55 |
| 4 | 18,59 |
| 5 | 8,92 |
| 6 | 2,97 |
| 7 | 0,6797 |
| 8 | 0,1020 |
| 9 | 0,009063 |
| 10 | 0,0003625 |
| ∑ | 100 |
| Erw.Wert | 2,86 |
| Varianz | 2,04 |
Gemeinsamer Geburtstag im Jahr[Bearbeiten]
253 Personen sind zusammengekommen. Die Verteilung
gibt die Wahrscheinlichkeit an, dass genau
Anwesende an einem zufällig gewählten Tag Geburtstag haben (ohne Beachtung des Jahrganges).
| B(k | 1/365; 253) | |
| k | Wahrscheinlichkeit in % (gerundet) |
| 0 | 49,95 |
| 1 | 34,72 |
| 2 | 12,02 |
| 3 | 2,76 |
| 4 | 0,47 |
Die Wahrscheinlichkeit, dass „irgendjemand“ dieser 253 Personen, d.h. eine oder mehrere Personen, an diesem Tag Geburtstag haben, beträgt somit
.
Bei 252 Personen beträgt die Wahrscheinlichkeit
. Das heißt, die Schwelle der Anzahl von Personen, ab der die Wahrscheinlichkeit, dass mindestens eine dieser Personen an einem zufällig gewählten Tag Geburtstag hat, größer als 50 % wird, beträgt 253 Personen (siehe dazu auch Geburtstagsparadoxon).
Die direkte Berechnung der Binomialverteilung kann aufgrund der großen Fakultäten schwierig sein. Eine Näherung über die Poisson-Verteilung ist zulässig (n>50, p<0,05). Mit dem Parameter
= np = 253/365 ergeben sich folgende Werte:[2]
| P253/365(k) | |
| k | Wahrscheinlichkeit in % (gerundet) |
| 0 | 50 |
| 1 | 34,66 |
| 2 | 12,01 |
| 3 | 2,78 |
| 4 | 0,48 |
Konfidenzintervall für eine Wahrscheinlichkeit[Bearbeiten]
In einer Meinungsumfrage unter n Personen geben k Personen an, die Partei A zu wählen. Bestimme ein 95% -Konfindenzintervall für den unbekannten Anteil der Wähler, die Partei A wählen, in der Gesamtwählerschaft.
Eine Lösung des Problems ohne Rückgriff auf die Normalverteilung findet sich im Artikel Konfidenzintervall einer unbekannten Wahrscheinlichkeit.
Auslastungsmodell[Bearbeiten]
Mittels folgender Formel lässt sich die Wahrscheinlichkeit dafür errechnen, dass k von n Personen eine Tätigkeit, die durchschnittlich m Minuten pro Stunde dauert, gleichzeitig ausführen.

Statistischer Fehler der Klassenhäufigkeit in Histogrammen[Bearbeiten]
Die Darstellung unabhängiger Messergebnisse in einem Histogramm führt zur Gruppierung der Messwerte in Klassen.
Die Wahrscheinlichkeit für
Einträge in Klasse i ist gegeben durch die Binomialverteilung
mit
und
.
Erwartungswert und Varianz der
sind dann
und
.
Damit liegt der statistische Fehler der Anzahl von Einträgen in Klasse i bei
. Bei großer Zahl von Klassen wird
klein und
.
So lässt sich beispielsweise die statistische Genauigkeit von Monte-Carlo-Simulationen bestimmen.
Zufallszahlen[Bearbeiten]
Zufallszahlen zur Binomialverteilung werden üblicherweise mit Hilfe der Inversionsmethode erzeugt.
Einzelnachweise[Bearbeiten]
- ↑ George Udny Yule: An Introduction to the Theory of Statistics. Griffin, London 1911, S. 287
- ↑ Im konkreten Fall muss man für die Binomialverteilung
ausrechnen und für die Poissonverteilung
. Beides ist mit dem Taschenrechner einfach. Bei einer Rechnung mit Papier und Bleistift benötigt man mit der Exponentialreihe 8 oder 9 Glieder für den Wert der Poissonverteilung, während man für die Binomialverteilung durch mehrfaches Quadrieren auf die 256. Potenz kommt und dann noch durch die dritte Potenz teilt.
Weblinks[Bearbeiten]
- Bernoulli-Versuche und Binomialverteilung
- Berechnung der Binomialverteilung für einfache und kumulierte Wahrscheinlichkeiten (englisch)
- Binomial- und Normalverteilung – Online-Lehrgang mit dynamischen Arbeitsblättern (Java-Plugin benötigt)
- Interaktive Animation – Universität Konstanz (Java-Plugin benötigt)
- Interaktive Animation (Flash-Plugin benötigt)
- Earliest Known Uses of Some of the Words of Probability & Statistics - Kees Verduin.
Diskrete univariate Verteilungen für endliche Mengen:
Benford | Bernoulli | beta-binomial | binomial | kategorial | hypergeometrisch | Rademacher | Zipf | Zipf-Mandelbrot
Diskrete univariate Verteilungen für unendliche Mengen:
Boltzmann | Conway-Maxwell-Poisson | negativ binomial | erweitert negativ binomial | Compound-Poisson | diskret uniform | discrete-Phase-Type | Gauss-Kuzmin | geometrisch | logarithmisch | parabolisch-fraktal | Poisson | Poisson-Gamma | Skellam | Yule-Simon | Zeta
Kontinuierliche univariate Verteilungen mit kompaktem Intervall:
Beta | Cantor | Kumaraswamy | raised Cosine | Dreieck | U-quadratisch | stetig uniform | Wigner-Halbkreis
Kontinuierliche univariate Verteilungen mit halboffenem Intervall:
Beta prime | Bose-Einstein | Burr | Chi-Quadrat | Coxian | Erlang | Exponential | F | Fermi-Dirac | Folded normal | Fréchet | Gamma | Gamma-Gamma | Extremwert | verallgemeinert invers Gauß | halblogistisch | halbnormal | Hotellings T-Quadrat | hyper-exponentiale | hypoexponential | invers Chi-Quadrat | scale-invers Chi-Quadrat | Invers Normal | Invers Gamma | Lévy | log-normal | log-logistisch | Maxwell-Boltzmann | Maxwell-Speed | Nakagami | nichtzentriert Chi-Quadrat | Pareto | Phase-Type | Rayleigh | relativistisch Breit-Wigner | Rice | Rosin-Rammler | shifted Gompertz | truncated normal | Type-2-Gumbel | Weibull | Wilks’ Lambda
Kontinuierliche univariate Verteilungen mit unbeschränktem Intervall:
Cauchy | Extremwert | exponential Power | Fishers z | Fisher-Tippett (Gumbel) | generalized hyperbolic | Hyperbolic-secant | Landau | Laplace | alpha-stabil | logistisch | normal (Gauß) | normal-invers Gauß’sch | Skew-normal | Studentsche t | Type-1-Gumbel | Variance-Gamma | Voigt
Diskrete multivariate Verteilungen:
Ewen | multinomial | Dirichlet compound multinomial
Kontinuierliche multivariate Verteilungen:
Dirichlet | generalized Dirichlet | multivariat normal | multivariat Student | normalskaliert invers Gamma | Normal-Gamma
Multivariate Matrixverteilungen:
Invers Wishart | Matrix-normal | Wishart
, 



oder 







;
(blau),
(rot)
für 
.
.

,
und 


,






.


![\begin{align}
\operatorname P(Z=k) &= \sum_{i=0}^k\left[\binom{n_1}i p^i (1-p)^{n_1-i}\right]\left[\binom{n_2}{k-i} p^{k-i} (1-p)^{n_2-k+i}\right]\\
&= \binom{n_1+n_2}k p^k (1-p)^{n_1+n_2-k} \qquad k=0,1,\ldots,n_1+n_2
\end{align}](http://upload.wikimedia.org/math/4/b/d/4bdf500a8abb2fd990dc0889b2252707.png)




.



.
ausrechnen und für die Poissonverteilung
. Beides ist mit dem Taschenrechner einfach. Bei einer Rechnung mit Papier und Bleistift benötigt man mit der Exponentialreihe 8 oder 9 Glieder für den Wert der Poissonverteilung, während man für die Binomialverteilung durch mehrfaches Quadrieren auf die 256. Potenz kommt und dann noch durch die dritte Potenz teilt.