Binomialtest
Ein Binomialtest ist ein statistischer Test, bei dem die Testgröße binomialverteilt ist. Er wird verwendet, um Hypothesen über Merkmale zu prüfen, die genau zwei Ausprägungen annehmen können (dichotome Merkmale).
Inhaltsverzeichnis |
Hypothesen und Teststatistik [Bearbeiten]
Mit dem Binomialtest können folgende Hypothesenpaare für die unbekannte Wahrscheinlichkeit
eines Merkmals in der Grundgesamtheit getestet werden:
| Test | ![]() |
![]() |
|---|---|---|
| zweiseitiger | ![]() |
![]() |
| rechtsseitig | ![]() |
![]() |
| linksseitig | ![]() |
![]() |
Die Teststatistik
gibt an, wie oft das Merkmal in einer zufälligen Stichprobe vom Umfang
aufgetreten ist. Unter der Nullhypothese
ist die Teststatistik
-verteilt, das heißt
Signifikanzniveau und kritische Werte [Bearbeiten]
Da die Teststatistik diskret verteilt ist, kann das vorgegebene Signifikanzniveau
in der Regel nicht eingehalten werden. Daher wird gefordert, die kritischen Werte so zu wählen, dass für ein möglichst großes exaktes Signifikanzniveau
gilt
.
Für den zweiseitigen Test werden daher als kritischen Werte das größte
und das kleinste
bestimmt werden, für die gilt
und
.
Das exakte Signifikanzniveau ergibt sich als
. Für die beiden einseitigen Tests wird analog verfahren.
| Test | Kritische Werte | Kritischer Bereich | Grenze(n) |
|---|---|---|---|
| zweiseitig | und ![]() |
![]() |
|
| rechtsseitig | ![]() |
![]() |
c = kleinster Wert, für den ![]() |
| linksseitig | ![]() |
![]() |
c = größter Wert, für den ![]() |
Approximation der Verteilung der Teststatistik [Bearbeiten]
Die binomial verteilte Teststatistik kann mit einer anderen Verteilung approximiert werden. Die dafür notwendigen Approximationsbedingungen können je nach Literaturquelle variieren.
| Verteilung | Parameter | Approximationsbedingungen |
|---|---|---|
Poisson-Verteilung ![]() |
![]() |
und ![]() |
Normalverteilung ![]() |
und ![]() |
![]() |
Im Fall der Approximation der Normalverteilung kann statt der Teststatistik
auch gleich die Teststatistik
betrachtet werden.
Beispiele [Bearbeiten]
- Hellseh-Fähigkeit versus Raten der Farbe einer zufällig gewählten Spielkarte (aus statistischer Test): Bei n-maliger Durchführung erreicht eine Testperson X Treffer (Farbe richtig genannt). Ab welcher Trefferzahl X sollte man die Nullhypothese
verwerfen und die Alternativhypothese
(also tatsächliche Hellseh-Fähigkeit) für plausibler halten?[1] Wenn
richtig ist, dann ist X binomialverteilt mit Parametern n und 1/4. Die Wahrscheinlichkeit k oder mehr Treffer durch Raten zu erzielen, beträgt dann
. Bei einem Signifikanzniveau von 1 % verwirft man die Nullhypothese, falls
. Hier ist c der kleinste Wert, für den
ist. Beispielsweise für
ergibt sich
. Die Testperson müsste also unter den genannten Bedingungen mindestens bei 36 von 100 Versuchen richtig liegen, damit ihre Hellseh-Fähigkeiten für plausibel gehalten werden. - In einer Multiple-Choice-Prüfung gibt es 50 Fragen und jeweils 4 Antwortmöglichkeiten, von denen jeweils genau eine richtig ist. Dies führt zur gleichen Fragestellung wie das Spielkartenbeispiel. Die Nullhypothese ist, dass ein Prüfling die Antwort zufällig ankreuzt (
), und die Alternativhypothese ist
.[2] Diese Modellierung setzt allerdings voraus, dass es keine Möglichkeit gibt, gewisse Antworten als unplausibel auszuschließen. - Eine Urne enthält 10 Kugeln, die weiß oder schwarz sein können. Man möchte die Nullhypothese testen, dass alle Kugeln weiß sind (also
) und zieht n Kugeln mit Zurücklegen. Die Alternativhypothese ist
und man verwirft die Nullhypothese, sobald eine oder mehr schwarze Kugeln gezogen worden sind: der Ablehnungsbereich ist
. Der Fehler 1. Art ist gleich 0, da unter der Nullhypothese keine schwarze Kugel gezogen werden kann. Der Ablehnungsbereich ist also offenbar unabhängig vom Signifikanzniveau. Der Fehler 2. Art ist maximal, falls genau eine schwarze Kugel vorhanden ist, und beträgt dann
. - (Gegenbeispiel) Gleiche Situation, aber Ziehen ohne Zurücklegen (es werden maximal n=10 Kugeln gezogen). Wie im vorigen Fall verschwindet der Fehler 1. Art. Der Fehler 2. Art bestimmt sich aber aus einer hypergeometrischen Verteilung. Er ist maximal für eine schwarze Kugel und beträgt dann
. Es handelt sich also nicht um einen Binomialtest.
Anmerkungen [Bearbeiten]
- ↑ Wir betrachten für p den Parameterbereich [1/4,1], um zu erreichen, dass Nullhypothese und Alternativhypothese den gesamten Parameterbereich überdecken. Bei absichtlichem Nennen einer falschen Farbe könnte man zwar auch auf Hellseh-Fähigkeiten schließen, aber wir nehmen an, dass die Testperson eine möglichst hohe Trefferzahl erzielen will.
- ↑ Wie im Spielkartenbeispiel nehmen wir an, dass der Parameterbereich [1/4,1] ist (Prüfling möchte eine möglichst hohe Trefferzahl erreichen).
Literatur [Bearbeiten]
- Henze, Norbert: Stochastik für Einsteiger. 8. Auflage. Vieweg, 2010.
- Krengel, Ulrich: Einführung in die Wahrscheinlichkeitstheorie und Statistik. 8. Auflage. Vieweg, 2005.
- Rinne, Horst: Taschenbuch der Statistik. 3. Auflage. Harri Deutsch, 2003.









und
.
und 









und 

und 

verwerfen und die Alternativhypothese
(also tatsächliche Hellseh-Fähigkeit) für plausibler halten?
. Bei einem
. Hier ist c der kleinste Wert, für den
ist. Beispielsweise für
ergibt sich
. Die Testperson müsste also unter den genannten Bedingungen mindestens bei 36 von 100 Versuchen richtig liegen, damit ihre Hellseh-Fähigkeiten für plausibel gehalten werden.
), und die Alternativhypothese ist
.
) und zieht n Kugeln mit Zurücklegen. Die Alternativhypothese ist
und man verwirft die Nullhypothese, sobald eine oder mehr schwarze Kugeln gezogen worden sind: der Ablehnungsbereich ist
. Der
.
. Es handelt sich also nicht um einen Binomialtest.