Teststatistik

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Dieser Artikel oder nachfolgende Abschnitt ist nicht hinreichend mit Belegen (beispielsweise Einzelnachweisen) ausgestattet. Die fraglichen Angaben werden daher möglicherweise demnächst entfernt. Bitte hilf der Wikipedia, indem du die Angaben recherchierst und gute Belege einfügst. Näheres ist eventuell in der Versionsgeschichte angegeben. Bitte entferne zuletzt diese Warnmarkierung.

Als Teststatistik (synonyme Begriffe: Testgröße, Prüfgröße, Prüffunktion) bezeichnet man in der mathematischen Statistik eine bestimmte Stichprobenfunktion, die bei einem Hypothesentest dazu verwendet wird, die Testentscheidung – also Ablehnen oder Nichtablehnen der Nullhypothese – zu treffen.

Als Prüfwert wird die Realisation einer Teststatistik anhand einer Stichprobe bezeichnet.

Verwendung bei festem Signifikanzniveau[Bearbeiten | Quelltext bearbeiten]

Vor der Durchführung des Tests, das heißt auch vor der Ziehung der hierzu benötigten Stichprobe, ist die Teststatistik eine Zufallsvariable, deren Wahrscheinlichkeitsverteilung von jener der Stichprobenvariablen abhängt, wobei der Stichprobenumfang ist. Unter der Annahme, dass die Nullhypothese () richtig ist, wird für die Verteilung der Teststatistik je nach Testverfahren ein bestimmtes Verteilungsmodell angenommen, dessen Verteilungsparameter sich aus der Nullhypothese ergeben. Anhand dieser angenommenen Verteilung sowie des zuvor festgelegten Signifikanzniveaus wird zugleich der Ablehnbereich bestimmt. Nun wird die Stichprobe gezogen und aus den sich dabei ergebenden Stichprobenwerten der konkrete Wert der Teststatistik errechnet. Zur Ablehnung der Nullhypothese kommt es genau dann, wenn in den Ablehnbereich fällt; anderenfalls wird unter dem verwendeten Signifikanzniveau die Nullhypothese beibehalten. Wenn nämlich die Nullhypothese gilt und damit die unterstellte Verteilung der Teststatistik als richtig angenommen werden kann, entspricht die Wahrscheinlichkeit, dass die Testgröße in den Ablehnbereich fällt und somit die Nullhypothese fälschlich abgelehnt wird (sogenannter Fehler 1. Art), genau dem festgelegten Signifikanzniveau. Das Fallen der Testgröße in den Ablehnbereich ist gleichbedeutend mit der (je nach Testproblem) Über- bzw. Unterschreitung eines bestimmten Schwellenwertes, der auch als „Kritischer Wert“ bezeichnet wird.

Verwendung mit p-Wert[Bearbeiten | Quelltext bearbeiten]

Eine alternative, heutzutage in vielen statistischen Softwareanwendungen übliche Vorgehensweise besteht darin, anstatt sich vorher auf eine bestimmte Wahrscheinlichkeit für den Fehler 1. Art festzulegen, die Testentscheidung durch Berechnung des sogenannten p-Wertes zu treffen. In diesem Fall wird die Stichprobe ohne vorherige Festlegung des Signifikanzniveaus gezogen und der Wert der Teststatistik anschließend berechnet. Je nachdem, in welchen Bereich der für angenommenen Verteilung er fällt, ergibt sich ein -Wert, der umso stärker die Ablehnung der Nullhypothese „signalisiert“, je kleiner er ist (aus diesem Grund interpretiert man den p-Wert auch als Maß für die „Signifikanz“ der Nullhypothese). Somit wird bei dieser Vorgehensweise, im Gegensatz zu der oben beschriebenen „klassischen“ Methode, nicht der Wert der Teststatistik selbst zur Testentscheidung herangezogen, sondern der aus ihm ermittelte -Wert.

Beispiele für Teststatistiken[Bearbeiten | Quelltext bearbeiten]

mit = Stichprobenmittelwert, = laut Nullhypothese angenommener exakter Wert bzw. Obergrenze bzw. Untergrenze für den Erwartungswert , = korrigierte Stichprobenstandardabweichung.
Unter ist beim t-Test über einen Erwartungswert die Teststatistik t-verteilt mit Freiheitsgraden.
mit = Anzahl der Ausprägungsklassen des betreffenden Merkmals, = empirische (sich aus der Stichprobe ergebende) Häufigkeit des Auftretens des Merkmals in der -ten Klasse, = theoretische (unter unterstellte) Häufigkeit des Auftretens des Merkmals in der -ten Klasse.
Unter ist bei diesem Test die Testgröße annähernd Chi-Quadrat-verteilt mit Freiheitsgraden.