Gauß-Test

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Dieser Artikel behandelt den Hypothesentest von Gauß in der mathematischen Statistik. Für den Gauß-Test zur Reihenkonvergenz siehe Kriterium von Gauß.

Der Gauß-Test ist ein Begriff aus der mathematischen Statistik. Er bezeichnet eine Gruppe von Hypothesentests mit standardnormalverteilter Testprüfgröße unter der Nullhypothese. Der Test ist benannt nach Carl Friedrich Gauß.

Mit dem Gauß-Test werden anhand von Stichproben-Mittelwerten Hypothesen über die Erwartungswerte derjenigen Grundgesamtheiten geprüft, aus denen die Stichproben stammen.

Der Gauß-Test weist eine starke Verwandtschaft mit dem t-Test auf. Der wichtigste Unterschied liegt in den Voraussetzungen für die Anwendung dieser Tests: Während der t-Test mit den empirischen Standardabweichungen der Stichproben arbeitet, müssen für den Gauß-Test die Standardabweichungen der Grundgesamtheiten bekannt sein.

Mathematische Grundlagen[Bearbeiten]

Sind X_1, X_2, \dots, X_n unabhängige normalverteilte Zufallsvariablen mit Erwartungswert \mu_X und Standardabweichung \sigma_X, so ist ihr arithmetisches Mittel

\bar X = \frac{1}{n}\sum_{i=1}^n X_i

normalverteilt mit Erwartungswert \mu_X und Standardabweichung \sigma_X/\sqrt{n}.

Die Stichprobenfunktion

Z = \frac{\bar X - \mu_0}{\sigma_X}\sqrt{n}

ist dann unter der Nullhypothese \mu_X=\mu_0 standardnormalverteilt und wird als Teststatistik verwendet.

Die Teststatistik kann geschrieben werden als:

Z = \frac{\bar X - \mu_X}{\sigma_X}\sqrt{n}+\frac{\mu_X-\mu_0}{\sigma_X}\sqrt{n}=\chi+\frac{\mu_X-\mu_0}{\sigma_X}\sqrt{n},

also wie eine standardnormalverteilte Zufallsvariable χ plus eine Zahl, die auf standardisierte Weise die Distanz zwischen dem wirklichen und dem unterstellten Erwartungswert zeigt.


Liegen außerdem unabhängige normalverteilte Zufallsvariablen Y_1, Y_2, \dots, Y_m, die auch unabhängig sind von der X-Stichprobe, mit Erwartungswert \mu_Y, Standardabweichung \sigma_Y und arithmetischem Mittel

\bar Y = \frac{1}{m}\sum_{i=1}^m Y_i

vor, so ist \bar X-\bar Y normalverteilt mit Erwartungswert \mu_X - \mu_Y und Standardabweichung \sqrt{\frac{\sigma_X^2}{n} + \frac{\sigma_Y^2}{m}}.

Die Stichprobenfunktion

Z = \frac{(\bar X - \bar Y)-\delta}{\sqrt{\frac{\sigma_X^2}{n} + \frac{\sigma_Y^2}{m}}}

ist dann unter der Nullhypothese \mu_X-\mu_Y=\delta standardnormalverteilt und wird als Teststatistik verwendet.

Einstichproben-Gauß-Test[Bearbeiten]

Anwendung[Bearbeiten]

Der Einstichproben-Gauß-Test prüft anhand des arithmetischen Mittels einer Stichprobe, ob der Erwartungswert der zugehörigen Grundgesamtheit ungleich (bzw. kleiner oder größer) einem vorgegebenen Wert ist.

Die Stichprobe x_1, x_2, \dots, x_n bestehe aus den Ausprägungen unabhängiger Zufallsvariablen und entstamme einer normalverteilten Grundgesamtheit mit unbekanntem Erwartungswert \mu und bekannter Standardabweichung \sigma.

Es werden getestet bei einem

  • zweiseitigen Test: \!H_0\colon \mu = \mu_0 gegen \!H_1\colon \mu \neq \mu_0
  • rechtsseitigen Test: H_0\colon \mu \leq \mu_0 gegen \!H_1\colon \mu > \mu_0
  • linksseitigen Test: H_0\colon \mu \geq \mu_0 gegen \!H_1\colon \mu < \mu_0

Der Wert von \mu_0 wird vom Anwender vorgegeben.

Berechnung der Testprüfgröße[Bearbeiten]

Mit dem Stichprobenmittelwert \bar x = \frac{1}{n}\sum_{i=1}^n x_i berechnet man die Testprüfgröße z = \sqrt{n} \cdot \frac{\bar x - \mu_0}{\sigma}.

Zweistichproben-Gauß-Test für unabhängige Stichproben[Bearbeiten]

Anwendung[Bearbeiten]

Der Zweistichproben-Gauß-Test für unabhängige Stichproben prüft anhand der arithmetischen Mittel der Stichproben, ob die Erwartungswerte der zugehörigen Grundgesamtheiten verschieden sind.

Die unabhängige Stichproben x_1, x_2, \dots, x_n und y_1, y_2, \dots, y_m sollen auch unter einander unabhängig sein und normalverteilten Grundgesamtheiten mit unbekannten Erwartungswerten \mu_X bzw. \mu_Y und bekannten Standardabweichungen \sigma_X bzw. \sigma_Y entstammen.

Es werden getestet bei einem

  • zweiseitigen Test: \!\,H_0\colon \mu_X - \mu_Y = \mu_0\!\, gegen \!\,H_1\colon \mu_X - \mu_Y \neq \mu_0
  • rechtsseitigen Test: H_0\colon \mu_X - \mu_Y  \leq \mu_0 gegen \!H_1\colon \mu_X - \mu_Y  > \mu_0
  • linksseitigen Test: H_0\colon \mu_X - \mu_Y  \geq \mu_0 gegen \!H_1\colon \mu_X - \mu_Y  < \mu_0

Der Wert von \mu_0 wird vom Anwender vorgegeben.

Berechnung der Testprüfgröße[Bearbeiten]

Mit den Stichprobenmittelwerten \bar x = \frac{1}{n}\sum_{i=1}^n x_i und \bar y = \frac{1}{m}\sum_{i=1}^m y_i berechnet man die Testprüfgröße z = \frac{\bar x - \bar y - \mu_0}{\sqrt{\frac{\sigma_X^2}{n} + \frac{\sigma_Y^2}{m}}}.

Zweistichproben-Gauß-Test für abhängige (verbundene) Stichproben[Bearbeiten]

Anwendung[Bearbeiten]

Für den Zweistichproben-Gauß-Test für abhängige Stichproben müssen Paare (x_i, y_i) von Messwerten vorliegen, wie man sie z. B. bei Vorher-Nachher-Messungen vorfindet. Mittels der Paardifferenzen wird geprüft, ob für diese Differenzen der Erwartungswert der zugehörigen Grundgesamtheit ungleich (bzw. kleiner oder größer) einem vorgegebenen Wert ist.

Die Differenzen d_i = x_i - y_i sollen eine unabhängige Stichprobe bilden und einer normalverteilten Grundgesamtheit mit unbekanntem Erwartungswert \mu und bekannter Standardabweichung \sigma entstammen. Der benutzte Test ist der Einstichprobe-Gauß-Test für der unabhängige Stichprobe der Differenzen d_i.

Es werden getestet bei einem

  • zweiseitigen Test: \!H_0\colon \mu = \mu_0 gegen \!H_1\colon \mu \neq \mu_0
  • rechtsseitigen Test: H_0\colon \mu \leq \mu_0 gegen \!H_1\colon \mu > \mu_0
  • linksseitigen Test: H_0\colon \mu \geq \mu_0 gegen \!H_1\colon \mu < \mu_0

\mu_0 wird vom Anwender vorgegeben. In den meisten Anwendungsfällen wird auf „Ungleichheit“ (H_1) getestet, dann ist \mu_0 = 0.

Berechnung der Testprüfgröße[Bearbeiten]

Die Differenzen d_i bilden eine neue Stichprobe mit arithmetischem Mittel \bar d = \frac{1}{n}\sum_{i=1}^n d_i. Also kann man den Einstichproben-Gauß-Test auf die Stichprobe der Differenzen anwenden und erhält als Testprüfgröße z = \sqrt{n} \cdot \frac{\bar d - \mu_0}{\sigma}.

Entscheidung über die Hypothesen[Bearbeiten]

Bei allen drei Gauß-Tests werden für die Entscheidung über die Annahme bzw. Verwerfung der Hypothesen die allgemeinen Kriterien für Hypothesentests angewendet. Da Z unter der Nullhypothese eine standardnormalverteilte Zufallsvariable ist, erhält man die folgenden Regeln.

Ablehnung von H_0 (d. h. Annahme von H_1) zum Signifikanzniveau \alpha, falls gilt:

  • beim zweiseitigen Test: |z| > u(1-\alpha/2) (dies ist das (1-\alpha/2)-Quantil der Standardnormalverteilung)
  • beim rechtsseitigen Test: z > u(1-\alpha)
  • beim linksseitigen Test: z < u(\alpha)

Gauß-Test für nicht-normalverteilte Zufallsvariablen[Bearbeiten]

Für große Stichprobenumfänge (> 30 als Faustregel) kann aufgrund des Zentralen Grenzwertsatzes auf die Normalverteilungsannahme verzichtet werden. Wenn also die für den Gauß-Test geltenden Forderungen an die Erwartungswerte und Standardabweichungen der beteiligten Zufallsvariablen erfüllt sind, geht man davon aus, dass die für die Berechnung von z erforderlichen Summen approximativ normalverteilt sind und der Gauß-Test in guter Näherung korrekte Ergebnisse liefert.

Beispiel[Bearbeiten]

Ein bestimmter Blutparameter B ist in der Bevölkerung in sehr guter Näherung normalverteilt mit \sigma = 2. Von einer Gruppe chemisch verwandter Pharmaka ist bekannt, dass sie die Verteilung des Blutparameters verschieben können, d. h. sie verändern möglicherweise den Erwartungswert (unter Beibehaltung der Verteilungsform).

Für ein Pharmakon P aus dieser Gruppe soll geprüft werden, ob sich eine solche Veränderung tatsächlich einstellt. Zufällige unabhängige Stichproben des Umfangs n=22 ergeben die folgenden Messwerte für B:

ohne Gabe von P   xi  12 13 10 12 14 11 14 18 15 13 15 13 11 17 11 12 13 14 15 13 14 13
mit Gabe von P    yi  13 14 13 17 13 16 16 19 17 15 17 15 15 20 15 15 14 15 13 15 16 15

Mit diesen Messwerten sollen verschiedene Hypothesen geprüft werden. Das Signifikanzniveau \alpha soll jeweils 0,05 betragen; die zugehörigen u-Werte sind dann (im Folgenden alle Werte gerundet):

  • u(1-\alpha/2) = u(0{,}975) = 1{,}960
  • u(1-\alpha) = u(0{,}95) = 1{,}645
  • u(\alpha) = u(0{,}05) = -1{,}645

Für die Mittelwerte berechnet man \bar x = 13{,}32 und \bar y = 15{,}36.

  • 1. Hypothese: Die Werte von B liegen nach Verabreichung von P im Mittel oberhalb von 15.
Verfahren: Rechtsseitiger Einstichproben-Gauß-Test.
H_0: \mu \leq \mu_0 = 15 und H_1: \mu > 15\!\,
z = \sqrt{22} \cdot \frac{15{,}36 - 15}{2} = 0{,}85 < 1{,}645
Entscheidung: H0 wird beibehalten. Es ließ sich nicht nachweisen, dass die Gabe von P zu einem durchschnittlichen B-Wert oberhalb 15 führt.
  • 2. Hypothese: Die Werte von B unterscheiden sich im Mittel in den beiden Grundgesamtheiten ohne bzw. mit Gabe von P.
Verfahren: Zweiseitiger Zweistichproben-Gauß-Test für unabhängige Stichproben.
H_0: \mu_x - \mu_y = \mu_0 = 0\!\, und H_1: \mu_x \neq \mu_y
|z| = \sqrt{22} \cdot \frac{|13{,}32 - 15{,}36|}{2 \cdot \sqrt{2}} = 3{,}39 > 1{,}960
Entscheidung: H0 wird zugunsten von H1 verworfen. Mit einer Irrtumswahrscheinlichkeit von höchstens 0,05 wurde nachgewiesen, dass sich bzgl. der Gabe bzw. Nicht-Gabe von P die B-Werte im Mittel unterscheiden.

Nun soll ein Versuch mit abhängigen Stichproben betrachtet werden. Bei umfangreichen Vorher-Nachher-Untersuchungen wurde für die Veränderung der B-Werte durch die Gabe der betroffenen Pharmaka ebenfalls eine Normalverteilung gefunden, mit \sigma = 1{,}6. In der Tabelle der Messwerte seien nun die jeweils übereinander stehenden Messwerte in einem Vorher-Nachher-Versuch ermittelt worden.

  • 3. Hypothese: Die Werte von B liegen nach Gabe von P im Mittel um mehr als 1,25 oberhalb der Werte vor Gabe von P.
Verfahren: Linksseitiger Zweistichproben-Gauß-Test für abhängige Stichproben.
H_0: \mu \geq \mu_0 = -1{,}25 und H_1: \mu < -1{,}25\!\,
\bar d = \bar x - \bar y = -2{,}045
z = \sqrt{22} \cdot \frac{-2{,}045 + 1,25}{1{,}6} = -2{,}33 < -1{,}645
Entscheidung: H0 wird zugunsten von H1 verworfen. Mit einer Irrtumswahrscheinlichkeit von höchstens 0,05 wurde nachgewiesen, dass bei Vorher-Nachher-Untersuchungen die B-Werte nach Gabe von P im Mittel um mehr als 1,25 oberhalb der B-Werte vor Gabe von P liegen.

Siehe auch[Bearbeiten]

Literatur[Bearbeiten]

  • Rönz/Strohe (Hrsg.): Lexikon Statistik. Gabler, 1994, ISBN 978-3-409-19952-0.
  • Irle: Wahrscheinlichkeitstheorie und Statistik. Kap. 20. Vieweg und Teubner, 2. Aufl. 2005, ISBN 978-3-519-12395-8.
  • Cramer/Kamps: Grundlagen der Wahrscheinlichkeitsrechnung und Statistik: Ein Skript für Studierende der Informatik, der Ingenieur- und Wirtschaftswissenschaften. S. 271ff. Springer, 2. Aufl. 2008, ISBN 978-3-540-77760-1.

Weblinks[Bearbeiten]