Gauß-Test

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Dieser Artikel behandelt den Hypothesentest von Gauß in der mathematischen Statistik. Für den Gauß-Test zur Reihenkonvergenz siehe Kriterium von Gauß.

Der Gauß-Test oder z-Test ist in der der mathematischen Statistik eine Gruppe von Hypothesentests mit standardnormalverteilter Testprüfgröße unter der Nullhypothese. Der Test ist benannt nach Carl Friedrich Gauß.

Mit dem Gauß-Test werden anhand von Stichproben-Mittelwerten Hypothesen über die Erwartungswerte derjenigen Grundgesamtheiten geprüft, aus denen die Stichproben stammen.

Der Gauß-Test folgt einer ähnlichen Methode wie der t-Test. Der wichtigste Unterschied liegt in den Voraussetzungen für die Anwendung dieser Tests: Während der t-Test mit den empirischen Standardabweichungen der Stichproben arbeitet, müssen für den Gauß-Test die Standardabweichungen der Grundgesamtheiten bekannt sein. Des Weiteren verwendet der Gauß-Test grundsätzlich die Standardnormalverteilung als Kennwerteverteilung und ist somit für kleine Stichproben mit unbekannter Populationsstreuung schlecht geeignet, während der t-Test für kleine Stichprobengrößen auf die t-Verteilung zurückgreift.

Mathematische Grundlagen[Bearbeiten | Quelltext bearbeiten]

Sind X_1, X_2, \dots, X_n unabhängige normalverteilte Zufallsvariablen mit Erwartungswert \mu_X und Standardabweichung \sigma_X, so ist ihr arithmetisches Mittel

\bar X = \frac{1}{n}\sum_{i=1}^n X_i

normalverteilt mit Erwartungswert \mu_X und Standardabweichung \sigma_X/\sqrt{n}.

Die Stichprobenfunktion

Z = \frac{\bar X - \mu_0}{\sigma_X}\sqrt{n}

ist dann unter der Nullhypothese \mu_X=\mu_0 standardnormalverteilt und wird als Teststatistik verwendet.

Die Teststatistik kann geschrieben werden als:

Z = \frac{\bar X - \mu_X}{\sigma_X}\sqrt{n}+\frac{\mu_X-\mu_0}{\sigma_X}\sqrt{n}=\chi+\frac{\mu_X-\mu_0}{\sigma_X}\sqrt{n},

also wie eine standardnormalverteilte Zufallsvariable χ plus eine Zahl, die auf standardisierte Weise die Distanz zwischen dem wirklichen und dem unterstellten Erwartungswert zeigt.

Liegen außerdem unabhängige normalverteilte Zufallsvariablen Y_1, Y_2, \dots, Y_m, die auch unabhängig sind von der X-Stichprobe, mit Erwartungswert \mu_Y, Standardabweichung \sigma_Y und arithmetischem Mittel

\bar Y = \frac{1}{m}\sum_{i=1}^m Y_i

vor, so ist \bar X-\bar Y normalverteilt mit Erwartungswert \mu_X - \mu_Y und Standardabweichung \sqrt{\frac{\sigma_X^2}{n} + \frac{\sigma_Y^2}{m}}.

Die Stichprobenfunktion

Z = \frac{(\bar X - \bar Y)-\delta}{\sqrt{\frac{\sigma_X^2}{n} + \frac{\sigma_Y^2}{m}}}

ist dann unter der Nullhypothese \mu_X-\mu_Y=\delta standardnormalverteilt und wird als Teststatistik verwendet.

Einstichproben-Gauß-Test[Bearbeiten | Quelltext bearbeiten]

Anwendung[Bearbeiten | Quelltext bearbeiten]

Der Einstichproben-Gauß-Test prüft anhand des arithmetischen Mittels einer Stichprobe, ob der Erwartungswert der zugehörigen Grundgesamtheit ungleich (bzw. kleiner oder größer) einem vorgegebenen Wert ist.

Die Stichprobe x_1, x_2, \dots, x_n bestehe aus den Ausprägungen unabhängiger Zufallsvariablen und entstamme einer normalverteilten Grundgesamtheit mit unbekanntem Erwartungswert \mu und bekannter Standardabweichung \sigma.

Es werden getestet bei einem

  • zweiseitigen Test: \!H_0\colon \mu = \mu_0 gegen \!H_1\colon \mu \neq \mu_0
  • rechtsseitigen Test: H_0\colon \mu \leq \mu_0 gegen \!H_1\colon \mu > \mu_0
  • linksseitigen Test: H_0\colon \mu \geq \mu_0 gegen \!H_1\colon \mu < \mu_0

Der Wert von \mu_0 wird vom Anwender vorgegeben.

Berechnung der Testprüfgröße[Bearbeiten | Quelltext bearbeiten]

Mit dem Stichprobenmittelwert \bar x = \frac{1}{n}\sum_{i=1}^n x_i berechnet man die Testprüfgröße z = \sqrt{n} \cdot \frac{\bar x - \mu_0}{\sigma}.

Zweistichproben-Gauß-Test für unabhängige Stichproben[Bearbeiten | Quelltext bearbeiten]

Anwendung[Bearbeiten | Quelltext bearbeiten]

Der Zweistichproben-Gauß-Test für unabhängige Stichproben prüft anhand der arithmetischen Mittel der Stichproben, ob die Erwartungswerte der zugehörigen Grundgesamtheiten verschieden sind.

Die unabhängige Stichproben x_1, x_2, \dots, x_n und y_1, y_2, \dots, y_m sollen auch untereinander unabhängig sein und normalverteilten Grundgesamtheiten mit unbekannten Erwartungswerten \mu_X bzw. \mu_Y und bekannten Standardabweichungen \sigma_X bzw. \sigma_Y entstammen.

Es werden getestet bei einem

  • zweiseitigen Test: \!\,H_0\colon \mu_X - \mu_Y = \mu_0\!\, gegen \!\,H_1\colon \mu_X - \mu_Y \neq \mu_0
  • rechtsseitigen Test: H_0\colon \mu_X - \mu_Y  \leq \mu_0 gegen \!H_1\colon \mu_X - \mu_Y  > \mu_0
  • linksseitigen Test: H_0\colon \mu_X - \mu_Y  \geq \mu_0 gegen \!H_1\colon \mu_X - \mu_Y  < \mu_0

Der Wert von \mu_0 wird vom Anwender vorgegeben.

Berechnung der Testprüfgröße[Bearbeiten | Quelltext bearbeiten]

Mit den Stichprobenmittelwerten \bar x = \frac{1}{n}\sum_{i=1}^n x_i und \bar y = \frac{1}{m}\sum_{i=1}^m y_i berechnet man die Testprüfgröße z = \frac{\bar x - \bar y - \mu_0}{\sqrt{\frac{\sigma_X^2}{n} + \frac{\sigma_Y^2}{m}}}.

Zweistichproben-Gauß-Test für abhängige (verbundene) Stichproben[Bearbeiten | Quelltext bearbeiten]

Anwendung[Bearbeiten | Quelltext bearbeiten]

Für den Zweistichproben-Gauß-Test für abhängige Stichproben müssen Paare (x_i, y_i) von Messwerten vorliegen, wie man sie z. B. bei Vorher-Nachher-Messungen vorfindet. Mittels der Paardifferenzen wird geprüft, ob für diese Differenzen der Erwartungswert der zugehörigen Grundgesamtheit ungleich (bzw. kleiner oder größer) einem vorgegebenen Wert ist.

Die Differenzen d_i = x_i - y_i sollen einer normalverteilten Grundgesamtheit mit unbekanntem Erwartungswert \mu und bekannter Standardabweichung \sigma entstammen.

Es werden getestet bei einem

  • zweiseitigen Test: \!H_0\colon \mu = \mu_0 gegen \!H_1\colon \mu \neq \mu_0
  • rechtsseitigen Test: H_0\colon \mu \leq \mu_0 gegen \!H_1\colon \mu > \mu_0
  • linksseitigen Test: H_0\colon \mu \geq \mu_0 gegen \!H_1\colon \mu < \mu_0

\mu_0 wird vom Anwender vorgegeben. In den meisten Anwendungsfällen wird auf „Ungleichheit“ (H_1) getestet, dann ist \mu_0 = 0.

Berechnung der Testprüfgröße[Bearbeiten | Quelltext bearbeiten]

Die Differenzen d_i bilden eine neue Stichprobe mit arithmetischem Mittel \bar d = \frac{1}{n}\sum_{i=1}^n d_i. Also kann man den Einstichproben-Gauß-Test auf die Stichprobe der Differenzen anwenden und erhält als Testprüfgröße z = \sqrt{n} \cdot \frac{\bar d - \mu_0}{\sigma}.

Entscheidung über die Hypothesen[Bearbeiten | Quelltext bearbeiten]

Bei allen drei Gauß-Tests werden für die Entscheidung über die Annahme bzw. Verwerfung der Hypothesen die allgemeinen Kriterien für Hypothesentests angewendet. Da Z unter der Nullhypothese eine standardnormalverteilte Zufallsvariable ist, erhält man die folgenden Regeln.

Ablehnung von H_0 (d. h. Annahme von H_1) zum Signifikanzniveau \alpha, falls gilt:

  • beim zweiseitigen Test: |z| > u(1-\alpha/2) (dies ist das (1-\alpha/2)-Quantil der Standardnormalverteilung)
  • beim rechtsseitigen Test: z > u(1-\alpha)
  • beim linksseitigen Test: z < u(\alpha)

Gauß-Test für nicht-normalverteilte Zufallsvariablen[Bearbeiten | Quelltext bearbeiten]

Für große Stichprobenumfänge (> 30 als Faustregel) kann aufgrund des Zentralen Grenzwertsatzes auf die Normalverteilungsannahme verzichtet werden. Wenn also die für den Gauß-Test geltenden Forderungen an die Erwartungswerte und Standardabweichungen der beteiligten Zufallsvariablen erfüllt sind, geht man davon aus, dass die für die Berechnung von z erforderlichen Summen approximativ normalverteilt sind und der Gauß-Test in guter Näherung korrekte Ergebnisse liefert.

Beispiel[Bearbeiten | Quelltext bearbeiten]

Ein bestimmter Blutparameter B ist in der Bevölkerung in sehr guter Näherung normalverteilt mit \sigma = 2. Von einer Gruppe chemisch verwandter Pharmaka ist bekannt, dass sie die Verteilung des Blutparameters verschieben können, d. h. sie verändern möglicherweise den Erwartungswert (unter Beibehaltung der Verteilungsform).

Für ein Pharmakon P aus dieser Gruppe soll geprüft werden, ob sich eine solche Veränderung tatsächlich einstellt. Zufällige unabhängige Stichproben des Umfangs n=22 ergeben die folgenden Messwerte für B:

ohne Gabe von P   xi  12 13 10 12 14 11 14 18 15 13 15 13 11 17 11 12 13 14 15 13 14 13
mit Gabe von P    yi  13 14 13 17 13 16 16 19 17 15 17 15 15 20 15 15 14 15 13 15 16 15

Mit diesen Messwerten sollen verschiedene Hypothesen geprüft werden. Das Signifikanzniveau \alpha soll jeweils 0,05 betragen; die zugehörigen u-Werte sind dann (im Folgenden alle Werte gerundet):

  • u(1-\alpha/2) = u(0{,}975) = 1{,}960
  • u(1-\alpha) = u(0{,}95) = 1{,}645
  • u(\alpha) = u(0{,}05) = -1{,}645

Für die Mittelwerte berechnet man \bar x = 13{,}32 und \bar y = 15{,}36.

  • 1. Hypothese: Die Werte von B liegen nach Verabreichung von P im Mittel oberhalb von 15.
Verfahren: rechtsseitiger Einstichproben-Gauß-Test
H_0: \mu \leq \mu_0 = 15 und H_1: \mu > 15\!\,
z = \sqrt{22} \cdot \frac{15{,}36 - 15}{2} = 0{,}84 < 1{,}645
Entscheidung: H0 wird beibehalten. Es ließ sich nicht nachweisen, dass die Gabe von P zu einem durchschnittlichen B-Wert oberhalb 15 führt.
  • 2. Hypothese: Die Werte von B unterscheiden sich im Mittel in den beiden Grundgesamtheiten ohne bzw. mit Gabe von P.
Verfahren: zweiseitiger Zweistichproben-Gauß-Test für unabhängige Stichproben
H_0: \mu_x - \mu_y = \mu_0 = 0\!\, und H_1: \mu_x \neq \mu_y
|z| = \sqrt{22} \cdot \frac{|13{,}32 - 15{,}36|}{2 \cdot \sqrt{2}} = 3{,}38 > 1{,}960
Entscheidung: H0 wird zugunsten von H1 verworfen. Mit einer Irrtumswahrscheinlichkeit von höchstens 0,05 wurde nachgewiesen, dass sich bzgl. der Gabe bzw. Nicht-Gabe von P die B-Werte im Mittel unterscheiden.

Nun soll ein Versuch mit abhängigen Stichproben betrachtet werden. Bei umfangreichen Vorher-Nachher-Untersuchungen wurde für die Veränderung der B-Werte durch die Gabe der betroffenen Pharmaka ebenfalls eine Normalverteilung gefunden, mit \sigma = 1{,}6. In der Tabelle der Messwerte seien nun die jeweils übereinander stehenden Messwerte in einem Vorher-Nachher-Versuch ermittelt worden.

  • 3. Hypothese: Die Werte von B liegen nach Gabe von P im Mittel um mehr als 1,25 oberhalb der Werte vor Gabe von P.
Verfahren: linksseitiger Zweistichproben-Gauß-Test für abhängige Stichproben
H_0: \mu \geq \mu_0 = -1{,}25 und H_1: \mu < -1{,}25\!\,
\bar d = \bar x - \bar y = -2{,}045
z = \sqrt{22} \cdot \frac{-2{,}045 + 1,25}{1{,}6} = -2{,}33 < -1{,}645
Entscheidung: H0 wird zugunsten von H1 verworfen. Mit einer Irrtumswahrscheinlichkeit von höchstens 0,05 wurde nachgewiesen, dass bei Vorher-Nachher-Untersuchungen die B-Werte nach Gabe von P im Mittel um mehr als 1,25 oberhalb der B-Werte vor Gabe von P liegen.

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Literatur[Bearbeiten | Quelltext bearbeiten]

  • Rönz/Strohe (Hrsg.): Lexikon Statistik. Gabler, 1994, ISBN 978-3-409-19952-0.
  • Irle: Wahrscheinlichkeitstheorie und Statistik. Kap. 20. Vieweg und Teubner, 2. Aufl. 2005, ISBN 978-3-519-12395-8.
  • Cramer/Kamps: Grundlagen der Wahrscheinlichkeitsrechnung und Statistik: Ein Skript für Studierende der Informatik, der Ingenieur- und Wirtschaftswissenschaften. S. 271ff. Springer, 2. Aufl. 2008, ISBN 978-3-540-77760-1.

Weblinks[Bearbeiten | Quelltext bearbeiten]