Alphafehler-Kumulierung

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 8. November 2015 um 10:22 Uhr durch HilberTraum (Diskussion | Beiträge) (Die 2 letzten Textänderungen von Steschulz2 und Asdert wurden verworfen und die Version 147710752 von HilberTraum wiederhergestellt.). Sie kann sich erheblich von der aktuellen Version unterscheiden.
Zur Navigation springen Zur Suche springen

Die Alphafehler-Kumulierung, häufig auch α-Fehler-Inflation genannt, bezeichnet in der Statistik die globale Erhöhung der Alpha-Fehler-Wahrscheinlichkeit (Fehler 1. Art) durch multiples Testen in derselben Stichprobe.

Anschaulich formuliert: Je mehr Hypothesen man auf einem Datensatz testet, desto höher wird die Wahrscheinlichkeit, dass eine davon (fehlerhaft) als zutreffend angenommen wird.

Mehrfaches Testen

Oft wird in einer Studie nicht nur eine Nullhypothese festgelegt, sondern man will mehrere Fragen mittels der gewonnenen Daten beantworten. Dies können weitere Nullhypothesen, aber auch Konfidenzintervalle oder Schätzwerte sein.

Im Falle von mehreren Nullhypothesen spricht man dann von einem multiplen Testproblem.

In solchen Fällen stößt man auf die folgenden zwei Probleme:

1) Inkonsistenzen (Bsp.)

Angenommen jemand will die Erwartungswerte vergleichen. Beim paarweisen Test werden alle Nullhypothesen nicht abgelehnt, nur die Hypothese wird abgelehnt.

2) Inflation des α-Fehlers

Bei multiplen Testproblemen werden das lokale (nur die einzelne Hypothese betreffende) α-Niveau und das globale α-Niveau (für die gesamte Hypothesenfamilie) unterschieden. Falls die Tests unabhängig sind, kann für jede Nullhypothese das lokale α auf der Basis des globalen Niveaus nach folgender Formel angepasst werden: mit k= Anzahl der Einzelhypothesen.

Adjustierung des globalen α-Niveaus

Wie aber kann man dieser α-Fehler-Inflation entgegenwirken bzw. sie korrigieren?

Bonferroni-Korrektur

Die Bonferroni-Korrektur[1] ist die einfachste und konservativste Form, das multiple α-Niveau anzupassen. Dabei wird das globale α-Niveau zu gleichen Teilen auf die Einzeltests verteilt:

Daraus folgt mittels der Bonferroni-Ungleichung, dass jeder Einzeltest unter dem Niveau (und nicht α) durchgeführt wird: Für gilt

Die sehr konservative Vorgehensweise bei der Bonferroni-Korrektur hat den Nachteil, dass das Ergebnis einen sehr geringen α-Wert aufweisen muss, um als statistisch signifikant gelten zu können. Dies versuchen Weiterentwicklungen wie die Bonferroni-Holm-Prozedur zu vermeiden.

Bonferroni-Holm-Prozedur

Eine Erweiterung der Bonferroni-Korrektur stellt die Bonferroni-Holm-Prozedur[2] dar. Dabei kommt folgender Algorithmus zum Tragen:

1. Schritt:

Festlegung des globalen α-Niveaus

2. Schritt:

Durchführung aller Einzeltests und Ermittlung der p-Werte

3. Schritt:

Sortieren der p-Werte vom Kleinsten zum Größten

4. Schritt:

Berechnung der lokalen α-Niveaus als Verhältnis von globalem α-Niveau zur Anzahl der Tests - i, wobei gilt:

5. Schritt

Vergleiche die p-Werte mit den berechneten sortierten lokalen α-Niveaus (beginnend mit ) und wiederhole diesen Schritt so oft, bis der p-Wert größer ist als der zugehörige Wert.

6. Schritt

Alle Null-Hypothesen, deren p kleiner als der lokale α-Wert waren, werden zurückgewiesen (bedeutet: der Effekt ist signifikant, es wird davon ausgegangen, dass die Alternativ-Hypothese zutrifft). Die Prozedur endet mit derjenigen Null-Hypothese, deren p größer als das lokale α-Niveau ist. Alle folgenden Null-Hypothesen werden nicht zurückgewiesen (unter dem globalen α-Niveau).

Die Bonferroni-Holm-Prozedur ist weniger konservativ als die Bonferroni-Korrektur. Nur der erste Test muss auf dem bei der Bonferroni-Korrektur erforderlichen Niveau statistisch signifikant sein, danach sinkt das nötige Niveau stetig. Allerdings weist auch diese Prozedur ebenso wie die Bonferroni-Korrektur den Nachteil auf, dass eventuelle logische und stochastische Abhängigkeiten zwischen den Teststatistiken nicht genutzt werden.

Weitere Methoden

Neben den beschriebenen Adjustierungen existieren noch weitere Möglichkeiten der Anpassung an ein globales α-Niveau. Dazu gehören beispielsweise:

Belege

  1. Victor A, Elsässer A, Hommel G, Blettner M: Wie bewertet man die p-Wert-Flut? Dtsch Arztebl Int 2010; 107(4):50-56 doi:10.3238/arztebl.2010.0050.
  2. S. Holm: A simple sequentially rejective multiple test procedure. In: Scandinavian Journal of Statistics. Vol. 6, 1979, S. 65–70.