Power

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Dieser Artikel beschäftigt sich mit dem Begriff Power aus der Statistik. Für weitere Bedeutungen siehe Power (Begriffsklärung).

Power (englisch für Kraft, Macht, Energie), auch Teststärke genannt, beschreibt in der Statistik die Aussagekraft eines statistischen Tests.

Die Teststärke gibt an, mit welcher Wahrscheinlichkeit ein Signifikanztest zugunsten einer konkreten Alternativhypothese H1 (zum Beispiel „Es gibt einen Unterschied“) entscheidet, falls diese richtig ist. Die abzulehnende Hypothese wird H0, die Nullhypothese genannt. Hohe Testpower spricht gegen, niedrige Testpower für die Nullhypothese H0.

Die Teststärke hat den Wert 1-β, ist also, wenn β die Wahrscheinlichkeit, einen Fehler 2. Art zu begehen, bezeichnet, selbst die Wahrscheinlichkeit, einen ebensolchen Fehler zu vermeiden.

Entscheidungstabelle[Bearbeiten]

Wahrer Sachverhalt: H0
(Es gibt keinen Unterschied)
Wahrer Sachverhalt: H1
(Es gibt einen Unterschied)
durch einen statistischen Test fällt eine Entscheidung für: H0 richtige Entscheidung (Spezifität)
Wahrscheinlichkeit: 1-α
Fehler 2. Art
Wahrscheinlichkeit: β
durch einen statistischen Test fällt eine Entscheidung für: H1 Fehler 1. Art
Wahrscheinlichkeit: α
richtige Entscheidung
Wahrscheinlichkeit: 1-β (Power, Sensitivität)

Wahl des β-Fehler-Niveaus[Bearbeiten]

Einfluss des Stichprobenumfangs auf die Gütefunktion bzw. Teststärke eines einseitigen (in diesem Fall rechtsseitigen) Tests
Einfluss des Stichprobenumfangs auf die Gütefunktion bzw. Teststärke eines zweiseitigen Tests

Für Wirksamkeitsstudien medizinischer Behandlungen schlägt Cohen (1969: 56) für β einen 4-mal so hohen Wert wie für das Signifikanzniveau α vor. Wenn α = 5 % ist, sollte das β-Fehler-Niveau also 20 % betragen. Liegt in einer Untersuchung die β-Fehler-Wahrscheinlichkeit (Wahrscheinlichkeit für einen Fehler 2. Art) unter dieser 20 %-Grenze, so ist die Teststärke (1-β) damit größer als 80 %.

Es sollte dabei bedacht werden, dass β-Fehler bei vorgegebenem, festem Signifikanzniveau α im Allgemeinen nicht direkt kontrolliert werden können. So ist der ß-Fehler bei vielen asymptotischen oder nichtparametrischen Tests schlechthin unberechenbar oder es existieren nur Simulationsstudien. Bei einigen Tests dagegen, zum Beispiel dem t-Test, kann der β-Fehler kontrolliert werden, wenn der statistischen Auswertung eine Stichprobenumfangsplanung vorausgeht.

Determinanten der Teststärke[Bearbeiten]

Die Teststärke (1-β) wird größer:[1]

  • mit wachsender Differenz von  \mu_0 - \mu_1 (das bedeutet: ein großer Unterschied zwischen zwei Teilpopulationen wird seltener übersehen als ein kleiner Unterschied)
  • mit kleiner werdender Merkmalsstreuung  \sigma
  • mit größer werdendem Signifikanzniveau  \alpha (sofern  \beta nicht festgelegt ist)
  • mit wachsendem Stichprobenumfang, da der Standardfehler dann kleiner wird: \sigma_{\overline{x}} = \frac{\sigma}{\sqrt{n}}
  • bei einseitigen Tests im Vergleich zu zweiseitigen Tests: Für den zweiseitigen Test braucht man einen etwa um 25 % größeren Stichprobenumfang, um dieselbe Power wie für den einseitigen Test zu erreichen.

Wichtig für die Teststärke bzw. Power ist auch die Art des statistischen Tests: Parametrische Tests wie zum Beispiel der t-Test haben, falls die Verteilungsannahme stimmt, bei gleichem Stichprobenumfang stets eine höhere Power als nichtparametrische Tests wie zum Beispiel der Wilcoxon-Vorzeichen-Rang-Test. Weichen die angenommene und die wahre Verteilung jedoch voneinander ab, liegt also beispielsweise in Wahrheit eine Laplace-Verteilung zugrunde, während eine Normalverteilung angenommen wurde, können nichtparametrische Verfahren jedoch auch eine wesentlich größere Power aufweisen als ihre parametrischen Gegenstücke.

Entgegengesetzte Notation[Bearbeiten]

In manchen Quellen wird, was für Verwirrung sorgen kann, für den Fehler 2. Art und die Teststärke die genau entgegengesetzte Notation verwendet, also die Wahrscheinlichkeit, einen Fehler 2. Art zu begehen, mit dem Wert 1-β bezeichnet, die Teststärke dagegen mit β.[2]

Siehe auch[Bearbeiten]

Literatur[Bearbeiten]

Weblinks[Bearbeiten]

 Wiktionary: Power – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Einzelnachweise[Bearbeiten]

  1. Bortz, J.: Statistik für Sozialwissenschaftler. Springer, Berlin 1999. ISBN 3-540-21271-X
  2. Erwin Kreyszig: Statistische Methoden und ihre Anwendungen; 7. Auflage, Göttingen 1998, S.209ff.