Neyman-Pearson-Lemma

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Das Neyman-Pearson-Lemma (auch Fundamentallemma von Neyman-Pearson) ist ein Satz der mathematischen Statistik, der eine Optimalitätsaussage über die Konstruktion eines Hypothesentests macht. Gegenstand des Neyman-Pearson-Lemmas ist das denkbar einfachste Szenario eines Hypothesentests, das auch Neyman-Pearson-Test genannt wird: Dabei ist sowohl die Nullhypothese H_0 als auch die Alternativhypothese H_1 einfach, d. h. sie entsprechen jeweils einer einzelnen Wahrscheinlichkeitsverteilung, deren zugehörige Wahrscheinlichkeitsdichten nachfolgend mit f_0 und f_1 bezeichnet werden. Dann, so die Aussage des Neyman-Pearson-Lemmas, erhält man den stärksten Test durch eine Entscheidung, bei der die Nullhypothese verworfen wird, wenn der Likelihoodquotient f_0/f_1 einen bestimmten Wert unterschreitet.

Das Lemma ist nach Jerzy Neyman und Egon Pearson benannt.

Situation[Bearbeiten]

Gesucht ist ein möglichst „guter“ Hypothesentest, der mit hoher Zuverlässigkeit eine Entscheidung zwischen Null- und Alternativhypothese herbeiführen soll. Dabei wird vorausgesetzt, dass Null- und Alternativhypothese jeweils genau einer für die Beobachtungsergebnisse geltenden Wahrscheinlichkeitsverteilung entsprechen. Unter dieser Voraussetzung kann für jede Festlegung eines Verwerfungsbereichs die Wahrscheinlichkeit einer falschen Testentscheidung exakt berechnet werden: Im Detail handelt es sich um die beiden Wahrscheinlichkeiten für einen Fehler erster Art und einen Fehler zweiter Art. Daher können bei einer durch das Signifikanzniveau vorgegebenen Obergrenze für einen Fehler erster Art die theoretisch denkbaren Testentscheidungen besonders einfach in qualitativer Hinsicht untereinander verglichen werden.

Formale Beschreibung der Situation[Bearbeiten]

Beobachtet werden Realisationen eines reellen Zufallsvektors X mit Dimension d über dem Messraum (\mathbb R^d,\mathcal B^d). Unbekannt ist die exakte Verteilung P_X von X. Getestet werden soll die Hypothese "P_X=P_0" gegen die Alternative "P_X=P_1" für zwei Wahrscheinlichkeitsmaße P_0,P_1 über dem gegebenen Messraum. Die Maße P_0 und P_1 besitzen Dichten f_0 bzw. f_1 bzgl. dem Lebesgue-Maß, d.h. sie beschreiben stetige Verteilungen über dem \mathbb R^d.

Charakterisiert wird ein Entscheidungsverfahren jetzt durch die Festlegung eines Verwerfungsbereichs B\in\mathcal B^d, mit dessen Hilfe man die Grundhypothese genau dann verwirft, wenn die beobachtete Realisation von X in B liegt. Dieser Test darf ein vorgegebenes Niveau \alpha\in(0,1) nicht überschreiten,

P_0(B)=\int 1_B(x)f_0(x)dx \leq \alpha ,

d.h. die Wahrscheinlichkeit für ein fälschliches Verwerfen der Grundhypothese, der sog. Fehler 1. Art, darf nicht größer als \alpha sein. Unter allen Tests, die dieses Niveau einhalten, nennt man denjenigen den stärksten Test, der die sog. Teststärke P_1(B) maximiert, sprich einen minimalen Fehler 2. Art,

P_1(B^\complement)=\int 1_{B^\complement}(x)f_1(x)dx ,

die Wahrscheinlichkeit für ein fälschliches Nichtverwerfen der Grundhypothese, besitzt.

Formulierung[Bearbeiten]

Das Neyman-Pearson-Lemma[Bearbeiten]

Unter der obigen Situation betrachtet man für eine Realisation von X den erweiterten Likelihoodquotienten

q(x):=\begin{cases}\frac{f_0(x)}{f_1(x)}\ ,& f_1(x)>0 \\ 1\ ,& f_0(x)=f_1(x)=0 \\ \infty \ ,& f_0(x)>0, f_1(x)=0\end{cases} \ .

Der Fall f_0(x)=f_1(x)=0 wird nur der Vollständigkeit halber definiert, da er mit keiner positiven Wahrscheinlichkeit eintritt.

Jetzt ist ein Test der Hypothese "P_X=P_0" gegen die Alternative "P_X=P_1" zu einem gegebenen Niveau \alpha\in(0,1) genau dann optimal (stärkster Test), wenn ein \gamma\in(0,\infty) existiert, sodass sein Verwerfungsbereich B\in\mathcal B^d die Forderungen

  1. P_0(B)=\alpha sowie
  2. q(x)\leq\gamma für fast sicher alle x\in B und
  3. q(x)\geq\gamma für fast sicher alle x\in B^\complement

erfüllt. Die fast sicheren Eigenschaften aus 2. und 3. beziehen sich hierbei auf das Wahrscheinlichkeitsmaß 0.5(P_0+P_1), d.h. sie müssen fast sicher bzgl. P_0 und P_1 eintreten.

Erfüllt ein Verwerfungsbereich B die Forderungen 1.-3., nennt man diesen auch einen Neyman-Pearson-Bereich. In diskreten Modellen existiert solch ein Verwerfungsbereich nur zu bestimmten Niveaus \alpha, um ein vorgebenes Niveau komplett auszuschöpfen muss gegebenenfalls auf randomisierte Tests zurückgegriffen werden.

Sonderfälle[Bearbeiten]

Durch das obige Lemma nicht betrachtet wurden wenigstens die folgenden Sonderfälle:

  • Der Verwerfungsbereich B_0=\{f_0=0\} ist der stärkste Test zum Testniveau \alpha=0, d.h. der Test weist keinen Fehler 1. Art auf. Der entsprechende Testparameter ist \gamma=0.
  • Der Verwerfungsbereich B_1=\{f_1>0\} ist der stärkste Test zum Niveau \alpha=P_0(B_1), denn er besitzt die Teststärke P_1(B_1)=1, d.h. der Test weist keinen Fehler 2. Art auf. Der entsprechende Testparameter ist \gamma=\infty.

Literatur[Bearbeiten]

Weblinks[Bearbeiten]