Konfidenzintervall einer unbekannten Wahrscheinlichkeit

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Ein Konfidenzintervall einer unbekannten Wahrscheinlichkeit ist ein Konfidenzintervall (Vertrauensbereich) für den Parameter p der Binomialverteilung (nach Beobachtung von k Treffern in einer Stichprobe der Länge n).

Vergleich der in diesem Artikel besprochenen Methoden, Konfidenzintervalle für den Parameter p der Binomialverteilung zu bestimmen (das Konfidenzniveau γ ist hier gleich 0,95).

Exakte Konfidenzintervalle, wie das Clopper-Pearson-Intervall, erhält man mit Hilfe der Binomialverteilung. Es gibt aber auch Näherungsmethoden, die (meistens) auf der Approximation der Binomialverteilung durch die Normalverteilung basieren.[1]

Einführendes Beispiel[Bearbeiten]

Um den unbekannten relativen Anteil p einer politischen Partei A in der Wählerschaft zu schätzen, werden in einer Meinungsumfrage n = 400 Personen befragt, ob sie die Partei A wählen werden. Das exakte Vorgehen ist: Wir wählen 400 Mal eine zufällige Person aus der Wählerschaft aus und befragen diese. Dabei halten wir nicht fest, ob diese Person schon einmal befragt wurde. Es kann also vorkommen, wenngleich es auch bei einer großen Wählerschaft entsprechend unwahrscheinlich ist, dass dieselbe Person mehrmals befragt wird. Die Anzahl X der Befragten, die angeben, die Partei A zu wählen, ist vom Zufall abhängig und deshalb eine Zufallsvariable. Da die befragten Personen zufällig und unabhängig voneinander ausgewählt werden, ist die Zufallsvariable X binomialverteilt mit den Parametern n = 400 und dem unbekannten Parameter p. Nehmen wir an, in der Umfrage haben k = 20 Befragte angegeben, die Partei A zu wählen. Man berechnet eine Schätzung \hat p von p als:


\hat p ={k\over n} = 0{,}05 \,
.

Man nennt dies eine Punktschätzung, weil nur ein Wert als Schätzung von p berechnet wird.

Der wahre Wert des relativen Anteils p kann sowohl kleiner, als auch größer als der Punktschätzer \hat p sein. Mit Sicherheit gilt nur, dass p jeden Wert zwischen 0 und 1 annehmen kann. Wünschenswert wäre ein Konfidenzintervall [pu, po] für p. Beim vielfachen Wiederholen des Verfahrens sollen die berechneten Konfidenzintervalle in den „meisten Fällen“ den Parameter p enthalten. Wie oft das der Fall sein soll, wird mittels der Vertrauenswahrscheinlichkeit (oder auch Konfidenzniveau) γ ausgedrückt. Das berechnete Intervall [pu, po] wird Konfidenzintervall (oder Vertrauensbereich) genannt. Oft wird γ gleich 95 % gewählt. Das bedeutet, dass bei Wiederholung des Verfahrens für 95 % aller Stichproben die Aussage p ∈ [pu, po] richtig ist.

Clopper-Pearson-Intervall[Bearbeiten]

ClopperPearsonInterval.png

Von C. Clopper und Egon Pearson (1934) stammt das folgende exakte Verfahren, um die untere Grenze pu und die obere Grenze po zu bestimmen.[2] Es sei, wie bisher, n die Größe der Stichprobe, k die Anzahl der Erfolge und das Konfidenzniveau sei 95 %.

Die obere Grenze bestimmt man aus P(X ≤ k; po) = 0,025 und die untere Grenze aus P(X ≥ k; pu) = 0,025, siehe Abbildung. Die untere Grenze lässt sich für k = 0 mit dieser Formel nicht angeben.

Erläuterung: Wenn die Wahrscheinlichkeit, höchstens k Erfolge zu erzielen, für einen Anteilswert p die Grenze 0,025 unterschreitet, so kann bei einer Irrtumswahrscheinlichkeit von maximal 2,5 % ausgeschlossen werden, dass p der gesuchte Anteilswert ist. Somit ist po der größte Wert von p, bei dem beim gegebenen Konfidenzniveau noch angenommen werden kann, dass k oder weniger Erfolge auftreten. Für größere Werte von p erscheint dies zu unwahrscheinlich.

Für die untere Grenze gilt entsprechend: pu ist der kleinste Wert von p, bei dem noch angenommen wird, dass k oder mehr Erfolge auftreten können. Für kleinere Werte von p erscheint dies zu unwahrscheinlich, wobei auch hier die Irrtumswahrscheinlichkeit maximal 2,5 % beträgt. Somit liegt man in mindestens 95 % aller Fälle mit der Aussage „p ≤ po und p ≥ pu“ richtig.

Praktische Berechnung[Bearbeiten]

Die beiden Werte pu, po lassen sich z.B. mit der Excel-Funktion BETAINV berechnen. Die Funktion gibt das Quantil der angegebenen Betaverteilung zurück und man erhält aufgrund des Zusammenhangs der Binomial- und Betaverteilung für die Auflösung der Gleichung P_p(X ≤ k) = α:
p = BETAINV(1-α;k+1;n-k). Im Folgenden bezeichnen wir wie bisher das Konfidenzniveau mit γ, außerdem sei α = 1-γ.

Im Beispiel mit n = 400, k = 20 sowie Konfidenzniveau von 95 % erhält man so für die untere Grenze des Konfidenzintervalls:
P(X ≥ 20) = 0,025
P(X ≤ 19) = 0,975
pu = BETAINV(1 - 0,975; 20; 400 - 19) = 0,03081

und für die obere Grenze des Konfidenzintervalls:
P(X ≤ 20) = 0,025
po = BETAINV(1 - 0,025; 21; 400 - 20) = 0,07617

Erläuterung in Worten: Selbst bei einem Stimmenanteil von nur 3,1 % beträgt die Wahrscheinlichkeit, dass sich in der Stichprobe mindestens 20 Personen befinden, noch 2,5 %. Und entsprechend: sogar bei einem Stimmenanteil von 7,6 % beträgt die Wahrscheinlichkeit, dass sich in der Stichprobe höchstens 20 Personen befinden, noch 2,5 %

Die Methode ist in der folgenden Tabelle zusammengefasst:

allgemeiner Fall Sonderfall
untere Grenze pu = BETAINV(α/2;k;n-k+1) pu=0 für k=0
obere Grenze po = BETAINV(1-α/2;k+1;n-k) po=1 für k=n

Analyse der Überdeckungswahrscheinlichkeit[Bearbeiten]

Ist C(k) das Konfidenzintervall zu k Erfolgen, so verlangt man laut Definition, dass für alle p die Überdeckungswahrscheinlichkeit  P_p ( k \in \{0,\ldots,n\} : p \in C(k)) größer oder gleich γ ist. Bei stetigen Verteilungen lassen sich Konfidenzintervalle finden, so dass hier Gleichheit vorliegt (also = γ statt >= γ). Dies ist für die diskrete Binomialverteilung nicht möglich. In folgender Abbildung ist die Überdeckungswahrscheinlichkeit in Abhängigkeit von p dargestellt. Das Clopper-Pearson-Intervall wird übrigens deshalb exakt genannt, weil es eine Überdeckungswahrscheinlichkeit sicherstellt, die für alle p tatsächlich größer oder gleich dem geforderten Konfidenzniveau ist. Für die im Folgenden besprochenen Approximationen ist das nicht der Fall: hier gibt es oft Überdeckungswahrscheinlichkeiten, die kleiner sind als das geforderte Niveau!

Die Überdeckungswahrscheinlichkeit berechnet man in Abhängigkeit von p und n wie folgt:

P_p ( k \in \{0,\ldots,n\} : p \in C(k)) = \sum_{k=0}^n B(k|p,n)\cdot \mathbf{1}_{[p_u(k), p_o(k)]}(p).

Hier ist \mathbf{1}_{[p_u(k), p_o(k)]}(p) die Indikatorfunktion. Sie nimmt den Wert 1 an, wenn p im Konfidenzintervall liegt, und sonst den Wert 0. Für k = 0 setzt man pu = 0.

Überdeckungswahrscheinlichkeit des Clopper-Pearson-Intervalls für n=40 und n=400. Sie liegt für alle p über dem geforderten Konfidenzniveau.


Einfache Approximation durch die Normalverteilung[Bearbeiten]

Überdeckungswahrscheinlichkeit des Standard-Intervalls für n=400.

Oft verwendet man die folgende einfache Näherungsformel:[3]


c = \Phi^{-1} \left( 1 - {\alpha \over 2} \right) \,

p_u = \hat p - c \cdot \sqrt{\hat p \cdot (1-\hat p) \over n}
 \,

p_o = \hat p + c \cdot \sqrt{\hat p \cdot (1-\hat p) \over n} \,

welches auch Standard-Intervall genannt wird.

Wenn diese Formel verwendet wird, sollte k ≥ 50 und n - k ≥ 50 sein. Trotzdem kann die Verwendung des Standard-Intervalls problematisch sein. In der Abbildung ist z.B. die Überdeckungswahrscheinlichkeit für n=400 und p \in [0{,}125;0{,}875] illustriert. Sie liegt oft unter dem geforderten Niveau von 0,95.

Wilson-Intervall[Bearbeiten]

Für n=1,...,40 ist hier die Überdeckungswahrscheinlichkeit für das Clopper-Pearson-Intervall aufgetragen. Sie ist stets größer als γ=0,95.
Beim Standard-Intervall liegt die Überdeckungswahrscheinlichkeit für n=1,...,40 fast immer unter dem geforderten Konfidenzniveau.
Die Überdeckungswahrscheinlichkeit für das Wilson-Intervall für n=1,...,40.
Die Überdeckungswahrscheinlichkeit für das Agresti-Coull-Intervall für n=1,...,40.

Dieses Intervall wurde 1927 von Edwin Bidwell Wilson vorgeschlagen und ist genauer als die einfache Approximation durch die Normalverteilung. Es gilt, mit dem gleichen c wie im vorigen Abschnitt,


p_{o,u} = \frac{1}{1 + \frac{c^2}{n}} \cdot \left(\hat p + \frac{c^2}{2n} \pm c\cdot\sqrt{\frac{\hat p \cdot (1-\hat p)}{n}+\frac{c^2}{4n^2}} \, \right)

Offenbar konvergieren die Intervallgrenzen für große n gegen die Grenzen des Standard-Intervalls (da c^2/2n und c^2/4n^2 mit wachsendem n gegen Null gehen).

Durch Umformen erhält man die bei Brown/Cai/DasGupta auf Seite 107 angegebene Formel (4):


p_{o,u} = \frac{k+\frac{c^2}{2}}{n+c^2} \pm \frac{c \sqrt{n}}{n+c^2} \cdot \sqrt{\frac{k}{n}\left(1-\frac{k}{n}\right)+\frac{c^2}{4n}}

In der Abbildung ist die Überdeckungswahrscheinlichkeit für n=1,...,40 illustriert.

Die bei Henze auf Seite 228 angegebene Formel unterscheidet sich davon noch durch eine Stetigkeitskorrektur (von +0,5 oder -0,5 angewandt auf k).

Agresti-Coull-Intervall[Bearbeiten]

Für dieses Intervall setzt man \tilde k = k+\frac{c^2}{2}, \,\tilde n = n + c^2, \,\tilde p = \frac{\tilde k}{\tilde n} und verwendet die (oben beschriebene) einfache Approximation mit diesen Parametern:


p_{o,u} = \tilde p \pm c \cdot \sqrt{\tilde p \cdot (1-\tilde p) \over \tilde n}

Der Mittelpunkt des Intervalls ist identisch zu dem des Wilson-Intervalls und das Intervall ist nie kürzer als ein Wilson-Intervall.[4]

Falls γ = 0,95, dann ist c = 1{,}96 \approx 2 und man bekommt eine einfache Regel: \tilde k = k+2, \tilde n = n+4 und \tilde p=\frac{k+2}{n+4}.

Diskussion der Vor- und Nachteile der Verfahren[Bearbeiten]

Die beschriebenen Methoden werden in dem grundlegenden Artikel von Brown/Cai/DasGupta verglichen. Dort wird das Standard-Intervall auch Wald-Intervall genannt (nach Abraham Wald). Brown/Cai/DasGupta empfehlen drei Intervall-Methoden: das Wilson-Intervall, das Agresti-Coull-Intervall und das Jeffreys-Intervall, welches wir hier nicht besprochen haben.[5] Für einen graphischen Vergleich der oberen und unteren Grenzen für die vier Methoden siehe auch die Abbildung am Anfang dieser Seite.

Literatur[Bearbeiten]

  • Agresti, Alan, und Coull, Brent A.: Approximate is better than 'exact' for interval estimation of binomial proportions, The American Statistician 52, 119-126 (1998)
  • Brown, Lawrence D., Cai, T. Tony und Anirban DasGupta: Interval Estimation for a Binomial Proportion', Statistical Science 16 (2), 101–133 (2001) - pdf
  • Clopper, C. und Pearson, E. S.: The use of confidence or fiducial limits illustrated in the case of the binomial, Biometrika 26, 404-413 (1934)
  • Ross, T. D.: Accurate confidence intervals for binomial proportion and Poisson rate estimation, Computers in Biology and Medicine 33, 509-531 (2003)
  • Wilson, E. B.: Probable inference, the law of succession, and statistical inference, Journal of the American Statistical Association 22, 209-212 (1927)
  • Henze, Norbert: Stochastik für Einsteiger: Eine Einführung in die faszinierende Welt des Zufalls. 8. Auflage. Vieweg+Teubner Verlag 2010, ISBN 978-3-8348-0815-8, doi:10.1007/978-3-8348-9351-2.
  • Krengel, Ulrich: Einführung in die Wahrscheinlichkeitstheorie und Statistik. 8. Auflage. Vieweg, 2005.
  • Rinne, Horst: Taschenbuch der Statistik, Harri Deutsch (2003)

Einzelnachweise[Bearbeiten]

  1. Die wichtigsten Methoden werden in dem grundlegenden Artikel von Brown/Cai/DasGupta verglichen. Außer den hier angegebenen wird dort noch z.B. das Jeffreys-Intervall besprochen.
  2. Siehe Krengel, Kapitel 4.7, Abschnitt Konfidenzintervalle für die Erfolgswahrscheinlichkeit
  3. Siehe hierfür und auch für die Clopper-Pearson- und Wilson-Intervalle Seite 459 des Taschenbuch der Statistik von Horst Rinne.
  4. Siehe Brown/Cai/DasGupta, S. 108
  5. Ihr Artikel wird ergänzt durch fünf Kommentare von (1) Alan Agresti und Brent A. Coull (2) George Casella (3) Chris Corcoran und Cyrus Mehta (4) Malay Ghosh (5) Thomas J. Santner und abgeschlossen durch eine Erwiderung von Brown/Cai/DasGupta.