Überdeckungswahrscheinlichkeit

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

In der Statistik gibt die Überdeckungswahrscheinlichkeit eines Konfidenzintervalls (auch Vertrauensbereich) die Wahrscheinlichkeit an, dass dieses Intervall tatsächlich den wahren Wert enthält.

Der Vertrauensbereich zielt entsprechend seiner Konstruktion darauf ab, mit einer bestimmten Wahrscheinlichkeit den unbekannten Parameter zu enthalten. Dies ist das Konfidenzniveau (auch Konfidenzkoeffizient), das als nominelle Überdeckungswahrscheinlichkeit bei der Konstruktion des Konfidenzintervalls verwendet und oft bei 95 Prozent gewählt wird. Die Überdeckungswahrscheinlichkeit ist nun die tatsächliche Wahrscheinlichkeit, dass das resultierende Konfidenzintervall (eine zufällige Menge) den wahren (fixen) Parameter enthält.

Definition[Bearbeiten | Quelltext bearbeiten]

Das Konfidenzniveau (auch Überdeckungswahrscheinlichkeit) zu einem Parameter erfüllt zusammen mit den Statistiken , welche die Grenzen des -Konfidenzintervalls sind, die folgende Wahrscheinlichkeitsbedingung:

Der Begriff der Wahrscheinlichkeit in der Überdeckungswahrscheinlichkeit bezieht sich auf eine Menge von hypothetischen Wiederholungen des gesamten Datenerfassungs- und Analyseverfahrens. Bei diesen hypothetischen Wiederholungen werden unabhängige Datensätze mit der gleichen Wahrscheinlichkeitsverteilung betrachtet, und ein Vertrauensintervall für jeden dieser Datensätze berechnet.

Konservative versus permissive Konfidenzintervalle[Bearbeiten | Quelltext bearbeiten]

Wenn alle bei der Konstruktion des Konfidenzintervalls verwendeten Annahmen erfüllt sind, wird die nominelle Überdeckungswahrscheinlichkeit mit der (tatsächlichen) Überdeckungswahrscheinlichkeit zusammenfallen. Ist dies hingegen nicht gegeben, so kann die tatsächliche Überdeckungswahrscheinlichkeit kleiner oder größer als die nominelle sein.

Wenn die tatsächliche Überdeckungswahrscheinlichkeit größer als die nominelle ist, wird das Intervall bzw. die Methode zu seiner Berechnung als konservativ bezeichnet; wenn sie kleiner ist, als antikonservativ oder permissiv.

Eine Diskrepanz zwischen der tatsächlichen und der nominellen Überdeckungswahrscheinlichkeit tritt häufig bei der Näherung einer diskreten Verteilung durch eine kontinuierliche auf. Die Konstruktion des Konfidenzintervalls für die Erfolgswahrscheinlichkeit der Binomialverteilung ist ein klassisches Beispiel, bei dem tatsächliche und nominelle Überdeckungswahrscheinlichkeit selten übereinstimmen.[1][2][3]

Weblinks[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Alan Agresti, Brent Coull: Approximate Is Better than "Exact" for Interval Estimation of Binomial Proportions. In: The American Statistician. Band 52, Nr. 2, 1998, S. 119–126, doi:10.2307/2685469, JSTOR:2685469.
  2. Lawrence Brown, Tony T. Cai, Anirban DasGupta: Interval Estimation for a binomial proportion. In: Statistical Science. Band 16, Nr. 2, 2001, S. 101–117, doi:10.1214/ss/1009213286 (upenn.edu [PDF]).
  3. Roberz Newcombe: Two-sided confidence intervals for the single proportion: Comparison of seven methods. In: Statistics in Medicine. Band 17, 2, Issue 8, 1998, S. 857–872, doi:10.1002/(SICI)1097-0258(19980430)17:8<857::AID-SIM777>3.0.CO;2-E, PMID 9595616.