Überdeckungswahrscheinlichkeit

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

In der Statistik gibt die Überdeckungswahrscheinlichkeit eines Vertrauensbereichs die Wahrscheinlichkeit an, dass der Vertrauensbereich den wahren Wert enthält.

Angenommen unser Interesse gilt der mittleren Anzahl von Monaten, die Menschen mit einer bestimmten Art von Krebs nach erfolgreicher Behandlung mit Chemotherapie in Remission bleiben. Der Vertrauensbereich zielt entsprechend seiner Konstruktion darauf ab, mit einer bestimmten Wahrscheinlichkeit die unbekannte mittlere Remissionsdauer zu enthalten. Dies ist das „Konfidenzniveau“, das als nominelle Überdeckungswahrscheinlichkeit bei der Konstruktion des Konfidenzintervalls verwendet und oft bei 95 Prozent gewählt wird. Die Überdeckungswahrscheinlichkeit ist nun die tatsächliche Wahrscheinlichkeit, dass das resultierende Zeitintervall (in diesem Beispiel) die wahre mittlere Remissionsdauer enthält.

Wenn alle bei der Konstruktion des Konfidenzintervalls verwendeten Annahmen erfüllt sind, wird die nominelle Überdeckungswahrscheinlichkeit mit der (tatsächlichen) Überdeckungswahrscheinlichkeit zusammenfallen. Ist dies hingegen nicht gegeben, so kann die tatsächliche Überdeckungswahrscheinlichkeit kleiner oder größer als die nominelle sein. Wenn die tatsächliche Überdeckungswahrscheinlichkeit größer als die nominelle ist, wird das Intervall bzw. die Methode zu seiner Berechnung als "konservativ" bezeichnet. Eine Diskrepanz zwischen der tatsächlichen und der nominellen Überdeckungswahrscheinlichkeit tritt häufig bei der Näherung einer diskreten Verteilung durch eine kontinuierliche auf. Die Konstruktion binomischer Konfidenzintervalle ist ein klassisches Beispiel, bei dem tatsächliche und nominelle Überdeckungswahrscheinlichkeit selten übereinstimmen[1][2][3].

Der Begriff der Wahrscheinlichkeit in der Überdeckungswahrscheinlichkeit bezieht sich auf eine Menge von hypothetischen Wiederholungen des gesamten Datenerfassungs- und Analyseverfahrens. Bei diesen hypothetischen Wiederholungen werden unabhängige Datensätze mit der gleichen Wahrscheinlichkeitsverteilung wie die tatsächlichen Daten betrachtet, und ein Vertrauensintervall für jeden dieser Datensätze berechnet.

Siehe auch[Bearbeiten]

Einzelnachweise[Bearbeiten]

  1. Alan Agresti, Coull, Brent: Approximate Is Better than "Exact" for Interval Estimation of Binomial Proportions. In: The American Statistician. 52, Nr. 2, 1998, S. 119–126. doi:10.2307/2685469.
  2. Lawrence Brown, Cai, T. Tony; DasGupta, Anirban: Interval Estimation for a binomial proportion. In: Statistical Science. 16, Nr. 2, 2001, S. 101–117. doi:10.1214/ss/1009213286.
  3. Robert Newcombe: Two-sided confidence intervals for the single proportion: Comparison of seven methods.. In: Statistics in Medicine. 17, 1998, S. 857–872. doi:10.1002/(SICI)1097-0258(19980430)17:8<857::AID-SIM777>3.0.CO;2-E. PMID 9595616.