Konfidenzintervall

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Konfidenzintervalle zum Niveau 95 % für 100 Stichproben vom Umfang 30 aus einer normalverteilten Grundgesamtheit. Davon überdecken 94 Intervalle den exakten Erwartungswert μ = 5; die übrigen 6 tun das nicht.

Ein Konfidenzintervall (auch Vertrauensbereich oder Vertrauensintervall und Erwartungsbereich genannt) ist ein Intervall aus der Statistik, das die Präzision der Lageschätzung eines Parameters (zum Beispiel eines Mittelwertes) angibt. Das Konfidenzintervall ist der Bereich, der bei unendlicher Wiederholung eines Zufallsexperiments mit einer gewissen Häufigkeit (dem Konfidenzniveau) die wahre Lage des Parameters einschließt.

Ein häufig verwendetes Konfidenzniveau ist 95 %, so dass in diesem Fall (mindestens) 95 % aller auf Grundlage von gemessenen Daten berechneten Konfidenzintervalle den wahren Wert der zu untersuchenden Population beinhalten. Die häufig anzutreffende Formulierung, dass der wahre Wert zu 95 % im Konfidenzintervall liegt, d. h. im vorhandenen berechneten Intervall, ist streng genommen nicht korrekt.[1][2]

Das Schätzen von Parametern mit Hilfe von Konfidenzintervallen wird Intervallschätzung genannt. Ein Vorteil gegenüber Punktschätzern ist, dass man an einem Konfidenzintervall direkt die Signifikanz ablesen kann. Ein für ein vorgegebenes Konfidenzniveau breites Intervall weist auf einen geringen Stichprobenumfang oder eine starke Variabilität in der Grundgesamtheit hin.

Definition[Bearbeiten]

Es seien unabhängige und identisch verteilte Zufallsvariablen X_1,\dotsc, X_n mit unbekanntem reellen Verteilungsparameter \vartheta gegeben. Wenn sich Stichprobenfunktionen U und V angeben lassen, so dass gilt:

P(U < \vartheta < V) \geq \gamma

mit \gamma \in (0,1), dann heißt das (stochastische) Intervall [U, V] ein Konfidenzintervall für \vartheta zum Konfidenzniveau \gamma (auch: ein \gamma-Konfidenzintervall). Die Realisationen u und v von U bzw. V bilden das Schätzintervall [u, v].

Da die Realisationen u und v der Grenzen U und V keine Zufallsvariablen sind und \vartheta ein fixer Wert ist, kann man nicht sagen, dass das Schätzintervall [u, v] mit einer Wahrscheinlichkeit von \gamma den unbekannten Parameter \vartheta enthält. Es bedeutet vielmehr, dass im Mittel ein Anteil von \gamma aller so berechneten Schätzintervalle den unbekannten Parameter überdecken. Dem nicht widersprechend, kann – wie bereits von Ronald Fisher festgestellt – in manchen Modellen die Qualität des Schätzintervalls von den Daten abhängen und sogar zu Antworten führen, die mit Blick auf die Daten unsinnig sind. Probleme mit solcher Post-Data-Inkohärenz führen zur Theorie der bedingten Inferenz.

Allgemeine Definition Konfidenzbereich[Bearbeiten]

Es seien (X , \mathcal{F}, P_{\vartheta} : \vartheta \in \Theta) ein statistisches Modell und \Sigma eine Menge. Es seien  \tau \colon \Theta \rightarrow \Sigma eine zu ermittelnde Kenngröße für den Parameter  \vartheta und 0 < \alpha < 1.

Eine Abbildung  C : X \rightarrow \mathcal{P}(\Sigma), welche jedem möglichen Beobachtungsergebnis  x \in X eine Menge  C(x) \subset \Sigma zuordnet, heißt Konfidenzbereich zum Irrtumsniveau  \alpha von  \tau , wenn gilt:

 \inf_{\vartheta \in \Theta} P_{\vartheta} ( x \in X \colon C(x) \ni \tau(\vartheta) ) \geq 1 - \alpha\,.

Ist \Sigma \subseteq \R und C(x) für alle x ein Intervall, dann heißt C Konfidenzintervall.

Beschreibung des Verfahrens[Bearbeiten]

Man interessiert sich für den unbekannten Parameter \vartheta einer Grundgesamtheit. Dieser wird durch eine Schätzfunktion aus einer Stichprobe vom Umfang n geschätzt. Es wird davon ausgegangen, dass die Stichprobe eine einfache Zufallsstichprobe ist, in etwa die Grundgesamtheit widerspiegelt und dass deshalb die Schätzung in der Nähe des wahren Parameters liegen müsste. Die Schätzfunktion ist eine Zufallsvariable mit einer Verteilung, die den Parameter \vartheta enthält.

Man kann zunächst mit Hilfe der Verteilung ein Intervall angeben, das den unbekannten wahren Parameter \vartheta mit einer Wahrscheinlichkeit \gamma = 1-\alpha überdeckt. Ermitteln wir z. B. das 95 %-Konfidenzintervall für den wahren Erwartungswert \mu einer Population, dann bedeutet dies, dass wir ein Konfidenzintervall ermitteln, das bei durchschnittlich 95 von 100 gleich großen Zufallsstichproben den Erwartungswert enthält.

Das Verfahren kann anhand eines normalverteilten Merkmals mit dem unbekannten Erwartungswert \mu und der bekannten Varianz \sigma^2 demonstriert werden: Es soll der Erwartungswert \mu dieser Normalverteilung geschätzt werden. Verwendet wird die erwartungstreue Schätzfunktion: der Stichprobenmittelwert  \bar X .

Der Erwartungswert der Population wird anhand unserer Stichprobe geschätzt

Schätzfunktion: \bar X =\frac{1}{n}\sum_{i=1}^n X_i
Punktschätzung: \hat \mu =\bar x = \frac{1}{n}\sum_{i=1}^n x_i\,,

wobei die Zufallsvariable X_i (i=1,\dotsc,n) für die i-te Beobachtung (vor der Ziehung der Stichprobe) steht. Es ist

\bar X \sim \mathcal{N} \left( \mu;\frac{\sigma^2}{n} \right)\,.

Die Grenzen des zentralen Schwankungsintervalls

[\bar x_u; \bar x_o],

das \hat\mu mit der Wahrscheinlichkeit 1-\alpha überdeckt, bestimmen sich aus der Beziehung

P(\bar x_u \le \bar X \le \bar x_o )=1-\alpha.

Man standardisiert zur Standardnormalverteilung \mathcal{N}(0,1) und erhält für die standardisierte Zufallsvariable

Z = \frac {\bar X-\mu}{\sigma/\sqrt{n}}

die Wahrscheinlichkeit

P \left( {-z_\left( 1-\tfrac {\alpha}{2} \right) \le \frac{\bar X-\mu}{\sigma/\sqrt{n}} \le z_\left( 1-\tfrac{\alpha}{2} \right)} \right) =1-\alpha,

wobei \textstyle z_\left( 1-\frac {\alpha}{2} \right) das (1-\tfrac{\alpha}{2})-Quantil der Standardnormalverteilung ist. Löst man nach \mu auf, so ergibt sich aus

P \left( { \bar X-z_\left( 1-\tfrac {\alpha}{2} \right)\frac {\sigma}{\sqrt{n}} \le \mu \le \bar X+z_\left( 1-\tfrac {\alpha}{2} \right) \frac {\sigma}{\sqrt{n}}} \right) =1- \alpha

das (1−α)-Konfidenzintervall für \mu

Mögliche Lage des unbekannten µ im Schätzintervall um das beobachtete \bar x.
\left[ { \bar X-z_\left( 1-\tfrac {\alpha}{2} \right) \frac {\sigma}{\sqrt{n}} ; \ \bar X+z_\left( 1-\tfrac {\alpha}{2} \right) \frac {\sigma}{\sqrt{n}}} \right].

Das Schätzintervall, die Realisation eines Konfidenzintervalles anhand einer konkreten Stichprobe, ergibt sich dann als

\left[ { \bar x-z_\left( 1-\tfrac {\alpha}{2} \right) \frac {\sigma}{\sqrt{n}} ; \ \bar x+z_\left( 1-\tfrac {\alpha}{2} \right) \frac {\sigma}{\sqrt{n}}} \right].

Die Grenzen des Schätzintervalles hängen jedoch von \bar x ab und ändern sich damit von Stichprobe zu Stichprobe. Ist die Stichprobe aber extrem ausgefallen, überdeckt das Intervall den Parameter nicht. Dies ist in 100α % aller Stichproben der Fall, d. h., das durch \bar x bestimmte Intervall überdeckt den wahren Parameter \mu also mit einer Wahrscheinlichkeit von 1−α.

Von besonderem Interesse ist die Breite des Konfidenzintervalls. Diese bestimmt sich durch die Standardabweichung der Schätzfunktion und das gewählte Konfidenzniveau. Durch Erhöhung des Stichprobenumfangs kann die Breite verringert werden. Erwünscht ist in der Regel ein möglichst schmales Konfidenzintervall, denn dies weist bei konstantem Konfidenzniveau auf eine genaue Schätzung hin.

Als absoluter Fehler e wird die halbe Breite des Konfidenzintervalls bezeichnet. Im obigen Fall gilt also

e=z_{\left( 1-\frac{\alpha}2\right)} \frac{\sigma}{\sqrt{n}}\,.

Der absolute Fehler ist ein Maß für die Genauigkeit der Schätzung (Breite des Konfidenzintervalls: 2e).

Der absolute Fehler ist von Bedeutung, wenn bei einem gegebenen Konfidenzintervall und einer gegebenen Konfidenzintervalllänge der benötigte Stichprobenumfang n ermittelt werden soll. Die Frage lautet also: Welchen Stichprobenumfang benötigt man, um einen Parameter (z. B. arithmetisches Mittel) mit vorgegebener Genauigkeit und vorgegebenem Sicherheitsgrad zu schätzen?

Ausgewählte Schätzintervalle[Bearbeiten]

Übersicht für stetige Verteilungen[Bearbeiten]

Erwartungswert eines normalverteilten Merkmals mit bekannter Varianz \sigma^2:

\textstyle z_{(1-\tfrac{\alpha}{2})} ist das (1−α/2)-Quantil der Standardnormalverteilung.

\left[ { \bar x-z_{(1-\tfrac{\alpha}{2})}\frac {\sigma}{\sqrt{n}} \ ; \ \bar x+z_{(1-\tfrac{\alpha}{2})}\frac{\sigma}{\sqrt{n}}} \right]
Erwartungswert eines normalverteilten Merkmals mit unbekannter Varianz:
Die Varianz der Grundgesamtheit wird durch die korrigierte Stichprobenvarianz
s^2= \tfrac {1}{n-1}\sum (x_i-\bar x)^2

geschätzt.

\textstyle t_{(1-\tfrac{\alpha}{2};n-1)} ist das (1−α/2)-Quantil der t-Verteilung mit n-1 Freiheitsgraden.

Für n > 30 kann das Quantil der t-Verteilung näherungsweise durch das entsprechende Quantil der Standardnormalverteilung ersetzt werden.

\left[{\bar x-t_{(1-\tfrac{\alpha}{2};n-1)}\frac{s}{\sqrt{n}}\ ;\ \bar x+t_{(1-\tfrac{\alpha}{2}; n-1)} \frac{s}{\sqrt{n}}} \right]
Erwartungswert eines unbekannt verteilten Merkmals mit unbekannter Varianz:
Falls n genügend groß ist, kann aufgrund des zentralen Grenzwertsatzes das Konfidenzintervall bestimmt werden.
\left[ { \bar x-z_{(1-\tfrac {\alpha}{2})}\frac{s}{\sqrt{n}}\ ;\ \bar x+z_{(1-\tfrac{\alpha}{2})}\frac{s}{\sqrt{n}}} \right]
Standardabweichung eines normalverteilten Merkmals:

\textstyle \chi^2_{(p;k)} ist das p-Quantil der χ2-Verteilung mit k Freiheitsgraden.

 \left[ \ s\sqrt{\frac {n-1}{ \chi^2_{(1-\tfrac {\alpha}{2}; n-1)}}} ; s\sqrt{\frac {n-1}{\chi^2_{(\tfrac {\alpha}{2}; n-1)}}}\ \right]

Diskrete Verteilungen[Bearbeiten]

Konfidenzintervalle für den Parameter p der Binomialverteilung sind beschrieben in dem

Das sogenannte Clopper-Pearson-Konfidenzintervall kann mit Hilfe der Beta- oder F-Verteilung bestimmt werden. Dieses Konfidenzintervall wird auch exakt genannt, da das geforderte Konfidenzniveau tatsächlich eingehalten wird. Bei Näherungsmethoden, die (meistens) auf der Approximation der Binomialverteilung durch die Normalverteilung basieren, wird das Konfidenzniveau oft nicht eingehalten.

Ist die Zahl der Elemente in der Grundgesamtheit bekannt, kann für den Parameter (mit Hilfe eines Korrekturfaktors) auch ein Konfidenzintervall für ein Urnenmodell ohne Zurücklegen angegeben werden.[3]

Konfidenzintervalle und Hypothesentests[Bearbeiten]

Die Begriffe Konfidenzbereich und statistischer Test sind dual zueinander, unter allgemeinen Bedingungen können aus einem Konfidenzbereich für einen Parameter statistische Tests für entsprechende Punkthypothesen gewonnen werden und umgekehrt:

Testet man von einem Parameter θ die Nullhypothese: θ = θ0, dann wird die Nullhypothese bei einem Signifikanzniveau α nicht abgelehnt, wenn das entsprechende (1-α)-Konfidenzintervall, berechnet mit den gleichen Daten, den Wert θ0 enthält. Daher ersetzen Konfidenzintervalle gelegentlich auch Hypothesentests.

Beispielsweise testet man in der Regressionsanalyse, ob im multiplen Regressionsmodell mit der geschätzten Regressionshyperebene

 \hat{y} = b_0 + b_1 \, x_1 + b_2 \, x_2 + \dotsb+ b_m \,x_m

die wahren Regressionskoeffizienten βj (j = 1, … , m) gleich Null sind. Wenn die Hypothese nicht abgelehnt wird, sind die entsprechenden Regressoren xj vermutlich für die Erklärung der abhängigen Variablen y unerheblich. Eine entsprechende Information liefert das Konfidenzintervall für einen Regressionskoeffizienten: Überstreicht das Konfidenzintervall die Null, so ist bei einem Signifikanzniveau α der Regressionskoeffizient statistisch nicht verschieden von 0.

Die Begriffe der Unverfälschtheit und des gleichmäßig besten Tests lassen sich hierüber auf Konfidenzbereiche übertragen.

Beispiele für ein Konfidenzintervall[Bearbeiten]

Beispiel 1

Ein Unternehmen möchte flächendeckend auf dem Markt ein neues Spülmittel einführen. Um die Käuferakzeptanz auszuloten, wird in einem Supermarkt dieses Produkt mit hohem Werbeaufwand platziert. Es soll mit dieser Aktion der durchschnittliche tägliche Absatz in einem Supermarkt dieser Größe geschätzt werden. Man definiert nun den täglichen Absatz als Zufallsvariable X [Stück] mit den unbekannten Parametern Erwartungswert μ und der Varianz σ2. Man geht auf Grund langjähriger Beobachtungen hier davon aus, dass X annähernd normalverteilt ist. Die Marktforschungsabteilung hat ein Konfidenzniveau von 0,95 als ausreichend erachtet. Es wird nun 16 Tage lang der tägliche Absatz erfasst. Es hat sich beispielsweise ergeben

Absatz x 110 112 106 90 96 118 108 114 107 90 85 84 113 105 90 104

Bei normalverteilter Grundgesamtheit mit unbekannter Varianz wird das Konfidenzintervall für den Erwartungswert angegeben als

\left[ { \bar x-t_\left( 1-\frac {\alpha}{2}; n-1 \right) \frac {s}{\sqrt{n}} \ ; \ \bar x+t_ \left( 1-\frac {\alpha}{2} ; n-1 \right) \frac {s}{\sqrt{n}}} \right]

Es ist

\bar x = \frac{1}{16} \cdot (110 + 112 + \dotsb+ 104)=\frac{1}{16} \cdot 1632 = 102

und


\begin{align}
s^2 &= \frac{1}{n-1} \sum (x_i-\bar x)^2\\
&= \frac{1}{15} \left((110-102)^2+(112-102)^2+ \dotsb+ (104-102)^2 \right)\\
&= \frac{1}{15} \cdot 1856 = 123{,}73
\end{align}

Es ist das (1-α/2)-Quantil der t-Verteilung mit 15 Freiheitsgraden

t_\left( 1-\frac {\alpha}{2} ; n-1 \right) = t_\left( 0{,}975; 15 \right) = 2{,}131

Das 95 %-Konfidenzintervall berechnet sich dann als

\left[ { 102 - 2{,}131 \frac {\sqrt{123{,}73}} {\sqrt{16}} ; 102 + 2{,}131 \frac {\sqrt{123{,}73}} {\sqrt{16}} } \right] = [102 -5{,}93; 102 + 5{,}93] = [96{,}07; 107{,}93]

Im Mittel enthalten 95 % der so geschätzten Intervalle den wahren Mittelwert, also den durchschnittlichen Tagesabsatz an Spülmittelflaschen. Für dieses konkrete Intervall trifft die Aussage, dass es mit 95 % Wahrscheinlichkeit den wahren Mittelwert enthält, nicht zu. Man weiß lediglich, dass dieses Intervall aus einer Menge (von Intervallen) stammt, von denen 95 % der Intervalle den wahren Mittelwert enthalten.

Beispiel 2

Ein Unternehmen lieferte ein Los von 6000 Stück (z. B. Schrauben) an den Kunden. Dieser führt mittels Stichprobennahme gemäß der internationalen Norm ISO 2859-1[4] eine Eingangsprüfung durch. Dabei werden z. B. 200 Schrauben (je nach gewähltem AQL) zufällig über das gesamte Los gezogen und auf Übereinstimmung mit den vereinbarten Anforderungen (Qualitätsmerkmalen) geprüft. Von den 200 geprüften Schrauben erfüllen 10 Stück die gestellten Anforderungen nicht. Mittels der Berechnung des Konfidenzintervalls (Excel-Funktion BETAINV) kann der Kunde abschätzen, wie groß der zu erwartende Anteil fehlerhafter Schrauben im ganzen Los ist: bei einem Konfidenzniveau von 95 % berechnet man das Clopper-Pearson-Konfidenzintervall [2,4 %, 9 %] für den Anteil fehlerhafter Schrauben im Los (Parameter: n=200, k=10).

Literatur[Bearbeiten]

  • Ulrich Krengel: Einführung in die Wahrscheinlichkeitstheorie und Statistik. 8. Auflage. Vieweg, 2005.
  • Joachim Hartung: Statistik. 14. Auflage. Oldenbourg, 2005.

Weblinks[Bearbeiten]

Einzelnachweise[Bearbeiten]

  1. Significance Test Controversy(Englisch)
  2. In Brief: Statistics in Brief: Confidence Intervals: What is the Real Result in the Target Population? (Englisch)
  3. Siehe zum Beispiel Kap. IV, Abschnitte 3.1.1 und 3.2 bei Hartung. Hier werden die Wilson- und Clopper-Pearson-Intervalle, sowie der Korrekturfaktor für die hypergeometrische Verteilung besprochen.
  4. Annahmestichprobenprüfung anhand der Anzahl fehlerhaften Einheiten oder Fehler [Attributprüfung] - Teil 1: Nach der annehmbaren Qualitätsgrenzlage AQL geordnete Stichprobenpläne für die Prüfung einer Serie von Losen