Satz von Cochran

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

In der Statistik wird der Satz von Cochran in der Varianzanalyse verwendet. Der Satz geht auf den schottischen Mathematiker William Gemmell Cochran zurück.

Man nimmt an U1, ..., Un seien stochastisch unabhängige standardnormalverteilte Zufallsvariablen, und es gilt


\sum_{i=1}^n U_i^2=Q_1+\cdots + Q_k,

wobei jedes Qi die Summe der Quadrate von Linearkombinationen der Us darstellt. Ferner nimmt man an, dass


r_1+\cdots +r_k=n,

wobei ri der Rang von Qi ist. Der Satz von Cochran besagt, dass die Qi unabhängig sind mit einer Chi-Quadrat-Verteilung mit ri Freiheitsgraden.

Der Satz von Cochran ist die Umkehrung des Satzes von Fisher.

Beispiel[Bearbeiten]

Falls X1, ..., Xn unabhängige normalverteilte Zufallsvariablen mit Erwartungswert μ und Standardabweichung σ sind, dann gilt

U_i=(X_i-\mu)/\sigma \;

ist standardnormalverteilt für jedes i.

Jetzt kann man folgendes schreiben


\sum_{i=1}^{n} U_i^2=\sum\limits_{i=1}^{n}\left(\frac{X_i-\overline{X}}{\sigma}\right)^2
+ n\left(\frac{\overline{X}-\mu}{\sigma}\right)^2

Damit man diese Identität erkennt, muss man auf beiden Seiten mit \sigma multiplizieren und beachten, dass gilt


\sum_{i=1}^{n}(X_i-\mu)^2=
\sum_{i=1}^{n}(X_i-\overline{X}+\overline{X}-\mu)^2

und erweitert, um zu zeigen


\sum_{i=1}^{n}(X_i-\overline{X})^2+\sum_{i=1}^{n}(\overline{X}-\mu)^2+
2\sum_{i=1}^{n}(X_i-\overline{X})(\overline{X}-\mu).

Der dritte Term ist null, weil dies gleich einer Konstante mal

\sum_{i=1}^{n}(\overline{X}-X_i),

ist, und der zweite Term ist besteht nur aus n identischen Termen, die zusammengefügt wurden.

Kombiniert man die obigen Ergebnisse und teilt anschließend durch σ2, dann erhält man:


\sum_{i=1}^{n}\left(\frac{X_i-\mu}{\sigma}\right)^2=
\sum_{i=1}^{n}\left(\frac{X_i-\overline{X}}{\sigma}\right)^2
+n\left(\frac{\overline{X}-\mu}{\sigma}\right)^2
=Q_1+Q_2.

Jetzt ist der Rang von Q2 gerade gleich 1 (es ist das Quadrat von nur einer Linearkombination der standardnormalverteilten Zufallsvariablen). Der Rang von Q1 ist gleich n − 1, und daher sind die Bedingungen des Satzes von Cochran erfüllt.

Der Satz von Cochran besagt dann, dass Q1 und Q2 unabhängig sind, mit einer Chi-Quadrat-Verteilung mit n − 1 und 1 Freiheitsgrad.

Dies zeigt, dass der Mittelwert und die Varianz unabhängig sind; Ferner gilt


(\overline{X}-\mu)^2\sim \frac{\sigma^2}{n}\chi^2_1.

Um die Varianz σ2 zu schätzen, wird ein häufig verwendeter Schätzer benutzt


\widehat{\sigma}^2=
\frac{1}{n}\sum_{i=1}^{n}\left(
X_i-\overline{X}\right)^2.

Der Satz von Cochran zeigt, dass


\widehat{\sigma}^2\sim
\frac{\sigma^2}{n}\chi^2_{n-1},

was zeigt, dass der Erwartungswert von \widehat{\sigma}^2 von σ2 (n − 1)/n ist.

Beide Verteilungen sind proportional zur wahren aber unbekannten Varianz σ2; Daher ist ihr Verhältnis unabhängig von σ2, und weil sie unabhängig sind, erhält man


\frac{\left(\overline{X}-\mu\right)^2}
{\frac{1}{n}\sum_{i=1}^{n}\left(X_i-\overline{X}\right)^2}\sim
F_{1,n}
,

wobei F1,n die F-Verteilung mit 1 und n Freiheitsgraden darstellt (siehe auch Student's t-Verteilung).

Literatur[Bearbeiten]

  • Cochran, W. G.: The distribution of quadratic forms in a normal system, with applications to the analysis of covariance. Mathematical Proceedings of the Cambridge Philosophical Society 30 (2): 178–191, 1934.
  • Bapat, R. B.: Linear Algebra and Linear Models. Zweite Auflage (1990). Springer. ISBN 978-0-387-98871-9