Freiheitsgrad (Statistik)

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

In der Statistik werden anhand einer Stichprobe die unbekannten Parameter einer Grundgesamtheit geschätzt. Die Anzahl n der unabhängigen Beobachtungswerte abzüglich der Anzahl u der schätzbaren Parameter wird als Anzahl der Freiheitsgrade f bezeichnet:

f=n-u.

Den Freiheitsgrad kann man als Anzahl der „überflüssigen“ Messungen bezeichnen, die nicht zur Bestimmung der Parameter benötigt werden.[1]

Die Freiheitsgrade werden bei der Schätzung von Varianzen benötigt. Außerdem sind verschiedene Wahrscheinlichkeitsverteilungen, mit denen anhand der Stichprobe Hypothesentests durchgeführt werden, von den Freiheitsgraden abhängig.

Eine Stichprobe besteht aus mehr Messwerten (n) als (schätzbare) Parameter (u) vorhanden sind, so dass Abweichungen (Residuen) zwischen den Messwerten und den aus den geschätzten Parametern abgeleiteten Sollwerten bestehen. Diese n Residuen sind zusätzlich zu den Parametern zu schätzen. Ohne die Beobachtungen zu kennen, lassen sich bereits u Bedingungen für die Residuen aufstellen, so dass nur noch f=n-u unabhängige Residuen verbleiben. Aus n Beobachtungen lassen sich also u Parameter und f=n-u unabhängige Residuen schätzen.

Beispiel[Bearbeiten]

Zur Schätzung des Erwartungswertes \mu und der Varianz \sigma^2 einer Grundgesamtheit liegen n Beobachtungswerte x_i vor. Zuerst ist der Erwartungswert zu schätzen, es liegt hier u=1 Parameter vor. Mit Hilfe der Methode der kleinsten Quadrate erhält man die Schätzung \hat \mu des Erwartungswertes als arithmetisches Mittel der Beobachtungen:

\hat \mu = \frac{1}{n} \sum_{i=1}^{n} x_i

und für die Residuen e_i=\mu-x_i die Bedingung (u=1), dass ihre Summe Null ist:

\sum_{i=1}^{n} e_i = 0 .

Für die Schätzung der Varianz wird die Quadratsumme

QS = \sum_{i=1}^{n} \hat e_i^2 = \sum_{i=1}^{n} (x_i-\hat \mu)^2

benötigt. Diese Quadratsumme hat n-1 Freiheitsgrade, entsprechend der Anzahl der unabhängigen Residuen. Der Erwartungswert der Quadratsumme ist allgemein

E(QS) = (n-u) \, \sigma^2 .

Für eine erwartungstreue Schätzung der Varianz wird die Quadratsumme der Residuen daher durch die Zahl der Freiheitsgrade geteilt:

\hat \sigma^2 = \frac{1}{n-u} \sum_{i=1}^{n} \hat e_i^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i-\hat \mu)^2 .

Wenn der Erwartungswert der Grundgesamtheit bekannt ist, liegt kein zu schätzender Parameter vor; es ist also u=0. In diesem Fall hat der Schätzer der Varianz n Freiheitsgrade:

\hat \sigma^2 = \frac{1}{n} \sum_{i=1}^{n} \hat e_i^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i-\mu)^2 .

Freiheitsgrade als Parameter von Verteilungen[Bearbeiten]

Die Zahl der Freiheitsgrade ist auch Parameter mehrerer Verteilungen. Wenn die Beobachtungen normalverteilt sind, besitzt der Quotient aus der Quadratsumme QS der Residuen und der Varianz \sigma^2 die \chi^2-Verteilung mit n-u Freiheitsgraden:

\frac{QS}{\sigma^2} \sim \chi_{n-u}^2 .

Weitere von der Zahl der Freiheitsgrade abhängige Verteilungen sind die t-Verteilung und die F-Verteilung. Diese Verteilungen werden für die Schätzung von Konfidenzintervallen der Parameter und für Hypothesentests benötigt.[2]

Einzelnachweise[Bearbeiten]

  1. Berhold Witte, Hubert Schmidt: Vermessungskunde und Grundlagen der Statistik für das Bauwesen. 2. Aufl., Wittwer, Stuttgart 1989, S.59.
  2. Karl-Rudolf Koch: Parameterschätzung und Hypothesentests. 3. Aufl., Dümmler, Bonn 1997.