F-Verteilung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Die F-Verteilung oder Fisher-Verteilung, auch Fisher-Snedecor-Verteilung (nach Ronald Aylmer Fisher und George W. Snedecor), ist eine stetige Wahrscheinlichkeitsverteilung. Eine F-verteilte Zufallsvariable ergibt sich als Quotient zweier jeweils durch die zugehörige Anzahl von Freiheitsgraden geteilter Chi-Quadrat-verteilter Zufallsvariablen. Die F-Verteilung besitzt zwei unabhängige Freiheitsgrade als Parameter und bildet so eine Zwei-Parameter-Verteilungsfamilie.

Die F-Verteilung wird häufig als Nullverteilung von Teststatistiken verwendet (F-Test), um festzustellen, ob sich die Varianzen zweier Grundgesamtheiten signifikant unterscheiden. Auch im Rahmen der Varianzanalyse wird mit einer F-Statistik auf signifikante Unterschiede zwischen Grundgesamtheiten (Gruppen) getestet. [1]

Inhaltsverzeichnis

[Bearbeiten] Definition

Dichtefunktion der F-Verteilung mit ausgewählten Freiheitsgraden m und n
Verteilungsfunktion der F-Verteilung mit ausgewählten Freiheitsgraden m und n

Eine stetige Zufallsvariable genügt der F-Verteilung \,F(m,n), mit m Freiheitsgraden im Zähler und n Freiheitsgraden im Nenner, wenn sie die Wahrscheinlichkeitsdichte

f(x|m,n) = 
\begin{cases} 
m^{\frac{m}{2}} n^{\frac{n}{2}} \cdot \frac{\Gamma (\frac{m}{2}+\frac{n}{2})}{\Gamma (\frac{m}{2}) \Gamma (\frac{n}{2})} \cdot \frac{x^{\frac{m}{2}-1}}{(mx+n)^\frac{m+n}{2}} & \text{wenn} \; x \geq 0 \\ 
0 & \text{sonst} \\
\end{cases}

besitzt. Dabei ist mit Γ(x) die Gammafunktion an der Stelle x bezeichnet.

Alternativ lässt sich die F-Verteilung mit m Freiheitsgraden im Zähler und n Freiheitsgraden im Nenner, auch definieren als die Verteilung der Grösse

F_{m,n}=\frac{\chi_m^2/m}{\chi_n^2/n},

wobei \chi_m^2 und \chi_n^2 unabhängige, χ²-verteilte Zufallsvariablen sind mit bzw. m und n Freiheitsgraden.

[Bearbeiten] Eigenschaften

[Bearbeiten] Erwartungswert

Der Erwartungswert ist nur für n > 2 definiert und lautet dann

\operatorname{E}(F_{m,n}) = \frac{n}{n-2}.

[Bearbeiten] Varianz

Die Varianz ist nur für n > 4 definiert und lautet dann

\operatorname{Var}(F_{m,n}) = \frac{2 n^2 (m+n-2)}{m (n-2)^2 (n-4)}.

[Bearbeiten] Verteilungsfunktion

Die Werte der Verteilung P(X \leq x) = F(x|m;n) werden meist numerisch ermittelt und in einer Tabelle angegeben. Eine komplette Tabellierung bezüglich aller Freiheitsgrade ist i.a. nicht notwendig, so dass die meisten Verteilungstabellen die Quantile bezüglich ausgewählter Freiheitsgrade und Wahrscheinlichkeiten angeben. Man macht sich hier auch die Beziehung zunutze:

F(p;m;n) = \frac{1}{F(1-p;n;m)} \;,

wobei F(p;m;n) das p-Quantil der F-Verteilung mit m und n Freiheitsgraden bedeutet.

Die F-Verteilung lässt sich geschlossen ausdrücken als

F(x|m;n)= I\left(\frac{m\cdot x}{m\cdot x+n},\frac{m}{2},\frac{n}{2}\right),

wobei  I(z,a,b)=\frac{1}{B(a,b)}\cdot \int_0^z t^{a-1} (1-t)^{b-1}\mathrm{d}t die regularisierte unvollständige Betafunktion darstellt.

[Bearbeiten] Maximum

Für m > 2 nimmt f an der Stelle

x_{\mathrm{max}}=\frac{n(m-2)}{m(n+2)}

das Maximum an.

[Bearbeiten] Beziehungen zu anderen Verteilungen

[Bearbeiten] Beziehung zur Beta-Verteilung

Wenn \operatorname{X} \sim F(m, n) und Y=\frac{m X/n}{1+m X/n} ist, dann verteilt sich Y \sim \operatorname{Beta}(m/2,n/2)

[Bearbeiten] Beziehung zur Chi-Quadrat-Verteilung

Aus den \chi_m^2 und \chi_n^2 Chi-Quadrat-verteilten Zufallsgrößen mit m bzw. n Freiheitsgraden lässt sich

F(m,n)=\frac{\chi_m^2/m}{\chi_n^2/n}

konstruieren. Dieser Ausdruck ist F-verteilt mit m und n Freiheitsgraden.

[Bearbeiten] Beziehung zur nichtzentralen F-Verteilung

Für unabhängige Zufallsvariablen \operatorname{X} \sim \chi^2(\delta, m) und \operatorname{Y} \sim \chi^2(n) ist

Z = \frac{\; \mathrm{X}/m \;}{\mathrm{Y}/n}

verteilt nach der nichtzentralen F-Verteilung \operatorname{Z} \sim F(\delta,m,n) mit nichtzentralitäts-Parameter δ. Dabei ist \chi^2(\delta,\,m) eine Nichtzentrale Chi-Quadrat-Verteilung mit nichtzentralitäts-Parameter δ und m Freiheitsgraden. Für δ = 0 ergibt sich die zentrale F-Verteilung F(m,\,n).

[Bearbeiten] Beziehung zur Normalverteilung

Wenn die unabhängigen normalverteilten Zufallsvariablen X_1, X_2, \dots , X_m,Y_1, Y_2, \dots , Y_n die Parameter

\operatorname{E}(X_i)=\mu, \operatorname{Var}(X_i)=\sigma^2
\operatorname{E}(Y_j)=\nu,  \operatorname{Var}(Y_j)=\tau^2

besitzen, sind die jeweiligen Stichprobenvarianzen S_X^2 und S_Y^2 unabhängig, und es gilt:

\frac{S_X^2}{\sigma^2} ist verteilt wie \chi_{m-1}^2/(m-1)

und

\frac{S_Y^2}{\tau^2} ist verteilt wie \chi_{n-1}^2/(n-1).

Deshalb unterliegt die Zufallsvariable

F=\frac{S_X^2/\sigma^2}{S_Y^2/\tau^2}

einer F-Verteilung mit m − 1 Freiheitsgraden im Zähler und n − 1 Freiheitsgraden im Nenner,

[Bearbeiten] Beziehung zur Studentschen t-Verteilung

Wenn \operatorname{X} \sim f_n(t) (Studentsche_t-Verteilung), dann ist \operatorname{X^2} \sim f_{1,n}(F).

Das Quadrat einer t-verteilten Zufallsvariablen mit n Freiheitsgraden folgt einer F-Verteilung mit m=1 und n Freiheitsgraden.

[Bearbeiten] Herleitung der Dichte

Die Wahrscheinlichkeitsdichte der F-Verteilung lässt sich herleiten (vgl. Herleitung der Dichte der Studentschen t-Verteilung) aus der gemeinsamen Dichte der beiden unabhängigen Zufallsvariablen \chi^2_m und \chi^2_n, die beide Chi-Quadrat-verteilt sind. [2]


g_{\chi^2_m,\chi^2_n}(x,y)= \frac{x^{\frac m2-1}e^{-\frac 12x}}{2^\frac m2\Gamma(\frac m2)} \cdot \frac{y^{\frac n2-1}e^{-\frac 12y}}{2^\frac n2\Gamma(\frac n2)}.

Mit der Transformation


f=\frac{x/m}{y/n},v=y ,

bekommt man die gemeinsame Dichte von F=\frac{\chi^2_m/m}{\chi^2_n/n} und \chi^2_n, wobei f\ge 0 und v\ge 0.

Die Jacobideterminante dieser Transformation ist:

\det\frac{\partial(x,y)}{\partial(f,v)}=\begin{vmatrix}
     \frac mn v&0\\
     \sim&1
\end{vmatrix}=\frac mn v.

Der Wert ist unwichtig, weil er bei der Berechnung der Determinante mit 0 multipliziert wird. Die neue Dichtefunktion schreibt sich also


g_{F,\chi^2_n}(f,v)= \frac{1}{2^\frac m2 \Gamma(\frac m2)}\left(f v\, \frac mn\right)^{\frac{m}{2}-1}e^{-\frac 12(f v\, \frac mn)}\cdot \frac{1}{2^\frac n2 \Gamma(\frac n2)}v^{\frac{n}{2}-1}e^{-\frac 12v}\cdot\frac{m}{n}v.

Gesucht ist nun die Randverteilung g_{m,\,n}(f) als Integral über die nicht interessierende Variable v:


g_{m,n}(f)=\int\limits_{0}^\infty g_{F,\chi^2_n}(f,v)\,dv=\frac{(\frac mn)^{\frac m2}f^{\frac m2-1}}{2^\frac {m+n}{2}  \Gamma(\frac m2) \Gamma(\frac n2)} \int\limits_{0}^\infty v^{\frac{m+n}{2}-1}e^{-\frac v2 (1+\frac mn f)}\,dv=m^{\frac m2} n^{\frac n2} \cdot \frac{\Gamma (\frac m2+\frac n2)}{\Gamma (\frac m2) \Gamma (\frac n2)} \cdot \frac{f^{\frac m2-1}}{(mf+n)^\frac{m+n}{2}}.

[Bearbeiten] Quantilfunktionen

Das p-Quantil der F-Verteilung xp ist die Lösung der Gleichung p=F(x_p|m,\,n) und damit prinzipiell über die Umkehrfunktion zu berechnen. Konkret gilt hier

x_p=\frac{n I^{-1}(p,\frac m2,\frac n2)}{m(1-I^{-1}(p,\frac m2,\frac n2))},

mit I − 1 als Inverse der regularisierten unvollständigen Betafunktion. Dieser Wert xp ist in der F-Verteilungstabelle unter den Koordinaten p, m, und n eingetragen.

Für einige Werte m,n lassen sich die Quantilsfunktionen x_p(m,\,n) explizit ausrechnen. Man löst das Beta Integral I(x,\tfrac m2,\tfrac n2) mit m,n=1,2,\ldots, wobei für ein paar Indizes invertierbare Funktionen auftreten:


\begin{array}{c|c|c|c|c}
 m \downarrow,\,n \rightarrow &  1  & 2 & 3  & 4\\
\hline
 1 &\tan(\frac\pi2 p)^2  & \frac{2p^2}{1-p^2} & ?  & \frac{4}{2\cos(\frac13 \arccos(1-2p^2))-1}-4\\
\hline
 2 & \frac12(\frac{1}{(1-p)^2}-1)  & \frac{p}{1-p} &  \frac32(\frac{1}{(1-p)^{2/3}}-1)  & \frac{2}{\sqrt{1-p}}-2\\
\hline
 3 & ?  & \frac{2p^{2/3}}{3-3p^{2/3}} & ?  & ?\\ 
 \hline
4 & \frac{1}{16}\csc(\frac16\arccos(2p(2-p)-1))^2 -\frac14 & \frac{\sqrt p}{2(1-\sqrt p)} & ?  & \frac{1}{\frac12+\sin(\frac13\arcsin(1-2p))}-1\\
\end{array}

[Bearbeiten] Literatur

  • Joachim Hartung, Bärbel Elpelt, Karl-Heinz Klösener: Statistik, 12. Auflage, Oldenbourg 1999, S. 156 ff., ISBN 3-486-24984-3.

[Bearbeiten] Weblinks

[Bearbeiten] Einzelnachweise

  1. P.R. Kinnear, C.D. Gray (2004): SPSS 12 MADE SIMPLE. Psychology Press. New York. S. 208–209.
  2. Frodesen, Skjeggestad, Tofte: Probability and Statistics in Particle Physics, Universitetsforlaget, Bergen - Oslo - Tromsö S. 145f
Meine Werkzeuge
Namensräume
Varianten
Aktionen
Navigation
Mitmachen
Drucken/exportieren
Werkzeuge
In anderen Sprachen