Betaverteilung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Betaverteilung für verschiedene Parameterwerte
Dichten verschiedener beta-verteilter Zufallsgrößen

Die Betaverteilung ist eine stetige Wahrscheinlichkeitsverteilung über dem Intervall [0,1].

Definition[Bearbeiten]

Betaverteilung auf [0,1][Bearbeiten]

Die Betaverteilung ist definiert durch die Wahrscheinlichkeitsdichte

f(x)={{1}\over {B(p,q)}}x^{p-1}(1-x)^{q-1}.

Außerhalb des Intervalls [0,1] wird sie durch f(x)=0 fortgesetzt. Sie besitzt die reellen Parameter p und q. Um ihre Normierbarkeit zu garantieren, wird p,q > 0 gefordert.

Der Vorfaktor 1/B(p,q) dient der korrekten Normierung. Der Ausdruck

B(p,q)={\Gamma(p) \Gamma(q)\over\Gamma(p+q)}=\int_0^1 u^{p-1} (1-u)^{q-1}\, \mathrm{d}u

steht für die Betafunktion, nach der die Verteilung benannt ist. Dabei bezeichnet \Gamma die Gammafunktion.

Die Verteilungsfunktion ist entsprechend

 F(x)=\frac{\mathbb{I}_{[0,1]}(x)}{B(p,q)}\cdot \int_0^{x} u^{p-1} (1-u)^{q-1}\mathrm{d}u,

diese Funktion heißt auch regularisierte unvollständige Betafunktion.

Betaverteilung auf [a,b][Bearbeiten]

Die allgemeine Betaverteilung ist definiert zu

f(x)={{1}\over {B(a,b,p,q)}}(x-a)^{p-1}(b-x)^{q-1},

wobei a und b die obere und untere Grenze des Intervalls sind. Entsprechend ergibt sich die Berechnung von B zu

B(a,b,p,q)=\int_a^b (u-a)^{p-1} (b-u)^{q-1}\mathrm{d}u={\Gamma(p)\Gamma(q)\over\Gamma(p+q)}(b-a)^{p+q-1}.

Die weiteren Ausführungen in diesem Artikel beziehen sich nur auf die auf das Intervall [0,1] eingeschränkte Betaverteilung.

Eigenschaften[Bearbeiten]

Extremum[Bearbeiten]

Die Dichtefunktion f nimmt ihr Extremum an der Stelle x_{\text{extrem}}=\left(1+\frac{q-1}{p-1}\right)^{-1}=\frac{p-1}{p+q-2} an.

Erwartungswert[Bearbeiten]

Der Erwartungswert berechnet sich zu

\operatorname{E}(X)={p \over p+q}.

Varianz[Bearbeiten]

Die Varianz ergibt sich zu

\operatorname{Var}(X)={pq \over (p+q+1)(p+q)^{2}}.

Standardabweichung[Bearbeiten]

Für die Standardabweichung ergibt sich

\sigma = \sqrt{\frac{pq}{(p+q+1)(p+q)^2}}.

Variationskoeffizient[Bearbeiten]

Aus Erwartungswert und Varianz erhält man unmittelbar den Variationskoeffizienten

\operatorname{VarK}(X) = \sqrt{\frac{q}{p(p+q+1)}}.

Schiefe[Bearbeiten]

Die Schiefe ergibt sich zu

\operatorname{v}(X) = \frac{2(q-p)\sqrt{p+q+1}}{(p+q+2)\sqrt{pq}}.

Symmetrie[Bearbeiten]

Die Beta-Verteilung ist für p=q symmetrisch um x=\frac{1}{2} mit der Schiefe \operatorname{v}(X)=0.

Beziehungen zu anderen Verteilungen[Bearbeiten]

Beziehung zur F-Verteilung[Bearbeiten]

Wenn X \sim \operatorname{F}(m,n) F-verteilt und Y=\frac{m X/n}{1+m X/n} ist, dann verteilt sich Y \sim \operatorname{Beta}(m/2,n/2).

Beziehung zur Gammaverteilung[Bearbeiten]

Wenn X \sim \gamma(p_1,b) und Y \sim \gamma(p_2,b) unabhängige gammaverteilte Zufallsvariablen sind mit den Parametern p_1, b bzw. p_2, b, dann ist die Größe \tfrac{X}{X+Y} betaverteilt mit Parametern p_1 und p_2, kurz

B(p_1,p_2) \sim \frac{\gamma(p_1,b)}{\gamma(p_1,b)+\gamma(p_2,b)}.

Beispiel[Bearbeiten]

Die Betaverteilung kann aus zwei Gammaverteilungen erhalten werden: Der Quotient X = U/(U+V) aus den stochastisch unabhängigen Zufallsvariablen U und V, die beide gammaverteilt sind mit den Parametern b und p_u bzw. p_v, ist betaverteilt mit den Parametern p_u und p_v. U und V lassen sich als Chi-Quadrat-Verteilungen mit 2p_u bzw. 2p_v Freiheitsgraden interpretieren.

Mit Hilfe der Linearen Regression wird eine Regressionsgerade y = a + bx durch eine Punktwolke mit n Wertepaaren (x_i;y_i) (i=1,\dots ,n) zweier statistischer Merkmale x und y gelegt, und zwar so, dass die Quadratsumme der senkrechten Abstände der y_i-Werte von der Geraden minimiert wird.

Die totale Streuung von y (TSS) lässt sich mit der Streuungszerlegung zerlegen in die so genannte erklärte Streuung der durch die Gerade geschätzten Werte y* (ESS) und die nichterklärte Streuung der Residuen (RSS):

TSS= ESS+RSS.

Das Bestimmtheitsmaß, der Anteil der erklärten Streuung an der Gesamtstreuung

r^{2}={{ESS}\over{TSS}}

beziehungsweise

r^{2}={ {ESS} \over { {ESS}+{RSS}}}

ist also betaverteilt. Da das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten von x und y darstellt, ist auch das Quadrat des Korrelationskoeffizienten betaverteilt.

Allerdings kann die Verteilung des Bestimmtheitsmaßes beim Modelltest der Regression durch die F-Verteilung angegeben werden, die tabelliert vorliegt.

Weblinks[Bearbeiten]