Betaverteilung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Betaverteilung für verschiedene Parameterwerte
Kumulative Verteilungsfunktion für verschiedene Parameterwerte
Dichten verschiedener betaverteilter Zufallsgrößen

Die Betaverteilung ist eine stetige Wahrscheinlichkeitsverteilung über dem Intervall .

Definition[Bearbeiten | Quelltext bearbeiten]

Betaverteilung auf (0,1)[Bearbeiten | Quelltext bearbeiten]

Die Betaverteilung ist definiert durch die Wahrscheinlichkeitsdichte

Außerhalb des Intervalls wird sie durch fortgesetzt. Für lässt sich durch ersetzen. Die Betaverteilung besitzt die reellen Parameter und (in den nebenstehenden Grafiken und ). Um ihre Normierbarkeit zu garantieren, wird (bzw. ) gefordert.

Der Vorfaktor dient der korrekten Normierung. Der Ausdruck

steht für die Betafunktion, nach der die Verteilung benannt ist. Dabei bezeichnet die Gammafunktion.

Die Verteilungsfunktion ist entsprechend

mit

Die Funktion heißt auch regularisierte unvollständige Betafunktion.

Betaverteilung auf (a,b)[Bearbeiten | Quelltext bearbeiten]

Die allgemeine Betaverteilung ist definiert zu

wobei a und b die obere und untere Grenze des Intervalls sind. Entsprechend ergibt sich die Berechnung von zu

Die weiteren Ausführungen in diesem Artikel beziehen sich nur auf die auf das Intervall eingeschränkte Betaverteilung.

Eigenschaften[Bearbeiten | Quelltext bearbeiten]

Erwartungswert[Bearbeiten | Quelltext bearbeiten]

Der Erwartungswert berechnet sich zu

.

Modus[Bearbeiten | Quelltext bearbeiten]

Der Modus, also die Maximalstelle der Dichtefunktion , ist

.

Varianz[Bearbeiten | Quelltext bearbeiten]

Die Varianz ergibt sich zu

.

Standardabweichung[Bearbeiten | Quelltext bearbeiten]

Für die Standardabweichung ergibt sich

.

Variationskoeffizient[Bearbeiten | Quelltext bearbeiten]

Aus Erwartungswert und Varianz erhält man unmittelbar den Variationskoeffizienten

.

Schiefe[Bearbeiten | Quelltext bearbeiten]

Die Schiefe ergibt sich zu

.

Höhere Momente[Bearbeiten | Quelltext bearbeiten]

Aus der momenterzeugenden Funktion ergibt sich für die k-ten Momente

.

Symmetrie[Bearbeiten | Quelltext bearbeiten]

Die Betaverteilung ist für symmetrisch um mit der Schiefe .

Momenterzeugende Funktion[Bearbeiten | Quelltext bearbeiten]

Die momenterzeugende Funktion einer betaverteilten Zufallsgröße lautet

.

Mit der hypergeometrischen Funktion erhält man die Darstellung

.

Charakteristische Funktion[Bearbeiten | Quelltext bearbeiten]

Analog zur momenterzeugenden Funktion erhält man die charakteristische Funktion

.

Beziehungen zu anderen Verteilungen[Bearbeiten | Quelltext bearbeiten]

Spezialfälle[Bearbeiten | Quelltext bearbeiten]

Beziehung zur F-Verteilung[Bearbeiten | Quelltext bearbeiten]

Wenn F-verteilt und ist, dann verteilt sich

Beziehung zur Gammaverteilung[Bearbeiten | Quelltext bearbeiten]

Wenn und unabhängige gammaverteilte Zufallsvariablen sind mit den Parametern bzw. , dann ist die Größe betaverteilt mit Parametern und , kurz

Beziehung zur stetigen Gleichverteilung[Bearbeiten | Quelltext bearbeiten]

Sind unabhängige auf stetig gleichverteilte Zufallsvariable, dann sind die Ordnungsstatistiken betaverteilt. Genauer gilt

für .

Mischverteilungen[Bearbeiten | Quelltext bearbeiten]

Eine Binomialverteilung, deren Parameter betaverteilt ist, nennt man Beta-Binomialverteilung. Dies ist ein spezieller Fall einer Mischverteilung.

Beispiel[Bearbeiten | Quelltext bearbeiten]

Die Betaverteilung kann aus zwei Gammaverteilungen erhalten werden: Der Quotient aus den stochastisch unabhängigen Zufallsvariablen und , die beide gammaverteilt sind mit den Parametern und bzw. , ist betaverteilt mit den Parametern und . und lassen sich als Chi-Quadrat-Verteilungen mit bzw. Freiheitsgraden interpretieren.

Mit Hilfe der Linearen Regression wird eine Regressionsgerade durch eine Punktwolke mit Wertepaaren zweier statistischer Merkmale und gelegt, und zwar so, dass die Quadratsumme der senkrechten Abstände der -Werte von der Geraden minimiert wird.

Die totale Streuung von y (TSS) lässt sich mit der Streuungszerlegung zerlegen in die so genannte erklärte Streuung der durch die Gerade geschätzten Werte y* (ESS) und die nichterklärte Streuung der Residuen (RSS):

.

Das Bestimmtheitsmaß, der Anteil der erklärten Streuung an der Gesamtstreuung

beziehungsweise

ist also betaverteilt. Da das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten von und darstellt, ist auch das Quadrat des Korrelationskoeffizienten betaverteilt.

Allerdings kann die Verteilung des Bestimmtheitsmaßes beim Modelltest der Regression durch die F-Verteilung angegeben werden, die tabelliert vorliegt.

Beispiel zur Betaverteilung auf (a,b)[Bearbeiten | Quelltext bearbeiten]

Im Dreieckstest werden drei Proben im gleichseitigen Dreieck angeordnet, wobei eine Ecke des gedachten Dreiecks nach oben zeigt. Zwei der drei Proben gehören zum Produkt A und eine Probe gehört zum Produkt B oder umgekehrt. Die Aufgabe des Probanden besteht nun darin, dasjenige Produkt zu finden, das nur einmal vorkommt. Die Wahrscheinlichkeit durch bloßes Raten die richtige Antwort zu geben beträgt .

Verteilung der Erfolgswahrscheinlichkeiten einer Stichprobe im Dreieckstest (schwarze Linie) bei einer Rate-Erfolgswahrscheinlichkeit von (blaue Linie)

Die Erfolgswahrscheinlichkeiten variieren je nach sensorischen Fähigkeiten. Unter der Annahme, dass kein Proband absichtlich eine falsche Antwort gibt, liegt die Erfolgswahrscheinlichkeit bei niemandem unter . Bei Feinschmeckern oder großen Geschmacksunterschieden kann diese theoretisch bis auf 100 % ansteigen. Im Folgenden wird für beliebige Rate-Erfolgswahrscheinlichkeiten mit die Beta-Verteilung auf hergeleitet.[1] Aus den eben genannten Gründen modelliert diese Wahrscheinlichkeitsdichte die Erfolgswahrscheinlichkeiten der Probanden realistischer als eine Beta-Verteilung auf .


Die Erfolgswahrscheinlichkeiten der einzelnen Probanden seien zunächst betaverteilt auf mit Parametern und . Die korrigierten Erfolgswahrscheinlichkeiten auf ergeben sich aus . Die Wahrscheinlichkeitsdichte von lässt sich über den Transformationssatz für Dichten bestimmen. Die Beta-Verteilung von hat eine positive Dichte im Intervall . Die Transformation mit ist ein Diffeomorphismus. Daraus erhält man die Umkehrfunktion . Für die gesuchte Dichtefunktion von erhält man

.

Diese Wahrscheinlichkeitsdichte von auf wird in Abhängigkeit der Wahrscheinlichkeitsdichte von auf dargestellt. In der nebenstehenden Grafik ist beispielhaft eine Betaverteilung auf mit Parametern und eingezeichnet. Der Erwartungswert beträgt  %. Die durchschnittliche Erfolgswahrscheinlichkeit liegt damit  % über der Rate-Erfolgswahrscheinlichkeit von  %.

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Brockhoff, Per Bruun. "The statistical power of replications in difference tests."Food Quality and Preference 14.5 (2003): 405-417.

Weblinks[Bearbeiten | Quelltext bearbeiten]