Diskrete Gleichverteilung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Wahrscheinlichkeitsfunktion der diskreten Gleichverteilung auf \{0,1,\dots,20\}, d. h. n=21

Die diskrete Gleichverteilung ist eine statistische Wahrscheinlichkeitsverteilung (Gleichverteilung). Eine diskrete Zufallsvariable X mit endlich vielen Ausprägungen hat eine diskrete Gleichverteilung, wenn die Wahrscheinlichkeit für jede ihrer Ausprägungen x_1, \dotsc, x_n gleich ist. Es gilt dann P(X = x_i) = \tfrac{1}{n} für i \in \{1,\dotsc,n\}.

Typischerweise findet diese Wahrscheinlichkeitsverteilung Anwendung bei Zufallsexperimenten, deren Ergebnisse gleichhäufig sind. Wenn man (mit oder ohne Begründung) annimmt, dass die n Elementarereignisse gleich wahrscheinlich sind, spricht man von einem Laplace-Experiment. Gängige Beispiele für Laplace-Experimente sind der Laplace-Würfel und die Laplace-Münze. Siehe auch Stetige Gleichverteilung, Laplace-Formel.

Definition[Bearbeiten]

Bei der diskreten Gleichverteilung werden verschiedene Fälle unterschieden. Diese unterscheiden sich durch die Ergebnismengen und dementsprechend unterschiedlich definierte Wahrscheinlichkeitsfunktionen und Verteilungsfunktionen. In allen Fällen wird die Gleichverteilung mit  \mathcal{U}_T bezeichnet, wobei  T der Träger ist.

Allgemeiner Fall[Bearbeiten]

Im allgemeinsten Fall sind die auftretenden Ergebnisse beliebige  x_i mit  i=1, \dots, n und  x_i < x_j wenn  i < j ist. Der Träger ist also  T=\{x_1, \dots, x_n\} . Die Wahrscheinlichkeitsfunktion der diskreten Gleichverteilung ist dann

 \operatorname{P}(X = x) =f(x)= \begin{cases}
\frac {1}{n} & \text{für}\; x = x_i (i = 1, \dots , n) \\
0 & \text{sonst}
\end{cases}

und damit genügt sie der Verteilungsfunktion

F_X(t)= P(X\leq t) = \frac{|\{k:x_k\leq t\}|}{n}.

Hier sind insbesondere auch nichtnatürliche zahlen als die  x_i zugelassen

Auf beliebigen ganzen Zahlen[Bearbeiten]

Wahrscheinlichkeitsfunktion für  n=b-a+1=5
Die zugehörige Verteilungsfunktion

Wählt man zwei  a<b \in \mathbb{Z} mit  b-a=n-1 , so wählt man als Träger die Menge

 T:=\{a, a+1, a+2, \dots, b-1,b \}

und definiert die Wahrscheinlichkeitsfunktion

 \operatorname{P}(X = x) =f(x)= \begin{cases}
\frac {1}{n} & \text{für}\; x \in T \\
0 & \text{sonst}
\end{cases}

und die Verteilungsfunktion

F_X(t)= P(X\leq t) = 
\begin{cases}
 0  & \text{falls } t<a \\
 \frac{\lfloor t \rfloor -a + 1}{b-a+1} \\
 1  & \text{falls } t \geq b
\end{cases}
.

Auf natürlichen Zahlen bis n[Bearbeiten]

Als Spezialfall der beiden obigen Definitionen (setze  x_i=i oder  a=1, b=n ) wählt man als Träger

 T=\{1,2,\dots, n\}

und erhält als Wahrscheinlichkeitsfunktion

 \operatorname{P}(X = x) =f(x)= \begin{cases}
\frac {1}{n} & \text{für}\; x \in \mathbb{N} \, \text{und} \, x \leq n \\
0 & \text{sonst}
\end{cases}

sowie die Verteilungsfunktion

F_X(t)= P(X\leq t) =
\begin{cases}
 0  & \text{falls } t<1 \\
 \frac{\lfloor t \rfloor}{n} & \text{falls } 1 \leq t < n \\
 1  & \text{falls } t \geq n
\end{cases}

Hierbei bezeichnet  \lfloor t \rfloor die Abrundungsfunktion.

Eigenschaften[Bearbeiten]

Erwartungswert[Bearbeiten]

Der Erwartungswert ist im allgemeinen Fall

 \operatorname{E}(X) = \frac{1}{n} \sum_{i=1}^n x_i

Im zweiten Fall erhält man

 \operatorname{E}(X)=\frac{a+b}{2} ,

was sich im dritten Fall zu

 \operatorname{E}(X)=\frac{n+1}{2}

vereinfacht. Der Beweis folgt dabei jeweils der Gaußschen Summenformel.

Varianz[Bearbeiten]

Die Darstellung der Varianz ist für den allgemeinen Fall bereits unübersichtlich, da keine Vereinfachungen möglich sind:

 \operatorname{Var}(X) = \frac {1}{n} \left(\sum_{i=1}^n x_i^2 - \frac {1}{n} \left(\sum_{i=1}^n x_i\right)^2\right).

Für den zweiten Fall ergibt sich

 \operatorname{Var}(X) =\frac{(a-b-2)(a-b)}{12}.

Im dritten Fall gilt

 \operatorname{Var}(X) = \frac{n^2-1}{12}.

Schiefe[Bearbeiten]

Für alle drei Varianten ist die Schiefe gleich Null.

 \operatorname{v}(X)=0

Wölbung und Exzess[Bearbeiten]

Die Exzess ist im zweiten Fall

\gamma=-1{,}2-0{,}2\cdot \operatorname{Var}(X)^{-1}=\frac{-6}{5}-\frac{12}{5(b-a-2)(b-a)}

und damit ist die Wölbung

 \beta_2=1{,}8- 0{,}2\cdot \operatorname{Var}(X)^{-1}

Dies vereinfacht sich im dritten Fall zum Exzess

\gamma=-1{,}2-\frac{12}{5(n^2-1)}

und zur Wölbung

\beta_2=1{,}8-\frac{12}{5(n^2-1)}

Entropie[Bearbeiten]

Die Entropie der diskreten Gleichverteilung ist für alle drei Varianten

 \Eta(X)=\log_2(n)

gemessen in Bit.

Median[Bearbeiten]

Im allgemeinen Fall fällt der Median der diskret gleichverteilten Zufallsvariable mit dem Median der Ausprägungen x_1,\dotsc,x_n zusammen:

\tilde m
=\begin{cases}
  x_\frac{n+1}{2}                                    & n\text{ ungerade}\\
  \frac {1}{2}\left(x_{\frac{n}{2}} + x_{\frac{n}{2} + 1}\right) & n \text{ gerade.}
\end{cases}
.

Im zweiten Fall ist dann

 \tilde m=\frac{a+b}{2}

und dementsprechend im dritten Fall

\tilde m=\frac{n+1}{2} .

Modus[Bearbeiten]

Der Modus lässt sich zwar angeben, hat aber wenig Aussagekraft. Er entspricht genau dem Träger der Verteilung, sprich  (x_i)_{i=1, \dots, n} , bzw.  \{a,\dots,b\} oder  \{1,\dots,n\} .

Wahrscheinlichkeitserzeugende Funktion[Bearbeiten]

Sind im zweiten Fall  a,b \geq 0 , so ist die wahrscheinlichkeitserzeugende Funktion gegeben durch

 m_X(t)=\frac{t^a-t^{b+1}}{n(1-t)}.

Im dritten Fall ergibt dies dann

m_X(t):=\frac{t(1-t^n)}{n(1-t)}

Beide Fälle lassen sich elementar mittels der geometrischen Reihe zeigen.

Momenterzeugende Funktion[Bearbeiten]

Die momenterzeugende Funktion ergibt sich für beliebige  a<b \in \mathbb{Z} als

M_X(t)=\frac{e^{at}-e^{(b+1)t}}{n(1-e^t)}\, bzw.
M_X(t)=\frac{e^{t}-e^{(n+1)t}}{n(1-e^t)}\,.

Charakteristische Funktion[Bearbeiten]

Die charakteristische Funktion ergibt sich für beliebige  a<b \in \mathbb{Z} als

\varphi_X(t)=\frac{e^{iat}-e^{i(b+1)t}}{n(1-e^{it})}\, bzw.
\varphi_X(t)=\frac{e^{it}-e^{i(n+1)t}}{n(1-e^{it})}\,.

Schätzer[Bearbeiten]

Das Problem, bei einer auf  \{1,\dots, N\} gleichverteilten Zufallsvariable den Parameter  N zu schätzen, wird auch das Taxiproblem genannt. Diese Bezeichnung entsteht aus der Überlegung, dass man am Bahnhof steht und die Nummern der Taxis beobachten kann. Geht man davon aus, dass alle Nummern gleichverteilt sind, entsprechen die Taxis dem Ziehen einer Stichprobe und der Parameter  N der Gesamtzahl der Taxis in der Stadt. Ist  x=(x_1, \dots , x_n ) eine diskret gleichverteilte Stichprobe aus \{1,\dots,N\}, so ist der Maximum-Likelihood-Schätzer für den Parameter N gegeben durch

 T_M(x)=\max_{i=1, \dots , n} x_i .

Er ist insbesondere nicht erwartungstreu, da er den wirklichen Wert tendenziell unterschätzt und nie überschätzt, sondern nur asymptotisch erwartungstreu. Die Einführung eines Korrekturterms führt zu dem Schätzer

 T'_M(x)=\frac{n+1}{n}\left(\max_{i=1, \dots , n} x_i\right) .

Oder aber man schätzt den mittleren Abstand der Werte in der Stichprobe durch  \min_{i=1, \dots , n} x_i ab und erhält aufs Neue einen Schätzer

 T_I(x) = \left(\max_{i=1, \dots , n} x_i\right) + \left(\min_{i=1, \dots , n} x_i\right) -1.

Dieser ist erwartungstreu, genauso wie

 T_S(x)=\left( \frac{2}{n} \sum_{i=1}^n x_i\right)-1.

Das Taxiproblem ist ein Standardbeispiel der Schätztheorie, um zu zeigen, dass sich ohne Probleme mehrere verschiedene Schätzer für dasselbe Problem finden lassen, von denen a priori nicht klar ist, welcher besser ist.[1] Varianten des Taxiproblems waren anscheinend im Zweiten Weltkrieg wichtig, um aus den Seriennummern abgeschossener Panzer Rückschlüsse auf die Anzahl der Panzer in der gegnerischen Armee zu ziehen. Dies entspräche dann dem Schätzen von  a,b , wenn man davon ausgeht, dass die Seriennummern auf  \{a,a+1,\dots,b-1,b\} gleichverteilt sind.

Beziehung zu anderen Verteilungen[Bearbeiten]

Beziehung zur Bernoulli-Verteilung[Bearbeiten]

Die Bernoulli-Verteilung mit  p=q=\frac{1}{2} ist eine diskrete Gleichverteilung auf  \{0,1\} .

Beziehung zur Beta-Binomialverteilung[Bearbeiten]

Die Beta-Binomialverteilung mit  a=b=1 ist eine diskrete Gleichverteilung auf  \{0, \dots, n\} .

Beziehung zur Zweipunktverteilung[Bearbeiten]

Die Zweipunktverteilung ist für  p=q=\frac{1}{2} eine diskrete Gleichverteilung auf  \{a,b\} .

Beziehung zur Rademacher-Verteilung[Bearbeiten]

Die Rademacher-Verteilung ist eine diskrete Gleichverteilung auf  \{0,1\}

Beziehung zum Urnenmodell[Bearbeiten]

Die diskrete Gleichverteilung ist die Basis aller Überlegungen, die Im Urnenmodell angestellt werden, da das Ziehen jeder der Kugeln aus der Urne gleich wahrscheinlich sein soll. Je nachdem, wie die Kugeln gefärbt, nummeriert oder zurückgelegt werden (oder auch nicht), ergeben sich somit aus der diskreten Gleichverteilung eine Vielzahl anderer wichtiger Verteilungen wie z. B. die Binomialverteilung, Geometrische Verteilung, Hypergeometrische Verteilung, Negative Binomialverteilung und Multinomialverteilung.

Stetiger Fall[Bearbeiten]

Die diskrete Gleichverteilung kann leicht auf reelle Intervalle oder beliebige messbare Mengen mit positivem Volumen verallgemeinert werden. Sie wird dann stetige Gleichverteilung genannt.

Beispiel[Bearbeiten]

Sechsseitiger Laplace-Würfel[Bearbeiten]

Das Zufallsexperiment ist: Ein Würfel wird einmal geworfen. Die möglichen Ausprägungen der Zufallsvariablen X sind: x_1=1, x_2=2, \dots, x_6=6. Nach der klassischen Wahrscheinlichkeitsauffassung ist die Wahrscheinlichkeit für jede Ausprägung gleich. Sie hat dann die Wahrscheinlichkeitsfunktion

 P(X = x) = f(x) = \begin{cases}
\frac{1}{6} & \text{für}\; x = x_i (i = 1, \dots , 6) \\
0 & \text{sonst}
\end{cases}

mit dem Erwartungswert \operatorname{E}(X) für x_i=i und n=6:

 E(X) = 7/2 = 3{,}5

und der Varianz

 V(X) = \frac {35}{12} \approx 2{,}92.

Entscheidungsproblem des Marketing[Bearbeiten]

Eine Anwendung in der Praxis könnte etwa ein Problem des Operations Research (Marketing) sein. Ein Unternehmen möchte ein neues Produkt auf dem Markt einführen:

Man versucht, den Erfolg des Produkt quantitativ vorauszuschätzen. Es wird vereinfachend von 5 verschiedenen verkauften Stückzahlen ausgegangen: 0, 1.000, 5.000, 10.000 und 50.000. Da über die Wahrscheinlichkeit der einzelnen Absatzzahlen keine verlässliche Schätzung möglich ist, verwendet man der Einfachheit halber gleiche Wahrscheinlichkeiten.

Man kann nun den Entscheidungsprozess, d. h. die individuelle Kaufentscheidung objektivieren, also den erwarteten durchschnittlichen Absatz ermitteln und sich überlegen, etwa anhand von Entscheidungsbäumen, inwieweit erhöhte Werbeausgaben die Absatzzahlen erhöhen könnten.

Abgrenzung[Bearbeiten]

Die diskrete Gleichverteilung wird oft auch nach Pierre-Simon Laplace benannt (Laplace-Würfel). Sie hat jedoch nichts mit der stetigen Laplace-Verteilung zu tun.

Weblinks[Bearbeiten]

Einzelnachweise[Bearbeiten]

  1.  Ann Largey, John E. Spencer: Estimation of the Parameter in the Discrete "Taxi" Problem, With and Without Replacement. In: The Economic and Social Review. 27, Nr. 2, 1996, S. 119–136 (PDF).