Tschebyscheff-Ungleichung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Dieser Artikel behandelt die statistische Tschebyschow-Ungleichung. Für die arithmetische Tschebyschow-Ungleichung siehe Tschebyscheff-Ungleichung (Arithmetik).

In der Stochastik ist die Tschebyscheff-Ungleichung oder Tschebyschow-Ungleichung eine Ungleichung, die zur Abschätzung von Wahrscheinlichkeiten verwendet wird. Sie geht (in ihrer ersten Fassung) zurück auf eine Arbeit des russischen Mathematikers Pafnuti Lwowitsch Tschebyschow aus dem Jahre 1867.[1] Die Ungleichung gibt eine obere Schranke für die Wahrscheinlichkeit an, dass eine Zufallsvariable mit endlicher Varianz Werte außerhalb eines symmetrisch um den Erwartungswert gelegenen Intervalls annimmt. Damit ist auch eine untere Schranke gegeben für die Wahrscheinlichkeit, dass die Werte innerhalb dieses Intervalls liegen.

Der Satz lässt sich auch auf Verteilungen anwenden, die weder glockenförmig noch symmetrisch sind, und gibt Abschätzungen, wie viele der Daten „in der Mitte“ liegen und wie viele nicht.

Satz[Bearbeiten]

Sei X eine Zufallsvariable mit Erwartungswert \mu und endlicher Varianz \sigma^2. Dann gilt für alle reellen Zahlen k > 0:

\operatorname{P}\left[\left|X-\mu\right|\geq k\right] \leq \frac{\sigma^2}{k^2}.

Durch Übergang zum komplementären Ereignis erhält man

\operatorname{P}\left[\left|X-\mu\right| < k\right] \geq 1 - \frac{\sigma^2}{k^2}.

Der Beweis ergibt sich als Anwendung der Markow-Ungleichung, eine einfache Herleitung findet sich auch unten. Wie man die Markow-Ungleichung mit schulgemäßen Mitteln aus einem unmittelbar einsichtigen Flächenvergleich folgern und dann daraus diese Fassung der Ungleichung von Tschebyschew herleiten kann, findet man in [2].

Die von der Tschebyscheff-Ungleichung angegebenen Grenzen können nicht verbessert werden:

Für die diskrete Zufallsgröße X mit \operatorname{P}\left[X=\mu\right]=1-p und \operatorname{P}\left[X=\mu-k\right]=\operatorname{P}\left[X=\mu+k\right]=p/2 gilt das Gleichheitszeichen.

Im Allgemeinen sind die Abschätzungen aber eher schwach. Beispielsweise sind sie für k \leq \sigma trivial. Dennoch ist der Satz oft nützlich, weil er ohne Verteilungsannahmen über die Zufallsvariablen auskommt und somit für alle Verteilungen mit endlicher Varianz (insbesondere auch solche, die sich stark von der Normalverteilung unterscheiden) anwendbar ist. Außerdem sind die Schranken einfach zu berechnen.

Varianten[Bearbeiten]

Abweichungen ausgedrückt durch die Standardabweichung[Bearbeiten]

Ist die Standardabweichung \sigma von Null verschieden und \lambda eine positive Zahl, so erhält man mit k = \lambda \sigma eine oft zitierte Variante der Tschebyscheff-Ungleichung:

\operatorname{P}\left[\left|X-\mu\right|\geq \lambda \sigma\right] \leq \frac{1}{\lambda^2}.

Diese Ungleichung liefert nur für \lambda > 1 eine sinnvolle Abschätzung, für 0<\lambda\leq 1 ist sie trivial, denn Wahrscheinlichkeiten sind stets durch 1 beschränkt.

Verallgemeinerung auf höhere Momente[Bearbeiten]

Die Tschebyscheff-Ungleichung lässt sich auf höhere Momente verallgemeinern. Man bezeichnet diese verallgemeinerte Ungleichung nicht selten (vereinfachend) ebenfalls als Tschebyscheff-Ungleichung (englisch Chebyshev's inequality)[3], während sie im Rahmen der Wahrscheinlichkeitstheorie manchmal auch als markoffsche Ungleichung (bzw. als markovsche Ungleichung o. ä., englisch Markov's inequality) genannt wird[4][5]. Bei einigen Autoren findet man die verallgemeinerte Ungleichung auch unter der Bezeichnung tschebyscheff-markoffsche Ungleichung (bzw. chebyshev-markovsche Ungleichung o. ä.).[6]

Die verallgemeinerte Ungleichung besagt, dass für einen Maßraum (\Omega,\Sigma,\nu) und eine messbare Funktion f\colon\Omega\to\R_0^+ und \varepsilon, p\in\R^+ stets die Ungleichung

\nu(\{x\mid f(x)\geq \varepsilon\})\leq \frac{1}{\varepsilon^p}\int_\Omega f^p {\rm d}\nu.

gilt.

Dies folgt aus

\int_\Omega f^p \;{\rm d}\nu \geq \int_{\{x\mid f(x)\geq \varepsilon\}} f^p \;{\rm d}\nu \geq \int_{\{x\mid f(x)\geq \varepsilon\}} \varepsilon^p \;{\rm d}\nu = \varepsilon^p\nu(\{x\mid f(x)\geq \varepsilon\})

Die oben genannte Version der Ungleichung erhält man als Spezialfall, indem man \nu = P, f=|X-\mu| und p=2 setzt, denn dann ist

P(|X-\mu| \ge k) = P(|X-\mu|^2 \ge k^2) \le \frac{1}{k^2}\int_\Omega |X-\mu|^2 \;{\rm d}P = \frac{\sigma^2}{k^2}.

Anwendungen[Bearbeiten]

Beispiele[Bearbeiten]

Beispiel 1[Bearbeiten]

Nehmen wir zum Beispiel an, dass Wikipedia-Artikel einen Erwartungswert der Länge von 1000 Zeichen mit einer Standardabweichung von 200 Zeichen haben. Aus der Tschebyscheff-Ungleichung kann man dann ableiten, dass mit mindestens 75 % Wahrscheinlichkeit ein Wikipedia-Artikel eine Länge zwischen 600 und 1400 Zeichen hat (k=400, ~ \mu=1000, ~ \sigma=200).

Der Wert für die Wahrscheinlichkeit wird auf folgende Weise berechnet:

\operatorname{P}\left[\left|X-1000\right| < 400\right] \geq 1 - \frac{200^2}{400^2} = 0{,}75 = 75\ \%

Beispiel 2[Bearbeiten]

Eine andere Folgerung aus dem Satz ist, dass für jede Wahrscheinlichkeitsverteilung mit Mittelwert \mu und endlicher Standardabweichung \sigma mindestens die Hälfte der Werte im Intervall (\mu - \sqrt{2}\sigma, \mu + \sqrt{2}\sigma) liegen (k^2=2\sigma^2).

Beispiel 3[Bearbeiten]

Ein Zufallsereignis tritt bei einem Versuch mit Wahrscheinlichkeit p ein. Der Versuch wird n-mal wiederholt; das Ereignis trete dabei k-mal auf. k ist dann binomialverteilt und hat Erwartungswert np und Varianz np(1-p); die relative Häufigkeit \tfrac{k}{n} des Eintretens hat somit Erwartungswert p und Varianz \tfrac{p(1-p)}{n}. Für die Abweichung der relativen Häufigkeit vom Erwartungswert liefert die Tschebyscheff-Ungleichung

\operatorname{P}\left[\left|\frac{k}{n}-p \right|\geq \epsilon \right] \leq \frac{p(1-p)}{\epsilon^2n} \leq \frac{1}{4\epsilon^2n} ,

wobei für die zweite Abschätzung die unmittelbar aus der Ungleichung vom arithmetischen und geometrischen Mittel folgende Beziehung \sqrt{p(1-p)}\leq \tfrac{1}{2} verwendet wurde.

Bei dieser Formel handelt es sich um den Spezialfall eines schwachen Gesetzes der großen Zahlen, das die stochastische Konvergenz der relativen Häufigkeiten gegen den Erwartungswert zeigt.

Die Tschebyscheff-Ungleichung liefert für dieses Beispiel nur eine grobe Abschätzung, eine quantitative Verbesserung liefert die Chernoff-Ungleichung.

Verwandte Resultate[Bearbeiten]

Literatur[Bearbeiten]

 Wikibooks: Beschreibung mit Beispiel – Lern- und Lehrmaterialien

Einzelnachweise und Fußnoten[Bearbeiten]

  1. Als andere geläufige Transkriptionen des Namens finden sich gelegentlich auch die Schreibungen Tschebyscheff, Tschebyschew und Chebyshev.
  2. H. Wirths: Der Erwartungswert – Skizzen zur Begriffsentwicklung von Klasse 8 bis 13. In: Mathematik in der Schule 1995/Heft 6, S. 330–343
  3. Robert B. Ash: Real Analysis and Probability. 1972, S. 84-85 & S. 227
  4. A. N. Širjaev: Wahrscheinlichkeit. 1988, S. 572
  5. R. G. Laha, V. K. Rohatgi: Probability Theory. 1979, S. 33
  6. Heinz Bauer: Maß- und Integrationstheorie. 1992, S. 128
  7. Heinz Bauer: Wahrscheinlichkeitstheorie. 2002, S. 69 ff