Tschebyscheff-Ungleichung
In der Stochastik gibt die Tschebyscheff-Ungleichung oder Tschebyschow-Ungleichung eine untere Grenze für die Wahrscheinlichkeit an, dass ein Wert einer Zufallsvariable mit endlicher Varianz innerhalb eines bestimmten Bereiches um den Erwartungswert der Variable liegt. Damit ist auch eine obere Grenze für die Wahrscheinlichkeit angegeben, dass die Werte außerhalb dieses Bereiches liegen. Der Satz lässt sich auch auf Verteilungen anwenden, die weder "glockenförmig" noch symmetrisch sind und setzt Grenzen dafür, wie viele der Daten "in der Mitte" liegen und wie viele nicht.
Die Tschebyscheff-Ungleichung ist zu Ehren von Pafnuti Lwowitsch Tschebyschow benannt; in Transkriptionen findet sich gelegentlich noch die Schreibweise Tschebyschev.
Inhaltsverzeichnis |
[Bearbeiten] Satz
Sei X eine Zufallsvariable mit Erwartungswert
und endlicher Varianz
. Dann gilt für alle reellen Zahlen
:
Durch Übergang zum komplementären Ereignis erhält man
Der Beweis ergibt sich als Anwendung der Markow-Ungleichung, eine einfache Herleitung findet sich auch unten.
Die von der Tschebyscheff-Ungleichung angegebenen Grenzen können nicht verbessert werden:
Für die diskrete Zufallsgröße X mit
und
gilt das Gleichheitszeichen.
Im Allgemeinen sind die Grenzen aber schwach. Trotz der schwachen Grenzen kann der Satz nützlich sein, weil er ohne Verteilungsannahmen über die Zufallsvariablen auskommt, und somit für alle Verteilungen mit endlicher Varianz (insbesondere auch solche, die sich stark von der Normalverteilung unterscheiden) anwendbar ist. Außerdem sind die Schranken einfach zu berechnen.
[Bearbeiten] Varianten
[Bearbeiten] Abstand von Standardabweichung
Ist die Standardabweichung
von Null verschieden und
eine positive Zahl, so erhält man mit
eine oft zitierte Variante der Tschebyscheff-Ungleichung:
Diese Ungleichung liefert nur für
eine sinnvolle Abschätzung, für
ist sie trivial, denn Wahrscheinlichkeiten sind stets durch 1 beschränkt.
[Bearbeiten] Verallgemeinerung auf höhere Momente
Die Tschebyscheff-Ungleichung lässt sich auf höhere Momente verallgemeinern (Lit.: Ash, 1972, Theorem 2.4.9): Im Maßraum
gilt für eine messbare Funktion
und 
.
Das folgt sehr einfach aus
Daraus erhält man als Spezialfall die oben genannte Ungleichung, indem man
,
und
setzt, denn dann ist
.
[Bearbeiten] Anwendungen
- Der Satz wird beim Beweis des Gesetzes der großen Zahlen verwendet.
- Die Verallgemeinerung auf höhere Momente kann benutzt werden, um zu zeigen, dass aus der
-Konvergenz von Funktionenfolgen die Konvergenz im Maß folgt. - Für den Median
gilt
.
[Bearbeiten] Beispiele
[Bearbeiten] Beispiel 1
Nehmen wir zum Beispiel an, dass Wikipedia-Artikel im Durchschnitt 1000 Zeichen lang sind mit einer Standardabweichung von 200 Zeichen. Aus der Tschebyscheff-Ungleichung kann man dann ableiten, dass mit mindestens 75% Wahrscheinlichkeit ein Wikipedia-Artikel eine Länge zwischen 600 und 1400 Zeichen hat (
).
Der Wert für die Wahrscheinlichkeit wird auf folgende Weise berechnet:
[Bearbeiten] Beispiel 2
Eine andere Folgerung aus dem Satz ist, dass für jede Wahrscheinlichkeitsverteilung mit Mittelwert
und endlicher Standardabweichung
mindestens die Hälfte der Werte im Intervall
liegen (
).
[Bearbeiten] Beispiel 3
Ein Zufallsereignis tritt bei einem Versuch mit Wahrscheinlichkeit
ein. Der Versuch wird
mal wiederholt; das Ereignis trete dabei
Mal auf.
ist dann binomialverteilt und hat Erwartungswert
und Varianz
; die relative Häufigkeit
des Eintretens hat somit Erwartungswert
und Varianz
. Für die Abweichung der relativen Häufigkeit vom Erwartungswert liefert die Tschebyscheff-Ungleichung
,
wobei für die zweite Abschätzung die unmittelbar aus der Ungleichung vom arithmetischen und geometrischen Mittel folgende Beziehung
verwendet wurde.
Bei dieser Formel handelt es sich um den Spezialfall eines schwachen Gesetzes der großen Zahlen, das die stochastische Konvergenz der relativen Häufigkeiten gegen den Erwartungswert zeigt.
Die Tschebyscheff-Ungleichung liefert für dieses Beispiel nur eine grobe Abschätzung, eine quantitative Verbesserung liefert die Chernoff-Ungleichung.
[Bearbeiten] Literatur
- Robert B. Ash: Real Analysis and Probability. Academic Press, New York 1972, ISBN 0-12-065201-3.
- Ulrich Krengel: Einführung in die Wahrscheinlichkeitstheorie und Statistik. 7. Auflage, Vieweg Verlag, Wiesbaden 2003, ISBN 3-528-67259-5.
- P. L. Tschebyschow: On Mean Values, in: Journal de Mathématiques Pures et Appliquées 2(12), 1867, S. 177–184.
- Andreas Wagener: Chebyshev's Algebraic inequality and comparative statics under uncertainty, in: Mathematical social sciences 52 (2006), S. 217–221.
![\operatorname{P}\left[\left|X-\mu\right|\geq k\right] \leq \frac{\sigma^2}{k^2} .](http://upload.wikimedia.org/wikipedia/de/math/2/c/7/2c7addb4c71e715a02f2b904d999c0fe.png)
![\operatorname{P}\left[\left|X-\mu\right| < k\right] \geq 1 - \frac{\sigma^2}{k^2} .](http://upload.wikimedia.org/wikipedia/de/math/7/d/c/7dcaecfd21bb05de6108f4958f891a85.png)
![\operatorname{P}\left[\left|X-\mu\right|\geq \lambda \sigma\right] \leq \frac{1}{\lambda^2} .](http://upload.wikimedia.org/wikipedia/de/math/e/f/c/efcb0b508ebd707d8abf68d32d10ddcd.png)
.
.
-Konvergenz von
gilt
.![\operatorname{P}\left[\left|X-1000\right| < 400\right] \geq 1 - \frac{200^2}{400^2} = 0,75 = 75\%](http://upload.wikimedia.org/wikipedia/de/math/c/6/d/c6d3d687a79140d7f5d2b351adcb9828.png)
,