„Kolmogorow-Verteilung“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
[gesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
→‎Anwendung: + Approximation
Zeile 30: Zeile 30:


== Anwendung ==
== Anwendung ==
Die Kolmogorow-Verteilung wird als approximative Wahrscheinlichkeitsverteilung der Teststatistik für die Durchführung eines approximativen Kolmogorow-Smirnow-Anpassungstests verwendet, falls der Stichprobenumfang hinreichend groß ist, um die asymptotische Verteilung der Teststatistik – nämlich die Kolmogorow-Verteilung – zu verwenden. Die <math>(1-\alpha)</math>-Quantile der Kolmogorov-Verteilung für <math>\alpha = 0.20, 0.10, 0.05, 0.02,0.01 </math> sind näherungsweise <math>1.073, 1.224, 1.358, 1.517, 1.628</math>.<ref name="Lex-627">Z. B. {{Literatur|Titel=Lexikon der Stochastik: Tafel XIII B: Kolmogorow-Test: Quantile der Kolmogorow-Verteilung |Seiten=627}}</ref>
Die Kolmogorow-Verteilung wird als approximative Wahrscheinlichkeitsverteilung der Teststatistik für die Durchführung eines approximativen Kolmogorow-Smirnow-Anpassungstests verwendet, falls der Stichprobenumfang hinreichend groß ist, um die asymptotische Verteilung der Teststatistik – nämlich die Kolmogorow-Verteilung – zu verwenden. Die <math>(1-\alpha)</math>-Quantile der Kolmogorow-Verteilung für <math>\alpha = 0.20, 0.10, 0.05, 0.02,0.01 </math> sind näherungsweise <math>1.073, 1.224, 1.358, 1.517, 1.628</math>.<ref name="Lex-627">Z. B. {{Literatur|Titel=Lexikon der Stochastik: Tafel XIII B: Kolmogorow-Test: Quantile der Kolmogorow-Verteilung |Seiten=627}}</ref>
Eine Approximation der Verteilungsfunktion ergibt sich, wenn nur der erste Summand für <math>k=1</math> verwendet wird,
:<math>K(x) \approx K_1(x) = 1 - 2e^{-2x^2}, \quad x > 0.</math>
Das <math>(1-\alpha)</math>-Quantil <math>k_{1-\alpha}</math> der Kolmogorow-Verteilung ergibt sich dann näherungsweise als Lösung der Gleichung <math>\alpha = 2e^{-2x^2}</math>. Dies führt zur Näherungsformel
:<math> k_{1-\alpha} \approx \sqrt{-\frac{1}{2}\ln\left(\frac{\alpha}{2}\right)}</math>,
die zu Werten führt, die bis zur dritten Nachkommastelle mit den oben angegebenen Tabellenwerten übereinstimmt. Manchmal wird diese Formel angegeben, ohne klarzustellen, dass es sich um eine doppelte Approximation handelt.<ref>{{Literatur |Autor=[[Lothar Sachs]], Jürgen Hedderich |Titel= Angewandte Statistik. Methodensammlung mit R |Auflage=17 |Verlag=Springer Spektrum |Ort=Berlin / Heidelberg |Datum=2018 |ISBN=978-3-662-62293-3 |Fundstelle=S. 496 |DOI=10.1007/978-3-662-62294-0 }}</ref> Die asymptotische Verteilung wird für endlichen Stichprobenumfang verwendet und dabei wird nur die Approximation <math>K_1(x)</math> der Kolomogorow-Verteilung verwendet.


== Theoretischer Hintergrund ==
== Theoretischer Hintergrund ==

Version vom 27. Juli 2023, 18:40 Uhr

Die Kolmogorow-Verteilung ist eine stetige Wahrscheinlichkeitsverteilung, die als Grenzverteilung einer Teststatistik des Kolmogorow-Smirnow-Anpassungstests für über alle Grenzen wachsenden Stichprobenumfang auftritt.

Definition

Eine stetige Zufallsvariable heißt Kolmogorow-verteilt, falls sie die Verteilungsfunktion

hat.[1][2] Die zugehörige Wahrscheinlichkeitsverteilung heißt Kolmogorow-Verteilung.

Eigenschaften

Eine alternative Summendarstellung der Verteilungsfunktion[3][4] ist

Diese alternative Darstellung ist für numerische Berechnungen in bestimmten Fällen günstiger.[3]

Für eine Kolmogorow-verteilte Zufallsvariable gilt

Die Zufallsvariable hat den Erwartungswert

und die Varianz

[3]

Anwendung

Die Kolmogorow-Verteilung wird als approximative Wahrscheinlichkeitsverteilung der Teststatistik für die Durchführung eines approximativen Kolmogorow-Smirnow-Anpassungstests verwendet, falls der Stichprobenumfang hinreichend groß ist, um die asymptotische Verteilung der Teststatistik – nämlich die Kolmogorow-Verteilung – zu verwenden. Die -Quantile der Kolmogorow-Verteilung für sind näherungsweise .[5]

Eine Approximation der Verteilungsfunktion ergibt sich, wenn nur der erste Summand für verwendet wird,

Das -Quantil der Kolmogorow-Verteilung ergibt sich dann näherungsweise als Lösung der Gleichung . Dies führt zur Näherungsformel

,

die zu Werten führt, die bis zur dritten Nachkommastelle mit den oben angegebenen Tabellenwerten übereinstimmt. Manchmal wird diese Formel angegeben, ohne klarzustellen, dass es sich um eine doppelte Approximation handelt.[6] Die asymptotische Verteilung wird für endlichen Stichprobenumfang verwendet und dabei wird nur die Approximation der Kolomogorow-Verteilung verwendet.

Theoretischer Hintergrund

Die reellwertigen Zufallsvariablen seien stochastisch unabhängig und identisch verteilt mit der stetigen Verteilungsfunktion .

wobei
die zufällige empirische Verteilungsfunktion bezeichnet, nicht von ab. ist also bezüglich der Klasse aller stetigen Verteilungsfunktionen eine verteilungsfreie Statistik.
  • Außerdem konvergiert die Folge in Verteilung gegen die Kolmogorow-Verteilung, es gilt daher
.

ist die Teststatistik des Kolmogorov-Smirnov-Anpassungstest für den Stichprobenumfang . Sie heißt auch Kolmogorow-Smirnow-Statistik. Es gibt Tabellen für Quantile der Verteilung von .[7]

Für große Stichprobenumfänge können die Quantile der Kolmogorow-Verteilung verwendet werden.[5] Es gibt eine Tabelle für Werte der Verteilungsfunktion der Kolomogorov-Verteilung[8]

Literatur

  • P. H. Müller (Hrsg.): Lexikon der Stochastik – Wahrscheinlichkeitsrechnung und mathematische Statistik. 5. Auflage. Akademie-Verlag, Berlin 1991, ISBN 978-3-05-500608-1, Kolmogorow-Verteilung, S. 188–189, 627.

Einzelnachweise und Anmerkungen

  1. Die leicht abweichende Darstellung
    findet sich im Lexikon der Stochastik: Kolmogorow-Verteilung. S. 188. In dieser Form wurde die Verteilungsfunktion auch druch Kolmogorow in der Originalarbeit angegeben: A. Kolmogoroff: Sulla determinazione empirica di una legge di distribuzione. In: Giornale dell’Istituto italiano degli attuari. Band IV, Nr. 1, 1933, S. 83–91, S. 91 (italienisch, sbn.it). Diese ist äquivalent zur oben angegebenen Form.
  2. Eine - vermutlich fehlerhafte – Darstellung der Verteilungsfunktion mit anstelle von findet sich in den beiden folgenden Quellen: Andererseits findet sich die in der Definition angegebene Form der Verteilungsfunktion mit dem Faktor 2 im Exponenten auch in diesen Quellen:
  3. a b c Lexikon der Stochastik: Kolmogorow-Verteilung. S. 188.
  4. William Feller: On the Kolmogorov-Smirnov limit theorems for empirical distributions. In: The Annals of Mathematical Statistics. Band 19, Nr. 2, 1948, S. 177–186, S. 178, JSTOR:2236265.
  5. a b Z. B. Lexikon der Stochastik: Tafel XIII B: Kolmogorow-Test: Quantile der Kolmogorow-Verteilung. S. 627.
  6. Lothar Sachs, Jürgen Hedderich: Angewandte Statistik. Methodensammlung mit R. 17. Auflage. Springer Spektrum, Berlin / Heidelberg 2018, ISBN 978-3-662-62293-3, S. 496, doi:10.1007/978-3-662-62294-0.
  7. Z. B. Lexikon der Stochastik: Tafel XIII A: Kolmogorow-Test: Quantile . S. 625–626.
  8. N. Smirnov: Table for estimating the goodness of fit for empirical distributions. In: The Annals of Mathematical Statistics. Band 19, Nr. 2, 1948, S. 279–281, JSTOR:2236278. Diese Tabelle wurde zuerst abgedruckt in N. Smirnov: On the estimation of the discrepancy between empirical curves of distribution for two independent samples. In: Bulletin Mathématique de l'Université Moscou. Band 2, Nr. 2, 1939. Die Tabelle ist wiederabgedruckt auf S. 143 in Galen R. Shorack, Jon A. Wellner: Empirical Processes with Applications in Statistics. Wiley, New York 1986 (Unveränderter Nachdruck: SIAM, Philadelphia 2009, ISBN 978-0-898716-84-9).