Diskussion:Kolmogorow-Smirnow-Test/Archiv

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 1 Jahr von Sigma^2 in Abschnitt Schreibweise Titel
Zur Navigation springen Zur Suche springen

Ältere Versionen

Gestern hatte ich einen Artikel zu diesem Thema geschrieben, nichtahnend, dass schon ein Artikel vorlag, der aber anders transkribiert war. Ich fasste dann heute die beiden Artikel zusammen. Jetzt wurde hier noch ein dritter Artikel kreiert, den ich noch ein bisschen integriert habe. Meine erste Version ist unter Kolmogoroff-Smirnow-Test dokumentiert, falls jemand die Zusammenfassung der Versionsgeschichte übernimmt. --Philipendula 00:03, 20. Jul 2004 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: --Sigma^2 (Diskussion) 11:56, 26. Jul. 2023 (CEST)

Sonderzeichen

bitte haltet euch an die in Wikipedia:Sonderzeichen beschriebenen mathematischen zeichen, das x ist zudem mal groß und mal klein, danke

Welches Zeichen stimmt denn wieder nicht, oh Unbekannter? Wenn X groß ist, handelt es sich um die Zufallsvariable in der Grundgesamtheit, wenn es klein ist, um eine konkrete Beobachtung dieser Zufallsvariablen. --Philipendula 11:06, 20. Jul 2004 (CEST)

tut mir ja leid, wenn ich dir zu nahe getreten bin, ich weiss du hast viel energie und zeit investiert um die 3 artikel zusammenzufügen. die sache mit dem x habe ich nicht richtig überschauen können, daher der kommentar, einfach weil ich zweifel hatte. ich habe mich wohl ein bisschen zuknapp gefasst. ich meinte rein das format, bloss das kursiv schreiben der variablen mehr nicht. PS: ich will doch auch bloss helfen

War meine Reaktion so schroff? Tut mir leid, war nicht so gemeint. Soo schlimm war das Zusammenfügen auch wieder nicht. Das mit dem Kursiv weiß ich, aber ich hasse es wie die Pest, weil es die Lesbarkeit einschränkt. Der Text ist mit Schrift und TeX sowieso schon so unruhig. Trotzdem könntest Du Dich mal irgendwie identifizieren lassen. --Philipendula 22:43, 20. Jul 2004 (CEST)

alles klar :), mit der identifizierung: zum rechtschreibfehler korrigieren hats bisher immer ohne account ausgereicht, habe eh nur noch 2 wochen festes internet und dann werde ich kaum irgend etwas machen ich bin nicht der meinung das ich activ genug für einen account bin aber wenns hilft kann ich ja die temporäre ip anzeigenlassen :) --194.95.177.102 08:15, 21. Jul 2004 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: --Sigma^2 (Diskussion) 11:57, 26. Jul. 2023 (CEST)

Schlussfolgerung aus Zahlenbeispiel?

Welche Schlussfolgerung ergibt sich aus dem Zahlenbeispiel? Das ist wieder typisch für Mathematiker. Die Tabellen etc. sind allesamt korrekt, aber eine sinnvolle lexikalische Schlussfolgerung wird nicht gezogen. Dabei heisst es schon in der Schule, dass ein Antwortsatz zu formulieren ist! Also: leckt die Abfüllmaschine in diesem Beispiel oder sind die Abfüllmengenabweichungen noch im Rahmen einer statistischen Wahrscheinlichkeitsverteilung? Bitte bedenkt, dass ihr solche komplexen mathematischen Phänomene vor allem Nichtmathematikern erklären sollt! Am besten, Ihr versetzt Euch in die Lage eines Künstlers, der aus diesem Artikel auf Anhieb die Essenz herausziehen möchte. Von grossartigem Vorwissen kann nicht ausgegangen werden, also scrollt er gleich zum "Zahlenbeispiel". Die Abfüllanlage ist ja gar nicht verkehrt als Beispiel, nur was heisst die Schlussfolgerung daraus? --85.178.44.18 09:39, 16. Jun. 2007 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von --Sigma^2 (Diskussion) 12:17, 26. Jul. 2023 (CEST), Es gibt inzwischen eine verbale Zusammenfassung

falsche Grenzen

Die Grenze für D bei n=10 und alpha=5% von 0,454 stimmt nicht mit dem Wert in der verlinkten Tabelle ([1]) von .410 überein. Was paßt da nicht? --Thire 10:30, 21. Mär 2006 (CET)

liegt das vielleicht an dem n=8? Gruß --Philipendula 13:20, 21. Mär 2006 (CET)
Perfekt, stimmt. Zwar steht da in der tabelle noch 0.457 überein. Nicht schlimm, aber verwirrend. Wenn Du mir einen linktippgibst, dann verspreche ich, an dem Artikel etwas herumzuarbeiten. --Thire 13:55, 21. Mär 2006 (CET)
Hab keinen Linktip, bin Toterbaumfan. Die kritischen Werte sind aus Jochen Schwarze, Grundlagen der Statistik II, ein Autor, den ich für sehr seriös halte. --Philipendula 14:16, 21. Mär 2006 (CET)
Ich zweifle in keinster Weise an deinen Literaturquellen; Wenn ein Laie das nachvollziehen will (er hat ja so ein schönes Zahlenbeispiel von Dir), dann sollte er den kritischen Wert auchausfindig machen können. Die Tabelle in [2] weist zB genau Deine 0,454 aus. Super. Ich werde das auch verlinken. Ein Freund hat mir heute den Zusammenhang zur Brownsche Brücke erklärt. Ev baue ich das auch noch ein. :) Was ist ein Toterbaumfan? --Thire 18:49, 21. Mär 2006 (CET)
Toterbaumfan = Bücherfan. --Philipendula 09:15, 22. Mär 2006 (CET)
Okay, danke. :) ich finde man merkt noch etwas, dass der Artikel zusammengestückelt wurde. Ich will ih nun verbessern. Ev auch einen anderen Datensatz nehmen. Deiner scheint ja nur ein fiktives Beispiel zu sein, da wäre es vielleicht besser Daten wie zB in (okay, schlechtes Beispiel, da von mir) Bild:PartielleAutokorrelation.png zu nehmen (die Wasserstände des Huronsees). Was meinst Du? --Thire 10:01, 22. Mär 2006 (CET)

Hallo! Ich sehe noch ein weiteres, grundlegenderes Problem mit den Grenzen. Eine normierte stetige Verteilungsfunktion sollte nahe der unteren Grenze des Definitionsbereichs nahe bei 0 und in der Nähe der oberen Grenze nahe bei 1 sein. Direkt an diesen Punkten sind nur 0 bzw. 1 zulässig, denn alle Stichproben liegen ja zwischen diesen beiden Grenzen. Wenn eine Verteilung nahe der unteren Definitionsbereichsgrenze die 95%-Vertrauens-Kurve erreicht, so ist die Verteilung in Wahrheit schon extrem "falsch". Daher müssten die Vertrauens-Kurven zu den Randpunkten hin auch gegen 0 bzw. 1 konvergieren. Ferner sollte die Definition und Bedeutung der Signifikanz in Bezug auf den K-S-Test besser erläutert werden (das geht aus dem Hauptartikel Statistische Signifikanz nicht hervor).--SiriusB

Da mein Beitrag im Artikel mit Hinweis auf die Diskussion gelöscht wurde, füge ich ihn hier mal ein. Ich lasse mich natürlich gerne belehren, dass er (mein Beitrag) falsch ist. Allerdings habe ich die Zahlen aus der KS-funktion direkt berechnet und ich könnte mir vorstellen, dass Rundungsartefakte der Grund für die Abweichungen sein könnten. Allerdings habe ich meine zugrunde liegenden Zahlen auf mehrere Stellen nach dem Komma berechnet.

Hinweis: Das Zahlenbeispiel ist unglücklich gewählt. Der kritische Wert bei α = 0,05 und n=8 ist der Betrag 0,481. Damit wäre der größte absolute Abweichler in der Tabelle von 0,459 kleiner als der kritische Wert und würde vom KS-Test akzeptiert! Der oben genannte Betrag von 0,454 käme bei einem n=8,974 zustande, ist also vermutlich von n=9 genommen. Es gibt aber nur 8 Messwerte im o.g. Beispiel.

Letztlich gilt aber erstmal Vielen Dank für den Artikel...Hat mir sehr weitergeholfen. Hab mich halt nur gewundert, dass ich alle die Zahlen aus der Tabelle reproduzieren konnte, nur den threshold nicht.

Der letzte Beitrag ist unsigniert. Inhaltlich ist der angegebene Zahlenwert 0,481 nicht nachvollziehbar.--Sigma^2 (Diskussion) 12:34, 26. Jul. 2023 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: --Sigma^2 (Diskussion) 12:34, 26. Jul. 2023 (CEST)

Kommentar weg

Ich habe mal den html-Kommentar war er doch hoffentlich? nach dem namen Wladimir Iwanowitsch Smirnow entfernt, da er auch in der französischen und italienischen wikipedia genannt wird. Falls jemand bedenken hat - bitte meldet Euch hier bzw bessert es aus! --Thire 19:08, 21. Mär 2006 (CET)

Merkt doch eh niemand ;). --Philipendula 09:16, 22. Mär 2006 (CET)
Genau deshalb hab' ich es hier rein geschrieben. Es sollte doch stimmen... --Thire 09:54, 22. Mär 2006 (CET)
Archivierung dieses Abschnittes wurde gewünscht von: --Sigma^2 (Diskussion) 12:36, 26. Jul. 2023 (CEST)

besserer Datensatz

Ich hab's oben schon mal geschrieben:
Ev sollte man einen anderen Datensatz für das Zahlenbeispiel nehmen. Der aktuelle scheint ja nur ein fiktives Beispiel zu sein, da wäre es vielleicht besser Daten wie zB in (okay, schlechtes Beispiel, da von mir ;) ) Bild:Autokorrelation.png zu nehmen (die Wasserstände des Huronsees).
Ev kann man das auch mit dem Absatz 3 Anwendungsbeispiel verbinden und mit dem Standard C-Generator 8 Zufallszahlen ziehen. Oder habt ihr eine bessere Idee?
--Thire 15:25, 22. Mär 2006 (CET)

Ein fiktives Beispiel ist meistens besser nachvollziehbar. Kann du nicht das andere Beispiel als zweites, praxisrelevantes reinbringen? --Philipendula 15:53, 22. Mär 2006 (CET)
Wie meinst Du? Soll ich 11 Zufallszahlen ziehen und dann noch mal das alles durchrechnen? Zwei Beispiele in einer Enzyklopedie wären etwas zu viel... --Thire 16:30, 22. Mär 2006 (CET)
Mir ist nicht so recht klar, was der Huronsee mit Zufallszahlen zu tun hat. Ich kann nur sagen, dass ich mir mit dieser Tabelle ziemlich viel Arbeit gemacht habe und dass es mich sehr begeistert, dass das für die Katz war. --Philipendula 17:59, 22. Mär 2006 (CET)
Ich finde die Wasserstände des Hurronsees auch nicht so aufregend. Aber ich will den Artikel verbessern und war auf der Suche nach einem besseren Datensatz. Denn Deinen erdachten finde ich mit Verlaub etwas zu wenig aufregend... Das war mehr eine Anregung, ob Dir oder sonst jemandem was besseres einfällt. Eine Idee von mir war dann, die Sache mit den Zufallszahlen mit dem Zahlenbeispiel zu vereinen (aha, schon wieder merkt man, dass es mehrere Quellen gab) und ein Beispiel da zu verwenden. Oder eben einen besseren Datensatz.
Ich vermute mal, dass Du in Deinem letzten Satz ein "nicht" ("mich nicht sehr begeistert") vergessen hast. Aber das ist weder Deine wikipedia noch Dein Artikel, er gehört uns allen (offen, frei). Wenn ich ihn verbessere (Argumente, warum der aktuelle Datensatz mich nicht besonders geil macht siehe oben), dann ist das doch nur gut, oder? Let's gettin' started... --Thire 10:45, 23. Mär 2006 (CET)
Zum Einen: Es ist genau so wenig deine Wikipedia wie meine. Zum Anderen: Es ist IMHO nicht die Aufgabe des Datensatzes, aufregend zu sein. Mir ging es um ein einfaches, leicht nachvollziehbares Beispiel mit einem Sachverhalt, der einerseits eine gewisse praktische Relevanz hat und andererseits für jeden verständlich ist. Das Recht, die eigene Meinung durchzudrücken, nehme ich für mich genau so in Anspruch wie du für dich. --Philipendula 13:31, 23. Mär 2006 (CET)
Ich finde Dein Beispiel ganz toll.
Aber ich finde es ginge noch besser.
Ich will nicht "meine Meinung durchdrücken". Ich versuche zu argumentieren, um der Sache (=Enzyklopädie=Wikipedia). Da steht jetzt mal "Ein fiktives Beispiel ist meistens besser nachvollziehbar." gegen "Ich suche einen besseren Datensatz, zB wie Huronsee oder C-Zufallszahlen (vereint geschickt zwei Absätze)".
Sag's mir bitte, wenn Du das anders siehst. Ev ziehen wir eh am gleichen Strang (sogar in die selbe Richtung!), aber sind nur schlecht koordiniert.
Auch habe ich nie behauptet, dass es meine wikipedia sei.
Gibt es Argumente gegen meine Vorschläge? Hast Du andere konstruktive Ideen? Was spricht gegen einen neuen (=besseren) Datensatz? --Thire 13:51, 23. Mär 2006 (CET)

Dann mach halt. --Philipendula 09:03, 24. Mär 2006 (CET)

Werde ich auch und habe ich ja auch schon. Es wäre halt schön, wenn zB Du als Hauptschreiber des Artikels mit von der Partie bist!
Ich habe paar kleinere Fehler im Bild entdeckt, ich erneuere es, wenn ich weiß, welche Daten dem Testbeispiel zu Grunde liegen sollen. --Thire 10:50, 24. Mär 2006 (CET)
Was kann ich denn tun als mal abwarten ... --Philipendula 14:06, 24. Mär 2006 (CET)
Das muss ich Dir jetzt sagen ;)
Naja, wenn Du von Deinem eigenen Datensatz nicht mehr ganz überzeugt bist, könntest Du gemeinsam mit mir einen neuen, besseren suchen.
Wenn Du an Deinem festhältst, könntest Du mich auf andere Gedanken bringen: Och Thomas, mach doch mal das mit der Brownsche Brücke, das interessiert mich jetzt, was das mit dem KS-Test zu tun hat...
Oder sonst was...
Wieder im Boot?
--Thire 15:02, 24. Mär 2006 (CET)
Witzbold. Natürlich bin ich von meinem Datensatz überzeugt. Aber was hab ich davon, wenn du auf einem anderen bestehst? Da muss ich halt abwarten, was du bringst. Was soll ich denn machen - auf einem Bein Tango tanzen? --Philipendula 17:52, 24. Mär 2006 (CET)
Archivierung dieses Abschnittes wurde gewünscht von: --Sigma^2 (Diskussion) 12:37, 26. Jul. 2023 (CEST)

Verweise auf andere Verfahren fehlen

Für den Test auf Normalverteilung (eine sehr häufige Anwendung) gibt es bessere Tests als den hier besprochenen: :Anderson-Darling-Test

Cramér-von-Mises-Kriterium
Shapiro-Wilk-Test

In der englischen Version des Artikels werden die auch erwähnt, hier nicht. Gibt es dafür Gründe? Ich selbst scheue mich, an statistischen Artikeln herumzupfuschen: Dafür bin ich zu dumm. --Jan-Henner Wurmbach 11:55, 9. Jan. 2008 (CET) So dumm, dass ich immer meine Unterschrift vergesse

Archivierung dieses Abschnittes wurde gewünscht von: --Sigma^2 (Diskussion) 13:53, 26. Jul. 2023 (CEST)

Einwand von 129.217.132.49

Aus dem Artikel [3] kopiert:

Kritik: ein einseitiger KS-Test ist ein KS-Test mit einem einseitigen Testproblem. fälschlicherweise wird hier ein KS-Test bei einer Stichprobe (also Anpassungstest) falsch formuliert. Bei dem KS-Test als Anpassungstest gibt es sowohl einseitige als auh zweiseitige Testprobleme.

Siehe Büning / Trenkler : Nichtparametrische Methoden, 2. Auflage, Seite 70

Archivierung dieses Abschnittes wurde gewünscht von: --Sigma^2 (Diskussion) 13:55, 26. Jul. 2023 (CEST)

Falsche Zuordnung

Der Author des Artikels von 1939 über diesen Test war N. Smirnow, nicht W. I. Smirnow. Guido Germano 21:04, 21. Mär. 2009 (CET)

Archivierung dieses Abschnittes wurde gewünscht von: --Sigma^2 (Diskussion) 13:58, 26. Jul. 2023 (CEST)

Schreibweise Titel

Meiner Meinung nach ist die Schreibweise hier falsch. In sämtlicher Statistik Fachliteratur die ich in meiner elektronischen Bibliothek habe, ist vom Kolmogorov-Smirnov-Test, also beides mal mit "v", die Rede[1] [2]. Ebenso im englischen Artikel dazu. Sucht man bei Google nach "Kolmogorow-Smirnow-Test" (mit "w") wird dies ebenfalls als Tippfehler gewertet und "Kolmogorov-Smirnov-Test" (mit "v") als Vorschlag gemacht.

Daher würde ich empfehlen den Artikel umzubenennen.

Die hier verwendete Transkription entspricht Wikipedia:Namenskonventionen/Kyrillisch. Daher muss es mit W geschrieben werden. 90.184.23.200 20:12, 5. Jun. 2016 (CEST)
  1. Eckstein, Peter P.: Statistik für Wirtschaftswissenschaftler: Eine realdatenbasierte Einführung mit SPSS. 4., aktualisierte u. erw. Aufl. 2014. Wiesbaden: Springer Fachmedien Wiesbaden, 2014
  2. Weiß, Christel: Basiswissen Medizinische Statistik. 6., überarb. Aufl. Berlin Heidelberg: Springer, 2013 (Springer-Lehrbuch)
Archivierung dieses Abschnittes wurde gewünscht von: --Sigma^2 (Diskussion) 15:42, 27. Jul. 2023 (CEST)