Diskussion:Zweistichproben-t-Test

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Vorgeschichte[Quelltext bearbeiten]

Der Inhalt dieses Artikel wurde 2011 aus dem Artikel t-Test ausgelagert, allerdings wurden die betreffenden Diskussionen nicht mitgeführt. Ältere Diskussionen bis 2011 finden sich daher auf der Seite Diskussion:T-Test.--Sigma^2 (Diskussion) 09:31, 24. Aug. 2021 (CEST)Beantworten

Abhaengige Stichproben[Quelltext bearbeiten]

MMn ist der Titel des Abschnitts "Zweistichproben-t-Test für abhängige Stichproben" falsch, und der Abschnitt gehoert nicht hier, Zwar handelt es sich um zwei Stichproben, aber der Test bezieht sich auf die eine Stichprobe der Differenzen. Nijdam 21:43, 12. Nov. 2011 (CET)Beantworten

Was macht denn der Test für "abhängige Stichproben"? In beiden Fällen wird betrachtet; man könnte den Abschnitt für abhängige Stichproben auslagern, aber macht das Sinn? --Sigbert 15:13, 13. Nov. 2011 (CET)Beantworten

Es handelt prinzipiell um dem T-Test fuer eine Stichprobe, naemlich die Stichprobe der Differenzen. MMn gehoert der Fall dort besprochen zu werden.Nijdam 20:23, 13. Nov. 2011 (CET)Beantworten

Mir ist ein grober Fehler aufgefallen: Die Formel für die Berechung der Freiheitsgrade ist falsch. Dort wird mit sx und sy gerechnet. Richtig wäre aber jeweils die VARIANZ. (nicht signierter Beitrag von 89.13.15.58 (Diskussion) 13:43, 29. Nov. 2011 (CET)) Beantworten

Hast recht, habe es korrigiert. Nijdam 17:02, 29. Nov. 2011 (CET)Beantworten

Ich zeigre noch auf meine Bemerkungen oben: der "Zweistichproben-t-Test für abhängige Stichproben" ist wesentlich nur ein Test für gepaarte Beobachtungen. Nijdam (Diskussion) 14:39, 19. Jun. 2012 (CEST)Beantworten

Der Test für so genannte "abhängige Stichproben" muss entweder als t-Differenzentest einen eigenen Artikel bekommen, wie in der englischsprachigen Wikipedia (https://en.wikipedia.org/wiki/Paired_difference_test) oder er muss als Abschnitt in den Artikel Einstichproben-t-Test. Zwar wird in einigen Anwendungsbereichen von "abhängigen Stichproben" gesprochen, es handelt sich aber um e i n e Stichprobe aus e i n e r Grundgesamtheit, bei der z w e i Merkmale an denselben Einheiten beobachtet werden. Nijdam hat grundsätzlich recht, auch wenn in seiner ersten Äußerung falsch konzediert "handelt es sich um zwei Stichproben". Nein es handelt sich eben n i c h t um zwei Stichproben, sondern um e i n e (zweidimensionale) Stichprobe, weswegen die Differenzen gebildet werden können. Die aus dem Anwenderbereich kommende schlechte Begrifflichkeit "abhängige Stichproben" (ähnlich problematisch und üblich für denselben Sachverhalt: "gebundene Stichproben", "gepaarte Stichproben") führt dann dazu, dass der t-Differenzentest unter der Überschrift Zweistichproben-Test landet, wo er nichts zu suchen hat. --Sigma^2 (Diskussion) 18:15, 23. Aug. 2021 (CEST)Beantworten

Beispiel 2[Quelltext bearbeiten]

MMn soll es im Beispiel 2 um einen einseitigen Test handeln. Nijdam (Diskussion) 14:35, 19. Jun. 2012 (CEST)Beantworten

Im Beispiel werden ja beide Varianten (ein- und zweiseitig) erwähnt. Denkst du, dass hier nur der einseitige sinnvoll ist? -- HilberTraum (Diskussion) 17:19, 19. Jun. 2012 (CEST)Beantworten

Unbedingt, denn um eine neue Therapie zur Senkung des Cholesterinspiegels zu testen, möchte man nur sicher sein ob tatsächlich eine Senkung stattfindet. Also ist die alternative Hypothese einseitig. Nijdam (Diskussion) 12:53, 20. Jun. 2012 (CEST)Beantworten

Das würde aber heißen, dass man eine mögliche Erhöhung des Cholesterinspiegels schon vor dem Test völlig ausschließt. Ich denke gerade bei Medikamenten schadet es nicht, wenn man da etwas vorsichtig ist, vgl. Paradoxe Reaktion. -- HilberTraum (Diskussion) 07:33, 21. Jun. 2012 (CEST)Beantworten

Nein, nein, ich erwarte besseres von dir. Es ist nur die Frage was man "beweisen" möchte. Nijdam (Diskussion) 09:01, 21. Jun. 2012 (CEST)Beantworten

Man findet sicher leicht noch bessere Quellen, aber auf die Schnelle mal hier etwas zu Einlesen. -- HilberTraum (Diskussion) 09:20, 21. Jun. 2012 (CEST)Beantworten

Ich verstehe nicht worauf du deutest. Von einer neuen Therapie zur Senkung des Cholesterinspiegels mochte man doch versuchen zu zeigen das sie tatsächlich das Cholesterinspiegel senkt, oder? Die Nullhypothese ist also sie senkt den Cholesterinspiegel nicht. Sie wird nur abgelehnt wenn eine signifikante Senkung festgestellt wird. Nijdam (Diskussion) 23:28, 21. Jun. 2012 (CEST)Beantworten

Man könnte mal im Medizin-Portal nachfragen, wie das in der Praxis gemacht wird, aber nach meinem (theoretischen) Wissen sind zweiseitige Tests bei Medikamenten absolut üblich (oder sogar vorgeschrieben?). Man testet, ob das neue Medikament überhaupt eine Wirkung hat und schaut dann erst auf die Richtung. Begründet wird das damit, dass das Medikament genauso gut auch eine verschlechternde Wirkung haben könnte. Mathematisch könnte man das gleiche natürlich auch mit einem einseitigen Test mit angepasstem machen, aber ich denke man will so mehr "Symmetrie" in die Interpretation bringen. -- HilberTraum (Diskussion) 09:04, 22. Jun. 2012 (CEST)Beantworten

Notation[Quelltext bearbeiten]

Die Notation in den Formeln finde ich einigermaßen irritierend. Folende Schreibweisen würde ich vorschlagen:

Stichproben[Quelltext bearbeiten]

Fallzahl der ersten Stichprobe
Fallzahl der zweiten Stichprobe
Mittelwert der ersten Stichprobe
Mittelwert der zweiten Stichprobe
Standardabweichung der ersten Stichprobe
Standardabweichung der zweiten Stichprobe
Aus der ersten Stichprobe geschätzte Grundgesamtheitsvarianz
Aus der zweiten Stichprobe geschätzte Grundgesamtheitsvarianz
Aus beiden Stichproben geschätzte gemeinsame Grundgesamtheitsvarianz

Grundgesamtheiten[Quelltext bearbeiten]

Mittelwert der Grundgesamtheit der ersten Stichprobe
Mittelwert der Grundgesamtheit der zweiten Stichprobe
Standardabweichung der Grundgesamtheit der ersten Stichprobe
Standardabweichung der Grundgesamtheit der zweiten Stichprobe
Varianz der Grundgesamtheit der ersten Stichprobe
Varianz der Grundgesamtheit der zweiten Stichprobe
Varianz der gemeinsamen Grundgesamtheit beider Stichproben

Sonstiges[Quelltext bearbeiten]

Mittelwertdifferenz, auf die getestet wird. Normalerweise gleich null gesetzt. Kann deshalb auch weggelassen werden.
Freiheitsgrade

Dann sind:

Testgröße t bei gleichen Varianzen[Quelltext bearbeiten]

bzw., was numerisch identisch ist:

mit Freiheitsgraden

Testgröße t bei ungleichen Varianzen (Welch-Korrektur)[Quelltext bearbeiten]

mit

Freiheitsgraden, wobei

ist. Vergleiche dazu auch Clauß/Ebner (1968), 184-194 und Borz (2005), 140-143 sowie folgende Webseiten:

http://eswf.uni-koeln.de/lehre/stathome/statcalc/v2401.htm

Effektstärke

Viele Grüße --Jake2042 (Diskussion) 07:02, 25. Jul. 2012 (CEST)Beantworten

Literatur[Quelltext bearbeiten]

Borz,Jürgen, (6)2005: Statistik für Human- und Sozialwissenschaftler. Heidelberg: Springer

Clauß, Günter und Heinz Ebner, 1968: Grundlagen der Statistik für Psychologen, Pädagogen und Soziologen. Berlin: Volk und Wissen

Normalverteilungsnotation[Quelltext bearbeiten]

Als Parameter der Normalverteilung werden normalerweise Erwartungswert und Varianz angegeben, also . Im Artikel steht hingegen . Absicht? Gleiches im Artikel Einstichproben-t-Test.--93.131.229.131 19:52, 22. Jun. 2015 (CEST)Beantworten

Ja, ich denke auch, dass das überall auf Varianzen vereinheitlicht werden sollte. -- HilberTraum (d, m) 08:26, 24. Jun. 2015 (CEST)Beantworten
Gleicher Meinung. Nijdam (Diskussion) 23:01, 25. Jun. 2015 (CEST)Beantworten


Beispiel 1[Quelltext bearbeiten]

Es wird vom 0.975-Quantil gesucht, aber von einer Konfidenz von 95% gesprochen. Ich vermute, hier ist ein Fehler, aber verfüge selbst nur über Halbwissen. Könnte das ein sachkundiger Benutzer ändern oder im Fall dass ich falsch liege in einem Halbsatz kurz erwähnen, warum die Zahlen verschieden sind? --80.146.228.74 10:23, 10. Aug. 2017 (CEST)Beantworten

Das stimmt schon so, wie es im Beispiel steht: Das Signifikanzniveau wird zu gleichen Teilen auf die „zu großen“ und die „zu kleinen“ Werte verteilt. Darum heißt es auch „zweiseitiger“ Test. Grüße -- HilberTraum (d, m) 19:42, 10. Aug. 2017 (CEST)Beantworten
Es ist problematisch, den Begriff "Konfidenz" im Zusammenhang mit statistischen Tests zu verwenden, da es ein Begriff aus dem Bereich der Intervallschätzung (Konfidenzintervalle und -bereiche) ist. Im Bereich der statistischen Test wird vom Signifikanzniveau und Signifikanz gesprochen. Das Ergebnis des Tests kann z.B. so zusammengefasst werden: "Die Düngemittel unterscheiden sich in ihrer Wirkung signifikant (bei einem vorgegebenen Signifikanzniveau von 5%)." --Sigma^2 (Diskussion) 09:59, 24. Aug. 2021 (CEST)Beantworten

Notation "" wird ohne Referenz oder Erklärung verwendet[Quelltext bearbeiten]

Im Abschnitt "Zweistichproben-t-Test für unabhängige Stichproben" wird in einer Formel die Notation t(x, y) verwendet. Diese Funktion wird nicht eingeführt. Offensichtlich ist es was anderes als der weiter oben definierte t-Wert. Es wäre schön, wenn ein/e Wissende/r eine Erklärung ergänzen würde, so dass ich das Schritt für Schritt nachrechnen kann (idealerweise ohne Vorwissen über t-Tests, denn sonst müsste ich diesen Artikel ja nicht aufrufen). Nachdem ich den Wikipedia-Artikel "t-Verteilung" angesehen habe (der in einem anderen Kontext weiter oben verlinkt ist), vermute ich, es handelt sich um das x-Intervall einer t-Verteilung mit der Breite y (oder "Freiheitsgrade"???, was auch immer das ist). Die Notation dort ist aber t(x;y) (mit Semikolon!), daher bin ich verwirrt.

Der - leider unsignierte - Einwand ist bezogen auf die Notation richtig. Erstens sollte eine Notation bei der ersten Verwendung erklärt werden. Zweitens sollte sie im Artikel einheitlich verwendet werden (t(x,y) versus t(x;y)). Drittens sollte sie möglichst mit der Notation im Artikel t-Verteilung übereinstimmen oder es sollte wenigstens die Entsprechung der abweichenden Notationen erklärt werden, wenn diese Einheitlichkeit nicht möglich ist. --Sigma^2 (Diskussion) 10:41, 24. Aug. 2021 (CEST)Beantworten
Erster Punkt ist erledigt. Dritter Punkt ist im Sinne des zweiten Halbsatzes erledigt. Der zweite Punkt ist noch schlimmer, da im Artikel neben und auch noch die dritte Notation verwendet wird. Viele Köche ... --Sigma^2 (Diskussion) 11:25, 24. Aug. 2021 (CEST)Beantworten