Diskussion:Multivariate Verteilung

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 5 Jahren von JonskiC in Abschnitt Bedingt
Zur Navigation springen Zur Suche springen
Diese Diskussionsseite dient dazu, Verbesserungen am Artikel „Multivariate Verteilung“ zu besprechen. Persönliche Betrachtungen zum Thema gehören nicht hierher. Für allgemeine Wissensfragen gibt es die Auskunft.

Füge neue Diskussionsthemen unten an:

Klicke auf Abschnitt hinzufügen, um ein neues Diskussionsthema zu beginnen.

Falsche Integralgrenzen[Quelltext bearbeiten]

Ich denke statt

.

muss es heißen

.

und im mehrdimensionalen Fall

statt

.

muss es heißen

.

--Darou77 (Diskussion) 21:03, 1. Feb. 2013 (CET)Beantworten

Ich hab's korrigiert. Danke für den Hinweis.
Dieser Abschnitt kann archiviert werden. HilberTraum (Diskussion) 09:04, 2. Feb. 2013 (CET)

Redirect[Quelltext bearbeiten]

Bin mit "Multivariate Normalverteilung" hierher umgeleitet worden, obwohl es ja den Artikel "Mehrdimensionale Normalverteilung" gibt. Leider weiß ich nicht wie man eine Weiterleitung ändert. SG --Rage987 23:52, 22. Feb. 2010 (CET)Beantworten

Hallo Rage987, vielen Dank. Ich habe es geändert. -- KurtSchwitters 09:11, 23. Feb. 2010 (CET)Beantworten

Ich habe das ähnliche Problem, dass meiner Meinung nach eine Umleitung von Korrelationsmatrix auf Kovarianzmatrix besser wäre als auf diesen Artikel. -- BeneErnst 11:28, 10. Mär. 2010 (CET)Beantworten

Was soll die Abgrenzung der Multivariaten Verteilung von der Multinomialen? Es kommt auch niemand auf die Idee, Äpfel von Erdäpfeln abzugrenzen, bloß weil es ähnlich klingt. --Philipendula 00:38, 4. Nov 2005 (CET)

Beispiel zu Stichproben[Quelltext bearbeiten]

Was sollen in der Matrix die einzelnen Spalten inhaltlich bedeuten? --source 21:17, 1. Jan. 2009 (CET)Beantworten

Thematisieren eines häufig gemachten Fehlers[Quelltext bearbeiten]

Schon ziemlich oft habe ich die folgende Aussage gelesen: Sind zwei normalverteilte Zufallsvariablen unkorreliert, dann sind sie auch unabhängig.

Dies ist nicht richtig, die beiden Zufallsvariablen müssen schon "gemeinsam normalverteilt" sein, lese ich anderswo. Was bedeutet eigentlich "gemeinsam normalverteilt"? Hierfür kann ich keine Definition finden???

Sollte man nicht am Ende dieses Artikels die falsche Tatsache: "X,Y normalverteilt und unkorreliert, dann folgt unabhängig" extra thematisieren? Das einfachste Gegenbeispiel ist ja: "Z ~ N(0,1) und Y diskret mit P(Y=1)=0.5 und P(Y=-1)=0.5 und X_1=Z*Y und X_2=Z, dann sind X_1 beide normalverteilt und unkorreliert, aber nicht unabhängig (X_1=x lässt ja für X_2 nur die Werte x und -x möglich).

Oder gehört das besser in einen anderen Artikel (welchen?)? 27. Feb.2009

"Gemeinsam normalverteilt" bedeutet, dass (X,Y) normalverteilt ist. Das muss nicht zwangsläufig der Fall sein. --Scherben 14:33, 8. Mär. 2009 (CET)Beantworten
Ok, dann haben wir aber eine Reihe von Fehlern im Artikel. In meinem Beispiel oben habe ich zwei ZV konstruiert, die jede für sich normalverteilt sind und unkorreliert sind. Die gemeinsame Dichte ist aber nicht ( Einheitsmatrix)
Und ganz falsch ist die Behauptung:
"Sind die Komponenten des Zufallsvektors paarweise unkorreliert, sind sie auch stochastisch unabhängig."
Ich bin immer noch auf der Suche nach dem Missverständnis der "gemeinsamen Normalverteilung". Bedeutet das nicht doch mehr als nur, dass die Komponenten jeweils für sich normalverteilt sind??? 9. Mrz. 2009
Ja, natürlich. Es bedeutet, dass (X,Y) normalverteilt ist, also eine Dichte der o. a. Form hat. Habe ich doch gesagt. --Scherben 09:06, 9. Mär. 2009 (CET)Beantworten
Dann sollte es im Artikel aber heißen:Gegeben ist ein Vektor aus gemeinsam normalverteilten Zufallsvariablen mit dem Erwartungswertvektor und der Kovarianzmatrix mit Determinante , AUßERDEM SEI die gemeinsame Dichtefunktion der Vektorkomponenten gegeben durch
.
Aber dann wiederum ist doch die Aussage "Sind die Komponenten des Zufallsvektors paarweise unkorreliert, sind sie auch stochastisch unabhängig." nahezu belanglos, weil die Folgerung eigentlich schon durch die Voraussetzung gefordert wird, ganz nach dem Motto: "Wenn es morgen regnet, dann haben wir den 10. März 2009". Und genau um diese Implikation von der Unkorreliertheit auf die Unabhängigkeit geht es mir eigentlich: Die Unkorreliertheit, so liest man in zahlreichen Quellen, impliziere die Unabhänigkeit, aber das ist nicht korrekt. (z.B. in dem häufig in Wikipedia zitierten Nachschlagewerk "Statistik" von Hartung steht in der 14. Auflage auf Seite 546: "Wir haben aber gesehen, dass speziell zwei unkorrelierte normalverteilte Zufallsvariablen X und Y auch unabhängig sind." Falls ich was ganz falsch verstanden haben sollte, sorry, aber bis jetzt halte ich meine Fragen für sehr berechtigt. 9. März
Wieso ist die Aussage belanglos? Es ist eine spezielle Eigenschaft normalverteilter Zufallsvektoren, dass ihre Marginalverteilungen genau dann unabhängig sind, wenn sie unkorreliert sind, und das ist das Resultat eines mathematischen Satzes, keine bloße Trivialität. Hier im Artikel ist das auch korrekt dargestellt, erwähnenswert ist es natürlich ebenfalls, von daher wird mir nicht ganz klar, was du willst. (PS: Wenn du deine Beiträge auf Diskussionsseiten unterschreiben willst, einfach --~~~~ eintippen.) Grüße --Scherben 16:58, 9. Mär. 2009 (CET)Beantworten
Ich denke, wir stehen jetzt ganz kurz vor dem gemeinsamen Nenner. Genau diese Aussage: "Für einen 2-Vektor, dessen (beide) Marginalverteilungen jeweils normalverteilt und unkorreliert sind folgt Unabhängigkeit der beiden Komponenten" sehe ich aber durch mein eingangs erwähntes Beispiel widerlegt: Angenommen, wir haben eine ZV, die jeden Tag eine standardnormalverteilte Zufallszahl ausspuckt. Nun baue ich eine Zufallsvariable Y, die ebenfalls jeden Tag eine Zufallszahl ausspuckt: Y schaut sich das Ergebnis von X an und wirft eine Münze. Kommt Kopf, dann übernimmt Y den Wert von X und kommt Zahl, dann multipliziert Y den Wert von X mit -1. Der entstehende Vektor (X,Y) ist jetzt doch ein Gegenbeispiel, denn die Korrelation ist Null (Kor(X,Y)=Kor(X,-Y), also kann nur Kor(X,Y)=0). Ich glaube, dass die Aussage nur haltbar ist, wenn ich ziemlich viel über die gemeinsame Dichte voraussetze, nämlich dass sie von genau der Bauart mit dem ist. Sollte ich falsch liegen, sorry, aber wo ist dann der Haken an meinem Gegenbeispiel? --joe 17:35, 9. Mär. 2009
Natürlich ist die o. g. Aussage widerlegt, aber um sie geht es hier ja auch nicht. Hier geht es um mehrdimensionale Normalverteilungen, und für diese stimmt der Satz. Das, was du hier als (X,Y) konstruiert hast, ist keine zweidimensionale Normalverteilung, das sind nur solche mit der Dichte von oben. Du verstehst von daher alles richtig, hast wohl nur den falschen Begriff einer multivariaten Normalverteilung im Kopf... --Scherben 22:38, 9. Mär. 2009 (CET)Beantworten
Ok, dann ist der gemeinsame Nenner gefunden. Jetzt schlage ich aber vor, dass wir den Artikel an unsere Erkenntnisse anpassen und schreiben: Gegeben ist ein Vektor aus gemeinsam normalverteilten Zufallsvariablen mit dem Erwartungswertvektor und der Kovarianzmatrix mit Determinante , D.H die gemeinsame Dichtefunktion der Vektorkomponenten SEI gegeben durch ... Wie gesagt, in manchen Büchern wird dieser Satz verkürzt formuliert und damit falsch (Hartung usw.)--joe, 10. Mär. 2009
Erledigt, auch wenn es eher deine Erkenntnisse waren. :) --Scherben 08:58, 10. Mär. 2009 (CET)Beantworten
Sorry, aber ich finde jetzt, dass die Implikation "Unkorreliert impliziert Unabhängigkeit" furchtbar trivial, denn dann ist per Voraussetzung die Einheitmatrix und für den Nachweis der Unabhängigkeit ist jetzt nur noch die korrekte Anwendung der Rechenregeln für die Exponentialfunktion fällig (Unabhängigkeit heißt ja, dass die gemeinsame multivariate Dichte gleich dem Produkt der Einzeldichten ist). Also ich bleibe dabei: Die Implikation ist so trivial, dass man sie lieber nicht erwähnen sollte, weil die Gefahr von Missverständnissen doch sehr groß ist (siehe z.B. dein lieber Freund aus Dortmund, Herr Hartung...). Und was ist der Nutzen? Wie soll man jemals in einem praktischen Fall nachweisen können, dass die gemeinsame Dichte so aussieht, da muss man ja alles schon vorher im Griff haben, der Satz liefert dann keinen Erkenntnisgewinn!? --joe 08:52, 12. Mär. 2009 (CET)
Nichts da. Der Satz ist in der Statistik zentral, auch wenn er einfach zu beweisen ist. --Scherben 09:48, 12. Mär. 2009 (CET)Beantworten

Übertrag von Informationen aus dem Artikel Normalverteilung[Quelltext bearbeiten]

Ich habe Teile des Abschnitts "Mehrdimensionale Verallgemeinerung" des Artikels Normalverteilung hierhin kopiert, mit dem Ziel den Abschnitt in Normalverteilung später zu löschen. Siehe dazu auch die Diskussionseite von Normalverteilung. Es wurde auch vorgeschlagen, die Themen, die in Multivariate Verteilung zur mehrdimensionalen Normalverteilung enthalten sind, in einen eigenen Artikel auszulagern. Das kann jemand später erledigen. (Außerdem: die von mir eingefügten Stellen passen noch nicht so gut zusammen und müssen weiter bearbeitet werden.) -- zitiere_kinsey 15:11, 3. Nov. 2009 (CET)Beantworten

Weitere Diskussionsanregungen[Quelltext bearbeiten]

  • Im Artikel Zufallsvariable würde ich den Abschnitt über mehrdimensionale ZV ausbauen, inklusive Verweis auf Varianz, Kovarianz_(Stochastik) und Kovarianzmatrix. Dann kann man sich die hier angebenen Dinge sparen. Sie führen auch etwas in die Irre, da die gemeinsame Verteilung gerade nicht bestimmt wird durch solche Kenngrößen.
  • Die Konvention, dass mehrdimensionale Zufallsvariablen klein und unterstrichen geschrieben werden, halte ich für überflüssig und entspricht auch nicht der Verwendung im Artikel Zufallsvariable.
  • Da man bei der mehrdimensionalen Normalverteilung mit singulärer Kovarianzmatrix keine Dichte hat, muss der Abschnitt anders formuliert werden. Entweder lässt man solche Fälle nicht zu und nimmt die Dichte als Definition, oder man muss die Definition anders machen, z.B. "jede Linearkombination der Komponenten ist normalverteilt", siehe die englische Fassung des Artikels über die mehrdimensionalen Normalverteilung.
  • Es wurde vorgeschlagen, den Abschnitt über die mehrdimensionalen Normalverteilung zu einem eigenen Artikel zu machen.
  • Das Beispiel Apfelbaumplantage: hier fände ich es angebracht, auf den Unterschied von Modell und zu modellierender Realität hinzuweisen. Beispielsweise sind Größe und Ertrag stetige Werte, während Anzahl der Blätter erstmal ein diskretes Merkmal ist. Bei der Anzahl der Blätter soll der Mittelwert 20000 sein und die Standardabweichung 15000. Da die Blattanzahl nicht negativ werden kann, müsste man also eine "abgeschnittene Normalverteilung" postulieren. Das lässt sich natürlich durch Änderung der Parameter beheben, macht aber klar, warum ich hier Vorbehalte habe.
  • Die Fortführung des Beispiels wäre wohl besser in einem Artikel aufgehoben, in dem auch auf Schätzer eingegangen wird, da hier ja diese Schätzer ausgerechnet werden.

-- zitiere_kinsey 20:51, 12. Nov. 2009 (CET)Beantworten

Auslagerung und Überarbeitung[Quelltext bearbeiten]

Einige der Vorschläge habe ich durchgeführt. Die gelöschten Abschnitte über Varianz, Kovarianz_(Stochastik) und Kovarianzmatrix kann ich in Zufallsvariable überarbeiten und vertiefen. -- KurtSchwitters 11:42, 19. Nov. 2009 (CET)Beantworten

Also ich kann nicht nachvollziehen, warum dieser Artikel so zerrupft wurde. Vor allem die vektoriale Darstellung ist viel klarer und leichter lesbarer. Gerade Erwartungswertvektor und Kovarianzmatrix gehören eigentlich hier rein. Das jetzt in x andere Artikelchen umzulagern ist kontraproduktiv, vor allem weil da die Symbolik dann wieder abweicht. -- Philipendula 13:25, 19. Nov. 2009 (CET)Beantworten
Ich schlage vor, die Verwendung der Schreibweise mit Unterstrich auf statistische Artikel zu beschränken, z.B. wie in Hauptkomponentenanalyse. Wenn es um Begriffe der Wahrscheinlichkeitstheorie geht, würde ich gerne X für Zufallsvariablen nehmen (oder einen anderen Großbuchstaben ohne Unterstrich), egal, ob sie reellwertig sind oder in einen anderen Raum gehen. Im mehrdimensionalen Fall kann man dann schreiben, und wenn es um die statistische Analyse mehrdimensionaler Daten geht, kann man übergehen zu . -- zitiere_kinsey 17:38, 22. Nov. 2009 (CET)Beantworten

Bivariate Verteilung[Quelltext bearbeiten]

Gerade wenig Zeit, bin nur eben drüber gestolpert. Sollte nicht der Artikel Bivariate_Verteilung besser in einen Redirect hierher umgewandelt werden? Immerhin gibt es hier schon einen Abschnitt "Zweidimensionale Verteilungsfunktion". Und viel nützliches erfährt man in dem Artikel bisher leider auch nicht. Grüße, MM-Stat 11:22, 16. Feb. 2010 (CET)Beantworten

Ja. -- Philipendula 13:44, 16. Feb. 2010 (CET)Beantworten
Ich bin auch dafür. --Beben 22:18, 16. Feb. 2010 (CET)Beantworten
Ich habs mal gemacht, bei soviel Konsens hier.--MK P:W 00:52, 17. Feb. 2010 (CET)Beantworten
Übrigens danke dafür. :) -- MM-Stat 12:47, 26. Feb. 2010 (CET)Beantworten

Einführendes Beispiel[Quelltext bearbeiten]

Ich verstehe die folgende Aussage nicht bzw. halte sie für falsch:

Diese beiden Experimente ergeben nun zweidimensionale diskrete Zufallsvariablen Z1 und Z2, welche die gleichen Randverteilungen haben (jede Zahl von 1 bis 6 ist bei beiden Experimenten in beiden Ziehungen gleichwahrscheinlich und tritt mit Wahrscheinlichkeit 1/6 auf).

Inwiefern ist im zweiten Experiment die Ziehung der Zahlen 1 bis 6 in der zweiten Ziehung (ohne Zurücklegen) immer noch gleichwahrscheinlich 1/6? Weiter oben wird die grundlegende Eigenschaft von Experiment 2 beschrieben, dass es in der zweiten Ziehung nicht möglich ist, dieselbe Zahl noch einmal zu ziehen, somit p(x2|x1) = 0. -- DeepThought2 10:51, 30. Jul. 2010 (CEST)Beantworten

Hallo, bei der zweiten Ziehung bekommt man in den fünf Fällen (2,1), (3,1), (4,1), (5,1), (6,1) eine 1. Insgesamt gibt es 30 gleichwahrscheinliche Möglichkeiten. Die Wahrscheinlichkeit für eine 1 bei der zweiten Ziehung ist also 5/30 = 1/6. Dich verwirrt nur, dass die 6 möglichen Werte nicht gleichverteilt sind, wenn das Ergebnis der ersten Ziehung bekannt ist. --KurtSchwitters 11:33, 13. Aug. 2010 (CEST)Beantworten

Bedingt[Quelltext bearbeiten]

Die Schreibweise

für dei bedingte Dichte ist ziemlich merkwürdig und unlogisch. Es sieht aus als gäbe es eine Zufallsvariable . Im Artikel Bedingte Wahrscheinlichkeit findet man sie auch nicht; da wird, in Analogie zum diskreten Fall, geschrieben:

Es handelt sich um die Dichte von , aber bedingt durch das Ereignis . Madyno (Diskussion) 12:23, 19. Apr. 2019 (CEST)Beantworten

Es existieren in der Literatur unterschiedliche Schreibweisen und diese auch. Grüße.--Jonski (Diskussion) 12:27, 19. Apr. 2019 (CEST)Beantworten