Diskussion:Bayessche Statistik

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Unverständlich[Quelltext bearbeiten]

Der Artikel ist recht schwierig zu verstehen, für jemanden wie mich, der absolut keine Ahnung von Statistik hat.Ich habe durch den Artikel Feinabstimmung der Naturkonstanten mehr über die Bayessche Statistik erfahren, als in dem Artikel selbst; wäre toll wenn das jemand verbessern könnte. Kann es leider selbst nicht machen, weil ich viel über garnichts weiß.=( (nicht signierter Beitrag von 80.138.185.143 (Diskussion) 21:25, 22. Nov. 2007 (CET))[Beantworten]

Hypothesentest vs. Bayes[Quelltext bearbeiten]

Achtung: Hier wird wieder einmal nicht der Unterschied zwischen Hypothesentest, also p(D|H) und der Bayes-Statistik, also p(H|D) gemacht. Schwer verbesserungsbedürftig. 217.232.69.234 15:17, 6. Dez. 2009 (CET)[Beantworten]

Wer schon soviel weiß oder zu wissen vorgibt, darf dann auch mal gern das eine oder andere selbst verbessern. Einfach mal vorn anfangen! ...

Stammesgeschichte indoeuropäische Sprachen[Quelltext bearbeiten]

Nachdem die Gruppe um Bouckaert die Stammesgeschichte der indoeuropäischen Sprachen mit Hilfe der Methoden der Bayesschen Statistik untersucht hat und damit jetzt an die Öffentlichkeit getreten ist, wäre es schön, wenn die deutschsprachigen Wikipedia-Artikel zu dem Themenfeld klar strukturiert, leicht verständlich und ohne größere Redundanzen wären. Fragt sich natürlich, ob die Personaldecke dafür ausreicht. Notfalls muss man sich halt auf der Homepage von Bouckaert ode in der englischen WP kundig machen und /oder sich den Artikel (Science) besorgen. Das wollte ich mir eigentlich ersparen. --13Peewit (Diskussion) 07:45, 26. Aug. 2012 (CEST)[Beantworten]

Halb richtig. Es ist keine "Gruppe um Bouckaert", sondern um Gray und Atkinson. Bouckaert steht an erster Stelle, weil er der Hauptautor des Programms zur Berechnung der geographischen Diffusion ist, was wiederum noch komplizierter ist als die zugrundeliegende Bayes-Prozedur. Zu letzterer sind im Moment die meisten Statistik-Schinken in irgendeiner Uni-Bibliothek noch besser als dieser wiki-Artikel, vor allem vom Sprachlichen und Begrifflichen her. Das soll nicht das Verdienst schmälern, erst einmal angefangen zu haben!!! Aber es ist noch viel zu tun. Z.B. trifft der Absatz unter 1. so, wie beschrieben, sicher nicht die Wahrheit. Wie so viele Mathematiker, ist hier jemand der Formeln wesentlich mächtiger als der deutschen Sprache, d.h. das Gemeinte wird unvollständig oder falsch ausgedrückt. Dann, in den Erläuterungen zur a-posteriori Wahrscheinlichkeit: Eine "Aussage mit Informationen" ist eine Tautologie und sonst gar nichts.
Zu dem Bouckaert et al.-Artikel: Da hilft auch ein noch so guter Bayes-Artikel in wiki nicht weiter. Ich bin mittlerweile (unter SEHR entgegenkommender Mithilfe der Autoren des verwendeten Programms) bei der geschätzt zweihundertfünfzigsten Berechnung von kleinen und größeren Variationen dieses Ansatzes, deren sechs Seiten lange (!) Parametereingaben bei weitem nicht ausreichend beschrieben und klar sind. Mit durchaus nachvollziehbaren Parameteränderungen kann ich dabei Entstehungszeiten (root heights] von 2'800 bis ca. 25'000 vC "hervorzaubern", als auch nahezu jede beliebige Baumstruktur. Es hat auch keinen Sinn, hier ohne monatelanges Studium Einzelfragen dazu zu stellen. Es gibt eine eigene wiki-Diskussionsgruppe für Spezialisten. HJJHolm (Diskussion) 08:15, 6. Sep. 2013 (CEST)[Beantworten]

Angesichts der superaktuellen Quellenlage des entsprechenden englischen Artikels fragt man sich, wie rückständig eigentlich deutsche Unis hier sind, oder wie schreibfaul die deutschen Mathematiker. HJJHolm (Diskussion) 12:19, 28. Okt. 2013 (CET)[Beantworten]

Meinst du, dass es kaum deutschsprachige Literatur zum Thema gibt? Das stimmt wohl, aber eher nicht, weil man an deutschen Uni "faul" oder "rückständig" ist, sondern weil man so "fortschrittlich" ist und auf Englisch veröffentlicht. Ich schau man demnächst, wie man den Literaturabschnitt ausbauen kann. -- HilberTraum (Diskussion) 08:06, 29. Okt. 2013 (CET)[Beantworten]
Es scheint zumindest so, dass der Bayes'sche Ansatz eher weniger von deutschen Autoren gepflegt wird, wie ein Blick in google-Scholar lehrt.HJJHolm (Diskussion) 09:21, 5. Jul. 2014 (CEST)[Beantworten]

Nicht überzeugend[Quelltext bearbeiten]

Es muss hier erlaubt sein, auch mal den Verstand einzuschalten: Als Beispiel für eine Bayesche Anwendung wird in Lehrbüchern häufig die Situation etwa mehrerer Ersatzteillieferanten mit bekannten Fehlerhäufigkeiten dargestellt. Es wird dann wunderbar mit Hilfe der Bayesschen Formel berechnet, dass ein (mathematikerüblich stillschweigend, aber wirklichkeitsfremd als ungekennzeichnet anzunehmendes) fehlerhaftes Ersatzteil mit soundsovieler Wahrscheinlichkeit von einer bestimmte Firma stamme. Es wird aber der Realitätsbezug dieser Rechnung verschwiegen, nämlich, dass diese Wahrscheinlichkeit erstens für JEDES fehlerhafte Ersatzteil zutrifft, und zweitens in keiner Weise eine Regressforderung gegenüber dieser "wahrscheinlichen" Lieferfirma" begründen kann. Und so bleibt die berechtigte Frage, was das Ganze eigentlich soll, denn welche Firma prozentual den meisten Schrott liefert, war ja bereits die Eingabe, mit dem tollen Terminus "prior probability". Von derartiger Logik ist übrigens der englische Artikel auch völlig frei. HJJHolm (Diskussion) 16:00, 22. Jun. 2014 (CEST)[Beantworten]

Gilt diese Kritik nun dem Artikel oder Bayesianischer Statistik? Da der Artikel das benannte Beispiel nicht bringt (es ist mir bisher auch nicht begegnet) ist das wohl doch eher Fehl am Platz hier. Ansonsten bleibt, dass Bayesianische Statistik eine Platz in der Statistik hat (mit handfesten Vorteilen). Insofern ist an der Relevanz des Artikels nichts auszusetzen.--Rbb (Diskussion) 10:36, 5. Jul. 2014 (CEST)[Beantworten]

Diese anonyme ex-cathedra-Bemerkung geht weiträumig am Einschalten des Verstandes vorbei. Niemand hat die "Relevanz des Artikels" an sich beanstandet. Aber es muss deutlich gemacht werden, wo dieser ach so elegante Ansatz Sinn macht, also wo die "handfesten Vorteile" liegen. Z. B. gibt es zu dem weiteren Standardbeispiel, nämlich zur Aussagekraft von medizinischen Tests, didaktisch sehr viel überzeugendere Ansätze im Internet. HJJHolm (Diskussion) 09:13, 5. Jul. 2014 (CEST)[Beantworten]

Sorry, Beitrag war von mir, Signatur habe ich gerade unter meinen Beitrag nachgetragen. Der Artikel koennte sicherlich besser sein und ich plane daran zu arbeiten. Der Artikel wird dem Bayesianischen Ansatz in sofern nicht gerecht, dass er kaum das Arbeiten mit Wahrscheinlichkeitsverteilungen illustriert und das Hypothesentest-Beispiel ist schon sehr Grenzwertig weil es sich schon irgendwo zwischen Bayesscher Statistik und ad-hoc Methoden bewegt. Man kann eben nicht Bayesianische Statistik ohne Wahrscheinlichkeitsverteilungen erlaeutern (ansonsten erklaert man einfach Bayesianische Wahrscheinlichkeitsrechnung). --Rbb (Diskussion) 10:36, 5. Jul. 2014 (CEST)[Beantworten]
Der Hauptvorteil dürfte sein, dass man sehr flexibel bereits bestehendes Vorwissen über eine zu schätzende oder zu testende Größe zusätzlich zu den Beobachtungsdaten berücksichtigen kann. So kann man beispielsweise bei unterschiedlichen Experimenten nach und nach immer mehr Information über die Größe sammeln und die Ergebnisse werden immer genauer. Dieser Hauptvorteil ist aber auch der Hauptnachteil, denn man braucht immer A-priori-Annahmen und wenn man nicht aufpasst, kann das schnell willkürlich/subjektiv werden oder zumindest so wirken. -- HilberTraum (Diskussion) 20:16, 5. Jul. 2014 (CEST)[Beantworten]
Entsprechend versuche ich gerade unter Benutzer:Rbb/Bayesianische_Statistik den Artikel umzuschreiben, dass er den sequentiellen Aspekt und die Prioren anschaulich macht, gerade schreibe ich an der Bayesstatistik beim Muenzwurf, als zweites Beispiel schwebt mir eine bayesianische lineare Regression vor, bei der man Standardabweichungen der Koeffizienten erhaelt. Imho fehlt dem Artikel auch eine Behandlung des Themas subjektive und objektive Prioren bzw. konjugierte Prioren und eine Illustration von Unterschieden zu ad-hoc Methoden wie Maximum Likelihood. Als Nachteil wuerde ich Prioren nicht sehen, allenfalls wenn sie komplett falsch gewaehlt sind. Im Zweifel kann man einen breit verteilten Prior waehlen und erhaelt so eine Unsicherheit im Ergebnis und hat damit ein Mass fuer die Vertrauenswuerdigkeit des Erwartungswerts des Posteriors. --Rbb (Diskussion) 08:40, 6. Jul. 2014 (CEST)[Beantworten]

Der Artikel macht Riesenfortschritte. Die jetzt eingeführte Übersetzung "Modellwahrscheinlichkeit" für likelihood finde ich sehr treffend! HJJHolm (Diskussion) 18:17, 12. Jul. 2014 (CEST)[Beantworten]

Ich möchte betonen, dass das keine Wortschöpfung aus meiner Feder ist und ich im moment, wo dieser Begriff nochmal aufgegriffen wurde, ich ihn fast schon wieder streichen möchte. Die Likelihood ist eher eine Datenwahrscheinlichkeit oder eine Daten-im-Modellvergleichs-Wahrscheinlichkeit. Es gibt auch noch die Übersetzung "Mutmaßlichkeit", wobei Likelihood in der Fachliteratur so gut wie nie übersetzt zu finden ist. Es ist ein anerkannter Fachbegriff. --Rbb (Diskussion) 18:55, 12. Jul. 2014 (CEST)[Beantworten]
Richtig, aber nur, weil die Engländer die Möglichkeit haben, auf germanische UND romanische Wurzeln zurückzugreifen, auch, wenn diese in der Alltagssprache das Gleiche bedeuten. Eine treffende Eindeutschung bzw. Übersetzung in die Muttersprache ist für ein gutes Verständnis oder "Klar machen" extrem hilfreich, nicht nur für Anfänger. Dass die "Modellwahrscheinlichkeit" auf die Daten zu beziehen ist, ist zwar richtig, ergibt sich ja aus der Formel. HJJHolm (Diskussion) 10:44, 13. Jul. 2014 (CEST)[Beantworten]
Insbesondere spricht für Likelihood, das sämtliche deutschsprachige Literatur den Begriff Likelihood verwendet. Auch durchaus alte Werke. An Likelihood als Primärbezeichnung führt kein Weg vorbei, alle anderen Bezeichnungen können lediglich als Gedankenstütze dienen. Wer Likelihood als "Mutmaßlichkeit" oder "Modellwahrscheinlichkeit" bezeichnet wird nicht verstanden werden. Insbesondere sollte man einer Verwechslung von Posterior und Likelihood durch nicht eindeutige Bezeichnungen keinen Vorschub leisten --Rbb (Diskussion) 23:25, 14. Jul. 2014 (CEST)[Beantworten]

Unverständliche Sätze[Quelltext bearbeiten]

@Rbb: Ich wollte versuchen, ein paar sprachliche Schnitzer in Ordnung zu bringen, bei einigen Sätzen ist allerdings nicht klar, war sie überhaupt bedeuten sollen.

  • Was soll dieser Satz heißen: „ Die folgende Abbildung zeigt, wie aus einem Prior mit Vorwissen … mit binomialverteilten Messdaten wird nun die Verteilung … genauer bestimmt …“ – abgesehen davon, dass das aus grammatikalischer Sicht kein Satz ist?
  • Was ist der Sinn von „Die Likelihood.“ im dritten Aufzählungspunkt im ersten Abschnitt „Struktur Bayesianischer Verfahren“, eingefügt mit diesem Edit?

Danke, Troubled @sset   Work    Talk    Mail   11:29, 13. Jul. 2014 (CEST)[Beantworten]

Also
Vielleicht sehe ich den Wald vor lauter Bäumen nicht, aber das ist grammatikalisch ein Satz und beschreibt die Abbildung. Mir ist nicht klar was da unverständlich sein soll.
„Die Likelihood.“ soll den Bezug zwischen beschreibendem Text und Term im Satz von Bayes schaffen. Ich hatte den Begriff Modellwahrscheinlichkeit zur Erläuterung verwendet (hatte ich in Literatur gefunden) aber dann wieder entfernt weil er imho missverständlich ist. --Rbb (Diskussion) 23:17, 14. Jul. 2014 (CEST)[Beantworten]
Also:
„Die folgende Abbildung zeigt, …“ ist ein Hauptsatz, und das „wie …“ ist ein abhängiger Nebensatz, in dem das Verb ans (Neben-)Satzende nachgeklappt werden müsste. So ergibt das keinen Sinn und ist grammatikalisch kein korrekter Satz.
  • A: „Ich weiß, wie ein Satz korrekt gebildet wird.“
  • B: „Ich weiß, wie ein Satz gebildet wird korrekt.“
Dein Satz oben entspricht Variante B. Wenn du das für richtig hältst und A für falsch, kann ich dir nicht helfen.
Der zweite Satz hieß bei dir:
„Likelihood, auch inverse Wahrsch. oder "Mutmaßlichkeit", die Wahrscheinlichkeitsverteilung für die Messdaten D, wenn der Modellparameter M gegeben ist. Die Likelihood.“
Meine Frage war, was die beiden, von dir eigens in einem weiteren Edit ergänzten Wörter „Die Likelihood.“ am Ende hier für einen Sinn haben sollen. Dass es um die Likelihood geht, steht doch schon im ersten Wort. Der Sinn dieser Ergänzung zwecks erneuter Anführung von Likelihood ist mir auch nach deiner vorstehenden Erklärung nicht ersichtlich, ich nehme aber zur Kenntnis, dass du auch nach nochmaliger Betrachtung deines eigenen Satzes dies immer noch für sinnvoll und korrekt hältst.
Ich bedaure, feststellen zu müssen, dass wir offensichtlich unterschiedliche Vorstellungen von korrektem Deutsch und sinnvollen Beschreibungen haben. Da kann man wohl nichts machen.
Troubled @sset   Work    Talk    Mail   12:09, 15. Jul. 2014 (CEST)[Beantworten]
Ich sehe mittlerweile welche Stelle du mit "Die Likelihood" meinst (hatte nicht weit genug runtergescrollt im Diff). Überflüssige 2 Worte die man imho direkt streichen kann statt die auf der Diskussionsseite breit zu treten. Bei der Betrachtung des Satzes mit Fehler in der Satzstellung war der betreffende Satz bereits in der Seite geändert und daher konnte ich keinen Satzstellungsfehler mehr erkennen. Kein Grund für deinen äzenden, sarkastischem Unterton. --Rbb (Diskussion) 23:14, 15. Jul. 2014 (CEST)[Beantworten]
Ich habe diese Wörter aus dem Grund nicht direkt „gestrichen“, weil du sie in einem eigenen Edit extra dazugeschrieben hast. Ich habe daher nicht einfach revertiert, sondern hier auf der Disk vorher nachgefragt, wie es gute Praxis ist. Dies als „breittreten“ zu diffamieren, ist völlig unangemessen. Und den ersten Satz hatte ich in der Version vom Zeitpunkt meines Posts sogar hier wiedergegeben. Zu sagen, du hättest in einer mittlerweise korrigierten Version im Artikel keinen Fehler mehr erkennen können, berechtigt dich nicht, meine Frage als von vornherein unberechtigt abzutun.
Wenn du geschrieben hättest, „du hast recht, der Satz war falsch, wurde aber mittlerweile im Artikel korrigiert“ und „du hast recht, die beiden Wörter gehören da nicht hin, ich habe sie im Artikel wieder entfernt“, wäre diese Diskussion gar nicht erst entstanden. Dein überhebliches und in der Sache nicht gerechtfertigtes Beharren darauf, alles sei richtig, hat mich überhaupt erst zu meiner Antwort veranlasst. Mein „äzender (sic) Unterton“ – wenn es ihn denn geben sollte – war wohl eine unterbewusste Reaktion auf die Arroganz, mit der du mich hier abzubügeln versucht hast.
In Zukunft werde ich deine Edits einfach ignorieren, ohne Fehler hier „breitzutreten“. So wichtig ist mir der Artikel jetzt auch wieder nicht, dass ich nicht mit den resultierenden Unzulänglichkeiten leben könnte.
Troubled @sset   Work    Talk    Mail   10:04, 16. Jul. 2014 (CEST)[Beantworten]
User:Troubled asset, entschuldige bitte. ich habe dich total falsch verstanden und meine Reaktion war falsch. Vielen Dank für deine Korrekturen. --Rbb (Diskussion) 21:14, 16. Jul. 2014 (CEST)[Beantworten]

Meine Bearbeitung[Quelltext bearbeiten]

@HilberTraum: …hat sich, da ich fast eine Stunde an dem Artikel saß, zeitlich mit Deiner überschnitten. Ich habe versucht, nachträglich alle Deine Änderungen mit einzubringen. Da es aber eine ganze Menge waren, kann es sein, dass ich etwas übersehen habe. — ToshikiDisku 17:21, 13. Jul. 2014 (CEST)[Beantworten]

Zum Einleitungssatz[Quelltext bearbeiten]

Ich tue mich schwer mit der Bezeichnung "modern" i. B. auf die Bayessche Statistik. Die klassischen Statistiker sind Pascal, Moivre, Bernoulli, Bayes bis Gauß. Gauß war so gesehen der "jüngste". Schwerpunkte sind seltene Ereignisse, etwa in der Medizin seltene Krankheiten. --Gaschroeder 18:24, 28. Apr. 2015 (CEST)[Beantworten]

Schwerpunkt von was? Ja, "modern" würde ich dort auch nicht schreiben. --mfb (Diskussion) 21:59, 28. Apr. 2015 (CEST)[Beantworten]

Weitere Arbeiten am Artikel[Quelltext bearbeiten]

Ich wollte mal ein paar Gedanken zum Artikel zur Diskussion stellen bevor ich zu einer Tag schreite.

  • Im Beispiel mit Laplace's Anwendung des Bayesschen Satzes
  • Das französische Zitat halte ich für überflüssig fürs Verständnis. Der geneigte Leser kann es in der Publikation nachschlagen (oder man könnte es zu wiki quotes verschieben)
  • Was ich im Artikel noch gerne sehen würde
  • Aspekte der Prior-Wahl (insbesondere die Ansätze die nicht auf konjugierten Prioren beruhen).
  • graphische Modelle (Faktor Graphen, etc.)
  • Illustration komplexerer Modelle bzw. Modellierung durch Software wie Stan, PyMC. Ich denke es wäre ein Beispiel gut, an dem man zeigen kann, dass manchmal gesampelt werden muss.
  • Ein Beispiel mit linearer Regression mit Bayesschem Ansatz in etwa der Ausführlichkeit wie das binomiale Beispiel. Damit könnte man einen weiteren konjugierten Prior illustrieren und ich hätte auch schon schöne Plots im Auge mit denen man die "Verschmiertheit" der Schätzung schön illustrieren kann.
  • Kurze Abgrenzung von nicht-bayesianischen Verfahren, also wo liegen die Unterschiede, wo konvergieren die Verfahren, warum sind ML und Bayessche Ansätze im Limit of konvergent?

Im Grunde könnte man auch Teile aus dem Abschnitt über Bayessche Statistik in Satz von Bayes hierherverschieben und einpflegen (also die hier fehlenden Aspekte einbringen und anschaulicher Formulieren).

--Rbb (Diskussion) 23:52, 14. Jul. 2014 (CEST)[Beantworten]

Lasst doch bitte den Hinweis auf "Vernunft" draußen. Nochmal wiedeer das Beispiel aus dem Mathe-Duden, in dem einige Zulieferfirmen mit bekannten Fehlerquoten und Lieferanteilen aufgeführt werden. Aus diesen a-priori- Daten wird dann mit der bayesschen Formel berechnet, dass man mit der höchsten PP eine der Lieferfirmen als Ursprung für ein x-beliebiges fehlerhaftes Zulieferteil bestimmen kann. Das hat nun absolut NICHTS mit Vernunft zu tun. Es reicht auch nicht als Beweis aus, diese Firma als Zulieferer dieses Stückes zu beschuldigen. Es könnte mit geringerer Wahrscheinlichkeit auch von jeder der anderen Firmen stammen. Es könnte sogar die Firma mit den geringsten Fehlerquoten treffen, wenn diese einen entsprchend hohen Lieferanteil hat. Was soll das Ganze also??? HJJHolm (Diskussion) 17:42, 9. Mär. 2015 (CET)[Beantworten]

Was hat der Diskussionsbeitrag mit dem Artikel zu tun? --mfb (Diskussion) 00:37, 10. Mär. 2015 (CET)[Beantworten]

Bayessch vs Bayesianisch[Quelltext bearbeiten]

Wie in diesem Diff zu sehen https://de.wikipedia.org/w/index.php?title=Bayessche_Statistik&diff=prev&oldid=148207038 wurden alle Verwendungen von "bayesianisch" und anderer Formen die auf -ian gebildet sind durch "bayessch" ersetzt. Die Intention ist wohl klar, vermutlich sollten von "bayesian" entlehnte Formen des Adjektivs durch im Deutschen gebildete Adjektive ("bayessch") ersetzt werden. Mein Problem damit: Meiner Erfahrung nach wird im deutsprachigen Fachumfeld überwiegend "bayesianisch" verwendet.

Siehe auch google ngrams: https://books.google.com/ngrams/graph?content=bayesianisch%2Cbayessch&year_start=1800&year_end=2000&corpus=20&smoothing=10&share=&direct_url=t1%3B%2Cbayesianisch%3B%2Cc0 bzw. häufigkeiten bei Google Suchen.

Jedenfalls finde ich es nicht angebracht über den Wikipedia-Artikel zum Thema hier den Sprachgebrauch zu lenken. --Rbb (Diskussion) 21:23, 1. Jan. 2016 (CET)[Beantworten]

Notation und anderes[Quelltext bearbeiten]

Ich bin über den Artikel etwas verwirrt. Die Notation mit ist m.E. völlig unüblich und auch sollte statt dem Satz von Bayes für Wahrscheinlichkeiten hier der Satz von Bayes für Dichten dargestellt werden. Auch eine Herleitung des Satzes von Bayes für Dichten fehlt.--Jonski (Diskussion) 02:22, 13. Jan. 2019 (CET)[Beantworten]

Likelihood, die Wahrscheinlichkeitsverteilung für die Messdaten wenn der Modellparameter gegeben ist[Quelltext bearbeiten]

M.E. müsste es genau anders herum lauten: Eine Funktion des unbekannten Parameters, wenn die Daten gegeben sind.--Jonski (Diskussion) 18:07, 31. Mai 2019 (CEST)[Beantworten]