Diskussion:Methode der kleinsten Quadrate/Archiv/2008

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Einleitung 2

Ich finde die Einleitung nicht unbedingt optimal, sie hat mich selbst vor ein paar Jahren (mit Stand Mathematik-Leistungskurs, also meiner Meinung nach Zielgruppe) vom Artikel abgeschreckt. Hier mal ein (sicher auch nicht optimaler) Alternativvorschlag:

"Die Methode der kleinsten Quadrate (bezeichnender auch: der kleinsten Fehlerquadrate; englisch: Least Squares Method) ist das mathematische Standardverfahren zur Ausgleichungsrechnung. Bei der Ausgleichsrechnung soll für eine Menge von Datenpunkten, beispielsweise physikalischen Messwerten oder wirtschaftlichen Größen, eine möglichst gut passende Funktion gefunden werden. Eine Möglichkeit dieses Ziel zu erreichen ist eine Funktion mit freien Parametern vorzugeben und die Paramter an die Daten anzupassen. Durch die Methode der kleinsten Quadrate können die Paramter so bestimmt werden, dass der Abstand zwischen den Punkten und der Funktion minimiert wird.

Bei dieser Methode wird ein bestimmter, namensgebender Abstand minimiert, die Summe der quadratischen Abweichungen der Funktion von den gegebenen Punkten. Das heißt in der Grafik rechts, dass die zur y-Achse parallelen Abstände (die grünen Pfeile) der Punkte von der Funktion getrennt berechnet, quadriert und dann zum Gesamtabstand addiert werden.

Die Berechnung der Parameter erfolgt meist numerisch mit Hilfe eines Computers. Die Methode dient nur zur Berechnung der Parameter, eine passende Funktion muss durch andere Überlegungen gefunden werden.

In der Stochastik wird..."

Eine weitere sinnvolle Ergänzung wäre für mich ein konkretes Beispiel (z.B. Strecke/Geschwindigkeit aus Messpunkten) ganz am Anfang. --G 19:46, 7. Sep. 2008 (CEST)

Das prinzipielle Problem dieses Lemmas und auch Deiner Umformulierung ist, dass hier eigentlich zwei verschiedene Sachen vermengt werden: 1. Die Definition einer Fehler-/Gütefunktion, hier in Form der Fehlerquadratsumme; 2. das Verfahren, die Ausgleichung durch Minimierung dieser Fehlerfunktion durchzuführen. Wie gesagt, die Fehlerquadratsumme ist nur eine mögliche Definition von mehreren (Alternative wäre z. B. Absolutbetragssumme, die wäre aber nicht differenzierbar). Und das Verfahren, wie ich meine Parameter optimiere, ist eigentlich ein allgemeines Problem der nichtlinearen Optimierung mit jeder Menge zur Verfügung stehender Verfahren, nicht nur dem linearen, das hier verwendet wird. Deswegen kribbelt es bei mir immer etwas angesichts der "Methode" im Lemma, wo es eigentlich nur um die Definition der Fehlerfunktion gehen sollte, also um ein Teilproblem der Optimierung. --PeterFrankfurt 02:20, 9. Sep. 2008 (CEST)
Mir ging es bei der Änderung weniger um den Inhalt als um eine einfachere Verständlichkeit. Ich war der Meinung der Name bezeichnet die Fehlerdef. + die Lösung mittels Normalgleichung, hatte mich da leider nicht informiert weil ich inhaltlich eigentlich nichts ändern wollte. Hier ein neuer Vorschlag:
"Die Methode der kleinsten Quadrate (bezeichnender auch: der kleinsten Fehlerquadrate; englisch: Least Squares Method) ist das mathematische Standardverfahren zur Ausgleichungsrechnung. Bei der Ausgleichsrechnung soll für eine Menge von Datenpunkten, beispielsweise physikalischen Messwerten oder wirtschaftlichen Größen, eine möglichst gut passende Funktion gefunden werden. Eine Möglichkeit dieses Ziel zu erreichen ist eine Funktion mit freien Parametern vorzugeben und die Parameter an die Daten anzupassen. Die Parameter werden dann so bestimmt, dass der Abstand zwischen den Punkten und der Funktion minimiert wird, das entspricht dem finden einer Näherungslösung für ein überbestimmtes Gleichungssystems.
Bei der Methode der kleinsten Quadrate wird ein bestimmter, namensgebender Abstand minimiert, die Summe der quadratischen Abweichungen der Funktion von den gegebenen Punkten. Das heißt in der Grafik rechts, dass die zur y-Achse parallelen Abstände (die grünen Pfeile) der Punkte von der Funktion getrennt berechnet, quadriert und dann zum Gesamtabstand addiert werden.
Die Methode gibt nur an, welche Bedingung (eben die Minimierung der quadratischen Abweichungen) die berechneten Parameter erfüllen müssen. Eine passende Funktion mit Parametern muss durch andere Überlegungen gefunden werden. Zur wirklichen Berechnung der Parameter stehen dann verschiedene Verfahren, wie die oft mit der Methode assoziierte Normalgleichung zur Auswahl, sie erfolgt meist numerisch mit Hilfe eines Computers.
In der Stochastik wird..."--G 10:20, 9. Sep. 2008 (CEST)

Ja, finde ich schon besser. Um die Rechtschreibung kann ich mich dann ja kümmern. Jetzt muss nur noch der hiesige Hauptautor seinen Segen geben, der ist bei solchen Änderungen immer sehr kritisch. --PeterFrankfurt 02:26, 10. Sep. 2008 (CEST)

Hab noch die Links ergänzt.--G 16:58, 10. Sep. 2008 (CEST)

Also ich finde die neue Einleitung nicht so gut, aber ich stimme zu, dass die alte Einleitung verbessert werden kann. Vielleicht kannst Du ja Deine Kritik an der alten mal präziser fassen? Das Verfahren ist erstmal der Ansatz, den quadratischen Fehler zu minimieren. Gauß selbst hatte als er Ceres gefunden hatte, noch keinen wirkliche Idee von der Bestimmung der optimalen Lösung, er hat halt nach diesem Kriterium wild rumprobiert. Die modernen Lösungsverfahren sind also streng genommen kein Teil des Verfahrens, aber halt auch nicht mehr davon zu trennen. Normalgleichungen gibt es schließlich nur im linearen Fall, bei nichtlinearen tauchen die gar nicht auf. Aber man könnte Normalgleichungen und Gauß-Newton ruhig in der einleitung erwähnen. --P. Birken 22:15, 10. Sep. 2008 (CEST)
Ich finde die Einleitung für Laien zu schwer verständlich.--G 23:30, 10. Sep. 2008 (CEST)
Kannst Du das bitte konkreter machen? --P. Birken 00:03, 11. Sep. 2008 (CEST)

Wenn ich mich wieder einmischen darf: Mir schwebt eine deutliche Zweiteilung der Erläuterung des Prinzips vor, erstens definiert man ein Verfahren zur Berechnung des Fehlers (der Güte) einer Approximation (und wählt dann aus guten Gründen die Fehlerquadratsumme), zweitens minimiert man diesen Fehler dann methodisch, um eine möglichst optimale Approximation zu erhalten. Durch diese Aufspaltung in Einzelaussagen macht man die beiden Teile je für sich einfacher in Formulierung und Verständnis. Weiter sollte man die Teile nicht trennen, da sie sinnvollerweise wie im Rest des Artikels kombiniert werden. Aber zur systematischen und didaktischen Klarheit wäre dieser deutlicher gegliederte Ansatz vorteilhaft. Soll ich mal einen Formulierungsveruch hier starten? (Ich frag lieber vorher, anstatt mir womöglich unnötige Arbeit zu machen.) --PeterFrankfurt 01:54, 11. Sep. 2008 (CEST)

Ok, dann hier doch schon mein Ansatz. Zum Vergleich zuerst die derzeitige Formulierung:

Die Methode der kleinsten Quadrate (bezeichnender auch: der kleinsten Fehlerquadrate; englisch: Least Squares Method) ist das mathematische Standardverfahren zur Ausgleichungsrechnung. Es ist eine Wolke aus Datenpunkten gegeben, die physikalische Messwerte, wirtschaftliche Größen oder Ähnliches repräsentieren können. In diese Punktwolke soll eine möglichst genau passende, parameterabhängige Modellkurve gelegt werden. Dazu bestimmt man die Parameter dieser Kurve numerisch, indem die Summe der quadratischen Abweichungen der Kurve von den beobachteten Punkten minimiert wird.
In der Grafik sind die (t;y)-Paare als Datenpunkte zu erkennen. Es wurde hier eine logistische Funktion in die Punktwolke gelegt. Die Parameter dieser Funktion werden so bestimmt, dass die Quadratsumme der senkrechten Abweichungen e der Beobachtungen y von der Kurve minimiert wird.

Nach diesem Beginn würde ich gern ergänzen:

Die Methode der kleinsten Quadrate ist in zwei Schritte unterteilbar: Zunächst entscheidet man, wie man die Güte der Modellkurve sinnvoll berechnen sollte. Die Summe der Fehlerqudrate erweist sich bei näherer Untersuchung als besonders gut geeignet. Im zweiten Schritt wendet man ein – meist schrittweises („iteratives“) – Näherungsverfahren an, um die Parameter der Modellkurve so zu optimieren, dass der Fehlerwert der Abweichung von den Eingangs-Messwerten minimal wird. Bei linearen Zusammenhängen wie in den Beispielen unten kann das auf relativ leicht lösbare Gleichungen – oder die Lösung eines linearen Gleichungssystems – hinauslaufen, bei komplizierteren Zusammenhängen stehen andere Optimierungsverfahren zur Verfügung.

--PeterFrankfurt 02:08, 11. Sep. 2008 (CEST)

Ich finde dass Begriffe wie "Punktwolke", "Modellkurve" und "(t;y)-Paare" nicht in der Einleitung auftauchen, Begriffe wie "numerisch", "Ausgleichsrechnung" und "Quadratsumme der senkrechten Abweichungen" irgendwie erklärt werden sollten.--G 15:17, 11. Sep. 2008 (CEST)
@PeterFrankfurt: Tut mir leid, aber das ist so eine ziemlich schiefe Darstellung des Verfahrens. Die Festlegung des Modells ist nicht Teil der Methode der kleinsten Quadrate sondern ein Schritt davor. @G: Mh, wenn man alle Fachvokabeln weglässt bleibt vom Verfahren nichts mehr übrig. Meiner Meinung nach sollte eine Einleitung denen die nicht wissen worum es geht die grundsätzliche Einordnung ermöglichen und denen, die ungefähr wissen worum es geht, das schnelle Nachschlagen ermöglichen. Und ich denke das leistet sie. --P. Birken 20:00, 11. Sep. 2008 (CEST)
Aber ich finde keinen der Begriffe den ich weggelassen habe unverzichtbar, und im Artikel kann man das ganze dann exakt formulieren. Als ich vor 2 Jahren die Einleitung gelesen habe, habe ich auf jeden Fall nicht verstanden, um was es geht. Außerdem finde ich bei Wikipedia die Verständlichkeit wichtiger als immer 100% exakt zu sein.--G 20:51, 11. Sep. 2008 (CEST)
Ich denke halt nicht, dass der Artikel für die Leute an die er gerichtet ist, unverständlich ist. Wer mit Punktwolke und Modellkurve nichts anfangen kann, auch nicht in Kombination mit dem Bild, da weiß ich irgendwie auch nicht. Die t-y-Paare könnte man wohl aber rausnehmen. --P. Birken 22:01, 11. Sep. 2008 (CEST)
Ob man jetz Modellkurve oder Modellfunktion schreibt finde ich ziemlich egal. Und wenn man weiß um was es geht hört sich die Punktwolke lächerlich an, aber wenn nicht erwartet man hinter dem neuen Begriff alles mögliche. Ich spreche wie gesagt aus eigener Erfahrung und war damals ein mathematisch sicher überdurchschnittlicher Abiturient.--G 22:08, 11. Sep. 2008 (CEST)
Hab nochmal nachgedacht woran das liegen kann. Vermutlich ist die Grafik nicht besonders aussagekräftig und eine Kurvenschar, von denen eine die optimale Lösung ist, wäre sinnvoller? --P. Birken 22:20, 11. Sep. 2008 (CEST)
Das ist eine sehr gute Idee. Aber auch unbekannte Begriffe (auch wenn eigentlich nichts dahinter steckt) können es komplizierter machen und abschreckend wirken.--G 22:58, 11. Sep. 2008 (CEST)

Also die Formulierung mit der "logistischen Funktion" ist ja für einen Nicht-Stochastiker (wie mich) erstmal vollkommen unverständlich. In der Einleitung sollte man es nicht lebensnotwendig machen, einen zweiten Artikel zu verstehen, bevor man die Einleitung zu Ende studieren kann. Es ist wohl gemeint, dass für diese speziellen Daten so eine logistische Funktion die angemessene Modellfunktion ist? Das fehlt noch in der Formulierung. Das sieht für mich aber doch so aus, als ob diese Wahl der Modellfunktion mit zum ganzen Anpassungsverfahren gehört. --PeterFrankfurt 00:54, 12. Sep. 2008 (CEST)

Wie sieht es aus?-G 12:39, 16. Sep. 2008 (CEST)

Ich habe im Lauftext auch noch entsprechend ausführlicher nachformuliert. --PeterFrankfurt 01:24, 17. Sep. 2008 (CEST)

Hab gemeint ob noch jemand neue Vorschläge machen will.--G 21:29, 18. Sep. 2008 (CEST)

Ich hab Phili mal gefragt, ob sie ein neues Bild erstellt. --P. Birken 18:46, 19. Sep. 2008 (CEST)
Bitte verzeiht mir, wenn ich nicht die ganze Schriftrolle oben durchlesen mag. Was soll ich denn nu machen? Beispielsweise eine Gerade durch eine erkennbar nichtlineare Punktwolke legen? Gruß -- Philipendula 11:28, 21. Sep. 2008 (CEST)
Verstehe ich auch nicht so ganz. Wichtig ist doch nicht, was eine logistische Funktion ist, sondern was die Methode der kleinsten Quadrate ist. --Scherben 16:50, 21. Sep. 2008 (CEST)
Also Rücksprache mit P. ergab, dass wohl gemeint ist, zum Vergleich eine optimale Anpassung und eine weniger optimale zu erstellen. Damit man sieht, dass bei letzterer die Quadratsumme nicht minimal ist. -- Philipendula 17:11, 21. Sep. 2008 (CEST)

Und was ist mit dem Text?--G 17:49, 8. Okt. 2008 (CEST)

Ich halte ein neues Bild für ausreichend. --P. Birken 20:36, 13. Okt. 2008 (CEST)
Ich nicht.--G 15:15, 14. Okt. 2008 (CEST)
Ich finde die aktuelle Version völlig in Ordnung. Wer mit Punktwolken und Modellkurven nichts anfangen kann, hat eh den falschen Artikel angeklickt. --Scherben 18:49, 14. Okt. 2008 (CEST)
Uh, ich hatte die Grafiken vergessen *schwitz*... -- Philipendula 19:44, 14. Okt. 2008 (CEST)

"Ich finde die aktuelle Version völlig in Ordnung. Wer mit Punktwolken und Modellkurven nichts anfangen kann, hat eh den falschen Artikel angeklickt." Was ist denn das für ein Kommentar??? Ich finde die Grundlagen der Methode könnte man ohne besondere Kenntnisse verstehen, das sollte unser Ziel sein und das wird mit unnötigen Fachbegriffen erschwert. Es geht ja nicht darum, dass er nicht in Ordnung ist, sondern dass er besser werden soll.--G 19:56, 15. Okt. 2008 (CEST)

a) Das sind keine unnötigen Fachbegriffe.
b) Ich glaube nicht, dass man die Methode verstehen kann, wenn man keine grundsätzliche Vorstellung hat, worum es geht. --Scherben 20:47, 16. Okt. 2008 (CEST)
Wo ist der Verlust wenn man statt Modellkurve Funktion und statt Punktwolke Menge von Punkten schreibt? Es geht darum an eine Linie möglichst Nahe an ein paar Punkte zu bringen, um das zu verstehen braucht man kein Mathe-Studium. --G 23:06, 16. Okt. 2008 (CEST)
Du verlierst dann Informationen. "Modellkurve" impliziert schon begrifflich, dass du bestimmte Vorauswahlen hinsichtlich der Funktionenklasse tätigst. --Scherben 09:08, 17. Okt. 2008 (CEST)
Der Artikel ist ja noch lang genug um es genau zu beschreiben, außerdem steht das in meinem Vorschlag auch drinnen, nur ohne den Begriff. Die kompakte Formulierung passt vielleicht für den Bronstein, wenn es allgemeinverständlich sein soll muss man halt ein bisschen mehr schreiben.--G 13:14, 17. Okt. 2008 (CEST)
"Möglichst gut passende" Funktion ist deutlich zu unpräzise. --Scherben 14:00, 17. Okt. 2008 (CEST)
Ich finde es eine Voraussetzung für einen exzellenten Artikel, dass er so gut verständlich ist wie möglich und bin mir sicher, dass man hier noch was machen könnte. Außerdem halte ich es prinzipiell für besser wenn mehr Leute den Anfang verstehen als wenn ein paar Leute etwas mehr lesen müssen um eine genaue Definition zu erhalten (da bin ich auch nicht der einzige Wikipedia:Oma-Test.--G 17:23, 21. Okt. 2008 (CEST)

Nachdem sich nichts geändert hat und ich finde, dass so ein "exzellener" Artikel kein gutes Bild abgibt habe ich die Einleitung geändert. Wir können gern weiter darüber reden und es soll nicht an der Punktwolke scheitern, auch wenn ich nicht verstehe wofür man die braucht.--G 17:35, 26. Dez. 2008 (CET)

Die Änderung ist damals um Weihnachten an mir vorbeigegangen, so dass ich nun etwas verärgert bin, eine neue Einleitung vorzufinden, obwohl Deine Kritik hier nicht ganz nachvollzogen werden konnte. Ich habe entsprechend die alte Einleitung wiederhergestellt. Konkret ist Deine stilistisch deutlich schlechter, benutzt Klammersätze und Füllworte und ist damit sprachlich unpräziser. --P. Birken 23:02, 3. Mai 2009 (CEST)

Und ich finde es unblaublich, dass ein für Laien unverständlicher Artikel exzellent ist und Artikel als persönlicher Besitz gesehen werden.--G 19:33, 4. Mai 2009 (CEST)

Persönlicher Besitz? Dann schau Dir die Diskussion nochmal an. Deine Kritik an der Einleitung konnte nicht nur von mir, sondern auch von Scherben und Philipendula nicht nachvollzogen werden. --P. Birken 20:12, 6. Mai 2009 (CEST)
Ich stütze mich hier ebenfalls nicht nur auf meine Meinung, und dass Leute die schon am Artikel mitgeschrieben haben ihn nicht zu kompliziert finden, wundert mich auch nicht. Wenn ihr den Artikel exzellent findet, können wir ja nochmal darüber abstimmen lassen.--G 16:46, 7. Mai 2009 (CEST)