„Statistisches Modell“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
[gesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
K →‎Alternative Definitionen: <ref> nach dem Punkt (s. WP:EN)
+ Definition nach Le Cam
Zeile 1: Zeile 1:
Ein '''statistisches Modell''', manchmal auch '''statistischer Raum''' genannt, ist ein Begriff aus der [[Mathematische Statistik|mathematischen Statistik]], dem Teilbereich der [[Statistik]], der sich der Methoden der [[Stochastik]] und [[Wahrscheinlichkeitstheorie]] bedient. Anschaulich fasst ein statistisches Modell alle Ausgangsinformationen zusammen: Welche Werte können die Daten annehmen, welchen [[Menge (Mathematik)|Mengen]] von Werten soll eine [[Wahrscheinlichkeit]] zugeordnet werden und welche [[Wahrscheinlichkeitsmaß]]e sind möglich beziehungsweise sollen in Betracht gezogen werden?
Ein '''statistisches Modell''', manchmal auch '''statistischer Raum''' oder '''statistisches Experiment''' genannt, ist ein Begriff aus der [[Mathematische Statistik|mathematischen Statistik]], dem Teilbereich der [[Statistik]], der sich der Methoden der [[Stochastik]] und [[Wahrscheinlichkeitstheorie]] bedient. Anschaulich fasst ein statistisches Modell alle Ausgangsinformationen zusammen: Welche Werte können die Daten annehmen, welchen [[Menge (Mathematik)|Mengen]] von Werten soll eine [[Wahrscheinlichkeit]] zugeordnet werden und welche [[Wahrscheinlichkeitsmaß]]e sind möglich beziehungsweise sollen in Betracht gezogen werden?


== Definition ==
== Definition ==
Zeile 17: Zeile 17:


Andererseits findet sich auch die Beschreibung eines statistischen Modells lediglich als Familie oder Menge von Wahrscheinlichkeitsmaßen <math> \mathcal P </math>.<ref>Czado, Schmidt: ''Mathematische Statistik.'' 2011, S. 39. </ref> Der entsprechende Grundraum ergibt sich dann implizit aus den definierten Wahrscheinlichkeitsmaßen, die verwendete σ-Algebra ist entsprechend die kanonische Wahl (Potenzmenge im diskreten Fall, [[Borelsche σ-Algebra]] sonst).
Andererseits findet sich auch die Beschreibung eines statistischen Modells lediglich als Familie oder Menge von Wahrscheinlichkeitsmaßen <math> \mathcal P </math>.<ref>Czado, Schmidt: ''Mathematische Statistik.'' 2011, S. 39. </ref> Der entsprechende Grundraum ergibt sich dann implizit aus den definierten Wahrscheinlichkeitsmaßen, die verwendete σ-Algebra ist entsprechend die kanonische Wahl (Potenzmenge im diskreten Fall, [[Borelsche σ-Algebra]] sonst).

=== Definition nach Le Cam ===
[[Lucien Le Cam]] verwendete wie [[David Blackwell]] den Begriff des statistischen Experiment für das statistische Modell, definierte dieses aber abstrakter über bestimmte [[Banachverband|Banachverbände]], deren [[Norm (Mathematik)|Norm]] additiv auf dem [[Ordnungskegel|positiven Kegel]] ist, den sogenannten [[Abstrakter L-Raum|abstrakten L-Räume]]. Le Cam definierte das statistische Modell wie folgt:
:''Ein statistisches Experiment <math>\mathcal{E}</math>, indexiert von einer Menge <math>\Theta</math>, ist eine Abbildung der Form <math>\theta\mapsto P_{\theta}</math> von <math>\Theta</math> in einen abstrakten L-Raum <math>(L,\|\cdot\|)</math>, bestehend aus positiven normierten linearen [[Funktional]]en <math>P_{\theta}</math>, das heißt es gilt <math>\|P_{\theta}\|=1</math> und für alle <math>f\geq 0</math> gilt <math>P_{\theta}f\geq 0</math>.<ref>{{Literatur|Autor=[[Lucien Le Cam]] |Datum=1986 |Titel=Asymptotic Methods in Statistical Decision Theory |Sammelwerk=Springer Series in Statistics |Hrsg=Springer, New York |Seiten=5 |DOI=10.1007/978-1-4612-4946-7}}</ref>
Ein statistisches Modell ist somit eine Abbildung auf den nichtnegativen [[Rand (Topologie)|Rand]] des [[Einheitsball]] in einem abstrakten L-Raum.


== Klassifikation statistischer Modelle ==
== Klassifikation statistischer Modelle ==

Version vom 18. Februar 2024, 20:56 Uhr

Ein statistisches Modell, manchmal auch statistischer Raum oder statistisches Experiment genannt, ist ein Begriff aus der mathematischen Statistik, dem Teilbereich der Statistik, der sich der Methoden der Stochastik und Wahrscheinlichkeitstheorie bedient. Anschaulich fasst ein statistisches Modell alle Ausgangsinformationen zusammen: Welche Werte können die Daten annehmen, welchen Mengen von Werten soll eine Wahrscheinlichkeit zugeordnet werden und welche Wahrscheinlichkeitsmaße sind möglich beziehungsweise sollen in Betracht gezogen werden?

Definition

Ein statistisches Modell ist ein Tripel bestehend aus

  • einer Grundmenge , die alle möglichen Ergebnisse eines Zufallsexperiments oder einer Stichprobenziehung enthält,
  • einer σ-Algebra auf der Grundmenge und
  • einer Menge von Wahrscheinlichkeitsmaßen auf

Oftmals ist es handlicher, die Menge von Wahrscheinlichkeitsmaßen als Familie (mit beliebiger Indexmenge) zu notieren, um auf ausgewiesene Elemente leichter zugreifen zu können. Die Menge von Wahrscheinlichkeitsmaßen wird dann auch mit notiert. Dies bedeutet nicht zwangsläufig, dass es sich um ein parametrisches Modell handelt.

Alternative Definitionen

Es existieren mehrere alternative Definitionen eines statistischen Modells, die sich in ihrer Detailliertheit unterscheiden.

Einerseits findet sich die Beschreibung eines statistischen Modells als eine Zufallsvariable , die Werte in dem Messraum annimmt entsprechend den Verteilungen aus .[1] Der zugrunde liegende Wahrscheinlichkeitsraum der Zufallsvariable wird nicht näher präzisiert, da er für die Verteilungen nicht relevant ist. Diese Beschreibung macht im Gegensatz zur obigen Beschreibung klarer, dass die Stichproben, also die Elemente aus , als Realisierung einer Zufallsvariable mit unbekannter Verteilung zu sehen sind. Die Menge heißt dann auch Stichprobenraum.

Bei vielen statistischen Anwendungen in der statistischen Schätz- und Testtheorie ist ein Zufallsvektor von stochastisch unabhängigen und identisch verteilten reellen Zufallsvariablen , die eine Zufallsstichprobe bilden. Der Stichprobenraum ist dann häufig .

Andererseits findet sich auch die Beschreibung eines statistischen Modells lediglich als Familie oder Menge von Wahrscheinlichkeitsmaßen .[2] Der entsprechende Grundraum ergibt sich dann implizit aus den definierten Wahrscheinlichkeitsmaßen, die verwendete σ-Algebra ist entsprechend die kanonische Wahl (Potenzmenge im diskreten Fall, Borelsche σ-Algebra sonst).

Definition nach Le Cam

Lucien Le Cam verwendete wie David Blackwell den Begriff des statistischen Experiment für das statistische Modell, definierte dieses aber abstrakter über bestimmte Banachverbände, deren Norm additiv auf dem positiven Kegel ist, den sogenannten abstrakten L-Räume. Le Cam definierte das statistische Modell wie folgt:

Ein statistisches Experiment , indexiert von einer Menge , ist eine Abbildung der Form von in einen abstrakten L-Raum , bestehend aus positiven normierten linearen Funktionalen , das heißt es gilt und für alle gilt .[3]

Ein statistisches Modell ist somit eine Abbildung auf den nichtnegativen Rand des Einheitsball in einem abstrakten L-Raum.

Klassifikation statistischer Modelle

Parametrische und nichtparametrische Modelle

Lässt sich die Menge von Wahrscheinlichkeitsmaßen über eine Parametermenge, auch Parameterraum genannt, beschreiben, ist also

für eine Parametermenge , so spricht man von einem parametrischen Modell, ansonsten von einem nichtparametrischen Modell. Ist , so spricht man von einem einparametrigen Modell.

Die Parameter des Modells können zum Beispiel mit der Maximum-Likelihood-Methode mithilfe von Stichproben geschätzt werden.

Diskrete Modelle

Ist endlich oder abzählbar unendlich und ist die Potenzmenge, so spricht man von einem diskreten Modell. Die Wahrscheinlichkeitsmaße lassen sich dann durch Wahrscheinlichkeitsfunktionen beschreiben.

Stetige Modelle

Ist eine Borel-Menge des und ist die Einschränkung der Borelschen σ-Algebra auf diese Menge, also und besitzt jedes der Wahrscheinlichkeitsmaße in eine Wahrscheinlichkeitsdichte, so spricht man von einem stetigen Modell.

Standardmodelle

Handelt es sich um ein stetiges Modell oder um ein diskretes Modell, so spricht man von einem Standardmodell[4]. Bei Standardmodellen existiert also insbesondere eine Wahrscheinlichkeitsdichte oder eine Wahrscheinlichkeitsfunktion. Manche Autoren nennen diese Modelle auch reguläre Modelle[5].

Reguläre Modelle

Reguläre statistische Modelle sind einparametrige Standardmodelle, bei denen noch Anforderungen an die Existenz von Ableitungen der Dichtefunktion gestellt werden. Sie werden zur Formulierung der Cramér-Rao-Ungleichung benötigt.

Lokations- und Skalenmodelle

Statistische Modelle, deren Verteilungsklasse eine Lokationsklasse ist, also durch Verschiebung einer einzigen Wahrscheinlichkeitsverteilung entstehen, werden Lokationsmodelle genannt, ebenso werden statistische Modelle mit Skalenfamilien Skalenmodell genannt.

Produktmodelle

Produktmodelle entstehen, wenn man das mehrmalige Produkt eines statistischen Modells mit sich selbst bildet. Sie formalisieren die Vorstellung, dass man einen Versuch mehrmals hintereinander ausführt und die Ergebnisse der Einzelversuche sich nicht gegenseitig beeinflussen. Viele der gängigen Modelle wie das Normalverteilungsmodell sind Produktmodelle.

Beispiele

Ein Beispiel für ein statistisches Modell ist der Grundraum versehen mit der σ-Algebra und als Menge der Wahrscheinlichkeitsmaße die Menge

aller Binomialverteilungen mit Parametern 100 und . Dieses statistische Modell könnte man beispielsweise wählen, wenn man eine Münze 100-mal wirft und die Anzahl der Erfolge zählt. Diese ist binomialverteilt, aber zu einem unbekannten Parameter, da nicht klar ist, ob die Münze gefälscht ist oder nicht. Es handelt sich bei diesem Modell um ein einparametriges Modell, da ist. Außerdem ist es ein diskretes Modell, da die Grundmenge endlich ist und die σ-Algebra durch die Potenzmenge definiert wird. Damit ist es auch automatisch ein Standardmodell. Die Menge von Wahrscheinlichkeitsmaßen

,

ergibt hingegen ein nichtparametrisches Modell.

Verwendungsarten statischer Modelle

Prinzipiell lassen sich zwei Ansätze bei der Erstellung statistischer Modelle unterscheiden:[6]

  • bei der ersten Gruppe von Methoden werden zunächst generierende stochastische Modelle angenommen,
  • in der anderen werden die Modelle algorithmisch als Black Box erstellt und ihre prädiktive Genauigkeit analysiert.

Literatur

Einzelnachweise

  1. Rüschendorf: Mathematische Statistik. 2014, S. 18.
  2. Czado, Schmidt: Mathematische Statistik. 2011, S. 39.
  3. Lucien Le Cam: Asymptotic Methods in Statistical Decision Theory. In: Springer, New York (Hrsg.): Springer Series in Statistics. 1986, S. 5, doi:10.1007/978-1-4612-4946-7.
  4. Georgii: Stochastik. 2009, S. 197.
  5. Claudia Czado, Thorsten Schmidt: Mathematische Statistik. Springer-Verlag, Berlin Heidelberg 2011, ISBN 978-3-642-17260-1, S. 41, doi:10.1007/978-3-642-17261-8.
  6. Breiman, Leo. Statistical modeling: The two cultures (with comments and a rejoinder by the author). Statistical science, 16.3 (2001): 199–231, online