Formelsammlung Stochastik

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Dies ist eine Formelsammlung zu dem mathematischen Teilgebiet Stochastik einschließlich Wahrscheinlichkeitsrechnung, Kombinatorik, Zufallsvariablen und Verteilungen sowie Statistik.

Notation[Bearbeiten | Quelltext bearbeiten]

In der Stochastik gibt es neben der üblichen mathematischen Notation und den mathematischen Symbolen folgende häufig verwendete Konventionen:

  • Zufallsvariablen werden in Großbuchstaben geschrieben: , , etc.
  • Realisationen einer Zufallsvariablen werden mit den entsprechenden Kleinbuchstaben geschrieben, z. B. für die Beobachtungen in einer Stichprobe: .
  • Für die Bezeichnung von Wahrscheinlichkeitsfunktionen und Wahrscheinlichkeitsdichten werden Kleinbuchstaben benutzt, z. B. .
  • Für die Bezeichnung von Verteilungsfunktionen werden Großbuchstaben benutzt, z. B. .
    • Speziell die Wahrscheinlichkeitsdichte der Standardnormalverteilung wird die Bezeichnung und für die Verteilungsfunktion benutzt.
  • Griechische Buchstaben (z. B. ) werden benutzt, um unbekannte Parameter (Parameter der Grundgesamtheit) zu bezeichnen.
  • Eine Schätzfunktion wird häufig mit einem Zirkumflex über dem entsprechenden Symbol bezeichnet, z. B. (gesprochen: Theta Dach).
  • Das arithmetische Mittel wird mit bezeichnet (gesprochen: x quer).

Wahrscheinlichkeitsrechnung[Bearbeiten | Quelltext bearbeiten]

Im Folgenden sei stets ein Wahrscheinlichkeitsraum gegeben. Darin ist der Ergebnisraum eine beliebige nichtleere Menge, eine σ-Algebra von Teilmengen von , die enthält, und ein Wahrscheinlichkeitsmaß auf

Grundlagen[Bearbeiten | Quelltext bearbeiten]

Axiome: Jedem Ereignis wird eine Wahrscheinlichkeit zugeordnet, so dass gilt:

,
,
für paarweise disjunkte Ereignisse gilt

Rechenregeln: Aus den Axiomen ergibt sich:

Für gilt , insbesondere
Für das Gegenereignis gilt

Laplace-Experimente

Bedingte Wahrscheinlichkeit

Satz von Bayes:

Unabhängigkeit:

Zwei Ereignisse sind unabhängig

Kombinatorik[Bearbeiten | Quelltext bearbeiten]

Fakultät: Anzahl der Möglichkeiten beim Ziehen aller Kugeln aus einer Urne (ohne Zurücklegen):

wobei

  ohne Wiederholung
(von n Elementen)
 
mit Wiederholung
(von r + s + … + t = n Elementen,
von denen jeweils r, s … t nicht unterscheidbar sind)
Permutation

Binomialkoeffizient „n über k“

Anzahl der Möglichkeiten beim Ziehen von Kugeln aus einer Urne mit Kugeln:

  ohne Wiederholung
(siehe Hypergeometrische Verteilung)

mit Wiederholung
(siehe Binomialverteilung)

Variation
Kombination

Zufallsvariablen[Bearbeiten | Quelltext bearbeiten]

Diskrete Zufallsgrößen[Bearbeiten | Quelltext bearbeiten]

Eine Funktion heißt Wahrscheinlichkeitsfunktion einer diskreten Zufallsgröße , wenn folgende Eigenschaften erfüllt sind:

  1. Für alle gilt

Für die zugehörige Zufallsvariable gilt dann:

Eine Zufallsgröße X und deren Verteilung heißen diskret, falls die Funktion die Eigenschaft (2) hat. Man nennt die Wahrscheinlichkeitsfunktion von X.

Stetige Zufallsgrößen[Bearbeiten | Quelltext bearbeiten]

Eine Funktion heißt Dichte(Funktion) einer stetigen Zufallsgröße , wenn folgende Eigenschaften erfüllt sind:

  1. Für alle gilt

Für eine stetige Zufallsgröße gilt dann:

Eine Zufallsgröße X und deren Verteilung heißen stetig, falls es eine geeignete Dichtefunktion mit dieser Eigenschaft gibt. Die Funktion heißt Dichte(Funktion) von X.

Für die Wahrscheinlichkeit gilt

für alle

Erwartungswert und Varianz sind gegeben durch

Erwartungswert, Varianz, Kovarianz, Korrelation[Bearbeiten | Quelltext bearbeiten]

Für den Erwartungswert , die Varianz , die Kovarianz und die Korrelation gelten:

, allgemein
Für unabhängige Zufallsvariablen gilt:
Für unabhängige Zufallsvariablen gilt:

Tschebyschow-Ungleichung:

Spezielle Verteilungen[Bearbeiten | Quelltext bearbeiten]

Binomialverteilung[Bearbeiten | Quelltext bearbeiten]

Gegeben ist ein -stufiger Bernoulli-Versuch (d. h. mal dasselbe Experiment, unabhängig voneinander, mit nur zwei möglichen Ausgängen und konstanten Wahrscheinlichkeiten) mit der Erfolgswahrscheinlichkeit und der Misserfolgswahrscheinlichkeit . Die Wahrscheinlichkeitsverteilung der Zufallsgröße : Anzahl der Erfolge heißt Binomialverteilung.

Die Wahrscheinlichkeit für Erfolge berechnet sich nach der Formel:

Erwartungswert:

Varianz:

Standardabweichung:

σ-Regeln[Bearbeiten | Quelltext bearbeiten]

(Wahrscheinlichkeiten von Umgebungen des Erwartungswertes bei Binomialverteilungen) Zwischen dem Radius einer Umgebung um den Erwartungswert und der zugehörigen Wahrscheinlichkeit der Umgebung gelten folgende Zuordnungen (falls ):

Radius der Umgebung Wahrscheinlichkeit der Umgebung
0,68
0,955
0,997
Wahrscheinlichkeit der Umgebung Radius der Umgebung
0,90 1,64σ
0,95 1,96σ
0,99 2,58σ

Standardisieren einer Verteilung[Bearbeiten | Quelltext bearbeiten]

Hat die Zufallsvariable X eine Verteilung mit Erwartungswert EX=μ und Standardabweichung σ, dann wird die standardisierte Variable X* definiert durch

Die standardisierte Variable X* hat den Erwartungswert 0 und die Standardabweichung 1.

Poisson-Näherung[Bearbeiten | Quelltext bearbeiten]

Gegeben sei eine Binomialverteilung mit großem Stichprobenumfang ≥ 100 und kleiner Erfolgswahrscheinlichkeit p≤0,1. Mithilfe von kann man dann näherungsweise die Wahrscheinlichkeit für Erfolge berechnen:

Die Beziehungen lassen sich zusammenfassen zu:

Poisson-Verteilung[Bearbeiten | Quelltext bearbeiten]

Gilt für die Verteilung einer Zufallsgröße

Näherungsformeln von Moivre und Laplace[Bearbeiten | Quelltext bearbeiten]

Sei eine binomialverteilte Zufallsgröße mit σ>4 (brauchbare Näherung besser σ>9). Die Wahrscheinlichkeit für genau und höchstens Erfolge lässt sich näherungsweise berechnen durch:

Standardnormalverteilung[Bearbeiten | Quelltext bearbeiten]

Die Dichte(Funktion) (auch als Glockenkurve bekannt) der Standardnormalverteilung ist definiert durch:

und die Verteilungsfunktion durch:

Näherungsformeln für eine diskrete Verteilung unter Anwendung der Kontinuitätkorrektur:

Hypergeometrische Verteilung[Bearbeiten | Quelltext bearbeiten]

In einer Grundgesamtheit vom Umfang seien zwei Merkmalsausprägungen vom Umfang bzw. vertreten. Eine Stichprobe vom Umfang werde genommen. Dann nennt man die Verteilung der Zufallsgröße: X: Anzahl der Exemplare der 1. Merkmalsausprägung in der Stichprobe einer hypergeometrischen Verteilung.

Die Wahrscheinlichkeit, dass in der Stichprobe vom Umfang genau Exemplare der 1. Merkmalsausprägung sind, ist:

= Anzahl der Elemente, = Anzahl der positiven Elemente, = Anzahl der Ziehungen, = Anzahl der Erfolge.

Sei der Anteil, mit dem die 1. Merkmalsausprägung in der Gesamtheit vorkommt, dann gilt:

Geometrische Verteilung[Bearbeiten | Quelltext bearbeiten]

Gegeben ist ein Bernoulli-Versuch mit Erfolgswahrscheinlichkeit . Die Verteilung der Zufallsgröße W: Anzahl der Stufen bis zum ersten Erfolg heißt geometrische Verteilung. Es gilt:

(Erfolg genau beim k-ten Versuch)
(k Misserfolge hintereinander bzw. der erste Erfolg kommt erst nach dem k-ten Versuch)
(Erfolg spätestens beim k-ten Versuch bzw. bis zum k-ten. Versuch tritt mindestens ein Erfolg ein)

Der Erwartungswert ist

Weitere[Bearbeiten | Quelltext bearbeiten]

Die unzähligen weiteren speziellen Verteilungen können hier nicht alle aufgeführt werden, es sei auf die Liste univariater Wahrscheinlichkeitsverteilungen verwiesen.

Approximationen von Verteilungen[Bearbeiten | Quelltext bearbeiten]

Unter gewissen Approximationsbedingungen können Verteilungen auch durcheinander approximiert werden um Berechnungen zu vereinfachen. Je nach Lehrbuch können die Approximationsbedingungen etwas unterschiedlich sein.

Nach
Von
Diskrete Verteilungen
Binomialverteilung
-- ,
,
Hypergeometrische Verteilung

, ,

Poisson-Verteilung
-- ,
Stetige Verteilungen
Chi-Quadrat-Verteilung

Studentsche t-Verteilung

Normalverteilung
--

Bei dem Übergang von einer diskreten Verteilung zu einer stetigen Verteilung kommt auch noch eine Stetigkeitskorrektur (wenn oder ) in Betracht und insbesondere .[1]

Kritische Werte[Bearbeiten | Quelltext bearbeiten]

Das -Level ist der Wert einer Wahrscheinlichkeitsverteilung für den gilt: . Es gibt eine Standardnotation für einige häufig verwendete Verteilungen:

  • oder für die Standardnormalverteilung
  • oder für die t-Verteilung mit Freiheitsgraden
  • oder für die Chi-Quadrat-Verteilung mit Freiheitsgraden
  • oder für die F-Verteilung mit und Freiheitsgraden

Statistik[Bearbeiten | Quelltext bearbeiten]

Beschreibende Statistik[Bearbeiten | Quelltext bearbeiten]

Lagemaße[Bearbeiten | Quelltext bearbeiten]

Arithmetisches Mittel:

Median

Modus

Streuungsmaße[Bearbeiten | Quelltext bearbeiten]

Stichprobenvarianz:

Standardabweichung:

Zusammenhangsmaße[Bearbeiten | Quelltext bearbeiten]

Empirische Kovarianz:

Empirischer Korrelationskoeffizient:

Gleichung der Regressionsgeraden: mit

,

wobei und die arithmetischen Mittel bedeuten.

Mittelwerte[Bearbeiten | Quelltext bearbeiten]

Mittelwert Zwei Zahlen Allgemein
Modus Ausprägung mit höchster Häufigkeit
Median (Zentralwert) Sofern sortiert sind:

Arithmetisches Mittel
Geometrisches Mittel
Harmonisches Mittel
Quadratisches Mittel

Schließende Statistik[Bearbeiten | Quelltext bearbeiten]

Parameter[Bearbeiten | Quelltext bearbeiten]

Im Allgemeinen werden in der Statistik unbekannte Parameter der Grundgesamtheit oder eines Modells mit griechischen Buchstaben (z. B. ) bezeichnet.

  • Das arithmetische Mittel in der Grundgesamtheit: .
  • Die Varianz in der Grundgesamtheit: .
  • Den Anteilswert einer dichotomen Variablen in der Grundgesamtheit: .
  • Der Achsenabschnitt und die Steigung im einfachen linearen Regressionsmodell .

Schätzfunktionen[Bearbeiten | Quelltext bearbeiten]

Eine Schätzfunktion für einen unbekannten Parameter wird häufig durch einen Großbuchstaben der Parameterbezeichnung aus der beschreibenden Statistik bezeichnet. Die Schätzfunktion ergibt sich aus den Stichprobenvariablen .

Parameter Bedingung Schätzfunktion Verteilung
1.

2. Wenn der zentrale Grenzwertsatz gilt, dann gilt

bekannt
unbekannt
1. Ziehen mit Zurücklegen:

2. Ziehen ohne Zurücklegen:
    mit und der Umfang der Grundgesamtheit.

, Wenn , dann folgt

Punktschätzer und Konfidenzintervalle[Bearbeiten | Quelltext bearbeiten]

Parameter Punktschätzer Konfidenzintervall
1. Wenn bekannt:
2. Wenn unbekannt:
1. Ziehen mit Zurücklegen: Wenn , dann gilt approximativ:

2. Ziehen ohne Zurücklegen: Wenn , dann gilt approximativ:

Bei der Berechnung eines Schätzintervalls mittels einer Stichprobe in 1. und 2. wird durch ersetzt.

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Yates, F. (1934). Contingency table involving small numbers and the χ2 test. Supplement to the Journal of the Royal Statistical Society 1(2): 217-235. JSTOR Archive for the journal

Weblinks[Bearbeiten | Quelltext bearbeiten]