Optional Sampling Theorem

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Das Optional Sampling Theorem (auch Optional Stopping Theorem) ist eine auf Joseph L. Doob zurückgehende wahrscheinlichkeitstheoretische Aussage. Eine populäre Version dieses Theorems besagt, dass es bei einem fairen, sich wiederholenden Spiel keine Abbruchstrategie gibt, mit der man seinen Gesamtgewinn verbessern kann.

Ausgangssituation[Bearbeiten]

Man betrachtet eine Menge T möglicher Zeitpunkte und eine Grundmenge \Omega möglicher Ereignisse. Zu jedem Zeitpunkt t\in T liegt eine σ-Algebra {\mathcal A}_t auf \Omega vor, die für den Informationsstand zu diesem Zeitpunkt steht. Da die verfügbare Information im Zeitverlauf steigt, gelte {\mathcal A}_s \subset {\mathcal A}_t für s<t, das heißt ({\mathcal A}_t)_{t\in T} ist eine Filtrierung auf \Omega. In Anwendungen liegt ein Wahrscheinlichkeitsraum (\Omega,{\mathcal A},P) vor und es ist {\mathcal A}_t\subset {\mathcal A}.

Zu jedem Zeitpunkt t gebe es eine {\mathcal A}_t-messbare Zufallsgröße X_t:\Omega\rightarrow \R, das heißt es liegt ein adaptierter stochastischer Prozess (X_t)_t vor, X_t kann zum Beispiel für die Auszahlung eines Spiels zum Zeitpunkt t stehen. Weiter wird vorausgesetzt, dass (X_t)_t ein Martingal ist; die definierende Bedingung E(X_t|{\mathcal A}_s) = X_s für s<t drückt die Fairness des Spiels aus: die Prognose über die Auszahlung zum Zeitpunkt t unter der bei s vorliegenden Information ist genau die bei s gemachte Beobachtung X_s. Insbesondere stimmt der Erwartungswert E(X_t) zum Zeitpunkt t mit dem anfänglichen Erwartungswert E(X_0) überein.

Eine Stoppzeit ist eine Abbildung \tau:\Omega\rightarrow T\cup \{\infty\} mit \{\omega\in \Omega:\,\tau(\omega)\le t\} \in {\mathcal A}_t. Dahinter steckt der Gedanke, den Prozess zum Zeitpunkt \tau(\omega) abzubrechen, was dann zum Ergebnis X_{\tau(\omega)}(\omega) führt, wobei X_{\infty} geeignet zu definieren ist. Ob man bis zum Zeitpunkt t abbricht, darf nur von den bis t vorliegenden Informationen abhängen, was die an \tau gestellte Messbarkeitsbedingung erklärt.

Es stellt sich nun die Frage, ob man durch Wahl einer geeigneten Stoppzeit ein besseres Ergebnis als E(X_0) erhalten kann. Das Optional Sampling Theorem sagt aus, dass dies unter geeigneten Voraussetzungen nicht der Fall ist.

Diskrete Version[Bearbeiten]

Betrachtet man eine diskrete Abfolge von Zeitpunkten, so kann man dies durch T=\N modellieren. Die diskrete Version des Optional Sampling Theorems sagt aus:

  • Sind ({\mathcal A}_n)_{n\in \N} eine Filtrierung und (X_n)_n ein adaptiertes Martingal auf (\Omega,{\mathcal A},P) und ist \tau:\Omega\rightarrow \N\cup \{\infty\} eine Stoppzeit mit P(\tau < \infty)=1, E(|X_{\tau}|)<\infty und \int_{\{\tau > n\}}|X_n|{\rm d}P\, \stackrel{n\to \infty}{\longrightarrow}\,0, so gilt
E(X_{\tau}) \,=\, E(X_0).

Die an \tau gestellten, technischen Voraussetzungen sind insbesondere für den realistischen Fall beschränkter Stoppzeiten erfüllt (man kann nicht ewig warten!).

Die Stopp-Strategie, beim Roulette immer auf rot zu setzen, mit einem Euro beginnend jedes Mal den Einsatz zu verdoppeln und beim ersten Auftreten von rot abzubrechen, erfüllt nicht diese technischen Bedingungen. Man hat hier allerdings die unrealistische Situation einer unbeschränkten Stoppzeit mit exponentiell wachsenden Einsätzen (am „Ende“ gewinnt man insgesamt einen Euro).

Die folgende Verschärfung für beschränkte Stoppzeiten wird ebenfalls als Optional Sampling Theorem bezeichnet:

  • Sind ({\mathcal A}_n)_{n\in \N} eine Filtrierung und (X_n)_n ein adaptiertes Submartingal auf (\Omega,{\mathcal A},P) und sind \sigma, \tau:\Omega\rightarrow \N beschränkte Stoppzeiten mit \sigma \le \tau, so gilt
X_{\sigma}\,\le\, E(X_{\tau}|{\mathcal A}_{\sigma}).

Dabei ist {\mathcal A}_{\sigma} := \{A\in {\mathcal A}:\, A\cap \{\sigma < t\}\in {\mathcal A}_t\,\forall t\in T\} die sogenannte σ-Algebra der \sigma-Vergangenheit. Setzt man speziell \sigma=0, so ist sicher \sigma\le \tau und es folgt X_0 \le E(X_{\tau}|{\mathcal A}_0) und nach Anwendung des Erwartungswerts E(X_0) \le E(X_{\tau}). Im Falle von Martingalen kann man dieses Argument auch auf (-X_n)_n anwenden, und man erhält die Aussage des erstgenannten Satzes für beschränkte Stoppzeiten.

Kontinuierliche Version[Bearbeiten]

Im zeitkontinuierlichen Fall, der durch T=[0,\infty) modelliert wird, sind weitere technische Voraussetzungen zu stellen, die es erlauben, den Beweis auf den diskreten Fall zurückzuführen. Analog zum diskreten Fall gelten die folgenden beiden Sätze, die ebenfalls als Optional Sampling Theorem bezeichnet werden.

  • Sind ({\mathcal A}_t)_{t\in [t\infty)} eine Filtrierung und (X_t)_t ein adaptiertes Martingal mit rechtsseitig stetigen Pfaden auf (\Omega,{\mathcal A},P) und ist \tau:\Omega\rightarrow [0,\infty] eine Stoppzeit mit P(\tau < \infty)=1, E(|X_{\tau}|)<\infty und \int_{\{\tau > t\}}|X_t|{\rm d}P \,\stackrel{t\to \infty}{\longrightarrow}\,0, so gilt
E(X_{\tau}) \,=\, E(X_0).
  • Sind ({\mathcal A}_t)_{t\in [t\infty)} eine Filtrierung und (X_t)_t ein adaptiertes Submartingal mit rechtsseitig stetigen Pfaden auf (\Omega,{\mathcal A},P) und sind \sigma, \tau:\Omega\rightarrow [0,\infty) beschränkte Stoppzeiten mit \sigma \le \tau, so gilt
    X_{\sigma}\le E(X_{\tau}|{\mathcal A}_{\sigma}).

Quellen[Bearbeiten]