Robbins-Monro-Prozess

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Der Robbins-Monro-Prozess ist ein stochastischer Prozess, mit dessen Hilfe die Nullstelle einer unbekannten Regressionsfunktion stochastisch approximiert werden kann. Er wurde 1951 von Herbert Robbins und Sutton Monro vorgestellt.

Definition[Bearbeiten | Quelltext bearbeiten]

Sei eine Familie von Zufallsvariablen und eine messbare Funktion, sodass gilt: . Sei zudem eine eindeutige Lösung gegeben, sodass . Dann heißt die Folge von Zufallsvariablen gegeben durch

Robbins-Monro-Prozess, wobei eine beliebige reelle Konstante und eine Folge reeller Konstanten mit sei.

Konvergenz von Xn gegen θ[Bearbeiten | Quelltext bearbeiten]

Unter den folgenden vier Bedingungen konvergiert in gegen [1]:

  • ,
  • ist monoton wachsend,
  • existiert,
  • genügt folgenden Bedingungen:

Einfaches Beispiel[Bearbeiten | Quelltext bearbeiten]

Seien um verschobene Sinusfunktionen zwischen und mit zufälligen Schwankungen , die an den Rändern linear fortgesetzt werden.

Wobei unabhängige, gleichverteilte Zufallsvariablen in sind. Sei außerdem und . Dann konvergiert gegen .

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Herbert Robbins, Sutton Monro: A Stochastic Approximation Method. In: The Annals of Mathematical Statistics. 22, Nr. 3, 1951, S. 405 Theorem 2.

Literatur[Bearbeiten | Quelltext bearbeiten]

  • Herbert Robbins, Sutton Monro: A Stochastic Approximation Method. In: The Annals of Mathematical Statistics. 22, Nr. 3, 1951, S. 400–407(PDF-Datei; 514KB).
  • Marie Duflo: Random Iterative Models, Springer Verlag, 1997.