Gelman-Rubin-Statistik

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Die Gelman-Rubin-Statistik erlaubt eine Aussage über die Konvergenz von iterativen Monte-Carlo-Simulationen.

Das Problem, das die Gelman-Rubin-Statistik löst, ist die Unsicherheit darüber, ob und wann MCMC-Simulationen konvergiert sind. Konvergenz bedeutet in diesem Kontext, dass die von der MCMC-Simulation generierten Zufallszahlen die zugrunde liegende Wahrscheinlichkeitsverteilung repräsentieren. Wenn eine Kette nicht konvergiert, können die daraus resultierenden Schätzungen verzerrt und ungenau sein.

Die Gelman-Rubin-Statistik löst dieses Problem, indem sie die Varianz innerhalb der Ketten mit der Varianz zwischen den Ketten vergleicht. Wenn diese beiden Varianzen ähnlich sind, deutet dies darauf hin, dass die Kette konvergiert hat. Die Gelman-Rubin-Statistik wird als Verhältnis dieser beiden Varianzen berechnet, und ein Wert nahe 1 deutet auf Konvergenz hin.

Es ist wichtig zu beachten, dass die Gelman-Rubin-Statistik nur ein Diagnosewerkzeug ist und keine Garantie für die Konvergenz bietet.

Es werden Monte-Carlo Simulationen (Ketten) mit unterschiedlichen Startwerten gestartet. Die Stichproben aus den jeweiligen Burn-In Phasen werden verworfen.

Aus den Stichproben (der j-ten Simulation) wird die Varianz zwischen den Ketten und die Varianz in den Ketten geschätzt:

Mittelwert der Kette j
Mittelwert der Mittelwerte aller Ketten
Varianz der Mittelwerte der Ketten
Über alle Ketten gemittelte Varianzen der einzelnen Ketten

Ein Schätzwert der Gelman-Rubin-Statistik ergibt sich dann als[1]

.

Wenn L gegen unendlich und B gegen null strebt, strebt R gegen 1.

Die Geweke Diagnostik vergleicht ob der Mittelwert der ersten x Prozent einer Kette und der Mittelwert der letzten y Prozent einer Kette übereinstimmen.

  • Vats, Dootika, and Christina Knudson. „Revisiting the gelman–rubin diagnostic.“ Statistical Science 36.4 (2021): 518–529. arxiv
  • Gelman, Andrew, and Donald B. Rubin. „Inference from iterative simulation using multiple sequences.“ Statistical science 7.4 (1992): 457–472. pdf

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. https://bookdown.org/rdpeng/advstatcomp/monitoring-convergence.html