Kaplan-Meier-Schätzer

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Der Kaplan-Meier-Schätzer (auch Produkt-Limit-Schätzer) dient zum Schätzen der Wahrscheinlichkeit, dass bei einem Versuchsobjekt ein bestimmtes Ereignis innerhalb eines Zeitintervalls nicht eintritt. Es handelt sich um eine nichtparametrische Schätzung der Überlebensfunktion im Rahmen der Ereigniszeitanalyse. Die zu Grunde liegenden Daten können rechts-zensiert sein. Diese Methode wurde 1958 von Edward Kaplan und Paul Meier entwickelt.[1]

Rechenvorschrift[Bearbeiten]

Der Kaplan-Meier-Schätzer ist definiert durch:


\hat S(t)=\prod_{t_{(i)}\leq t} \frac{n_i-d_i}{n_i}=\prod_{t_{(i)}\leq t}\left( 1-\frac{d_i}{n_i}\right)

mit

\hat S(0)=1
d_i= Versuchobjekte, bei denen das Ereignis zum Zeitpunkt t_{(i)} eingetreten ist
n_i= Versuchsobjekte zum Zeitpunkt t_{(i)} unter Risiko

Beispiel[Bearbeiten]

Zugrunde liegend soll folgende Tabelle sein:

Objekt Nr Zeit t (Tage) 1=Ereignis eingetreten,
0=Zensiert
Unter Risiko

n(t)

S(t)
#1 1 0 15 1
#2 12 1 14 0,93
#3 22 0  
#4 29 1 12 0,85
#5 31 1 11 0,77
#6 36 0  
#7 38 0  
#8 50 0  
#9 60 0  
#10 61 1 6 0,64
#11 70 1 5 0,51
#12 88 0  
#13 99 0  
#14 110 0  
#15 140 0  


Stellt die Tabelle die Ergebnisse einer klinischen Studie dar, so repräsentiert sie folgendes Geschehen:

Anfänglich sind 15 Patienten vorhanden. Bei diesen ist das Ereignis noch nicht eingetroffen, sie stehen aber „unter Risiko“.

Tag1: Ein Patient geht bereits nach einem Tag in der Studie verloren, d. h. er hat die Studie verlassen, ohne dass bei ihm bis dahin das Ereignis eingetreten ist (z. B. letzte Beobachtung 1 Tag vor Studienende).

\hat S(1)=\frac{15-0}{15} = 1

Solche durch Zensur verursachten Terme sind immer 1 und werden daher in den folgenden Berechnungen nicht mehr mitgeschrieben. Er wird zensiert, somit stehen nun nur noch 14 Patienten unter Risiko.

Tag 12: Bei einem Patienten tritt das Ereignis ein.

\hat S(12)= \frac{14-1}{14} = 0.9286

Es stehen nun noch 13 Patienten unter Risiko.

Tag 22: Ein weiterer Patient muss zensiert werden. \hat S ändert sich nicht:

\hat S(22) = \hat S(12)

Die Anzahl der Patienten unter Risiko verringert sich auf 12.

Tag 29: Bei einem weiteren Patienten tritt das Ereignis ein.

\hat S(29)=\frac{12-1}{12} \cdot \frac{14-1}{14} = 0.9167 \cdot 0.9286 = 0.8512

Es stehen nun 11 Patienten unter Risiko.

usw.

Deshalb stehen die am längsten beobachteten Patienten am Ende der Kurve. Durch die reduzierte Anzahl an Patienten unter Risiko steigt auch die Unsicherheit der Schätzung für das Risiko zum späteren Zeitpunkt (breiteres Konfidenzintervall).

Darstellung der gewonnenen Ergebnisse. Die schwarzen Kreuze markieren Zensurzeitpunkte. Ein Konfidenzintervall ist gestrichelt eingezeichnet.

Weitergehende Themen[Bearbeiten]

Varianz[Bearbeiten]

Die Varianz des Schätzers kann im Intervall t_k \leq t \le t_{k+1}

mittels


\operatorname{var} \{ \hat S (t) \} \approx [\hat S(t)]^2 \left\{ \sum_{i=1}^k \frac{d_i}{n_i(n_i-d_i)} \right\}

geschätzt werden.

Konfidenzintervall[Bearbeiten]

Das Konfidenzintervall kann wie gewohnt aus der Varianz bzw. dem Standardfehler berechnet werden.


s.e.\{ \hat S (t) \} \approx [\hat S(t)] \left\{ \sum_{i=1}^k \frac{d_i}{n_i(n_i-d_i)} \right\}^\frac{1}{2}

Diese Formel wird auch als Greenwood's formula bezeichnet.

Das 95 %-Konfidenzintervall ist somit:

\left[ \hat S (t) - 1{,}96 \cdot s.e.\{ \hat S (t) \};\hat S (t) + 1{,}96 \cdot s.e.\{ \hat S (t) \}\right]

Einzelnachweise[Bearbeiten]

  1. Nachrufartikel zu Paul Meier in der New York Times

Siehe auch[Bearbeiten]