Kaplan-Meier-Schätzer

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Der Kaplan-Meier-Schätzer (auch Produkt-Grenzwert-Schätzer, kurz: PGS) dient zum Schätzen der Wahrscheinlichkeit, dass bei einem Versuchsobjekt ein bestimmtes Ereignis innerhalb eines Zeitintervalls nicht eintritt. Es handelt sich um eine nichtparametrische Schätzung der Überlebensfunktion im Rahmen der Ereigniszeitanalyse. Die zu Grunde liegenden Daten können rechts-zensiert sein. Diese Methode wurde 1958 von Edward L. Kaplan und Paul Meier entwickelt.[1]

Die Bezeichnung Produkt-Grenzwert-Schätzer rührt daher, dass man diesen Schätzer als Grenzwert von Sterbetafelschätzungen mit gegen null gehenden Intervalllängen interpretieren kann.

Rechenvorschrift[Bearbeiten | Quelltext bearbeiten]

Der Kaplan-Meier-Schätzer für die Überlebensfunktion (also die Wahrscheinlichkeit dafür, dass die Zeit bis zum Eintreten des Ereignisses überschreitet) ist gegeben durch:

mit

Versuchsobjekte, bei denen das Ereignis zum Zeitpunkt eingetreten ist
Versuchsobjekte zum Zeitpunkt unter Risiko

Beispiel[Bearbeiten | Quelltext bearbeiten]

Zugrunde liegend soll folgende Tabelle sein:

Objekt Nr. Zeit t (Tage) 1 = Ereignis eingetreten,
0 = Zensiert
Unter Risiko
n(t)
S(t)
#1 1 0 15 1
#2 12 1 14 0,93
#3 22 0  
#4 29 1 12 0,85
#5 31 1 11 0,77
#6 36 0  
#7 38 0  
#8 50 0  
#9 60 0  
#10 61 1 6 0,64
#11 70 1 5 0,52
#12 88 0  
#13 99 0  
#14 110 0  
#15 140 0  

Stellt die Tabelle die Ergebnisse einer klinischen Studie dar, so repräsentiert sie folgendes Geschehen:

Anfänglich sind 15 Patienten vorhanden. Sie stehen aber „unter Risiko“, d. h. bei ihnen ist das Ereignis noch nicht eingetroffen.

Tag 1: Ein Patient geht bereits nach einem Tag in der Studie verloren, d. h., er hat die Studie verlassen, ohne dass bei ihm bis dahin das Ereignis eingetreten ist (z. B. letzte Beobachtung 1 Tag vor Studienende).

Solche durch Zensur verursachten Terme sind immer 1 und werden daher in den folgenden Berechnungen nicht mehr mitgeschrieben. Er wird zensiert, somit stehen nun nur noch 14 Patienten unter Risiko.

Tag 12: Bei einem Patienten tritt das Ereignis ein.

Es stehen nun noch 13 Patienten unter Risiko.

Tag 22: Ein weiterer Patient muss zensiert werden. ändert sich nicht:

Die Anzahl der Patienten unter Risiko verringert sich auf 12.

Tag 29: Bei einem weiteren Patienten tritt das Ereignis ein.

Es stehen nun 11 Patienten unter Risiko.

usw.

Deshalb stehen die am längsten beobachteten Patienten am Ende der Kurve. Durch die reduzierte Anzahl an Patienten unter Risiko steigt auch die Unsicherheit der Schätzung für das Risiko zum späteren Zeitpunkt (breiteres Konfidenzintervall).

Darstellung der gewonnenen Ergebnisse. Die schwarzen Kreuze markieren Zensurzeitpunkte. Ein Konfidenzintervall ist gestrichelt eingezeichnet.

Eigenschaften[Bearbeiten | Quelltext bearbeiten]

Der Kaplan-Meier Schätzer maximiert die empirische Likelihood.

Varianz[Bearbeiten | Quelltext bearbeiten]

Die Varianz des Schätzers kann im Intervall

mittels

geschätzt werden.

Konfidenzintervall[Bearbeiten | Quelltext bearbeiten]

Das Konfidenzintervall kann wie gewohnt aus der Varianz bzw. dem Standardfehler berechnet werden.

Diese Formel wird auch als Greenwood-Formel oder Greenwoodsche Formel bezeichnet.

Das 95 %-Konfidenzintervall lautet somit:

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Literatur[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. Edward L. Kaplan & Paul Meier: Individual Nonparametric Estimation from Incomplete Observations. Journal of the American Statistical Association, 53(282) (1958), S. 457–481. doi:10.1080/01621459.1958.10501452 JSTOR:2281868