CUSUM

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

In der statistischen Prozess- und Qualitätskontrolle ist die kumulative Summe oder CUSUM (von engl. “cumulative sum”) eine sequentielle Analysemethode zur Entdeckung von Änderungen in einer sequentiellen Datenreihe oder Zeitreihe (z. B. Kurswechsel bzw. Wendepunkte).[1] E. S. Page definierte 1954 eine Qualitätszahl \theta, einen Parameter einer Wahrscheinlichkeitsverteilung; z. B. den Erwartungswert. Er entwickelte CUSUM als Methode, um generelle Änderungen des Parameters aus zufälligem Rauschen heraus zu filtern und schlug ein Grenzkriterium vor ab dem in den Prozess eingegriffen werden sollte. Einige Jahre später stellte George Alfred Barnard das V-Mask Diagramm vor zur visuellen Entdeckung von Änderungen von \theta.[2]

Vorgehensweise[Bearbeiten]

CUSUM betrachtet die kumulative Summen von Datenwerten x_n und vorgebenen Werten \omega_n:

S_0=0
S_n=\max(0, S_{n-1}+x_n-\omega_n)

Es ist wichtig anzumerken, dass CUSUM nicht die bloße kumulative Summe der Datenwerte ist, sondern die kumulative Summe der Differenzen zwischen den Datenwerten x_n und \omega_n. Überschreitet der Wert von S_{n+1} einen vorgebenen Grenzwert, dann hat man eine Änderung gefunden. CUSUM erkennt also nicht nur scharfe Datenwertänderungen, sondern auch schrittweise und kontinuierliche über den Betrachtungszeitraum. Meist handelt es sich bei \omega um eine Likelihood-Funktion, obwohl dies in Pages Artikel nicht so spezifiziert wird.

Beispiele[Bearbeiten]

Beispiel 1[Bearbeiten]

In dem Beispiel wird vorgegeben \omega_n=5 und betrachtet werden sowohl positive als auch negative kumulierte Abweichungen:

S_0=S_0^+=S_0^-=0
S_{n}^+=\max(0, S_{n-1}^++x_n-\omega_n)
S_{n}^-=\min(0, S_{n-1}^--x_n+\omega_n)
S_{n}= S_{n-1}-\omega_n+x_n
Grafische Darstellung der CUSUM Berechnung.
n Datenwert x_n x_n-\omega_n S_n^+ S_n^- CUSUM S_n
0 0 0 0
1 2 -3 0 3 -3
2 4 -1 0 4 -4
3 7 +2 2 2 -2
4 3 -2 0 4 -4
5 9 +4 4 0 0

S_n kann auch aufgefasst werden:

  1. Alle Datenpunkte werden mittelwertbereinigt (x_n-\omega_n) und
  2. zu jedem dadurch neu entstandenen Wert werden alle vorhergehenden mittelwertbereinigten Differenzen addiert.

Der Mittelwert ist dabei die Likelihoodschätzung für den Erwartungswert normalverteilter Datenwerte.

Beispiel 2[Bearbeiten]

Die folgenden Grafiken zeigen den Verlauf von S_n\,, S_n^+ und S_n^- in verschiedenen Situationen:

  • links: der Mittelwert des Prozesses ändert sich nicht
  • mitte: der Mittelwert des Prozesses wird langsam größer (im Verhältnis zur Streuung)
  • rechts: der Mittelwert springt abrupt nach oben nach 60 Zeiteinheiten

In den Daten (oben) sind diese Änderungen kaum zu erkennen, jedoch nicht im Verlauf der S_n\,, S_n^+ und S_n^- Kurven (unten).

CusumExample.svg

Literatur[Bearbeiten]

Weblinks[Bearbeiten]

Einzelnachweise[Bearbeiten]

  1. E. S. Page: Continuous Inspection Schemes. In: Biometrika. Bd. 41, Nr. 1/2 (Juni 1954), ISSN 0006-3444, S. 100–115.
  2. G. A. Barnard: Control Charts and Stochastic Processes. In: Journal of the Royal Statistical Society. Series B (Methodological). Bd. 21, Nr. 2 (1959), ISSN 0035-9246, S. 239–271.