Gleitender Mittelwert

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Der gleitende Mittelwert (auch: gleitender Durchschnitt) ist eine Methode zur Glättung von Zeit- bzw. Datenreihen. Die Glättung erfolgt durch das Entfernen höherer Frequenzanteile. Im Ergebnis wird eine neue Datenpunktmenge erstellt, die aus den Mittelwerten gleich großer Untermengen der ursprünglichen Datenpunktmenge besteht. In der Signaltheorie wird der gleitende Mittelwert als Tiefpassfilter mit endlicher Impulsantwort (FIR-Tiefpass) beschrieben. In der gleichgewichteten Form stellt der gleitende Mittelwert das einfachste FIR-Tiefpassfilter dar.

Anwendung findet der gleitende Mittelwert beispielsweise bei der Analyse von Zeitreihen. Die gleichgewichtete Variante entspricht der Faltung mit einer Rechteckfunktion und führt zu einer Reihe von Problemen, denen beispielsweise mit speziellen Gewichtungen entgegengewirkt werden kann.

Prinzipielles Vorgehen[Bearbeiten]

Die Menge der gleitenden Mittelwerte werden iterativ („gleitend“) über einen Ausschnitt, das „Fenster“, eines gegebenen Signals berechnet. Das verwendete Fenster wird überlappend verschoben, d. h. wiederholt wird der erste Wert aus dem betrachteten Ausschnitt gestrichen, der erste Wert nach dem Ausschnitt hinzugenommen und ein neuer Mittelwert berechnet. Für die Berechnung des Mittelwerts können die im Fenster vorkommenden Werte anschließend beliebig gewichtet werden.

Die Ergebnismenge der Mittelwerte ist für sich genommen unabhängig; häufig wird sie jedoch in den Zusammenhang mit einer Position der Eingabemenge gebracht, die auch hot spot genannt wird. Der hot spot kann im Bereich des Fensters liegen, muss es aber nicht. Bei Zeitreihen wird häufig der letzte Zeitpunkt als hot spot verwendet; in anderen Anwendungsfällen sind zentrierte Abbildungen üblich.

Einfacher gleitender Mittelwert[Bearbeiten]

Zentrierte gleitende Mittelwerte der Breite 3 verglichen mit einem binomial gefalteten Signal gleicher Breite. Im Gegensatz zur Dämpfung bzw. Auslöschung der hohen Frequenzen zwischen t=7 und t=12 (schnelle Wechsel zwischen hohen und niedrigen Werten) wird die Signalphase vom gleitenden Mittelwert invertiert, d.h. wo zuvor ein hoher Wert war, ist nun ein niedriger, und umgekehrt. Das Binomialfilter verursacht dagegen keine Phaseninversion.

Der einfache gleitende Durchschnitt (englisch simple moving average (SMA)) n-ter Ordnung einer diskreten Zeitreihe x(t) ist die Folge der arithmetischen Mittelwerte von n aufeinanderfolgenden Datenpunkten. Da es sich um eine Zeitreihe handelt, liegt der hot spot auf dem letzten Zeitpunkt. Die nachfolgenden Ausführungen beziehen sich auf diesen Sonderfall.


m_{MA}^{(n)}(t) = \frac{1}{n} \sum_{i=0}^{n-1} x(t-i)

In Analogie zu Filtern mit endlicher Impulsantwort wird auch n+1 als Ordnung genannt.

Solch ein gleitender Mittelwert hat eine Verzögerung (Gruppenlaufzeit) von \tau = \frac{n-1}{2}, d. h. die gemittelten Werte „hinken“ um \tau Zeiteinheiten hinterher.

Diese Verzögerung kann korrigiert werden, indem man den gleitenden Mittelwert um -\tau verschiebt. Dies ist der sogenannte zentrierte Mittelwert. Dann jedoch sind keine Werte mehr für die letzten \tau Zeiteinheiten vorhanden. Diese Lücke kann nur geschlossen oder zumindest verkleinert werden, indem man eine geringere Ordnung, andere Gewichtungen oder einen Schätzer verwendet.

Der zentrierte einfache gleitende Mittelwert der Ordnung 3 ist also durch


m_{MA_3}^{(n)}(t-1) = \frac{1}{3}(x(t) + x(t-1)+ x(t-2))

gegeben.

Ein Beispiel für die Verwendung von derartigen gleitenden Mittelwerten sind die 38- bzw. 200-Tage-Durchschnittswerte von Börsenkursen, die den gleitenden Mittelwert der vergangenenBörsentage eines Wertpapierkurses beschreiben.

Ein Gleitender-Mittelwert-Filter ist ein Tiefpass-Filter, jedoch werden einzelne Frequenzbereiche stärker oder schwächer gefiltert und es kommt zu Signalverschiebungen (englisch Lags).

Die Wirkung eines Glei­tender-Mittel­wert-Filters auf ein Chirp-Signal (oberes Drittel). Bis zum mit „Artefakt“ gekenn­zeichneten Bereich arbeitet der glei­tende Mittel­wert (mittleres Drittel) gut als Tiefpass­filter. Rechts davon jedoch wird das Signal wieder stärker durch­gelassen, mal mit invertierter Phase, mal lediglich gedämpft. Zum Vergleich das Ergebnis nach Anwendung eines binom­ialen Filters (unteres Drittel).

Online-Berechnung[Bearbeiten]

Durch die Überlappung bei der Berechnung des gleitenden Mittels für zwei aufeinanderfolgende Punkte wird die Summe für (n-1) Punkte doppelt berechnet. Um sich diesen redundanten Aufwand zu reduzieren, existiert ein Online-Algorithmus, der mit nur zwei Additionen und Multiplikationen pro Mittelwert auskommt:


 \begin{align}
   m^{(n)}(t) &= \frac{1}{n} \sum_{i=1}^{n} x(t-n+i)  \\
              &= \frac{1}{n} \Big( \underbrace{ x(t-n) - x(t-n) }_{= 0} + x(t-n+1) + x(t-n+2) + \dots + x(t) \Big)  \\
              &= \underbrace{ \frac{1}{n} \Big( x(t-n) + x(t-n+1) + x(t-n+2) + \dots + x(t-1) \Big) }_{= m^{(n)}(t-1)} - \frac{x(t-n)}{n} + \frac{x(t)}{n}  \\
              &= m^{(n)}(t-1) + \frac{x(t)}{n} - \frac{x(t-n)}{n}
 \end{align}

Da es sich hierbei um eine rekursive Berechnung handelt, entspricht dies einem Filter mit unendlicher Impulsantwort. In der Praxis kann solch ein Filter nur mit Werten endlicher Genauigkeit implementiert werden, sodass durch Effekte wie Rundungsfehler oder Auslöschung das Filter instabil werden kann.

Gewichteter gleitender Mittelwert[Bearbeiten]

Der gewichtete gleitende Mittelwert m(t) der Ordnung n einer Zeitreihe x(t) ist – analog zum Filter mit endlicher Impulsantwort – definiert als:


m_x^{(n)}(t-\tau) = \sum_{i=0}^{n-1} w_i \; x(t-i)

Dabei stellt wi die Gewichtung der jeweiligen Datenpunkte dar (äquivalent zur Impulsantwort des Filters). Wenn \tau > 0, ist das Filter nicht kausal, sondern berücksichtigt zukünftige Werte bei der Durchschnittsbildung. Die Summe über alle Gewichte muss 1 ergeben, da sonst noch eine Verstärkung oder Dämpfung hinzukommt.

Ein Beispiel ist das zentrierte Binomialfilter dritter Ordnung mit w_{0}=\tfrac14, w_{1}=\tfrac12, w_{2}=\tfrac14 und \tau = 1


m_{BIN}(t-1) = \tfrac14 x(t) + \tfrac12 x(t-1) + \tfrac14 x(t-2)

Spektrale Eigenschaften[Bearbeiten]

Über­tragungs­funktion im Frequenz­bereich des glei­tenden Mittel­werts der Breite 3 (φMA3) im Vergleich mit der eines Binomial­filter gleicher Breite (φBIN3)

Bildet man den zentrierten gleitenden Mittelwert n-ter Ordnung \bar X^{(n)} einer schwachstationären Zeitreihe X_t mit Spektraldichte f_X, dann hat \bar X^{(n)} die gefilterte Spektraldichte

|\varphi(\omega)|^2\cdot f_X(\omega)

mit der Übertragungsfunktion

|\varphi(\omega)|^2 := \frac{2\pi}n k_n(\omega),

wobei k_n den Fejér-Kern bezeichnet. An der grafischen Darstellung für n=3 mit Übertragungsfunktion \varphi(\omega)_{\text{MA}_3} = (1 + 2\cos(\omega))/3 kann man die Tiefpass-Eigenschaft erkennen: Frequenzen nahe 0 werden nicht gedämpft. Andererseits zeigt dieses einfache Filter das übliche Antwortverhalten bei der Faltung mit einem Rechtecksignal. Bei einer Filterbreite von 3 werden die Frequenzen bis zum Punkt \omega = \tfrac23\pi zunehmend bis zur vollständigen Unterdrückung gedämpft. Frequenzen, die über diesen Punkt hinaus vorhanden sind, werden nicht etwa auch unterdrückt, sondern treten mit invertierter Phase auf.

Das kleinste Binomialfilter mit ungerader Breite und mit den Gewichten \tfrac14, \tfrac12, \tfrac14 ist ein Tiefpass-Filter mit \varphi(\omega)_{\text{BIN}_3} = (1+ cos(\omega))/2 \ge 0 für alle Frequenzen. Es dämpft die Frequenzen bis \omega = \pi zunehmend und mit konstanter Phasenverschiebung.[1]

Chirp-Signal bis zur Nyquist-Frequenz (oben) und mit gleitendem Mittelwert (Breite: 7) gefaltete Variante (Mitte). Unten zum Vergleich ein mit einem Binomialfilter gefaltetes Signal (Breite: 7). Die Glättung mit dem gleitenden Mittelwert sollte zu einem Signal führen, das die tiefen Frequenzen (links) unverändert enthält, die hohen Frequenzen (rechts) jedoch herausfiltert. Zwischen diesen Extremen wird zunehmend gedämpft. Der ungewichtete gleitende Mittelwert (Mitte) erfüllt diese Aufgabe nur sehr unzureichend, der Binomialfilter dagegen erheblich besser.

Linear gewichteter gleitender Mittelwert[Bearbeiten]

Ein linear gewichteter gleitender Mittelwert (engl.: linear weighted moving average (LWMA, meist: WMA)) ordnet den Datenpunkten linear aufsteigende Gewichte zu, d. h. je weiter die Werte in der Vergangenheit liegen, desto geringer ist ihr Einfluss:


w_i = \frac{2i}{n (n+1)} \quad \forall i=1, \dots, n

m_{LWMA}^{(n)}(t) = \frac{2}{n (n+1)} \sum_{i=1}^n i \; x(t-n+i)

Exponentiell geglätteter Mittelwert[Bearbeiten]

Der exponentiell geglättete Mittelwert ordnet den Datenpunkten einer Zeitreihe exponentiell abnehmende Gewichte zu. Somit werden auch hier jüngere Datenpunkte stärker gewichtet als weiter zurückliegende, jedoch noch stärker als beim gewichteten gleitenden Mittelwert.


m_{EMA}^{(n)}(t) = \alpha x(t) + (1 - \alpha) m_{EMA}^{(n)}(t-1)

Da der exponentielle Mittelwert nicht nur Werte aus der Zeitreihe, sondern auch vorangegangene Mittelwerte miteinbezieht, stellt er ein Filter mit unendlicher Impulsantwort dar. Ein entscheidender Vorteil ist seine wesentlich kürzere Verzögerung bei gleicher Glättung.

Siehe auch[Bearbeiten]

Literatur[Bearbeiten]

Weblinks[Bearbeiten]

Einzelnachweise[Bearbeiten]

  1. Jens-Peter Kreiß, Georg Neuhaus: Einführung in die Zeitreihenanalyse. Springer, 2006, ISBN 978-3-540-25628-1