ARMA-Modell

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Dieser Artikel oder Abschnitt bedarf einer Überarbeitung. Näheres ist auf der Diskussionsseite angegeben. Hilf mit, ihn zu verbessern, und entferne anschließend diese Markierung.

Das Akronym ARMA (Autoregressive-Moving Average) und die daran angelehnten Kunstwörter ARMAX und ARIMA bezeichnen lineare, zeitdiskrete Modelle für stochastische Prozesse. Sie werden zur statistischen Analyse von Zeitreihen besonders in den Wirtschafts-, Sozial- und Ingenieurwissenschaft eingesetzt. Die Spezifikation, Schätzung, Validierung und praktische Anwendung von ARMA-Modellen werden im Box-Jenkins-Ansatzes behandelt. Als wichtigste Anwendung gilt die kurzfristige Prognose. Diese Modelle haben die Form von linearen Differenzengleichungen und dienen dazu, lineare stochastische Prozesse abzubilden bzw. komplexere Prozesse zu approximieren.

Mathematische Darstellung[Bearbeiten | Quelltext bearbeiten]

Fließen in ein ARMA-Modell sowohl vergangene Rauschterme als auch vergangene Werte der Zeitreihe selbst ein, spricht man auch von einem gemischten ARMA-Modell. Sind es nur aktuelle und vergangene Rauschterme, handelt es sich um ein (reines) Moving-Average- oder MA-Modell, sind es neben dem aktuellen Rauschterm nur vergangene Werte der Zeitreihe selbst, um eine (reines) autoregressives oder AR-Modell.

Moving-Average- oder MA-Modell[Bearbeiten | Quelltext bearbeiten]

Das zu modellierende Signal ist durch ein gewichtetes, gleitendes Mittel (Moving Average) von Rauschtermen in der aktuellen und den Vorperioden sowie einer Konstanten gegeben. Die sogenannten MA-Koeffizienten geben an, mit welchem Gewicht der Rauschterm in das Signal einfließt.

Bezüglich der Rauschterme wird angenommen, dass sie zeitlich voneinander unabhängig und identisch (meist Gauß-)verteilt sind, mit Erwartungswert 0 und der Varianz .

Autoregressives oder AR-Modell[Bearbeiten | Quelltext bearbeiten]

Das Signal setzt sich aus einer Konstanten, einem Rauschterm und einem gewichteten, gleitenden Mittel der vorhergehenden Signalwerte zusammen, wobei die AR-Koeffizienten die Gewichte sind.

ARMA-Modell[Bearbeiten | Quelltext bearbeiten]

Dieses Modell wird auch als ARMA(p,q)-Modell bezeichnet, wobei p und q, jeweils die autoregressive und die Moving-Average-Ordnung des Prozesses angeben. Reine AR(p)- bzw. MA(q)-Modelle sind also spezielle ARMA-Modelle mit q=0 bzw. p=0.

Mit Hilfe des so genannten Verschiebungs- oder Lag-Operators (von lag, „Zeitverschiebung“):

schreibt man kürzer auch:

wobei und jeweils Polynome (der Grade p und q) sind:

,
.

Alternative Darstellungen[Bearbeiten | Quelltext bearbeiten]

Reine MA-Darstellung[Bearbeiten | Quelltext bearbeiten]

Ist ein ARMA-Prozess stationär hat er auch eine reine MA-Darstellung, die es erlaubt, den Prozess auch als einen MA()-Prozesses auszudrücken:

wobei der Erwartungswert von durch und die Koeffizienten der reinen MA-Darstellung durch das Polynom gegeben sind.

Reine AR-Darstellung[Bearbeiten | Quelltext bearbeiten]

Die Analogie zur reinen MA-Darstellung ist die reine AR-Darstellung. Sie erfordert, dass der Prozess invertierbar ist, also die Wurzeln des MA-Polynoms größer eins sind. Dann gilt:

bzw.

Spezialfälle und Erweiterungen[Bearbeiten | Quelltext bearbeiten]

Weißes Rauschen[Bearbeiten | Quelltext bearbeiten]

Ein ARMA(0,0)-Prozess , also wenn einfach der Rauschterm ist (möglicherweise plus einer Konstanten), dann spricht man von weißem Rauschen.

Random Walk[Bearbeiten | Quelltext bearbeiten]

Ein Random Walk ist ein AR-Prozess erster Ordnung (p=1), bei dem der AR-Koeffizient den Wert 1 hat, also

Ist Konstante , dann spricht man auch von einem Random Walk mit Drift.

ARIMA[Bearbeiten | Quelltext bearbeiten]

Bei nicht-stationären Zeitreihen kann unter Umständen durch Differenzenbildung Stationarität induziert werden. Die erste Differenz von ist durch definiert, wobei der sogenannte Differenzen-Operator ist. Modelliert man nicht , sondern die d-te Differenz als ARMA(p,q) modell, dann spricht man von einem integrierten ARMA-Modell der Ordnungen p, d, und q, oder kurz: einem ARIMA(p,d,q)-Modell. Werte für die ursprüngliche, undifferenzierte Zeitreihe erhält man durch d-faches Integrieren („Anti-Differenzenbildung“) von .

ARMAX[Bearbeiten | Quelltext bearbeiten]

Werden eine oder mehrere exogene Variablen benötigt, um die Zeitreihe zu modellieren, dann spricht man von einem ARMAX-Modell. Im Falle einer exogenen Variable gilt dann:

wobei das Polynom die Lag-Struktur beschreibt, mit der die exogene Variable die zu erklärende Variable beeinflußt.

Saisonale ARMA-Modelle[Bearbeiten | Quelltext bearbeiten]

In Wirtschafts- aber auch anderen Zeitreihen treten häufig saisonale Effekte auf. Beispiele sind monatliche Arbeitslosenzahlen, quartalsweise Einzelhandelsumsätze etc. Um diese zu berücksichtigen, können zusätzlich saisonale AR- bzw. MA-Komponenten spezifiziert werden. Liegen Daten mit einer saisonalen Spanne s (z.B. s=12 für Monatsdaten und s=4 für Quartalsdaten) vor, dann hat das saisonale ARMA-Model die Form:

wobei das saisonale AR-Polynom der Ordnung ist und das saisonale MA-Polynom der Ordnung . In Kurzform: ARMA(p,q)x(P,Q,s).

Modellierung[Bearbeiten | Quelltext bearbeiten]

Die ARMA-Modellierung folgt in der Praxis meist der Box-Jenkins-Methode, die aus den Schritten Modellidentifikation, -schätzung, -validierung und -anwendung besteht.

Identifikation[Bearbeiten | Quelltext bearbeiten]

Ziel der Identifikation ist es, die ARMA-Spezifikationsparameter d, p und q zu bestimmen. Zur Bestimmung von d, der notwendigen Differenzen-Ordnung, können Einheitswurzeltests verwendet werden. Für die ARMA-Ordnungen p und q werden häufig die Autokorrelationsfunktion (AKF) und die partielle Autokorrelationsfunktion herangezogen sowie Kriterien zur Modellselektion, wie das AIC oder BIC.

Schätzung[Bearbeiten | Quelltext bearbeiten]

Die Schätzung der Modellparameter erfolgt meist durch oder Maximum-Likelihood-Schätzung oder Kleinst-Quadrat-Schätzung. Im Fall von reinen AR-Modellen ist der Kleinst-Quadrat-Schätzer ein linearer Schätzer; ansonsten ist eine nichtlineare Kleinst-Quadrat-Schätzung erforderlich.

Validierung[Bearbeiten | Quelltext bearbeiten]

Um die Geeignetheit eines geschätzten Modells zu beurteilen, können verschiedene Kriterien herangezogen werden. In der Regel wird geprüft, ob die Residuen, also die geschätzten unkorreliert sind und sich wie weißes Rauschen verhalten. Darüber hinaus kann auch die Prognosegüte evaluiert werden. Erscheint ein Modell nicht adäquat, kann ein erneutes Durchlaufen des Identifikations- und Schätzschrittes ggf. Abhilfe schaffen.

Anwendung[Bearbeiten | Quelltext bearbeiten]

Nach erfolgreicher Validierung kann die Modellanwendung betrieben werden. Häufig ist das die Kurzfristprognose. Eine Einschritt-Prognose erhält man zum Beispiel, indem man die Differenzengleichung des geschätzten ARMA-Modells eine Periode in die Zukunft schiebt und den bedingten Erwartungswert berechnet. Für Mehrschritt-Prognosen kann dies rekursiv wiederholt werden.

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Literatur[Bearbeiten | Quelltext bearbeiten]

  • Box, G.E.P. und Jenkins, G.M.: Time series analysis: Forecasting and control. Holden-Day, San Francisco 1970
  • McCleary, R. und Hay, R.A.: Applied Time Series Analysis for the Social Sciences. Sage Publications, Beverly Hills 1986
  • Hamilton, James D.: Time Series Analysis. Princeton University Press, Princeton 1994
  • Enders, W.: Applied Econometic Time Series. John Wiley & Sons INC. 1995
  • Mills, Terence C.: The Econometric Modelling of Financial Time Series. 2nd Edition, Cambridge University Press 1999
  • Tsay, Ruey S.: Analysis of Financial Time Series. 2nd Edition, Wiley Series in Prob. and Statistics 2005
  • Stier, W.: Methoden der Zeitreihenanalyse. Springer 2001