Staging (Datenbank)

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Staging ist ein Prozess der Informationsintegration, in dem Daten in einem Datenbereich (engl.: staging area, der Bereitstellungsraum oder Sammelplatz beim Militär) temporär zwischengespeichert werden, um sie dort zu bereinigen und zu transformieren. Nach dem Bereinigungs- und Transformationsschritt werden die Daten in eine Zieldatenbank geladen.

Staging und der ETL-Prozess[Bearbeiten]

Staging wird typischerweise bei der Implementierung eines ETL-Prozesses verwendet. Dieser Prozess dient dazu, Daten aus einer Reihe von operativen Datenbanken in einer zentralen Datenbank - häufig ein Datenlager (data warehouse) - zusammenzuführen. Dort können die Daten mittels Methoden wie u. a. OLAP, Data-Mining, Text Mining analysiert werden.

Staging-Area[Bearbeiten]

Die Daten werden dabei zunächst aus den Datenquellen extrahiert (extract) und in der Staging-Area gesammelt und zwischengespeichert. Dort werden die Daten bereinigt (cleanse, scrub) und transformiert (transform), ohne die Datenquellen weiter zu belasten. Die so aufbereiteten Daten werden abschließend aus der Staging-Area in die Zieldatenbank gespeichert (load). Die bereinigten Daten können auch genutzt werden, um die Daten in den jeweiligen Quell(system)en anzugleichen.