Replikation (Datenverarbeitung)

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Replikation oder Replizierung (lat. replicare „erwidern“, „wiederholen“) bezeichnet die mehrfache Speicherung derselben Daten an meist mehreren verschiedenen Standorten und die Synchronisation dieser Datenquellen.

Grundlagen[Bearbeiten]

Allgemein dient Replikation in der Datenverarbeitung dazu, Daten an mehreren Orten verfügbar zu machen. Dieses dient einerseits zur Datensicherung; andererseits zur Verkürzung der Antwortzeiten, besonders für lesende Datenzugriffe.

Die einfachste Form von Datenreplikation ist die Speicherung einer Kopie einer Datei (copy), in erweiterter Form das Kopieren und Einfügen (Copy & Paste) moderner Betriebssysteme.

Replikation ist auch die Vervielfältigung optischer Datenträger in einem Presswerk oder mit Hilfe eines Brenners.

Ändernde Datenzugriffe werden im Allgemeinen durch die Replikation aufwändiger. Bei der häufig anzutreffenden Master/Slave-Replikation unterscheidet man zwischen dem „Original“ der Daten (Primärdaten) und den abhängigen Kopien. Bei gleichrangigen Kopien (Versionsverwaltung) muss in der Replikation zu Mergestrategien gegriffen werden, die das Zusammenführen der Datenbestände (Synchronisation) ermöglichen.

Mitunter ist es wichtig zu wissen, welche Aktualität die Replikate besitzen müssen. Je nach Art der Replizierung liegt zwischen der Bearbeitung bzw. Erstellung der Primärdaten und ihrer Replizierung eine gewisse Zeitspanne. Diese Zeitspanne wird als timelines, meist aber als latency bezeichnet.

Synchrone Replikation[Bearbeiten]

Von synchroner Replikation spricht man, wenn eine Änderungsoperation an einem Datenobjekt nur dann erfolgreich abgeschlossen werden kann, wenn sie auch auf den Replikaten durchgeführt wurde. Um dies technisch umsetzen zu können, ist ein Protokoll zur Gewährleistung der Atomarität (Unteilbarkeit) von Transaktionen anzuwenden, das Commit-Protokoll.

Strategien synchroner Replikation:

Beispiele für eine synchrone Replikation sind:

  • Warm Standby Replikation von ASE-Sybase-Server-Datenbanken
  • Hot Standby Replikation von SQL-Server-Microsoft-Datenbanken

Asynchrone Replikation[Bearbeiten]

Wenn zwischen der Bearbeitung der primären Daten und der Replizierung eine Latenz liegt, spricht man von Asynchronität. Die Daten sind nur zu dem Zeitpunkt der Replikation synchron (identisch).

Eine einfache Variante der asynchronen Replikation ist die „File Transfer Replication“, der Transfer von Dateien via FTP oder SSH.

Die Daten der Replikate stellen also nur eine Momentaufnahme der primären Daten zu einem bestimmten Zeitpunkt dar. Auf Datenbankebene können so in kurzen Zeitintervallen die Transaktionslogs der Datenbanken von einem Server zum anderen transportiert und in die Datenbank eingelesen werden.

Unter Voraussetzung eines intakten Netzwerks entspricht die Latenz dann dem Zeitintervall, in dem die Transaktionslogs geschrieben werden.

Strategien asynchroner Replikation:

Vor- und Nachteile der Replikation[Bearbeiten]

Vorteile von Replikaten in verteilten Datenbanksystemen:

Nachteile:

  • hoher Updateaufwand
  • erhöhter Speicherplatzbedarf
  • mögliche Redundanz der Datensätze bei möglicher Vernetzung

Anwendungsmöglichkeiten[Bearbeiten]