Bigtable

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 27. Juni 2016 um 18:15 Uhr durch Der.Traeumer (Diskussion | Beiträge) (Änderungen von 95.88.211.129 (Diskussion) auf die letzte Version von Wunschpunkt zurückgesetzt (HG)). Sie kann sich erheblich von der aktuellen Version unterscheiden.
Zur Navigation springen Zur Suche springen

BigTable ist ein Hochleistungs-Datenbanksystem des US-amerikanischen Unternehmens Google Inc.

Geschichte

Die Entwicklung von BigTable begann 2004. Es wird mittlerweile von vielen hauseigenen Produkten, wie etwa MapReduce, Google Maps, Google Bücher, YouTube oder Google Earth, genutzt. Besonderer Wert wurde auf Skalierbarkeit und Geschwindigkeit gelegt. Die Datenbank basiert deshalb auch auf einer nichtrelationalen Struktur.

Technik

Charakteristisch für in BigTable gespeicherte Daten ist, dass sehr häufig Datensätze hinzugefügt werden, vorhandene Datensätze aber sehr selten geändert werden. Eine BigTable besteht grundlegend aus sehr vielen Zeilen, die durch einen Datensatzidentifikator benannt werden. Innerhalb einer Zeile können beliebig viele Spalten definiert werden. Im Gegensatz zu relationalen Datenbanken kann die Anzahl der Spalten für jede Zeile unterschiedlich groß sein. Lediglich die sogenannten Family Columns, die einen gleichen Datentyp (wie beispielsweise einen Link, der auf eine Seite verweist) beinhalten, müssen bei der Implementierung der Datenbank bekannt sein, können aber beliebig viele Instanzen pro Zeile enthalten.[1]

Jede Tabelle ist mehrdimensional. Zur Versionierung erhält jeder Eintrag einen Timestamp. Mithilfe von Timestamps kann stets die neueste Version der Daten berücksichtigt werden, ohne ältere Daten zu bearbeiten oder zu löschen.

Beispiel

Der Anbieter selbst beschreibt in einer Publikation[1] ein Beispiel für die Verwendung von BigTable durch die hauseigene Suchmaschine: Für jede zuvor durch einen Crawler gescannte neue Webseite wird eine Zeile in der entsprechenden BigTable angelegt. Die erste Spalte enthält den ersten Inhalt (in HTML-Syntax) der Seite. Die Multidimensionalität entsteht durch spätere Versionen der gleichen Seite und den zugeordneten Zeitstempel (Timestamp). Die nachfolgenden Spalten entstammen alle der gleichen FamilyColumn „anchor“ und enthalten jeweils die URL einer anderen Seite, die auf die entsprechende Seite verlinkt. Somit ist die Anzahl der Spalten seitens des Anbieters nicht beschränkt.

Einzelnachweise

  1. a b Bigtable: A distributed storage system for structured data (pdf-Datei, 216 KB)