Apache Cassandra

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Cassandra
Logo
Entwickler Apache Software Foundation
Aktuelle Version 3.7
13. Juni 2016[1]

3.0.9 (LTS)
20. September 2016[1]

2.2.7 (LTS)
5. Juli 2016[1]

Nur Sicherheitskorrekturen:
2.1.15 (LTS)
5. Juli 2016[1]

Betriebssystem plattformübergreifend
Programmier­sprache Java
Kategorie Datenbankmanagementsystem
Lizenz Apache
deutschsprachig nein
cassandra.apache.org

Cassandra ist ein einfaches, verteiltes Datenbankverwaltungssystem für sehr große strukturierte Datenbanken (ein sogenanntes „NoSQL“-Datenbanksystem). Es ist auf hohe Skalierbarkeit und Ausfallsicherheit bei großen, verteilten Systemen ausgelegt. Die Daten werden in Schlüssel-Wert-Relationen abgelegt. Es ist offen dokumentiert und in Java implementiert. Die Implementierung wird als freie Software unter den Bedingungen von Version 2 der Apache-Lizenz verbreitet.

Geschichte[Bearbeiten | Quelltext bearbeiten]

Cassandra wurde ursprünglich bei Facebook von Avinash Lakshman (einem der Autoren von Amazons Dynamo) und Prashant Malik für das Inbox-Search-Problem bei Facebook entwickelt[2] und im Juli 2008 freigegeben. Danach haben auch andere große Unternehmen wie IBM, Rackspace[3] und Twitter zum Code beigetragen. Das Projekt wurde im März 2009 bei der Apache Software Foundation als Unterprojekt in den Apache Incubator aufgenommen. Am 17. Februar 2010 wurde Cassandra von der Apache Software Foundation zum „Top-Level“-Projekt erklärt[4] und ist somit kein Unterprojekt von Apache Incubator mehr. Die am 2. Juni 2011 erschienene Version 0.8 führt die Cassandra Query Language (CQL) ein, eine Abfragesprache mit SQL-ähnlicher Syntax.[5]

Verwendung[Bearbeiten | Quelltext bearbeiten]

Cassandra wird bei Twitter, Digg[6] und Reddit genutzt.[5] Auch bei Facebook bediente es bis Mitte 2011 hunderte Millionen von Mitgliedern (seit Juli 2011 ersetzt durch eine Kombination aus HBase, HDFS und Haystack).[7]

DataStax listet eine Vielzahl (160 im März 2012) von Benutzern auf seinen Webseiten. Die zur besseren Übersicht angebotenen Filter nach Marktsegmenten betonen das breite Spektrum der Anwendungen: Communication, Education, Financial, Healthcare, Security, Social Media/Networks uvm.[8] Cassandra ist die populärste spaltenorientierte NoSQL-Datenbank.[9]

Konzept[Bearbeiten | Quelltext bearbeiten]

Cassandra ist eine spaltenorientierte NoSQL-Datenbank. Sie kann als Mischung aus Amazon Dynamo und Google BigTable gesehen werden, da es leicht weiterentwickelt die Replikationsmechanismen von Dynamo nutzt, gleichzeitig aber nach außen die Datenstruktur von BigTable anbietet.

Weblinks[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. a b c d Downloadseite bei apache.org, abgerufen am 21. September 2016 (englisch).
  2. Avinash Lakshman: Cassandra – A structured storage system on a P2P Network
  3. Jonathan Ellis: The Cassandra Project (Memento vom 30. Januar 2011 im Internet Archive).
  4. http://www.mail-archive.com/cassandra-dev@incubator.apache.org/msg01518.html
  5. a b Oliver Diedrich: NoSQL-Datenbank Cassandra in Version 0.8. In: Heise online. 6. Juni 2011, abgerufen am 11. März 2016.
  6. Looking to the future with Cassandra
  7. Storage Infrastructure behind Facebook Messages (engl.)
  8. Cassandra Users | DataStax - Anwendungen von Cassandra
  9. DB-Engines Ranking von Wide Column Stores