PostgreSQL

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
PostgreSQL
PostgreSQL-Maskottchen
Entwickler PostgreSQL Global Development Group
Aktuelle Version 9.4.0
9.3.5
9.2.9
9.1.14
9.0.18
8.4.22
(20. März 2014[1])
Aktuelle Vorabversion 9.4 RC1[2]
(2014-11-20)
Betriebssystem Unix-Derivate, Linux, Windows
Programmier­sprache C
Kategorie Datenbanksystem, Server
Lizenz PostgreSQL Lizenz[3] vergleichbar der BSD-Lizenz oder der MIT-Lizenz
Deutschsprachig nein
www.postgresql.org

PostgreSQL (englisch [,pəʊstgɹɛs kjʊ'ɛl])[4] ist ein freies, objektrelationales Datenbankmanagementsystem (ORDBMS). Seine Entwicklung begann in den 1980er Jahren, seit 1997 wird die Software von einer Open-Source-Community weiterentwickelt.

PostgreSQL ist weitgehend konform mit dem SQL-Standard ANSI-SQL 2008,[5] d. h. der Großteil der Funktionen ist verfügbar und verhält sich wie definiert. PostgreSQL ist vollständig ACID-konform (inklusive der Data Definition Language), und unterstützt erweiterbare Datentypen, Operatoren, Funktionen und Aggregate[6]. Obwohl sich die Entwicklergemeinde sehr eng an den SQL-Standard hält, gibt es dennoch eine Reihe von PostgreSQL-spezifischen Funktionalitäten, wobei in der Dokumentation bei jeder Eigenschaft ein Hinweis erfolgt, ob dies dem SQL-Standard entspricht, oder ob es sich um eine spezifische Erweiterung handelt. Darüber hinaus verfügt PostgreSQL über ein umfangreiches Angebot an Erweiterungen durch Dritthersteller, wie z. B. PostGIS.

PostgreSQL ist in den meisten Linux-Distributionen enthalten. Apple liefert seit der Version Mac OS X 10.7 („Lion“) PostgreSQL als Standarddatenbank aus.

Geschichte[Bearbeiten]

Timeline postgresql.png

PostgreSQL, zuvor bekannt unter dem Namen Postgres, später Postgres95, entstand aus einer Datenbankentwicklung der University of California in Berkeley. Den Anfang stellte dabei das Ingres-Projekt dar, wobei der Hauptverantwortliche Michael Stonebraker 1982 die Universität verließ, um Ingres kommerziell zu vertreiben. Nachdem Stonebraker 1985 wieder zur Universität zurückkehrte, startete er das Post-Ingres-Projekt, um die Probleme der damaligen Datenbankmanagementsysteme auszumerzen. Die Codebasis des ersten Postgres ist dabei eine andere als die von Ingres.

1989 wurde die erste Version von Postgres fertiggestellt.

Im Jahre 1994 wurde Postgres von den Studenten Andrew Yu und Jolly Chen um einen SQL-Interpreter erweitert und die Software als Open Source unter dem Namen Postgres95 freigegeben. Der Postgres95-Code entsprach dem ANSI-C-Standard und wurde um 25 % verkleinert, weiterhin wurden Performance und Zuverlässigkeit verbessert. Postgres95 Version 1.0.x war im Wisconsin Benchmark 30 bis 50 Prozent schneller als Postgres, Version 4.2.

Im Zuge der Entwicklung des World Wide Web verstärkte sich das Interesse an Datenbanken. Die Entwicklung von PostgreSQL wurde 1996, zusammen mit dem Wechsel auf den heutigen Namen, begonnen. Die erste veröffentlichte Version unter diesem Namen ist 6.0. Seitdem wurde PostgreSQL fortlaufend weiterentwickelt.

Eigenschaften[Bearbeiten]

  • Umfassendes Transaktionskonzept, das Multiversion Concurrency Control (MVCC) unterstützt
  • Ermöglicht komplexe Abfragen mit Unterabfragen (Subselects), auch geschachtelt
  • Referentielle Integrität (u. a. Constraints, Fremdschlüssel)
  • Mengenoperationen
  • Maximale Datenbankgröße nur durch zur Verfügung stehenden Speicher begrenzt
  • Views, die mit Hilfe von Regeln (Rules und Triggers) auch schreibfähig sein können (Updatable Views)
  • Trigger und gespeicherte Prozeduren (stored procedures) sind in verschiedenen Sprachen möglich: PL/pgSQL, PL/c, PL/Tcl, PL/Python, PL/Perl, PL/Java, PL/PHP, PL/Ruby, PL/R, PL/sh, PL/Scheme, PL/Parrot, PL/V8 (derzeit noch experimentell)
  • Schnittstellen zu vielen Programmiersprachen, u. a. C, C++, Object Pascal, Java/JDBC, Tcl, PHP, Perl, Python, Ruby sowie zu ODBC und .NET
  • Lauffähig auf vielen Unix-Plattformen, ab Version 8.0 auch nativ unter Microsoft Windows
  • Export und Import sowohl von Daten als auch von Datenbankstrukturen (Schemata)
  • Erweiterbarkeit durch Funktionen, selbstdefinierbare Datentypen und Operatoren
  • Asynchrone und Synchrone Replikation. Der Vorteil der synchronen Replikation liegt in der Sicherstellung, dass die Transaktion mindestens auf zwei Servern tatsächlich ausgeführt wurde, womit ein vollständiges Backup jederzeit garantiert werden kann (Hot Standby). Diese Ausfallsicherheit wird naturgemäß durch eine längere Wartezeit auf das Commit erkauft. Daher gibt es auch die Möglichkeit, besonders wichtige Geschäftsprozesse wie finanzielle Transaktionen synchron zu replizieren, und bei weniger wichtigen Transaktionen, wie dem Logging der Benutzerinteraktionen, die sehr viel schnellere asynchrone Replikation zu nutzen.

Erweiterungen[Bearbeiten]

Eine Reihe von durch den Benutzer zu installierenden Zusatzmodulen steht zur Verfügung, darunter mit GiST (Generalized Search Tree) eine universelle Schnittstelle, um Such- und Sortierverfahren in weiten Grenzen selbst definieren zu können. Eine Anwendung davon ist PostGIS, das geografische Objekte und Datenstrukturen verwalten und damit als Datenbank für Geoinformationssysteme (GIS) dienen kann. Eine andere GiST-Anwendung ist OpenFTS (Open Source Full Text Search), das Volltextsuche in DB-Objekten erlaubt.

Eine Reihe von Erweiterungen beschäftigt sich mit Clustering und Replizierung, dem parallelen Einsatz und Abgleich verteilter DB-Server.

Limits[Bearbeiten]

In diesem Abschnitt werden einige Einschränkungen der aktuellen Version beschrieben. Wenn zukünftige Releases bereitgestellt werden, könnten einige dieser Einschränkungen weggefallen sein.

Die hier beschriebenen Einschränkungen betreffen die Version 8.4. bis 9.3:[7]

  • maximale Größe der Datenbank: unbeschränkt
  • maximale Größe einer Tabelle: 32 TB
  • maximale Größe eines Datensatzes: 1,6 TB
  • maximale Größe einer Zelle: 1 GB
  • maximale Anzahl Zeilen pro Tabelle: unbeschränkt
  • VARCHAR- und TEXT-Spalten können nicht länger als 1 GB sein
  • Die maximale Anzahl der Spalten pro Tabelle ist abhängig von den verwendeten Datentypen und liegt zwischen 250 und 1600

Upgrade der Datenbank[Bearbeiten]

Jede Nebenversionsnummer wird von der PostgreSQL-Entwickler-Community 5 Jahre lang weitergepflegt. Revisionen enthalten Leistungsverbesserungen und Fehlerbereinigungen, aber niemals neue Funktionen. Die älteste derzeit noch gepflegte Version ist 9.0, die im September 2010 erschien.

Bei einer Software-Aktualisierung müssen bestehende Datenbanken vorher gesichert, danach in der neuen PostgreSQL-Version neu angelegt und die Daten aus der vorherigen Sicherung eingespielt werden. Dies ist dann erforderlich, wenn sich die zweite oder erste Stelle der Versionsnummer geändert hat, nicht jedoch bei Änderungen der dritten Stelle.

Neuere Versionen liefern ein Werkzeug namens pg_upgrade[8] mit, welches das Datenverzeichnis ohne das vorher notwendige Sichern und Wiedereinspielen der Datenbank aktualisieren kann.

Aktuell[Bearbeiten]

Seit der Version 8.0 unterstützt PostgreSQL Windows. Eine weitere Neuerung ist die Unterstützung von Sicherungspunkten (Savepoints). Mit diesen ist es möglich, eine Transaktion an einem vorher gespeicherten Sicherungspunkt fortzusetzen, falls diese durch einen Fehler abgebrochen wurde.

Version 8.3 wurde im Februar 2008 veröffentlicht und brachte eine Reihe von Performance-Verbesserungen sowie Funktionserweiterungen, darunter:

  • Volltextsuche, die bisher als Zusatzprodukt verfügbar war, ist nun in den Kern der DB integriert.
  • XML-Verarbeitung wird durch einen XML-Datentypen unterstützt, der jeweils ein XML-Dokument enthält; bei Abfragen können nun etwa SQL- mit XPath-Queries in einer Transaktion kombiniert werden. Dieses Verfahren wurde 2006 bei DB2 von IBM vorgestellt.
  • Datentypen ENUM und UUID.

Version 9.0 wurde im September 2010 veröffentlicht und brachte Funktionen für Replikation und Hot-Standby und Verbesserungen bei Sicherheit, Monitoring und speziellen Datentypen.[9]

Version 9.1 wurde am 12. September 2011 veröffentlicht. Diese Version brachte eine Verbesserung der Hochverfügbarkeit bei Betrieb von mehreren Servern mit Hilfe synchroner Replikation, Zugriff auf fremde Datenquellen, spaltenweise linguistisch korrekte Sortierbarkeit, Einbindung von Erweiterungen sowie eine Reihe weiterer Verbesserungen.[10]

Version 9.2 wurde am 10. September 2012 veröffentlicht und beinhaltet in erster Linie neue Funktionalitäten zur Verbesserung der Performance.[11]

Version 9.3 wurde am 9. September 2013 veröffentlicht, wesentliche Verbesserungen sind im Bereich der Unterstützung von JSON, bei materialisierten Views und beschreibbaren Views.

Softwarewerkzeuge[Bearbeiten]

PostgreSQL selbst läuft als Hintergrundprozess und kann auf verschiedene Weise interaktiv bedient werden. Für die kommandozeilenorientierten Bedienung wird die Konsolenanwendung psql mit der Installation mitgeliefert. Programme mit grafischer Benutzeroberfläche zur Bedienung und Verwaltung der Datenbank müssen oft gesondert installiert werden: freie Produkte sind etwa PgAdmin[12] und phpPgAdmin. Daneben werden eine Vielzahl von kommerziellen Werkzeugen angeboten, die auch grafische CASE-Modellierung, Im- und Export-Funktionen oder DB-Monitoring bieten. Ein MySQL-Migrationshilfswerkzeug ist in jedem freien PostgreSQL Downloadpaket von EnterpriseDB[13] enthalten.

Preise und Auszeichnungen[Bearbeiten]

An PostgreSQL wurden in der Vergangenheit zahlreiche Preise vergeben.[14] Zuletzt erhielt das Projekt den „Linux New Media Awards 2012“ als die beste Open-Source-Datenbank.[15]

Literatur[Bearbeiten]

  • Peter Eisentraut, Bernd Helmle: PostgreSQL Administration 2.Auflage. O'Reilly 10/2010, ISBN 978-3-89721-661-7
  • Andreas Scherbaum: PostgreSQL. Datenbankpraxis für Anwender, Administratoren und Entwickler. Open Source Press 08/2009, ISBN 978-3-937514-69-7

Weblinks[Bearbeiten]

 Commons: PostgreSQL – Sammlung von Bildern, Videos und Audiodateien

Produkt und Community[Bearbeiten]

Werkzeuge und Erläuterungen[Bearbeiten]

Distributionen[Bearbeiten]

Einzelnachweise[Bearbeiten]

  1. PostgreSQL updates 9.3.5, 9.2.9, 9.1.14, 9.0.18, and 8.4.22 released. In: PostgreSQL.org. 24. Juli 2014, abgerufen am 24. Juli 2014 (englisch).
  2. PostgreSQL 9.4 RC1 Released
  3. PostgreSQL: License. In: PostgreSQL.org. Abgerufen am 11. April 2012 (englisch).
  4. Hörbeispiel zur Aussprache von „PostgreSQL“ (MP3-Datei; 5,6 kB)
  5. PostgreSQL: Documentation: Manuals: PostgreSQL 9-1: SQL Conformance. In: PostgreSQL.org. Abgerufen am 11. April 2012 (englisch).
  6. PostgreSQL: Feature Matrix. In: PostgreSQL.org. Abgerufen am 19. Mai 2012 (englisch).
  7. PostgreSQL: About. In: PostgreSQL.org. Abgerufen am 11. April 2012 (englisch).
  8. PostgreSQL: Documentation: Manuals: PostgreSQL 9-1: pg_upgrade. In: PostgreSQL.org. Abgerufen am 11. April 2012 (englisch).
  9. PostgreSQL 9.0 mit eingebauter Replikation. In: heise online. 20. September 2010, abgerufen am 11. April 2012.
  10. PostgreSQL 9.1 erschienen – Artikel bei Golem.de, vom 16. September 2011
  11. PostgreSQL 9.2: Release Notes – PostgreSQL-Online-Dokumentation, vom 10. September 2012
  12. pgadmin.org (englisch)
  13. Downloadseite für PostgreSQL. Abgerufen am 24. September 2011.
  14. Liste der Auszeichnungen auf der Projektseite.
  15. Cebit 2012: Android, Libre Office und Samsung streichen Preise ein, 8. März 2012, linux-magazin.de
  16. enterprisedb.com/ Postgres Plus Server (english). Abgerufen am 27. September 2011.