Apache Subversion

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Subversion (Software))
Wechseln zu: Navigation, Suche
Apache Subversion
Subversion-Logo
Entwickler CollabNet
Aktuelle Version 1.8.13
(31. März 2015)
Betriebssystem AIX, GNU/Linux, Windows, Mac OS X, *BSD, Solaris, OS/400
Programmier­sprache C
Kategorie Versionsverwaltung
Lizenz Apache-Lizenz 2.0
Deutschsprachig ja[1]
subversion.apache.org
Zentrale Verwaltung eines Repositories mit Hilfe von Subversion.

Apache Subversion (SVN) ist eine freie Software zur zentralen Versionsverwaltung von Dateien und Verzeichnissen.

Die Versionierung erfolgt in einem zentralen Projektarchiv (engl. repository) in Form einer einfachen Revisionszählung. Wenn Änderungen an Inhalten verteilt auf den Computern der Bearbeiter ausgeführt werden, werden zwischen dem Projektarchiv und einem Arbeitsplatz jeweils nur die Unterschiede zu bereits vorhandenen Ständen übertragen.

Allgemeines[Bearbeiten]

Subversion wird als freie Software unter einer Lizenz im Stil der Apache-Lizenz veröffentlicht.

Die Benennung „Subversion“ setzt sich aus den Worten Sub und Version zusammen und kann so als Unterversion, frühere Version verstanden werden. Der Name wurde von Jim Blandy geprägt, der auch das initiale Design des Subversion-Speichers definierte. Er verstand die Software als eine Weiterentwicklung von CVS, wobei als Reaktion auf weit verbreitete Kritik an CVS insbesondere die Handhabung von Versionshistorien geändert wurde[2]. So ist es mit Subversion – im Gegensatz zu CVS – z. B. möglich, Dateien oder Verzeichnisse zu verschieben oder umzubenennen, ohne die Versionsgeschichte zu verlieren. Details finden sich im Abschnitt Unterschiede zu CVS. In der Bedienung der Kommandozeilenversion ist es dagegen sehr ähnlich gehalten.

Mit cvs2svn gibt es einen Konverter, mit dem ein CVS-Repository zu Subversion konvertiert werden kann. Auch für die Migration von anderen Versionsverwaltungs-Systemen (etwa PVCS, Visual Source Safe, ClearCase, MKS[3], Perforce, StarTeam, …) sind verschiedene kostenfreie Import-Werkzeuge erhältlich.

Geschichte[Bearbeiten]

Subversion wurde seit Anfang 2000 bei CollabNet entwickelt.

Am 4. November 2009 gaben ehemaliger und neuer Hoster in einer gemeinsamen Presseerklärung bekannt, dass das Projekt auf Entschluss von CollabNet zur Apache Software Foundation wechseln werde.[4] Am 7. November 2009 startete Apache Subversion im Apache Incubator, seit 17. Februar 2010 ist Apache Subversion ein Top-Level-Apache-Projekt.

Releases[Bearbeiten]

Release Erscheinungsdatum Bemerkungen
1.0 23. Februar 2004
1.1 29. September 2004 Projektarchive (Repositories) können nicht mehr nur in einer Berkeley-Datenbank verwaltet werden, sondern auch direkt im Dateisystem. Internationalisierte Programmausgaben.
1.2 23. Mai 2005 Bearbeitungssperren für Dateien, was für binäre Dateien von Vorteil sein kann.
1.3 1. Januar 2006 Verbesserungen in den Bereichen Server-Logging, Autorisierung, Programmiersprachen-Anbindungen, Kommando-Optionen und Performance.
1.4 10. September 2006 Neues Programm svnsync, welches das Spiegeln von Projektarchiven (Repositories) ermöglicht.
1.5 19. Juni 2008 Neue Funktionalität Merge-Tracking, das dokumentierte Zusammenführen verschiedener Teilbäume.
1.6 20. März 2009 Verbesserungen des Merge-Tracking und der Sicherheitsfunktionen.
1.7 11. Oktober 2011 Änderung der Metadatenverwaltung: anstatt Metadaten in .svn-Ordnern in jedem Unterverzeichnis zu speichern, werden sie jetzt in einem einzigen .svn-Ordner im Hauptverzeichnis der Arbeitskopie in einer SQLite-Datenbank gespeichert.
1.8 15. Dezember 2014 Lokales (Working copy) Verschieben/Umbenennen von Dateien wird transparent unterstützt, Vereinfachungen des Reintegrierens von Teilbäumen, vererbte Eigenschaften und Einstellungen direkt im Projektarchiv.

Besonderheiten[Bearbeiten]

Versionsschema[Bearbeiten]

Das Versionsschema von Subversion bezieht sich nicht auf einzelne Dateien, sondern auf das ganze Projektarchiv. Dieses bekommt bei jeder Änderung eine neue „Revisionsnummer“ zugeordnet. Somit kann einfach und konsistent eine exakte Version des Projektarchivs beschrieben werden (z. B. „Revision 2841“ statt „Version vom 23. März 2004 20:56:31 UTC“). Die Revisionsnummer einer Datei entspricht dabei der Revisionsnummer des Projektarchivs zum Zeitpunkt der letzten Änderung der Datei. Die Revisionsnummer eines Verzeichnisses entspricht der höchsten Revisionsnummer aller enthaltenen Dateien und Verzeichnisse. Die Abfolge der Revisionsnummern einer einzelnen Datei kann also durchaus lückenhaft sein, wenn die Datei nicht bei jeder Änderung (Commit) am Repository geändert wurde. Beispielsweise könnte eine Datei bei der Revision 25 zum Projektarchiv hinzugefügt und jeweils einmal in der Revision 48 und der Revision 52 verändert worden sein. Beim Abrufen (Checkout) einer Datei wird die größte Revisionsnummer abgerufen, die kleiner oder gleich der angeforderten ist. Wird in dem Beispiel die Revision 52 angefordert, so wird die Revision 52 der Datei abgerufen; wird hingegen die Revision 51 angefordert, liefert Subversion die Inhalte von Revision 48.

Änderungsverfolgung[Bearbeiten]

Subversion speichert Client-seitig bei jedem Checkout, Update und Commit einer Datei eine Kopie, welche im .svn-Verzeichnis abgelegt wird. Dadurch verdoppelt sich der Speicherbedarf einer Arbeitskopie, allerdings bietet dies bei entfernten Projektarchiven auch einige Vorteile. So können einige Aktionen, wie Anzeige der lokalen Änderungen, ganz ohne Netzwerkzugriff erfolgen, und Subversion muss beim Übertragen nur die geänderten Teile einer Datei übertragen. Auch ist es möglich, jederzeit die Änderungen einer Datei gegenüber ihrer Basisversion zu ermitteln oder zurückzunehmen, ohne das Projektarchiv zu konsultieren.

Export-Kommando[Bearbeiten]

Da die im .svn-Ordner enthaltenen Metadaten etwa auf einem Produktivsystem nicht erwünscht sind, gibt es in Subversion das export-Kommando, welches die Dateien ohne die Metadaten des .svn-Ordners ins Dateisystem schreibt. Dies unterscheidet das export-Kommando von einem Checkout.

Atomare Commits[Bearbeiten]

Commits geschehen in Subversion atomar, das heißt, eine Änderung – auch mehrerer Dateien – wird entweder ganz oder gar nicht ins Repository gespeichert. Verbindungsabbrüche und mehrere gleichzeitige Zugriffe können somit nicht zu inkonsistenten Zuständen führen.

"Billige Kopien"[Bearbeiten]

Subversion ist in der Lage, Kopien von Dateien so zu verwalten, dass den Kopien derselbe Bearbeitungsverlauf gemeinsam ist. Dieser Umstand ist besonders dann nützlich, wenn Änderungen an einer der Dateien in die andere portiert werden sollen. Zur Erstellung einer Kopie werden die Dateien auch nicht dupliziert, sondern es wird eine datenbankinterne Verknüpfung angelegt, die im weiteren Verlauf genauso weiterverwendet werden kann wie das Original. Von dieser Technik wird häufig als „billige Kopie“[5] gesprochen.

Umbenennungs- und Verschiebungskonzept[Bearbeiten]

Das Kopie-Konzept wird bei der Umbenennung und Verschiebung von Dateien eingesetzt: Subversion realisiert diese, indem es eine Kopie anlegt und das Original als gelöscht markiert, dabei kommt es zu keinem Bruch im Versionsverlauf.

Eine native Unterstützung für Verschiebung und Umbenennung ist auf der Entwicklerseite als mittelfristiges Ziel genannt.[6]

Tag- und Branchkonzept[Bearbeiten]

Neben dem geänderten Datenbank-Modell sticht das zu anderen Versionsverwaltungssystemen völlig unterschiedliche Konzept im Bereich der Benennung von Dateiversionen (sogenanntes Tagging) und der Verzweigung in Varianten (Branching) hervor. Während die Benennung von Tags und Branches in den meisten anderen Versionsverwaltungssystemen wie Git, Mercurial oder auch CVS eine klare semantische Bedeutung hat, kennt Subversion nur das Konzept der „billigen Kopie“, die je nach Nutzungsart „Tag-“ oder „Branch-Charakter“ haben kann. Jede Kopie in Subversion ist demnach automatisch eine Variante dieser Datei oder des Verzeichnisses. Namentliche Kennzeichnungen entstehen in Subversion durch eine Kopie, die später nicht mehr verändert werden sollte. Wegen des Fehlens einer Tag- oder Branch-Semantik obliegt die Strukturierung und Verwaltung von Kennzeichnungen und Verzweigungen dem Benutzer und Administrator. Dabei hat sich bewährt, für Projekte die Basisverzeichnisse trunk (engl. „Stamm“), branches (engl. „Verzweigungen“) und tags (engl. „Markierungen“) anzulegen. trunk enthält dabei die Hauptentwicklungslinie des Projekts, in branches werden weitere Unterverzeichnisse mit alternativen Entwicklungspfaden verwaltet und in tags eine Kopie von trunk oder einem der branches als Unterverzeichnis angelegt. Zur besseren Übersicht werden je nach Projektanforderungen tags und branches noch in weitere Unterverzeichnisse unterteilt. Als HEAD bezeichnet man die neueste Version („top revision“) innerhalb einer Verzweigung.

Visualisierung eines Subversion-Projektes

Da branches und tags nur Kopien im Dateisystem sind, entsteht bei deren Erstellung zwangsläufig ein neuer Commit. Zudem muss sich jeder Entwickler an die vorgegebene Semantik halten. So ist es etwa möglich, tags und branches von Teilen des Dateisystems oder gar vom ganzen Dateisystem inklusive aller bisherigen tags und branches zu erstellen, in einen tag nachträglich Änderungen zu committen oder Dateien oder Verzeichnisse außerhalb der vorgesehenen Dateistruktur anzulegen. So ein regelwidriges Verhalten kann durch serverseitige Skripte unterbunden werden.

Da Dateien in Subversion auch versionskontrolliert umbenannt werden können, kann die Projektstruktur jederzeit gestiegenen oder gesunkenen Anforderungen angepasst werden.

Verzeichnisse und Metadaten[Bearbeiten]

Subversion kann im Gegensatz zu CVS und anderen Versionskontrollsystemen wie SCCS, RCS oder Git auch Verzeichnisse und Metadaten verwalten. Insbesondere können Verzeichnisse auch als gelöscht markiert werden.

Binärdateien[Bearbeiten]

Subversion bietet einen verbesserten Umgang mit Binärdaten. Es erkennt solche Dateien (beispielsweise Bilder oder Audiodateien) weitgehend automatisch, und es werden (wie bei Textdateien) nur die Differenzen zwischen den geänderten Versionen gespeichert.

Dateilöschung[Bearbeiten]

Dateien, die bereits durch einen Commit im Repository gespeichert wurden, können als gelöscht markiert werden, sind dann aber immer noch mit ihrer gesamten Historie vorhanden. Ein vollständiges Entfernen von Dateien (mitsamt Versionshistorie) entspricht nicht den Grundsätzen von Subversion und lässt sich nur mit großem Aufwand als Administrator durchführen.

Sonstiges[Bearbeiten]

Die Metadaten erlauben die Speicherung von Attributen wie etwa Dateien, die ignoriert werden sollen, oder solche, die auf Systemen, die dies unterstützen, als ausführbar markiert werden sollen. Neben den von SVN vordefinierten Werten, zu denen etwa auch Merge-Informationen gehören, können hier auch beliebige andere Werte hinterlegt werden. Allerdings werden diese Metadaten teilweise als intransparent kritisiert, da sie je nach Client gut versteckt sind und teils von Subversion selbst gesetzt werden.

Wie CVS bietet Subversion den Netzwerkzugriff über einen eigenen Server, auf den mit SSH auch verschlüsselt zugegriffen werden kann. Zusätzlich hierzu und der Speicherung im lokalen Dateisystem gibt es auch ein Modul für den Apache-2-Webserver, mit dem die Daten auch mit der HTTP/HTTPS-Erweiterung WebDAV übertragen werden können. Somit kann die aktuelle Revision einer Datei auch mit einem gewöhnlichen Webbrowser abgerufen werden.

Subversion verwaltet das gesamte Repository in einer Datenbank, deren Dateien nicht die Struktur des Repository-Inhalts widerspiegeln. Die Integrität der Datenbank lässt sich so verzeichnisübergreifend überprüfen. Es stehen dabei aktuell zwei Backends zur Verfügung. Das in der Version 1.1 hinzugefügte fsfs-Backend verwendet ein eigenes Format. Das andere Backend verwendet das Berkeley-Datenbanksystem, dies hat jedoch den Nachteil, dass die Daten einerseits – abhängig von der verwendeten Version – dessen binären Inkompatibilitäten unterliegen, und andererseits den damit eingebrachten Stabilitätsproblemen. Dies kann zur Folge haben, dass ein mit einer älteren Version erstelltes Repository an die neue Version angepasst werden muss. Zudem ist der Zugriff über NFS und Windows-Netzwerkfreigaben dann nicht möglich.

Subversion definiert selbst die Zeichenkodierung, welche für Dateinamen und Log-Messages im Repository benutzt wird. Damit können beispielsweise auch Dateien mit Umlauten im Namen auf Systemen mit verschiedenen Zeichen-Codierungen (beispielsweise CP1252 (deutschsprachiges Windows), UTF-8 (Linux)) benutzt werden. Allerdings ergeben sich bei Zeichen in Dateinamen, die in UTF-8 sowohl eine composed als auch decomposed gespeichert werden können, Probleme auf MacOS-basierten Systemen. Dies betrifft etwa Umlaute, die in UTF-8 als ein Zeichen (Ä, composed) und als zwei Zeichen (A und ¨, decomposed) gespeichert werden können.[7]

Abhängigkeiten von Subversion[Bearbeiten]

Für eine Installation der Basisfunktionen muss seit Version 1.1.0 nur die Apache Portable Runtime-Bibliothek vorhanden sein. Zuvor war auch noch eine Berkeley-DB in einer Version 4.0 oder höher notwendig, was aber hinfällig ist, seit das Repository mit Hilfe des FSFS-Backend optional auch direkt im Dateisystem gespeichert werden kann.

Apache 2 und Neon sind für die WebDAV-Nutzung erforderlich, Python 2.x für einige mitgelieferte Test-Skripte, eine SSL-Implementierung, wenn man WebDAV verschlüsseln will. Seit Version 1.4 kann alternativ auch Serf anstatt Neon für WebDAV verwendet werden.

Repositorys werden – wie bei CVS – mit dem Aufruf eines Befehls eingerichtet. Damit kann bei lokalem Zugriff sofort gearbeitet werden. Eine Server-Konfiguration verläuft abhängig von der gewählten Methode unterschiedlich, gleicht aber derjenigen anderer Systeme, CVS eingeschlossen.

Mit dem WebDAV-Modul wird der Apache-HTTP-Server auch direkt zum eigentlichen Serverprozess für Subversion-Repositories. Die Subversion-Inhalte werden dabei über eine gewöhnliche URL per HTTP adressiert. Mittels eines normalen Web-Browsers kann ein Repository durchsucht werden (zumindest die aktuelle Version). Da Subversion damit auch den normalen HTTP-Port 80 verwendet, ist oft keine zusätzliche Konfiguration von Firewall o. ä. notwendig.

Subversion kann auch mit einem eigenen Apache-unabhängigen Serverprozess verwendet werden. Dieser verwendet ein eigenes Netzwerkprotokoll, das – weil für Subversion optimiert – effizienter ist als das Apache-Modul. Der Standard-Port ist 3690.

Unterschiede zu CVS[Bearbeiten]

Versionsschema
CVS basiert auf dem älteren RCS-System und hat hiervon das interne Speicherformat übernommen. Dieses Format ist ausschließlich für die Verwaltung der Versionsgeschichte von einzelnen Dateien ausgelegt. CVS hat für die Verwaltung von Projekten mit mehreren Dateien eine sehr einfache Lösung gewählt: Das Projekt wird als Sammlung von Dateien betrachtet, von denen jede für sich eine eigene Historie hat. Insbesondere in der Softwareentwicklung gehören aber häufig Änderungen an mehreren Dateien in einem logischen Schritt zusammen. So muss beispielsweise in einem C-Projekt bei Anpassung einer Funktionsdeklaration in foo.h immer auch die Implementierung in foo.c angepasst werden. Dass der Schritt von foo.h auf die Version 1.5 mit dem Schritt von foo.c auf die Version 1.9 zusammenhängt, kann in CVS nicht abgebildet werden. Es kann nur durch weiche Kriterien wie zeitliche Nähe oder gleiche Commit-Nachricht gefolgert werden oder durch Vergabe eines Tags explizit angegeben werden.
Änderungsverfolgung
CVS berechnet Änderungen Server-seitig und muss somit bei Übertragungen jeweils die gesamte Datei übertragen.
Umbenennungen und Verschiebungen
Umbenennungen und Verschiebungen werden in CVS ebenfalls realisiert, indem eine Kopie angelegt und das Original als gelöscht markiert wird. In CVS kommt es dabei aber zu einem Bruch im Versionsverlauf.
Löschmarkierung von Verzeichnissen
In CVS können nur leere Verzeichnisse gelöscht werden, sie können nicht ohne Verlust der Historie aller enthaltenen Dateien aus dem Repository gelöscht werden.
Binärdateiverwaltung
Die Endungen von zu verwaltenden Binärdateitypen müssen in CVS in cvswrapper eingetragen werden, verschiedene Versionen von Dateien dieser Typen müssen aber immer vollständig gespeichert werden.
Zeichenkodierung für Dateinamen und Logmessages im Repository
Wird von CVS nicht selbst kodiert.

Distributionen[Bearbeiten]

Eine größere Anzahl von Freiwilligen pflegt verschiedene Binärdistributionen von Subversion, in der Regel mehrere pro Zielsystem. Ebenfalls werden Binärdistributionen zu unterschiedlichen Konditionen von einschlägigen Unternehmen herausgegeben. Das Apache-Subversion-Projekt gibt keine offiziellen Empfehlungen für bestimmte Distributionen heraus, pflegt aber eine Seite mit Weblinks der ihm bekannten Distributionen.[8]

Grafische Benutzeroberflächen[Bearbeiten]

Es gibt einige ausgereifte grafische Benutzeroberflächen (GUIs) für Subversion. Sie machen es den Benutzern besonders leicht, auf ein Subversion-Repository zuzugreifen. Hier einige Anwendungen:

Integriert in Dateibrowser:

Integriert in Entwicklungsumgebungen:

Integriert in Editoren:

Weiterhin sind Plugins für NetBeans, KDevelop, Code::Blocks, Vim, TYPO3 und ASCET verfügbar. Die globale Administration (Benutzerrechte, Protokolle, …) erfolgt jedoch weiterhin über spezielle SVN-eigene Konfigurationsdateien.

Um ein Subversion-Repository lediglich zu betrachten, bieten viele Open-Source-Projekte einen Link auf ihren Webdienst an. Dieser präsentiert in übersichtlicher Form Inhalte von Dateien, Verzeichnissen und Logbüchern; auch Datei-Vergleiche sind möglich.

Literatur[Bearbeiten]

  • C. Michael Pilato, Ben Collins-Sussman, Brian W. Fitzpatrick: Versionskontrolle mit Subversion – Website des freien Buchprojektes.
  • C. Michael Pilato, Ben Collins-Sussman, Brian W. Fitzpatrick, Versionskontrolle mit Subversion, O'Reilly-Verlag, 3. Auflage April 2009, ISBN 978-3-89721-897-0.
  • Tobias Wassermann: Versionsmanagement mit Subversion, mitp-Verlag, 1. Auflage Oktober 2006, ISBN 978-3-8266-1662-4.
  • Frank Budzuhn: Subversion, Galileo Computing, 2. aktualisierte und erweiterte Auflage 2007, ISBN 978-3-89842-879-8.

Einzelnachweise[Bearbeiten]

  1. falls bei der Erstellung des Installationspaketes die Internationalisierung berücksichtigt wurde, wie dies zum Beispiel bei http://alagazam.net/ der Fall ist. Die Ausgabesprache wird anhand der Systemvariablen LC_ALL automatisch bestimmt; alle Meldungen erscheinen auf deutsch, falls (Beispiel für Windows:) LC_ALL = de_DE.CP1252 gesetzt ist. Pakete zur späteren Nachinstallation einer Sprache stehen beim Kommandozeilenclient nicht zur Verfügung. Diese Situation ist nicht zu verwechseln mit zu Subversion passenden graphischen Oberflächen wie TortoiseSVN, wo deutschsprachige Meldungen erst nach Installation eines Sprachpaketes zur Verfügung stehen.
  2. Subversion Buch Subversion's History
  3. PTC Integrity (engl. WP)
  4. Subversion Submitted to Become a Project at The Apache Software Foundation
  5. Erläuterung der Bubble-Up-Methode als Grundlage „billiger Kopien“ in SVN (englisch)
  6. Subversion-Bugtracker: Issue 898
  7. Problems with umlauts in file names on Mac OS X
  8. Apache-Linkliste für Binärdistributionen

Weblinks[Bearbeiten]