Open Data

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 19. Oktober 2016 um 14:20 Uhr durch Reclus (Diskussion | Beiträge) (→‎Hackathon: Typografie). Sie kann sich erheblich von der aktuellen Version unterscheiden.
Zur Navigation springen Zur Suche springen

Open Data bedeutet die freie Verfügbar- und Nutzbarkeit von – meist öffentlichen – Daten. Die Forderung danach beruht auf der Annahme, dass vorteilhafte Entwicklungen unterstützt werden wie Open Government, wenn adressatengerecht und benutzerfreundlich aufbereitete Informationen öffentlich zugänglich gemacht werden und damit mehr Transparenz und Zusammenarbeit ermöglichen. Dazu verwenden die Ersteller Lizenzmodelle, die auf das Urheberrecht, Patente oder andere proprietäre Rechte weitgehend verzichten. Open Data ähnelt dabei zahlreichen anderen „Open“-Bewegungen, wie zum Beispiel Open Source, Open Content, Open Access, Open Education und ist eine Voraussetzung für Open Government.

Begriffsbestimmung „Offene Daten“

Offene Daten sind sämtliche Datenbestände, die im Interesse der Allgemeinheit der Gesellschaft ohne jedwede Einschränkung zur freien Nutzung, zur Weiterverbreitung und zur freien Weiterverwendung frei zugänglich gemacht werden.[1] Zu denken wäre etwa an Lehrmaterial, Geodaten, Statistiken, Verkehrsinformationen, wissenschaftliche Publikationen, medizinische Forschungsergebnisse oder Hörfunk- und Fernsehsendungen. Bei „Open Data“ handelt es sich nicht ausschließlich um Datenbestände der öffentlichen Verwaltung, denn auch privatwirtschaftlich agierende Unternehmen, Hochschulen und Rundfunksender sowie Non-Profit-Einrichtungen produzieren entsprechende Beiträge.[1]

Zur Kennzeichnung von Daten als offene Daten gibt es verschiedene Lizenzhinweise wie zum Beispiel CC Zero. Lizenzen, die die Nutzung der Daten einschränken, beispielsweise indem sie Veränderungen oder kommerzielle Nutzung untersagen, entsprechen nicht der Vereinbarung der „Berliner Erklärung über offenen Zugang zu wissenschaftlichem Wissen“ und gelten nicht als offene Daten.

Forderungen der Open-Data-Bewegung

Das Konzept von Open Data ist nicht neu, jedoch ist der Begriff – anders als beispielsweise Open Access – bisher nicht allgemeingültig definiert worden. Open Data bezieht sich speziell auf Informationen, außerhalb einer Textform, wie zum Beispiel Wetterdaten, Karten, Genomen oder medizinischen Daten. Da dieses Material von kommerziellem Interesse ist, kommt es hier oft zu Widerspruch. Befürworter von Open Data argumentieren jedoch, es handle sich dabei um Allgemeingut, und die freie Verwendung der Daten dürfe nicht durch Restriktionen behindert werden.

Ein typischer Fall, der die Notwendigkeit von Open Data zeigen soll:

“Numerous scientists have pointed out the irony that right at the historical moment when we have the technologies to permit worldwide availability and distributed process of scientific data, broadening collaboration and accelerating the pace and depth of discovery […] we are busy locking up that data and preventing the use of correspondingly advanced technologies on knowledge.”

„Viele Wissenschaftler haben die Ironie aufgezeigt, dass gerade jetzt, zu dem Zeitpunkt in der Geschichte, da wir die Technologien haben, die eine weltweite Verfügbarkeit von wissenschaftlichen Daten und verteilte Verarbeitung dieser ermöglichen, wo Zusammenarbeit vertieft werden und Entdeckungen beschleunigt werden können, dass genau zu diesem Zeitpunkt wir unsere Zeit darauf verwenden, eben diese Daten verschlossen zu halten und dadurch die Anwendung ebenso fortschrittlicher Technologien zu ihrer Erschließung verhindern.“

John Wilbanks, Executive Director, Science Commons[2]

Datenerzeuger vernachlässigen oftmals die Notwendigkeit, Benutzerrechte festzulegen. Zum Beispiel kann eine fehlende (eventuell freie) Lizenzierung Daten unnötig von einer weiteren freien Verwendung ausschließen.

Die Open-Data-Bewegung fordert nicht nur den freien Zugang zu Daten, sondern generiert diese auch selber. Ein Beispiel dafür ist OpenStreetMap. Befürworter behaupten, dass durch das Open Data Konzept auch eine demokratischere Gesellschaft möglich sei – so ermöglicht beispielsweise die englische Webseite TheyWorkForYou.com, das Abstimmungsverhalten der britischen Abgeordneten nachzuverfolgen.[3] Im Zusammenhang mit Daten, die eine Regierung betreffen, wird auch von Open Government gesprochen. Rob McKinnon sagte bei einem Vortrag auf der re:publica, dass „der Verlust des Datenprivilegs zu neuen Machtstrukturen innerhalb einer Gesellschaft führen kann“.[4] Ein weiteres gutes Beispiel ist die Seite farmsubsidy.org, die zeigt, an wen EU-Agrarsubventionen gezahlt werden, die fast die Hälfte des Gesamtbudgets ausmachen. Speziell deutsche Politiker sperren sich seit langem, dass diese Informationen öffentlich werden.

Daten, die den Kriterien von Open Data genügen sollen, müssen strukturiert und maschinenlesbar zur Verfügung gestellt werden, so dass sie sich filtern, durchsuchen und von anderen Anwendungen weiterverarbeiten lassen können. Daten von Regierungsstellen zum Beispiel liegen oft als PDF vor und sind somit nicht ohne Probleme weiterzuverarbeiten.

Argumente für Open Data

  • „Daten gehören den Menschen“ – typische Beispiele: Genome, medizinische Forschung, umweltwissenschaftliche Daten.
  • Öffentliche Gelder haben die Generierung der Daten erst ermöglicht, also müssen sie auch öffentlich zugänglich sein (tatsächlich treten Wissenschaftler in der Regel die Rechte an den von ihnen generierten Daten an private Verlage ab, wenn sie ihre Ergebnisse publizieren).
  • Fakten können nicht dem Urheberrecht unterliegen.
  • Die durch freien Zugang und Verwendung der Daten ermöglichte Zusammenarbeit erweitert die verwendbaren Daten und den Nutzen für die Allgemeinheit und den Autor. Berühmtestes Beispiel dafür ist die Wikipedia.
  • Forschung wird gefördert, wenn wissenschaftliche Erkenntnisse für alle Forscher frei zugänglich sind.
  • In den Behörden wird Geld gespart, weil z. B. weniger bzw. keine Anfragen mehr an die Behörden gestellt werden.[5]
  • Unternehmen können einfacher und besser Geld erwirtschaften, weil die für bestimmte Projekte nötigen Daten besser bzw. überhaupt verfügbar sind.[6]
  • Die Bürger können sich besser über ihre Umgebung informieren sowie Zusammenhänge, Vorhaben und Zahlen und Fakten besser verstehen.[7]

Argumente gegen Open Data

  • Moralischer Anspruch auf das Urheberrecht
  • Der Urheber möchte finanziellen Gewinn erzielen
  • Innovationsschutz durch Marken- und Patentrecht. Der Urheber möchte seine neuen Ideen schützen.
  • Durch Open Data treten durch Steuergelder geförderte Informationssammlungen in Konkurrenz zu kommerziellen Angeboten (Wettbewerbsrecht, siehe auch Streit zur Tagesschau-App)
  • Durch die einfache Zugänglichkeit von Daten und eventuell sogar dem Recht, Änderungen daran zu machen, besteht die Gefahr, dass die Daten absichtlich oder unabsichtlich verfälscht werden
  • Durch das Offenlegen von Daten wird deren Missbrauch erleichtert. Beispiele sind Listen von Sicherheitslücken in IT-Systemen, Daten aus der Waffenforschung, oder Publikationen zu genmanipulierten hochansteckenden Vogelgrippeviren.[8]
  • Datenschutzrechtliche Bedenken, z. B. wenn das Verhalten von Individuen aufgezeichnet wird, und die Datensätze nicht ausreichend anonymisiert wurden
  • Haftung: Je nachdem, ob die offenen Datensätze dem Kunden kostenlos oder kommerziell zugänglich gemacht werden, unterscheidet sich die Haftung wenn diese Datensätze genutzt werden, und es zu einem Schadensfall kommt. Die rechtliche Lage zur Haftung kann je nach Einzelfall stark variieren.[9]

Geschichte

Keith Jeffery schreibt:

“Although the term open data is rather new, the concept is rather old. The International Geophysical Year of 1957-8 caused the setting up of several world data centres and - more importantly - set standards for descriptive metadata to be used for data exchange and utilisation.”

„Obwohl es sich bei Open Data um einen recht neuen Begriff handelt, ist das Konzept als solches wesentlich älter. Während des Internationalen Geophysikalischen Jahres 1957/58 wurden verschiedene World Data Center eingerichtet und Standards für deskriptive Metadaten festgesetzt, die den Austausch und die Verwendung von Daten reglementieren.“[10]

Harlan Yu und David G. Robertson schreiben:

“The earliest appearance of the term ‘open data’ in a policy context appears to come from science policy in the 1970s: When international partners helped NASA operate the ground control stations for American satellites, the operative international agreements required those partners to adopt an ‘open-data policy comparable to that of NASA and other U.S. agencies participating in the program, particularly with respect to the public availability of data.’ The agreements also required that data be made available to NASA ‘in the NASA-preferred format.’
Later, a 1995 National Academy of Sciences report titled On the Full and Open Exchange of Scientific Data elaborated the idea of sharing data from environmental monitoring satellites, perhaps reflecting its shared lineage with those earlier NASA agreements: ‘International programs for global change research and environmental monitoring crucially depend on the principle of full and open exchange …. Experience has shown that increased access to scientific data, information, and related products has often led to significant scientific discoveries and the opportunity for educational enhancement.”[11]

Projekte, die Open Data anbieten

Projekt Inhalt Lizenz
Wikipedia Wissen CC-by-SA
Wikidata Daten CC0
OpenStreetMap Geo-Daten ODbL

Hackathon

Mitte März 2015 veranstaltete Freiburg im Breisgau im Carl-Schurz-Haus einen ersten „Open-Data-Hackathon“, bei dem fünfzig Web-Entwickler und Programmierer innerhalb von 26 Stunden und 30 Minuten Ideen zur besseren Nutzung der Open Data der Stadt entwickeln sollten.[12]

Die Deutsche Bahn veranstaltete am 20. März 2015 einen „DB Open Data-Train Challenge“ Prototype an app to display time – tables or crunch our data to create the unexpected. Hier bekommen die Teilnehmer für 24 Stunden Zugriff auf die Daten von Zugfahrten. Ziele sind die Entwicklung einer neuartigen Fahrplananzeige sowie ein „Spiel mit den Daten auf kreative Art und Weise – macht daraus was ihr wollt“.[13]

Closed Data

Es existieren verschiedene Mechanismen, um den freien Zugang zu Daten und deren freie Weiterverwendung zu erschweren:

  • Lagerung der Daten in nicht-digitalisierter (d. h. Papier-) Form
  • Verwendung von proprietären Technologien (z. B. nicht-offene Dateiformate)
  • Urheberrecht
  • Patente
  • Lizenzvereinbarungen
  • Zeitlich begrenzter oder kostenpflichtiger Zugang zu den Daten
  • Kommerzielle Anbieter, die versuchen, mit Lobbyarbeit Einfluss auf die Politik zu erlangen, und Open Data einzuschränken. Dies geschah z. B. bei PubChem, einer US-amerikanischen Datenbank zu chemischen Verbindungen.[14]

Organisationen, die Open Data unterstützen

Deutschland

Österreich

Schweiz

Italien

Sonstige

Siehe auch

Weblinks

deutschsprachig

englischsprachig

Literatur

Einzelnachweise

  1. a b Lucke, Geiger: zeppelin-university.de (PDF) 2010, S. 3.
  2. Science Commons
  3. theyworkforyou.com
  4. Tina Klopp: Mit alten Daten neues Wissen schaffen. Zeit online, 16. April 2010.
  5. Folie 13. Open Data der Stadt Zürich. Was bringt es? 27. November 2014; abgerufen 4. Februar 2015
  6. Folie 16. Open Data der Stadt Zürich. Was bringt es? 27. November 2014; abgerufen 4. Februar 2015
  7. Folie 17. Open Data der Stadt Zürich. Was bringt es? 27. November 2014; abgerufen 4. Februar 2015
  8. Vogelgrippe-Forscher stoppen Arbeit am Supervirus. zeit.de, 21. Januar 2012; abgerufen 3. März 2012
  9. Open Source – Wer haftet, wenn es schief geht. manager-magazin.de, 11. Oktober 2004; abgerufen 3. März 2012
  10. Keith G Jeffery: Peter Murray-Rust’s blog. 12. September 2006 (englisch)
  11. Harlan Yu, David G. Robinson: The New Ambiguity of ‘Open Government’. In: UCLA L. Rev. Disc., 178, 59, 28. Februar 2012, doi:10.2139/ssrn.2012489
  12. Erster Open-Data-Hackathon in Freiburg: Apps für die Lebensqualität. badische-zeitung.de, 9. März 2015
  13. DB Open Data-Train Challenge. eventbrite.com
  14. ACS Challenging NIH’s PubChem Database. arl.org; abgerufen am 3. März 2012