Open Data

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Als Open Data (aus englisch open data, wörtlich offene Daten) werden Daten bezeichnet, die von jedermann ohne jegliche Einschränkungen genutzt, weiterverbreitet und weiterverwendet werden dürfen.[1]

Die Forderung danach beruht auf der Annahme, dass frei nutzbare Daten zu mehr Transparenz und Zusammenarbeit führen. Der volkswirtschaftliche Wert offener Daten aus der öffentlichen Verwaltung wurde 2016 von der Konrad-Adenauer-Stiftung auf jährlich 43,1 Milliarden Euro geschätzt.[2] Um die Nachnutzbarkeit zu gewährleisten, werden Freie Lizenzen verwendet. Die Open-Data-Bewegung ist im Umfeld der Wissensallmende anzusiedeln und teilt viele Argumente mit den artverwandten Themen Open Source, Open Content, Open Access und Open Education. Die Bereitstellung offener Daten durch die öffentliche Hand wird als eine Voraussetzung für Open Government angesehen.

Definition[Bearbeiten | Quelltext bearbeiten]

Offene Daten sind sämtliche Datenbestände, die im Interesse der Allgemeinheit der Gesellschaft ohne jedwede Einschränkung zur freien Nutzung, zur Weiterverbreitung und zur freien Weiterverwendung frei zugänglich gemacht werden.[1] Die wissenschaftliche Literatur zitiert beispielhaft Lehrmaterial, Geodaten, Statistiken, Verkehrsinformationen, wissenschaftliche Publikationen, medizinische Forschungsergebnisse oder Hörfunk- und Fernsehsendungen.[1] Bei Open Data kann es sich über Datenbestände staatlicher Stellen hinaus auch um Daten privatwirtschaftlich agierender Unternehmen, Hochschulen sowie Non-Profit-Einrichtungen handeln.[3]

Eine ausführlichere Definition der Kriterien für offene Daten wurde erstmals 2006 von der Open Knowledge Foundation in der Open Definition veröffentlicht.[4] Hervorzuheben ist, dass offene Daten keine personenbezogenen Daten oder dem Datenschutz unterliegende Daten beinhalten dürfen.[5]

Um die freie Nutzbarkeit offener Daten zu kennzeichnen, können geeignete freie Lizenzen verwendet werden. Lizenzen, die die Nutzung der Daten einschränken, beispielsweise indem sie Veränderungen oder kommerzielle Nutzung untersagen, entsprechen nicht der Vereinbarung der „Berliner Erklärung über offenen Zugang zu wissenschaftlichem Wissen“ und der Open Definition und gelten somit nicht als offene Daten.

Geschichte[Bearbeiten | Quelltext bearbeiten]

Das Konzept hinter Open Data kann bis auf das Internationale Geophysikalische Jahr 1957/-58 zurückgeführt werden. Damaliges Ziel war, durch die Einrichtung von Datenaustauschzentren und die Standardisierung von Metadaten den Austausch und die Nutzung wissenschaftlicher Daten zu erleichtern.[6]

In den 1970er Jahren wird der Begriff erstmals in einer Verordnung erwähnt. Wenn internationale Partner die NASA durch Bodenkontrollstationen beim Betrieb amerikanischer Satelliten unterstützten, erforderten die internationalen Vereinbarungen, dass diese Partner eine Open-Data-Richtlinie (im Original open data policy) einführten. Diese Richtlinie musste vergleichbare Anforderungen an die öffentliche Verfügbarkeit von Daten machen wie die hauseigenen Richtlinien der NASA und anderer teilnehmender US-Einrichtungen. Auch das Format, in dem die Daten bereitgestellt wurden, wurde darin spezifiziert.[7]

1995 ging ein Bericht der National Academy of Sciences auf diese und vergleichbare Vereinbarungen zum Austausch wissenschaftlicher Daten ein:[8]

“International programs for global change research and environmental monitoring crucially depend on the principle of full and open exchange …. Experience has shown that increased access to scientific data, information, and related products has often led to significant scientific discoveries and the opportunity for educational enhancement.”

„Internationale Programme zur Erforschung der Weltveränderung und zur Umweltüberwachung hängen entscheidend vom Prinzip des vollständigen und offenen Austauschs ab… Die Erfahrung zeigt, dass gesteigerter Zugang zu wissenschaftlichen Daten, Informationen und verwandten Ergebnissen häufig zu signifikanten wissenschaftlichen Entdeckungen und zu Gelegenheiten für die Verbesserung der Bildung geführt hat.“

– On the Full and Open Exchange of Scientific Data

Aus diesem Antrieb, wissenschaftliche Daten und Erkenntnisse frei teilen und nachnutzen zu können, entstand auch die Open-Access-Bewegung, die peer-reviewte Forschungsergebnisse der Allgemeinheit frei zugänglich machen möchte.

Der Open-Data-Begriff ist jedoch nicht nur auf wissenschaftliche Daten beschränkt. Die Konzepte Open Government und Open Data sind eng verwandt – in den Vereinigten Staaten wird zudem noch der Begriff Open Government Data verwendet, wobei dieser Begriff sowohl „Daten, die einer Open Government entstammen“ als auch „Offene Daten, die einer Regierung entstammen“ bedeuten kann[7]. In Ländern, in denen transparentes Regierungshandeln durch Informationsfreiheitsgesetze verbrieft ist, hatte die Bürgerschaft zwar rechtlichen Anspruch auf Daten aus Regierungshand, musste diese jedoch individuell anfragen. Ab der Verbreitung des World Wide Web in den 1990ern entstanden in Ländern mit Informationsfreiheitskultur Gesetzesinitiativen, Daten über Regierungshandeln auch ohne vorherige Anfrage maschinenlesbar im Netz zur Verfügung zu stellen.[7][9]

Forderungen der Open-Data-Bewegung[Bearbeiten | Quelltext bearbeiten]

Open Data bezieht sich speziell auf Informationen, außerhalb einer Textform, wie zum Beispiel Wetterdaten, Karten, Genomen oder medizinischen Daten. Da dieses Material von kommerziellem Interesse ist, kommt es hier oft zu Widerspruch. Befürworter von Open Data argumentieren jedoch, es handle sich dabei um Allgemeingut, und die freie Verwendung der Daten dürfe nicht durch Restriktionen behindert werden.

Ein typischer Fall, der die Notwendigkeit von Open Data zeigen soll:

“Numerous scientists have pointed out the irony that right at the historical moment when we have the technologies to permit worldwide availability and distributed process of scientific data, broadening collaboration and accelerating the pace and depth of discovery […] we are busy locking up that data and preventing the use of correspondingly advanced technologies on knowledge.”

„Viele Wissenschaftler haben die Ironie aufgezeigt, dass gerade jetzt, zu dem Zeitpunkt in der Geschichte, da wir die Technologien haben, die eine weltweite Verfügbarkeit von wissenschaftlichen Daten und verteilte Verarbeitung dieser ermöglichen, wo Zusammenarbeit vertieft werden und Entdeckungen beschleunigt werden können, dass genau zu diesem Zeitpunkt wir unsere Zeit darauf verwenden, eben diese Daten verschlossen zu halten und dadurch die Anwendung ebenso fortschrittlicher Technologien zu ihrer Erschließung verhindern.“

John Wilbanks, Executive Director, Science Commons[10]

Datenerzeuger vernachlässigen oftmals die Notwendigkeit, Benutzerrechte festzulegen. Zum Beispiel kann eine fehlende (eventuell freie) Lizenzierung Daten unnötig von einer weiteren freien Verwendung ausschließen.

Die Open-Data-Bewegung fordert nicht nur den freien Zugang zu Daten, sondern generiert diese auch selber. Ein Beispiel dafür ist OpenStreetMap. Befürworter behaupten, dass durch das Open Data Konzept auch eine demokratischere Gesellschaft möglich sei – so ermöglicht beispielsweise die englische Webseite TheyWorkForYou.com, das Abstimmungsverhalten der britischen Abgeordneten nachzuverfolgen.[11] Im Zusammenhang mit Daten, die eine Regierung betreffen, wird auch von Open Government gesprochen. Rob McKinnon sagte bei einem Vortrag auf der re:publica, dass „der Verlust des Datenprivilegs zu neuen Machtstrukturen innerhalb einer Gesellschaft führen kann“.[12] Ein weiteres gutes Beispiel ist die Seite farmsubsidy.org, die zeigt, an wen EU-Agrarsubventionen gezahlt werden, die fast die Hälfte des Gesamtbudgets ausmachen. Speziell deutsche Politiker sperren sich seit langem, dass diese Informationen öffentlich werden.

Daten, die den Kriterien von Open Data genügen sollen, müssen strukturiert und maschinenlesbar zur Verfügung gestellt werden, so dass sie sich filtern, durchsuchen und von anderen Anwendungen weiterverarbeiten lassen können. Daten von Regierungsstellen zum Beispiel liegen oft als PDF vor und sind somit nicht ohne Probleme weiterzuverarbeiten.

Die folgenden Abschnitte ist nicht hinreichend mit Belegen (beispielsweise Einzelnachweisen) ausgestattet. Die fraglichen Angaben werden daher möglicherweise demnächst entfernt. Bitte hilf der Wikipedia, indem du die Angaben recherchierst und gute Belege einfügst. Näheres ist eventuell auf der Diskussionsseite oder in der Versionsgeschichte angegeben. Bitte entferne zuletzt diese Warnmarkierung.

Argumente für Open Data[Bearbeiten | Quelltext bearbeiten]

  • „Daten gehören den Menschen“ – typische Beispiele: Genome, medizinische Forschung, umweltwissenschaftliche Daten.
  • Öffentliche Gelder haben die Generierung der Daten erst ermöglicht, also müssen sie auch öffentlich zugänglich sein (tatsächlich treten Wissenschaftler in der Regel die Rechte an den von ihnen generierten Daten an private Verlage ab, wenn sie ihre Ergebnisse publizieren).
  • Fakten können nicht dem Urheberrecht unterliegen.
  • Die durch freien Zugang und Verwendung der Daten ermöglichte Zusammenarbeit erweitert die verwendbaren Daten und den Nutzen für die Allgemeinheit und den Autor. Berühmtestes Beispiel dafür ist die Wikipedia.
  • Forschung wird gefördert, wenn wissenschaftliche Erkenntnisse für alle Forscher frei zugänglich sind.
  • In den Behörden wird Geld gespart, weil z. B. weniger bzw. keine Anfragen mehr an die Behörden gestellt werden.[13]
  • Unternehmen können einfacher und besser Geld erwirtschaften, weil die für bestimmte Projekte nötigen Daten besser bzw. überhaupt verfügbar sind.[14]
  • Die Bürger können sich besser über ihre Umgebung informieren sowie Zusammenhänge, Vorhaben und Zahlen und Fakten besser verstehen.[15]

Argumente gegen Open Data[Bearbeiten | Quelltext bearbeiten]

  • Moralischer Anspruch auf das Urheberrecht
  • Der Urheber möchte finanziellen Gewinn erzielen
  • Innovationsschutz durch Marken- und Patentrecht. Der Urheber möchte seine neuen Ideen schützen.
  • Durch Open Data treten durch Steuergelder geförderte Informationssammlungen in Konkurrenz zu kommerziellen Angeboten (Wettbewerbsrecht, siehe auch Streit zur Tagesschau-App)
  • Durch die einfache Zugänglichkeit von Daten und eventuell sogar dem Recht, Änderungen daran zu machen, besteht die Gefahr, dass die Daten absichtlich oder unabsichtlich verfälscht werden
  • Durch das Offenlegen von Daten wird deren Missbrauch erleichtert. Beispiele sind Listen von Sicherheitslücken in IT-Systemen, Daten aus der Waffenforschung, oder Publikationen zu genmanipulierten hochansteckenden Vogelgrippeviren.[16]
  • Datenschutzrechtliche Bedenken, z. B. wenn das Verhalten von Individuen aufgezeichnet wird, und die Datensätze nicht ausreichend anonymisiert wurden
  • Haftung: Je nachdem, ob die offenen Datensätze dem Kunden kostenlos oder kommerziell zugänglich gemacht werden, unterscheidet sich die Haftung wenn diese Datensätze genutzt werden, und es zu einem Schadensfall kommt. Die rechtliche Lage zur Haftung kann je nach Einzelfall stark variieren.[17]

Projekte, die Open Data anbieten[Bearbeiten | Quelltext bearbeiten]

Projekt Inhalt Lizenz
Wikipedia Wissen CC-by-SA
Wikidata Daten CC0
OpenStreetMap Geo-Daten ODbL
PANGAEA Erdsystem CC-by
Datahub.io Daten abhängig von jeweiligen Datensätzen

Hackathon[Bearbeiten | Quelltext bearbeiten]

Mitte März 2015 veranstaltete Freiburg im Breisgau im Carl-Schurz-Haus einen ersten „Open-Data-Hackathon“, bei dem fünfzig Web-Entwickler und Programmierer innerhalb von 26 Stunden und 30 Minuten Ideen zur besseren Nutzung der Open Data der Stadt entwickeln sollten.[18]

Die Deutsche Bahn veranstaltete am 20. März 2015 einen „DB Open Data-Train Challenge“ Prototype an app to display time – tables or crunch our data to create the unexpected. Hier bekommen die Teilnehmer für 24 Stunden Zugriff auf die Daten von Zugfahrten. Ziele sind die Entwicklung einer neuartigen Fahrplananzeige sowie ein „Spiel mit den Daten auf kreative Art und Weise – macht daraus was ihr wollt“.[19]

Closed Data[Bearbeiten | Quelltext bearbeiten]

Es existieren verschiedene Mechanismen, um den freien Zugang zu Daten und deren freie Weiterverwendung zu erschweren:

  • Lagerung der Daten in nicht-digitalisierter (d. h. Papier-) Form
  • Verwendung von proprietären Technologien (z. B. nicht-offene Dateiformate)
  • Urheberrecht
  • Patente
  • Lizenzvereinbarungen
  • Zeitlich begrenzter oder kostenpflichtiger Zugang zu den Daten
  • Kommerzielle Anbieter, die versuchen, mit Lobbyarbeit Einfluss auf die Politik zu erlangen, und Open Data einzuschränken. Dies geschah z. B. bei PubChem, einer US-amerikanischen Datenbank zu chemischen Verbindungen.[20]

Organisationen, die Open Data unterstützen[Bearbeiten | Quelltext bearbeiten]

Deutschland[Bearbeiten | Quelltext bearbeiten]

Österreich[Bearbeiten | Quelltext bearbeiten]

Schweiz[Bearbeiten | Quelltext bearbeiten]

Italien[Bearbeiten | Quelltext bearbeiten]

Sonstige[Bearbeiten | Quelltext bearbeiten]

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Weblinks[Bearbeiten | Quelltext bearbeiten]

deutschsprachig[Bearbeiten | Quelltext bearbeiten]

englischsprachig[Bearbeiten | Quelltext bearbeiten]

Literatur[Bearbeiten | Quelltext bearbeiten]

  • Thilo Hagendorff (2016): Open Data. In: Jessica Heesen (Hg.): Handbuch Informations- und Medienethik. Stuttgart: Metzler, S. 227–233.
  • Ulrich Herb (2012) (Hrsg.): Open Initiatives: Offenheit in der digitalen Welt und Wissenschaft. Saarbrücken: universaar. ISBN 978-3-86223-062-4. Open Access Version

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. a b c Jörn von Lucke, Christian Geiger: Open Government Data. Frei verfügbare Daten des öffentlichen Sektors. Hrsg.: zeppelin university. Friedrichshafen 3. Dezember 2010 (.zu..de [PDF]).
  2. Marcus M. Dapp, Dian Balta, Walter Palmetshofer, Helmut Krcmar, Pencho Kuzev: Open Data the benefits. Das volkswirtschaftliche Potential für Deutschland. Hrsg.: Konrad-Adenauer-Stiftung. Berlin 2016, ISBN 978-3-95721-202-3 (worldcat.org).
  3. Jörn von Lucke: Innovationsschub durch Open Data, Datenportale und Umsetzungswettbewerbe. In: Reinbert Schauer, Norbert Thom, Dennis Hilgers (Hrsg.): Innovative Verwaltung : Innovationsmanagement als Instrument von Verwaltungsreformen. Trauner, Johannes Kepler Universität Linz 2011, ISBN 978-3-85499-850-1, S. 261–272 (worldcat.org).
  4. The Open Definition. Open Knowledge Foundation, abgerufen am 18. Februar 2017 (englisch).
  5. Was ist Open Data? Konrad Adenauer Stiftung, abgerufen am 18. Februar 2017.
  6. Keith G Jeffery: Open Data – The Time has Come. Blogkommentar. In: petermr's blog. 3. Oktober 2006, abgerufen am 18. Februar 2017 (englisch): „Although the term open data is rather new, the concept is rather old. The International Geophysical Year of 1957-8 caused the setting up of several world data centres and - more importantly - set standards for descriptive metadata to be used for data exchange and utilisation.“
  7. a b c Harlan Yu, David G. Robinson: The New Ambiguity of 'Open Government'. ID 2012489. Social Science Research Network, Rochester, NY 28. Februar 2012, doi:10.2139/ssrn.2012489 (ssrn.com [abgerufen am 18. Februar 2017]).
  8. National Research Council: On the Full and Open Exchange of Scientific Data. 1995, doi:10.17226/18769 (nap.edu [abgerufen am 18. Februar 2017]).
  9. AB 1624 (Bowen). 18. Mai 1993, abgerufen am 18. Februar 2017 (englisch).
  10. Science Commons
  11. theyworkforyou.com
  12. Tina Klopp: Mit alten Daten neues Wissen schaffen. Zeit online, 16. April 2010.
  13. Folie 13. Open Data der Stadt Zürich. Was bringt es? 27. November 2014; abgerufen 4. Februar 2015
  14. Folie 16. Open Data der Stadt Zürich. Was bringt es? 27. November 2014; abgerufen 4. Februar 2015
  15. Folie 17. Open Data der Stadt Zürich. Was bringt es? 27. November 2014; abgerufen 4. Februar 2015
  16. Vogelgrippe-Forscher stoppen Arbeit am Supervirus. zeit.de, 21. Januar 2012; abgerufen 3. März 2012
  17. Open Source – Wer haftet, wenn es schief geht. manager-magazin.de, 11. Oktober 2004; abgerufen 3. März 2012
  18. Erster Open-Data-Hackathon in Freiburg: Apps für die Lebensqualität. badische-zeitung.de, 9. März 2015
  19. DB Open Data-Train Challenge. eventbrite.com
  20. ACS Challenging NIH’s PubChem Database. arl.org; abgerufen am 3. März 2012