DBpedia

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
DBpedia

DBpediaLogo.svg
Basisdaten

Entwickler DBpedia Association
Erscheinungsjahr 10. Januar 2007
Aktuelle Version 2016-10
(4. Juli 2017)
Programmiersprache Scala, Java
Lizenz Creative Commons CC-BY-SA und GNU-Lizenz für freie Dokumentation
wiki.dbpedia.org
DBpedia im Linking Open Data project im September 2007
DBpedia in der Linking Open Data Cloud 2014

DBpedia ist ein Gemeinschaftsprojekt, das Wikipedia-Artikel gemäß der Konzepte von Linked Open Data für das Semantic Web transformiert. DBpedia wurde 2007 von Entwicklern der Universität Leipzig, der Universität Mannheim, des Hasso-Plattner-Instituts und OpenLink Software ins Leben gerufen. Die DBpedia Entwickler extrahieren regelmäßig strukturierte Informationen aus Wikipedia und machen sie als Webanwendung, als Datenbankdump, und als SPARQL Endpunkt zugänglich. DBpedia ermöglicht somit, die Wikipedia-Datenbasis anhand verschiedener Mechanismen auf standardisierte und trotzdem flexible Weise mit anderen Informationssystemen zu verbinden.

Seit 2014 wird DBpedia durch die DBpedia Association[1] am Institut für Angewandte Informatik e. V. (InfAI) unterstützt und verwaltet.

Hintergrund[Bearbeiten | Quelltext bearbeiten]

Wikipedia-Artikel bestehen meistens aus normalem Fließtext, enthalten aber andererseits auch strukturierte Informationen, beispielsweise Infoboxen, Tabellen, Kategorien, geographische Koordinaten und Weblinks. Diese Informationen können extrahiert und als Datenbasis für fortgeschrittene Fragen verwendet werden. Im September 2011 enthielt DBpedia 3,64 Millionen Datensätze (things) mit mehr als einer halben Milliarde Einzeldaten (facts).[2] Die im September 2014 erschienene Version enthält 38,3 Millionen Datensätze über alle Sprachversionen hinweg, wovon 4,58 Millionen Datensätze auf die englische Version entfallen. Insgesamt enthält DBpedia in Version 2014 etwa 3 Milliarden Einzeldaten.[3]

Als Standard für die Daten wird das Resource Description Framework (RDF) benutzt. Als Quelle wurden unter anderem die englische, deutsche, französische, spanische, italienische, portugiesische, polnische, schwedische, niederländische, japanische, chinesische, russische, finnische und norwegische Wikipedia verwendet. Die Datensätze sind unter der GNU-Lizenz für freie Dokumentation und der Creative-Commons-Attribution-ShareAlike-3.0-Lizenz verfügbar und mit anderen freien Datensammlungen (Open Data) durch den RDF-Standard verbunden. Dies sind beispielsweise Freebase, Open Cyc, UMBEL,[4] GeoNames, MusicBrainz, CIA World Factbook, das Linked Open Data-Projekt der New York Times, Digital Bibliography & Library Project, Project Gutenberg, Jamendo, Eurostat und die US-Volkszählung.

Seit 2012 betreibt die Wikimedia Foundation neben der Wikipedia selbst das Projekt Wikidata, in dem einzelne Fakten direkt verwaltet werden, wovon wiederum viele der strukturierten Daten der Wikipedia automatisch gespeist werden sollen. Zukünftig ist geplant, dass auch DBpedia sich verstärkt aus Wikidata bedient.[5]

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Literatur[Bearbeiten | Quelltext bearbeiten]

Weblinks[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. DBpedia Association
  2. http://wiki.dbpedia.org/Datasets
  3. DBpedia Version 2014 released (Memento vom 20. November 2014 im Internet Archive)
  4. http://www.umbel.org/
  5. Jens Lehmann u. a.: DBpedia – A Large-scale, Multilingual Knowledge Base Extracted from Wikipedia, Semantic Web, Volume 6, Nummer 2, 2015, 167–195, IOS Press