„DBpedia“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
[gesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
K →‎Siehe auch: -1: ist bereits in Einleitung verlinkt
K Links angepasst und Umbel referenz archiviert
Zeile 22: Zeile 22:
[[Datei:Linking-Open-Data-diagram 2007-09.png|mini|DBpedia im Linking Open Data project im September 2007]]
[[Datei:Linking-Open-Data-diagram 2007-09.png|mini|DBpedia im Linking Open Data project im September 2007]]
[[Datei:LOD Cloud 2014-08.svg|mini|DBpedia in der Linking Open Data Cloud 2014]]
[[Datei:LOD Cloud 2014-08.svg|mini|DBpedia in der Linking Open Data Cloud 2014]]
'''DBpedia''' ist ein Gemeinschaftsprojekt, das [[Wikipedia]]-Artikel gemäß der Konzepte von [[Linked Open Data]] für das [[Semantic Web]] transformiert. DBpedia wurde 2007 von den Entwicklern [[Sören Auer]], [[Jens Lehmann (Informatiker)|Jens Lehmann]], [[Georgi Kobilarov]] [[Richard Cyganiak]] und [[Zachary Ives]]<ref>https://link.springer.com/chapter/10.1007/978-3-540-76298-0_52</ref> der [[Universität Leipzig]], [[Christian Bizer]] der [[Universität Mannheim]], des [[Hasso-Plattner-Institut]]s und [[OpenLink Software]] ins Leben gerufen. Die DBpedia-Entwickler extrahieren regelmäßig strukturierte Informationen aus Wikipedia und machen sie als [[Webanwendung]], als [[Datenbankdump]], und als [[SPARQL]]-Endpunkt zugänglich. DBpedia ermöglicht somit, die Wikipedia-Datenbasis anhand verschiedener Mechanismen auf standardisierte und trotzdem flexible Weise mit anderen Informationssystemen zu verbinden.
'''DBpedia''' ist ein Gemeinschaftsprojekt, das [[Wikipedia]]-Artikel gemäß der Konzepte von [[Linked Open Data]] für das [[Semantic Web]] transformiert. DBpedia wurde 2007 von den Entwicklern [[Sören Auer]], [[Jens Lehmann (Informatiker)|Jens Lehmann]], [[Georgi Kobilarov]] [[Richard Cyganiak]] und [[Zachary Ives]]<ref>{{Literatur |Autor=Sören Auer, Christian Bizer, Georgi Kobilarov, Jens Lehmann, Richard Cyganiak |Titel=DBpedia: A Nucleus for a Web of Open Data |Sammelwerk=The Semantic Web |Verlag=Springer |Ort=Berlin, Heidelberg |Datum=2007 |Reihe=Lecture Notes in Computer Science |ISBN=978-3-540-76298-0 |DOI=10.1007/978-3-540-76298-0_52 |Seiten=722–735 |Online=https://link.springer.com/chapter/10.1007/978-3-540-76298-0_52 |Abruf=2022-02-02}}</ref> der [[Universität Leipzig]], [[Christian Bizer]] der [[Universität Mannheim]], des [[Hasso-Plattner-Institut]]s und [[OpenLink Software]] ins Leben gerufen. Die DBpedia-Entwickler extrahieren regelmäßig strukturierte Informationen aus Wikipedia und machen sie als [[Webanwendung]], als [[Datenbankdump]], und als [[SPARQL]]-Endpunkt zugänglich. DBpedia ermöglicht somit, die Wikipedia-Datenbasis anhand verschiedener Mechanismen auf standardisierte und trotzdem flexible Weise mit anderen Informationssystemen zu verbinden.


Seit 2014 wird DBpedia durch die DBpedia Association<ref>[https://www.dbpedia.org/about-the-association/ DBpedia Association]</ref> am [[Institut für Angewandte Informatik]] (InfAI) an der Universität Leipzig unterstützt und verwaltet.
Seit 2014 wird DBpedia durch die DBpedia Association<ref>{{Internetquelle |url=https://www.dbpedia.org/about-the-association/ |titel=About the Association |werk=DBpedia Association |sprache=en-GB |abruf=2022-02-02}}</ref> am [[Institut für Angewandte Informatik]] (InfAI) an der Universität Leipzig unterstützt und verwaltet.


== Hintergrund ==
== Hintergrund ==


Wikipedia-Artikel bestehen meistens aus normalem [[Fließtext]], enthalten aber andererseits auch strukturierte Informationen, beispielsweise Infoboxen, Tabellen, Kategorien, geographische Koordinaten und Weblinks. Diese Informationen können extrahiert und als Datenbasis für fortgeschrittene Fragen verwendet werden. Im September 2011 enthielt DBpedia 3,64 Millionen Datensätze (things) mit mehr als einer halben Milliarde Einzeldaten (facts).<ref>http://wiki.dbpedia.org/Datasets</ref> Die im September 2014 erschienene Version enthält 38,3 Millionen Datensätze über alle Sprachversionen hinweg, wovon 4,58 Millionen Datensätze auf die englische Version entfallen. Insgesamt enthält DBpedia in Version 2014 etwa 3 Milliarden Einzeldaten.<ref>{{Webarchiv | url=http://blog.dbpedia.org/2014/09/09/dbpedia-version-2014-released/ | wayback=20141120120008 | text=DBpedia Version 2014 released}}</ref>
Wikipedia-Artikel bestehen meistens aus normalem [[Fließtext]], enthalten aber andererseits auch strukturierte Informationen, beispielsweise Infoboxen, Tabellen, Kategorien, geographische Koordinaten und Weblinks. Diese Informationen können extrahiert und als Datenbasis für fortgeschrittene Fragen verwendet werden. Im September 2011 enthielt DBpedia 3,64 Millionen Datensätze (things) mit mehr als einer halben Milliarde Einzeldaten (facts).<ref>{{Internetquelle |url=https://www.dbpedia.org/ |titel=Home - DBpedia Association |sprache=en-GB |abruf=2022-02-02}}</ref> Die im September 2014 erschienene Version enthält 38,3 Millionen Datensätze über alle Sprachversionen hinweg, wovon 4,58 Millionen Datensätze auf die englische Version entfallen. Insgesamt enthält DBpedia in Version 2014 etwa 3 Milliarden Einzeldaten.<ref>{{Webarchiv | url=http://blog.dbpedia.org/2014/09/09/dbpedia-version-2014-released/ | wayback=20141120120008 | text=DBpedia Version 2014 released}}</ref>


Als Standard für die Daten wird das [[Resource Description Framework]] (RDF) benutzt. Als Quelle wurden unter anderem die englische, deutsche, französische, spanische, italienische, portugiesische, polnische, schwedische, niederländische, japanische, chinesische, russische, finnische und norwegische Wikipedia verwendet. Die Datensätze sind unter der [[GNU-Lizenz für freie Dokumentation]] und der [[Creative Commons|Creative-Commons]]-Attribution-ShareAlike-3.0-Lizenz verfügbar und mit anderen freien Datensammlungen ([[Open Data]]) durch den RDF-Standard verbunden. Dies sind beispielsweise [[Freebase (Datenbank)|Freebase]], [[Cyc|Open Cyc]], [[UMBEL]],<ref>http://www.umbel.org/</ref> [[GeoNames]], [[MusicBrainz]], [[The World Factbook|CIA World Factbook]], das Linked Open Data-Projekt der [[New York Times]], [[Digital Bibliography & Library Project]], [[Project Gutenberg]], [[Jamendo]], [[Eurostat]] und die [[United States Census|US-Volkszählung]].
Als Standard für die Daten wird das [[Resource Description Framework]] (RDF) benutzt. Als Quelle wurden unter anderem die englische, deutsche, französische, spanische, italienische, portugiesische, polnische, schwedische, niederländische, japanische, chinesische, russische, finnische und norwegische Wikipedia verwendet. Die Datensätze sind unter der [[GNU-Lizenz für freie Dokumentation]] und der [[Creative Commons|Creative-Commons]]-Attribution-ShareAlike-3.0-Lizenz verfügbar und mit anderen freien Datensammlungen ([[Open Data]]) durch den RDF-Standard verbunden. Dies sind beispielsweise [[Freebase (Datenbank)|Freebase]], [[Cyc|Open Cyc]], [[UMBEL]]<ref>{{Internetquelle |url=http://www.umbel.org/ |titel=Website von Umbel |archiv-url=https://web.archive.org/web/20190827013215/http://www.umbel.org/ |abruf=2022-02-02}}</ref>, [[GeoNames]], [[MusicBrainz]], [[The World Factbook|CIA World Factbook]], das Linked Open Data-Projekt der [[New York Times]], [[Digital Bibliography & Library Project]], [[Project Gutenberg]], [[Jamendo]], [[Eurostat]] und die [[United States Census|US-Volkszählung]].


Seit 2012 betreibt die [[Wikimedia Foundation]] neben der Wikipedia selbst das Projekt [[Wikidata]], in dem einzelne Fakten direkt verwaltet werden, wovon wiederum viele der strukturierten Daten der Wikipedia automatisch gespeist werden sollen. Zukünftig ist geplant, dass auch DBpedia sich verstärkt aus Wikidata bedient.<ref>Jens Lehmann u.&nbsp;a.: ''[http://jens-lehmann.org/files/2015/swj_dbpedia.pdf DBpedia – A Large-scale, Multilingual Knowledge Base Extracted from Wikipedia]'', Semantic Web, Volume 6, Nummer 2, 2015, 167–195, IOS Press</ref>
Seit 2012 betreibt die [[Wikimedia Foundation]] neben der Wikipedia selbst das Projekt [[Wikidata]], in dem einzelne Fakten direkt verwaltet werden, wovon wiederum viele der strukturierten Daten der Wikipedia automatisch gespeist werden sollen. Zukünftig ist geplant, dass auch DBpedia sich verstärkt aus Wikidata bedient.<ref>Jens Lehmann u.&nbsp;a.: ''[http://jens-lehmann.org/files/2015/swj_dbpedia.pdf DBpedia – A Large-scale, Multilingual Knowledge Base Extracted from Wikipedia]'', Semantic Web, Volume 6, Nummer 2, 2015, 167–195, IOS Press</ref>

Version vom 2. Februar 2022, 17:35 Uhr

DBpedia

Basisdaten

Entwickler DBpedia Association
Erscheinungsjahr 10. Januar 2007
Aktuelle Version 2016-10
(4. Juli 2017)
Programmiersprache Java, Scala
Lizenz Creative Commons CC-BY-SA und GNU-Lizenz für freie Dokumentation
dbpedia.org
DBpedia im Linking Open Data project im September 2007
DBpedia in der Linking Open Data Cloud 2014

DBpedia ist ein Gemeinschaftsprojekt, das Wikipedia-Artikel gemäß der Konzepte von Linked Open Data für das Semantic Web transformiert. DBpedia wurde 2007 von den Entwicklern Sören Auer, Jens Lehmann, Georgi Kobilarov Richard Cyganiak und Zachary Ives[1] der Universität Leipzig, Christian Bizer der Universität Mannheim, des Hasso-Plattner-Instituts und OpenLink Software ins Leben gerufen. Die DBpedia-Entwickler extrahieren regelmäßig strukturierte Informationen aus Wikipedia und machen sie als Webanwendung, als Datenbankdump, und als SPARQL-Endpunkt zugänglich. DBpedia ermöglicht somit, die Wikipedia-Datenbasis anhand verschiedener Mechanismen auf standardisierte und trotzdem flexible Weise mit anderen Informationssystemen zu verbinden.

Seit 2014 wird DBpedia durch die DBpedia Association[2] am Institut für Angewandte Informatik (InfAI) an der Universität Leipzig unterstützt und verwaltet.

Hintergrund

Wikipedia-Artikel bestehen meistens aus normalem Fließtext, enthalten aber andererseits auch strukturierte Informationen, beispielsweise Infoboxen, Tabellen, Kategorien, geographische Koordinaten und Weblinks. Diese Informationen können extrahiert und als Datenbasis für fortgeschrittene Fragen verwendet werden. Im September 2011 enthielt DBpedia 3,64 Millionen Datensätze (things) mit mehr als einer halben Milliarde Einzeldaten (facts).[3] Die im September 2014 erschienene Version enthält 38,3 Millionen Datensätze über alle Sprachversionen hinweg, wovon 4,58 Millionen Datensätze auf die englische Version entfallen. Insgesamt enthält DBpedia in Version 2014 etwa 3 Milliarden Einzeldaten.[4]

Als Standard für die Daten wird das Resource Description Framework (RDF) benutzt. Als Quelle wurden unter anderem die englische, deutsche, französische, spanische, italienische, portugiesische, polnische, schwedische, niederländische, japanische, chinesische, russische, finnische und norwegische Wikipedia verwendet. Die Datensätze sind unter der GNU-Lizenz für freie Dokumentation und der Creative-Commons-Attribution-ShareAlike-3.0-Lizenz verfügbar und mit anderen freien Datensammlungen (Open Data) durch den RDF-Standard verbunden. Dies sind beispielsweise Freebase, Open Cyc, UMBEL[5], GeoNames, MusicBrainz, CIA World Factbook, das Linked Open Data-Projekt der New York Times, Digital Bibliography & Library Project, Project Gutenberg, Jamendo, Eurostat und die US-Volkszählung.

Seit 2012 betreibt die Wikimedia Foundation neben der Wikipedia selbst das Projekt Wikidata, in dem einzelne Fakten direkt verwaltet werden, wovon wiederum viele der strukturierten Daten der Wikipedia automatisch gespeist werden sollen. Zukünftig ist geplant, dass auch DBpedia sich verstärkt aus Wikidata bedient.[6]

Siehe auch

Literatur

Weblinks

Einzelnachweise

  1. Sören Auer, Christian Bizer, Georgi Kobilarov, Jens Lehmann, Richard Cyganiak: DBpedia: A Nucleus for a Web of Open Data. In: The Semantic Web (= Lecture Notes in Computer Science). Springer, Berlin, Heidelberg 2007, ISBN 978-3-540-76298-0, S. 722–735, doi:10.1007/978-3-540-76298-0_52 (springer.com [abgerufen am 2. Februar 2022]).
  2. About the Association. In: DBpedia Association. Abgerufen am 2. Februar 2022 (britisches Englisch).
  3. Home - DBpedia Association. Abgerufen am 2. Februar 2022 (britisches Englisch).
  4. DBpedia Version 2014 released (Memento vom 20. November 2014 im Internet Archive)
  5. Website von Umbel. Archiviert vom Original; abgerufen am 2. Februar 2022.
  6. Jens Lehmann u. a.: DBpedia – A Large-scale, Multilingual Knowledge Base Extracted from Wikipedia, Semantic Web, Volume 6, Nummer 2, 2015, 167–195, IOS Press