Wikipedia:WikiProjekt Georeferenzierung/Hauptseite/Datenextraktion

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Die Koordinaten werden täglich von Benutzer:Dispenser aus der Datenbank ausgelesen, dafür werden die Externallinks auf das Tool GeoHack genutzt. Daraus folgt, dass nur die Daten aus der Link-URL zur Verfügung stehen. Zugleich ist man jedoch unabhängig von den diversen verwendeten Vorlagen – von denen die vorhandenen Daten verarbeitet werden, um (direkt oder indirekt über die Einbindung einer anderen Vorlage) die Link-URL zu erzeugen –, die bei der früher angewendeten Extraktionsmethode ausgelesen wurden. Die so gewonnenen Daten werden von Benutzer:Kolossos weiterverarbeitet und die verschiedenen Sprachen zu einer einzigen PostGIS-Tabelle in der Hosting-Umgebung Wikimedia Tool Labs vereinigt, dabei werden Interwiki-Links genutzt und von jedem Artikel ein zufälliges Bild und die Artikellänge in Bytes extrahiert. Die Artikelänge entscheidet darüber, welche Sprachversion eines Artikels in die endgültige Datenbank übernommen wird.

Diese Updates erfolgen ca. alle 2 Monate. Auf diese Datenbasis wird dann von verschiedenen Anwendungen zugegriffen, bzw. die Daten zum Download angeboten, siehe Unterprojekt Wikipedia-World.

Webservices[Quelltext bearbeiten]

  • Das Unterprojekt Wikipedia-World bietet einen schnellen Zugriff als KML und JSON für einen bestimmten Bereich.

Downloads[Quelltext bearbeiten]

Verteilungsdichte der bis 23. Februar 2013 im WikiProjekt Georeferenzierung gesammelten Koordinaten