Wikipedia:WikiProjekt Georeferenzierung/Hauptseite/Wikipedia-World

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

This page in English: Wikipedia:WikiProjekt Georeferenzierung/Wikipedia-World/en

Dieses ist eine internationale Koordinierungsseite für die mehrsprachige Nutzung und Auswertung der im Projekt Georeferenzierung, en:Wikipedia:WikiProject Geographical coordinates und anderen Wikipedia-Projekten gesammelten Koordinaten.

NEWS: At the moment (2014-03-25) we have (Source): 3,54 million entries as input:

  • en 1060952
  • de 595338
  • sv 335418
  • fr 256615
  • nl 221201
  • ru 191923
  • pl 110481
  • ja 93024
  • ca 81242
  • it 75936
  • es 69956
  • zh 48349
  • da 47256
  • cs 44760
  • uk 44611
  • no 36482
  • fa 33645
  • eu 29148
  • lt 24243

With interwikilinks we get an output for 273 languages.

Database-Dumps (2013-10)

All people with toolserver-account can read and use the database u_kolossos on server ptolemy. [1]


Einträge[Bearbeiten]

Momentan werden 42 Sprachversionen über die Links auf den Geohack ausgewertet. Über die Interwikilinks werden alle Sprachvarianten ausgewertet und in einer gemeinsamen Datenbank zusammengeführt, die etwa alle drei Monate aktualisiert wird. Damit stehen Koordinatendatensätze zu Artikeln in 273 Sprachen zur Verfügung. Viele der Anwendungen basieren auf dieser zentralen Datenbank auf dem Toolserver.

Extraktion[Bearbeiten]

Mittlerweile werden die Koordinaten täglich von Benutzer:Dispenser aus der Datenbank ausgelesen, dafür werden die Externallinks auf den Geohack genutzt. Vorteilhaft ist, dass man somit unabhängig der verwendeten Vorlagen ist, als Nachteil ist zu erwähnen, dass nur die Daten aus der Link-URL zur Verfügung stehen. Die so gewonnenen Daten werden von Kolossos weiterverarbeitet und die verschiedenen Sprachen zu einer einzigen PostGIS-Tabelle auf dem Toolserver vereinigt, dabei werden InterWikiLinks genutzt und von jedem Artikel ein zufälliges Bild und die Artikellänge in Bytes extrahiert. Die Artikelänge entscheidet darüber, welche Sprachversion eines Artikels in die endgültige Datenbank übernommen wird.

Diese Updates erfolgen ca. aller 2 Monate. Auf diese Datenbasis wird dann von verschiedenen Anwendungen zugegriffen bzw. die Daten zum Download angeboten, siehe Unterprojekt Wikipedia-World.

Webservices[Bearbeiten]

  • Das Unterprojekt Wikipedia-World bittet einen schnellen Zugriff als KMLs und JSON für einen bestimmten Bereich.

Downloads[Bearbeiten]

Verteilungsdichte der bis 7. Juli 2010 im Projekt Georeferenzierung gesammelten Koordinaten

Benutzer mit Toolserver-Zugriff können auch die Datenbank u_kolossos auf dem ptolemy-Server nutzen. Siehe auch tswiki:OpenStreetMap

To-Do-Liste[Bearbeiten]

  1. Stylegenerierung über Kategorien wieder einbauen
  2. Sortierung nach Benutzerzugriffszahlen
    1. Übersetzen der Type-Special-Liste (Werden zur Datenveredelung mit Hilfe der Kategorien benötigt)
  3. Transfer zwischen WP und OSM
    1. OSM könnte dann z.B. die Interwikilinks nutzen
    2. Wikipedia hätte z.B. Zugriff auf die eindeutigen Typen in OSM
    3. weiterer Ausbau von WIWOSM
  4. letzter Schritt: Geotag-Generierung

Ansprechpartner[Bearbeiten]