Wikipedia:WikiProjekt Metadaten

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Abkürzung: WP:MD
Metadaten Willkommen im WikiProjekt Metadaten.
Dieses WikiProjekt ist im Aufbau und bedarf noch vieler Diskussionen. Bitte hilf mit und beteilige Dich daran.
Sammelpunkt.svg
Erstes persönliches Treffen zu diesem Projekt war am Sonntag den 21. September 2008, 19:00h in Stuttgart.

Die Wikipedia lebt von gut geschriebenen Artikeln, die Zusammenhänge erläutern und Lust zum Lesen machen. Gute Artikel leben aber auch von Fakten, die in unterschiedlichen Artikeln genutzt werden oder permanenten Änderungen unterworfen sind. Es ist zeit- und arbeitsaufwändig, solche Fakten über mehrere Artikel zu vereinheitlichen und auf dem Laufenden zu halten. Dieses Projekt versucht, dieses Problem durch technische Unterstützung der Mediawiki-Software zu beheben und ggf. immer wieder notwendige Bot-Läufe zu ersetzen.

Organisation[Bearbeiten]

Die Strukturierung, Organisation, Koordination und Bereitstellung der Vorlagen vom Typ „Metadaten“ erfolgt im Wikipedia:WikiProjekt Metadaten/Datenorganisation.

Grundlagen[Bearbeiten]

Daten, wie z. B. die Einwohnerzahl einer Gemeinde oder das Bruttosozialprodukt eines Landes, werden oft in mehreren Artikeln sowohl im Fließtext als auch in Infoboxen oder Tabellen verwendet. Solche Daten zeichnen sich durch mehrere Attribute aus:

  • Wer (Schlüssel): welche Einheit ist gemeint (z. B. Berlin).
  • Was (Bezug): um welche Daten handelt es sich (z. B. Einwohnerzahl)
  • Wieviel (Wert): welchen Wert haben diese Daten (z. B. 3420786)
  • Wann (Stand): wann wurde dieser Wert ermittelt (z. B. 31. März 2008)
  • Woher (Quelle): woher kommen diese Daten (z. B. Amt für Statistik Berlin-Brandenburg)

Die ersten drei Attribute beschreiben die Daten selbst. Sie werden in Anlehnung an das Resource Description Framework (RDF) auch als Subjekt - Prädikat - Objekt bezeichnet. Die beiden letzten Attribute sind im engsten Sinne Metadaten, also Daten über Daten.

Vorlagen bieten eine einfache Möglichkeit, über einen Eingabeparameter einen Rückgabewert zu steuern. So könnte eine Vorlage "Bevölkerungszahl" (Prädikat) z. B. bei der Eingabe des Parameters "Berlin" (Subjekt), den Wert "3420786" (Objekt) zurückgeben. Die Vorlagenprogrammierung bietet hierzu über switch eine elegante Lösung.

Die Kategorie:Vorlage:Metadaten zeigt erste Beispiele solcher Vorlagen.

Datentypen[Bearbeiten]

Bei den relevanten Daten werden verschiedene Datentypen unterschieden, die aus praktischen Gründen jedoch in maschinenverarbeitbarer Form vorliegen sollten und erst zur Ausgabe in ein geeignetes Format gewandelt werden. Diese maschinenverarbeitbare Form (z. B. bei Zahlen ohne Tausendertrenner und mit Punkt als Dezimaltrenner) erlaubt es etwa auch noch, die Bevölkerungsdichte aus dem Quotienten Bevölkerungszahl/Fläche zu ermitteln:

Nomenklatur der Vorlagen[Bearbeiten]

Die Benennung der Vorlagen des Vorlagentyps „Metadaten“ erfolgt nach dem Schema:

Vorlage:Metadaten Bezug Abgrenzung

Beispiel: Vorlage:Metadaten Einwohnerzahl DE-NI

Der Aufruf erfolgt dann entsprechend:

{{Metadaten Yyz|Schlüssel|Zusatz}}

Beispiel: {{Metadaten Einwohnerzahl DE-NI|12345}}

Bezug[Bearbeiten]

Daten des gleichen Bezugs werden mit dem gleichen möglichst allgemeingültigen Überbergiff beschrieben. Beispiele:

  • Einwohnerzahl ergibt Daten über die Einwohnerzahl einer Gebietskörperschaft
  • Oberhaupt ergibt Daten über das Oberhaupt einer Gebietskörperschaft, das entspricht z. B. bei einer Gemeinde einem „Bürgermeister“, bei einem deutschen Landkreis einem „Landrat“.
  • Bruttoinlandsprodukt ergibt Daten über das Bruttoinlandsprodukt eines Landes.

Abgrenzung[Bearbeiten]

Die optionale Abgrenzung des Datensatzes erfolgt nach den Kriterien

  • Form der Datenbereitstellung der Datenquelle,
  • Größe des Datenumfangs (z. B. sollten nicht mehr als max. 2000 Einträge in der Switch-Liste stehen) und
  • logischem Zusammenhang der Datengruppe.

Bspiele:

  • Die Einteilung der Datenvorlagen für die Einwohnerzahlen deutscher Gemeinden, Gemeindeverbände, Landkreise und Regierungsbezirke erfolgt nach Bundesland.
  • Die Datenvorlage für den Human Development Index erfolgt nach Staaten der Erde.

Die Benennung der Abgrenzung erfolgt ebenfalls nach allgemeingültigen Kriterien, so werden etwa Daten über geographische Einheiten nach ISO 3166 abgegrenzt.

Schlüssel[Bearbeiten]

Die Zuordnung der Daten erfolgt möglichst nach allgemeingültigen und eindeutigen von wikipediainternen Regelungen unabhängigen Schlüsseln. So sollte z. B. der amtliche Gemeindeschlüssel für Daten zu deutschen Gemeinden oder der ISO-3166-Schlüssel für Daten zu Staaten benutzt werden. Dies verhindert, dass Dateneinbindungen durch Lemma-Änderungen verloren gehen und ermöglicht eine Verwendung der Datensätze unabhängig von den Namenskonventionen der einzelnen Wikipedia-Sprachversionen.

Zusatz[Bearbeiten]

Wird der Paremeter Zusatz nicht angegeben, liefern die Vorlagen die erwarteten Daten in entsprechender Form (siehe oben). Durch Angabe dieses Parameters können zusätzliche Daten zu den Daten abgefragt werden. Beispiele:

  • STAND liefert den Stand der Daten im Format JJJJ-MM-TT zurück. Damit kann z. B. durch folgenden Aufruf
Einwohner München: {{FormatZahl|{{Metadaten Einwohnerzahl DE-BY|09162000}} }} (Stand {{FormatDate|{{Metadaten Einwohnerzahl DE-BY|09162000|STAND}} }}) folgendes Ergebnis erziehlt werden:
Einwohner München: 1.407.836 (Stand 31. Dezember 2013)
bzw. kurz: Einwohner München: {{EWZ|DE-BY|09162000}} (Stand {{EWD|DE-BY|09162000|}})
Einwohner München: 1.407.836 (Stand 31. Dezember 2013)
  • QUELLE liefert die Quelle der angeforderten Daten, als Text (ggf. mit Formatierung), Beispiel: {{Metadaten Einwohnerzahl DE-BY|09162000|QUELLE}} bzw. kurz: {{EWQ|DE-BY|09162000}}
Bayerisches Landesamt für Statistik – Tabelle 12411-001: Fortschreibung des Bevölkerungsstandes: Bevölkerung: Gemeinden, Stichtage (letzten 6) vom 18. September 2014 (Einwohnerzahlen auf Grundlage des Zensus 2011)
  • BEZEICHNER liefert einen näheren Bezeichner wie z. B. „Bürgermeisterin“ bei einem weiblichem Gemeindeoberhaupt.

Zu klärende Fragen[Bearbeiten]

  • Stehen Aufwand und Nutzen in vernünftigem Verhältnis?
  • Schreckt man Newbies damit nicht noch mehr ab?
  • Wie sollen die Bezüge benannt werden?
  • Braucht es einen Default-Wert?
  • Wie können Bots damit umgehen?

Verwandte Projekte[Bearbeiten]