Wikipedia:Technik/MediaWiki/Datenformate

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Diese Projektseite stellt Informationen zu Datenformaten innerhalb der MediaWiki-Software zusammen.

Content Model[Quelltext bearbeiten]

Das Content Model ist ein 2013 neu eingeführtes Konzept. Einer ganzen Seite (oder einer Zeichenkette) kann die Eigenschaft zugewiesen werden.

Zunächst sind die nachstehenden Eigenschaften bekannt; weitere sind insbesondere für Programmiersprachen in Vorbereitung.

Schlüsselwörter bei Wiki-Seiten
wgPageContentModel
Seiteninformationen
Bedeutung
"wikitext"
Wikitext
Jede Seite, über die nichts Näheres bekannt ist.
"css"
CSS
Nur im Benutzer- und MediaWiki-Namensraum anhand der Namensendung .css / .js erkannt.
"javascript"
JavaScript
"json"
JSON
Nur im Benutzer- und MediaWiki-Namensraum anhand der Namensendung .json erkannt  –
MediaWiki:Visualeditor-quick-access-characters.json
"sanitized-css"
Bereinigtes CSS
mw:Help:TemplateStyles
  • Seiten im Vorlagen-Namenraum, deren Titel auf .css endet und die nur zugelassenen CSS-Code enthalten.
"Scribunto"
Scribunto
  • Jede Programmiersprache, die mit der Scribunto-Erweiterung zugänglich ist.
  • Konzeptionelles Problem: Zurzeit ist dies nur Lua; es sind aber weitere Programmiersprachen möglich.
  • Jede Seite im Modul-Namensraum, die keine Unterseite /Doku ist.
  • Benutzer-Unterseiten, die die Bedingung des Spielwiesenpräfix erfüllen.
"flow-board" Structured Discussions (Flow): Seite mit inhaltlichen Texten (etwa eine Diskussionsseite)
"GadgetDefinition" Seite im Namensraum Gadget-Definition, aber zurzeit noch nicht MediaWiki:Gadgets-definition.
"wikibase-item" Hauptnamensraum auf Wikidata
"proofread-page" Wikisource „Seite:“
"proofread-index" Wikisource „Index:“

Nur bei wikitext wird bei der Seitenverschiebung automatisch eine Wikitext-Weiterleitung angelegt; sie wäre sonst funktionslos. Bei anderen Programmiersprachen kann es geeignete analoge Mechanismen geben.

Nicht für ganze Seiten, aber in anderem Kontext kann auftreten:

  • JsonSchema
  • MassMessageListContent
  • SecurePoll
  • text

Siehe auch $wgContentHandlers (englisch).

Die manuelle Änderung eines Seitentyps ist Administratoren anscheinend möglich; allerdings ist kein Formular dazu bekannt. Vielleicht könnte das in begründeten Fällen per API ausgelöst werden; ggf. durch Bots (Flow). Entsprechende Ereignisse werden in Spezial:Logbuch/contentmodel aufgezeichnet.

Auswertung:

Content Space[Quelltext bearbeiten]

Der Begriff wird teilweise nicht ganz sachgerecht verwendet für bestimmte Namensräume:

  • Es könnte subject space gemeint sein; das ist das Gegenstück zu einer Diskussionsseite; der Namensraum, auf den sich die Diskussion bezieht.
  • Präziser bezieht er sich auf eine Erweiterung des Begriffs „Haupt-Namensraum“ (das ist der Namensraum mit der Nummer 0) auf möglicherweise weitere Namensräume.
    • Es sind die Namensräume, in denen die eigentlichen Inhalte des Wikis veröffentlicht werden; nicht aber alle internen Bereiche, die hinter den Kulissen der Präsentation zuarbeiten.
    • Sie gehen auch in die Spezial:Statistik ein und werden als „Zufällige Seite“ angeboten.
    • In der deutschsprachigen Wikipedia ist das zurzeit nur der Artikel-Namensraum.
    • Definiert wird das für die Projekte über mw:Manual:$wgContentNamespaces.
    • Auf einer Wikisource schließt das auch den Namensraum Index ein; bei mw: umfasst der content space zusätzlich die Namensräume API, Extension, Manual, Skin.
    • In der deutschsprachigen Wikipedia kämen theoretisch noch Portale in Frage.
  • Es könnte der main space gemeint sein; das ist der Namensraum mit der Nummer 0, in einer Wikipedia der Artikel-Namensraum.

Datenbankname[Quelltext bearbeiten]

Jedes Wiki-Projekt ist in einer Datenbank abgelegt; für jedes von der WMF betriebene Projekt gibt es einen eindeutigen Namen.

  • Für die deutschsprachige Wikipedia ist das: dewiki
  • Gleiche Datenbanknamen werden für die Beta-Tests verwendet. Der Bezeichner dewiki ist für beide identisch:
    • de.wikipedia.org – die echte Wikipedia
    • de.wikipedia.beta.wmflabs.org – die Erprobungsversion („Beta-Cluster“)
  • Vollständige Liste aller Projekte

Allgemein hat der Datenbankname die Form <Sprachkürzel><Projekt> mit

  • <Sprachkürzel>: Interwikipräfix (siehe WP:Sprachen #Alle Wikipedias), für Deutsch z. B. de
  • <Projekt>:
    • wiki – Wikipedia
    • wikibooks
    • wikinews
    • wikiquote
    • wikisource
    • wikiversity
    • wikivoyage
    • wiktionary
  • Spezielle Projekte; einige häufige Beispiele:

Datum- / Zeitformat[Quelltext bearbeiten]

Schlüsselwörter zum Datumsformat
"default" Projektstandard
wgDefaultDateFormat
deutschsprachige Wikipedia:
"dmy"
"dmyt" 1. Jan. 1970, 00:00 10. Mai 2018, 22:59
"dmyts" 1. Jan. 1970, 00:00:00 10. Mai 2018, 22:59:52
"dmy" 00:00, 1. Jan. 1970 22:59, 10. Mai 2018
"ymd" 00:00, 1970 Jan. 1 22:59, 2018 Mai 10
"mdy" (Nur andere Sprachen)
"ISO 8601" 1970-01-01T00:00:00 2018-05-10T22:59:52

Angemeldete Benutzer können in den user.options der Option date einen dieser Werte zuweisen.

Die obigen Beispiele gelten für deutschsprachige Wikis, wohl auch englischsprachig, die konkrete Anordnung kann aber abhängig von der Sprache abweichen.

Zu weiteren (internen) Formaten siehe auch: includes/Timestamp.php

GeoIP[Quelltext bearbeiten]

Hinter der GeoIP verbirgt sich der Staat, in dem der Internet-Provider seinen Sitz hat.

Um das Staatskürzel aus zwei Großbuchstaben (ISO 3166) zu illustrieren, werden Geokoordinaten beigegeben. Diese spezifizieren aber nicht notwendigerweise den Internet-Provider oder den Aufenthaltsort des Benutzers, sondern sind oft gleich und redundant zum Staatscode.

  • Anscheinend nur bei gut der Hälfte der Benutzer liegt eine solche Information vor.
  • Weil die Ermittlung etwas aufwändiger sein dürfte, wird sie in einem Sitzungs-Cookie auf dem Rechner des Benutzers abgelegt und bei jedem Seitenabruf dem Server übermittelt, so dass die IP-Adresse nicht neu analysiert werden muss.
  • In JavaScript sind sie über die Komponenten eines Objekts Geo verfügbar.
  • Dieses Objekt wird über http://bits.wikimedia.org/geoiplookup definiert.

Verwendet wird die Information zur Lokalisation bei Spendenaufrufen.

  • Im Lauf der Jahre ist die Präzision gesteigert worden. In den USA scheinen viele sehr engmaschige Positionsangaben in den Datenbanken vorhanden zu sein; in Deutschland ist es oft nur der Firmensitz des Providers oder ein regionales Netzwerk. Teilweise wird nur ein fester Punkt im Staat angegeben. Mediawiki wertet öffentlich zugängliche Datenbanken aus, die IP-Adresse und Geo-Information verknüpfen.
DE
Deutschland
DE::51.0000:9.0000:v4
Südrand des Kellerwalds
GB
Großbritannien
GB.::515000:-0.1300:v4
Westminster Central Hall, gegenüber der Westminster Abbey

Sprachcodes[Quelltext bearbeiten]

Siehe MediaWiki/Sprachen.