Benutzer:Duesentrieb/Biblio

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Diese Seite enthält Informationen zu Plänen für eine verbesserte Unterstützung bibliographischer Informationen in Wikimedia-Projekten. Aktuelle Informationen zur Umsetzung gibt es unter Wikipedia:BibRecord.

Grundlegende Architektur

[Bearbeiten | Quelltext bearbeiten]

Literaturangaben in Wikipedia werden bisher in jeden Artikeln einzeln eingetragen und müssen jedesmal vollständig ermittelt und formatiert werden. In Zukunft sollen bibliographische Daten stattdessen zentral an einer Stelle verwaltet und aus den Artikeln referenziert werden.

Zur Erfassung und Verwaltung von Literaturangaben existieren mit Bibliothekskatalogen und Social Cataloging-Diensten bereits eine Vielzahl von frei zugänglichen Datenbanken (bibliographic databases). Anstatt Publikationen ein weiteres mal neu zu erschließen, kann Wikipedia auf diese Datenbanken zurückgreifen und einzelne Datensätze bei Bedarf in eine zentrale Literaturdatenbank (bibliographic record store) übertragen. Besitzt die Publikation bereits einen offiziellen Identifikator (ISBN, DOI, URN...), wird dieser Identifikator (id) zum Zugriff auf die Literaturangabe benutzt; andernfalls wird ein einfaches, standardisiertes Hashkey-Verfahren (bibkey) verwendet, um die Publikation eindeutig zu referenzieren. In Wikipedia-Artikeln genügt damit zum Eintragen einer Literaturangabe ein einfacher Verweis (reference) auf die entsprechende Literatur. Über den angegebenen Identifikator können die vollständigen bibliographischen Daten (BibRecord) aus er zentralen Literaturdatenbank ermittelt und in einem gewünschten Zitierungsformat (format) dargestellt werden. Dabei wird gleichzeitig gespeichert (link table), in welchem Artikel welche Literatur angegeben ist, so dass für jedes Wiki eine eigene Zitationsdatenbank entsteht.

Ideen für verbesserte Unterstützung bibliographischer Informationen in Wikimedia-Projekten (vorrangig Wikipedia):

  • Neuer Namensraum für Bibliographische Daten
    • "Bibliographie" oder "Quellen" oder "Literatur"?
    • Unterseiten aktiv
  • Bibliographische Records
    • Für Bücher in Bibliographie:ISBN/0815471123
    • Auch für ISSN, möglicherweise auch über andere IDs (alias per Redirect oder Include)
    • Angaben für Kapitel und Artikel wie und wo?
  • Templates für Literaturangaben und Quellen
    • {{ISBN|0815471123}} bzw. {{Quelle|ISBN|0815471123}}
    • Quellangaben müssen zusätzlich Kapitel und Seitenbereiche unterstützen
      • Muss an ISBN-Record weitergereicht werden, damit das im COinS-Tag landet
    • Kapitel und Artikel wie?
    • Tool zur automatischen umwandlung von "händischen" Referenzen in Template-Referenzen
      • Automatisches anlegen der entsprechenden Record-Seite
    • "Rote" Referenzen (fehlendes Record) erlauben, aber auf spezielles Tool verlinken:
      • Suche Daten aus DNB/OpenLibrary/Amazon/etc, formatiere mit ISBN-Record.
      • Automatisches einfügen oder Copy&Paste
    • Auswertung mit dbpedia, wikiword, etc
  • Strukturierte Bibliographien: Bibliographie:Physik, etc
    • gewartet von Portalen/Projekten
    • Tool zum Sammeln von Büchern, die in einer Kategorie zitiert/referenziert werden.
    • Bibliographien sind sprachspezifisch, können/sollen Interwiki-Links haben
    • Bibliographien enthalten ggf auch Querverweise auf verwandte und über-/untergeordnete Themen.
    • Hinweisbaustein für Bibliographien, z.B. in Physik und Portal:Physik für Bibliographie:Physik
  • Backend zur Speicherung der Records
    • Zentrales "Datenwiki" auf Basis von SMW
    • Zentrales "Datenwiki" auf Basis von WikiDate (uff)
    • Zentrale Datenverwaltung auf Basis von OW2
    • Anbindung an OpenLibrary

Notizen 12.11.2008

[Bearbeiten | Quelltext bearbeiten]
  • Als Datenquelle kommen mehrere bibliographische Datenbanken in Frage (BibSonomy, DNB, LOC, OLP...). Wir sollten uns nicht auf eine beschränken sondern eine Reihe von möglichen Quellen für den Import anbieten.
    • Offene Frage: Wie sind die Terms of Services? Datenbankschutzrechte etc.?
  • Es wird eine eigene Datenbasis geschaffen (z.B. biblio.wikimedia.org). Die Daten sollen in verschiedene MediaWikis eingebunden und als als Dump zur Verfügung gestellt werden.
    • Offene Frage: Auf Basis von (Semantic) MediaWiki oder eine spezielle Datenbank?
    • Offene Frage: Müssen die Inhalte in der Datenbank änderbar sein? => erstmal keine Priorität
    • Offene Frage: Wie können/wollen wir die Daten als Dump zur Verfügung stellen? Public Domain? Welche Lizenz?
  • Die Datensätze der bibliographischen Datenbasis werden durch Identifikatoren angesprochen. Diese IDs werden nicht von uns vergeben (!) sondern wir greifen auf eine Menge von bekannten ID-Arten wie ISBN, DOI, LCCN etc. als URI zu. Als Fallback wird ein vorher definiertes und publiziertes Hashkey-Verfahren (bibkey) verwendet.
  • Die Einbindung von Literatur in Artikel geschieht über Vorlagen, in der nur die ID angegeben wird (ggf. ergänzende Angaben, die aber keine Daten überschreiben). Im Wiki wird eine Tabelle angelegt, aus der ersichtlich ist, welche Literatur in welchem Artikel referenziert wird.

Wenn ein Autor einen Artikel bearbeitet und eine Literatur- oder Quellenangabe einfügen möchte, gibt es folgende Möglichkeiten:

  • Er benutzt ein Literatursuche-Gadget
  • Er trägt die Literatur als Freitext ein (wie bisher) ein Bot oder Nutzer kann anschließend daraus eine ID-Referenz erzeugen
  • Er verwendet die Literatur-Vorlage Vorlage:Literatur (wie bisher) ein Bot oder Nutzer kann anschließend daraus eine ID-Referenz erzeugen
  • Er gibt eine ID-Referenz an (ISBN etc.)
    • Falls die ID nicht in der bibliographischen Datenbasis vorhanden ist, gibt es einen roten Link o.Ä. und die Literatur kann in die bibliographische Datenbasis aus verschiedenen Quellen nachgetragen werden.
  • Der zentrale bibliographische Datenstore und dessen Anbindung an MediaWiki ist eine umfangreichere Aufgabe, deshalb schauen wir, mit welchen Teilen wir jetzt schon anfangen können
  • Mit verschiedenen potentiellen Datenquellen sollte geklärt werden, ob wir die Daten nutzen können (Rechtssicherheit schaffen)
  • Vorhandene Literaturangaben aus Artikeln der deutschsprachigen Wikipedia können geparst und in eine Datenbank gespielt werden, um erstmal damit weiter zu arbeiten. Die Datenbank kann als Quelle für den endgültigen store dienen.
    • Die vorhandenen Literaturangaben können unter einem Nutzer in BibSonomy abgespeichert werden, welches wiederum als Datenquelle dient
  • Exporaktion von Bibliographischen Angaben
    • Publikationen
    • Literaturlisten
    • Einzelnachweise
    • Erstmal nur Bücher mit ISBN
  • Import in Bibsonomy
  • Lokale Speicherung von Bib-Records als Wikiseiten
  • Tool/Webseite zum Suchen in Bibsonomy.
    • Erzeugt entsprechende Wikipedia-Seite für das Buch, falls nicht vorhanden
    • Gibt Referenz-Template aus, für copy&paste
    • Später: intergration per Ajax in Edit-Seite
  • Skript/Bot für das Ersetzen von Inline-Angaben.
    • Bei Bedarf, Anlegen des entsprechenden ISBN-Eintrags in Wikipedia und auch in Bibsonomy.
  • Ausblick
    • Arbite an zentralem Bib-Store. SMW? Flache Datenbank? Triple-Store?
    • Rechtssicherheit bzgl Quellen von Bib-Daten (DNB, etc)