Wikipedia Diskussion:Normdaten

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Abkürzung: WD:ND
Automatische Archivierung
Auf dieser Seite werden Abschnitte monatlich automatisch archiviert, deren jüngster Beitrag mehr als 100 Tage zurückliegt und die mindestens einen signierten Beitrag enthalten. Um die Diskussionsseite nicht komplett zu leeren, verbleiben mindestens 3 Abschnitte.
Archivübersicht Archiv
Wie wird ein Archiv angelegt?
Automatische Archivierung
Auf dieser Seite werden Abschnitte automatisch archiviert, die seit 3 Tagen mit dem Baustein {{Erledigt|1=~~~~}} versehen sind.

Vorgehen bei unklaren GNDs[Bearbeiten]

Hi. Wie geht ihr mit solchen Fällen wie Nicolas Roche um? Es gibt einen korrekten LCCN-Datensatz und einen VIAF-Datensatz dazu. Dort ist die Tp 1045325686 auch verlinkt. Die Wahrscheinlichkeit ist groß, dass es die Person ist, aber der Datensatz ist eigentlich zu dünn für eine sinnvolle Zuordnung. Wie geht man mit solchen "Tp" um. Das ist ja kaum mehr als ein Tn... --APPER\☺☹ 20:59, 1. Jun. 2014 (CEST)

Die Datenarmut deutet auf einen Verbundkatalog als Quelle. In diesem Fall ist es der HBZ-Verbundkatalog, der als Werktitel Inside the peloton liefert, die Nicolas Roche#Autobiografie. Fazit: Eintragen. -- 32X 21:47, 1. Jun. 2014 (CEST)
Danke. Werde dann öfter mal einen Blick auf die Verbundkataloge werfen. --APPER\☺☹ 22:53, 1. Jun. 2014 (CEST)

Fehler im Bundesarchiv[Bearbeiten]

Im Artikel Louis Auguste Ravené (1866–1944) gibt es einen Einzelnachweis mit diesem Link zu den Akten der Reichskanzlei - soweit korrekt. Die auf dieser Seite angegebene PND-Nummer 117690872 steht aber in der DNB für eine andere Person (Wirkungsdaten 1853–1858). Mann müsste bei Verwendung der Vorlage:AdR dann eine andere Nummer als die richtige GND eintragen - was nicht schön ist. Gibt es dafür auch so etwas wie Wikipedia:PND/F?--Färber (Diskussion)

Lt. Bundesarchiv ist es eine gemeinsame Edition mit der Historischen Kommission bei der Bayerischen Akademie der Wissenschaften. Insofern könnte es sich lohnen, statt beim Bundesarchiv einen Zuständigen auszugraben den bei [1] angegebenen "CONTACT" anzumailen. -- Thomas Berger (Diskussion) 18:29, 5. Jun. 2014 (CEST)
Vllt. kann ich das morgen mal versuchen. Vielen Dank für die Antwort.--Färber (Diskussion) 21:52, 5. Jun. 2014 (CEST)

Ich habe mal bei der Historischen Kommission angerufen. Der zuständige Mitarbeiter hat das notiert und wird das prüfen. Die Daten würden etwa "alle halbe Jahre" mal angefasst.--194.25.30.14 08:40, 6. Jun. 2014 (CEST)

Abgleich mit Wikidata[Bearbeiten]

Seit der letzten Woche gibt es bei den Bildern in Infoboxen Wartungskategorien, die automatisch den Wikipedia-Artikel mit dem Inhalt in Wikidata abgleichen. Das sind vor allem Kategorie:Local image but no image on Wikidata, Kategorie:No local image but image on Wikidata, Kategorie:Local image different from Wikidata.
So etwas wäre in meinen Augen auch für die Normdaten praktisch. In der italienischen Wikipedia gibt es schon so etwas: it:Categoria:Codice VIAF assente ma presente su Wikidata‎, it:Categoria:Codice VIAF differente da Wikidata‎, it:Categoria:Codice VIAF non presente su Wikidata‎. Die Implementierung ist sehr einfach. Es braucht nur eine Anpassung der Vorlage. Der jeweilige Parameter (GND, LCCN, VIAF) muss nur mit der äquivalenten Eigenschaft auf Wikidata abgeglichen werden. Befüllt werden diese Kategorien automatisch.
Das würde hier und dort helfen, die Qualität zu steigern und abweichende Angaben korrigieren zu können. -- Pütz M. (Diskussion) 13:56, 16. Jun. 2014 (CEST)

Solange auf Wikidata (a) Botbetreiber am längeren Hebel sitzen und (b) als Quelle Wikipedia(-Kategorien) gelten dürfen, ist dies meines Erachtens ein Schritt in die falsche Richtung. -- 32X 16:27, 16. Jun. 2014 (CEST)
Es geht doch nur darum die Unterschiede aufzulisten um überhaupt mal ein Bild zu bekommen, ob und wie hilfreich Wikidata wäre anstatt sich wie jetzt nur auf Mutmaßungen zu verlassen. --Mps、かみまみたDisk. 16:46, 16. Jun. 2014 (CEST)
Ich gehe davon aus, dass d:User:KrBot alle Normdaten-Vorlagen von hier nach Wikidata schippt. Wenn das nicht passt, gibt es dort einen Doppeleintrag und es fällt bei d:Wikidata:Database reports/Constraint violations/P227 auf. Bzw. analog für LCCN. Bei VIAF sind abweichende Nummern ja eher die Norm. Ob umgekehrt Wikidata GND-Nummern zu Items hat, deren zugehöriger Artikel hier ohne Normdatenvorlage ist, finde ich nicht so spannend: Vielleicht sollten wir uns hier die Prioritäten lieber selber setzen. Jedenfalls wäre eine Art Marathon, wo Bots oder Benutzer aufgrund von Wartungslisten ohne weitere Prüfungen Normdatennummern möglichst schnell von Wikidata hierhin schippen, der Super-GAU, denn der Überschuss in Wikidata dürfte größtenteils auf dem automatischen VIAF-Mapping durch OCLC vor einigen Jahren beruhen. Bleibt also höchstens der Neid, dass Normdaten-Umlenkungen in Wikidata zeitnah durch Bots nachvollzogen werden, wohingegen sie hier in unregelmäßigen Abständen aus Offline-Wartungslisten abzuleiten sind. Andererseits sind Umlenkungen selbst ja wieder persistent, d.h. es ist ziemlich egal, mit welcher Verspätung man sie nachvollzieht... -- Thomas Berger (Diskussion) 18:48, 16. Jun. 2014 (CEST)

Bitte um Hilfe[Bearbeiten]

Kann mit den angegebenen Normdaten in Paris Latino nichts anfangen. --Mai-Sachme (Diskussion) 17:37, 28. Jun. 2014 (CEST)

Habe mal den Einsteller angeschrieben. Vielleicht liest er das ja trotz seiner dauerhaften Abwesenheit.--USt (Diskussion) 17:52, 28. Jun. 2014 (CEST)
Es handelt sich um den Eintrag zum Tonträger im Katalog der Library of Congress ("Normdaten" sind nur LCCN-Nummern, die mit "n" beginnen). Daher hat die Nummer in der Vorlage nichts zu suchen und ich habe sie gestrichen. -- Thomas Berger (Diskussion) 18:31, 28. Jun. 2014 (CEST)
Ich danke allen Beteiligten für ihre wertvolle Mitarbeit. Liebe Grüße, --Colin (Diskussion) 19:12, 28. Jun. 2014 (CEST)

Schwach individualisierte Tp[Bearbeiten]

Hallo, Alexandre Collin hat einen VIAF-Satz, der Tp 1038750571 enthält (der Landesbezug Deutsches Reich irritiert natürlich). Alle references verweisen tatsächlich auf den Bauingenieur, aber speisen die sich womöglich aus dem VIAF-Satz? --Mai-Sachme (Diskussion) 16:53, 30. Jun. 2014 (CEST)

Wo jeder einzelne sagt "by http://viaf.org/viaf/37191916" ist der Schluss naheliegend (und auch korrekt). Das VIAF-Cluster enthält aber noch mehr Datensätze, und die Visualisierung zeigt, dass der GND-Satz extrem schwach mit dem Rest verbunden ist (nur über den Niederländischen Eintrag mit ebenfalls gekürztem Vornamen, und auch der wiederum nur schwach mit dem Rest). "Selected Titles" zeigt überhaupt kein GND-Fähnchen, d.h. es gibt keine nachvollziehbaren Indizien für die Zuordnung. Daher hier möglichst die Finger davon lassen, zumal die GND-Angaben "Naturwissenschaftler" und "Deutsches Reich" zwar ohne Daten, Orte und/oder Literatur nicht wirklich belastbar sind, tendenziell aber eher im Widerspruch zu Alexandre Collin stehen. -- Thomas Berger (Diskussion) 18:56, 30. Jun. 2014 (CEST)
Naja, Naturwissenschaftler würde schon einigermaßen passen, erstens weil diese DNB-Beschreibungen oft haarscharf an der Sache vorbeizielen, zweitens weil Collin sich ja tatsächlich laut Artikel um die Hydrologie verdient gemacht hat. Aber danke jedenfalls! --Mai-Sachme (Diskussion) 19:00, 30. Jun. 2014 (CEST)

Verwendung von Normdatenvorlage[Bearbeiten]

Hallo, mir sind binnen kürzester Zeit zwei Verwendungsweisen der Normdatenvorlage aufgefallen, die wir in der Form wohl nicht wollen, oder täusche ich mich? Einmal siehe hier: Ausfüllen eines Parameters GNDName=fehlt. Und einmal siehe hier: Eintragung von GNDCheck, obwohl GND, LCCN und VIAF allesamt wunderbarst vorhanden sind. Liege ich mit meinen Reklamationen richtig? Besteht Präzisierungsbedarf bei der Vorlagenbeschreibung? Besteht bei den GNDName=fehlt-Fällen Nachräumbedarf?

Und noch etwas anderes: Wer findet raus, welcher Artikel mit Bartın gemeint ist? Diesmal musste ich passen. --Mai-Sachme (Diskussion) 21:21, 12. Jul. 2014 (CEST)

Hallo Mai-Sachme, der von Dir gesuchte Artikel lautet Bartın. Ich war mal so frei und habe die Normdaten korrigiert...
Hm, dass GND-Name=fehlt eingetragen wird, obwohl eine GND vorhanden ist, habe ich bisher noch nicht beobachtet. Ich bin aber wie Du der Meinung, dass dieses vollkommen überflüssig ist. Da es anscheinend doch Klärungsbedarf besteht, sollte die Vorlagenbeschreibung in dieser Hinsicht angepaßt werden. Ich wünsche ein schönes Restwochenende, --Silke (Diskussion) 14:25, 13. Jul. 2014 (CEST)
Ein Feature von normdaten.js ist, dass man "fehlt" im Feld GND einträgt, damit GNDfehlt=ja und die damit zusammenhängenden Felder generiert werden (sofern Person, sonst bleibt es so stehen...). Ein Benutzer scheint nun häufiger "fehlt" auch für GNDName einzutragen. -- Thomas Berger (Diskussion) 14:45, 13. Jul. 2014 (CEST)

210.000 neue GNDs[Bearbeiten]

Hi. Die DNB hat mitgeteilt, dass ab Mitte August 210.000 neue Tp-Datensätze eingespielt werden. Weiß jemand, wo die herkommen, welche Qualität die haben und ob die für uns relevant sind? --APPER\☺☹ 12:48, 1. Aug. 2014 (CEST)

Höre ich zum ersten Mal. Vielleicht hängt die wundersame Vermehrung mit der Umstellung auf RDA zusammen? Mitte August ist der Zeitpunkt, an dem "die für den deutschsprachigen Raum erarbeiteten Anwendungsregeln und Erläuterungen im RDA-Toolkit zur Verfügung stehen". --Kolja21 (Diskussion) 00:18, 2. Aug. 2014 (CEST)
Nein, es ist wohl wirklich eine Offline-Einspielung, die in drei Portionen für den 14., 21. und 28. August heute angekündigt worden ist. Vielleicht sind es ja die Daten aus dem Kooperationsprojekt mit dem Deutschen Filminstitut? Vor Montag wird man niemanden fragen können... -- Thomas Berger (Diskussion) 01:23, 2. Aug. 2014 (CEST)
Heute ist der große Tag ;) Hat jemand mittlerweile gehört/gelesen, welchen Personenkreis die Neueinspielung betrifft oder woher die Daten stammen? --Kolja21 (Diskussion) 17:48, 14. Aug. 2014 (CEST)
Gestern abend lief die zweite Tranche ein, alle von mir bislang angesehenen Einzelfälle stammen vom IAI/PK (DE-204). -- Thomas Berger (Diskussion) 12:08, 22. Aug. 2014 (CEST)
Danke, sieht tatsächlich danach aus. Grad mal ein paar Lateinamerikaner durchgegangen, da kann man jetzt anscheinend erstaunlich viele GNDs ergänzen. Wobei es sich vermutlich lohnt zu warten, bis alle drei Blöcke eingespielt sind. --APPER\☺☹ 13:41, 22. Aug. 2014 (CEST)
Wobei anscheinend nicht wenige eine Qualität wie Tp 1056656514 haben :(. Ohne Lebensdaten sind solche Einträge ziemlich... naja... wird schon Mireya Cueto sein, aber eigentlich habe ich bei sowas immer ein schlechtes Gewissen, die GND einzutragen. --APPER\☺☹ 13:44, 22. Aug. 2014 (CEST)
Das IAI ist im GBV nachgewiesen, also handelt es sich bei Tp 1056656514 um die dortige PPN 398495718. Wir sollten beobachten, ob im Nachklapp dieser Einspielung dieser GBV-Normdatensatz mit der GND-Nummer angereichert wird bzw. durch den GND-Satz ausgetauscht wird. Anschließend könnten wir @JakobVoss: evtl. überreden, die GBV-BEACON-Datei zu aktualisieren, und "unsere" Mechanismen wären damit in der Lage, die Bedeutung solcher GND-Nummern anhand der tatsächlichen Nutzung zu verifizieren. -- Thomas Berger (Diskussion) 15:53, 22. Aug. 2014 (CEST)

Wikidata[Bearbeiten]

@APPER, Gymel: In Zusammenhang mit den Neueinspielungen sollten wir überlegen, wie wir in Zukunft mit Wikidata zusammenarbeiten. Die Daten doppelt einzugeben, ist eigentlich (hätte es auf WD nicht soviel Streitereinen gegeben) unnötig. Die Frage ist, ob wir kurz-mittel-langfristig die bestehende Vorlage ergänzen wollen oder eine getrennte Vorlage "Normdaten-Wikidata" erstellen. Welche Vorgehensweise ist für die Wartungsarbeit am besten? --Kolja21 (Diskussion) 10:55, 2. Aug. 2014 (CEST)

PS: Es wäre auch interessant, das Angebot an Normdaten zu überprüfen. Wir hatten uns damals für die NDL entschieden, dessen Datensätze mittlerweile von VIAF erfasst werden und sich auf Autoren beschränken, die in japanischer Sprache veröffentlich haben. Die Normdaten des jap. Verbundkatalogs en:CiNii einzubinden, wäre hilfreicher. Neu könnte man Polen (NUKAT) aufnehmen. --Kolja21 (Diskussion) 14:31, 2. Aug. 2014 (CEST)
Früher oder später wird es sinnvoll sein, die Normdaten aus Wikidata einzubinden. Man muss dann aber langsam vorgehen und sich für jede Normdatei anschauen, wie der Stand bei Wikidata ist. Für die GND ist es beispielsweise derzeit meiner Meinung nach nicht möglich, da dort Tp- und Tn-Datensätze nicht unterschieden werden und tausende Tn-Datensätze eingetragen sind. Diese jetzt hier als "GND" anzuzeigen wäre meiner Meinung nach nicht hilfreich. Ich bin der Meinung, dass man Wikidata noch ein wenig Zeit geben sollte. --APPER\☺☹ 19:32, 2. Aug. 2014 (CEST)
Danke für das Feedback. Eigentlich sollten in WD gar keine Tn's eingetragen werden. Die gelten als Fehler und können per Bot komplett gelöscht werden. --Kolja21 (Diskussion) 20:32, 2. Aug. 2014 (CEST)
(Nach BK) Ich denke, für die GND werden es stets andere Überlegungen sein: Wir haben hier unsere Werkzeuge in Bezug auf WP:PND/F und die "Bindung" der GND-Nummer an einen bestimmten Artikel macht auch (z.B. den Bearbeitern der Meldungen bei der DNB) klarer, wofür es steht. Wikidata hat da in etwa schon VIAF vergleichbare Probleme, Artikel kommen und gehen und haben auch u.U. widersprüchliche Angaben. (Die Qualität in Wikidata ist ganz in Ordnung, da viele Einträge von hier stammen und die interaktive "Authority control" dort anders als normdaten.js hier die "undifferentiated persons" ausschließt. Es sind aber dennoch gut 16.000 Tn's in Wikidata nachgewiesen, würde man sie durch Bots entfernen lassen, kämen sie durch andere Bots als Reimport aus en:WP zuruück?). Auch für VIAF wird es länger eine Sonderbetrachtung geben, mehrere VIAF-Nummern zu einer Person sind normal, auch wenn Wikidata derzeit nur knapp 3.000 solcher Fälle kennt.
Gute Kandidaten wären m.E. BNF (81.000) und SUDOC (63.000), wir haben hier häufiger aus "redaktionellen" Gründen (wie kommen wir auf eine nennenswerte Anzahl, wer pflegt das, ...) entsprechende Vorschläge abgeblockt, d.h. Konflikte mit hier erfassten Daten gibt es nicht, das macht auch die Anzeige einfacher. Gescheit verlinkbar sind diese beiden Nummern auch. d:Wikidata:Database reports/Constraint violations/P268 und d:Wikidata:Database reports/Constraint violations/P269 wirken erfreulich übersichtlich, d.h. es kommt wenig Schrott nach Wikidata rein und/oder es ist unter aktiver Pflege. Natürlich dürfte das Gros der Nummern über VIAF nach Wikidata gekommen sein, das halte ich aber nicht unbedingt für ein Problem. Von der Häufigkeit die nächsten Kandidaten wären CANTIC (Katalanien) mit 15.000 Einträgen in Wikidata, NDL mit 14.000, NKC mit 8.000, BNE mit 1.800. Das oben vorgeschlagene NUKAT hat ca. 2.900 Wikidata-Items, es scheint aber keine Verlinkungsmöglichkeit bekannt zu sein. -- Thomas Berger (Diskussion) 21:14, 2. Aug. 2014 (CEST)
Die Verlinkungsmöglichkeit ist in der Tat wichtig; bei NUKAT, das hatte ich vergessen, sind Permalinks erst für nächstes Jahr in Planung. Katalonien liegt etwas weit ab vom Schuss. Die französische (BnF) und die tschechische Nationalbibliothek (NK ČR) via Wikidata einzubinden, halte ich für die beste Idee. (Ich finde es wichtig, dass wir nicht nur West-, sondern auch Osteuropa berücksichtigen.) --Kolja21 (Diskussion) 02:17, 3. Aug. 2014 (CEST)
Irgendwo (en.wp?) gibt es folgenden Ansatz: Wenn lokal kein Wert (z.B. für VIAF) gesetzt, wird Wikidata angezeigt, sonst der lokale Wert. Wenn beide (lokal und WP) einen Wert haben, wird von der Vorlage eine von zwei Wartungs-Kategorien erzeugt, je nachdem, ob die Werte identisch oder anders sind. Sind sie identisch, kann ein Bot den lokalen Wert entfernen, das Resultat für den Leser bleibt gleich. Normdaten-Sklaven wie wir können dann die "widersprüchliche" Kategorie abgrasen und die Konflikte auflösen. Das EInzige, was sich für den Benutzer "automatisch" ändert, ist, dass mehr Werte (von Wikidata) angezeigt werden. Das kann dann auch mal einer der "Tn's" sein, wenn lokal nicht schon ein besserer gesetzt ist. Kann man Tn's irgendwie automatisch erkennen? Wäre das wirklich ein großes Problem, wenn die (statt "nix") angezeigt werden? --Magnus Manske (Diskussion) 00:44, 5. Aug. 2014 (CEST)
Ja, in der enWP wird das so gehandhabt. Das größere Problem als die Tn's (die müssten sich, wie gesagt, leicht mit einem Botlauf löschen lassen) sind oder waren (?) die Dubletten, vor allem was die VIAF betrifft. Da kommen leicht drei, vier Nrn. für eine Person zusammen. Ich weiß nicht, ob das Problem mittlerweile gelöst ist. --Kolja21 (Diskussion) 14:42, 5. Aug. 2014 (CEST)
Dass es mehr als eine VIAF-Nummer zu einer Person gibt ist ja ein VIAF-Problem. Wir sollten dann halt einfach eine der Nummern anzeigen, so wie das ja derzeit auch gehandhabt wird... Also das sehe ich nicht so als großes Problem. --APPER\☺☹ 17:42, 5. Aug. 2014 (CEST)
VIAF illustriert zwei Probleme, die ich im en:WP-Ansatz sehe: Die Einbindungsmechanismen präsentieren uns eine der tendenziell mehreren VIAF-Nummern in Wikidata (falls nicht jemand dort eine als Vorzugsnummer markiert hat), die lokal gespeicherte Nummer ist da eher "handverlesen". Und falls die VIAF-Nummer entweder aus lokaler Quelle stammt oder aus Wikidata importiert wird, müssten wir eigentlich bei der Anzeige auf die Quelle hinweisen, "hier intellektuell geprüft" gegen "von irgendwo besorgt" macht schon einen Unterschied, selbst wenn in 99% der Fälle das Ergebnis dasselbe ist. Aus diesem Grund bin ich auch dagegen, hier lokal erfasste Nummern zu löschen, sobald eine Übereinstimmung mit Wikidata festgestellt wird (Wikidata mag sie von hier haben und das auch sogar vermerken, aber irgendwann hängt alles in der Luft und rotiert um sich selbst, nicht anders als wenn man alle VIAF-Quelldatenbanken abschalten würde, weil ja nun alles in VIAF ist). -- Thomas Berger (Diskussion) 18:31, 5. Aug. 2014 (CEST)
Ein Problem sind Tn in Artikeln mitunter schon. Die meisten Leser und Wikipedianer kennen den Unterschied zwischen Tp- und Tn-Datensätzen nicht und könnten dann (verständlicherweise) annehmen, dass alle dort gelisteten Werke auch zu dieser konkreten Person gehören. Teilweise tragen Wikipedianer auch fälschlicherweise alle diese Werke blind in die Artikel ein. Das ergibt Fehlangaben in Artikeln, die gerade bei weniger bekannten Personen u. U. leider jahrelang nicht erkannt und korrigiert werden. --91.67.96.57 16:55, 7. Aug. 2014 (CEST)
... vor allem wo wir wiederum die Werkliste im Artikel der DNB gegenüber als Beleg dafür anbieten, anlässlich der Umwandlung in einen Tp-Satz alle möglichen Werke dieser Person zuordnen zu dürfen. -- Thomas Berger (Diskussion) 17:43, 7. Aug. 2014 (CEST)
In diesem Punkt ist auch deWP verbesserungswürdig. Ich stoße immer wieder auf Fälle wie Erich Kloss (Autor), wo in der Vorlage:DNB-Portal ein Tn eingetragen wurde, der auf Werke eines Namensvetters verlinkt, obwohl die Normdatenvorlage den korrekten Tp nennt.[2] Außerdem wäre es hilfreich, wenn ein Bot mal die ganzen VIAF-Einträge löschen würde, die nur mit einem Tn verknüpft sind. --Kolja21 (Diskussion) 20:14, 7. Aug. 2014 (CEST)

Zwei Vorschläge, wie man sich bei Bedarf an die Normdaten aus Wikidata herantasten könnte:

  • Auswahl einer Normdatenbank, etwa BnF, die zusätzlich im Normdatenkasten für alle Benutzer angezeigt wird. Für die BnF gibt es weiter oben gute Argumente und mir fällt kein Grund ein, warum man das nicht kurzfristig ausprobieren sollte. Technisch bin ich in Punkto Wikidata überhaupt nicht auf dem Stand der Dinge, aber eine entsprechende Erweiterung unserer Normdatenvorlage dürfte relativ einfach sein?
  • Direkt angehen könnte man einen einmaligen Botlauf durch Wikidata, der alle Tn löscht. Anschließend könnte man vielleicht ganz nützliche Erkenntnisse gewinnen, welche automatischen Prozesse in Wikidata aktiv sind und die Tn ggf erneut eintragen. Wie aufwendig wäre das Aufsetzen eines derartigen Bots? Könnte man vielleicht bei Ivan_A._Krestinin anfragen, dessen KrBot die tägliche Aktualisierung der P227 constraint violation reports durchführt?

Ich persönlich bin derzeit eher skeptisch was Wikidata betrifft, aber wenn man/jemand in dieser Richtung was machen möchte, sind diese beiden Kleinprojekte doch ganz gut geeignet, weil risikoarm: Der Aufwand ist überschaubar, die Auswirkungen sind klar begrenzt und es gehen keinerlei Informationen verloren. -- Make (Diskussion) 21:01, 8. Aug. 2014 (CEST)

+ 1. Plädiere, wie oben ausgeführt, für die Neuaufnahme von BnF und NK ČR via Wikidata. Wegen des Botlaufs nachzufragen, kann auch nicht schaden. --Kolja21 (Diskussion) 02:48, 9. Aug. 2014 (CEST)

Wenn die Daten aus Wikidata bezogen werden, führt das dazu, dass bei neuen Artikeln gar keine Normdaten mehr lokal, sondern auf WD eingetragen werden. Wenn es dann mehrere VIAF's zu einer Person gibt, muss eine Regel her, welche ausgewählt wird. Ich finde, es ist dann diejenige sinnvoll, zu der es auch eine GND gibt. Oder die mit "Datenherkunft = deutschsprachige Wikipedia".--Färber (Diskussion) 09:03, 12. Aug. 2014 (CEST)

Bei WD kann man Aussagen (wie "VIAF = ...") mit einem Rang versehen: "Der Rang (rank) bezeichnet verschiedene Qualitätsstufen für die einfache Auswahl in Fällen, wo es mehrere unterschiedliche Aussagen (statements) zu einer bestimmten Eigenschaft (property) gibt" (d:Help:Ranking). Sauber programmiert, kann die Vorlage daher selbst erkennen, welcher von den dubletten Datensätzen angezeigt werden soll. (Ich wähle in der Regel die VIAF aus, die die meisten Treffer hat.) --Kolja21 (Diskussion) 17:45, 14. Aug. 2014 (CEST)
Das Problem mit verschiedenen Einträgen gibt es gelegentlich auch bei der DNB!--Martin Se aka Emes Fragen? 15:58, 16. Aug. 2014 (CEST)

Hickey, Toves (2014): Managing Ambiguity In VIAF[Bearbeiten]

[3] -- grad (zufällig) gefunden, Details zur VIAF-Konstruktion, zB:

  • “Other than our ability to redact data from the database, there is no option to directly edit a VIAF record. Changes to the VIAF record are accomplished by changes to its source records, and in this way the VIAF clusters are 'virtual' authority records.”
  • “Our goal is that for any two source records in a cluster, that there is less than a 1% chance that they describe two different entities, that is that the link is correct more than 99% of the time. A recent check of 300 random pairings within VIAF clusters failed to find any incorrect pairs.”

-- Make (Diskussion) 14:33, 10. Aug. 2014 (CEST)

Aktualisiert: Benutzer:Gymel/GND-Probleme - Stand 2014-09-03[Bearbeiten]

Ich habe die längst wunderbar abgearbeitete Wartungsliste Benutzer:Gymel/GND-Probleme anhand des aktuellen Wikipedia-Dumps 2014-09-03 einmal aufgefrischt, damit der Auswertungsstand mit dem der neuen Auswertung Benutzer:Gymel/DNB-Portal übereinstimmt. Ich habe die Zahlen jetzt nicht verglichen, mein Eindruck ist aber, dass die Zahlen der Problemartikel inzwischen massiv sinken. Probleme mit nichtindividualisierten Tn-Sätzen an Stellen, wo nur individualisierte Tp-Sätze erlaubt sind, gibt es noch viele (und wie immer bin ich mir nicht sicher, ob es sich um "frische" Fehler handelt oder ob alte erstmalig sichtbar werden). Umlenkungen wird es immer geben (je mehr, desto besser eigentlich: Sie sind ja Resultat aktiver Normdatenpflege in der GND), vermutlich sollten wir (nach m.E. positiven Erfahrungen auf Wikidata) hier eine stärkere Automatisierung angehen. -- Thomas Berger (Diskussion) 10:36, 5. Sep. 2014 (CEST)

Danke für die Aktualisierung, mein Eindruck ist ebenfalls, dass die Problemfälle tendentiell sinken. Wie es kommen kann, dass alte Fehler erstmalig sichtbar werden, dazu wüsste ich gerne mehr. --Mai-Sachme (Diskussion) 13: 01, 5. Sep. 2014 (CEST)
Ist wohl eine Fehlerinnerung von mir: Ich habe gerade aus jeder 50er-Gruppe bei den Tp-"Enitätenfehlern" die ersten fünf überprüft, also insgesamt 30 Artikel: Bis auf zwei sind alle in den letzen Monaten angelegt worden, und bei den beiden älteren Fällen ist der Eintrag der monierten Nummer ebenfalls im fraglichen Zeitraum erfolgt. In drei Fällen ist eine bei GNDname bereits stehende Tn-Nummer nachträglich als GND dublett und falsch eingesetzt worden: normdaten.js könnte die Ursache dafür sein. Wir müssen also einfach davon ausgehen, dass monatlich im Schnitt 50 GND-Parameter neu in die Vorlage:Normdaten eingetragen werden, die formal korrekt sind aber nur nach GNDname gehören oder ganz entfallen sollten. Lt. Versionsgeschichte der Vorlage:NORMDATENCOUNT ist der Zuwachs an GND-Parametern durchschnittlich 2000 im Monat, Fehlerquote bei Erstvergabe also etwa 2, 5 %... -- Thomas Berger (Diskussion) 16:06, 5. Sep. 2014 (CEST)
Auch von mir Danke. Ich habe noch eine Frage zum Datumsstempel des verwendeten GND-Datenbankabzugs: Grundlage ist vermutlich der Dump vom 10. Juli 2014 (sehe ich auf [4]). Weitere Vermutung ist, dass über Metadata-Harvesting (OAI-PMH) bis zum Stichtag aktualisiert wurde. (OAI-PMH habe ich unter http://www.dnb.de/oai und http://d-nb.info/1044619376/34 gefunden). -- Make (Diskussion) 18:22, 5. Sep. 2014 (CEST)
Im Prinzip ja, allerdings ist Grundlage der vorige Datenabzug (vom März oder April 2014) und für die Auswertung habe ich auch noch bis irgendwann am 4. September geharvested. Benutzt habe ich die Daten im RDF-Format (Turtle-Version des Gesamtabzugs, Harvesting als RDF/XML), das gegenüber der Aufbereitung in MARC21/XML weniger Information bereitstellt. Insbesondere die Codierungen Tn/Tp/Tb etc. liegen dabei nicht explizit vor sondern werden von mir aus dem Befund (welcher rdf:type, wie heisst das Prädikat, das die Ansetzung transportiert) rückgeschlossen. Normalerweise sollte das zuverlässig sein, im Fall von Mehrfachcodes, fehlendem Entitätstyp (ca. 25.000 Körperschaften sind betroffen) oder in sich widersprüchlicher Grob- und Feincodierung (auch das kommt vor, beide Sorten Codes werden ja unabhängig voneinander manuell belegt) wird es etwas beliebig. -- Thomas Berger (Diskussion) 20:40, 5. Sep. 2014 (CEST)
Der Datenabzug ist "GND-2014-02.ttl", von mir am 28. Februar downgeloadet (vermutlich zeitnah, allerdings vergehen zwischen Abzugsdatum und tatsächlicher Bereitstellung meist einige Wochen). Inzwischen hat Kolja21 (Diskussion • Beiträge • Hochgeladene Dateien • Sperr-Logbuch • Logbuch) zwei "unbekannt"-Listungen ermittelt, die durchaus in der GND vorliegen (mit Erstellungsdatum nach Februar), mir also durch die Lappen gegangen sind. Noch frühere Gesamtabzüge waren stellenweise gar nicht vollständig, das ist mir für den Februar-Abzug aber nicht bekannt. Das Gegenteil ist auch möglich: ich habe lange nicht mehr genauer untersucht, wie echte Löschungen in der GND kommuniziert werden: Die Wirklichkeit (der realen Normdatengeschäftsgänge in GND-Beziehern) ist deutlich komplexer als das eine "Löschung"-Flag im OAI-PMH-Standard, ist aber wie alle Verwaltungsinformation ein Bereich, der nur in der MARC21-Darstellung abgebildet wird. Es können also bei meiner Auswertung Sätze als "gültig" durchgewunken worden sein, die in der GND nicht mehr existiern. Das wird dann erst auffallen, wenn ich meine interne Datenbasis auf einen aktuelleren Volldump umstelle. -- 12:32, 6. Sep. 2014 (CEST)

Aktualisiert: Benutzer:APPER/VIAF2 -> fehlerhafte VIAFs[Bearbeiten]

Hi. Auf der Seite Benutzer:APPER/VIAF2 findet ihr jetzt wieder "deleted" Cluster. Außerdem neu (erstmalig getestet) solche, bei denen eine Fehlermeldung von VIAF kommt. Das sind dann irgendwie vollkommen falsche Nummern oder ähnliches. Rund 150 deleted Cluster und 250 fehlerhafte Nummern.

Außerdem eine Frage: Wie gehen wir mit eingetragenen VIAFs um, denen ausschließlich eine deutsche Tn zugeordnet ist. Meist ist diese in diesem Fall auch im Artikel eingetragen. Das sind ca. 6000 Stück in der de.wikipedia... Als "eine Art Normdatensatz" behalten? Per Bot entfernen? --APPER\☺☹ 15:09, 19. Sep. 2014 (CEST)

Unbedingt behalten: Falls VIAF irgendwann diesen Normsatz einem anderen Cluster zuordnen kann, wird es dann einen Redirect geben. Das Resultat sollte dann vielleicht nicht ganz so blind übernommen werden wie in anderen Fällen, aber letzendlich hängt die Zuverlässigkeit davon ab, wie verantwortungsvoll die VIAF-Nummer ursprünglich in die Vorlage eintetragen worden ist: Zumindest die spärlichen von VIAF eingeblendeten Werktitel sollten einschlägig sein. Und wenn andererseits die GND schneller sein sollte und den Tn löscht, bevor VIAF eine sinnvolle Zusammenlegung mit anderem erreicht, ist immer noch Gelegenheit zur Löschung. Mein Vorschlag also, die Einträge zu lassen, interne VIAF-Umlenkungen anhand von Wartungslisten manuell abarbeiten. -- Thomas Berger (Diskussion) 15:42, 19. Sep. 2014 (CEST)

Ich habe mir eines der "deleted cluster" einmal angesehen:

GND-Umlenkungen werden also nicht automatisch zu VIAF-Weiterleitungen, umgekehrt ist nicht jeder in VIAF als "nur historisch" nachgewiesene Normsatz auch wirklich spurlos verschwunden: Es lohnt sich, auf den Link der jeweiligen Normdatei zu klicken... -- Thomas Berger (Diskussion) 16:27, 19. Sep. 2014 (CEST)

Ich bin nicht für "unbedingt behalten". Die Tn's sind per se fehleranfällig, da namensgleiche Autoren zusammengewürfelt werden. Darauf beruhende VIAFs haben imho nichts im Artikelraum verloren. Eine der neg. Folgen ist, dass sie leichtfertig per Bot von Wikidata übernommen wurden und dort die Normdaten in Misskredit bringen. --Kolja21 (Diskussion) 21:56, 19. Sep. 2014 (CEST)
VIAF weiss zwar, dass da "undifferentiated" GND- oder LoC-Sätze im Cluster sitzen, kennt aber selbst nicht das Konzept eines Vn-VIAF-Clusters. Fehler sind immer möglich, mehrere Clusters zu einer Person, Cluster für Personen die es nie gab (hier auch der Fall von Tn, die definitiv für mehrere Personen stehen). Solange es VIAF-Sätze gibt, wird jemand die auch verwenden, verantwortungsvolle Verwendung bedeutet zu überprüfen, wofür das VIAF-Cluster steht und ob das mit dem übereinstimmt, wofür man einen Normdatenreferenz benötigt. Ich halte es für problematisch zu deklarieren, dass gewisse VIAF-Cluster aufgrund bestimmter formaler Eigenschaften ihrer Konstituenten a priori untauglich sind und daher jegliche Verwendung hier (und womöglich in Wikidata) unbesehen als "gewiss fehlerhaft" unterbleiben bzw. falls vorhanden aktiv herausgelöscht werden soll. Mag sein, dass ich da befangen bin, aber in Fällen ohne Tp oder uninteressanter VIAF-Cluster zur Tp habe ich gerne die VIAF-Nummer eines Tn-Satzes (etwa denen mit Vermerk "BSB-Musik" oder mit Verweis von einem bestimmten Mädchennamen) eingetragen. Ich habe aber auch kein Problem damit, einen Datensatz in seinem GND-Biotop als unindividualisiert und pfui aufzufassen und denselben Datensatz in VIAF als eine Person kennzeichnend und akzeptabel: Nach meinem Verständnis ist es - hinreichende Nutzung vorausgesetzt - nicht der konkrete Inhalt des Normsatzes (geschweige denn irgendein willkürliches Häkchen), der über seine Bedeutung bestimmt, sondern seine Verwendung und Vernetzung... -- Thomas Berger (Diskussion) 01:12, 20. Sep. 2014 (CEST)

Position der Wikipedia-Personensuche[Bearbeiten]

Hallo, es wurde ja immer wieder mal darüber gesprochen, die Wikipedia-Personensuche aus der Normdatenleiste irgendwie populärer/sichtbarer zu machen oder an geeigneterer Position zu verankern. Ich muss sagen, dass mir die Position, an der in italienischen Artikeln die Normdaten eingebunden werden, relativ gut gefällt. Beispiel: it:Carlo Schmid (ganz rechts oben, analog zu Koordinaten in geographischen Artikeln). Was haltet ihr davon, wenn ein Link zur Personensuche (also nicht die Normdatennummern, bloß der Link zum Apper-Tool und vielleicht mit peppigerem Namen) von der Normdatenleiste gelöst werden würde und rechts nach oben gepackt? --Mai-Sachme (Diskussion) 15:57, 21. Sep. 2014 (CEST)

Wäre eine Idee wert, aber man müsste dann das Layout klären, wenn sowohl Koordinaten als auch der Suchlink vorhanden sind (ja, es gibt Personenartikel, wo - aus welchen Gründen auch immer - Koordinaten enthalten sind). 129.13.72.197 16:00, 21. Sep. 2014 (CEST)
So ein Fall ist mir auch schon mal unter gekommen (die Koordinaten bezogen sich auf die Position einer Statue der gemeinten Person), allerdings halte ich das für einen (sehr selten vorkommenden) Fehler und sowieso korrekturwürdig. Menschen haben keine Koordinaten, ich hab sie damals dann auch gelöscht. --Mai-Sachme (Diskussion) 16:02, 21. Sep. 2014 (CEST)
Beispiele: Louise Gueury, Justin Popović, George Washington Carver, William Lashly, Johannes Flintrop, Apsley Cherry-Garrard, Jörg Hartmann und Lothar Schleusener. 129.13.72.197 16:02, 21. Sep. 2014 (CEST)
Himmel hilf! Danke für die Beispiele, ich mach das dann jedenfalls so. Aber wie gesagt: Hatte das bisher eigentlich nur einmal gesehen, wir sprechen sicherlich nicht von einem strukturellen Problem, sondern eigentümlichen Ausnahmen. --Mai-Sachme (Diskussion) 16:09, 21. Sep. 2014 (CEST)
Übel: Eduard Zais. 129.13.72.197 16:22, 21. Sep. 2014 (CEST)
Nicht mehr, aber stimmt schon: Solchen all-coordinates-Sachen kann man schwer Sinnhaftigkeit absprechen, insofern müsste die Position der Wikipedia-Personensuche tatsächlich mit den Koordinaten kompatibel gemacht werden. --Mai-Sachme (Diskussion) 16:44, 21. Sep. 2014 (CEST)
Oder man lässt das All-Coordinates-Zeug generell aus Biografien raus und verlinkt immer inline bzw. verweist auf den entsprechenden Artikel (sofern vorhanden). 85.212.6.101 17:31, 21. Sep. 2014 (CEST)
Prinzipiell glaube ich schon, dass Eduard Zais irgendwie demonstriert, dass all coordinates in Biographien eine sinnhafte Sache sein kann. Bei Le Corbusier fände ich das auch phantastisch und überhaupt wäre so ein Kartenangebot bei vielen Architekten-Biographien ein toller Mehrwert für Leser. Aber das führt jetzt ein wenig weg von meiner eigentlichen Frage, nämlich ob eine neue Positionierung der Personensuche grundsätzlich für sinnvoll gehalten wird. Dazu hätte ich ganz gern ein paar Meinungen, @APPER:, @Gymel:, @Kolja21:, @APPER:, @Silewe:, @AndreasPraefcke:. Ich hoffe, es stört dich nicht, dass ich unser Gespräch jetzt mal klein mache. --Mai-Sachme (Diskussion) 17:42, 21. Sep. 2014 (CEST)
Für mich wäre es natürlich okay, das irgendwo prominenter zu verlinken, aber ob rechts oben die richtige Position ist, weiß ich nicht. Eine bessere Position weiß ich spontan aber auch nicht. --APPER\☺☹ 17:50, 21. Sep. 2014 (CEST)
Die italienische Variante ist mir auch schon aufgefallen: Sie gefällt mir sehr! (Leider bindet it:Template:Controllo di autorità die GND nicht ein, aber das ist ein lokales Thema.) --Kolja21 (Diskussion) 17:49, 21. Sep. 2014 (CEST)