Wikipedia Diskussion:Normdaten

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Abkürzung: WD:ND
Automatische Archivierung
Auf dieser Seite werden Abschnitte monatlich automatisch archiviert, deren jüngster Beitrag mehr als 100 Tage zurückliegt und die mindestens einen signierten Beitrag enthalten. Um die Diskussionsseite nicht komplett zu leeren, verbleiben mindestens 3 Abschnitte.
Archivübersicht Archiv
Wie wird ein Archiv angelegt?
Automatische Archivierung
Auf dieser Seite werden Abschnitte automatisch archiviert, die seit 3 Tagen mit dem Baustein {{Erledigt|1=~~~~}} versehen sind.

GNDName - Vorgehen[Bearbeiten]

Das Ideal sollte ja sein, dass zu einer Person eine individualisierte GND eingetragen ist und sämtliche Literatur überall im GND-Universum (und vor allem bei der DNB) korrekt dieser GND zugeordnet ist. Sollten Werke einer Person einer Tn-GND zugeordnet sein, wird diese bei uns im Parameter GNDName eingetragen. Aber in welchen zusätzlichen Fällen ist der Parameter angebracht. Ich stoße immer wieder auf GNDName-Einträge mit Tns, bei denen es bei der DNB keine Literatur gibt (sowohl bei zusätzlicher Tp-GND als auch ohne). Nicht selten auch in der Kombination mit der VIAF-Nummer der (leeren) Tn-GND (ohne weitere Normdaten). Was ist der Sinn solcher Einträge? Kurzform meiner Frage: Wann ist ein GNDName-Parameter mit einer Tn ohne Literatur bei der DNB sinnvoll und sollte nicht entfernt werden? --APPER\☺☹ 00:04, 30. Apr. 2014 (CEST)

Über Sinnhaftigkeit kann ich nicht urteilen, aber ich erzähl mal kurz, welche Privatregeln ich so circa befolge:
1) Tp vorhanden, eine zusätzliche Tn wird nur eingetragen, wenn die DNB Literatur verzeichnet;
2a) keine Tp vorhanden, Tn (+ GNDfehlt) wird eingetragen, wenn die DNB Literatur verzeichnet;
2b) keine Tp vorhanden, Tn (aber nicht GNDfehlt) wird eingetragen, wenn im VIAF-Satz der Tn zugeordnete Literatur sichtbar ist. --Mai-Sachme (Diskussion) 07:36, 30. Apr. 2014 (CEST)
Dagegen ich:
1') Tn wird möglichst dann immer eingetragen, wenn sie in VIAF mit (und nur mit) Nicht-GND-Sätzen geclustert ist (und womöglich deswegen ein Tp daran gehindert wird, dort ebenfalls zusammengefasst zu werden). Ich folge dazu dem (hypothetischen) AKS-Link zur Tn-Nummer, d.h. wenn eine Nutzung des Tn manifest ist (typischerweise in den Bibliotheksverbünden HBZ oder BVB) und die dort überwiegend die fragliche Person betrifft, halte ich den Tn-Eintrag für verantwortbar.
2a') analog (aber - vermutlich tut Mai-Sachme das auch - die verzeichnete Literatur sollte stark überwiegend der Person zuordnbar sein)
Einschub: Natürlich, stark überwiegend der Person zuordenbar, so hatte ich's gemeint. --Mai-Sachme (Diskussion) 10:52, 30. Apr. 2014 (CEST)
2b') bei mir eher wie 1'), denn ich habe nie herausgefunden, wie "frisch" die Titelbestände sind (und von wem sie stammen), anhand derer VIAF matcht und anzeigt. Daher verifiziere ich lieber selbst und lasse die Tn u.U. weg.
Generell besetze ich stets GNDfehlt (Wenn kein Tp) und GNDCheck (Wenn kein Tp oder auch Tn) bzw. lasse das von normdaten.js regeln: Wenn ich mich recht erinnere, hatten wir 2012 diverse Modelle diskutiert, wie die Funktionalität der alten Vorlage PNDfehlt in der Normdaten-Vorlage weitergeführt werden könnte (in etwa: soll "nicht perfekt" dokumentiert und wiedervorgelegt werden oder nur "Handlungsbedarf durch DNB wird gesehen (von uns - die DNB mag sich sträuben)"; wie stark sollen Dokumentation und Wiedervorlage miteinander gekoppelt sein), je nach Modell sind GNDfehlt und GNDCheck+Abwesenheit von GND äquivalent oder nicht. Es gab keine klare Erwartung an die Funktionen der Vorgängervorlage und daher ist das auch bei den Normdaten etwas vage, die Anwendung von normdaten.js führt aber zu einer gewissen Einheitlichkeit der Form.
VIAF-Nummern im Zusammenhang mit Tn's sind hier (oder den Schwesterseiten) schon häufiger Thema gewesen, die einen geben gerne eine VIAF-Nummer an, die nicht aus PND oder LCCN oder NDL ableitbar ist (möglichst breite Abdeckung also), die anderen präferieren eine möglichst hohe Kohärenz und folgen mit VIAF möglichst GND bzw. GNDName. VIAF zeigt zwar seit einiger Zeit "undifferentiated" bei GND und LCCN-Sätzen an, hat aber m.W. nicht das Konzept eines "undifferentiated cluster". D.h. auch wenn in einem Cluster nur ein Tn sitzt, dürfen wir daraus nicht schließen, dass VIAF keine Person meint. Insofern ist der VIAF-Parameter ein attraktives Vehikel, eine "echte" Nummer in die Vorlage zu bekommen, auch wenn ansonsten nur ein Tn bekannt ist. Man muss das aber verantworten können, d.h. - aber da waren wir schon - ein Tn als GNDName darf nicht leichtfertig eingetragen sein. -- Thomas Berger (Diskussion) 09:54, 30. Apr. 2014 (CEST)
Dass bei GNDName automatisch nicht-individualisierte VIAFs hinzugefügt werden, ist ein Fehler in Benutzer:Schnark/js/personendaten.js/normdaten.js, der imho dringend behoben werden sollte. Leider wurden diese Nicht-Normdaten bereits nach Wikidata exportiert (aber das ist ein anderes Thema). Hilfreich wäre auch, wenn die DNB in ihrem OPAC optisch deutlich Tns von Tps trennen würde. --Kolja21 (Diskussion) 17:08, 30. Apr. 2014 (CEST)
Verstehe ich nicht (ist der Bug nicht umgekehrt, nämlich dass das Tool beim Eintrag von VIAF u.U. automatisch eine dazu gehörende Tn-Nummer ins GND-Feld überträgt oder zumindest vorschlägt?), bzw. halte ich für völlig legitim: Wenn es GNDname und LCCN gibt, dann ist die gemeinsame VIAF-Nummer in Ordnung, angenommen nun es gäbe keinen LCCN-Satz in der Gleichung, könnte VIAF immer noch (und gegen die GND) behaupten, es sei individualisiert und wir übernehmen das dann so. Es ist ja nur (historische) Schludrigkeit, dass es Tn's gibt und keine Aussage damit verbunden, dass es einen Tp dazu gibt, oder mehrere, oder keinen oder niemals einer existieren darf (da mehrere Personen). -- Thomas Berger (Diskussion) 18:36, 30. Apr. 2014 (CEST)
Wenn weitere Normdaten wie die LCCN vorliegen, ist es natürlich korrekt, die dazugehörige VIAF einzutragen. Das Tool trägt, selbst nachdem ich sie per Hand gelöscht habe, aber auch VIAFs ein, die nur mit einem Tn verbunden sind und den Vermerk "undifferentiated" tragen. (Die Tns sind strenggenomme keine Schludrigkeit, sondern historische Bequemlichkeit. Man dachte, es spart Zeit, wenn man Werke nicht umverknüpfen muss, sondern einen Tn nachträglich individualisiert kann und, die gleiche Nr. beibehaltend, in einen Tp umwandelt. Das klappte zu PND-Zeiten auch halbwegs, ist heute, wo die Verbundkataloge mit einbezogen sind, allerdings Murks. Außerdem hat sich das Verständnis von Normdaten gewandelt. Früher reichte ein griffiges Unterscheidungsmerkmal wie Geburtsjahr oder Beruf, heute legt selbst die LoC, die früher nicht mal das Sterbejahr nachgetragen hat, Kurzbiografien an.) --Kolja21 (Diskussion) 01:28, 1. Mai 2014 (CEST)
Da musst Du weiter zurückgehen: Bis in die 1970er Jahre wurden die Namen nicht ausdifferenziert, nur bei der Einsortierung in den Kartenkatalog waren sie nach Personen zu gruppieren: Man brauchte also jemand ziemlich umfassend gebildeten für eine Tätigkeit, die man gerne an Hilfskräfte delegieren oder am besten ganz abschaffen wollte. Man dachte dann (bei der Einführung der RAK, besonders schlau zu sein, indem man einerseits mechanisch sortiert und andererseits anders als die Amis und andere die Namen immer noch nicht ausdifferenzierte. Da verorte ich die Schludrigkeit. Seit etwa 20 Jahren dann ist klar, dass man in den Normdateien möglichst alles erfasst (und nicht nur die besonders komplizierten, besonders alten, besonders wichtigen) und kurz darauf begann zu dämmern, dass Nachweise zu Personen doch viel brauchbarer sind als nur eine Sammlung von Namensformen. Seit nunmehr 15 Jahren wird versucht, diese Sicht Top-Down durchzusetzen, 2006 hat sie sich in einer wenig wahrgenommenen Regelwerksänderung niedergeschlagen, 2016 wird wohl mit RDA durchgesetzt werden, dass Tn-Sätze normalerweise nicht mehr erzeugt werden dürfen (ausser von den Verlagen im Rahmen des CIP-Programms?), und auf den Ebenen unterhalb der Verbünde dürfte es dann ca. 2030 ankommen. Das Aufnorden von Tn zu Tp wird unterschiedlich gehandhabt: Die nutzen die Normdateien ja seitdem es sie gibt, und bei ihren Änderungen sind sie verpflichtet, die Datenbestände der anderen Verbünde im Blick zu behalten (das machen sie m.W. nicht mit BEACON oder anderen Mechanismen, die sich an den Nummern orientieren, sondern über KVK-Recherchen, der Aufbau eines Nicht-ganz-so-virtuellen Gesamtkatalogs aller Verbünde scheitert ja regelmäßig bereits im Vorfeld, derzeit scheint aber Culturegraph auf einem guten Weg). Umwandlung von Tn in Tp kommt auch derzeit durchaus häufig vor, einzig die DNB denkt auch an die GND-Anwender jenseits der Verbundsysteme, deren Nutzung spezifischer Sätze niemand im Blick haben kann und legt deswegen lieber neue Tp-Sätze an als bestehende Tn-Sätze zu schärfen. Das Problem, dass ein von Literatur leergeräumter Tn-Satz überhaupt nicht mehr offenbart, wofür er einmal benutzt worden ist, ist auch in der DNB bekannt. Geplant ist, über mechanische, VIAF-artige Methoden Literatur, die irgendwo Tn's zugeordnet ist und irgendwo anders bereits Tps, in allen Verbünden ebenfalls dem Tp-Satz zuzuordnen, so dass dann große Mengen (die Hoffnung ist: Millionen!) von Tn-Sätzen in allen Verbünden leergeräumt sind. Die Nummern sollen dann veröffentlicht (den unbekannten Auch-Nutzern der GND zur Kenntnis) und nach einer gewissen Übergangszeit gelöscht werden. -- Thomas Berger (Diskussion) 02:51, 1. Mai 2014 (CEST)

Nur nochmal nachgefragt: GND-Namenseinträge wie bei Alexandra Kyle sind also Unsinn und können gelöscht werden?--Eddgel (Diskussion) 17:12, 4. Mai 2014 (CEST)

Im konkreten Fall wäre es unsinnig, denn die im B3Kat genutzte Tn 1015005527 bezieht sich auf die gemeinte Person. (Es wäre schön, wenn du zukünftig deine Beispiele nicht kurz vor dem Speichern der Antwort änderst. ;) ) -- 32X 18:45, 4. Mai 2014 (CEST)
OK, ist korrigiert (sry, mach ich)--Eddgel (Diskussion) 19:08, 4. Mai 2014 (CEST)
@32X, ich nehme an, du wolltest sagen, eine Löschung der Tn sei unsinnig, nicht die Eintragung der Tn. Oder? --Mai-Sachme (Diskussion) 20:29, 4. Mai 2014 (CEST)
Stimmt.--Eddgel (Diskussion) 01:19, 5. Mai 2014 (CEST)

Ich trage Tn, die in der GND keine weiteren deutlichen Angaben wie Alternativnamen etc. haben, dann ein, wenn in einem Verbundkatalog (B3Kat oder HBZ) die Daten eindeutig (oder fast eindeutig) auf die betreffende Person zutreffen. Fast immer handelt es sich um Filmschauspieler, die B3Kat mit seinen vielen DVDs und CDs ausufernd enthält, leider aber nur mit Tn-Sätzen versehen hat. --AndreasPraefcke (Diskussion) 11:22, 6. Mai 2014 (CEST)

Kann man folgende Wartungsliste aus Wikidata und de.WP extrahieren?[Bearbeiten]

Alle Artikel, die VIAF in Wikidata enthalten und einen deutschen Artikel betreffen, in dem aber entweder keine Normdatenvorlage oder kein VIAF-Eintrag in der Normdatenvorlage existieren? Man müsste die dann eh nochmal anschauen, es wäre also keine Botaufgabe. (Für GND ist so eine Liste wegen der vielen Tn-GND in Wikidata hingegen wenig sinnvoll.) Grund: Mir fallen bei der Erarbeitung Munzinger-BEACON-Datei immer wieder Artikel z. B. zu ausländischen Politikern auf, bei denen in Wikidata schon eine (bislang sogar stets korrekte) VIAF-ID hinterlegt ist, bei uns aber noch keine Normdatenvorlage eingebaut wurde. --AndreasPraefcke (Diskussion) 17:31, 9. Mai 2014 (CEST)

PS: Folgendes Schmankerl möchte ich euch nicht vorenthalten: Sucht mal nach "Gabriel Lisette" in der GND. Ich kann mich nicht erinnern, jemals so viele Tp für eine Person gesehen zu haben... --AndreasPraefcke (Diskussion) 18:08, 9. Mai 2014 (CEST)

Hi. Ich habe grade vor einigen Wochen angefangen, Wikidata gegen de.wikipedia abzugleichen. Dabei habe ich mit der GND angefangen (und dabei jeweils geschaut, ob es sich um eine Tn-GND handelt). Den Weg Wikipedia->Wikidata habe ich dabei erstmal ausgenommen. Übrig blieb also eine Liste von GNDs, die sich in de.wikipedia und Wikidata widersprechen und eine Liste, bei denen eine GND in Wikidata angegeben ist, aber hier keine. Erstaunlich häufig handelte es sich bei beidem um Korrekturen, die hier durchgeführt wurden, aber in Wikidata nicht nachgezogen wurden. Erstaunlich häufig auch, dass es zwei GNDs gibt (daher stammen die von mir eingetragenen Dopplungen hier). Obwohl häufig hier in de.wikipedia von einer zur anderen geändert wurde, wurde WP:PND/F nicht genutzt. Die anderen Fälle von widersprüchlichen GNDs waren meist leicht zu fixen, die hier fehlenden GNDs waren zum Teil Fehler, aber auch echt fehlende GNDs. Insgesamt war die Liste aber überschaubar. Für einen erneuten Lauf müsste ich einbauen, dass Seiten, die von WP:PND/F-Seiten verlinkt sind, ignoriert werden, weil das halt häufig Doppel-Tps sind. Alternativ kann man natürlich auch in Wikidata von der einen zur anderen ändern...
Für VIAF wird das sehr wahrscheinlich sehr viel umfangreicher. Da müsste ich aber auch solche VIAF-Datensätze ausschließen, die ausschließlich einen undifferentiated-Eintrag haben. Bin die nächsten Wochen ziemlich im Stress, also das wird wohl eher erst Ende Juni was. --APPER\☺☹ 18:29, 9. Mai 2014 (CEST)
Nach einem ganz kleinen Mini-Testlauf kann ich sagen: Der Großteil werden Artikel sein, bei denen wir eine GND haben, aber die VIAF nicht eingetragen ist. --APPER\☺☹ 19:32, 9. Mai 2014 (CEST)
Danke für die Ausführungen. Hm, dann sollten die vielleicht auch noch raus, die GND oder LCCN schon drin haben. --AndreasPraefcke (Diskussion) 19:37, 9. Mai 2014 (CEST)
Habe mir jetzt ein wenig mehr angeguckt und finde die Liste tatsächlich recht sinnvoll. VIAFs ergänzen ist ja auch sinnvoll, wenn wir die GND schon haben. Einzige Fehleinträge, die ich bisher entdeckt habe, sind solche mit zwei VIAF-Identifiern. Das kann Wikidata zwar abbilden, aber ich habs noch nicht abgefangen ;). Habe jetzt einen Gesamtlauf angeschmissen und werde dann mal ein paar auf irgendeine Wartungsseite stellen ;). --APPER\☺☹ 22:22, 9. Mai 2014 (CEST)
So, schau dir mal Benutzer:APPER/Wikidata an. --APPER\☺☹ 22:54, 9. Mai 2014 (CEST)
Mach ich, danke. --AndreasPraefcke (Diskussion) 10:39, 10. Mai 2014 (CEST)
7x Tp für Gabriel Lisette ist nicht schlecht. Mein bisheriger Rekord waren insgesamt 4 für Juan de Zumárraga. --Mai-Sachme (Diskussion) 18:33, 9. Mai 2014 (CEST):
Ich bin auch einige durchgegangen und erstaunlich oft war der Fehler, dass hier eine VIAF-ID ist, die auf eine andere weiterleitet und auf Wikidata schon das Weiterleitungsziel stand. Habe daher mal wieder einen Testlauf gemacht und dabei weit über 3000 solche Weiterleitungen gefunden. Mein Bot korrigiert die jetzt erstmal. Schön, dass VIAF-IDs so persistent sind ;). --APPER\☺☹ 21:04, 10. Mai 2014 (CEST)
Ein Blog-Eintrag von 2011 thematisiert das: "Originally we optimized changes to minimize the number of clusters which disappear or are created. This was important when we did not have a mechanism in place to redirect from one VIAF ID to another, but had a side effect of moving more source records from one cluster to another than we liked" und "We now optimize for minimum movement of source records between clusters, which gives us more stable clusters" (was ich zugegebenermaßen nicht wirklich verstehe, aber so interpretiere, dass eben häufiger Cluster komplett in anderen, ggfls. neuen, aufgehen und auf technischer Ebene dann ein Redirect besteht). Für mich fällt das aber noch unter "Persistenz", denn wenn eine Nummer auf eine andere weiterleitet, kann man darauf maschinell reagieren, bei "This cluster no longer exists in VIAF" hingegen kann man noch einmal komplett von vorne beginnen. -- Thomas Berger (Diskussion) 21:46, 10. Mai 2014 (CEST)
Ja, das gute sind die Weiterleitungen: Nur so kann mein Bot das ja glücklicherweise automatisiert fixen. --APPER\☺☹ 22:10, 10. Mai 2014 (CEST)
Soweit ich weiß, ist Wikidata den gleichen Weg gegangen. Die haben die VIAFs von WP importiert und anschließend, vermutlich durch d:User:VIAFbot, die Weiterleitungen aufgelöst. --Kolja21 (Diskussion) 23:08, 10. Mai 2014 (CEST)
PS: Die auf VIAF fixierte enWP hat die Wartungsliste en:Category:VIAF different on Wikidata (aktuell: 12.030 Artikel). Vielleicht könnten wir analog "Category:GND different on Wikidata" ("Kategorie:Wikipedia:Andere GND auf Wikidata") anlegen. --Kolja21 (Diskussion) 23:18, 10. Mai 2014 (CEST)
Das wäre sinnvoll, wenn es möglich ist, alle bei WD angegebenen GNDs zu "durchsuchen" keine Ahnung, wer sagen kann, ob das geht. Derzeit betreffen die meisten Unterschiede GND-Dubletten, von denen eine hier und eine andere auf Wikidata angegeben ist. --APPER\☺☹ 23:21, 10. Mai 2014 (CEST)
Das Objekt muss per Interwiki-Link (Sitelink) mit dem entsprechenden Artikel in deWP verlinkt und in deWP die Normdatenvorlage eingetragen sein. Sonst funktiert die Abfrage, soweit ich weiß, nicht. --Kolja21 (Diskussion) 23:49, 10. Mai 2014 (CEST)
Habe inzwischen die vollständige Liste. Es handelt sich um zigtausende Einträge. Ein paar habe ich auf Benutzer:APPER/Wikidata gestellt. Bitte nachfragen, wenns leer ist und mehr gewünscht ;). --APPER\☺☹ 14:12, 17. Mai 2014 (CEST)

Blüht uns da noch was?[Bearbeiten]

In http://d-nb.info/gnd/4508501-8 (und anderen Flughäfen) zu finden: Verwendungshinweis: Benutzt für die Körperschaft und das Gebäude. Bei Wiederaufgreifen für die Körperschaft einen eigenen Normdatensatz anlegen. Heißt das, nachdem jetzt alle möglichen GKD und SWD-Sätze zusammengeschmissen werden, blüht das Unwesen bald wieder neu auf?? --AndreasPraefcke (Diskussion) 14:49, 14. Mai 2014 (CEST)

Einerseits werden fleissig Körperschaften und naturräumliche Einheiten zusammengeworfen (frische "Dublette" die Identifikation der Insel Formosa mit der Republik China), aber andererseits hat man aus der Vergangenheit gelernt, dass die traditionelle Gleichsetzung von Gebäuden (als Werke der Architektur) mit den darin hausenden Körperschaften keine tragfähige Idee ist. Dein Befund deutet darauf hin, dass zumindest für Flughäfen geplant ist, die Trennung zukünftig auch durchzuziehen. -- Thomas Berger (Diskussion) 15:46, 14. Mai 2014 (CEST)
Aha, man darf also gespannt sein. --AndreasPraefcke (Diskussion) 14:36, 15. Mai 2014 (CEST)

Vorgehen bei unklaren GNDs[Bearbeiten]

Hi. Wie geht ihr mit solchen Fällen wie Nicolas Roche um? Es gibt einen korrekten LCCN-Datensatz und einen VIAF-Datensatz dazu. Dort ist die Tp 1045325686 auch verlinkt. Die Wahrscheinlichkeit ist groß, dass es die Person ist, aber der Datensatz ist eigentlich zu dünn für eine sinnvolle Zuordnung. Wie geht man mit solchen "Tp" um. Das ist ja kaum mehr als ein Tn... --APPER\☺☹ 20:59, 1. Jun. 2014 (CEST)

Die Datenarmut deutet auf einen Verbundkatalog als Quelle. In diesem Fall ist es der HBZ-Verbundkatalog, der als Werktitel Inside the peloton liefert, die Nicolas Roche#Autobiografie. Fazit: Eintragen. -- 32X 21:47, 1. Jun. 2014 (CEST)
Danke. Werde dann öfter mal einen Blick auf die Verbundkataloge werfen. --APPER\☺☹ 22:53, 1. Jun. 2014 (CEST)

Fehler im Bundesarchiv[Bearbeiten]

Im Artikel Louis Auguste Ravené (1866–1944) gibt es einen Einzelnachweis mit diesem Link zu den Akten der Reichskanzlei - soweit korrekt. Die auf dieser Seite angegebene PND-Nummer 117690872 steht aber in der DNB für eine andere Person (Wirkungsdaten 1853–1858). Mann müsste bei Verwendung der Vorlage:AdR dann eine andere Nummer als die richtige GND eintragen - was nicht schön ist. Gibt es dafür auch so etwas wie Wikipedia:PND/F?--Färber (Diskussion)

Lt. Bundesarchiv ist es eine gemeinsame Edition mit der Historischen Kommission bei der Bayerischen Akademie der Wissenschaften. Insofern könnte es sich lohnen, statt beim Bundesarchiv einen Zuständigen auszugraben den bei [1] angegebenen "CONTACT" anzumailen. -- Thomas Berger (Diskussion) 18:29, 5. Jun. 2014 (CEST)
Vllt. kann ich das morgen mal versuchen. Vielen Dank für die Antwort.--Färber (Diskussion) 21:52, 5. Jun. 2014 (CEST)

Ich habe mal bei der Historischen Kommission angerufen. Der zuständige Mitarbeiter hat das notiert und wird das prüfen. Die Daten würden etwa "alle halbe Jahre" mal angefasst.--194.25.30.14 08:40, 6. Jun. 2014 (CEST)

Abgleich mit Wikidata[Bearbeiten]

Seit der letzten Woche gibt es bei den Bildern in Infoboxen Wartungskategorien, die automatisch den Wikipedia-Artikel mit dem Inhalt in Wikidata abgleichen. Das sind vor allem Kategorie:Local image but no image on Wikidata, Kategorie:No local image but image on Wikidata, Kategorie:Local image different from Wikidata.
So etwas wäre in meinen Augen auch für die Normdaten praktisch. In der italienischen Wikipedia gibt es schon so etwas: it:Categoria:Codice VIAF assente ma presente su Wikidata‎, it:Categoria:Codice VIAF differente da Wikidata‎, it:Categoria:Codice VIAF non presente su Wikidata‎. Die Implementierung ist sehr einfach. Es braucht nur eine Anpassung der Vorlage. Der jeweilige Parameter (GND, LCCN, VIAF) muss nur mit der äquivalenten Eigenschaft auf Wikidata abgeglichen werden. Befüllt werden diese Kategorien automatisch.
Das würde hier und dort helfen, die Qualität zu steigern und abweichende Angaben korrigieren zu können. -- Pütz M. (Diskussion) 13:56, 16. Jun. 2014 (CEST)

Solange auf Wikidata (a) Botbetreiber am längeren Hebel sitzen und (b) als Quelle Wikipedia(-Kategorien) gelten dürfen, ist dies meines Erachtens ein Schritt in die falsche Richtung. -- 32X 16:27, 16. Jun. 2014 (CEST)
Es geht doch nur darum die Unterschiede aufzulisten um überhaupt mal ein Bild zu bekommen, ob und wie hilfreich Wikidata wäre anstatt sich wie jetzt nur auf Mutmaßungen zu verlassen. --Mps、かみまみたDisk. 16:46, 16. Jun. 2014 (CEST)
Ich gehe davon aus, dass d:User:KrBot alle Normdaten-Vorlagen von hier nach Wikidata schippt. Wenn das nicht passt, gibt es dort einen Doppeleintrag und es fällt bei d:Wikidata:Database reports/Constraint violations/P227 auf. Bzw. analog für LCCN. Bei VIAF sind abweichende Nummern ja eher die Norm. Ob umgekehrt Wikidata GND-Nummern zu Items hat, deren zugehöriger Artikel hier ohne Normdatenvorlage ist, finde ich nicht so spannend: Vielleicht sollten wir uns hier die Prioritäten lieber selber setzen. Jedenfalls wäre eine Art Marathon, wo Bots oder Benutzer aufgrund von Wartungslisten ohne weitere Prüfungen Normdatennummern möglichst schnell von Wikidata hierhin schippen, der Super-GAU, denn der Überschuss in Wikidata dürfte größtenteils auf dem automatischen VIAF-Mapping durch OCLC vor einigen Jahren beruhen. Bleibt also höchstens der Neid, dass Normdaten-Umlenkungen in Wikidata zeitnah durch Bots nachvollzogen werden, wohingegen sie hier in unregelmäßigen Abständen aus Offline-Wartungslisten abzuleiten sind. Andererseits sind Umlenkungen selbst ja wieder persistent, d.h. es ist ziemlich egal, mit welcher Verspätung man sie nachvollzieht... -- Thomas Berger (Diskussion) 18:48, 16. Jun. 2014 (CEST)

Bitte um Hilfe[Bearbeiten]

Kann mit den angegebenen Normdaten in Paris Latino nichts anfangen. --Mai-Sachme (Diskussion) 17:37, 28. Jun. 2014 (CEST)

Habe mal den Einsteller angeschrieben. Vielleicht liest er das ja trotz seiner dauerhaften Abwesenheit.--USt (Diskussion) 17:52, 28. Jun. 2014 (CEST)
Es handelt sich um den Eintrag zum Tonträger im Katalog der Library of Congress ("Normdaten" sind nur LCCN-Nummern, die mit "n" beginnen). Daher hat die Nummer in der Vorlage nichts zu suchen und ich habe sie gestrichen. -- Thomas Berger (Diskussion) 18:31, 28. Jun. 2014 (CEST)
Ich danke allen Beteiligten für ihre wertvolle Mitarbeit. Liebe Grüße, --Colin (Diskussion) 19:12, 28. Jun. 2014 (CEST)

Schwach individualisierte Tp[Bearbeiten]

Hallo, Alexandre Collin hat einen VIAF-Satz, der Tp 1038750571 enthält (der Landesbezug Deutsches Reich irritiert natürlich). Alle references verweisen tatsächlich auf den Bauingenieur, aber speisen die sich womöglich aus dem VIAF-Satz? --Mai-Sachme (Diskussion) 16:53, 30. Jun. 2014 (CEST)

Wo jeder einzelne sagt "by http://viaf.org/viaf/37191916" ist der Schluss naheliegend (und auch korrekt). Das VIAF-Cluster enthält aber noch mehr Datensätze, und die Visualisierung zeigt, dass der GND-Satz extrem schwach mit dem Rest verbunden ist (nur über den Niederländischen Eintrag mit ebenfalls gekürztem Vornamen, und auch der wiederum nur schwach mit dem Rest). "Selected Titles" zeigt überhaupt kein GND-Fähnchen, d.h. es gibt keine nachvollziehbaren Indizien für die Zuordnung. Daher hier möglichst die Finger davon lassen, zumal die GND-Angaben "Naturwissenschaftler" und "Deutsches Reich" zwar ohne Daten, Orte und/oder Literatur nicht wirklich belastbar sind, tendenziell aber eher im Widerspruch zu Alexandre Collin stehen. -- Thomas Berger (Diskussion) 18:56, 30. Jun. 2014 (CEST)
Naja, Naturwissenschaftler würde schon einigermaßen passen, erstens weil diese DNB-Beschreibungen oft haarscharf an der Sache vorbeizielen, zweitens weil Collin sich ja tatsächlich laut Artikel um die Hydrologie verdient gemacht hat. Aber danke jedenfalls! --Mai-Sachme (Diskussion) 19:00, 30. Jun. 2014 (CEST)

Verwendung von Normdatenvorlage[Bearbeiten]

Hallo, mir sind binnen kürzester Zeit zwei Verwendungsweisen der Normdatenvorlage aufgefallen, die wir in der Form wohl nicht wollen, oder täusche ich mich? Einmal siehe hier: Ausfüllen eines Parameters GNDName=fehlt. Und einmal siehe hier: Eintragung von GNDCheck, obwohl GND, LCCN und VIAF allesamt wunderbarst vorhanden sind. Liege ich mit meinen Reklamationen richtig? Besteht Präzisierungsbedarf bei der Vorlagenbeschreibung? Besteht bei den GNDName=fehlt-Fällen Nachräumbedarf?

Und noch etwas anderes: Wer findet raus, welcher Artikel mit Bartın gemeint ist? Diesmal musste ich passen. --Mai-Sachme (Diskussion) 21:21, 12. Jul. 2014 (CEST)

Hallo Mai-Sachme, der von Dir gesuchte Artikel lautet Bartın. Ich war mal so frei und habe die Normdaten korrigiert...
Hm, dass GND-Name=fehlt eingetragen wird, obwohl eine GND vorhanden ist, habe ich bisher noch nicht beobachtet. Ich bin aber wie Du der Meinung, dass dieses vollkommen überflüssig ist. Da es anscheinend doch Klärungsbedarf besteht, sollte die Vorlagenbeschreibung in dieser Hinsicht angepaßt werden. Ich wünsche ein schönes Restwochenende, --Silke (Diskussion) 14:25, 13. Jul. 2014 (CEST)
Ein Feature von normdaten.js ist, dass man "fehlt" im Feld GND einträgt, damit GNDfehlt=ja und die damit zusammenhängenden Felder generiert werden (sofern Person, sonst bleibt es so stehen...). Ein Benutzer scheint nun häufiger "fehlt" auch für GNDName einzutragen. -- Thomas Berger (Diskussion) 14:45, 13. Jul. 2014 (CEST)

210.000 neue GNDs[Bearbeiten]

Hi. Die DNB hat mitgeteilt, dass ab Mitte August 210.000 neue Tp-Datensätze eingespielt werden. Weiß jemand, wo die herkommen, welche Qualität die haben und ob die für uns relevant sind? --APPER\☺☹ 12:48, 1. Aug. 2014 (CEST)

Höre ich zum ersten Mal. Vielleicht hängt die wundersame Vermehrung mit der Umstellung auf RDA zusammen? Mitte August ist der Zeitpunkt, an dem "die für den deutschsprachigen Raum erarbeiteten Anwendungsregeln und Erläuterungen im RDA-Toolkit zur Verfügung stehen". --Kolja21 (Diskussion) 00:18, 2. Aug. 2014 (CEST)
Nein, es ist wohl wirklich eine Offline-Einspielung, die in drei Portionen für den 14., 21. und 28. August heute angekündigt worden ist. Vielleicht sind es ja die Daten aus dem Kooperationsprojekt mit dem Deutschen Filminstitut? Vor Montag wird man niemanden fragen können... -- Thomas Berger (Diskussion) 01:23, 2. Aug. 2014 (CEST)
Heute ist der große Tag ;) Hat jemand mittlerweile gehört/gelesen, welchen Personenkreis die Neueinspielung betrifft oder woher die Daten stammen? --Kolja21 (Diskussion) 17:48, 14. Aug. 2014 (CEST)
Gestern abend lief die zweite Tranche ein, alle von mir bislang angesehenen Einzelfälle stammen vom IAI/PK (DE-204). -- Thomas Berger (Diskussion) 12:08, 22. Aug. 2014 (CEST)
Danke, sieht tatsächlich danach aus. Grad mal ein paar Lateinamerikaner durchgegangen, da kann man jetzt anscheinend erstaunlich viele GNDs ergänzen. Wobei es sich vermutlich lohnt zu warten, bis alle drei Blöcke eingespielt sind. --APPER\☺☹ 13:41, 22. Aug. 2014 (CEST)
Wobei anscheinend nicht wenige eine Qualität wie Tp 1056656514 haben :(. Ohne Lebensdaten sind solche Einträge ziemlich... naja... wird schon Mireya Cueto sein, aber eigentlich habe ich bei sowas immer ein schlechtes Gewissen, die GND einzutragen. --APPER\☺☹ 13:44, 22. Aug. 2014 (CEST)
Das IAI ist im GBV nachgewiesen, also handelt es sich bei Tp 1056656514 um die dortige PPN 398495718. Wir sollten beobachten, ob im Nachklapp dieser Einspielung dieser GBV-Normdatensatz mit der GND-Nummer angereichert wird bzw. durch den GND-Satz ausgetauscht wird. Anschließend könnten wir @JakobVoss: evtl. überreden, die GBV-BEACON-Datei zu aktualisieren, und "unsere" Mechanismen wären damit in der Lage, die Bedeutung solcher GND-Nummern anhand der tatsächlichen Nutzung zu verifizieren. -- Thomas Berger (Diskussion) 15:53, 22. Aug. 2014 (CEST)

Wikidata[Bearbeiten]

@APPER, Gymel: In Zusammenhang mit den Neueinspielungen sollten wir überlegen, wie wir in Zukunft mit Wikidata zusammenarbeiten. Die Daten doppelt einzugeben, ist eigentlich (hätte es auf WD nicht soviel Streitereinen gegeben) unnötig. Die Frage ist, ob wir kurz-mittel-langfristig die bestehende Vorlage ergänzen wollen oder eine getrennte Vorlage "Normdaten-Wikidata" erstellen. Welche Vorgehensweise ist für die Wartungsarbeit am besten? --Kolja21 (Diskussion) 10:55, 2. Aug. 2014 (CEST)

PS: Es wäre auch interessant, das Angebot an Normdaten zu überprüfen. Wir hatten uns damals für die NDL entschieden, dessen Datensätze mittlerweile von VIAF erfasst werden und sich auf Autoren beschränken, die in japanischer Sprache veröffentlich haben. Die Normdaten des jap. Verbundkatalogs en:CiNii einzubinden, wäre hilfreicher. Neu könnte man Polen (NUKAT) aufnehmen. --Kolja21 (Diskussion) 14:31, 2. Aug. 2014 (CEST)
Früher oder später wird es sinnvoll sein, die Normdaten aus Wikidata einzubinden. Man muss dann aber langsam vorgehen und sich für jede Normdatei anschauen, wie der Stand bei Wikidata ist. Für die GND ist es beispielsweise derzeit meiner Meinung nach nicht möglich, da dort Tp- und Tn-Datensätze nicht unterschieden werden und tausende Tn-Datensätze eingetragen sind. Diese jetzt hier als "GND" anzuzeigen wäre meiner Meinung nach nicht hilfreich. Ich bin der Meinung, dass man Wikidata noch ein wenig Zeit geben sollte. --APPER\☺☹ 19:32, 2. Aug. 2014 (CEST)
Danke für das Feedback. Eigentlich sollten in WD gar keine Tn's eingetragen werden. Die gelten als Fehler und können per Bot komplett gelöscht werden. --Kolja21 (Diskussion) 20:32, 2. Aug. 2014 (CEST)
(Nach BK) Ich denke, für die GND werden es stets andere Überlegungen sein: Wir haben hier unsere Werkzeuge in Bezug auf WP:PND/F und die "Bindung" der GND-Nummer an einen bestimmten Artikel macht auch (z.B. den Bearbeitern der Meldungen bei der DNB) klarer, wofür es steht. Wikidata hat da in etwa schon VIAF vergleichbare Probleme, Artikel kommen und gehen und haben auch u.U. widersprüchliche Angaben. (Die Qualität in Wikidata ist ganz in Ordnung, da viele Einträge von hier stammen und die interaktive "Authority control" dort anders als normdaten.js hier die "undifferentiated persons" ausschließt. Es sind aber dennoch gut 16.000 Tn's in Wikidata nachgewiesen, würde man sie durch Bots entfernen lassen, kämen sie durch andere Bots als Reimport aus en:WP zuruück?). Auch für VIAF wird es länger eine Sonderbetrachtung geben, mehrere VIAF-Nummern zu einer Person sind normal, auch wenn Wikidata derzeit nur knapp 3.000 solcher Fälle kennt.
Gute Kandidaten wären m.E. BNF (81.000) und SUDOC (63.000), wir haben hier häufiger aus "redaktionellen" Gründen (wie kommen wir auf eine nennenswerte Anzahl, wer pflegt das, ...) entsprechende Vorschläge abgeblockt, d.h. Konflikte mit hier erfassten Daten gibt es nicht, das macht auch die Anzeige einfacher. Gescheit verlinkbar sind diese beiden Nummern auch. d:Wikidata:Database reports/Constraint violations/P268 und d:Wikidata:Database reports/Constraint violations/P269 wirken erfreulich übersichtlich, d.h. es kommt wenig Schrott nach Wikidata rein und/oder es ist unter aktiver Pflege. Natürlich dürfte das Gros der Nummern über VIAF nach Wikidata gekommen sein, das halte ich aber nicht unbedingt für ein Problem. Von der Häufigkeit die nächsten Kandidaten wären CANTIC (Katalanien) mit 15.000 Einträgen in Wikidata, NDL mit 14.000, NKC mit 8.000, BNE mit 1.800. Das oben vorgeschlagene NUKAT hat ca. 2.900 Wikidata-Items, es scheint aber keine Verlinkungsmöglichkeit bekannt zu sein. -- Thomas Berger (Diskussion) 21:14, 2. Aug. 2014 (CEST)
Die Verlinkungsmöglichkeit ist in der Tat wichtig; bei NUKAT, das hatte ich vergessen, sind Permalinks erst für nächstes Jahr in Planung. Katalonien liegt etwas weit ab vom Schuss. Die französische (BnF) und die tschechische Nationalbibliothek (NK ČR) via Wikidata einzubinden, halte ich für die beste Idee. (Ich finde es wichtig, dass wir nicht nur West-, sondern auch Osteuropa berücksichtigen.) --Kolja21 (Diskussion) 02:17, 3. Aug. 2014 (CEST)
Irgendwo (en.wp?) gibt es folgenden Ansatz: Wenn lokal kein Wert (z.B. für VIAF) gesetzt, wird Wikidata angezeigt, sonst der lokale Wert. Wenn beide (lokal und WP) einen Wert haben, wird von der Vorlage eine von zwei Wartungs-Kategorien erzeugt, je nachdem, ob die Werte identisch oder anders sind. Sind sie identisch, kann ein Bot den lokalen Wert entfernen, das Resultat für den Leser bleibt gleich. Normdaten-Sklaven wie wir können dann die "widersprüchliche" Kategorie abgrasen und die Konflikte auflösen. Das EInzige, was sich für den Benutzer "automatisch" ändert, ist, dass mehr Werte (von Wikidata) angezeigt werden. Das kann dann auch mal einer der "Tn's" sein, wenn lokal nicht schon ein besserer gesetzt ist. Kann man Tn's irgendwie automatisch erkennen? Wäre das wirklich ein großes Problem, wenn die (statt "nix") angezeigt werden? --Magnus Manske (Diskussion) 00:44, 5. Aug. 2014 (CEST)
Ja, in der enWP wird das so gehandhabt. Das größere Problem als die Tn's (die müssten sich, wie gesagt, leicht mit einem Botlauf löschen lassen) sind oder waren (?) die Dubletten, vor allem was die VIAF betrifft. Da kommen leicht drei, vier Nrn. für eine Person zusammen. Ich weiß nicht, ob das Problem mittlerweile gelöst ist. --Kolja21 (Diskussion) 14:42, 5. Aug. 2014 (CEST)
Dass es mehr als eine VIAF-Nummer zu einer Person gibt ist ja ein VIAF-Problem. Wir sollten dann halt einfach eine der Nummern anzeigen, so wie das ja derzeit auch gehandhabt wird... Also das sehe ich nicht so als großes Problem. --APPER\☺☹ 17:42, 5. Aug. 2014 (CEST)
VIAF illustriert zwei Probleme, die ich im en:WP-Ansatz sehe: Die Einbindungsmechanismen präsentieren uns eine der tendenziell mehreren VIAF-Nummern in Wikidata (falls nicht jemand dort eine als Vorzugsnummer markiert hat), die lokal gespeicherte Nummer ist da eher "handverlesen". Und falls die VIAF-Nummer entweder aus lokaler Quelle stammt oder aus Wikidata importiert wird, müssten wir eigentlich bei der Anzeige auf die Quelle hinweisen, "hier intellektuell geprüft" gegen "von irgendwo besorgt" macht schon einen Unterschied, selbst wenn in 99% der Fälle das Ergebnis dasselbe ist. Aus diesem Grund bin ich auch dagegen, hier lokal erfasste Nummern zu löschen, sobald eine Übereinstimmung mit Wikidata festgestellt wird (Wikidata mag sie von hier haben und das auch sogar vermerken, aber irgendwann hängt alles in der Luft und rotiert um sich selbst, nicht anders als wenn man alle VIAF-Quelldatenbanken abschalten würde, weil ja nun alles in VIAF ist). -- Thomas Berger (Diskussion) 18:31, 5. Aug. 2014 (CEST)
Ein Problem sind Tn in Artikeln mitunter schon. Die meisten Leser und Wikipedianer kennen den Unterschied zwischen Tp- und Tn-Datensätzen nicht und könnten dann (verständlicherweise) annehmen, dass alle dort gelisteten Werke auch zu dieser konkreten Person gehören. Teilweise tragen Wikipedianer auch fälschlicherweise alle diese Werke blind in die Artikel ein. Das ergibt Fehlangaben in Artikeln, die gerade bei weniger bekannten Personen u. U. leider jahrelang nicht erkannt und korrigiert werden. --91.67.96.57 16:55, 7. Aug. 2014 (CEST)
... vor allem wo wir wiederum die Werkliste im Artikel der DNB gegenüber als Beleg dafür anbieten, anlässlich der Umwandlung in einen Tp-Satz alle möglichen Werke dieser Person zuordnen zu dürfen. -- Thomas Berger (Diskussion) 17:43, 7. Aug. 2014 (CEST)
In diesem Punkt ist auch deWP verbesserungswürdig. Ich stoße immer wieder auf Fälle wie Erich Kloss (Autor), wo in der Vorlage:DNB-Portal ein Tn eingetragen wurde, der auf Werke eines Namensvetters verlinkt, obwohl die Normdatenvorlage den korrekten Tp nennt.[2] Außerdem wäre es hilfreich, wenn ein Bot mal die ganzen VIAF-Einträge löschen würde, die nur mit einem Tn verknüpft sind. --Kolja21 (Diskussion) 20:14, 7. Aug. 2014 (CEST)

Zwei Vorschläge, wie man sich bei Bedarf an die Normdaten aus Wikidata herantasten könnte:

  • Auswahl einer Normdatenbank, etwa BnF, die zusätzlich im Normdatenkasten für alle Benutzer angezeigt wird. Für die BnF gibt es weiter oben gute Argumente und mir fällt kein Grund ein, warum man das nicht kurzfristig ausprobieren sollte. Technisch bin ich in Punkto Wikidata überhaupt nicht auf dem Stand der Dinge, aber eine entsprechende Erweiterung unserer Normdatenvorlage dürfte relativ einfach sein?
  • Direkt angehen könnte man einen einmaligen Botlauf durch Wikidata, der alle Tn löscht. Anschließend könnte man vielleicht ganz nützliche Erkenntnisse gewinnen, welche automatischen Prozesse in Wikidata aktiv sind und die Tn ggf erneut eintragen. Wie aufwendig wäre das Aufsetzen eines derartigen Bots? Könnte man vielleicht bei Ivan_A._Krestinin anfragen, dessen KrBot die tägliche Aktualisierung der P227 constraint violation reports durchführt?

Ich persönlich bin derzeit eher skeptisch was Wikidata betrifft, aber wenn man/jemand in dieser Richtung was machen möchte, sind diese beiden Kleinprojekte doch ganz gut geeignet, weil risikoarm: Der Aufwand ist überschaubar, die Auswirkungen sind klar begrenzt und es gehen keinerlei Informationen verloren. -- Make (Diskussion) 21:01, 8. Aug. 2014 (CEST)

+ 1. Plädiere, wie oben ausgeführt, für die Neuaufnahme von BnF und NK ČR via Wikidata. Wegen des Botlaufs nachzufragen, kann auch nicht schaden. --Kolja21 (Diskussion) 02:48, 9. Aug. 2014 (CEST)

Wenn die Daten aus Wikidata bezogen werden, führt das dazu, dass bei neuen Artikeln gar keine Normdaten mehr lokal, sondern auf WD eingetragen werden. Wenn es dann mehrere VIAF's zu einer Person gibt, muss eine Regel her, welche ausgewählt wird. Ich finde, es ist dann diejenige sinnvoll, zu der es auch eine GND gibt. Oder die mit "Datenherkunft = deutschsprachige Wikipedia".--Färber (Diskussion) 09:03, 12. Aug. 2014 (CEST)

Bei WD kann man Aussagen (wie "VIAF = ...") mit einem Rang versehen: "Der Rang (rank) bezeichnet verschiedene Qualitätsstufen für die einfache Auswahl in Fällen, wo es mehrere unterschiedliche Aussagen (statements) zu einer bestimmten Eigenschaft (property) gibt" (d:Help:Ranking). Sauber programmiert, kann die Vorlage daher selbst erkennen, welcher von den dubletten Datensätzen angezeigt werden soll. (Ich wähle in der Regel die VIAF aus, die die meisten Treffer hat.) --Kolja21 (Diskussion) 17:45, 14. Aug. 2014 (CEST)
Das Problem mit verschiedenen Einträgen gibt es gelegentlich auch bei der DNB!--Martin Se aka Emes Fragen? 15:58, 16. Aug. 2014 (CEST)

Hickey, Toves (2014): Managing Ambiguity In VIAF[Bearbeiten]

[3] -- grad (zufällig) gefunden, Details zur VIAF-Konstruktion, zB:

  • “Other than our ability to redact data from the database, there is no option to directly edit a VIAF record. Changes to the VIAF record are accomplished by changes to its source records, and in this way the VIAF clusters are 'virtual' authority records.”
  • “Our goal is that for any two source records in a cluster, that there is less than a 1% chance that they describe two different entities, that is that the link is correct more than 99% of the time. A recent check of 300 random pairings within VIAF clusters failed to find any incorrect pairs.”

-- Make (Diskussion) 14:33, 10. Aug. 2014 (CEST)