Vorlage Diskussion:Normdaten

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
Diese Diskussionsseite dient dazu, Verbesserungen an der Vorlage „Normdaten“ zu besprechen.

Persönliche Betrachtungen zum Thema gehören nicht hierher. Für allgemeine Wissensfragen gibt es die Auskunft.

Füge neue Diskussionsthemen unten an:

Klicke auf Abschnitt hinzufügen, um ein neues Diskussionsthema zu beginnen, und unterschreibe deinen Beitrag bitte mit Signatur und Zeitstempel oder --~~~~.
Archiv

Wie wird ein Archiv angelegt?

Wikipedia Diskussion:Normdaten | commons:Template talk:Authority control | en:Template talk:Authority control | eo:Ŝablono-Diskuto:Bibliotekoj

Wichtiger Hinweis[Quelltext bearbeiten]

Das Archiv der Diskussion um die Vorlage:PND befindet sich hier. Die Vorlage:PND ist veraltet und wurde gelöscht. --AndreasPraefcke (Diskussion) 13:23, 23. Mai 2012 (CEST)

Ich habe den Beitrag hierhin übertragen und etwas verändert. MfG Harry8 09:46, 6. Aug. 2012 (CEST)

"14.000 Tn werden zu Tp6"[Quelltext bearbeiten]

Der folgende Datensatz könnte einer der Tns sein, die in Tp6 umgewandelt wurden:

Der Datensatz trägt das Erstellungsdatum 17-06-20 und ist als "PND-Grundbestand" gekennzeichnet. Für welches Werk er angelegt wurde, erfährt man weiterhin nur über die OGND.

Auch VIAF:32407883 zeigt nicht den dazugehörigen Titel (Baškirskie suveniry, 1982) an.

@Wurgl: Die Kunstwissenschaftlerin tauchte in deiner Liste unter "Parameter GND mit einem Tn ausgefüllt" auf.[1] Entsprechend müssten die Tn/Tps bei der nächsten Aktualisierung unter "Parameter GNDName mit einem Tp ausgefüllt" zu finden sein. --Kolja21 (Diskussion) 02:16, 14. Jul. 2020 (CEST)

13.624 Tns wurden zu Tps "befördert". Nachdem laut Aussage der DNB (zumindest erinnere ich mich, sowas gelesen zu haben) seit längerer Zeit (ich glaub 1 Jahr) keine Tns mehr angelegt wurden, ist das wohl die tatsächliche Zahl. --Wurgl (Diskussion) 16:15, 17. Jul. 2020 (CEST)
Super. Das gut zu wissen. Im August 2019 wurde die Vergabe von Tn-Nummern eingestellt. Dann stimmt die Angabe "14.000 Tn werden zu Tp6". Gibt es darunter welche, die mehr Informationen als GND 103328513 enthalten? Und werden die Fälle in deiner Liste unter "Parameter GNDName mit einem Tp ausgefüllt" erscheinen? --Kolja21 (Diskussion) 17:58, 17. Jul. 2020 (CEST)
Weiß noch nicht ob da Info ist. Hab noch einen Fehler, eine wundersame Datenverdopplung die ich noch finden muss. Ja, die werden kommen und ich werde sowas wie "ehemals Tn" dazuschreiben. --Wurgl (Diskussion) 18:03, 17. Jul. 2020 (CEST)

Aus der alten Liste Benutzer:Wurgl/Fehler GND, Abschnitt "Parameter GNDName ergänzen":

  • Yōko Kamio Ergänzen um Tn 143225197
    @Wurgl, Raymond: Der Tn wurde in einen Tp6 umgewandelt. Über das Webformular lässt er sich nicht erg. Fehlermeldung: "Feld 'Entitätencodierung' ist obligatorisch." (Den Fall auf WP:GND/F gemeldet.) Da das dazugehörige Werk Hana yori dango nicht im Katalog der DNB angezeigt wird, ist es naheliegend, dass der Tp6 auch weiterhin wie ein Tn für alle Personen dieses Namens genutzt wird. --Kolja21 (Diskussion) 16:22, 18. Jul. 2020 (CEST)
Dieses "Typ Person (piz)" fehlt bei den zu Tp beförderten Datensätzen. Hab mir ein paar angeguckt, fehlt wohl bei allen. --Wurgl (Diskussion) 16:47, 18. Jul. 2020 (CEST)
@Kolja21: Sorry für die späte Reaktion. War das oben eine Bitte, eine Mail an die Ansprechperson für das Webformular zu senden? — Raymond Disk. 20:19, 22. Jul. 2020 (CEST)
Mir erscheint das eher ein Fehler beim Upgrade der Tns zu Tps zu sein. Da muss noch der Typ "Person (piz)" dazu. Okay, per Webformular kann man das wohl auch fixen, aber auf Ebene der Datenbank ist das wohl einfacher. --Wurgl (Diskussion) 20:25, 22. Jul. 2020 (CEST)
Per Webformular lassen sich die Neu-Tp6, wie oben geschrieben, nicht bearbeiten. @Raymond: Es ist unprofessionell, wie die DNB die Sache handhabt. Auf die Bugs in dem Webformular hast du sie ja schon mehrmals hingewiesen. Ich denke, es reicht, wenn wir die Neu-Tp6 auf WP:GND/F melden; wir müssen nicht darauf dringen, die Ergänzung der Datensätze für die Bibliothek zu erledigen. --Kolja21 (Diskussion) 20:55, 22. Jul. 2020 (CEST)

VIAF: "Das Cluster wurde entfernt"[Quelltext bearbeiten]

VIAF scheint Probleme zu haben, die Datensätze der BnF zu lesen. VIAF:316443275 für den Radrennfahrer André Huret: "Das Cluster wurde entfernt und ist nicht mehr in VIAF enthalten." Offenbar hat VIAF alle Einträge, die es keiner Entität zuordnen konnte, gelöscht, selbst in den Fällen, in denen bereits ein Link zu Wikidata erfasst war. Der betreffende Eintrag BnF 14974456 ist weiterhin problemlos abrufbar. --Kolja21 (Diskussion) 13:32, 16. Aug. 2020 (CEST)

Selbes Problem mit der Normdatei der Vatikanischen Apostolischen Bibliothek (BAV): VIAF:89204787 (keiner Entität zuordenbar), gelöscht. --Kolja21 (Diskussion) 18:57, 16. Aug. 2020 (CEST)

LCCN Formatierung[Quelltext bearbeiten]

Hallo, gibt es eigentlich irgendeinen Grund warum man die bescheuerte / Formatierung braucht und nicht einfach den Link eintragen kann? Der Identifier ohne / und herumgefummele mit führenden Nullen ist doch eindeutig. Könnte man nicht sogar beides zulasse, um nicht tausende Artikel ändern zu müssen? --Fano (Diskussion) 15:30, 20. Aug. 2020 (CEST)

Service von der Vorlagenseite: Als Hilfsmittel gibt es das Skript normdaten.js, das die Einfügung der Daten erleichtert. In das Skript einfach die Nummer hineinkopieren und um den Rest brauchst Du Dir dann keine Gedanken mehr machen. Ohne dieses Skript würde ich die Normdaten schon seit Jahren nicht mehr pflegen wollen. --Silke (Diskussion) 16:42, 20. Aug. 2020 (CEST)
Wenn das schon per script geht, wieso kann dann die Vorlage nicht den gleichen Code ausführen? Dann hat jeder was davon und nicht nur die die angemeldet sind und wissen wie sie ihre .js verändern. --Fano (Diskussion) 18:54, 20. Aug. 2020 (CEST)
Der Grund ist nur historischer Art: Die Vorlage wurde ursprünglich so erstellt. Sie zu ändern, ist 1) kompliziert (ich kann es nicht) und 2) müssen auch die Wartungsliste entsprechend angepasst werden. Wenn sich jemand beiden Aufgaben widmen möchte, nur zu. --Kolja21 (Diskussion) 03:03, 21. Aug. 2020 (CEST)
Vielen Dank, hab es mal unter Wikipedia:WikiProjekt_Vorlagen/Werkstatt#LCCN_bei_Vorlage:Normdaten angesprochen wenn nur historisch. --Fano (Diskussion) 13:49, 24. Aug. 2020 (CEST)
Die Vorlage wurde bereits entsprechend geändert, was 703.784 Artikel betrifft. Hilfe:Normdaten müsste, falls es dabei bleibt, entsprechend aktualisiert werden. @Wurgl: Funktionieren Wartungslisten wie Benutzer:Wurgl/DoppelteNormdaten weiterhin, obwohl es jetzt zwei Formate für LCCN gibt? @Schnark: Ist es sinnvoll, dein Skript auf das neue, benutzerfreundlichere Format umzustellen? Randbemerkung: Library of Congress Control Number (LCCN) ist als Bezeichnung mehrdeutig. Korrekt müsste der Parameter Library of Congress Authorities (LCAuth) heißen = LCAuth-Kennung (P244). --Kolja21 (Diskussion) 19:04, 24. Aug. 2020 (CEST)
Kommt Zeit, kommt Anpassung. Falsche Infos wie bei Teresa Tomsia (bitte bis Donnerstag zu Testzwecken so lassen) klappen natürlich nach wie vor nicht. Ich nehme an, diese 6 Stück haben diese Änderung ganz dringend notwendig gemacht</rant>. --Wurgl (Diskussion) 19:57, 24. Aug. 2020 (CEST)
Sollen wir uns mit zwei Formaten rumplagen oder ist in diesem Fall ein Botlauf sinnvoll? 313.222 - 6 = 313.216 Korrekturen. --Kolja21 (Diskussion) 21:12, 24. Aug. 2020 (CEST)
Was ist mit Schnarks Normdatenscript? Gibts noch was? --Wurgl (Diskussion) 21:25, 24. Aug. 2020 (CEST)

@Botlauf: Der ginge in die Monate, und dafür ist die Geschichte nicht wichtig genug. Gibt Zoff mit Beos und VG. Es gibt Leute, die wollen auch Bots beobachten und blenden die nicht aus.

  • Heißt: Die Auswertenden müssen dann halt mit allen Formaten klarkommen. Kann eh kaum mehr als einer sein.
  • Vorlage:LCCN kann noch ein paar, zumindest bei Katalogeinträgen.
  • Schnark ist leider schon seit Monaten offwiki; weil er vor zehn Jahren mal Student war ist er heute vielleicht mit anderen Sachen beschäftigt.

VG --PerfektesChaos 23:18, 24. Aug. 2020 (CEST)

Ok, es muss nicht gleich ein Botlauf sein.
  • Eine Aktualisierung von Schnarks Normdatenscript reicht fürs Erste aus, falls Wurgl grünes Licht gibt.
  • Die Vorlage:LCCN ist laut Beschreibung für "Druckwerke ohne eine ISBN" gedacht (analog zur Vorlage:DNB). Deswegen meine Anm. von oben, dass der Parameter in der Normdatenvorlage eigentlich in "LCAuth" umbenannt werden müsste.
--Kolja21 (Diskussion) 06:14, 25. Aug. 2020 (CEST)
Ja, Vorlage:LCCN ist für das Volk an Katalogeinträge zu einer Publikation adressiert; soweit die Syntax hingegen anwendbar ist (womit mich zu beschäftigen ich nach sieben Jahren Intervall weder Bock noch Zeit habe) müsste das Prinzip auch für Schlagwortkategorien nutzbar sein.
Ich würde empfehlen, sich hinsichtlich umseitiger Vorlagenprogrammierung in optischer Darstellung sowie Konsistenzprüfung zu beschäftigen mit:
Wie in Vorlage:LCCN #Veraltete_Parameter dargestellt ist das Schrägstrich-Format ein hiesiges Eigengewächs aus der Vor-Lua-Zeit, also vor 2013.
Für die formal-syntaktische Richtigkeit würde das ja langen; wenn die inhaltliche Zuordnung geprüft werden kann müsste das von externem Zeugs unternommen werden.
VG --PerfektesChaos 17:28, 25. Aug. 2020 (CEST)
Die Prüfung auf formal gültige LCCN läuft jeden Donnerstag und da gibts eine nette Regular Expression mit der sich die Datenbank herumschlagen darf: lccn NOT REGEXP '^(n|nb|nr|ns|no|sh|sj|sp)(/(200[1-9]|201[0-9]|2020|42|50|00|7[789]|[89][0-9])/[0-9]{1,6}|(200[1-9]|201[0-9]|2020|42|50|00|7[789]|[89][0-9])[0-9]{6})$' (der Teil mit dem Jahr ab 2000 ist generiert, nächstes Jahr sind also auch solche mit 2021 gültig)
Das ist aber nur auf formale Richtigkeit, auf Gültigkeit (HTTP 404, 302 etc.) prüfe ich nicht.
Die sind dann in Benutzer:Wurgl/DoppelteNormdaten zu finden. --Wurgl (Diskussion) 17:53, 25. Aug. 2020 (CEST)
Vorlage:str match kann den von dir genannten RegExp leider nicht testen, selbst nicht auf den normalisierten Code, weil Lua primär kein (Hund|Katze|Maus) in der Syntax hat. Sowas geht zwar, jedoch nur über eine komplexe programmtechnische Umschreibung.
Es könnte allerdings der normalisierte Code auf eine Plausibilität geprüft werden; ^[ns][bhjoprs]?%d würde grob unplausible ausfiltern; die Ziffernfolge kann analog grob auf völlige Ausreißer geprüft werden und obiges isLCCN kann schwere Syntaxverstöße identifizieren.
Die in die umseitige Programmierung eingebauten Checks haben zwei Vorteile:
  • Es gibt noch vor Abspeicherung eine Fehlermeldung und eine sofort abzuarbeitende Wartungskat.
  • Die Programmierung ist nicht vom Zugriff auf externe Software abhängig, sondern bedarf irgendwen aus einer Personaldecke von einem Dutzend Leutchen.
VG --PerfektesChaos 19:03, 25. Aug. 2020 (CEST)
Mengenorientiertes SQL. wo ich auf einen Sitz alle bekommen will. ist eben anders als eine Prüfung einer einzelnen Zeichenkette. In Lua kann man wohl zu Fuß die einzelnen Zeichen durchgehen. Erst sind ein oder zwei Buchstaben, siehe erste Klammer, danach nur im alten Format der Schrägstrich, danach Ziffern. Ist die erste eine "2", dann 4 Stellen und die müssen numerisch >= 2001 und <= aktuelles Jahr sein. Ist es keine "2", dann kann 42, 50, 00 oder zweistellig >= 77 kommen. Dann nur im alten Format der Schrägstrich und nach diesem bis zu 6 Ziffern (führende Nullen dieses Teils konnten im alten Format weggelassen werden). Im neuen Format zwingend genau 6 Ziffern. Fertig. Sowas geht zwar in SQL auch, nur zeigt mir dann der Query-Optimierer den Vogel und wird ziemlich nie fertig. --Wurgl (Diskussion) 20:27, 25. Aug. 2020 (CEST)
Ich schrub, dass mit dem normalisierten Format zu arbeiten wäre; heißt, man möge den vom Benutzer angegebenen Code an eine Untervorlage dergestalt übergeben, dass er dort nur noch normalisiert ankäme. Dann kann man diesen nach einheitlicher Regel checken, ob er Mindestvoraussetzungen erfüllen würde, und außerdem verlinken und darstellen. Auf die Frage, ob das mal mit oder ohne Schrägstriche angegeben wurde käme es nicht mehr an. formatLCCN@URIutil kann also in der Untervorlage gecheckt, verlinkt, Wartungsgekattet werden. VG --PerfektesChaos 21:00, 25. Aug. 2020 (CEST)
Für den Import in Wikidata (siehe Kategorie:Wikipedia:LCCN in Wikipedia vorhanden, fehlt jedoch in Wikidata#Import in Wikidata) muss die bisherige Schreibweise mit den Schrägstrichen derzeit noch über einen Zwischenschritt über LibreOffice/OpenOffice auf die Variante ohne Schrägstriche umformatiert werden (der Import erfolgt dann mit QuickStatements ohne Angabe des Ursprunges und ohne Fehlerprüfung / constraint violation check / unique value violation / format violation). Dagegen kann die Schreibweise ohne Schrägstriche direkt mit dem ersten Schritt in Wikidata importiert werden, inklusive der Information, dass die Angabe aus dem deutschen Artikel importiert wurde (Beispiel) sowie einer Fehlerprüfung beim Import (constraint violation check / unique value violation / format violation). Für Artikel ohne LCCN/LCAuth siehe auch Kategorie:Wikipedia:LCCN in Wikipedia fehlt, in Wikidata vorhanden (18.393 Artikel mit Stand 29. August 2020). --M2k~dewiki (Diskussion) 13:59, 29. Aug. 2020 (CEST)

Bei einigen WD-Objekten wird der Import aus den de-WP-Artikeln abgelehnt, in den Objekten finden sich die LCAuth mit der Angabe "Grund für die Zurückweisung: betrifft eine andere Person":

--M2k~dewiki (Diskussion) 14:14, 29. Aug. 2020 (CEST)

Danke für die Info. Ich korrigiere die Fälle hier, dann müsste der Import in WD klappen; vorausgesetzt es gibt eine passende LCAuth. --Kolja21 (Diskussion) 15:34, 29. Aug. 2020 (CEST)

Tn bzw. Parameter "GNDName" löschen?[Quelltext bearbeiten]

Zur Frage: "Sehe ich das richtig, dass die DNB die Tn komplett gelöscht/unsichtbar gemacht hat, ich sie also jederzeit - ohne nachzugucken - löschen kann? Und wenn ja, warum entsorgt man dann nicht alles Tn automatisch, per Bot? Ich wette ein großer Anteil der Artikel wird aus den Unterkategorien zu Kategorie:Wikipedia:GND fehlt geschmissen (schön wärs!), eben da, wo eine Tp vorhanden ist und eine jetzt überflüssige Tn." (Jack User auf Benutzer Diskussion:Graphikus#Tn)

Im DNB-Katalog wurden die Tns in der Tat "unsichtbar" gemacht, d.h. aus dem Index gelöscht (s. Hilfe:GND#Personen). Sie sind nicht mehr mit Titeln verknüpft, was die Wartungsarbeit erschwert. In VIAF tauchen die Tns mit dem Hinweis "(undifferentiated)" noch vereinzelt auf. Imho kann man die Tns löschen, wenn:
  1. eine GND (Tp) für die Person vorliegt
  2. mindestens ein Titel mit der GND verknüpft ist
Ohne verknüpfte Titel fällt es VIAF schwer, die Personen richtig zuzuordnen. (@Wurgl: Kann ein Bot den Job übernehmen?) Sind die beiden Bedingungen nicht erfüllt, sollte man überprüfen, ob im DNB-Katalog Literatur von oder über diese Person vorliegt und sie gegebenenfalls auf WP:GND/F melden. --Kolja21 (Diskussion) 22:44, 10. Nov. 2020 (CET)
Wäre es nicht trivialer die Vorlage Normdaten so umzubauen, dass GNDName keine sichtbare Ausgabe bewirkt? Etwas über 27.000 Artikel sind mit GNDName (und Inhalt) bzw. etwas über 28.000 Artikel mit Parameter GNDName mit/ohne Inhalt versehen. --Wurgl (Diskussion) 22:59, 10. Nov. 2020 (CET)
@Wurgl: Die Angaben der Parameter "GNDName" und "REMARK" sind doch schon jetzt nur für Benutzer sichtbar, die die entsprechende Einstellung vorgenommen haben. An der Abarbeitung der Kategorie:Wikipedia:GND fehlt kommen wir nicht herum. Weißt du, wie viele der 27.000 Artikel die oben genannten Kriterien erfüllen? --Kolja21 (Diskussion) 23:21, 10. Nov. 2020 (CET)
Also ca. 14.300 haben GND und GNDName belegt. Wie viele dieser GNDs Literatur zugeordnet haben, kann ich dir nach 14.300 Zugriffen auf die Webseite der DNB sagen – zumindest jetzt. Möglicherweise gibt es eine Dump-Datei wo ich zugeordnete Titel rauspfriemeln kann, damit hab ich mich aber noch nicht beschäftigt. --Wurgl (Diskussion) 23:37, 10. Nov. 2020 (CET)
Ich hab mal 200 dieser Vorlagen mit GND und GNDName geprüft. 125 GNDName kann man entfernen, weil beim GND-Datensatz Einträge unter "Autor von" und/oder "Beteiligt an" vorhanden sind. Dabei muss ich dann auch GNDCheck entfernen, sonst kommt der TaxonBot auch noch vorbei. "Thema in" und "Maschinell verknüpft mit" ignorier ich erstmal. Hab ich das so richtig verstanden? Wenn ja, dann sind das hochgerechnet knapp 9000 Artikel. Im Änderungskommentar werde ich hierher verlinken, auch okay? --Wurgl (Diskussion) 22:08, 27. Nov. 2020 (CET)
Traumhaft! Die Kategorie:Wikipedia:GND fehlt enthält zzt. 117.498 Artikel, da wirken 9.000 Edits auf den ersten Blick zwar nicht beeindruckend, aber trotzdem ein riesen Fortschritt, wenn man bedenkt, wie lange die Korrekturen von Hand dauern würden. Danke schon mal! --Kolja21 (Diskussion) 01:10, 28. Nov. 2020 (CET)
Viele, aber nicht alle werden aus der Kategorie genommen. Bei einigen ist kein GNDCheck vorhanden. Wie auch immer: ein Testpaket ist gelaufen. Ich mach jede Nacht 200 Stück raus. Und so grob einmal im Monat prüf ich die verbliebenen durch. --Wurgl (Diskussion) 09:43, 28. Nov. 2020 (CET)

Schade[Quelltext bearbeiten]

Das ich Bot nicht kann, bei mir würde jede Tn rausfliegen, denn Status: Datensatz ist nicht mehr Bestandteil der Gemeinsamen Normdatei (GND), denn: dann würden von 118k+-Artikeln gefühlt die Hälfte aus der Wartungskat fliegen. --Jack User (Diskussion) 22:02, 28. Nov. 2020 (CET)

Sind aber nur 27.116 Vorlagen mit GNDName ausgefüllt. Beim Rest gibts gar nix in der DNB. --Wurgl (Diskussion) 22:20, 28. Nov. 2020 (CET)

VIAF doppelt[Quelltext bearbeiten]

Wie trage ich das in die Vorlage im Artikel ein, wenn einer Person zwei verschiedene VIAF-Nummern zugeordnet sind? Astrid Emilie Helle hat die 9909911 und die 231149196260374790626. --Gereon K. (Diskussion) 10:12, 7. Apr. 2021 (CEST)

Bei Wikidata beide VIAFS eintragen und bei uns die mit (falls vorhanden LCCN) oder die "fettere". Die mit LCCN, weil das erfahrungsgemäß die ID ist, die beim Zusammenführen bleibt. --Wurgl (Diskussion) 10:49, 7. Apr. 2021 (CEST)