Hilfe Diskussion:Personendaten

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Abkürzung: HD:PD
Automatische Archivierung
Auf dieser Seite werden Abschnitte monatlich automatisch archiviert, deren jüngster Beitrag mehr als 30 Tage zurückliegt und die mindestens einen signierten Beitrag enthalten. Um die Diskussionsseite nicht komplett zu leeren, verbleiben mindestens 3 Abschnitte.
Archivübersicht Archiv
Wie wird ein Archiv angelegt?

Fürstlichkeiten und andere unbürgerliche Personen[Quelltext bearbeiten]

Zur automatisierten Sortierschlüsselgenerierung bei Personen ohne Struktur „Familienname, Vorname“ ist mir Folgendes eingefallen, und ich bitte um Stellungnahmen:

  • Im Parameter NAME= tritt kein Komma auf.
  • Regierende Fürsten haben meist ein Klammerlemma, und in der Klammer steht mit etwas Glück der geeignete Name des Staates oder Fürstenhauses.
  • Römische Zahlen können auftreten und lassen sich in numerische Angaben umschreiben.

Ich würde wie folgt vorgehen, bin aber kein Experte für die Monarchien:

Wladimir I. Uljanow
|NAME=Uljanow, Wladimir I.
Komma vorhanden, also direkt als SORTIERUNG
Lenin
Franz X. Kroetz
John V. Kennedy
Benedikt XVI.
|NAME=Benedikt XVI.
generiert: Benedikt 16
Benedikt XVI.
Gustav II. Adolf
|NAME=Gustav II. Adolf
generiert: Gustav 2 Adolf #Schweden
Gustav II. Adolf (Schweden)
Gustav von Schweden
|NAME=Gustav von Schweden
generiert: Gustav von Schweden #Wasa
Gustav von Schweden (Wasa)
vorhanden: {{SORTIERUNG:Gustav von Schweden}}
Gustav Adolf von Schweden
|NAME=Gustav Adolf von Schweden
generiert: Gustav Adolf von Schweden
Gustav Adolf Erbprinz von Schweden
Gustav Samuel Leopold
|NAME=Gustav Samuel Leopold
generiert: Gustav Samuel Leopold #PfalzZweibrücken
Gustav Samuel Leopold (Pfalz-Zweibrücken)
Elisabeth II.
|NAME=Elisabeth II.
generiert: Elisabeth 2
??? |SORTIERUNG=Elisabeth 2 #England
Elisabeth II.
zurzeit: {{SORTIERUNG:Elisabeth 02}}

Der neue Parameter SORTIERUNG= ermöglicht, bei seltsamen Künstlernamen die automatische Generierung aus NAME= zu übersteuern.

C. I. N. D. Y.
100 1 N. 500 Y.

LG --PerfektesChaos 18:10, 25. Nov. 2016 (CET)

  1. Ich habe mittlerweile wie vorstehend umrissen eine Ermittlung des Schlüssels für Einträge ohne Komma auf BETA bereitgestellt.
  2. Seltsames traf ich in Johann VIII. Hugo von Orsbeck an; Fehler?
    • |NAME=Orsbeck, Johann VIII. Hugo von
    • {{SORTIERUNG:Orsbeck, Johann 08 Hugo Von}}
    • Kategorie:Fürstbischof sieht seltsam aus.
LG --PerfektesChaos 19:21, 26. Nov. 2016 (CET)
(Nach BK, ohne Berücksichtigung des neuen Beitrags von PerfektesChaos):
Das sieht soweit gut aus. Wenn man dem Anwender Arbeit ersparen will (oder auch nur: seine Eingaben prüfen will), wäre es nicht schlecht, auch die Problematik der römischen Zahlen zu behandeln, also ihre Unterscheidung von den entsprechenden Buchstaben(folgen), soweit das mit mäßigem Aufwand möglich ist. Der unten angegebene überschaubare Regelsatz würde von etwa 8500 Namen (aus dem Dump vom 1. Mai) etwa 400 übrig lassen, bei denen die Unterscheidung mit vernünftigem Aufwand nicht ohne weiteres gelingt. Die 'Regeln' ergaben sich aus einer Durchsicht auf der Basis des genannten Dumps, wobei nur die Artikel mit Personendaten untersucht wurden, und zwar die Lemmata selbst, nicht die NAME-Angabe der PD. Es ergab sich (die Regeln sind nacheinander anzuwenden):
  • röm. Zahlen treten nicht am Namensanfang auf
  • sie sind links begrenzt durch Leerzeichen oder '(', '/'
  • sie sind rechts begrenzt durch Leerzeichen oder '.', ')', '/', ',' oder das Namensende
  • bei Personennamen treten nur die Ziffern I, V, X, L auf, der Wert ist maximal 72
  • alle derartig begrenzten Folgen von mehr als einem Zeichen aus I, V, X, L meinen röm. Zahlen mit Ausnahme der Folge 'XL' am Namensende, diese meint immer die Buchstaben
  • Wenn 'z' im weiteren einen der Buchstaben/Ziffern I, V, X, L bezeichnet, so gilt
'z.' in einem Namen meint den Buchstaben, wenn der Name eines der folgenden Worte enthält:
junior, senior, Jr., Sr.
'z.' in einem Namen meint den Buchstaben, wenn dem im Namen unmittelbar eine andere Abkürzung 'Buchstabe.' vorangeht oder folgt (das gilt sicher auch für Formen wie 'Ch.')
'z.' am Namensende meint die Ziffer
'z.' vor '(', ')', '/', ',' meint die Ziffer
ein 'L.', welches durch die bisher genannten Regeln noch nicht festgelegt wurde, meint den Buchstaben; im weiteren sei z daher nur noch I, V oder X
'z.' in einem Namen meint die Ziffer, wenn dieser irgendwo eines der folgenden Worte:
cel, da, de, de’, della, der, du, im, of, tom, von, zu, zur, Prinz
oder ein Wort mit einem der 'Präfixe'
ar-, al-
enthält oder unmittelbar gefolgt wird von
dem Wort 'ibn' oder einem Wort mit dem Präfix 'd’'.
(Der Status der Worte 'van' bzw. 'Van' und 'De' irgendwo im Namen oder auch direkt nach 'z.' bleibt wegen zu seltenem Auftreten unklar. Die Beispiele deuten darauf hin, dass 'van' 'Ziffer' anzeigt, 'Van' und 'De' aber 'Buchstabe'.)
(Ein 'I.' meint im betrachteten Bestand immer die Ziffer, wenn der Name mit einer Klammer endet, welche nur ein Wort enthält. Aber als Regel ist das wohl kaum brauchbar.)
ein 'L' (ohne Punkt) meint den Buchstaben (nur einmal aufgetreten: Big L (Rapper))
ein 'X' (ohne Punkt) am Namensende meint immer den Buchstaben
ein 'V' (ohne Punkt) am Namensende (nur dort gefunden) kann beides meinen
von 7 Fällen war es viermal der Buchstabe (Marco V, ...), dreimal die Ziffer (Timothy Dwight V, ...)
ein 'I' (ohne Punkt) am Namensende meint
die Ziffer, sofern der Name (incl. 'I') mehr als zwei Wörter enthält
den Buchstaben, wenn es nur zwei Wörter sind (einzige Beispiele: Yi I, Yanji I, Crooked I).
(Bei Künstlernamen ist es meist sinnlos, die 'gemeinte' Interpretation finden zu wollen.)
Nach diesen Regeln noch nicht geklärte 'I' (ohne Punkt) meinen die Ziffer.
Nach diesen Regeln noch nicht geklärte 'X' (ohne Punkt) wurden nicht gefunden.
Es verbleiben, ohne dass klärende Kriterien offensichtlich sind:
16 Namen mit 'X.', 13-mal meint das den Buchstaben, in drei Fällen aber die Ziffer:
Karl X. Gustav, Stephano Bedros X. Azarian, Johannes X. Kamateros
149 Namen mit 'V.'
228 Namen mit 'I.'
Für die verbliebenen Fälle müsste der Nutzer die Unterscheidung vornehmen, was er bei einem Großteil der Fälle ja schon macht, wenn er in NAME die Form 'Familienname, Vorname(n)' eingibt und die Vornamen auf eine der kritischen Zeichenfolgen 'I.', 'X.', 'V.' enden. Das sind dann ja wohl meist (wäre noch abzusichern) Initialen, keine römischen Ziffern. Wählt er nicht diese Form, spricht viel für römische Ziffern, das müsste auch noch abgesichert werden. Vermutlich bleiben, wenn auch diese Information genutzt wird, nur wenige Dutzend offene Fälle. Sodass möglicherweise der Parameter SORTIERUNG gar nicht benötigt wird. (Die Anzahl der Fälle wie Elisabeth II., bei denen in den Sortierschlüssel mehr Informationen sollen, als in NAME vorhanden sind, ist ja vermutlich (?) auch gering.) --Griot (Diskussion) 19:44, 26. Nov. 2016 (CET)
Schönen Dank, aber eine Gegenfrage zu meinem Verständnis:
  • Beim Parameter NAME= ist oben und in der Programmierung zu allererst vorausgesetzt, dass kein Komma vorkommt.
  • Mithin handelt es sich nicht um die Ansetzung Familienname, Vorname(n).
  • Die Personen, bei denen kein Komma in NAME= stünde – wer von denen hätte einen abgekürzten Vornamen?
LG --PerfektesChaos 20:17, 26. Nov. 2016 (CET)
Hui, seid ihr schnell im analysieren und ausprobieren. So schnell komme ich da nicht nach. Lieber @PerfektesChaos: unser Kuriosenkabinett der Pseudonyme und damit unserer Namen findest Du unter Liste der Biografien, jeweils dort nur die ersten Buchstaben durchklicken. Auf den Listen Liste der Biografien/A oder Liste der Biografien/L negativ aufgeschlagen sind z.B. A*S*Y*S oder L.V.. Weitere werde ich bestimmt auch noch finden... Bis jetzt sieht das Ganze schon sehr, sehr gut aus! LG Silke (Diskussion) 21:36, 26. Nov. 2016 (CET)
  • Heinrich LXXII. (Reuß-Schleiz auf Husten)‎ gibt sich die Ehre als Klammerlemma.
  • A*S*Y*S stört nicht allzusehr, weil * und Leerzeichen wohl nahezu gleich in der Kat landen würden. Vorbehaltlich genauerer Nachforschung.
  • L.V. ist hingegen nicht von Ludwig V. zu unterscheiden (|NAME=L. V.) und muss einen gesonderten Schlüssel bekommen.
    • Das L. wird nicht zur 50, weil am Anfang kein Leerzeichen davor stünde.
LG --PerfektesChaos 11:51, 27. Nov. 2016 (CET)
(Meine nächtliche Antwort habe ich wohl vergessen abzuschicken.) Zum vorletzten Beitrag von PerfektesChaos jetzt nur kurz: Das Problem der röm. Zahlen betrifft Artikel, bei denen NAME ein Komma enthält, ebenso wie solche ohne ein solches Komma. Daher sah ich mir die Lemmata an, nicht die NAME-Angaben. Ich wiederhole das jetzt für die NAME-Angaben, mit vermutlich deutlich weniger nicht automatisch klärbaren Fällen. Das Ergebnis (heute, spätestens morgen) wird auch die letztgenannte Frage beantworten. Es grüßt, --Griot (Diskussion) 13:13, 27. Nov. 2016 (CET)
Bei meiner Ankündigung hatte ich die Rechnung ohne die Telekom (oder deren Hacker) gemacht. Da ich bis zum Wochenende offline bin, kommt das Gesamtergebnis leider erst in der nächsten Woche. Jetzt nur eine Antwort auf die Frage von PerfektesChaos, wer von den Personen ohne Komma in NAME einen abgekürzten Vornamen hat.
Wie gehofft erleichtert die Entscheidung der WP-Autoren, NAME ohne Komma anzusetzen, die Wahl 'römische Zahl oder Buchstabe?' entscheidend. Bei korrekter Ansetzung kann ein fragliches I/V/X/L nur in seltenen Fällen, etwa bei isländischen Namen, ein Vorname sein. In nur zwei Fällen:
Platon V. Kornyljak
Kristján L. Möller
ist ein solcher abgekürzter Vorname I/V/X/L in NAME im Bestand vom 1. Mai enthalten, die Ansetzung entspricht im ersten Fall nicht den Regeln, wohl aber im zweiten.
Die anderen Fälle von NAME ohne Komma, in denen eine potentielle römische Zahl die Buchstaben meint, aber keinen abgekürzten Vornamen, sind:
Prince Far I
Florencia de la V
Marco V
Mia X
Michael X
Sadat X
Terminator X
Xindl X
Ziggy X
Big L (Rapper)
Junkie XL
Sha Money XL
Chino XL
Schließlich gibt es noch zwei unklare Fälle:
Crooked I
Fermín IV
Eine gewisse Aufmerksamkeit verlangt vielleicht noch
Heinrich IX. Reuß zu Köstritz j. L.
Die Auflistung sollte (zum 1. Mai) vollständig sein. Es grüßt, --Griot (Diskussion) 14:09, 29. Nov. 2016 (CET)

APPERs Personendaten-Tool[Quelltext bearbeiten]

Da APPER leider seit März 2016 abwesend ist, ist auch sein Personendaten-Tool verwaist. Ein großer Verlust! Die Weiterleitung auf WP-Artikel von GND-Nummern ist das Feature, was ich am meisten vermisse.

Gibt es jemanden, der dieses Tool weiterentwickeln und -pflegen kann? jonathan groß (ad fontes) 17:38, 1. Dez. 2016 (CET)

Offenbar leider nicht, siehe Wikipedia Diskussion:Normdaten#Wikipedia-Personensuche defekt? --Kolja21 (Diskussion) 01:20, 2. Dez. 2016 (CET)
Wenn sich bis Spätsommer 2017 da noch nichts getan hat, dann würde ich mich daran mal versuchen. Vorher hab ich aber keine Zeit. -- sk (Diskussion) 09:38, 24. Dez. 2016 (CET)
Hallo @Stefan Kühn:, danke für Deine Bereitschaft zu helfen. Es gibt zwar noch keinen Grund zum Jubeln, aber APPER hat sich in der Zwischenzeit auf seiner Diskussionsseite gemeldet. Die Datenbank scheint nach gut einer Woche Anlauf wieder zu laufen, seine Bots leider noch nicht. Mal schauen, wie sich das noch so weiter entwickelt. Liebe Grüße Silke (Diskussion) 14:34, 24. Dez. 2016 (CET)

Erkennung römischer Zahlen für Lemma und NAME von Personen[Quelltext bearbeiten]

Der Inhalt wurde nach Wikipedia Diskussion:Lua/Modul/Vorlage:Personendaten verschoben. --Griot (Diskussion) 00:51, 17. Jan. 2017 (CET)

„Änderungen nur wegen der Verlinkungen innerhalb der Orts-Datenfelder sind unerwünscht.“[Quelltext bearbeiten]

Im umseitigen Abschnitt Hilfe:Personendaten#Geburtsort, Sterbeort steht, dass nur wegen der Verlinkung des Ortsnamens keine Änderungen durchgeführt werden sollen. Das wurde vor fünfeinhalb Jahren von @Wikijunkie mit dieser Änderung eingefügt, unter explizitem Verweis auf diese Diskussion von vor achteinhalb Jahren auf dieser Diskussionsseite. Als Gründe wurden angeführt: Server schonen, kein Nutzen erkennbar. Das war vor allem 2008 und auch noch 2011 nachvollziehbar.

Ich halte diese Regelung aber heute nicht mehr für zeitgemäß und schlage vor, sie ersatzlos zu streichen. Die Verlinkung der Ortsnamen ist quasi-Standard, und im Sinne der eindeutigen Identifikation des Geburts- oder Sterbeortes auch funktionell von wichtiger Bedeutung. Leider ist die Verlinkung aber nicht flächendeckend vorhanden. Tatsächlich lässt sich mit vorhandener Verlinkung etwa wunderbar Wikidata-Arbeit machen, so greifen etwa einige Tools auf die in der Vorlage gespeicherten Werte zu und können damit den Inhalt eindeutig zuordnen. Ohne Verlinkung geht das nicht, weil Ortsnamen naturgemäß kein Eindeutigkeitsmerkmal besitzen.

Das Serverschonen-Argument ist seit Jahren hinfällig, die Infrastruktur läuft schon lange nicht mehr ansatzweise in der Nähe ihrer Belastungsgrenze. —MisterSynergy (Diskussion) 13:35, 13. Feb. 2017 (CET)

+1 --Kolja21 (Diskussion) 13:45, 13. Feb. 2017 (CET)
+1 --Pelz (Diskussion) 00:31, 16. Feb. 2017 (CET)
+1 --Graphikus (Diskussion) 01:12, 16. Feb. 2017 (CET)
+1 --sk (Diskussion) 11:18, 16. Feb. 2017 (CET)
+1 --Silke (Diskussion) 11:28, 16. Feb. 2017 (CET)
+ 1 --Bjarlin 16:29, 16. Feb. 2017 (CET)

Danke für die Unterstützung, ich habe das jetzt umseitig wie angekündigt entfernt. Viele Grüße! —MisterSynergy (Diskussion) 11:20, 17. Feb. 2017 (CET)