Hilfe Diskussion:Personendaten

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Automatische Archivierung
Auf dieser Seite werden Abschnitte monatlich automatisch archiviert, deren jüngster Beitrag mehr als 30 Tage zurückliegt und die mindestens einen signierten Beitrag enthalten. Um die Diskussionsseite nicht komplett zu leeren, verbleiben mindestens 3 Abschnitte.
Archivübersicht Archiv
Wie wird ein Archiv angelegt?

Regeln für GEBURTSDATUM und STERBEDATUM[Quelltext bearbeiten]

Die gültigen Regeln für diese Angaben wurden 2008 festgelegt, dabei blieben Details offen, speziell zum Zusammenwirken von 'um' mit 'vor', 'nach', 'zwischen'. Es scheint mir an der Zeit, die Regeln mit der gegenwärtigen Praxis zu vergleichen, Erfahrungen einzuarbeiten, sie genauer zu fassen. Dies würde auch eine automatische Auswertung erleichtern.

Der folgende Vorschlag gibt weitgehend die aktuell regelgerechte Form der Angaben wieder, darüber hinaus aber die reale Verwendung. Ein Vergleich mit den aktuellen Regeln schließt sich an.

Eine überarbeitete Hilfeseite, die die Regeln durch Beispiele statt durch Syntax beschreibt, wäre von genau festgelegten Regeln abzuleiten. Das kann m.E. warten, bis ein genauerer Regelsatz vorliegt.

(Unter Hilfe:Personendaten/Datumsangaben gibt es eine hoffnungslos veraltete Syntaxbeschreibung von 2005, die nicht die aktuellen Regeln wiedergibt. Sie sollte unabhängig von der Akzeptanz des hier vorgestellten Vorschlags ersetzt oder gelöscht werden.)

Syntax (Vorschlag)[Quelltext bearbeiten]

Einige Kontext- und Zusatzbedingungen – z.B. "getauft" nur in GEBURTSDATUM, "begraben" nur in STERBEDATUM, chronologische Reihenfolge der Alternativen – werden im folgenden Vorschlag weggelassen, bei dem 'specification' die rechte Seite in den PD-Angaben GEBURTSDATUM, STERBEDATUM beschreiben soll. Dabei wurde nicht Kürze, sondern Lesbarkeit der Syntax angestrebt.

Wie weitgehend üblich bedeutet [...] ein optionales, {...} ein beliebig oft (incl. 0-mal) wiederholbares Element, "...", dass die enthaltene Zeichenkette genau so anzugeben ist. "|" steht zwischen verschiedenen Möglichkeiten. Angaben zwischen "//" und Zeilenende sind Kommentar, gehören nicht zur Syntax.

'number' sei jeweils eine dezimal angegebene Zahl kontextabhängig geeigneter Größe (bei Jahrhunderten bis zu dreistellig [nur, etwas zweifelhaft, wegen der Leanderthal Lady]), die nicht mit 0 beginnt. (Auch die Zahl 0 selbst kommt nicht vor.)

Leerzeichen (vorzugsweise genau eines) sind nur dort möglich, dort aber auch notwendig, wo sie in der folgenden Syntax zwischen zwei benachbarten Elementen erscheinen – das heißt nicht links von "." und ":", rechts und links von "–" und "/".

specification   = [["unsicher:"] alternatives]

alternatives    = annotated_date {"oder" annotated_date}

annotated_date  = ["getauft" | "begraben"] date
------
day             = number

month           = "Januar" | "Februar" | ... | "Dezember"   // nicht "Jänner"

year_normal     = number ["v. Chr."]                        // 77; 77 v. Chr.
year_special    = number"/"number "v. Chr."                 // 77/76 v. Chr., die Jahre müssen aufeinander folgen
year            = year_normal
                | year_special

range           = number"–"number ["v. Chr."]               // 77–88; 77–66 v. Chr.
century         = number"." "Jahrhundert" ["v. Chr."]       // 3. Jahrhundert; 3. Jahrhundert v. Chr.
years           = century
                | range

daymonth        = [day"."] month                            // nur zusammen mit Jahres- oder Jahresspanne angebbar
------
um_clause       =          "um" year           // 16384 (16371 + 13) (year_normal + year_special) // fast ..
                |          "um" daymonth year  //   320 (  320 +  0)                              // .. aktuelle ..
                | daymonth "um" year           //    58 (   58 +  0)                              // .. Zählung
                |          "um" years          //   233 (  147 + 86) (century + range)
                | daymonth "um" years          //     2 (    0 +  2)

dateframe       = [daymonth] year
                | [daymonth] century
                | um_clause
------
vor_clause      = [daymonth] "vor" dateframe
nach_clause     = [daymonth] "nach" dateframe
zwischen_clause = [daymonth] "zwischen" dateframe "und" dateframe
------
date            = [daymonth] year
                | [daymonth] century
                | um_clause
                | vor_clause
                | nach_clause
                | zwischen_clause

Dabei darf 'daymonth' in einer clause nicht sowohl vor, als auch nach dem Schlüsselwort 'um', 'vor', 'nach', 'zwischen' erscheinen. (Dies kann syntaktisch formuliert werden, darauf werde hier der Lesbarkeit wegen verzichtet.)

Einige wenig sinnvolle unter den syntaktisch zulässigen Formen stören nicht, da sie praktisch nicht verwendet werden.

Auf die Angabe zulässiger Verlinkungen wurde hier verzichtet (s. auch unter Verlinkung). Verlinkt werden zur Zeit im Bestand nur noch 'day. month' sowie Einzeljahre (nicht v. Chr.), dies wäre durch folgende geänderte Regeln erfassbar:

daymonth      =    [day"."] month
              | "[["day"." month"]]"

year_normal   =     number ["v. Chr."]
              | "[["number"]]"

--Griot (Diskussion) 19:29, 21. Jan. 2018 (CET)

Vergleich mit den aktuellen Regeln[Quelltext bearbeiten]

  1. Alle laut Hauptteil auf H:PD#Datum (d.h. vor "die folgenden Formen sollen bis zur noch ausstehenden endgültigen Entscheidung toleriert werden") zulässigen Formen bleiben zulässig.
  2. Die gegenwärtige doppelte Verwendung von "/" würde beseitigt. Damit auch die doppelte, also unklare Bedeutung von etwa 'um 77/76 v. Chr.'
  3. Die bisherige Form '333/332 v. Chr.' bleibt zulässig. (Ihre zulässige Verwendung würde sich weitgehend auf griechische/römische Daten beschränken, was gegenwärtig ohnehin schon der Fall ist.)
  4. Die Form '1332/1333' wäre nicht mehr zulässig. Sie wird zur Zeit auch nie isoliert verwendet.
  5. Formen wie 'um 335/325 v. Chr.' bzw. 'um 1870/1880' wären in 'um 335–325 v. Chr.' bzw. 'um 1870–1880' zu überführen. Die Anzahl dieser Formen im Bestand ist zur Zeit einstellig (6).
  6. "getauft" und "begraben" wären nicht mehr nur am Anfang zugelassen.
  7. In um-Klauseln wäre eine Spanne von Jahren in der Form '1234–1256' zulässig. Sie wird ohnehin bereits in etwa 90 Angaben verwendet.
  8. Die zulässigen Kombinationen von 'vor', 'nach', 'um', 'zwischen' wären jetzt genau beschrieben.

--Griot (Diskussion) 19:29, 21. Jan. 2018 (CET)

Ich sehe "getauft" und "begraben" eher als spezielle Varianten von "vor" an. --Schnark 09:16, 22. Jan. 2018 (CET)
Das kann man so sehen. Es würde zwar Formen wie 'getauft zwischen 1. Mai und 9. Mai 1111' ausschließen, aber zur Zeit kommen solche Formen nicht vor. Die Zählung ergibt im Dump vom 1. Januar:
    735  getauft dd. month year                          // [[Georg Koës]],  ..., 8 mit unsicher: [[Henry Manaton]], ...
      2  getauft dd. month year oder dd. month year      // [[Samuel Scheidt]], [[Samuel Blesendorf]]
      1  getauft dd. month year oder um year             // [[Martin Berteau]]
      1  getauft dd. month year oder year                // [[Elizabeth Simcoe]]
      2  getauft month year                              // [[Anna von Egmond]], [[Johann Bleyer]]
      7  getauft year                                    // [[George Whetstone]], [[Pierre Gaultier]], ...
      1  vor year oder getauft dd. month year            // [[Johann Friedrich Meister]]
    175  begraben dd. month year                         // [[Jan van Eyck]],  ..., 4 mit unsicher: [[Paul Speccott]], ...
      1  begraben dd. month year oder dd. month year     // [[Nicholas Lanier]]
      1  begraben dd. month year oder month year         // [[Thomas de Keyser]]
Bei der Gelegenheit: der Fall Thomas de Keyser mit dem Text „begraben 7. Juni 1667 oder gestorben im November 1679“, aber der PD-Angabe „begraben 7. Juni 1667 oder November 1679“ zeigt, dass die gegenwärtige Begrenzung von 'getauft/begraben' auf den Anfang der Angaben ungeeignet ist. Wird diese Beschränkung aufgehoben, müssen die Angaben in den 7 Artikeln überprüft werden, in denen 'getauft/begraben' zusammen mit 'oder' erscheint. --Griot (Diskussion) 19:24, 22. Jan. 2018 (CET) Beispiele ergänzt --Griot (Diskussion) 02:47, 23. Jan. 2018 (CET)
Ich bin derjenige, der den Bot von APPER nun betreut. Der mach diese Biographielisten und von dessen Daten kommt auch das Tool https://tools.wmflabs.org/persondata zur Personensuche. Wenn sich da was an der erlaubten Syntax ändert, dann interessiert mich das weil ich ja diese Syntax beim interpretieren der Persondata-Daten in PHP nachbasteln darf. Ich will hier nur noch einen Punkt einbringen, weil die PD-Daten zwar nett sind, aber es leider doch einige Fälle gibt, wo im Einleitungssatz etwas steht und in den PD-Daten nicht so ganz das selbe. Das wurde schonmal wo von Silewe oder Graphikus angesprochen, aber an eine Reaktion kann ich mich nicht erinnern. Eine sehr unvollständige Liste ist als Nebenprodukt einer Wartungsliste zum Abgleich der Lebensdaten auf verschiedenen Seiten entstanden: Benutzer:Wurgl/Falsche_Lebensdaten/Blacklist#Weiteres_Datum_in_Anmerkung Jedenfalls ist das eine Liste von Problemfällen, wo schon so einige interessante Fälle dabei sind. Die neue Syntax sollte diese abbilden können. Abgesehen davon ist auch die Frage ob alle diese fragwürdigen Daten in den PD-Daten abgebildet werden sollen, oder ob dort gefiltert werden soll/darf/kann und Daten die im Freitext stehen unter bestimmten Umständen nicht in die PD-Vorlage gehen. --Wurgl (Diskussion) 19:51, 22. Jan. 2018 (CET)
Schön, dass APPERs tool weiter betreut wird, danke. – Da die existierenden regelgerechten Angaben mit ganz wenigen (wohl unter 10) Ausnahmen auch den vorgeschlagenen Regeln (auch bei Modifikation gemäß Schnarks Einwand) genügen, sollte der Anpassungsaufwand zumindest zunächst gering bleiben.
Ob die in der von Dir genannten Wartungsliste genannten Fälle mit den vorgeschlagenen Formen befriedigend dargestellt werden können, werde ich überprüfen.
Ob sie in den Personendaten dargestellt werden sollten, ist eine vom aktuellen Vorschlag unabhängige Frage, die unabhängig diskutiert werden sollte. Und eine solche Diskussion natürlich verdient. (Nur kurz meine Meinung: ja. Jedes im Artikel einschließlich der Anmerkungen genannte mögliche Datum sollte in die PD eingehen, sofern es nicht explizit als falsch oder widerlegt bezeichnet wird oder wenigstens mit 'gilt als widerlegt' markiert wird. Bei vielen möglichen Einzeldaten ist ihre Ersetzung durch eine zwischen-Angabe m.E. oft vorzuziehen.) --Griot (Diskussion) 02:47, 23. Jan. 2018 (CET)
Da ist noch so ein Spezialfall: Raoul Wallenberg --Wurgl (Diskussion) 21:05, 23. Jan. 2018 (CET)
Die in der genannten Wartungsliste genannten Fälle können alle mit den vorgeschlagenen (wie auch den gültigen) Formen dargestellt werden, meist als oder-Konstruktion. (Für die ersten drei und für Clara (Schauspielerin) habe ich es erledigt.)
Die Problematik amtlich festgelegter Todesdaten vers. PD wurde meines Wissens noch nicht diskutiert. Ich halte die amtliche Festlegung für irrelevant für die PD, nur die realen Daten sollten m.E. eingetragen werden. Bisher wurden meine entsprechende Änderungen nicht kritisiert, ich habe ihr 'Schicksal' aber auch nicht auf Dauer beobachtet. Bei Wallenberg hab' ich es entsprechend geändert – mal abwarten, ob es akzeptiert wird. --Griot (Diskussion) 02:26, 24. Jan. 2018 (CET)

zum Verhältnis von 'getauft'/'begraben' zu 'vor'[Quelltext bearbeiten]

Des längeren Zwischentexts wegen wiederhole ich Schnarks obige Bemerkung:

  • „Ich sehe "getauft" und "begraben" eher als spezielle Varianten von "vor" an.“

Dies schien mir zunächst (s.o.) eine plausible Auffassung. Der Versuch, das in der Syntax darzustellen, änderte das jedoch. Es gibt zwei Möglichkeiten:

  1. 'getauft' und 'begraben' werden 'vor' gleich gestellt. Das ergibt leider die Zulassung von Formen wie "3. Mai getauft 1333", denen keine vernünftige Bedeutung zugeordnet werden kann. (Anders als etwa Angaben wie "3. Mai vor 99. Jahrhundert v. Chr.", die durchaus eine klare Bedeutung haben, auch wenn ihre Verwendung sinnlos wäre.)
  2. Es werden extra-Konstruktionen für getauft-/begraben-Klauseln eingeführt. Das scheint mir nicht gerechtfertigt, die bereits unerwünscht komplexe Darstellung von 'date' würde weiter aufgebläht werden, während in meinem Vorschlag die semantischen, über Zeitangaben hinausgehenden Angaben 'getauft', 'begraben', wie auch 'unsicher' gewissermaßen ausgeklammert werden.

Für die praktische Verwendung ergeben sich aus den unterschiedlichen Interpretationen allerdings keine Unterschiede. Die inzwischen vorgeschlagene Tabelle für die Hilfeseite ist daher auch davon unabhängig. --Griot (Diskussion) 14:09, 4. Feb. 2018 (CET)

Verlinkung in GEBURTSDATUM und STERBEDATUM[Quelltext bearbeiten]

Es gibt keine 1000 Artikel mehr, in denen diese Daten verlinkt sind. Während es natürlich weiterhin vorzuziehen ist, sie bei einer sonstigen Änderung nebenbei zu entlinken, könnte das gegenwärtige Verbot ("sollte aber nicht") vielleicht doch gelockert werden. Solange es besteht bleiben einige (langfristig vielleicht 300-500) fast durchweg sehr kurze Artikel übrig, in denen diese Verlinkungen überleben. --Griot (Diskussion) 19:29, 21. Jan. 2018 (CET)

Es scheint keine Einwände zu geben. Bleibt es dabei, werde ich das in 2 Tagen umsetzen. --Griot (Diskussion) 00:56, 1. Feb. 2018 (CET)

"begraben" in STERBEDATUM[Quelltext bearbeiten]

Die Wahl dieses Wortes scheint mir nicht die glücklichste gewesen zu sein. Wäre nicht 'bestattet' respektvoller? Wenn Einverständnis besteht, würde ich die nur 177 Artikel ändern, die dies betrifft. --Griot (Diskussion) 19:29, 21. Jan. 2018 (CET)

Das Wort ‚bestattet‘ klingt nur insofern respektvoller, als der Begriff ‚Bestattung‘ neben dem eigentlichen Begräbnis auch eine abgehaltene Trauerzeremonie ausdrückt. Wo das unter den 177 Fällen als gesichert erscheint, kann umbenannt werden, in Zweifelsfällen würde ich ‚begraben‘ belassen.--JFKCom (Diskussion) 20:47, 21. Jan. 2018 (CET)
Das heißt nein, nicht ändern, da weder zwei verschiedene Angaben für relativ wenige Fälle gerechtfertigt wären, noch der Aufwand für Detailuntersuchungen. (Wobei ein Zusammenhang von 'bestatten' mit 'Trauerzeremonie' auch zweifelhaft ist.)
Sollte aber nicht auch berücksichtigt werden, dass Tote zu 'begraben' nur eine der üblichen Bestattungsarten ist? Heute z.B. ist Feuerbestattung und anschließendes Verstreuen der Asche weit verbreitet. In Deutschland noch nicht, aber auch die Beisetzung der Urne ist nur noch bedingt als 'begraben' zu bezeichnen. --Griot (Diskussion) 10:53, 27. Jan. 2018 (CET)
Wenn keine weiteren Stellungnahmen kommen, betrachte ich den Vorschlag als abgelehnt. --Griot (Diskussion) 00:58, 1. Feb. 2018 (CET)

zusätzliche Daten in Anmerkungen etc.[Quelltext bearbeiten]

Oben unter #Vergleich mit den aktuellen Regeln (ab 'Ich bin derjenige') ging es bereits um den Fall, dass ein Artikel neben dem Geburts-/Sterbedatum in der Einleitung weitere mögliche derartige Daten enthält, meist in Anmerkungen. Es scheint angebracht, den gewünschten Umgang damit in den Regeln anzugeben. Bei mehr als 50 derartigen Fällen wurden keine Einwände erhoben gegen das folgende Verfahren, das ich daher als bevorzugte Variante vorschlage:

  • Die Angaben GEBURTSDATUM und STERBEDATUM in den PD sollten im Regelfall alle im Artikel genannten möglichen Daten angeben, außer solchen, für die dort explizit angegeben wird, sie seien (oder gälten als) 'falsch', 'veraltet' etc. Extrem unwahrscheinliche Daten können ausnahmsweise ausgenommen werden.

--Griot (Diskussion) 10:28, 1. Feb. 2018 (CET)

amtlich festgelegte Daten[Quelltext bearbeiten]

Oben unter #Vergleich mit den aktuellen Regeln (ab 'Da ist noch so ein Spezialfall') ging es bereits um den Fall, dass ein Geburts-/Sterbedatum amtlich festgelegt wurde. (Meist bei vermissten Personen.) Sollte dieses amtliche Datum in den PD erscheinen oder 'das' vermutliche reale Datum, welches meist eine größere Zeitspanne sein dürfte, oft: 'nach datum'. Das folgende Verfahren wurde bisher nicht bemängelt und werde daher als bevorzugte Variante vorgeschlagen – allerdings liegen hier weniger Erfahrungen (<10) vor:

  • Amtlich festgelegte Geburts- oder Sterbedaten sind für die PD nicht relevant. Dort sollten die vermutlichen realen Daten angegeben werden, auch wenn das nur größere Zeitspannen sind.

--Griot (Diskussion) 10:54, 1. Feb. 2018 (CET)

Siehe dazu (erst kürzlich, aber schon im Archiv): Hilfe Diskussion:Personendaten/Archiv/5#Todeserklärung sowie Kategorie:Gerichtlich für tot erklärte Person (20. Jahrhundert) für die gar nicht so wenigen Fälle. --FordPrefect42 (Diskussion) 13:34, 1. Feb. 2018 (CET)
PS: "vermutliche reale Daten" finde ich als Formulierung verunglückt, es geht ja gerade nicht um Vermutungen, sondern um die Eingrenzung anhand des letzten gesicherten Lebenszeichens ("vermisst/verschollen seit"). Ich denke, dass du das auch meinst, da du das ja bei Wallenberg auch so gehandhabt hast. --FordPrefect42 (Diskussion) 13:47, 1. Feb. 2018 (CET)
Danke, das siehst Du richtig, ich streiche das 'vermutlichen' dann durch. – Mit 'weniger Erfahrungen' meine ich, dass diese Verfahrensweise jedenfalls von mir noch nicht häufig angewandt wurde, so dass das bisherige Ausbleiben ablehnender Stellungnahmen noch nicht sehr aussagekräftig ist. Anders als im vorangegangenen Punkt. --Griot (Diskussion) 14:12, 1. Feb. 2018 (CET)

Vorschlag für Tabelle auf der Hilfeseite[Quelltext bearbeiten]

Die oben vorgeschlagenen #Regeln für GEBURTSDATUM und STERBEDATUM könnten auf der Hilfeseite durch folgende Tabelle dargestellt werden (der praktisch wichtigste Unterschied zur bisherigen Form ist die Angabe, wo 'um' eingesetzt werden kann):

falsch richtig Bedeutung & Bemerkungen
[[3. April]] [[1940]] 3. April 1940 Datumsfelder sollten nicht verlinkt sein.
Ein solcher Link sollte vorzugsweise
bei anderen Änderungen mit entfernt werden.
4. Jänner 1234
4. 1. 1234
04. Januar 1234
4. Januar 1234 einheitliche Schreibweise,
um automatische Auswertung zu erleichtern
123 v. u. Z.
123 v. d. Z.
123 v.Chr.
123 v.&nbsp;Chr.
123 v. Chr. dito
123 n. Chr.
123 u. Z.
123 dito
Frühjahr 45 v. Chr.
2. Hälfte 45 v. Chr.
45 v. Chr. Vergröberung,
um automatische Auswertung zu erleichtern
etwa 333
ca. 333
~333
um 333 um
(kleines) Intervall um das angegebene Datum
um 3. Mai 333
um Mai 333
um 3. Mai 333 v. Chr.
um 4. Jahrhundert v. Chr.
um 1333/50 um 1333–1350
um 333/30 v. Chr. um 333–330 v. Chr.
dokumentiert 444
erwähnt 444
nachweisbar seit 444
vor 444 für GEBURTSDATUM
vor dem 4. Mai 444 vor 4. Mai 444 vor
schließt hier immer das angegebene Datum mit ein
vor 444 v. Chr.
vor Mai 444
vor um Mai 444
vor um 444–450
später als 555
frühestens 555
verschollen 555
vermisst 555
nicht vor 555
nach 555 für STERBEDATUM
nach dem 5. Mai 555 nach 5. Mai 555 nach
schließt hier immer das angegebene Datum mit ein
nach 555 v. Chr.
nach Mai 555
nach um Mai 555
nach um 555–560
666-777
666–777
zwischen 666 und 777 zwischen
schließt hier immer beide angegebenen Daten mit ein
nach 6. Mai 666 und vor 6. Mai 677 zwischen 6. Mai 666 und 6. Mai 677
2. Hälfte des 7. Jh.
Ende des 7. Jahrhunderts
zwischen 650 und 700
zwischen um Mai 666 und 677
zwischen 7. Jahrhundert und 9. Jahrhundert
zwischen um 5 v. Chr. und 18
3. Mai um 333
Mai um 333 v. Chr.
Mai um 333–350
der Tag oder Monat ist bekannt, das Jahr nicht genau
6. Mai vor 777
Mai nach um 777
Mai zwischen 777 und 888
5. Mai zwischen 79 v. Chr. und 75 v. Chr.
6. Mai 19xx 6. Mai 20. Jahrhundert
940 od. 945
940; nach anderen Quellen 945
940 (oder 945)
940 oder 945 oder soll nur zwischen vollständigen Daten stehen,
nicht zwischen Tagen oder Monatsnamen;
mehr als zwei Alternativen sind zulässig;
die Daten sollten aufsteigend geordnet sein
3. oder 4. April 940
3./4. April 940
3. April 940 oder 4. April 940
3. April oder Mai 940
3. April/Mai 940
3. April 940 oder 3. Mai 940
3. April 940 oder 941
3. April 940/941
3. April 940 oder 3. April 941
3. oder 4. Jahrhundert
3./4. Jahrhundert
3. Jahrhundert oder 4. Jahrhundert
geboren Mai 888 und getauft 8. Mai 888
8. Mai 888 (Taufe)
getauft 8. Mai 888 getauft bzw. begraben
können nur vor vollständigen Daten stehen
977 oder getauft 8. Mai 988
beerdigt 9. Mai 999
bestattet 9. Mai 999
beigesetzt 9. Mai 999
begraben 9. Mai 999
begraben um 9. Mai 999
wahrscheinlich 1460
vermutlich 1460
wohl 1460
1460(?)
unsicher: 1460 unsicher
bezieht sich auf die gesamte Datumsangabe,
es kann nur am Anfang stehen
3.(?) März 1460
3. März(?) 1460
3. März 1460(?)
wohl 3. März 1460
unsicher: 3. März 1460
unsicher: um 1111
unsicher: 1. Mai 999 oder 1. Juni 999
unsicher: getauft 17. Mai 1705
unsicher: begraben 14. Juni 1705
1. Jahrtausend zwischen 1. Jahrhundert und 10. Jahrhundert es ist fast immer möglich,
solch Datum genauer einzugrenzen
unbekannt
?
Besser wäre, falls möglich, eine grobe Angabe, etwa
„3. Jahrhundert“
oder gar nur
„zwischen 3. Jahrhundert und 5. Jahrhundert“.
Falls nicht, sollte das Feld leer bleiben.
333/32 v. Chr. 333/332 v. Chr. Ein bekanntes Jahr eines anderen Kalenders
(meist griechisch/römisch),
wiedergegeben durch zwei aufeinanderfolgende
julianische Jahre – durch „/“ getrennt –;
nur für Jahre v. Chr. zugelassen;
neben dem „/“ darf kein Leerzeichen stehen.
um 333/332 v. Chr.
nach 333/332 v. Chr.
zwischen 33/32 v. Chr. und 33
Mai 333/332 v. Chr.
Mai um 333/332 v. Chr.

--Griot (Diskussion) 13:26, 4. Feb. 2018 (CET)

Griot, danke für die Arbeit. Die Tabelle kann aus meiner Sicht so umgesetzt werden. Silke (Diskussion) 13:51, 4. Feb. 2018 (CET)
Das erste gehört sang- und klanglos gestrichen, da es sich längst eingebürgert hat das Datum zu verlinken. Egal ob es nützt oder nicht. --Informationswiedergutmachung (Diskussion) 14:36, 4. Feb. 2018 (CET)
Im Einleitungssatz ja, aber doch nicht in den Personendaten oder? Silke (Diskussion) 15:22, 4. Feb. 2018 (CET)
Guter Vorschlag. Danke für die Arbeit --Pelz (Diskussion) 00:12, 7. Feb. 2018 (CET)
Mir gefällt es nicht so richtig. Ich finde "vor um 444" sprachlich sehr seltsam. IMHO: Statt das jetzt hier in der deutschsprachigen umzusetzen, müssten wir uns mehr Gedanken machen darüber wie wir die deutschen Personendaten nach Wikidata transferieren, wo sie international genutzt werden können. Parallel dazu muss das Einbinden in die deutsche über Vorlagen erfolgen und dann können wir uns über die Verfeinerung der Syntax Gedanken machen. Wir rennen hier sonst auf einen deutschsprachige Sackgasse zu. Je feiner ihr das jetzt im deutschen von der Syntax her aufzieht, umso schwieriger wird dann die internationale Umsetzung. - Ich mache derzeit nix am Personendaten-Auswertungs-Skript, weil ich die Arbeit scheue, wenn es dann in ein paar Wochen/Monaten/Jahren doch alles über Wikidata in die deutschsprachige Wikipedia reingezogen wird. Da überlege ich lieber gleich bei Wikidata mit einem Checkskript anzusetzen. -- sk (Diskussion) 06:06, 7. Feb. 2018 (CET)
Zunächst danke an Silke und Pelz für Eure Einschätzung. Hallo Stefan, drei Punkte:
1) „vor um 444“ ist seltsam, mag sein, kann jedoch kaum missverstanden werden. Aber es beschreibt folgende Datenlage: Es ist bekannt, dass jemand vor einem gewissen Zeit„punkt“ geboren wurde oder starb, aber dieser Zeit„punkt“ ist nicht genau bekannt. Ein Beispiel: Gregor Brentel – „vor um 1515“. Alternativ könnte man das mit „vor 1515 oder um 1515“ beschreiben. Das wäre umständlicher und schwerer auswertbar, da dazu erst die Übereinstimmung der beiden angegebenen Zeitpunkte festgestellt werden müsste. Und wenn solch ein 'um' innerhalb einer zwischen-Konstruktion erscheint, wäre ein Umschreiben in eine um-lose oder-Konstruktion kaum noch machbar, Beispiel: Kleopatra Selene – „zwischen um 5 v. Chr. und 18“. Wir müssen versuchen, Daten so darzustellen, wie sie uns vorliegen. Und das ist auch bereits weitgehend der Fall – die Formen mit 'um' sind ja nicht wirklich neu, sie gehören bisher nur einer Grauzone an, da in der bisherigen Tabelle zwar Beispiele angeführt werden, aber nicht, wo diese Formen angegeben werden dürfen. Die vorgeschlagenen Formen zu 'um' erfordern keine einzige Änderung im Bestand, mögen allerdings in manchen Fällen zu Änderungen ermutigen.
2) „Je feiner ihr das jetzt im deutschen von der Syntax her aufzieht, umso schwieriger wird dann die internationale Umsetzung.“ Das verstehe ich überhaupt nicht. Das genaue Gegenteil ist doch der Fall: Wenn – und nur wenn – eine exakt beschriebene Form vorliegt, ist eine automatische Umsetzung mit vertretbaren Mitteln (d.h. ohne KI) denkbar.
3) „mehr Gedanken … darüber wie wir die deutschen Personendaten nach Wikidata transferieren“ sind selbstverständlich zu begrüßen. Man kann den dargestellten Vorschlag als einen Schritt hierfür auffassen: als Spezifikation der zu transferierenden Daten.
Es grüßt, --Griot (Diskussion) 13:54, 7. Feb. 2018 (CET)
Der Gedanke, das man unsere PD nach Googledata transferien sollte ist strikt abzulehnen, jedenfalls dann, wenn hier die Daten nach Wikikacka transferiert werden und dort bearbeitet würden. Es würden hier schon einige Mitarbeiter gehen, vermute ich. Ich ganz sicher. Die ND & PD sind hier schon schwer genug, aber Freiwillige zu finden, die das dann noch umständlich auf Wikiblabla machen und auch noch korrekt: völlig unmöglich, jedenfalls derzeit. Fuck Wikigoogledata, das elende Ding hat bisher nur Google genutzt.
--Informationswiedergutmachung (Diskussion) 14:09, 7. Feb. 2018 (CET)
Bisher liegt kein grundsätzlicher Widerspruch vor, auch der Beitrag von Stefan enthält keine Ablehnung. Bleibt es bis zum 13.2. dabei, würde ich die Tabelle ersetzen. (Zu Wikidata äußere ich mich später.) --Griot (Diskussion) 00:40, 11. Feb. 2018 (CET)

Verhältnis zu Wikidata[Quelltext bearbeiten]

Im Abschnitt #Vorschlag für Tabelle auf der Hilfeseite haben sich Stefan Kühn und Informationswiedergutmachung hierzu bereits kurz geäußert. Zum Folgenden sei angemerkt, dass ich Wikidata (WD) nur skizzenhaft kenne, dass ich möglicherweise Wesentliches nur nicht gefunden habe. Dadurch bleiben manche der folgenden Aussagen unsicher.

Es geht in diesem Text nur um die Informationen GEBURTSDATUM/STERBEDATUM aus den Personendaten der deutschsprachigen Wikipedia (deWP).

Ich halte die Orientierung auf eine global zentralisierte Verwaltung dieser Daten (nicht notwendig aller, so manche Person interessiert höchstens lokal) für grundsätzlich richtig. Möglich wäre vielleicht bereits jetzt, unsere Daten (automatisiert!) nach WD zu übertragen, so dass ein Abgleich der Daten aus unterschiedlicher Quelle erfolgen kann. Für das umgekehrte jedoch, Daten zentralisiert zu halten und von dort zu übernehmen, damit perspektivisch wohl auch unsere Personendaten aufzugeben, sind m.E. (mindestens?) vier Bedingungen zu erfüllen:

  • Das zentral verfügbare Datenformat gestattet, die Daten geeignet darzustellen.
  • Die Wartung von Daten ist nicht oder wenigstens nicht wesentlich aufwendiger als jetzt die der Personendaten.
  • Ein geeigneter Schutz gegen absichtliche oder unabsichtliche Verfälschungen wird gefunden, eine Gefahr, die ja mit der Zahl der Benutzer steigt, welche leicht den Weg zu den Daten finden und diese ändern können.
  • Für den Fall, dass das überaus ambitionierte WD-Projekt scheitert, muss eine (einfache) Rückgewinnung unserer Daten möglich sein. (nachträglich: --Griot (Diskussion) 10:32, 19. Feb. 2018 (CET))
Ein Unterschied fehlt: Bei uns können nur Sichter Informationen verändern bzw. die Veränderung sichten; Wikidata ist laut Eigenwerbung „die Datenbank, die jeder Internetbenutzer auf dem Planeten verändern kann“, eine menschliche Kontrolle über millionenfache Änderungen fehlt, Belege müssen ändernde Bearbeiter nicht angeben, und nur mit Algorithmen versucht man Serientätern auf die Spur zu kommen.
  • Ein Abgleich und insbesondere eine Information über bei uns fehlende Daten (jemand ist in Kambodscha verstorben, was wir erstmal nicht mitbekommen, aber die Kambodschaner) ist unproblematisch und sinnvoll.
  • Einfach mal unter Zweit-Account ein paar Tippfehler korrigieren und dann eine lebende Person sterben lassen und gucken, ob und wann das irgendwer zurücksetzt.
  • Man kann auch Fake-Belege angeben. Schaut sich niemand an, und die Algorithmen sind happy.
  • Eine Löschung unserer gepflegter und gesichteter und im Artikel belegter Daten und nur noch Anzeige der WD-Info steht nicht zur Diskussion.
VG --PerfektesChaos 17:39, 19. Feb. 2018 (CET)

Darstellungsmöglichkeiten in WD, im Vergleich zur deWP[Quelltext bearbeiten]

Es geht hier vor allem darum, ob die Möglichkeiten der deWP in WD vorhanden sind, nicht um den umgekehrten Weg.

Die Angabe des Tauf- und Begräbnisdatums statt des Geburts- oder Todesdatums ist in deWP und WD möglich, in WD auch beides.

Die Zeitangaben Tag+Monat+Jahr, Monat+Jahr, Jahr, Jahrhundert entsprechen sich natürlich direkt. (Bei einer Umrechnung wäre nur zu berücksichtigen, dass in WD auch Daten nach dem 15. Oktober 1582 julianisch bzw. Daten davor gregorianisch angegeben sein können. Ebenso empfiehlt sich Umsicht bei nicht-astronomischen, naturgemäß fast immer vagen Daten aus frühen Zeiten, wenn diese gregorianisch angegeben sind.)

Dass in WD der verwendete Kalender explizit angegeben werden kann, ist prinzipiell ein Vorzug. Da aber z.Zt. nur Proleptic Gregorian calendar und Proleptic Julian calendar möglich sind, ist er eher theoretischer Natur. Wir kommen vorerst ohne diese Angabe aus.

Es gibt auch in WD die Möglichkeit, den Tag ohne Jahr anzugeben: d:Property:P3150, "birthday". Bsp: Nina Vidal. Allerdings ist er dann nicht an eine von ja möglicherweise mehreren Angaben zu den Jahren gebunden. Hierzu s. #WD-Mängel.

Statt der bei uns gegebenen Möglichkeiten, Unsicherheiten auszudrücken - 'um' und 'unsicher' - gibt es in WD zunächst die folgenden:

'um' und 'circa' können gewiss als äquivalent behandelt werden.
'unsicher' meint manchmal 'presumably', manchmal 'disputed', manchmal keins von beiden. Am besten, und m.E. ausreichend gut, passt es zu wohl zu 'possible'. Eine Umrechnung ist also möglich, allerdings wäre sie nicht eindeutig reversibel. Eine mittels 'um'/'circa' qualifizierte Zeitangabe kann allerdings nicht als Begrenzer einer (endlichen oder unendlichen) Zeitspanne angegeben werden, ein weiterer Fall des bereits genannten Mangels.

Zeitspannen, wie sie in der deWP mittels 'vor', 'nach' und vor allem 'zwischen' angegeben werden, können (mit der oben zu 'um' genannten Einschränkung) in WD ebenfalls angegeben werden, s. https://www.mediawiki.org/wiki/Wikibase/DataModel#Dates_and_times. Leider ist dies eher theoretisch, als praktisch möglich. Weder fand ich eine Beschreibung, wie der Benutzer diese Daten angeben kann/soll, noch werden sie überhaupt angezeigt. Sie sind nicht einmal zu sehen, wenn man eine Angabe editiert! Wie oft sie z.Zt. verwendet werden, bleibt so offen. Beispiele sind jedenfalls Scipio Africanus Freeing Massiva, Attribut inception - es ist ein 'after :2' [Jahre] gespeichert, aber das ist nicht zu sehen. Entsprechend Virgin and Child with Saint Anne ('after :1'), Altar frontal from Cardet ('after :5' [Dekaden]), Beispiele bei Personen fand ich unter diesen Umständen nicht, es mag sie aber geben.

Alternativen können in WD, wie es scheint, nur einzeln angegeben werden, s. z.B. William Herschel. Vielleicht reicht das aus? Wobei die Gefahr besteht, dass Daten aus den verschiedensten Quellen nebeneinander gestellt werden und die hoffentlich sachkundige Auswahl der Artikelschreiber verloren geht. Allerdings können - s. d:Help:Ranking - Daten als "normal", "preferred" or "deprecated" qualifiziert werden. Dennoch könnte bei einem eventuellen Import der Daten aus WD nach deWP verlorengehen, welche Daten der deWP-Autor im Artikel genannt hat. (Wenn alle in der deWP verwendeten Daten auch als 'importiert aus deWP' markiert werden, dies bei Eintrag zuverlässigerer Quellen also nicht entfernt wird, ist das Problem lösbar.)
Die 'oder'-Konstruktionen der deWP sind also darstellbar. Hinderlich dabei ist die übliche schlechte Praxis in der deWP, zwei aufeinander folgende Jahre mittels etwa '1960 oder 1961' darzustellen. Leider ist 'zwischen 1960 und 1961' zwar an sich besser, aber aufwendig und 'seltsam'. Dennoch wäre es vorzuziehen, würde in einer 'oder'-Konstruktionen jeder Term direkt zu einer im Artikel genannten Quelle gehören.

Die Möglichkeit in der deWP, ein bekanntes meist griechisch/römisches Jahr durch Formen wie '66/65 v. Chr.' anzudeuten, gibt es in WD nicht. Solange der Kalender nicht angegeben werden kann, ist sie ohnehin nicht anders als '66 v. Chr. oder 65 v. Chr.' (besser, wie gesagt, 'zwischen 66 v. Chr. und 65 v. Chr.') auswertbar. Dies deutet darauf hin, dass es besser sein könnte, würde die deWP diese Form allgemein für Jahrespaare einführen, wobei die ohnehin nicht verwertbare Bedeutung 'bekanntes Jahr eines anderen Kalenders' zwar verloren gehen würde, dafür aber das eben genannte Problem des unglücklichen oder-Gebrauchs lösbar wäre.

Der größte Vorzug von WD gegenüber unseren Personendaten ist, dass die Datenquellen, die bei uns (hoffentlich) im Artikeltext versteckt sind, direkt angegeben werden können.

Zusammengefasst ergibt sich, dass die Datums-Information der deWP mit wenigen Ausnahmen (z.Zt. im niedrigen zweistelligen Bereich) in WD angemessen dargestellt werden kann, sobald nur eine brauchbare Möglichkeit zur Eingabe von Zeitspannen vorhanden ist und eingegebene Zeitspannen auch dargestellt werden. Die nicht gänzlich darstellbaren Formen könnten ohne unvertretbare Verluste durch Vergröberungen ersetzt werden. (nachträglich: --Griot (Diskussion) 10:32, 19. Feb. 2018 (CET))

WD-Mängel[Quelltext bearbeiten]

Wie sich ergab, ist WD den Personendaten in vielen Punkten überlegen. Ein wesentlicher Mangel ist grundsätzlicher Art: Alle Informationen werden auf Einzelangaben herunter gebrochen, sie können nicht zusammengefasst werden. Dass einzelne Angaben nur in gewissen, nicht in allen Kombinationen sinnvoll sind, ist, so scheint es, nicht darstellbar.

Dazu noch eine Kritik technischer Art. Speicherplatz und Rechenzeit scheinen bei WD keine Rolle zu spielen. Während es auch mit einem schon älteren PC möglich ist, mit Dumps der deWP problemlos und solchen der englischsprachigen Wikipedia ohne größere Probleme zu arbeiten, liegt dies für WD außer Reichweite. Ursache ist eine extreme Weitschweifigkeit der Daten-Darstellung. Das beschränkt die Nutzungsmöglichkeiten stark. (nachträglich: --Griot (Diskussion) 10:32, 19. Feb. 2018 (CET))

Zu den weiteren Bedingungen[Quelltext bearbeiten]

Hierzu nur kurz:

  • Die Wartung von Daten über WD ist zur Zeit zu aufwendig. Eventuell könnte eine Wartung 'scheinbar' wie bisher in den Personendaten erfolgen, wobei die Daten aber in Wirklichkeit in WD abgelegt werden? Mit einigem Aufwand sollte das realisierbar sein.
  • Die Vandalismusgefahr ist groß. Wenn jetzt jemand Daten zu etwa einer Person verfälschen will, muss er in alle Projekte gehen, die einen entsprechenden Artikel enthalten. Das ist aufwendig. Wird die Information aus WD bezogen, ist das viel einfacher. Lösung:?
  • Die Rückgewinnung von Daten aus einer gescheiterten WD scheint unproblematisch zu sein. (nachträglich: --Griot (Diskussion) 10:32, 19. Feb. 2018 (CET))

Fazit[Quelltext bearbeiten]

Sobald das Zeitspannen-Problem der WD gelöst ist, könnten und sollten unsere Daten nach WD transportiert werden, ohne bei uns bereits entfernt zu werden. Für den Import von Daten aus der WD sowie für die ausschließliche Speicherung dort sind die Bedingungen noch nicht gegeben. Ich wiederhole: es ging hier nur um die Geburts- und Sterbedaten. --Griot (Diskussion) 02:28, 19. Feb. 2018 (CET)

Ich will deinen langen Text nicht auftrennen, aber dennoch gehört in der Gruppe "Bedingungen" /unmittelbar vor der fett geschriebenen Zwischenüberschrift) noch ein ganz wichtiger Punkt hinein:
  • Wp-übergreifender Konsens über Geburts/Sterbedatum einer Person.
Ein Account wird Quellen in seiner Sprache den Vorzug geben und Quellen anderer Sprachen zweitrangig betrachten. Wenn nun Quellen in verschiedenen Sprachen unterschiedliche Daten angeben, dann führt das zwangsläufig zu einem Konflikt. Und unterschiedliche Daten findet man in z.B. den Normdaten zur Genüge. Und damit gibt es auch einen Mangel in WD:
  • Ranking je nach Sprachversion
Momentan kann man zwar mehrere Daten angeben und diese mit einem Ranking versehen, doch das Ranking kann nicht lokalisiert werden, es kann also nicht das eine Datum in der enWP den höchsten rang haben und ein anderes Datum in der deWP. --Wurgl (Diskussion) 08:59, 19. Feb. 2018 (CET)
Hallo Wurgl, ich stimme Dir vollkommen zu, dass das ein Problem ist. Da eine Hinzufügung eines sprachspezifischen Rankings die ohnehin komplexen Strukturen weiter komplizieren würde, hoffe ich aber zunächst, dass die oben vorgeschlagene Bewahrung (in der für jedes einzelne Datum vorhandenen Liste der Quellen) der Wikipedia-Version, aus der das jeweilige Datum importiert wurde, ausreicht, das Problem zu lösen. Wobei auch Wikipedia-Versionen, aus denen nicht direkt importiert wurde, die das Datum aber nutzen, in die Liste der Quellen aufgenommen werden können (oder sollten?). --Griot (Diskussion) 10:32, 19. Feb. 2018 (CET)

@Griot: Danke für diese Ausführung. Mir erscheint das machbar. Mein größtest Problem war bisher die Bearbeitbarkeit. Aber wie gerade im Kurier berichtet, ist ja mit Wikipedia:Wikidata/InfoboxErweiterung was neues im Anmarsch. Das könnte uns vielleicht helfen. Wenn man die Vorlage:Personendaten zu einer Infobox umbaut (Sichtbarkeit auf Wunsch), kann man direkt im Artikel die Personendaten weiter bearbeiten. Oder eben erstmal nur die Datumsangaben. - Ein Fallback-System wäre doch durch ein einfaches Backup zum aktuellen Zeitpunkt der deutschen Personendaten jederzeit möglich. Man müsste sich dann nur die Mühe machen, das das zu halbautomatisch zu verskripten, sonst wird das keiner machen wollen. - Auswertungen würde ich auch nicht mehr über den Dump machen. Meine jetzigen Projekte baue ich immer so auf, dass sie auf den Live-Daten über die API arbeiten. Irgendwann wird jede Sprachversion so groß werden, dass man sie nicht mehr auf einem einzelnen Rechner auswerten will/kann. -- sk (Diskussion) 17:41, 19. Feb. 2018 (CET)