Hilfe Diskussion:Personendaten

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Abkürzung: HD:PD
Automatische Archivierung
Auf dieser Seite werden Abschnitte monatlich automatisch archiviert, deren jüngster Beitrag mehr als 30 Tage zurückliegt und die mindestens einen signierten Beitrag enthalten. Um die Diskussionsseite nicht komplett zu leeren, verbleiben mindestens 3 Abschnitte.
Archivübersicht Archiv
Wie wird ein Archiv angelegt?

Siamesische Zwillinge[Bearbeiten]

Wie sieht es mit PD bei siamesischen Zwillingen aus? Getrennt wie bei Mary und Eliza Chulkhurst (wobei sich der Alternativname ja auf beide bezieht), oder gemeinsam wie bei Daisy und Violet Hilton? --Schnark 10:33, 14. Feb. 2015 (CET)

Ich würde sagen: Getrennt. Sind zwei Individuen, auch wenn sie zusammengewachsen sind. --APPER\☺☹ 11:39, 14. Feb. 2015 (CET)
Auch von meiner Seite Zustimmung zu APPER. Ich würde die siamesischen Zwillinge wie Personengruppen behandeln wollen. Sind halt zwei Personen... Viele Grüße --Silke (Diskussion) 12:37, 14. Feb. 2015 (CET)

Wie greift das mit Wikidata ineinander?[Bearbeiten]

Im Zuge diverser Arbeiten auf Wikidata fällt mir auf, dass die Persondaten zu einem hohen Prozentsatz redundant zu den Angaben auf Wikidata sind. Nach meiner Ansicht könnte man diese Daten, sofern nicht bereits geschehen, auf Wikidata übertragen und den Abschnitt Persondaten ersatzlos streichen ohne dabei Informationen zu verlieren. Diverse Tools müssten dann eben ihre Infos von Wikidata abfragen.--Giftzwerg 88 (Diskussion) 11:51, 15. Feb. 2015 (CET)

Im Prinzip sind das Geburts- und Sterbedatum sowie die Kurzbeschreibung größtenteils die einzigen Dinge, die derzeit auf Wikidata sind. Bei der Kurzbeschreibung kommt dazu, dass zum Teil dort Lebensdaten mit einfließen, was bei uns eigentlich nicht der Fall sein sollte. Der korrekte Namensansatz beim Hauptnamen und bei Alternativnamen ist eigentlich nicht vorhanden. Bei Orten (Geburts- und Sterbeort) sind nur Angaben auf Wikidata-Items möglich, keine eigenen Texte, das ist also auch noch kein vollständiger Ersatz, zumal bei Orten immer der aktuelle Name angezeigt wird, bei Geburtsorten aber der Name zur Zeit der Geburt maßgeblich sein sollte. Also da gibt es schon noch einige Probleme, die gelöst werden müssen. --APPER\☺☹ 16:23, 15. Feb. 2015 (CET)
Unser Ansatz hier ist nach meiner Erinnerung, dass die Personendaten ein (mehr oder weniger) maschinenlesbarer Extrakt des Einleitungsabsatzes sind, also nicht unbedingt als "unabhängige" Daten aufgefasst werden können, die genauso gut nach Wikidata ausgelagert werden könnten. Auf der praktischen Ebene öffnen die verschiedenen Sichtweisen aber wohl dieselben Handlungsoptionen: Wartungskategorien bzw. versteckte Redlinks im Fall von Abweichungen etwa der Geburtsdaten von Wikidata, automatische Ergänzung (ggfls. mit hochgestellter Kennung "WD") fehlender Elemente aus Wikidata für Anzeigezwecke. -- Thomas Berger (Diskussion) 16:39, 15. Feb. 2015 (CET)
Von meiner Seite aus ist geplant, die Wikidata-Daten in das Wartungsskript für die Personendaten in dewiki einfließen zu lassen. Wie Thomas beschreibt kann man damit Differenzen aufdecken und so Fehler entdecken, die nur mit dewiki nicht zu finden wären. -- sk (Diskussion) 22:18, 15. Feb. 2015 (CET)
Personendaten sind "ein (mehr oder weniger) maschinenlesbarer Extrakt des Einleitungsabsatzes", genau das denke ich soll dem Grundsatz nach auch WD sein, bloß dass es sich nicht auf die Einleitung beschränkt und vom Prinzip her alle Daten einer Biographie erfasst. Die Beschreibung ist genau so, wie sie die Benutzer eingeben, grundsätzlich soll sie so kurz wie möglich sein und keine Personbeschreibung, es ist ein String, also nichts konzeptionell anderes, als in der Vorlage. Mag sein, dass momentan im Objekt was anderes steht als in der Vorlage, es lässt sich jedoch vom Ansatz her abgleichen. (Es wäre auch ein Bot möglich, der bei fehlender Beschreibung diese aus der Vorlage holt.) Es gibt zum einen die Möglichkeit, die Beschreibung gewissen Regelungen zu unterwerfen, so dass sie übereinstimmend zur Kurzbeschreibung der Vorlage wäre, zum anderen könnte man ein eigenes Feld mit einer extra Eigenschaft definieren, die genau diese Kurzbeschreibung der Vorlage enthält. Auch zu dem Thema "korrekter Namensansatz" gibt es schon Lösungen. Inzwischen ist z. B. so gut wie jedes Personenobjekt so aufbereitet, dass zumindest der Vorname als Vorname definiert ist, auch sehr viele Nachnamen sind bereits definiert, so dass man computergeneriert den korrekten Ansatz von Vor- und Nachnamen erledigen kann. Die Taskforce hat auf diesem Gebiet riesiges geleistet, so dass schon ein erheblicher Prozentsatz so aufbereitet ist. Die Aliasnamen kann man genau so definieren oder eingeben, wie man sie in dieser Vorlage braucht, ich wüsste nicht, wie sich das konzeptionell unterscheidet. Das ist v. a. wichtig für ostasiatische Namen, wo Vor- und Nachnamen oft herumgedreht sind. Es gab auch schon Versuche eine Eigenschaft mit definierter Namensansetzung zu machen, jedoch war das noch nicht konzeptionell ausgegoren. Zum Thema Geburtsorte: Auch das kann man bereits mit WD-Mitteln lösen. Die Regeln lassen es zu, dass ein neues Objekt für einen noch nicht vorhandenen Geburtsort erstellt wird, eigens zum Zweck um darauf zu verlinken. Als Notnagel kann man auch das Objekt der nächsthöheren Verwaltungseinheit nehmen, was zwar einen Verlust an "Präzision" bedeutet, in vielen Fällen jedoch aussagekräftiger sein kann als der isolierte Name eines sonst unbekannten Dorfes im Dschungel oder in Sibirien. Das Konzept von Objekten statt einem frei formulierbaren Text hat außerdem weitere Vorteile, z. B. lässt sich so entscheiden und festlegen welcher von mehreren gleichlautenden Orten der richtige ist, eine automatische Verknüpfung mit Landkreis, Bundesland, Staat, sowie zu Geokoordinaten herstellen. Zum Thema Name des Geburtsorts zur Zeit der Geburt: Auch das lässt sich bereits darstellen, indem mehrere Namen definiert werden und im Fall einer Umbenennung der Endzeitpunkt für den alten und der Startzeitpunkt für den neuen Namen mit Qualifikatoren festgelegt wird. Durch Abgleichung mit dem Geburtstag kann man zweifelsfrei und auf den Tag genau festlegen, welcher Name davon angezeigt wird. Ebenso ist es ein Vorteil, dass der Leser so erfahren kann, dass der Ort immer noch existiert, nur eben heute anders heißt. Das Problem ist momentan nur noch, dass Qualifikatoren noch nicht mit den jetzigen Vorlagen abgerufen werden können, das ist aber nur noch eine Frage der Zeit und wird höchstwahrscheinlich im Lauf des Jahres noch kommen, da sitzen die Programmierer dran. Technisch gesehen bin ich absolut der Meinung, dass diese Vorlage durch Wikidata bereits jetzt zu 80% ohne Problem ersetzbar ist und weitere 15% mit ein paar Modifikationen, neu angelegten Objekten und Nachnamen ohne Informationsverlust ersetzbar wäre. Vielleicht 5% wären problematisch, weil die Qualifier noch nicht funktionieren. Ich sehe aber durchaus das Argument Redundanz. Ein gewisses Maß an Redundanz ist sinnvoll, dann sollte es aber irgendwie systematischer sein. Bisher ist die Vorlage inhaltlich redundant zum Artikeltext, es könnte aber in Zukunft die Redundanz verlagert werden auf eine Redundanz zwischen den Artikeltexten in mehreren Sprachen und Wikidata, wobei die Grunddaten zur Biographie z. B. mittels einer Vorlage angezeigt wird, so dass der Leser sehen kann, wenn sich zwischen Artikeltext und Wikidata ein Unterschied ergibt. Falls z. B. jemand den Wikiartikel vandalieren will, kann er im gleichen Edit zugleich auch die Vorlage ändern. Falls es mit WD wäre, müsste man zugleich zwei unterschiedliche Dokumente auf zwei unterschiedlichen Projekten vandalieren und unter Umständen noch in mehreren anderen Sprachen auch noch. Der wirkliche Fortschritt ist jedoch, dass auf diese Weise die Daten in allen anderen Sprachen auch zur Verfügung stehen und nicht nur in de- und enwiki, somit hätte man zugriff auf Daten aus jeder Biographie, die in irgendeiner beliebigen Sprache existiert und zwar in allen Sprachen.--Giftzwerg 88 (Diskussion) 23:50, 15. Feb. 2015 (CET)

Zum Vergleich mal die automatisierten Ergebnisse von

--Giftzwerg 88 (Diskussion) 00:23, 16. Feb. 2015 (CET)
Das mit dem Vor- und Nachnamen klingt vielleicht einfach, aber Hias Noichl, Matthäus Hipp, Dr. Motte, Matze Knop und Matías Fernández tragen laut Wikidata alle den Vornamen Matthias. Das ist nicht ausreichend um die Namen in der Form "Nachname, Vorname" zu formatieren. Damit ist der NAMEns-Eintrag in den Personendaten gegenüber Wikidata eben noch lange nicht überflüssig.
Das gleiche gilt natürlich noch viel mehr für die ALTERNATIVNAMEN. Dass die KURZBESCHREIBUNG zwar auf Wikidata ähnlich vorhanden ist, dort aber zur Unterscheidung teilweise die hier überflüssigen Lebensdaten angefügt werden, hat APPER schon erwähnt. Bei nicht-exakten Lebensdaten ("zwischen", "nach", etc.) liefern unsere Personendaten mehr Informationen als Wikidata.
Letztlich liegt die Entscheidung für oder gegen Personendaten in ihrer gegenwärtigen Form bei denen, die sie nutzen und bei denen, die sie pflegen wollen. Natürlich, sobald APPER meint, die Liste der Biografien sei besser aus Wikidata zu erstellen als über die Personendaten, sobald diejenigen, die jetzt wieder die Personendatenfehlerliste abarbeiten sich lieber Fehlerlisten in Wikidata vornehmen, dann sind die Personendaten überflüssig. Aber solange es Benutzer gibt, die die Daten hier pflegen und damit die Qualität so hoch halten, dass Nachnutzer die Personendaten Wikidata vorziehen, sind die Personendaten eben nicht überflüssig. --Schnark 10:15, 16. Feb. 2015 (CET)
Etwas unsystematische Kommentare von mir:
  • Nachname, Vorname, gedrehte oder nicht gedrehte "Ansetzungen": M.E. erheblich überbewertet (natürlich gibt es zu jeder Person für jeden Kulturkreis und Zeitpunkt eine oder mehrere präferierte Formen der Notation, aber darüber ein abstrahierendes Raster wie zum Beispiel Nachname, Vorname zu legen ist ziemlicher Humbug und löst günstigstenfalls Probleme, die man gar nicht hatte). Jedenfalls bin ich sehr froh, dass die Vorlage:Personendaten ohne dieses Raster auskommt und finde nicht, dass sie dadurch gewinnen könnte, die entsprechenden Angaben aus Wikidata aufzubereiten (Umgekehrt bin ich aber froh, dass sich Wikidata systematisch um Verwandschaftsbeziehungen kümmern kann).
  • Kurzbeschreibung: Weil die Captions in Wikidata anders als die Lemmata in den einzelnen Sprachversionen nicht disambiguieren müssen (und auch nicht sollen), gibt es für die Kurzbeschreibung in Wikidata und der aus Infoboxen bzw. Personendaten hier einen funktionalen Unterschied: Wikidata-Kurzbeschreibungen müssen die gesamte Disambiguierung leisten (notfalls auch unter Nennung von Lebensdaten) und eigentlich nicht mehr als dies, Kurzbeschreibungen hier dienen eher einer umfassenden Würdigung. Die Frage darf gestellt werden, ob die Beschreibung in den Personendaten als Neuformulierung des Einleitungsabsatztes nach Abzug aller Namensformen, Daten und Orte gedacht ist, oder eine noch kürzere, "unabhängige" Formulierung sein soll.
  • Zu den "kulturgeschichtlichen" Einordnungen der Orte hatte ich unlängst eine quälende Diskussion: Für eine exakte (monatsgenaue?) Zuordnung aller Beziehungen aller historischen Verwaltungseinheiten untereinander fehlen uns vermutlich noch 90% aller Entities und 99,9% aller benötigten Daten (Relationen und Qualifier) auf Wikidata (glücklicherweise gibt es dort keine Regeln gegen TF?), und maschinell bestimmte hyper-exakte Angaben dürften in vielen Fällen die Benutzer überfluten bzw. sogar desorientieren, wohingegen die Ortsangaben in den Personendaten versuchen, gezielt für das Publikum der deutschsprachigen Wikipedia angemessene Minimalinformation zur Einordnung zu geben (mit sekundärem Ziel einer gewissen Einheitlichkeit): Wenn erst einmal der weltweit umfassendste Geothesaurus in Wikidata geschaffen sein wird (keine Ironie, ich halte es für nicht ausgeschlossen, dass es in 5 Jahren so sein wird), wäre ein Eindampfen auf Leserbedürfnisse noch eine gewaltige (informatische) Zusatzaufgabe. Insofern halte ich die bisherige Praxis der "hybriden", aber weitestgehend de:WP-intern verlinkten Ortsangaben in den Personendaten für auf lange Sicht nicht ablösbar... -- Thomas Berger (Diskussion) 10:57, 16. Feb. 2015 (CET)