Hilfe Diskussion:Personendaten
Archiv |
Wie wird ein Archiv angelegt? |
Botflagantrag Xinbenlv_bot[Quelltext bearbeiten]
- Beispiele zur Diskussion
- Diskussion:Mihaela Cârstoi (error)
- Diskussion:Ernst-Aleksander Joll
- More: de:Kategorie:Wikipedia:WikiProjekt_WikiLoop/Inconsistent_Birthday
Hallo zusammen,
ich möchte auf folgenden Botflag-Antrag aufmerksam machen, zu dem insbesondere zur konkrete inhaltlichen Ausgestaltung der Bottätigkeit Feedback gegeben werden kann Wikipedia:Bots/Anträge_auf_Botflag#Diskussion_Xinbenlv_bot. Xinbenlv_bot soll zur Meldung sich widersprechender Geburtsdaten in Biografieartikeln verschiedener Sprachversionen genutzt werden. --Septembermorgen (Diskussion) 18:05, 22. Feb. 2019 (CET) Btw. die inhaltliche Ausgestaltung sollte dann doch besser hier diskutiert werden. --Septembermorgen (Diskussion) 18:06, 22. Feb. 2019 (CET)
- Vielen Dank! Benutzer:Xinbenlv(en:User:Xinbenlv) 18:36, 22. Feb. 2019 (CET)
- @Xinbenlv: In english, since you seem to speek german not very good ;^) I have done a similar check, but only within the german wikipedia. Even there different articles mention different dates. For various reasons after more than a year of edits, that project is now in a kind of sleeping state. But there ist still plenty work to do, sure more than another year or even more. For most persons born after ~1850 (1850 is just a number, it might bei some years later or earlier) there are good sources, but even there for some there exist different good sources which hold different dates for birth and for death. So, there is a lot to discuss (discussions with main autors of articles) – eg. is a gravestone a better source, than a publication from exactly that same graveyard? For people who lived before, it is even harder, so you will have differences. Currently I am very busy because of the database crash on the toolservers and because of server upgrades there, but when this is done, we can share ideas and experiences. --Wurgl (Diskussion) 21:06, 22. Feb. 2019 (CET)
- Thank you, @Wurgl:. Yeah, I am still in my early stage of learning German. Yeah, I agree there are reasons that a person will have multiple good sources indicating different/inconsistent birthdays. So if authors checked and verified that multiple birthdays have good source, they mark that article subject as "Unterschiedliche Geburtstage überprüft" using a template Benutzer:Xinbenlv/msg/inconsistent_birthday_verified. Benutzer:Xinbenlv(en:User:Xinbenlv) 00:32, 23. Feb. 2019 (CET)
- @Septembermorgen:, danke für den Hinweis! Leider kann ich nur englisch lesen und verstehen, bin aber nicht in der Lage auf englisch zu antworten... Deshalb von mir in Deutsch. Gerne darf für Xinbenlv übersetzt werden :-)
- Der Hinweis auf der Diskussionsseite sieht erst einmal gut aus. Mir persönlich fehlen aber Hinweise, WIE die Inkonstistenz bearbeitet werden kann/soll:
- Grundsätzlich gilt: Wikipedia ist keine Quelle. Es müssen also externe Belege in den genannten Artikeln überprüft werden. Idealerweise sind Weblinks, Normdaten oder Einzelnachweise vorhanden. Sind alle Belege überprüft, gibt es mehrere Möglichkeiten:
- Alle Quellen geben für den deutschsprachigen Artikel eindeutig ein zu korrigierendes Datum an. Dann ist der Einleitungssatz, die Infobox (falls vorhanden), die Personendaten und die Kategorie zu korrigieren. Danach ist unbedingt über Links auf diese Seite zu überprüfen, ob die falschen Daten auch auf verlinkten Artikeln zu korrigieren sind.
- Zu klären ist: Kann die Botmeldung auf der Diskussionsseite gelöscht werden?
- Die Quellen geben unterschiedliche Daten an. Dann sollten diese unterschiedlichen Lebensdaten mit Beleg im Artikel genannt werden. Entweder im Einleitungsatz oder als Anmerkung unter Einzelnachweisen. Es kann aber vorkommen, dass im Artikel selber auf die Inkonsistenz hingewiesen wird. In allen Fällen sollte dann auf der Diskussionsseite der Hinweis "Unterschiedliche Geburtstage überprüft" für den Bot hinterlassen werden.
- Sowohl der Artikel in DE, als auch die anderen Artikel sind bezüglich der Lebensdaten unbelegt und können nicht über eine Recherche nachvollzogen werden.
- Zu klären ist: Wohin mit solchen Artikeln? Eine weitere Unterseite mit unbelegte Lebensdaten?
- Die Lebensdaten in DE sind richtig, aber in einer anderen Sprachversion falsch.
- Zu klären ist: Wohin mit solchen Artikeln? Eine weitere Unterseite mit Geburtsdatum in DE überpüft und richtig, Korrekturbedarf in anderen Sprachversionen?
- Soweit meine ersten Überlegungen. So eine Botmeldung ist die eine Sache, aber die Abarbeitung ist manchmal gar nicht so einfach durchzuführen. Hier benötigt es Unterstützung und Hilfe für die Community. Wie könnte diese aussehen? Da Wurgl sich gerade wirklich um viel, viel wichtigere Dinge kümmern muss, möchte ich darum bitten, dass der Botflag ohne weitere Hilfe für die Community noch nicht erteilt wird. Auf Verständis hoffend, --Silke (Diskussion) 13:35, 23. Feb. 2019 (CET) PS:@Graphikus: dazu hast Du doch bestimmt auch eine Meinung :-)
- @Silewe: ich kann mich Deinen Ausführungen unbedingt anschließen. Allein - wohin mit den Artikeln (wohl sind hier Listen zur späteren Überprüfung und evtl. Abarbeitung gemeint) weiß ich auch nicht. Die Abänderungen sollten imho nur von Hand gemacht werden, da die ganze Geschichte viel zu komplex ist einem Bot anzuvertrauen. Verschiedene Sprachversionen = verschiedene Quellen, Einzelnachweise usw. Aber wohin damit - das kann ein Bot-Betreiber wohl eher beantworten. Deine Anmerkungen zu @Wurgl: muss ich leider voll bestätingen. Bis Mitte März muss er da doch noch viel machen, ohne ihn würde wohl Einiges stehen bleiben. --Graphikus (Diskussion) 18:58, 23. Feb. 2019 (CET)
- @Xinbenlv: In english, since you seem to speek german not very good ;^) I have done a similar check, but only within the german wikipedia. Even there different articles mention different dates. For various reasons after more than a year of edits, that project is now in a kind of sleeping state. But there ist still plenty work to do, sure more than another year or even more. For most persons born after ~1850 (1850 is just a number, it might bei some years later or earlier) there are good sources, but even there for some there exist different good sources which hold different dates for birth and for death. So, there is a lot to discuss (discussions with main autors of articles) – eg. is a gravestone a better source, than a publication from exactly that same graveyard? For people who lived before, it is even harder, so you will have differences. Currently I am very busy because of the database crash on the toolservers and because of server upgrades there, but when this is done, we can share ideas and experiences. --Wurgl (Diskussion) 21:06, 22. Feb. 2019 (CET)
- Der Bot schreibt nur die Benachrichtigung in die Diskussionsseite; Listen und Tabellen gibt es nicht und der Artikel wird erst recht nicht bearbeitet.
- Über die Suche der Seiteneinbindungen lässt sich eine aktuelle Übersicht verschaffen, zu welchen Artikeln es noch unerledigten Recherchebedarf gibt.
- LG --PerfektesChaos 19:06, 23. Feb. 2019 (CET)
- Das wichtigste wäre wohl, dass die Vorlage, die Xinbenlv_bot auf der Diskseite hinerlässt, eine vernünftige Anleitung enthält und die getaggten Artikel in einer Wartungskategorie gesammelt werden. Daraus lassen sich in einem weiteren Schritt wie bei anderen Wartungsaufgaben auch, portal- und wikiprojektgerechte Wartungslisten erstellen. Bischen anderst als andere Wartungsaufgaben ist diese hier, weil sie sprachversionübergreifend ist. Dies erfordert eine etwas höhere Sensibilität, wenn man bei strittigen Inhalten mit Benutzern aus anderen Sprachversionen zu tun hat, mit denen man sonst eigentlich nie zu tun hat. --Septembermorgen (Diskussion) 11:58, 24. Feb. 2019 (CET)
- :-) Also Korrekturen in anderen Sprachversionen würde ich nie und nimmer durchführen. 1. interessieren die mich nicht. 2. kenne ich die dortigen Gepflogenheiten nicht. Wenn so etwas gewünscht wird, schicken wir unsere Community ins offene Messer. Ich persönlich würde dafür plädieren, dass jede Sprachversion eventuelle Korrekturen selber durchführt. Der Bot könnte dann in anderen Sprachversionen einen Prüfhinweis hinterlassen? Ich habe mir einmal erlaubt bei den beiden obigen Beispielen meine Prüfergebnisse zu hinterlegen. Da gibt es noch einiges zu besprechen... --Silke (Diskussion) 13:49, 24. Feb. 2019 (CET)
- Das wichtigste wäre wohl, dass die Vorlage, die Xinbenlv_bot auf der Diskseite hinerlässt, eine vernünftige Anleitung enthält und die getaggten Artikel in einer Wartungskategorie gesammelt werden. Daraus lassen sich in einem weiteren Schritt wie bei anderen Wartungsaufgaben auch, portal- und wikiprojektgerechte Wartungslisten erstellen. Bischen anderst als andere Wartungsaufgaben ist diese hier, weil sie sprachversionübergreifend ist. Dies erfordert eine etwas höhere Sensibilität, wenn man bei strittigen Inhalten mit Benutzern aus anderen Sprachversionen zu tun hat, mit denen man sonst eigentlich nie zu tun hat. --Septembermorgen (Diskussion) 11:58, 24. Feb. 2019 (CET)
- Das ist ja in das Ermessen der jeweiligen Bearbeiter gestellt. Die Meldung erscheint auf der allen beteiligten Autoren zugänglichen Artikeldisk, und wenn die lemmatisierte Person einen besonderen Bezug zur anderen Sprachversion hat und ein Fachautor in jener Wikipedia heimisch ist, kann das Ergebnis unserer Recherche auf eigene Verantwortung auch dort eingearbeitet werden. LG --PerfektesChaos 14:42, 24. Feb. 2019 (CET)
- :-) da hast Du Recht. Jede(r) so wie er/sie kann oder will. Ich wollte darauf hinweisen, dass auch die Nichtbearbeitung in anderen Sprachversionen möglich ist. Viele Grüße --Silke (Diskussion) 14:58, 24. Feb. 2019 (CET)
- Das ist ja in das Ermessen der jeweiligen Bearbeiter gestellt. Die Meldung erscheint auf der allen beteiligten Autoren zugänglichen Artikeldisk, und wenn die lemmatisierte Person einen besonderen Bezug zur anderen Sprachversion hat und ein Fachautor in jener Wikipedia heimisch ist, kann das Ergebnis unserer Recherche auf eigene Verantwortung auch dort eingearbeitet werden. LG --PerfektesChaos 14:42, 24. Feb. 2019 (CET)
To summarize in a nutshell what Silewe said:
- Before mass distribution can begin a user guide for community members has to be provided.
- Authors need clear advice what do in which situation based on which kind of sources.
- This goes on investigation about sources with differing statements and how to quote that in the article.
- And template management, when to place which template where in order to declare the issue as resolved, even when it could not be agreed upon one unique date only.
- She says bot flag should be stalled until preconditions have been completed.
- BTW, I am in full agreement with her.
That has been my first impression as well.
- The original plan has been that the bot is just dumping a table on talk page, then vanishing.
- However, the entire process is to be planned in advance.
- A discussion on results of source investigation and evaluation of reliability needs space.
- A decision will be made between the possible options how to change at least our article, perhaps as well on other projects.
- Therefore it needs to be the opener for a talk page section, which is to be resolved and closed and archived at a certain stage.
Your software is giving valuable input and nudging the community on possible errors, but we need the full loop from cradle to coffin (joining birth date and cradle). I see the following pages required as user pages, which may get the same name on every wiki in the world, and filled in local spirit:
- user:Xinbenlv/Birth message/headline
- Could be empty if no headline desired.
- Content example here:
<onlyinclude>== Abweichendes Geburtsdatum entdeckt == {{Nicht archivieren|Zeigen=nein}}</onlyinclude>
- user:Xinbenlv/Birth message
- Main informative template.
- More than one external pair may be provided, since more wikis could be involved and a third table row will appear.
<onlyinclude> This bot has detected inconsistent birth dates on wiki projects: <table> * Please check your sources. * If it turns out that the one or other date is definitely wrong please correct and include citation. * Detailed instructions may be found at [[user:Xinbenlv/Unterschiedliche Geburtstage]] * This message has been generated by bot ..... run by [[user:Xinbenlv]]. * Please raise issues, also in German, on my English user page: [[:en:user talk:Xinbenlv/........]]. </onlyinclude>
- user:Xinbenlv/msg/Birth date checked
- Global mark for excluding from further bot notification.
- Content example here:
<onlyinclude>''Es erfolgen zukünftig keine Benachrichtigungen mehr zu diesem Artikel.''</onlyinclude>
- user:Xinbenlv/Unterschiedliche Geburtstage überprüft
#REDIRECT [[user:Xinbenlv/msg/Birth date checked]]
- Therefore you can check in all wikis whether this mark has been set.
- user:Xinbenlv/Unterschiedliche Geburtstage
- User guide, detailed and operational procedure for authors what to do when. Could also explain more about methodology behind and link to English pages, also feedback and bug reports.
- Local in every wiki.
- Content as detailed by Silewe.
- Please note that no project template nor project page is involved. This is a private user action.
Providing such infrastructure in any wiki, the bot may dump on every wiki the story in identical format:
{{subst:user:Xinbenlv/Birth message/headline}} {{user:Xinbenlv/Birth message | 1905-06-07 | [[:en:John Doe]] | 1905-06-09 }} --~~~~~
Regards --PerfektesChaos 18:24, 23. Feb. 2019 (CET)
Auf gar keine Fall Botflag erteilen. In dem Beispiel mit der Biathletin wurde ein unbelegtes falsches Datum im Artikel eingesetzt, in der genannten Referenz, die sowieso schon im Artikel vorhanden war, steht der 24. Februar und nicht der 20. März. Das demonstriert wohl hinreichend die Unzuverlässigkeit. Abgesehen davon hat das bei Biographien von Personen, die etwas früher gelebt haben und bei denen die Angaben oft sehr differieren – man braucht da nur einen Blick auf WD werfen. wo das System ja auch nicht versteht, daß man nicht immer nur ein Datum angeben kann –, ein ungeheures Spampotential. --Enzian44 (Diskussion) 19:45, 24. Feb. 2019 (CET)
- Wurde weiter oben schon geschrieben. Der Bot ändert in den Artikeln gar nichts, er soll nur sich widersprechende Angaben auf der Artikeldiskussionsseite melden, alles weitere erfolgt nicht automatisiert. Gruß --Septembermorgen (Diskussion) 19:49, 24. Feb. 2019 (CET)
- Auch auf den Diskussionsseiten ist das Spam, mit Verlaub. --Enzian44 (Diskussion) 19:58, 24. Feb. 2019 (CET)
- Naja, seine ersten Gehversuche waren schon direkt im ANR... Er hat sich aber Gott sei Dank jetzt für den Hinweis auf der Diskussionsseite entschieden. Danke an Enzian44 für die Korrektur im Artikel und den Hinweis, dass einem offiziellen Organ mehr Rechnung getragen werden sollte. --Silke (Diskussion) 19:53, 24. Feb. 2019 (CET)
- Nachfrage: Kann man eigentlich Artikel gegen Angriffe von Bots wie diesem hier schützen? --Enzian44 (Diskussion) 19:54, 24. Feb. 2019 (CET)
- Ach OK, dann ziehe ich meinen Einwand zurück, das wäre in der Tat nicht gut ausgegangen. Wie gesagt, es wird jetzt so sein, dass der Bot einen Hinweis auf der Diskseite hinterlässt und die Artikel nicht anrührt. --Septembermorgen (Diskussion) 19:57, 24. Feb. 2019 (CET)
- Soll das heißen, Du willst den ernsthaft auf de:wp loslassen? Kein enzyklopädischer Mehrwert erkennbar. --Enzian44 (Diskussion) 20:01, 24. Feb. 2019 (CET)
- Ich seh da für WP insgesamt schon einen Gewinn, wenn sich widersprechende Geburtsdaten nochmal geprüft und gfs. korrigert werden, auch wenn die Korrektur dann in der jeweils anderen Sprachversion vorgenommen wird oder dortige Autoren zumindest einen Hinweis auf die richtigen Daten erhalten. Abgesehen davon, auch wenn die Beleglage nicht eindeutig ist und mehrere Geburtsdaten angegeben werden können, widersprechen sollten sich diese Angaben in verschiedenen Sprachversionen dennoch nicht. Es wird jedenfalls noch eine umfangreichere Testphase geben, dann wird man sehen, ob das so wie angedacht funktioniert oder eben nicht, derzeit kann man das kaum abschließend beantworten. --Septembermorgen (Diskussion) 20:25, 24. Feb. 2019 (CET)
- Die Quote der falsch-positiven Meldungen soll auch dadurch gering gehalten, indem der Bot nur Geburtsdaten nach 1850 oder 1900 berücksichtigt und evtl. bei älteren Daten nur Jahresdifferenzen berücksichtigt. --Septembermorgen (Diskussion) 20:36, 24. Feb. 2019 (CET)
- Der antragstellende Benutzer hat demonstriert, daß er nicht in der Lage ist, das Datum aus der von ihm benutzten Information richtig wiederzugeben: ob das an seiner Botkonzeption oder an ihm liegt, läßt sich nicht feststellen, ich würde das aber auch gar nicht erst zum Test kommen lassen. Außerdem sehe ich überhaupt nicht ein, daß in allen WP-Versionen bei divergierenden Daten (von eventuellen Tippfehlern wollen wir mal absehen) dieselbe Entscheidung getroffen werden muß. Es ist auch fraglich, was die richtigen Daten sind. Wer entscheidet das? Selbst Normdaten können fehlerhafte Angaben enthalten. Zudem ist erfahrungsgemäß damit zu rechnen, daß sich da Leute an die eventuelle Abarbeitung machen, denen die sachliche Kompetenz zur Klärung nicht immer einfacher Fragen fehlt. Bei älteren biographischen Daten gibt es auch manchmal gar keine Jahreszahlen, sondern nur Jahrhundertangaben, die in den Sprachversionen auch differieren können. --Enzian44 (Diskussion) 21:30, 24. Feb. 2019 (CET)
- Es geht vor allem darum, klare Falschangaben durch erratisches händisches Editieren aufzuspüren. Das passiert nämlich leider ziemlich häufig, und wird meist jahrelang nicht korrigiert, weil da niemand systematisch nach sucht. Es scheint mir ausgesprochen kontraproduktiv zu sein, weiterhin die Augen vor dem Problem zu verschließen, nur weil einige Benutzer nicht in der Lage sein könnten, das korrekt abzuarbeiten. Wir schauen uns hier alle gegenseitig auf die Finger, da dürfte "falsches abarbeiten" schnell auffallen. Im Übrigen geht es nicht um "die richtigen Daten", sondern darum, die in den gemeldeten Artikeln vorzufindenden Daten einem erneuten Quellenabgleich zu unterziehen und das ggf. angemessen darzustellen. --MisterSynergy (Diskussion) 13:45, 26. Feb. 2019 (CET)
- Auf WD sieht man auch falsche Edits von Bots. Prinzipiell ist ein Hinweis sinnvoll, ich glaube aber angesichts der Arbeitsproben des Benutzers nicht, daß er der richtige dafür ist. --Enzian44 (Diskussion) 14:19, 26. Feb. 2019 (CET) PS. Viel problematischer als abweichende Lebensdaten sind eigentlich falsche Inhalte der Artikel, aber daran dürfte jeder Bot scheitern.
- Sobald jemand den Finger regt und irgendetwas (regelmäßig) tut, passieren dabei naturgemäß gelegentlich auch Fehler. Das ist beim automatisierten Editieren in Wikipedia oder Wikidata nicht anders als beim händischen Editieren. Der Bot soll ja nicht im ANR editieren, was ich für absolut richtig halte, sondern lediglich auf Diskussionsseiten einen erneuten Quellenabgleich vorschlagen, der dann von menschlichen Benutzern durchgeführt wird. Und dass es möglicherweise schwerwiegendere oder schwerer zu erkennende Probleme mit Artikeln gibt, kann kein Grund sein, diesen hier vorgeschlagenen Abgleich auszuschlagen. --MisterSynergy (Diskussion) 14:52, 26. Feb. 2019 (CET)
- Auf WD sieht man auch falsche Edits von Bots. Prinzipiell ist ein Hinweis sinnvoll, ich glaube aber angesichts der Arbeitsproben des Benutzers nicht, daß er der richtige dafür ist. --Enzian44 (Diskussion) 14:19, 26. Feb. 2019 (CET) PS. Viel problematischer als abweichende Lebensdaten sind eigentlich falsche Inhalte der Artikel, aber daran dürfte jeder Bot scheitern.
- Es geht vor allem darum, klare Falschangaben durch erratisches händisches Editieren aufzuspüren. Das passiert nämlich leider ziemlich häufig, und wird meist jahrelang nicht korrigiert, weil da niemand systematisch nach sucht. Es scheint mir ausgesprochen kontraproduktiv zu sein, weiterhin die Augen vor dem Problem zu verschließen, nur weil einige Benutzer nicht in der Lage sein könnten, das korrekt abzuarbeiten. Wir schauen uns hier alle gegenseitig auf die Finger, da dürfte "falsches abarbeiten" schnell auffallen. Im Übrigen geht es nicht um "die richtigen Daten", sondern darum, die in den gemeldeten Artikeln vorzufindenden Daten einem erneuten Quellenabgleich zu unterziehen und das ggf. angemessen darzustellen. --MisterSynergy (Diskussion) 13:45, 26. Feb. 2019 (CET)
- Der antragstellende Benutzer hat demonstriert, daß er nicht in der Lage ist, das Datum aus der von ihm benutzten Information richtig wiederzugeben: ob das an seiner Botkonzeption oder an ihm liegt, läßt sich nicht feststellen, ich würde das aber auch gar nicht erst zum Test kommen lassen. Außerdem sehe ich überhaupt nicht ein, daß in allen WP-Versionen bei divergierenden Daten (von eventuellen Tippfehlern wollen wir mal absehen) dieselbe Entscheidung getroffen werden muß. Es ist auch fraglich, was die richtigen Daten sind. Wer entscheidet das? Selbst Normdaten können fehlerhafte Angaben enthalten. Zudem ist erfahrungsgemäß damit zu rechnen, daß sich da Leute an die eventuelle Abarbeitung machen, denen die sachliche Kompetenz zur Klärung nicht immer einfacher Fragen fehlt. Bei älteren biographischen Daten gibt es auch manchmal gar keine Jahreszahlen, sondern nur Jahrhundertangaben, die in den Sprachversionen auch differieren können. --Enzian44 (Diskussion) 21:30, 24. Feb. 2019 (CET)
- Soll das heißen, Du willst den ernsthaft auf de:wp loslassen? Kein enzyklopädischer Mehrwert erkennbar. --Enzian44 (Diskussion) 20:01, 24. Feb. 2019 (CET)
- Ach OK, dann ziehe ich meinen Einwand zurück, das wäre in der Tat nicht gut ausgegangen. Wie gesagt, es wird jetzt so sein, dass der Bot einen Hinweis auf der Diskseite hinterlässt und die Artikel nicht anrührt. --Septembermorgen (Diskussion) 19:57, 24. Feb. 2019 (CET)
- Nachfrage: Kann man eigentlich Artikel gegen Angriffe von Bots wie diesem hier schützen? --Enzian44 (Diskussion) 19:54, 24. Feb. 2019 (CET)
Xinbenlv's response to Hilfe_Diskussion:Personendaten initial comments // Xinbenlvs Antwort auf Hilfe_Diskussion: Personendaten erste Kommentare[Quelltext bearbeiten]
Deutsche(Übersetzt) Hallo @Silewe:, @Graphikus:, @Septembermorgen:, @Enzian44:, @MisterSynergy:,
Vielen Dank, dass Sie sich an der Diskussion beteiligt haben, und Ihre Beiträge sind sehr wertvoll. Zunächst einmal möchte ich mich noch einmal für den Mangel an deutschsprachigen Fähigkeiten entschuldigen. Ansonsten kann ich den Bot besser der DE-Community erklären und auch Ihre Eingaben erleichtern. Ich möchte User:Silewe und User:Enzian44 für die Hilfe bei der Überprüfung der Testeditionen danken.
Hier einige Punkte, die ich klarstellen möchte, insbesondere um auf User:Silewe und User:Enzian44 Bedenken einzugehen:
- 1. Der Bot schreibt die Wikipedia-Seite nicht. Das aktuelle Datum wird nicht für menschliche Redakteure bearbeitet.
- 2. Der Bot benachrichtigt die Redakteure nur darüber, dass "ein anderer Geburtstag als in anderen Wikis existiert".
- 3. Weder der Bot noch ich, der Betreiber, wird Vermutungen anstellen, welche Wikipedia korrekt oder besser ist. Wir haben Daten über inkonsistente Geburtstage von deutschen, französischen, englischen, japanischen, chinesischen Wikipedias und mehr. Die Daten in der deutschen Wikipedia sind möglicherweise korrekt und möglicherweise falsch. Die Daten in der englischen Wikipedia sind möglicherweise korrekt und können, genau wie alle anderen, auch falsch sein. Wir gehen nicht davon aus, dass eine bestimmte Wikipedia in einem bestimmten Fall von besserer Qualität ist als eine andere. Wir wenden Botflag an und generieren ähnliche Meldungen in anderen Sprachversionen von Wikipedias, wie Sie m::User:Xinbenlv_bot sehen können, und auf englischen Seiten informiere ich sie auch über Inkonsistenzen. Hier ein Beispiel: Diskussion:Elia_Bastianoni(Sandbox)
- 4. Es ist für jede Person auf Wikipedia durchaus möglich, es gibt verschiedene zuverlässige Quellen, die unterschiedliche Geburtstage unterstützen. Wenn diese Quellen nach Wikipedia: Neutraler_Standpunkt "zuverlässig" sind, müssen diese verschiedenen Geburtstage auf derselben Seite erscheinen und die Verweise auf der Seite hinzugefügt werden.
- 5. Ich stimme mit User:Septembermorgen überein, dass für die Nachrichtenvorlage bessere Anweisungen erforderlich sind, wie Redakteure Inkonsistenzen beheben sollen. Für das How-to-Fix denke ich, dass dies eine DE Community sein sollte, insbesondere ihr Jungs auf Hilfe_Diskussion:Personendaten, um Entscheidungen zu treffen.
- 6. @PerfektesChaos: Ich akzeptiere Ihre Vorschläge zum Aktualisieren der Vorlage, da ich glaube, dass die Vorlage besser in deutscher Sprache sein sollte. Nehmen Sie die Aktualisierungen direkt in meinen Vorlagen auf.
- 7. Antworten Sie auf User: Silewe und User: Enzian44: Bei einer der beiden Testversionen Mihaela_Cârstoi und insbesondere dem RevisionId = 184546339 War der Autor einen Tippfehler in dem Datum, als ich versuchte, Inkonsistenz durch Markieren einer Referenz zu beheben. Dieser Tippfehler, der sich in den Testversuchen befindet, macht die Diskussion über Botflag noch schwieriger. Für diejenigen, die die Datenqualität in Frage stellen, können Sie die Quelldaten [1] und andere Quellen sehen Daten unter diesem Github-Projekt auch.
English(Original)
Hi @Silewe:, @Graphikus:, @Septembermorgen:, @Enzian44:, @MisterSynergy:,
Thank you all for joining the discussion, and your input is all very valuable. First of all, let me again apologize for lacking German speaking skill, otherwise I can better explain the bot to DE community and also take your input easier. I want to thank User:Silewe and User:Enzian44 for in particular help checking the trial edits.
Here are a few points that I want to clarify, in particular, to respond to User:Silewe and User:Enzian44's concerns:
- 1. The bot does not write the Wikipedia page. It will not edit the actual date on behalf of human editors.
- 2. The bot only notify editors that "there exists a different birthday from across different wikis".
- 3. Neither the bot nor me the operator, will make any assumptions which Wikipedia is correct or better. We have data of inconsistent birthdays of German, French, English, Japanese, Chinese Wikipedias, and more. The dates on German Wikipedia might be correct and might be wrong, The dates on English Wikipedia might be correct and might be wrong, same as any others. We don't assume any particular Wikipedia in any specific case is better quality than another. We are applying botflag and generating similar messages on other language version of Wikipedias, as you can see m::User:Xinbenlv_bot, and on English pages, I also notify them the inconsistencies, here are an example: en:User:Xinbenlv_bot/sandbox/Project_Wikiloop/unique_value/Talk:Elia_Bastianoni
- 4. It is completely possible for any person on Wikipedia, there are different reliable sources supporting different birthdays. If these sources are "reliable", according to Wikipedia:Neutraler_Standpunkt, these different birthdays shall all appear on the same page, and the references be added to the page.
- 5. I agree with User:Septembermorgen that the message template needs better instructions on how editors should fix inconsistencies. For the how-to-fix, I think this should be DE community, in particular, you guys on Hilfe_Diskussion:Personendaten to make decisions.
- 6. @PerfektesChaos: I accept your suggestions on how to update the template, since I believe the template should better be in German language directly, feel free to make updates directly on my templates.
- 7. To User:Silewe and User:Enzian44: On one of the two trial edits, Mihaela_Cârstoi, and in particular the RevisionId=184546339, I was the author introducing an typo in the date, when I was trying to fix inconsistency by marking a reference. This typo, happen to be in the trial tests, makes the discussion of botflag even marder. For those of you questioning the data quality, you can take a look at the source data, and you can see other source data under that github project too.
Benutzer:Xinbenlv(en:User:Xinbenlv) 21:00, 26. Feb. 2019 (CET)
Je mehr ich lese, desto mehr frage ich mich, warum das unbedingt auf Artikeldiskussionsseiten platziert werden sollte? Inkonsistenzen könnten auch in einer Wartungsseiten abgelegt werden. So wie ich Xinbenlv verstehe, befinden sich die Daten auf [2]. Diese einfach in Listen (entweder 26 für A-Z oder nach ca. 20 Themenschwerpunkten via Kategorienauswertung, zB: "Sportler", "Künstler" etc.) aufbereiten, so dass daran Interessierte diese abarbeiten können (die Befürchtung Enzian44 bezüglich unsauberer Abarbeitung wäre dann kleiner, da nicht jeder dahergelaufene über solche Listen stolpert und abarbeitet, wenn er nicht gerade daran interessiert ist). Aka und andere machen auch immer wieder solche Listen. Würden wir alles, was wir auf Wartungslisten haben, neu auf Diskussionsseiten platzieren, so hätten wir dort am Ende nur noch Botnachrichten (Tippfehler, fehlende Normdaten, Wikisyntaxfehler, ...). Tote Weblinks ist eine Ausnahme, die aber breit gestützt ist. --Filzstift ✏️ 09:20, 27. Feb. 2019 (CET)
- Deutsche Übersetzung : @Filzstift: Vielen Dank. Der Grund ist, dass wir den Datensatz dort veröffentlicht haben, aber die Leute werden die Arbeit über die Liste oft sehr langweilig finden und wissen daher nicht, wo sie anfangen sollen. Wenn Sie eine Bereinigungsnachricht und eine Kategorie veröffentlichen, können Autoren, die sich für das Thema interessieren, diese Inkonsistenz entdecken und an diesem Einzelfall arbeiten. Für Leute, die gerne an einer Liste arbeiten, können sie einfach die Kategorie öffnen, um alle Seiten zu finden und sie einzeln durchgehen. In der Tat kann es sogar 10 Minuten dauern, eine Inkonsistenz zu lösen, um verlässliche Quellen zu finden und Urteilsaufrufe zu tätigen Benutzer:Xinbenlv(en:User:Xinbenlv) 10:30, 27. Feb. 2019 (CET)
- English original : @Filzstift: Thank you. The reason is that we have posted the dataset out there, but people usually will find work over list very boring and thus don't know where to start. When posting a clean up message plus a category, authors who care about the subject can discover this inconsistency and work on that individual case. For people who do like to work along a list, they can simply open the category to find all pages and go through them one by one. In fact, even solving one inconsistency may take 10min to find reliable sources and make judgement calls Benutzer:Xinbenlv(en:User:Xinbenlv) 10:30, 27. Feb. 2019 (CET)
@Filzstift: Es ist schon äußerst snnvoll, dies auf der Artikeldiskussionsseite direkt beim Artikel anzuordnen.
- Es ist der Anstupser für eine Diskussion unter den Autoren.
- Verschiedene widersprüchliche Quellen müssen hinsichtlich ihrer Zuverlässigkeit eingeschätzt werden; man entscheidet sich schließlich, eines der Daten aus Enzyklopädie, Grabstein, Künstlerlexikon direkt in die Einleitung und die PD zu schreiben und die anderen nebst jeweiliger Belege in einer Endnote zu erwähnen.
- Dieser Diskussionsprozess muss dauerhaft beim Artikel dokumentiert bleiben.
- Du verwechselst das mit Wartungslisten wegen trivialer Syntaxfehler; die werden abgearbeitet, die Syntax korrigiert und der Fall ist erledigt; auch das Update eines Weblinks. Da gibt es inhaltlich nicht viel dauerhaft zu dokumentieren.
- Auf Wartungslisten würde nicht dokumentiert, die werden runtergearbeitet, eindeutig gelöst und gelöscht. Hier gibt es aber oft widersprüchliche und mehrdeutige Angaben, für die wir im Nachhinein höchstens banale Schreibfehler und Zahlendreher aufklären könnten, aber es hatte kein Wikipedianer mit im Kreißsaal gestanden und sich das im Kalender notiert.
- LG --PerfektesChaos 14:13, 27. Feb. 2019 (CET)
- Dem stimme ich zu, außerdem können Diskussionsseiteneinträge zusammen mit einer Wartungskategorie bedarfsgerecht zu Wartungslisten zusammengestellt werden oder mit PetScan ausgewertet werden, sind also sehr flexibel nutzbar. --Septembermorgen (Diskussion) 20:11, 27. Feb. 2019 (CET)
- Ok, den Punkt, dass Diskussionsbedarf bei einzelnen Artikeln gegeben ist, habe ich nicht bedacht. Das ist korrekt. --Filzstift ✏️ 10:23, 28. Feb. 2019 (CET)
- Ich schau mal, ob ich die nächsten Tage so eine Anleitung schreibe. Ist nur die Frage, wo soll sie hin (als Unterseite zu welchem Projekt). Falls es Erfahrungen zu den 50 Testedits gibt, wäre Feedback dazu sehr hilfreich. @Xinbenlv:, I am going to write a manual the next days. --Septembermorgen (Diskussion) 16:06, 1. Mär. 2019 (CET)
- Ok, den Punkt, dass Diskussionsbedarf bei einzelnen Artikeln gegeben ist, habe ich nicht bedacht. Das ist korrekt. --Filzstift ✏️ 10:23, 28. Feb. 2019 (CET)
- Eine zentrale Seite, auf die aus den kurzen Artikldisks verlinkt wird, und deren Inhalte dann zentral weiter diskutiert werden können.
- Landeplatz wäre wahlweise:
- user:Xinbenlv/Geburtstagsproblem – Anleitung
- Wikipedia:WikiProjekt WikiLoop/Geburtstagsproblem – Anleitung
- Problem: Wikipedia:WikiProjekt WikiLoop existiert nicht.
- Soll vielleicht ein international organisiertes Projekt sein, aber das durchschaue ich noch nicht. Ich weiß also nicht, was alles diese Loop jetzt und in Zukunft für Aufgaben haben soll.
- fr:user:Xinbenlv/sandbox/Project Wikiloop soll es geben, gibt es aber auch als Sandkiste nicht.
- fr:Utilisateur:Xinbenlv/sandbox/Project Wikiloop/unique value/Discussion:undefined wäre vorhanden.
- en:Wikipedia:Project Wikiloop existiert nicht.
- en:User:Xinbenlv bot/sandbox/Project Wikiloop/unique value/Talk:Justin Keenan wäre da.
- Die globale Seitenorganisation scheint mir wie auch die Vorlagenprogrammierung unausgereift.
- @Septembermorgen: Du solltest demzufolge besser im BNR verbleiben; dass hier ein global einheitliches WikiProjekt entstehen würde, sehe ich einstweilen nicht, und falls doch irgendwann, dann kann das immer noch trivial aus dem BNR in ein etabliertes ausgereiftes Projekt verschoben werden.
- BNR ist unabhängig von Community-Regeln und kann leicht global einheitlich gestaltet werden; zu funktionierenden WikiProjekten hat jede Community eigene Spielregeln.
- LG --PerfektesChaos 17:08, 1. Mär. 2019 (CET)
@Xinbenlv:, I've made some revisions in Benutzer:Xinbenlv bot/msg/inconsistent birthday and created the maintenance-categories Kategorie:Wikipedia:Wartungskategorie-Artikelwartung/Inkonsistente Geburtsdaten, /Inkonsistente Geburtsdaten/Fixed and /Inkonsistente Geburtsdaten/Validated. Could you please also include the empty parameters | status =
and | by = <Benutzername>
into your bot message? DE: Ich habe einige Überarbeitungen in Benutzer:Xinbenlv bot/msg/inconsistent birthday durchgeführt und die Wartungskategorien Kategorie:Wikipedia:Wartungskategorie-Artikelwartung/Inkonsistente Geburtsdaten , /Inkonsistente Geburtsdaten/Fixed and /Inkonsistente Geburtsdaten/Validated angelegt. Könntest Du bitte die leeren Parameter | status =
and | by = <Benutzername>
in die Botnachricht mit aufnehmen? --Septembermorgen (Diskussion) 12:28, 16. Mär. 2019 (CET)
- @Septembermorgen:, Sure. I can do that. Thank you! // Sicher. Ich kann das machen. Vielen Dank Benutzer:Xinbenlv(en:User:Xinbenlv) 08:15, 17. Mär. 2019 (CET)
- @Septembermorgen:: can you take a look if what I did is what you ask for? // Können Sie einen Blick darauf werfen, ob ich gefragt habe, was ich getan habe? Benutzer:Xinbenlv(en:User:Xinbenlv) 20:41, 18. Mär. 2019 (CET)
Xinbenlv's response to Hilfe_Diskussion:Personendaten second batch of comments // Xinbenlvs Antwort auf Hilfe_Diskussion: Personendaten zweiten Kommentarstapel[Quelltext bearbeiten]
@PerfektesChaos:, @Septembermorgen:, @Silewe:, @Enzian44:, @Graphikus:, @MisterSynergy:.
EN Dear DE editors on Hilfe_Diskussion:Personendaten, thank you all for your advice. According to your comments, I update the template for the message. In particular, I add feature to make it easier to mark "Fixed" or "Validated". It makes it more obvious of "What should be fixed", and "What should be kept". Can anyone help check if it looks better now?
Regarding @PerfektesChaos:'s comment about the Wikipedia:WikiProjekt WikiLoop. We want to keep it separate from the bot application, since the definition of a Wiki Project of WikiLoop is currently still unclear and under discussion. We kindly ask the editors here at Hilfe_Diskussion: Personendaten to focus on discussing the Talk page notifications of conflicting birthday: We want to kindly ask you to consider a question: do you think whether or not having a notification for inconsistent birthday will help editors fix Wikipedia pages about people?
Xinbenlv bot (Diskussion) 23:54, 11. Mär. 2019 (CET)
DE Liebe DE-Redakteure zu Hilfe_Diskussion: Personendaten, vielen Dank für Ihre Ratschläge. Entsprechend Ihren Kommentaren aktualisiere ich die Vorlage für die Nachricht. Insbesondere füge ich eine Funktion hinzu, um das Markieren von "Fixed" oder "Validated" zu erleichtern. Es macht es deutlicher, "Was soll behoben werden" und "Was sollte aufbewahrt werden".
Zu @PerfektesChaos: 's Kommentar zu Wikipedia: WikiProjekt WikiLoop. Wir möchten es von der Bot-Anwendung getrennt halten, da die Definition eines Wiki-Projekts von WikiLoop derzeit noch unklar ist und derzeit diskutiert wird. Wir bitten die Redaktionen hier bei Hilfe_Diskussion: Personendaten, sich auf die Diskussion der Benachrichtigungen auf der Diskussionsseite zu widersprüchlichen Geburtstagen zu konzentrieren Hilfe-Redakteure korrigieren Wikipedia-Seiten über Personen?
Xinbenlv bot (Diskussion) 23:54, 11. Mär. 2019 (CET)
- @PerfektesChaos:, @Septembermorgen:, @Silewe:, @Enzian44:, @Graphikus:, @MisterSynergy:, und Freunde
- EN Can you see you still have any other concerns? if there is none, I will resume my bot application. Benutzer:Xinbenlv(en:User:Xinbenlv) 03:18, 20. Mär. 2019 (CET)
- DE Sehen Sie noch andere Bedenken? Wenn es keine gibt, werde ich meine Bot-Anwendung fortsetzen. Benutzer:Xinbenlv(en:User:Xinbenlv) 03:18, 20. Mär. 2019 (CET)
- @PerfektesChaos:, @Septembermorgen:, @Silewe:, @Enzian44:, @Graphikus:, @MisterSynergy:, und Freunde
- Ich bitte Sie um Aufmerksamkeit, dass ich immer noch auf Feedback oder Kommentare warte. Wenn Sie der Meinung sind, dass ich bereits alle Ihre Fragen beantwortet habe, lassen Sie es mich bitte wissen. Vielen Dank! Benutzer:Xinbenlv(en:User:Xinbenlv) 21:43, 26. Mär. 2019 (CET)
- I'd like to kindly ask for attention that I am still waiting for feedback or comments. If you think I already answer alled the questions you have, please kindly let me know as well. Thank you! Benutzer:Xinbenlv(en:User:Xinbenlv) 21:43, 26. Mär. 2019 (CET)
- I think everything's ok now. Just one thing left: Editlimitnumber should be set to a maximum of six Edits per minute (which was more during the test phase). But everything else is ok, in my opinion. We should proceed and finalize the discussion on Wikipedia:Bots/Anträge_auf_Botflag#Diskussion_Xinbenlv_bot. --Septembermorgen (Diskussion) 22:36, 26. Mär. 2019 (CET)
HTML-kodierte Zeichen in ALTERNATIVNAMEN[Quelltext bearbeiten]
Im Parameter ALTERNATIVNAME finde ich so einige HTML-Zeichen wie ‌ und die werden nicht gar so toll ausgewertet. Aktuell sieht das dann wie bei Ali Chameini oder Maithripala Sirisena aus. Arabische Zeichen, gefolgt von &zwnj. Der Strichpunkt am Ende ist der Trenner zwischen verschiedenen alternativen Namen.
Für das Tool kann ich das fixen.
Aber wie ich das verstehe, soll der Block Personendaten ja auch für Dritte auswertbar sein und ein Strichpunkt findet sich nur in einem Beispiel beim Datum. Dieses ‌ rauszunehmen ist nicht so toll, da kommt die Darstellung im Browser durcheinander, siehe Spezial:Diff/225246845 und da den Teil علی; der ist nämlich in der Anzeige (und nur dort) verschoben weil hier die Schreibrichtung von rechts nach links den Strichpunkt umfasst.
In jedem Fall (HTML-Kodierung erlaubt bzw. verboten) sollte das auf der Vorderseite dokumentiert sein. --Wurgl (Diskussion) 09:02, 11. Aug. 2022 (CEST)ET)
Migration nach Wikidata[Quelltext bearbeiten]
Hallo allerseits, ich habe ein bisschen rumgesucht, und nur recht dürftige Diskussionen zu einer Migration der PD-Daten nach Wikidata gefunden, v.a. diese Zusammenstellung von @Griot:. Ich bin wahrlich nie ein großer Freund von reinem Datensammeln gewesen und habe mich in der Wikipedia immer mit dem Verfassen von Texten befasst. Aber selbst mir will einfach nicht einleuchten, warum wir derart hervorragend strukturierte und kuratierte Daten wie die Personendaten der de.wikipedaia nicht auf Wikidata migrieren und dort weiterpflegen. Da ich mittlerweile auch auf Wikidata recht aktiv bin und dort die Daten zu antiken Personen und Orten pflege, fällt mir immer wieder auf, dass die Wikidata-Items sehr von den de-Personendaten profitieren würden. Umgekehrt macht es einfach Sinn, Daten wie die Personendaten auf der dafür vorgesehenen und auch am meisten geeigneten internationalen Plattform unterzubringen. Da ich kein Techniker bin, kann ich selbst hier leider nicht viel ausrichten. Gerne will ich aber noch einmal die Diskussion dazu in Gang bringen. @JakobVoss:, @Stefan Kühn: @Tomukas:. Viele Grüße, --Tolanor 01:53, 16. Dez. 2022 (CET)
- @Tolanor: Ich bin kein Fan von langen Diskussionen, weshalb ich mich da immer sehr zurückhalte. Doch bei dem Thema stimme ich dir voll zu. Ja bitte lasst uns die Personendaten komplett nach Wikidata migrieren. Vom Prinzip her können wir die Daten der Vorlage:Personendaten per Skript auslesen und mit z.B. QuickStatements nach Wikidata transferieren. Danach kann die Vorlage in den deutschen Artikeln entfernt werden. Vielleicht hat ja jemand genug Zeit ein Bot zu schreiben. Oder eine Webseite, so das viele Wikipedianer am Transfer mitarbeiten können. @APPER @Wurgl: Ihr betreibt ja die Personensuche. Was haltet ihr davon? --sk (Diskussion) 06:03, 16. Dez. 2022 (CET)
- Das ist eine nur mäßig gute Idee, weil Wikidata weiterhin große Qualitätsprobleme hat, auch wenn es in den letzten Jahren besser geworden ist. Der Import kann schon gemacht werden (vorbehaltlich urheberrechtlicher Probleme), aber würde auf Wikidata auch erhebliches Nacharbeiten erfordern, weil man im Idealfall ja widersprüchliche Angaben im Detail anschauen und mit entsprechenden Rängen versehen sollte. Und dann sollte man natürlich auf Wikipedia ggf. auch nacharbeiten, manchmal sind die Daten ja auch dort falsch. Und manchmal sind sie auf Wikipedia und Wikidata jeweils anders falsch. Ich sehe dafür aktuell nicht die erforderliche Nutzerbasis, um das so zu gestalten, dass nicht im Endeffekt mehr Datensalat herauskommt als vorher.--emu (Diskussion) 10:24, 16. Dez. 2022 (CET)
- Es macht aber heute keinen Sinn mehr die Personendaten in der Vorlage:Personendaten hier in der dewiki alleine zu pflegen, und redundant werden die gleichen Daten in Wikidata gepflegt. Zumal dort eben auch noch zusätzlich anderssprachigen Nutzern bei der Pflege mit helfen. Das Wikidata evt. Qualitätsprobleme hat, ist für die Migration doch nicht relevant, da ja unsere "guten" deutschen Daten komplett in Wikidata reinkommen. Die Problematik der wiedersprüchlichen Angaben ist ja dann auch gut, weil man dann global in Wikidata an deren Bereinigung arbeiten kann. Was die rechtliche Geschichte angeht, sehe ich da kein Problem, weil die Personendaten aus meiner Sicht nur eine Fakteninformation ist. Einzig bei der Kurzbeschreibung könnte man ein Problem sehen wollen. Aus meiner Sicht spricht alles für eine Migration nach Wikidata. Schon um alleine diese redundatnte Datenhaltung aufzuheben und unsere Kräfte zu bündeln. --sk (Diskussion) 11:27, 16. Dez. 2022 (CET)
- Ich finde das grundsätzlich eine top Idee. Alleine die Beschreibungen sind z.B. so eine Sache, die die Nutzbarkeit der WD-Items wirklich boosten würde. Aber auch die redundante Bearbeitungen auf beiden Seiten macht tatsächlich wenig Sinn. Wikidata wäre der geeignete Ort, um dort Konflikte, unterschiedliche Angaben, Quellen, etc. zu beherbegen und langfristig zu verbessern. Du bist allerdings nicht der erste, der die Idee hat. Auch bei Wikidata gab es anscheinend Diskussionen zum Thema: Es gab zwei Anfragen/Diskussionen (hier & hier) zur Migration bestimmter Parameter des Templates. @Pyfisch:, vielleicht kannst du uns sagen, ob/wie das in der Folge weitergegangen ist? Trotz der Entwicklung von Wikidata scheint die Nutzung des Templates in den letzten Jahren (seit der genannten Diskussionen) weiter gestiegen zu sein: Aktuell sind dort >920K Nutzungen verbucht.--Tomukas (Diskussion) 11:40, 16. Dez. 2022 (CET)
- @Tomukas: Inzwischen sind die meisten Personendaten in Wikidata enthalten, viele verschiedene Benutzer haben Daten aus den Normdateien und den Wikipedia-Sprachversionen mit Bots nach Wikidata kopiert. Leider sind die Quellenangaben nicht immer vollständig oder korrekt. Bevor die Personendaten aus der deutschen Wikipedia entfernt werden ist es auf jeden Fall interessant die Daten abzugleichen und alle Einträge zu überprüfen, wo die Daten nicht übereinstimmen. --Pyfisch (Diskussion) 21:38, 23. Dez. 2022 (CET)
- Ich finde das grundsätzlich eine top Idee. Alleine die Beschreibungen sind z.B. so eine Sache, die die Nutzbarkeit der WD-Items wirklich boosten würde. Aber auch die redundante Bearbeitungen auf beiden Seiten macht tatsächlich wenig Sinn. Wikidata wäre der geeignete Ort, um dort Konflikte, unterschiedliche Angaben, Quellen, etc. zu beherbegen und langfristig zu verbessern. Du bist allerdings nicht der erste, der die Idee hat. Auch bei Wikidata gab es anscheinend Diskussionen zum Thema: Es gab zwei Anfragen/Diskussionen (hier & hier) zur Migration bestimmter Parameter des Templates. @Pyfisch:, vielleicht kannst du uns sagen, ob/wie das in der Folge weitergegangen ist? Trotz der Entwicklung von Wikidata scheint die Nutzung des Templates in den letzten Jahren (seit der genannten Diskussionen) weiter gestiegen zu sein: Aktuell sind dort >920K Nutzungen verbucht.--Tomukas (Diskussion) 11:40, 16. Dez. 2022 (CET)
- Wie immer in diesen Diskussionen ist man offenbar Argumenten von Leuten, die sich sowohl auf Wikidata als auch auf Wikipedia auskennen und in dem Bereich seit Jahren tätig sind, nicht zugänglich, das Motto lautet „Ich habe eine tolle Idee, wie schwer können die Details sein?!“ Es fällt schwer, da nicht in Zynismus zu verfallen. CC Benutzer:Kolja21, Benutzer:Wurgl. --emu (Diskussion) 12:17, 16. Dez. 2022 (CET)
- @Emu: Es ist egal von wem die Idee wieder mal in den Ring geworfen wird. Ich kenne in Wikipedia und Wikidata und bei den Personendaten sehr gut aus. Ja es ist eine anspruchsvolle Aufgabe, aber es wird nicht besser wenn wir es erst in 10 oder 20 Jahren angehen. Es muss gemacht werden. --sk (Diskussion) 12:57, 16. Dez. 2022 (CET)
- Es macht aber heute keinen Sinn mehr die Personendaten in der Vorlage:Personendaten hier in der dewiki alleine zu pflegen, und redundant werden die gleichen Daten in Wikidata gepflegt. Zumal dort eben auch noch zusätzlich anderssprachigen Nutzern bei der Pflege mit helfen. Das Wikidata evt. Qualitätsprobleme hat, ist für die Migration doch nicht relevant, da ja unsere "guten" deutschen Daten komplett in Wikidata reinkommen. Die Problematik der wiedersprüchlichen Angaben ist ja dann auch gut, weil man dann global in Wikidata an deren Bereinigung arbeiten kann. Was die rechtliche Geschichte angeht, sehe ich da kein Problem, weil die Personendaten aus meiner Sicht nur eine Fakteninformation ist. Einzig bei der Kurzbeschreibung könnte man ein Problem sehen wollen. Aus meiner Sicht spricht alles für eine Migration nach Wikidata. Schon um alleine diese redundatnte Datenhaltung aufzuheben und unsere Kräfte zu bündeln. --sk (Diskussion) 11:27, 16. Dez. 2022 (CET)
- Es ist komplexer! Weit komplexer! Es gibt so einige Artikel (speziell zu Herrschern der letzten Jahrhunderte) widersprüchliche Angaben aus verschiedenen Quellen. Das wirkt sich dann hier in deWP so aus, dass im Artikel zur Person Quelle A mit den Lebensdaten A' bevorzugt wird und im Übersichtsartikel zur entsprechenden Familie Quelle B mit Lebensdaten B' verwendet wird. Ein Abgleich ist nicht möglich, weil die beiden Artikel von unterschiedlichen Hauptautoren geschrieben sind und beide ihrer eigenen Quelle mehr vertrauen als der anderen, wobei beides renommierte Quellen sind.
- Und dann ist der Punkt mit den ungefähren Angaben. Fängt an mit Geburts- und Sterbeorten die hier in deWP auf eine BKS verlinken, siehe Kategorie:Wikipedia:Geburts- oder Sterbeort unbekannt oder mit Geburtsdatum wie "25. Februar 1992 oder 2. Mai 1992 oder 25. September 1992" bei z.B. Abby Ghent?
- Auf die Schnelle fällt mir noch die unterschiedliche Transkription ein, die z.B. Geburtsorte oder Alternativnamen betrifft.
- Klar bei 800.000 der aktuell 881.629 Artikel gibts kein Problem, aber für die 80.000 muss Zeit aufgewendet werden, die hat aber niemand hier. --Wurgl (Diskussion) 12:33, 16. Dez. 2022 (CET)
- @Wurgl: Melde mich hier freiwillig für die 80.000 Problemfälle, zum abarbeiten. Gerne natürlich mit Unterstützung anderer Wikipedianer und gerne auch mit Tool-Unterstützung, die diese Aufgabe koordiniert oder irgendwie vereinfacht. --sk (Diskussion) 12:58, 16. Dez. 2022 (CET)
- Und du streitest dich dann mit engl. Usern um ein Geburtsdatum weil die engl. Quellen ein anderes Jahr angeben als die deutschen Quellen? Viel Spaß!
- Der große Vorteil von redundanten Daten liegt darin, dass man diese vergleichen kann und dadurch Fehler schneller entdeckt. Jüngstes Beispiel ist https://www.wikidata.org/w/index.php?title=Q2888773&action=history Der Kollege wurde um 25 Jahre gealtert, entdeckt durch Abgleich der Personendaten mit der Infobox (die ihre Daten aus Wikidata bezieht). Solch eine Änderung bliebe über Monate, wenn nicht Jahre unentdeckt. --Wurgl (Diskussion) 13:16, 16. Dez. 2022 (CET)
- @Wurgl: Wieso soll man sich da streiten? Jeder kann in Wikidata eine weiteres Geburtsdatum mit einer zweiten Quelle angeben. Von mir aus auch "Quelle: Importiert aus deutschsprachiger Wikipedia". Wenn dann klar ist das eines der Daten falsch ist, kann dieses gelöscht werden, aber ansonsten sind sie erstmal problemlos nach Wikidata übertragbar. Wer mithelfen möchte kann ja in der PD Wartung (ID 272,274,275) die Problemfälle abarbeiten. --sk (Diskussion) 14:43, 16. Dez. 2022 (CET)
- Sehr lobenswert. Das kann man natürlich freilich schon jetzt machen, also an die Arbeit! --emu (Diskussion) 14:07, 16. Dez. 2022 (CET)
- @Wurgl: Melde mich hier freiwillig für die 80.000 Problemfälle, zum abarbeiten. Gerne natürlich mit Unterstützung anderer Wikipedianer und gerne auch mit Tool-Unterstützung, die diese Aufgabe koordiniert oder irgendwie vereinfacht. --sk (Diskussion) 12:58, 16. Dez. 2022 (CET)
- Das ist eine nur mäßig gute Idee, weil Wikidata weiterhin große Qualitätsprobleme hat, auch wenn es in den letzten Jahren besser geworden ist. Der Import kann schon gemacht werden (vorbehaltlich urheberrechtlicher Probleme), aber würde auf Wikidata auch erhebliches Nacharbeiten erfordern, weil man im Idealfall ja widersprüchliche Angaben im Detail anschauen und mit entsprechenden Rängen versehen sollte. Und dann sollte man natürlich auf Wikipedia ggf. auch nacharbeiten, manchmal sind die Daten ja auch dort falsch. Und manchmal sind sie auf Wikipedia und Wikidata jeweils anders falsch. Ich sehe dafür aktuell nicht die erforderliche Nutzerbasis, um das so zu gestalten, dass nicht im Endeffekt mehr Datensalat herauskommt als vorher.--emu (Diskussion) 10:24, 16. Dez. 2022 (CET)
@Emu: Eine kurze Bemerkung hierzu. Ich bin seit 17 Jahren bei Wikipedia dabei mit fast 30.000 Bearbeitungen und seit etwa 3 Jahren auf Wikidata mit über 14.000 Bearbeitungen. Ich kenne mich also auf beiden Projekten aus. Dasselbe gilt für die anderen Befürworter der Migration. Du kannst Dir solche ad-personam-„Argumente“ also gerne sparen.
Zu den anderen vorgebrachten Argumenten:
- Die Datenqualität auf Wikidata sei schlecht. Angenommen, das stimmt so (m.E.: teilweise ja, teilweise nein, wie so oft): Das ist in keiner Weise ein Argument, die Personendaten nicht nach WD zu migrieren. Im Gegenteil muss die Datenqualität dort eben weiter verbessert werden, und genau deshalb sollten die PD migriert werden. Auf WD stört es mich gehörig, dass viele Daten auf de.wp vorgehalten sind, aber noch nicht auf Wikidata. Das gilt nicht nur für die PD, sondern auch für Wikipedia:Normdaten.
- Aufwand. Ihr habt recht, dass es einiges an Aufwand erfordern würde, v.a., um strittige Fälle zu klären. Dafür müsste es eine Infrastruktur mit Wartungslisten geben, die wir m.E. hier entwerfen können. Hierzu gerne Input.
- Mangelndes Personal. Dieses Argument will mir insofern nicht einleuchten, als es sowohl hier (de.wp) zahlreiche Nutzer gibt, die die PD pflegen, als auch auf Wikidata noch hunderte mehr. D.h. es gäbe genug Nutzer, die diese Arbeit bereits machen, und die man nur auf eine gemeinsame Infrastruktur lenken müsste.
Viele Grüße, --Tolanor 18:12, 16. Dez. 2022 (CET)
- Aber dann macht es doch: Importiert die Daten auf Wikidata (unter Berücksichtigung der dortigen Regularien), entwickelt die Infrastruktur mit Wartelisten und arbeitet die strittigen Fälle auf. Niemand hindert euch daran, im Gegenteil, ich helfe bei der Aufarbeitung gerne mit. Wenn das alles erledigt ist, wird wohl niemand ernsthaft dagegen sein, die Personendaten (und die Normdaten und überhaupt gar manche andere Vorlage) einzustampfen. Bisher sehe ich viel „müsste“ und „gäbe“ und noch einmal „müsste“, Hauptsache, man löscht die Daten auf Wikipedia. --emu (Diskussion) 18:42, 16. Dez. 2022 (CET)
- Danke, das wollte ich doch nur hören ;-). Es geht weder mir noch irgendwem anders (so weit ich es beurteilen kann) darum, die Daten zuerst auf Wikipedia zu löschen. Selbstverständlich muss erst sichergestellt sein, dass die Daten korrekt nach Wikidata migriert sind. Also: Who's up? --Tolanor 19:13, 16. Dez. 2022 (CET)
- Moin zusammen, Moin Tolanor, die Idee ist gut und auch bestimmt zukunftsträchtig, allerdings sehe ich genau wie einige Andere, dass es gut vorbereitet sein will. Vllt. kannst du ja mal eine kleine Liste machen, was zu machen, zu organisieren ist. Am Ende denke ich, sollte man gut vorbereitet sein und muss auch andere Benutzer hier abholen, wie man weiter machen möchte etc. Also soetwas wie:
- Daten-Overview bzw. Valitätscheck
- Daten nach Wikidata migrieren
- Wartungslisten erstellen und abarbeiten
- Langfristig die Hilfeseiten umbauen/erweitern
- usw.
- Am Besten alles mal mit etwas Leben füllen und dann denke ich auch, dass sich noch Leute finden werden, dass mit zu begleiten. mfg --Crazy1880 20:35, 17. Dez. 2022 (CET)
- Genau! Von der Technik verstehe ich nix, aber wenn man die Doppelpflege (Wikidat/PD) damit aus der Welt schaffen kann, bin ich für "Kärrnerarbeiten" gerne dabei. Gruß --dä onkäl us kölle (Diskussion) 21:07, 17. Dez. 2022 (CET)
- Moin zusammen, Moin Tolanor, die Idee ist gut und auch bestimmt zukunftsträchtig, allerdings sehe ich genau wie einige Andere, dass es gut vorbereitet sein will. Vllt. kannst du ja mal eine kleine Liste machen, was zu machen, zu organisieren ist. Am Ende denke ich, sollte man gut vorbereitet sein und muss auch andere Benutzer hier abholen, wie man weiter machen möchte etc. Also soetwas wie:
- Danke, das wollte ich doch nur hören ;-). Es geht weder mir noch irgendwem anders (so weit ich es beurteilen kann) darum, die Daten zuerst auf Wikipedia zu löschen. Selbstverständlich muss erst sichergestellt sein, dass die Daten korrekt nach Wikidata migriert sind. Also: Who's up? --Tolanor 19:13, 16. Dez. 2022 (CET)
Einschub von PerfektesChaos[Quelltext bearbeiten]
Ich schreib mich jetzt mal dreist hier zwischen, weil diese Diskussion völlig und vielfach zerfleddert ist und unten abdriftet.
Das Problem ist, dass unsere Daten von Menschen gepflegt werden, und über die Eintragungen auf Wikidata regelmäßig gnadenlose Bots drüberlaufen, die Hunderttausende von Einträgen rücksichtslos mit dem überschreiben, was sie in irgendeiner externen Datenbank gefunden haben.
- Heißt: Einmal auf Wikidata eine falsche Information korrigiert, drei Wochen später steht sie wieder falsch da, wieder korrigiert, fünf Wochen drauf wieder falsch.
- Hatten wir schon x-mal durchgekaut.
- Was wir gern machen können, ist ein Abgleich ob bei uns identisch mit dort. Meist sind wir richtig, korrigieren dort, ein Weilchen später hat ein enthirntes Wikidata-Wesen es wieder auf falsch revertiert.
- Kennen wir schon seit Jahren, hat noch nie funktioniert. Vorschlag ist keine Verbesserung, sondern ein Totalschaden.
- Schon allein die immens vielen unsicheren Geburtsdaten, widersprüchliche Angaben, unklare Informationen; dazu merkwürdige Ortschaften als Geburtsorte, Eingemeindungen, Schlösser und Burgen. In der Wikidata-Vorstellungswelt hat alles seit Jahrtausenden eine Postleitzahl und einen Q-Item und einen eindeutigen standesamtlich dokumentierten Geburtstag. Wikidata-Items waren in der schlichten Vorstellungswelt ihrer Konzeption technische Objekte, die nach Kilogramm, Zentimetern, Registriernummern, Geokoordinaten, dokumentierten Zeitpunkten exakt erfassbar waren. Bei allen unsicheren, ungenauen, historisch lückenhaften Informationen, von kulturellen, politischen, historischen, sozialen, religiösen, künstlerischen Sichtweisen abhängigen Angelegenheiten versagt Wikidata regelmäßig jämmerlich. Und es gab kein globales Standesamt über die letzten 5000 Jahre, das jeden Menschen dokumentiert und mit einer Sozialversicherungsnummer und Geburtsort und Geburts- und Todestag rregisitriert hatte.
- Der mit Eröffnung dieses Abschnitts bejammerte große Personalaufwand ist exakt der Unterschied zwischen uns und Wikidata: Unsere Personendaten werden durch Fachpersonal recherchiert, Unstimmigkeiten und häufig mal widersprüchliche Angaben in den Belegen aufgeklärt, und mit Sichterrechten das Ergebnis dauerhaft hinterlegt. In Wikidata schreiben inkompetente Bots und Zigtausende Anonyme stumpf ab, was in irgendeiner wilden Website, fremden Wikis aller Macharten und Regierungspropaganda steht.
- Wenn wir unsere seit bald zwei Jahrzehnten blitzsauber polierten PD nach Wikidata schreiben und anschließend bei uns löschen oder uns nicht mehr darum kümmern, dann sind sie nach ein paar Monaten oder spätestens Jahren von den Wikidata-Bots geschreddert worden und der gleiche unzuverlässige Datenmüll wie sonst auch; erfüllt jedenfalls als fremdes frei editierbares Wiki nicht mehr unsere enzyklopädischen Ansprüche.
- „macht es einfach Sinn, Daten wie die Personendaten auf der dafür vorgesehenen und auch am meisten geeigneten internationalen Plattform“ – diese Aussage ist aus erwähnten Gründen blanker Hohn und schlicht unzutreffend.
- Wir haben ein in fast zwei Jahrzehnten mühsam aufgebautes und sehr fehlerarmes System, und das sollen wir vernichten zugunsten eines Systems, das in intransparenter Weise von irgendwelchen Datenbank-Bots und unauffindbaren Vandalen vermüllt wird und dass es in einem Jahrzehnt nicht auf die Kette bekommen hat, nachvollziehbare Konzepte zur Datenqualität und zur Vandalismusbekämpfung zu entwickeln, und bekanntermaßen von unentdeckten Fehlern nur so strotzt?
- „Migration“ gemäß Abschnittsüberschrift bedeutet: „Hierzuwiki löschen.“
- Es bedarf eines MB, um die Arbeit von Jahrzehnten aus einer Dreiviertelmillion Artikel zu eliminieren.
- Hiesige Disk deshalb ersichtlich nicht zielführend; MB-Pro und MB-Contra erarbeiten und nicht wieder so absolut einseitig und sinnverdrehend wie die Zusammenfassung der Umfrage neulich.
- Aber für Google-Auskünfte ist Wikidata gut genug.
Wikidata hat einen Vorteil: Es beschreibt die Größe des Staatsgebiets der russischen Föderation zeitnah gemäß Beleg aus russischer Statistikbehörde und verbucht jede Okkupation schnellstmöglich.
- Und das wird dann unhinterfragt in fast allen Wikipedien des Planeten automatisch als enzyklopädische Wahrheit angezeigt.
- Nur bei uns nicht. Warum wohl?
- Unsere lokalen Daten sind die glaubwürdige Referenzinformation, und bedürfen der Sichterrechte. Wikidata darf jeder Internetbenutzer des Universums und jeder Bot mit jedem Mist überschreiben. Einschließlich russischer Desinformationsexperten.
VG --PerfektesChaos 21:22, 19. Dez. 2022 (CET)
- @PerfektesChaos: Danke für die furiose Zusammenfassung der Qualitätsprobleme auf Wikidata. Im Grunde diskutieren wir hier das gleiche Problem wie bei der Vorlage:Normdaten, wo sich die Doppelarbeit bewährt hat. Auch die Vorlage:BibISBN hätte längst ersetzt werden können, wenn Wikidata saubere Datensätze anbieten würde. Technisch ist die Datenbank den Wikipedia-Vorlagen um Längen überlegen. --Kolja21 (Diskussion) 22:10, 19. Dez. 2022 (CET)
- Bei wohlwollender Interpretation des Unterfangens wollen die aktuellen Proponenten das Qualitätsniveau auf Wikidata durch diverse Importe und Abgleiche auf ein solches Niveau heben, das dann auch Kritische vom Ende der doppelten Datenhaltung überzeugen soll. Ich bin ziemlich skeptisch, aber selbst wenn das Projekt scheitert, wird es hoffentlich zu einer Qualitätsverbesserung auf beiden Projekten beitragen. Die ersten Mühen der Ebene zeigen sich ja schon am unteren Ende der Diskussion.
- Zwei kleine Bemerkungen:
- Die Erfassung von zweifelhaften oder geschätzten Daten ist technisch auch auf Wikidata möglich. Daran soll es nun wirklich nicht scheitern.
- Das mit den Leuten, die Informationen aus „irgendeiner wilden Website, fremden Wikis aller Macharten und Regierungspropaganda“ importieren, haben wir auf Wikipedia natürlich auch. Ohne jetzt mit dem Finger auf andere zu zeigen, aber was in den Biographien teilweise für abenteuerliche Behauptungen aufgestellt werden (die ich dann teilweise im Abgleich mit Wikidata aufspüre und korrigiere), ist erstaunlich. Die sind dann halt teilweise aus Wikipediasicht seriös bequellt, weil irgendein Sonderling vor hundert Jahren seine Privatoffenbarungen in ein Lexikon geschrieben und einen Verlag dafür gefunden hat.
- --emu (Diskussion) 23:18, 19. Dez. 2022 (CET)
- Gerade eben wieder so ein schönes Beispiel für einen überaus schlauen Bot: IdeRef 028808789 war als "missbilligt" eingetragen, was den Bot nicht davon abhält den selben Eintrag nochmals reinzumüllen, danke Kolja21 für den Hinweis. Ich mag solche Bots ganz besonders. --Wurgl (Diskussion) 13:08, 20. Dez. 2022 (CET)
- Und das ist leider noch ein harmloses Beispiel. Gravierender sind die falschen Lebensdaten, bei denen VIAF als Quelle angegeben ist: d:Q16198105#P569. Das zeigt zum einen das fehlende Verständnis dafür, was eine zitierfährige Quelle ist (VIAF ist eine Sammlung; die zitierfähige Quelle ist der jeweilige Normdatensatz), und zum anderen die freie Interpretation von Daten. Aus der Angabe "geb. 19. Jahrhundert" extrahiert der Bot das Geburtsjahr 1850. Der Fehler ist bekannt und wurde dem Botbetreiber gemeldet, aber die falschen Lebensdaten stehen bis heute in Wikidata. PS: Wie viele Personen die Lebensdaten 1850-1950 haben, müsste über diese Abfrage zu erfahren sein. Im Moment erhalte ich aber nur die Meldung: "Zeitüberschreitungsgrenze erreicht". Schwieriger ist es, die Personen herauszufiltern, bei denen fälschlich das Geburtsjahr 1950 angegeben ist. --Kolja21 (Diskussion) 13:58, 20. Dez. 2022 (CET)
- Gerade eben wieder so ein schönes Beispiel für einen überaus schlauen Bot: IdeRef 028808789 war als "missbilligt" eingetragen, was den Bot nicht davon abhält den selben Eintrag nochmals reinzumüllen, danke Kolja21 für den Hinweis. Ich mag solche Bots ganz besonders. --Wurgl (Diskussion) 13:08, 20. Dez. 2022 (CET)
@PerfektesChaos: Offen gesagt empfinde ich Deinen Einwurf als ziemlich respektlos. Auf Wikidata sind tausende Menschen unterwegs, die beständig daran arbeiten, die Datenqualität dort zu verbessern. Ich zum Beispiel bin ausgebildeter Historiker, habe in der Wikipedia schon exzellente und lesenswerte Artikel geschrieben. Es geht mir null darum, Geschichte in vorgefertigte Schablonen zu verpacken, sondern einfach darum, ein für viele Zwecke verwendbares, qualitativ hochwertiges Datengerüst zu schaffen, das auch wissenschaftlich genutzt werden kann. Ähnliches gilt für viele andere Wikidata-Bearbeiter. Dein Text hört sich aber so an, als wären wir alle Vollidioten. Was glaubst Du denn, was wir da tun, wenn nicht uns beständig darüber Gedanken zu machen, wie man Daten besser abbilden kann?
Zu den vorgebrachten Argumenten, soweit vorhanden:
- Ja, es gibt Bots auf Wikidata. Das ist bei sehr vielen Daten auch sinnvoll, und übrigens gibt es die auch auf WP. In Einzelfällen mag es passieren, dass solche Bots falsche Edits vornehmen. Insgesamt gibt es aber natürlich auch hier eine Qualitätskontrolle. Nicht jeder bekommt einfach so ein Botflag, man muss sich als verantwortungsbewusster Benutzer bewiesen haben und braucht die Zustimmung der Community. Vgl. d:Wikidata:Bots. Dein Szenario zum Ukrainekrieg entbehrt insofern jeder Grundlage.
- Menschen vs. Bots. Puh, wo soll man da anfangen? 1. sind auf Wikidata ebenfalls Menschen tätig. 2. Geht es doch gerade darum, dass es noch mehr werden - etwa indem die PD-Bearbeiter ihre Expertise auch dort einbringen.
- Ich stimme zu, dass es vermutlich eines MBs bedarf, die Personendaten zu löschen. So oder so muss aber der erste Schritt sein, die Daten vollständig zu übertragen. Das ist schwierig genug. Erst wenn das geschafft ist, können wir überhaupt darüber diskutieren, ob die PD noch weiterhin sinnvoll sind.
Insgesamt erinnert mich Dein Beitrag leider sehr an unqualifizierte Aussagen, die man in den 2000er und 2010er Jahren häufig aus der Wissenschaft über die Wikipedia gehört hat. "Kann nichts werden", "ist qualitativ minderwertig", "höhöhö". Die Antwort ist: "Ist schon was", "wird qualitativ beständig besser", und vor allem: It's a wiki! Du kannst es verändern, wenn es Fehler und Probleme gibt. Genau darum geht es ja hier. --Tolanor 18:53, 20. Dez. 2022 (CET)
- *räusper* Was PC zu den Bots gesagt hat, entspricht leider der Wahrheit. Wenn die Wahrheit respektlos ist, dann ist das eben so, damit musst du leben.
- Ja, es gibt auch hier Bots, aber die Aufgaben dieser Bots sind nicht zu vergleichen. Du wirst hier keinen Bot finden, der ganz einfach von irgendwelchen Webseiten Daten übernimmt, da gibts hier nicht.
- Ich hab oben ein aktuell entdecktes Beispiel genannt, soll ich mit einem Bot-Blog zu Fehlern von Bots anfangen? Ich hätte da jeden Tag zwei oder drei Fälle, die ich genauer beschreiben kann und das ist nur(!) aus dem Bereich Normdaten – wobei zugegeben viele dieser Fälle stammen aus der Datenübernahme der VIAF-Daten aus 2015, trotzdem sind die nach 7 Jahren immer noch fehlerhaft. --Wurgl (Diskussion) 19:18, 20. Dez. 2022 (CET)
"Respektlos" war sicherlich bezogen auf die vielen Freiwilligen, die hier in der Generalkritik von PC über einen Kamm geschert wurden - und nicht die wenigen Bots, die quer schießen. Ich habe auf Wikidata mehrere Tausend Personenobjekte erstellt und bearbeitet und monitore diese (ohne großen Aufwand) mit einer Watchlist. Umstände, die du mit wiederkehrenden Bots beschreibst, habe ich in diesem Ausmaß nicht beobachtet. Ich sehe keinen "Totalschaden".
- Bei deiner Wikidata-Kritik fühle ich mich wie Tolanor an Zeiten von vor 15 Jahren erinnert, als Wikipedia als "Newcomer" diese Kritik ständig erfahren hat. Ja, natürlich ist hier nichts perfekt und wie wir alle wissen, wird weder Wikipedia noch Wikidata je perfekt sein. Tolanors Vorschlag soll ja eben dem dienen, dem wir uns hier ständig widmen: Die Sachen zu verbessern - und in dem Fall Dank der der Arbeit die du und andere im Rahmen des PD-Projekts leisten.
- Andere Sprachversionen haben den Switch schon vor Ewigkeit vollzogen und sind auch in der Folge bei Wikidata geblieben:
- 2011 (!!) die französische Wikipedia
- 2015 die englische Wikipedia
Ich kann aber auch die grundsätzliche Wikidata-Kritik nicht nachvollziehen. Was soll denn sonst der Plan sein? Dass wir Insel-Lösungen (wie die Personendaten) für bestimmte Datentypen bestehen lassen und die in jeweils sprachabhängigen Pseudo-Datenbanken aufrecht erhalten, weil "die anderen" es angeblich nicht auf die Kette kriegen ihre Bots zu nutzen, nur aus Vandalen und Nicht-"Fachpersonal" bestehen? Daten, die dann noch in jedem Fall weniger editierbar und noch weniger nutzbar sind, als ein technisch komplexes Wikidata? Ich komme wirklich nicht ganz mit. --Tomukas (Diskussion) 09:29, 21. Dez. 2022 (CET)
- Hallo Tomukas, ich arbeite seit Anfang an bei Wikidata mit. Die "grundsätzliche Wikidata-Kritik" schließt nicht aus, dass auch dort gute Arbeit geleistet wird. Es gibt mittlerweile zahlreiche internationale Experten und Expertengruppen, die sich um die Datenpflege kümmern. Trotzdem bleibt die Datenbank weit hinter ihren Möglichkeiten zurück. Bereits seit 2016 gibt es den Zurückweisungsgrund bekannt unzuverlässige Quelle (Q22979588). Mit einem Minimum an Verständnis für die Bedeutung von Quellen (die ein Bot zum Beispiel nicht überschreiben sollte), hätte ein Großteil der Fehler vermieden werden können; die Fehler, die auch in zehn Jahren unkorrigiert in der Datenhalde schlummern werden, und die neuen, die täglich hinzukommen. Selbst schlecht programmierte Bots dürfen weiter ihr Unwesen treiben. (Mindestanforderungen für Bots wurden wiederholt abgelehnt.) Die "Pseudo-Datenbanken" in Wikipedia (wie war das mit dem Respekt?) bieten genau die Qualität, die Wikidata vermissen lässt. Ich würde gerne auf die Doppelarbeit verzichten, aber sie hat sich bewährt. Teste einfach mal eine der Wartungskats (Beispiel: Kategorie:Wikipedia:GND in Wikipedia weicht von GND in Wikidata ab) und du wirst verstehen, was "intellektuelle Arbeit", wie es im Bibliothekswesen heißt, von automatisierten Massenimporten unterscheidet. Übrigens ist auch die Deutsche Nationalbibliothek mit ihrer maschinellen Indexierung baden gegangen. Wir brauchen deren Fehler nicht zu wiederholen. --Kolja21 (Diskussion) 16:44, 21. Dez. 2022 (CET)
Und wer bastelt uns dann ein Äquivalent zu Schnarks PD-Skript, bloß für Wikidata? scnr, --Yen Zotto (Diskussion) 21:19, 17. Dez. 2022
Sehe ich es richtig, dass @Wurgl: am tiefsten in den Personendaten drin ist (dank APPERbot und Personendatentool etc.). Vielleicht magst Du mal einen systematischen Aufschlag machen, was zu tun sein wird? --Tolanor 03:27, 18. Dez. 2022 (CET)
- Zur Übernahme der Daten nach Wikidata hab ich nix zu sagen. Wikidata ist nicht mein Gebiet, ich hab nichtmal einen Schimmer von Ahnung was da zu tun sein wird. Und die Personendaten … das wird sich zeigen wenn die mal bei Wikidata sind, wie gesagt: Ich hab keine Ahnung wie das dort abgebildet wird, also kann ich nicht viel sagen. Eventuell stirbt dann persondata … --Wurgl (Diskussion) 10:57, 18. Dez. 2022 (CET)
- Bisher ist die Eigenschaft "hat Vorlage Personendaten" ausschlaggebend für die Anzeige im persondata-Tool. Was ist nach einer Übernahme und nach entfernen/inaktivieren der Vorlage Personendaten das Kriterium? Wenn es keine Kriterien gibt, dann ist persondata tot. Und wenn persondata tot ist, dann sind die Seiten unter Liste der Biografien tot, bzw. von Hand zu pflegen. Ebenso ist die wöchentliche Liste für Graphikus Benutzer:APPER/PersonenBKL2 zur Erweiterung/Ergänzung der Namensseiten und Personen-BKS tot.
- Zu beachten ist, dass es etliche "Personen" gibt (z.B. Adam (Q70899) oder Otto Normalverbraucher (Q1752067)), die nicht im persondata-Tool gelistet werden, das sind biblische Gestalten und Sagengestalten. auf diese sollte das Kriterium nicht zutreffen.
- Auf die Schnelle fallen mir da auch ca. 1000 Weiterleitungen ein, die nicht in Wikidata zu finden sind: quarry:query/69857 --Wurgl (Diskussion) 12:54, 18. Dez. 2022 (CET)
- Hallo Wurgl! Ich glaube, dass wir alle ein Interesse daran haben, dass das persondata-Tool weiterbesteht und eine eventuelle Migration der Daten überlebt. Es gibt verschiedene Möglichkeiten, das zu gewährleisten. Eine Möglichkeit wäre, die Vorlage:Personendaten einfach auch nach einer möglichen Migration in den Artikeln zu belassen, nur ggf. dann per Wikidata-Daten zu füllen. Das hätte auch den Vorteil, dass man direkte Bearbeitungslinks zu Wikidata setzen könnte, dass sich also nicht jeder PD-Bearbeiter systematisch in das Wikidata-Bearbeitungssystem hineinfuchsen müsste. Zweite Möglichkeit: Man nutzt das WD-Kriterium "instance of" "human" als Kriterium. Dann hätte man eine noch größere Datengrundlage für das Persondata-Tool. Ggf. kann man hierfür auch Ausnahmen schaffen (z.B. indem man bestimmte Kriterien ausschließt, etwa "mythological Greek character" etc.), wenn die entsprechenden Items nicht in das Tool übernommen werden sollen.
- Was zuletzt die von Dir genannten 1000 Weiterleitungen mit PD angeht: Diese PDs sollten dringend in entsprechende Wikidata-Items überführt werden, wo noch nicht geschehen. --Tolanor 20:44, 18. Dez. 2022 (CET)
- Verzeihe mir, aber die Vorlage Personendaten aus Wikidata zu befüllen ist sinnfrei. Das ist sinnfrei, weil diese Vorlage dazu gedacht war, dass Tools (nicht nur Tools der Wikipedia, auch externe Tools) diese auslesen und wie auch immer verarbeiten können, daher auch die recht strikte Definition zu den Inhalten (siehe Vorderseite). Tools lesen Quelltext, im Quelltext steht aber nix. HTML kann man auch parsen – ist aber eine Größenordnung komplexer und damit auch um diesen Faktor anfälliger für Fehler. --Wurgl (Diskussion) 20:55, 18. Dez. 2022 (CET)
- Noch ein Punkt: Otto Normalverbraucher (Q1752067) hat sehr wenige Properties um diesen als "nicht in persondata-Tool aufnehmen" zu identifizieren. Eigentlich nur Platzhaltername (Q1318274). Leider hat auch Betty Shabazz (Q469198) diese Eigenschaft "Platzhaltername", die hat aber die Vorlage Personendaten.
- Ich sehe nur als Möglichkeit nur ein eigenes Property, ob das dann einfach so existiert oder Inhalt hat, bleibt mal außen vor. Eine Liste von Ausnahmen ist nicht praktikabel, die ändert sich einfach zu oft, sprich wird zu oft erweitert. --Wurgl (Diskussion) 21:18, 18. Dez. 2022 (CET)
- Verstehe ich noch nicht. Otto Normalverbraucher hat doch gerade nicht die property "human", die selbstverständlich Grundlage der Erfassung im persondata-Tool sein müsste. Erst von dort aus müsste man dann Ausnahmen definieren. D.h. Otto Normalverbraucher wäre draußen, Betty Shabazz selbstverständlich drin. --Tolanor 21:34, 18. Dez. 2022 (CET)
- Die hat Mose (Q9077) auch nicht, dennoch sind da Personendaten. Es ist eben nicht so einfach. --Wurgl (Diskussion) 21:40, 18. Dez. 2022 (CET)
- Verstehe ich noch nicht. Otto Normalverbraucher hat doch gerade nicht die property "human", die selbstverständlich Grundlage der Erfassung im persondata-Tool sein müsste. Erst von dort aus müsste man dann Ausnahmen definieren. D.h. Otto Normalverbraucher wäre draußen, Betty Shabazz selbstverständlich drin. --Tolanor 21:34, 18. Dez. 2022 (CET)
Müsste solch eine Import-Aktion nicht mit den anderssprachigen WPs abgesprochen werden? --tsor (Diskussion) 11:10, 18. Dez. 2022 (CET)
- Zumindest das Feld "Beschreibung" betrifft nur die dt. Sprache bzw. das, was Editoren in Wikidata für Deutsch halten. Eine Stilblüte aus den letzten Tagen: "britisches klassisches Wissen" für einen brit. klassischen Wissenschaftler, womit in dem betreffenden Fall ein Altphilologe gemeint war. Man müsste also eine Liste erstellen (und abarbeiten), in der alle Fälle aufgelistet sind, in denen die KURZBESCHREIBUNG (Vorlage) von dem Feld "Beschreibung" (Wikidata) abweicht. --Kolja21 (Diskussion) 12:21, 18. Dez. 2022 (CET)
- Wenn es ein Bot machen soll, dann muss man eine Genehmigung erwirken (wikidata:Wikidata:Bots), ansonsten eigentlich nicht, so lange man den Import seriös macht und bei Problemen zeitnah eingreift. Wenn wirklich hunderttausende Statements importiert werden sollen, ist aber sicher eine kleine Diskussion dort sinnvoll. Am tiefsten in der massenhaften Wikipedia-zu-Wikidata-Migration drinnen dürfte aktuell M2k~dewiki sein. --emu (Diskussion) 12:28, 18. Dez. 2022 (CET)
Siehe auch
- Wikipedia:Meinungsbilder/Lokale Seiten-Kurzbeschreibungen
- Wikipedia Diskussion:Meinungsbilder/Lokale Seiten-Kurzbeschreibungen
- Wikipedia:Kurier/Ausgabe_9_2022#Hitlergruß_auf_Wikidata
- Wikipedia_Diskussion:Kurier/Archiv/2022/09#Hitlergruß_auf_Wikidata
- Wikipedia_Diskussion:Kurier/Archiv/2022/11#Staatsanwaltschaftlicher_Nachtrag_zu_„Hitlergruß_auf_Wikidata“
- d:Wikidata:Forum/Archiv/2022/10#Vandalismusbekämpfung
- Wikipedia:Umfragen/Normdaten aus Wikidata
- Wikipedia_Diskussion:Umfragen/Normdaten_aus_Wikidata
- Benutzer:M2k~dewiki/FAQ#Massenimport-Personendaten-Geolocation
--M2k~dewiki (Diskussion) 13:04, 18. Dez. 2022 (CET)
- Danke für die Links auf bisherige Diskussionen! Mich würde nun vor allem interessieren, was Deine Position zur Migration ist und ob Du bereit wärst, hier noch einmal systematisch Arbeit zu investieren. Viele Grüße, --Tolanor 20:20, 18. Dez. 2022 (CET)
- Siehe auch Wikipedia:Fragen_zur_Wikipedia#Wikidata-Falschinformationen - https://de.wikipedia.org/w/index.php?title=Wikipedia:Fragen_zur_Wikipedia&oldid=231843144#Wikidata-Falschinformationen --M2k~dewiki (Diskussion) 12:31, 15. Mär. 2023 (CET)
Ergänzungen von fehlenden Eigenschaften in Wikidata-Objekten (Beschreibungen, Geburtsdatum, Sterbedatum, ...)[Quelltext bearbeiten]
- Hallo @Tolanor, Stefan Kühn: unter
- ist eine mögliche technische Lösung zum Export der Beschreibungen aus den de-WP-Personendaten und Import mit Quickstatements dokumentiert und hinterlegt, diese ist zumindest seit 2021 in Verwendung und wird regelmäßig (ca. einmal täglich) auf Objekte ohne Geburtsdatum (plus deutschsprachige Beschreibung) oder beispielsweise unregelmäßig solche mit bestimmten Staatsangehörigkeiten (Republik Österreich, Cisleithanien, Kaisertum Österreich, DDR, Schweiz; andere Staatsangehörigkeiten wie Deutschland/NS-Staat/Weimarer Republik/Deutsches Reich/etc. werden meines Wissens nicht systematisch eingepflegt) angewendet. Die Ergänzung betrifft damit hauptsächlich die täglich neu erstellten biografischen Artikel der deutschsprachigen Wikipedia.
- Die Scripts können gerne übernommen und an eigene Anforderungen angepasst werden. Unter anderem ist dabei die Frage zu klären, auf welche Teilmenge der derzeit rund 105 Millionen bestehenden Objekte die Scripts angewendet werden soll, ohne dass man auf Wikidata in einen Timeout läuft.
- Weitere Beispiele zum Anreichern der Objekte sind unter d:User:M2k~dewiki/Tools/Enrich_Objects zu finden, Anlage bzw. Verbinden der noch unverbundenen Objekte ist unter d:User:M2k~dewiki/Tools/Create Objects möglich. --M2k~dewiki (Diskussion) 20:37, 18. Dez. 2022 (CET)
- Wow, hervorragend. Hättest Du Lust, Dir auf dieser Grundlage Gedanken zu machen, wie man diese Tools auf eine allgemeine Migration der PD-Daten nach WD anwenden könnte und dafür ggf. eine Infrastruktur zu schaffen? Ich könnte anbieten, dass wir das einmal mit z.B. verhältnismäßig komplexen (weil antiken) 200 Artikeln aus der Kategorie:Grieche (Antike) ausprobieren und daran eventuelle Probleme klären. Wenn es für antike Personen funktioniert, müsste es m.E. für die meisten Personen funktionieren... --Tolanor 20:56, 18. Dez. 2022 (CET)
- Moin Tolanor, ich bin hier mal ehrlich, ich habe irgendwie den Faden verloren, da es doch in einige Richtungen hier abscheift, ohne, dass wir da Konkretes irgendwo, außer in dieser doch sehr langen Diskussion zusammentragen. Du solltest darüber nachdenken, vllt. irgendwo eine Seite inkl. Diskussionsmöglichkeiten zu schaffen, wo man sammelt und schaut, wie wenn dann Arbeitsmöglichkeiten entstehen könnten. Zweiter Punkt wäre, dass du mal unter der PD Wartung vorbeischaust und dort dir die IDs 272, 274 und 275 nicht nur anschaust, sondern vllt. auch mit abarbeitest, dass würde dort auch schon für Verbesserungen sorgen. @Stefan Kühn, wäre es schnell möglich noch weitere IDs mit Wikidata-Abgleich bereitzustellen? Also z.B. keine Beschreibung in Wikidata oder kein Alias in Wikidata? mfg --Crazy1880 21:23, 26. Dez. 2022 (CET)
- @Crazy1880: Ich reich mal die Frage an @Tidoni weiter. Er hat zuletzt die Wartungsliste gepflegt und auch diese neuen IDs eingebaut. --sk (Diskussion) 22:26, 26. Dez. 2022 (CET)
- Hi, um auch kurz meine Gedanken dazu loszuwerden. ID 272 funktioniert(e) mehr schlecht als recht, da in der Liste primär Artikel auftauchen, die eine Weiterleitung beinhalten und die Weitergeleitete Seite mit einem Wikidata-Item verknüpft ist. Der Diskussion auf Wikidata entnehme ich aber, dass sich dieses Problem scheinbar gelöst hat. Weitere Abgleiche mit Wikidata sind prinzipiell möglich, hatte ich damals nur nicht weiter gemacht, weil mir nicht klar war, wie man es hinbekommt, dass alle Artikel mit ihrem Partner in Wikidata verknüpft werden (siehe Problematik mit ID 272) und ich mir dachte, dass mit tausenden an Geburts-/Sterbedaten vorerst genug zu tun ist (die Einträge sind nur künstlich auf 1000 begrenzt). Ich kann bei Gelegenheit mal schauen, dass ich noch weitere IDs für die anderen Werte erstelle. --Gruß Tidoni (Diskussion) 22:16, 31. Dez. 2022 (CET)
- @Crazy1880: Ich reich mal die Frage an @Tidoni weiter. Er hat zuletzt die Wartungsliste gepflegt und auch diese neuen IDs eingebaut. --sk (Diskussion) 22:26, 26. Dez. 2022 (CET)
- Moin Tolanor, ich bin hier mal ehrlich, ich habe irgendwie den Faden verloren, da es doch in einige Richtungen hier abscheift, ohne, dass wir da Konkretes irgendwo, außer in dieser doch sehr langen Diskussion zusammentragen. Du solltest darüber nachdenken, vllt. irgendwo eine Seite inkl. Diskussionsmöglichkeiten zu schaffen, wo man sammelt und schaut, wie wenn dann Arbeitsmöglichkeiten entstehen könnten. Zweiter Punkt wäre, dass du mal unter der PD Wartung vorbeischaust und dort dir die IDs 272, 274 und 275 nicht nur anschaust, sondern vllt. auch mit abarbeitest, dass würde dort auch schon für Verbesserungen sorgen. @Stefan Kühn, wäre es schnell möglich noch weitere IDs mit Wikidata-Abgleich bereitzustellen? Also z.B. keine Beschreibung in Wikidata oder kein Alias in Wikidata? mfg --Crazy1880 21:23, 26. Dez. 2022 (CET)
- Moin Tidoni, vielen Dank für deine Antwort. Ja die Problematik kannte man aus den Kinderschuhen von 2012 und Wikidata, dass es nun 10 Jahre später behoben wurde ist klasse und bietet neue Möglichkeiten, aber auch jede Menge Supportstau, den es abzuarbeiten gilt. Wir haben ja gute IDs in Personendatenwartung. Könnte man davon denn einige nehmen und als weitere IDs mit Wikidata bauen, dann müssten wir folgende auf jeden Fall haben:
- ID 48 = Kurzbeschreibung leer => heißt, wenn keine Beschreibung auf Wikidata
- ID 90 = ID 272
- ID 213 = Kurzbeschreibung ohne Nationalität => müsste man dann aus der Beschreibung auf Wikidata auslesen
- ID 266 = ID 274
- ID 267 = Alternativname leer, aber Titel nicht im Text => Müsst dann auf Wikidata die Aliasse checken
- ggf. Geburtsort und Sterbeort fehlt in Wikidata ist aber in dewiki vorhanden (müsste neue ID sein)
- Wären diese denn denkbar als Abgleiche zu fahren? mfg --Crazy1880 10:56, 6. Jan. 2023 (CET)
- Ev. siehe meinen Kommentar in Benutzer_Diskussion:Onkelkoeln#Lorepa_Wangchug_Tsöndru "17:04, 31. Dez. 2022". Jedenfalls sind die Klammerausdrücke in ALTERNATIVNAMEN (die sollten die Sprache bzw. Schrift angeben) sehr "innovativ". Link auf eine Liste der Klammerausdrücke ist in dem Diskussionsstrang zu finden. --Wurgl (Diskussion) 11:35, 6. Jan. 2023 (CET)
- Moin Tidoni, vielen Dank für deine Antwort. Ja die Problematik kannte man aus den Kinderschuhen von 2012 und Wikidata, dass es nun 10 Jahre später behoben wurde ist klasse und bietet neue Möglichkeiten, aber auch jede Menge Supportstau, den es abzuarbeiten gilt. Wir haben ja gute IDs in Personendatenwartung. Könnte man davon denn einige nehmen und als weitere IDs mit Wikidata bauen, dann müssten wir folgende auf jeden Fall haben:
- @Crazy1880: Danke für den Hinweis auf die PD-Wartungs-IDs. In der Tat ist es gut, dass es dort schon entsprechende IDs gibt und auch sinnvoll, sich dort einmal umzusehen, um mögliche Probleme auszumachen. Ich bin gleich auf eines gestoßen und habe das direkt bei Wikidata thematisiert. Ich kann gerne dabei helfen (vielleicht mit Tomukas? wer will noch?), eine halbwegs saubere Arbeitsseite zu schaffen, würde aber noch etwas abwarten wollen, wer hier noch in der Diskussion aufschlägt und welche Probleme sich noch herausstellen. Gerne kannst Du auch andere Bearbeiter der PD-Wartungslisten hier einmal anpingen, damit diese noch ihre Ideen beitragen können. --Tolanor 02:23, 27. Dez. 2022 (CET)
Ergänzungen von fehlenden Beschreibungen in Wikidata-Objekten[Quelltext bearbeiten]
- Hallo @Tolanor: in der Kategorie:Grieche (Antike) und deren Unterkategorien finden sich derzeit 2.504 Artikel (siehe PetScan-Abfrage).
- Von diesen 2.504 Artikeln bzw. Wikidata-Objekten hatten 38 WD-Objekte noch keine deutschsprachige Beschreibung, diese wurde mittels Download.csv aus obigem Petscan-Ergebnis (Output -> Format "CSV" -> "Do it!"), dem darauf angewendeten Script
- und anschließendem Uplod per QuickStatement hinzugefügt, siehe:
- Im Gegensatz dazu verwendet
- ein Ergebnis-Download einer SPARQL-Abfrage (statt PetScan).
- Mit
- wird eine fehlendes Geburtsdatum sowie eine fehlende deutschsprachige Beschreibung ergänzt.
- Die Umstellung von (bisher) SPARQL auf PetScan war notwendig, weil mit PetScan die Kategorie:Grieche (Antike) ausgewertet wurde anstatt mit SPARQL eine Wikidata-Eigenschaft. --M2k~dewiki (Diskussion) 22:03, 18. Dez. 2022 (CET)
Vergleich von WD-Objekt-Beschreibung und Personendaten-Kurzbeschreibung[Quelltext bearbeiten]
- Cool. Könntest Du dasselbe noch einmal etwas tiefer machen, indem Du
- a) eine Wartungsliste anlegst für Fälle, in denen die Personenbeschreibung auf WD und die in den Personendaten unterschiedlich ist
- b) Sterbe- und Geburtsdaten in allen Fällen auf WD überträgst, in denen dort noch gar nichts in dieser Richtung existiert, also auch bei PD-Angaben wie "vor xx", "1. Jahrhundert oder 2. Jahrhundert", etc.?
- c) Namen und Alternativnamen ebenfalls übertragen werden?
- Ist vermutlich etwas komplizierter, würde uns aber vielleicht eine gute Einsicht geben, was Problemfälle sein können. --Tolanor 23:52, 18. Dez. 2022 (CET)
- Cool. Könntest Du dasselbe noch einmal etwas tiefer machen, indem Du
Hallo @Tolanor: nachfolgend eine kurze Beispielausgabe (die ersten paar Datensätze) von
Objekt | WD-Beschreibung | PD-Kurzbeschreibung |
---|---|---|
d:Q8409 | makedonischer Feldherr und König (356-323 v. Chr.) | makedonischer Feldherr und König |
d:Q8739 | antiker griechischer Mathematiker, Physiker und Ingenieur | griechischer Mathematiker, Physiker und Ingenieur |
d:Q868 | klassischer griechischer Philosoph | griechischer Philosoph und Naturforscher |
d:Q859 | antiker griechischer Philosoph | griechischer Philosoph |
d:Q36303 | griechischer Philosoph, Mathematiker und Astronom | griechischer Philosoph, Mathematiker, Astronom; angeblich erster Philosoph |
d:Q6691 | mutmaßlicher Autor der Ilias und Odyssee | griechischer Dichter |
d:Q131671 | vorsokratischer Philosoph und Dichter | vorsokratischer Philosoph und Dichter |
d:Q635 | letzte Königin des ägyptischen Ptolemäerreiches und letzter weiblicher Pharao aus dem ersten Jahrhundert vor Christus | ägyptische Königin |
d:Q22082330 | illegitime Gewalt- und Willkürherrschaft | |
d:Q105290 | altgriechischer Bildhauer | griechischer Bildhauer |
d:Q133337 | Staatsmann und Philosoph der Antike | griechischer Politiker und Gesetzgeber Athens |
d:Q45936 | altgriechischer Geschichtsschreiber und Geograph des 1. Jahrhunderts | griechischer Geschichtsschreiber und Geograph |
d:Q26825 | antiker griechischer Geschichtsschreiber, Geograph und Völkerkundler | griechischer Historiker, Geograph und Völkerkundler |
d:Q235426 | Philosoph der Antike | Ehefrau des Pythagoras |
d:Q43216 | Philosoph der Antike | griechischer Philosoph, Begründer des Epikureismus |
d:Q203445 | Philosoph der Antike | antiker griechischer Philosoph |
d:Q178217 | griechischer Mathematiker | antiker griechischer Mathematiker |
d:Q165589 | Philosoph der Antike | Mitbegründer des Atomismus |
d:Q28626 | athenischer Gesetzesreformer | Athener Gesetzesreformer |
d:Q179552 | athenischer Politiker und Feldherr | griechischer Politiker und Feldherr |
d:Q117253 | antiker griechischer Staatsmann und Redner | Redner des antiken Griechenland |
d:Q131976 | makedonisch-griechische Herrscherdynastie in Ägypten | |
d:Q335156 | Philosoph der Antike | griechischer Philosoph und Musiktheoretiker |
d:Q188332 | Philosoph der Antike | griechischer Philosoph (Vorsokratiker) |
d:Q451719 | Philosoph der Antike | antike griechische Philosophin |
d:Q325955 | Philosoph der Antike | Neffe Platons, Scholarch der Älteren Akademie |
d:Q665984 | Philosoph der Antike | griechischer Philosoph |
d:Q185770 | Philosoph der Antike | griechischer Philosoph, Geschichtsschreiber und Universalgelehrter |
d:Q214121 | Philosoph der Antike | griechischer Philosoph |
d:Q189506 | Philosoph der Antike | griechischer Philosoph |
d:Q31845 | römischer Politiker und Geschichtsschreiber | römischer Historiker |
d:Q26204 | Rhetor, Schriftsteller und Geschichtsschreiber des 1. Jahrhunderts v. Chr | Rhetor und Verfasser einer römischen Frühgeschichte bis zum Beginn des ersten Punischen Krieges |
d:Q226858 | Oströmischer Historiker | spätantiker Historiker |
d:Q228564 | Philosoph der Antike | griechische Philosophin, zweite Frau des Perikles |
d:Q248287 | Philosoph der Antike | griechischer Philosoph (Kyniker) |
d:Q297776 | griechischer Arzt, bedeutendster Pharmakologe des Altertums | griechischer Arzt |
d:Q357027 | Philosoph der Antike: Früher Neuplatoniker | Bischof von Ptolemais |
d:Q365977 | griechischer Philosoph der Antike, einer der Sieben Weisen | altgriechischer Redner, einer der Sieben Weisen |
d:Q34601 | Philosoph der Antike | Gesetzgeber des klassischen Sparta |
d:Q365950 | Philosoph der Antike | Tyrann von Lindos |
- Der Vergleich pro Datensatz dauert in dieser Programmversion geschätzt ca. eine Sekunde, bei 2.500 Datensätzen in Kategorie:Grieche (Antike) geschätzt rund 40 Minuten oder mehr.
- Laut den ersten Beispielvergleichen (basierend auf den ersten 125 Datensätzen) dürfte die Beschreibung bei rund der Hälfte der Objekte voneinander abweichen.
- d:Q22082330 und d:Q131976 haben beispielsweise keine Personendaten, die Artikel finden sich aber in einer (Unter)kategorie von Kategorie:Grieche (Antike).
--M2k~dewiki (Diskussion) 01:32, 19. Dez. 2022 (CET)
- Puh, das ist nicht wenig. Könnte man hierfür eine Seite einrichten, auf der Bearbeiter den direkten Vergleich der Beschreibungen sowie das Lemma auf de.wp sehen und dann per Klick entscheiden können, welche der Beschreibungen die bessere ist, und die wird dann ins WD-Item gesetzt? Das wäre doch eine gute Grundlage für den Übertrag. --Tolanor 09:14, 19. Dez. 2022 (CET)
- Hallo @Tolanor: ein Vergleich findet sich jetzt unter Benutzer:Tolanor/Vergleich Kategorie Grieche (Antike). --M2k~dewiki (Diskussion) 11:46, 19. Dez. 2022 (CET)
Ergänzungen von fehlenden Geburts- und Sterbedaten in Wikidata-Objekten[Quelltext bearbeiten]
- Hallo @Tolanor: Personen-Einträge aus der Kategorie:Grieche (Antike) (exklusive Listen, Artikel für Personengruppen, usw., also nur Einträge, die sich zusätzlich auch in der der Kategorie Kategorie:Person nach Geschlecht befinden) ohne Geburtsdatum im Wikidata-Objekt sind mit dieser PetScan-Abfrage zu finden. --M2k~dewiki (Diskussion) 23:35, 19. Dez. 2022 (CET)
Hallo @Tolanor: analog dazu sind nachfolgend auch Objekte ohne die Eigenschaft Sterbedatum zu finden:
- Personen-Einträge aus der Kategorie:Grieche (Antike) (exklusive Listen, Artikel für Personengruppen, usw., also nur Einträge, die sich zusätzlich auch in der der Kategorie Kategorie:Person nach Geschlecht befinden:
--M2k~dewiki (Diskussion) 17:36, 20. Dez. 2022 (CET)
Okay, aber ich fürchte, jetzt bräuchten wir noch ein Skript, um die Daten auch tatsächlich zu übertragen. Wenn Du etwas ausprobieren magst, erkläre ich mich gerne bereit, Änderungen auf Fehler etc. durchzusehen, damit das Skript verbessert werden und dann großflächig (er) eingesetzt werden kann. --Tolanor 17:59, 20. Dez. 2022 (CET)
- Hallo @Tolanor: ein automatisiertes Übertragen von Daten wie Achilleus Tatios (Astronom): zwischen 2. Jahrhundert und 4. Jahrhundert halte ich für eher schwierig. Mit obigem Script werden nur Datumswerte der Form Tag. Monat Jahr, Monat Jahr oder Jahr übertragen, Datumswerte die "vor|nach|um|unsicher|zwischen|und|oder" enthalten werden bewusst ignoriert. --M2k~dewiki (Diskussion) 18:06, 20. Dez. 2022 (CET)
- Aber das ist für mich genau das Problem, weil es gerade für die meisten antiken Personen keine genauen Geburts- und Sterbedaten gibt, es aber trotzdem wichtig wäre, sie auch auf Wikidata zeitlich einzuordnen. Sicherlich ist es komplizierter, diese Daten zu übertragen, aber lohnen würde es sich sehr. Falls Du hierzu Hilfe brauchst, kann ich gerne noch einige Benutzer hinzuorganisieren. Ich dachte nur, dass Du ja in der Datenübertragung schon recht tief drin bist. Viele Grüße, --Tolanor 18:23, 20. Dez. 2022 (CET)
- Hallo @Tolanor: bei Personen, wo weder Geburts- noch Todesdatum bekannt sind, wird unter Umständen stattdessen das Wirkungsjahr angegeben:
- d:Property:P1317: Wirkungsjahr einer Person, von der weder Geburts- noch Todesdatum bekannt ist (mehrfache Werte sind möglich)
- Beispiele:
- --M2k~dewiki (Diskussion) 20:11, 20. Dez. 2022 (CET)
- Wirkungsdaten von Personen mit Staatsangehörigkeit Römisches Reich als Timeline:
- --M2k~dewiki (Diskussion) 21:24, 20. Dez. 2022 (CET)
- Hallo @Tolanor: bei Personen, wo weder Geburts- noch Todesdatum bekannt sind, wird unter Umständen stattdessen das Wirkungsjahr angegeben:
- Aber das ist für mich genau das Problem, weil es gerade für die meisten antiken Personen keine genauen Geburts- und Sterbedaten gibt, es aber trotzdem wichtig wäre, sie auch auf Wikidata zeitlich einzuordnen. Sicherlich ist es komplizierter, diese Daten zu übertragen, aber lohnen würde es sich sehr. Falls Du hierzu Hilfe brauchst, kann ich gerne noch einige Benutzer hinzuorganisieren. Ich dachte nur, dass Du ja in der Datenübertragung schon recht tief drin bist. Viele Grüße, --Tolanor 18:23, 20. Dez. 2022 (CET)
Abbildung der PD in Wikidata-Objekten[Quelltext bearbeiten]
Die Übernahme nach Wikidata mag ja okay sein. Dennoch sollte man sich überlegen, wie diese Daten überhaupt abgebildet werden sollen und wie auf dem umgekehrten Weg aus den Wikidata-Daten wieder die (bisherigen) PD-Informationen werden und zwar ohne Verluste.
- NAME: Inhalt ist "Familienname Komma Vorname". Familienname entspricht Familienname (P734) und Vorname entspricht Vorname (P735). Soweit okay. Wenn jetzt mehrere Namen aufgeführt werden, z.B. bei Ang Lee (Q160726), welcher Name gilt? Das Beispiel hat Ang (Q21143702) (wie in deWP) und als zweiten Namen Ān (Q96251256). Bei uns steht "Lee, Ang". Wie soll hier entscheiden werden, welcher der Vornamen wegzulassen ist und falls beide gelten, dann ist die Frage der Reihenfolge zu klären. Selbige Problematik kann wohl beim Familiennamen auftreten.
- ALTERNATIVNAMEN: Da hab ich momentan überhaupt keine Idee. Speziell die Zusätze wie "(Pinyin)" oder "(Geburtsname)" etc. machen Kopfschmerzen. Und welche Namen werden angezeigt? Eventuell das Feld "Auch bekannt als"?
- KURZBESCHREIBUNG: Okay, das könnte die deutsche Beschreibung sein.
- GEBURTSDATUM: Entspricht wohl Geburtsdatum (P569). Das Beispiel Adam Ries (Q61740) zeigt die Problematik. In Wikidata sind drei Daten: "26. März 1492", "23. Dezember 1492" und "1492", das letzte als bevorzugter Rang, bei uns steht "1492 oder 1493". Wie abbilden, so dass unser 1493 nicht verloren geht? Und was ist das Kriterium um "26. März 1492" und "23. Dezember 1492" zu ignorieren?
- GEBURTSORT: In Wikidata ist einfach ein Objekt verlinkt, in den PD ist etwas ausführlicher noch der Kreis und manchmal das Land bzw. der Bundesstaat. Beispiel: Anthony Minghella (Q188726) hat Hammersmith (Q277162) in den PD steht "London". Hammersmith ist ein Stadtteil von London, also nicht falsch, nur die Information welches aus Hammersmith (Begriffsklärung) es ist, fehlt. Stadtteil von London (Q2755753) ist kaum geeignet um dieses Hammersmith genauer zu qualifizieren, das ist speziell für London.
- STERBEDATUM: Analog zu Geburtsdatum
- STERBEORT: Analog zu Geburtsort
Wenn zusätzlich noch geklärt ist, ob unsere importierten Daten die Anzeige in anderen Sprachversionen verändern dürfen bzw. wie man das verhindert, dann kann man an Schritt 1 "Übernahme der Daten nach Wikidata" denken. Weil erst dann kann Wikidata mit deWP verglichen werden. Und erst wenn das durch ist, kann an Schritt 2 "Unsere PD in die Tonne treten" gedacht werden. --Wurgl (Diskussion) 21:04, 21. Dez. 2022 (CET)
- Hallo Wurgl, erstmal frohe Weihnachten. Ich freue mich, dass wir jetzt auf eine konstruktive Ebene kommen. Ich denke, wir sind uns hier alle einig, dass "Übernahme der Daten nach Wikidata" der erste Schritt ist; Schritt zwei ist noch weit weg und sollte auch erstmal gar nicht diskutiert werden. Zu einigen Deiner konkreten Fragen:
- Alternativnamen: In der Tat sollten die Alternativnamen in den Personendaten einfach in das Feld "Auch bekannt als" übertragen werden. Auch Zusätze wie "(Geburtsname)" kann man dort problemlos eingeben. Im Prinzip muss man beim Übertrag nur die Semikola zwischen den verschiedenen Alternativnamen durch | ersetzen.
- Kurzbeschreibung: Ja, genau, allerdings macht mir in der Tat Sorgen, dass (siehe oben) offenbar so viele Kurzbeschreibungen PD vs Wikidata voneinander abweichen. Das wird eine Riesenarbeit, die abzugleichen ... Andererseits lohnt es sich insofern, als es sicher eine große qualitative Verbesserung der Kurzbeschreibungen bedeuten wird.
- Geburtsdatum: M.E. kann Dein Tool hier mit dem Kriterium "references" arbeiten und einfach diejenigen Geburts- bzw. Sterbedaten priorisieren, die als reference "German Wikipedia" angegeben haben. D.h. man würde bei einer automatisierten Übertragung immer die deutschsprachige Wikipedia als Referenz einfügen.
- Geburtsort: Hier verstehe ich das Problem noch nicht ganz. Die PD verlinken ja immer auf einen konkreten Ort, der auch keine BKL ist. Das entsprechende WD-Item kann über diesen Link identifiziert werden. Weitere Daten wie Land oder Bundesstaat können dann wiederum über die entsprechenden Statements in den WD-Items identifiziert werden.
- Nebenbei bemerkt: Wenn Du/Wir es schaffen, das Tool auf Wikidata umzustellen, stehen dem Tool weit mehr als nur 800.000 biografische Daten zur Verfügung. --Tolanor 02:41, 27. Dez. 2022 (CET)
- Zum Geburtsort: Es gibt auch PDs, wo eine BKL verlinkt ist (direkt oder via Weiterleitung auf eine BKL): https://de.wikipedia.org/wiki/Kategorie:Wikipedia:Geburts-_oder_Sterbeort_unbekannt Und es gibt PDs wo der Ort ein Rotlink ist. --Wurgl (Diskussion) 09:22, 27. Dez. 2022 (CET)
- Bei den Rotlinks wird zwar die automatische Erkennung versagen, aber Wikidata wird zu den meisten Orten, die bei uns Rotlinks sind, schon ein Item haben, das man händisch verlinken kann. In den wenigen Fällen, wo das nicht der Fall ist (falls es das überhaupt gibt?), kann man dann das Item anlegen. Ähnlich für die BKLs. --Tolanor 09:28, 27. Dez. 2022 (CET)
- Klammerzusätze bei Auch bekannt als sind nicht erwünscht und auch nicht üblich. Wenn, dann müsste man das mit Statements abbilden. --emu (Diskussion) 10:30, 27. Dez. 2022 (CET)
Abbildung von Personennamen in Wikidata[Quelltext bearbeiten]
Ich sehe die systematische Übertragung des Namens und der Alternativnamen nach Wikidata als größte Herausforderung bei der Migration der Personendaten nach Wikidata. Geburts- und Sterbedaten, auch ungefähre, können in Wikidata gut abgebildet werden; Geburts- und Sterbeort werden in Wikidata als Verweis auf das Item des Ortes, der Region oder des Landes angelegt, alles weitere kann automatisch abgeleitet werden.
Aktuell werden Namen hauptsächlich als Verweise auf Items kodiert z.B. wäre für Steffi Graf (vollständiger Name: Stephanie Maria Graf) korrekt:
- Vorname (P735): Stephanie (Q1291472)
- Vorname (P735): Maria (Q325872)
- Familienname (P734): Graf (Q1158367)
Sind alle Namensbestandteile gespeichert kann man den vollständigen Namen wie in den Personendaten ableiten: "Graf, Stephanie Maria". Jedoch ist es nicht offensichtlich, dass der bekanntere Name "Graf, Steffi" ist. (Vielleicht wäre es besser "Steffi" direkt als Vornamen zu kodieren, und als Rufnamen zu markieren, siehe Diskussion zu Rufnamen). Ein Nachteil ist, dass es eigene Items für jeden Vor- und Nachnamen (in jeder Schreibung) geben muss (auch Doppelnamen z.B. Karl-Theodor (Q19688667)). Außerdem gibt es für ursprünglich nicht lateinische Namen häufig viele verschiedene Schreibungen z.B. محمد (Mohammed (Q5837762), Muhammad (Q19693229), Mohamed (Q19729888), ...) mit jeweils eigenen Items. Hier können aus einem einzigen arabischen, russischen, oder ostasiatischen Namen viele verschiedene Items werden, abhängig davon welche lateinsche Schreibung von der Person verwendet wird (wenn überhaupt bekannt). Für viele weitere Fälle gibt es spezielle Eigenschaften z.B. für Römer römischer Vorname (P2358), Nomen gentile (P2359), Nomen gentile (P2359). Hier die Namen aller Personen in der deutschsprachigen Wikipedia korrekt zu kodieren ist ein großes Projekt. Trotzdem ist es schwierig von den gespeicherten Aussagen den bekannten Namen, den vollständigen Namen und die Namen in Muttersprachen abzuleiten, da man alle Aussagen zu Namen berücksichtigen muss. Eine weitere Herausforderung wäre es automatisch die Regeln für die alphabetische Katalogisierung (RAK) anzuwenden, um die Namen in die Form "'Nachname', 'Vorname'" zu bringen.
Zusätzlich können Namen daher als einsprachiger Text kodiert werden z.B. bei Steffi Graf angegeben sind:
- Name in Muttersprache (P1559): Steffi Graf (deutsch)
- Geburtsname (P1477): Stephanie Maria Graf (deutsch)
Einsprachige Texte haben immer eine festgelegte Sprache, es kann aber auch "mul" (verschiedene Sprachen) oder "und" (nicht bestimmte Sprache) ausgewählt werden. Es gibt viele weitere Eigenschaften um spezielle Namen anzugeben, aber auch einfach Name (P2561), welches verwendet werden soll wenn keine genauere Eigenschaft existiert. Damit können für eine Person alternative Namen, jeweils mit fixer Schreibung und Sprache sowie einer klaren Rolle angelegt werden. Leider werden die Namen nicht nach RAK gespeichert und die Regeln der Seite Hilfe:Personendaten/Name automatisch anzuwenden bleibt ein Problem.
Mein Vorschlag, um die Felder NAME und ALTERNATIVNAMEN in Wikidata zu übertragen, ist die Form "Nachname Komma Vorname" beizubehalten und entweder eine neue Eigenschaft (Name in Ansetzungsform nach RAK?) anzulegen oder die Eigenschaft Name (P2561) zu verwenden mit einem Qualifizierer Bestimmungsmethode (P459): Regeln für die alphabetische Katalogisierung (Q1424976). Über den Rang kann man einen bevorzugten Namen festlegen, bestehende Anmerkungen in Klammern können als weitere Qualifizierer gespeichert werden, bei Namen in anderen Sprachen kann die Sprache direkt angegeben werden.
Für 3 Personen habe ich die Namen in dieser Form testweise eingetragen:
- Ferdinand Magellan
- Otto Graf Lambsdorff
- Vitali Klitschko (deutsche Transkriptionen können entweder automatisch abgeleitet werden oder in der Aussage als Qualifizierer mit angegeben werden)
Falls man die Namen in Ansetzungsform nach RAK in Wikidata speichert sollte man das auch mit wikidata:WikiProject:Names diskutieren, außerdem sollte man berücksichtigen, dass dieses Format bisher nicht in Wikidata verwendet wird und die deutschsprachigen Wikipedianer die Daten hauptsächlich pflegen müssten. Dafür spricht, dass man die Daten automatisch übertragen kann und keine Informationen verliert, sowie dass viele wichtige Normdateien ebenfalls das Format "Vorname Komma Nachname" primär verwenden, mindestens die GND, LCAuth, BnF und BIBSYS. --Pyfisch (Diskussion) 16:02, 27. Dez. 2022 (CET)
- Super, finde ich eine hervorragende, erstaunlich einfache Lösung eines komplexen Problems, das Du gut aufgedröselt hast. Meinst Du, Du könntest mal an einem Skript werkeln, das den Übertrag der kompletten PD-Daten schafft? Dann testen wir es an 100 Artikeln und sehen uns gemeinsam genau an, wo es noch hakt. --Tolanor 22:16, 27. Dez. 2022 (CET)
- Vielleicht noch ein kleiner Zusatz: Man sollte auch die Sprache de-at berücksichtigen, was mir nur gerade dazu einfällt. Denn auch "unsere" Stephanie Graf heißt in de-at Steffi. lg K@rl du findest mich auch im RAT 09:24, 28. Dez. 2022 (CET)
- Grundsätzlich sollen Alternativnamen in verschiedenen Sprachen übertragen werden. Dass "Graf, Steffi" der de-at spezifischer Name von Stephanie Graf ist ergibt sich für mich aus den Quellen aber nicht. (Auch kann ein Skript natürlich nur die Namen und Informationen übertragen, die in der Vorlage Personendaten angegeben sind ;-) --Pyfisch (Diskussion) 14:39, 28. Dez. 2022 (CET)
- Vielleicht noch ein kleiner Zusatz: Man sollte auch die Sprache de-at berücksichtigen, was mir nur gerade dazu einfällt. Denn auch "unsere" Stephanie Graf heißt in de-at Steffi. lg K@rl du findest mich auch im RAT 09:24, 28. Dez. 2022 (CET)
Bekommen wir dann künftig immer die englisch-transkribierten Namen von Russen zurück? Oder das russische Original? --Jbergner (Diskussion) 12:43, 29. Dez. 2022 (CET)
- Wenn bisher das russische Original in den Personendaten angegeben ist, bekommen wir das auch weiterhin zurück. Entweder man leitet vom Original mechanisch die deutsche Transkription ab, oder man gibt die deutsche Transkription des Namens auf Wikidata explizit an. Englisch transkribierte Namen, oder Transkriptionen für andere Sprachen, könnte man auch nach einer Tabelle ableiten, sollen bei diesem Vorschlag aber, wie bisher, nicht in die deutschsprachige Wikipedia übernommen werden. --Pyfisch (Diskussion) 17:22, 29. Dez. 2022 (CET)
- D.h. für mich, alle heute in der deutschen Wikipedia englisch transkribierten Sportler werden nicht mehr mit ihren solcherart in den Olympiasiegerlisten vorzufindenden Namen zurückgegeben, sondern mit den automatisch auf deutsch transkribierten (international unbekannten) Namen geführt oder mit ihren russischen? Gleiches gilt dann für in Amerika wirkende russischstämmige Forscher und Wissenschaftler? --Jbergner (Diskussion) 17:53, 29. Dez. 2022 (CET)
- Das ist ein interessanter Fall. Hast du ein paar Beispielartikel? Dann schaue ich mir an, wie die Infos in den PD stehen. Bei Personen, die stets die englische Transkription verwenden und entsprechend der Artikelname ebenfalls diese Schreibung verwendet würde es wenig Sinn ergeben dies nicht nach Wikidata zu übernehmen. --Pyfisch (Diskussion) 18:13, 29. Dez. 2022 (CET)
- Mir fallen nur so Leute ein wie der Ukrainer Witalij Klytschko (in D Bekannt als Vitali Klitschko), der Ukrainer Wolodymyr Klytschko (in D bekannt als Wladimir Klitschko), der US-Amerikaner Alexander Wladimirowitsch Iwanow (internat. bekannt als Alexander Ivanov), der US-Amerikaner Grygorij Sinowijowytsch Kajdanow (internat. bekannt als Gregory Kaidanov) und was der Konfusion bei Sowjet-Russen-Ossetier-Ukrainer-US-amerikanern mehr ist. --Jbergner (Diskussion) 20:11, 29. Dez. 2022 (CET)
- Es wird wie seit Jahren die in dem jeweiligen Land bekannteste Schreibweise angegeben (wie in Wikipedia auch). Andere Bezeichnungen sind Aliase der Landessprache (welche auch in den Suchergebnissen auftauchen). Finde dein Beispiel d:Q18797, hier gibt es weit über 30 Schreibweisen in den verschiedenen Sprachen. Einfach mal schauen, wie Wikidata aufgebaut ist... Conny 07:25, 30. Dez. 2022 (CET).
- Ähh? Da sind zwei Schreibweisen des Namens. Die 30 Stück sind die Lemmata. --Wurgl (Diskussion) 09:21, 30. Dez. 2022 (CET)
- Es wird wie seit Jahren die in dem jeweiligen Land bekannteste Schreibweise angegeben (wie in Wikipedia auch). Andere Bezeichnungen sind Aliase der Landessprache (welche auch in den Suchergebnissen auftauchen). Finde dein Beispiel d:Q18797, hier gibt es weit über 30 Schreibweisen in den verschiedenen Sprachen. Einfach mal schauen, wie Wikidata aufgebaut ist... Conny 07:25, 30. Dez. 2022 (CET).
- Mir fallen nur so Leute ein wie der Ukrainer Witalij Klytschko (in D Bekannt als Vitali Klitschko), der Ukrainer Wolodymyr Klytschko (in D bekannt als Wladimir Klitschko), der US-Amerikaner Alexander Wladimirowitsch Iwanow (internat. bekannt als Alexander Ivanov), der US-Amerikaner Grygorij Sinowijowytsch Kajdanow (internat. bekannt als Gregory Kaidanov) und was der Konfusion bei Sowjet-Russen-Ossetier-Ukrainer-US-amerikanern mehr ist. --Jbergner (Diskussion) 20:11, 29. Dez. 2022 (CET)
- Das ist ein interessanter Fall. Hast du ein paar Beispielartikel? Dann schaue ich mir an, wie die Infos in den PD stehen. Bei Personen, die stets die englische Transkription verwenden und entsprechend der Artikelname ebenfalls diese Schreibung verwendet würde es wenig Sinn ergeben dies nicht nach Wikidata zu übernehmen. --Pyfisch (Diskussion) 18:13, 29. Dez. 2022 (CET)
- D.h. für mich, alle heute in der deutschen Wikipedia englisch transkribierten Sportler werden nicht mehr mit ihren solcherart in den Olympiasiegerlisten vorzufindenden Namen zurückgegeben, sondern mit den automatisch auf deutsch transkribierten (international unbekannten) Namen geführt oder mit ihren russischen? Gleiches gilt dann für in Amerika wirkende russischstämmige Forscher und Wissenschaftler? --Jbergner (Diskussion) 17:53, 29. Dez. 2022 (CET)
- Guck mal ganz oben bei "Label" und klick "all entered languages" an. Es gibt für jede Sprache die Möglichkeit, ein Hauptlabel anzugeben sowie etliche Alternativnamen. --Tolanor 12:31, 30. Dez. 2022 (CET)