Benutzer Diskussion:MisterSynergy

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
Archiv-Tabelle Archiv
Zum Archiv
Wie wird ein Archiv angelegt?

Verteilung[Quelltext bearbeiten]

Quelltextgrößenverteilung in dewiki

Nochmals Dank für dein kenntnisreiches Eingreifen! Ich überlege, ob man das nicht in einem knappen WP-Kurier-Artikel verbreiten sollte (scheint ja sonst keiner zu wissen). Ist es viel Aufwand (überhaupt möglich?), die einzelnen 10 grössten Artikel (in deiner Auflistung, S. 24) zu benennen? Drei (Beispiel)Artikel, die im Peak der Verteilung liegen, kann ich selber heraussuchen. Cheers! Play It Again, SPAM (Diskussion) 09:09, 11. Okt. 2016 (CEST)

Hallo Play It Again, SPAM! Inwiefern man das Wissen über Daten wie den Ermittelten verbreiten möchte, bin ich nicht festgelegt – ich stehe dem ausdrücklich nicht im Wege und würde bei Interesse auch versuchen, weitere Daten zu beschaffen (Vergleiche mit anderen Sprachversionen etc, als „Qualitätsvergleich“ und mglw. auch zum Aufspüren von signifikanten Botaktivitäten). Die 10 (bzw. 100) größten Artikel sind schnell ermittelt: noch ein Quarry. Allerdings wird vielen so theoretisches Zahlenmaterial wenig zugänglich sein, deshalb bin ich nicht sicher ob der Kurier dazu nicht vielleicht eine zu große Plattform wäre.
Diesen Peak sollte man vielleicht noch etwas untersuchen. Mein Studium mit Mathematik-Vorlesungen liegt weit genug zurück und die Vorlesungen waren reichlich abstrakt, so dass ich da die praktischen Aspekte der Statistikdetails gerade nicht mehr so parat habe zwinker . Wenn ich aber doch mal mutig die bei FzW angedeutete Log-normalverteilung anfitte, kommen ein paar Ergebnisse raus: und , demnach ist der Median , das Maxium der Verteilung liegt bei . Passt insofern alles zu der Auftragung, aber da gibt es ein paar statistische Fallstricke, wegen derer das trotzdem alles großer Quatsch sein könnte. Interessant war glaub ich auch die Verteilungsfunktion, die ich mir gestern kurz angeschaut habe, aber ohne davon ein Bild zu speichern. Daraus dürfte man in der Praxis mehr ablesen können als aus dieser logarithmisch skalierten Auftragung, bei der die Datenpunkte nach rechts immer dichter liegen.
Wie auch immer. Wenn ich Dir noch mit Abfragen helfen kann, lass mich das wissen. Eile haben wir in der Sache ja nicht. Viele Grüße! MisterSynergy (Diskussion) 09:46, 11. Okt. 2016 (CEST)
Ich sehe mal nach, ob dieses Thema schon dort präsentiert wurde. Es sollte einfach zu schlucken und zu verdauen sein. ob @HilberTraum: mehr mit den Zahlen (merkwürdig: vorhin konnte ich hier noch alle Zahlen sehen...) anfangen kann?!? Melde mich wieder. Play It Again, SPAM (Diskussion) 11:09, 11. Okt. 2016 (CEST)
Hoppla, ich hatte versehentlich an der Abfrage rumgebastelt, das aber nicht zum Ende geführt. Sollte nun wieder laufen! —MisterSynergy (Diskussion) 11:11, 11. Okt. 2016 (CEST)
Ja, ich denke auch, dass eine Log-Normalverteilung hier gut passt. Wie kommen die Werte für und zustande? Ich habe die Zahlen jetzt mal mit R fitten lassen und es hat und ausgespuckt. Kann aber gut sein, dass ich was falsch gemacht habe. -- HilberTraum (d, m) 15:11, 11. Okt. 2016 (CEST)
Hallo HilberTraum, ich den Fit auf den blauen Daten (nur Artikel ohne BKS, Datensatz von gestern) mit Origin gemacht und dabei festgehalten, i.e. keine Verschiebung entlang der y-Achse erlaubt. Das Fitmodell y = y0 + A/(sqrt(2*PI)*w*x)*exp(-(ln(x/xc))^2/(2*w^2)) hat die Parameter etwas anders definiert, so dass , und rauskommen, so ich mich nicht vertue. In doppelt-logarithmischer Auftragung sieht das Fitmodell leider nicht mehr so gut für den Bereich oberhalb von ~10000 Bytes aus – die Daten fallen dort sehr schön ohne jegliche Beule bis zum Ende ab, aber signifikant langsamer als der Fit das tut. Das Konzept der gestreckten Exponentialfunktion könnte hier dem Gefühl nach besser passen, ich habe aber gerade kein Fitmodell dafür vorhanden – und wüsste auch nicht ob das am Ende irgendetwas helfen würde. Viele Grüße! —MisterSynergy (Diskussion) 15:38, 11. Okt. 2016 (CEST)
Quetsch: Ok, das sieht ziemlich professionell aus ;-) Soweit ich sehe berechnet die R-Funktion, die ich verwendet habe, einfach die Maximum-Likelihood-Schätzer. Dass der Plot bei ungefähr 10000 nicht so gut passt, ist mit aber auch aufgefallen. -- HilberTraum (d, m) 16:00, 11. Okt. 2016 (CEST)
Wenn man mit der einen, halblogarithmischen Grafik einen Kurzbericht schreiben möchte, was wäre dann erwähnenswert?
  • Datum, Gesamtanzahl Artikel, Gesamt-kB-Menge
  • Die kB-Grösse, die die meisten (Peak) Artikel haben. (2232 ?!)
  • Die Durchschnittsgrösse eines Artikel ist x kB.
  • 50 %, 75 % und 95 % aller Artikel liegen bei kleiner/gleich...
  • Die Top-5-% aller Artikel stellen x % der Gesamtdatenmenge dar.
  • Die drei Artikel mit den meisten kB
Andere interessante Spitzenwerte? Play It Again, SPAM (Diskussion) 15:46, 11. Okt. 2016 (CEST)
Also ich hab mich ja gefragt, welches die beiden Artikel mit gerundet null Byte sind ;-) -- HilberTraum (d, m) 16:05, 11. Okt. 2016 (CEST)
Nationales Pferdezentrum mit 47 Bytes (URV-Meldung) und White House Station (New Jersey) mit 48 Bytes (Vandalismus). —MisterSynergy (Diskussion) 16:11, 11. Okt. 2016 (CEST)

Ich versuche gerade nochmal Daten für verschiedene große Sprachversionen zusammenzubekommen. Leider ist enwiki zu groß, die Abfrage wird nicht innerhalb einer halben Stunde fertig. Ich versuche das später nochmal direkt von der Konsole, ohne das Quarry-Tool zu nutzen. —MisterSynergy (Diskussion) 16:34, 11. Okt. 2016 (CEST)

Auch das finde ich interessant, wir müssen es aber um "sprachspezifische Textlänge" korrigieren. Ich versuche herauszufinden, welche nummerischen Faktoren man für die Hauptsprachen gefunden hat. Gruss Play It Again, SPAM (Diskussion) 08:19, 12. Okt. 2016 (CEST)

Benutzer:MisterSynergy/Linkfixliste[Quelltext bearbeiten]

Hallo MisterSynergie,

könntest du zum Zwecke der Priorsierung Ähnlichkeiten zwischen Rotlinks auf Benutzer:Drahreg01/American Academy of Arts and Sciences/Wartung/Fehlende und Rotlinks in der Kategorie:Wissenschaftspreis analysieren?

Liebe Grüße und ein schönes Weihnachtsfest, --Drahreg01 (Diskussion) 10:56, 23. Dez. 2016 (CET)

Hallo Drahreg! Ja das schaue ich mir an, vermutlich aber erst im Januar. Ich bastle zurzeit an einem Websitecrawler in einer anderen Sache, und weil die Website bald offline geht ist das etwas dringlich. Dazu kommen natürlich diverse familiäre Verpflichtungen über Weihnachten, so dass die Urlaubszeit wikitechnisch vermutlich nicht so produktiv sein wird. Wenn es soweit ist, lade ich das Ergebnis auf der bekannten Seite ab, die Du einfach weiter beobachten kannst. Viele Grüße und eine schöne Zeit, MisterSynergy (Diskussion) 11:02, 23. Dez. 2016 (CET)
Selbstverständlich. Ich hatte keine Bearbeitung noch dieses Jahr erwartet. Vielen lieben Dank für deine Hilfe! --Drahreg01 (Diskussion) 15:41, 23. Dez. 2016 (CET)

@Drahreg01: ich will zum Verständnis nochmal nachfragen, was hier das Ziel sein soll. Möchtest Du tatsächlich die Rotlinks der Liste in Deinem BNR mit denen in den Artikeln in der Kategorie verglichen haben, damit die vereinheitlicht und dann abgezählt werden können? Das wäre möglich, ich will nur nicht wieder einen falschen Job ausführen und frage daher nach :-) Viele Grüße, MisterSynergy (Diskussion) 16:49, 24. Dez. 2016 (CET)

Eins vorab: Das soll eine höfliche Anfrage sein, deren Bearbeitung oder Irgendwann-Bearbeitung oder eben auch Nichtbearbeitung vollständig und ganz alleine deine Entscheidung ist.
Ursprung ist diese Debatte. Es geht darum, unter den fast 7.000 fehlenden Artikeln unter Benutzer:Drahreg01/American Academy of Arts and Sciences/Wartung/Fehlende solche zu finden, die (mehrfach) ausgezeichnete Wissenschaftler repräsentieren. Alle Artikel zu schreiben wird Jahrzehnte (oder Jahrhunderte?) dauern. Die wichtigsten könnten vielleicht eher geschrieben werden.
Viele Grüße, --Drahreg01 (Diskussion) 17:51, 24. Dez. 2016 (CET)
Hallo @Drahreg01, Du musst mir mit der Sache mal gerade helfen, ich stehe auf dem Schlauch. Ich habe mittlerweile dreimal (seit Anfang Januar) versucht, mit Petscan die Rotlinks aus Deiner Seite zu extrahieren – und das will einfach nicht richtig klappen??! An sich sollte die Abfrage ja sehr simpel sein – siehst Du da einen Fehler? Petscan hat so irre viele Funktionen, dass ich mit dem Ding ein wenig auf dem Kriegsfuß stehe… Viele Grüße, MisterSynergy (Diskussion) 23:41, 13. Jan. 2017 (CET)
Soweit ich das kapiere, werden rote Links ausgegeben, die auf Seiten stehen, die auf Benutzer:Drahreg01/American Academy of Arts and Sciences/Wartung/Fehlende blau sind. Warum PetScan das macht, habe ich noch nicht verstanden.
Was bedeutet die Tick box in den Ergebnissen?
Vielen Dank für deine Unterstützung. --Drahreg01 (Diskussion) 06:48, 14. Jan. 2017 (CET)
Guten Morgen! Deine Beobachtung sieht gut aus. Irgendwie hätte ich gedacht, dass Petscan da anders reagiert oder mglw. in der Vergangenheit auch anders reagiert hat.
Die Checkbox ist vermutlich ein Wikidata-Tool – für die angehakten Elemente gibt es nichts bei Wikidata passendes, und Du könntest Items erstellen. Die nicht angehakten Elemente sind zwar bei dewiki rot, aber es gibt mögliche Treffer bei Wikidata. Du kannst mal auf die check Wikidata-Links klicken und den Unterschied sehen. Petscan als Nachfolger von Catscan bietet als einziges Tool die Möglichkeit, Wikidata-Daten und Wikipedia-Kategorien in einer Anfrage zu kombinieren, das ist auch sehr nützlich. Aber die Benutzeroberfläche ist nicht optimal gelungen, finde ich…
Ich schaue nochmal weiter, was ich tun kann. Es gibt ja nicht nur Petscan… :-) MisterSynergy (Diskussion) 07:56, 14. Jan. 2017 (CET)

Guten Morgen @Drahreg01! Da ist nun ein Ergebnis auf der Linkfixseite – und das ist umfangreicher ausgefallen als ich es erwartet habe. Da beide Quellen einigermaßen in Eurem Einflussbereich liegen, habe ich diesmal deutlich weniger vorab händisch rausgefiltert. Bei der Abarbeitung scheint mir auch einiges an Spezialwissen über die Personen, deren Fachgebiete und die Wissenschaftspreise notwendig zu sein. Überlegt Euch also, inwiefern das Ergebnis für Euch nützlich ist. Viele Grüße! —MisterSynergy (Diskussion) 09:49, 20. Jan. 2017 (CET)

Hola, das sieht tatsächlich nach viel Arbeit aus – für dich in der Vergangenheit und für mich in der Zukunft! Erstmal herzlichen Dank dafür! Viele Grüße, --Drahreg01 (Diskussion) 11:43, 20. Jan. 2017 (CET)
Das ging heute morgen recht fix. Die Rotlinks aus Deiner Wartungsliste habe ich direkt übernommen, die aus der Kategorie kann ich mittlerweile mit ein paar Routineschritten per Datenbankabfrage an der Toolserver-Konsole ermitteln. Das Vergleichsskript hat für diesen Durchlauf einige wenige zusätzliche Zeilen Code (und entsprechende Funktionalität) bekommen, und der Durchlauf selbst dauerte dann aufgrund der erheblich niedrigeren Linkzahlen nur ein paar Minuten. Danach war nur noch das händische Nachfiltern und die Vorbereitung als Wikitabelle zu tun.
Lass Dir ruhig Zeit mit der Abarbeitung, und vielleicht können und wollen Dir Deine Wissenschaftlerkollegen auch helfen. Meinerseits besteht ausdrücklich keine Notwendigkeit zur eiligen Abarbeitung. Und ich würde Dir auch gern weitere Listen bauen, wenn Du bei der Korrektur nicht müde wirst :-)  Viele Grüße! MisterSynergy (Diskussion) 11:51, 20. Jan. 2017 (CET)
Noch eine Nachfrage: ich finde (zumindest unter A bis C als Anfangsbuchstaben) keine einzige 100%ige Übereinstimmung zwischen einem Eintrag in der linken und einem in der rechten Spalte. Das erscheint mir unplausibel. Spezial:Linkliste/Alexander Hollaender enthält auch zum Beispiel einen Wissenschaftspreis. Der müsste also auch in der rechten Spalte auftauchen!? (Konnte ich mich verständlich ausdrücken?) Liebe Grüße, --Drahreg01 (Diskussion) 16:05, 20. Jan. 2017 (CET)
Ich musste etwas nachdenken, aber jetzt verstehe ich Dein Anliegen.
Der grundlegenden Idee folgend müsste er tatsächlich auch auf der rechten Seite auftauchen, wegen der konkreten Implementierung meines Skriptes passiert das zurzeit nicht. Weniger weil ich das hier beabsichtigt habe, sondern mehr weil wir erstmals Rotlinks miteinander vergleichen, und nicht Blau- mit Rotlinks. So kann es jetzt vorkommen, dass Links tatsächlich in beiden Datensätzen vorkommen. Ich habe das Skript aber bisher so gebaut, dass in der Vergleichsdatenbank alle Links mit ihrer exakten Schreibweise nur einmal vorkommen können. Deine Liste habe ich zuerst importiert, deshalb ist die vollständig drin. Danach wurden die Rotlinks aus der Kategorie:Wissenschaftspreis importiert, wobei die bereits von der anderen Liste vorhandenen Exemplare nicht erneut rein kamen. Entsprechend steht der von Dir genannte Eintrag auf der rechten Seite nicht mehr, und bei einem 100 %-igen Treffer wäre eigentlich auch nichts zu tun. (Oder?)
Ich muss also die Beschreibung des Auswertungsergebnisses noch einmal dahingehend anpassen, dass diese Tatsache korrekt dargestellt wird (frühestens heute Abend). Wenn Du feststellst, dass der Import in genau umgekehrter Reihenfolge sinnvoller ist, dann kann ich Dir das gern noch einmal machen. Ich habe das Verhalten des Skriptes in diesem Punkt tatsächlich beim Auswerten nicht bedacht, und die Importreihenfolge deshalb zufällig, nicht bewusst aus den beiden Möglichkeiten gewählt.
Alles klar? :-)  Viele Grüße, MisterSynergy (Diskussion) 16:19, 20. Jan. 2017 (CET)
Nicht ganz klar bekloppt , was aber sicherlich an meinem mangelnden Intellekt liegt. <kopfkratz />
"Viel zu tun" ist mit der Liste zunächst ohnehin nicht. Ich bin mal diagonal über die Einträger gegangen, die rechts blau sind. Zu tun waren: einen Link fixen, eine BKL anlegen, eine Weiterleitung anlegen. Immerhin!
Intention war aber ja etwas anderes, nämlich die Priorisierung der >> 6000 Rotlinks auf Benutzer:Drahreg01/American Academy of Arts and Sciences/Wartung/Fehlende mit Hilfe des Kriteriums "hat (mehrere) Wissenschaftspreise gewonnen".
Liebe Grüße, --Drahreg01 (Diskussion) 16:41, 20. Jan. 2017 (CET)
<salopp>Also das mit dem „mangelnden Intellekt“ glaub ich Dir nicht. Dein Tun verrät Gegenteiliges :-)</salopp>
Ich hielte es auch nicht für clever, jetzt durch die Liste zu pflügen und Rotlinks auf Rotlinks umzubiegen. Hilfreich ist es aber sicher schon, bei der Anlage eines neuen Artikels schauen zu können, welche anderen Schreibweisen im Umlauf sind.
Die Zahl der gewonnenen Wissenschaftspreise (bzw. korrekter: die Zahl der Wissenschaftspreislisteneinträge in dewiki) je Rotlink kann ich glaub ich anders besser bestimmen, da ist das bisher genutzte Skript eigentlich nicht für prädestiniert. Ich muss ein bisschen hirnen und hoffe dann noch ein anderes Ergebnis liefern zu können… Viele Grüße, MisterSynergy (Diskussion) 16:52, 20. Jan. 2017 (CET)
Danke für die Blumen, aber ich verstell mich bloß...
Die schiere Zahl der Rotlinks ist ja wahrscheinlich relativ trivial und kann von Petscan ausgeliefert werden. Ist auch auf Benutzer:Reinhard Kraasch/Häufigkeiten Wissenschaftspreisträger dokumentiert. Die Zahl der ähnlichen links dagegen wäre ein echter Zugewinn. Danke, dass du hier Hirnschmalz investierst!
Vielleicht wäre ja eine absolute Zahl von Preisen (unabhängig von etwaigen Ähnlichkeiten zu meiner AAAS-Arbeitsliste) auch ein interessantes Objekt?
LG, --Drahreg01 (Diskussion) 17:10, 20. Jan. 2017 (CET)

Guten Morgen! So etwas ähnliches wie Benutzer:Reinhard Kraasch/Häufigkeiten Wissenschaftspreisträger basierend auf Deiner Liste bekomme ich mit einer Datenbankabfrage auch hin, das generiert jetzt aber keinerlei neue Einsicht (die Zahlen sind sehr ähnlich). Für solch eine Liste wären einheitliche Rotlinks natürlich schon dufte, aber das haben wir nicht – und das bekommen wir mit dem Status Quo auch kaum automatisiert ausgewertet.

Jetzt kratze ich mir am Kopf, ehrlich gesagt. Der ganze Bereich würde in meinen Augen von sauberen Daten bei Wikidata sehr profitieren, da könnte man dann auch ziemlich fix Häufigkeitslisten von dewiki-Rotlinks basierend auf verschiedenen Kriterien rausgenerieren. Allerdings wäre da wohl noch einige Arbeit zu tun, bis die Daten sauber bei Wikidata wären. Bin unschlüssig, wie ich Euch gerade helfen kann… Viele Grüße! —MisterSynergy (Diskussion) 10:22, 21. Jan. 2017 (CET)

Also, wenn du die fehlenden Preisträger aus der linken Spalte noch rechts ergänzen könntest, wie du es weiter oben schon mal angedeutet hattest, wäre ich dir schon sehr dankbar. Cluster aus ähnlichen Namen kann ich dann immer noch „händisch“ bilden.
Mit Wikidata bin ich nie richtig warm geworden. Ja, wenn man erst mal alle Informationen nach Wikidata trägt, kann man sie alle von dort wieder abholen. <sarkasmus />
Liebe Grüße, --Drahreg01 (Diskussion) 11:10, 21. Jan. 2017 (CET)
Hallo MisterSynergy, darf ich nochmal höflich fragen, ob du diese erweiterte Abfrage noch machen könntest? Wenn das (derzeit oder dauerhaft) für dich zu aufwändig ist, ist das für mich aber auch vollkommen ok. Ich bin dir für deine bisherigen Zuarbeiten mehr als dankbar. Liebe Grüße, --Drahreg01 (Diskussion) 23:04, 4. Mär. 2017 (CET)
Guten Abend! Ja, das habe ich noch im Kopf. Ich bin gerade heute aus dem Urlaub zurückgekehrt und möchte mich in der nächsten Zeit dransetzen, ebenso wie an den (einfacheren) nachstehenden Auftrag. Viele Grüße! MisterSynergy (Diskussion) 23:30, 4. Mär. 2017 (CET)

Schachanfrage[Quelltext bearbeiten]

Könntest du so eine Liste auf für die Kategorie:Schach erstellen? Es gibt da allerdings keine Vergleichsliste, ist das ein Problem? Zu vergleichen wären dann halt nur untereinander die Artikel in der Kategorie. 129.13.72.198 13:03, 20. Jan. 2017 (CET)

Ja, das stelle ich auch mal in die Warteschlange. Wie melde ich mich bei Dir, wenn das fertig ist? Das könnte nämlich ein paar Tage dauern. —MisterSynergy (Diskussion) 13:06, 20. Jan. 2017 (CET)
Auf meiner Diskussionsseite, die IP ist ja statisch. Oder ansonsten schau ich immer mal wieder hier rein. 129.13.72.198 13:10, 20. Jan. 2017 (CET)
Danke. Soweit alles erledigt. Allerdings hast du ja jetzt nur Blaulinks mit Rotlinks abgeglichen, oder? Was ist mit einem Vergleich der Rotlinks untereinander? 2A00:1398:9:FB00:5931:294E:69DD:6567 17:29, 24. Jan. 2017 (CET)
Eins nach dem anderen; rote Links blaumachen ist erstmal wichtiger gewesen als Rotlinks zu anderen Rotlinks umzukorrigieren. Das ist nämlich gar nicht so einfach, da mache ich Dir aber auch noch etwas fertig … Viele Grüße! —MisterSynergy (Diskussion) 17:31, 24. Jan. 2017 (CET)
Die Rotlinks sind nun da. —MisterSynergy (Diskussion) 20:32, 24. Jan. 2017 (CET)
Danke. 85.216.41.109 21:40, 24. Jan. 2017 (CET)

Ich hab einiges korrigiert. Kannst du beide Listen (also die Blaulink-Vergleichsliste und die Rotlink-Vergleichsliste) nochmal generieren? 129.13.72.198 11:23, 2. Feb. 2017 (CET)

Ja, dauert aber ein bisschen. —MisterSynergy (Diskussion) 11:26, 2. Feb. 2017 (CET)
Das dauert aber lange. Bei der letzten Abfrage hat es nur drei Tage gedauert. 129.13.72.198 16:29, 8. Feb. 2017 (CET)
Ich habe das nicht vergessen, bleibe bitte geduldig. Es könnte vielleicht heute Abend klappen. —MisterSynergy (Diskussion) 16:31, 8. Feb. 2017 (CET)

Jetzt ist mir grade aufgefallen, dass deine Schachabfrage wie folgt lautete: Vergleiche Blaulinks aus Kategorie:Person (Schach) mit Rotlinks aus Artikeln in der Kategorie:Schach. Was ich eigentlich wollte war Vergleiche Blaulinks aus Kategorie:Schach mit Rotlinks aus Artikeln in der Kategorie:Schach Kannst du das noch machen? 129.13.72.198 08:50, 1. Mär. 2017 (CET)

Hallo, ja das war eigentlich so Absicht. Wenn ich alle Blaulinks aus Kategorien wie Kategorie:Schach vergleiche, führt das manchmal zu schwierigen Ergebnissen. Da sind oft zu viele systematisch ähnliche Lemmata drin, was bei Personenkategorien so nicht der Fall ist. Ich versuche das trotzdem mal nächste Woche, bin nämlich zurzeit im Urlaub und da habe ich nur mein Dritt-Notebook ohne alle Wikipedia-Skripte dabei. Viele Grüße! --MisterSynergy (Diskussion) 17:50, 1. Mär. 2017 (CET)
Wieso dauert das so lange? 129.13.72.198 17:30, 22. Mär. 2017 (CET)
Ich bin auf längerer Dienstreise unterwegs und komme zu kaum etwas anderem. Schaue zwar täglich rein, aber zu mehr als ein paar wenige Kleinstedits hier und bei Wikidata reichts zurzeit einfach nicht. Ich habe Euch beide (und auch einige andere Jobs) nicht vergessen und werde mich drum kümmern, sobald meine Zeit es zulässt. Viele Grüße! MisterSynergy (Diskussion) 21:35, 22. Mär. 2017 (CET)
Der Nachschlag zur Schachanfrage ist nun da. Sorry fürs Warten lassen, ich hab zurzeit leider nicht viel Luft für Wikipedia-Arbeit. Viele Grüße! —MisterSynergy (Diskussion) 19:02, 14. Apr. 2017 (CEST)
Danke! 79.229.67.23 00:00, 15. Apr. 2017 (CEST)

Weblinkkrabbler[Quelltext bearbeiten]

Frohes Neues;

ich hätte da ein kleines Attentat in der Schublade.

  • Du bist mir bei den WP:BA angenehm aufgefallen und scheinst dich besser auf toollabs: auszukennen als ich.
  • Auf diese Seite kommend, lese ich zufällig im Abschnitt drüber „Ich bastle zurzeit an einem Websitecrawler in einer anderen Sache“ – vermutlich nur um eine Domain auszusaugen, aber geht schon in die richtige Richtung.
  • Ich hätte da etwas Zukunftsmusik.
    • Keine Angst, du müsstest nicht gleich die ganze WMF zum Glühen bringen; unser ANR würde für den Anfang reichen.
    • Ist auch keine unmittelbare Terminsache, liegt bereits ein Jahr in der Pipeline.
    • Die erste Stufe eines Mock-Up wäre scho schee.
    • Wobei man die Strukturen gleich ausbaufähig für die absehbar gierigen weiteren Wünsche halten kann, bloß derartige Abfragen erstmal nicht unterstützt.
    • Interaktive vielsprachige Formulare machen viel Arbeit; für den Anfang würden Abfragen per URL-Parameter auf Jahre hinaus reichen und wären eine wesentliche Hilfe für unsere Linkpflege; auch um diesen Diskussionsseitenwahnsinn ausschleichen zu lassen.

Gifti ist stark im RL eingespannnt und baut derzeit eher Bot-Projekte zurück, als dass sie noch neue Herausforderungen annehmen könnte.

  • Vielleicht überlässt sie dir aber ihre Datenbank als Anfangspopulation.
  • Vielleicht lässt sie auch den Krabbler bis auf Weiteres weiterlaufen, so dass dessen Ergebnisse einmal monatlich in deine neustrukturierte Datenbank übernommen werden können, und du persönlich erstmal keine Websites kontaktieren brauchst; falls das einfacher wäre.
  • Sicher würde sie dich in ihren Krabbler-Code gucken lassen, auch wenn das mutmaßlich nicht byteweise in ein neu und auf Zuwachs designtes System übernommen werden könnte. Auf jeden Fall kann sie in haushaltsüblichen Mengen Tipps geben und Fragen zum schlauesten Vorgehen aus ihrer Erfahrung beantworten.

Ein toollabs:weboid wäre toll, und wenn das als Mock-Up erstmal liefe (mir ist zurzeit kein vergleichbares Projekt aus einem anderen Wiki bekannt), dann kämen sicher auch Leute aus der enWP hinzu, und auch Gifti würde wohl als wenigstens passives Mitglied einsteigen.

Antwort hat keine Eile; erfolgreiches 2017 --PerfektesChaos 10:14, 5. Jan. 2017 (CET)

Hallo und Frohes Neues! Ich nehme diese Anfrage zunächst einmal ohne Bewertung zur Kenntnis und denke ein paar Tage drüber nach. Du bekommst hier auf der Seite Ping, wenn ich mich dazu äußern kann! :-)  Viele Grüße, MisterSynergy (Diskussion) 12:08, 5. Jan. 2017 (CET)

Hilfe bei Wikidata List für Unix-Wikiprojekt[Quelltext bearbeiten]

Hallo MisterSynergy,

ich habe vor kurzem eine Frage in Wikipedia:Fragen zur Wikipedia gestellt und von deiner Erfahrung dort profitiert. Ich habe jetzt wie verabredet die Vorlage:Wikidata list eingebunden. Ich habe ein paar erste Versuche gestartet (um ehrlich zu sein hauptsächlich copy&paste). Ich komme aber noch nicht sehr weit und ich bin auch nicht sicher,ob der Bot wirklich meine Seite aktualisiert.

Kannst du mir ein wenig unter die Arme greifen? Du kannst auch gerne Benutzer:Hundsrose/Wikidata Spielwiese bearbeiten, falls du möchtest.

Vielen Dank für die Hilfe. Beste Grüße --Hundsrose (Diskussion) 21:29, 22. Okt. 2018 (CEST)

Hallo Hundsrose, ich war dran und habe einen Vorschlag gemacht. Probleme mit Deinem Start waren:
  • Die Vorlage braucht eine weitere Vorlage {{Wikidata list end}} zum Abschließen, und der Bot editiert danach alles zwischen den beiden Vorlagen. Die zweite fehlte, deshalb mochte er nicht.
  • Außerdem fehlte bei der SPARQL-Abfrage die abschließende geschweifte Klammer.
Ansonsten habe ich ein paar Beispieldaten aus Wikidata ergänzt, und das alles nach der Lizenz in Abschnitte gruppieren lassen. Die meisten Programme haben tatsächlich noch keine Lizenz bei Wikidata angegeben, deshalb erscheinen die im letzten Abschnitt.
Änderungen musst Du nun in Wikidata vornehmen, und dann die Liste manuell aktualisieren lassen (sonst tut der Bot das alle paar Tage, kannst Du auch irgendwo einstellen).
Abgesehen von der ersten Spalte sollten keine Q-Identifikatoren erscheinen. Wenn das doch passiert, fehlt im entsprechenden Objekt die deutschsprachige Bezeichung (label).
Du kannst gern an der Liste weiter ausprobieren, und/oder bei Wikidata die Objekte besser mit Informationen ausstatten. Eine Übersicht der zurzeit genutzten Aussagen in den Objekten findest Du mit dieser Abfrage; da dürfen aber natürlich auch (passende) andere Eigenschaften genutzt werden.
Have fun. Bei Fragen kannst Du gern in diesem Abschnitt weiterfragen. Viele Grüße! —MisterSynergy (Diskussion) 22:43, 22. Okt. 2018 (CEST)
Vielen Dank, MisterSynergy. Sieht sehr beeindruckend aus. Ich bin momentan noch ein wenig erschlagen von der Informationsmenge, werde mir aber bei Gelegenheit etwas mehr Zeit nehmen um mich einzuarbeiten und zu experimentieren. Ich freue mich meinen ersten Ansprechpartner in Wikidata gefunden zu haben. :) Vielen Dank. Liebe Grüße --Hundsrose (Diskussion) 22:56, 22. Okt. 2018 (CEST)
Hallo MisterSynergy. Ich habe leider noch nicht das manuelle Update eingestellt, kannst du mir erklären wie ich das mache? Außerdem würde gerne ein paar Lizenzen in der Kategorie Misc eingetragen, wie z.B. für alias (Unix). Ich weiß aber nicht wo ich die Informationen erhalte und wie ich sie belegen kann. Kannst du mir weiter helfen? Vielen Dank und beste Grüße --Hundsrose (Diskussion) 18:29, 3. Dez. 2018 (CET)
Hallo Hundsrose, ganz oben auf der Seite gibt es einen Link “Liste manuell aktualisieren”, noch vor dem Inhaltsverzeichnis. Wenn Du den klickst, kommt der Bot unverzüglich vorbei und aktualisiert die Seite basierend auf dem aktuellen Stand der Objekte in Wikidata. Zurzeit passiert allerdings nichts – es sind keine Änderungen seit dem letzten Update zu machen, weil sich an den Objekten in Wikidata nichts geändert hat.
Hinsichtlich zu ergänzender Lizenzen: da wäre Recherche gefragt. Ich kenne mich in dem Themengebiet nicht besonders aus, deshalb kann ich nicht sagen, wo es Lizenzinformationen zu den Tools gibt. In einigen Fällen steht in den Englischsprachigen Wikipediaartikeln etwas drin. Wenn Du erstmal keine Fundstellen angeben kannst, ergänzt Du das ohne Fundstelle in Wikidata. Solange da niemand anderer Meinung ist, ist das kein echtes Problem. —MisterSynergy (Diskussion) 19:36, 3. Dez. 2018 (CET)

Hallo MisterSynergy (hoffentlich dieses Mal richtig geschrieben), vielen Dank für die Infos! Beste Grüße --Hundsrose (Diskussion) 20:30, 3. Dez. 2018 (CET)

Ausdrücklich gern wieder. Ich habe Deine Arbeitsseite im Übrigen auf der Beobachtungsliste und schaue mindestens interessiert zu, was Du da so machst :-) Viele Grüße, MisterSynergy (Diskussion) 22:34, 3. Dez. 2018 (CET)
Das freut mich zu hören. :) Bezüglich der Lizenzen habe ich übrigens eine Anfrage in der englischsprachigen Wikipedia gestellt:
en:Wikipedia:Reference_desk/Computing#Sources/References_for_licences_of_Unix_commands_to_implement_in_Wikidata. Viele Grüße
--Hundsrose (Diskussion) 13:50, 4. Dez. 2018 (CET)
Vielen Dank für deine Korrektur auf meiner Seite. Ich wollte die Gruppierung aufheben, da in der obigen Diskussion in der englischsprachigen Wikipedia klar wurde, dass das Thema Lizenzen in Unix nicht ganz so trivial ist. Ich habe in der Doku von Wikidata list gesehen, dass section optional ist. Ich dachte sie kann daher auch fehlen, also auskommentiert werden. Viele Grüße --Hundsrose (Diskussion) 15:56, 5. Dez. 2018 (CET)
Kurz bei enwiki die Diskussion überflogen: ja, es macht klar Sinn, dann nicht nach Lizenzen zu gruppieren. Du kannst nun selbst entscheiden, ob Du die Information da drin stehen lassen möchtest, oder nicht; vielleicht ist ja mittelfristig was anderes interessanter. Wegen der Auskommentierung: ich hätte das möglicherweise ähnlich versucht, aber der Bot ist halt gestolpert. Bei dem Ausfüllen von der Vorlage hilft häufig Ausprobieren, wenn etwas nicht wie erwartet klappt. Viele Grüße! —MisterSynergy (Diskussion) 16:15, 5. Dez. 2018 (CET)

Ich habe die Anzahl der Spalten jetzt etwas verkürzt. Mir ist leider noch nicht ganz klar, wie in der zweiten Spalte das deutsche (und z.B nicht das englische) Label erkannt und anschließend auch verlinkt wird. Woher weiß ich dass der englische Link ?sitelinkEN:enwiki und nicht ?sitelinkEN heißt? Was war ?schema ? Ich habe die Wikidata-Hauptseite besucht, finde aber die Dokumentation zu Variablen und Parameter noch nicht (verstehe aber im Allgemeinen was Quantity und Property sind). Viele Grüße --Hundsrose (Diskussion) 19:13, 5. Dez. 2018 (CET)

  • Zu den Spaltenüberschriften: eigentlich versucht der Bot, selbst was passendes da hinzuschreiben; wenn Du zum Beispiel im Parameter |column= unter anderem eine Spalte P31 definierst, dann schreibt der Bot die deutschsprachige Bezeichnung (in der deutschsprachigen Wikipedia) der Eigenschaft ist ein(e) (P31) da als Spaltenüberschrift hin (also "ist ein(e)"). Es gibt gemäß en:Template:Wikidata list auch einen optionalen Parameter |language=, mit dem Du eine andere Sprache auswählen kannst als die Standardsprache des Projektes, in dem Du Dich gerade befindest (ListeriaBot ist in ziemlich vielen verschiedensprachigen Projekten vorhanden). Auf der anderen Seite, wenn Du mit der automatisch generierten Spaltenüberschrift nicht zufrieden bist, dann kannst Du auch selbst eine vorgeben. Das wird mit Doppelpunkt von der Spaltendefinition getrennt, also bekommst Du beispielswiese bei "P31:foo" eine Spaltenüberschrift "foo" für die Spalte, in der die P31-Daten stehen. Spalten aus dem SPARQL-Ergebnis (also solche, die mit Fragezeichen beginnen), brauchen meines Wissens eigentlich immer eine händisch vorgegebene Spaltenüberschrift. Demnach greift "?sitelinkEN:enwiki" auf die SPARQL-Variable "?sitelinkEn" zu, und schreibt als Spaltenüberschrift "enwiki" drüber.
  • Zu "schema": ich nehme an, Du beziehst Dich auf das "schema" in der SPARQL-Abfrage. Das hat mit dem RDF-Modell zu tun. Ich habe glaub ich letztens schonmal länglich bei WP:FZW grob ausgeführt, wie SPARQL als Abfragesprache für Graphdatenbanken funktioniert: Graph in gerichtete Tripel zerlegen, davon haben wir gut 6 Milliarden, und dann Tripel mit bestimmten Eigenschaften suchen. Die Tripel kannst Du Dir als "Subjekt, Prädikat, Objekt"-Tripel vorstellen, wobei für alle drei Komponenten je nach Situation verschiedene "Vokabulare" in Frage kommen. Einige Vokabulare definiert Wikidata selbst (Objekte, Eigenschaften, etc.), andere sind Standard-Vokabulare. "schema" ist ein bei https://schema.org/ definiertes Standardvokabular, welches bei Wikidata unter anderem dafür genutzt wird, einen Sitelink zu einem Objekt in Relation zu setzen. Hier also: <https://de.wikipedia.org/wiki/Douglas_Adams> <http://schema.org/about> <http://www.wikidata.org/entity/Q42>; anschaulich: Douglas Adams (=Subjekt) ist ein Artikel über (=Prädikat) "Douglas Adams" (=Objekt). Etwas allgemeiner: wenn Du den Wikidata SPARQL Endpoint nutzen möchtest, brauchst Du zwei Dinge: Kenntnisse in SPARQL (der Abfragesprache), und Kenntnisse über das Wikidata-Datenmodell (wie also die Tripel in der Praxis aussehen). Für SPARQL dürften Deine mutmaßlich vorhandenen SQL-Kenntnisse helfen, auch wenn SPARQL durchaus anders ist, plus entweder ein (einfaches) Buch oder – so mache ich das – die SPARQL 1.1-Referenz. Das Wikidata-Datenmodell ist auf Objektseiten im Wikidata Web-Frontend nicht erkennbar, das ist jedoch unter mw:Wikibase/Indexing/RDF Dump Format vollumfänglich beschrieben; beachte darin insbesondere auch das Bild recht weit oben. Das Datenmodell erlernt man nicht mal ebenso nebenbei, sondern eher Schritt für Schritt durch verschiedene Anwendungsfälle.
MisterSynergy (Diskussion) 23:55, 5. Dez. 2018 (CET)

Vielen Dank für deine Erklärungen.

  • Zu den Spaltenüberschriften: Bei den Spaltenüberschriften war ich mir nicht ganz sicher, ob der Bot per Default die Standardsprache des jeweiligen Projekts verwendet oder nicht. Die Verwendung der Interwikilinks-Variablen ergeben jetzt auch mehr Sinn. Was mich sehr interessieren würde, wäre wie ich den Artikelnamen statt des ganzen Links ausgeben kann ,also z.B. en:alias (command) oder besser alias (command) statt https://en.wikipedia.org/wiki/Alias_(command).
  • Vielen Dank für die Links RDF, SPARQL 1.1-Referenz und mw:Wikibase/Indexing/RDF Dump Format. Das hilft mir schon mal sehr. Schema ergibt jetzt auch mehr Sinn.
  • Ich habe im SPARQL-Query-Editor angefangen zu üben und eine Tabelle für Unix-Kommandos erstellt welche englische, aber keine deutsche Artikel haben. Ich habe versucht diese zusätzliche Tabelle auf meiner Seite zu implementieren, hat aber leider nicht ganz geklappt. Darf nur ein Wikidata-List-Element eingebunden werden oder habe ich Klammern falsch gesetzt. Kannst du vielleicht noch mal reinschauen?
  • Vielen Dank für deine Unterstützung und deine Geduld. Ich plane noch sehr viel zu üben, aber momentan habe ich noch ein paar Startschwierigkeiten. Liebe Grüße --Hundsrose (Diskussion) 01:11, 6. Dez. 2018 (CET)
  • Das mit der Formatierung der enwiki-Links machen wir später (ist aber nicht schwer). Erstmal: je Seite nur eine Listeria-Liste, bitte. Sonst weiß der Bot nicht, wo er hinschreiben soll ;-) Wenn Du das auf eine Version zurückgebaut hast, dann kann ich gern die enwiki-Links formatieren.
  • Beim Wikidata SPARQL Endpoint kannst Du üben und Abfragen ausprobieren. Wenn das darin klappt, dann (meistens) auch mit dem Listeria-Bot. Tatsächlich bin ich vor drei Jahren ähnlich unbedarft eingestiegen: ich hatte selbsterlernte, grundlegende SQL-Kenntnisse, und hab mir SPARQL dann ebenfalls selbst beigebracht und natürlich nebenbei auch das Wikidata-Datenmodell kennengelernt – so sehr, dass ich auf die genannten Links nur noch sehr selten zugreifen muss. Ausweislich Deiner Beitragsliste vermute ich, dass Du auch bereits SQL-Kenntnisse mitbringst, insofern wärest Du gut vorbereitet, auch SPARQL hinreichend gut zu lernen.
  • Dein Ansinnen, Objekte ohne dewiki-Artikel auszugeben, ist schon weit gediegen. Zwei Sachen: erstens entferne GROUP BY ?item ?sitelinkEn am Ende, da Du nichts weiter aggregierst (keine Operation GROUP_CONCAT(), SUM(), COUNT(), oder so). Dann kannst Du zweitens in der ersten Zeile auch ?sitelinkDE entfernen, weil das natürlich alles leer sein wird ;-)
Jetzt erstmal gute Nacht. —MisterSynergy (Diskussion) 01:31, 6. Dez. 2018 (CET)

Hallo MisterSynergy, vielen Dank, dass du mir bis spät in die Nacht Fragen beantwortet hast.

  • Ich habe die Abfrage modifiziert und auf Benutzer:Hundsrose/Wikidata Spielwiese 2 verschoben. Leider ergibt die Abfrage noch keine Ergebnisse. Siehst du den Fehler? Ich bin auch sehr gespannt auf die Kurzschreibweise der Links.
  • Die Abfragen mit Wikidata SPARQL Endpoint funktionieren schon recht gut, am obigen Punkt erkennst du wahrscheinlich schon, dass ich bei der Implementierung mit dem Listeria-Bot noch etwas Probleme habe. Im Allgemeinen wird meine Vorgehensweise bezüglich des Lernprozesses ähnlich sein.
  • Das GROUP BY ?item ?sitelinkEn habe ich entfernt. Ich benötige ?sitelinkEn aber immer noch im SELECT, nur nicht mehr bei |columns ,oder?

Vielen Dank für die Hilfe. Viele Grüße --Hundsrose (Diskussion) 20:21, 6. Dez. 2018 (CET)

Weiblich bei der deWP vs. männlich bei VIAF/DNB[Quelltext bearbeiten]

Hallöchen! Kannst du mal gucken, ob es noch so einen Fall wie bei Yang Lei (ist schon korrigiert, ev. Versionsgeschichte gucken) gibt, wo einer eindeutig weiblichen Person (deWP) Normdaten einer männlichen Person zugeordnet wurden? Es mag da sicher ein paar geben, welche eine Geschlechtsumwandlung machten, aber hoffentlich kaum welche wie dieser Fall. Danke! --Wurgl (Diskussion) 11:14, 15. Nov. 2018 (CET)

Hallo Wurgl, ich kann die Geschlechter aus VIAF und GND mit denen in Wikidata (Geschlecht (P21)) vergleichen, basierend auf den Identifikator-Links VIAF-Kennung (P214) und GND-Kennung (P227) im jeweiligen Wikidata-Objekt. Weiter könnten wir mit Petscan Fälle finden, wo das Geschlecht in Wikidata und dewiki abweichend ist. Auf die dewiki-lokalen Identifikatoren kann ich bisher nicht direkt zugreifen.
Jedenfalls müsste ich sowieso erstmal ein bisschen Code schreiben, das schaffe ich frühestens heute Abend, spätestens (hoffentlich) am Wochenende. Die DNB würde ich über User:Jneubert’s SPARQL-Endpoint befragen, für VIAF habe ich den aktuellsten RDF-Dump bereits lokal vorliegen und die Geschlechter daraus ermittelt. Da könnte ich Dir aber auch eigentlich direkt die Textdatei mit VIAF-ID -> gender zukommen lassen (~115M Größe, ~5.48M Zeilen). —MisterSynergy (Diskussion) 11:41, 15. Nov. 2018 (CET)
Kein Stress! Weihnachten ist früh genug :-) Den DNB-Dump hab ich auch. Das Geschlecht lässt sich durch Kategorie:Mann vs. Kategorie:Frau ermitteln (gäbe dann noch ein paar in Kategorie:Person_nach_Geschlecht aber das sind so wenige, das muss nicht sein). Ich kann hier nur nicht diese zwei Datensätze direkt miteinander verknüpfen – ich müsste die zu Fuß einzeln vergleichen. Und es reicht erstmal der Vergleich Wikidata mit der DNB. --Wurgl (Diskussion) 12:00, 15. Nov. 2018 (CET)

So, hier wäre schonmal etwas:

Wenn ich das Ergebnis anschaue, sieht das aber so aus als seien das fast ausschließlich Fehler in der GND, nicht in Wikidata. Möglicherweise ist das jetzt kein so hilfreiches Ergebnis für Dich, denn Du hast ja implizit angenommen, dass die Informationen aus der GND korrekt sind, und Du per Abgleich hier Fehler finden kannst. Sieht aber eher so aus, als müssten im Wesentlichen die GND-Leute was reparieren (@Kolja21 bei der Gelegenheit).

Wegen der VIAF-Sache schicke ich Dir heute Abend eine Email mit den Rohdaten. Da kannste dann selbst vergleichen ;-) Viele Grüße, MisterSynergy (Diskussion) 17:23, 15. Nov. 2018 (CET)

Ja is' denn heut schon Weihnachten? Ui, gleich der/die erste ist eine harte Nuss. Die Quellen sind Japanisch. Und Google übersetzt die sehr schlecht. Aber wenn ich den Lebenslauf (Einzelnachweis 1) bei google Translate einwerfe, dann steht schon im ersten Block "Tochter". Zweite Stichprobe ist wohl ein Fehler von filmportal.de --Wurgl (Diskussion) 17:51, 15. Nov. 2018 (CET)
Ich hab mir die beiden mal in Benutzer:Wurgl/Zeugs2 zurechtgelegt. Muss erstmal ein Gefühl dafür bekommen, bevor ich irgendwen mit Mails oder so zuschütte. (falls jemand mitliest, Hilfe ist willkommen). --Wurgl (Diskussion) 20:41, 15. Nov. 2018 (CET)
Danke für den Ping. Leider können wir diese Fehler nicht über das GND-Webformular korrigieren. (Ich vermute mal, es werden kaum Tp4 oder Tp6 darunter sein.) Ich würde vorschlagen, die Tabelle an die aktuelle Monatsliste unter WP:GND/F dranzuhängen. --Kolja21 (Diskussion) 21:08, 15. Nov. 2018 (CET)
Ich generier dann aus der Tabelle eine Fehlermeldungsliste für Copy/Paste. Aber erst möchte ich die einzeln anstarren. Wie gehen wir bei filmportal um? Denen eine Mail mit Hinweis schicken und hoffen, dass die dann die Änderungen auch bei der DNB machen, oder einfach an filmportal zusätzlich eine Mail? --Wurgl (Diskussion) 21:16, 15. Nov. 2018 (CET)
Das wäre auch eine Möglichkeit: Erst das Filmportal anschreiben, und dann die Meldung an die DNB, falls das Filmportal nicht die Korrekturen vornimmt. --Kolja21 (Diskussion) 21:23, 15. Nov. 2018 (CET)
i Info: Der Dump ist zwar am 6. November ins Netz gestellt worden, der Datenbestand ist wohl von vor dem 18. Oktober. Bei Tp 1062238087 ist das schön zu sehen. Im Dump sind keine Lebensdaten enthalten, auf der Webseite aber schon. Und wenn man dann rechts bei "RDF (Turtle)-Repräsentation" reinguckt, dann ist dort das letzte Änderungsdatum zu sehen und das ist 2018-10-18T11:00:15.00 – ähnlich wie bei Adolf von Stählin. Denk dir also nix dabei. --Wurgl (Diskussion) 11:35, 16. Nov. 2018 (CET)
Danke, gut beobachtet. Ich hätte allerdings schon erwartet, dass die RDF-Einzeldateien auch jederzeit auf dem aktuellen Stand sind. Dass der Dump es nicht ist, ist ja selbstverständlich. —MisterSynergy (Diskussion) 11:48, 16. Nov. 2018 (CET)
Wobei das schon merkwürdig ist. Im RDF-Einzelfile von Stählin wird das Aktulisierungsdatum aktualisiert, aber die aktualisierten Daten nicht? Gemäß dieser archivierten Version stand da im Übrigen schon länger (2016-01-30) männlich in im Web-Frontend, und im archivierten RDF-Einzelfile female (2016-10-10). Da scheint doch irgendetwas kaputt zu sein. —MisterSynergy (Diskussion) 11:56, 16. Nov. 2018 (CET)
(BK) Hast jetzt flash verstanden. Die RDF-Einzeldaten sind am aktuellen Stand, nur der Dump ist aber älter als er vorgibt. (scheint am 13. Oktober nach 15 Uhr (GMT oder UTC) erzeugt worden zu sein) --Wurgl (Diskussion) 12:04, 16. Nov. 2018 (CET)
Bei Stählin passt es eben nicht. Er ist männlich im Web-Frontend [1] und weiblich im aktuellen RDF-Einzelfile [2] (Zeile 69). —MisterSynergy (Diskussion) 12:07, 16. Nov. 2018 (CET)
Der ist echt klasse! Ich schick mal ne Mail an meinen Kontakt und frag mal ganz blauäugig … aber zuerst muss ich ein Pizza inkorporieren ;^) --Wurgl (Diskussion) 12:12, 16. Nov. 2018 (CET)
Nette Antwort bekommen. Im Datensatz sind zwei Einträge zum Geschlecht und damit kann der Export nicht so toll umgehen. Wird bald korrigiert. Hier ist noch so ein ähnlicher Fall Tp 119362252, sind wohl auch zwei Angaben aber nicht versehentlich, sondern wegen Geschlechtsangleichung. --Wurgl (Diskussion) 16:45, 16. Nov. 2018 (CET)
Magst du bitte mal einen Blick auf d:Q15447639 bzw. Yoshio Yoshida werfen? Da war eine Hausnummer als GND-ID zugeordnet und entsprechendes Chaos bei Wikidata. Vielleicht hab ich ja was übersehen oder falsch gemacht. Danke! --Wurgl (Diskussion) 08:46, 18. Nov. 2018 (CET)
An sich okay, wobei bei Fehlern der Größenordnung es angemessen ist, das alte Objekt als “ill-defined” zu löschen, und die Informationen in ein neues Objekt zu übertragen. Ich mache das mal eben, danke für den Hinweis… —MisterSynergy (Diskussion) 09:25, 18. Nov. 2018 (CET)
Es gibt nun Yoshio Yoshida (Q58835715) und Valerie Etienne (Q4007836), welches ebenfalls ein paar neue Aussagen bekommen hat. Das alte Objekt ist gelöscht. Ursache waren wohl falsche Normdaten im dewiki-Artikel, und dann Importe basierend auf der falschen VIAF-ID. —MisterSynergy (Diskussion) 09:37, 18. Nov. 2018 (CET)
Danke! Das war der zweite Fehler hier in der deWP. Von den Fehlerchens in der DNB ist Tp 115366148 mein Favorit! Hab hier mehr Fehler erwartet, aber ist so besser. --Wurgl (Diskussion) 10:29, 18. Nov. 2018 (CET)

Hilfe bei Commons-Wartungskategorie[Quelltext bearbeiten]

Moin Moin MisterSynergy, ich schaue mal, ob ich bei dir richtig bin, bzw. ob du mir helfen kannst. Ich versuche auf Commons Wartungskategorien abzuarbeiten, die in Zusmamenhang mit der Wikidata Infobox stehen. Dabei ist mir aufgefallen, dass ich zu Fuß viel zu langsam bin. Es geht z.B. um commons:Category:Uses of Wikidata Infobox with no given name, hier kommen immer wieder gleiche Vornamen vor. Gibt es eine Möglichkeit, sich diese Kategorie in eine Art Excel zu ziehen, eine P-Nummer und eine Q-Nummer zu vergeben und automatisiert einzulesen? Danke schonmal vorab, Rückfragen und/oder Anregungen nehme ich gerne entgegen. mfg --Crazy1880 07:33, 29. Nov. 2018 (CET)

Hallo Crazy1880, ja tatsächlich kann man in solch einem Fall automatisieren. Das populärste Tool dafür heißt „QuickStatements“, und dafür gibt es bei wikidata:Help:QuickStatements ein umfassendes Manual. Den Tool-Input kannst Du tatsächlich mit Excel vorbereiten, dazu gibt es Screenshots im Manual (die Tool-Oberfläche sieht allerdings mittlerweile ein bisschen anders aus). Es gibt auch einfache Tutorial-Videos dazu, zum Beispiel hier (ebenfalls mit der leicht veralteten Tool-Oberfläche).
Ob das gerade bei Vornamen jetzt besonders hilfreich ist, will ich aber mal bezweifeln. Die Vorname (P735)-Eigenschaft ist bereits relativ stark verbreitet, und der Blick in die Commons-Wartungskategorie zeigt weiterhin, dass vor allem eher ungewöhnliche Vornamen fehlen, bei denen dazu Transkription aus einem anderen Schriftsystem eine Rolle spielt. Dazu gibt es oft noch keine Objekte. Vielleicht kannst Du hier und da 10 Vornamen ergänzen, so richtig wirst Du aber keine Bäume ausreißen können.
In commons:Category:Wikidata infobox maintenance fallen vor allem drei Wartungskategorien auf, die augenscheinlich echten Wartungsbedarf anzeigen:
Grundsätzlich scheinst Du über Petscan mit dem Batch-Editing in Wikidata vertraut zu sein, aber QuickStatements hast Du offenbar noch nicht genutzt. Unabhängig davon ob das in dieser Sache jetzt wirklich weiterhilft, kannst Du Dir das Tool merken und vielleicht später irgendwann einsetzen. Bei Fragen helfe ich gern weiter. Viele Grüße! —MisterSynergy (Diskussion) 08:23, 29. Nov. 2018 (CET)
Moin und danke für die schnelle Antwort.
  • Hast du rein zufällig noch ein Tool, was aus Kategorie eine Excel-Datei macht?
  • Ja, die Kategorien stehen früher oder später auch mit auf dem Plan.
mfg --Crazy1880 10:59, 29. Nov. 2018 (CET)
„Hast du rein zufällig noch ein Tool, was aus Kategorie eine Excel-Datei macht?“ — ich verstehe nicht so recht. Möchtest Du alle Wikidata-Objekte von Membern einer Kategorie in Commons in Excel haben? Dann wäre Petscan das richtige Tool. Wenn Du mir eine Kategorie zeigst, mache ich Dir den Link fertig. —MisterSynergy (Diskussion) 11:03, 29. Nov. 2018 (CET)
Korrekt, die oben verlinkt Kategorie: commons:Category:Uses of Wikidata Infobox with no given name hätte ich gerne mit den Einträgen in Excel. Wenn ich es versuche, bekomme ich nur vier Einträge angezeigt. ;(
Dann stelle ich mir vor, dass man in einer Spalte in Excel die P-Nummer und eine Spalte mit Q-Nummer füllt und diese dann einlesen lassen kann. Hoffentlich geht soetwas.
mfg --Crazy1880 12:54, 29. Nov. 2018 (CET)
Dann wohl das hier. Du müsstest noch beim „Output“-Tab das TSV- oder CSV-Format einstellen, damit das einfach in Excel reinzukopieren ist. —MisterSynergy (Diskussion) 13:29, 29. Nov. 2018 (CET)
Okai, zu doof dazu. Ich gebe in QuickStatement ein "Q6586284TABP735TABQ16002118" so wie in der Hilfe beschrieben und bekomme => No valid commands found. Die Doku finde ich persönlich auch eher schlecht und auch das Video hilft mir nicht. mfg --Crazy1880 19:36, 29. Nov. 2018 (CET)
Kopiervorlage:
Q6586284	P735	Q16002118
Versuch das bitte im QuickStatements-Tool einzugeben (einloggen, "Neuer Stapel", ins Textfeld reinkopieren, dann "V1 Anweisungen importieren" klicken). Bei mir funktioniert das… —MisterSynergy (Diskussion) 21:11, 29. Nov. 2018 (CET)
Moin, ahh, wenn ich den Tab von extern hereinkopiere, dann scheint es zu laufen. Wenn ich dort Tab drücke, springe ich nur zur nächsten Schaltfläche. Wenn man weis wie's läuft. Danke, ich schaue da mal. mfg --Crazy1880 10:45, 30. Nov. 2018 (CET)

Nun Namensabgleich *seufz*[Quelltext bearbeiten]

Hallöchen!

Ich versuche gerade was zu basteln, das die Namen bei uns (Lemma + Alternative Namen in Vorlage Personendaten) mit den Namen (und Varianten) bei der DNB abgleicht. Wobei ich mich mal auf Personen beschränke. 352.000 Personen mit DNB gibts momentan hier. Und bei 307.000 gibt es auch eine 1:1-Übereinstimmung. Mit etlichen Schätz-O-Maten hab ich das mal etwas reduziert, bin jetzt bei 12.700 (wobei sich 2900 davon nur durch einen Buchstaben unterscheiden), sind aber immer noch viel zu viele. Ich will so auf 1000 runterkommen, wird aber wohl nicht klappen.

So nebenbei beim Durchgucken der Debug-Ausgaben hab ich ich schon mal zwei gefunden und korrigiert: Oskar Lapp (da war ein Fritz Lapp drangehängt) und Franz Jakob Späth (da war ein Franz Joseph Späth dran). --Wurgl (Diskussion) 19:54, 30. Nov. 2018 (CET)

Moin! Ich verstehe das weitgehend, aber hast Du jetzt eine Aufgabe für mich, oder brauchst Input?
Leicht offtopic: ich habe mal zur Rotlinkkorrektur in Wikipedia verschiedene Namensvergleichsskripte geschrieben, die vor allem Levenshtein-Distanzen und ein paar ähnliche Metriken zwischen zwei Strings (Namen) ausgerechnet haben; solche Funktionen sind in PHP und Python eingebaut, oder einfach als Modul zu ergänzen, und möglicherweise auch in anderen Skriptsprachen verfügbar. Wenn man diese Stringähnlichkeits-Metriken ausrechnet, kann man dann besonders deutliche Abweicher auflisten und diese zuerst anschauen. Viele Grüße! —MisterSynergy (Diskussion) 22:41, 30. Nov. 2018 (CET)
Moin ist erst in 30 Minuten *kicher* Levensthein hab ich implementiert, das sind die 2900. Das Problem sind die einerseits die transkribierten Namen aus kyrillischem und arabischem Zeichensatz und zusätzliche Namensteile bei der deWP und bzw. bei der DNB und da schlägt Levensthein extrem aus. Ich bin am Überlegen, ob ich noch die Namensversionen (Lemmata) der anderssprachigen Wikipedias vergleiche, eventuell reduziert das weiter. Oder bei Wikidata dieses "Auch bekannt als" … Wenn du da Ideen hast?
Beispiele für Problemfälle: Anatoli Borissowitsch Tschubais oder ʿAbd al-Qādir al-Dschīlānī für die Transkription. Hans Wilbert Petri (der Wilbert) und John Ponsonby, 4. Earl of Bessborough (der Willliam, nicht der 4. Earl etc.) für zusätzliche Namensteile. --Wurgl (Diskussion) 23:41, 30. Nov. 2018 (CET)
Ich fürchte, bei Transkriptionen wird wenig zu machen sein. Das ist ja so eine Wissenschaft für sich, das macht jeder irgendwie anders. Für den Petri kannst Du in Fällen, wo zwei Leerzeichen im Namen drin sind, mal wahlweise den mittleren oder einen anderen Namensbestandteil weglassen. Wobei das natürlich dann auch schnell falsch-negative Ergebnisse generiert.
Aliase von Wikidata könntest Du zwar auch vergleichen, da habe ich aber wenig Hoffnung, dass Dich das substantiell weiterbringt. Ist vermutlich den Aufwand nicht wert. Ansonsten würde ich bei 2900 Fällen vorschlagen, eine Arbeitsliste irgendwo einzustellen, beispielsweise mit alphabetischer Untergliederung nach Name, und dann mit scharfem Auge vermeintliche Problemfälle rauszufischen. —MisterSynergy (Diskussion) 22:42, 3. Dez. 2018 (CET)
Umgekehrt wird ein Schuh draus. 2.900 sind es, wo genau ein Buchstabe unterschiedlich ist. Knapp 10.000 wo mehr unterschiedlich ist und diese 10.000 wären zu kontrollieren.
Ich glaub ich werde das mal nach Ländern teilen und erstmal diese Transkribierten weglassen. Für diese werd ich dann mal gucken, ob es einen sprachspezifischen Soundex (oder sowas) gibt oder selber mal sowas in der Art ausschwitzen.
Bei den Daten aus Wikidata hätte ich zumindest andere Transkriptionen dabei. Das war da die Idee. Aber erstmal ein paar Nächte drüberschlafen, vielleicht fällt mir noch was ein. --Wurgl (Diskussion) 22:54, 3. Dez. 2018 (CET)
Moin Moin Wurgl, wenn du Hilfe brauchst, lass es mich wissen. Ich übertrage auch viel nach Wikidata bzw. korrigiere dort Dinge. Gib mir eine Wartungsliste und wir schauen, wo wir angreifen können. mfg --Crazy1880 18:04, 4. Dez. 2018 (CET)
Danke, danke! Ich brauch manchmal einfach nur Ideen und die kommen, wenn ich das Problemchen irgendwem erzähle. Das Programmieren ist nicht das Problem. Ich werde mal gucken, wieviele rausfallen bei denen Geburtsdatum und Sterbedatum (falls vorhanden) bis auf den Tag exakt gleich sind. Und dann als nächsten Schritt eventuell nach Ländern aufteilen (das Land ist ja im DNB-Dump enthalten). --Wurgl (Diskussion) 20:44, 4. Dez. 2018 (CET)

Wikiläum[Quelltext bearbeiten]

Hallo MisterSynergy,
gibt es irgendeine Möglichkeit, bei deinem Tool zur Ermittlung des Wikiläums importierte Edits nicht zu berücksichtigen? Bei mir gibt es z.B. zwei vom 24. September 2004, die nicht von mir, sondern dem damaligen Stefan bei en:wp sind. Das kriegt man aber vermutlich weder in der Versionsgeschichte, folglich auch nicht in deinem Tool gerade gebogen, oder? Mein erster Edit war nämlich erst am 2. Januar 2005. Viele Grüße, --Stefan »Στέφανος«⸘…‽ 21:41, 4. Dez. 2018 (CET)

Hallo Stefan, das Problem uneindeutiger Benutzernamen aus der Prä-SUL-Zeit hatte ich bisher nicht auf dem Schirm.
Ich habe gerade einmal in der Datenbank nachgeschaut, in der Tabelle mit den Versionen. Bei den beiden fraglichen Edits im September 2004 steht Dein Benutzername und auch Deine dewiki-Benutzerkennung 54681 dran. Die Beiträge erscheinen ja auch in Deiner Beitragsliste. Ich fürchte, das Import-Tool war damals halt nicht gut genug, und ich könnte mir vorstellen, dass solche Situationen kaum sinnvoll nachträglich zu ermitteln sind.
Was meist möglich sein sollte, wäre ein Vergleich von Zeitpunkt des ersten Edits mit dem Anmeldezeitpunkt. Letztere muss zwingend vor ersterem liegen. Allerdings auch da: Dein Benutzeraccount so so alt, damals gab es kein Neuanmeldungslogbuch und entsprechend keine Information, wann Du Deinen Account registriert hast. Deinen speziellen Fall kann ich so nicht entdecken.
Jedenfalls würde ich WolfgangRieger einmal informieren wollen, damit er im Zweifel auf diesen Umstand aufpasst (mit diesem Ping hoffentlich erledigt). Ich denke aber auch drüber nach, wie ich der Sache codetechnisch begegnen könnte. Für weitere Hinweise und ggf. Fälle bin ich dankbar. Viele Grüße —MisterSynergy (Diskussion) 22:03, 4. Dez. 2018 (CET)
Danke für deine Antwort und das Mitdenken. Ja, wahrscheinlich gibt es noch ziemlich viele ähnliche Fälle, du hast Recht, damals™ war die Software noch nicht so ganz ausgereift, aber das macht Wikipedia auch irgendwie schön, dass man sieht, wie sie gewachsen ist. Man kriegt das vermutlich nie auseinander, bei mir sind es ja auch nur zwei Edits, vielleicht gibt es noch Accounts, wo das Thema relevanter ist. Ich frage mal auf FZW nach. Gruß, --Stefan »Στέφανος«⸘…‽ 08:50, 5. Dez. 2018 (CET)
Ich habe die entsprechenden Daten vermerkt. Danke. -- Wolfgang Rieger (Diskussion) 16:42, 6. Dez. 2018 (CET)

#QDw3c[Quelltext bearbeiten]

Benutzer:Itti schickt mich zu dir. entwicklung an einem mentorenprogramm. es ist wohl noch zu früh, dir konkrete fragen zu stellen. aber vielleicht willst du schon hinweise machen. zb auf bestehende erfahrungen, ähnliche projekte. etc. --Sms2sms (Diskussion) 12:45, 9. Dez. 2018 (CET)

Hallo Sms2sms, ich habe von User:Itti schon einen Ping bekommen, als sie mich auf ihrer Diskussionsseite erwähnte. Jetzt nach Deinem Beitrag hier habe ich ein bisschen durch Deine Seiten quergelesen, aber da steig ich noch nicht richtig durch – das ist alles recht umfangreich. (Manöverkritik: wegen der zahlreichen Schlagworte/Hashtags wirkt das Projekt stellenweise reichlich abstrakt und nicht besonders kohärent ausgearbeitet, was es für Außenstehende schwierig macht, Dir/Euch zu folgen.) Ich nehme an, Du beziehst Dich hier auf Wikidata-verwandte Aspekte von Deinem Projekt.
Aus Erfahrung kann ich Dir jedenfalls schon einmal aufschreiben, dass wir interessierten Neulingen bzw. Wikipedia-Autoren zurzeit anhand ganz konkreter Aufgaben oder Problemstellungen den Weg nach Wikidata aufzeigen. Es gibt, ähnlich wie bei Wikipedia, kein allumfassendes Trainingsmanual, welches man von vorn nach hinten durcharbeiten könnte, und dann wäre man perfekt vorbereitet. Beide Projekte sind dazu viel zu komplex und vielschichtig. Ansprechen kannst Du die (deutschsprachige) Wikidata-Community bei d:Wikidata:Forum auf deutsch, oder Du kannst Dir vertraute Benutzer direkt ansprechen. Ich mache sowas zum Beispiel sehr gern.
Gleichzeitig ist es durchaus so, dass insbesondere die Community der deutschsprachigen Wikipedia gern mehr Manual für Wikidata hätte. Das wurde erst vor sehr kurzer Zeit auf der Seite Wikipedia Diskussion:Kurier thematisiert. Ich möchte nicht ausschließen, dass da irgendwann einmal jemand daran arbeiten könnte… Man müsste jedoch zunächst einmal das Zielpublikum für ein solches Manual vorab definieren, eine Sache die ich bei Deinem Projekt noch nicht so recht gefunden habe. Wenn das definiert ist, kann man am ehesten etwas hilfreiches ausarbeiten.
Wenn Du weiter Input brauchst, kannst Du mich gern hier anschreiben. Ich lasse das Thema eine ganze Weile lang offen. Viele Grüße! —MisterSynergy (Diskussion) 13:16, 9. Dez. 2018 (CET)

Hilfe bei Wikidata List für Unix-Wikiprojekt Teil 2[Quelltext bearbeiten]

Hallo MisterSynergy,

ich habe einen neuen Abschnitt erstellt, da der letzte sehr gewachsen ist und ich dir die Möglichkeit geben wollte ihn zu archivieren falls du das möchtest.

Ich habe gesehen, dass du Veränderungen an der Seite Benutzer:Hundsrose/Wikidata Spielwiese 2 vorgenommen hast, vielen Dank. Leider liefert die Abfrage noch keine Ergebniszeilen. Fehlen noch Veränderungen bei der Abfrage?

Vielen Dank für deine Hilfe. Liebe Grüße --Hundsrose (Diskussion) 15:44, 15. Dez. 2018 (CET)

Da klemmt irgendetwas, ich weiß leider nicht was. Manchmal ist der Listeria-Bot ein bisschen störrisch, ich bleibe aber dran. An der Spielwiese (1) möchte ich auch noch eine Änderung vornehmen, so dass da die Kommandozeilenoptionen alphabetisch gelistet werden. Zurzeit gibt es da ja rund täglich ein Update, und das einzige was sich ändert ist die Sortierung – nervig und überflüssig. Viele Grüße! —MisterSynergy (Diskussion) 21:28, 16. Dez. 2018 (CET)
Vielen Dank für die Erklärungen und dass du dran bleibst. Das bedeutet mir viel! --Hundsrose (Diskussion) 08:22, 17. Dez. 2018 (CET)
Hallo MisterSynergy, ich wünsche dir ein frohes neues Jahr! :). Hat sich mittlerweile an den Updates auf Benutzer:Hundsrose/Wikidata Spielwiese 2 etwas geändert? Gibt es vielleicht irgendetwas was ich tun kann? Liebe Grüße --Hundsrose (Diskussion) 17:41, 7. Jan. 2019 (CET)
Hallo Hundsrose, dieser Anstoßer war genau richtig, ich hatte das etwas vom Radar verloren über den Jahreswechsel. Ich schaue mir das zeitnah an. Viele Grüße, MisterSynergy (Diskussion) 22:52, 7. Jan. 2019 (CET)

WD-Hilfestellung erbeten[Quelltext bearbeiten]

Hi MisterSynergy, vielleicht kannst Du mir ein paar Tipps geben...

Hintergrund ist diese Diskussion, Ziel wäre, die genannten rund 29.000 IDs nach WD zu schaufeln. Mit Quickstatements habe ich noch nie gearbeitet, vielleicht kannst Du mir ja einfach die Kommandozeile und eine initiale Excel-Zeile dafür bauen, wenn ich jetzt beispielsweise d:Q27131349 (entspricht Dec-2-enal) mit der ECHA-ID (P2566) "100.021.339" und der EG-Nummer (P232) "223-472-1" versehen wollte? Für beide Aussagen sollte als Fundstelle die URL http://echa.europa.eu/information-on-chemicals/registered-substances genannt werden. Geht das? Vielen lieben Dank schon vorab! --Mabschaaf 21:31, 17. Dez. 2018 (CET)

Hallo Mabschaaf, in der Schnelle vorm Schlafengehen ein paar Stichpunkte:
  • QuickStatements ist dazu das richtige Tool. wikidata:Special:MyLanguage/Help:QuickStatements gibt ordentlich Hilfe; ich präferiere das alte Inputformat (V1 oder „Command sequence syntax“–Abschnitt 2 in der Hilfeseite), nicht das neuere CSV-Eingabeformat.
  • Tool-Bedienung grob skizziert: QuickStatements öffnen, "Neuer Stapel", Textinput in das Feld kopieren, "V1 Anweisungen importieren", in der Vorschau dann schauen, ob das korrekt initialisiert wurde, und dann "Start" klicken. "Start (im Hintergrund)" ginge auch, dann aber möglicherweise über wikidata:User:QuickStatementsBot mit Dir als Auftraggeber in der Zusammenfassungszeile (sprich: die Edits würden Dir nur indirekt zugeordnet werden), und das könnte auch länger dauern.
  • Du brauchst dazu kein Bot-Flag und kannst das mit Deinem normalen Account machen (wenn Du *nicht* "Start (im Hintergrund)" wählst). Du könntest nach einem Flooder-Flag fragen, das macht aber kaum jemand.
  • Eingabe-Beispiel:
Q27131349	P2566	"100.021.339"	S854	"http://echa.europa.eu/information-on-chemicals/registered-substances"	s813	+2018-12-18T00:00:00Z/11
Q27131349	P232	"223-472-1"	S854	"http://echa.europa.eu/information-on-chemicals/registered-substances"	s813	+2018-12-18T00:00:00Z/11
  • Die Hilfeseite erklärt die Syntax im Detail. Die Tabseparation bekommt man mit Excel eigentlich ganz gut hin: kopiert man mehrere Spalten und fügt dann in einer Textdatei ein, dann kommt das passend raus. Allerdings müssen notwendige Anführungszeichen (Strings, URLs) schon in Excel ergänzt werden.
  • Die Art, wie Du die Fundstellen angeben möchtest, ist etwas ungewöhnlich. Du scheinst auf eine Eingabemaske verlinken zu wollen, wo man das dann vermutlich eintippen und damit belegen kann. Bei URL der Fundstelle (P854)-Fundstellen erwarten wir eigentlich eher eine (mehr oder weniger) statische Seite, wo die zu belegende Information direkt drinsteht. So wie Du die Situation schilderst, brauchst Du vermutlich eher eine Fundstelle nachgewiesen in (P248) mit einem Objekt als Wert, welches noch anzulegen wäre (Bezeichung etwa: "ECHA-Chemikaliendatenbank" oder so). Dazu dann ein Abrufdatum sowie nach Möglichkeit den Identifikator erneut und den Datenbankeintrags-Titel mit Titel (P1476). Das wäre insofern redundant, als dass man den Identifikator im Grunde mit sich selbst belegt, aber eigentlich brauchen die Dinger überhaupt keine Fundstelle, so wie Du in Wikipedia Weblinks oder Literaturverweise selbst grundsätzlich erstmal nicht belegen musst. Schaden tut das aber auch nicht, und anderswo wird das ebenfalls gemacht. Wenn Du das so ändern wollen würdest, kann ich Dir gern nochmal passenden Beispielinput aufscheiben.
  • Obligatorischer Hinweis: with great power comes great responsibility. Ich habe kein Zweifel, dass Du das sorgfältig vorbereitest. Ich schlage dennoch vor, anfangs mal mit 10, dann 20, 50 und 100 Kommandos zu starten, und danach jeweils erstmal die eigenen Beiträge durchzuschauen. Du musst keine Sorge haben, dass das Tool was anderes in die Objekte editiert als was Du definiert hast oder in der Vorschau angezeigt wird. Manchmal hat man aber versehentlich Mist definiert, wäre blöd wenn Du das erst nach 58000 Edits merkst :-) (Auch wenn das reparierbar wäre). Wenn die kleinen Probeläufe durch sind, kannst Du den Rest durchaus in ein bis drei großen Batches laufen lassen, insgesamt sollte das so rund einen Tag laufen. Du darfst das Browserfenster in der Zeit nicht schließen.
Bei Fragen gern nachfragen. Ansonsten erstmal gute Nacht!—MisterSynergy (Diskussion) 01:59, 18. Dez. 2018 (CET)
Vielen Dank für Deine wirklich ausführliche und schon jetzt sehr hilfreiche Antwort.
Den wichtigsten Punkt erwähnst Du zwar zuletzt, für mich hat er aber höchste Priorität - Richtigkeit dessen, was ich hier tue (oder plane zu tun).
Ich habe schon mal 5 Testedits gemacht, die mir erst mal nur den technischen Workflow zeigen sollten, die aber auch direkt in Ordnung zu sein scheinen. Folgende Fragen dazu:
  • Was passiert, wenn es schon Einträge gibt? Werden die neuen dann einfach ergänzt (auch bei inhaltlicher Gleichheit) oder die Bearbeitungen nicht ausgeführt? Kann man das ggf. irgendwo einstellen (nichts überschreiben, keine Mehrfach- oder gar Doppeleinträge)?
  • Zur Fundstellenangabe: Ich habe mich mit der URL der ECHA-Eingabemaske an dem orientiert, was auch bei den schon vorhandenen Einträgen typischerweise angegeben ist. Unbefriedigend finde ich das selbst, weil letztlich nicht nachvollziehbar ist, wie die Daten zugeordnet wurden (hier: aufgrund der CAS-Nummer). Lässt sich das besser lösen? Ideal wäre hierzu eine URL, die die CAS-Nummer enthält und auf der dann die ECHA-ID/EG-Nummer sichtbar wird - die gibt es aber leider nicht. Es gibt nur die URL mit der ECHA-ID selbst, die für die ECHA-ID redundant wäre, die man aber evtl. für die EG-Nummer nutzen könnte.
Das Zustandekommen von Fehlzuordnungen (die auf Leyos BD erwähnten 323 Einträge) ist derzeit überhaupt nicht nachzuvollziehen. (Gerade über ein schönes Beispiel gestolpert: Gelb (Q943) hat laut WD die CAS-Nummer 129423-54-7, entsprechend dieser chemischen Verbindung - was natürlich völlig Banane ist. Wenn ich dieser CAS-Nummer jetzt auch noch eine ECHA-ID und eine EG-Nummer zuordne, wird die Menge der Fehler im Item aber immer größer und es lässt sich nicht mehr nachvollziehen, welche ID warum in dieses Item kam.)
Gibt es eigentlich ein Tool (o.ä.) ähnlich Wikiblame, um in der Versionsgeschichte einfach zu finden, wer eine bestimmte Angabe in einem Item ergänzt/geändert hat?--Mabschaaf 12:34, 18. Dez. 2018 (CET)
  • Wenn Du einen Identifikator ergänzen möchtest, der schon in betreffenden Objekt vorhanden ist (Eigenschaft + Wert im Paar), dann fügt das Tool ihn *nicht* ein zweites Mal hinzu. Es würde allerdings Qualifikatoren und Fundstellen zur bereits existierenden Aussage hinzufügen. Diesbezüglich musst Du eigentlich wenig Sorgen haben. Wenn man Qualifikatoren ergänzt muss man damit ein bisschen aufpassen, aber das möchtest Du ja nicht.
  • Grundsätzlich ist es hilfreich, bei Importen der Größenordnung danach zwei bis drei Tage lang die entsprechenden covi-Fehlerlisten zu beobachten (hier also wikidata:Wikidata:Database reports/Constraint violations/P2566 und wikidata:Wikidata:Database reports/Constraint violations/P232). Auch bei einem guten Import tauchen häufig ein paar neue Fehler auf, die Du dann nachträglich reparieren kannst. Falls es zuviele sind, geht das auch automatisiert. Falls Du das schon *während* des Imports überprüfen möchtest, kannst Du entsprechende SPARQL-Abfragen auf wikidata:Property talk:P2566 und wikidata:Property talk:P232 recht weit oben finden, wo sie Eigenschaftseinschränkungen für die beiden Eigenschaften aufgelistet sind. Die SPARQL-Daten sind jederzeit aktuell, während die covi-Fehlerlisten nur alle paar Tage und mit zeitlicher Verzögerung ausgewertet werden.
  • Irgendwie verstehe ich noch nicht so recht, wo Du jetzt die ~29.000 neuen Identifikatoren her hast. Bleiben wir bei Dec-2-enal (Q27131349) (von oben): das hat CAS-Nummer (P231): 3913-71-1, und darin steht der Link EINECS: 100.021.339. Hast Du das so ermittelt? Dann sollten wir eine Fundstelle nach dem Datenbank-Modell in wikidata:Help:Sources wählen:
  • Die Fehlerliste mit den 232 komischen Fällen lässt Du am besten aus, um da nicht weitere mutmaßlich falsche Identifikatoren zu ergänzen. Bei falsch zugeordneten VIAF-Identifikatoren gibt es ähnliche Situationen. Wer sowas letztlich irgendwann aufräumt (falsche Identifikatoren entfernen oder mit missbilligtem Rang ausstatten, um erneute Ergänzungen zu vermeiden), der weiß in der Regel um diese Problematik und überprüft *alle* Identifikatoren in einem zu überprüfenden Objekt.
  • Ein echtes Blame-Tool gibt es nicht. Ich finde das DiffList.js Benutzerskript von User:Yair_rand sehr hilfreich (einzubinden per mw.loader.load( '//www.wikidata.org/w/index.php?title=User:Yair_rand/DiffLists.js&action=raw&ctype=text/javascript', 'text/javascript' ); // [[User:Yair rand/DiffLists.js]] in wikidata:Special:MyPage/common.js). Das läd zwar ne Menge Sachen auf Watchlist, Recent changes und Objekt-Versionsgeschichte nach , aber ändert (optimiert) dort die Darstellung, und es bietet nette Filter an. Nachteil ist, dass Edit-Kommentare nicht mehr zu sehen sind, die insbesondere bei Zurücksetzungen wichtig sind – dazu rufe ich den betreffenden Diff dann auf, wo die Darstellung unverändert bleibt.
Viele Grüße, —MisterSynergy (Diskussion) 13:15, 18. Dez. 2018 (CET)
Hallo, kurzer Hinweis zu Europäischen Stofflisten / Datenbank(en) / Stoffinventar(en): es gab und gibt EINECS, ELINCS, NLP und das neue REACH-Register. Am besten sieht man das unter EG-Nummer. Viele Grüße --Wilhelm (Diskussion) 13:30, 18. Dez. 2018 (CET)
Danke. Ich klicke mich da gerade noch durch Wikipediaseiten und Wikidataobjekte, ohne wirklich durchzusteigen. Gibt es einen Zusammenhang zwischen den neunstelligen ECHA-IDs und den siebenstelligen IDs der verschiedenen europäischen Datenbanken? Werde letztere alle über ECHA zugänglich gemacht? —MisterSynergy (Diskussion) 13:39, 18. Dez. 2018 (CET)
Ich pinge mal Benutzer:Leyo hierher, vielleicht kann der zu den IDs und auch zu einer sinnvollen Quellenangabe auf WD etwas sagen. Diese Frage hätte ich nämlich gerne zügig geklärt, damit es weitergehen kann.
Nebenbei: Es gibt noch eine weitere ID, die in der URL des Classification and Labelling Inventory der ECHA auftaucht, wenn man beispielsweise für Methan https://echa.europa.eu/information-on-chemicals/cl-inventory-database/-/discli/substance/external/100.000.739 (also eine URL mit der neunstelligen ECHA-ID) aufruft: https://echa.europa.eu/information-on-chemicals/cl-inventory-database/-/discli/details/107761 ist das Weiterleitungsziel. Welchen Sinn diese Nummer auch noch hat, erschließt sich mir nicht. Ich hoffe nur, dass nicht irgendwann die neunstellige ID wieder eingestampft wird...--Mabschaaf 17:00, 18. Dez. 2018 (CET)
Die ECHA-InfoCard-ID ist eine Laufnummer, die nicht aus einer anderen ID (z.B. EG-Nummer) abgeleitet werden kann.
Bei den EG-Nummern würde ich als Fundstelle schlicht die ECHA-InfoCard-ID angeben. --Leyo 18:50, 18. Dez. 2018 (CET)
Also dann für die ECHA-IDs wie von MisterSynergy oben vorgeschlagen: "nachgewiesen in ECHA-Chemikaliendatenbank (neues Objekt), CAS-Nr, Titel, abgerufen..."
Und für die EG-Nummern: "nachgewiesen in ECHA-InfoCard-ID, abgerufen..."
@MisterSynergy: Könntest Du mir dazu (gerne mit dem Beispiel von oben) die passende Command Sequence erstellen?--Mabschaaf 19:10, 18. Dez. 2018 (CET)
Was wäre denn jetzt eine angemessene Bezeichnung für die Datenbank mit den neunstelligen ECHA-IDs? Wenn ich das habe, mache ich Euch ein Objekt fertig und schreibe hier Beispiel-Input für QuickStatements auf. —MisterSynergy (Diskussion) 23:46, 18. Dez. 2018 (CET)
Hm, Hintergrundinfos gibt's da. Aber ich würde die ECHA-InfoCard-ID jeweils mit sich selbst belegen. Wenn man auf den Link klickt, kann man die Nummer ja bei Bedarf direkt verifizieren. Bei der PubChem-CID oder der ChemSpider-ID wird das oft auch so gemacht. --Leyo 00:00, 19. Dez. 2018 (CET)
Falls der Name noch gebraucht wird: Harmonisierte Stoffeinstufung der EG würde passen, falls erforderlich noch die Regelung ("CLP-Liste") dazu. Wenn nicht jemand etwas besseres weiss . . . Viele Grüße --Wilhelm (Diskussion) 00:13, 19. Dez. 2018 (CET)
Hm, IMHO passt das nicht, aber wenn mein Vorschlag umgesetzt wird, braucht es keinen (neuen) Datenbanknamen. --Leyo 01:57, 19. Dez. 2018 (CET)
Nach dem Überfliegen des von Dir verlinkten PDF-Files scheint mir "ECHA Infocard database" eher passend. Zurzeit ist bei Wikidata (kleinerer) Reparaturbedarf vorhanden, denn ECHA-InfoCard-ID (P2566) hat die Aussage entsprechendes Objekt (P1629): Europäische Chemikalienagentur (Q48798); es verlinkt also auf die Agentur, was wir eigentlich nicht haben möchten, sondern wir möchten an der Stelle einen Link auf die entsprechende Datenbank – und da gibt es kein Objekt für. In Einzelnachweisen bedeutet das, dass wir nicht "nachgewiesen in (P248): Europäische Chemikalienagentur (Q48798)" machen, was eine Eigenschaftseinschränkungsverletzung nach sich zieht, sondern dass wir ebenfalls auf die "ECHA Infocard database" verlinken (ein Werk, nicht eine Organisation). In dem Sinne wären eine übersichtliche Zahl von existierenden Fundstellen anzupassen. In jedem Falle brauchen wir einen geeigneten Namen für diese von ECHA bereitgestellte Datenbank, in die diese neunstelligen Identifikatoren von ECHA-InfoCard-ID (P2566) verlinken. —MisterSynergy (Diskussion) 02:18, 19. Dez. 2018 (CET)
"ECHA Infocard database" passt. Das andere wäre eventuell publikumsnäher, aber das ist
nur mein Eindruck
sowieso im Wandel
und die Verlinkung soll ja bleiben. Viele Grüße --Wilhelm (Diskussion) 08:47, 19. Dez. 2018 (CET)
ECHA Infocard database ist auch für mich völlig in Ordnung. Auf den CAS-Nr.-Bezug würde ich schon gerne bei der Datenquelle hinweisen. @MisterSynergy: Damit solltest Du doch ein Datenobjekt anlegen und den Beispiel-Input formulieren können, oder?--Mabschaaf 12:54, 19. Dez. 2018 (CET)
Ich habe nun das Objekt ECHA-InfoCard-Datenbank (Q59911453) angelegt, aber bisher noch nicht eingesetzt. Die Bezeichnung darf durchaus eine deskriptive sein, wenn wir keinen offiziellen Titel dieser Datenbank kennen. Schaut bitte einmal drüber. QS-Beispielinput kommt gleich. —MisterSynergy (Diskussion) 14:03, 19. Dez. 2018 (CET)
Scheint mir so in Ordnung. Folgende alternative Bezeichnungen für die Tabelle / Datenbank kenne ich:
CLP-list (en)
C&L-Verzeichnis (de)
Einstufungs- und Kennzeichnungsverzeichnis (gemeint ist: nach CLP-Verordnung der EG) (de)
hab nach der Anmeldung auf die Schnelle nicht die Stelle zum Eintragen gefunden - ist vielleicht auch besser, es prüft noch jemand, ob das passt. Viele Grüße --Wilhelm (Diskussion) 19:25, 19. Dez. 2018 (CET)
Es passt nicht (unterschiedliche Datenbanken/Verzeichnisse), so dass ich die unpassenden Synonyme entfernt habe. --Leyo 23:07, 19. Dez. 2018 (CET)
Um das abzuschließen: sorry - die CLP-Liste hat auch neunstellige Nummern, hatte fälschlicherweise angenommen, die wäre das :(. Viele Grüße --Wilhelm (Diskussion) 23:36, 19. Dez. 2018 (CET)

Hier nochmal aktualisierter QS-Input, wobei da noch keine CAS-Nummern drin sind. Beides wird so mit der ECHA-Infocard zum jeweiligen Objekt belegt, was für die Eigenschaft ECHA-InfoCard-ID (P2566) einen akzepablen Selbstverweis darstellt:

Q27131349	P2566	"100.021.339"	S248	Q59911453	s2566	"100.021.339"	s813	+2018-12-19T00:00:00Z/11	s1476	en:"2-decenal"
Q27131349	P232	"223-472-1"	S248	Q59911453	s2566	"100.021.339"	s813	+2018-12-19T00:00:00Z/11	s1476	en:"2-decenal"

Nach meinem Verständnis von vorstehender Diskussion entsprechen diese Fundstellen der Art des Datenbezuges, und sie entsprechen auch den Konventionen, wie bei Wikidata Fundstellen gemacht werden. Es geht daraus allerdings nicht hervor, dass die Zuordnung über die CAS-Nummer 3913-71-1 vorgenommen wurde, die in der ECHA-InfoCard vorliegt und bereits im Wikidataobjekt vorhanden ist. Wenn man das noch ergänzen möchte, wäre wohl die Nutzung eines Fundstellen-Qualifikators Zitat (P1683) am ehesten angemessen, mit dem Inhalt en:"CAS no.: 3913-71-1". Würde das reichen? Dann wäre der QS-Input dieser:

Q27131349	P2566	"100.021.339"	S248	Q59911453	s2566	"100.021.339"	s813	+2018-12-19T00:00:00Z/11	s1476	en:"2-decenal"	s1683	en:"CAS no.: 3913-71-1"
Q27131349	P232	"223-472-1"	S248	Q59911453	s2566	"100.021.339"	s813	+2018-12-19T00:00:00Z/11	s1476	en:"2-decenal"	s1683	en:"CAS no.: 3913-71-1"

Darin sind je Zeile anzupassen: der Q-Identifikator des Objektes ganz am Zeilenanfang, die ECHA-InfoCard-ID bzw. die EG-Nummer im Hauptwert, die ECHA-InfoCard-ID in der Fundstelle, das Datum des Datenbezuges (muss nicht heute sein), der Titel der ECHA-InfoCard, und die CAS-Nummer des Abgleiches. Wenn das schwierig hinzubekommen ist, würde ich eine CSV-Datei mit den Rohdaten per Email empfangen, den Input vorbereiten (sofern möglich), und dann den QS-Input zurückmailen. Soweit klar? Viele Grüße! —MisterSynergy (Diskussion) 22:37, 19. Dez. 2018 (CET)

Ich habe weitere fünf Testedits (zunächst nur für die ECHA-ID) gemacht - von der technischen Seite ist damit alles klar. Bitte nochmal drüberschauen und ggf. Änderungswünsche kundtun, bevor ich dann größere Batches lostrete. Besten Dank nochmal für die Unterstützung!--Mabschaaf 12:36, 20. Dez. 2018 (CET)
Was ich sehe, sieht gut aus. —MisterSynergy (Diskussion) 14:36, 20. Dez. 2018 (CET)
Seufz. Jetzt habe ich es doch geschafft, einen kompletten Batch zu ruinieren, weil ich anstelle der fixen Source Q59911453 eine Variable habe laufen lassen. Kannst Du mir verraten, wie ich das komplett rückgängig machen oder reparieren kann?--Mabschaaf 18:21, 1. Jan. 2019 (CET)
Fürs Protokoll: das haben wir bei Wikidata geklärt. —MisterSynergy (Diskussion) 18:58, 5. Jan. 2019 (CET)

Inzwischen sind die Daten alle "drin". Als nächsten Schritt könnte man bei den "alten" ECHA-IDs, bei denen als Fundstelle die Suchmasken-URL angeben ist, noch Fundstellenangaben wie oben einfügen. Sinnvoll wäre dabei aber, die Suchmasken-URL zu ersetzen. Geht das auch mit QS? Wie wäre dafür die Syntax? Ob und wann ich das umsetzen würde, kann ich aber noch nicht sagen.--Mabschaaf 18:49, 5. Jan. 2019 (CET)

Meines Wissens kann man mit QS keine Fundstellen entfernen. Das ist ja auch ein Vorgang, der eher nicht so erwünscht ist. Mit PAWS/pywikibot geht das allerdings durchaus, ich kann wohl ein entsprechendes Skript basteln. Wie beim letzten Mal steht jetzt aber erstmal das Familienabendessen an, ich schaue daher nachher nochmal genauer hin :-) Viele Grüße, MisterSynergy (Diskussion) 18:58, 5. Jan. 2019 (CET)
Kannst Du gerade einmal eine Beispiel-Fundstelle verlinken, die Du ersetzt haben möchtest? Ich weiß gerade nicht, wonach ich suchen soll… —MisterSynergy (Diskussion) 21:31, 5. Jan. 2019 (CET)
Bspw. Methanol, d:Q14982, dort steht bei ECHA-InfoCard-ID zwar völlig korrekt 100.000.599, aber als Fundstelle nur URL: http://echa.europa.eu/de/information-on-chemicals/registered-substances - besser wäre
Wobei sich hier gleich die Frage anschließt: Wie findet man alle Einträge, die als Fundstelle auf die o.g. URL verweisen? Viele Grüße von unterwegs (und die nächsten Tage vermutlich offline) -- Mabschaaf --2003:DF:E72C:9F00:B10C:4819:F2BA:BCD1 23:55, 5. Jan. 2019 (CET)
Ah, jetzt sehe ich das. Hier sind 12208 Fundstellen für ECHA-InfoCard-ID (P2566)-Aussagen mit URL der Fundstelle (P854): <URL unter echa.europa.eu>, die allermeisten exakt wie beim Methanol. Das kriegen wir hin. Sollen wir warten, bis Du wieder online bist? Ich würde gern zeitnah oder gar zeitgleich Ergänzung der richtigen Fundstelle und Entfernung der alten Fundstelle durchführen. —MisterSynergy (Diskussion) 00:04, 6. Jan. 2019 (CET)
Es wäre mir lieber, mir das an einem richtigen PC erst noch mal anschauen zu können, vor allem die neu entstandenen CoVis. Ich melde mich nächste Woche wieder. --83.59.138.103 14:50, 8. Jan. 2019 (CET)
Alles klar, von meiner Seite aus gibt es keine Eile. Wenn du weitermachen kannst, sag einfach hier Bescheid. —MisterSynergy (Diskussion) 14:54, 8. Jan. 2019 (CET)

Fundstellennachtrag[Quelltext bearbeiten]

(Ich packe das mal in einen neuen Abschnitt) Letztlich geht es ja darum, Fundstellen zu ergänzen (wenn vorher noch gar keine angegeben war) oder zu präzisieren (wenn vorher nur die allgemeine URL oder ein "importiert aus xy-Wikipedia" als Fundstelle genannt war). Wäre dazu folgendes Vorgehen machbar:

  • Ich ergänze bei allen Items, bei denen die Zuordnung passt (in diesem Falle also: Das Tripel CAS-Nummer/ECHA-ID/EC-Nummer des Items stimmt mit dem Tripel in der ECHA-Datenbank exakt überein)
    • Die Fundstelle zur ECHA-ID wie oben angegeben (mit nachgewiesen in / CAS-No / Titel / Datum)
    • Die Fundstelle zur EC-Nummer wie oben angegeben (mit nachgewiesen in / CAS-No / Titel / Datum)
  • Anschließend löschst Du bei allen Items, die eine ECHA-ID mit präziser Fundstellenangabe haben
    • die allgemeine URL
    • den Verweis auf irgendwelche WP-Versionen

Damit sollte ein "Bodensatz" an Items übrig bleiben, bei denen irgendwas in der Zuordnung nicht passt. Wobei das eigentlich ziemlich wenige sein sollten, da ich ja vor der Ergänzung der ECHA-IDs schon alle nicht passenden überarbeitet habe.
Ein ähnliches Vorgehen stünde dann auch für die ZVG-Nummer bevor.

Off-Topic: Gibt es ein Tool, mit dem man gleichzeitig alle WP-Sitelinks zu einem anderen Item verschieben kann? Move Claim ist da mühsam, wenn es viele Artikel in unterschiedlichen Sprachen gibt. Und leider hatte ich jetzt schon öfter den Fall, wo es nötig wäre: Beispielsweise müssten alle Sitelinks (bis auf esWP) von geranial (Q410888) nach Citral A+B (Q60176530) umziehen.--Mabschaaf 12:37, 19. Jan. 2019 (CET)

Wegen der Fundstellen schaue ich mir ein paar Sachen an. Ggf. bekommen wir das so hin, dass wir nur einen Edit je Objekt brauchen. Ich melde mich wieder.
Wegen der anderen Sache: nein, gibt es meines Wissens nicht. Für das Beispiel habe ich das jetzt schnell mal erledigt. Grundsätzlich könnte man wohl mit QuickStatements auch das hinbekommen, aber ich glaube die Vorbereitung des Inputs ist schnell aufwändiger als moveClaim.js. —MisterSynergy (Diskussion) 20:54, 19. Jan. 2019 (CET)

Zusammenführen rückgängigmachen[Quelltext bearbeiten]

Noch eine Bitte in anderer Sache: Könntest Du Dir mal [3] anschauen? Bei dieser Rückgängigmachung eines Merge wurde das ehemalige zweite Item nicht wieder hergestellt.--Mabschaaf 18:17, 25. Jan. 2019 (CET)

Hallo, ich sehe [4] und [5] mit einem Merge von Dir (18. Januar, 15:12 Uhr), wo bisher überhaupt nichts von rückgängig gemacht wurde. War der Merge nicht korrekt? Du müsstest dann zweimal die Version vor dem Merge wiederherstellen: zuerst im merge target, hier in Q18211631, danach im weitergeleiteten Objekt, hier Q28410839. Die Reihenfolge ist dann wichtig wenn Sitelinks im Merge involviert sind; würdest Du es andersherum machen, dann wäre zeitweilig ein Sitelink in beiden Objekten vorhanden, und das mag die Software nicht zulassen. Oder ist das Problem ein anderes? Viele Grüße! —MisterSynergy (Diskussion) 19:19, 25. Jan. 2019 (CET)
Sorry, das war oben der falsche Diff. Dieser war gemeint. Auf d:Q26840944 ist aber noch immer eine Weiterleitung.--Mabschaaf 19:25, 25. Jan. 2019 (CET)
Das habe ich rückgängig gemacht. —MisterSynergy (Diskussion) 20:45, 25. Jan. 2019 (CET)
Vielen Dank. Hätte ich das auch gekonnt oder waren dazu Admin-Rechte nötig?--Mabschaaf 11:48, 26. Jan. 2019 (CET)
Das hättest Du auch gekonnt, wobei in dieser speziellen Situation ein Extra-Fallstrick eingebaut war. Du hast gestern um 8:05 Uhr den Merge Zielseitig rückgängig gemacht [6] und damit Aluminiumkaliumsulfat-Dodecahydrat von dem Ziel-Objekt entfernt, so dass dieser Artikel mit keinem Datenobjekt mehr verbunden war. Um 11:22 Uhr hat ein anderer Benutzer ein neues Objekt Q60981875 für den Sitelink angelegt [7], welches der Rückgängigmachung im Weiterleitungs-Objekt des Merges im Wege stand. Ich musste aus dem neuen Objekt Q60981875 den Sitelink also erst entfernen (siehe zuvor verlinkte VG von Q60981875), konnte dann die Weiterleitung von Q26840944 entfernen, und danach das zwischenzeitlich angelegte Objekt Q60981875 in das wiederhergestellte Objekt Q26840944 mergen.
Es hilft vielleicht, einen Merge als die Zusammenführung von Daten aus zwei Objekten (i.e. Wiki-Seiten) zu verstehen. Wenn Du sowas anstößt, wird durch Deinen Account im Hintergrund eine Reihe von ganz normalen Edits in den beiden Objekten vorgenommen: Daten aus dem einen Objekt entfernen, zu dem anderen ergänzen, und dann eine Weiterleitung am Quell-Objekt anlegen. Meist sind das drei Edits, manchmal aus verschiedenen, hier nicht wichtigen Gründen auch mehr. Wenn Du das rückgängig machen möchtest, musst Du eigentlich nur in der richtigen Reihenfolge die Versionen vor dem Merge wiederherstellen – ich mache das meist über die Versionsgeschichte der beiden Wiki-Seiten. Die Reihenfolge ist wichtig, weil Sitelinks nicht gleichzeitig mit mehreren Objekten verbunden sein können, deshalb muss zuerst die Sitelink-entfernende Rückgängig-Operation am Merge-Ziel durchgeführt werden, und dann die Sitelink-ergänzende Rückgängig-Operation am Weiterleitungs-Objekt.
Schwierig wird das vor allem dann, wenn der Merge schon eine Weile zurückliegt und zwischenzeitlich Modifikationen am Ziel-Objekt des Merges durchgeführt wurden. Im Ziel-Objekt muss man dann manuell etwas genauer prüfen, ob noch alles in Ordnung ist.
Viele Grüße! —MisterSynergy (Diskussion) 12:08, 26. Jan. 2019 (CET)
Besten Dank für die ausführliche Erläuterung. d:Q411309 ist auch wieder so ein Fall, bei dem am besten alle Sitelinks zu d:Q26840944 umziehen sollten. Hintergrund für den vorausgegangenen Merge war nämlich vermutlich diese Anmerkung.--Mabschaaf 13:01, 26. Jan. 2019 (CET)
Da fehlt mir die Fachkenntnis bei der Bewertung, welche Sitelinks alle umziehen sollten. Kriegst Du das selbst hin? Bei wikidata:Special:Preferences#mw-prefsection-gadgets habe ich "Move: Adds a move tool to the sitelink edit toolbar to move a sitelink to another item." und "Drag'n'drop: Add statements and references from Wikidata or Wikipedia by dragging and dropping them." aktiviert. Letzteres macht eine Vorschau der Wikipedia-Artikel möglich, zumindest auf größeren Displays funktioniert das gut; damit kann man recht schnell bewerten, welcher Sitelink wohin gehört. Hier in diesem Fall zumindest dürften dafür ja weniger Sprachkenntnisse erforderlich sein, sondern man kann das möglicherweise an der chemischen Formel in der Infobox festmachen. —MisterSynergy (Diskussion) 21:58, 26. Jan. 2019 (CET)
Ist erledigt.--Mabschaaf 09:20, 27. Jan. 2019 (CET)

Bitte um Unterstützung[Quelltext bearbeiten]

Hallo Mister Synergy, bitte entschuldige die Ansprache. PerfektesChaos hat mich auf deiner vorbildliche Arbeit am Portal-css des Ruder-Portals hingewiesen. Mit Untersützung von Debenben haben wir schon einen Haufen der alten Tabellen umgestellt, aber es gibt noch [8] Probleme, zumal unsere Dokumentation wohl unzureichend ist. Könntest Du uns ein paar Tipps geben oder unter die Armen greifen? Mit besten Grüßen -- Leif Czerny 14:18, 30. Jan. 2019 (CET)

Hallo Leif Czerny, das ist alles recht unübersichtlich, dem Punkt mit Eurer unzureichenden Dokumentation würde ich wohl zustimmen :-) . Aus eigener Erfahung: es ist irre wichtig, gleich mit der Dokumentation anzufangen, noch während man so eine Umstellung durchführt. Sonst wird das später irre schwierig zu warten sein. Das Portal:Philosophie hat per Spezial:Präfixindex/Portal:Philosophie/ rund 500 Unterseiten, von denen sicherlich einige, aber eben auch lange nicht alle mit der TemplateStyle-Sache ausgestattet werden müssen. Zum Zwecke der koordinierten Abarbeitung solltest Du das irgendwo dokumentieren.
Wo wir schon beim Ruderportal sind: ich habe da Portal:Rudern/styles.css mit den CSS-Anweisungen, Portal:Rudern/styles mit einer Dokumentation dafür, sowie Portal:Rudern/Kasten (Box-Vorlage, welche die CSS-Anweisungen nutzt) in Gebrauch. Diese Methode mit einer Kasten-Vorlage ist hilfreich (siehe übersichtlichen Quellcode von Portal:Rudern), aber nicht zwingend der einzig seligmachende Weg zum Strukturieren eines Portals; es geht jedenfalls sicher auch ohne. Für das Gesamtportal gibt es außerdem Portal:Rudern/Portalübersicht als im Portal selbst nicht sichtbare Hintergrundinformation, mit einer Liste von Seiten und einem Konzept, wie das Portal strukturiert ist. Ich würde sehr empfehlen, dass Ihr das Philosophie-Portal sowie das zugehörige WikiProjekt ebenfalls dokumentiert, und dabei keine existierende Unterseite auslasst.
Soweit ich das verstehe, ist Dein Hauptproblem zurzeit, dass diese graublaue Kiste um den Inhalt herum auf Diskussionsseiten nicht funktioniert, weil das schließende div-Tag ggf. wegarchiviert wird. Dafür kann ich auch leider keine brauchbare Lösung anbieten, sondern wie bereits an anderer Stelle empfehlen, die graublaue Kiste nicht um die Diskussionsbeiträge laufen zu lassen. Das sieht sowieso wie eine Jugendsünde aus. Ihr könntet (bzw. solltet) trotzdem einen Seitenkopf im herkömmlichen Design behalten, und vielleicht (bin gerade nicht ganz sicher) könnten auch die farbig hinterlegten Abschnittsüberschriften ohne den Rahmen erhalten bleiben. Auf Nicht-Diskussionsseiten könnte die Box erhalten bleiben weil kein Archivbot kommt, so richtig schön ist das da aber auch nicht. Grundsätzlich ist es im Übrigen genau richtig, das Portal von einer Tabelle zu div-Boxen hin umzustellen und dabei auch TemplateStyles zu nutzen.
Ich empfehle außerdem, die Ratschläge von User:PerfektesChaos in seinem ersten Beitrag in der Technikwerkstatt zu beherzigen (ich zitiere: „Namensraum, Seitenname, Benennung der Klassen, Beispielen, Dokumentation, Unterstützung langfristiger Pflege und Wartung sowie projektweiter Registrierung“). Das bedeutet im Einzelnen:
  • [[Vorlage:Philosophie/Portal.css]] wird verschoben nach Portal:Philosophie/styles.css; alle bisherigen Nutzungen müssten dann angepasst werden.
  • Portal:Philosophie/styles wird zur Dokumentation der Aktion genutzt. Ganz oben {{Dokumentation/styleSeite}} einbinden, danach ein bissken Erklärung und, wenn alles fertig ist, vielleicht auch Beispiele.
  • Um nicht irgendwie versehentlich mit gleichlautenden CSS-Klassennamen anderer TemplateStyles zu kollidieren, registrierst Du auf Wikipedia:Technik/Skin/CSS/TemplateStyles für Dein Portal ein Präfix (PortalPhilosophie- oder philosophie-portal-), welches Du für ausnahmslos alle Selektoren in Portal:Philosophie/styles.css nutzest. Insbesondere die Tabs sind zurzeit nicht innerhalb dieses Schemas verortet.
  • Dann kannst Du alle umzustellenden Seiten identifizieren, bei Portal:Philosophie/styles dokumentieren, und dann auch umstellen. Danach ggf. noch weitere Erklärtexte und ggf. Beispiele einpflegen. Ziel sollte sein, dass ein anderer Benutzer das vorfindet und relativ schnell einen Überblick über den TemplateStyles-Einsatz bekommt.
Soweit fürs erste. Ich beantworte gern weitere Fragen. Ans CSS selbst würde ich ungern rangehen, ggf. gebe ich aber nochmal ein oder zwei Tipps dazu. Ein echter Experte diesbezüglich bin ich nämlich nicht. Viele Grüße! —MisterSynergy (Diskussion) 23:18, 30. Jan. 2019 (CET)
OK, danke. Wie ist das mit dem Registrieren gemeint, genügt ein händischer Eintrag in die Tabelle dort? -- Leif Czerny 11:21, 31. Jan. 2019 (CET)
Exakt, das ist zurzeit nicht mehr als ein händischer Eintrag in der Tabelle. —MisterSynergy (Diskussion) 11:30, 31. Jan. 2019 (CET)
Damit das nicht zwischenzeitlich blöde aussieht, habe ich alle sieben Einbindungen von Vorlage:Philosophie/Portal.css nun zu Portal:Philosophie/styles.css geändert. Der erste der vier Punkte von meinem Posting von gestern ist damit erledigt. —MisterSynergy (Diskussion) 11:53, 31. Jan. 2019 (CET)
Danke, da warst Du aber schnell. -- Leif Czerny 12:03, 31. Jan. 2019 (CET)
Die Dokumentation bei Portal:Philosophie/styles ist auch angefangen, und wenn Du Dir einen CSS-Selektor-Präfix ausgesucht hast, brauchst Du es nur noch bei Wikipedia:Technik/Skin/CSS/TemplateStyles in der schon angelegten Zeile ergänzen (und natürlich entsprechend die styles.css + Seiten anpassen). —MisterSynergy (Diskussion) 12:05, 31. Jan. 2019 (CET)
Ok, philosophie- ist ja noch frei und ohnehin das, was überall eingesetzt ist. Das mit den Unterseiten sit nicht so tragisch, viele von Ihnen enthalten nur Textbausteine und benötigen keine eigene CSS-Einbindung. Ob ich vor dem WE dazu komme, die Dokumentation zu schreiben, weiß ich nicht, aber sowohl mir als auch deneben ist noch einigermaßen klar, wozu alles gedacht ist ;-) Gruß-- Leif Czerny 12:13, 31. Jan. 2019 (CET)
philosophie- ist einigermaßen clever, so brauchst Du nichts zu ändern. Akut notwendige Umbauarbeiten hast Du geschafft – abgesehen wohl von dem div-Problem auf Diskussionsseiten, soweit ich das überblicken kann. Viele Grüße! —MisterSynergy (Diskussion) 12:31, 31. Jan. 2019 (CET)

Personenvorlage[Quelltext bearbeiten]

Hallo MisterSynergy,

die haufig ungenützte Personenvorlage bei Sportlern und Politikern hat vermutlich den Grund, das die DNB - die deutsche Nationalbibliothek am Anfang nur die Datensätze der Bücher (und deren Verfasser) vergeben hat, als Administrator hast Du sicher schon das TaxonBot mitbekommen, was neu verlinkte Vorlagen (innerhalb von ein paar Stunden) die Personenvorlage gegencheckt und dann (meines Wissens) eine Meldung an die DNB weitergibt, die daraufhin dann später GND Daten zu den Peronen vergeben (für die Normdatensätze) - was wiederum dazu führt, das VIAF Daten als Folge der GND-Datensätze vergeben werden, wenn eben aber noch keine Personenvorlagen in der Nutzung sind, ist die Vorlage, die glaube ich Dein Kollege Apper damals programmiert hatte ja auch nicht wertlos, sondern verlinkt die Personengruppen innerhalb der Wikipedia - wie gesagt, bin mir nicht sicher, ob jeder Nutzer oder Administrator den doppelten Mehrwert der Personen-Vorlagen (die ja von Kollegen kommen), hier schon vollständig verinnerlicht hat. Nichtsdestotrotz wäre es natürlich schöner, wenn ein Bot irgendwann automatisch auch diese Funktion dort übernehmen könnte, dann wäre sicherlich mehr Zeit für andere Sachen, ich finde es nur schade, das viele Sportler und Politiker (vor allem diese beiden Gruppen) da hinter den anderen etwas zurückbleiben. Dir noch einen schönen Morgen. Liebe Grüße--Schelmentraum (Diskussion) 00:50, 1. Feb. 2019 (CET)

Hallo Schelmentraum, Dein Beitrag wirkt etwas inkohärent, ich versuche nach besten Möglichkeiten zu antworten.
In der Vergangenheit wurden mit großem Aufwand leere Vorlageneinbindungen vom Normdatenteam entfernt, dazu gibt es zwei längliche Diskussionsthemen aus dem letzten Jahr auf der Seite Wikipedia Diskussion:Normdaten/Archiv/005. Die Normdaten werden vorwiegend mit erheblichem Aufwand händisch gewartet, wobei meines Wissens leere Vorlageneinbindungen, die keinen Mehrwert bieten, im Wege sind. Automatisierung der Wartung wäre nach meiner Meinung sicher wünschenswert, aber die Tücke liegt im Detail, so dass wir da noch im Wesentlichen händische Normdatenwartung machen. Ich wüsste nicht, dass sich an der Gesamtsituation seit letztem Jahr etwas geändert hätte. @Informationswiedergutmachung, Silewe, Kolja21, Wurgl wissen sicher mehr dazu.
Weiterhin kann ich mir nicht vorstellen, dass die DNB für Artikel mit leerer Vorlage auf Zuruf einen GND-Eintrag anlegt. Die haben genug Probleme mit ihrem Kernbestand und halsen sich wohl eher keine weiteren Einträge auf, nur weil Wikipedia sie "braucht". Der Fokus der DNB (Bibliothek!) liegt außerdem naturgemäß bei Autoren, weshalb "Sportler und Politiker" sowie Personen vieler anderer Berufe dort gewissermaßen unterrepräsentiert sind; daran wird die DNB nichts ändern. Vor diesem Hintergrund wäre bestenfalls zu hinterfragen, ob die Auswahl der Normdaten in der Wikipedia optimal oder thematisch ungerecht und reformbedürftig ist (die Chancen auf eine Veränderung sind aber wohl eher gering).
Ich bin hier übrigens kein Administrator; selbst wenn ich es wäre, würde es mich nicht zum Normdaten-Experten machen :-) —MisterSynergy (Diskussion) 01:14, 1. Feb. 2019 (CET)
Hallo MisterSynergy,
bist doch Administrator (sogar als einer der wenigen aus Deutschland - was das ja gerade besonders wertvoll macht - Dein Engagement) bei der Wikidata ;-) (Überblick von oben) und die Wikidata führt die Datensätze ja auch noch mal auf einem noch übergeorneteren Niveau für alle Wikipedias zusammen - was ich allerdings nicht wußte, ist das es da in der Vergangenheit (gerade was die Normdaten anbetrifft) es bei Euch Diskussionen gegeben hat. Denn zahlreiche solide Beispiele in der Vergangenheit haben schon bewiesen (innerhalb der Wikipedia), daß die DNB dann schon noch (irgendwann einmal) einen individualisierten Datensatz auf Wunsch oder "Zuruf" nach dem Eichhörnchenprinzip dann anlegt. Beispiel Chris Gill als kleines Beispiel ein von mir 2013 mal angelegter Artikel (damals noch ohne jede Normdaten, da geht es den Filmeditoren wie den Politikern oder Sportlern ;-)) hier mal ein britischer Filmeditor - siehe: (Aktuell | Vorherige) 12:28, 3. Jun. 2018‎ Informationswiedergutmachung (Diskussion | Beiträge)‎ K . . (6.213 Bytes) +18‎ . . (PD-fix, Normdaten korrigiert) (rückgängig | danken) [automatisch gesichtet] Vor einem halben Jahr vom Kollegen Informationswiedergutmachung dort rübergegeben - Jetzt hat der Chris Gill seine Normdatensätze aber bekommen siehe GND + VIAF (6 Monate ist da eher flott) - Du hast allerdings recht wenn Du sagst, daß sich die DNB da nicht unbedingt "drum prügelt" um diese technische -Mehrarbeit- (weil die auch personaltechnisch chronisch unterbesetzt sind und auch sonst kaum mit ihren Kernaufgaben hinterherkommen).
Nichtsdestotrotz haben die (DNB-Abteilung in Frankfurt) die Verwaltung aller Datensätze als hoheitliche Aufgabe übertragen bekommen. Die können das also nicht einfach "ablehnen", wenn Sie dazu aufgefordert werden. Allerdings, und da gebe ich Dir völlig recht - wie strukturiert, ökonomisiert oder intelligent (in der Summe) so etwas dann am Ende buchstäblich -programmtechnisch- umgesetzt wird, bleibt abzuwarten. Die bastelten jahrelang an einer Schnittstelle von VLB und DNB (August 2015 war es dann soweit) - jetzt funktioniert zumindest das - einigermaßen, obwohl man auch da mit viel mehr Weitblick (und den nötigen Programmierern) intelligente Formulare (Programme) hätte für alle installieren können, die der DNB, der Wikipedia (auf allen Ebenen - schließt dann auch Wikidata mit ein) und den allgemeinen Nutzern die Arbeit und den Umgang mit internationalen Normdatensätzen deutlich erleichtert hätte. Da fehlt noch so ein bißchen der Gesamt-Überblick in Sachen Datensätze und deren externe Verarbeitung (der DNB von oben) und deswegen verliert sich das oftmals im Detail oder im Klein-Klein der Handmade-Variante, obwohl der gute Wille bei den Mitarbeitern in Frankfurt schon gegeben ist - meines Wissens - da braucht es wohl in der Zukunft mal Leute von der DNB und der Wikipedia (und vielleicht dem VLB) das da mal eine intelligente Blaupause für alle entwickelt wird. Nichtsdestotrotz jemand wie Apper fehlt uns an allen Ecken und Enden, seit der weg ist, liegen ja ganze Sichtertabellenbots brach, es wird immer unzureichender nachgesichtet und dadurch können immer weniger Autoren in die Wikipedia kommen, weil das ewig dauert, bis die mal 300 Sichtungen bekommen. Das ist mir schon als normaler Nutzer irgendwann mal aufgefallen. Gute technische Lösungen, die dauerhaft von kompetenten Leuten betreut werden sind hier unendlich kostbar. Ich wollte Dir Deine Arbeit auf der Wikidata aber nicht unnötig erschweren. Aber solange es keine übergeordnete Lösung gibt, bleibt ja nur die Handmade-Variante (bei uns genauso wie auch bei der DNB) - das kostet Zeit, Nerven Energie. ;-) Aber ich glaube so ist die Wikipedia überhaupt mal entstanden - Handmade ... ;-) Liebe Grüße--Schelmentraum (Diskussion) 17:18, 1. Feb. 2019 (CET)
Der Chris Gill hat seinen Normdatensatz vermutlich durch (maschinelle?) Übernahme der Daten von filmportal.de bekommen. TaxonBot schreibt einfach Personen mit fehlender GND in diese Liste, der Bot meldet gar nichts und an niemanden. Einige User der Wikipedia können und dürfen Normdatensätze bei der DNB anlegen und die machen das auch manchmal, ob aus dieser Liste oder aus anderen Listen entzieht sich meiner Kenntnis. Meiner Information nach (ich müsste suchen) sollen aber für Sportler keine Datensätze angelegt werden (trotzdem gibt es etliche Normdatensätze, irgendein Institut an einer Uni hat die angelegt) – das ist auch nachvollziehbar, den der Namensbestandteil Bibliothek in Deutsche Nationalbibliothek sagt ja schon, dass es um Bücher geht (auch wenn der Begriff nun auch auf Tonträger etc. ausgeweitet wurde). Wenn ein Fußballer mal eine Biographie schreibt, dann wird der natürlich aufgenommen, aber alleine die Tätigkeit als Balltreter rechtfertigt keinen Eintrag. Bei Sportlern kann daher getrost auf diese Vorlage:Normdaten verzichtet werden, entweder haben die irgendwas geschrieben, dann haben die wohl einen Eintrag oder eben nicht. Es ist mittelfristig kein Eintrag erwarten. --Wurgl (Diskussion) 18:39, 1. Feb. 2019 (CET)
Die können das also nicht einfach "ablehnen", wenn Sie dazu aufgefordert werden. Natürlich können die ablehnen, und wie. Die Aufgabe der DNB lautet: Die Deutsche Nationalbibliothek hat die Aufgabe, lückenlos alle deutschen und deutschsprachigen Publikationen ab 1913, im Ausland erscheinende Germanica und Übersetzungen deutschsprachiger Werke sowie die zwischen 1933 und 1945 erschienenen Werke deutschsprachiger Emigranten zu sammeln, dauerhaft zu archivieren, bibliografisch zu verzeichnen sowie der Öffentlichkeit zur Verfügung zu stellen. Keine Publikation - kein DNB-Eintrag, so einfach. Was interessiert die DNB der US-, Erbfeind-, tschechische Politiker, wenn er noch nie auf deutsch publiziert hat oder über ihn publiziert wurde? Genau: nichts, es ist einfach nicht ihre Aufgabe. Ich hatte sogar mal vorgeschlagen, dass die DNB automatisiert unsere Einträge übernimmt, da wir auch eine deutschsprachige(n) Publikation ab 1913 sind, aber deren Priorität ist erst einmal eine andere. Für alles weitere kann man Benutzer:Raymond fragen, der ist der Hauptkontakt zur DNB (und sogar Admin, hier). MfG --Informationswiedergutmachung (Diskussion) 21:05, 1. Feb. 2019 (CET)
Danke, Wurgl und Informationswiedergutmachung; das deckt sich weitgehend mit meinem Wissensstand über die Sache. Es bleibt die Frage, ob eine leere Vorlage {{Normdaten}} erwünscht ist oder nicht. Ich habe hier eine Einbindung von User:Schelmentraum rückgängig gemacht, mit Verweis auf Hilfe:Normdaten (einleitender Absatz, Ende) und die Erinnerung an die Themen bei Wikipedia Diskussion:Normdaten (im Archiv 5) aus dem letzten Jahr. Schelmentraum hat einige weitere leere Vorlagen gestern Abend eingebaut, siehe Spezial:Beiträge/Schelmentraum. —MisterSynergy (Diskussion) 21:40, 1. Feb. 2019 (CET)
(nach BK) Übrigens, @Schelmentraum:, solche Ergänzungen sind unerwünscht, per Hilfe:Normdaten: Die Einbindung der leeren Vorlage, um lediglich auf die WP-Personensuche zu verlinken, ist nicht erwünscht, da sie die effiziente Abarbeitung der Wartungskategorien (bspw. Wikipedia:GND fehlt) verhindert. Eigentlich hatte mir Benutzer:Doc Taxon als Betreiber des Taxonbots zugesagt, das solche Einträge gelöscht werden, aber nun ja... Man, also ich, kann nicht alles haben. --Informationswiedergutmachung (Diskussion) 21:41, 1. Feb. 2019 (CET)
Jedenfalls wird meine Zeit damit vergeudet, wenn ich Einträge aus den Wartungskategorien bei Kategorie:Wikipedia:GND fehlt abarbeite, dann schau ich bei solchen Einträgen regelmäßig eher nicht nach, ob es da eine neue Eintragung gibt, sondern verpasse dem Artikel einfach nur das neue Datum. Blöd, aber es ist so. Treibt meinen Editcount nach oben, bringt dem freien Wissen aber nicht mehr als Arbeitszeitvergeudung. --Informationswiedergutmachung (Diskussion) 21:44, 1. Feb. 2019 (CET)
Braucht man aber auch nicht extra Löschen, ich setze die leere Vorlage nach wie vor ebenfalls ein, also hauptsächlich [bei] Autoren, Wissenschaftler[n], Journalisten, Filmschaffende[n], Musiker[n], Politiker[n] in hohen Ämtern etc (siehe ebenfalls die Hilfe:ND). Repräsentantenhaus mag zwar nett sein, aber aus deutschsprachiger Sicht eher kein hohes Amt. --Informationswiedergutmachung (Diskussion) 21:59, 1. Feb. 2019 (CET)
Nur als kleiner Ergänzung meinerseits, da hier immer wieder von der DNB gerdet wird. Die GND ist ein gemeinsames Projekt zahlreicher Bibliotheken und Archive, d.h. natürlich erhalten auch Sportler Normdatensätze; nur sind eben Autoren, die eine Monographie veröffentlicht haben, automatisch relevant (wie irrelevant das Buch auch sein mag). Schauspieler verdanken wir dem Filmportal, Politiker der Friedrich-Ebert-Stiftung, die Bayern erfassen Ordensträger etc. Das einzige Relevanzkriterium lautet: Es muss Material über eine Person vorliegen, und dafür reicht oft schon eine Zeitschriftenbeitrag (Beispiel: Regionalbibliografien). --Kolja21 (Diskussion) 23:57, 1. Feb. 2019 (CET)

Hallo und danke für Eure Beiträge ...

Was mich hier so ein bißchen umtreibt, ist warum die "leere Vorlage" sie ist ja defacto nicht "leer" irgend jemand hier -stört-, ;-) oder mehr Arbeit verursacht/verursachen soll oder jemanden bei der Arbeit "behindert". Ich arbeite jetzt mit den Normdatensätzen hier seit über 6 Jahren bei der Wikipedia, als einer der wenigen hier durchgehend, die da noch den Überblick haben auch nach außen. Ich habe die Umstellung der DNB ihrer Daten von PND auf GND problemlos überstanden. :-) O-Ton: Informationswiedergutmachung "Braucht man aber auch nicht extra Löschen, ich setze die leere Vorlage nach wie vor ebenfalls ein" - Wunderbar - meine meine Rede, :-) wenn die Normdaten irgendwann bei DNB oder bei der LCCN oder dem VIAF mal (warum auch immer) nachgetragen sind, ist die Vorlage hier bei uns in der Wikipedia ja schon da - in der gesamten anderen Zeit (ohne Normdatensätze) funktioniert die sogenannte "leere Vorlage" ja ohnehin als sinnvolles Tool von Apper -nämlich- als Wikipedia-Personensuche (innerhalb der Wikipedia - nach innen) - wie gesagt der Apper hat sich mit Sicherheit was damals dabei gedacht, als er dieses Tool genau -so- angelegt hat - Zwei unetrschiedliche Dinge verbindend (a. Normdatensätze, b. Wikipedia-Personen-Suchhilfe die innerhalb des Textes verlinkt sind nach innen) 2 Dinge im Preis von einem "Tool".
Vielleicht bin ich ja der einzige der auch ab und an die Wikipedia-Personensuche -ohne- die Normdatensätze nutzt und wenn die bei Sportlern oder Politikern nicht da sind, fehlt da auch was. Das diese vermeintlich "leere Vorlagenhülle" geradzu eine "Massen-Hysterie" ;-) beförden kann wundert mich komplett - mal davon abgesehen, daß jeder Bibliothekar der an die DNB angeschlossen ist, individualisierte Normdatensätze anlegen darf (und es auch tut) völlig unerheblich -wer- das ist, hat mit dem Literaturbetrieb mittlerweile nur noch sehr bedingt was zu tun, Beispiele gibt es da übrigens haufenweise. Das liegt aber wahrscheinlich daran, das auch die DNB mehr und mehr erkennt, das sie keine Oase der Seeligen im Niemandsland einer reinrassigen Bücherwelt darstellt, in Deutschland nicht und weltweit schon gar nicht - sondern für den gesamten deutschen Literaturbetrieb (und mittlerweile darüber hinaus) sämtliche Datensätze dem In- und Ausland zur Verfügung stellt, (die Wikipedia ist ja nur ein Abnehmer dieser Datensätze) und zwar für VIAF und den WorldCat - im besonderen. Auch das wissen nicht alle Mitarbeiter innerhalb der DNB - Leider! - Frankfurt war als große Bibliothek mit den eigen Literatur-Datensätzen früher als Bibliothek ja ausgelastet - heute im Zeitalter der Globalisierung und im Medien- Informationszeitalter der Vernetzung geht deren Aufgabe viel weiter, sonst würde/dürfte es so viele Personen die über individualisierte Normdatensätze innehalb der DNB erfaßt sind gar nicht geben. Zum Teil mehrfach angelegt falsch angelegt - unvollständig angelegt etc. - was das mit dem Tool "leere Vorlage" von Apper für die Wikipedia-Personensuche zu tun hat - genau - gar nichts! ;-) Liebe Grüße--Schelmentraum (Diskussion) 00:03, 2. Feb. 2019 (CET)
Nein, nicht deine Rede. Du verkürzt mein Zitat unzulässig auf dir die genehme Version. Die leere Vorlage lediglich zur Personensuche ist Quatsch. Darf gerne gelöscht werden, auch wenn ich sie benutze. Weg damit. --Informationswiedergutmachung (Diskussion) 00:13, 2. Feb. 2019 (CET)

Das wäre fast so als würde uns die katholische Kirche erklären wollen, das Sex nur zur Fortpflanzungszwecken dienen soll. ;-) Genutzt hat es glaube ich nix! ;-) Weder nach innen noch nach außen.--Schelmentraum (Diskussion) 00:28, 2. Feb. 2019 (CET)

Grüße von B. L. Ödsinn. --Informationswiedergutmachung (Diskussion) 00:39, 2. Feb. 2019 (CET)

Wikidata-Eigenschaft vs. lokale Parameter[Quelltext bearbeiten]

Moin Moin MisterSynergy, vielen Dank erstmal für die vielen Hilfen, die du hier durch dein Wissen zur Verfügung stellst. Ich lese hier gerne mit und schnappe immer wieder Neuigkeiten auf, die ich versuche sinnhaft für meine Mitarbeit zu nutzen. Meine Frage wäre, wie du am effizientesten das folgende lösen würdest und mir ggf. dafür einen Tipp geben kannst. Ich habe hier in der deutschsprachigen (aber auch englisch und niederländischen) Wikipedia lokale Vorlage mit Parametern und Werten und ich würde gerne die Werte zu Wikidata vergleichen. SPARQL ist mir da für mich noch zu Neuland und die Vorlagen umbauen und Wartungskategorien verpassen zu kompliziert und unnötig (momentan zumindest!). Die Frage hat keine Prio. Danke dir schonmal --Crazy1880 16:05, 2. Feb. 2019 (CET)

Hallo Crazy1880, von Wikidata aus kannst Du nicht in den Quelltext von Wikipedia-Artikeln reingucken, deshalb hilft SPARQL auch nicht weiter. Selbst wenn Du das könntest, sind Vorlagenparameter oft irgendwie sonderbar formatiert (mit Wikilinks oder so), so dass Du das von Wikidata aus eh nicht machen wollen würdest.
Für eine einmal-Überprüfung könntest Du alternativ noch mit einem lokalen Skript was zusammenfummeln, sofern die Vorlage nicht in zu vielen Seiten eingebunden ist (>5000 könnte schwer werden). Da würdest Du mit Spezial:Export die Seiten-Quelltexte in eine XML-Datei exportieren, außerdem von in einem weiteren Schritt mit SPARQL von Wikidata die zu vergleichenden Daten beziehen, und das dann mit einem Skript (Python oder so) lokal vergleichen. So richtig effizient ist das nicht.
Besser wäre es wohl, vor allem wenn Du das dauerhaft überwachen möchtest, Wartungskategorien in Wikipedia anzulegen und die mit dem Vorlagencode oder einem Modul zu befüllen. Da könnten dann auch andere Benutzer bei der Abarbeitung mithelfen :-)
Für externe Identifikatoren möchte ich in absehbarer Zeit ein entsprechendes Lua-Modul zur Verfügung stellen (Entwicklungszwischenstand bei beta-dewiki), so dass Nutzer den komplizierten Vergleichscode nicht selbst schreiben müssen, sondern nur das Modul in ihren Vorlagen einbinden müssen. Andere Datentypen sind aber aus verschiedenen Gründen nicht so einfach, deshalb wäre das erstmal auf Identifikatoren beschränkt.
Viele Grüße! —MisterSynergy (Diskussion) 20:23, 3. Feb. 2019 (CET)
Da ich selbiges ja gerade gemacht habe, gebe ich mal meinen Senf dazu:
  • Vorlagen auf WP kann das Tool von Giftpflanze auswerten.
  • Eine Liste aller auf WD vorhandenen Einträge zu einer bestimmten Property ist via Query erhältlich
  • Der Rest ist Excel-Magie: Zuordnung der passenden Einträge beider Listen zueinander und Vergleich der fraglichen Daten.
  • Für alle Abweichungen erstelle ich dann auch direkt in Excel passende Zeilen in Wikisyntax für Wartungstabellen, die ich dann auf eine Benutzerunterseite per c&p transferiere.
Möglicherweise gibt es bessere/einfachere Wege, dieser aber funktioniert zumindest auch. --Mabschaaf 22:59, 3. Feb. 2019 (CET)
Moin Moin @Mabschaaf:,
  • coole Sache eigentlich, etwas behäbig, aber lustig, ich teste da mal dran, danke für den Tipp.
  • Hast du ein Beispielquerry für mich?
@MisterSynergy: die Wartungskategorien wären zu viel, vor allem, weil zusätzlicher Code in die Vorlagen müsste, was wahrscheinlich bei wenigen auf Gegenliebe stoßen würde. Meine volle Unterstützung hast du zu deinem Modul. Wenn du jemanden zum Testen brauchst, sag Bescheid.
mfg --Crazy1880 18:24, 5. Feb. 2019 (CET)
Mit Query habe ich auch so meine Probleme. Mir hat mal jemand das da erstellt, ich modifiziere jetzt darin immer irgendwelche Properties, wobei dann die Spaltenüberschriften nicht mehr stimmen, was mich aber nicht stört. Vielleicht nutzt Dir das ja als Startpunkt.--Mabschaaf 21:22, 5. Feb. 2019 (CET)
Für SPARQL-Hilfe ist wikidata:Wikidata:Request a query eine passende Anlaufstelle (deutschsprachig würde auch wikidata:Wikidata:Forum gehen). Da beschreibt man grob, wonach man sucht (welche Eigenschaften, was man raus haben möchte, und so), und dann hilft einem jemand, meist mit einer fertigen Abfrage. —MisterSynergy (Diskussion) 21:27, 5. Feb. 2019 (CET)