Wikipedia:Bots/Anfragen

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Hier ist Platz, Bearbeitungs- und Änderungswünsche an die Botbetreiber zu notieren, die in „Handarbeit“ ausgeführt eher als Zumutung gelten können, zum Beispiel das Korrigieren von mehr als 50 Einbindungen einer verschobenen Vorlage (gilt nur für zu löschende Falschschreibungsweiterleitungen auf Vorlagen!). Wenn du Fragen hast, kannst du Botbetreiber auch im IRC-Channel [#wikipedia-de-bots] Webchat erreichen. Für Besprechungen unter den Botbetreibern oder zur Koordination von wichtigen Änderungen (z.B. an der API) gibt es die Bot/Notizen.

Für Anfragesteller gilt
  1. Anfragen bitte begründen, gegebenenfalls mit Links auf relevante Diskussionen, und unterschreiben.
  2. Es gibt keine Verpflichtung der Botbetreiber, diesen Anfragen nachzukommen und insofern auch keinen Anspruch auf Umsetzung eines Änderungswunsches.
  3. Größere Änderungen an Artikeln eines Themengebietes, z. B. an Einbindungen viel genutzter Vorlagen, bitte mit den jeweiligen Fachportalen oder -redaktionen abstimmen. Die Verantwortung für die Aktion liegt beim Anfragesteller.
  4. Vor dem Stellen einer Anfrage, die einen regelmäßigen Boteinsatz und keine einmalige (Massen-)Änderung betrifft, bitte ebenfalls das betroffene Portal bzw. Projekt informieren und den geplanten Boteinsatz dort diskutieren.
  5. Bei einem Boteinsatz ist oft noch Vor- und Nacharbeit durch den Anfragesteller notwendig, zum Beispiel nach Auflösung von Weiterleitungen die Kontrolle und das Stellen eines Schnelllöschantrages. Auch kann es immer Fälle geben, in denen der Bot nicht richtig arbeitet und die dann manuell nachgearbeitet werden müssen.
  6. Ent- oder Umkategorisierungen von Artikeln in die Kategoriendiskussion eintragen, dort diskutieren und dann in die Warteschlange des WikiProjekts Kategorien stellen.
  7. Ein einfaches Umbiegen von Links nach einer Verschiebung auf das neue Ziel wird grundsätzlich nicht vorgenommen.
    1. Umgebogen werden können Verweise auf zwingend zu löschende Weiterleitungen – wie z. B. bei Falschschreibungs-Weiterleitungen oder nach Verschiebungen falsch geschriebener Vorlagen.
    2. Neue Begriffsklärungsseiten können zur Entlinkung an das Fließband des WikiProjekts BKS gemeldet werden.
  8. Änderungen der Signatur können in Fällen durchgeführt werden, in denen zahlreiche Links auf eine falsche Benutzerseite zeigen. Dies jedoch nur, falls die Korrektur nicht mittels Weiterleitungen möglich ist (beispielsweise bei im Rahmen der SUL-Finalisierung umbenannten Benutzern).
  9. Es werden keine Änderungen der Rechtschreibung zwischen zulässigen Versionen bzw. Variationen durchgeführt.
Für Botbetreiber gilt
  1. Jeder Botbetreiber ist verpflichtet, die Sinnhaftigkeit vor Ausführung eines Änderungswunsches zu prüfen und bei Einsprüchen gegebenenfalls von der Änderung abzusehen (kein blindes Vertrauen in die Angemessenheit/Richtigkeit hier gestellter Anfragen).
  2. Für jede hier gelistete Anfrage gelten die auf Wikipedia:Bots genannten grundsätzlichen Regeln (zum Beispiel keine Änderungen im Benutzer- oder Wikipedia-Namensraum ohne Absprache).
  3. Bot-Anfragen (insbesondere nach Löschdiskussionen) sollten mindestens 3 Tage ruhen, um eine gegebenenfalls initiierte Löschprüfung nicht durch vollendete Tatsachen unmöglich zu machen. Bei offensichtlichen Botaufträgen (z. B. aus einer Portal-Diskussion für das Portal beschlossene Änderungen und dergleichen) ist diese Wartezeit nicht zwingend notwendig, desgleichen nicht für „Anfrage-Aufträge“, die keine Seiten in der Wikipedia ändern.
Durchführung
  • Die Botbetreiber sollen bitte vor Umsetzung den jeweiligen Punkt entsprechend kommentieren, um Überschneidungen zu vermeiden.
  • Dazu sollte unmittelbar (maximal 15 Minuten) vor dem Botstart hier im entsprechenden Abschnitt die Vorlage InuseBot platziert werden:
{{InuseBot|Botname|Betreiber}}
  • Den Bot bitte sorgfältig beobachten!
  • Bitte nach Erledigung den Punkt in der Liste als erledigt kennzeichnen.
Abkürzung: WP:BA, WP:BOT/A, WP:B/A


Automatische Archivierung
Auf dieser Seite werden Abschnitte automatisch archiviert, die seit 3 Tagen mit dem Baustein {{Erledigt|1=~~~~}} versehen sind. Die Archivübersicht befindet sich unter Wikipedia:Bots/Anfragen/Archiv.

Inhaltsverzeichnis

Bot für die Abarbeitung von Kategorie:Benutzer:Importartikel[Quelltext bearbeiten]

Normalerweise werden Importartikel nach 3 Monaten Nichtbearbeitung gelöscht. Ich schlage daher, falls jemand daran Interesse hat, folgenden Bot vor (ich kann das leider nicht): Automatische Löschung von Importartikel, die drei Monate unbearbeitet sind und der Benutzer auch inaktiv. Automatische Benachrichtigung auf er Benutzerdisk (entfällt bei gesperrten Benutzern). Automatische Benachrichtigung auf der Benutzerdisk, falls der Importartikel drei Monate nicht bearbeitet wurde, der Benutzer aber aktiv ist. Siehe dazu auch die Diskussion auf meiner Disk unter Benutzer Diskussion:Informationswiedergutmachung#SLAs auf alte Importe. Es erspart Zeit, sinnlose Diskussionen und dürfte automatisierbar sein. MfG --Informationswiedergutmachung (Diskussion) 22:38, 2. Dez. 2014 (CET)

Ich würde diese Angelegenheit federführend den Importeuren überlassen.
Auf Wikipedia:Importwünsche/Wartung wird eine detaillierte Auflistung generiert, wann welcher Artikelentwurf zuletzt bearbeitet wurde und von wem.
VG --PerfektesChaos 23:03, 2. Dez. 2014 (CET)
Diese detaillierte Auflistung wurde zuletzt am 30. Januar 2014 aktualisiert (siehe Verson) und drin steht: Letzter Stand: Sonntag, 1. September 2013 16:20:18. Außerdem stimmt sie hinten und vorne nicht: es sind noch drei Artikel vom Mai 2011 nicht fertig übersetzt, siehe Kategorie:Benutzer:Importartikel 05 - 2011, viele haben gar kein Importdatum in der Tabelle. Ein Bot würde eher dazu führen, dass man diese Projektseite schnelltonnen kann. Ach ja: spaßigerweise steht da noch ein Importartikel von mir drin (angelegt unter meinem alten Benutzernamen: Benutzer:Jack User/Hoot Gibson. Hat sich auch schon längst erledigt. Fazit: ein Bot macht es schneller, besser und entlastet die Importeure vor unnützen Arbeit. Fragen wir mal Itti, was sie als Importeur von der Idee hält. Die Projektseite gibt es übrigens erst seit Januar 2013 und hat sich offensichltich nicht bewährt, immer noch offene Importartikel von 2011 und 2012 sind da gar nicht drin, wenn ich richtig gezählt habe knapp 60 Artikel. --Informationswiedergutmachung (Diskussion) 23:20, 2. Dez. 2014 (CET)
Oh ja, das ganze lässt sich gut per Bot machen, nur müssen eine Menge Fakten beachtet werden. Ebenso auch das Ansprechen von Benutzern z.B. Das ist eine ganz interessante Idee, und ich als Importeur mach mich mit meinem Bot da ran. Das wird aber eine größere Sache. Also schauen wir mal, -- Doc Taxon @ Disc – BIBR – 23:26, 2. Dez. 2014 (CET)
Schön zu sehen, wie sich eine Idee nach dem Wikiprinzip weiterentwickelt und durchsetzt. Vielen Dank posthum an Benutzerin:Lady Whistler, die hier viel Arbeit investierte. Frohes Schaffen — Boshomi ☕⌨☺  00:30, 3. Dez. 2014 (CET)

in Arbeit  -- in Arbeit, -- Doc Taxon @ Disc – BIBR – 23:26, 2. Dez. 2014 (CET)

@Doc Taxon: Danke, der Vorteil ist ja auch, dass die Benutzer mal an ihre Artikel erinnert werden. --Informationswiedergutmachung (Diskussion) 23:45, 2. Dez. 2014 (CET)
@Informationswiedergutmachung:
Oh du mein Herzchen. Na klar, wenn da oben lang und breit erklärt ist, wie die Fachleute den Seiteninhalt aktualisieren, und dort als letztes Datum 2013 vermerkt ist, dann muss halt mal wieder jemand auf den Knopf drücken.
Jetzt mit 812 Einträgen und detaillierter Analyse aktualisiert.
@Doc Taxon: Die Wartungskat darf nicht leer sein; wurde irrtümlich aus der Vorlage herausgenommen – dann natürlich null Treffer.
VG --PerfektesChaos 00:36, 3. Dez. 2014 (CET)
@PerfektesChaos: Ach, PerfektesHerzchen, und was spricht gegen eine Automatisierung des Löschens und auch eine automatische Nachricht? Die gibt es trotz der Fachherzchen nämlich nicht und wäre gar formidabel, wenn nicht gar famos. --Informationswiedergutmachung (Diskussion) 01:36, 3. Dez. 2014 (CET)
Aber supa, das ein Fachmann mal den richtigen Knopf gedrückt hat. Auch wenn es nur ein Jahr gedauert hat. Oder so. --Informationswiedergutmachung (Diskussion) 01:37, 3. Dez. 2014 (CET)
Praktisch wäre auch, wenn man als Knöpfeldrücker automatisch drauf aufmerksam gemacht wird, wenn ein neues Lemma, das identisch mit dem Importnamensartikel ist. Dann könnte man auch umgehend feststellen, dass bsp. Max Maven im Oktober 2014 angelegt wurde, aber im BNR bei einem inaktiven Benutzer Benutzer:Benji Wiebe/Baustelle/Max Maven fröhlich vor sich hinschimmelt. --Informationswiedergutmachung (Diskussion) 01:41, 3. Dez. 2014 (CET)
eine Funktion dazu habe ich vor, in den Bot mit einzubauen. -- Doc Taxon @ Disc – BIBR – 07:30, 4. Dez. 2014 (CET)


@Informationswiedergutmachung:

  • Die fragliche Wartungsseite blieb deshalb auf Stand Sommer 2013, weil die abarbeitende Importeurin im Sommer 2013 verstorben war und ihre Nachfolger sich hier bislang nicht einbrachten.
  • Ein Bot oder Admin, der automatisch Benutzerseiten löschen würde, wäre bald knopflos.
  • Die von dir verlangte Benutzerseitenlöschung wäre dann und nur dann möglich, wenn seit dem Import überhaupt kein oder nur ein Mini-Edit erfolgte. Genau dieser Sachverhalt wird auf der fraglichen Wartungsseite auseinandergefieselt.
  • Vor irgendwelchen Aktivitäten müssen die Benutzer auf ihren Diskus angesprochen werden, und es muss ihnen ausreichend Gelegenheit zur Stellungnahme (rund ein Monat) gegeben werden. Nur diese Ansprache könnte als botgestützte Massenpost erfolgen. Benutzer müssen auch nicht pausenlos aktiv sein.
  • Kam es erstmal durch den Wirt oder gelegentlich andere Benutzer zu nennenswerten Bearbeitungen, wurde gar der Artikel schon zur Hälfte übersetzt, dann ist überhaupt keine Löschung von Amts wegen mehr möglich.
  • Schwierig ist der Fall, wenn zum gleichen Thema und ggf. von jemand anderem übersetzt schon ein Artikel im ANR steht; dann muss für alle erarbeiteten Passagen überprüft werden, ob sie inhaltsreicher sind als die ANR-Version.
  • Die grundsätzliche Politik mit Benutzerseiten ist, dass diejenigen, die dem Ziel der Enzyklopädieerstellung dienen, auch im BNR verweilen dürfen; sie fressen keinerlei zusätzliche Ressourcen mehr als ohnehin schon angefallen.
  • Der Umgang mit den fraglichen Benutzerseiten bedarf der Einzelfallprüfung und eines vorsichtigen Umgangs mit den Autoren. Eine automatisierte Kahlschlagsanierung, wie sie dir vorschwebt, wird es nicht geben.

@Doc Taxon: CC

VG --PerfektesChaos 12:35, 5. Dez. 2014 (CET)

Ja ja, das seh ich schon auch alles so. Ein Konzept dazu erarbeite ich gerade. -- Doc Taxon @ Disc – BIBR – 13:44, 5. Dez. 2014 (CET)
Programmierung wird nach der AdminCon fortgesetzt werden, -- Doc Taxon (Diskussion) 16:51, 16. Feb. 2015 (CET)
Wie ich schon erwähnt habe, ist der Code bereits fertig. Ich werde die Funktion den Importeuren noch zur Diskussion stellen, genauso wie die geplante Abschaltung von WP:IU. – Doc TaxonDiskussionWiki-MUCWikiliebe?! 00:56, 18. Okt. 2015 (CEST)

@Doc Taxon, Informationswiedergutmachung: In wenigen Minuten ist der letzte Beitrag ein Jahr her. Wie ist hier der Stand? --Leyo 23:25, 17. Okt. 2016 (CEST)

Ich hab keine Ahnung, ich kann Bot gar nicht. --Informationswiedergutmachung (Diskussion) 23:43, 17. Okt. 2016 (CEST)
Priorität gaaanz weit unten, da sind viele wichtige Botentwicklungen erstmal vorrangig. – Doc TaxonDisk.WikiMUCWikiliebe?! 08:03, 18. Okt. 2016 (CEST)

@Informationswiedergutmachung: @PerfektesChaos: @Itti: @Doc Taxon: @Boshomi: @Leyo: Erledigt? --178.191.121.179 00:11, 2. Jan. 2018 (CET) @Doc Taxon: Moin, wie ist hier der Stand? Du hast immerhin seit fast 1,5 Jahren hier nichts mehr zu geschrieben. Viele Grüße, Luke081515 01:39, 30. Mär. 2018 (CEST)

Ja, ich mach erst noch drei andere Sachen. Eigentlich ist's schon fertig, aber war in der Testphase, als einiges dazwischen kam. Mir schwebt auch vor, wie ich mein ursprüngliches Konzept noch verbessern könnte, der wachsenden Erfahrung geschuldet. Ich kümmer mich schon darum, – Doc TaxonDisk.WikiMUCWikiliebe?! 12:28, 30. Mär. 2018 (CEST)

Kategorie-Umsortierungen per Bot[Quelltext bearbeiten]

Um die Kategorie:Wikipedia:Sportler nach Staat (überarbeiten) zweckmäßig abarbeiten zu können, müsste ein Bot großflächig Umsortierungen vornehmen: Alle Kategorien und Artikel der zweiten Ebene unter Kategorie:Wikipedia:Sportler nach Staat (überarbeiten) (also z. B. die Kategorie:Leichtathlet (Mexiko) oder der Artikel Muchran Wachtangadse) sollen auf die erste Ebene (sprich, z. B. Kategorie:Leichtathlet (Mexiko) soll direkt in Kategorie:Wikipedia:Sportler nach Staat (überarbeiten) einsortiert werden), und die Kategorien der ersten Ebene (z. B. Kategorie:Sportler (Mexiko)) sollen aus der Kategorie:Wikipedia:Sportler nach Staat (überarbeiten) raus. Das würde es ermöglichen, erledigte Kategorien einfach aus der Wartungskat entfernen zu können, anstatt warten zu müssen, bis der ganze zugehörige Staatsast erledigt ist. 79.217.150.153 17:21, 29. Apr. 2015 (CEST)

Das müsste im Wikipedia:WikiProjekt Kategorien besprochen werden. Danach kann man das ganze hier durch einen Bot ausführen lassen. Gruß, Luke081515 20:18, 29. Apr. 2015 (CEST)
Meinst du nicht, dass ich WP:~ kenne? Allerdings wäre es doch ziemlich umständlich, alle Kategorien einzeln dort einzutragen, das geht doch bestimmt einfacher. Ich werde das sicher nicht irgendwo diskutieren. Es ist offensichtlich, dass die Umsortierung die Abarbeitung begünstigen würde. 79.217.150.153 21:52, 29. Apr. 2015 (CEST)
Kann man bestimmt lösen, nur nach welchem System möchtest du die verschieben? Ohne Logik kommt ein Bot selten weiter.... Gruß, Luke081515 22:13, 29. Apr. 2015 (CEST)
Hab ich doch ausführlich beschrieben! Was verstehst du denn nicht? 79.217.150.153 22:39, 29. Apr. 2015 (CEST)
Also du möchtest alle Artikel in die erste Ebene, verstehe ich das richtig? Kann man sicher machen, aber das ist eine sehr einschneidene Änderung, sollte ich das machen, hätte ich da vorher gerne einen Konsens darüber. Was allerdings nicht heißt, das es nicht ein anderer Botbetreiber übernehmen kann (ich möchte hier nur für mich sprechen nicht für andere). Gruß, Luke081515 10:04, 30. Apr. 2015 (CEST)
Nein, das möchte ich eben nicht. Also nochmal: Ich möchte alle Kategorien und Artikel, die derzeit in der zweiten Ebene stehen, in der ersten Ebene haben. Die Anzahl der betroffenen Artikel ist allerdings minimal: In Kategorie:Sportler (Deutschland) sind das 28 Artikel, in vielen anderen Kategorien maximal fünf, und in vielen Verbandskategorien sind gar keine Artikel betroffen. D.h. die Änderung betrifft im Wesentlichen Kategorien, und die werden sowieso regelmäßig wartungsmäßig bearbeitet, da sind die Botedits irrelevant und wiegen den Nutzen mehr als auf. 79.217.157.14 11:09, 30. Apr. 2015 (CEST)
Kann den Antrag mal bitte jemand umsetzen? Die Wartungskategorien arbeiten sich nicht von selbst ab. 85.212.3.122 00:33, 6. Mai 2015 (CEST)
Kannst Du mir vielleicht bitte kurz erläutern, was das Ziel dieser Wertungsaktion ist? Beim Lesen Deines Antrags hatte ich gehofft, dass man sich ein bisschen in Richtung einer Facettenklassifikation zu bewegen versucht (unglaublich!). Aber aus der Disk., die Du in der Wartungsakat. verlinkt hast ([1]), kann ich das nicht so richtig herauslesen. Um beim Beispiel Mexiko zu bleiben: Welche Kat. soll Adriana Fernández nach der Umstellung haben?--Cactus26 (Diskussion) 10:00, 7. Mai 2015 (CEST)
Adriana Fernández ist bereits völlig ok, da würde gar nichts passieren, auch nicht bei diesem Bot-Antrag hier. Das Ziel ist, Staatsangehörigkeit und Tätigkeit zu entkoppeln. Siehe auch diese aktuelle Diskussion. Bei den Sportlern war es so, dass früher z. B. Kategorie:Sportler (Mexiko) unter Kategorie:Mexikaner hing, was zu zahlreichen Falschzuordnungen geführt hat. Seitdem diese Zuordnung entfernt wurde, fehlen bei vielen Sportlern die Staatsangehörigkeitskategorien. 85.212.36.116 21:10, 7. Mai 2015 (CEST)
Danke für Deine Mühe, mir das zu erklären. Ich denke, ich habe das Problem jetzt erkannt. Auf den ersten Blick ist erstaunlich., warum die Interpretation von "Mexiko" in "Kategorie:Gewichtheber (Mexiko)" als Staatsbürgerschaft ein Problem sein könnte... Wäre sie auch nicht, wären da nicht Unterkategorien, die das "Sport (Land)" anders deuten. Am Beispiel Lionel Messi erkennt man, wo das liegt. Dieser würde Kategorie:Fußballspieler (FC Barcelona) und Kategorie:Fußballspieler (Spanien) zum Spanier. Die Vereinskategorien sind also das Problem (vielleicht gibt es weitere). Nun versucht ihr, das Problem zu lösen, indem ihr das "Mexiko" in "Kategorie:Gewichtheber (Mexiko)" umdeutet als "war sportlich aktiv in" (als "Spezialisierung" von "hat(te) seinen Tätigigkeitschwerpunkt in").
Ich bin ehrlich: Ich halte das für chancenlos. Wenn man sich z.-B. Michael Stockton ansieht. Bei diesem fehlt "Basketnballspieler (Deutschland)". Mag sein, dass Du bei Deiner Umstellung daran denken würdest. Aber jemand, der nicht hauptberuflich Sportler-Artikel anlegt, denkt daran niemals und kommt nicht auf die Idee, das "Vereinigte Staaten" könnte was anderes meinen als Staatsbürgerschaft.
Ich muss weiterhin zugeben, dass ich des gesamte Kategoriessystem für kaum noch zu retten halte. Der hauptsächliche Fehler ist, dass es selbstverständlich ist, Schnittmengenkategorien völlig unabhängiger Eigenschaften zu bilden (Sportart x Land/Region). Dass bei einer präkombinierter Systematik der Pflegeaufwand des Kategoriekatalogs explodiert und nicht mehr bewältigbar wird, wird leider von zu wenigen erkannt (wenn Du Lust hast, ich habe mich mal mit dem Thema versucht zu befassen: [2]).
Ein weiteres großes (und zum Teil aus der Schnittbildung resultierendes) Problem ist, dass der Kategoriebezeichner nicht erklärt, was er eigentlich meint (so wie das "Mexiko" in den Sportartenkategorien).
Ein Schritt in die richtige Richtung wäre mMn an dieser Stelle ein etwas weitergehender Ansatz:
  • die Verschneidung Sportart x Land wird grundsätzlich entfernt
  • statt dessen wird eine neue "Assoziationskategorie" "hat(te) seinen Tätigkeitsschwerpunkt in <Land>" unter allen Ländern ergänzt (die für andere Dinge wie Sport später auch genutzt werden kann)
  • jedem Sportler wird eine (oder mehrere) "reinrassige" Sportartenkategorie und eine oder mehrere Kategorie für "Tätigkeitsschwerpunkt in <Land>" ergänzt
  • zudem (in Übereinstimmung mit dem geplanten Vorgehen) bekommt jeder Sportler direkt die Staatsbürgerschaft-Kategorie (auch hier mehrere möglich)
Ich vermute, dieses Spontankonzept berücksichtig noch nicht alles, auch sind aussagekräftige Kategoriebezeichner sicher "sperrig" (wobei da technische Möglichkeiten bestünden, das zu verbessern).
Es tut mir leid, ich tue mich ein wenig schwer in Botaufträge zu investieren, hinter deren Ergebnissen ich nicht stehe.--Cactus26 (Diskussion) 11:27, 9. Mai 2015 (CEST)
Kategorie:Sportler nach Land ist eigentlich in dieser Form überflüssig, ja. Es genügt Kategorie:Sportler nach Verband und Kategorie:Sportler nach Verein, wobei man die Vereinskategorien natürlich räumlich sortieren kann. Ist halt noch ein Relikt aus der Frühzeit. Nichtsdestotrotz wird eine Staatsangehörigkeitskategorie immer benötigt, insofern ist der Botauftrag hier durchaus nicht vergeudete Zeit. 85.212.9.215 19:20, 11. Mai 2015 (CEST)

@79.217.150.153: @Luke081515: @79.217.157.14: @85.212.3.122: @Cactus26: @85.212.36.116: @85.212.9.215: Erledigt? --178.189.137.25 01:05, 4. Jan. 2018 (CET)

Sieht das hier für dich so aus als ob es erledigt wäre? Nein, es ist nicht erledigt! 88.65.121.4 11:51, 6. Jan. 2018 (CET)

Italienische Provinzen->Metropolitanstädte[Quelltext bearbeiten]

Von den ehemals 109 Provinzen Italiens wurden am 1. Januar 2015 zehn in Metropolitanstädte umgewandelt. In de.wiki haben wir dem mit einer Anpassungsaktion Rechnung getragen, bspw. bei Lemmas, Infoboxen, Navileisten, Listen, Kategorien. Es verbleibt das Problem, dass in den Artikeln zu den Kommunen, die bis 2014 den 10 Provinzen angehört haben und jetzt zu den neuen Metropolitanstädten gehören, im laufenden Artikeltext noch immer steht, dass sie der Provinz XY angehören, und nicht, wie es sein sollte, der Metropolitanstadt XY. Beispiel: Venaria Reale in der ehemaligen Provinz Turin, jetzt aber Metropolitanstadt; Sestri Levante (Fall Genua), Fiumicino (Fall Rom), usw usw. Dieses Problem dürfte mehrere hundert (wenn nicht tausende) Artikel betreffen, weswegen man darauf einen Bot ansetzen sollte, soweit möglich. Auf der entsprechenden Portal Diskussion:Italien#Città metropolitana hat :@$traight-$hoota:, ein Informatiker, gemeint, dass das möglich sein sollte, wobei es zu empfehlen sei, sich in den betreffenden Artikeln nur auf die ersten beiden Absätze zu beschränken, da an anderen Stellen, z.B. im Geschichtsabschnitt, eine Änderung den historischen Umständen keine Rechnung tragen könnte. Es sollten also in den Artikeln zu Gemeinden, die den Provinzen bzw. heutigen Metropolitanstädten Turin, Genua, Mailand, Venedig, Bologna, Florenz, Rom, Neapel, Bari und Reggio Calabria angehören, in den ersten beiden Abschnitten des laufenden Artikeltextes die Links auf die jeweilige Provinz auf Links zur jeweiligen neuen Metropolitanstadt umgestellt werden. Bei den Hauptstädten dieser Metropolitanstädte, bspw. Mailand oder Rom ist dies bereits manuell erledigt worden. Sollte meine Bot-Anfrage nicht den Standards entsprechen, würde ich gern Straight-Shoota bitten, die Anfrage zu ergänzen. Vielen Dank und Gruß --Black Smoker (Diskussion) 21:06, 16. Jun. 2015 (CEST)

Anmerkung: Generell in irgendwelchen Artikeln alle Provinzen zu ersetzen geht nicht ("liegt neben der Provinz Parma"), aber alle Verwendungen von [[Provinz Turin]] auf das Weiterleitungsziel [[Metropolitanstadt Turin]] umzuändern sollte ein Bot können, analog mit Links zu den anderen 9 Artikeln. Betroffen sind diese 10 Provinzen: Bari|Bologna|Florenz|Genua|Mailand|Neapel|Reggio Calabria|Rom|Turin|Venedig. Artikellisten finden sich in den entsprechenden Linklisten, sind alleine für Turin etwa 500. --mfb (Diskussion) 22:10, 16. Jun. 2015 (CEST)
So sollte es sein, aber nur bei Gemeindeartikeln, geografischen Artikeln oder Artikeln zu "zeitlosen" Themen (bspw. nicht bei Personen, die bspw. in der Provizn Turin geboren wurden; die können 1950 nicht in der Metropolitanstadt Turin geboren worden sein), wobei die Änderung wenn möglich nicht über die ersten beiden Artikelabschnitte hinausgehen sollte, weil sonst Geschichtliches betroffen sein könnte (wo die alten Provinzen bleiben sollen), wie Straight-Shoota schon sagte. Was der Bot nicht kann, muss man halt im Lauf der Zeit manuell machen. Aber es wäre angesichts der Artikelmassen schon ein enormer Gewinn. --Black Smoker (Diskussion) 22:30, 16. Jun. 2015 (CEST)
Ich würde es sogar eher erst mal auf bestimmte Objektklassen wie eben die Gemeinden beschränken und dort eben auch nur in der Einleitung. Das ist ja schon mal ein ganzer Brocken Arbeit, der einfach abgenommen werden kann. Vor allem ist dort auch nur eine Handvoll Formulierungen wie „in der Provinz Turin“ vorhanden, die zusätzlich zur Sicherung vor unbeabsichtigten Änderungen einbezogen werden kann. --$traight-$hoota {#} 23:13, 16. Jun. 2015 (CEST)

Ja, ich wäre dankbar, wenn man dieses Mindestprogramm abspulen könnte. Ich sehe dann noch so einige andere Dinge, wo mir angesichts evtl Handarbeit schlecht wird:

Bei der Liste der Gemeinden in der Metropolitanstadt Turin besteht kein Bedarf mehr. --Black Smoker (Diskussion) 23:21, 17. Jun. 2015 (CEST)

Siehe Intro, Punkt 7. --Matthiasb – Vandale am Werk™ Blue ribbon.svg (CallMyCenter) 22:39, 22. Jun. 2015 (CEST)
Liest du die Anfragen auch durch bevor du sie kommentierst? Es geht auch um den angezeigten Text, denn der ist derzeit ebenso falsch. --mfb (Diskussion) 22:41, 22. Jun. 2015 (CEST)
Natürlich. Es geht eben nicht um den angezeigten Text, weil der in vielen Fällen auch nach wie vor richtig ist, etwa wie oben angeführt, in allen Fällen mit historischem Zusammenhang. Solche Feinheiten kann man nicht mit einem Boteinsatz lösen. Bei den Gemeindelisten könnte ich eventuell mit AWB mithelfen, aber frühestens am Wochenende. --Matthiasb – Vandale am Werk™ Blue ribbon.svg (CallMyCenter) 22:48, 22. Jun. 2015 (CEST)
Natürlich, deswegen auch der völlig unsinnige Verweis auf Punkt 7. Wegen der möglichen historischen Zusammenhänge soll der Boteinsatz auf die ersten zwei Absätze beschränkt werden. --mfb (Diskussion) 22:51, 22. Jun. 2015 (CEST)
Die Gemeindelisten habe ich schon aktualisiert. Bei den Gemeindeartikeln geht es ja nicht nur um eine Linkänderung, sondern um eine inhaltliche Aktualisierung. Die ehemalige Provinz Turin heißt jetzt nämlich nicht mehr so, sondern Metropolitanstadt Turin. --$traight-$hoota {#} 14:52, 23. Jun. 2015 (CEST)
Danke für die Gemeindelisten, Straight-Shoota. Wie gesagt, angesichts der Artikelmassen wäre ich für die Aktualisierung der Gemeindeartikel dankbar, den Rest kann man dann manuell machen.--Black Smoker (Diskussion) 17:49, 23. Jun. 2015 (CEST)

Ich hab mal ein paar Test-Edits in Kategorie:Gemeinde in Ligurien gemacht: Spezial:Beiträge/$traight-Bot --$traight-$hoota {#} 15:30, 8. Jul. 2015 (CEST)

@$traight-$hoota: Wie ist bei der Anfrage hier der Status? Viele Grüße, Luke081515 20:23, 8. Okt. 2015 (CEST)
Der Bot ist konfiguriert und hat ein paar Test-Edits gemacht (hier nochmal der Direktlink zu den Benutzerbeiträgen). Ich hab die Edits soweit auch durchgeschaut, dass sie in Ordnung aussehen, aber von Black Smoker kam dann nichts mehr. Und ohne Rückmeldung, ob das der gewünschten Form entspricht oder noch Änderungen vorzunehmen sind, wollte ich auch nicht voll durchstarten. --$traight-$hoota {#} 10:45, 9. Okt. 2015 (CEST)
Wie man auf meiner Disk sehen kann, mache ich eine WP-Pause. Es wäre sinnvoll, diese Dinge bei Bedarf auch auf Portal Diskussion:Italien#Città metropolitana zu posten. Dank und Gruß --Black Smoker (Diskussion) 18:02, 17. Okt. 2015 (CEST)

@Black Smoker: @Mfb: @$traight-$hoota: @Matthiasb: @Luke081515: Erledigt? --178.189.142.68 17:06, 4. Jan. 2018 (CET)

Kleine Formalkorrekturen[Quelltext bearbeiten]

Hier befinden sich notwendige Korrekturen, die aber möglichst gebündelt durchgeführt werden sollten, darum wollte sich Xqt kümmern. Der Übersichtlichkeit her habe ich diese daher hier zusammengefasst. Viele Grüße, Luke081515 00:31, 3. Okt. 2015 (CEST)

[0-9] x [0-9] → [0-9] × [0-9][Quelltext bearbeiten]

In ~10 000 Artikeln wird fälschlicherweise das x anstelle des × als Malzeichen verwendet. Mag das jemand per Bot korrigieren? --Leyo 17:26, 26. Mär. 2015 (CET)

  1. Wenn man sowas macht, dann auch das Kreuzchen von zwei &nbsp; umgeben.
    • Dann würde man sogar noch den dahinter folgenden m oder cm mit &nbsp; anbinden.
  2. Grad kein Artikel verlinkt oder nutzt
  3. Das nur als Stichprobe; ich habe in WSTM schlechte Erfahrungen mit sowas gemacht, weil das nicht nur in Verlinkungen, sondern auch als Parameter für Infoboxen auftreten könnte.
  4. @c:Admin: Replacing in file:L'étrangère. Huile sur toile,, 65 x 50 cm.jpg ,, by single , would improve readability.
LG --PerfektesChaos 19:06, 26. Mär. 2015 (CET)
Bezüglich x vs. × geht's in Kategorie:Patronenmunition bzw. Liste Handfeuerwaffenmunition ziemlich drunter und drüber. Ich wäre für die einheitliche Verwendung von × (unter Beibehaltung/Einrichtung der entsprechenden x-Weiterleitung). Bei Dateinamen (wo's standardmässig keine Weiterleitungen gibt) ist es ggf. sinnvoll, die Dateinamen so zu belassen. --Leyo 00:26, 29. Mär. 2015 (CET)
Naja, man ruiniert mit sowas irgendwelche Dateinamen, ohne es zu merken (ggf. Vorlagenparameter), oder Computercode in bewusstem ASCII. Datei:Dorothé Jehoel, "Saltimbanque", kunststof, 320 x 200 x 200 cm, RWZI Dongemond - Oosterhout, 2006.jpg meint sicher „Kunststoff“. LG --PerfektesChaos 00:35, 29. Mär. 2015 (CET)
= nl:Kunststof --Leyo 00:41, 29. Mär. 2015 (CET)
@Leyo: Da ich eben gerade unten einen ähnlichen Auftrag hatte, was soll der Bot jetzt machen? x durch × ersetzen, oder noch mehr? Ich frag da lieber mal nach. Viele Grüße, Luke081515 00:17, 26. Mai 2015 (CEST)
Bildeinbindungen und Links müsste dein Bot auslassen. Für zweiteres könnte ggf. das Ergebnis von Portal Diskussion:Waffen#Lemmata in Kategorie:Patronenmunition uneinheitlich abgewartet werden. --Leyo 01:12, 26. Mai 2015 (CEST)
@Luke081515: Die oben genannte Diskussion ist abgeschlossen. IMHO steht einem Botrun nichts mehr im Weg. --Leyo 03:10, 11. Jul. 2015 (CEST)

Ich bin da leider noch nicht weitergekommen, und hab leider momentan mit andere Aufgaben noch viel zu tun, die dauern wohl noch. Ich könnte es noch machen (Programm steht noch aus), aber wenn ein anderer Botbetreiber Lust hat, kann er es auch gerne Übernehmen, der wird wohl schneller sein ;). Viele Grüße, Luke081515 03:13, 11. Jul. 2015 (CEST)

Könnte insource:/[0-9] x [0-9]/ sicherer gemacht werden, so dass Bildeinbindungen oder Titel bei Literaturangaben nicht erfasst werden? --Leyo 23:05, 15. Dez. 2015 (CET)

@Leyo: Direkt in der Suche zu filtern, ob sich der String innerhalb einer Vorlage befindet, ist nicht ganz so einfach, zumindest fällt mir dazu nicht ein wie man das lösen könnte. Man kann das aber während der Routine einfach überprüfen und den Fall überspringen, wenn sich das Match als Vorlage/Datei herausstellt. Beste Grüße --FNDE 13:10, 11. Jun. 2017 (CEST)
Wenn ihr mir helft herauszufinden was da noch alles ausgeschlossen werden müsste, bastel ich für diese Anfrage was zusammen. Bislang habe ich:
  • Tags: ref, gallery, nowiki, syntaxhighlight, code
  • Links im allgemeinen, also auch Dateieinbindungen
Zu überlegen wäre noch:
  • sollen Vorlagen generell mit einbezogen werden? In Infoboxen zum Beispiel sinnvoll
  • sollen der Beschreibungstext von Bildern berücksichtigt werden?
Beste Grüße --FNDE 14:45, 11. Jun. 2017 (CEST)
In Infoboxen wäre es IMHO sinnvoll. Tritt das Problem bei sonstigen Vorlagen häufig auf?
Solange der Beschreibungstext von Bildern nicht als Zitat gekennzeichnet ist, spricht wohl nicht dagegen. --Leyo 21:40, 11. Jun. 2017 (CEST)
@Leyo: Habe das jetzt nur in der Vorlage Internetquelle gesehen, aber die Einzelnachweise werden wir ja ohnehin nicht anrühren, das ist zu riskant. Zitate in Bildern? Da wirds wohl wieder so kompliziert, dass wir die Bilder ebenfalls ausschließen sollten ätsch  Schöne Grüße --FNDE 22:35, 11. Jun. 2017 (CEST)
Ja, im Zweifelsfall besser ausschliessen. --Leyo 22:39, 11. Jun. 2017 (CEST)
@Leyo: Ich werd den Bot in einer Trockenübung drüber laufen lassen und kann euch dann sagen, wie viele Seiten am Ende tatsächlich betroffen sind. Dann können wir entscheiden, ob und wann es richtig los geht. --FNDE 22:54, 11. Jun. 2017 (CEST)
Das klingt sinnvoll. --Leyo 15:18, 27. Jun. 2017 (CEST)

@Leyo, PerfektesChaos: von den 9.900 Treffern bleiben etwa 8.500 übrig, wo eine Ersetzung stattfinden kann. Ich habe mal die ersten 1.000 Seiten aufgelistet, wo eine Ersetzung durchgeführt wird. Die verbleibenden Seiten wurden aussortiert, wenn die Ersetzung innerhalb von folgenden Bereiche liegt:

  • Links
  • Tags: code, math, gallery, <!-- -->, pre, syntaxhighlight, nowiki
  • Dateinamen (sowohl in Vorlagen, Dateilinks und Gallery)
  • Zitatvorlagen

In der vorliegenden Liste konnte ich bis jetzt nichts falsch-positives finden. Schöne Grüße --FNDE 17:41, 14. Jul. 2017 (CEST)

In Grüne Gentechnik sollten die Titel wohl eher so belassen werden, auch wenn es natürlich als × gemeint ist. Eine Änderung wäre in solchen Fällen jedoch unproblematisch. Ansonsten habe ich bei meinen Stichproben nichts gefunden. --Leyo 18:09, 14. Jul. 2017 (CEST) PS. Die Suchlinks in deiner Liste sind sehr nützlich.
@Leyo: Okay, dann gehen wir am besten Mal den vorsichtigen Weg: externe Links lassen wir komplett raus, also auch den Beschreibungstext. Vorlage Internetquelle wird ebenfalls ausgelassen. Dann kann man dann schauen was noch übrig bleibt und ggf. einen zweiten Durchgang starten. Ich werde in diesen Auftrag übrigens #Leerzeichen zwischen Einzelnachweisen entfernen integrieren, dann können wir davon schon ein paar abarbeiten. Da es hier keinen Einspruch gab, gehts mit dem Auftrag heute Abend los. Beste Grüße --FNDE 16:57, 17. Jul. 2017 (CEST)
Das hört sich gut an. --Leyo 17:13, 17. Jul. 2017 (CEST)
Bitte keine Buchtitel verändern. --mfb (Diskussion) 17:27, 18. Jul. 2017 (CEST)
mfb, Wurde noch frühzeitig entdeckt das Problem. Die Einzelnachweise werden jetzt komplett ausgelassen. --FNDE 18:16, 18. Jul. 2017 (CEST)
War für mich auch noch eine kleine Arbeitsbeschaffungsmaßnahme. Hab ca. 70 Artikel nachkontrolliert, die von diesem Muster betroffen waren. Passt nun alles soweit wieder. --FNDE 18:58, 18. Jul. 2017 (CEST)
@Leyo: wurde jetzt von 10k auf 1k reduziert. So wie ich das sehe, sind jetzt tatsächlich nur noch Suchmuster in Dateilinks, Galerien usw. vorhanden. Ein paar (<20) hat der Bot ausgelassen, weil es im Artikel Syntaxfehler gab. Die kontrolliere ich nochmal einzeln und lass den Bot erneut drüber laufen. Ansonsten sind wir hier fertig? --FNDE 10:58, 20. Jul. 2017 (CEST)
Vielen Dank! Bei meinen Stichproben ist mir noch ein Artikel (Cache) aufgefallen, welcher der Bot übersprungen zu haben scheint. Bei Wikilinks (insource:/\[\[[0-9]+ x [0-9]/) könnten auch noch Korrekturen durchgeführt werden, wobei geprüft werden müsste, ob es das potentiell neue Lemma gibt. --Leyo 00:01, 21. Jul. 2017 (CEST)

@Xqt: @Luke081515: @Leyo: @PerfektesChaos: @FNDE: @Mfb: Seit einem Jahr hat sich hier nichts mehr getan. Ist das Problem erledigt? --89.144.202.120 18:44, 5. Aug. 2018 (CEST)

Es gibt noch zu korrigierende Artikel, z.B. Mountainbike. --Leyo 01:15, 6. Aug. 2018 (CEST)

Plenks entfernen[Quelltext bearbeiten]

Lässt sich insource:/ \, [A-Za-z]/ weiter eingrenzen, so dass die Korrektur der Plenks automatisiert erfolgen könnte? Beispielsweise dürften Bildeinbindungen nicht angefasst werden. --Leyo 00:17, 11. Aug. 2015 (CEST)

  • Keine Quelltextkommentare: Zeit des Nationalsozialismus, Dampflokomotive, FC Chelsea
  • Vermutlich keine Artikel zur Lautschrift und ähnlichen Themen: Pinyin#Auslaute
  • nicht direkt an URLs heranziehen: Nordamerika (der Link sollte natürlich besser formatiert werden)
  • größere Mengen an Sonderzeichen in der Nähe sind in der Regel ein Zeichen dafür, dass ein Bot sich fernhalten sollte, hier hätte ein Entfernen des Leerzeichens immerhin nichts verschlechtert aber auch nichts verbessert.
  • Nichts in mathematischen Formeln, Programmcode und Zitaten ändern.
Das waren nur die ersten 100 Treffer. --mfb (Diskussion) 00:34, 11. Aug. 2015 (CEST)
Danke für deine Analyse! Ich sehe schon, das wird schwierig … --Leyo 00:50, 11. Aug. 2015 (CEST)
Zumindest Bot-mäßig, ja. Wäre eventuell was für Benutzer:Aka? 129.13.72.195 12:46, 11. Aug. 2015 (CEST)
Ich mache das schon ab- und zu mit. Für einen Bot ist das m.E. nicht geeignet, ich lasse mich aber gerne vom Gegenteil überzeugen :) -- Gruß, aka 12:56, 11. Aug. 2015 (CEST)

Vllt macht das ja @Xqt:, der macht solche Korrekturen ja öfter. Viele Grüße, Luke081515 13:00, 11. Aug. 2015 (CEST)

WSTM bietet zwar eine benutzerdefinierte Ersetzung an, aber ein ! gehört auch zur Tabellensyntax. Und Linkziele wie etwa schlecht buchstabierte Dateinamen werden von WSTM vor der Ersetzung geschützt, genauso wie math-Bereiche, Syntaxhighlight und alle Kommentare.
mail-re gelegentlich, hat erfreulicherweise niemand interessiert, lassen wir Frau Streisand ruhen.
Schönen Urlaub --PerfektesChaos 13:12, 11. Aug. 2015 (CEST)
Hatte doch erst vor kurzer Zeit meinen Bot laufen lassen. Hat sich schon wieder was angesammelt? Mein Ersetzungsparameter sind noch da und ich kann jederzeit loslegen.  @xqt 21:34, 11. Aug. 2015 (CEST)
@PerfektesChaos: ([^: ?|]) +(([,;:])|(?[^?])|(![^!])|(\\.[ \n])) (aus deiner verlinkten Seite) ist leider zu komplex für die Wikipedia-Suchfunktion.
@Xqt: Beziehst du dich auf das Entfernen der doppelten Leerzeichen (normal + geschützt)? Hast du solche Korrekturen kürzlich ebenfalls gemacht? --Leyo 00:01, 12. Aug. 2015 (CEST)
Ja, einige  @xqt 08:22, 12. Aug. 2015 (CEST)
einige = alle, deren Korrektur per Bot sicher genug waren?
Vielleicht könnte CamelBot von lustiger seth noch weitere Artikel korrigieren? --Leyo 16:21, 19. Aug. 2015 (CEST)
gudn tach!
CamelBot parst den wikitext nicht, sondern macht eigentlich nur relativ stupide ersetzungen, siehe source code, weshalb mich die beispiele von mfb eigentlich auch eher Aka's einschaetzung teilen lassen. einen einfachen, wenn auch langen regulaeren ausdrueck einzusetzen, wuerde nur dann sinn machen, wenn man die false positives (fast) alle benennen kann. wenn das jemand kann, kann ich auch eine entsprechende ersetzungsvorschrift dafuer basteln, es sei denn xqt hat das bereits getan.
wie geht denn dein bot vor, xqt? parst der den text ein bissl oder ist er so "doof" wie CamelBot? und kuemmert er sich auf anfrage um die gesamte wikipedia oder haengt er auf den RCs? wenn die ersetzungsvorschrift mal da waere, koennte ich anbieten, zusaetzlich CamelBot auf den RCs arbeiten zu lassen. -- seth 22:02, 19. Aug. 2015 (CEST)
Nein, ganz so stupid geht mein Bot nicht vor, da wird auch der Zusammenhang geprüft und die Ausnahmeliste ist lang, hier ab Zeile 88  @xqt 05:57, 20. Aug. 2015 (CEST)
@Xqt: Da empfehle ich aber bei Zeile 220 <syntaxhighlight> und überhaupt und so.
@Lustiger seth: Ich empfahl schon mal, WSTM in einer JS-Umgebung des Servers laufen zu lassen. Auf Labs ist mindestens node.js vorhanden. Linkservice
LG --PerfektesChaos 10:18, 25. Aug. 2015 (CEST)
gudn tach!
@PerfektesChaos: ich erinnere mich. ich hatte nur noch keine zeit, mir anzuschauen, wie ich in perl den js-kram einbinden koennte. schien mir kompliziert zu sein. den python-code habe ich mir bisher auch nur kurz angeschaut. koennte aber sein, dass das leichter zu uebernehmen bzw. einzubinden waere. -- seth 23:35, 29. Aug. 2015 (CEST)

@Leyo: @Aka: @Xqt: @Luke081515: @PerfektesChaos: @Lustiger seth: @Mfb: Seit einem Jahr hat sich hier nichts mehr getan. Ist das Problem erledigt? --89.144.202.120 18:49, 5. Aug. 2018 (CEST)

Könnte man mit dieser Aufgabe nicht den Anführungszeichentroll betrauen? Dann hätte der mal was Sinnvolles zu tun. --77.0.26.53 22:55, 29. Dez. 2018 (CET)

Entfernen von Whitespace-Kommentaren aus Wikilinks und URLs[Quelltext bearbeiten]

Gelegentlich wird in Wikilinks und URLs ein html-Kommentar nur eingefügt, um einen Zeilenumbruch zu erreichen. Dieses Vorgehen hat einige Nachteile für andere Benutzer, insbesondere bei langen Artikeln, da dadurch das Auffinden einer URL deutlich erschwert wird. Konstruktionen wie

Beispiel für URL

http://example.org/das<!--
-->isteinbeispiel.html
oder 
http://example.org/das<!-- -->isteinbeispiel.html

Beispiel für Wikilink:

[[Wikipedia:Bots<!--
-->/Anfragen]]
oder 
[[Wikipedia:Bots<!--  -->/Anfragen]]

Wäre schön, wenn jemand diese unnötige und störende HTML-Kommentare die nur Withespace enthalten entfernen könnte. Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht  12:06, 15. Mai 2015 (CEST)

@Boshomi: Meinst du, man könnte das auch auf nicht Links ausweiten, wo nur Whitespace drinne ist? Viele Grüße, Luke081515 18:41, 15. Mai 2015 (CEST)
In Vorlagen ist das manchmal sinnvoll (nicht in URLs), da sonst teilweise gigantisch lange komplizierte Absätze ohne Struktur entstehen. Es wird zwar meiner Meinung nach viel häufiger angewandt als es sinnvoll ist, aber pauschal alles zu entfernen ist keine Verbesserung. --mfb (Diskussion) 18:45, 15. Mai 2015 (CEST)
@Mbf: Die Anfrage ist natürlich für den ANR gemeint. Bei Vorlagen sind Zeilenumbrüche wegen der Lesbarkeit sinnvoll.
@Luke081515: Natürlich, aber die Bearbeitung ist vorläufig einfacher, wenn man das getrennt hält. Die Masse sind wohl Whitespace-Kommentare. Bei den anderen könnten auch einige False-Positive dabei sein.  Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht  18:50, 15. Mai 2015 (CEST)
Ich frage mich gerade, wie man die Suche eingrenzen könnte, ohne eine Mio. Artikel zu durchforsten.  @xqt 14:52, 16. Mai 2015 (CEST)
Die Abfrage ist doch simpel (Peal-reg-expr o. ä.)). Und wenn man es nicht in einer Nacht erledigen will, hängt man es an irgendeinen beliebigen Bot dran der so oder so irgendwann an allen Seiten vorbei kommt. Pfiffigerweise ein Bpt, der den Eingang durchforstet. -- SummerStreichelnNote 19:53, 16. Mai 2015 (CEST)
Ich finde ca. 1500 Artikel, die auf /<!--\s*-->/s passen, siehe Benutzer:Krdbot/Whitespacekommentare. --Krd 20:37, 16. Mai 2015 (CEST)
Sehr schön! Eine hervorragende Grundlage für einen 4-Jahresplan. :-)  -- SummerStreichelnNote 20:53, 16. Mai 2015 (CEST)

{{InuseBot|1=Xqbot|2=Xqt}} @Xqt: Ist er durch? Viele Grüße, Luke081515 19:17, 20. Mai 2015 (CEST)

nö. Wegen Einspruch/Rückfragen auf meiner DS hatte ich die weitere Bearbeitung gestoppt. Im Moment bin ich unterwegs und gab auch keinen Vollzugang auf meinen Server. Das muss also vielleicht bis zum Wochenende warten.  @xqt 21:11, 20. Mai 2015 (CEST)

Ich glaube ich frage nochmal. @Xqt: Wie siehts aus? zwinker . Viele Grüße, Luke081515 22:41, 15. Sep. 2015 (CEST)

@Boshomi: @Luke081515: @Mfb: @Xqt: @Summer ... hier!: @Krd: Seit einem Jahr hat sich hier nichts mehr getan. Ist das Problem erledigt? --89.144.202.120 18:52, 5. Aug. 2018 (CEST)

@89.144.202.120 inhaltlich gebe ich dir recht. Dummerweise fliegt der intelligente Schwarm über das Problem hinweg. So sind Freiwilligenprojekte - betteln oder selbst machen. --SummerStreichelnNote 19:51, 5. Aug. 2018 (CEST)
Phzh scheint solche Korrekturen vorzunehmen. Allenfalls könnte Benutzer:Krdbot/Whitespacekommentare aktualisiert werden. --Leyo 00:27, 21. Dez. 2018 (CET)
≈17
Man beachte die auffallende Österreich-Dominanz; da weiß ich auch, welcher Benutzer die serienmäßig in jede längere URL reingemacht hatte und vielleicht heute noch macht.
VG --PerfektesChaos 01:34, 21. Dez. 2018 (CET)
Da und da waren es mit W!B: und Oliver S.Y. jedenfalls unterschiedliche Benutzer. --Leyo 10:59, 21. Dez. 2018 (CET)
Ich thematisierte ja auch eine alpenländische Dominanz, die zu vielen Hunderten quer durch den ANR eingebaut wurden, und die du hier auch korrekt identifiziert hast. VG --PerfektesChaos 11:13, 21. Dez. 2018 (CET)
Ehrlich gesagt stehe ich da auf dem Schlauch, und bei dem Link von 2016 bin ich mir ziemlich sicher, den von woanders in dieser Form kopiert zu haben, da damals unstrittig. Ich weiß weder, weshalb das ein Problem ist, noch wie die vermeintlich regelkonforme Variante dessen aussieht. Es funktioniert, das ist bei Wikipedia schon ziemlich selten. kein Grund für einen Botlauf bei mehr als 1000 Seiten, wenn, dann ist sowas händisch zu ändern, und auf die Reaktionen der verschiedenen Autoren zu reagieren.Oliver S.Y. (Diskussion) 13:05, 21. Dez. 2018 (CET)
ich brauchs kaum mehr: 2011 hat der firefox den umbruch von urls am «/» noch nicht beherrscht, und der auto-umbruch des wp-editfensters hat auch nicht sauber geklappt. mit alten 800-px-bildschirmen war das lästig. heutzutage ist das nurmehr in extremen ausnahmefällen notwendig. und für handy-bildschirme ists sowieso einerlei. ausserdem haben sich superlange urls sowieso als langfristig höchst instabil erwiesen: wer seine webseite so aufbaut, baut sie sicherlich bald wieder um. man findet es meist nur bei datenbankanfragen, die sollte man eh prinzipiell vermeiden, ein paar jahre später nutzen die gar nichts mehr. da ist eine verbale beschreibung des klick-wegs dann oft besser. mfg --W!B: (Diskussion) 07:51, 22. Dez. 2018 (CET)

Korrektur Seitenbereiche[Quelltext bearbeiten]

Die mittels insource:/\| *pages *= *[0-9]+ *\- *[1-9]/ gefundenen falsch formatierten Seitenbereiche (mit Binde- statt Bis-Strich, unnötige Leerzeichen) sollten per Bot korrigiert werden. Dieser Botrun braucht nicht mit obigen gebündelt zu werden. --Leyo 20:49, 28. Okt. 2015 (CET)

Wäre es nicht überhaupt sinnvoll einen Bot zu installieren, der nach page_id modus x alle Seiten durchläuft und alle nicht zeitkritischen kleinen Änderungen zusammenfasst? Das wäre dann wenigstens ein systematischer Ansatz, der nicht von zufälligen anderen Läufen abhängig ist.
Je nach Dringlichkeit könnte x ein Vielfaches von 7 sein (28,91,182,364,728) Auf diese Weise würde sichergestellt, dass sich Botedits für einen Artikel auf jeweils einen (lange im Voraus bekannten) Wochentag konzentrieren, und somit die Beobachtungslisten der Benutzer geschont werden. Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht  21:44, 28. Okt. 2015 (CET)
Ich höre immer Beos schonen, ist ja auch sinnvoll, keine Frage. Klar machts auch Sinn, die bearbeitungen zu konzentrieren, aber wenn der Bot ein Botflag nutzt, kann der Benutzer zumindest leicht die edits ausblenden. Viele Grüße, Luke081515 22:05, 28. Okt. 2015 (CET)
IMO könnte man solche kosmetischen Änderungen schon irgendwo sammeln (analog zu c:Commons:File description page regular expressions) und dann periodisch durchführen. Diese Altlasten hier sollten aber erst einmal in einem Run eliminiert werden. Mit Botflag sehe ich wie Luke kein Problem. --Leyo 22:43, 28. Okt. 2015 (CET) PS. Die mittels insource:/ S\.( )* *[0-9]+ *\- *[0-9]/ ausserhalb von Zitationsvorlagen gefundenen Falschformatierungen könnten gleich mitkorrigiert werden, auch wenn wohl wenige Artikel beide Typen aufweisen.

Ich warne hier vor einer automatischen „Korrektur“.

  • Es gibt Seitenzahlen, in die das Kapitel integriert ist: S. 5-14 ist die 14. Seite des 5. Kapitels.
  • Im Treffer zu Haushund findet sich pages=119-26 – typisch für die Übernahme aus gedruckten Zeitschriften und deren Übernahme in die Publikationsdatenbanken. Das würde noch verschlimmert.

So wichtig ist das nun nicht irgendwo tief unten in den ungelesenen Endnoten, als dass man hier automatisierte Verschlimmbesserung lostreten muss, um eine typografische Petitesse durchzudrücken. Einfach so lassen; es mag manuell korrigieren, wer will, und ich verbessere es mit WSTM für die Lit-Vorlage gelegentlich unter menschlicher Aufsicht, falls die zweite Zahl größer ist als die erste. Was auch noch nicht gegen die abschnittsweise Seitennummerierung hilft.

LG --PerfektesChaos 12:54, 29. Okt. 2015 (CET)

Beim ersten Punkt hast du teilweise Recht. Allerdings kommt das IMHO sehr selten vor. Und wenn, dann nicht mit Leerzeichen vor und nach dem Strich.
Beim zweiten irrst du. Es handelt sich um einen Seitenbereich, wie unter DOI:10.1002/jez.b.21116 festgestellt werden kann. Am besten wäre „119–126“, aber auch „119–26“ ist bereits eine Verbesserung gegenüber „119-26“. --Leyo 13:01, 29. Okt. 2015 (CET)
Nee, dann lieber 119-26 als ASCII belassen; dann zieht es noch Aufmerksamkeit auf sich. Wenn da erstmal der Bis-Strich drin ist, findet es auch dein RegExp nicht mehr und ist verhudelt. Wir schreiben korrekt 119–126, oder wir lassen die Finger davon. Einfach mal nix machen; das ist nicht der Fließtext des Artikels, und wir haben im Bereich Zitationsformatierung -zigtausende viel viel schlimmerer Formate als die Frage, ob da untenrum ein kleiner oder großer Strich stünde. Wenn der Bot dann auch noch sinnentstellende Fehler in den ersten Fall hineinverballhornt, gibt es nur vermeidbaren Zoff mit den Autoren. LG --PerfektesChaos 13:54, 29. Okt. 2015 (CET)
Ich nehme deine Meinung zur Kenntnis, bleibe jedoch bei meiner. Man/ich kann diese Ausnahmefälle (z.B. insource:/\| *pages *= *[0-9]{3} *\- *[0-9]{1,2} *\|/) ja halbautomatisch abarbeiten, inkl. Ergänzung der weggelassenen Ziffern. Bereits typografisch korrigierte gibt's übrigens deutlich mehr (z.B. insource:/\| *pages *= *[0-9]{3}–[0-9]{1,2} *\|/). --Leyo 16:57, 29. Okt. 2015 (CET)
Halbautomatisch wäre nicht das Problem; ich kann dir rund eine halbe Million Seiten nennen, wo man halbautomatisch was dran machen könnte. Das hier ist dagegen Luxusproblem. Du kannst ja mittels entsprechender RegExp die Seiten suchen, wo in irgendeinem Format links von einem Bindestrich drei oder vier und rechts nur eine oder zwei Ziffern stehen, und davor Seiten oder S. oder pages= etc. Und bei einer solchen Berichtigung darf es dann auch der richtige Strich werden. Etwas Gespür für die Publikationen und ihre Paginierung und die Herkunft der Zitation ist von Vorteil. Vornamen vor Nachnamen fände ich dann als nächste Stufe passend; kann gleich miterledigt werden und ist bei diesen Kandidaten oft zu finden. LG --PerfektesChaos 17:12, 29. Okt. 2015 (CET)
Die Fälle mit weniger Ziffern nach dem Bindestrich bei insource:/\| *pages *= *[0-9]+ *\- *[1-9]/ sollten abgearbeitet sein. Nun steht einer automatischen Korrektur mit Botflag nichts mehr im Weg. --Leyo 00:05, 31. Okt. 2015 (CET)
Man kann Botedits ausblenden, blendet damit aber auch mögliche vorherige Änderungen anderer Benutzer aus. Total unsinnige Umsetzung finde ich. --mfb (Diskussion) 13:36, 29. Okt. 2015 (CET)
@Mfb: Ne, da hast du wohl was in den falschen Hals bekommen. Das ist markbotedits was Rollback mit Botflag erlaubt, und nachträglich dem vorherigen Edit auch eins verpasst. Bots nutzen aber das Recht bot was sich nur auf den aktuellen edit auswirkt, der Rest bleibt ohne. Viele Grüße, Luke081515 13:41, 29. Okt. 2015 (CET)
Nehmen wir doch Gut Adolphshof als Beispiel: Heute IP-Edits, danach ein Botedit. Nehme ich die Seite in die BEO auf, sehe ich sie ganz normal. Blende ich aber Botedits aus, verschwindet die Seite komplett von der BEO. Dass eine IP dort etwas bearbeitet hat, verpasse ich komplett wenn ich nicht zwischen 12:58 und 13:30 die Beobachtungsliste durchschaue. --mfb (Diskussion) 13:56, 29. Okt. 2015 (CET)
@Mfb: Das ist jetzt aber seltsam. Ich sehe die IP Edits nämlich bei hidebots=1 immer noch. Viele Grüße, Luke081515 15:26, 29. Okt. 2015 (CET)
Bei mir bleibt die Seite auch angezeigt.  @xqt 15:34, 29. Okt. 2015 (CET)
Ja, das wäre das gewünschte Verhalten... aber selbst wenn ich eigenes .css und .js entferne (bzw. nur irrelevante Elemente behalte), verschwindet die Seite. Die Seite verschwindet sogar komplett aus dem Quelltext, liegt also an der Software. Habt ihr vielleicht irgendwelche Extrascripte die das reparieren? Vielleicht sollten wir die Diskussion verlegen, mit dem Botantrag hat das nichts zu tun. --mfb (Diskussion) 15:35, 29. Okt. 2015 (CET)
Einstellungen -> Beobachtungsliste -> "In der Beobachtungsliste alle und nicht nur die aktuellsten Änderungen anzeigen". Zeigt dann auch die vorherigen an, aber immer, egal ob der aktuellste herausgefiltert ist oder nicht. Der Umherirrende 18:40, 29. Okt. 2015 (CET)
Ach so, ja, das ist eine Einstellung die ich ziemlich schnell deaktiviert habe, weil meine Beobachtungsliste dann praktisch nur noch WP-Seiten hätte (Auskunft&co) und ich die Artikel nicht mehr finde. --mfb (Diskussion) 20:05, 29. Okt. 2015 (CET)
Nicht, wenn du das Tool von PerfektesChaos verwendest, wie ich es in der en-WP mache (siehe en:User:Leyo/common.js, unten). --Leyo 23:23, 29. Okt. 2015 (CET)

insource:/\| *Seiten *= *[0-9]+ *− *[1-9]/ (mit Minuszeichen statt Bis-Strich) gibt's auch noch. --Leyo 21:55, 25. Nov. 2015 (CET)

Die Fälle sind erledigt bis auf einen unklaren Fall. 188.99.191.230 21:03, 5. Dez. 2015 (CET)
Danke! Den letzten Fall habe ich ebenfalls geklärt. Oben ist jedoch noch vieles offen. --Leyo 22:05, 6. Dez. 2015 (CET)
Sind schon wieder 15 dazugekommen :( 88.64.180.46 13:10, 10. Jan. 2016 (CET)

@Leyo: @Boshomi: @Luke081515: @PerfektesChaos: @Mfb: @Xqt: @Umherirrender: @188.99.191.230: @88.64.180.46: Erledigt? --Thomas Obermair 4 (Diskussion) 21:29, 22. Aug. 2017 (CEST)

Nein, es gibt noch zu korrigierende Artikel. --Leyo 00:51, 23. Aug. 2017 (CEST)

@Leyo: Wenn du mir den gefallen tun würdest, und mir einmal Pattern, zu ersetzender Teil und einzusetzen Teil kurz auflistet, gehe ich das mit meinem neuen Halbautomatischen Tool durch, das hat sich gestern ganz gut bewährt. Ich blicke da leider in diesem riesen Abschnitt nicht ganz durch. Viele Grüße, Luke081515 01:47, 30. Mär. 2018 (CEST)

Hm, (\| *pages *= *[0-9]+) *\- *([1-9])$1–$2 sollte in den allermeisten Fälle korrekt sein. --Leyo 22:28, 1. Apr. 2018 (CEST)

@Leyo: @Boshomi: @Luke081515: @PerfektesChaos: @Mfb: @Xqt: @Umherirrender: Das Problem besteht nun seit drei Jahren. Ist eine Lösung in Sicht? --213.225.38.39 11:57, 28. Okt. 2018 (CET)

Liebe IP, da hier alles Ehrenamtliche mitmachen, müssen wir auch damit leben, dass eine Anfrage längere Zeit hier liegen bleibt. Aber kein Problem: Klicke die Links an und ersetze mit Ctrl+F die gefundenen falschen Striche. Ich helfe gerne auch mit. So können wir vielleicht bald die Anfrage schliessen. Wäre das eine gute Idee? :-) LG --Phzh (Diskussion) 12:12, 28. Okt. 2018 (CET)

Bot-Suche/Hinweis gewünscht[Quelltext bearbeiten]

In etwa 1500 Artikeln (zumeist in Artikeln über Autorennen, sportliche Wettkämpfe, Konzerte u.ä.) findet man eine falsche Verwendung des Adjektivs "diesjährige/er". Kann man da nicht mal mit einem Bot drübergehen, und in die Diskussionsseite so etwas wie "Bitte ändern, weil das nachträglich immer jenes Jahres heißen muss und selbst dann, wenn es das aktuelle Jahr betrifft, ist es im nächsten Jahr schon veraltet." einbauen? Wenn ich die Artikel manuell ändere, lernen diejenigen Autoren es ja nie...--Mideal (Diskussion) 16:29, 9. Nov. 2015 (CET)

Klingt wie geschaffen für Aka. –Queryzo ?! Red-WikiPill.png Blue-WikiPill.png 16:32, 9. Nov. 2015 (CET)
Das können bestimmt auch andere. --Leyo 22:24, 20. Nov. 2015 (CET)
@Mideal: Kannst du ein paar Beispiele von betroffenen Artikeln angeben? --Leyo 16:39, 25. Nov. 2015 (CET)
@Leyo: ? Einfach mal Volltextsuche "in diesem Jahr" nur in Artikeln, allein damit gibt es über 15000 Ergebnisse Liste der Nummer-eins-Hits in Österreich (1973), "Liste der mexikanischen Kinofilme...", "Bob-Weltmeisterschaften...", Magdalenenfest. Hinzu kommen "in jenem Monat/Jahrzehnt/Jahrhundert" und "diesjährige(/m/n/r)", "demnächst" u.ä. Wendungen wie "wird ....sein" 8die sich auf beim Editieren aktuelle Entwicklungen/zukünftige Ereignisse beziehen und die Verwendung von "nächsten Monat" muss man wohl oder übel manuell sichten (letzteres ist n.m.M. meist korrekt verwendet).--Mideal (Diskussion) 16:34, 26. Nov. 2015 (CET)
Liste der Nummer-eins-Hits in Österreich (1973) ist ein Beispiel, bei dem nichts zu ändern ist. "In diesem Jahr" bezieht sich eindeutig auf das unmittelbar zuvor genannte Jahr 1973. Auch "in jenem Monat" etc. sollte meistens unproblematisch sein. "diesjährig" etc. ist häufiger falsch. "wird ... sein" hat idealerweise die Vorlage:Zukunft, sofern eine Änderung zu erwarten ist ("Alpha Centauri wird in 25000 Jahren näher als Proxima Centauri sein" braucht keinen Hinweis). --mfb (Diskussion) 16:56, 26. Nov. 2015 (CET)

@Mideal, Leyo:Hi, ich bin gerade auf der Suche nach sinnvollen Bot-Aufträgen und finde das eine als (Erst)Botprogrammierer zu bewältigende Aufgabe. Nur zur Klärung: Bei Uruguay Open 2012 zum Beispiel wäre der Botauftrag, auf der Diskussionsseite auf die Verwendung von "diesjährig" hinzuweisen, oder? Mein Vorschlag wäre, zusätzlich entweder den Erstautor oder den letzten Editor (armer Aka) noch zu benachrichtigen, damit das dann auch wirklich erledigt wird. Eine automatische Korrektur halte ich wie Mideal nicht für sinnvoll. Wenn das für alle okay ist und die Funktion noch nicht implementiert ist würde ich mich da mal dran setzen. LG --Zenith4237 (DiskussionBeiträge) 22:24, 6. Dez. 2016 (CET)

Merci!--Mideal (Diskussion) 12:28, 23. Aug. 2017 (CEST)

@Mideal: @Aka: @Queryzo: @Leyo: @Mfb: @Zenith4237: Erledigt? --Thomas Obermair 4 (Diskussion) 21:34, 22. Aug. 2017 (CEST)

+1--Mideal (Diskussion) 12:28, 23. Aug. 2017 (CEST)
Hi, habe ja damals (leider) keine Rückmeldung bekommen (Wenn das für alle okay ist) und mich somit an ein anderes Projekt rangesetzt. Werde vermutlich auch in den nächsten Wochen keine Zeit haben, bin momentan etwas im Stress. Wenn jemand Lust hat, das zu machen – gerne. Kommt aber definitiv auf meine ToDo-Liste. LG --Zenith4237 ( • Beiträge • ±) 22:36, 27. Aug. 2017 (CEST)

@Mideal: @Aka: @Queryzo: @Leyo: @Mfb: @Zenith4237: Das Problem besteht nun seit drei Jahren. Ist eine Lösung in Sicht? --213.225.0.240 20:18, 9. Nov. 2018 (CET)

Hier ist jede Mitarbeit freiwillig. Warum auch immer du meinst, hier regelmäßig andere nerven zu müssen: lasse mich bitte in Zukunft aus der Pingliste raus. -- Gruß, aka 20:39, 9. Nov. 2018 (CET)
Ebenso. Ich helfe häufiger mal mit irgendwelchen Hinweisen, Suchlinks etc., aber das bedeutet nicht, dass ich großes Interesse an jedem einzelnen Punkt hätte. --mfb (Diskussion) 21:30, 9. Nov. 2018 (CET)

Minuszeichen als Gedankenstrich[Quelltext bearbeiten]

Das Minuszeichen wird zurzeit recht oft als Gedankenstrich oder Streckenstrich missbraucht. Diese Abfrage liefert 200 Treffer, lässt man es ein weniger allgemeiner, kommt man sogar auf mehr als 7000 Treffer, was ein Fall für einen Bot wäre, wenn nicht einige wenige False-Positives drin wären (z. B. Schwierigkeitsskala (Klettern)). Die Frage ist, ob man die Abfrage noch etwas verfeinern könnte, sodass keine False-Positives mehr drin sind und ein Bot loslaufen kann (z. B. durch Ausschluss des Pluszeichens im Umfeld der Gedankenstriche). 79.217.150.114 13:40, 24. Dez. 2015 (CET)

Hm, gibt es vielleicht auch Falsch-Positive wie Dateinamen oder gar Lemmata? --Leyo 12:04, 14. Aug. 2017 (CEST)
Bei 200 Ergebnisse könnte ja vllt. mal jemand kurz die Liste durchgehen und falsch-positive flaggen. Bot kann ich dann drüber laufen lassen, das haben wir schon mal in ähnlicher Weise gemacht. --FNDE 21:29, 27. Jan. 2018 (CET)
Könnte hier jemand dann die korrekten Zeichen, die ersetzt werden sollen einmal pasten? Ich hab eben mir versucht das aus den Artikeln zu holen, und hatte immer zwei Zeichen, die, als ich sie eingefügt habe komplett gleich aussahen. Das möchte ich dann ungern so in mein Skript einfügen. Viele Grüße, Luke081515 01:54, 30. Mär. 2018 (CEST)
@Luke081515: Die Minuszeichen (−) sollen jeweils durch Halbgeviertstriche (–) ersetzt werden. --Leyo 11:13, 6. Aug. 2018 (CEST)

Ich vermute mal es liegt am Encoding, aber ich kriege das nicht hin. Meine Skripte machen Nulledits, auch im Quelltext sehen beide gleich aus. Viele Grüße, Luke081515 18:56, 8. Aug. 2018 (CEST) Vergesst es, ich habe auf den falschen Account geschaut. Kommt dann nach dem aktuellen Auftrag. Viele Grüße, Luke081515 19:23, 8. Aug. 2018 (CEST)

@Luke081515: Das wäre dann wann? 129.13.72.197 13:19, 9. Jan. 2019 (CET)

Liste über ungewöhnliche Kategorienstruktur[Quelltext bearbeiten]

Wenn es eine Kategorie K0 gibt, welche eine Unterkategorie K1 hat und einen Artikel A, welche in K1 ist, dann sollte A nicht zusätzlich in K0 sein (siehe z.B. https://de.wikipedia.org/w/index.php?title=Bayessches_Netz&type=revision&diff=149491243&oldid=147998947)

Könnte jemand bitte einen Bot schreiben, der das für alle Artikel überprüft und in eine Tabelle (Verlinktes Lemma, Kategorie, Unterkateogrie) schreibt?

Was man tun muss:

Dabei sollen nicht nur direkte Unterkategorien überprüft weden, sondern beliebige Tiefen. Dazu muss zuerst ein Kategoriebaum (bzw. Wald / DAG) aufgabaut werden. Dann wird für jeden Artikel überprüft, ob es einen Pfad von einem Wurzelknoten zu einer benutzten Kategorie gibt, welche über eine andere benutzte Kategorie führt (das ist ein wenig schwer auszudrücken ... wenn mir jemand den Kategorie-Baum im JSON-Format geben kann und die Kategorien aller Artikel auch als JSON kann ich das auch selbst machen)

Viele Grüße, --Martin Thoma 13:39, 30. Dez. 2015 (CET)

das werde ich mal machen, dauert aber schon ne Weile dann – Doc TaxonDiskussionWiki-MUCWikiliebe?! 23:20, 1. Jan. 2016 (CET)

steht so bei 44%

hm, das scheint für die zerbrechliche WMF-API-Technik zu viel zu sein. Aber es gibt einen anderen Weg, der ähnlich gut ist. Es geht also weiter ... – Doc TaxonDiskussionWiki-MUCWikiliebe?! 14:54, 20. Jan. 2016 (CET)

@Doc Taxon: Passiert hier noch etwas? Dann sollte man aber wissen, was der Antragsteller bezweckt, denn je nachdem könnte bzw. sollte man die Fälle ausschließen, in denen diese Struktur ggf. erwünscht ist, bspw. DDR-Personen in Deutschland-Personenkategorien.

@MartinThoma: @Doc Taxon: Erledigt? --178.189.139.107 14:39, 5. Jan. 2018 (CET)

RiAA-Datenbank[Quelltext bearbeiten]

Die RIAA hat ihre Datenbank umgestellt, nun müssten über zweitausend Links geändert werden. Leider geht nicht alles per Bot, aber die einfachen Fälle dürften machbar sein.

@Doc Taxon: der Bot hat nicht alle angegebenen Links geändert.

Gab es da irgendwelche Probleme? --Ali1610 (Diskussion) 07:42, 6. Jan. 2016 (CET)

@Ali1610: Ähm, ich guck noch mal. Du musst Dich aber auch schon relativ genau ausdrücken, denn ich steck ja nicht in Deinen Themen. Was meinst Du mit Künstlerlink? – Doc TaxonDiskussionWiki-MUCWikiliebe?! 17:48, 6. Jan. 2016 (CET)
Ich liste hier nochmal auf, wo noch Links übrig geblieben sind.
Die unteren beiden sind eben keine reinen Ersetzungslinks, sondern hier muss der Bot noch etwas im Link umbauen wie oben beschrieben. Ich hoffe, dass es jetzt verständlich und machbar war. --Ali1610 (Diskussion) 21:55, 6. Jan. 2016 (CET)

@Ali1610: Ah, jetzt weiß ich auch, warum so viel übrig geblieben ist. Ich bin dran, – Doc TaxonDiskussionWiki-MUCWikiliebe?! 13:42, 7. Jan. 2016 (CET)

Siehe Wikipedia:WikiProjekt_Weblinkwartung/Toter_Link/Liste_riaa Grundsätzlich dürft die Aktion in vielen Fällen eine Lösung gebracht haben. In mindestens 118 Fällen finde ich aber neue 404er die durch den Botlauf neu entstanden (alles mit Eingangsdatum 6. Jänner und 7. Jänner in der Liste).  Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht  22:56, 8. Jan. 2016 (CET) @Doc Taxon, Ali1610: Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht  22:57, 8. Jan. 2016 (CET)

@Boshomi: Ich bin mal testweise willkürlich ca. 20 Links vom 7.1., die auf deiner Liste stehen, durchgegangen. Bei allen war sowohl die Version vor als auch die nach dem Fix defekt. Der Bot war hier also nicht schuld. Da muss manuell nachgearbeitet werden, wie von mir schon im Anfangspost beschrieben wurde. Oder wir finden einen Weg, wie man auch die per Bot fixe kann. Generell würde das gehen, aber da müssten mehrere Parameter geändert werden. --Ali1610 (Diskussion) 23:25, 8. Jan. 2016 (CET)
@Ali1610: Die URLs in der angeführten Liste waren vor dem Botlauf nicht im ANR, natürlich kommen da noch Useredits dazu, die ebenso nicht funktionieren, aber ich kann über die API nicht unterscheiden, von wem die URL eingetragen wurde. Ich habe nur an den 3 Tagen die Domain eingelesen, wobei meine erste Einlesung zu einem Zeitpunkt stattfand, als der Bot möglicherweise schon gearbeitet hat, also ist es möglich dass auch unter dem Datum 5. Jänner URLs tote URLs enthalten sind, die es zuvor nicht gab.  Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht  23:35, 8. Jan. 2016 (CET)
@Boshomi: Ja, das kann durchaus sein. Ich habe mal die Links angeschaut, und theoretisch könnten viele durch einen Bot fixbar sein, allerdings muss der Bot dafür ziemlich schlau sein. Beispiel:

@Ali1610: @Doc Taxon: @Boshomi: Erledigt? --Thomas Obermair 4 (Diskussion) 21:46, 22. Aug. 2017 (CEST)

Vorlage:Google Buch einfügen[Quelltext bearbeiten]

Teilweise wird mittels einer unnötig langen URL auf Google Books verwiesen. Ich fände es sinnvoll, wenn zumindest in gewissen Fälle die URLs durch die Vorlage:Google Buch ersetzt werden könnten (Beispiel) – auch, um einen einheitlicheren Linktext zu erhalten (Beispiel). Kandidaten sind beispielsweise mittels insource:/\[https?\:\/\/books\.google.{4,20}id=[^ ]+ [Oo]nline/ zu finden. Am einfachsten wäre es wohl, zunächst die Fälle anzugehen, bei denen der Link im Parameter Online enthalten ist. Die Cirrus-Suche machte da aber nicht mehr mit. --Leyo 03:06, 23. Jan. 2016 (CET)

Hallo, anders als in deinem Beispiel, sollte dann aber die Information über die verwiesene Seite und ggf. der Texthervorhebung übernommen werden. Des Weiteren sollte für die von dir vorgeschlagenen Bücher (soweit ich sehen kann aus dem 19 Jhd. als als Volltext bei Google Books abrufbar) der Parameter "Linktext=Volltext" gesetzt werden. --Cepheiden (Diskussion) 12:17, 23. Jan. 2016 (CET)
Im ersten Beispiel habe ich die Seite ja übernommen. Beim zweiten war die Seitenangabe bei einem Parameter ohne erkennbare Auswirkung drin.
Per Bot kann man wohl nicht einfach herausfinden, ob es sich um einen Volltext handelt oder nicht. --Leyo 02:43, 24. Jan. 2016 (CET)
Ich denke schon, dass es da Möglichkeiten gibt, z.B. wenn man das Jahr auswertet, so erfasst man zumindest einige Einbindungen. Man müsste den RegEx/Bot-Experten aber entsprechende Beispiele vorgeben, oder nicht? --Cepheiden (Diskussion) 08:11, 24. Jan. 2016 (CET)
Die Intention meiner Anfrage war es nicht, auf Volltext oder nicht zu prüfen, sondern einfach mal die Vorlage einzusetzen. Bei den meisten der mittels insource:/\[https?\:\/\/books\.google\.[^ ]+\]/ gefundenen Treffern etwa, bei welchen der Weblink im Artikel als [1] erscheint, ist die Vorlage beispielsweise auch ohne Volltext-Prüfung eine deutliche Verbesserung gegenüber dem Ist-Zustand. --Leyo 22:25, 24. Jan. 2016 (CET)
@Cepheiden: Als einer der Hauptautoren der Vorlage:Google Buch hast du bestimmt einen guten Überblick über die zu übernehmenden Parameter sowie Fälle, bei denen die Vorlage nicht eingesetzt werden kann. --Leyo 12:56, 30. Jan. 2016 (CET)
Das schon, aber mir fehlt natürlich eine Übersicht der Fälle, wie die url-Variante eingebunden ist. --Cepheiden (Diskussion) 18:20, 30. Jan. 2016 (CET)
Man sollte am besten mit den häufigsten Typen anfangen. --Leyo 21:47, 7. Feb. 2016 (CET)
Relevant laut Vorlage:Google Buch sind folgende URL-Parameter: q=, id=, pg=, dq=. Gibt es weitere oder kann alles andere ignoriert werden? --Leyo 14:16, 12. Jun. 2018 (CEST)

Kategorieinhalt nach den Unterkategorien einer anderen Kategorie systematisch sortieren - z.B. Kategorie:Filmkomödie nach Kategorie:Filmtitel nach Jahr[Quelltext bearbeiten]

Hallo, Folgendes hatte ich auf FzW bereits gefragt, dort konnte mir offenbar keiner helfen. Daher jetzt eine Botanfrage:

Ich möchte öfters Inhalte von Kategorien sortiert nach anderen systematisch angelegten Kategorien sortiert bekommen. Zum Beispiel würde ich mir gerne den Inhalt von Kategorie:Filmkomödie anzeigen lassen, sortiert nach den Unterkategorien von Kategorie:Filmtitel nach Jahr. Das Ergebnis sähe dann z.B. so aus:

  • Filmtitel 1888
    • Filmkomödie xy
    • Filmkomödie yz
  • Filmtitel 1889
    • Filmkomödie ab
    • Filmkomödie bc

Klar, händisch kann ich das mit CatScan machen. Gibt es eine Möglichkeit, das automatisch zu machen? Ich hätte gerne (man darf ja noch träumen) ein Tool mit Formular:

  • Kategorie, aus der Artikel sortiert werden sollen die Sortiert werden soll: ___________ (hier z.B. "Filmkomödie")
  • Kategorie, die Kategorien enthält, nach denen alphabetisch sortiert werden soll: ___________ (hier z.B. "Filmtitel nach Jahr")

wünscht sich --Zulu55 (Diskussion) Unwissen 12:02, 16. Feb. 2016 (CET)

Mach ich, ich hab da ein änhliches Skript, dann schreibe ich das mal um. Viele Grüße, Luke081515 13:19, 16. Feb. 2016 (CET)
Wow, ich sag schon mal Danke! --Zulu55 (Diskussion) Unwissen 15:18, 16. Feb. 2016 (CET)
@Luke: Hat sich schon was getan? Gruß --Zulu55 (Diskussion) Unwissen 09:08, 2. Mär. 2016 (CET)
Ich bin scho noch dran, nur in den letzten Tagen hats mir einmal komplett das Framework zerschossen, da musste ich große Teile neuschreiben. Ich bin schon noch dran, nru es kann sich noch etwas hinziehen
@Zulu55: Welche Variante wolltest du denn?
  • a) Nur eine Subkategorie in die Tiefe, also nur in eine Unterkat, alles was darunter ist nicht.
  • b) Maximal 100 Subkategorien in die Tiefe, allerdings ohne diese Unterkats noch aufzulisten, nur die Seiten die da sind
  • c) Maximal 100 Subkategorien in die Tiefe, alle Kategorien werden gelistet
Was möchtest du? von a) nach c) wirds schwerer. Viele Grüße, Luke081515 10:39, 15. Mär. 2016 (CET)

Da ein Formular gewünscht ist, wirst Du wohl webservice brauchen. Weißt Du, wie Du Deine Scripts einbindest? – Doc TaxonDiskussionWiki-MUCWikiliebe?! 10:51, 15. Mär. 2016 (CET)

@Luke: "a)" für das was oben im Beispiel "Filmtitel nach Jahr" ist; also keine Unterkategorie von "Filmtitel nach Jahr" (gibt's in dem Beispiel auch gar nicht). Für das was oben "Filmkomödie" ist gerne einstellbar von 0 bis 7. Falls das nicht geht bitte 0 (nur Seiten die direkt in der Kategorie Filmkomödie sind). --Zulu55 (Diskussion) Unwissen 10:59, 15. Mär. 2016 (CET)
@Luke: Auch hier die freundliche Nachfrage: Tut sich was? --Zulu55 (Diskussion) Unwissen 10:43, 11. Apr. 2016 (CEST)

Ab dem 19ten haben wieder mehr Zeit, momentan leider recht viel zu tun. Viele Grüße, Luke081515 11:04, 11. Apr. 2016 (CEST)

Vllt wirds doch fixer fertig, der Bot ist jetzt von Code her fertig geschrieben, muss noch gerade durchs Review, dann teste ich ihn, und dann kanns losgehen. Viele grüße, Luke081515 17:24, 13. Apr. 2016 (CEST)
@Luke: Und, wie siehts aus? Magst du noch mal? --Zulu55 (Diskussion) Unwissen 16:19, 12. Jul. 2016 (CEST)
Hallo @Luke081515, noch mal freundliche die Nachfrage: Wie sieht es aus? --Zulu55 (Diskussion) Unwissen 14:06, 28. Okt. 2016 (CEST)

Moin, ich ab leider derzeit recht wenig Zeit für WP etc. die, die ich habe verwende ich daher für Sachen, die mir in dem Augenblick Spaß machen, und da sitze ich gerade an einem Programm, was für außerhalb die WP ist. Daher schreibe ich das Skript derzeit nicht weiter, auch wenn ich dir gerne den Wunsch erfüllen würde, daran liegt es nicht. Wenn allerdings ein anderer Techniker in der zwischenzeit übernehmen möchte: Ich habe nix dagegen. Viele Grüße, Luke081515 19:57, 29. Okt. 2016 (CEST)

@Magnus Manske: Könnte man das nicht schön in Petscan integrieren? Beim sortieren gäbe es dann die Option eine Kategorie einzutragen z.B. hier "Kategorie:Filmtitel nach Jahr". Die Ergebnisse werden dann nach den darin enthaltenen Kategorien (Tiefe 1) (in diesem Fall Jahreskategorien) alphabetisch sortiert. Die Ausgabe könnte dann abgesetzt nach den Jahreskategorien erfolgen. --Zulu55 (Diskussion) Unwissen 09:45, 19. Jul. 2017 (CEST)

@Zulu55: @Luke081515: @Doc Taxon: @Magnus Manske: Seit einem Jahr hat sich hier nichts mehr getan. Ist das Problem erledigt? --89.144.202.120 19:33, 5. Aug. 2018 (CEST)

Hallo, mein, es gibt immer noch kein Werkzeug das das kann. Gruß --Zulu55 (Diskussion) 11:22, 21. Aug. 2018 (CEST)

Suche nach speziellen Bildern im Mineralbereich[Quelltext bearbeiten]

Hallo zusammen, ich bräuchte einen Bot, der mir etwas Arbeit bei der Suche nach exzellenten, Qualitäts- bzw. wertvollen Bildern im Mineralbereich hilft. Und zwar suche ich nach Bildern, die entsprechend ausgezeichnet wurden, aber bisher nicht in den genannten Listen auftauchen.
Grundlage wären die entsprechenden Kategorien auf Commons Commons:Commons:Featured pictures/Objects/Rocks and Minerals, Commons:Commons:Quality images/Subject/Objects/Geological objects/Rocks, Minerals, Elements und Commons:Commons:Valued images by topic/Objects/Geological objects/Rocks, minerals and elements.
Jetzt ist die Frage: Schafft es ein Bot, die Bilder dahingehend zu prüfen, ob das dargestellte Objekt (Name) in der Kategorie:Mineral auftaucht? Wenn ja, wäre ein monatlicher (oder auch quartalsmäßiger) Botlauf wirklich hilfreich. Die Botmeldung könnte auf der Diskussionsseite von Portal:Minerale/Galerie erfolgen. Mag sich jemand daran versuchen? Viele Grüße -- Ra'ike Disk. LKU WPMin 21:53, 28. Feb. 2016 (CET)

@Ra'ike: Sollen nur die auf den drei angegebenen Seiten eingebundenen Bilder durchsucht werden, oder gibt es weitere Kriterien? -- hgzh 23:29, 8. Mär. 2016 (CET)
Hallo hgzh, eigentlich dürften sich die gesuchten Mineralbilder nur in den angegebenen Commons-Kategorien befinden. Gruß -- Ra'ike Disk. LKU WPMin 21:47, 9. Mär. 2016 (CET)
würde ich gerne machen, wenn das hgzh jetzt nicht schon vor hat – Doc TaxonDiskussionWiki-MUCWikiliebe?! 23:37, 9. Mär. 2016 (CET)
@Doc Taxon: Ich bewundere ja deine deine Motivation, hier fast wirklich jeden Botauftrag zu übernehmen. Mehr als ein grobes Konzept hatte ich mir noch nicht zurechtgelegt, also nur zu. Gruß, -- hgzh 19:35, 10. Mär. 2016 (CET)
@Hgzh: nee, mach mal: Ich wünsche Dir hierbei viel Spaß, – Doc TaxonDiskussionWiki-MUCWikiliebe?! 19:47, 10. Mär. 2016 (CET)

@Doc Taxon: Bist du schon durch? Gruß -- Quotengrote (D|B) 15:30, 27. Jun. 2017 (CEST)


@Ra'ike: @Hgzh: @Doc Taxon: @Quotengrote: Seit einem Jahr hat sich hier nichts mehr getan. Ist das Problem erledigt? --89.144.195.168 20:03, 7. Jul. 2018 (CEST)

Was mich angeht, habe ich seit dem letzten Beitrah von Quotengrote nichts mehr davon gehört, ob der Antrag noch in Arbeit ist. Wird vermutlich eingeschlafen sein. -- Ra'ike Disk. LKU P:MIN 20:07, 7. Jul. 2018 (CEST)
Hm, ich schau mir das noch mal an, nachdem ich wichtigere Sachen abgearbeitet habe. – Doc TaxonDisk.WikiMUCWikiliebe?! 13:27, 9. Jul. 2018 (CEST)

Einzelnachweise ohne Formatierung automatisch konvertieren[Quelltext bearbeiten]

In Arbeit --FNDE (Diskussion) 17:51, 5. Apr. 2016 (CEST)


Hallo, mir ist aufgefallen, dass es in der neusten Version des VisualEditors die Möglichkeit gibt, Links, die nur aus dem Linkziel bestehen, automatisch zu konvertieren. Ist es möglich, einen Bot so zu programmieren, dass er alle diese Links automatisch konvertiert? Es gibt teilweise sehr viele von solchen Links, vgl.: elementary OS#Referenzen. -- Live Long and Prosper Motte001Diskussion • 18:50, 21. Mär. 2016 (CET)

@Motte001: Wie werden die Links denn konvertiert? Meinst du von [[E-Mail|E-Mail]] in [[E-Mail]]? --FNDE (Diskussion) 12:09, 3. Apr. 2016 (CEST)
@FNDE: Nein, es werden automatisch Meta Daten hinzugefügt. Bsp: <ref>[https://www.youtube.com/watch?feature=player_embedded&v=wtxmBJKMrDI Special Live Hangout]</ref> zu <ref>{{Internetquelle|url=https://www.youtube.com/watch?feature=player_embedded&v=wtxmBJKMrDI|titel=Announcing Freya: Special Live Hangout|autor=elementary|datum=2015-04-11|zugriff=2016-04-03}}</ref>. Einfach im grafischen Editor einen Einzelnachweis anklicken und dann erscheint da ein kleines Fenster, in dem der "konvertieren" Button ist-- Live Long and Prosper Motte001Diskussion • 18:12, 3. Apr. 2016 (CEST)
@Motte001: Jetzt verstehe ich was du meinst :) Man müsste sich darauf einigen, welche der Bot denn genau verwerten soll. Soll es eine <h1>-Überschrift sein, oder sollen die Daten aus den Metatags der HTML-Seite ausgelesen werden? Zweiteres wäre sicher sinnvoll, wird aber vorrangig nur auf Nachrichtenseiten oder Blogs einheitlich verwendet. VG --FNDE (Diskussion) 18:19, 3. Apr. 2016 (CEST)
@FNDE: Natürlich kann man dem Bot nicht sagen: "klicke jeden Link an und dann auf konvertieren", aber kann man nicht den vorhandenen Algorithmus "einfach" per copy+paste in den Code eines Bots einfügen und dann alle Seiten nach nicht konvertierten Quellen durchsuchen lassen? MediaWiki ist ja OpenSource -- Live Long and Prosper Motte001Diskussion • 18:55, 3. Apr. 2016 (CEST)
@Motte001: der Algorithmus ist nicht wirklich kompliziert, da werden wie gesagt nur Metatags extrahiert. Ich finde die Idee sehr gut, würde aber vorschlagen für den ersten Test lediglich Seiten einzubeziehen, wo man die genaue Struktur kennt. Links auf SPON/FAZ/SZ usw. kann man problemlos umwandeln, da es dort immer spezielle Metatags gibt. Wenn das läuft kann man überlegen, wie man das System weiterentwickelt. Ich bin dafür nur solche Links umzuwandeln, wo nachträglich nicht verbessert werden muss :) --FNDE (Diskussion) 20:24, 3. Apr. 2016 (CEST) Technisch gesehen ist das keine große Sache. Viele Grüße --FNDE (Diskussion) 20:24, 3. Apr. 2016 (CEST)
  • Ihr reflektiert über Wikipedia:Technik/Labs/Citoid.
    • Das Teil macht die Auswertung je nach Website dann schon selbst.
  • Die Websites liefern unterschiedlich brauchbare Ergebnisse.
    • Auch wenn man von der gleichen Domain schon ein Dutzend brauchbare Texte bekommen hatte, haut sie einem dann doch wieder irgendwelche konfusen Sondermeldungen dazwischen.
    • Da ich selbst eine solche Anwendung betreibe, habe ich leidvolle Erfahrungen mit Automatismen.
  • Wenn es schon ein (menschlich) betiteltes Weblink gibt, sollte man auf jeden Fall die Finger von lassen.
    • Oben steht was von
      <ref>[https://www.youtube.com/watch?feature=player_embedded&v=wtxmBJKMrDI Special Live Hangout]</ref>
      zu
      <ref>{{Internetquelle|url=https://www.youtube.com/watch?feature=player_embedded&v=wtxmBJKMrDI|titel=Announcing Freya: Special Live Hangout|autor=elementary|datum=2015-04-11|zugriff=2016-04-03}}</ref>
    • Das bleibt dann für einen Bot tabu.
  • Das Auffinden von nackten, unbetitelten URL ist nicht trivial. Wenn man das automatisch macht, zerschießt man etliche anders beabsichtigte Formatierungen. Relativ robust ist wohl, wenn die URL in <ref> und </ref> eingeschlossen ist.
  • Um manuell von den nächsten Autoren nachkontrollieren zu können, werden traditionell an die Umschreibung Kommentare angehängt.
    • Die hier stammen von einer der letzten Aktionen dieser Art um 2008; mit der Nachkontrolle ist man aber wohl noch nicht ganz fertig geworden.

VG --PerfektesChaos 10:03, 4. Apr. 2016 (CEST)

Hey @PerfektesChaos: Danke für den Input! Mein Vorschlag war ohnehin zunächst nur alle großen Nachrichtenportale einzubeziehen, alleine dafür gibt es mehrere zehntausend mögliche Änderungen. Weniger bekannte Seiten haben u.U. eine Struktur, die man mit dem Bot nicht abbilden kann. Daher die Idee, vorrangig auf das Metatag mit title= zurückzugreifen.
  • Deinen Hinweis mit dem Youtube-Link verstehe ich nicht ganz, würdest du solche Änderungen nicht durchführen lassen?
  • Die Links würde ich so hier filtern: /\<ref\>( *\[http:\/\/www\.spiegel\.de[^\]]*\][^\<]*)\<\/ref\>/
  • Ich hatte schon überlegt ob man für so ein Vorhaben (zur Zeit) überhaupt eine Botflag bekommt. Es sind zwar nicht direkt kosmetische Eingriffe, aber wäre ja blöd wenn man da jetzt Arbeit reinsteckt ohne den Bot später im Einsatz zu haben. Viele Grüße! --FNDE (Diskussion) 11:18, 4. Apr. 2016 (CEST)
  • In dem genannten Beispiel hatte ein menschlicher Autor einen Linktitel vergeben; vielleicht einzelne Teile kursiviert, vielleicht weitere Hinweise gegeben, vielleicht etwas übersetzt oder transskribiert, vielleicht redundante Passagen des Textes, mit dem es bei Youtube eingestellt ist, herausgekürzt oder es gibt eine Folge mehrerer Links, die „Teil 1“, „Teil 2“ und „Teil 3“ heißen.
    • Wenn ein Bot sowas mit irgendwie automatisch generiertem Zeugs überschreibt, ist das Botflag bald futsch.
    • Dein RegExp erwischt bereits betitelte Spiegel-Artikel bzw. Spiegel Online, bei denen schon mal jemand was gemacht hatte, etwa auch typografisch nachgearbeitet, und bei denen sogar Ursprung und Datum bereits dahinter stehen darf. Kein Handlungsbedarf, kann zur sogenannten Verschlimmbesserung führen, weil du die Infos dahinter (etwa auch Zitate oder Hinweise zum Inhalt [„Titelgeschichte“; „Gespräch“; „Interview“]) eliminierst.
  • Grundsätzlich ist das bei nackten URL eine Botflag-fähige Aufgabe, aber braucht manuelle Überwachung und geht nur pro Domain/Subdomain, und bei manchen URL-Schemata merkt man dann auch, dass die Antworten zuverlässig sind und bei manchen nicht. Außerdem können Weblinks halb oder ganz defekt oder veraltet sein, ohne sich mit 404 zu melden, sondern statt dessen was von Suchmasken erzählen.
VG --PerfektesChaos 12:20, 4. Apr. 2016 (CEST)
@FNDE: Es gibt von Benutzer:Kuebi den URL-in-Wiki-Konverter, der kann das für alle Seiten, die dort bei Klick auf "Hilfe" verzeichnet sind.--Mabschaaf 12:44, 4. Apr. 2016 (CEST)

Konzeption der Bot-Aufgaben[Quelltext bearbeiten]

  • @PerfektesChaos: Okay, das macht absolut Sinn. Wir sollten uns also nur auf Refs wie <ref>[http://www.spiegel.de/*]</ref> beschränken.(?) Denkbar wäre natürlich den vorhandenen Linktext in die Vorlage Internetquelle zu integrieren. Denkst du denn, dass bei SPON/FAZ usw. so viele individuelle Linktexte existieren? Bei Nachrichten wird ja i.d.R. nur der Titel verlinkt.
  • @Mabschaaf: so in der Art wird es dann bei uns auch aussehen, allerdings werden wir für die Umsetzung wie von PerfektesChaos vorgeschlagen auf Wikipedia:Technik/Labs/Citoid setzen. Viele Grüße! --FNDE (Diskussion) 13:28, 4. Apr. 2016 (CEST)
  • Nicht einmal das; weil es geklammert und damit bereits ein menschlich individuell betitelter Link ist. Das kann dann auch nur noch durch Menschen umgeschrieben werden.
  • Nur für den Fall, dass es dazwischen auch keinerlei Whitespace gibt, wäre bei Klammern zu unterstellen, dass dort nur dumpfes [17] steht.
  • Wenn du aber mal auf Artikel aus Jahreszahlen oder Lemmata beginnend mit „Nekrolog“ gehst und dir dort die letzte Spalte anguckst, wirst du merken, dass selbst [17] sinnvoll sein kann; nur innerhalb der <ref> wäre eine einsame [17] nicht so prickelnd.
Zotero dürfte alles abdecken, was andere Tools auch lesen können; notfalls kann man es dort mit Formatbeschreibung zur weltweiten Nutzung einbringen.
VG --PerfektesChaos 14:04, 4. Apr. 2016 (CEST)
@PerfektesChaos: Wie gesagt, ich würde mit REGEX schauen ob es sich um einen Link von Spiegel Online o.ä. handelt, es sollen ja nicht willkürlich alle Links umgeschrieben werden. Grüße! --FNDE (Diskussion) 14:07, 4. Apr. 2016 (CEST)
Wenn es noch keine menschlich zugewisene Linkbeschriftung gibt, ist das auch kein Problem. VG --PerfektesChaos 14:13, 4. Apr. 2016 (CEST)
@PC: ACK!
@FNDE: Wir haben die Vorlage {{Weblink ohne Linktext}} die von Benutzer:CactusBot auf Anforderung verteilt wird. Das Abarbeiten dieser Vorlage stellt sich in aller Regel als mühsehlig heraus, und ist bestimmt nicht mit einfacher Regexp-Trickserei lösbar. In manchen Fällen kann ein Bot aushelfen, allerdings sollte der Antragsteller schon sehr genau wissen in welchem Kontext die unbeschriftete URL steht, denn nur so kann der Bot sinnvolle Arbeit leisten.
Ich habe diese Wochenende gut 1700 URLs von retro.seals.ch auf www.e-periodica.ch umstellen lassen. Nur das Umstellen der URLs ist eine relativ triviale Aufgabe, auch das Fixen der rund 10 % toten Links war eher einfach. Es wurde aber auch angeregt dafür gleich eine Vorlage zu erstellen. Es wäre recht einfach hierfür die 1001ste Datenbanklinkvorlage zu erstellen, aber die Domain wir derart unterschiedlich verwendet, dass eine tatsächlich einheitliche Vorlage wohl nur mit massiver Handarbeit in die Artikel eingearbeitet werden könnte, denn in den meisten Fällen existiert schon eine brauchbare Linkbeschriftung. Zudem gibt es für jede einzelne URL eine korrespondierende DOI, sodass ich heute einer generischen auf DOI und citoid basierenden Lösung den Vorzug gegenüber einer neuen Vorlage geben würde. (Für den nächsten Schritt fehlt mir aber eine sinnvolle Möglichkeit die DOIs über die neuen URLs abzufragen.) Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!  15:43, 4. Apr. 2016 (CEST)
Danke euch allen für die Hinweise! Ich mach mich mal ans Werk. --FNDE (Diskussion) 17:49, 5. Apr. 2016 (CEST)
@FNDE: Mir ist ein mögliches Problem eingefallen: Wenn ich die Konvertierungsfunktion nutze, wird "Zugegriffen am" auf das heutige Datum gesetzt. Es kann ja aber sein, dass die Seite heute nicht mehr ereichbar ist bzw. auf die Hauptseite weiterleitet (was der Bot für defekte Links nicht erkennen kann). Dann wäre die Datumsangabe falsch. -- Live Long and Prosper Motte001Diskussion • 18:07, 6. Apr. 2016 (CEST)
@Motte001: Ich würde Seiten mit 404-Fehlern direkt als offline kennzeichnen. --FNDE (Diskussion) 19:01, 6. Apr. 2016 (CEST)
für das Markieren nicht mehr erreichbarer Seiten haben wir die Vorlage {{Toter Link}} Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!  19:20, 6. Apr. 2016 (CEST)
Ich meinte eher die Seiten, die keinen 404 geben, sondern einfach auf ihre Startseite weiterleiten. Bsp: Star-Trek-Technologie#Weblinks (zweiter Link) -- Live Long and Prosper Motte001Diskussion • 20:52, 6. Apr. 2016 (CEST)
Das ist auch ein toter Link und sollte mit der Vorlage markiert werden.  Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!  21:37, 6. Apr. 2016 (CEST)
Gelegentlich gibt die Vorlage dann gleich selbst Hinweise, wie das zu Fixen wäre... Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!  21:42, 6. Apr. 2016 (CEST)
Das Zugriffsdatum wird bei einer Quelle angeben, damit man weiß wann die Quelle das zu Belegende belegt hat; wenn dann später die Information aus der Quelle gelöscht wird, kann das Zugriffsdatum hilfreich sein. Das Zugriffsdatum sollte der Bot also auf das Datum setzen an dem der Mensch den Beleg eingefügt hat (da das in den allermeisten Fällen das selbe Datum sein wird, an dem der Mensch in der Quelle gelesen hat), oder leer lassen falls das möglich ist --Distelfinck (Diskussion) 02:19, 7. Apr. 2016 (CEST)
Bei Belegen ist das grundsätzlich richtig. Wenn ich Links fixe, ändere ich nur selten das angegebene Originaldatum.  Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!  10:09, 7. Apr. 2016 (CEST)

@Boshomi: @Motte001: Ich weiß jetzt nicht welcher Link konkret gemeint ist. Wir könnten sich solchen Fällen aber den 301er abfangen und ebenfalls als toten Link kennzeichnen. Bei den großen Nachrichtenportalen (mit denen ich zunächst beginnen werde) besteht dieses Problem aber i.d.R. nicht, da alles über Jahre hinweg abrufbar bleibt. Meine Überlegung ist allerdings: gibt es für tote Links nicht schon längst einen Bot der das kennzeichnet? --FNDE (Diskussion) 23:19, 6. Apr. 2016 (CEST)

Doppelkennzeichung von toten Links bringt wenig. Wenn man aber eine Botmeldung sieht, und selbst keine Lösung findet, dann ist eine Markierung mit der Vorlage schon sinnvoll. In diesem fall kann dann der Link von der Diskussionsseite entfernt werden.
301er sind nicht zwingend tote Links, die gehen oft auch zu zielführendende neu aufgesetzten Seiten. Wenn man so etwas sieht und viele Seiten davon betroffen sind, kann man das auf WD:WLW melden, oder gleich auf WP:WLWBot einstellen. Für Hilfe bei den ersten Schritten stünde ich gerne zur Verfügung. Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!  23:28, 6. Apr. 2016 (CEST)

@FNDE: Du unterstellst, dass die URL, die in unserem Artikel steht, korrekt übertragen wurde und die fraglichen Websites dann immer ein sachgerechtes Antwortpaket liefern würden.

  • Es ist aber durchaus häufig, dass beim C&P aus dem Browser ein Buchstabe oder ganzer Parameter nicht mitkopiert wurde, oder in den späteren Jahren mal jemand durch Edit-Unfall plus/minus einen Buchstaben vergeigt hatte.
  • Und dann kommt eine normale Textseite; „diese Nachricht haben wir nicht, aber vielleicht interessieren Sie sich für eine von diesen Seiten?“
  • Das muss also abgefangen werden; einfach eine bewusst falsche URL anfragen und gucken, wie die Reaktion aussieht. Dann skippen oder mit Vorlage markieren; natürlich nicht diesen Linktext und auch kein Abrufdatum. Der Statuscode ist nicht zuverlässig und bei Zotero auch nicht mitgeliefert.

LG --PerfektesChaos 23:40, 7. Apr. 2016 (CEST)

@PerfektesChaos: @Boshomi: ist wohl doch etwas komplexer wie ich dachte :) Ich werde die betroffenen Links am besten skippen und in eine Wartungsliste aufnehmen, dann kann man gezielt schauen wie man die Problemfälle am besten angehen kann. Viele Grüße --FNDE (Diskussion) 11:57, 8. Apr. 2016 (CEST)
Debug
@PerfektesChaos: @Boshomi: @Motte001: ich habe den Bot mal ein paar Trockenübungen machen lassen. 1000 Durchläufe ohne Probleme, außer ein paar 404er. Die kamen vor allem durch die angesprochenen Formatierungen zustande, beispielsweise http://www.spiegel.de/link.html. – der Punkt am Ende macht hier beispielsweise Probleme, ich halte es aber für schwierig, alle Eventualitäten mit einzubeziehen. Die defekten Links werden deshalb erstmal in einer Datenbank mit Lemma gesammelt, sodass man später nochmal drüber schauen kann. Eine Kennzeichnung werde ich nun doch nicht einbauen, schließlich kann auch mal die Seite selbst down sein. Die Gegenüberstellung könnt ihr hier sehen: //tools.wmflabs.org/request/FNBot/db_task.php, man kann da schon ganz gut sehen wie das System arbeitet. diff_from zeigt den ursprünglichen Link, diff_to die zu ersetzende Änderung. Das Datum wird (wenn vorhanden) direkt auf der Seite per Metatag geholt, da Citoid diese Information leider nicht liefert. Viele Grüße --FNDE (Diskussion) 21:29, 8. Apr. 2016 (CEST)
Das bedarf dennoch einer guten Kontrolle, nicht jeder 200er liefert tatsächlich die gewünschte Seite. Daher ist es empfehlenswert das Verfahren Domain für Domain erneut zu überprüfen.  Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!  23:03, 8. Apr. 2016 (CEST)
@Boshomi: Wird gemacht. Neue Domains werde ich vorher im manuellen Verfahren prüfen. Viele Grüße! --FNDE (Diskussion) 10:03, 9. Apr. 2016 (CEST)
@FNDE: gut so. Übrigens, bei manchen Domains ist das "title"-Tag im Meta-Abschnitt nützlicher als die erste h1-Überschrift.  Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!  10:13, 9. Apr. 2016 (CEST)

Ausgelagerte Disk. zum Antrag des Botflag[Quelltext bearbeiten]

@PerfektesChaos: Ich antworte mal hier, damit die Seite für den Antrag auf Botflag etwas übersichtlicher bleibt.

  1. Ich finde den Vorschlag mit der Spiegel-Vorlage gut, allerdings gibt es auf den betreffenden Seiten leider keine Metadaten für das Datum, was für die Vorlage jedoch erforderlich wäre. Dafür müsste ich also eigene Regeln zum parsen der Seite festlegen, weiß nicht ob das so wartungsfreundlich ist?
  2. Ich verstehe nicht ganz was du mit ohne Vorlage / direkt formatiert meinst. So? <ref>[http://www.welt.de/print/xyz Linktitel] abgerufen am ...</ref>
Das Verzeichnis welt_print wegen 301er auf print umstellen habe ich verstanden.
  1. Gleiche Frage zum Hinweis mit der Zeit
  2. Du willst darauf hinaus den Punkt am Ende der URL einfach zu belassen, weil er ohnehin nicht verwertet wird?
  3. Links im Format <ref>[http://example.com]</ref> werden bereits mit einbezogen, falls du das meinst.

Vielen Dank für deine Unterstützung! --FNDE (Diskussion) 23:22, 10. Apr. 2016 (CEST)

Zu 1.: Bei Wochenzeitungen brauchst du kein Datum; ist hier völlig redundant; halt der zugehörige Montag. Archive sind aber nach Heftnummern sortiert.
  • Du brauchst aus dem Zotero-Ergebnis: "authors" (sofern vorhanden), "title", "year", "issue".
  • Du kannst ja mal Benutzer:PerfektesChaos/js/citoidWikitext aktivieren und mit ein paar URL spielen. Funktioniert offenbar.
o.Nr.:
  • Bei den dreien handelt es sich um die Wiedergabe der gedruckten Ausgaben, für die wir die IQ-Vorlage nicht verwenden.
  • Zu allen dreien gibt es aber auch eine Online-Redaktion. Die mit IQ-Vorlage und erfolgreichem Abrufdatum.
  • Bei den Printmedien brauchst du kein Abrufdatum. Die haben wir jeweils im fünfstelligen Bereich verlinkt, und wenn deren Archiv kaputtgeht oder kostenpflichtig wird, hilft uns das Abrufdatum auch nicht weiter – letzte Woche ging es noch. Das maßgebliche Exemplar ist aber das aus Papier, das in der Bücherei einsehbar ist; das ist anders als mit echten Internetquellen.
Zu 2.: Wie im beliebigen Suchtreffer Tauentzienpalast. Reicht. Guck mal im Zotero nach "date".
Zu 3.: Wie im beliebigen Suchtreffer Restquote. "authors", "title", "year", "issue". Reicht. Lit-Vorlage wäre denkbar, kann dir aber massiven Ärger mit Vorlagengegnern einbringen.
Zu 4.: Weil http://example.org/index.html. im ungeklammerten Link den Punkt nicht mitverlinkt, müsstest du ihn ersatzlos wegschmeißen. War nur so als Dekoration gemeint gewesen. Hoffentlich funktioniert die URL dann auch ohne.
Zu 5.: Stand noch nicht im Antrag drin; ist aber unbedenklich.
Enjoy --PerfektesChaos 00:10, 11. Apr. 2016 (CEST)
@PerfektesChaos:
zu 1) klar soweit.
zu 2 + 3) ebenfalls klar, nur habe ich noch nicht gesehen, dass Citoid issue überhaupt zurück gibt. Würde eigentlich auch gerne die Literatur-Vorlage verwenden, das lässt sich später auch deutlich besser verarbeiten von anderen Bots. Was haben die Gegner denn gegen die Vorlage einzuwenden? :-) 
zu 4) genau das ist der Punkt. Ich werde die URLs erstmal skippen und das ganze Problem im einzelnen begutachten, um eine individuelle Lösung zu finden.
zu 5) werd ich dann noch ergänzen.
Danke! --FNDE (Diskussion) 13:40, 12. Apr. 2016 (CEST)
Gegner der Lit-Vorlage: Lies selber; 2006, 2008, 2011 – lass es einfach; bringt dir in diesen beiden Fällen nur Ärger. Direktformatierung und Ruhe ist.
Ob es year gibt, weiß ich jetzt nicht so genau, aber einen ganzen Schwung an Datumsfeldern in der Zotero-Antwort.
LG --PerfektesChaos 13:59, 12. Apr. 2016 (CEST)
@PerfektesChaos:
  • Dann mach ich das mit dem Direktformatierung und Ruhe ist :-) 
  • Hab ich da was mißverstanden? Ich dachte diese Zotero-Daten sind in der Abfrage von Citoid integriert? Tut mir Leid, bin da noch nicht ganz auf der Höhe mit den Datenquellen.
Viele Grüße --FNDE (Diskussion) 15:03, 12. Apr. 2016 (CEST)
@FNDE, PerfektesChaos: finde ich nicht gut, denn wozu haben wir denn die Vorlage. Wir sollten weiterhin die Vorlagen Literatur und Internetquelle nutzen, ich finde sie übersichtlich, man findet fix die Parameter und kann dann auch mal fehlerhafte Einträge korrigieren. Des Weiteren ist eine Nachbearbeitung durch Bots bei Änderung der Vorlage simpel ausführbar. Außerdem sollte man die Referenzen komplettieren und nicht wieder bloß die Hälfte machen, und autor ist auch nicht immer hrsg. Das im Tauentzienpalast und in Restquote reicht eben nicht. Hier fehlen z.B. ISSN und bei einem auch das Datum, das Format Nr/Jahr mit Schrägstrich entspricht nicht unseren Vorgaben oder Vorlagen, des Weiteren wird die Vorlage Literatur nicht verwendet. Hier gibt es viel Bedarf zum Nachdenken noch – Doc TaxonDiskussionWiki-MUCWikiliebe?! 15:23, 12. Apr. 2016 (CEST)
  • Wenn bei einer Bot-Bearbeitung serienmäßig eine Vorlage eingesetzt wird, die einige Autoren mit Händen und Füßen ablehnen, dann gibt das nur vermeidbaren Riesen-Zoff und hilft niemandem.
  • Bei den großen Print-Publikationen, um die es hier geht, verwenden wir grundsätzlich keine ISSN, da die Publikation verlinkt ist und alle weiteren Angaben aus dem eigenen Artikel hervorgehen.
  • Bei einer Wochenzeitung ist die Angabe der Heftnummer völlig ausreichend, da die Archive dementsprechend aufgebaut sind. Wenn du hingegen bei Spiegel oder Zeit nur das Tagesdatum kennst, stehst du erstmal auf dem Schlauch und findest das Heft nicht, weil in den Archiven keines angegeben ist. Du kannst dann erstmal anhand des Monats mal vier, plus ein bisserl, und dann einige Wochen davor und danach durchprobieren, bis du irgendwann die richtige Nummer gefunden hast.
  • Wir geben nur die Informationen an, die hinreichend sind, um eine Publikation eindeutig und zweifelsfrei zu beschreiben; alles andere ist redundant, bläht nur und gibt dann wieder Zeck mit den Autoren der Artikel bis zu Revert und VM. Alles schon gehabt. Man könnte ja mal was draus lernen. Wir geben auch beim Spiegel oder der Zeit nicht an, dass die mal von Rudolf Augstein oder Gerd Bucerius begründet und herausgegeben wurden, dass Stefan Aust grad Chefredakteur sei oder zum Erscheinungszeitpunkt Helmut Schmidt zu den Herausgebern gehört hatte.
  • Die weitaus überwiegende Anzahl der genannten Print-Publikationen ist wie beschrieben im ANR zitiert; Bot-Einsätze könnten hier allenfalls mal wegen veränderter URL erforderlich werden und die findet sich in jedem Fall. Alles andere ist Handarbeit und bedarf der Sensibilität.

VG --PerfektesChaos 15:52, 12. Apr. 2016 (CEST)

Nee, alle fünf Punkte sind nur teilweise korrekt. Ich arbeite ja schon länger an so einem Bot, der solche Schluderei korrigiert, und komme gut voran. Boshomi und Luke081515 wissen davon auch schon, und wer hier auf dieser Seite aufmerksam mitliest, weiß es auch. Alsdenn, Wikipedia wird verbessert. :-) Doc TaxonDiskussionWiki-MUCWikiliebe?! 16:03, 12. Apr. 2016 (CEST)

Zur Beachtung: Wikipedia:Literatur und Wikipedia:Zitierregeln, die wir hiermit nicht über Bord schmeißen sollten und dürfen!Doc TaxonDiskussionWiki-MUCWikiliebe?! 16:16, 12. Apr. 2016 (CEST)

@PerfektesChaos, Doc Taxon: und jetzt? :) --FNDE (Diskussion) 16:30, 12. Apr. 2016 (CEST)
@FNDE: und wie "und jetzt"? Lasst es uns von vornherein vernünftig machen. Und gleich möglichst alle Eventualitäten integrieren. – Doc TaxonDiskussionWiki-MUCWikiliebe?! 16:35, 12. Apr. 2016 (CEST)
@Doc Taxon: Auf jeden Fall, ich werde aus eurem Dialog aber nicht ganz schlau, was den Konsens betrifft :) Viele Grüße --FNDE (Diskussion) 16:37, 12. Apr. 2016 (CEST)
@FNDE: Es geht doch darum, Einzelnachweise zu konvertieren. Fehlende Informationen werden gesammelt, diese in eine Vorlage (Literatur oder Internetquelle oder Webarchiv) gesetzt und der Artikel damit dann geändert. Das alles unter Beachtung der oben fett genannten Regeln und Dokumentationshinweise zu den eben genannten Vorlagen. Fertig! Ist natürlich ein Haufen Arbeit, kriegt man aber hin. – Doc TaxonDiskussionWiki-MUCWikiliebe?! 16:41, 12. Apr. 2016 (CEST)
@Doc Taxon: Ich hab da kein Problem mit alles in eine Vorlage zu integrieren, die Links werden ja immer noch deutlich verbessert. PerfektesChaos hatte nur die o.g. Bedenken geäußert. Wenns von euch (vllt. auch administrative?) Rückendeckung gibt kann der Bot gerne mit den Vorlagen Internetqelle/Spiegel/Literatur arbeiten. Viele Grüße! --FNDE (Diskussion) 18:55, 12. Apr. 2016 (CEST)
@FNDE: na prima, Rückendeckung hast Du von mir natürlich, aber nicht administrativ, denn das steht den Admins in inhaltlichem Bezug nicht zu. Die Vorlagen sind ja auch keine Pflicht, ich habe nur die Vorzüge erläutert. – Doc TaxonDiskussionWiki-MUCWikiliebe?! 19:23, 12. Apr. 2016 (CEST)

Aktueller Stand[Quelltext bearbeiten]

Hallo zusammen. Der Bot (Benutzer:FNBot) hat inzwischen seine Berechtigung erhalten, die Diskussion könnt ihr auf der Antragsseite nachvollziehen. Die Arbeit des Bots wurde unter der folgenden Voraussetzung erteilt: wir dürfen die Links nur mit der Vorlage Internetquelle formatieren, wenn das Zugriffsdatum des Autors bekannt ist. Das ist für die aktuell betroffenen Links leider nicht ohne erheblichen Aufwand möglich, bzw. aufgrund vieler Einzelfälle faktisch unmöglich. Es wurde sich darauf geeinigt, dass der Bot deshalb eine Formatierung als Link mit Beschreibung (z.B. <ref>[http://www.spiegel.de/xyz Headline xyz] in [[Spiegel Online]], 24.05.2016.</ref>) vornimmt. Sofern das Erstelldatum des Artikels vorliegt, wird es wie gezeigt hinten angefügt. Das ist natürlich immer noch eine große Verbesserung im Vergleich zum nackten Link, wenn auch nicht so schön wie eine Vorlage. Ich schlage vor bei diesen Link noch einen unsichtbaren Kommentar einzufügen, beispielsweise <!-- fnbot_1 --><ref> ... </ref><!-- fnbot_end -->. So können wir in Zukunft noch Verbesserungen vornehmen, falls sich da neue Möglichkeiten auftun. Für alle neuen Links gilt dies selbstverständlich nicht: ich würde den Bot ein paar Mal am Tag die Recent Changes untersuchen lassen und neue Links direkt korrigieren. Hier können wir auch unproblematisch die Vorlage Internetquelle verwenden, da das Datum der Einfügung des Links einwandfrei bekannt ist. Habt ihr zu der ganzen Sache noch Fragen oder Anregungen? Ansonsten würde ich den Bot in den nächsten Tagen aktivieren. Viele Grüße und danke für die bisherige Hilfe! --FNDE (Diskussion) 15:49, 24. Mai 2016 (CEST) FYI: Benutzer:Distelfinck, Benutzer:PerfektesChaos, Benutzer:Doc Taxon, Benutzer:Boshomi

mach's bitte ohne Kommentare. Ist nur zusätzlich aufgeladener Quelltext-Müll, der nicht wirklich gebraucht wird. Danke, – Doc TaxonDiskussionWiki-MUCWikiliebe?! 16:10, 24. Mai 2016 (CEST)
Du könntest auch die Vorlage {{Cite web}} oder {{Cite news}} verwenden, da ist das accessdate empfohlen, aber nicht verpflichtend. Bei defakto unveränderlichen Artikeln wie das beim Spiegel der Fall ist, ist das Zugriffsdatum sowieso für die Fisch. Das Zugriffsdatum ist überall dort dringend notwendig, wo unter der selben URL über die Zeit hinweg andere Inhalte geliefert werden. Bei Cite News wird das Zugriffsdatum vernünftigerweise ausgeblendet wenn es gleich dem Erscheinungsdatum ist. Auf Kommentare eines Bots kann ich auch gerne verzichten. Verwende statt dessen aussagekräftige Editkommentare  Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!  16:15, 24. Mai 2016 (CEST)
Alles klar, ohne Kommentare. Die Cite-Vorlage ist ja ganz gut.. warum sind wir da nicht gleich drauf gekommen? :) So hätte es ja trotzdem eine Struktur die sich im Nachhinein ggf. ändern ließe. Viele Grüße! --FNDE (Diskussion) 16:21, 24. Mai 2016 (CEST)
Das is ja super, mit den {{Cite ...}}-Vorlagen. Die Vorlagen erleichtern dann auch die Bearbeitbarkeit im Visual-Editor, also: top --Distelfinck (Diskussion) 16:39, 24. Mai 2016 (CEST)

Ich halte das für einen völligen Trugschluss, dass das Abrufdatum weggelassen werden kann, nur weil die Cite-Vorlagen keine Fehlermeldung auswerfen, wenn es nicht eingetragen wurde. In Wikipedia:Zitierregeln#Internetquellen_und_Weblinks steht sehr klar, dass Einzelnachweise (und um die dürfte es in der überwiegenden Zahl der Fälle gehen) mit einem Abrufdatum versehen werden sollen. Wenn der Bot das nicht kann, dann sollte er die Finger von diesem Eintrag weglassen. Es spricht mM allerdings nichts dagegen, die Recent Changes zu überwachen, nachzuformatieren und das aktuelle Tagesdatum als Abrufdatum zu verwenden.--Mabschaaf 17:21, 24. Mai 2016 (CEST)

und wenn wir so vorgehen, wie Mabschaaf es meint, kann der Eintrag jetzt wiederum doch in die Vorlage Internetquelle inkl. Parameter autor titel hrsg datum zugriff erfolgen. Yeah, that's it! – Doc TaxonDiskussionWiki-MUCWikiliebe?! 17:29, 24. Mai 2016 (CEST)
Der Bot fügt keine Einzelnachweise ein, er versieht lediglich schon bestehende Einzelnachweise mit einem Seitentitel und macht sie lesbarer. Von daher muss der Bot kein Abrufdatum angeben --Distelfinck (Diskussion) 17:36, 24. Mai 2016 (CEST)
wie eben oben erwähnt, haben Einzelnachweise ein Zugriffsdatum auszuweisen, wie es unsere Zitierregeln vorsehen – Doc TaxonDiskussionWiki-MUCWikiliebe?! 17:41, 24. Mai 2016 (CEST)
Okay, du willst also darauf hinaus, dass es schön wäre, ein Zugriffsdatum noch zu ergänzen. Da aber aktuell kein Computercode dafür vorliegt, der das machen kann, kann der Bot das auch nicht machen... Also besser der Bot macht was er kann, statt garnix, oder --Distelfinck (Diskussion) 17:45, 24. Mai 2016 (CEST)
(nach BK) Mabschaaf, wir machen aus einem Link ohne Titel, Datum und alles einen Link (bzw. eine Vorlage), die zumindest den Titel, das Artikeldatum und den Herausgeber enthält. Für neue Links ist das Zugriffdatum natürlich zu berücksichtigen, aber bei den alten haben wir entweder die Wahl zwischen so stehen lassen und damit die Usability konstant schlecht zu halten, oder das bestmöglichste herauszuholen. Doc Taxon, ich zitiere mal: Des Weiteren soll bei Belegen nach der letzten allgemeinen Angabe und vor der Kommentarklammer das Abrufdatum angegeben werden. Natürlich soll es so sein, ist aber bei zehntausenden Links nicht so geschehen. Wir versuchen ja nur den Link zu verbessern, auch wenn der status quo (fehlendes Zugriffdatum) erhalten bleibt. Dieser Umstand wird sich aber ohnehin nicht ändern, mit oder ohne Botauftrag. Viele Grüße --FNDE (Diskussion) 17:50, 24. Mai 2016 (CEST)
okay, ich kann gerne ein Bot entwickeln, der Deine Boteinträge prüft und korrigiert - wenn es ungedingt so sein muss ... – Doc TaxonDiskussionWiki-MUCWikiliebe?! 17:58, 24. Mai 2016 (CEST)
 ? Scherz? Da gibt's nix zu korrigieren? --Distelfinck (Diskussion) 18:01, 24. Mai 2016 (CEST)
nee, Ernst, wenn man schon Einzelnachw., und wir haben tausende falsvh formatierte, korrigiert, dann ordentlich ... – Doc TaxonDiskussionWiki-MUCWikiliebe?! 18:04, 24. Mai 2016 (CEST)
Es ist ja ordentlich! Das einzige was dich zu stören scheint, ist, dass der Bot nicht seine Aufgabe noch mit einer anderen Aufgabe kombiniert in einem Edit. --Distelfinck (Diskussion) 18:08, 24. Mai 2016 (CEST)
Dieser Punkt wurde ja schon auf der Antragsseite besprochen. Es wäre vollkommen unverhältnismäßig diesen Aufwand zu betreiben und trotzdem noch zahlreiche Fehler durch die Ausnahmen einzubauen. Ein Einzelnachweis ohne Zugriffsdatum (status quo) ist weniger falsch als ein Einzelnachweis mit einem falschen Zugriffsdatum, das steht schon mal fest. Und dieses falsche Zugriffsdatum können wir einfach nicht ausschließen. MBq hat ja selbst den Vorschlag eingebracht, die Links ohne Zugriffsdatum zu formatieren. Dort gab es abschließend auch keine Gegenrede, deshalb kann ich die Diskussion gerade nicht nachvollziehen. Viele Grüße --FNDE (Diskussion) 18:18, 24. Mai 2016 (CEST)
es wurde ja hier gerade erwähnt, dass die SPON-Artikel praktisch nie geändert werden. Also kommt das Zugriffsdatum einer Neuprüfung gleich, die ein älteres Datum obsolet macht. Somit kann das aktuelle Zugriffsdatum eingetragen werden. Ich dachte, ich sagte das oben schon. – Doc TaxonDiskussionWiki-MUCWikiliebe?! 18:22, 24. Mai 2016 (CEST)
Also das Zugriffsdatum anzugeben, ist ja kein Selbstzweck. Wenn sich eine Seite nie ändert, dann muss man auch kein Zugriffsdatum angeben, weil es in dem Fall schlicht niemand für was gebrauchen kann --Distelfinck (Diskussion) 18:37, 24. Mai 2016 (CEST)
Ja das ist auch so, aber genau das war doch schon mein Argument in der Diskussion auf der Bot-Antragsseite. Alle bislang ausgewählten Seiten arbeiten nach dem Prinzip wie bei SPON: Inhalte ändern sich nicht, und wenn es so ist, wird explizit darauf hingewiesen. Es würde demnach also nichts dagegen sprechen für diese Seiten das aktuelle Datum als Zugriff zu verwenden. Ich erinnere mich aber, dass Distelfinck von der Idee nicht so angetan war. Alles nicht so leicht hier :-)  Viele Grüße --FNDE (Diskussion) 18:31, 24. Mai 2016 (CEST)
Ich glaube nicht, dass Doc Taxon das gemeint hat. Bei einem Teil der Belege ließe sich schon ein Zugriffsdatum feststellen. Und zwar bei Belegen, bei denen sich der belegte Text nicht geändert hat. Also bei einem Teil der Links ließe sich die Zugriffsdatums-Ergänzung schon umsetzen. Aber das ist nicht deine Aufgabe. Deshalb ja auch der Vorschlag, den Bot zu open-sourcen, dann kann jemand, der den Bot um Extra-Funktionen erweitern will, das machen. Oder jemand stellt eine API für dich bereit, die das Zugriffsdatum zurückgibt --Distelfinck (Diskussion) 18:33, 24. Mai 2016 (CEST)
Ja, FNDE, dieses Argument auf der Bot-Antragsseite ist aber nun vom Tisch, wenn der SPON-Artikel praktisch nicht verändert wird. Nochmal: die Änderung des Link-Eintragas würde somit einer Neuprüfung entsprechen, die alte Datumangaben obsolet macht. Insofern ist das Zugriffsdatum des aktuellen Tages zu verwenden. Da zusätzlich Autor, Titel und Datum sehr unproblematisch auslesbar sind, kann der Eintrag in die dafür vorgesehene Vorlage Internetquelle eingefügt werden, und wir haben erreicht, was wir wollten. Danke, – Doc TaxonDiskussionWiki-MUCWikiliebe?! 18:41, 24. Mai 2016 (CEST)
Es findet überhaupt keine Neuprüfung durch den Bot statt! "Insofern ist das Zugriffsdatum des aktuellen Tages zu verwenden." - das wäre kein Informationsgewinn, das in den Einzelnachweis einzufügen – ein Datum auswürfeln kann der Leser auch selber; und das Datum würde auch manchmal falsch sein, wie schon in der Bot-Antrags-Diskussion erwähnt, im Durchschnitt würde also eine Falschinformation in den Einzelnachweis eingefügt. --Distelfinck (Diskussion) 18:52, 24. Mai 2016 (CEST)
Ich bin mir gerade nicht sicher, ob ich zu einfach, oder zu kompliziert denke :-)  Machen wir also jetzt doch das, was vor der ganzen Zugriffs-Datum-Diskussion schon gesetzt war? Vorlage Internetquelle + Zugriffsdatum für alle Links, auch die bestehenden? Ich glaube, ich habe gerade meinen roten Faden verloren :) Grüße --FNDE (Diskussion) 19:49, 24. Mai 2016 (CEST)
Ich sagte ja, dass eine Neuprüfung das alte Datum obsolet machen würde, wir haben es sowieso nicht, deshalb ist das aktuelle zu verwenden. @FNDE: ja, so können wir es in diesem Fall machen: Vorlage Internetquelle + Zugriffsdatum für alle Links, auch die bestehenden – Doc TaxonDiskussionWiki-MUCWikiliebe?! 19:56, 24. Mai 2016 (CEST)
Also damit hab ich jetzt nicht gerechnet ätsch  Aber prima, erleichtert alles natürlich. Nur kann sich Distelfinck wohl nicht damit arrangieren wenn ich richtig liege? --FNDE (Diskussion) 20:10, 24. Mai 2016 (CEST)
Ich glaub ich bin hier im falschen Film. Wer soll diese "Neuprüfung" durchführen? --Distelfinck (Diskussion) 20:16, 24. Mai 2016 (CEST)
(Es bestünde auch die Möglichkeit dies im IRC zu besprechen, könnte mir vorstellen, dass es dort etwas zügiger geht als hier. --FNDE (Diskussion) 20:30, 24. Mai 2016 (CEST))
Nee, nochmal: Wer soll diese Neuprüfung durchführen, sprich für jeden einzelnen vom Bot angefassten Link zu überprüfen, ob die Quelle korrekt wiedergegeben ist? Das wäre eine Riesenarbeit, jeden einzelnen Link abzusegnen --Distelfinck (Diskussion) 20:37, 24. Mai 2016 (CEST)
Niemand hat die Absicht.. eine Neuprüfung durchzuführen :) Also, wenn ich selbst alles richtig verstanden habe meinte Doc Taxon, dass ein inhaltlicher Vergleich mit dem letzten Zugriffsdatum keinen Sinn macht, da es uns nicht vorliegt. Mit Prüfung war die automatische Prüfung durch einen Bot gemeint. Demnach wird also keine Prüfung stattfinden, weder von einem Bot, noch von uns. --FNDE (Diskussion) 20:58, 24. Mai 2016 (CEST)
(BK) Distelfinck, wenn (und ich betone: wenn) feststeht, dass sich der Inhalt einer bestimmten Webseite nie ändert, dann ist die Argumentationskette folgende:
  • Es ist egal, wann der menschliche Bearbeiter den Link eingefügt hat
  • Der Bot prüft die Erreichbarkeit und holt sich die Metadaten (Autor, Titel, Veröffentlichungsdatum)
  • Der Bot formatiert mit diesen Angaben den (nackten) Link um, indem er die Vorlage:Internetquelle mit Parameterwerten befüllt
  • Als Zugriffsdatum (Parameter zugriff=) kann nun auch das Bot-Zugriffsdatum genutzt werden, weil der Link zu diesem Zeitpunkt noch erreichbar war (sonst hätte der Bot auch keine Angaben zum Autor etc. gefunden). Der Inhalt ist ja - wie eingangs beschrieben - unverändert.
Dieses Vorgehen ist natürlich nur bei wenigen(?) Internetseiten akzeptabel, eben nur dann, wenn als zuverlässig annehmbar ist, dass sich Inhalte nie ändern.
In Analogie dazu ist das beim Zugriffsdatum bei Online-Resourcen von Druckwerken (also Vorlage:Literatur mit Parameter Abruf=) auch in der dortigen Doku so festgehalten: Es zählt das Datum der letzten Erreichbarkeit.--Mabschaaf 21:05, 24. Mai 2016 (CEST)
(BK) Add: Da wir hier v.a. über SPON diskutieren: Ich bin mir nicht sicher, ob ein Vorgehen wie eben beschrieben dort gerechtfertigt ist. Siehe diesen Artikel, vor allem den letzten Satz. Hat diese Änderung zu einer neuen ID geführt oder nicht? Wie also verhält sich die SPON-Redaktion genau in solchen Fällen inhaltlicher Änderungen?--Mabschaaf 21:17, 24. Mai 2016 (CEST)

Die einbezogenen Seiten könnt ihr hier einsehen: Benutzer:FNBot/Einzelnachweise --FNDE (Diskussion) 21:13, 24. Mai 2016 (CEST)

@Mabschaaf: Die so gekennzeichneten Internetseiten lassen sich problemlos vom Bot auf eine Blacklist setzen, die dann händische Nacharbeit erfordert. Ich kann mir nicht vorstellen, dass dabei allzuviel zusammen kommt. Damit hätten wir auch dieses Problem aus der Welt. – Doc TaxonDiskussionWiki-MUCWikiliebe?! 22:09, 24. Mai 2016 (CEST)
Welche "so" gekennzeichneten? Wie sollte das denn automatisch erkannt werden? Hier kommt keine Blacklist in Frage, dort wären erst mal alle Seiten drauf. Hier müsste mit einer White-List gearbeitet werden, und welche Seiten dort drauf dürfen, ist zu diskutieren. Ganz ehrlich: Ich sehe da kaum eine Chance, die Altbestände per Bot aufzuarbeiten. Wie gesagt, Recent Changes ist ein anderes Thema. Dort gerne.--Mabschaaf 22:12, 24. Mai 2016 (CEST)
@Mabschaaf: man kann ganz einfach die redaktionelle Anmerkung aus dem Seitenquelltext auslesen, und die Seite kommt auf die Blacklist, fertig. – Doc TaxonDiskussionWiki-MUCWikiliebe?! 00:59, 25. Mai 2016 (CEST)
@Doc Taxon: Mir scheint, Du hast die Problematik noch nicht verstanden. In diesem einen Fall könntest Du tatsächlich nach "Anmerkung der Redaktion" im Text suchen und den Artikel ausschließen. Wer sagt Dir aber, dass unter jedem nachträglich geänderten Artikel "Anmerkung der Redaktion" steht? Vielleicht steht da auch "Corrigendum", "Nachtrag", "Überarbeitet" oder sonst was. Vielleicht aber auch explizit gar nichts. Und im Text wurden die ehemals 345 Opfer zu 435 Opfern korrigiert. Stillschweigend. Das kann nur ein Mensch mit Verstand durch Lesen des Textes und Vergleich mit dem in WP belegten Fakt prüfen.
Was der Bot jetzt (in diesem Beispielfall) machen würde, ist die (nach altem Artikelstand in Wp genannten und belegten) 345 Opfer mit einem Einzelnachweis mit aktuellem Tagesdatum versehen und damit den Beleg "fälschen", denn zum heutigen Tag stehen dort die 435 Opfer. Keine gute Idee. --Mabschaaf 12:43, 25. Mai 2016 (CEST)

Formatierung[Quelltext bearbeiten]

Mabschaaf, das stimmt. Auch hier gäbe es zu viele Einzelfälle. Denkbar wäre eventuell den last-modified-Metatag zu uberprüfen, aber wie schon beim Versionsvergleich haben wir ja kein Referenzdatum, an dem der Link auf Wikipedia eingefügt wurde. Naja, und das Metatag selbst wird auch nicht überall bereitgestellt. Zu deiner Frage oben: die ID bei SPON ändert sich nicht, die Redakteure schreiben bei Änderungen nur ein Update direkt unter den Artikel. Gleiches gilt für die anderen Nachrichtenseiten, auch wenn ich es im Einzelnen nicht überprüft habe. Wenn wir einen 404er von der Seite bekommen wird der Link ohnehin in eine Wartungsliste eingetragen. --FNDE (Diskussion) 13:15, 25. Mai 2016 (CEST)

Fang doch mal mit den Recent Changes an, da gibt es die genannten Probleme nicht. Über die Altfälle müsste man mM einen breiteren Konsens suchen für die Frage:
a) Ist es besser, die Daten, die man kriegen kann auszulesen und in eine Vorlage zu schreiben - und dafür in Kauf zu nehmen, dass eine Wartungskat wegen fehlendem Abrufdatum vollläuft oder
b) sollte man auf das Formatieren mittels Vorlage verzichten und die Informationen nur als Plain Text eintragen oder
c) per Bot einfach nichts tun.--Mabschaaf 13:24, 25. Mai 2016 (CEST)
Also, wenn dem so ist, und die Redakteure eine Änderung des Artikeltextes kennzeichnen, wie FNDE es eins drüber nochmal versicherte, dann haben wir's doch. Ob die jetzt immer "Anmerkung der Redaktion" schreiben, lässt sich sicher rauskriegen. – Doc TaxonDiskussionWiki-MUCWikiliebe?! 15:22, 25. Mai 2016 (CEST)
@Doc Taxon, sag mal, liest Du eigentlich, was wir schreiben? FNDE hat sehr klar gemacht, dass sich die ID nicht ändert, das Metatag last-modified nicht immer verfügbar ist und die Redakteure bestenfalls irgendwas unter den Text schreiben. Klingt das nach sicher automatisierbar? Nein. Und das war jetzt nur für SPON. Wie es die Welt, die FAZ, die Zeit und alle anderen machen, haben wir noch nicht mal Ansatzweise diskutiert. Du solltest die Worte schon mal gehört haben, dass für jeden Boteinsatz breite Zustimmung da sein muss. Die sehe ich hier nicht.--Mabschaaf 17:22, 25. Mai 2016 (CEST)

@Motte001: @FNDE: @PerfektesChaos: @Kuebi: @Mabschaaf: @CactusBot: @Boshomi: @Distelfinck: @Doc Taxon: @MBq: Erledigt? --Thomas Obermair 4 (Diskussion) 23:32, 24. Aug. 2017 (CEST)

Listen auslesen[Quelltext bearbeiten]

Wäre es irgendwie möglich, alle Kaderlisten der Schachbundesliga durch ein Skript auszulesen und in Wikidata einzulesen, bzw. daraus Listen z. B. mit den am häufigsten eingesetzten Spielern o.ä. zu generieren? 129.13.72.198 15:38, 18. Apr. 2016 (CEST)

@129.13.72.198: Erledigt? --Thomas Obermair 4 (Diskussion) 23:33, 24. Aug. 2017 (CEST)

Nö. 188.98.178.120 23:34, 24. Aug. 2017 (CEST)

Englische Seitenangabe p.[Quelltext bearbeiten]

Es gibt mehr als 4000 Vorkommen des englischen "p." (page) anstatt des deutschen "S.". Könnte das ein Bot oder jemand halbautomatisch korrigieren? 129.13.72.198 09:05, 19. Jul. 2016 (CEST)

S. kann man auch ausschreiben, das sonst leicht mit manchmal ebenfalls üblichen "Spalte" zu verwechseln. Ich sehe das aber eher als Handarbeit, die man ev. durch Skripts unterstützen kann (Siehe User:TMg/autoFormatter#Benutzerdefinierte_Ersetzungen oder User:Boshomi/ARreplace). Für Bots ist das Risiko der False-Positiven Ersetzungen zu groß. Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!  18:58, 19. Jul. 2016 (CEST)
Warum nur nimmt keiner unsere Vorlagen her Facepalm Doc TaxonDisk.WikiMUCWikiliebe?! 00:41, 20. Jul. 2016 (CEST)
funktioniert ja, Siehe die Doku. Man kann sich sogar kleine Funktionen für die Ersetzung schreiben (Siehe die etwa das letzte Beispiel in TMgs-Doku). Links wie "Datei:Facial Chronicle - b.16, p. 462 - Great standing on the Ugra.jpg" werden diesen Skripts auch verlässlich ignoriert. ARreplace setzt auf dem Autoformatter auf, und setzt nur die benutzerdefinierte Ersetzungen durch. Das ist für halbautomatischen Einsatz oft besser geeignet, die Diffs sind dadurch viel einfacher und es kommen weniger False-Postive vor, auf die man bei der Nutzung des vollen Funktionsumfang des Autoformatters natürlich achten muss. Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!  01:02, 20. Jul. 2016 (CEST)

@129.13.72.198: @Boshomi: @Doc Taxon: Erledigt? --Thomas Obermair 4 (Diskussion) 23:18, 25. Aug. 2017 (CEST)

In 1918 wird mit obigem Suchlink [[Datei:History.gbatlasGerman Caucasus Expedition, Grosser Bilderatlas des Weltkrieges, Bruckmann, 1919. p. 317.jpg|mini|Bildercollage der Kaukasusexpedition im „Großen Bilderatlas des Weltkrieges“]] gefunden. --Leyo 14:31, 17. Jul. 2018 (CEST)

Einzelnachweise: Dopplungen finden[Quelltext bearbeiten]

Siehe WP:?#Einzelnachweise: Dopplungen findenWikipedia:Fragen zur Wikipedia/Archiv/2016/Woche 29#Einzelnachweise: Dopplungen finden

Mit dem Auffinden alleine ist es in diesem Fall nicht getan. Die Frage die sich mir stellen, ist ob schon jemand einen Bot hat, der mit Hilfe der URL und Wikipedia:Technik/Labs/Citoid sowas zumindest für die Teilmenge der unterstützten URLs zu sinnvoll beschriebenen Linktexten umformen kann?

Für den Rest käme möglicherweise der Einsatz der Vorlage {{Weblink ohne Linktext}} in Frage.  Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!  19:05, 19. Jul. 2016 (CEST)

@Boshomi: Erledigt? --Thomas Obermair 4 (Diskussion) 23:19, 25. Aug. 2017 (CEST)

Commons-Links[Quelltext bearbeiten]

Es gibt hunderte Links auf Commonsseiten, die fehlerhaft sind, siehe Benutzer:Achim55/Links to redirecting pages on Commons. Die könnten per Bot korrigiert werden, da immer auf einen Weiterleitungshinweis gelinkt wird. Kann das jemand übernehmen (eventuell mit einer aktuellen Abfrage)? 84.57.193.43 20:52, 2. Sep. 2016 (CEST)

Doc Taxon, kann das nicht dein Bot so nebenbei übernehmen? Sollte doch nicht schwer sein zu programmieren? 129.13.72.198 17:02, 4. Jan. 2017 (CET)
Etwas Geduld noch, ... ... ... – Doc TaxonDisk.WikiMUCWikiliebe?! 04:10, 7. Jan. 2017 (CET)
@Doc Taxon: Wie lange noch? 129.13.72.198 11:25, 6. Feb. 2017 (CET)
Also, die Daten habe ich schon mal. 2.545 Seiten gilt es zu reparieren. Bin noch dran, – Doc TaxonDisk.WikiMUCWikiliebe?! 13:06, 6. Feb. 2017 (CET)
nein, kleinen Fehler entdeckt, es sind doch deutlich mehr, – ich mach weiter – Doc TaxonDisk.WikiMUCWikiliebe?! 14:16, 6. Feb. 2017 (CET)
@Doc Taxon: Wie schauts aus? Kann dein Bot nicht schonmal anfangen, auch wenn du noch nicht alle Vorkommen gefunden hast? 129.13.72.198 12:54, 13. Feb. 2017 (CET)
Es wird gerade ein Großteil korrigiert. – Doc TaxonDisk.WikiMUCWikiliebe?! 15:32, 13. Feb. 2017 (CET)
Ist der Bot durch? 129.13.72.198 10:40, 14. Feb. 2017 (CET)

@Doc Taxon: Auf Benutzer:Achim55/Links to redirecting pages on Commons gibts noch recht viel zu tun, kannst du dich drum kümmern? 129.13.72.198 16:40, 31. Jul. 2017 (CEST)

@Achim55: @Doc Taxon: Seit einem Jahr hat sich hier nichts mehr getan. Ist das Problem erledigt? --89.144.202.120 01:01, 6. Aug. 2018 (CEST)

Ich hab die Liste gerade eben mal aktualisiert. Der Berg vorm Schneeschieber ist schon deutlich kleiner geworden, aber es sind doch noch 988 Einträge. Davon sind allerdings viele auf Listen-Seiten, da kann ich nicht einschätzen, wie aufwendig die Korrektur für einen Bot wäre oder ob das doch besser händisch zu erledigen ist. Gruß, --Achim (Diskussion) 12:33, 6. Aug. 2018 (CEST)

gesetze-im-internet.de[Quelltext bearbeiten]

Könnte die Vorkommen von www.gesetze-im-internet.de/… (insource:/http\:\/\/www.gesetze-im-internet.de/) nicht automatisiert durch Vorlage:§/Vorlage:§§/Vorlage:Art. ersetzen? Oder zumindest für nackte Links in Einzelnachweisen (insource:/\> *http\:\/\/www.gesetze-im-internet.de/) oder unter Weblinks (insource:/\* *http\:\/\/www.gesetze-im-internet.de/)? --Leyo 11:46, 14. Nov. 2016 (CET)

Siehe GiftbotweblinksucheTreffer für: http://www.gesetze-im-internet.de/%  (Wayback, Webcite, Archive.is) (IABot tote Links, IABot Mementos, Diskussionseiteneinträge) Information icon.svg. Da ist schon einiges tot, siehe die Botmeldungen im Link. Die Frage ist, wie man das am einfachsten fixt, bzw. wo gibt es eine bessere Quelle, die auch veraltete Gesetzestexte anzeigen kann. Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!  20:18, 14. Nov. 2016 (CET)
Es dürfte hier ja ein paar Deutsche geben, die wissen, wo man ihre Gesetzestexte finden kann. ;-) --Leyo 20:30, 14. Nov. 2016 (CET)
Wollen wir es hoffen. Allerdings gehe ich jederzeit eine Wette ein, dass mindestens ein Drittel aller deutschen Bundestagsabgeordneten nicht in der Lage sind selbstständig diese toten Gesetzestexte zu finden.  Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!  21:25, 14. Nov. 2016 (CET)

@Leyo: @Boshomi: Erledigt? --Thomas Obermair 4 (Diskussion) 23:31, 25. Aug. 2017 (CEST)

Klick doch einfach auf die Suchlinks oben. Bist etwa du Deutscher und hast zumindest gewisse Kenntnisse von deutschen Gesetzestexten? --Leyo 23:37, 25. Aug. 2017 (CEST)

Regierungswechsel im Weißen Haus[Quelltext bearbeiten]

Am 21. Januar findet bekanntlich die Amtsübergabe von Obama an seinen Nachfolger statt. Zu dem Zeitpunkt werden alle bis dahin geltenden Weblinks zu whitehouse.gov ungültig und ins Archiv verschoben. Das wird wohl so etwas sein wie http://obama-whitehouse.archives.gov/ oder so ähnlich, jedenfalls war das vor acht Jahren

nach

Wir brauchen also einen Botbetreiber, der, sobald die neue URL feststeht, zeitnah und rasch – bevor übereifrige Benutzer anfangen, vermeintlich tote Links manuell zu korrigieren oder ersatzlos aus Artikeln zu entfernen – dann die Änderungen umsetzt. Dies betrifft sowohl Einzelnachweise als auch Weblinks. Schnell muß es ja vor allem deswegen gehen, weil ja ab dem Regierungswechsel neue, gültige Weblinks mit http://whitehouse.gov/ in Artikel eingefügt werden.

Das ganze ist übrigens ein globales Problem, wenn der Botbetreiber einer globaler Bot ist, wäre es also nicht schädlich.

Sinnvoll wäre es, schon jetzt einmal einen Vorablauf durchzuführen, ob es unter der Domain HTTP-404-Fälle gibt und wenn ja, ob diese ggf. in die Zeit vor 2008 zurückreichen und durch die o.g. Änderung auf das George-W-Bush-Archiv korrigiert werden können. --Matthiasb – Blue ribbon.svg (CallMyCenter) 14:20, 6. Dez. 2016 (CET)

Die Suche nach insource:"http://whitehouse.gov/" liefert nur 2 Treffer, beide sehen "haltbar" aus: https://www.whitehouse.gov/administration/eop und https://www.whitehouse.gov/1600/presidents/ronaldreagan. Interessanter sieht es mit insource:"://www.whitehouse.gov/" aus: 360 Treffer. --mfb (Diskussion) 00:36, 7. Dez. 2016 (CET)

@Matthiasb: Was ist hier der Stand? --Leyo 00:56, 23. Aug. 2017 (CEST)

Das wohl kein Botbetreiber was gemacht hat und das nun eine Aufgabe für die Dead-Link-Fixer ist, die alle Vorkommen einzeln korrigieren müssen. Kann doch kein Schwein wissen, daß eine sinnvolle Bootanfrage nicht abgearbeitet wird. Ärgerlich, so eine Sache – und vermeidbar. --Matthiasb – Blue ribbon.svg (CallMyCenter) 01:37, 23. Aug. 2017 (CEST)
Es hat leider nur noch sehr wenige Botbetreiter, die Anfragen auf dieser Seite abarbeiten … --Leyo 09:59, 23. Aug. 2017 (CEST)
Schon klar. Jetzt haben wir leider im Bestand eine Mischung von gültigen Links zur Trump-Präsidentschaft und veralteten der Obama- und mglw. der Busch-Präsidentschaft. Hier sollte man vielleicht auf eine Linkvorlage umstellen, ich denke mal unrein, sowas wie Whitehouse|<Präsident>|<URL-Teil>, das ist eigentlich ein typischer Anwendungsfall für so etwas. --Matthiasb – Blue ribbon.svg (CallMyCenter) 11:34, 23. Aug. 2017 (CEST)
Potentiell betroffen sind 226 + 132 Artikel. Vielleicht kann man diese eingrenzen. --Leyo 13:06, 23. Aug. 2017 (CEST)
Die "the-press-office" und "blog"-Links leiten automatisch weiter. Alle Links mit "the_press_office" leiten falsch weiter und müssen korrigiert werden. Das sind die größten Gruppen. Der Rest muss wohl auf die 404-Seite geprüft werden. --mfb (Diskussion) 14:55, 23. Aug. 2017 (CEST)

Bilder in Proteinartikeln[Quelltext bearbeiten]

Hallo, es gibt 791 Protein-Artikel ohne Bild. Fast jeder Artikel davon hat in der Infobox eine Uniprot-Nummer, die dort als Weblink zu Uniprot führt. Auf der jeweiligen Uniprot-Seite sind meistens ein oder mehrere Verlinkungen zu Proteinbildern der Protein Data Bank (PDB) unter der jeweiligen PDB-Nummer (Beispiel mit Bild, Beispiel ohne Bild aber mit PDB-Nummer auf der Uniprot-Seite).

Proteinbilder bei Commons aus einem Massenimport von PDB-Bildern tragen als Teil des Dateinamens auch eine PDB-Nummer. Ist es möglich, für die 791 Protein-Artikel auf der jeweils in der Infobox genannten Uniprot-Seite die genannten PDB-Nummern mit Bildern zu sammeln und mit Bildern bei Commons abzugleichen und so eine Liste mit möglichen vorhandenen Bildern auf Commons für die Protein-Artikel ohne Bild zu generieren, die z.B. ich dann manuell abarbeiten würde? Viele Grüße, --Ghilt (Diskussion) 19:53, 17. Dez. 2016 (CET)

@Ghilt: Habe alle Artikel ohne Bild in der Infobox Protein hier aufgelistet: Benutzer:LarusBot/Proteinartikel ohne Bild. Sofern dort eine PDB Nummer gefunden wurde, steht ein Link zu einer Suche auf Commons damit in Klammern dahinter. -- Freddy2001 DISK 19:53, 3. Jan. 2017 (CET)
Dankeschön, Freddy2001! Da ist wohl noch einiges bei Commons an Bildern zu importieren...Grüße, --Ghilt (Diskussion) 11:24, 4. Jan. 2017 (CET)
So, die Protein-Artikel ohne Bild aber mit PDB-Nummer und Bild bei Commons habe ich jetzt größtenteils bebildert, nochmals vielen Dank! Wäre es möglich, für Protein-Artikel ohne Bild und ohne PDB-Nummer auf der jeweils verlinkten UniProt-Seite nach PDBs zu suchen und diese mit Commons abzugleichen? Grüße, --Ghilt (Diskussion) 16:54, 4. Jan. 2017 (CET)
Das wäre auch möglich, auch wenn es oftmals mehrere solcher Nummern auf den verlinkten Seiten gibt. Falls gewünscht, werde ich es mir anschauen, sobald ich wieder etwas mehr Zeit habe. -- Freddy2001 DISK 11:38, 28. Jan. 2017 (CET)
Gerne, und nimm Dir alle Zeit, die Du brauchst, Grüße, --Ghilt (Diskussion) 01:42, 5. Feb. 2017 (CET)
Gäbe es generell eine Möglichkeit, Infoboxparameter von Uniprot zu importieren? --Nothingserious (Diskussion) 18:43, 24. Feb. 2017 (CET)
@Nothingserious: Prinzipell schon, nur muss ganz genau klar sein, wo es welche Daten auf der Seite gibt und wo sie hinsollen. -- Freddy2001 DISK 18:18, 8. Mai 2017 (CEST)

@Freddy2001: Als da wären:

Infobox Protein UniProt Beispiel UniProt P11413
HGNCid HGNC 4057
Symbol Gene Name G6PD
GeneCards GeneCards G6PD
OMIM MIM 300908
MGIid MGI UniProt Q7TNG8: 106428
EC-Nummer BRENDA (Erster Wert x.x.x.xx) 1.1.1.49

Nicht in jedem Eintrag bei UniProt sind alle Parameter vorhanden. --Nothingserious (Diskussion) 20:00, 17. Mai 2017 (CEST)

@Ghilt: @Freddy2001: @Nothingserious: Erledigt? --Thomas Obermair 4 (Diskussion) 23:34, 25. Aug. 2017 (CEST)

Nee, noch nicht, Grüße, --Ghilt (Diskussion) 11:43, 26. Aug. 2017 (CEST)

Bindestrich und Leerzeichen[Quelltext bearbeiten]

Kann bitte jemand seinen Bot losschicken, um folgende Fälle zu korrigieren, also den Bindestrich und das Leerzeichen durch einen Halbgeviertstrich ersetzen:

--Leyo 23:25, 3. Jan. 2017 (CET)

für mehr fehlt mir gerade die Zeit, aber ich bin ja hier nicht alleine zwinker Doc TaxonDisk.WikiMUCWikiliebe?! 16:07, 11. Jan. 2017 (CET)


Gleich noch zwei Anschlusswünsche zum Thema Seitenzahlen:

  • Bitte alle innerhalb von Vorlagen der cite-Familie vielfach fehlerhaft verwendeten Parameter |page= ändern auf |pages=, siehe z.B. Spezial:Diff/161083647/161266863
  • Verbreitet ist auch die abgekürzte Zitierung von Seitenzahlbereichen, bspw. S. 431-5. oder S. 823-37. - entspricht aber nicht WP:ZR, wo nur die vollständige Angabe vorgesehen ist, also S. 431-435. oder S. 823-837. Dies zumindest innerhalb von Vorlagen bei Parametereinträgen wie |Seite[n]= oder |page[s]= zu ändern, sollte fehlerfrei möglich sein.

Viele Grüße --Mabschaaf 12:35, 4. Jan. 2017 (CET)

Frohes Neues, und Veto zu letzterem:
  • Es gibt Publikationen, die ihre Seiten kapitelweise nummerieren, also 12-5 oder 123-2 ist Seite 5 in Kapitel 12 oder Seite 2 zu Thema 123.
  • Ein Automatismus sollte die Finger davon lassen.
  • Wenn, dann mit zwei notwendigen Bedingungen:
    1. Zwischen den beiden Zahlen steht ein Bis-Strich, kein ASCII.
    2. Die abgeschnittene Zifferngruppe muss numerisch größer sein als die gleichlange schließende Zifferngruppe des Startwerts.
Eigentlich ändert man als Sofortmaßnahme eher die Vorlagenprogrammierung, dass die Zweitnotation page= unerwünscht/veraltet sei, arbeitet jedoch damit normal weiter, und wirft eine Wartungskat, mit der sich die aktiven Fälle zuverlässiger als mit Quelltextanalyse des Artikels auffinden lassen, und irrtümliche Verfälschung anderer Einbindungen zumindest unwahrscheinlicher wird. Ggf. auch rote Fehlermeldung zeigen.
VG --PerfektesChaos 09:10, 5. Jan. 2017 (CET)
@PerfektesChaos: Dein Veto kann ich nicht nachvollziehen: Wenn der Bot (wie eingangs angefragt) Seitenzahlenbereiche mit dem typographisch korrekten Bis-Strich versieht, kann er auch gleich die Endseite korrigieren.
Entweder sind dann beide Korrekturen richtig oder auch schon der Bis-Strich ist falsch, weil tatsächlich eine Kapitel-Seite-Notation vorlag. Dann hätte Dein Veto aber gegen Leyos Anfrage gehen müssen.--Mabschaaf 13:01, 5. Jan. 2017 (CET)
Bei meinen zwei Suchstrings kann ich mir schlicht keine Falsch-Positiven vorstellen. --Leyo 13:15, 5. Jan. 2017 (CET) PS. Mit einem Leerzeichen am Anfang der Strings – also insource:/ S\. [1-9][0-9]*- [1-9]/ bzw. insource:/ S\. [1-9][0-9]* -[1-9]/ – gibt es mehr Treffer.
@Mabschaaf: Du hast monospace geschrieben, und in dem sind jegliche Striche gleich breit und ASCII und typografisch nicht unterscheidbar; weder in der Seitendarstellung noch im Queltext.
  • Es stand auch nichts ausdrücklich von U+2013 mit bei.
Fehlerhafte weil unlogische Seitenzahlen würden von einem Bot allenfalls als mutmaßlicher Fehler markiert, aber niemals in irgendeiner Weise automatisiert korrigiert wie „kann er auch gleich die Endseite korrigieren“.
Wenn da vorher ein ASCII-Strich stand, kann überhaupt nichts verändert werden, weil der Bot nicht wissen kann, ob das eine kapitelweise Einzelseite oder ein Bereich von Seitenzahlen sein soll; deshalb darf dann auch kein ASCII-Strich durch typografisch korrekten Bis-Strich ersetzt werden. Der in einem zweiten Schritt dann jetzt eindeutig bestimmen ließe, dass es ein Bereich von Seitenzahlen sein solle.
  • Als Mensch baue ich sowas um; aber weil ich den Gesamtumständen und der Art der Publikation entnehmen kann, dass hier mit C&P oder Citoid aus PubMed etc. eingefügt wurde und ich Mutmaßungen über die Publikationen habe.
Es kann nur geändert werden in dem Fall, in dem
  1. vorher ein U+2013 typografischer Bis-Strich stand
  2. die zweite Zifferngruppe numerisch größer ist als der gleich lange Abschluss der ersten Zifferngruppe.
Andernfalls: nicht dran rühren, keinen Bot-Amok provozieren.
VG --PerfektesChaos 14:11, 5. Jan. 2017 (CET)

@Leyo: @Doc Taxon: @Mabschaaf: @PerfektesChaos: Erledigt? --Thomas Obermair 4 (Diskussion) 23:38, 25. Aug. 2017 (CEST)

Links updaten[Quelltext bearbeiten]

Hallo, die Links zu den Listen der Schweizer Kulturgüter sind größtenteils nicht mehr erreichbar (404):

Die PDF-Dateien sind hier gelistet: http://www.babs.admin.ch/de/aufgabenbabs/kgs/inventar/a-objekte.html (A-Objekte), http://www.babs.admin.ch/de/aufgabenbabs/kgs/inventar/b-objekte.html (B-Objekte).
Teilweise hat sich nur die URL geändert, teilweise gibt es neuere Listen, vgl. diese Änderung. Kann hier ein Bot Hand anlegen? --тнояsтеn 08:33, 16. Jan. 2017 (CET)

Ich werde mich noch in dieser Woche darum kümmern, und daraus einen Auftrag auf WP:WLWBot einstellen. Im einfachen Fall ist das durch ein Regexp machbar, allerdings halte ich das Überprüfen der neuen Linkziele bei solchen Mengen für sinnvoll, um nicht unnötige automatisch generierte Fehlverlinkungen zu erzeugen. Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!  09:27, 18. Jan. 2017 (CET)
@Thgoiter:Ich hatte das letzte Woche aufgeschoben. Ich finde keine URLs für 2016, nur noch für 2017. Ist es in Ordnung URLs für das Jahr 2016 durch 2017er zu ersetzen? Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!  22:12, 27. Jan. 2017 (CET)
Im Abschnitt Weblinks in den Listenartikeln dürfte es problemlos sein, wenn dort kein Datum angegeben ist. Ebenso in den Kategoriebeschreibungen. Bei beidem könnte man auch über den Einsatz einer Vorlage nachdenken. Beim Rest müsste man vermutlich besser händisch prüfen, ob es sich um Belege handelt. --тнояsтеn 22:16, 27. Jan. 2017 (CET)
@Boshomi:? --тнояsтеn 19:35, 28. Jun. 2017 (CEST)
Ich bin derzeit RL-bedingt gut ausgelastet, aber wie es aussieht sollte in den nächsten Wochen wieder etwas Zeit übrig bleiben. Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!  19:49, 28. Jun. 2017 (CEST)

@Thgoiter: @Boshomi: Erledigt? --Thomas Obermair 4 (Diskussion) 23:40, 25. Aug. 2017 (CEST)

Nein --тнояsтеn 11:54, 26. Aug. 2017 (CEST)

Umstellung auf Vorlage:Eishockeybox per Bot?[Quelltext bearbeiten]

Hallo!Im Laufe der Jahre wurde im Portal:Eishockey die Vorlage:Eishockeybox eingeführt. Bei der Durchsicht einiger älterer Artikel sind mir zahlreiche Einbindungen des nun in der Vorlage verwendeten Quelltextes aufgefallen - sprich die Vorlage wurde nicht verwendet. In gewisser Weise geht es bei allem ja auch um die Vereinfachung des Quelltextes eines Artikels, besserer Editierbarkeit, etc. Dass alles evtl. händisch per Copy&Paste zu erledigen, ist aus meiner Sicht eine Arbeit für jemanden, der Vater und Mutter erschlagen hat... Im Prinzip ginge es bei meiner Anfrage, dass der Bot folgendes von "Alt" in "Neu" umwandeln würde:

{| style="width: 70%; background: #F0F0F0;" cellspacing="0"
|- valign="top"
| align="center" width="10%" style="font-size:90%;" | 18. Mai 2008<br />13:00 Uhr
| align="center" width="10%" style="font-size:90%;" | 18. Mai 2008<br />19:00 Uhr
| width="22%" align="right" | {{CAN|#}} Kanada<br /><small>[[Brent Burns|B. Burns]] (3:54)<br />[[Chris Kunitz|C. Kunitz]] (9:17)<br />B. Burns (14:51)<br />[[Dany Heatley|D. Heatley]] (29:56)</small>
| width="15%" align="center" | 4:5 n.V.<br /><small>(3:1, 1:1, 0:2, 0:1)<br />[http://stats.iihf.com/Hydra/132/IHM132156_74_4_0.pdf Spielbericht]</small>
| width="22%" align="left" | {{RUS|#}} '''Russland'''<br /><small>[[Alexander Walerjewitsch Sjomin|A. Sjomin]] (1:23)<br />A. Sjomin (21:14)<br />[[Alexei Wladimirowitsch Tereschtschenko|A. Tereschtschenko]] (48:55)<br />[[Ilja Walerjewitsch Kowaltschuk|I. Kowaltschuk]] (54:46)<br />I. Kowaltschuk (62:42)</small>
| style="font-size:85%;" | Colisée Pepsi, Québec City<br />Zuschauer: 13.339
|}
{{Eishockeybox
| bg        = 
| breite    = 70%
| datum     = 18. Mai 2008
| zeit      = 13:00 Uhr
| datum     = 18. Mai 2008
| zeit      = 19:00 Uhr
| team1     = {{CAN|#}} Kanada
| ergebnis  = 4:5 n.V.
| drittel   = (3:1, 1:1, 0:2, 0:1)
| url       = http://stats.iihf.com/Hydra/132/IHM132156_74_4_0.pdf
| team2     = {{RUS|#}} '''Russland'''
| tore1     = [[Brent Burns|B. Burns]] (3:54)<br />[[Chris Kunitz|C. Kunitz]] (9:17)<br />B. Burns (14:51)<br />[[Dany Heatley|D. Heatley]] (29:56)
| tore2     = [[Alexander Walerjewitsch Sjomin|A. Sjomin]] (1:23)<br />A. Sjomin (21:14)<br />[[Alexei Wladimirowitsch Tereschtschenko|A. Tereschtschenko]] (48:55)<br />[[Ilja Walerjewitsch Kowaltschuk|I. Kowaltschuk]] (54:46)<br />I. Kowaltschuk (62:42)
| stadion   = Colisée Pepsi
| ort       = Québec City
| zuschauer = 13.339
}}

Besteht da eine Möglichkeit? Vielleicht auch so, dass man auf minimaler Ebene noch händisch nacharbeiten müsste? Mit besten Grüßen, Tomyiy  16:27, 17. Feb. 2017 (CET)

Von wie vielen betroffenen Artikel reden wir hier? --Ziegenberg (Diskussion) 18:53, 17. Feb. 2017 (CET)
Das kann ich nicht sagen. Ich kann auch noch nicht genau benennen, um welche Artikel es sich namentlich handelt. --Tomyiy  19:10, 17. Feb. 2017 (CET)
Müssten alle betroffenen Artikel innerhalb des Kategoriebaums Kategorie:Eishockeyturnier sein? --Leyo 21:12, 17. Feb. 2017 (CET)
Stimmt, das müsste es zum allergrößten Teil abdecken. Höchstens noch in dem ein oder anderen Saison-Artikel. --Tomyiy  21:50, 17. Feb. 2017 (CET)
@Tomyiy: wäre es nicht besser, wenn beim rechtsbündigen Team 1 die Flagge eher hinter dem Team steht als davor? – Doc TaxonDisk.WikiMUCWikiliebe?! 18:11, 12. Mär. 2017 (CET)
Wir waren im Portal mit der von links nach rechts geschriebenen/gelesenen Variante eigentlich immer recht zufrieden. Spricht etwas dagegen? Gruß Tomyiy  19:34, 12. Mär. 2017 (CET)
Schätzungsweise 40 Artikel. Gesucht nach | align="center" width="10%" style="font-size:90%;" |, 40 Treffer. Bandy-Weltmeisterschaft 1977 und Bandy-Weltmeisterschaft 1995 folgen einem leicht anderen Tabellenmuster. --mfb (Diskussion) 18:35, 12. Mär. 2017 (CET)
Keine Ahnung, wie man das in die Volltextsuche eingibt... Aber man müsste einfach mal mit "width" etwas spielen. 15% gibt es da zum Beispiel auch, siehe Spengler Cup (Austragungen). Gruß Tomyiy  19:34, 12. Mär. 2017 (CET)

@Tomyiy: @Ziegenberg: @Leyo: @Doc Taxon: @Mfb: Erledigt? --Thomas Obermair 4 (Diskussion) 23:43, 25. Aug. 2017 (CEST)

Auch hier gilt von meiner Seite: ich habe nichts mehr daran gearbeitet und werde auf lange Sicht im Zeitraum des nächsten Jahres auch nichts mehr machen können. --Ziegenberg (Diskussion) 23:47, 25. Aug. 2017 (CEST)

Klassifizierung von Mineralen prüfen und ggf. korrigieren[Quelltext bearbeiten]

Ausgehend von dieser Anfrage im Portal:Minerale bräuchte ich Hilfe für folgendes Problem:
Es geht darum, alle Minerale dahingehend zu überprüfen, ob in der Infobox und falls möglich im Abschnitt „Klassifikation“ die jeweilige Mineralklasse sowie die System-Nummern nach

  1. Systematik der Minerale nach Strunz (8. Auflage)
  2. Systematik der Minerale nach Strunz (9. Auflage)
  3. Systematik der Minerale nach Dana (diese hat Unterseiten für jede Klasse)

korrekt eingetragen sind.
Vor allem bei der zweiten Systematik (Strunz 9. Aufl.) gibt es vermutlich noch viele veraltete Zuordnungen in den Artikeln, seit ich diese auf den letzten bekannten Stand aktualisiert habe.
Kriegt man das per Bot hin? Mir würde da auch schon eine Wartungsliste reichen. Danke im voraus für die Mühe und viele Grüße -- Ra'ike Disk. LKU WPMin 20:32, 14. Apr. 2017 (CEST)

ich kümmer mich mal drum, ist aber nix von jetzt auf gleich ... zwinker Doc TaxonDisk.WikiMUCWikiliebe?! 08:49, 15. Apr. 2017 (CEST)

die Listen sind da, und je nachdem, wie es weiter gehen soll, bleibt die Anfrage noch offen, – Doc TaxonDisk.WikiMUCWikiliebe?! 01:06, 18. Apr. 2017 (CEST)

@Ra'ike: @Doc Taxon: Erledigt? --Thomas Obermair 4 (Diskussion) 23:51, 25. Aug. 2017 (CEST)

Hallo Thomas Obermair 4, nun ja, erledigt insoweit, als dass ich mit den Listen in meinem Benutzernamensraum zu Strunz 8, Strunz 9 und Dana zumindest eine Übersicht habe, bei welchen Mineralen die System-Nummern nicht mit denen in den o.g. Systematik-Listen übereinstimmt.
Inzwischen habe ich allerdings so einige Artikel überarbeitet, d.h. meine BNR-Listen müsste Doc Taxon freundlicherweise sowieso aktualisieren. Auf der anderen Seite frage ich mich aber auch, ob ein Bot die System-Nr. nicht automatisch im Artikel korrigieren könnte. Maßgeblich sind jedenfalls immer die o.g. Systematik-Listen. Ausnahmen, die von Hand geprüft werden müssten, wären dann nur noch Minerale, die z.B. in den Listen nicht auftauchen, weil sie noch zu neu sind und entsprechend noch keine Zuordnung in den Systematiken erhalten haben (vergl. Agakhanovit-(Y)) oder weil sich der Mineralname geändert hat (vergl. Argentobaumhauerit, ehem. Baumhauerit-2a) oder weil es sich wie beim Chabasit um eine Sammelbezeichnung handelt.
Wenn man ansonsten die nötigen Korrekturen per Bot hinkriegen könnte, wäre das schon eine große Hilfe. Viele Grüße -- Ra'ike Disk. LKU P:MIN 19:11, 26. Aug. 2017 (CEST)

Pipes entfernen[Quelltext bearbeiten]

Folgende Weblinks werden mit einer Pipe abgeschlossen und funktionieren daher nicht: insource:/\[https?\:\/\/[^ \]]+\|[A-Za-z]/, insource:/\[https?\:\/\/[^ \]]+\| /
Achtung: In beiden Suchanfragen gibt es falsch-positive Treffer. Kriegt dennoch jemand die Korrektur hin? --Leyo 01:12, 22. Apr. 2017 (CEST)

Es handelt sich alleine um rund 250 Links auf das Deutsche Sportecho (Liste) die besser durch einen Wikilink auf Deutsches Sportecho ersetzt werden könnten, falls Deeplinks auf konkrete Jahrgänge nicht möglich sind. Evtl. kann Benutzer:Greifen dazu etwas sagen?--Mabschaaf 10:16, 22. Apr. 2017 (CEST)
Der Link Zeitschriftendatenbank (ZDB) führt auf die Seite der Zeitschriftendatenbank der Staatsbibliothek Berlin, über deren Suchfunktion ermittelt werden kann, in welchen Bibliotheken das Deutsche Sportecho zur Verfügung steht. Von einer Fehlfunktion kann daher keine Rede sein, und es gibt keinen Handlungsbedarf. -- Greifen (Diskussion) 11:31, 22. Apr. 2017 (CEST)
In Rüdiger Braun sehe ich aber durchaus eine Fehlfunktion (=defekter Link). 129.206.247.161 13:23, 22. Apr. 2017 (CEST)
@Greifen: Das ist aber ziemlich unnütz. Entweder gibst Du konkret eine ISSN mit Vorlage:ISSN an (damit wird ein Deeplink zur ZDB erzeugt, der wirklich zielführend ist) oder der Link kann raus. Sonst könnte man schlicht von jedem Einzelnachweis, der sich auf eine Zeitschrift bezieht, zusätzlich zur ZDB verlinken. Im Artikel Deutsches Sportecho sind die beiden ISSN-Links drin, daher ist die interne Verlinkung dorthin einerseits völlig ausreichend, andererseits noch besser als ein massenhaft gesetzter Link auf eine Suchseite (auf http://dispatch.opac.dnb.de/ gibt es übrigens auch noch 84 Links, die zwar funktionieren, aber entsprechend verbessert werden sollten).--Mabschaaf 13:58, 22. Apr. 2017 (CEST)
@Greifen: Könnte man die defekten Weblinks ggf. auf Vorlage:DNB-Portal umstellen? --Leyo 19:38, 12. Mai 2017 (CEST)
1. kenn ich mich mit Vorlagenprogrammierung nicht aus und 2. wie soll man die evt. defekten Weblinks finden? -- Greifen (Diskussion) 10:02, 13. Mai 2017 (CEST)
@Greifen: Es geht doch darum, für Dich als Autor einen akzeptablen Weg zu finden - dazu musst Du Dich nicht mit Vorlagen auskennen. Die Liste der Artikel mit defekten Links hatte ich oben schon verlinkt, die sind also bekannt. Mein Vorschlag wäre schlicht aus dem bisherigen (ich bleibe jetzt mal beim Beispielartikel Rüdiger Braun, jeweils Quelltext):
  • ''Deutsches Sportecho'': Jahrgänge 1981–1991. c/o [http://dispatch.opac.dnb.de/DB=1.1/SET=1/TTL=1/SHW?FRST=3&PRS=HOL| DNB Leipzig u.a.].
folgendes zu machen:
  • ''[[Deutsches Sportecho]]'': Jahrgänge 1981–1991.
Alternativ wäre noch möglich:
  • ''[[Deutsches Sportecho]]'': Jahrgänge 1981–1991. {{ISSN|0323-8628}}, {{ISSN|0232-4818}}.
was dann tatsächlich so aussieht:
Wenn davon eine Lösung für Dich in Ordnung ist, kann man hier weiter nach einem Botbetreiber suchen, der die knapp 340 Einträge in den Artikeln entsprechend ändert.--Mabschaaf 10:22, 13. Mai 2017 (CEST)
Die ISSN-Version scheint am besten geeignet. Das Problem sind die Jahrgangszahlen. Es kann nicht immer 1981-1991 stehen, da je nach Biografie variabel. Wenn kein Widerspruch erhoben wird, werde ich die ISSN-Version ab sofort bei neuen Artikeln verwenden. -- Greifen (Diskussion) 10:33, 13. Mai 2017 (CEST)
Das, was in den einzelnen Artikeln als Jahrgang angegeben ist, wird natürlich nicht verändert.--Mabschaaf 10:40, 13. Mai 2017 (CEST)
Das Sportecho sollte erledigt sein. Die Links mit dispatch.opac.dnb.de sind in Arbeit, die sind spätestens im September tot. --Wurgl (Diskussion) 17:55, 17. Jul. 2018 (CEST)

@Leyo: @Greifen: @Mabschaaf: @129.206.247.161: Erledigt? --Thomas Obermair 4 (Diskussion) 23:57, 25. Aug. 2017 (CEST)

Nein, magst du bei der Abarbeitung mithelfen? --Leyo 00:01, 26. Aug. 2017 (CEST)
Ich denke, das soll per Bot betrieben werden? Für eine manuelle Bearbeitung steht der Aufwand im keinen Verhältnis zum Nutzen. -- Greifen (Diskussion) 09:57, 26. Aug. 2017 (CEST)
Defekte Weblinks zu reparieren? Ich sehe den Nutzen da durchaus. --mfb (Diskussion) 10:16, 26. Aug. 2017 (CEST)

@Mabschaaf: Moin, wie ist der Stand da bei den Vorlagen? Gibt es da ein Muster nach dem ich ersetzen kann? Ich kann, so wie es bisher aussieht das mit zwei Tools von mir ganz gut Abfrühstücken, einmal eine automatische Korrektur, die funktioniert, wenn man den exakten String hat, der ersetzt werden soll, und für die ohne die Vorlage dann mit Halbautomatik und Pattern, wie ich es gestern bei den doppelten Kommata gemacht habe. Viele Grüße, Luke081515 01:36, 30. Mär. 2018 (CEST)

@Luke081515: Hier hat sich offenbar nichts bewegt. Wenn Du das problemlos lösen kannst, dann nur zu.--Mabschaaf 16:53, 30. Mär. 2018 (CEST)
@Mabschaaf: Es scheint nur noch einen Artikel mit dispatch.opac.dnb.de-Weblink, der mit Pipe angeschlossen wird, zu geben. --Leyo 14:58, 17. Jul. 2018 (CEST)
@Leyo: ok, und nun? Letztlich bleibt Deine Eingangsanfrage bestehen, oder?--Mabschaaf 17:31, 17. Jul. 2018 (CEST)
Ja, schon. Aber damit wäre wenigstens ein Teil der Fälle erledigt. Vielleicht kann mfb die Suchlinks im Eingangsposting optimieren, so dass es keine/kaum Falsch-Positive mehr gibt. --Leyo 17:52, 17. Jul. 2018 (CEST)
Der zweite Link (mit Leerzeichen) hat kaum noch Falsch-Positive. Beim ersten: insource:/\[https?\:\/\/[^ \]]+\|[^ ]*\]/ - keine Leerzeichen. 33 Treffer, aber auch noch false positives. Muss wohl jemand von Hand durchschauen. --mfb (Diskussion) 22:13, 17. Jul. 2018 (CEST)

Bot zur Aktualisierung von Wikipedia:Positivlisten/Chartacts in Deutschland/Singles[Quelltext bearbeiten]

Hallo!

Könnte ein Bot Wikipedia:Positivlisten/Chartacts in Deutschland/Singles, Wikipedia:Positivlisten/Chartacts in Österreich/Singles usw. aktualisieren? Die Listen sind sehr veraltet (Stand: 2010 und älter).

Weiteres müssten Wikipedia:Positivlisten/Chartacts in Deutschland/Alben, Wikipedia:Positivlisten/Chartacts in Österreich/Alben usw. erstellt werden.

LG --Thomas Obermair 4 (Diskussion) 20:59, 9. Mai 2017 (CEST)

@Thomas Obermair 4: kannst du kurz erklären, wie diese Listen zustande kommen? Ich blick da nicht ganz durch, wie diese zusammengestellt wurde. Schöne Grüße --FNDE 18:27, 26. Mai 2017 (CEST)
@FNDE: Alle Künstler die mit einer Single bzw. Album die Charts erreicht haben sind hier aufgeführt. Die Listen wurde von Wikipedianern immer wieder aktualisiert nur ist sie seit längerem nicht mehr aktualisiert worden. LG --Thomas Obermair 4 (Diskussion) 20:00, 31. Mai 2017 (CEST)
Der Ingo Appelt (Komiker) ist in der Liste, aber wie soll ein Bot den identifizieren? Wenn die Vorlage Infobox Chartplatzierungen im Artikel ist, dann ist das machbar (das könnte der Apperbot machen), aber diese Vorlage ist nicht überall. Bei einigen ist eine Tabelle wie hier: Yasmin K. Bei anderen findet man die Info als Text: Acker Bilk, David Bowie oder gar nix: Guido Born. Ich zweifle daran, dass hier ein Bot was machen könnte. --Wurgl (Diskussion) 20:19, 31. Mai 2017 (CEST)
@Thomas Obermair 4: okay, meine Frage zielt auch auf die Bedenken von Wurgl ab, wie hat ein Bot das damals zusammengestellt? Ich kenne mich in dem Bereich nicht aus, aber könnte die Funktionsweise ggf. nachbilden. --FNDE 22:42, 31. Mai 2017 (CEST)
@Wurgl: Das der Bot alle bereits angelegten Artikel durchsucht macht wenig Sinn da es sich um eine Positivliste handelt die aufzeigen soll welche Interpreten es in die Charts geschafft haben und über die noch kein Artikel existiert. Der Bot müsste z.B. auf die Webseite Offizielle Deutsche Charts zugreifen und dann mit der bereits existierenden Positivliste abgleichen. LG --Thomas Obermair 4 (Diskussion) 21:08, 1. Jun. 2017 (CEST)
@FNDE: Laut Versionsgeschichte wurde die Liste händisch von verschiedenen Wikipedianern zusammengestellt. LG --Thomas Obermair 4 (Diskussion) 21:08, 1. Jun. 2017 (CEST)
Okay, das klingt eigentlich nach einer spannenden Aufgabe. Also zusammengefasst: Charts ab 2006 durchforsten ob es Interpreten gibt, die noch nicht in der Positivliste enthalten sind. Korrekt? Wenn man schon mal dabei ist könnte man das ja auch fortlaufend machen, also mit wöchentlicher (oder täglicher?) Aktualisierung. --FNDE 22:27, 1. Jun. 2017 (CEST)
@FNDE: Ja! Aber bitte von Beginn der Aufzeichnungen da die Liste wie schon erwähnt händisch zusammengestellt wurde und Fehler nicht auszuschließen sind. Für einen Bot ist die Aufgabe relativ schnell erledigt. Die Aktualisierung sollte wöchentlich erfolgen da die Charts wöchentlich veröffentlicht werden. LG --Thomas Obermair 4 (Diskussion) 17:11, 2. Jun. 2017 (CEST)

Ja, immerhin ist die Ausgabe auf der Chartseite einigermaßen strukturiert. Eine API haben die zwar nicht, ich denke aber ich bekomme das hin. Wird aber noch etwas dauern, da ich erstmal geplante Botaufgaben abarbeite. Beste Grüße --FNDE 21:11, 2. Jun. 2017 (CEST)

Wir haben doch dafür Portal:Charts und Popmusik/Wunschartikel, dies wird von HvW ab und an aktualisiert. --Tkkrd (Diskussion) (Neulingshilfe) 13:43, 12. Dez. 2017 (CET)

Also händisch ist schwierig. Die Wunschartikel sind zwar vollständiger und zuverlässiger, weil ich nicht auf das Format der Chartseiten angewiesen bin und gleichzeitig auch noch die Links prüfen und anpassen kann, aber ich hänge derzeit weit hinterher und habe auch schon früher eine größere Lücke drin. Das sind netto 2-3 Stunden pro Woche Arbeit.
Die Positivlisten wurden teilweise händisch erstellt, allerdings hat 2010 Firefox13 mal ein Programm geschrieben, das vor allem die Hung-Seiten (alles, was man von hitparade.ch aus links oben aufrufen kann) automatisch ausgewertet hat und die Seiten neu erstellt hat (z. B. für Frankreich). Allerdings haben wir da nicht weitergemacht bzw. das verstetigt. Und er ist kaum noch aktiv. Machbar wäre es und wünschenswert auf jeden Fall auch.
Allerdings eine Warnung: das Thema "offizielle" Charts ist weitaus komplexer als man denkt. Beim Beispiel Frankreich stimmen die Hung-Seiten seit 2012 nicht mehr mit den offiziellen Charts überein und die offizielle Seite ist gelinde gesagt schwierig. Die anderen vorhandenen Länder sind weitgehend okay, obwohl Hung da oft nicht die offizielle Seite ist. Wollte man noch andere Länder einbeziehen, gibt es weitere Probleme, Spanien und Italien kann man bspw. nicht ohne Weiteres von Hung übernehmen.
Für die erste Zeile (DACH+UK+US) hat man vier verschiedene, aber zumindest zuverlässige Quellen, das wäre der Kern und auch wichtig für die WP. Der Rest ist nicht so wichtig und eher eine Frage der Vollständigkeit. Gut wäre auf jeden Fall eine Absprache mit der WP:Redaktion Musik oder dem Portal:Charts. Gruß -- Harro (Diskussion) 14:15, 12. Dez. 2017 (CET)

webpaper.nzz.ch gibt es nicht mehr - Tote Links[Quelltext bearbeiten]

Hallo, die Subdomain webpaper.nzz.ch (Neue Züricher Zeitung) wurde in epaper.nzz.ch integriert. Daher sind alle Links, die auf eine Seite bei webpaper.nzz.ch zeigen, tot. Kann man diese Links automatisiert als tote Links markieren?

Ein Beispiel: Wiki-Seite: https://de.wikipedia.org/wiki/Dominique_Strauss-Kahn

Linkziel: http://webpaper.nzz.ch/2013/05/19/international/KC4X9/strauss-kahns-comeback-in-der-wueste?guest_pass=8e28375c25:KC4X9:e36d2a7805f0a5c83cf893a067d72c6e448d55fd

Anchor: Strauss-Kahns Comeback in der Wüste. (nicht signierter Beitrag von Melanie Riedel (Diskussion | Beiträge) 11:35, 19. Mai 2017 (CEST))

Ein Fall für das Webarchiv? https://web.archive.org/web/20160701060437/https://webpaper.nzz.ch/2013/05/19/international/KC4X9/strauss-kahns-comeback-in-der-wueste?guest_pass=8e28375c25:KC4X9:e36d2a7805f0a5c83cf893a067d72c6e448d55fd – oder sonst eben ca. 110 fehlende Einzelnachweise. --Wurgl (Diskussion) 11:45, 19. Mai 2017 (CEST)
@Wurgl: Ja alle Links als Webarchiv wäre optimal. Ist das möglich per Bot? --KurtR (Diskussion) 03:58, 22. Mai 2017 (CEST)
Das Problem dürfte sein, daß die Mementos nicht denselben Zeitstempel tragen – es dürfte notwendig sein, daß jemand jeden einzelnen Link einzeln bearbeitet. Wobei sich mir die Frage stellt, ob man nicht sinnvoller nach epaper.nzz.ch umstellt. Dazu müßte man aber wissen, ob und wie die Links umgestellt wurden.
@Melanie Riedel: Hast du irgendwelche Infos darüber, unter welcher URL "Strauss-Kahns Comeback in der Wüste" sich unter epaper.nzz.ch findet? (Herrgott, haben die bei NZZ noch nix von Weiterleitungen gehört?) --Matthiasb – Blue ribbon.svg (CallMyCenter) 21:36, 22. Mai 2017 (CEST)
M. W. sind die Artikel nicht frei verfügbar unter epaper.nzz.ch, also ist archive.org optimal. Vielleicht kann der bot einfach das erste vorhandene Memento nehmen oder ist dies technisch nicht möglich? --KurtR (Diskussion) 03:21, 23. Mai 2017 (CEST)
@Matthiasb: Nein, das weiß ich leider nicht. Aber das sollte nur ein Beispiel sein für mehrere Seiten, auf die das zutrifft.(nicht signierter Beitrag von Melanie Riedel (Diskussion | Beiträge) 11:57, 23. Mai 2017 (CEST))
@Wurgl: Nein, Links werden nicht per Bot auf Webarchive umgebogen (es sei denn, es gibt eine geprüfte 1:1-Liste für Ersetzungen). Beim Umbiegen auf ein Archiv ist immer eine inhaltliche Prüfung nötig, die ein Bot nicht leisten kann. Deshalb hat auch GiftBot bei den defekten Weblinkmeldungen auf den Diskussionsseiten nur geprüft, ob es überhaupt Archiveinträge gibt und dann einen Ersetzungsvorschlag gemacht. So, wie ich das einschätze, ist diese Anfrage per Bot nicht lösbar. --Mabschaaf 12:38, 23. Mai 2017 (CEST)
Ich meinte das eher allgemein. Mir erscheint es jedenfalls vernünftiger, diese ca. 110 Links per Hand auf ein Webarchiv umzubiegen als sie als tot zu markieren (was nichts anderes ist als ein Scheintod, weil der übernächste wirft das dann raus) oder gar sofort zu entfernen. Und 110 sind per Hand zwei oder drei Abende (oder ein langer Abend und dann tanzende Sternchen vor den Augen), das ist jedenfalls machbar. --Wurgl (Diskussion) 14:19, 23. Mai 2017 (CEST)
@Mabschaaf @Wurgl: Es braucht in diesem Fall keine inhaltliche Prüfung, die Domain wurde abgeschaltet, der Link ist im Archiv korrekt. Manuell wird damit nur Zeit vergeudet sowie tauchen die manuellen Änderungen in den BEOs auf, was auch nervend ist. Wurgl: Als Tot markieren mit der Vorlage finde ich auch schlecht, auch wenn mit der Vorlage auf eine Memento-Übersichtsseite verlinkt wird. Was aber dann nochmals einen extraklick vorrausetzt für den User zum Anschauen. --KurtR (Diskussion) 17:55, 23. Mai 2017 (CEST)
Ein deutschsprachiger Klon von InternetArchiveBot wäre nützlich … --Leyo 22:12, 25. Mai 2017 (CEST)
Der Botbetreiber hat sich auf Wikipedia:Projektdiskussion#Ein Bot zu bekämpfen von WP:Defekte Weblinks (Bereitstellen von InternetArchiveBot zu dewiki) schon angeboten, aber eher Ablehnung erhalten. 147.142.62.125 14:23, 2. Jul. 2017 (CEST)
@Benutzer:Melanie Riedel, Wurgl, KurtR, Matthiasb, Mabschaaf, Leyo: In einer Kurierdiskussion wurde das Thema deutlich positiver aufgenommen. Daher gibt es inzwischen Wikipedia:Meinungsbilder/Boteinsatz bei toten Links. --Martina Disk. 05:34, 8. Aug. 2017 (CEST)
Danke für die Initiative! GiftBot macht zwar einen tollen Job, aber die viele Handarbeit ist nicht (mehr) zu bewältigen. Die angebotene Unterstützung ist mehr als willkommen. --Leyo 09:28, 8. Aug. 2017 (CEST)

Umbrüche innerhalb des Begriffs mit geschützten Leerzeichen verhindern[Quelltext bearbeiten]

Hallo zusammen,

leider findet man sehr häufig die Zeichenkette

Mac OS&nbsp;X

(insource:/Mac OS\ X/). Bei dieser Schreibweise wird nach dem Mac umbrochen, weswegen diese Schreibweise völlig unlogisch ist. Ich denke, entweder man macht das richtig oder gar nicht. Da es aber für „gar nicht“ keinen rationalen Grund gibt, bleibt nur noch das „richtig machen“.

Folgende Ersetzungen sollte ein Bot daher vornehmen:

a)

Mac OS&nbsp;X

 durch

Mac&nbsp;OS&nbsp;X

b)

Mac OS X

 durch

Mac&nbsp;OS&nbsp;X

c)

Mac OS

 durch

Mac&nbsp;OS

d)

OS X

 durch

OS&nbsp;X

Da ich, als Typograf, ständig Brechreiz kriege wenn ich sowas sehen muss, wäre ich sehr erfreut, wenn das ein Bot übernehmen täte. -- LG, ℳ웃79 23:33, 22. Mai 2017 (CEST)

(a) kann man sicher machen, bei den übrigen bin ich mir bezüglich Konsens unsicher. --Leyo 22:14, 25. Mai 2017 (CEST)
Mit a) wär ich schon sehr glücklich. -- LG, ℳ웃79 18:05, 26. Mai 2017 (CEST)
Bei 135 Ergebnissen könnte man das ja mit ein paar anderen Aufgaben verbinden, z.B. geschützte Leerzeichen parallel in normale umwandeln. Ist beides jedenfalls schnell gemacht. Sagt Bescheid wenn es losgehen soll. --FNDE 18:21, 26. Mai 2017 (CEST)
Ich setze mich da mal ran. -- Quotengrote (D|B) 20:07, 15. Jun. 2017 (CEST)
Warte mal ab Kollege @Quotengrote, hier gibts noch keinen Konsens :) Beste Grüße --FNDE 20:41, 15. Jun. 2017 (CEST)
Diskussion:MacOS/Archiv/2016#Umbruch verhindern durch geschütztes Leerzeichen bei Mac OS, Mac OS X – ich verstehe immer noch nicht, was so schlimm daran sein soll, wenn „Mac OS“ umgebrochen wird. Ist es nicht schlimmer, wenn „OS X“ umgeborchen wird? ‣Andreas 02:01, 16. Jun. 2017 (CEST)
Sehe das ähnlich. Mac OS könnte man eigentlich so lassen, sind immerhin 800 Seiten die wegen einer eher kosmetischen Änderung geändert werden müssten. Bei den anderen beiden: da müssen wir auf jeden Fall darauf achten:
  • dass in Wikilinks nur der jeweilige Beschreibungstext ersetzt wird
  • dass keine Vorlagen mit dieser Bezeichnung (falls es sie gibt) ersetzt werden
  • Code, Syntaxhighlight, Kategorien sollte ebenfalls ausgeschlossen werden
  • Versionsnummern sollten vor Umbrüchen geschützt werden
  • in Zitaten wäre es meines Erachtens ins Ordnung
  • dass alle Ersetzungen parallel in einem Edit vorgenommen werden
Wenns dazu Konsens gibt kann ich das machen, mein Bot kann das bereits, dann muss Kollege Quotengrotte da nicht das Rad neu erfinden. Beste Grüße --FNDE 11:13, 16. Jun. 2017 (CEST)
Mir wäre es schon wichtig, wenn man das nach typographischen Regeln macht. Gibt es denn eindeutige Regeln in der Wikipedia, wie da zu verfahren ist?
Generelle Regeln besagen, dass man z.B. keine Zahlen von den zugehörigen Wörtern trennen soll. Siehe z.B. hier.
  • Vermeidung sinnentstellender Trennungen (etwa Urin-stickt wird nicht so getrennt, wenn, dann als Ur-instikt) – die Wikipedia trennt ohnehin keine Wörter (Silbentrennung)
  • Keine Trennung innerhalb von Überschriften – die Wikipedia trennt ohnehin keine Wörter (Silbentrennung)
  • Trennungen über Seitengrenzen hinweg vermeiden – in der Wikipedia online nicht anwendbar
  • Keine Abkürzungen trennen – wird in der Wikipedia u.a. bei z.&nbps;B. gemacht
  • Zwei gleiche Silben sollten nicht untereinander stehen – könnte wohl passieren… wäre nur über die Wikimedia-Software abzudecken
  • Keine Trennung zwischen Zahl und zugehörigem Wort (Wörtern)
    • Beispiele: Mac OS X Server 10.6, MS-DOS 6.22, Windows NT 3.51
  • Zu viele Trennungen hintereinander vermeiden – die Wikipedia trennt ohnehin keine Wörter (Silbentrennung)
Gibt es sonst noch Regeln, die man befolgen sollte?
Und dann kommen die konkreten Fälle: Sollte man z.B. bei MS-DOS 6.22 MS-DOS&nbsp;6.22 verwenden? Und sollte man den Bindestrich bei MS-DOS als geschützten Bindestrich ausführen, damit es nicht zu einer automatischen Worttrennung beim Bindestrich an einem Zeilenende (je nach Auflösung im Browser anders) kommt?
Ich bin kein Typograph, aber es scheint mir schon so zu sein, dass es Sinn macht, Wörter, die zusammenhängen und von denen ein Teil nicht größer als 2 Zeichen ist, nicht zu Trennen.
Das würde konkret bedeuten:
  • Mac&nbsp;OS&nbsp;X – oder, wenn man OS&nbsp;X als eine > 2 Zeichen-Einheit betrachtet: Mac OS&nbsp;X
  • MS&#x2011;DOS, also mit dem geschützten Bindestrich, dem Equivalent zu &nbsp;
Aber, wie gesagt, ich bin kein Experte. Das sind offenbar andere. Nur kommt es mir dann doch zuviel vor, wenn Mac&nbsp;OS&nbsp;X&nbsp;Server dabei herauskommt… ‣Andreas 11:58, 16. Jun. 2017 (CEST)
Zu "Zwei gleiche Silben sollten nicht untereinander stehen – könnte wohl passieren… wäre nur über die Wikimedia-Software abzudecken". Nein, das kann keine serverseitige Software, denn diese kennt die Breite des Browserfensters nicht und auch nicht den von User eingestellten Font. Wenn, dann könnte man das mit Javascript im Browser machen, aber der Aufwand würde in keinem Verhältnis zum Gewinn stehen. --Wurgl (Diskussion) 12:04, 16. Jun. 2017 (CEST)
Egal. Wichtiger ist der Rest der Textsatzregeln… ‣Andreas 12:18, 16. Jun. 2017 (CEST)
Nachtrag: hier gefunden, unter den Beispielen für geschützte Leerzeichen:
  • 8.&nbsp;Oktober 2015 – entspricht WP:DK
  • Das Angebot&nbsp;– so viel ist klar&nbsp;– verdient eine genaue Prüfung. – entspricht WP:TYPO#Streckenstrich
Aber auch:
  • Stadtwerke&nbsp;AG, Meyer&nbsp;OHG
und (Nachtrag 2) hier:
  • bei Anreden und Namen: Dr.&nbsp;Chris Wolf – nicht zwingend notwendig, aber empfohlen
  • könnte aber auch Dr.&nbsp;Chris&nbsp;Wolf sein… Nachtrag 2, ‣Andreas 12:30, 16. Jun. 2017 (CEST)
Nur mal so als Beispiel… Vielleicht steht das aber ohnehin schon irgendo, z.B. in WP:TYPO (oder wo anders), und ich bin nur zu blöd es zu finden… ‣Andreas 12:24, 16. Jun. 2017 (CEST)

Details[Quelltext bearbeiten]

Das würde ja mit meinem Vorschlag übereinstimmen:

  • Wir ändern Mac OS X in Mac OS&nbsp;X
  • außerdem OS X in OS&nbsp;X
  • und Mac OS #.#.# (beliebe Versionsnummer) in Mac OS&nbsp;#.#.#.
  • Wenn Wikilinks im Schema von [[Mac OS X]] betroffen sind, würde das ganze auf [[Mac OS X|Mac OS&nbsp;]] umgebogen werden.

Beste Grüße --FNDE 13:19, 16. Jun. 2017 (CEST)

Ja, auch ich würde das so machen. Jedoch hat sich gerade ein erklärter Typograph, nämlich Messerjokke79 (ℳ웃79), hierrüber beschwert. Eine weitere (professionelle) Meinung wäre also von Vorteil. ‣Andreas 15:06, 18. Jun. 2017 (CEST)
Nachtrag: Um bei der Wahrheit zu bleiben: ich selbst habe Mac&nbsp;OS verwendet, wenn es alleine dasteht. Bei Mac OS&nbsp;X habe ich die Priotität verschoben zugunsten eines zusammenhängenden „OS X“ ebenso wie bei z.B. Mac OS&nbsp;9, damit die „9“ nicht alleine in der nächsten Zeile steht. Hingegen finde ich in diesem Fall, dass man das Mac als letztes Wort in der einen Zeile ohne gröberen Brechreiz (und ohne Probleme) mit dem „OS 9“ in der nächsten Zeile verbinden kann und somit der Lesefluss nicht gestört ist. Andere (z.B. @Messerjokke79:) sehen das anders. Auch bei Mac&nbsp;OS 9.2.2 habe ich den Fokus auf ein Zusammenstehen von „Mac OS“ entgegen der Regel mit der Versionsnummer gelegt, weil mir ein 9.2.2 in der nächsten Zeile hier weniger Brechreiz verursacht hat als umgekehrt. Das heißt: auch ich habe hier Mist gebaut. Liegt aber wohl auch daran, dass keine Regeln diesbezüglich zu finden sind… Was es mit dem sehr subjektiven Brechreiz dann nicht einfacher macht, einen Konsens zu finden… ‣Andreas 15:18, 18. Jun. 2017 (CEST)
Macht was immer Ihr wollt. Ich bin nicht länger Autor der WP. LG, ℳ웃79 18:28, 18. Jun. 2017 (CEST)
Das ist nicht hilfreich. Wenn es gute Argumente für etwas gibt, dann wäre es falsch, den Kampf aufzugeben. ‣Andreas 19:01, 18. Jun. 2017 (CEST)
Andreas, wie ist hier der Stand? --FNDE 21:17, 8. Apr. 2018 (CEST)
Noch unentschieden. Es gibt offenbar keinen Typographen oder jemanden, der sagen kann, wie man die Zeilenumbrüche korrekt macht. Auch die Regeln der Wikipedia helfen da nicht weiter. Dass man "OS X" zusammenhängt (OS&nbsp;X), ist wohl nachvollziehbar, aber eben nur ein erster Schritt, der dann aber die wirkliche Frage erst aufwirft, nämlich die, wie weit das Ganze dann gehen soll.
[Nachtrag] Das ist ja nicht die Möglichkeit, dass es keine einzige Typgraphie-Quelle gibt, die das ansatzweise erklärt, oder?
Andreas 07:04, 9. Apr. 2018 (CEST)

Bild:[Quelltext bearbeiten]

Sollten wir nicht allmählich mal das veraltete Bild: eliminieren (55.239 Funde)? (Neulinge könnten darin ein falsches Vorbild sehen.) --Hydro (Diskussion) 12:13, 27. Mai 2017 (CEST)

@Hydro: Ist zwar reine Syntaxoptimierung, finde dein Argument mit dem Vorbild für Neulinge aber auch zutreffend. Vielleicht ergibt sich hier ja ein Konsens, wenn man mehrere Aufgaben kombiniert. Ich würde mich der Aufgabe annehmen, da wir demnächst einen größeren Botlauf mit ca. 50-70.000 Artikeln durchführen. Da könnte man diesen Job schon mal integrieren, sicherlich werden wir da auch ein paar erwischen. Ansonsten könnte ich in Kombination zu dieser Aufgabe anbieten:
  • Ersetzung von geschützten Leerzeichen
  • Leerzeichen zwischen Einzelnachweisen entfernen (siehe oben)
  • Sternchen vor Commons-Vorlage entfernen (siehe oben)
  • Ersetzung von prettytable (veraltet)
  • Wikilinks mit gleichem Linkziel kürzen ([[Deutschland|Deutschland]][[Deutschland]])
  • Einfache Regex-Jobs
Wäre im Prinzip sofort einsatzbereit. Beste Grüße --FNDE 13:35, 27. Mai 2017 (CEST)
Wäre schön, ist alles recht, mit einer Reduzierung der "Bild:"-Syntax wäre ich schon zufrieden. Schöne Grüße --Hydro (Diskussion) 14:01, 27. Mai 2017 (CEST)
Wäre es dann nicht sinnvoll, auch gleich |thumb und |miniatur durch |mini und |upright durch |hochkant zu ersetzen? Gruß axpdeHallo! 15:52, 27. Mai 2017 (CEST)
Das sind meines Wissens keine veralteten Syntaxelemente, da würde ich die Finger von lassen. Dagegen dürfte [[Image: auch veraltet sein, und das ist ebenfalls ein paar tausend Male vorhanden. —MisterSynergy (Diskussion) 17:14, 27. Mai 2017 (CEST)
Und [[File:! axpdeHallo! 17:49, 27. Mai 2017 (CEST)
Können wir mit aufnehmen, ist halt die Frage, ob es in den Ergebnissen tatsächlich dabei ist. Schöne Grüße --FNDE 17:52, 27. Mai 2017 (CEST)
[[File: ist ebenfalls nicht veraltet. Wenn Ihr da anfangt, aktuelles Zeugs rauszukloppen, gibt es garantiert Ärger. —MisterSynergy (Diskussion) 18:10, 27. Mai 2017 (CEST)
In der Tat: Es gibt Benutzer, die finden, man müsse die Syntax eindeutschen, und es gibt welche (wie mich), die eher dagegen sind. Veraltet ist an |thumb etc. nichts, auch wenn es Leute gibt, die meinen, sie bei Artikelbearbeitungen unbedingt durch die eingedeutschte Variante ersetzen zu müssen. Gestumblindi 20:24, 27. Mai 2017 (CEST)
Mir gefiel die englische Syntax auch besser, aber es ist nun mal der aktuelle Stand, dass Image: und Bild: nicht mehr verwendet werden sollen, deshalb sollte man diese jetzt mal zu Grabe tragen. --Hydro (Diskussion) 20:39, 27. Mai 2017 (CEST)
Das ist ein anderes Thema: File: in der englischen und meinetwegen Datei: (aber auch File: geht!) in der deutschen Wikipedia statt "Image" oder "Bild", was auch plausibel ist, da auf diesem Wege auch andere Dateien als Bilder eingebunden werden können - so weit in Ordnung. Die unnötige Eindeutschung von Syntax abgesehen davon steht auf einem anderen Blatt. Gestumblindi 20:48, 27. Mai 2017 (CEST)
Du scheinst das ureigenste Anliegen der wikipedia nicht zu kennen. Wissen soll für jeden abrufbar aber auch einstellbar sein. Und wenn jemand nun kein englisch kann (und ja, davon gibt's einige, mit Sicherheit mehr als die kein Deutsch können - also zumindest was die für "Deutsch" halten ... ich schweife ab), dann hätte er in dieser deutschsprachigen wikipedia ein paar Probleme, Artikel zu schreiben ;-) axpdeHallo! 21:10, 27. Mai 2017 (CEST)
Man braucht gar kein Englisch zu können, um die (englische) Syntax der Wikipedia in Kürze erlernen zu können. HTML hat man auch nie mit <Kopf> statt <head> etc. eingedeutscht und trotzdem, denke ich, haben es viele mit bescheidenen oder keinen Englischkenntnissen erlernt :-). Die Wikisyntax ist eine technische Grundlage, bei der eine Übersetzung in unzählige Sprachen überhaupt keinen Sinn ergibt. Vielmehr wird durch Einheitlichkeit die Austauschbarkeit zwischen den Sprachversionen auch bei Übersetzungen erleichtert, oder wenn man als Nicht-Muttersprachler in einer anderen Wikipedia eine Kleinigkeit korrigieren will. Gestumblindi 21:34, 27. Mai 2017 (CEST)
Ich starr gerade die Fernsteuerung meines Fernsehers (Telefunken steht drauf) an. Das steht BACK drauf, aber wie ich damit Backen soll, ist mir unklar. Und EXIT ist mir auch unbekannt. Warum auf MENU keine Ü-Punkte sind, ist mir auch unklar. Und mit der Taste LANG. kann ich wohl das Bild länger machen. V+ und V- hab ich noch nicht geschnallt, aber irgendwie hab ich doch ein Bild hinbekommen. Nein! Es muss nicht alles Deutsch sein, in der Fernsehwerbung wird mit dem Begriff "fragrance" für irgendwelchen Mief geworben. Übrigens ein Wort das ich bis dahin nicht kannte, aber Fernsehen soll angeblich ja Bildung vermitteln. Ich find "Bild" und "Datei" jedenfalls doof, es erinnert mich an eine wunderbare Übersetzung eines wohl humanistisch sehr gebildeten Germanisten, der damals in den frühen 80er Jahren ein Computerhandbuch übersetzte und dabei Begriffe wie Kartei (Directory), Datei (File), Schreibmarkenanzeiger (Cursor) und noch so einige extensiv verwendete (sorry, ist ewig her, weiß nur noch das das ein franz. Produkt, Fa. Thomson war, jedenfalls kam DOS erst danach auf den Markt). Das Handbuch war beinahe unverständlich. --Wurgl (Diskussion) 21:50, 27. Mai 2017 (CEST)
Ich bin dagegen. Ich konvertiere bei Bearbeitungen bewußt die deutschen Bezeichnungen in englische, um es Nachnutzern aus anderen Sprachen einfacher zu machen, hiesige Bildeinbindungen in ihren Sprachversionen nachzunutzen. Habt ihr schonmal versucht, in der arabischen Wikipedia oder so eine lokalisierte Bildeinbindung zu finden? Diese Syntaxelement zu lokalisieren war die mit Abstand dümmste Maßnahme seit Beginn der Wikipedia.
Desweiteren, und da widerspreche ich mir gerne selbst, verwende ich Bild: bewußt bei der Einbindung von Lagekarten in der US-Ortsinfobox; das erleichtert mir gewisse Wartungsaufgaben und ich verbitte mir diesbezüglich eine Änderung auf Datei:. --Matthiasb – Blue ribbon.svg (CallMyCenter) 00:00, 28. Mai 2017 (CEST)
@FNDE: Darf ich mal fragen, wann so ungefähr "demnächst" ist? Ich hätte da auch so eine Sache mit dem Ausfüllen/Ergänzen eines Parameters bei der Vorlage Normdaten in den Biografie-Artikeln. Geht um ca. 17.000 Artikel (hochgerechnet von den ersten 500, kann also noch abweichen). Und ich hab erst ein Okay aus einem klitzekleinen Kreis (falls zwei Personen einen kreis bilden können), ich brauch also noch ein paar Tage bis es soweit ist. --Wurgl (Diskussion) 14:54, 28. Mai 2017 (CEST)
@Wurgl: ich schätze in den nächsten 2-3 Wochen wird es soweit sein, wir haben da auch schon beim Hackathon in Wien dran gearbeitet. Klingt interessant was du sagst, da bei diesem Botlauf (meines Wissens) auch viele Personenartikel dabei sind. Wenn es nicht "zu" kompliziert ist könnte man das also mit einbauen, der besagte Botlauf soll wie ich es verstanden habe aber möglichst bald losgehen, jedenfalls wünscht sich das WMDE, damit ein Feature in der Software freigeschaltet werden kann. Mehr dazu hier: Benutzer:Michael Schönitzer (WMDE)/Sortierschlüssel. Ich schlage vor, wir schauen einfach mal wie komplex das ist, im Zweifel können wir das auch als einzelnen Botlauf machen. Beste Grüße --FNDE 15:26, 28. Mai 2017 (CEST)
Ist recht trivial: Mache aus sowas:
{{Normdaten|TYP=p|GND=118972332|LCCN=n/93/4745|VIAF=85338005}}
das hier:
{{Normdaten|TYP=p|GND=118972332|LCCN=n/93/4745|NDL=00931823|VIAF=85338005}}
Du kannst davon ausgehen, dass diese Vorlage immer in einer Zeile ist (wenn nicht einfach auslassen) und diese Nummer NDL=00931823 ist natürlich bei jedem anders.
2-3 Wochen ist okay, da hab ich Zeit zum Diskutieren :-) --Wurgl (Diskussion) 15:40, 28. Mai 2017 (CEST)
@FNDE: Wie viel sonstige Korrektur ist geplant? Wir hätten da z. B. noch 35,000 Artikel und hunderte Kategorien mit "z.B. " oder "z.B.:". Manche dieser Listen sollten auch 100 % automatisch bearbeitbar sein. --mfb (Diskussion) 22:21, 31. Mai 2017 (CEST)

Zusätzliche Aufgaben[Quelltext bearbeiten]

mfb, ich sag mal so: es gibt die eine Hauptaufgabe (→ Sortierschlüssel anpassen) die mit Priorität behandelt wird. Wir haben dazu ein paar kleine Aufgaben hinzufügt, beispielsweise eindeutige Syntaxkorrekturen oder Ersetzungen. Ich könnte natürlich deine Liste mit den Job aufnehmen, allerdings sehe ich da 2 Probleme:

  1. das wird ziemlich unübersichtlich, wenn der Bot 20-30 verschiedene Aufgaben gleichzeitig ausführt. Niemand wird sich die Mühe machen das zu prüfen, ob er vllt. nicht doch einen Fehler gemacht hat. Meiner Meinung nach sollten die Edits für normale Nutzer nachvollziehbar sein, auch über die Zusammenfassungszeile.
  2. wir werden lediglich etwa 50.000 Artikel bearbeiten, das heißt, nicht jede zusätzliche Aufgabe wird dort Anwendung finden.

Ich habe inzwischen ein recht leistungsstarkes Framework. Wenn wir hier einen Konsens finden, dass ein Botlauf mit mehreren Syntaxkorrekturen, jeweils in einem Edit zusammengefasst, stattfinden darf, so können wir das gerne als eigenen Job planen. Beste Grüße --FNDE 22:48, 31. Mai 2017 (CEST)

Userscripte machen solche Korrekturen schon länger, aber die erreichen eben nur einen kleinen Teil der Artikel. Wenn User eine solche Bearbeitung machen dürfen, wieso sollte ein Bot das nicht dürfen? Editkommentar "x Syntax- und Formatierungsfehler korrigiert, siehe Liste" oder so. Ich finde das sogar besser als über Userscripte, denn dort werden oft inhaltliche Änderungen mit irrelevanten Syntaxänderungen gemischt, und wenn man die inhaltliche Änderung prüfen will, muss man die erst einmal suchen. Und 5 Syntaxdinge gleichzeitig zu ändern halte ich für sinnvoller als 5 getrennte Edits. Sollten eben wirklich eindeutige Sachen sein. --mfb (Diskussion) 23:18, 31. Mai 2017 (CEST)
Ich sehe das wie du. Man wird diese Korrekturen niemals abschließen können, wenn Autoren ihre Zeit dafür opfern müssen, um solche trivialen Änderungen vorzunehmen. Ich hatte mal irgendwo gelesen, dass reine Syntaxkorrekturen unterlassen werden sollen, wenn es keine zusätzliche inhaltliche Änderung gibt. Ich würde es persönlich nicht so schlimm finden, wenn man so eine Liste mal gezielt innerhalb von ein paar Wochen abarbeitet, zumal die Botedits ja ausgeblendet werden können in der Beo. Bin wie gesagt bereit und kann das schnell umsetzen, müsste hier nur dementsprechend "erlaubt" werden. Beste Grüße --FNDE 23:53, 31. Mai 2017 (CEST)

Wenn der Bot als Nebenaufgaben einige der hier schon ewig rumgammelnden Wünsche erledigt, wär das doch super. Machbar wären z. B. #Commons-Links, #Kleine_Formalkorrekturen, #Kommata entlinken, #Zweimal mini. 129.13.72.198 10:04, 2. Jun. 2017 (CEST)

Für's Protokoll noch einmal, da es oben offenbar übersehen wurde: Ich bin gegen die Ersetzung von "Bild:", nicht nur wegen des konkreten arbeitsökonomischen Vorteils bei der Einbindung von spezifischen Positionskarten, sondern schlichtweg, weil es nix bringt. Es ist egal und es wird bis zum Sanktnimmerleinstag egal sein, ob da Bild:, Image:, File: oder Datei: steht, das ist Softwaresyntax, die schon aus Gründen der Lesbarkeit von alten Artikelversionen nie entfernt werden wird. Also laßt es bleiben. --Matthiasb – Blue ribbon.svg (CallMyCenter) 23:06, 16. Jun. 2017 (CEST)
Bin mir nicht sicher, ob wir veraltete Syntax bis zum Sankt-Nimmerleinstag im Projekt haben wollen. Wenn man das einmal richtig angeht, kann die Einbindung per Bild: aus den Hilfeseiten, sodass keiner mehr auf die Idee kommt dies einzubinden. Es gibt insgesamt 4 verschiedene Bezeichnungen zur Einbindung, was an sich schon ziemlich unnötig ist, eine klare Linie wäre angebracht. Für Wartungsaufgaben sollte die alte Variante jedenfalls nicht zweckentfremdet werden, wie ich finde. --FNDE 23:22, 16. Jun. 2017 (CEST)
ob wir veraltete Syntax bis zum Sankt-Nimmerleinstag im Projekt haben wollen – das zumindest war die Aussage von Brion Vibber, als diesbezüglich Bedenken geäußert wurden, als damals die Enscheidung fiel, die Bilddaten von Image: nach File: zu verschieben. --Matthiasb – Blue ribbon.svg (CallMyCenter) 23:41, 19. Jun. 2017 (CEST)
Wir werden hier sicher nicht Bild oder ähnliches ersetzen, aber davon abgesehen gibt es noch genügend zu tun, siehe meine obigen Links. 129.13.72.197 13:09, 23. Jun. 2017 (CEST)

Umstellung der Gemeindeartikel in Brasilien auf bessere Infobox[Quelltext bearbeiten]

Hallo,

im Portal:Brasilien haben wir uns auf eine Umstellung der Infobox der Ortsartikel von {{Infobox Stadt in Lateinamerika}} auf {{Infobox Ort in Brasilien}} verständigt (siehe Portal_Diskussion:Brasilien#Umstellung_der_Gemeindeartikel_auf_bessere_Infobox). Aktuell geht es um ca. 570 Artikel.

Dazu müssten einige Parameter umbenannt werden, aber die bestehenden Werte können nahezu eins-zu-eins übernommen werden. Die Umsetzung der Parameter ist hier beschrieben: Benutzer:Emeritus/BRA/Umsetzung_Infobox#Stadt_in_Lateinamerika.

Falls noch Infos benötigt werden, bitte anpingen.

Grüße --MB-one (Diskussion) 20:04, 28. Jun. 2017 (CEST)

Ich würde mich da ransetzen wenn niemand was dagegen hat. Gruß -- Quotengrote (D|B) 20:26, 28. Jun. 2017 (CEST)
@MB-one: Warum darf bei Fläche der Wert nicht übernommen werden, oder geht es da nur um die Einheit? -- Quotengrote (D|B) 20:32, 28. Jun. 2017 (CEST)
@Quotengrote: Erstmal danke für deinen Einsatz. Es geht tatsächlich nur um die Einheit, weil die von der Infobox fix vorgegeben ist. Der Wert soll bitte übernommen werden. Grüße --MB-one (Diskussion) 09:13, 29. Jun. 2017 (CEST)
Ok, dann werde ich mich heute Abend oder morgen früh dran setzen. -- Quotengrote (D|B) 10:23, 29. Jun. 2017 (CEST)
Schön, die ersten Umsetzungen sind eingetroffen, sieht 1:1 aus. Was ich bei den Vorgedanken zur Umsetzung nicht erwähnt hatte, war, dass neben der Umsetzung einzelner Parameternamen auch die gesamte sonstige Vorlage eingespielt wird. Ich sah das als Selbstverständlichkeit an, weil die Vorteile der neuen Infobox nur dann tragfähig sind und mir bei der Überarbeitung der alten Artikel helfen, wenn auch die leeren (nicht in Stadt in Lateinamerika vorkommenden) zusätzlichen Parameter mit eingefügt werden. So ist es nur eine intern sichtbare Kosmetik, bei der zu jedem Ort manuell die einzelnen Parameter, als Beispiel hier zum Gemeindecode oder den Regionen oder den Wirtschaftsdaten (BIP, HDI) etc., via copy/paste einzeln herübergezogen werden müssen, statt die neue Vorlage als neues Formular verwenden zu können. - Somit wäre m.M.n. ein zweiter Bot-Lauf nur für die heute vom Botlauf Betroffenen notwendig, da die Vorlage:Infobox Ort in Brasilien nicht vollständig übernommen ist. Oder? --Emeritus (Diskussion) 20:05, 29. Jun. 2017 (CEST)
Nur zur Sicherheit: du willst also alle Parameter die bei Vorlage:Infobox Ort in Brasilien in der "Langvariante" vorkommen mit in den Artikeln haben auch wenn dann kein Wert zugewiesen wird? Gruß -- Quotengrote (D|B) 00:03, 30. Jun. 2017 (CEST)
Wenn der Bot nochmals läuft, dann prüfe vielleicht ob noch so ein Hoppala wie in Wikipedia:Fragen_zur_Wikipedia#Infobox_Wappengr.C3.B6.C3.9Fe passiert ist. Ein paar hab ich stichprobenartig (uas reiner Neugierde) angestarrt, aber die waren okay. --Wurgl (Diskussion) 00:06, 30. Jun. 2017 (CEST)
Ja, echte Umstellung auf eine andere Infobox, vgl. die alte Fassung mit der teilüberarbeiteten Fassung Ewbank da Câmara. Überarbeitung der alten Artikel funktioniert in der Art, dass ich aus dem fast parallelen Template:Info/Município do Brasil der pt:WP die aktuelleren Angaben aus pt:Ewbank da Câmara übertragen kann, wenn auch die leeren Parameter vorliegen. - Bisher war die Infobox:Stadt in Lateinamerika nur ein Ersatz für den Veraltet-Baustein; bei dem bisherigen manuellen Austausch hatte ich dann immer die Langvariante eingespielt und neu ausgefüllt. - Die leeren, noch ohne zugewiesenem Wert, bleiben nicht immer leer, weil sämtliche Orte ja weiter systematisch bearbeitet werden. - Ansonsten wäre es nur eine reine Namensänderung der Infobox, was keine großen Sinn machen würde. --Emeritus (Diskussion) 06:24, 30. Jun. 2017 (CEST)
Nachtrag: @Quotengrote: Die "Befüllung" der Infobox in drei Stufen (IB Lateinamerika --> IB Brasilien --> dann neue Befüllung) kannst Du am Beispiel Ivoti sehen, da hattest Du ja den Belege-Baustein eingefügt, hier wäre die Langform also arbeitssparend gewesen. --Emeritus (Diskussion) 08:57, 30. Jun. 2017 (CEST)
Ok, jetzt hab ich es verstanden, leider kann mein Bot das noch nicht, ich habe bis jetzt erstmal nur suchen/ersetzen implementiert. Da müsste vllt jemand anders ran, oder das dauert noch. Gruß -- Quotengrote (D|B) 10:19, 30. Jun. 2017 (CEST)

CopperBot[Quelltext bearbeiten]

Benutzer:CopperBot steht seit April. Weiß man, wo es hakt? Kann ein anderer Bot die Aufgabe des Nachsignierens übernehmen? --тнояsтеn 15:08, 7. Jul. 2017 (CEST)

Ich vermute, das hat was mit dem RC-Stream zu tun, der wurde am 7. Juli abgeschaltet. Der Betreiber ist ja schon seit 2012 inaktiv, konnte der Bot SO lange unbeaufsichtigt laufen? --FNDE 15:40, 7. Jul. 2017 (CEST)
тнояsтеn, Gerade mal nachgeschaut: der Bot nutzt tatsächlich den RC-Stream, aber die Inaktivität deckt sich genau mit der Abschaltung. Ich könnte die Aufgabe übernehmen, wenn mich ein Admin auf Tool Labs als Maintainer einträgt, sodass ich den Code sehen kann. Der Bot ist in Python geschrieben, eben so wie der von mir betriebene. --FNDE 15:47, 7. Jul. 2017 (CEST)
Ich habe dem Beitreiber mal eine Mail geschrieben. Das ist der Grund, warum der Bot noch läuft, trotz Breaking Changes vor zwei Jahren: Nicht jeder, der inaktiv scheint ist es. Mal schauen, obs eine Antwort gibt. Viele Grüße, Luke081515 15:56, 7. Jul. 2017 (CEST)
Danke Luke, dann warten wir mal ab, was er sagt. --FNDE 14:31, 10. Jul. 2017 (CEST)
@Luke081515: Gab es schon eine Antwort? -- Quotengrote (D|B) 16:26, 25. Aug. 2017 (CEST)
Nein, gab es leider nicht. Luke081515 17:35, 25. Aug. 2017 (CEST)

Auf Commons gibts den c:User:SignBot. --тнояsтеn 07:52, 8. Aug. 2017 (CEST)

Link zum SignBot Quellcode ist hier: c:User_talk:Zhuyifei1999/Archive_28#SignBot_on_swedish_wiki.3F. --Count² (Diskussion) 17:37, 19. Sep. 2017 (CEST)

@FNDE: Bist Du hier noch dran?--Mabschaaf 23:41, 6. Nov. 2017 (CET)

Hey Mabschaaf, aktuell gerade nicht, habe gerade im RL einiges zu tun. Wie versprochen würde ich mich der Sache annehmen (falls sich niemand findet der sofort einspringt), aber realistisch erst zum Ende des Jahres damit anfangen. --FNDE 13:03, 12. Nov. 2017 (CET)
@FNDE: Wie ist der Status? Viele Grüße, Luke081515 23:06, 10. Feb. 2018 (CET)
Doc Taxon scheint sich gerade darum zu kümmern. [3] --Count² (Diskussion) 21:02, 15. Feb. 2018 (CET)

ja, genau, bin schon dran – Doc TaxonDisk.WikiMUCWikiliebe?! 21:34, 16. Feb. 2018 (CET)

@Doc Taxon: Darf man mal nach dem Stand der Dinge fragen?--Mabschaaf 18:35, 11. Jul. 2018 (CEST)

Vorlage:Hauptseite Aktuelles[Quelltext bearbeiten]

Liebe KollegInnen,

in der Frage ob Vorlage:Hauptseite Aktuelles in der Vergangenheit zu viel Sport-Themen präsentiert hat (s. Vorlage Diskussion:Hauptseite Aktuelles#„Sport-Wikipedia“), wollte ich nachfragen, ob es nicht eine Möglichkeit gibt, die neu ergänzten Artikel pro Edit (Berichtszeit: Jan–Jun 2017) für die Vorlage automatisiert herauszuziehen und vielleicht monatlich für weitere Auswertungen in eine Excel-Datei o. ä. zu sammeln (rein stilistische oder Rechtschreibkorrekturen sollten nicht mit aufgenommen werden). Bis jetzt habe ich das händisch gemacht, es ist aber ein großer zeitlicher Aufwand und ich bin erst mit dem Januar 2017 durch. Frage ist auch, ob man z. B. eine Statistik der Verweildauer jedes Artikels kreieren könnte, wie in der Diskussion von Happolati gefordert (manuell ist das zu aufwendig und wahrscheinlich auch fehleranfällig). Danke im Voraus und viele Grüße, --César (Diskussion) 10:06, 11. Jul. 2017 (CEST)

Hi César, versteh ich das richtig: soll die Vorlage:Hauptseite Aktuelles daraufhin untersucht werden, wie lange eine Nachrichtenzeile jeweils in der Vorlage besteht? Sortierung nach Sportthemen dürfte kompliziert sein für einen Algorithmus, reicht euch daher die einfache Auflistung der jeweiligen Themen mit der dazugehörigen Verweildauer? CC: Benutzer:Happolati --FNDE 15:46, 11. Jul. 2017 (CEST)
Hi und danke fürs CC. Ich habe technisch nicht viel Ahnung davon, was möglich ist, aber eine Auflistung der Themen/Stichwörter/Links mit der längsten Verweildauer auf der HS wäre für unsere Diskussion interessant. Danke für deine Mühe! Gruß --Happolati (Diskussion) 18:02, 11. Jul. 2017 (CEST)
Hallo FNDE,
das wäre toll. Könnte man so etwas monatlich für Januar bis Juni 2017 machen, für Stichwörter und Textmeldungen? Und vielleicht nochmal zusammengerechnet für das Halbjahr? Viele Grüße, --César (Diskussion) 19:30, 11. Jul. 2017 (CEST)
Hallo FNDE,
ich wollte mal nachfragen, ob sich schon absehen lässt, ob du solche Listen bereitstellen könntest. Oder müsste das doch händisch gemacht werden? Viele Grüße, --César (Diskussion) 10:41, 23. Jul. 2017 (CEST)
Hey César, ich würde mich mal die Woche da ran setzen. Aber nochmal eine Nachfrage: werden die einzelnen Zeilen nicht ohnehin jeden Tag ausgetauscht? Wenn dem so ist, hat jedes Stichwort doch eine "Maximallaufzeit" von einem Tag. Wie gesagt, automatisch nach Themen zu unterscheiden ist schwierig. Beste Grüße -- FNDE 18:27, 23. Jul. 2017 (CEST)
Moin. Das kann man nicht so pauschal sagen, FNDE. Es ist sehr unterschiedlich – je nachdem, ob aktualisierte Artikel vorliegen. Mal bleibt eine Textmeldung oder Stichwort mehrere Tage stehen, mal ein paar Stunden. Grüße, --César (Diskussion) 08:18, 24. Jul. 2017 (CEST)
César, ich würde das dann wie folgt machen: wir gehen jede einzelne Version durch, berücksichtigt werden nur die Stichwörter bzw. deren Linkziel. Wenn dann der Beschreibungstext eines Links geändert wird bleibt die Zählung weiterhin aktiv, nur beim kompletten Austausch des Links wird dann die Zeit unterbrochen. Wäre das so in eurem Sinne? Beste Grüße --FNDE 13:47, 24. Jul. 2017 (CEST)
Ich denke, das würde passen. Probiere mal Dein Glück mit Januar bis Juni 2017. Ich habe für den Januar schon eine separate Liste händisch erstellt gehabt, die ich zur Überprüfung nutzen könnte. --César (Diskussion) 14:01, 24. Jul. 2017 (CEST)

Umstellung von Archivlinks auf Vorlage:Webarchiv[Quelltext bearbeiten]

Boshomi und Aka haben früher jeweils archive.org-Links auf Vorlage:Webarchiv umgestellt. Das ist nicht mehr der Fall. Mag diese Aufgabe vielleicht ein Botbetreiber übernehmen? --Leyo 17:09, 9. Aug. 2017 (CEST)

Weiterführender Vorschlag:
* Entweder auf {{Internetquelle}} umstellen unter Nutzung des dortigen Parameter "archiv-url" ...
* ... oder gleich die Funktionalität von {{Webarchiv}} in die {{Internetquelle}} einbauen!
Gruß axpde Hallo! 22:07, 9. Aug. 2017 (CEST)
@Leyo: Vermutlich gehts dabei um eine fortlaufende Prüfung/Ersetzung? Kannst du einen Suchstring vorgeben worum es konkret geht? Schöne Grüße --FNDE 00:39, 10. Aug. 2017 (CEST)
Ja, plus die aufgelaufenen „Altlasten“. Mittels insource:/http\:\/\/web\.archive\.org\/web\/[0-9]{14}\/http/ sollte man die entsprechenden Artikel finden, aber es hat Falsch-Positive darunter. Boshomi und Aka haben allenfalls eine ausgefeiltere Methode. --Leyo 01:05, 10. Aug. 2017 (CEST)
Die Umsetzung stammt von User:TMg das Skript ist Benutzer:TMg/weblinkChecker.js, ich selbst verwende dieses Skript mit geringfügiger Abweichung: Benutzer:Boshomi/externalURLform.jsfix. Eingebunden habe das hier: M:User:Boshomi/global.js, allerdings funktioniert die Einbindung seit einer Softwareumstellung nicht mehr. Da ich demnächst wirklich wieder Zeit für Wikipedia haben werde, wäre ich über jede Hilfe sehr dankbar, die das Skript wieder lauffähig macht. Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!  18:19, 11. Aug. 2017 (CEST)
@Leyo: es geht dabei ja um die nackten Links so wie ich das verstanden habe, also eher so hier? insource:/\[http\:\/\/web\.archive\.org\/web\/[0-9]{14}\/http/ (mit eckiger Klammer am Anfang). Schönen Gruß -- FNDE 18:48, 11. Aug. 2017 (CEST)
Primär um diese, aber IMHO nicht ausschliesslich. Diffs für andere Beispiele habe ich leider nicht auf Anhieb gefunden. --Leyo 19:14, 11. Aug. 2017 (CEST)
Besser als cirrus ist hier die Giftbot Weblinksuche:
Die relevanten Links sind:
 Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!  19:24, 12. Aug. 2017 (CEST)

@Boshomi: @Aka: @Leyo: @Axpde: @FNDE: @TMg: Das Problem besteht nun seit einem Jahr. Ist eine Lösung in Sicht? --89.144.202.120 21:04, 9. Aug. 2018 (CEST)

Gesetze-im-Internet.de: Links durch Vorlage ersetzen[Quelltext bearbeiten]

Hallo, vorhin habe ich mit dem AutoWikiBrowser (AWB) mehrere Links von HTTP zu HTTPS geändert, siehe dazu auch Hilfe:Verschlüsselte Verbindung. Es ging um den Link "http://www.gesetze-im-internet.de", welchen ich durch "https://www.gesetze-im-internet.de" ersetzt habe. Ich wurde darauf aufmerksam gemacht (siehe hier), dass ich doch auch gleich die Vorlagen Vorlage:§, Vorlage:§§ sowie Vorlage:Art. einbinden könnte.

Diese Automatisierung ist mit AWB allerdings nicht so einfach umsetzen. Aus diesem Grund wollte ich fragen, ob hier jemand diese Aufgabe automatisieren könnte. Das wäre eine große Hilfe! Vielen Dank und beste Grüße, --Soluvo (Diskussion) 21:35, 16. Aug. 2017 (CEST)

Ob AWB oder Bot, auf das richtige Regex kommt es an. --Leyo 12:40, 13. Sep. 2017 (CEST)
Ja, das stimmt natürlich. --Soluvo (Diskussion) 21:03, 18. Sep. 2017 (CEST)

@Soluvo: @Leyo: Das Problem besteht nun seit einem Jahr. Ist eine Lösung in Sicht? --213.225.32.77 21:20, 16. Aug. 2018 (CEST)

Vielleicht kann Volljurhorst etwas dazu sagen. --Leyo 23:01, 16. Aug. 2018 (CEST)
(Seit geraumer Zeit ersetze ich Fundstellenangaben durch Vorlagen, dabei setze ich bisweilen auch die Vorlage:§ etc. ein. Meine lange Liste ist nun auf 12 Seiten geschrumpft. Bin also bald damit fertig.) Ich widme mich dem gleich und bitte um Nachsicht, dass es so lange gedauert hat. --Volljurhorst (Diskussion) 14:57, 20. Aug. 2018 (CEST)
Ich muss noch hinzufügen, dass das nur halbautomatisch geht. An manchen Stellen, wo solche Links auftauchen, ist der Artikel auch zu überarbeiten. Es ist zum Beispiel nicht hilfreich, einen Link auf das gesamte Gesetz zu setzen (durch Vorlage), wenn sich aus den Umständen ergibt, welche einzelne Regelung gemeint ist. Auch gibt es Stellen, wo im Text bereits die Vorlage:§ verwendet wird und noch eine zusätzliche ref auf das gesamte Gesetz existiert, sowas lösche ich dann gleich ganz raus. Es wird also seine Zeit brauchen, dient aber gleichzeitig der Vereinheitlichung. --Volljurhorst (Diskussion) 16:52, 20. Aug. 2018 (CEST)
Ich kann @Volljurhorst nur zustimmen, dass die Änderungen höchstens halbautomatisch und tendenziell eher manuell durchgeführt werden sollten. Teilweise habe ich auch ein paar Links auf Gesetze-im-Internet.de durch die Vorlage:§ ersetzt, allerdings auch nur manuell. --Soluvo (Diskussion) 20:13, 21. Aug. 2018 (CEST)
Vielleicht kann man die Treffer (insource:/www\.gesetze-im-internet\.de/) so in Gruppen einteilen, dass die halbautomatische Abarbeitung effizient erfolgen kann. --Leyo 09:44, 22. Aug. 2018 (CEST)
Genau, es gibt mehrere Seiten, die ohne nötigen Eingriff durchs erledigende Skript fallen und dann fast so viele Gruppen wie Seiten, bei denen der Artikel anschließend inhaltlich verbessert werden muss (manuell). --Volljurhorst (Diskussion) 16:49, 27. Aug. 2018 (CEST)

AsuraBot und DrTrigonBot funktionieren nicht mehr[Quelltext bearbeiten]

i Info: Im folgenden Abschnitt geht es nur um die Subster-Funktion der o.g. Bots, siehe Benutzer:DrTrigonBot/Doku#SubsterBot.

Hallo!

Benutzer:Emha hat im Mai 2015 hier Benutzer:sitic gefragt ob ihm die Fehlermeldungen von AsuraBot auf Benutzer:Emha/NBHessen und Wikipedia:WikiProjekt Umgang mit bezahltem Schreiben/Neueverifizierte aufgefallen sind. Benutzer:sitic wollte sich um die Fehlerbehebung kümmern. Leider ist Benutzer:sitic nicht mehr aktiv.

Er hatte diese Aufgabe ("Subster"), also definierte Inhalte von A nach B zu schreiben - Dokumentation auf Benutzer:DrTrigonBot/Doku#SubsterBot - von dem von Benutzer:DrTrigon betriebenen DrTrigonBot übernommen, der ebenfalls nicht mehr funktioniert. Könnte ein anderer Botbetreiber den Fehler beheben? --Thomas Obermair 4 (Diskussion) 00:52, 1. Sep. 2017 (CEST) (ergänzt durch --emha db 01:39, 1. Sep. 2017 (CEST))

Vergleiche zum Ausfall dieser Bots auch Wikipedia:Bots/Anfragen/Archiv/2016-2#SumDisc_-_denn_Benutzer:DrTrigonBot_und_Benutzer:AsuraBot_machen.27s_nicht_mehr --Zulu55 (Diskussion) Unwissen 10:34, 13. Sep. 2017 (CEST)
Das bezieht sich zum Schluss jedoch nicht mehr auf die Subster-Funktion, sondern auf die SumDisc-Funktion. Diese wird inzwischen von Benutzer:FNDE als Benutzer:FNDE/secWatch angeboten.
Subster hat jedoch keine/n Ersatz-Betreiber/in gefunden. Viele Grüße, --emha db 15:26, 13. Sep. 2017 (CEST)
Danke emha für diese Klarstellungen. Genau so ist es. --Zulu55 (Diskussion) Unwissen 13:31, 18. Sep. 2017 (CEST)

@Thomas Obermair 4: @Emha: wie lange funktionieren denn AsuraBot und DrTrigonBot schon nicht mehr? Ersterer war zumindest heute wieder aktiv, auch was sumDisc betrifft. – Doc TaxonDisk.WikiMUCWikiliebe?! 23:22, 15. Sep. 2017 (CEST)

Das funktioniert nicht, nachzulesen unter H:Ping. 94.218.183.103 19:42, 17. Sep. 2017 (CEST)
Subster und sumdisc könnte ich betreiben, ich habe den Quellcode.  @xqt 12:46, 18. Sep. 2017 (CEST)
Sumdisc wird in einer verbesserten Variante von Benutzer:FNDE betrieben (siehe oben). --Zulu55 (Diskussion) Unwissen 13:00, 18. Sep. 2017 (CEST)
Doc Taxon: es geht nur um die Subster-Funktion.
xqt: das wäre großartig! --emha db 13:49, 18. Sep. 2017 (CEST)
Dauert noch etwas, bin noch unterwegs.  @xqt 12:18, 21. Sep. 2017 (CEST)
Sehe gerade: user:AsuraBot ist doch aktiv. Was bleibt zu tun?  @xqt 17:12, 3. Okt. 2017 (CEST)
Natürlich ist der Bot aktiv, aber für den hier in Rede stehenden Job "Subster" schreibt er nur Errormeldungen Gruß, --emha db 11:05, 4. Okt. 2017 (CEST)
Timeoutfehler. Ich lasse mal meine Version laufen, hatte gestern schon die ersten Gehversuche. Mal sehen ob ich Kontakt zur Gegenstelle habe.  @xqt 12:57, 4. Okt. 2017 (CEST)
"Nur Errormeldungen" stimmt ja so auch nicht, siehe [4] um nur 1 Beispiel herauszugreifen. Gibt es denn eine Systematik im Versagen?  @xqt 13:42, 5. Okt. 2017 (CEST)
@Xqt: Unmaintenanced Bots werden üblicherweise doch gesperrt. Ich hab es die letzten Jahre öfter schon probiert, den Bot owner zu kontakten, aber kein Erfolg. Es ist ja schließlich nicht das erste Mal, dass der Bot nicht richtig oder gar nicht funktioniert. – Doc TaxonDisk.WikiMUCWikiliebe?! 03:03, 6. Okt. 2017 (CEST)

@Emha: @Zulu55: @Doc Taxon: @Xqt: --178.191.125.61 20:05, 3. Dez. 2017 (CET)

Logbuch: https://tools.wmflabs.org/asurabot/drtrigonbot/

Auszug von https://tools.wmflabs.org/asurabot/drtrigonbot/pwb.py-subster-lang%3afrr.log

2017-12-03 07:36:07 wikipedia.py, 10018 in writelogheader: INFO COMMAND: ['pwb.py', '-subster', '-lang:frr']

2017-12-03 07:36:08 wikipedia.py, 10027 in writelogheader: ERROR ParseError

Kann jemand sagen, warum der Bot (läuft prinzipiell, Betreiber Benutzer:sitic inaktiv) die Seite Portal:Berge und Gebirge/Aktuelle Diskussionen nicht mehr bearbeitet? --тнояsтеn 09:46, 5. Jan. 2018 (CET)

Leider nein, aber das gesamte Subster-Zeug scheint seit Mitte Dezember nicht mehr ordnungsgemäß zu laufen, auch in anderen Portalen. Leider ist auch DrTrigon derzeit inaktiv. --Magnus (Diskussion) 10:00, 5. Jan. 2018 (CET)
Benutzer:Doc Taxon, kann das dein Benutzer:TaxonBota übernehmen? --тнояsтеn 10:25, 5. Jan. 2018 (CET)
@Thgoiter: Ja, ich müsste erst mal kurz studieren, was der Bot da macht. Sieht aber simpel aus. – Doc TaxonDisk.WikiMUCWikiliebe?! 14:10, 5. Jan. 2018 (CET)
Dieser Botauftrag wird gerade von TaxonBota (Beiträge) bearbeitet. Um Konflikte zu vermeiden, warte bitte mit anderen Aktionen, bis diese Markierung entfernt ist, oder kontaktiere den Betreiber (Diskussion).

@Doc Taxon: Erledigt? --192.164.119.165 22:15, 16. Mär. 2018 (CET)

das geht nicht so schnell – Doc TaxonDisk.WikiMUCWikiliebe?! 19:02, 17. Mär. 2018 (CET)

@Emha: @Sitic: @DrTrigon: @DrTrigonBot: @Thomas Obermair 4: @Zulu55: @FNDE: @Doc Taxon: @Xqt: @Thgoiter: @Tsungam: @TaxonBota: Das Problem besteht nun seit einem Jahr. Ist eine Lösung in Sicht? --89.144.207.139 15:38, 1. Sep. 2018 (CEST)

Was soll dieser IP-Erledigt?-Quatsch eigentlich dauernd. So lange, wie das auf dieser Seite steht, ist das auch in Arbeit. Drängelt doch nicht immer so, einiges ist wirklich nicht unbedingt so trivial, ich seh aber schon ein Ziel, lang dauert's nicht mehr. – Doc TaxonDisk.Wikiliebe?! 16:12, 1. Sep. 2018 (CEST)

Hurrikankarten , laufende Aktualisierung[Quelltext bearbeiten]

Hallo. Könnte mal jemand einen Bot abrichten der die Versionen dieser laufend aktualisierten Karte automatisch auf commons holt? Allerdings idealerweise in ihren Einzelversionen, wobei ein generischer Name als REDIRECT auf die jeweils neueste Datei zu biegen wäre. --Quetsch mich aus, ... itu (Disk) 00:21, 19. Sep. 2017 (CEST)

@Itu: da die Datei auf Commons ist, ist das erledigt, oder? – Doc TaxonDisk.WikiMUCWikiliebe?! 03:00, 6. Okt. 2017 (CEST)
Erledigt ist dieser konkrete Fall weil sich dieser Hurrikan mittlerweile in Luft aufgelöst hat. Erledigt ist allgemein aber nichts weil ..zig analoge Dateiserien ebenfalls darauf warten automatisch auf commons geladen zu werden. --Quetsch mich aus, ... itu (Disk) 10:00, 7. Okt. 2017 (CEST)
@Itu: Welche wären dies denn? -- Freddy2001 DISK 12:57, 7. Okt. 2017 (CEST)
Na in diesem Fall wären es alle anderen Hurrikan für die nach gleichem Schema Karten produziert werden.
Klarerweise sind Ereignisse mit WP-Artikeln besonders vordringlich, siehe auch meine Anfrage weiter oben.
Man sollte zumindest einen Knopf bereitstellen auf den jeder beliebige Benutzer drücken kann, damit die Seiten/URLs von einem Bot gepollt werden und zeitnah, automatisch und systematisch und frei von Fehlern wie sie bei manueller Mühsal auftreten, nach commons hochgeladen werden. --Quetsch mich aus, ... itu (Disk) 21:31, 7. Okt. 2017 (CEST)
Also konkret ist bei den Hurrikans die Metaseite http://www.nhc.noaa.gov/ und von dieser Seite http://www.nhc.noaa.gov/graphics_at1.shtml?cone#contents aus kann sich der Bot die Diagramme für den jetzt aktuellen Hurrikan dann jeweils recht leicht rausziehen. Wobei der startende Benutzer diese URL erstmal auch dem Bot übergeben kann.
Ich kann übrigens sehr gerne die Parserei übernehmen (in shellskript, was anderes kann ich jetzt leider nicht), nur das Interface zum automatisierten Hochladen müsste jemand anderes übernehmen, das weiss ich leider nicht wie das geht bzw. habe mich dahin noch nicht durchgekämpft. --Quetsch mich aus, ... itu (Disk) 21:56, 7. Okt. 2017 (CEST)

@Itu: @Doc Taxon: @Freddy2001: Das Problem besteht nun seit einem Jahr. Ist eine Lösung in Sicht? --89.144.197.251 18:03, 19. Sep. 2018 (CEST)

@Itu: @Doc Taxon: @Freddy2001: Am besten jemand mit sehr guten Englischkenntnissen stellt die Anfrage auf Commons. https://commons.wikimedia.org/wiki/Commons:Bots/Work_requests --89.144.200.182 20:48, 24. Sep. 2018 (CEST)

Hatte ich bereits getan (in Bezug auf die Erdbebenkarten). Und was die dort mit dem radius gradient meinen, da hab ich nicht die mindeste Ahnung. --Quetsch mich aus, ... itu (Disk) 21:38, 24. Sep. 2018 (CEST)

Auswertung Vorlagenparameter[Quelltext bearbeiten]

Hallo! Könnte mir jemand alle Artikel listen, in denen in {{Charteintrag}} der Parameter Farbe auf irgendetwas anderes als 1 gesetzt wurde (inklusive leer)? Nach der jüngsten Lua-Umstellung könnten die Fälle Probleme machen … –XanonymusX (Diskussion) 23:32, 19. Okt. 2017 (CEST)

13 Treffer, sollten alle sein. --mfb (Diskussion) 00:42, 20. Okt. 2017 (CEST)
Ah, danke, dachte schon, dass es vielleicht auch ohne Bot geht!--XanonymusX (Diskussion) 00:52, 20. Okt. 2017 (CEST)
Bei Vorlagenparametern kannst mich auch (direkt) fragen. Ich muss halt SQL tippen. Die 13 passen übrigens. 912 Einbindungen mit dem Parameter Farbe sind es insgesamt. --Wurgl (Diskussion) 01:14, 20. Okt. 2017 (CEST)
Okay, gut zu wissen! :) Wird vielleicht wieder relevant, wenn die Farbgebung nächstes Jahr dann über TemplateStyles passiert …–XanonymusX (Diskussion) 01:45, 20. Okt. 2017 (CEST)
@Wurgl: wie fragst Du Vorlagenparameter mit SQL ab? – Doc TaxonDisk.WikiMUCWikiliebe?! 07:55, 20. Okt. 2017 (CEST)
Altes Erbstück von Apper. Da werden einfach alle Vorlagen geparst und zerdröselt in eine private Datenbank geschrieben. Okay, nicht ganz alle. Nur die im ANR. --Wurgl (Diskussion) 09:12, 20. Okt. 2017 (CEST)
@Wurgl: wie aktuell wird die gehalten? – Doc TaxonDisk.WikiMUCWikiliebe?! 10:00, 20. Okt. 2017 (CEST)
10 Minuten plus ein paar zerquetschte an Laufzeit vom Script. So oft wird der cronjob gestartet. Auch Erbstück (nur bei gelöschten und verschobenen kann es schon mal 2-3 Tage dauern bis die wieder draußen sind). --Wurgl (Diskussion) 10:18, 20. Okt. 2017 (CEST)
@Wurgl: Ist die DB auch für andere zugänglich? – Giftpflanze 00:23, 17. Jan. 2018 (CET)
Es gibt kein Web- oder anderes Interface. Ich müsste da was basteln, aber das ist hart an der Grenze meines Könnens. Ich hab ganz einfach noch nie viel mit Webinterfaces gemacht, vorhandenes Anpassen ist kein Problem, aber von 0 auf 100 … uaaahhhhh! Auf freundliche Anfrage hin kann ich was auswerten. Hab ich auch bei Septembermorgen mit den franz. Gemeinden gemacht. --Wurgl (Diskussion) 00:35, 17. Jan. 2018 (CET)
Naja, ein Webinterface brauchts nicht, sondern einen Direktzugriff auf die DB. Liegt sie auf Tool Labs/Toolforge? – Giftpflanze 00:44, 17. Jan. 2018 (CET)
Jupp! s51412__data nennt sich die Datenbank. Keine Ahnung wer da Zugriff hat, ist eben Erbstück. dewiki_templatedata und dewiki_templatedata_pages sind die beiden interessanten Tabellen. Ich wanke jetzt aber Richtung Furzkuhle, weitere Antworten gibts als erst nach dem Kaffee :-) --Wurgl (Diskussion) 00:55, 17. Jan. 2018 (CET)
Danke, das ist klasse. Ich habe sie auf der tools-DB gefunden. Nur kann ich auf die Tabellen nicht zugreifen, aber ein grant select, show view on `s51412__data`.* to '%'@'%'; soll das wohl beheben (bzw. ein Umbenennen der DB in s51412__data_p, aber das könnte sich schwieriger gestalten). – Giftpflanze 01:12, 17. Jan. 2018 (CET)
ERROR 1410 (42000): You are not allowed to create a user with GRANT Sogar die Grant-Syntax nachgelesen (braucht man ja sooooo oft), kommt immer die selbe Meldung. Das Ding in _p oder so umwandeln … die Datenbank ist sehr groß, so groß dass die kein Backup/keinen Dump davon machen … also das wird wohl nichts. --Wurgl (Diskussion) 08:06, 17. Jan. 2018 (CET)
GRANT ALL PRIVILEGES ON `s51412__%`.* TO 's51412'@'%' WITH GRANT OPTION Das kommt bei show grants; raus. Die weiteren Zeilen beziehen sich dann auf andere Elemente anderer Datenbanken. Ich sollte also dürfen, eigentlich. Hmm. --Wurgl (Diskussion) 08:32, 17. Jan. 2018 (CET)

@XanonymusX: @Mfb: @Wurgl: @Doc Taxon: @Giftpflanze: Das Problem besteht nun seit einem Jahr. Ist eine Lösung in Sicht? --213.225.4.183 22:50, 19. Okt. 2018 (CEST)

PNG-Fotos[Quelltext bearbeiten]

Mit Schrecken habe ich festgestellt, dass etliche PNG-Fotos in Artikel eingebunden sind, beispielsweise hastemplate:Infobox_Fußballspieler insource:/bildname *=.{3,30}\.(png|PNG)/. Aufgrund der mangelhaften Thumb-Qualität (Schärfe) sollten diese ins JPEG-Format konvertiert werden.
Kann jemand aus obigen Treffern eine Tabelle mit folgenden Spalten erstellen:

  • Artikel
  • Bild (eingebunden)
  • Commons-Kategorie (falls vorhanden; zur Überprüfung auf bessere Alternativbilder)

--Leyo 19:07, 3. Dez. 2017 (CET)

JPEG-Bilder haben doch eine geringere Schärfe als unkomprimierte PNG-Bilder (bei gleicher Pixelzahl). --FriedhelmW (Diskussion) 19:52, 3. Dez. 2017 (CET)
On Wikipedia, PNG thumbnails are not sharpened, but JPEG thumbnails are. For more complicated images, such a photographs, engravings, and such, PNG displays an inferior thumbnail. --Leyo 20:30, 3. Dez. 2017 (CET)
Danke für den Link. Trotzdem gefallen mir PNG-Thumbnails besser als gleichgroße JPEGs mit den Artefakten an Kanten. Gruß --FriedhelmW (Diskussion) 21:08, 3. Dez. 2017 (CET)
Schau dir doch beispielsweise das Thumbnail in Hernán Crespo an und vergleiche es mit Datei:Hernán Crespo.png. Aber bei dieser Anfrage geht's mir um die genannte Tabelle, nicht um Überzeugungsarbeit. ;-) --Leyo 21:16, 3. Dez. 2017 (CET)

Steinzeit-Tabellen in Wikitable umwandeln[Quelltext bearbeiten]

Ich habe soeben die Tabelle unter Simferopol entdeckt und mich gerade in die Internet-Steinzeit zurückversetzt gefühlt. Könnten solche unschönen Tabellen jeweils per Bot in eine Wikitable umgewandelt werden? --Leyo 11:31, 13. Dez. 2017 (CET)

Als jemand, der ab und zu mal Tabellensyntax feinschleift, wage ich zu behaupten, dass diese zu komplex ist, um automatisiert weitreichende Änderungen daran vornehmen zu können. Gruß, -- hgzh 18:48, 15. Dez. 2017 (CET)
Eine einfache insource-Suche liefert noch mehr solches antikes Zeug, z.B. Darío_Silva#Statistiken. 92.75.111.186 17:38, 16. Dez. 2017 (CET)
Das sind kosmetische Änderungen, sollten von einem Bot also nur in Verbindung mit inhaltlichen Änderungen vorgenommen werden. Ich würde das in diesem Fall aber nicht vollautomatisch durchlaufen lassen - lässt sich schwer überblicken, welchen Impact das am Ende hat. --FNDE 18:16, 29. Dez. 2017 (CET)
Dein erster Satz beruht auf einem Missverständnis: Die von mir vorgeschlagenen Umwandlungen bewirken sehr wohl eine sichtbare Änderung in den betreffenden Artikeln. --Leyo 02:19, 30. Dez. 2017 (CET)
Ergänzend zu den von FNDE genannten Zweieln hinsichtlich des Impacts ist auch das Problem, daß solche Steinzeittabellen eigentlich längst durch Infoboxen oder ähnliche Vorlagen ersetzt, aber aus irgendwelchen Gründen vergessen/übersehen wurden, etwa weil einst Baustelle im BNR oder so. So finde ich auch heute noch hin und wieder einen Schlachtartikel, in der trotz der berühmt-berüchtigten Löschung und Wiederherstellung der Vorlage:Infobox Militärischer Konflikt noch solche Steinzeittabellen enthalten sind. Das zu erkennen ist nicht trivial. Ich weiß nicht, wie allgemein in Ukraine/Rußland verfahren wird, aber in vielen Ländern werden die Bevölkerungsvorlagen Vorlage:USCensusPop oder Vorlage:Démographie "mißbraucht" ("mißbraucht", weil diese eigentlich für die USA bzw. Frankreich vorgesehen waren, aber letztlich funktionieren sie auch anderswo). --Matthiasb – Blue ribbon.svg (CallMyCenter) 04:55, 30. Dez. 2017 (CET)
Ich könnte anbieten erstmal eine Wartungsliste zu erstellen, dann könnte man erstmal schauen, ob der Botlauf sinnvoll ist. Wenn nicht, könnte man sich manuell ans Werk machen. Viele Grüße --FNDE 12:46, 8. Jan. 2018 (CET)
OK, am besten mit „Typenunterscheidung“. --Leyo 12:56, 8. Jan. 2018 (CET)
Inwiefern? Also von welchen Typen sprichst du? --FNDE 16:22, 8. Jan. 2018 (CET)
Ein Typ wäre beispielsweise {| border=1. --Leyo 00:53, 9. Jan. 2018 (CET)
In Ordnung. Schaau ich mir mal an. VG --FNDE 08:48, 9. Jan. 2018 (CET)

@FNDE: Bist du hier schon vorrangekommen? Viele Grüße, Luke081515Socke 16:21, 20. Apr. 2018 (CEST)

Änderung der Kommunalverbände in Artikeln zu frz. Gemeinden[Quelltext bearbeiten]

Hallo zusammen, könnte bitte jemand anhand dieser Liste Benutzer:Septembermorgen/Bottabelle/Französische Gemeinden Intercomms die Angaben zu den Kommunalverbänden aktualisieren. Folgende Schritte wären erforderlich:

  • 1. Ändere/Ergänze "Intercomm-Infobox" in der "Infobox Gemeinde in Frankreich" (Parameter intercomm)
  • 2. Löschen der "Navigationsleiste Kommunalverband" (Kann auch in einem Naviblock stehen, wenn dann nur eine Navileiste übrig bleibt, sollte der Naviblock aufgelöst werden), wenn eine 1 im der Spalte "Vorlage Kommunalverband löschen" steht.
  • 3. Ändere "Intercomm" im Fließtext. Der neun einzufügende Wikilink steht in der Spalte "Intercomm-Text ersetzen ". Bei Bedarf kann ich auch die ganzen Sätze noch in der Liste ergänzen, in denen der zu ersetzende Wikilink drin steht, ansonsten ist der Link immer der alte Eintrag im Parameter intercomm der Infobox Gemeinde in Frankreich.

Beste Grüße --Septembermorgen (Diskussion) 21:24, 17. Jan. 2018 (CET)

Link "Zufälliger Medizinartikel" - erwin85[Quelltext bearbeiten]

Hi, wir haben auf der Portalseite Medizin einen link zum Generieren eines zufälligen Artikels, der leider nicht mehr funktioniert:

https://tools.wmflabs.org/erwin85/randomarticle.php?lang=de&family=wikipedia&namespaces=0&subcats=1&categories=Medizin&d=30

Könnte das jemand überprüfen/korrigieren. Danke und Grüße--Partynia RM 15:42, 24. Jan. 2018 (CET)

Wenn du hier guckst, dann findest du dort "erwin85" (den Namen des Tools) und dort diejenigen, die Zugriff darauf haben: https://tools.wmflabs.org/admin/tools Alle anderen können auch nur gucken. --Wurgl (Diskussion) 16:40, 24. Jan. 2018 (CET)
Wie könnten hier Bots helfen? --тнояsтеn 19:37, 24. Jan. 2018 (CET)
Egal, er hat 9 mögliche Ansprechpartner. Ein paar werden wohl inaktiv sein, aber bleiben noch genug. --Wurgl (Diskussion) 19:51, 24. Jan. 2018 (CET)
Siehe Spezial:Diff/173280672/173280945?title=Wikipedia:Technik/Werkstatt -- Quotengrote (D|B|A) 21:33, 24. Jan. 2018 (CET)
@Partynia: Mittlerweile gibts auch Spezial:Zufällig_in_Kategorie, Syntax ist dann Spezial:Zufällig_in_Kategorie/Kategoriename. Hilft das ggf? Viele Grüße, Luke081515 21:36, 24. Jan. 2018 (CET)
Das liefert auch munter Kategorien, aber keine Artikel (und auch keine Kategorien) aus Unterkategorien. --mfb (Diskussion) 08:33, 27. Apr. 2018 (CEST)

Falsches Datumsformat[Quelltext bearbeiten]

Hallo zusammen,
Da ich immer wieder über falsch formatierte Daten stolpere, wollte ich fragen, ob jemand von Euch WP:FDF wieder zum Laufen kriegt? Danke und lieber Gruss --Phzh (Diskussion) 01:00, 16. Feb. 2018 (CET)

Hi Phzh, ich könnte mir vorstellen, mich darum zu kümmern. Hab mich auch schon auf die Suche gemacht nach dem Skript was ursprünglich verwendet wurde – leider ohne Ergebnis. Ein paar grundlegende Fragen dazu:
  • wie oft wurde die Liste aktualisiert? Immer wenns einen neuen Dump gab?
  • welche Datumsformate wurden berücksichtigt?
Danke und beste Grüße --FNDE 17:38, 7. Apr. 2018 (CEST)
Hallo FNDE,
  • Meines Wissen wurde die Liste immer, wenn es einen neuen Dump gab, aktualisiert.
  • Alle Artikel, die vermutlich ein Datum der Form TT.MM.JJJJ, TT.MM.JJ, JJJJ-MM-TT, 0T. Monat oder ähnliches enthalten. Auch teilverlinkte Daten wie TT.MM.[[JJJJ]] und [[TT. MM.]] [[JJJJ]] wurden erkannt. Folgendes sollte ignoriert werden: Web-URLs, Bild- und Medien-Dateinamen (.jpg, .svg, .ogg usw.), Tabellenspalten und Vorlagenparameter, die mit einem Datum beginnen oder enden, Chartboxen, Vorlage:PND, Titelparameter in gängigen Vorlagen, zitierten Text in den Zitiervorlagen, auskommentierte Textpassagen (siehe auch WP:FDF).
Danke und lieber Gruss, --Phzh (Diskussion) 17:50, 7. Apr. 2018 (CEST)

(Seiten)Index für Portale anhand von Kategorien erstellen und aktualisieren (Merlbot-Ersatz)[Quelltext bearbeiten]

Hallo, aufgrund einer Diskussion im Jahr 2009 (Automatische Index-Erstellung) übernahm Merlissimo mit seinem MerlBot den Job von Benutzer:Srbauer und seinem SrbBot, Indexe für Portale bzw. Projekte zu erstellen.

Seitdem stehen sie auf diesem Stand. Zusatznutzen: Die Disk.-Seiten und etwaige Weiterleitungen waren mit verlinkt.
Kann sich jemand vorstellen, das zu übernehmen? --emha db 21:23, 28. Feb. 2018 (CET)

@Emha: sowas wie Portal:Wintersport/Index? TaxonBota kann das schon, auch dies hatte MerlBot damals erledigt. – Doc TaxonDisk.WikiMUCWikiliebe?! 00:49, 13. Mär. 2018 (CET)
@Doc Taxon: ja, ganz genau. Was müssen die anderen Portale tun, um auch in den Genuss der Aktualisierungen durch Deinen Bot zu kommen? Gibt es irgendwo eine Dokumentation? Für Mittelhessen bitte ich natürlich um Aktualisierung, würdest Du das für die o.g. Fälle auch automatisch übernehmen? Viele Grüße, --emha db 02:10, 13. Mär. 2018 (CET)
@Emha: die anderen Portale müssten dieses Design befürworten, - einige, die du ausgegraben hast, sehen da ja sehr unterschiedlich aus. – Doc TaxonDisk.WikiMUCWikiliebe?! 02:31, 13. Mär. 2018 (CET)
Ich finde das Layout deutlich untergeordnet und ein wieder regelmäßig aktualisierter Index im Portal Hund wäre schon sehr schön. Anka ☺☻Wau! 21:02, 14. Mär. 2018 (CET)
Doc Taxon: ich habe den anderen o.g. Portalen / Projekten via Diskussionsseite Bescheid gegeben.
Wie finde ich heraus, ob es weitere Indexe/Themenlisten gibt/gab? Hat da jemand eine Idee? Viele Grüße, --emha db 18:36, 20. Mär. 2018 (CET)
@Emha: ich werde mal mit ein paar spezifischen Suchstrings danach suchen. – Doc TaxonDisk.WikiMUCWikiliebe?! 23:47, 20. Mär. 2018 (CET)
Ich bin vom Portal:Raumfahrt, und ich würde mich freuen, wenn unser veralteter Index wieder automatisch aktualisiert würde. Das Wintersport-Design ist für mich absolut okay. --Asdert (Diskussion) 08:34, 21. Mär. 2018 (CET)
Auch im Portal:Ostfriesland/Index wäre eine Aktualisierung sehr willkommen! Dank und Gruß, --Wikiwal (Diskussion) 08:18, 22. Mär. 2018 (CET)
@Doc Taxon: bist Du inzwischen in dieser Sache weiter gekommen? Die Portale (sind ja mittlerweile ein paar!) würden sich freuen. Stellvetretend hoffnungsvoll, --emha db 18:34, 2. Aug. 2018 (CEST)

Fehlende Commonscat finden[Quelltext bearbeiten]

Ich stoße ständig auf Artikel, bei denen der Commonscat-Link fehlt, und dass obwohl Artikel und Commonscat identisch benannt sind. Wäre es sinnvoll und möglich da eine Arbeitsliste per Bot anzulegen? Folgendes schwebt mir vor: 1. Auflistung aller Artikel, die keinen Commonscat-Link haben und zu denen es eine gleichlautenden Commonscat gibt. 2. Auflistung aller Artikel die keinen Commonscat-Link haben (wo es keine gleichnamige Commonscat gibt), bei denen aber eine andere Sprachversion auf eine Commonscat verlinkt und Angabe der dort verlinkten Commonscat. Kann man so etwas machen, und wäre es auch sinnvoll? -- Lord van Tasm «₪» ‣P:MB 22:04, 28. Feb. 2018 (CET)

Ich denke nicht, dass das sinnvoll ist. Allein mit dem Anfangsbuchstaben 'A' sind das 30.499 Seiten (ohne Weiterleitungen). In der linken Spalte auf der Seite ist ja ein Commonslink (wenn auf Wikidata eingetragen) angegeben. Ja, ich weiß, dass das bei Mobilgeräten wie Smartphones Probleme macht, aber dann sollte eben das Seitenlayout besser gestaltet werden, anstatt überall redundante Links reinzudrücken. Dagegen ist es m. E. sinnvoll, die Seiten rauszufischen, die nicht über Wikidata mit gleichnamigen Commons-Kategorien oder -Galerien verknüpft sind. --Achim (Diskussion) 15:56, 2. Mär. 2018 (CET)

BTW: Kennst du Benutzer:Aka/Fehlerlisten/fehlende Commons-Kategorie? --Leyo 10:46, 5. Mär. 2018 (CET)

Ah, Super! Danke vielmals! Auch 'ne Möglichkeit ein bissl mehr Ordnung reinzukriegen, auch wenn's was anderes ist.-- Lord van Tasm «₪» ‣P:MB 11:53, 5. Mär. 2018 (CET)
BTW hätten wir da auch noch Benutzer:Krdbot/Defekte Schwesterprojektlinks und Benutzer:Achim55/Bad links to pages on Commons im Sortiment, die umfangreicher sind, aber auch die Seiten, bei denen {{Commonscat}} ins Leere zeigt, enthalten. Nur für den Fall, dass Langeweile aufkommt... --Achim (Diskussion) 15:49, 5. Mär. 2018 (CET)

Einfache Anführungszeichen korrigieren[Quelltext bearbeiten]

Ich habe gerade in einem viel gelesenen Artikel falsch formatierte einfache Anführungszeichen korrigiert. Könnte Ähnliches in anderen Artikeln per Bot korrigiert werden? Mittels insource:/ ,[A-Za-z]+'[^']/ findet man nicht alle, speziell nur diejenigen Vorkommen mit einem einzelnen Wort in Anführungszeichen. --Leyo 14:50, 7. Mär. 2018 (CET)

Ich denke, ich hab erstmal alle über die Regex-Suche erwischt. -- hgzh 20:15, 24. Mär. 2018 (CET)
Danke! Leider gibt's noch mehr, z.B. viele der mittels insource:/, ,[A-Za-z]/ gefundenen. Auch die obige Regex-Suche ergibt bei mir noch einige Treffer. --Leyo 13:51, 25. Mär. 2018 (CEST)

Panoramio gibt es nicht mehr[Quelltext bearbeiten]

Durch Zufall bin ich auf dieser Seite gelandet: Lenindenkmale in Russland. Dort sind ca. hundert Fotos verlinkt. Davon wurden einige per archiv.org überprüft. Es gibt die Fotos also noch. Kann ein bot die jeweils älteste Version (noch ohne Hinweis auf Abschaltung) verlinken?

@Aka: kann dein laufendes script überprüfen, wie oft das vorkommt? Gruss --Nightflyer (Diskussion) 22:20, 18. Mär. 2018 (CET)

Ich bin mir nicht ganz sicher, was du genau suchst. Reicht vielleicht schon die Weblinksuche? -- Gruß, aka 22:53, 18. Mär. 2018 (CET)
Danke @Aka: Sieht gut aus. Da werden weit über tausend Fotos gelistet, die heute nicht mehr direkt erreichbar sind. Den Rest überlasse ich den Kundigen hier :-) Gruss --Nightflyer (Diskussion) 23:05, 18. Mär. 2018 (CET)
Tja, das Problem wurde bereits 2017 angesprochen, damals funktionierten die Links allerdings noch. Damals hat das aber noch niemanden so richtig interessiert. Jetzt ist der Salat mit den toten Links da. 129.13.72.197 09:48, 19. Mär. 2018 (CET)

Ich denke, der InternetArchiveBot wird da irgendwann drüberlaufen. -- hgzh 19:53, 24. Mär. 2018 (CET)

Wenn der Bot einen 404-Error auswertet, wird er es nicht können: Statt der Bilder gibt es jetzt einen Hinweis.. Gruss --Nightflyer (Diskussion) 20:53, 24. Mär. 2018 (CET)
Wenn der Bot es nicht selbst merkt, kann ein Armin ihm das hier beibringen.--Cirdan ± 05:51, 29. Mär. 2018 (CEST)

Viele tausend Panoramio-Bilder mit kompatibler Lizenz wurden nach Commons übertragen und wären nun, anstelle einer Verlinkung, hier direkt in Artkel einbindbar. Die ursprünglichen URLs sind auf Commons in den Dateibeschreibungsseiten angegeben (jedoch die dort nachträglich per Bot erfolgte Änderung "http" zu "https" beachten) (Beispielbild). Ein Bot könnte nun auf Commons nach unseren Panoramio-Links bzw. den Panoramio-Fotonummern suchen. Seine Ergebnisse könnte er hier z. B. auf der jeweiligen Artikeldisk ausgeben zur weiteren Überprüfung, ob eine direkte Bildeinbindung oder nur eine Linkanpassung nach Commons angebracht ist. Wenn sich die Zahl der Treffer in Grenzen hält, wäre auch eine Gesamtliste sinnvoll. Anderes mögliches Vorgehen: Der Bot biegt hier automatisch Links nach Commons um und hinterlässt in der Zusammenfassung einen Hinweis auf mögliche Direkteinbindung als Bild. Disclaimer: Nur ein Teil der Panoramiobilder hatte freie Lizenzen, wie groß die Schnittmenge mit unseren Links ist, kann ich nicht sagen. --Sitacuisses (Diskussion) 05:18, 29. Mär. 2018 (CEST)

Entfernen defekter Originallinks nach {{Webarchiv}}-Einbindung[Quelltext bearbeiten]

In einer ganzen Reihe von Artikeln (mehrere hundert) gibt es Einzelnachweise, in denen die folgende Konstruktion genutzt wird:

{{Webarchiv | url=http://www-pub.iaea.org/MTCD/publications/PDF/OPEX_2010_CD_web/PDF/OPEX_2010.pdf | webciteID=61tRdHT8n | text=''IAEA – jährlicher Report zu Kernkraftwerken in Mitgliedsstaaten''}} (pdf). IAEO, archiviert vom [http://www-pub.iaea.org/MTCD/publications/PDF/OPEX_2010_CD_web/PDF/OPEX_2010.pdf Original] (PDF; 20,3 MB), abgerufen am 22. September 2011.

Ursache dafür ist, dass {{Webarchiv}} bis vor einigen Tagen den Originallink nicht angezeigt hat (so wie es z.B. {{Internetquelle}} schon seit geraumer Zeit tut). Zum einen führt das jetzt zu dem unschönen folgenden Resultat:

IAEA – jährlicher Report zu Kernkraftwerken in Mitgliedsstaaten (Memento  vom 22. September 2011 auf WebCite) (pdf). IAEO, archiviert vom Original (PDF; 20,3 MB), abgerufen am 22. September 2011.

Zum anderen steht auf diese Weise natürlich ein als defekt bekannter Weblink dauerhaft im Artikel und wird von danach suchenden Bots gefunden, so auch vom jüngst gestarteten InternetArchiveBot, der pflichtbewusst die „Original“-Links repariert.

Für die Weblinkwartung wäre es ungemein hilfreich, diese händischen Originalverlinken würden entfernt. Das sollte ein semi-automatischer Bot gut erledigen können. Konkret müssen alle „archiviert vom Original“-Texte entfernt werden, die unmittelbar auf {{Webarchiv}} folgen. Martina und ich würden uns freuen, wenn ein Regex-Experte diese Aufgabe übernehmen könnte.--Cirdan ± 21:27, 24. Mär. 2018 (CET)

Probiers mal damit: Spezial:Suche (22 Treffer) --Wurgl (Diskussion) 14:28, 25. Mär. 2018 (CEST)

Automatisierte Link-Umstellung von HTTP zu HTTPS[Quelltext bearbeiten]

Hallo, ich würde es als sehr sinnvoll erachten, wenn wir einen Bot damit beauftragen, externe Links von HTTP zu HTTPS umzustellen. Das kommt natürlich nur für vorher geprüfte Websites in Frage.

Warum HTTPS wichtig ist, kann man hier nachlesen: https://developers.google.com/web/fundamentals/security/encrypt-in-transit/why-https

In der englischsprachigen Wikipedia gibt es einen solchen Link-Umstellungs-Bot auch, siehe en:User:KolbertBot.

Beste Grüße, --Soluvo (Diskussion) 15:05, 2. Apr. 2018 (CEST)

Ich könnte mir vorstellen mich darum zu kümmern. Inwiefern meinst du denn geprüft? Menschlich, oder automatisch? Viele Grüße, Luke081515 15:12, 2. Apr. 2018 (CEST)
Gemeint ist wohl, dass jeweils eine bestimmte, von uns häufig im ANR referenzierte Domain auch tatsächlich HTTPS mit brauchbarem Zertifikat unterstützt.
Ist eine sinnvolle Aufgabe, da sie Kommunikationsbelauschern das Leben schwermacht, wenn die erste Kontaktierung von der Wiki-Seite aus bereits mit HTTPS erfolgt.
Aus den frühen Jahren der deWP gibt es bestimmt eine Reihe relevanter Domains, die dem damaligen Artikelbearbeiter nur per HTTP erreichbar waren, heutzutage jedoch HTTPS können. Kann in die Zigtausende von Artikeln gehen.
LG --PerfektesChaos 15:22, 2. Apr. 2018 (CEST)
So von der ersten Einschätzung her hätte ich dann ein Skript zusammengeschraubt, das alle Artikel nach und nach durchgeht, mit geringer Frequenz, und dort alle Domains die verlinkt sind rauspickt. Diese würde dann von der Automatik auf https geprüft (sofern sie das nicht schon sind), also ob ein Cert da ist, ob es noch valid ist, und der CN auch stimmt. Würde der Check positiv sein, würde der Bot dann in einem Edit alle auf https umbügeln, die das eben können. Den Job könnte man einmal laufen lassen, und dann in regelmäßigen Abständen wieder. Spricht da was dagegen, @Soluvo, PerfektesChaos:? Viele Grüße, Luke081515 15:27, 2. Apr. 2018 (CEST)
700.000 Treffer meint eine schnelle Suche nach insource:/http:/. Mit geringer Frequenz ist da gleichbedeutend mit "ewig" :-) --Wurgl (Diskussion) 15:33, 2. Apr. 2018 (CEST)
Naja, a) Werden ja nicht alle ersetzt, b) ersetze ich so viele wie möglich in einem Edit. Mit geringer Frequenz meine ich schon mindestens ein Edit jede Minute. ;) Viele Grüße, Luke081515 15:35, 2. Apr. 2018 (CEST)
Ich vermute, gemeint war eine konkrete Benennung bestimmter Domains, und dann Abarbeitung aller Artikel, in der eine oder mehrere dieser Domains in HTTP vorkämen.
Dabei kann die Zertifizierungsqualität für eine begrenzte Liste von Domains auch manuell vorgeprüft werden.
Sollte schon politisch-medizinisch-juristisch-allgemeinauskunftig relevante Domains umfassen; die Touristeninfo von Posemuckel mag ja auch auf dem HTTPS-Server der Landkreisverwaltung sitzen, aber deswegen müssen wir nicht gleich den Artikel umbauen.
LG --PerfektesChaos 15:40, 2. Apr. 2018 (CEST)
Ja, so meinte ich es. --Soluvo (Diskussion) 18:05, 2. Apr. 2018 (CEST)
Danke für Eure Antworten. @Luke: Ja, das kannst Du gerne übernehmen. Mit Prüfung meine ich, wie PerfektesChaos richtig schreibt, eine vorherige manuelle Überprüfung der Zieldomain, ob diese tatsächlich ein funktionsfähiges SSL-Zertifikat besitzt.
Beispielsweise wurden kürzlich die Websites von Stern und Focus Online mit HTTPS verschlüsselt.
  • Früher unter http://www.stern.de, jetzt unter https://www.stern.de. Die Links für diese Domain in der deWP könnten also umgestellt werden.
  • Bei Focus das gleiche und jetzt ebenfalls unter https://www.focus.de erreichbar. Auch hier kann umgestellt werden.
  • Wenn man aber ohne Prüfung bspw. http://www.faz.net auf https://www.faz.net ändern würde, stellt man fest, dass die FAZ ihre Website leider noch nicht verschlüsselt hat.
  • --> Vorher prüfen, ob die Seite überhaupt verschlüsselt ist und ob alles funktioniert.
Noch ein paar allgemeine Dinge:
Bei weiteren Fragen helfe ich gerne! Beste Grüße, --Soluvo (Diskussion) 17:32, 2. Apr. 2018 (CEST)
Zusammenfassung: Weil (leider) nicht jede Website HTTPS unterstützt, können wir nicht einfach in der ganzen deWP jedes "http://" durch ein "https://" ersetzen. --Soluvo (Diskussion) 18:04, 2. Apr. 2018 (CEST)

Hinweis: Unter Benutzer:Soluvo/Automatisiert/Links habe ich eine Liste mit der Anzahl der Links zu bestimmten Websites erstellt. Siehe ggf. auch Benutzer:Soluvo/Automatisiert. --Soluvo (Diskussion) 19:03, 2. Apr. 2018 (CEST)

7300 Links zum Toolserver? Was ist das denn für alter Schrott? 94.217.107.61 22:51, 2. Apr. 2018 (CEST)
Sind sogar 30545 Links, aber exakt 0 Links im ANR. --Wurgl (Diskussion) 23:00, 2. Apr. 2018 (CEST)
@94.217.107.61, Wurgl: Ja, richtig, es befinden sich aktuell keine Links zum Toolserver im ANR. Am liebsten würde ich einen Wiki-Dump scannen, der nur den ANR und die jeweils aktuellste Version von jedem Artikel beinhaltet. Wisst ihr, welcher Dump unter https://dumps.wikimedia.org/dewiki/20180320/ (oder auch von woanders) dafür am besten geeignet ist? --Soluvo (Diskussion) 08:51, 3. Apr. 2018 (CEST)
Ich bastel dir was mit Quarry … --Wurgl (Diskussion) 09:31, 3. Apr. 2018 (CEST)
https://quarry.wmflabs.org/query/26098 Zu beachten ist dabei, dass in der Datenbank auch Links sind, die aus einer Vorlage generiert werden. Ich denke, die sollten zuerst angegangen werden. Und dann sind da noch ein paar Links die mit HTTP: und Http: beginnen, gibt auch zwei mit httP:. --Wurgl (Diskussion) 11:47, 3. Apr. 2018 (CEST)
@Wurgl: Danke dafür! Ich habe die Quarry-Seite geöffnet und sehen den SQL-Code, kann die Abfrage aber nicht ausführen. Ist das normal so? Wie kann man den Code ausführen lassen? --Soluvo (Diskussion) 08:41, 4. Apr. 2018 (CEST)
Hab Geduld. Die rödelt irgendwo und plötzlich kommen die Daten, so 1 Minute oder zwei warten. Es sind wohl noch die Daten als ich die gestern gestartet habe, vor meiner Umstellung der Normdaten. Allerdings sind die noch nicht alle in der Datenbank. Von 8.124.471 http-Links kurz nach meinen ersten Umstellungen ist der Zähler vor so einer Stunde auf 7.649.284. Sind aber grob 900.000 http-Links die da verschwinden müssten, daher ist ein neuer Start nicht so sinnvoll – das Ding rödelt eben noch. Ansonsten: Du brauchst dort einen Account, dann kannst die Abfrage mit "fork" duplizieren und in deinem Duplikat dann herumfuhrwerken. PS: books.google.de und ssd.jpl.nasa.go hab ich in den Vorlagen bereits umgestellt, die großen Brummer dispatch.opac.d-nb.de und zdb-katalog.de gehen nicht. --Wurgl (Diskussion) 09:14, 4. Apr. 2018 (CEST)
@Wurgl: Stimmt, man muss einfach ein bisschen warten. Jetzt funktionierts. Soll ich die Deutsche Nationalbibliothek (dispatch.opac.d-nb.de) oder die Zeitschriftendatenbank (zdb-katalog.de) mal kontaktieren, z.B. per E-Mail oder Telefon? Vielleicht bringt es ja etwas. Wenn du noch andere Seiten/ Unternehmen hast, bei denen ich mich mal melden soll, sag gerne Bescheid. --Soluvo (Diskussion) 11:05, 4. Apr. 2018 (CEST)
(*quetsch*) Ich hab die Query jetzt ein wenig umgebaut.Klein-/Großschreibung ist egal und nur noch die Hosts mit mehr als 10 Vorkommen. d-nb.info und beacon.findbuch.de sind schon mal gewaltig reduziert, die sollten auf nahezu Null kommen. --Wurgl (Diskussion) 17:53, 4. Apr. 2018 (CEST)
@Wurgl: Ich habe Deinen Query geforkt, siehe: https://quarry.wmflabs.org/query/26228. Diese Abfrage sucht nur im Vorlagennamensraum nach http-Links, weil eine kleine Anpassung bei einer Vorlage eine große Folge im Artikelnamensraum hat. --Soluvo (Diskussion) 10:19, 6. Apr. 2018 (CEST)
@Soluvo: Ja okay, kein Problem. Doch findest vermutlich nur Treffer in der Doku der Vorlage – wobei das auch schon eine Hilfe ist. --Wurgl (Diskussion) 11:03, 6. Apr. 2018 (CEST)
@Soluvo: dispatch.opac.d-nb.de und zdb-katalog.de mögen kein https, du kannst aber gerne eine Nörgelmail an die beiden schreiben. --Wurgl (Diskussion) 11:08, 4. Apr. 2018 (CEST)
Ok, ich schaue mal, ob sich da was machen lässt.
Folgende Seiten können nach meiner Einschätzung umgestellt werden:
--Soluvo (Diskussion) 11:14, 4. Apr. 2018 (CEST)
* http://www.heise.de geht auch …
@Luke081515, Soluvo: was haltet ihr vom ersten Schritt: Seiten die mittels Status 301 bzw. 302 von http nach https umleiten (z.B. www.heise.de) und ev. auch Seiten die mittels Refresh nach https umleiten (z.B. www.munzinger.de). Wenn du, Luke dann mittels insource-Suche aufwirfst, wenn diese http-Urls in Vorlage drinnen sind, dann mach ich die auch gleich per Hand – oder kannst du die auch automagisch umstellen? --Wurgl (Diskussion) 11:31, 4. Apr. 2018 (CEST)
@Wurgl: Ja, heise geht auch. Die 301-Weiterleitung und die Refreshs würde ich umstellen, die 302 Weiterleitung eventuell noch nicht. Wenn man sich HTTP-Statuscode#3xx – Umleitung anschaut, steht die 301-Weiterleitung für "Moved Permanently", während 302 für "Found (Moved Temporarily)" steht. Da wir nicht wissen, warum die 302-Seiten nur temporär umgezogen sind, würde ich diese noch nicht umstellen. --Soluvo (Diskussion) 13:39, 4. Apr. 2018 (CEST)
Die Normdaten stelle ich am Abend auf https um, soferne kein Widerspruch erfolgt (ein host dort http://dispatch.opac.d-nb.de/ kann aber nicht umgestellt werden). Vorlage:Munzinger hab ich gerade umgestellt. Für Vorlage:Filmportal fehlen mir die Rechte, da muss ein Admin ran (Filmportal selbst lenkt wie Munzinger auf https um). --Wurgl (Diskussion) 14:57, 3. Apr. 2018 (CEST)
So, alles um Normdaten herum ist umgestellt. Damit werden wohl ca. 1 Mio http-Links verschwinden (etwas über 8 Mio Einträge in der Datenbank-Tabelle externallinks gibt es). Und ein paar andere hab ich auch umgestellt. --Wurgl (Diskussion) 17:32, 3. Apr. 2018 (CEST)
Vielen Dank! --Soluvo (Diskussion) 08:41, 4. Apr. 2018 (CEST)

Es gibt da noch eine Sache. ich habe meinen Browser so eingestellt, dass der nörgelt, wenn von einer https-Seite irgendwelches Zeugs per http nachgeladen wird. Dieses Zeugs sind üblicherweise Bilder, Scripte oder auch css-Files, manchmal auch Werbung. Beispielseite: https://www.chemspider.com Die Frage ist nun, ob solche Seiten auch auf https umgestellt werden sollen? Und das Problemchen hier ist die automagische Erkennung durch einen Bot. Der müsste nämlich die Seiten saugen und auf http-Links untersuchen was nicht sehr erfrischend ist. --Wurgl (Diskussion) 17:47, 3. Apr. 2018 (CEST)

Ja, richtig, diese Herausforderung sehe ich auch. In meiner Antwort oben habe ich diese Inhalte als Mixed Content bezeichnet, siehe z.B. bei developers.google.com.
Ich würde die nur teilweise verschlüsselten Websites noch nicht automatisch umstellen. Um herauszufinden, welche Websites nur teilweise verschlüsselt sind, sollte eine Website meiner Meinung nach manuell überprüft werden (also nicht per Bot). Unter Benutzer:Soluvo/Automatisiert#Internetseiten habe ich eine Liste von Seiten erstellt, die umgestellt werden sollten. Ich muss nochmal prüfen, ob die Seiten auch alle verschlüsselt sind. --Soluvo (Diskussion) 08:41, 4. Apr. 2018 (CEST)
So einige Seiten leiten http selbstständig nach https um, bei denen kannst ohne viel nachzudenken umstellen. Die Zeit die man sich hier einspart, geht eben bei "mixed content" verloren :-( --Wurgl (Diskussion) 09:16, 4. Apr. 2018 (CEST)
Das bekommen wir schon hin! --Soluvo (Diskussion) 11:05, 4. Apr. 2018 (CEST)

@Luke081515, Wurgl: Gibt es etwas, das ich noch machen kann? Ich würde gerne helfen, doch fällt mir momentan nichts ein, wie ich das am besten machen kann. Soll z.B. ich Listen erstellen für Websites, die umgestellt werden können oder bei bestimmten Websites manuell die Verschlüsselung überprüfen oder etwas filtern, programmieren, etc.? Sagt bitte Bescheid, was ich machen soll! --Soluvo (Diskussion) 18:28, 5. Apr. 2018 (CEST)

Von meiner Seite aus wüsste ich nichts. Ich such jeden Tag in den Vorlagen nach ein paar von den Hosts die auf Seite 1 der Quarry auftauchen und stell ein paar Vorlagen um. Aber es ist fade, es sind nicht mehr viele. Gibt übrigens auch "lustige" Seiten, wie die FAZ: Die lenkt https nach http um. --Wurgl (Diskussion) 18:34, 5. Apr. 2018 (CEST)
Das klingt gut! Ja, ich habe auch schon einige Vorlagen auf HTTPS umgestellt. Das mit der FAZ ist mir auch schon aufgefallen. Ist bei der Süddeutschen Zeitung auch so. Leider... --Soluvo (Diskussion) 22:40, 5. Apr. 2018 (CEST)

Wie ist sichergestellt, dass http- und https-Zielseite den gleichen Inhalt haben? .-188.193.237.8 19:37, 5. Apr. 2018 (CEST)

@188.193.237.8: Kannst Du beschreiben, wann es passiert, dass http- und https-Seite unterschiedliche Inhalte zeigen? Hast Du vielleicht ein Beispiel für uns?
@Wurgl, Luke081515: Wisst ihr, was die Person meint? Ich habe unter https://webmasters.stackexchange.com/questions/60385/https-and-http-urls-point-to-different-places eine Problembeschreibung gefunden, die etwa darauf zutrifft. Ich erinnere mich auch, dass mir so etwas selbst mal aufgefallen ist, finde die Seite nur leider nicht mehr. Habt ihr eine Idee? --Soluvo (Diskussion) 22:40, 5. Apr. 2018 (CEST)
Ach Mann! Ja, es gibt unterschiedliche Inhalte: Https liefert den Inhalt aus, Http liefert eine Weiterleitung aus. Aber das auf http von einem Hochhausbrand und auf https unter der gleichen restlichen Adresse ein Kinofilm besprochen wird … Vergiss es einfach. --Wurgl (Diskussion) 22:49, 5. Apr. 2018 (CEST)
Hatte schon so einen Fall, leider die entsprechenden URLs gerade nicht mehr parat. Prinzipiell ist es möglich, dass http://beispiel.de/1234.htm und https://beispiel.de/1234.htm völlig unterschiedliche Seiten sind. --188.193.237.8 22:56, 5. Apr. 2018 (CEST)
Man kann solche Beispiele konstruieren, weil es technisch möglich ist. Für Wikipedia relevante Seiten verwenden solche Spielereien eher nicht. Was sein kann ist, dass die Inhalte zu unterschiedlichen Zeitpunkten aktualisiert werden, aber das ist ein kurzzeitiges Phänomen. Seiten die über einen längeren Zeitraum unterschiedlich waren, und hier von Interesse sind, kenne ich keine.  Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!  00:49, 6. Apr. 2018 (CEST)
Ich würde zur Sicherheit vorschlagen, jeweils den Quellcode von http und https zu vergleichen - dann wären wir doch auf der sicheren Seite. --FNDE 17:25, 7. Apr. 2018 (CEST)
Da hast du viele Unterschiede. Bei der einen Seite steht http, bei der anderen https. Wenn die Seite Werbung geschalten hat, dann kann es durchaus sein, dass da unterschiedliche Werbung eingeblendet wird. Dann hast du manchmal Links mit einer Session-ID im Quellcode. *seufz* So ein Vergleich ist eine Diplomarbeit. Da frag ich doch auch, ob jemand IPv4 mit IPv6-Seiten verglichen hat, ist ja ein ähnlicher Fall. --Wurgl (Diskussion) 19:39, 7. Apr. 2018 (CEST)

Es gibt jetzt noch einen weiteren Aspekt dieses Themas. tvspielfilm.de liefert für https zumindest in einigen Fällen (Beispiel) zur Zeit, dass die Seite nicht angezeigt werden kann während der gleiche Link für http funktioniert. Das Problem daran ist, dass die Links in einigen Artikeln (der Artikel zu den Beispielen: Ein starkes Team: Die Schöne vom Beckenrand) bereits als https eingetragen ist/war und nun vom Internetarchivebot auf Archiv umgestellt wurde. Dies betrifft mehrere Artikel zu Filmen dieser Reihe. --Senechthon (Diskussion) 15:47, 8. Apr. 2018 (CEST)

Die können https überhaupt nicht! http://www.tvspielfilm.de/ klappt, aber https://www.tvspielfilm.de/ klappt nicht, oder beim Impressum https://www.tvspielfilm.de/services/impressum/impressum,3710374,ApplicationArticle.html das selbe Spiel. Das betrifft genau 38 Artikel. --Wurgl (Diskussion) 15:59, 8. Apr. 2018 (CEST)

@all: Luke081515 und ich haben in der letzten Zeit noch weiter an der Erstellung des Bots gearbeitet. Der Bot soll ausgewählte HTTP-Links auf HTTPS umstellen. Dadurch soll die Sicherheit und der Schutz der Privatsphäre der Wikipedia-Nutzer noch weiter erhöht werden. Wir testen den Bot aktuell im Beta-Wiki (siehe hier). Der ausführende Bot wird Luke081515Bot sein. Wenn der Bot diese zusätzliche Aufgabe erfolgreich im Beta-Wiki absolviert, würden wir ihn gerne auch zeitnah in der deWP anwenden wollen. Vielen Dank und beste Grüße, --Soluvo (Diskussion) 15:04, 16. Jun. 2018 (CEST)

Anmerkung 1: Bitte darauf achten, dass möglichst nur Seiten umgestellt werden, die tatsächlich erreichbar sind. (Im ersten Schritt nur Seiten die http-200-er-Code zurückliefern und keine Umstellung von Redirects.) Die Umstellung toter Links auf https macht wenig Sinn und erschwert die automatische Auffindbarkeit in Webarchiven.
Anmerkung 2: Hilfreich wäre auch eine Liste vertrauenswürdiger Zertifikate. Danach könnte man per Zertifikat umstellen, und wäre nicht auf einzelne Domains beschränkt. Die Umstellung von unsicheren Zertifikaten könnte dazu führen, dass Browser diese Seiten nicht mehr öffnen. Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!  13:21, 17. Jun. 2018 (CEST)

Inhaltslose Wikilinks[Quelltext bearbeiten]

Wikilinks ohne Inhalt werden als [[]] angezeigt und sollten aus dem ANR entfernt werden (insource:/\[\[\]\]/). Ausnahmen sind Artikel wie Wikipedia sowie auskommentierte Bereiche. --Leyo 23:38, 2. Apr. 2018 (CEST)

Kann ich morgen Abend in Angriff nehmen. Viele Grüße, Luke081515 23:40, 2. Apr. 2018 (CEST)
aber bitte nicht bei auskommentierten wie bspw. hier: Eisschnelllauf-Weltcup 2011/12Doc TaxonDisk.WikiMUCWikiliebe?! 06:31, 3. Apr. 2018 (CEST)
Mein Plan wäre gewesen die zu entfernen, was anderes macht meiner Meinung nach auch keinen Sinn. Knapp unter 1000 Treffer sind das. Viele Grüße, Luke081515 07:55, 3. Apr. 2018 (CEST)
@Luke081515: ja, entferne die, aber eben nicht die auskommentierten. – Doc TaxonDisk.WikiMUCWikiliebe?! 09:24, 3. Apr. 2018 (CEST)
Warum nicht? Schadet doch nicht. 94.217.107.61 10:01, 3. Apr. 2018 (CEST)
ich kann mir vorstellen, dass die deshalb auskommentiert sind, weil noch etwas nachrücken soll. – Doc TaxonDisk.WikiMUCWikiliebe?! 10:18, 3. Apr. 2018 (CEST)
Ja, und? Einen Wikilink einzufügen ist so ziemlich das einfachste was es gibt. 94.217.107.61 11:16, 3. Apr. 2018 (CEST)
Ich ersetze jetzt erstmal das Zeugs außerhalb der Kommentar, weil ja auch Leyo was dazu geschrieben hatte. @Leyo: Magst du hier noch einmal schreiben, warum du die ausnehmen wolltest? Merci, Luke081515 23:16, 3. Apr. 2018 (CEST)
Nun, solange solche Syntaxfehler auskommentiert und damit nicht sichtbar sind, kann die wohl belassen, wenn man den Artikel nicht sowieso bearbeitet. --Leyo 23:23, 3. Apr. 2018 (CEST)

Heute nen Teil gemacht, mache morgen oder so weiter. Vieles sind einfach nur Kopiervorlagen, und die paar Treffer die man da hat erfordern in vielen Fällen Handarbeit. Viele Grüße, Luke081515 00:16, 4. Apr. 2018 (CEST)

Die mittels insource:/\[\[\]\]/ -insource:/\<!--/ -insource:/nowiki/i gefundenen Artikel könnte man automatisch korrigieren, aber dann wird's etwas schwieriger. insource:/\[\[\]\]/ -insource:/\<!--[^\>]*\[\[\]\][^\>]*--\>/ -insource:/nowiki/i -insource:/syntaxhighlight/i enthält Falsch-Positive. --Leyo 12:16, 1. Mai 2018 (CEST)

zeit.de[Quelltext bearbeiten]

Ich habe gesehen, dass der IABot alte URL bei zeit.de markiert hat, derzeit wohl acht.

Vor einem Jahrzehnt wurde (auch) benutzt:

  • http://images.zeit.de/text/restlicherPfad Yes check.svg Ok --PerfektesChaos 14:53, 6. Dez. 2018 (CET)
  • http://zeus.zeit.de/text/restlicherPfad

Die heißen heute:

  • http://www.zeit.de/restlicherPfad

Viele Jahre hatte der Verlag eine Weiterleitung auf www.zeit.de unterstützt; das mag mittlerweile weggefallen sein, weshalb IABot ansprang.

Unter www.zeit.de sind die Pfade in der Regel erreichbar; wenn mal nicht, soll der IABot den konkreten Einzelfall melden.

Auf jeden Fall stören die paar Hundert Altfälle das Gesamtbild der Zigtausende www.zeit.de und sollten vorbeugend glattgezogen werden; wie auch immer.

Ach ja, und bereits gesetzte IABot-Geschichten müssten wieder raus.

VG --PerfektesChaos 17:31, 9. Apr. 2018 (CEST)

Hab grade zwei URLs als Stichprobe getestet, beide haben auch unter zeit.de nicht funktioniert. 188.99.189.106 21:57, 9. Apr. 2018 (CEST)
Du müsstest schon konkret und präzise benennen, genau welche URL du getestet hast.
Von //zeit.de/ war auch nicht die Rede, das hatte es früher auch mal gegeben, jetzt nur noch //www.zeit.de/.
Zurzeit 303 Kandidaten. Zwei zufällige Stichproben davon:
Gelegentlich mal nicht erreichbare URL gibt es auf //www.zeit.de/ unter den Millionen auf deren Server, weil der sich mal verheddert oder bei uns die URL beschädigt wurde. Aber in der Regel passt das.
VG --PerfektesChaos 12:03, 12. Apr. 2018 (CEST)
Ich kümmere mich darum, inklusive Check, dass die neuen Links erreichbar sind, entfernen möglicher IABot-Hinweise und Umstellung auf HTTPS.--Cirdan ± 21:13, 5. Jun. 2018 (CEST)
Dieser Botauftrag wird gerade von KompostBot (Beiträge) bearbeitet. Um Konflikte zu vermeiden, warte bitte mit anderen Aktionen, bis diese Markierung entfernt ist, oder kontaktiere den Betreiber (Diskussion).

Fehlende Leerzeichen nach Punkten[Quelltext bearbeiten]

Mittels insource:/\.\[\[[^(Datei|File|Bild|Image|admin)]/ findet man etliche Artikel mit einem Vorkommen von .[[, was meist ein fehlendes Leerzeichen nach einem Satz bedeutet. Aktuell ergibt die Suche 1121 Treffer. --Leyo 11:08, 10. Apr. 2018 (CEST)

Jo, aber nicht immer, z. B. "www.boot.de" ist richtig. 129.13.72.197 12:46, 10. Apr. 2018 (CEST)
Leyo schrieb doch selbst meist, darum ist das auch nicht für einen Bot geeignet. Mit Komma statt Punkt findet man noch mehr Fehler. -- Gruß, aka 13:03, 11. Apr. 2018 (CEST) PS: [^(Datei|File|Bild|Image|admin)] macht nicht das, was du vermutlich wolltest. Du schließt damit alle Links aus, die mit einem der Buchstaben aus "dateiflbmagn" beginnen. In Perl würde ich (?!..|..|..) verwenden, was die interne Suchmaschine hier aber nicht zu verstehen scheint. -- Gruß, aka 14:15, 11. Apr. 2018 (CEST)
@Aka, Leyo:
Die Klammer-Syntax geht schon, aber mit runder Klammer und zwei Ausdrücken:
insource:/\.\[\[/ -insource:/\.\[\[(Datei|File|Bild|Image|admin)[:.]/i
LG --PerfektesChaos 12:13, 12. Apr. 2018 (CEST)
Was ist denn das für eine Aussage!? Wenn ein Vegetarier ein Schnitzel durch Salat ersetzt, kann er es auch essen, ja ;-) -- Gruß, aka 12:16, 12. Apr. 2018 (CEST)
Ich kann mich da demnächst drum kümmern, wie die letzten male halbautomatisch, dann passieren deutlich weniger Fehler. Viele Grüße, Luke081515 23:47, 12. Apr. 2018 (CEST)

Eine erste Etappe ist schon mal weg. Waren so um die 700 Treffer. Viele Grüße, Luke081515 23:23, 16. Apr. 2018 (CEST)

Vielen Dank! insource:/\.\[\[/ -insource:/\.\[\[(Datei|File|Bild|Image|admin)[:.]/i ergibt nun noch 704 Artikel. --Leyo 23:53, 16. Apr. 2018 (CEST)
Ich bin jetzt durchgegangen, bis auf false positives, und vllt eine Hand voll Sachen sollte alles weg sein. Viele Grüße, Luke081515 01:12, 28. Apr. 2018 (CEST)
Vielen Dank! Von den mittels insource:/,\{\{/ gefundenen Artikel könnten noch etliche korrigiert werden, aber es gibt auch Falsch-Positiven. --Leyo 23:26, 1. Mai 2018 (CEST)
Bei folgenden gibt's IMHO keine Falsch-Positiven: hastemplate:Webarchiv insource:/\,'*\{\{ *Webarchiv/ & hastemplate:Webarchiv insource:/:'*\{\{ *Webarchiv/ --Leyo 11:10, 22. Mai 2018 (CEST)

Commonscat prüfen bzw. mit Wikidata abgleichen[Quelltext bearbeiten]

Ich habe gerade eine Commonscat-Verlinkung, die auf eine Weiterleitung führte, korrigiert. Könnten alle Commonscat-Einbindungen auf ihre korrekte Verlinkung geprüft werden (Linkziel inkorrekt)? Allenfalls könnte dies anhand Wikidata (P373) geschehen. Bei Nicht-Übereinstimmung der lokalen Angabe und des Wikidata-Eintrags könnte allenfalls eine Wartungskategorie helfen. --Leyo 15:51, 18. Apr. 2018 (CEST)

Siehe Wikipedia:Bots/Anfragen#Commons-Links, Benutzer:Aka/Fehlerlisten/fehlende Commons-Kategorie und Benutzer_Diskussion:Achim55#Commons-Links. Alter Hut. Man könnte höchstens mal die Suche auf Nicht-ANR-Seiten ausweiten, da dein Beispiel ja eine Kategorie ist. 129.13.72.197 09:55, 19. Apr. 2018 (CEST)
Ja, eine solche Erweiterung wäre sinnvoll. --Leyo 15:48, 20. Apr. 2018 (CEST)

Spontane Idee: Man könnte schauen, bei welchen Artikel sich eine Änderung ergäbe, wenn man den Parameter 1 der Vorlage:Commonscat durch {{subst:#invoke:Wikidata|claim|P373}} ersetzen würde. --Leyo 13:19, 25. Apr. 2018 (CEST)

Ich schaue mir das zwischendrin mal an, ist in Arbeit, – Doc TaxonDisk.WikiMUCWikiliebe?! 01:33, 26. Apr. 2018 (CEST)
Das praktische Problem ist hier, dass es viele Artikel gibt, in denen die Vorlage:Commons bzw. Vorlage:Commonscat mehrfach eingebunden sind, siehe Benutzer:Mfb/Doppelte Commonscat-Ziele und Benutzer:Mfb/Doppelte Commons-Ziele. 212.51.174.162 10:29, 26. Apr. 2018 (CEST)

Der Bot geht mal alles im Artikelnamensraum durch, das dauert natürlich ne Weile. ... – Doc TaxonDisk.WikiMUCWikiliebe?! 21:49, 26. Apr. 2018 (CEST)

In diesem Beispiel stimmt jetzt zwar das Linkziel, aber aus einer deutschen Beschriftung wurde eine englische. Nicht optimal, so wäre es besser: [5] --тнояsтеn 22:50, 26. Apr. 2018 (CEST)
@Thgoiter: hierbei geht es um einen Verweis auf eine Kategorie bei Commons, bis auf ein paar Ausnahmen haben diese in der Regel keine deutschen Bezeichner. – Doc TaxonDisk.WikiMUCWikiliebe?! 23:02, 26. Apr. 2018 (CEST)
Trotzdem ist es üblich, in deutschen Artikeln die deutsche Übersetzung einzusetzen. --тнояsтеn 23:04, 26. Apr. 2018 (CEST)
@Thgoiter: ich nehm das mal mit auf – Doc TaxonDisk.WikiMUCWikiliebe?! 23:08, 26. Apr. 2018 (CEST)

ANR ist durch, denke ich. Jetzt ist ns 14 dran – Doc TaxonDisk.WikiMUCWikiliebe?! 09:01, 28. Apr. 2018 (CEST)

Gut. Was aber noch fehlt, ist die Korrektur der Commonslinks in der Vorlage:Commons. Kannst du da auch noch machen? 94.217.110.137 16:05, 28. Apr. 2018 (CEST)
Das Einsetzen des deutschen Kategorienamens ist oft nicht richtig, da die Commons-Kategorie anders heißt. Beispiele [6] [7] --188.194.41.172 16:39, 28. Apr. 2018 (CEST)
Das liegt dann aber daran, dass die verlinkte Commonskategorie per se nicht sinnvoll ist. In deinen beiden Beispielen habe ich sie daher entfernt. Mir ist allerdings noch aufgefallen, dass der Bot teilweise Links auch auf BKL-Seiten korrigiert hat, z. B. hier. Im Prinzip nicht so schlimm, kann man dann in einem zweitem Schritt manuell korrigieren, ich wollte es nur anmerken. 94.217.110.137 18:30, 28. Apr. 2018 (CEST)
Fehler: [8]. 94.217.110.137 18:42, 28. Apr. 2018 (CEST)
Das ist kein Fehler, denn genau dorthin leitet die Commons-Kategorie nun mal weiter. – Doc TaxonDisk.WikiMUCWikiliebe?! 19:30, 28. Apr. 2018 (CEST)
Und mit Commonscat bin ich fertig. – Doc TaxonDisk.WikiMUCWikiliebe?! 19:31, 28. Apr. 2018 (CEST)
Versteh ich nicht: Warum wird denn die nicht-existente Vorlage:cat see also eingefügt? 94.217.110.137 19:39, 28. Apr. 2018 (CEST)
huch, das war nicht geplant. Danke fürs Aufpassen. – Doc TaxonDisk.WikiMUCWikiliebe?! 20:02, 28. Apr. 2018 (CEST)

Unvollständige Syntax[Quelltext bearbeiten]

Können solche Fehler wie hier automatisch gefunden und aufgelistet werden? --тнояsтеn 22:06, 25. Apr. 2018 (CEST)

Siehe Hilfe:Wikisyntax/Validierung. --FriedhelmW (Diskussion) 22:33, 25. Apr. 2018 (CEST)
Kannst du mir bitte den genauen Link der Wartungsliste nennen, wo das o.g. Beispiel zu finden gewesen wäre? --тнояsтеn 22:45, 25. Apr. 2018 (CEST)
insource:/\[\[Kategorie:[^\]]+\][^\]]/ bzw. insource:/[^\[]\[Kategorie/ finden 9 bzw. 2 Kategorieseiten. Im ANR habe ich diese drei Artikel korrigiert. Anscheinend waren diese von akas Syntaxfehlerlisten nicht erfasst worden. --Leyo 22:51, 25. Apr. 2018 (CEST)
Danke. Wäre durchaus sinnvoll, wenn diese Fehler laufend geprüft würden. --тнояsтеn 23:01, 25. Apr. 2018 (CEST)

IABot + wissen.spiegel.de/wissen/image/[Quelltext bearbeiten]

Es gibt 427 Artikel mit URL vom Typ //wissen.spiegel.de/wissen/image/show.html?did=12345678&...............

  • Vermutlich knapp 200 hat der InternetArchiveBot bereits in die Finger bekommen; stehen zumindest in Vorlage:Webarchiv.
  • Es handelt sich um PDF-Versionen des gedruckten Spiegel.
    • Offensichtlich unterstützt der Verlag dieses URL-Schema nicht mehr.
  • Diese sind in aller Regel erreichbar als http://www.spiegel.de/spiegel/print/d-12345678.html
  • Problem: Oft steht diese normale HTML-URL bereits unmittelbar davor, und das PDF-Link ist nur eine absolut überflüssige und vollredundante Wiederholung von etwas, was sowieso bereits von der HTML-Seite aus als „PDF drucken“ mit momentan gültiger URL verlinkt ist.
    • In diesem Fall, wenn es also auf den vorangehenden 500 Zeichen diese Zahlenkombination bereits gibt, kann das Weblink bzw. Vorlage:Webarchiv komplett eliminiert werden (und kein <ref> zwischendrin steht etc.).
    • Kann auch bereits in Vorlage:Der Spiegel |ID=12345678 drinstecken.
  • {{Der Spiegel}} wäre sowieso die nettere Formatierung, aber nur manuell in die vorhandene Textumgebung einzuarbeiten.

VG --PerfektesChaos 14:47, 1. Mai 2018 (CEST)

Umstellung Domainnamen d-nb.de auf dnb.de[Quelltext bearbeiten]

Es sind ca. 1200 Seiten betroffen und überall ist der Domainname d-nb.de in diversen Links auf dnb.de umzustellen. Mindestens seit Samstag ist d-nb.de unerreichbar (Nameserver löst den Namen nicht auf), die Inhalte sind deckungsgleich auf dnb.de zu lesen.

Suchmuster: insource:/\.d-nb\.de\/./

Die Hostnamen sind deposit.d-nb.de, portal.d-nb.de, dispatch.opac.d-nb.de und die hab ich stichprobenartig auf sinnvollen Inhalt geprüft. Bei einigen hat leider schon der IABot zugeschlagen, die bereinige ich per Hand. Die 8 Vorlagen mach ich auch per Hand. Diskussion dazu gabs nur hier: Vorlage_Diskussion:Normdaten#"Seite_wurde_nicht_gefunden" --Wurgl (Diskussion) 14:31, 4. Jun. 2018 (CEST)

Nachtrag: d-nb.info ist davon nicht betroffen und http/https bleibt wie es ist. --Wurgl (Diskussion) 14:36, 4. Jun. 2018 (CEST)
@Wurgl: IABot ist kein Problem, das kann ich auch per Bot erledigen. Kannst du einschätzen, ob anstatt einer Linkkorrektur der Einsatz einer Vorlage sinnvoll wäre?--Cirdan ± 19:26, 4. Jun. 2018 (CEST)
Benutzer:Kolja21 wäre da der bessere Ansprechpartner. Sieht mir aber nach Handarbeit aus, es sind zu viele verschieden aufgebaute Links und auch sinnlose Links wie https://portal.dnb.de/opac.htm?method=showShortList&currentPosition=0 sind darunter. Leider :-( Hatte sowas mit "Ihre Session ist leider abgelaufen." vor ein paar Tagen bei 5 Links und da hab ich nur 20 Stück umgestellt. Da ging es um (Rest-)Umstellung von http://zdb-opac.de/ nach http://zdb-katalog.de/ --Wurgl (Diskussion) 20:02, 4. Jun. 2018 (CEST)
Ich vermute, in den meisten Fällen wäre die Ersetzung durch eine der Vorlagen besser. Habe da aber leider keinen Überblick. --Kolja21 (Diskussion) 21:50, 4. Jun. 2018 (CEST)
deposit.d-nb.de funktioniert wieder (298 Links)
files.d-nb.de funktioniert wieder (1 Link)
portal.d-nb.de funktioniert nicht (http leitet auf https weiter und dann kommt dieser Verbindung wird nicht vertraut)
dispatch.opac.d-nb.de funktioniert nicht
--Wurgl (Diskussion) 11:54, 5. Jun. 2018 (CEST)
Letzteres findet sich nicht mehr. Das vorletzte Funktioniert nicht mehr. Das sind derzeit laut Suche noch 296 Treffer, die werde ich gleich ersetzen. Viele Grüße, Luke081515 19:08, 8. Aug. 2018 (CEST)
Dieser Botauftrag wird gerade von Luke081515Bot (Beiträge) bearbeitet. Um Konflikte zu vermeiden, warte bitte mit anderen Aktionen, bis diese Markierung entfernt ist, oder kontaktiere den Betreiber (Diskussion).

@Luke081515: Erledigt? -- Quotengrote (D|B|A) 08:07, 19. Dez. 2018 (CET)

Fehlende Artikel in de.wp mit existenten Artikeln in anderen Sprachversionen[Quelltext bearbeiten]

Hallo, es gab mal eine Aktualisierung der Liste der Artikel aus anderen Sprachversionen (Beispiel) auf Portal:Biochemie/Fehlende Artikel, die Merlbot durchführte. Könnte der TaxonBot sowas auch? Oder gibt es eine Möglichkeit (z. B. per Petscan) das händisch zu machen? Viele Grüße, --Ghilt (Diskussion) 14:07, 2. Sep. 2018 (CEST)

Direkte Nutzung der Klasse BoxenVerschmelzen ersetzen; erster Teil[Quelltext bearbeiten]

In unserer Common.css steht die Klassendefinition und wird in jedem der weit über zehn Millionen denkbarer Seitenabrufe eingefügt.

  • Das muss irgendwann über das Netzwerk übertragen werden, und bei jedem Seitenaufbau wird die Seite danach durchsucht.
  • Benötigt wird es aber in deutlich weniger als einem Prozent unserer Seiten.

Ich beabsichtige deshalb, dies langfristig per TemplateStyles zielgerichtet nur in solchen Seiten einzubauen, die das wirklich benötigen würden.

Als erster Schritt sollen Fälle aus dem ANR eliminiert werden, die von Vorlage:NaviBlock übersichtlich abgedeckt werden können.

  • Dabei enthält der von <div class="BoxenVerschmelzen"> eingeschlossene Bereich ausschließlich parameterlose Navigationsleisten.
  • Nicht dazu würde etwa Alexander H. Rice gehören, weil hier ein Parameterwert 0 vorhanden ist.
  • Im ANR gibt es 574 Vorkommen.
  • Sähe etwa so aus.
  • Sollte jedoch nur eine einzige Vorlageneinbindung dazwischen stehen, soll dies ersatzlos entfernt werden.

Besten Dank im Voraus --PerfektesChaos 17:16, 11. Sep. 2018 (CEST)

Mal ein dümmliche Frage, wozu benötigt man den Block?
ohne Block werden alle Navigationsleisten beliebig erweiterbar miteinander verschmolzen
mit Block sieht es ähnlich aus (erschwert aber die Linterfehlersuche durch Schachtelung)
Also zumindest bei mir sieht das fast identisch aus, früher war das mal anders aber seit … ich weiß nicht mehr seit wann, sind die Leisten eigentlich immer verschmolzen, so dass ich den Sinn der Verblockung, außer, dass man sich eine optische Trennlinie spart, nicht erkennen kann. Es sei denn, man würde gezielt zwei Blöcke untereinander haben wollen, die wirklich getrennt wären.
doppelter Block
Zudem zeigt sich bereits im ersten Artikel aus der Suchliste, dass die Blockung nicht immer wirklich tolle Ergebnisse erzeugt. Beispiel Jaguar Cars#Einzelnachweise (die Klasse wird weiter oben verwendet und ist auch dort unnötig) aber das was derzeit im Artikel als Block gedacht ist, hat ein sehr unschönes Layout.
und so sähe es ganz ohne Block aus
Vielleicht wäre es daher sinnvoll mit dem Boxenentschmelzen erst einmal im Vorlagennamensraum (105 Vorkommen) zu beginnen, damit so etwas nicht in den Artikeln verbleibt. Ich sehe zudem weit mehr (2872) dieser class="BoxenVerschmelzen" und ich meine, dass ich auch schon einige davon entfernt habe. --Liebe Grüße, Lómelinde Diskussion 13:20, 12. Sep. 2018 (CEST)
Off-Topic: Will nur anmerken, dass die Mobilversion der "Zeitleiste der Jaguar- und Daimler-Modelle von 1970 bis heute" sehr bescheiden aussieht, die guckt nämlich rechts aus der Box raus. --Wurgl (Diskussion) 13:42, 12. Sep. 2018 (CEST)


  • Es geht um die Linien zwischen den Boxen.
    • Es ist ausdrücklicher Wunsch der Autoren, in zigtausenden von Fällen diese Linien zwischen aufeinanderfolgenden Elementen verschwinden zu lassen, und zwar in über 65.000 Seiten.
    • Es ist hier nicht meine Aufgabe, auch nicht die der Botbetreiber, über ästhetisches Empfinden zu debattieren.
    • Es geht ausschließlich darum, eine optisch gleichartige Lösung zu finden, deren Syntax effizienter und die restlichen Seiten nicht beanspruchend wäre.
    • Ob irgendwelche Autoren das in ihrem Artikel sinnvoll eingesetzt hätten, ist in dem betreffenden Artikel zu diskutieren.
  • Linter ist hier nicht ernsthaft betroffen; Fehler lassen sich auch so schnell einkreisen, optimal aus dem Vorlagen-NR heraus.
  • Diese Seite hier ist der absolut falsche Ort, um über Optik zu räsonieren.
    • Erst recht nicht über irgendeine einzelne Navileiste, die schon für sich irgendwie doof aussehen würde.
    • Vielmehr geht es ausschließlich darum, für Bot-Betreiber die zu ersetzende Syntax übersichtlich klar zu machen.
    • Alle diesbezüglichen Erörterungen haben auf der fraglichen Vorlagendisku zu erfolgen.
  • Die Abschnittsüberschrift endet auf „erster Teil“; wird also wohl einen Gesamtplan geben, was per Bot und was ggf. manuell zu erledigen wäre und in welchen Einzelschritten.

VG --PerfektesChaos 12:47, 13. Sep. 2018 (CEST)

@PerfektesChaos: bin durch, kannst ja nochmal drüber schauen, ob ich einen Fall vergessen habe. -- hgzh 15:08, 26. Sep. 2018 (CEST)

Direkte Nutzung der Klasse BoxenVerschmelzen ersetzen; zweiter Teil[Quelltext bearbeiten]

Schönen Dank; das war die erste Runde, um die Suchtreffer mal zu vereinfachen.

  • Irgendwelche Reste werden wir ganz zum Schluss beim manuellen Aufräumen finden; die kratzen erstmal nicht.
  • Jetzt gibt es vermutlich 987 Fälle im ANR, die zumindest eine Navileiste mit Parametern umschließen.
  • Die hätten folgende Form; Beispiel bei Alexander H. Rice:
<div class="BoxenVerschmelzen">
{{Navigationsleiste 1 mit oder ohne Parameter}}
{{Navigationsleiste 2 mit oder ohne Parameter}}
{{Navigationsleiste 3 mit oder ohne Parameter}}
usw.
</div>
  • Sollte werden:
{{BoxenVerschmelzen}}
{{Navigationsleiste 1 mit oder ohne Parameter}}
{{Navigationsleiste 2 mit oder ohne Parameter}}
{{Navigationsleiste 3 mit oder ohne Parameter}}
{{BoxenVerschmelzen/Ende}}
  • Vorlage:BoxenVerschmelzen
  • Schon mal zur Vorfreude: Wenn zwischendrin keine Navileisten-Vorlagen stehen, sondern div-Blöcke, dann müssten wir uns nach und nach über immer komplexere div-/div-div-/div-div-/div-div-/div-Konstrukte arbeiten, bis nur noch so wenig überbleibt, dass sich der Rest manuell entsorgen lässt.
  • Nachdem wir uns im ANR ausgetobt hätten, müssten schließlich noch projektweit Portale, WikiProjekte und wohl auch BNR-Entwürfe genauso versorgt werden. Aber die große Zahl liegt im ANR, und wenn der erstmal fit ist, dann lassen sich die andern NR und was daran noch pflegenswert wäre besser überblicken.

Besten Dank im Voraus --PerfektesChaos 16:23, 26. Sep. 2018 (CEST)

Beim Zusammensuchen sind mir noch Kombinationen aus Navileiste und Folgenleiste + BoxenVerschmelzen aufgefallen. Das klappt nicht und sieht blöd aus. Ich würde diese Fälle erstmal überspringen, meiner Meinung nach sollte man die Folgen- und Navileisten nicht miteinander zu verschmelzen versuchen, da die Folgenleisten wohl auch uneinheitlich gebaut sind. -- hgzh 19:52, 26. Sep. 2018 (CEST)
Völlig klar.
Der Bot-Lauf bezieht sich ja ausschließlich auf reine Navileisten-Gruppierung; was danach noch mit class= unterwegs ist, wird man sehen. Vermutlich nicht mehr verschmelzen. Wobei, wenn das mal aus Commons.css entfernt wurde, verschmilzt da sowieso nix mehr.
Erstmal die einfachen massenhaften Fälle wegschaffen.
Danach bleibt allerlei Bodensatz an fehlerhaften Verwendungen, Spezialfällen, komplizierter Teile übrig. Die müssen einzeln manuell entschieden werden, aber das geht einfacher, wenn die Suchtreffer begrenzt sind.
Es gibt auch noch gut 50 Vorlagen, die ich mehr oder weniger persönlich abarbeiten werde und wo meist auch weitere Sachen zu richten und auf modernen Stand zu bringen sind.
Dabei fallen Kombinationen aus Navileiste und Zeitleiste wie diese auf, die vollschrottig aussehen. Die werde ich versuchen alle auseinanderzunehmen.
Die <div> sind eine größere Herausforderung, wobei die in einer weiteren Phase zum einen gleichzeitig {{NavFrame}} erhalten sollen, ich zum anderen bei Stichproben vorrangig nur einzelne NavFrame fand, die überhaupt keine mehrfachen Blöcke zum Verschmelzen enthielten; etwa Renault Modus, Mordwinien, Ukulele, Lebendgebärende Zahnkarpfen, Schlacht bei Klissow. Das ist offenbar eine C&P-Schlamperei bei Seitengrößen unter 20 kB, wo einfach irgendwas von irgendwo abgekupfert wurde, ohne zu verstehen was es ist.
Nur munter weiter --PerfektesChaos 23:48, 27. Sep. 2018 (CEST)
erledigt. -- hgzh 15:39, 30. Okt. 2018 (CET)

Direkte Nutzung der Klasse BoxenVerschmelzen ersetzen; dritter Teil[Quelltext bearbeiten]

Es gibt womöglich umschließende BoxenVerschmelzen, die nur eine einzige Folgen- oder Navileiste umfassen – das ersatzlos eliminieren. TIA --PerfektesChaos 11:44, 20. Okt. 2018 (CEST)

erledigt. -- hgzh 15:39, 30. Okt. 2018 (CET)

Direkte Nutzung der Klasse BoxenVerschmelzen ersetzen; vierter Teil[Quelltext bearbeiten]

Es gibt gelegentlich Kombinationen aus zusammenklappbarer Navileiste und statischer Folgenleiste; dies sieht, wie oben schon richtig festgestellt, bescheuert aus und bringt dem Leser keinen Erkenntnisgewinn.

  • Genau eine Navileiste gefolgt von einer oder mehreren Folgenleisten – dann ersatzlos eliminieren.
  • Eine oder mehrere Folgenleisten, gefolgt von genau einer Navileiste – dann ersatzlos eliminieren.

TIA --PerfektesChaos 11:44, 20. Okt. 2018 (CEST)

per Hand erledigt. -- hgzh 16:12, 30. Okt. 2018 (CET)

Direkte Nutzung der Klasse BoxenVerschmelzen ersetzen; fünfter Teil[Quelltext bearbeiten]

Es gibt umschließende BoxenVerschmelzen, die genau ein (!) NavFrame-Konstrukt umfassen; dann ersatzlos eliminieren.

<div class="BoxenVerschmelzen">
<div class="NavFrame">
<div class="NavHead">
</div>
<div class="NavContent">
</div>
</div>
</div>
  • Sollte werden:
{{NavFrame}}
<div class="NavHead">
</div>
<div class="NavContent">
</div>
{{NavFrame/Ende}}

Das erstmal aufräumen; dann kann man beim Rest weitersehen. Bis dann danke schon mal --PerfektesChaos 11:44, 20. Okt. 2018 (CEST)

Nachtrag: In diesem Zusammenhang gibt es auch überflüssige clear:both in eigenen div (steht bereits im Klassen-CSS), und gelegentlich gibt es auch um das NavHead herum redundante div mit align style, die übersichtlicher in einem einzigen Element zusammenzufassen wären. Bräuchte also mehrere Bot-Läufe mit immer ausgefeilteren RegExp. VG --PerfektesChaos 17:43, 20. Okt. 2018 (CEST)

Grafiken zum Wechselkurs zum Euro[Quelltext bearbeiten]

Auf commons liegen eine ganze Menge Grafiken zu Wechselkursen des Euro. Siehe Dateien "File:Euro exchange rate to [ISO-Code-fuer-Waehrung].svg" in c:Category:Euro exchange rate charts. Die Dateien wurden vielen Jahren von User:Gorgo angelegt. Sie wurden per Script (GnuPlot) generiert. Wenn man eine Grafik aktualisieren will, laufen die Scripte heute noch problemlos weil die Quelle, ein durch die Europ. Zentralbank aktualisiertes ZIP-File, 'stabil' ist.

Für die Türkische Lira habe ich drei neue Grafiken angelegt - siehe dazu die Grafiken in Türkische Währungs- und Schuldenkrise 2018 und Türkische Lira#Inflation. Ein Srcipt habe ich soweit vorbereitet, das es problemlos 1zu1 einen einem Bot übernommen werden kann (im Prinzip habe ich das Script nur so erweitert, das es guckt ob ein neues ZIP geholt werden muss).

Die drei Zeilen für das Updaten laufen nur unter Unix ... es kann aber leicht nach Win. Portiert werden. Sowohl für Unix wie auch für Windows können die entsprechenden Zeilen nat. auch ausgelagert werden.

Voraussetztung für einen Bot ist, das Gnuplot installiert ist (unter Unix fast ein muss - unter Window meines Wissens kein Problem). Ansonsten muss das Gnuplot-Scipt nur an Nachmittagen/Anbenden in der Woche gestartet und die erzeugte SVG-Datei nach commons oder deWP hochgeladen werden. Das Einrichten des Bots wäre also denkbar einfach (wenn man denn einen Bot betreibt:-) ).

Das für einen Bot vorbereitete Script findet sich in Bildbeschreibung zu c:File:Euro exchange rate to TRY - Turkish Currency and Debt Crisis 2018.svg. Das Updaten dieser Grafik würde voraussichtlich Ende diesen Jahres beendet. Daher wäre das ein ganz guter Einstieg. Und den Gnutplotteil für andere Grafiken würde ich mich kümmern wenn der Einstieg vielversprechend ist. --SummerStreichelnNote 13:40, 12. Sep. 2018 (CEST)

HeySummer ... hier!,
ich hab heimlich, still und leise da mal bisschen angefangen. Die letzte Version dieser Datei im Beta-Wiki wurde automatisch von einem von mir erstellten Bot-Skript generiert und hochgeladen. Im Moment geht mal nur das genannte File, aber prinzipiell ist das ganze drauf ausgelegt mehrere Dateien nacheinander zu bearbeiten. (Falls der Code von Interesse ist, hier das Git-Repo).
Im Vergleich zum "orginal" GnuPlot Script hab ich den Daten-Update-Teil rausgenommen (mach ich in Python) und die Dateinamen werden per Umgebungsvariable übergeben.
Viele Grüße -- Jogo.obb (Diskussion) 21:10, 21. Sep. 2018 (CEST)
Danke, das sieht doch sehr gut aus. Der Tod eines lieben Menschen den eine eklige chronische Krankheit dahin gerafft hat beschäftigt mich derzeit außerwiki - gerade da tut eine pos. Nachricht wie deine gut! Ich melde mich (kannst auch sehr gerne ohne Rückfrage weiter machen ... es ist ja bekanntlich ein Wiki). --SummerStreichelnNote 02:31, 22. Sep. 2018 (CEST) PS: gleich werde ich c:File:Euro exchange rate to TRY - Turkish Currency and Debt Crisis 2018.svg nochmal updaten ... gerne darf es das letzte mal sein (wobei für mich Orte wie deWP/commons und Dateinamen nachrangig sind).
HalloSummer ... hier!,
das ist wirklich keine schöne Beschäftigung. Mein herzliches Beileid und viel Kraft für Dich und das was vor Dir liegt.
Ich schau mal, die Datei sollte denke ich auf jeden Fall an derzeitiger Stelle auf Commons bleiben. Ich hab das nur im Beta-Wiki getestet, weil ich da selber aufräumen kann. Allerdings muss ich mal noch klären, wie die Regularien für Bots auf Commons aussehen.
Grüße -- Jogo.obb (Diskussion) 08:55, 22. Sep. 2018 (CEST)
i Info: @Summer ... hier!: Ich hab auf Commons jetzt die erste Version halbautomatisch hochgeladen sowie ein Bot-Flag beantragt -- Jogo.obb (Diskussion) 17:14, 24. Sep. 2018 (CEST)
Vielen vielen Dank! Das sieht richtig gut aus. Bevor du weiter machst und später fest stellst das alles umsonst war: nach meiner Auffassung stellt der Graph den Kurs des EUR im Vergleich zur TRY dar (der Kurs steigt). Nach meiner Auffasssung müsste der Kurs der TRY wie in dieser Grafik dargestellt werden (der Kurs sinkt). Ich glaube das einzige Argument für die verwendete Grafik ist, das Benutzer:gorgo es seinerzeit einfach so gemacht hat.
Dies nur als Hinweise, das sich noch was ändern könnte ... mir fehlt zu Zeit dir Kraft da Überzeugungsarbeit zu leisten (meine Leben ist in den letzen Tagen ohnehin ein Pingong von tieftraurigen bis supergeilen Nachrichten ... jedenfalls schön das bei der Grafik ein Anfang gemacht ist). --SummerStreichelnNote 23:49, 24. Sep. 2018 (CEST)
HalloSummer ... hier!, wünsch Dir weiterhin viel Kraft für das wirklich wichtige. Da ist das hier natürlich nebensächlich. Aber schön, wenn es Dir wenigstens eine Freude macht.
Änderungen sind kein Problem, das ist alles nicht hart programmiert und konfigurierbar. Daher kann ich die andere Grafik auch mal zusätzlich rein nehmen.
Gruß -- Jogo.obb (Diskussion) 10:53, 25. Sep. 2018 (CEST)
i Info: @Summer ... hier!: So eben sind die ersten Versionen [9], [10] vollautomatisch von ToolLabs aus hochgeladen worden. Dies sollte jetzt wochentäglich um 17:13 ME(S)Z passieren. Grüße -- Jogo.obb (Diskussion) 17:24, 10. Okt. 2018 (CEST)
Hallo Benutzer:Jogo.obb, von mir an dieser Stelle mal ein dickes Danke. Und falls andere gerne Danke sagen wollen und nicht so recht wissen wofür - hier eine Liste der (bisher) automatisch upgedateten Dateien:
Bis auf die 800px Grafik, bei der es wegen der Auflösung keinen Sinn macht, sind alle Grafiken tagesaktuell. Man siehe dazu die Anzahl der Updates von c:File:Euro exchange rate to TRY.svg - die Grafik, die bisher eingebunden wurde. Beste Grüße in die Runde, --SummerStreichelnNote 18:22, 17. Okt. 2018 (CEST)
HalloSummer ... hier!, es gibt Neues an dieser Stelle. Magst Du Dir mal c:File:Euro_exchange_rate_to_USD.svg anschauen. Dort hab ich exemplarisch umgesetzt, wie ich vorhabe Standard-Fälle alle mit dem selben GnuPlot-Script zu erschlagen. LG -- Jogo.obb (Diskussion) 21:13, 7. Nov. 2018 (CET)

Änderung der Domain des Wien Geschichte Wiki von www.wien.gv.at auf www.geschichtewiki.wien.gv.at (ca. 700 Artikel)[Quelltext bearbeiten]

Das Wien Geschichte Wiki hat im Juli 2018 die Domain von www.wien.gv.at (plus /wiki) auf www.geschichtewiki.wien.gv.at geändert. (Über das Projekt/Geschichte#2018) Die alten URLs sind nicht mehr gültig, es gibt also auch keine Weiterleitung.

Derzeit finden sich laut Suche mit insource noch rund 700 Weblinks die auf die alte Domain zeigen.

Eine Möglichkeit wäre die alten Muster

durch das neue Muster

zu ersetzen.

Alternativ gäbe es auch die Vorlage:WiWi die verwendet werden könnte, sodass bei einer allfälligen weiteren Änderungen nur mehr zentral die Vorlage angepasst werden müsste. Bei der Vorlage ist als zweiter Parameter das Lemma des Artikels auf WiWi anzugeben, sofern dieser vom Lemma des Artikels auf de-WP abweicht.

Vielen Dank! --M2k~dewiki (Diskussion) 21:41, 26. Sep. 2018 (CEST)

Wobei dieser Vorlagenname vorher erstmal auf einen eindeutigen Namen zu verschieben wäre, in dem mindestens das Wort „Wien“ auftauchen müsste.
WiWi“ ist ein sehr verbreitetes Kurzwort für „Wirtschaftswissenschaften“, bei uns sogar direkte Lemma-WL. Sowas als Vorlagenname zu wählen ist katastrophal.
Außerdem würden, wenn man WiWI schon durch überirdische Intelligenz mit „Wien“ assoziiert, viele mögliche Wien-Wikis in Frage kommen, jetzt und im Lauf der Zeit. Dass es hierbei aber speziell und ausschließlich um „Geschichte“ gehen solle, macht der bisherige Name der Vorlage nun überhaupt nicht klar.
Dementsprechend zuallererst mal die Vorlage auf einen geeigneten Titel verschieben, etwa WienGeschichte, notfalls WienGeschi – vor dem endgültigen Namen keine Bot-Aktivitäten, damit das gleich richtig gemacht wird.
VG --PerfektesChaos 23:58, 27. Sep. 2018 (CEST)

Auf {{Wien Geschichte Wiki}} verschoben. Damit sollte der Einwand von PerfektesChaos vom Tisch sein. Modifizierte Botanfrage (Ergänzungen zu oben):

  • alle Verwendungen der {{WiWi}} durch {{Wien Geschichte Wiki}} ersetzen.
  • Unterstriche im Parameter 1 können entfernt werden, die Vorlage macht jetzt einen urlencode:{{{1}}}|WIKI

lg --Herzi Pinki (Diskussion) 10:06, 21. Okt. 2018 (CEST)

Rund 500 Artikel wurden von Benutzer:Invisigoth67 dankenswerterweise mittlerweile manuell korrigiert (Beispiel [11], [12], [13]), offen sind derzeit noch rund 200 Artikel. --M2k~dewiki (Diskussion) 09:37, 25. Nov. 2018 (CET)
Mit den dead links (ohne Vorlagenverwendung) auf die alte Domain habe ich bereits vor einiger Zeit begonnen, die aufgrund der unterschiedlichen Einbindungen und der unterschiedlichen Textierungen wohl eher nichts für einen Bot gewesen wären und händisch gemacht werden mussten. Einige fehlen noch, unter anderem weil die Vorlage gewisse Probleme mit Sonderzeichen hat, darauf habe ich soeben den Vorlagenersteller Herzi Pinki angesprochen. Was das Ändern der alten Vorlage auf die neue betrifft (ca. 1000 betroffene Artikel), könnte das sehr wohl ein Bot erledigen (oder ich mache das nebenher), oder wir belassen die Vorlage WiWi als Weiterleitung, was zwar kurzfristig hamsterschonender ist, aber natürlich die Gefahr birgt, dass Kollegen, die die alte Vorlage gewohnt sind, sie fleißig weiterverwenden. lg --Invisigoth67 (Disk.) 12:19, 25. Nov. 2018 (CET)

Links zu Natura2000-Steckbriefen[Quelltext bearbeiten]

Beim Bundesamt für Naturschutz gibt es für jedes FFH- oder EU-Vogelschutzgebiet einen Steckbrief, der aus der Wikipedia häufig verlinkt ist. Ende letzten Jahres hat das BfN die Linkstruktur umgestellt. Nicht aktualisierte Links führen auf eine Auswahlseite, von der aus man den Steckbrief mit etwas Mühe auch finden kann.

Die neuen Links des BfN hatten zunächst ein anderes Format, das zum Glück nochmal in das unten vorgestellte geändert wurde. Dieses Format ist seit Ende November 2017 unverändert. Eine kleine Diskussion dazu gab es auf Portal_Diskussion:Umwelt-_und_Naturschutz#Probleme_mit_Natura2000_Vorlage. Ich würde die Links gerne durch einen Bot an das neue Format anpassen lassen. Es sind etwa 6000 Links, meist von den Listen der FFH- oder Vogelschutzgebiete aus oder aus den Gebietsartikeln.

Die alten Links enthalten den Typ, der die Werte "ffh" oder "spa" (Special Protected Area, Vogelschutzgebiet) annehmen kann. Außerdem enthalten sie die Kennnummer des Gebiets, ohne die sonst üblichen Bindestriche. Typ und Kennnummer sollen aus dem alten Link extrahiert und in den neuen Link eingebaut werden.

Beispiel alt:

http://www.bfn.de/0316_steckbriefe.html?&tx_n2gebiete_pi1%5Bbundeslandspa%5D%5B0%5D=BY&tx_n2gebiete_pi1%5Bdetail%5D=spa&tx_n2gebiete_pi1%5Bsearchspa%5D=Suche%20starten&tx_n2gebiete_pi1%5Bsitecode%5D=DE6331471&tx_n2gebiete_pi1%5Bspid%5D=4624

Beispiel neu:

https://www.bfn.de/themen/natura-2000/natura-2000-gebiete/steckbriefe/natura/gebiete/show/spa/DE6331471.html

Wer kann diese Aufgabe erledigen? Viele Grüße, --Blech (Diskussion) 21:40, 3. Okt. 2018 (CEST)

Würde sich bei dieser grossen Anzahl nicht das Erstellen und Einbinden einer Vorlage anbieten? --Leyo 01:18, 4. Okt. 2018 (CEST)
Es gibt bereits die Vorlage:Natura 2000, die sich für diese Zwecke eignen würde. Ob es sinnvoll ist, kann ich nicht beurteilen. Viele der Links stecken in Kategorie:Liste (FFH-Gebiete in Bayern) und Kategorie:Liste (EU-Vogelschutzgebiete in Bayern). Die Listen verwenden die Vorlage:NaturGeoTabelle DE/Zeile, kann sich das mit Vorlage:Natura 2000 beißen? Für die Tabellen würde sich die Vorlage mit folgender Parametrierung eignen:
{{Natura 2000|Typ=spa |Box=ja |Nummer=DE-6331-471}}
führt zu: DE-6331-471
Bei Referenzlinks wäre unter Umständen eine andere Parametrierung geeigneter.
Das DE in der Nummer und die Bindestriche scheinen optional zu sein, die Vorlage fügt sie automatisch in den Link ein bzw. entfernt sie. Die eigentliche Nummer wird üblicherweise nach dem Muster DE-nnnn-nnn dargestellt. --Blech (Diskussion) 21:38, 4. Okt. 2018 (CEST)
Diese Aufgabe kann ich mit meinem neuen AyudaBot angehen. Ich habe schon gemerkt, dass die empfohlene Natura 2000-Vorlage nicht verwendet werden sollte, wenn der Link bereits in einer Vorlage (z.B. Vorlage:NaturGeoTabelle DE) enthalten ist. Daher nehme ich in diesen Fällen den "normalen" Weblink auf die neue Seite. --Don Manfredo (Diskussion) 21:19, 27. Nov. 2018 (CET)
@Don Manfredo: Was ist hier der Stand? --Leyo 02:03, 8. Jan. 2019 (CET)
@Leyo: Die Listen der Vogelschutzgebiete sind fertig, die der FFH-Gebiete in Bayern auch. Bei den Listen der FFH-Gebiete in anderen Bundesländern kann bzw. sollte mehr gefixt werden als nur der Link zum BfN. Vermutlich werden die Listen mit Daten von Wikidata neu erzeugt. Falls es klappt, muss sich der Bot dann nur noch um Einzelartikel mit verstreuten Links kümmern. --Don Manfredo (Diskussion) 00:20, 15. Jan. 2019 (CET)

Gekaperte Links zu djfl.de auf Archivversion ändern[Quelltext bearbeiten]

Der Link http://www.djfl.de/ führte einst zu dem, nach dem Tod des Namensgebers eingestellten, Dirk Jasper Filmlexikon. Alleine im Artikelnamensraum haben wir ca. 240 Links zur Website, teils als Weblink, teils als Beleg (www.djfl.de, djfl.de). Seit einiger Zeit führen die Links zu einer Werbeseite/Community für Blu-Ray-Discs. Laut Diskussion unter Wikipedia:Redaktion Film und Fernsehen#Dirk Jasper Filmlexikon sind die Links zwar an sich nicht besonders wertvoll, insbesondere die Belege können jedoch nicht einfach gelöscht werden. Um das jeweils genauer beurteilen zu können, müsste zunächst der Archivlink herausgesucht werden. Darum nun die Bitte, die Links per Bot auf web.archive.org umzustellen. Sinnvoll wäre es, wenn die Links zur weiteren Überprüfung gekennzeichnet würden und als Sahnehäubchen die Artikel in eine eigene Wartungskategorie kämen (letzteres ist allerdings meine persönliche Spontanidee). --Sitacuisses (Diskussion) 00:50, 11. Okt. 2018 (CEST)

Man könnte die URL jeweils mit der Vorlage:Toter Link markieren. Die zweitgenannte Domain kommt nur noch dreimal vor und kann daher schneller von Hand erledigt werden. --Leyo 02:07, 8. Jan. 2019 (CET)

Wikipedia:Liste der am längsten geschützten Artikel automatisieren[Quelltext bearbeiten]

Hallo, bislang hat Benutzer:Reinhard Kraasch händisch von Zeit zu Zeit, also halbautomatisch die Listen aktualisiert. Das geht jetzt nach seiner Aussage nicht mehr, da sich einiges in der API geändert hat. Mag jemand seinen Bot beauftragen die Listen etwa im monatlich zu aktualisieren. Und zwar wie folgt (unter Wikipedia:Liste der am längsten geschützten Artikel auch beschrieben):

Unterlisten für

  • keine Redirects
  • keine BKLs
  • keine Falschschreibungen
  • älter als 30 Tage
  • es muss eine edit-Sperre vorhanden sein (nicht nur move-Sperre)
  • bei /sysop nur solche, die eine edit=sysop Sperre haben (Seite kann nur von Administratoren bearbeitet werden)
  • bei /editeditor nur solche, die eine edit=editeditorprotected Sperre haben (Seite kann nur von aktiven Sichtern bearbeitet werden)
  • bei /autoconfirmed ‎nur solche, die eine edit=autoconfirmed ‎Sperre haben (Seite kann nur von Benutzern, die mindestens vier Tage angemeldet sind, bearbeitet werden)
  • es wird nur die jeweils letzte Sperre betrachtet

Danke und Gruß --Zulu55 (Diskussion) 16:30, 24. Okt. 2018 (CEST)

Ich versuch mich mal daran. --Wurgl (Diskussion) 21:44, 24. Okt. 2018 (CEST)
@Wurgl: Klasse, ich bin gespannt. --Zulu55 (Diskussion) 08:52, 25. Okt. 2018 (CEST)
@Zulu55, Reinhard Kraasch: Diese Spezialfälle nerven. Abhängigkeit (Medizin) hat einen Schutz, aber der ist nicht auf die Seite gesetzt worden, sondern … ja worauf eigentlich? Werden beim Verschieben von Seiten die Locks dupliziert? Und was soll ich bei der Seite als Beginn-Datum schreiben? Das Datum des Verschiebens oder das des ursprünglichen Locks? Ist zwar bei der Seite gehüpft wie gesprungen, aber wenn eine Seite erst vor ein paar Tagen verschoben wurde, dann schlüpft die durch. --Wurgl (Diskussion) 20:46, 25. Okt. 2018 (CEST)
Hab mal den APPERbot von der Leine gelassen. Sind sicher noch ein paar Fehlerchen drinnen, einfach murmeln. Die Seiten werden am 1. und 15. eines jeden Monats neu geschrieben. --Wurgl (Diskussion) 23:20, 25. Okt. 2018 (CEST)
@Wurgl: Vielen Dank. Wikipedia:Liste der am längsten geschützten Artikel/sysop funktioniert offenbar nicht, ist leer. --Zulu55 (Diskussion) 08:26, 26. Okt. 2018 (CEST)
Klares Nein! Sysop-Sperren sind auf Marokko, Kartoffel, Junge_Welt, Klaus_Kleinfeld, Verband_der_Islamischen_Kulturzentren, Peter_Spary, Herbert_Kickl, Vaskonische_Hypothese, Landtag_Steiermark, José_Sánchez_de_Murillo, Altfränkische_Sprache, Neuköllner_Begegnungsstätte und Blankett_(Gericht) und die Seiten sind alle erst seit wenigen Tagen gesperrt. --Wurgl (Diskussion) 09:01, 26. Okt. 2018 (CEST)
@Wurgl: Reden wir hier aneinander vorbei? Genau, die von dir genannten Seiten würde ich dort erwarten. Bei mir ist Wikipedia:Liste der am längsten geschützten Artikel/sysop allerdings leer. Warum sollten die genannten nicht angezeigt werden? --Zulu55 (Diskussion) 10:12, 26. Okt. 2018 (CEST)
Achso, wegen älter als 30 Tage - na dann nichts für ungut... --Zulu55 (Diskussion) 10:16, 26. Okt. 2018 (CEST)
@Wurgl: Da scheint noch was nicht zu stimmen: Sex wurde zuletzt 2015 auf editeditor geschützt. Es erscheint korrekt auch in Wikipedia:Liste der am längsten geschützten Artikel/editeditor, allerdings mit Datum und Begründung für die vorherige autoconfirmed-Sperre. --Zulu55 (Diskussion) 08:36, 26. Okt. 2018 (CEST)
@Wurgl: noch ein Beispiel: Antifa wird in der Tabelle Wikipedia:Liste_der_am_längsten_geschützten_Artikel/autoconfirmed aufgelistet, mit Daten zu einer sysop-Sperre --Zulu55 (Diskussion) 08:39, 26. Okt. 2018 (CEST)
Die Seite Sex ist seit 2006 durchgehend gesperrt, in 2015 wurde die Sperre geändert. Was ist nun die letzte Sperre? Die letzte Änderung oder ist das der letzte Zeitpunkt vom Übergang offen --> gesperrt? Das ist eine Definitionsfrage. Geändert ist das schnell, aber da will ich noch die eine oder andere Meinung hören. --Wurgl (Diskussion) 08:57, 26. Okt. 2018 (CEST)
Ok, also mich interessiert immer die aktuelle, bestehende Sperrart (also die letzte Änderung) und die entsprechenden Daten dazu. Ich benutze die Seite um aktuell bestehende Sperren zu beurteilen. So wie jetzt kann ich die Listen nicht nutzen. Das ist im Übrigen auch die Interpretation in Spezial:Geschützte_Seiten. In der Version von Benutzer:Reinhard Kraasch war das auch immer so. --Zulu55 (Diskussion) 09:37, 26. Okt. 2018 (CEST)
Also es gibt ein paar Sonderfälle: Chronologie_des_Zweiten_Weltkrieges, Kurden_in_der_Türkei, Mongolide, Neonazismus, Ostjuden_und_Westjuden, Penisring Schamlippe. Diese sind alle gesperrt, du findest im Log aber nix zu den Seiten. Die Sperre ist sehr alt und damals wohl sind Sperren die durch Verschieben von Artikeln mitverschoben wurden, nicht geloggt worden.
Und dann sind da noch ca. 170 Seiten, die mitsamt Sperre verschoben wurden, ein paar davon: Affen (4 mal verschoben), Anus (auch 4 mal verschoben), Arschloch (2 mal verschoben), Außerchristliche_antike_Quellen_zu_Jesus_von_Nazaret (1 mal), etc. Bei denen findest du im Log auch einen anderen Eintrag. --Wurgl (Diskussion) 10:25, 26. Okt. 2018 (CEST)
Wenn nichts im Logbuch steht, dann sollte das meiner Ansicht nach auch in der Tabelle so wiedergegeben werden (leeres Feld). --Zulu55 (Diskussion) 10:39, 26. Okt. 2018 (CEST)
Die Sonderfälle könnte man doch durch kurzes Entsperren und wieder Sperren bereinigen? 129.13.72.197 10:43, 26. Okt. 2018 (CEST)
dann wären es aber keine "am längsten gesperrten" mehr. Bei gesperrten ohne Log kann man doch die längste Sperre annehmen und "seit Prä-Log-Zeit" dazuschreiben. – Doc TaxonDisk.Wikiliebe?! 12:04, 26. Okt. 2018 (CEST)
Der Eintrag "move_prot" fehlt einfach. Wenn der da ist, dann pfriemel ich mir das alte Lemma aus dem Logtext und suche dort weiter. Wegen dieser 7 Fälle (die wohl nicht mehr werden) bastel ich nicht extra Code, ich hab per Hand die Sperre aus der Versionsgeschichte rausgesucht und per Copy/Paste in das Script eingetragen – ist einfach weniger Aufwand. (Diese Textkopien werden natürlich nur eingesetzt, wenn sich nix findet. Sollte die Sperre mal entfernt werden, dann kommt das natürlich nicht.) --Wurgl (Diskussion) 12:25, 26. Okt. 2018 (CEST)
ist doch okay so, – Doc TaxonDisk.Wikiliebe?! 12:50, 26. Okt. 2018 (CEST)

@Wurgl: Sind wir uns dann einig, dass die Daten der letzten Sperre jeweils angezeigt werden sollen? Setzt du das dann noch um? --Zulu55 (Diskussion) 09:51, 29. Okt. 2018 (CET)

Nö, nicht einig :^) Die Sperre beim Artikel Sex wurde 2006 gesetzt. Seit der Zeit ist der Beitrag durchgehend ohne eine Sekunde Unterbrechung gesperrt. 2015 wurde die Sperre geändert, siehe Sperrlog. --Wurgl (Diskussion) 10:08, 29. Okt. 2018 (CET)
@Benutzer:Wurgl: Klar, hab ich verstanden, dass man das so oder so interpretieren kann. Wie gesagt sind das ja auch die Daten die via Spezial:Geschützte Seiten angezeigt werden, vielleicht ein Indikator das das noch mehr so wünschen und interpretieren. Und wie gesagt war das bei der alten Version von Benutzer:Reinhard Kraasch auch so. Mir würde wie gesagt nur die Interpretation als letzte Sperre für die Abarbeitung nutzen. Ich konnte damit bislang gut veraltete Sperren auffinden. Bislang hatte ich also ein Tool für einen Zweck, dass ich jetzt nicht mehr benutzen kann. Es geht ja letztlich um die Anwendung der Seite. Was wäre mit der Lösung beide Varianten anzubieten? Oder wir nennen es halt um: Liste der längsten aktuell gültigen Artikelschutze. ;-)
Auf wessen Interpretation würdest du denn noch warten wollen? So viele Leute lesen hier ja nicht mit... @Doc Taxon, @Benutzer:Reinhard Kraasch: Was meint ihr? --Zulu55 (Diskussion) 09:56, 30. Okt. 2018 (CET)
Also ich bin da emotionslos, da nur Lieferant und nicht Nutzer der Seiten. --Reinhard Kraasch (Diskussion) 11:35, 30. Okt. 2018 (CET)
So besser? Im Kommentar ist dann die letzte Sperr-Änderung zu lesen. --Wurgl (Diskussion) 21:12, 31. Okt. 2018 (CET)
@Wurgl Hm, ich müsste danach sortieren können, und ich bräuchte den letzten Sperrkommentar ebenfalls in einer eigenen Spalte. Könntest du aus dem Datum und dem Kommentar vielleicht jeweils eine eigene Spalte machen? --Zulu55 (Diskussion) 10:06, 2. Nov. 2018 (CET)
@Benutzer:Wurgl: Hallo, ich hatte dich zwischenzeitlich ja auch auf deiner Benutzerseite noch mal angesprochen: Könntest du dich bitte äußern, wie bzw. ob da jetzt von dir noch was kommt? Ich hänge so etwas in der Luft, weil ich darauf warte, ob ich mit dem Tool weiterarbeiten kann oder nicht. Wie gesagt: Ich bräuchte statt Datum und Kommentar des ältesten Sperrbeginns Datum und Kommentar des neuesten Sperrbeginns. Am liebsten in eigenen Listen, falls du die aktuellen bestehen lassen möchtest. Beste Grüße und vielen Dank für deine bisherige Arbeit daran. --Zulu55 (Diskussion) 10:44, 5. Dez. 2018 (CET)
Hab ich doch gemacht? Gibt eine zweite Spalte mit dem Datum. --Wurgl (Diskussion) 10:48, 5. Dez. 2018 (CET)
Entschuldige, die neue Spalte mit dem Datum ist mir nicht aufgefallen. Jetzt bräuchte ich noch getrennt den letzten Kommentar. Dann wäre ich glücklich :-) --Zulu55 (Diskussion) 11:11, 5. Dez. 2018 (CET)

Artikelneuanlagen listen, zu denen es bereits eine LD gab[Quelltext bearbeiten]

Früher™ gab es den FzBot, der täglich Artikelneuanlagen gelistet hat, zu denen es bereits eine LD gab.

Ansatz wäre, bei Artikelneuanlagen die verlinkten Seiten zu überprüfen, und falls sich unter den verlinkten Seiten Löschdiskussionsseiten befinden, wird untersucht ob der Artikel im Titel (== xxx ==) vorkam.

Das hat sich in der Vergangenheit als sehr nützlich erwiesen, schließlich kann die Eingangskontrolle nicht alle LDs inklusiv LP-Ergebnis auswendig kennen. Diese recht übersichtliche Liste zu überprüfen hat seinerzeit in vielen Fällen durch die kalte Küche nachgeschobene Neuanlagen erkennen lassen.

Zusatzpunkte in der B-Note gäbe es für eine Soundex-Berücksichtigung, selbst wenn da false positives dabei sind, ist das auch ein beliebter Trick, der Entdeckung durch vielbeobachtete oder gesperrte Lemmata zu entgehen. Aber das wäre wirklich ein Sahnehäubchen, wenn das die Programmierung nachhaltig verzögert, lieber ohne als gar nicht.

Weil der Taxonbot ja sowieso schon über vergangene LDs schwer Bescheid weiß, mal ein ping an @Doc Taxon:, mit der freundlichen Nachfrage, ob Du das bitte mit auf Deine To-Do-Liste nehmen magst?

Sich herzlich im Voraus bedankend grüßt das Eloquenzministerium (Diskussion) 17:40, 27. Okt. 2018 (CEST)

@Eloquenzministerium: ja, das wäre ganz nett, aber so was könnte ich wirklich erst angehen, wenn ich gerade nichts weiteres reparieren muss. Im Moment habe ich aber wirklich viel auf der ToDo. – Doc TaxonDisk.Wikiliebe?! 18:02, 27. Okt. 2018 (CEST)

Vielen Dank für die prompte Reaktion, Doc Taxon. Wenn Du es überhaupt mit auf die Liste nimmst wäre das schon super. Kannst Du einen Zeitrahmen abschätzen, wann das durch Dich realisierbar wäre? Wenn Du Empfehlungen hast, wer weniger überlastet ist und, vielleicht mit Hilfe von Dir zur Verfügung gestelltem code, Dir das gänzlich vom Hals halten könnte, ist das auch eine Lösung. Wie komplex wäre das denn, ich bin zwar nicht so der begnadete Programmierer, aber wenn es gar nicht anders geht, würde ich dann schauen, ob ich mir zutraue, mich da einzuarbeiten. Eloquenzministerium (Diskussion) 18:37, 27. Okt. 2018 (CEST)

Ja, so eine Liste wäre wirklich gut :-) Wäre schön (analog zur Funktionsweise von Wikipedia:Löschkandidaten/Nicht eingetragen) eine Arbeitsliste Wikipedia:Löschkandidaten/Neuangelegte Löschkandidaten (oder ähnlicher Name).
Und ja, ich glaube Doc Taxon hat wirklich bereits genug zu tun. Ich hoffe, es findet sich vielleicht ein anderer Botbetreiber. Dass der Aufwand, einen solchen Automatismus einzurichten, vielleicht nicht ganz sooo groß ist.
Viele Grüße, -- Toni (Diskussion | Hilfe?) 21:23, 27. Okt. 2018 (CEST)

Ich habe dazu vor ein paar Wochen einen Query erstellt, aber gerade keine Zeit, einen Bot einzurichten. Vielleicht nutzt das ja jemandem als Übergangslösung oder Anregung für einen Bot. --Count Count (Diskussion) 11:01, 28. Okt. 2018 (CET)

Na gut, die Liste ist eher schneller gemacht, aber zunächst ohne Soundex. Wenn FzBot das früher mal gemacht hat, dann fragt doch mal @Filzstift, ob er das wieder aufnehmen würde. Falls nicht, mach ich mich mal da ran. – Doc TaxonDisk.Wikiliebe?! 13:51, 28. Okt. 2018 (CET)
Super. Filzstift hat auf seiner Admin-Kandidatur-Disk ausführlich erläutert, weshalb er in dieser Hinsicht nicht erneut tätig werden möchte[14]. Da Du aktuell mit dem in diesem Ressort bereits aktivem bot der ausgewiesener Experte in diesem Bereich bist, wäre das trotz Deiner Auslastung vermutlich die global am wenigstem Ressourcen beanspruchende Lösung. Soundex ist ein optionales Sahnehäubchen, das warten kann. Mad props im Voraus für eine Umsetzung dieser allerseits sehnlich erwünschten Ergänzung der LD. Im Voraus herzlich dankend grüßt das Eloquenzministerium (Diskussion) 22:47, 28. Okt. 2018 (CET)
Kann das nur wie erwähnt bestätigen, ich bin im Moment eigentlich ausserstande, so was auf die Beine zu stellen. --Filzstift  10:53, 29. Okt. 2018 (CET)
Mal als nicht-technikaffiner Benutzer die vielleicht naive Frage: Wenn das Ganze doch schonmal funktioniert hat, kann man da nicht eine Art "Wiederherstellen-Button" drücken und es läuft wieder? ;-) Grüße, -- Toni (Diskussion | Hilfe?) 14:51, 29. Okt. 2018 (CET)
Was meinen Code betrifft, so kannst du das fürs Erste mal vergessen: Da der Bot auch Benutzer:FzBot/Statistiken, das Statistiken zu Löschdiskussionen lieferte, pflegte (da diese Seite gelöscht ist: Dort und in den folgenden Abschnitten eine Auswertung aus diesen Statistiken), lief das ganze über eine Datenbank, in der sämtlichen Löschdiskussionen abgelegt waren. Tauchte ein neuer LK auf, so guckte FzBot in der Datenbank nach Wiedergänger nach. Diese Datenbank habe ich nicht mehr, sie müsste neu aufgebaut werden. Würde ich also den Reset-Button tun, müsste ich 1) mal den Code finden, 2) die Datenbank neu initialisieren, 3) eine in einer Cloud gehosteten VM einrichten und das Ganze zum Laufen bringen. Das führt zur folgenden Überlegung: Werden keine entsprechenden Statistiken gewünscht, so braucht es auch keine Datenbank. Dann kann das Ganze schlank gehalten werden, indem über Spezial:Linkliste nach Wiedergänger gesucht wird, so wie wir Menschen das tun würden. Das würde bedeuten, ich müsste mich in Wikimedia Labs einarbeiten und das Ganze neu schreiben (mein Code läuft nicht auf Wikimedia Labs), da andere Cloud-Lösungen nämlich was kosten - und da schliesst sich der Kreis: TaxonBot hat fast alles bereits. --Filzstift  15:18, 29. Okt. 2018 (CET)
Ergänzend vielleicht noch: Eine Datenbank ist dann hilfreich, Wiedergänger auch bei abweichendem Lemma (Leerzeichen, Interpunktion, Klein-/Grossschreibung) zu finden. Mit Spezial:Linkliste klappt das nicht. Glaube, das damals so implementiert zu haben. --Filzstift  15:31, 29. Okt. 2018 (CET)
Ja okay, ich schau mir das mal an, – Doc TaxonDisk.Wikiliebe?! 23:52, 29. Okt. 2018 (CET)
Ich versuche morgenheute eine Query dazu basteln. Die Ähnlichkeitssuche mag ein Problem sein, SOUNDEX ist wohl die einzige Funktion die mysql zur Verfügung stellt, ob das okay ist wird sich entscheiden. Möglicherweise müssen dann noch mehrfache Ergebnisse gefiltert werden, das kann auftreten wenn es bereits mehrere Löschdiskussionen zu einem Lemma gab. --Wurgl (Diskussion) 00:38, 30. Okt. 2018 (CET)
Klappt leider nicht. SOUNDEX() eignet sich überhaupt nicht, viel zu viele "Ähnlichkeiten" z.B: Susi Handschmann und Schock (Medizin) werden als ähnlich gefunden. --Wurgl (Diskussion) 09:47, 30. Okt. 2018 (CET)
Zumindest Interpunktionen, Leerzeichen, Klein-/Grosschreibung, evtl. auch Diakritika oder ß/ss wären toll. Bei einer eigenen DB einfach, direkt wie bei Quarry dürfte das wohl schwierig sein (und auch schwierig, LD zu Artikeln, die behalten wurden, zu finden, oder?). --Filzstift  10:09, 30. Okt. 2018 (CET)
Richtig! Groß-Kleinschreibung ist kein Thema, das ist trivial. Sonderzeichen sind dank UTF-8 schon ein Problem, weil die Liste ziemlich beliebig lang wird, die Datenbank hat keine Zeichenklassen bzw. mir ist nichts darüber bekannt (diese REGEXP-Funktion kann das eventuell, aber das ist bei Datenbanken nicht so mein Gebiet). ß/ss oder sz ist auch nicht trivial, das hoffte ich durch SOUNDEX abzufangen. Ebenso v/w bei transskribierten kyrillischen Namen (wobei v/w das einfachste Beispiel ist). Ev. muss man da mit sowas wie Levenshtein-Distanz rangehen. Behaltener Artikel fällt raus, den gibts ja schon, der kann ja nicht gerade angelegt worden sein, nur behaltener Artikel der danach irgendwann verschoben wurde wäre ein Fall. --Wurgl (Diskussion) 11:25, 30. Okt. 2018 (CET)
Filzstifts Vorschlag ist gut, zusätzlich vielleicht noch den Klammerzusatz bei Klammerlemmata nicht beim Vergleich berücksichtigen. Funktioniert SOUNDS_LIKE() genauso schlecht? Ist halt doof, daß das auf englisch optimiert ist und offenbar auch keinen fudge-factor hat, mit dem man die Empfindlichkeit einstellen könnte. Wenn man eine db hat, könnte man auch noch auf Ähnlichkeiten bei Artikeltext und Kats gucken. Die Ergebnisliste sollte dann auch klar unterscheiden zwischen in Lemma A wurde nach LD identisch neu angelegt und dem Fall Lemma B ähnelt Lemma C.
Wie dem auch sei, super wäre erstmal überhaupt anzufangen, das Sahnehäubchen alternatives Schreibweisen kann gern später dazukommen, wobei es natürlich schon schön wäre, wenn es in der Richtung auf der gewählten Plattform dafür realistische Umsetzungsmöglichkeiten gäbe. Eloquenzministerium (Diskussion) 11:11, 30. Okt. 2018 (CET)
Wurgl, Du schriebst: "Möglicherweise müssen dann noch mehrfache Ergebnisse gefiltert werden, das kann auftreten wenn es bereits mehrere Löschdiskussionen zu einem Lemma gab." Das ist weder notwendig, noch wünschenswert. Wenn es zu einem Lemma elf LDs gab, dann ist das, unabhängig vom jeweiligen Ausgang, eine signifikante Information.
Ein toller Bonus wäre es auch, wenn neben LDs auch LPs zum Lemma gefunden würden. Das gilt auch für den bereits laufenden Taxonbot-job bei den LK.
Hier mal ein überkreuz-ping, da es sich um Diskussionen im Bereich LD/LP handelt an @Xqt:. Siehe auch: Benutzer_Diskussion:Xqt#Erweiterungsvorschlag_für_deinen_Bot. Vielleicht besteht ja hier eine sinnvolle Kooperations-Möglichkeit, um doppelte Arbeit zu vermeiden.
Eloquenzministerium (Diskussion) 14:37, 30. Okt. 2018 (CET)

Letzte Aktivität der WP:Botschafter[Quelltext bearbeiten]

Die Liste der diplomatischen Vertreter in anderssprachigen Wikipedien WP:Botschaft enthält zum Teil seit Jahren inaktive Mitarbeiter. Ein entsprechender Baustein steht dort schon eine Weile, ohne daß es sich gebessert hätte. Ist ja auch klar, die wenigsten denken vor einer ausgedehnten Wiki-Pause daran, ihr Amt offiziell niederzulegen.

Ich würde mir wünschen, wenn dort einmal am Tag ein bot drübergeht und hinter den jeweiligen Benutzernamen zuletzt aktiv vor xx Tagen dazuschreibt.

Bonuspunkte, wenn die Liste vom aktivsten zum inaktivsten sortiert wird. Kann man auch gern zu einer sortierbaren Tabelle pro Land mit defaultsort auf die vom bot eingetragene letzte Aktivität umbauen. Wenn mir ein williger botbetreiber erklärt, wie sie aussehen soll, baue ich die auch.

So wird sofort deutlich, von welchem der oft zahlreichen Botschafter für eine Sprache am ehesten eine zügige Antwort zu erwarten ist. Gleichermaßen wird Ernennungsbedarf erkennbar, den man gegebenenfalls an das passende Portal weiterleiten könnte.

Hier habe ich auf diese Diskussion verlinkt Wikipedia_Diskussion:Botschaft#Bot-Anfrage:_Letzte_Aktivität_der_WP:Botschafter, damit sich interessierte Diplomaten ebenfalls zu Wort melden können.

Ich würde mich sehr freuen, wenn sich jemand um die verbesserte Erreichbarkeit unseres diplomatischen Corps verdient machen würde. Vielen Dank im Voraus sagt das Eloquenzministerium (Diskussion) 18:26, 3. Nov. 2018 (CET)

+1. Zusätzlich / als Alternative könnte man vielleicht auf die Diskussionseiten der entsprechenden Länderportale verweisen (also z.B. auf Portal_Diskussion:Dänemark für Anfragen auf dänisch. Ist auch nicht perfekt, aber immer noch besser, als jahrelang inaktive Benutzer zu kontaktieren. --Tkarcher (Diskussion) 19:31, 3. Nov. 2018 (CET)
Prima Idee, wobei man da sicher auch die letzte Aktivität dort vermerken sollte, in dem Bereich gibt es ja auch so allerlei Eingeschlafenes. Eloquenzministerium (Diskussion) 20:08, 3. Nov. 2018 (CET)

Navigationsleisten Städte und Gemeinden der ungarischen Kreise[Quelltext bearbeiten]

Hallo zusammen, für die ungarischen Ortsartikel müssten die Navigationsleisten der alten Kleingebiete auf die der neuen Kreise (seit 2013) umgestellt werden. Dazu habe ich bereits den Code der Navigationsleisten zusammengestellt und erst einmal in meinem Benutzernamensraum geparkt (Benutzer:Földhegy/UngarnNavis). Ein Bot müsste also „nur“ noch die fehlenden 160 Navigationsleisten aus den aufgelisteten Kopiervorlagen anlegen. Außerdem wäre es wünschenswert, anschließend

  • die Vorlagen in die Artikel der Kategorie:Ort in Ungarn einzubinden und die eventuell vorhandenen alten Kleingebiet-Navigationsleisten aus selbigen zu entfernen.
  • falls noch nicht vorhanden, den Kreis in der Infobox zu ergänzen.
  • eine Wartungsliste der Artikel anzulegen, bei denen ein Konflikt zwischen der derzeitigen Kreisangabe in der Infobox und der Navigationsleiste besteht (gerne auf meiner Benutzer-Unterseite)

Vielen Dank im Voraus! LG, --Földhegy (Diskussion) 22:22, 12. Nov. 2018 (CET)

@Földhegy: ich habe momentan keine Zeit, den Bot so zu programmieren, habe aber deine Liste mal testweise so umgestellt, dass für jede Navileiste der vorgesehene Text als Preload genutzt wird und diese dann nur noch abgespeichert werden muss. Wenn dir das nicht gefällt, kannst du auch gern zurücksetzen. -- hgzh 13:01, 14. Nov. 2018 (CET)
@Hgzh: Vielen Dank, das Anlegen hat auf diese Weise jetzt schnell & unkompliziert geklappt! Tatsächlich war es sogar genau das, was ich bei meiner Anfrage auf FzW im Kopf hatte. :) Das Einbauen der Navigationsleisten in die >1000 Artikel müsste nichtsdestotrotz ein Bot übernehmen, aber es eilt nicht. LG, --Földhegy (Diskussion) 22:14, 15. Nov. 2018 (CET)

Bot bzw. Wartungsliste Biologie[Quelltext bearbeiten]

Hallo zusammen, kennt sich jemand hier gut mit der Struktur von Taxoboxen aus und könnte einen Bot erstellen der eine Hinweisliste erstellen kann. Ich möchte möglichst viele fehlende Klammern bei Art- und Unterart-Autoren in den Zoologie Taxoboxen ermitteln um sie zu korrigieren, eine manuelle Überprüfung ist einfach extrem zeitaufwendig bei den etwa 30.000 zoologischen Art-Taxoboxen. Es gibt die Regel in der Zoologie das eine Klammer immer dann um Autor und Jahr gesetzt wird, wenn sich die Gattungszuordnung der Art nach der Erstbeschreibung geändert hat. Daraus folgt, immer wenn das Jahr bei einen Autor einer Gattung später liegt als das Jahr bei dem Autor einer zugehörigen Art oder Unterart, muss eine Klammerung um den Autor und Jahr in der Taxobox der Art, weil die Gattung bei der Erstbeschreibung noch nicht existiert hat und somit auf jeden Fall immer eine Gattungsänderung erfolgt sein muss. In diesem Fall soll der Bot einen Hinweis generieren, wenn keine Klammern um den Autor mit Jahr stehen. Ein Bot müsste um entsprechende Hinweise erzeugen zu können die Jahresangabe bei Autoren von zoologischen (Alle Taxoboxen mit Jahresangabe bzw. mit vorhandenen Komma bei Taxon_Autor, das Jahr ist vom Namen des Autors normalerweise durch ein Komma getrennt) Gattungs-Taxoboxen (Taxoboxen mit Taxon_Rang = Gattung) mit den Jahresangaben der Taxoboxen der untergeordneten Arten (Taxoboxen mit Taxon_Rang = Art) und Unterarten (Taxoboxen mit Taxon_Rang = Unterart) vergleichen können und dabei muss er erkennen können welche Art-Taxobox oder Unterart-Taxobox welcher Gattungs-Taxobox untergeordnet ist (Taxon_WissName der Gattung ist gewöhnlich identisch mit Taxon2_WissName der untergeordneten Arten, bei Unterarten identisch mit Taxon3_WissName, in ganz selten Fällen gibt es jedoch den Taxon_Rang Untergattung wodurch das ganze sich um eins verschieben würde, das könnte man aber erstmal auslassen, das wären Taxoboxen mit Taxon_Rang = Art und gleichzeitig Taxon3_Rang = Untergattung). Bei monotypischen Gattungen stehen hingegen beide Jahresangaben in einer Taxobox, so dass ein Vergleich in diesen Fällen viel einfacher ist (Taxoboxen mit Taxon_Rang = Art und einen vorhandenen Taxon2_Autor), weil alle Informationen in nur einem Artikel zu finden sind und nur die beiden Jahresangaben von Taxon_Autor und Taxon2_Autor verglichen werden müssen. Beispiel Löwe dort ist Taxon_Autor = (Linnaeus, 1758), Taxon_WissName = Panthera leo, und Taxon2_WissName = Panthera. Man sieht bei der Übergeordneten Gattung Eigentliche Großkatzen ist Taxon_Autor = Oken, 1816 und Taxon_WissName = Panthera, die Gattung ist als erst nach der Art aufgestellt worden und die Klammerung im Artikel Löwe somit richtig, wenn sie fehlen würde sollte der Bot einen Hinweis in einer Liste generieren und in der Tat Linnaeus hat den Löwen als Felis leo beschrieben, es gab eine Gattungsänderung. LG--Toxoplasma II. (Diskussion) 18:08, 19. Nov. 2018 (CET)

Ich versuche mich mal daran. --Wurgl (Diskussion) 21:25, 19. Nov. 2018 (CET)
Ein paar Fragen dazu:
  • In Vorlage:Taxobox#Taxon_Rang sind die Ränge angegeben. Bei Löwe ist die nächsthöhere Stufe die Gattung, aber kann das auch Untergattung, Sektion, Untersektion, Serie oder Unterserie sein? Wie bei Endlers_Guppy, dort gibts ja Untergattung.
  • Und es geht nur um Tierchen, Pflanzen, Pilze und was es sonst noch gibt werden ignoriert?
  • Die Regelung mit den Klammern gibt nur für Art und Unterart?
    Bei Eigentliche_Großkatzen ist das Jahr 1816, eine Stufe darüber bei Großkatzen steht 1917, also deutlich später. Trotzdem keine Klammern bei Eigentliche_Großkatzen?
  • Wird die Klammerung "vererbt"? Also wenn die Art eine Klammer bekommt, weil die Gattung später beschrieben wurde, bekommt dann die Unterart immer eine Klammer oder nur wenn die Unterart vor der Art beschrieben wurde?
Das wars erstmal. --Wurgl (Diskussion) 22:07, 19. Nov. 2018 (CET)
@Toxoplasma II.: Ach ja: Was ist eine monotypische Gattungen? --Wurgl (Diskussion) 22:27, 19. Nov. 2018 (CET)
Vielen Dank, ich versuche mal dir alles zu beantworten:
  • Zwischen Art und Gattung kann der Rang einer Untergattung geschoben sein, das ist aber selten. Eine Untergattung hat aber sonst keine andere Bedeutung außer das sich damit ein zusätzlicher Rang in der Taxbox befindet und sich dadurch die üblichen Plätze verschieben und das ganze so etwas komplizierter wird, die anderen Ränge gibt es in der Zoologie nicht aber in der Botanik.
  • Die Regel mit dem Klammern um Autoren bei Gattungsänderung gibt es zwar auch in der Botanik da gibt es aber keine Jahresangabe wie in der Zoologie und deshalb würde es dort nicht funktionieren. Deshalb nur zoologische Taxa.
  • Klammern werden bei Gattungsänderung nach der Erstbeschreibung gesetzt sonst nicht, also kann das nur Arten und Unterarten betreffen, keine Gattung selbst und keine Stufe darüber.
  • Ein wissenschaftlicher Art Name besteht aus zwei Teilen, der Gattung und den Epitheton. Als Beispiel der Tiger (Panthera tigris)
  • ein wissenschaftlicher Name einer Unterart besteht aus drei Teilen Beispiel Sibirischer Tiger (Panthera tigris altaica). Eine Nominatform wäre der Königstiger (Panthera tigris tigris) diese ist immer die Unterart die der Erstbeschreiber der Art vor sich hatte als er die Art beschrieben hat. Autor und Datum der Art und der zugehörigen Nominatform, sollte es eine geben, sind somit immer identisch.
  • Die Klammerung bei Gattungsänderung wird nicht "vererbt", sie ist immer abhängig vom Autor und Datum der Erstbeschreibung des jeweiligen Taxons. Sowohl bei Art als auch Unterart ist immer nur die zugehörige Gattung der Bezugspunkt (bei der Nominatform und ihrer übergeordneten Art muss die Klammerung aber logischerweise im Endeffekt immer gleich sein, weil auch Autor und Jahr immer identisch sind).
  • Wieder Tiger und Sibirischer Tiger als Beispiel, Beide gehören zur Gattung Eigentliche Großkatzen Panthera Oken, 1816 (hier ist das Datum wichtig), Art Panthera tigris (Linnaeus, 1758) dort wird der Autor geklammert, weil Linnaeus hat den Tiger 1758 als Felis tigris beschrieben, die Gattung hat sich seit dem also geändert. Jetzt die Unterart Panthera tigris altaica Temminck, 1844 hier wird keine Klammer gesetzt, weil Temminck den Sibirischer Tiger 1844 als Panthera tigris altaica beschrieben hat, es gab als keine Gattungsänderung. Denkbar wäre aber das er obwohl die Gattung Panthera bereits zu diesem Zeitpunkt beschrieben wurde dennoch den Sibirischer Tiger einer anderen Gattung zugeordnet hätte (Gründe könnten dafür sein, er kannte die Gattung Panthera nicht oder war der Meinung die Art gehört in eine andere Gattung), wenn das so wäre dann müssten Klammern gesetzt werden, mit dem Jahres vergleich könnte man hier dann auch nicht ermitteln das die Klammern fehlen, diese Fälle sind aber seltener.
  • Eine monotypische Gattung ist eine Gattung die nur eine Art hat, ein Beispiel ist Acinonyx die Gattung des Gepards (Acinonyx jubatus), weil es keinen Sinn macht bei nur einer Art einen zusätzlichen Gattungsartikel zu erstellen, behandelt der Artikel Art und Gattung zugleich, weil es ja beide nur den Gepard benennen und beschreiben.
  • Das was ich mir ausgedacht habe um die fehlende Klammern zu ermitteln funktioniert nur in eine Richtung, falsch gesetzte Klammern lassen sich damit nicht ermitteln nur fehlende Klammern. Auch funktionier es nicht wenn Gattung und Art im gleichen Jahr beschrieben wurden, die Gattung sich aber dennoch wenig später geändert hat (In ein paar Fällen ist es sogar der selbe Autor der die Gattung kurz später änderte). Ich denke aber den größten Teil der Fehler damit finden zu können. Bisher hab ich das manuell gemacht, also einen Artikel nach dem anderen überprüft, es muss aber doch einfacher gehen, mir würden schon die Arten reichen, Unterarten gibt es nicht so viele. LG --Toxoplasma II. (Diskussion) 00:33, 20. Nov. 2018 (CET)

Personen-BKL[Quelltext bearbeiten]

Es kommt leider nicht selten vor, dass es Links gibt, die auf BKL-Seiten verweisen, obwohl es für die entsprechende Person eine WP-Seite gibt. Häufig natürlich durch Unwissenheit, weil ein Bergsteiger nunmal nicht unbedingt weiß, dass es auch einen gleichnamigen Musiker gibt oder Ähnliches und dies leider nicht immer geprüft wird. Da gerade bei Personen die Fehlerquote solcher Links auf BKL-Seiten recht hoch ist, wäre es sehr hilfreich, wenn ein Bot BKL-Seiten von Personen auflistet, auf die aus dem ANR verlinkt wird. Somit könnte man diese häufig vorkommenden Fehler gezielt beheben. --Doktor Wu (Diskussion) 07:37, 25. Nov. 2018 (CET)

Siehe auch Wikipedia:WikiProjekt Begriffsklärungsseiten/Arbeitslisten/NeueVerlinkteBKS und Wikipedia:WikiProjekt Begriffsklärungsseiten/Arbeitslisten/Top-BKS. Auf der ersten Seite werden neu verlinkte BKS nach fünf Tagen entfernt, unabhängig davon ob die BKL aufgelöst wurden oder nicht. Beispiel: Spezial:Linkliste/David_Cunningham ([15]) und Spezial:Linkliste/Michael_Rose ([16]) --M2k~dewiki (Diskussion) 09:24, 25. Nov. 2018 (CET)

"Unsichtbare" geschützte Leerzeichen[Quelltext bearbeiten]

Leyo hat mir auf Wikipedia:Fragen zur Wikipedia#Seltsamer Zeilenumbruch geraten, hier nachzufragen. Offenbar ist es über irgend einen Weg möglich, "unsichtbare" geschützte Leerzeichen in Wikipedia-Seiten einzufügen. Das kann dann zu seltsamen Zeilenumbrüchen führen. Dieser Edit ist ein Beispiel, wo diese korrigiert (durch normale Leerzeichen ersetzt) wurden. Wikipedia:Typografie#Leerzeichen erwähnt nicht, dass es in Wikipedia möglich ist, solche geschützten Leerzeichen, die im Quelltext wie normale Leerzeichen aussehen, einzugeben. Ich nehme an, dass diese generell unerwünscht, weil "unsichtbar", sind. Falls tatsächlich ein geschütztes Leerzeichen gebraucht wird, ist dieses laut Wikipedia:Typografie#Leerzeichen über den HTML-Code &nbsp; zu setzen. Könnte man einen Bot auf solche unerwünschten "unsichtbaren" geschützten Leerzeichen ansetzen, der diese (regelmäßig) sucht und eliminiert? --Neitram  10:43, 28. Nov. 2018 (CET)

Es ist halt die Frage, ob sie immer unerwünscht sind. Ich würde sie jedenfalls nicht durch "einfache Leerzeichen" ersetzen, sondern durch &nbsp;. Zu allererst sollte man aber mal schauen, wie oft sie wirklich auftreten, ich kann mir nicht vorstellen, dass es allzuviele Vorkommen gibt. --Reinhard Kraasch (Diskussion) 11:43, 28. Nov. 2018 (CET)
siehe auch H:SPUK | Als das damals aufkam, habe ich mit meinem Bot diese Zeichen mit Entities ersetzt – und ja, es waren schon sehr viele. Dort wird auch auf die Werkzeuge verlinkt, die man zur automatischen Erkennung solcher Zeichen nutzen kann. – Doc TaxonDisk.Wikiliebe?! 12:07, 28. Nov. 2018 (CET)
Es sind ja keine unsichtbaren Zeichen sondern einfach geschützte Leerzeichen (U+00A0). Die kommen einfach durch Copy & Paste in den Artikel, z.B. hier: " ". Nach einer ersten Suche hat es davon mindestens tausende. --Count Count (Diskussion) 12:29, 28. Nov. 2018 (CET)
Es gibt sie durchaus häufig, weil sie sofort entstehen, wenn man mit C&P Text aus einer HTML-Seitenansicht oder einem Office- oder vielleicht gar PDF-Dokument übernimmt, in dem bewusst und korrekt solche Zeichen enthalten sind.
Manchmal stehen sie an sinnvollen Orten; oft werden sie aber unbemerkt durch weitere C&P-Vorgänge weitergeschleppt oder waren im Ausgangsdokument bereits nicht sinnvoll gewesen.
WSTM markiert bisher unsichtbare Zeichen als &#160; und macht sie dadurch unterscheidbar von beabsichtigt eingefügten. Wenn für die Ersetzung von unbeabsichtigten unerkannten &nbsp; benutzt wird, dann hilft das niemandem.
WSTM ersetzt unter üblicherweise menschlicher Kontrolle mit Diffpage. Ich warne hier ausdrücklich vor einem Bot-Einsatz, wenn anschließend niemand die auch noch etliche ähnliche Zeichen betreffenden Leerzeichen-Ersetzungen kontrolliert; wenn überhaupt von einem Bot ersetzt, dann nur durch triviale ASCII-Leerzeichen, was aber auch das Layout verschlechtern kann.
VG --PerfektesChaos 12:37, 28. Nov. 2018 (CET)
ja, bei solchen Sachen mache ich normalerweise Boteinsatz halbautomatisch. Dabei kommt es dann darauf an, auf wievielen Seiten diese Leerzeichen im ANR vorhanden sind. Und es gibt ja auch noch andere Leerzeichen als nur 160er. – Doc TaxonDisk.Wikiliebe?! 12:57, 28. Nov. 2018 (CET)
Ein Bot, der automatisch unsichtbare (Unicode-)Zeichen (nicht nur geschützte Leerzeichen, auch Steuerzeichen usw.) im Quelltext aufspürt und geeignet ersetzt, wäre sicher sehr hilfreich. Dieser Bot könnte auch gleich andere „einfache“ Korrekturen zur Einhaltung von WP:TYPO miterledigen, zum Beispiel schmale Leerzeichen ersetzen. Ein paar Gedanken dazu:
  • Unicode-Zeichen, die eine HTML-Entität haben (dazu gibt es maschinenlesbare Listen), ersetzt man am besten durch ebendiese Entität.
  • Unicode-Zeichen ohne HTML-Entität ersetzt man am besten durch den Dezimal- oder Hexadezimalcode (wie &#160;).
  • Unerwünschte Zeichen à la schmales Leerzeichen könnten andere Spezialersetzungen erfordern, hier am besten durch {{nnbsp}}.
  • Manche Zeichen sind nicht unsichtbar, sehen im Quelltext (und ggf. auch in der HTML-Darstellung) aber genauso aus wie manche „normalen“ Zeichen (geschützte Trennstriche etwa). Hier wäre zu klären, ob auch diese Zeichen vom Bot behandelt werden sollen (und wenn ja, was er mit ihnen anstellen soll).
  • Der Bot könnte auch eine Liste unsichtbarer Unicode-Zeichen haben, von denen unwahrscheinlich ist, dass sie in Wikipedia-Quelltexten vorkommen. Wenn er auf ein solches Zeichen stößt, könnte er einen Hinweis auf der Artikel-Diskussionsseite hinterlassen, dass man sich dieses Zeichen mal ansehen möge.
Ich denke, false positives sollten sich mit an Sicherheit grenzender Wahrscheinlichkeit ausschließen lassen, ohne dass man allzu viele false negatives in Kauf nehmen muss (wobei eine Anmerkung auf der Diskussionsseite kein false negative in dem Sinne wäre). Problematisch wären diese Fehlerfälle ja ohnehin nicht, wenn nur Zeichen durch (wenigstens semantisch) äquivalentes Markup ersetzt werden. --77.10.17.244 14:50, 30. Dez. 2018 (CET)

Soccerbase – Spieler[Quelltext bearbeiten]

Aktuell sind gut 900 Weblinks der Form

* [http://www.soccerbase.com/players_details.sd?playerid=9335 Spielerprofil auf soccerbase.com] (englisch)

in den Fußballer-Artikeln verteilt. Allerdings sind diese Links nicht (mehr) funktionsfähig. Es gibt eine Vorlage die diese IDs aufnehmen kann, damit die Verlinkung jederzeit nachträglich korrigiert werden kann. Alle Player-Einträge sollten bitte auf die Form

* {{Soccerbase|9335}}

geändert werden. Die vielfältigen Linkbeschriftungen und alles andere in dieser Zeile können entfallen. Falls doch ein anderslautender Text benötigt wird, müsste man diese Fälle separat Sichten und ändern. --Hadibe (Diskussion) 13:35, 17. Dez. 2018 (CET)

Ich würde mir das morgen mal angucken. -- Quotengrote (D|B|A) 14:18, 17. Dez. 2018 (CET)
Dankeschön. --Hadibe (Diskussion) 17:37, 17. Dez. 2018 (CET)
@Crazy1880: zur Info.
Danke für den Hinweis @Hadibe:, meine volle Zustimmung dazu. mfg --Crazy1880 19:12, 17. Dez. 2018 (CET)
Ich denke ich habe alle erwischt.
-> insource:"* [http://www.soccerbase.com/players_details.sd?playerid="
Der Rest sind andere Links oder auf Manager-Seiten.
-- Quotengrote (D|B|A) 11:37, 18. Dez. 2018 (CET)
Wäre es denn möglich den Vorlauf bitte nochmal für die korrekten Spielerlinks und Manager und zu starten? Die Manager bekommen einen zusätzlichen Parameter zur Unterscheidung des Links. --Hadibe (Diskussion) 00:51, 20. Dez. 2018 (CET)
* {{Soccerbase|9335|typ=trainer}}
Ich ersetze erstmal die Player und die Trainer gucke ich mir später an. Kann aber etwas dauern da ich ab heute mittag erstmal im Urlaub bin. Wenn ichs verpennen sollte einfach im Januar mal anpingen. @Hadibe: Gruß -- Quotengrote (D|B|A) 11:26, 20. Dez. 2018 (CET)
Player durch bis auf Konstrukte wie: {{soccerbase|32808&season_id=134}}. Die müssten händisch gemacht werden. Trainer dann im Januar. Gruß -- Quotengrote (D|B|A) 13:13, 20. Dez. 2018 (CET)
Habs schon gesehen, danke. --Hadibe (Diskussion) 14:01, 20. Dez. 2018 (CET)
Danke, dass mein Vorschlag endlich umgesetzt wurde. Dieser Edit war allerdings falsch. 129.13.72.197 14:03, 18. Dez. 2018 (CET)
Ja, ein paar Edits sind mir am Anfang durchgerutscht, die habe ich aber händisch korrigiert. -- Quotengrote (D|B|A) 11:26, 20. Dez. 2018 (CET)
Dieser falsche Edit sollte nicht stören und würde unter den Wartungslinks wieder auftauchen. --Hadibe (Diskussion) 00:51, 20. Dez. 2018 (CET)
Wartungskategorien wären praktischer. Von wo ist diese Wartungsliste eigentlich verlinkt? 129.13.72.197 10:25, 21. Dez. 2018 (CET)
Ist jetzt auch in der Doku. Was ist der Vorteil von Kategorien?
Frohe Weihnachten euch. --Hadibe (Diskussion) 01:05, 23. Dez. 2018 (CET)
Der Vorteil von Kategorien ist, dass Artikel mit Cat-Intersection-Tools wie PetScan o.ä. thematisch gefunden und z.B. per Bot an Wartungslisten von Themenportalen verteilt werden können. Mit den Rotlink-Listen ist im Gegensatz dazu gar nichts möglich. 129.13.72.197 10:49, 2. Jan. 2019 (CET)
Die Kategorien Wikidata P2193 verschieden und Wikidata P2195 verschieden habe ich nun auch noch angelegt. Ich staune wie viele Kategorien zum selben Thema es schon gibt. Hätte ich das vorher gewusst, hätte ich gleich die Kategorien eingebaut. --Hadibe (Diskussion) 01:35, 3. Jan. 2019 (CET)
Da komme ich erstmal nicht dazu, also wenn jemand es übernehmen will, gerne. -- Quotengrote (D|B|A) 10:05, 9. Jan. 2019 (CET)

Unverlinkte Abkürzungen finden[Quelltext bearbeiten]

Letzten Monat habe ich zufällig binnen kurzer Zeit zwei Abkürzungen gefunden, die sinnvolle Weiterleitungen auf Artikel ergaben: HSAM und USMCA. Beide standen bereits in den jeweiligen Artikeln. Vermutlich gibt es recht viele solcher Fälle. Um sie zu finden, bitte ich unter dem Lemma

um Einrichtung einer Tabelle in der Form

Abkürzungs-
kandidat
Artikel
HSAM Hyperthymestisches Syndrom
USMCA Nordamerikanisches Freihandelsabkommen
Fiktiver anderer Artikel mit Abkürzung USMCA

und zwar unter folgenden Bedingungen:

  • Suche nach Abkürzungskandidaten, das sind Strings aus Großbuchstaben (mindestens zwei), die noch kein Lemma belegen,
  • und die direkt an eine sich öffnende oder sich schließende Klammer angrenzen oder "(ABC" oder "XYZ)" oder beides - das ist bei Abkürzungen wahrscheinlich, und sonst gibt es zu viele "false positives" (lateinische Texte etc.)
  • und suche zu jedem Kandidaten alle Artikel, in denen er vorkommt (auch ohne Klammer)

--KnightMove (Diskussion) 20:01, 5. Jan. 2019 (CET)