Wikipedia Diskussion:WikiProjekt Weblinkwartung/InternetArchiveBot

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Diskussion zum versehentlich gestarteten Botlauf am 14. Januar[Quelltext bearbeiten]

 Info: Kommentar Mabschaaf (bis So 14. Januar offwiki)

  • Seit diesem Kommentar gab es keine wesentliche Weiterentwicklung der Unterlagen. Es fehlen kontinuierlich:
    • Zentrale, eigenständige Projekt-Unterseite als Informationsbasis über das auf mehrere Jahre angelegte Projekt.
      • Rein informative Beschreibung, übersichtlich
      • Verteilung von Anliegen per Verlinkung
      • Keine Vermengung mit Bot-Aktionen vom Gifti-Nur-Disku-Typ und dadurch zusätzliche Verwirrung.
    • Zentrale Feedback-Seite (vgl. Mabschaaf)
      • Bei Gifti 2015/2016 gab es in einem halben Jahr um 2000 Rückfragen.
      • Klar beschriebener Wegweiser, genau welche Art von Anliegen auf welcher Website vorzutragen ist.
      • Deutschsprachige Beantwortung individueller Nachfragen auf einer zentralen, klar dazu ausgewiesenen Seite, die keinem anderen Zweck dient.
      • Für automatisiert ausgewertete englischsprachige Formulare ein deutschsprachig erläutertes Musterbeispiel zum Ausfüllen.
    • Projekt-Unterseite für Organisation und Management.
      • Bislang erfolgte das Management auf Zuruf verstreut über etliche Benutzerseiten. Einen wesentlichen Anteil hatte WP:VWS, wo die Angelegenheit zeitweilig mehr als die Hälfte der Länge der ganzen Werkstattseite einnahm.
    • Plan für die Anlaufphase, also die erste Woche oder Wochen
      • Taktfrequenz
      • Darstellung der Überprüfung jeder einzelnen Bearbeitung; ggf. erst nachträgliche Sichtung
      • Bisher wurde nur an einem Dutzend gleich aufgebauter Artikel eines Themas aus einer Kategorie geprobt. (Update: und am 13. Januar einige Tausend unanalysiert) Es gibt jedoch eine breite Vielfalt an syntaktischen Artikelstrukturen, Gliederungen und Formatierungen. Jeder Bot-Betreiber weiß, dass man in realen Artikeln trotz jahrelanger Erfahrung immer wieder Überraschungen erlebt; ich betreibe seit 2010 WSTM und es kommen doch immer wieder neue Syntaxkonstrukte, die Autoren sich so einfallen lassen.
      • Community-Information
    • Konkrete und präzise Handlungsanweisungen an Autoren.
      • Für jede inhaltliche Situation (die im Einzelfall zu verdeutlichen ist)
        • differenziert nach VisualEditor- und Quelltext-Bearbeitung
          • für jede unterschiedliche Vorlage gesondert
            • Welcher Parameter ist von momentan welchem Wert auf welchen anderen umzuschreiben, falls genau diese oder jene Situation vorliegen würde?
    • Die momentane Anleitung an Autoren ist ein heilloses Durcheinander und stimmt hinten und vorne nicht. Die Anweisung, welche Parameter von den Autoren umzustellen wären, ist nicht ausführbar, weil die behaupteten Parameter in den eingefügten Vorlagen überhaupt nicht existieren.
    • Wenn Bausteine auf der Diskussionsseite eingefügt werden, was im Sinne einer konkreteren Anleitung eine bessere Idee ist als für alle Leser den Artikel zu verschandeln, dann darf dieser nicht die Optik des methodisch fundamental unterschiedlichen GiftBot-Laufs und dessen Vorlage nachahmen, sondern muss sich augenfällig von GiftBot-Technik unterscheiden.
      • Wir fügen niemals einen solchen Text statisch auf einer Diskussionsseite fest ein, sondern immer nur über die Einbindung einer Projekt-Unterseite, damit spätere Verbesserungen dieses Textes nachträglich zentral für alle Seiten wirksam werden können, etwa um die Anleitung nachzubessern, konkreter zu machen oder Linkziele zu aktualisieren oder zu konkretisieren.
      • Außerdem müssen die Abschnittsüberschriften mit spezifischen Markern versehen werden, damit sie eines Tages auch mal wieder einfach und zweifelsfrei von Bots aufgefunden werden können und entfernt werden können. Eine der elementaren Lehren aus dem Gifti-Lauf 2012.
      • In diesem Fall weiß der Bot ganz genau, welche Vorlage mit welchen Parametern eingefügt wurde, und er hat den Autoren verdammtnochmal eine konkrete und präzise Anweisung mitzugeben, in genau welchen Situationen genau welcher Parameter auf genau welchen Wert zu setzen ist, damit diese dusslige Meldung wieder aus dem Artikel verschwindet, oder womöglich die ganze Einbindung. Und wenn die Disku nach dem Artikel beschrieben wird, dann gehört hier auch ein Difflink hin.
      • Was passiert in dieser Disku-Schreiberei eigentlich, wenn mehrere defekte Links gefunden wurden, und was wenn GiftBot die vor zwei Jahren auch schon mal gemeldet hatte?
  • Hier ändert nicht mal still und leise ein Bot die URL einer bestimmten Domain von einer Struktur des Pfades auf eine andere, was Autoren einfach ausblenden können, und in nur 1000 Artikeln.
    • Hier sollen die Autoren jedem einzelnen Edit des Bots aktiv manuell nacharbeiten, und das über Jahre hinweg und in Hunderttausenden von Artikeln.
    • Dazu muss eine glasklare und laienverständliche Anleitung mitgegeben werden, damit es auch Menschen begreifen können, die nicht in die Aktion verwickelt sind.
    • Das Erscheinungsbild des Artikels ändert sich, möglicherweise auf ungeplante Art.
  • Die Bot-Botschafter verweigern sich hartnäckig den erforderlichen Vorarbeiten.
    • Der gebetsmühlenartige Hinweis, in anderen Wikis sei dieser Bot ja auch aktiv, ist unzureichend; ich kann nicht erkennen, dass irgendwo die Autoren jeden einzelnen Edit nacharbeiten sollen.
    • Vielmehr solle erstmal der Shitstorm Hunderter Autoren abgewartet werden, und aus dem könne man dann ja learning by doing betreiben und das so nach und nach verbesserrn. Wir haben aber nicht mehr 2006, wir haben aber jetzt über zwei Millionen Artikel, und es ist im Voraus weitgehend bekannt, was an Vorbereitungsmaßnahmen zu unternehmen ist, und dies oben bereits differenziert aufgelistet.
    • In der sich abzeichnenden Vorgehensweise wäre ein Not-Aus noch vor Ablauf von 24 Stunden per VM absehbar. Das könnte mir egal sein, aber es beschädigt gleichzeitig das Verständnis für andere, sauber umgesetzte Bot-Aktionen. Bereits vergeigte Artikel alle wieder geradezubiegen ist auch nicht ganz so einfach, und gibt noch mehr Zoff in Beo und VG. Aktualisierung: Das allererste Not-Aus hat er sich heute morgen von mir eingefangen.

VG --PerfektesChaos 00:39, 14. Jan. 2018 (CET)Beantworten

@Cyberpower678: Why did you start the bot already? There is a mistake in the parameter it uses for {{Internetquelle}}, the bot flag hasn't been granted and our how-to pages aren't ready/linked yet. Please disable the bot until the flag has been granted, there might be additional conditions we don't yet know about.--Cirdan ± 09:58, 14. Jan. 2018 (CET)Beantworten
@Cirdan: simply put it was an accident because of a stupid mistake on my part. I thought it might be easier to do test runs of the bot using the bot queue tool like last time but for that, the run page needs to be enabled. I did so thinking that the master worker was shut down. I had shut it down moments earlier, but I forgot to apply changes to my crontab, which is an event scheduler, that restarts IABot in the event it crashes. I made changes to the crontab file to reflect the changes, but forgot to actually apply it. So when the server was rebooted, it restarted the master worker for this wiki. My mistake. I will be working on a reversion script to undo the changes it has made so far. As for the errors, what is it using wrong? During the initial Testphase of the bot, this was not mentioned to me, or I missed the response.—CYBERPOWER (Diskussion) 11:37, 14. Jan. 2018 (CET)Beantworten
@Cyberpower678: No need to revert all changes I think. I just fixed all wrong parameters for {{Webarchiv}} where you have a typo: It has to be archiv-bot not arkiv-bot (example). Also, for {{Internetquelle}}, the parameter name is archiv-bot as well and not archivebot. If possible, I would prefer that in addition of InternetArchiveBot you also add a timestamp/date to these fields. This will greatly help us in the future, e.g. to determine how helpful the bot is and how succesful we as a community are at checking the bot changes. There is already some additional feedback regarding adding {{Webarchiv}} after an existing link, which looks really ugly, but I suggest we first find a place where we collect these issues and discuss them with interested community members. Until then, I believe the bot should not run at all.--Cirdan ± 12:32, 14. Jan. 2018 (CET)Beantworten
@Cirdan: That's a lot of work. I hope I didn't inconvenience you. In any event a thank you is in order for doing that. I have fixed the typo in the code, but as for {{Internetquelle}}, I assumed it was "archivebot" as it wasn't listed in the table at the template workshop page, so I assumed Cite web and Internetquelle share the same parameter. I will put in a fix to account for the differences. I will also work on changing the parameter contents as suggested. Adding Webarchiv to the original URL, I have to agree with everyone who's complained about it, it just looks very wrong. IABot was initially setup to just place the template over the original link to avoid double rendering, until I was told not to. If I may make a suggestion though. The Meinungsbild says I can't outright replace the original URL. But when I place the Webarchiv template there, it contains the original URL and the template builds and renders an archive URL in the output. Maybe switching back to the initial way of handling it wouldn't be a violation?—CYBERPOWER (Diskussion) 16:50, 14. Jan. 2018 (CET)Beantworten
  • Und die erste Beschwerde auf FZW wäre dann auch schon da.
    • Siehe oben, Zitat: „Es gibt jedoch eine breite Vielfalt an syntaktischen Artikelstrukturen, Gliederungen und Formatierungen. Jeder Bot-Betreiber weiß, dass man in realen Artikeln trotz jahrelanger Erfahrung immer wieder Überraschungen erlebt …“
    • Zitat von oben: „Das Erscheinungsbild des Artikels ändert sich, möglicherweise auf ungeplante Art.“
  • Wenn ich es richtig verstehe, waren das jetzt 6½ Stunden im Zehn-Sekunden-Takt (und ohne Bot-Flag). Macht >2000 Artikel-Bearbeitungen.
    • Zitat von oben: „Plan für die Anlaufphase, also die erste Woche oder Wochen“
    • Den GiftBot-Lauf 2015 hatten wir zunächst im mehrere Minuten, dann einminütigem Abstand anlaufen lassen, so dass wir jeden Edit noch manuell diffen konnten; mussten zwischendurch wegen Seltsamkeiten auch mal für eine halbe Stunde stoppen.
    • Hier hatte man sich entschieden, die Testphase ohne menschliche Überwachung im Zehn-Sekunden-Takt ablaufen zu lassen, bis sie kurz vor Mitternacht bei mir auf der Beo aufschlug und ich dem Treiben ein Ende setzte.
    • Ich erwarte nunmehr von den hiesigen Bot-Botschaftern einen glaubwürdigen Bericht und Nachweis, dass sie sich jede einzelne ANR-Test-Bearbeitung auf negative Auswirkung im Artikel angesehen und ggf. nachgebessert haben.
  • Seitens Cyberpower678 gab es keine Entschuldigung für die Massenbearbeitung ohne Bot-Flag, die unsere Projektrichtlinien verletzt; ich muss daher davon ausgehen, dass die 2000 Bearbeitungen planmäßig und im Einvernehmen der Verantwortlichen erfolgten.
VG --PerfektesChaos 04:23, 14. Jan. 2018 (CET)Beantworten
@PerfektesChaos: Wie ich schon in der Vorlagenwerkstatt gesagt habe (hier nochmal zu Transparenzzwecken): Ich bin nicht bereit, weiter mit dir zu kommunizieren, wenn du diesen Tonfall beibehälst. Ich muss mich weder von dir von oben herab belehren lassen, noch mich dir gegenüber für Dinge verantworten, mit denen ich absolut nichts zu tun habe. Ich bin nicht der Botbetreiber, ich bin genauso überrascht wie du, dass hier auf einmal hunderte Edits ausgespielt werden, eine ausführliche Anleitung ist im Bot-BNR in Vorbereitung und sollte vor dem Start des Bots (Erteilung des Flags) natürlich überall verlinkt werden.--Cirdan ± 09:48, 14. Jan. 2018 (CET)Beantworten
Dass ein Bot einfach so wegen eines Versehens den halben ANR durcheditiert geht halt einfach nicht. Das ist ganz einfach nicht tolerierbar. Botbetreiber haben eine große Verantwortung, der sie sich gewachsen zeigen müssen, und dazu gehört, dass man seinen Bot wirklich im Griff hat. --MGChecker – (📞| 📝| Bewertung) 15:09, 14. Jan. 2018 (CET)Beantworten

Dieser Kommentar des Botbetreibers ruft bei mir größte Bedenken hervor, ob er überhaupt jemals geeignet sein wird, hier für einen massiven ANR-Einsatz legitimiert zu werden: kann nicht „mithalten“, hat „nur schnell mitgelesen“ (aber eben keine Antworten gegeben bzw. reagiert) und trotz aller Einwände der Meinung „kann los legen“. Da macht sich bei mir der Eindruck breit, es geht überhaupt nicht um die Verbesserung der Artikelqualität, sondern schlicht um Editcount oder die Generierung von Backlinks zum Internetarchiv. Ich denke, es wird zwangsläufig erforderlich sein, dass sich hier eine Gruppe von Usern findet, die die Arbeit des IABots lokal und zeitnah betreut, das wird der Botbetreiber alleine niemals leisten können - zumal er auf vielen unterschiedlichen Projekten aktiv ist und es trotz sehr guter Deutschkenntnisse auch noch eine Sprachbarriere gibt, von der Unkenntnis hiesiger Projektgepflogenheiten ganz zu schweigen.--Mabschaaf 10:08, 14. Jan. 2018 (CET)Beantworten

@Mabschaaf: Ich denke ebenfalls, dass wir hier ein Kommunikationsproblem haben. Ich habe Cyberpower auf der Wikimania persönlich kennengelernt (ebenso die Verantwortlichen beim InternetArchive) und bisher hatte ich den Eindruck, dass er sehr verantwortungsvoll mit dem Bot umgeht und auch versteht, dass sich der Bot hier (wie in allen anderen Sprachversionen auch) an die Regeln, Gepflogen- und Eigenheiten halten muss. Das „kann losgehen“ bezog sich (meinem Verständnis nach) darauf, dass wir mit dem Botflag-Antrag usw. weitermachen können, also alle technischen Vorbereitungen an den Vorlagen usw. abgeschlossen waren. Warum jetzt hunderte Testedits mit fehlerhaften Parametern in den ANR gekippt wurden, weiß ich nicht und bin darüber sehr verärgert, weil wir so weit natürlich (wie man an den Testedits sehen kann) überhaupt nicht sind.--Cirdan ± 10:18, 14. Jan. 2018 (CET)Beantworten
Moin Moin zusammen, mag sich jemand noch mal die Darstellung hier im Artikel Editors’ Forum of Namibia ansehen? Der Einzelnachweis Nummer 2 ist jetzt doppelt dargestellt, also zweimal hintereinander liest man einen Link, nur weil einfach Webarchiv dahinter gesetzt worden ist. Diese Lösung soll doch sicherlich nicht so gewollt sein, oder? mfg --Crazy1880 10:25, 14. Jan. 2018 (CET)Beantworten
Das ist in allen Edits so. Vermutlich ein totaler Rollback am Einfachsten, um den Mist zu beheben. 94.217.98.113 10:33, 14. Jan. 2018 (CET)Beantworten
@Crazy1880: Das ist soweit ich weiß eine Konsequenz aus der Auflage beim Meinungsbild, dass keine Links ersetzt/bearbeitet werden dürfen, sondern nur neue Vorlagen oder Vorlagenparameter hinzugefügt werden dürfen. Die Idee war denke ich, dass man besser zwei Links und einen Archivlink hat als nur einen defekten Link. Ohnehin soll ja (wie beim Giftbot) ein Benutzer kurz prüfen und dann die Markierungen/Dopplungen entfernen. Ich persönlich finde die Doppel-Links aber auch nicht schön. Eine mögliche Lösung wäre, vorerst nur defekte Links in Vorlagen zu bearbeiten. Das müsste @Cyberpower678: so einstellen.--Cirdan ± 10:51, 14. Jan. 2018 (CET)Beantworten
Moin Cirdan, ich habe das MB mal kurz überflogen, aussagekräftig sehe ich es nicht, was genau daraus für Bearbeitungen hervorgehen sollen. Okai, ich war jetzt auch in der Diskussion nicht drinnen. Ich persönlich halte es aber für unsinnig, solche Dopplungen in den Artikel einzubauen und dann zu sagen, "lieber Benutzer/Artikelschreiber/etc. kontrolliere den Archivlink und setzte dann den Totlink raus, damit nur der Archivlink bestehen bleibt". Andererseits gibt es die Vorlage Internetquelle, welche das sauber bei uns umsetzt, mit Link, Archivlink usw.. Also würde ich auch eher unterstützen, sich erstmal an diesen Vorlage zur orientiern und umzusetzen. mfg --Crazy1880 11:03, 14. Jan. 2018 (CET)Beantworten
(BK) @Cirdan:Ich halte es nicht für zielführend, jetzt hier die nächste Seite aufzumachen, um inhaltlich zu diskutieren. Wirklich wichtig wäre nun, erst mal irgendwo eine zentrale Projekt(?)seite zu schaffen, um alle Anfragen/Kommentare zu kanalisieren und die Vorlagen(-ausgabe) sowie Artikeleinfügungen des Bots zu optimieren. Dort sollten sich dann auch entsprechende Betreuer der Aktion einfinden.
An der Stelle muss man aber wohl auch eingestehen, dass das MB in diesem Punkt unvollständig/ungeschickt war: Dort konnte niemand erkennen, welche Folgen die "Nur-Einfügung" auf das anschließende Aussehen des Einzelnachweises haben würde. Eine Doppelung des Linktextes widerspricht mM auch dem Sinn von WP:ZR, auch wenn zusätzliche Archivverlinkungen dort nicht wirklich geregelt sind. Aber dafür sollte sich eine Lösung finden lassen.--Mabschaaf 11:04, 14. Jan. 2018 (CET)Beantworten
@Mabschaaf: Leider ist meine Antwort an dich vorhin verloren gegangen. Erstmal vielen Dank für den Versuch, das hier in eine konstruktive Richtung zu lenken. Ich schlage vor, dass wir alles auf Wikipedia Diskussion:Meinungsbilder/Boteinsatz bei toten Links bündeln, dort steht auch schon die zentrale To-Do-Liste. Ich wollte keine zig Diskussionen aufmachen, sondern habe einfach versucht, überall zu antworten und soweit möglich zu erklären, was los ist, während ich die gröbsten Schnitzer beseitigt habe.--Cirdan ± 12:36, 14. Jan. 2018 (CET)Beantworten
Das ist doch Quatsch. Dass der Bot solchen dämlichen Anzeigetext erfüllt, hat nichts mit den Auflagen des Meinungsbildes zu tun, sondern damit, dass die entsprechenden Richtlinien nicht anständig in die zugehörigen Vorlagen implementiert wurden. In Zusammenhang mit Toter Link und wahrscheinlich auch mit Internetquelle scheint der Bot halbwegs zu tun was er soll, aber wenn er mit Webarchiv arbeitet, ist das Ergebnis schrecklich. Das muss nicht so sein, man kann auch einfach alles gescheit in eine Vorlage verwursten, wie bspw. hier von mir vorgeschlagen. Der gewünschte Zeitstempel fehlt btw auch. --MGChecker – (📞| 📝| Bewertung) 15:09, 14. Jan. 2018 (CET)Beantworten
@Cirdan: Ich finde es weder eine gute Idee, weiter hier zu diskutieren (damit wird eine Funktionsseite zugetextet und der Flag-Antrag völlig unübersichtlich), noch halte ich es für sinnvoll, eine MB-Diskuseite nach abgeschlossenem MB auf unbestimte Zeit weiter zu füllen. Wenn kein eigenständiges WikiProjekt für die IABot-Aktivitäten gestartet werden soll, könnten die Diskussionen ja vielleicht (zumindest vorläufig) auf einer neuen Unterseite des Wikipedia:WikiProjekt Weblinkwartung geführt werden.--Mabschaaf 16:07, 14. Jan. 2018 (CET)Beantworten
@Mabschaaf: Das ist eine gute Idee. Die Abschnitte werde ich umkopieren.--Cirdan ± 11:01, 19. Jan. 2018 (CET)Beantworten
  • An Alle. Ich entschuldige mich für was hier passiert ist. Die Erklärung dafür ist auf Englisch in Antwort auf Cirdan’s Frage geschrieben. Ich arbeite an ein Skript um die Änderungen alle Rückgängig zu machen. IABot hätte nicht laufen sollen und die Idee das ich hatte, war wirklich nur ein Furzidee, auch wenn es die Testphase leichter machen hätte sollen.—CYBERPOWER (Diskussion) 11:37, 14. Jan. 2018 (CET)Beantworten
@Cyberpower678: Wie oben schon geschrieben denke ich nicht, dass wir alles zurücksetzen müssen. Den fehlerhaften Parameter in {{Webarchiv}} habe ich repariert, ansonsten ist noch {{Internetarchiv}} fehlerhaft. Ich würde vorschlagen, wir lassen die aktuellen Änderungen ansonsten als Testbeispiele stehen, damit alle Benutzer sich das anschauen und es begutachten können.--Cirdan ± 12:34, 14. Jan. 2018 (CET)Beantworten
Wie ich hier sehe, kann der Kollege nicht übermäßig souverän mit Kritik umgehen. Dazu passt dann auch das zu dem ("Der Bot kann starten"). --109.44.3.22 13:11, 14. Jan. 2018 (CET)Beantworten
@Cirdan: Ich habe weiter oben geantwortet, auf Englisch.—CYBERPOWER (Diskussion) 16:50, 14. Jan. 2018 (CET)Beantworten
  • Meine Meinung stimmt überein mit @Cirdan, Crazy1880: dass das doppelte Weblink als Ergebnis von ein hingeheftete {{Webarchiv}} einfach blöd aussieht. Meine Meinung nach sollte das originale Weblink entfernt werden und mit {{Webarchiv}} ersetzt werden. Theoretisch ist es gar keine Ersetzung weil das originale URL noch in der Vorlage existiert. Aber ich bin hier nur ein Außenseiter. Ich muss IABot schliesslich and die Bedürfnisse an die Community von dewiki anpassen, und das will ich auch machen.—CYBERPOWER (Diskussion) 18:34, 14. Jan. 2018 (CET)Beantworten
DRTL. Hallo, ist es sinnvoll, dass der Bot einen Totlinkvermerk an einen Weblink heftet, der mittels Vorlage:Internetquelle-Parameter „offline=1“ schon als tot markiert wurde? (Bsp.). Da gibt es doch schon den Hinweis „Suche in Webarchiven“. Warum dasselbe noch einmal? Der Bot sollte als „offline“ gelabelte Weblinks mE unbeachtet lassen. Gruß, --Wi-luc-ky (Diskussion) 12:51, 18. Jan. 2018 (CET)Beantworten
@Wi-luc-ky: Danke. Das war mir nicht bewusst. Auf enwiki, ist deadurl nutzlos ohne Archivlink dazu und deshalb wird es separate angeheftet. Hier ist es aber nicht der Fall. Ich korrigiere dieses Problem.—CYBERPOWER (Diskussion) 02:04, 19. Jan. 2018 (CET)Beantworten
Vielen Dank für Erläuterung und Korrektur, en:User:Cyberpower678. Ist halt nicht so einfach, jeden Fall schon vorher im Blick zu haben… Gruß, --Wi-luc-ky (Diskussion) 14:17, 19. Jan. 2018 (CET)Beantworten

Einen herzlichen Dank an alle[Quelltext bearbeiten]

Ich möchte mich bei alle bedanken dir mir durch diese Prozedur mitgeholfen haben. Bezüglich, @Cirdan, Martina Nolte, Gestumblindi, MBq: womit ohne eure Geduld, und Begleitung, wäre ich wahrscheinlich nicht weiter gekommen. Danke alle, und ein Bier fuer Alle. :D—CYBERPOWER (Diskussion) 21:18, 22. Mär. 2018 (CET)Beantworten

Talk Page[Quelltext bearbeiten]

Hallo zusammen,
erstmalig ist mir der Lauf des IAB heute hier aufgefallen. Dazu dann zwei Fragen.

  1. Die Vorlage "Toter Link" wird auf Wartungslisten angezeigt, oder? Also, wenn man alles anzeigen lässt, was sich so anzeigen lässt.
  2. Wieso hinterlässt der IAB keine Nachricht auf der Talk Page so wie der GiftBot? Wenn mir ein IAB-Edit in der Beo durchrutscht, muss ich doch irgendwoher wissen, dass der Bot da was gemacht hat. Im vorliegenden Beispiel hat der Bot einen toten durch einen Archivlink ersetzt, das ist erst mal gut. Aber vielleicht würde ich ja einen aktuellen, gepflegten Link finden. Dafür muss ich aber irgendwo sehen, dass der Bot was gemacht hat, so wie bei den GiftBot-Benachrichtigungen auf der Talk Page. Wieso schreibt der IAB da nix hin? Das geht so nicht, das verhindert die Artikelwartung.

Viele Grüße, Grueslayer 21:41, 23. Mär. 2018 (CET)Beantworten

@Grueslayer:
  1. Ja, {{Toter Link}} sollte auf entsprechenden Wartungslisten erscheinen.
  2. Die Meldung auf Diskussionsseiten wurden nach entsprechendem Feedback abgeschaltet. Es ist prinzipiell aber natürlich möglich, solche Meldungen zu generieren. Perspektivisch besteht der Wunsch, dass der InternetArchiveBot auch die „normalen“ Weblinks (also solche außerhalb von Einzelnachweisen) untersucht und wie der GiftBot auf der Diskussionsseite meldet. Das ist technisch bereits möglich, allerdings muss sich jemand finden, der die Einführung dieses Features betreut und vorbereitet, so wie Martina Nolte und ich das in den letzten Wochen und Monaten getan haben. Bei jedem Link, den der Bot einfügt, wird direkt im Einzelnachweis darauf hingewiesen, dass es ein automatisch eingefügter Link ist (analog bei toten Links). Da der Bot auch einen Zeitstempel hinterlässt, ist es grundsätzlich möglich, zeitlich getrennte Wartungskategorien zu erzeugen. Wäre das aus deiner Sicht eine sinnvolle Einrichtung/Alternative zu Diskussionsseitennachrichten?
Die ganze Sache ist für unsere Community ja völlig neu, wir müssen sicherlich noch hier und da nachjustieren. Daher gerne mehr Feedback und Ideen!--Cirdan ± 23:27, 23. Mär. 2018 (CET)Beantworten
Moin. Prinzipiell ist der jetzige Weg ein guter, aber es muss eine Benachrichtigung für Autoren geben, die Artikel (un)regelmäßig warten. Eine Wartungskategorie wäre in diesem Fall wohl schlecht, da der vom IAB eingesetzte Archivlink ja auch die endgültige Lösung sein kann - wenn die manuelle Suche keinen besseren Link ergibt, hat der IAB das bestmögliche Resultat erbracht. Es muss aber ein Trigger für die manuelle Suche da sein, und das kann nicht die Versionsgeschichte sein. Wenn der IAB den nachfolgenden (in die Tüte gehusteten) Text auf die Talk Page schreibt, sollte alles gut sein: "Ich (der IAB) habe einen toten Link gegen eine Archivversion ausgetauscht. Wenn es einen besseren Link gibt, setze ihn ein und lösche diese Nachricht. Wenn es keinen besseren Link gibt, lösche diese Nachricht." Viele Grüße, Grueslayer 23:41, 23. Mär. 2018 (CET)Beantworten
Der Bot schreibt das nicht auf die Diskussionsseite, aber in den Artikel: Wenger#Einzelnachweise. Die Idee ist, dass der abarbeitende Benutzer wie in der verlinkten Anleitung beschrieben vorgeht und anschließend die Markierung entfernt. Dann würde der Artikel auch aus der Wartungskategorie fallen. Das von dir beschriebene Szenario findet also im Artikel selbst statt, ohne Einbeziehung der Diskussionsseite. Wie ist deine Einschätzung dazu?--Cirdan ± 23:52, 23. Mär. 2018 (CET)Beantworten
Hallo Cirdan,
das fällt mir doch nur auf, wenn ich in einem Artikel arbeite und dabei im Quelltext oder beim Lesen der ENe zufällig auf die Markierung stoße. Für manche mag das der Way of Working sein. Ich persönlich habe immer, wenn ich irgendwo was korrigiert oder ergänzt habe, kurz auf die Talk Page geguckt, ob da ein GiftBot-Hinweis auf einen toten Link steht, und habe den schnell miterledigt. Das kann ich zukünftig nicht mehr, was schade ist, denn ich habe schon so einiges an toten Weblinks weggearbeitet. Funktioniert wenigstens Tote Links nach Benutzer mit dem IAB?
Ein weiterer Punkt: Verstehe ich das richtig, dass Artikel mit vom IAB durch Archivlinks ersetzten, toten Links auf Wartungsseiten auftauchen? Die GiftBot-Hinweise auf Archivlinks waren zu gefühlten 75% okay, weil ich keine aktuellen Links gefunden habe. Ist der Eintrag in Wartungslisten da nicht etwas übertrieben, da unnötige Arbeitsbeschaffung?
Viele Grüße, Grueslayer 06:44, 24. Mär. 2018 (CET)Beantworten
@Grueslayer: Hier etwas off-topic: Kennst Du Benutzer:PerfektesChaos/js/externalLinkProblem? Das spart Dir den Klick auf die Diskuseite und zeigt Dir direkt im Artikel an, welche Links von GiftBot als defekt gemeldet wurden. Mit den IABot-Änderungen arbeitet es aber nicht zusammen.--Mabschaaf 08:02, 24. Mär. 2018 (CET)Beantworten
Das kannte ich noch nicht. Danke für den Hinweis. Schade, dass das jetzt obsolet ist. Viele Grüße, Grueslayer 08:59, 24. Mär. 2018 (CET)Beantworten
@Grueslayer: Was auf Wartungslisten auftauchen sollte, sind alle Fälle, in denen {{Toter Link}} gesetzt wurde (also immer dann, wenn der Bot keine passende Archivversion findet). Das sollte ja immer der Fall sein, egal, ob ein Bot oder ein Mensch {{Toter Link}} gesetzt hat. Da der Bot {{Webarchiv}} verwendet, um Archivlinks einzufügen (bzw. die entsprechenden Parameter in Linkvorlagen), sollten diese toten Links nicht auf Wartungslisten auftauchen. Auch das Problem besteht ja unabhängig davon, ob ein Bot oder Mensch den Archivlink ergänzt hat.
Das Tote-Links-nach-Benutzer-Tool funktioniert in seiner aktuellen Fassung nicht für vom IABot markierte Seiten, aber es sollte kein Problem sein, das Tool anzupassen bzw. ein ähnliches zu schreiben. Dazu wäre Voraussetzung, dass die Archivbotmarkierung einen Wartungskategorie-Eintrag erzeugt (das ist wie gesagt recht einfach möglich), dann kann diese Kategorie wie in dem von dir verlinkten Tool mit den eigenen Neuanlagen verschnitten werden.--Cirdan ± 08:17, 24. Mär. 2018 (CET)Beantworten
Hallo Cirdan,
die Abarbeitung der toten Links ist prima, das macht der Bot sehr gut. Mein Kernproblem ist, dass ich jetzt keinen Hinweis mehr bekomme, dass da ein Archivlink zu überprüfen ist. GiftBot hat auf der Talk Page drauf hingewiesen (Beispiel, der IAB setzt nur den Archivlink ein und schweigt sich darüber aus. Wenn ich nicht rein zufällig auf die Änderung stoße, kann ich den Link nicht ausbessern. Das ist schlecht.
Viele Grüße, Grueslayer 08:36, 24. Mär. 2018 (CET)Beantworten
Ja, das Problem sehe ich natürlich. Ich habe schon angefangen, Wartungskategorien vorzubereiten, bin aber auf der AdminCon und weiß noch nicht, wie viel Zeit ich heute finde.--Cirdan ± 08:56, 24. Mär. 2018 (CET)Beantworten
Von Eile war nie die Rede. ;-) Dass das Problem erkannt ist und beizeiten bearbeitet wird, reicht mir doch. Vielen Dank und viele Grüße, Grueslayer 08:59, 24. Mär. 2018 (CET)Beantworten
@Grueslayer: Schau mal: Kategorie:Wikipedia:Defekte Weblinks/Ungeprüfte Archivlinks 2018-03. Ich warte erstmal ab, bis die Kategorie voll ist. Dann baue ich das auch noch für die toten Links.--Cirdan ± 10:04, 24. Mär. 2018 (CET)Beantworten
Hallo Cirdan,
das müsste man noch verschneiden. Ich interessiere mich ja nicht für Warburg oder Ward Churchill, also gucke ich in die Kategorie nicht rein. Aber wenn der TaxonBota die Wartungskategorie in sein Programm mit aufnimmt, erscheinen die Artikel der Kategorie in den Wartungslisten der Portale etc., und dann ist vermutlich alles gut. :)
Viele Grüße, Grueslayer 10:40, 24. Mär. 2018 (CET)Beantworten
Hallo Grueslayer, genau, die Tools und Wartungslisten müssen natürlich entsprechend angepasst werden. Da die Kategorien nun vorliegen, sollte das aber für die Betreuer recht einfach sein. @Doc Taxon:--Cirdan ± 12:00, 24. Mär. 2018 (CET)Beantworten
@Cirdan, Grueslayer: Ich hatte das schon mehrmals erwähnt. Toter Link ist weder ein Wartungsbestandteil der Wikipedia noch gibt es einen Wartungsbaustein dazu. Die Idee hinter dieser Vorlage ist klar, inwiefern gibt es hier also Wartungsbedarf und warum muss das auf Wartungslisten zu finden sein? – Doc TaxonDisk.WikiMUCWikiliebe?! 14:43, 24. Mär. 2018 (CET)Beantworten
Bezüglich {{Toter Link}} hast du natürlich recht. Die Idee ist denke ich, Artikel, die in den Wartungskategorien Kategorie:Wikipedia:Defekte Weblinks/Ungeprüfte Archivlinks und Kategorie:Wikipedia:Defekte Weblinks/Ungeprüfte Botmarkierungen eingetragen sind, in Wartungslisten aufzuführen.--Cirdan ± 14:47, 24. Mär. 2018 (CET)Beantworten
@Doc Taxon: nach meiner Erfahrung zur Wartung lohnt es sich auch bei den als "tot" markierten Links genauer hinzusehen. Zum einen fehlt dem Artikel ein nachprüfbarer Beleg (=Wartungsbedarf), zum anderen sind Fälle wie "mausetot" oder echte "Knacknüsse" ziemlich selten - obwohl es sie gibt. Siehe meine Beispiele dort. LG --Tom (Diskussion) 15:03, 24. Mär. 2018 (CET)Beantworten
nach meiner Erfahrung sind wiederum "mausetot" oder "Knacknüsse" sogar "mittelmäßig häufig". Oft sind alternative Links oder Literatur eher selten zu finden. – Doc TaxonDisk.WikiMUCWikiliebe?! 15:38, 24. Mär. 2018 (CET)Beantworten
OK um Prozentzahlen brauchen wir nicht grübeln. Wartungsbedarf gibt es allerdings um Deine Frage von oben zu Beantworten. --Tom (Diskussion) 16:37, 24. Mär. 2018 (CET)Beantworten
Erwähnenswert ist noch, dass einige mit der Vorlage:Toter Link verpackte, totgeglaubte Links, die bei einer einfachen Suche mit https://archive.org/web/ und https://archive.is kein Memento erbrachten, dann mit der Vorlage Toter Link über http://timetravel.mementoweb.org/list/2010/ relativ oft doch noch ein oder sogar mehrere Mementos zur Auswahl zeigen. Gruß, --Wi-luc-ky (Diskussion) 18:41, 24. Mär. 2018 (CET)Beantworten
Stimmt ... und gerade bei PDF-Dateien hatte ich öfter das Glück deren Kopien an anderen Stellen im Web zu finden. Es lohnt sich also die "totgeglaubten länger leben" zu lassen. Die Recherche ist halt manchmal nicht so easy. Übrigens darf man den Bot auch mal loben ... der hat bisweilen Dinge gefunden an denen ich mir zuvor die Zähne ausgebissen hab. LG Tom (Diskussion) 19:09, 24. Mär. 2018 (CET)Beantworten

Frage zum weiteren Vorgehen[Quelltext bearbeiten]

(hierhin übertragen von Disk Cirdan)

Hallo Cirdan, nun hast Du ja den undankbaren Job der Implementation erledigt. Die Frage ist nun wie es weiter geht wenn sich in der Praxis Probleme zeigen. Es wäre sehr schön in de:WP eine zentrale Stelle für Fragen und Verbesserungsvorschläge zu haben. Zum Teil betrifft die Sache ja nicht direkt den Bot, sondern auch nachgelagerte Auswertungen. Um das zu erklären erlaube mir ein Beispiele anhand des Artikelbestandes des Militärwesens der Rund 70.000 Artikel umfasst oder mit Bezug zur Waffentechnik deren Artikelbestand bei grob 10.000 Artikeln liegt.

  • Mehrfache Botläufe auf einen Artikel waren etwas verwirrend für mich. Siehe [1]

Mit diesen (veralteten) Auswertungen sind wir nicht in der Lage ein tatsächliches Bild zum Zustand und Wartungsbedarf zu ermitteln.

Nun findet der IABot unabhängig von den alten Auswertungen defekte Weblinks, weil er systematisch alle Artikel durchgeht. Im Abgleich dieser Edits und der veralteten Auswertungen ist mir z.B. die Bearbeitung des Artikels Weaver-Schiene zur Kenntnis gekommen, dessen defekte Weblinks wir bisher nicht auswerten/erkennen konnten.

Der IABot hinterlässt im Artikel Arbeitsanweisungen zu: a) Bestätigung der Änderung, b) zur weiteren Suche von Alternativen bei toten Links ... die Frage ist nun wie wir diese Arbeitsanweisungen systematisch auswerten/finden können.

Im Abgleich der Versionen vor/nach IABotännderung finde ich keine Differenz bez. der verwendeten Vorlagen oder der Kategorien.

  • Die große Frage ist also wie wir zukünftig erkennen/auswerten können welche Botänderungen noch nachgearbeitet werden müssen ???

Bitte versteh es nicht so das ich Dir die Sache aufhalsen möchte ... es geht erstmal nur darum wie wir wieder zu gesicherten Auswertungen kommen. LG --Tom (Diskussion) 09:46, 24. Mär. 2018 (CET) P.S. einfach, schnell auswertbar und pflegeleicht wäre der Eintrag einer Wartungskategorie wie sie im Bereich Kategorie:Wikipedia:Wartungskategorie-Bausteine genutzt werden ;-)Beantworten

Hallo Tom, danke für dein anhaltendes Engagement! Ich denke, wir sollten das hier besprechen, damit alle mitlesen können. Kopiere gerne deinen Beitrag dorthin!
Gerade habe ich Kategorie:Wikipedia:Defekte Weblinks/Ungeprüfte Archivlinks 2018-03 angelegt, die sich jetzt langsam füllt. Das gleiche können wir noch für die toten Links machen, aber ich würde gerne erstmal abwarten, ob es Probleme gibt.--Cirdan ± 10:08, 24. Mär. 2018 (CET)Beantworten
OK Danke für den Tipp und den Hinweis zur Kategorie. LG --Tom (Diskussion) 10:29, 24. Mär. 2018 (CET)Beantworten

 Info: die erste Auswertung funktioniert und zeigt Ergebnisse per PetScan mit dieser Voreinstellung THX --Tom (Diskussion) 10:42, 24. Mär. 2018 (CET)Beantworten

Ach, das ist ja prima. Habe mir Petscan-Links mit festen Parametern auf meine Linkseite gesetzt und kann jetzt mit einem Klick die ungeprüften Weblinks aufrufen. Mehr brauch ich nicht zwingend, danke! Geht das auch statt mit einer Kategorie mit allen von mir angelegten Artikeln? Und ist die Kategorie ("Defekte Weblinks/Ungeprüfte Archivlinks 2018-03") fest oder heißt die jeden Monat anders? Viele Grüße, Grueslayer 15:32, 24. Mär. 2018 (CET)Beantworten
Zur zweiten Frage: Die Kategorie enthält den Monat, damit wir nicht irgendwann eine Riesenkategorie mit Millionen Einträgen haben, sondern etwas handlichere Mengen. Du kannst aber folgende Links verwenden, die sind zeitüberdauernd gültig:
Wo verlinken wir diese Beispiele am besten?--Cirdan ± 15:38, 24. Mär. 2018 (CET)Beantworten
Ja supi, damit ist Grueslayer schon mal etwas weitergeholfen; eine Autorenauswertung hab ich in PetScan nicht finden können. Beispiele hab ich eben mal auf PD:Schifffahrt + PD:MIL + PD:WF hinterlassen damit die Kollegen was zum probieren haben. GGF kann man später bei der Anleitung eine Seite verlinken auf der man solche Tipps hinterlegt ... nur so als Idee :-) LG --Tom (Diskussion) 15:46, 24. Mär. 2018 (CET) P.S. auch für die Seite mit den Tipps geeignet: DeadLinksbyUser BeispielBeantworten
@Hgzh: Wäre es möglich, das Tool anzupassen, so dass auch Artikel in Kategorie:Wikipedia:Defekte Weblinks/Ungeprüfte Botmarkierungen (inkl. Unterkategorien) mit angezeigt werden?--Cirdan ± 17:03, 24. Mär. 2018 (CET)Beantworten
Die zahlreichen Unterkategorien machen das natürlich schwierig. Das könnte ich höchstens über eine Wildcard im Kategoriennamen abfragen, da muss ich aber erst schauen, ob das nicht zu langsam ist. -- hgzh 17:32, 24. Mär. 2018 (CET)Beantworten
@Hgzh: Ich weiß nicht, wie sich dein Tool technisch von PetScan unterscheidet, aber dort scheint eine effiziente Abfrage über Unterkategorien stattzufinden. Vielleicht kannst du diesen Part von dort übernehmen?--Cirdan ± 17:35, 24. Mär. 2018 (CET)Beantworten
@Cirdan: alles unterhalb von Kategorie:Wikipedia:Defekte Weblinks/Ungeprüfte Botmarkierungen und Kategorie:Wikipedia:Weblink offline sollte nun auch in der Auswertung erscheinen. -- hgzh 18:38, 24. Mär. 2018 (CET)Beantworten
@Hgzh: Vielen vielen Dank für die schnelle Anpassung! @Grueslayer:--Cirdan ± 18:42, 24. Mär. 2018 (CET)Beantworten
+1 dem Dankeschön schliesse ich mich gerne an. LG --Tom (Diskussion) 19:09, 24. Mär. 2018 (CET)Beantworten

Hallo, Cirdan et. al, ich weiß, daß die Links der Seite www.lausitzer-fuechse.de, die der Bot als defekt oder tot meldet, nach neuerer Struktur der Seite doch zu finden sind. Ich würde gern die Reparatur der Links übernehmen und hätte dazu gern eine Liste aller Artikel mit vom Bot als offline gemeldeten Links, in denen auf die Site www.lausitzer-fuechse.de verwiesen wird. Gern in meinem BNR. Danke! --Tommes  23:17, 30. Mär. 2018 (CEST)Beantworten

Hallo, hat es einen Grund / eine Funktion, warum der IABot nach <ref> ein Leerzeichen erzwingt; ebenso ein Leerzeichen vor den schließenden }}-Klammern? Das muss bei jedem Durchsehen korrigiert werden… Gruß, --Wi-luc-ky (Diskussion) 23:59, 30. Mär. 2018 (CEST)Beantworten

URL mit[Quelltext bearbeiten]

@Cirdan, Giftpflanze:: Hier (beispielsweise) hat der IABot einen Archivlink eingefügt. Der Link in "Memento des Originals" führt auf https://tools.wmflabs.org/giftbot/deref.fcgi?url=... Was hat es damit auf sich und wofür ist das gut? Und vor allem: Muss das sein? (Bei der Abarbeitung der Botänderung und der Suche nach live-Seiten nerven solche Umleitungen.) --Martina Disk. 20:39, 31. Mär. 2018 (CEST)Beantworten

Hallo Martina, ja, das ist sinnvoll. Siehe hier den Abschnitt zu unbubble.eu. Vorher wurde mit unbubble ein externer Umleitungsdienst genutzt, der neue Service ist datenschutztechnisch besser und restriktiver.--Cirdan ± 20:49, 31. Mär. 2018 (CEST)Beantworten
Danke. (Die Umleitung nervt trotzdem. :-) ) --Martina Disk. 20:51, 31. Mär. 2018 (CEST)Beantworten

Erzeugte Texte[Quelltext bearbeiten]

Derzeit wird bei nicht gefundenen Archivversionen folgender Text angezeigt:

  • (A) (Seite nicht mehr abrufbar; Suche in Webarchiven  Info: Der Link wurde automatisch als defekt markiert. Bitte prüfe den Link gemäß Anleitung und entferne dann diesen Hinweis.)

Bei ungeprüften Archivlinks lautet der Text (Beispiel von [2]):

  • (B) (Memento des Originals vom 27. September 2007 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe den Link gemäß Anleitung und entferne dann diesen Hinweis.

Ich schlage folgende Angleichung/Korrektur vor (geänderte Details gelb hinterlegt, diese sollen natürlich in den Artikeln nicht hervorgehoben werden):

  • (A) (Seite nicht mehr abrufbar: Suche in Webarchiven;  Info: Der Link wurde automatisch als defekt markiert. Bitte prüfe den Link gemäß Anleitung und entferne dann diesen Hinweis.)
  • (B) (Memento des Originals vom 27. September 2007 im Internet Archive;  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe den Link gemäß Anleitung und entferne dann diesen Hinweis.)

Wichtig ist vor allem, in Fall (B) die Klammer nach hinten zu verschieben - geht nämlich der Text des Einzelnachweises nach dem Link weiter, kommt es zu so unschönen Satzzeichenfolgen wie im oben verlinkten Beispiel.--Mabschaaf 21:21, 3. Apr. 2018 (CEST)Beantworten

Aus meiner Sicht eine sinnvolle Verbesserung.--Cirdan ± 18:16, 7. Apr. 2018 (CEST)Beantworten
(B) würde doch (va. mit der Klammer) mit einer Verwendung der Vorlage Internetquelle kollidieren, oder sehe ich das falsch? -- Jonaes/Diskussion 21:30, 7. Apr. 2018 (CEST)Beantworten
@Cirdan: Würdest Du die nötigen Anpassungen der Vorlagen vornehmen?--Mabschaaf 21:49, 12. Apr. 2018 (CEST)Beantworten
@Mabschaaf, Boshomi: Ich würde da Boshomi bitten, er hat die Hinweistexte zentralisiert und überblickt am besten, welchen Einfluss eine Änderung auf welche Vorlagen hat.--Cirdan ± 13:41, 14. Apr. 2018 (CEST)Beantworten
@Mabschaaf, Cirdan: Ich habe die Zeichensetzung in der Vorlage {{Toter Link}} angepasst. Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!14:35, 15. Apr. 2018 (CEST)Beantworten
@Boshomi: Ich kann keine Änderung erkennen, im eingangs verlinkten EN sitzen die Klammern noch immer wie zuvor.--Mabschaaf 14:39, 22. Apr. 2018 (CEST)Beantworten
@Mabschaaf: Soweit ich sehe ist die Klammer geschlossen, und die Satzzeichen wurden vereinheitlicht (; wurde entfernt). Kannst du mir ein Beispiel zeigen, was nicht passt, und wie du es haben willst? Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!14:48, 22. Apr. 2018 (CEST)Beantworten
@Boshomi: Hast Du Dir den Link oben in den Artikel 1,12-Dodecandisäure angeschaut? EN 29 lautet dort gerade (ohne Verlinkung, kritische Stellen hinterlegt):
  • Condea: Dr. Z presents All about fatty alcohols, Saturated Fatty Alcohols (Memento des Originals vom 27. September 2007 im Internet Archive) i Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe den Link gemäß Anleitung und entferne dann diesen Hinweis., 2000
Dort ist nicht erkennbar, dass Du meinen Vorschlag oben >>(B)<< umgesetzt hättest.--Mabschaaf 14:56, 22. Apr. 2018 (CEST)Beantworten
@Mabschaaf: hm. Ich hatte die Anpassung in der Vorlage Toter Link (Spezial:Diff/176530502) vorgenommen, dort hat tatsächlich eine Klammer gefehlt und die Zeichensetzung war inkonsistent. Wenn ich dich richtig verstehe, willst du den Archivebot-Abschnitt innerhalb der Klammern, sowohl für Webarchiv als auch für Toter Link?  Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!15:13, 22. Apr. 2018 (CEST)Beantworten
Korrekt. Vermutlich gibt es tausend Varianten in den Artikeln, wie der Text rund um die ursprüngliche Weblinkbeschriftung aufgebaut ist, folglich muss der komplette zusätzliche Text, der nun durch die Vorlage zusätzlich erzeugt wird, innerhalb einer Klammer stehen, damit eine Satzkontruktion nicht zerstört wird.--Mabschaaf 15:17, 22. Apr. 2018 (CEST)Beantworten
@Mabschaaf: Für die Vorlage Webarchiv und Toter Link ist das möglich, der Aufruf des Archiv-bot-Textes muss dann in die Untervorlagen verschoben werden, was nicht das Problem ist. Schwieriger wäre das bei Internetquelle, wobei es dort vermutlich auch nicht so sinnvoll ist, da es dort sowieso am Ende angefügt wird. Für Webarchiv bin ich mir noch etwas unschlüssig wie das mit der Satzzeichensetzung korrekt umgesetzt werden sollte. Derzeit steht dort »(Memento des Originals vom 4. März 2016 im $Archiv)  Info: Der Archivlink wurde auto...« Die Frage ist, ob wir das Info-Symbol als Satzzeichen werten, und damit ein Punkt oder Strichpunkt entfallen kann, oder ob wir vor dem Infosymbol ein Satzzeichen brauchen. Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!18:48, 22. Apr. 2018 (CEST)Beantworten
Für mich gehört da auf alle Fälle ein Satzzeichen hin, ich würde - wie oben vorgeschlagen - das Semikolon nehmen. Generell finde ich die Info-Vorlage mit dem Grafik-"i" viel zu aufdringlich und würde die lieber heute als morgen aus dem Text komplett rauswerfen wollen. Ein Verlust würde dadurch nicht entstehen.--Mabschaaf 19:14, 22. Apr. 2018 (CEST)Beantworten
Darf ich zu bedenken geben, dass das Grafik-„i“ für mich optisch sehr hilfreich ist, die „Baustelle(n)“ leichter zu finden. Klar: Strg + F ginge natürlich auch… Gruß, --Wi-luc-ky (Diskussion) 23:52, 22. Apr. 2018 (CEST)Beantworten
@Wi-luc-ky: Da wäre es mM sinnvoller, der Meldung eine eigene css-Klasse mitzugeben, die Du (und andere Interessierte) dann mit einem Eintrag in Deiner Benutzer.css hervorheben könnte, also ähnlich einer BKL bei eingeschaltetem BKL-Helferlein.--Mabschaaf 23:10, 23. Apr. 2018 (CEST)Beantworten
@Mabschaaf: Technisch durchaus möglich (ich bin aufgeschlossen); doch wird der Kreis der Interessierten damit eher kleiner werden als größer. So, wie es jetzt ist, lockt es mglw. doch den einen oder die andere an, korrigierend zu editieren (ich spreche aus eigener Erfahrung). Mit css/Helferlein wandert die Thematik ab in den kleinen Kreis der technisch Versierteren, an denen die Arbeit hängenbleibt: das wäre – wenn die Diagnose richtig ist – mE die falsche Richtung. Gruß, --Wi-luc-ky (Diskussion) 23:34, 23. Apr. 2018 (CEST)Beantworten

Exkurs: Allgemeine Diskussion zu Texten[Quelltext bearbeiten]

@Mabschaaf, Cyberpower678: was für einen Sinn macht es, dass der Bot solche zusätzlichen Hinweise dazu schreibt. Was haben wir mit dem automatischen Ersetzen von Deadlinks erreicht, wenn man sie dennoch immer wieder prüfen muss? Dann kann man das doch gleich selbst machen, wie es doch vorher auch schon der Fall war, und braucht keinen Extra-Edit dieses Bots mit Bothinweisen im Artikeltext. Habt Ihr eine Gegenmeinung dazu? – Doc TaxonDisk.WikiMUCWikiliebe?! 22:09, 6. Apr. 2018 (CEST)Beantworten
Ausschließlich auf Archivlinks bezogen: Ich finde schon, dass es einen Unterschied macht. Es nimmt die Arbeit vom Erkennen des defekten Links bis zum Finden und Einsetzen einer Archivversion ab, man muss nur noch kurz drüberschauen, und den Hinweis entfernen. Eine andere Perspektive ist außerdem die der Leser. Für den Leser macht es schon einen Unterschied, ob er, das InternetArchive evtl. gar nicht kennend, einen toten Link oder eine, in den meisten Fällen brauchbare, Version im Archiv, nebst dem Hinweis, dass sie vielleicht unbrauchbar ist, bekommt. -- Jonaes/Diskussion 22:34, 6. Apr. 2018 (CEST)Beantworten
Naja, okay – Doc TaxonDisk.WikiMUCWikiliebe?! 23:29, 6. Apr. 2018 (CEST)Beantworten
@Doc Taxon: Eine Botbearbeitung führt zur Anzeige eines Texts, weil das im MB so vorgeschrieben wurde. Die Arbeitserleichterung durch den Bot ist im Vergleich zu den GiftBot-Hinweisen enorm, da man im besten Fall einfach nur die Markierung entfernen, aber nicht selbst mit Vorlagen und Archivlinks herumbasteln muss. Zudem arbeitet der Bot nicht immer fehlerfrei, es kommt immer wieder zu Links auf zerschossene oder falsche Archivversionen. Immer wieder kann auch ein Link ersetzt oder repariert werden. Es ist daher sowohl für die Autoren als auch die Leser wichtig, dass die Botbearbeitung deutlich markiert ist.--Cirdan ± 17:30, 7. Apr. 2018 (CEST)Beantworten

Parameter Zugriff[Quelltext bearbeiten]

@Cirdan, Cyberpower678: Sollte auf der entsprechend verlinkten Anleitungsseite nicht auch darauf hingewiesen werden, dass beispielsweise bei Verwendung der Vorlage:Internetquelle bzw. bei entsprechenden Angaben in der Fußnote das Zugriffsdatum manuell mitgeändert werden muss? Ist das mit der beschriebenen VisualEditor-Variante so überhaupt möglich?--Jack O'Neill ¿Å? ] 23:27, 7. Apr. 2018 (CEST)Beantworten

Hallo Jack O'Neill, ergänze gerne die Anleitung entsprechend. Auch beim Visual Editor muss das Zugriffsdatum manuell gesetzt werden.--Cirdan ± 20:44, 8. Apr. 2018 (CEST)Beantworten

Persönliches Fazit[Quelltext bearbeiten]

Prinzipiell: Prima, läuft. Ich habe mir die Übersichten für meine drei Themengebiete auf meine persönliche Wartungsseite kopiert und arbeite die halt so nach und nach ab.

Wunsch 1 (wichtig): Ich fände es sehr hilfreich und tatsächlich wichtig, so eine Übersicht für meine erstellten Artikel zu haben, weil die halt nicht so selten außerhalb meiner Stamm-Themengebiete liegen. Für den GiftBot gibt es das, siehe hier.

Wunsch 2 (weniger wichtig): Ich fände es schön, wenn die defekten Weblinks in normalen Wartungslisten drin wären, damit ich sie auf meiner Wartungsseite direkt sehe und nicht erst per Klick erzeugen muss. Das wäre dann die Perfektion.

Vielen Dank und viele Grüße, Grueslayer 16:04, 12. Apr. 2018 (CEST)Beantworten

Hallo Grueslayer, danke für dein Feedback! Das Tool von Hgzh sollte auch alle vom InternetArchiveBot als defekt markierten Links anzeigen. Ist das bei dir nicht der Fall? Das hat Hgzh gleich nach dem Botstart angepasst, siehe einen der Abschnitte hier drüber.
Die Artikel mit defekten Links würden auf Wartungsseiten auftauchen, wenn die allgemeine Defekte-Weblinks-Kategorie auf Wartungsseiten auftauchen würde. Das scheint aber nicht der Fall zu sein und DocTaxon hatte auch irgendwo einmal begründet, warum das der Fall ist. Es müsste allerdings möglich sein, eine Kategorienabfrage auch per TaxonBota ausliefern zu lassen, also eine solche Wartungsliste durch Verschnitt einer Themen- mit einer Defektlinkkategorie zu erstellen.
Was mir noch fehlt, ist ein Tool, mit dem ich meine Beobachtungsliste untersuchen lassen kann. Das geht bisher nur per manuellem Umweg.--Cirdan ± 20:19, 12. Apr. 2018 (CEST)Beantworten
Moin Cirdan,
"Tote Links nach Benutzer" funzt bei mir nicht, bzw. die Anzeige ist leer, weil ich die Giftbot-Meldungen alle abgearbeitet hatte. IAB-Meldungen werden keine angezeigt. Als Beispiel mal Gnome Ranger (tot) oder Cocorite (Archivlink vorhanden).
Stimmt, kaputte Links aus der Beo wär auch noch was.
Viele Grüße, Grueslayer 21:05, 12. Apr. 2018 (CEST)Beantworten
Hmm. @Hgzh: Kannst du mal schauen? Danke!--Cirdan ± 21:12, 12. Apr. 2018 (CEST)Beantworten
Da liegt tatsächlich etwas im Argen, bzw. funktioniert die Ermittlung nur unter gewissen Voraussetzungen. Das muss ich eingehender prüfen. -- hgzh 11:46, 14. Apr. 2018 (CEST)Beantworten
@Cirdan, Grueslayer: Fehler gefunden und behoben. -- hgzh 12:17, 14. Apr. 2018 (CEST)Beantworten
Wow. Danke!! Viele Grüße, Grueslayer 13:00, 14. Apr. 2018 (CEST)Beantworten

Hilfe bei Unklarheit[Quelltext bearbeiten]

Guten Tag, erst mal Danke für den Bot! Aber ich habe eine Frage: er hat mir hier zwei Links ersetzt, den zweiten konnte ich als richtig überprüfen und habe das Flag entfernt. Der erste Link funktioniert leider nicht, ich finde aber in TimeTravel

 <a href="https://web.archive.org/web/20130811065254/http://www.niederlausitzer-kreisel.de:80/" data-originalurl="http://www.niederlausitzer-kreisel.de" data-versiondate="2013-08-11 06:52:54">Robust Link for https://web.archive.org/web/20130811065254/http://www.niederlausitzer-kreisel.de:80/</a>

und den Hinweis

   Copy and paste the HTML code above to decorate the Memento URL: https://web.archive.org/web/20130811065254/http://www.niederlausitzer-kreisel.de:80/.

Mit dem Ersetzen von Teilen des ArchivBot-Eintrags komme ich nicht klar - welche(n) Textteil(e) des neu gefundenen Strings muss ich wohin kopieren? (meine bisherigen Versuche haben Fehler erzeugt). Oder soll ich den Link

 https://web.archive.org/web/20130811065254/http://www.niederlausitzer-kreisel.de:80/

konventionell eintragen und den Archiv-Bot-Eintrag komplett dadurch ersetzen?

Danke für Hinweis und viele Grüße --Wilhelm Zimmerling PAR (Diskussion) 13:40, 13. Apr. 2018 (CEST)Beantworten

Hallo Wilhelm, hilft dir Vorlage:Webarchiv weiter? Dort ist beschrieben, wie die Archivversion einzutragen ist. In deinem Fall:
{{Webarchiv|wayback=20130811065254|url=http://www.niederlausitzer-kreisel.de:80/|text=Linktext}}
Viele Grüße,--Cirdan ± 14:49, 13. Apr. 2018 (CEST)Beantworten
Hallo Cirdan, da hatte ich nicht tief genug gegraben, aber vor allem Deine Lösung am Beispiel hilft dann auch für die Zukunft. Danke und viele Grüße --Wilhelm Zimmerling PAR (Diskussion) 16:22, 13. Apr. 2018 (CEST)Beantworten
Nachtrag: ist eine Ergänzung (Hinweis auf diese Vorlage) unter "siehe auch" bei Markierung (oder wo sonst evtl.) sinnvoll? --Wilhelm Zimmerling PAR (Diskussion) 16:40, 13. Apr. 2018 (CEST)Beantworten
@Wilhelm Zimmerling PAR: Wenn du Ideen zur Verbesserung der Anleitung hast: Ergänze das sehr gerne!--Cirdan ± 13:41, 14. Apr. 2018 (CEST)Beantworten
Hmm, ich mach das mal - ich denke so ist es richtig (nicht an allen Stellen erforderlich). Viele Grüße und Danke für das Vertrauen --Wilhelm Zimmerling PAR (Diskussion) 00:41, 15. Apr. 2018 (CEST)Beantworten
@Wilhelm Zimmerling PAR: Vielen Dank! Ich habe den Vorschlag aufgegriffen und den Hinweis prominent auf Benutzer:InternetArchiveBot/Anleitung/Toter Link eingefügt und zudem hier ergänzt. Letztere Seite wird auf allen Anleitungsseiten unter „Siehe auch“ eingebunden.--Cirdan ± 12:12, 15. Apr. 2018 (CEST)Beantworten
Hallo Cirdan, ich Danke Dir! Das ist natürlich besser und erfasst (wahrscheinlich) alle ähnlichen Fälle. Über die Stelle war ich mir nicht sicher (ob es denn überall gebraucht wird). Viele Grüße --Wilhelm Zimmerling PAR (Diskussion) 16:13, 15. Apr. 2018 (CEST)Beantworten

IABot-Edits in Vorlage:Cite book[Quelltext bearbeiten]

...führen zu Einträgen in Kategorie:Wikipedia:Vorlagenfehler/Vorlage:Cite book (wie hier), weil Cite book nicht mit den nötigen Parametern ergänzt wurde.--Mabschaaf 19:24, 13. Apr. 2018 (CEST)Beantworten

@Mabschaaf: Danke für den Hinweis, die Vorlage wurde bisher noch gar nicht angepasst. @Boshomi: Ich habe es schonmal notdürftig geflickt. Könntest du auch diese Vorlage auf die neue Technik mit Durchschleifung an {{Webarchiv}} umstellen? Danke!--Cirdan ± 13:51, 14. Apr. 2018 (CEST)Beantworten
@Cirdan, Mabschaaf: Anpassung in Vorlage {{Cite book}} ist erledigt. Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!13:56, 15. Apr. 2018 (CEST)Beantworten

EE-links[Quelltext bearbeiten]

Kann mir einer der Botbetreiber bitte alle Toten Links dieser Art (http://www.entente-ee.com/ deutsch/sparten/gefluegel/...) zusammen stellen? Die Seiten wurden wohl nur verschoben. Gerne auch auf meiner Disk, in einer temp. Wartungskategorie oder einer Unterseite in meinem Namensraum. --PigeonIP (Diskussion) 14:24, 16. Apr. 2018 (CEST)Beantworten

Das wären alle Links mit http://www.entente-ee.com/deutsch/sparten/gefluegel/. EIne kurze Stichprobe von ca. 10 Einträgen hat jedes mal 404 gegeben. -- Jonaes/Diskussion 14:36, 16. Apr. 2018 (CEST)Beantworten

Pause[Quelltext bearbeiten]

Warum macht der Bot Pause? 129.13.72.197 10:59, 27. Apr. 2018 (CEST)Beantworten

Zitat von Benutzer:InternetArchiveBot:

Da der Bot in bestimmten Fällen {{Webarchiv}} mit falsch benannten und befüllten Parametern setzt, pausiert er seit 18. April 2018 18:00, bis phab:T192466 behoben ist.--Cirdan ± 18:03, 18. Apr. 2018 (MESZ)

-- Jonaes/Diskussion 16:04, 27. Apr. 2018 (CEST)Beantworten

Grundsätzliches[Quelltext bearbeiten]

Auch nachdem die derzeitigen Fehlfunktionen behoben sein werden, stellt sich die Frage, welchen Sinn eigentlich die Ersetzung von toten Links per Bot macht bzw. machen kann.

Die meisten solcher notwendigen Ersetzungen mit Archivversionen betreffen Referenzen, d. h. Quellenangaben zu den in Artikeln getroffenen Aussagen. Ob und wie die in Internetarchiven bereitgehaltenen Snapshots den Inhalten der ursprünglichen Webseiten entsprechen und somit als Substitut tauglich sind, muß ohnehin vom menschlichen Artikelbearbeiter geprüft und beurteilt werden. Insofern bringt der InternetArchiveBot letztlich keine Arbeitserleichterung.

Ich treffe öfters auf Artikel, die unter dem Abschnitt "Einzelnachweise" vom Bot eingefügte per Vorlage:Webarchiv verlinkte Archivversionen (nicht nur 404er o. ä.) als Referenzen behaupten, die tatsächlich nicht als Quelle geeignet sind. Das "Ausrufezeichen", das den Benutzer auffordert, den Link zu überprüfen, hilft da offensichtlich auch nicht viel. So konnte ich in keiner Versionsgeschichte eines solcherart behandelten Lemmas feststellen, daß eine derartige Fehlverlinkung nachträglich behoben wurde. Mutmaßlich als Reaktion auf die "Arbeit" des InternetArchiveBots wurden jedoch mehrfach fälschlicherweise die zuvor vom GiftBot auf den Disks gesetzten Hinweise auf nicht mehr abrufbare Seiten entfernt. Unter diesem Gesichtspunkt bringt der InternetArchiveBot in seiner bisherigen Funktionaliät also auch keine Qualitätsverbesserung, sondern tendenziell eher das Gegenteil.

Anregung: Man hätte kein Problem, sondern tatsächlich eine Hilfe bei der Pflege von Artikeln, ersetzte der Bot nicht mehr abrufbare Links lediglich mit der Vorlage Vorlage:Toter Link bzw. setzte in Vorlage:Internetquelle nur den Parameter "offline" auf "1".--Judäische Volksfront (Diskussion) 13:51, 29. Apr. 2018 (CEST)Beantworten

Hallo Jotzet, aus meiner Sicht besteht der Vorteil darin, dass im Gegensatz zu den GiftBot-Meldungen (von denen nach drei Jahren immer noch zig-tausende unbearbeitet sind) nun die automatisch ermittelten, in vielen Fällen korrekten Archivlinks direkt im Artikel stehen und damit für die Leser erreichbar sind. Auch zeigt sich, dass die Prüfung und Abarbeitung der Botmeldungen im Artikeltext deutlich einfacher ist und häufiger vorgenommen wird, als es bei den GiftBot-Meldungen der Fall ist (meine Einschätzung aus der Beobachtung der entsprechenden Wartungskategorien). Reine Totlink-Meldung beherrscht der InternetArchiveBot allerdings auch, bei entsprechender Community-Entscheidung könnte er also auch die von dir gewünschte Funktion ausüben.--Cirdan ± 18:01, 29. Apr. 2018 (CEST)Beantworten
Hallo Jotzet, ich habe den Bot mehrfach als hilfreich empfunden - sowohl in den Fällen, wo der Archiv-Link sofort funktioniert, als auch dort, wo ich selbst nachbessern musste (das waren weniger Fälle, und bisher brauchte ich keinen toten Link hinterlassen). Ohne Bot und in einigen Fällen Nacharbeit wären alle betroffenen Links tot gewesen, aber niemand hätte es gemerkt. Da daran gearbeitet wird, wird wohl auch die Nacharbeit weniger werden, getan werden muss sowohl Kontrolle als auch Nacharbeit so oder so. Bei der von Dir vorgeschlagenen Anregung müsste jeder in jedem Fall vorher auch noch die vom Bot erledigte Link-Ersetzung tun, da ist mehr als ein Kontroll-Klick zumindest in den Fällen, wo es funktioniert. Viele Grüße --Wilhelm (Diskussion) 22:32, 29. Apr. 2018 (CEST)Beantworten

Abschnitt(e) Defekte Weblinks auf der Diskussionsseite[Quelltext bearbeiten]

Guten Abend zusammen! Ist denn geplant, die auf den Diskussionsseiten gemeldeten Weblinks von 2012 und 2015 mit den bereits vom IABot auf der Artikelseite gemeldeten und abgearbeiteten Links abzugleichen? Im Zuge der Aufräumarbeiten von IABot-Meldungen ohne Datum sind mir viele Links in die Hände gekommen, die entweder vom IABot auf der Disk das zweite oder dritte Mal gemeldet wurden, oder wo die Links bereits repariert waren und trotzdem die Disk noch den Stand von 2016 hatte. Wie kann eine lange Liste, zum Beispiel diese hier automatisch kontrolliert werden? --Hadibe (Diskussion) 02:06, 25. Jul. 2018 (CEST)Beantworten

Hallo Hadibe, gute Frage; meiner Erfahrung nach ist das bis jetzt nur durch Handarbeit zu lösen. Der genannte Artikel (an dem wir beide schon geändert haben) ist sicher ein Extremfall; ich schau mal, wie ich da mithelfen kann (ich schreibe dort). Den IABot hatte ich absichtlich darüberlaufen lassen, weil ich die GiftBot-Liste gesehen hatte und nicht händisch die Mementos heraussuchen wollte und weiterer Mementobedarf zu erwarten war. Und wenn einmal ein Memento drin steht, hat es sich für diesen Link sowieso erledigt. Gruß, --Wi-luc-ky (Diskussion) 18:19, 25. Jul. 2018 (CEST)Beantworten

@Hadibe: Der InternetArchiveBot sollte gar keine Meldungen auf Diskussionsseiten hinterlassen. Ist das (abgesehen von Testedits vom Jahresanfang) vorgekommen? Ein direkter Abgleich ist nicht vorgesehen, im Rahmen der Überprüfung der IABot-Edits sollten die Einträge aber entfernt werden. Da die GiftBot-Vorlage erkennt, wenn ein Link nicht mehr im Artikel steht, sollte es prinzipiell auch möglich sein, obsolete GiftBot-Einträge automatisch zu entfernen.--Cirdan ± 20:02, 25. Jul. 2018 (CEST)Beantworten

Hallo Cirdan, IABot-Meldungen auf Diskus habe ich (auch) noch nie gesehen. Auf der fraglichen Disku steht aber kein Hinweis wie „Dieser Weblink nicht mehr im Artikel enthalten“, d. h. dass zum damaligen (!) Zeitpunkt, als GiftBot prüfte, alle (heute noch) aufgelisteten Weblinks noch im Art. vorhanden waren. Das bedeutet aber für den heutigen Stand gar nichts, so dass jede GiftBot-Meldung einzeln geprüft werden muss, Hadibe. Schreibst Du dort bitte, wie Du weiter vorgehen möchtest, und ob und wie ich Dich ggf. unterstützen könnte: evtl. könntest Du von oben, ich von unten her die Liste abarbeiten. Gruß, --Wi-luc-ky (Diskussion) 20:46, 25. Jul. 2018 (CEST)Beantworten
Hallo Wi-luc-ky, die Vorlage erkennt im Regelfall, wenn ein Link zwischenzeitlich komplett aus dem Artikel entfernt wurde, d.h. es ist durchaus dynamisch. Steht die URL aber z.B. noch in {{Toter Link}}, kann das die Vorlage nicht erkennen.--Cirdan ± 20:57, 25. Jul. 2018 (CEST)Beantworten
Nur für das Protokoll: mir sind aktuell nur diese acht Disku-Restposten bekannt und ja, alle stammen sie aus der Zeit bis zum März 2018. Es gab aber wirklich ein paar ganz wenige von April und/oder Mai. Notiert habe ich sie mir nicht.
@Cirdan: Wenn bei der Meldung des IABots neuerdings gleich die GiftBot-Einträge entfernt werden, ist es ja gut, dann gibt es keine doppelten Meldungen mehr. Was würde dann aber mit Einträgen passieren, die auf andere Artikel mit demselben Links verweisen? Diese Verknüpfung würde dann aufgehoben? --Hadibe (Diskussion) 00:00, 26. Jul. 2018 (CEST)Beantworten
@Hadibe: Der IABot entfernt keine GiftBot-Einträge, das ist ein Missverständnis. Die GiftBot-Einträge erkennen lediglich, ob die in ihnen enthaltene URL noch umseitig im Artikel auftaucht oder nicht. Obsolete GiftBot-Einträge müssen also manuell oder per Bot entfernt werden, das halte ich aber nicht für ein drängendes Problem, das können wir in ein oder zwei Jahren mal machen, wenn der IABot einige Runden durch unseren Bestand gedreht hat.--Cirdan ± 08:09, 5. Sep. 2018 (CEST)Beantworten

Automatisch eingesetzte Archive.org-Links bei toten Quellenangaben zeitlich besser vorauswählen?[Quelltext bearbeiten]

Von [3] hierhergekommen.

Ich habe in einem Artikel bei einem Quellenlink diesen Hinweis gefunden: "Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe den Link gemäß Anleitung und entferne dann diesen Hinweis."

Dabei fiel mir auf, dass offenbar der vom Bot eingesetzte Link der erste zu sein schien, der bei Archive.org gefunden wurde. Vorschlag: Könnte der Bot nicht herausfinden, wann der Edit getätigt wurde, mit dem der Quellenlink damals eingefügt wurde, und automatisch die Archiv-Version herausfinden, die zeitlich am nächsten an diesem Datum dranliegt?

-- Pemu (Diskussion) 13:31, 1. Sep. 2018 (CEST)Beantworten

Hallo, Pemu, klingt beim ersten Hören gut. Die unausgesprochene Voraussetzung lautet etwa: Näher dran = besser. Inhaltlich mag das für den Beleg zu einem bestimmten Zeitpunkt zutreffen, da sich Inhalte durch Aktualisierungen ändern können. Selbst wenn das technisch möglich wäre – wozu sich bitte andere äußern könnten –, ist dadurch nicht gewährleistet, dass das Memento auch von besserer technischer Qualität ist. Erfahrungsgemäß muss jedes vorgeschlagene Memento aufgerufen, in Augenschein genommen und bei Zweifeln andere Mementodaten gewählt werden. Es kommt (sicher nicht häufig) vor, dass erst ein späteres Memento den Qualitätsansprüchen hier genügt.
Aber, warum sollte der Bot es nicht versuchen? (Nur hat der IABot gerade eigene Probleme; ist wohl heute auch temporär deaktiviert worden.) Gruß, --Wi-luc-ky (Diskussion) 23:42, 1. Sep. 2018 (CEST)Beantworten
@Pemu: Der Bot macht das bereits so, wie du es vorschlägst, wenn er selbst die Archivlinks heraussucht. Er trägt mittlerweile gelegentlich auch fehlende Zugriffsdaten nach, die er aus der Versionsgeschichte ermittelt. Wenn stattdessen eine weiter entfernt liegende Archivversion verwendet wird, war bereits ein Archivlink in der Datenbank gespeichert, weil der Bot die URL schon aus einem anderen Artikel heraus kannte oder weil jemand das per Hand eingetragen hat (du kannst die Datenbank hier bearbeiten, der Bot "lernt" aber auch Archiv-URLs aus Wikipedia-Artikeln).
Die Alternative wäre, für jeden Artikel individuell für jede URL eine Archiv-URL zu ermitteln. Das ist aber sehr viel Aufwand bei vergleichsweise geringem Nutzen und in der Masse kaum wartbar.--Cirdan ± 08:06, 5. Sep. 2018 (CEST)Beantworten

Wegen Pipezeichen defekte Weblinks[Quelltext bearbeiten]

Weblinks können auch aufgrund eines Syntaxfehlers defekt sein, dann nämlich, wenn die Linkbeschriftung mittels Pipezeichen statt eines Leerzeichens (oder zusätzlich zu diesem) von der URL abgetrennt wird. Ich habe letzte Nacht knapp 300 solcher Weblinks korrigiert. Daraus ergeben sich folgende Aufgaben für den InternetArchiveBot:

  • Weblinks in den betroffenen Artikeln erneut prüfen und ggf. die Vorlage:Toter Link entfernen. Zusätzlich könnten ggf. auch die mittels hastemplate:Toter_Link insource:/\%7C/ oder ähnlich gefundenen Artikel geprüft werden.
  • Bei von | abgeschlossenen toten Weblinks künftig prüfen, ob der Weblink ohne | funktioniert und dies melden oder korrigieren.

--Leyo 11:19, 5. Feb. 2019 (CET)Beantworten

Das ist übrigens eine Funktion, die der GiftBot-Lauf für tote Weblinks schon implementiert hatte, genauso wie der Check, ob ein Wechsel von http -> https zu einer erreichbaren Seite führen würde. Beides wäre mM höchst sinnvoll, um die Abarbeitung zu erleichtern.--Mabschaaf 21:29, 5. Feb. 2019 (CET)Beantworten
@Leyo, Mabschaaf: Weblinks mit Pipe-Zeichen zwischen URL und Label sind keine gültigen externen Links. Sie sollten natürlich repariert werden, aber das ist keine Aufgabe für den InternetArchiveBot (und es ist unrealistisch, dass diese Funktionalität dort integriert wird).
Beim Wechsel HTTP -> HTTPS ist nicht sichergestellt, dass die gleichen Inhalte zurückgeliefert werden. Daher markiert der InternetArchiveBot solche Links als tot, bei denen per HTTP keine explizite Weiterleitung erfolgt. So ist jedenfalls mein Verständnis.--Cirdan ± 17:43, 10. Feb. 2019 (CET)Beantworten
Naja, die Frage ist schlicht, ob die Aufgabe des Bots wirklich nur die Markierung defekter Weblinks sein sollte, oder ob er gleichzeitig hilfreiche Angebote für die Reparatur machen sollte. Ein solches Angebot ist ein möglicher Archiv-Link, andere „Angebote“ wären explizite Hinweise auf die beschriebenen Fehlerfälle.--Mabschaaf 18:02, 10. Feb. 2019 (CET)Beantworten
Ich verstehe deinen Punkt, ich kann mir das prinzipiell auch gut vorstellen. Die praktische Schwierigkeit ist, dass wir hier einen Bot haben, der auf zig Projekten läuft und ohnehin bereits Schwierigkeiten hat, deren unterschiedlichen Anforderungen umzusetzen. Wir warten hier seit Monaten darauf, dass einige Fehler behoben werden und auf Phabricator stapeln sich weitere Fehlermeldungen unterschiedlicher Communities. Wenn wir einen Weblink-reparierenden Bot haben möchten, der sich neben Archivlinks auch um Syntaxreperaturen kümmert und an der ein oder anderen Stelle „intelligenter“ vorgeht, müssen wir das als Community leider selbst in die Hand nehmen. Der InternetArchiveBot bietet eine API, mit der ein hier laufender Bot Archivlinks anfragen bzw. einen gezielten Botlauf anfordern kann. Die englischsprachigen Kollegen haben beispielsweise den FA RotBot, der sich dort um die ausgezeichneten Artikel und Listen kümmert und regelmäßig den InternetArchiveBot losschickt.--Cirdan ± 18:27, 10. Feb. 2019 (CET)Beantworten

Seit wann in das Webarchiv das Original für das Webarchiv?[Quelltext bearbeiten]

Hallo, diese flächendeckenden Änderungen halte ich für verkehrt. Wenn bereits das Webarchiv ins Spiel gebracht worden war, um einen toten Link zu ersetzen, braucht es keinen Bot, der aus diesem ersetzten Link ein Original für einen neuen Webarchiv-Link macht! Bitte das Ganze rückgängig machen und den Bot anhalten, bis alle vergleichbaren Fälle behoben wurden. Grüße --RonaldH (Diskussion) 10:32, 10. Mär. 2019 (CET)Beantworten

@RonaldH: Der InternetArchiveBot ersetzt (wie die allermeisten Totlink-Skripte) alle toten Links, die „im Klartext“ im Artikeltext stehen. Das ist grundsätzlich auch richtig. Als tot bekannte Original-Links sollten niemals direkt im Artikeltext stehen, sondern mit {{Toter Link}} markiert sein. Das hilft einerseits den Lesern und stellt andererseits auch sicher, dass sie in der Spezial:Weblinksuche nicht mehr auftauchen, was den Weblinkwartenden Community-Mitgliedern die Arbeit deutlich erleichtert.--Cirdan ± 17:58, 23. Mai 2019 (CEST)Beantworten

Vermurkster Link oder etwas in der Art[Quelltext bearbeiten]

Moin - und zuerst vielen Dank für die Mementos in meinen Artikeln, die ich gern laufend überprüfe. Bei der Überprüfung von ca. 6 Mementos in Stadtmauer von Dubrovnik entdeckte ich jedoch noch einen weitere falschen link, derzeit Einzelnachweise Nr. 16 (City Walls, online auf: www.sitiunescoadriatico.org/…). Zum Zeitpunkt der Artikelerstellung (Sept. 2014) muss es wohl eine Seite eienr Unesco-Organisation gewesen sein zum Thema Stadtmauern von Dubrovnik. Heute steht unter https://sitiunescoadriatico.org/ nur Murks. Ich kann die Ur-Seite nicht finden. Ich würde ungern den Beleg entfernen. Kann man da etwas machen? Dank im Voraus, -jkb- 11:11, 17. Mai 2019 (CEST)Beantworten

Ja, -jkb-. Es gibt ein einschlägiges Memento. Ich kümmere mich gerade darum. Bis bald. Gruß, --Wi-luc-ky (Diskussion) 16:43, 17. Mai 2019 (CEST)Beantworten
Oh, vielen Dank. Was den Urinhalt und das heutige Murks anbetrifft, hatte ich zuerst den Eindruck, dass die Website gekapert wurde :-)... Ich habe die Seite auf meiner BEO. Gruß -jkb- 16:49, 17. Mai 2019 (CEST)Beantworten
Bitteschön, -jkb-. Da der Bot inhaltlich nicht erkennen und zu entscheiden vermag, ob der aktuelle Inhalt mit dem einst zur Referenzierung herangezogenen Inhalt übereinstimmt (war hier nicht der Fall), setzt er kein Memento, da die Seite ja live ist. – Mementos findest Du unter archive.org (wenn dort nichts), dann unter timetravel.mementoweb.org (wenn beim ersten Klick nichts [Brauchbares]), dann ein weiteres Mal auf Suchen klicken. – WP:Weblinks#Defekte Weblinks, WP:Weblinks#Archivierte Versionen und WP:Defekte Weblinks sind Dir bekannt? Gruß, --Wi-luc-ky (Diskussion) 01:22, 18. Mai 2019 (CEST)Beantworten
Ja, hallo, habe ich gesehen, vielen Dank, wie ich oben meinte, versuche ich zumindest meine Artikel auf dem laufenden zu halten (in letzter Zeit ist es auch jede Menge), ist aber nicht immer meine Stärke... Ich muss mir mal die anderen Änderungen anschauen schauen - die Web-/Literatur- und ähnliche Vorlagen halte ich für eher irritierend. Mal sehen. Noch einmal: danke! -jkb- 18:24, 23. Mai 2019 (CEST)Beantworten

Sichten von als defekt gemeldeten Links[Quelltext bearbeiten]

Hallo,

wenn der InternetAchiveBot einen Link als unerreichbar meldet, muss der entsprechende Artikel gesichtet werden. Muss ich als Sichter diesen Job machen?--Eduevokrit (Diskussion) 15:52, 12. Jun. 2019 (CEST)Beantworten

Wenn du es dir nicht zutraust, dann lieber nicht; andererseits sollte man den Artikel am besten auch nicht sichten, denn dadurch könnte die Bearbeiutung durch den Archivbot "verlorengehen" :-) -jkb- 16:42, 12. Jun. 2019 (CEST)Beantworten
Ich glaube, ich habe die Frage unklar formuliert. Sollte ich beim Sichten alle als defekt gemeldeten Links überprüfen? Oder ist das ein separater Schritt, den ich "anderen" überlassen darf? --Eduevokrit (Diskussion) 18:31, 12. Jun. 2019 (CEST)Beantworten
Bearbeitungen des InternetArchiveBots müssen nicht gesichtet werden. Wenn allerdings ein Artikel zuvor eine ungesichtet war bzw. die letzte Version vor der Botbearbeitung ungesichtet war, bleibt der Artikel natürlich ungesichtet. Das ist genau so, wie es bei menschlichen Benutzern auch funktioniert. Dementsprechend kannst du den Artikel also sichten, sofern der Artikel bzw. die Änderungen, die vor der Botbearbeitung zur Sichtung markiert waren, „sichtungswürdig“ sind.--Cirdan ± 19:13, 12. Jun. 2019 (CEST)Beantworten
Ah, vielen Dank, das hatte ich übersehen, das beantwortet meine Frage. Dankeschön an euch beide. --Eduevokrit (Diskussion) 00:01, 13. Jun. 2019 (CEST)Beantworten

Toter Link in Vorlage:Literatur[Quelltext bearbeiten]

Am Beispiel einer Änderung Special:diff/191990479 bei Flugplatz Bremgarten, wo vom Bot in der Literatur-Vorlage ein toter Weblink erkannt wurde, frage ich in die Runde, ob die Lösung sachgerecht war/ist. Denn diesen toten Link stehen zu lassen, ergibt bei der Anzeige des Einzelnachweises zweimal den aklickbaren Text "online verfügbar, PDF". Damit wir der Leser verwirrt. Ich habe den Parameter "Online=" dort manuell entfernt.

Ist das sachgerecht? Lässt sich die Bot-Arbeit verbessern? --KaPe (Diskussion) 09:45, 29. Jun. 2020 (CEST)Beantworten

Geringe Aktivität des Bots[Quelltext bearbeiten]

Mir ist aufgefallen, dass der Bot in letzter Zeit kaum aktiv war; nur eine Handvoll Edits im Dezember, davor zuletzt im Oktober. Warum? Gestumblindi 02:06, 15. Jan. 2021 (CET)Beantworten

Geht denn hier bald mal wieder was? Alle Probleme behoben? Nachschub an defekten Links für die Wartung wäre schön. ;-) Viele Grüße, Grueslayer 19:53, 23. Feb. 2021 (CET)Beantworten
Hallo Gestumblindi, Hallo Grueslayer, vielen Dank für die Nachfrage und das Interesse am Bot!
Der InternetArchiveBot läuft schon seit einer ganzen Weile nicht mehr automatisch, was drei Gründe hat.
Zum ersten ist seit geraumer Zeit die automatische „Totlinkerkennung“ defekt. Es kam zu sehr vielen Fehlerkennungen, daher hat der Bot sich nur noch darum gekümmert, Archivlinks zu manuell als tot markierten Weblinks hinzuzufügen. Davon gibt es mittlerweile nicht mehr so viele, die Edit-Frequenz des Bots auf seinem alphabetischen Weg durch den Artikelbestand hat also stark abgenommen. Warum die Erkennung über einen kurzen Zeitraum plötzlich erheblich schlechter geworden ist, ist soweit ich weiß unklar. In jedem Fall ist hier eine umfangreiche Analyse und Anpassung der Methodik nötig, um wieder halbwegs zuverlässig tote Links zu erkennen. Ob jemand daran arbeitet, weiß ich nicht, das vom Bot eingesetzte Tool hat ursprünglich mal die WMF entwickelt bzw. entwickeln lassen.
Zum zweiten leidet der Bot immer wieder unter Konfigurationsproblemen und sog. Regressionen, also Bugs, die schon einmal behoben wurden und sich dann in einer neuen Version wieder einschleichen. Der Bot war bislang ein Ein-Personen-Projekt und erfüllt (durchaus nachvollziehbar und verständlich) in dieser Hinsicht leider nicht die Qualitätsanforderungen, die man aus meiner Sicht an eine weltweit eingesetzte Software stellen muss. Nach dem letzten Update habe ich den Bot abgeschaltet, weil er Edits vorgenommen hat, ohne wie vorgeschrieben (und eigentlich auch konfiguriert) seine Unterschrift mit in die Vorlage zu setzen. Mittlerweile ist ein zweiter Entwickler mit dabei bzw. hat soweit ich sehe größere Teile der Entwicklungsarbeit übernommen. Inwiefern das mittelfristig zu mehr Stabilität und Robustheit führt, kann ich noch nicht abschätzen.
Der dritte Grund hängt direkt damit zusammen: Ich bin de facto der einzige „IABot-Betreuer“ in der deutschsprachigen Wikipedia und sehe es als meine Aufgabe an, den Bot zumindest stichprobenartig zu kontrollieren, auftretende Fehler zu melden bzw. zu beheben und auch immer wieder die Funktionsweise des Bots zu erklären. Wenn wie derzeit der Fokus meiner Akvititäten im Wikiversum nicht in der Wikipedia liegt, geht es auch beim IABot nicht voran.
Aus meiner persönlichen Sicht ist der IABot bzw. die von ihm erfüllte Funktion so wichtig, dass es angemessen wäre, hierfür zusammen mit den derzeitigen Entwicklern, dem InternetArchive (das die Entwicklung des als ehrenamtlichen Projekt gestarteten Bots zumindest zum Teil finanziert hat) und der WMF (oder einem Chapter) zusammen zu schauen, wie man eine professionelle Weiter- oder Neuentwicklung finanzieren könnte.--Cirdan ± 21:53, 23. Feb. 2021 (CET)Beantworten
Das ist sehr schade. Klingt nicht so, als würde der Bot nächste Woche wieder loslegen. Dabei ist er eines der wichtigsten Wartungstools.
Ich habe ein ausgeprägtes Technikverständnis und programmiere Textadventures. Wenn mich das qualifiziert, irgendwelche Arbeiten rund um den Bot zu übernehmen, damit Bewegung in die Sache kommt, sag Bescheid.
Viele Grüße, Grueslayer 00:56, 24. Feb. 2021 (CET)Beantworten
Hallo Grueslayer, das qualifiziert dich in jedem Fall.
Einerseits gibt es auf Benutzer:InternetArchiveBot/Fehler einige offene Meldungen, die du (sofern du es nicht schon kennst) nutzen könntest, im Management-Interface etwas Erfahrung zu sammeln.
Dort kannst du den automatischen Botlauf auch anschalten. Wie gesagt dürfte die Edit-Frequenz sehr niedrig sein, aber wenn du ein Auge auf die Botbeiträge und Benutzer:InternetArchiveBot/Fehler hast, kannst du ihn einfach mal laufen lassen. Ich bin die nächsten Wochen vermutlich regelmäßig online und kann Fragen beantworten. Ich habe Root-Rechte im Management-Interface und kann daher auch die Template-Konfiguration des Bots ändern (wobei das wie gesagt nicht immer die gewünschte Auswirkung hat).
Das Phabricator-Workboard für den Bot ist hier, das zugehörige Team-Workboard hier. Dort ist seit einiger Zeit Harej aktiv, Cyberpower678 ist der im Moment offenbar inaktive Hauptentwickler.
Viele Grüße,--Cirdan ± 18:18, 25. Feb. 2021 (CET)Beantworten

Falsche Anwendung von Vorlage "Toter Link"[Quelltext bearbeiten]

Der InternetArchiveBot erzeugt neustens einen Eintrag in WikiProjekt Weblinkwartung, es müsste laut WP:WLWT so (mit {{Toter Link |inline=1) aussehen, auch wird als Bearbeiter nicht der Bot sondern ein Nutzer eingetragen. (siehe z. B. hier) --Former111 (Diskussion) 13:49, 15. Apr. 2021 (CEST)Beantworten

Hallo Former111, vielen Dank für die aufmerksame Prüfung! Der zweite von dir angesprochene Punkt ist kein Fehler, sondern hier wurde der Bot manuell von einem Benutzer (in diesem Fall Benutzer:Bwbuz) eingesetzt.
Kannst du den Fehler bei {{Toter Link}} bitte nochmal auf Benutzer:InternetArchiveBot/Fehler eintragen? Derzeit ist der Bot (inklusive dem Management-Interface, über das die Vorlagen konfiguriert werden) wegen eines Datenbankfehlers komplett abgeschaltet. Sobald das Interface wieder aktiv ist, kann der Fehler nachvollzogen und die Konfiguration korrigiert werden.--Cirdan ± 14:26, 15. Apr. 2021 (CEST)Beantworten
Den gleichen Hinweis habe ich dem Kollegen Former111 in der vergangenen Woche bereits gegeben, nachdem er mich auf meiner Disk dazu angesprochen hatte. Doppelt hält wohl besser… --Bwbuz (Diskussion) 15:56, 15. Apr. 2021 (CEST)Beantworten
Deshalb hatte ich es ja auch in dieser zugehörigen Diskussion gemeldet, hatte es wohl missverstanden. Jetzt habe ich es auch in InternetArchiveBot/Fehler eingetragen. --Former111 (Diskussion) 16:06, 15. Apr. 2021 (CEST)Beantworten

Häufige Benutzerfehler[Quelltext bearbeiten]

Die User verwenden leider ab und an die Wikilink-Syntax für Weblinks, also [http://test.com/1.html| Link] (das Pipezeichen ist falsch). Manche Seiten ignorieren das Pipezeichen, manche Seiten liefern einen 404er. Oft ist der Link danach tot und wird mit Vorlage:Toter Link markiert. Das ist nicht grundsätzlich falsch. Hier gab es vor einer Wochen ca. 1600 solche Links mit Pipe-Zeichen, nun sind es noch 600 Stück. Kann man solche Links eventuell etwas anders behandeln? --Wurgl (Diskussion) 15:24, 11. Nov. 2021 (CET)Beantworten

Jenischpark[Quelltext bearbeiten]

Bitte prüfen, weshalb der Bot zwei Archivlinks als "offline" gekennzeichnet hat. Ich habe "offline" entfernt, weil sie funktionieren. Alinea (Diskussion) 16:27, 3. Mär. 2022 (CET)Beantworten

GameRankings[Quelltext bearbeiten]

Die Website ist schon seit Jahren nicht mehr existent und ein klassischer Fall für den Einsatz der Wayback Machine. Da die Domain aber auf die Metacritic Startseite weiterleitet, wertet der Bot sie Seite als live. Wenn ich URL Daten Verwalten wähle https://iabot.toolforge.org/index.php?page=manageurlsingle&url=gamerankings.com dann ändert sich nicht das Verhalten des Bots. Er archiviert keine GameRanking Links. PS: In der Zusammenfassung habe ich geschrieben "but the content was imported". Es muss aber "not imported" heißen. Die Datenbanken wurde nicht zusammengelegt. Die neue URL ist kein Ersatz. Es war lediglich eine Marktbereinigung. --Matthias 09:29, 6. Okt. 2022 (CEST)Beantworten

Wie geht der Bot mit "Umzügen" von Inhalten um?[Quelltext bearbeiten]

Die vielfach verlinkten Websites des United States Forest Service sind vor einiger Zeit von www.fs.fed.us nach www.fs.usda.gov umgezogen worden. Die Filestruktur ist dabei (in der Regel) erhalten geblieben. Kann man den Bot das automagisch anpassen lassen? Grüße --h-stt !? 16:17, 14. Okt. 2022 (CEST)Beantworten

gov39.ru etc.[Quelltext bearbeiten]

Diese, wie auch andere russische Regierungswebseiten, sind, wohl wegen des Ukrainekrieges, derzeit von hier aus nicht abrufbar. Insofern ist die Nichtabrufbarkeit möglicherweise nicht endgültig. --Georg0431 (Diskussion) 14:04, 24. Nov. 2022 (CET)Beantworten

Abschaltung einer Website und Bitte um einen gezielten Lauf des Bots[Quelltext bearbeiten]

Im Februar 2023 wurde die Seite dresdner-statteile.de abgeschaltet. Der ursprüngliche Betreiber der Seite war im August 2022 verstorben und es ist davon auszugehen, dass die Betreibung der Seite durch dessen Erben gekündigt wurde. Die qualitativ hervorragende Website wurde ab 2002, deren erster Erstellung regelmäßig im WebArchive archiviert/dokumentiert, auf diese Weise ist z.B. das Impressum dieser Seite insgesamt 195mal im WebArchive vorhanden. Die letzte komplette Sicherung der Website erfolgte Ende Januar 2023.

Auf der Portal-Unterseite Portal Diskussion:Dresden/''dresdner-stadtteile.de'' ist gestern durch mich umfangreich gelistet, wie und wo die abgeschaltete Seite dresdner-stadtteile.de als Link in Artikeln (1034 mal), Artikel-Diskussionen und verschiedenen anderen Seiten eingebunden wurde. Um hier nicht einen allzu großen Bruch zu erzeugen, wäre es hilfreich, den Bot gezielt über diese Links automatisiert "drüberlaufen zu lassen". Nach eigener Einschätzung sind sämtliche angegebenen Links im WebArchive zu finden, hilfreich wäre natürlich die automatisierte Ersetzung durch die jeweils neueste archivierte Fassung.

Ich hoffe, keine Fehlbitte getan zu haben und stehe für Anfragen/Rückfragen/Erläuterungen gern zur Verfügung. Vielen Dank im Voraus und viele Grüße,--Rote4132 (Diskussion) 10:30, 7. Mär. 2023 (CET)Beantworten