Vorlage Diskussion:Defekter Weblink

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 7 Monaten von PerfektesChaos in Abschnitt Vorlagenfehler seit Änderung des Lua-Moduls
Zur Navigation springen Zur Suche springen
Diese Diskussionsseite dient dazu, Verbesserungen an der Vorlage „Defekter Weblink“ zu besprechen. Persönliche Betrachtungen zum Thema gehören nicht hierher. Für allgemeine Wissensfragen gibt es die Auskunft.

Füge neue Diskussionsthemen unten an:

Klicke auf Abschnitt hinzufügen, um ein neues Diskussionsthema zu beginnen.

Ausgabe eines Schattenlinks zum Auffinden gefundener ungefixter und bereits gefixter URLs / URLs mit problematischen Zeichen[Quelltext bearbeiten]

Inzwischen ist der Botlauf fast vollständig (nur noch Artikel aus 2015 fehlen), da würde die Ausgabe von Hilfslinks für die Wartung richtig effizient. Durch die Auslieferung einer nicht sichtbaren URL (<span style="display:none;">) mit einem fixen Präfix lassen sich bereits gefixte URL, wo die Vorlage noch nicht entfernt wurde, oder bestimmte Muster noch nicht gefixter URLs recht effizient finden. Auch für die Problemfälle wären derartige URLs viel effizienter als Kategorien (Was nützt eine kategorisierte Seite wenn etwa in einem Nekrolog 1000 URL vorkommen, hundert davon defekt, und nur eine Handvoll haben irgendwelche Zeichenfehler?)

Beispiel für eine analoges SQL wäre beispielsweise dieses Quarry, hier für das Internet Archive zum Auffinden von URLs, die anderswo bereits als Archiv-URL vorliegen (Quarry 7499):

USE dewiki_p;
SELECT CONCAT('| ',CONCAT('[[',GROUP_CONCAT(pr.page_title SEPARATOR ']], [['),']]'),' || ', farchivepage  ,' || ', el_to) as tableline
FROM externallinks as eur 
   INNER JOIN page as pr on eur.el_from=pr.page_id
   INNER JOIN (SELECT substring(euf.el_to,29+15) as f, CONCAT('[[',GROUP_CONCAT(pf.page_title SEPARATOR ']], [['),']]') as farchivepage, max(euf.el_id) as m_id
        FROM externallinks as euf INNER JOIN page as pf on euf.el_from=pf.page_id
        WHERE el_index LIKE "https://org.archive.web./web/______________/%" 
        and pf.page_namespace=0
        GROUP BY substring(euf.el_to,29+15)      ) as filter on filter.f=el_to

WHERE pr.page_namespace=0 
GROUP BY el_to
ORDER BY m_id DESC              
LIMIT 100
Erklärung: die Subquery "filter" liefert alle URL, durch das Internet-Archive im Artikelsnamensraum vorkommen, sowie eine Liste aller davon betroffen Artikel.
Die Hauptabfrage liefert eine Tabellenzeile, die zu einer betroffenen URL eine Liste alle Lemmata mit Vorkommen der Live-URL und eine Liste aller Lemmata mit korrespondierender Archiv-URL enthalten.
Die Sortierung erfolgt nach Hinzufügen der Archiv-URL absteigend.

Mit einem Präfix à la http://giftbot.invalid/$defekteURL ließen sich analoge SQL-Abfragen basteln, die man recht effizient in Wartungslisten und Botaufträge umsetzen könnte. Im Fall von Fehlern wie seltsame Zeichen könnte man diese ebenso ausgeben, z. B. ltrrtl.giftbot.invalid, pipe.giftbot.invalid,... Mit Hilfe von Quarry oder der Giftbot/weblinksuche wären praktische Wartungslisten kein Problem. Die Vorlage {{Toter Link}} arbeitet schon seit langer Zeit mit solcher Technik. @Giftpflanze, PerfektesChaos, Mabschaaf, Leyo:. (@Leyo,Giftpflanze: ich sehe die Ausgabe solcher Schatten-URLs auch als Ergänzung zu einer Filtermöglichkeit nach defekten Weblinks über die Giftbot/weblinksuche.) Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht15:02, 21. Feb. 2016 (CET)Beantworten

Hier ein Beispiel das Ergebnis des obigen Quarry:


 Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht15:21, 21. Feb. 2016 (CET)Beantworten

@Boshomi: Ich kann dazu inhaltlich nicht viel sagen. Formal ist die Diskussion hier auf der Vorlagenseite aber falsch. Wenn Du Dir den Quelltext vorne anschaust, siehst Du, dass die Vorlage nur noch das Modul aufruft. Mehr ist da nicht. Wenn das Modul geändert/erweitert werden soll, muss PC ran, der ist der einzige, der das pflegen kann. Der bessere Diskussionsort wäre wohl Wikipedia:Lua/Werkstatt/Defekter Weblink Bot.--Mabschaaf 21:28, 22. Feb. 2016 (CET)Beantworten
@Mabschaaf:: Klar liegt das bei PerfektesChaos. Der Nutzen solche Abfragen sollte sich allerdings schon aus dem obigen Beispiel erschließen, das eine recht klare fast vollständig abarbeitbare Wartungsliste ergibt (entweder Original ist tot, dann das Archiv, andernfalls sollen die Archive wieder durch Originallinks ersetzt werden. (Mir ist bewusst, dass diese konkrete Abfrage Datenbanktechnisch schon recht anspruchsvoll ist, immerhin wird über ein gruppiertes Subselect gefiltert, in einer Tabelle mit 20 Mio Datensätzen und einem fast 6stelligen Resultat im Subselect. Allerdings wären die allermeisten der sehr nützlichen Abfragen um 10er-Stufen billiger machbar.) Insbesondere Schattenlinks auf Problem-URLs kosten der Datenbank fast gar nichts, und wenn man sich z. B. auf die Abarbeitung eines speziellen Zeichens beschränkt, ist man mit einer ganzen Kat in den meisten Fällen in recht kurzer Zeit fertig. Siehe mal die Liste, die ich erst im Wartungsbausteinwettbewerb abgeliefert habe. Das war natürlich das Produkt einer systematischen Herangehensweise. Nur möchte ich diese systematische Arbeit möglichst vielen Benutzern ermöglichen.  Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht21:56, 22. Feb. 2016 (CET)Beantworten
Siehe Quarry:query/7715  Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht18:00, 29. Feb. 2016 (CET)Beantworten

Vorlagenfehler seit Änderung des Lua-Moduls[Quelltext bearbeiten]

Die Vorlage verhindert jetzt die Auflösung von der eigenen und folgenden Vorlagen: (Siehe hier diese Disk)
Nach hinzufügen des Tages im Parameter "|Lauf=" werden folgende Vorlagen wieder aufgelöst (siehe Änderung hier)
@PerfektesChaos: Wahrscheinlich durch die Änderung des intern aufgerufenen LUA-Moduls. --WiKi1939 (Diskussion 14:39, 6. Sep. 2023 (CEST)Beantworten

Ich meine, ich hätte in genau derselben Angelegenheit (dir?) vor wenigen Tagen schon einmal geantwortet.
Die Seite ist schlicht und einfach zu groß.
  • Sie lag oberhalb einer erlaubten Seiten-Größe.
  • Mit deiner Änderung hast du irgendwie 100 Bytes „eingespart“.
  • Dadurch ist sie momentan wieder um 20 Bytes unter Limit gefallen, oder was.
  • Mit irgendeiner Präzisierung einer Angabe, oder der nächsten IA-Bot-Meldung, wird sie wieder explodieren und über dem Limit liegen.
Das ist alles Pfuscherei.
  • Der Artikel muss aufgeteilt werden.
  • Das ist kein stabiler Zustand, und eine Zumutung auf Smartphones oder bei langsamer oder teurer Internetverbindung.
  • Aufgeteilt werden mag zeitlich, ggf. Vor-, Haupt-, Nachsaison; oder regional (westliche und östliche Küstengebiete).
Im Übrigen hast du nicht „das LUA-Modul geändert“, sondern den Vorlagenparameter auf einen unbekannten und damit unerlaubten Wert gesetzt, und damit womöglich die Ausführung komplett abgeschossen.
Die von mir kürzlich vorgenommene Änderung am Lua-Modul hat damit überhaupt nichts zu tun.
VG --PerfektesChaos 16:00, 6. Sep. 2023 (CEST)Beantworten
Es geht hier nicht um den Artikel sondern die [[Diskussionsseite Abschnitt "Defekte Weblinks"!
Diese Diskussionsseite ist doch noch ziemlich klein, was soll da aufgeteilt werden?. --WiKi1939 (Diskussion 16:24, 6. Sep. 2023 (CEST)Beantworten
So, vorstehend unter Vorbehalt, du hast nicht den Artikel, sondern die Disk verlimkt.
Es hat 30 Grad, ich habe nur wenige Minuten pro Tag für alle Anfragen zusammen; nähere Untersuchung muss warten bis es kühler ist und ich wach bin.
VG --PerfektesChaos 16:03, 6. Sep. 2023 (CEST)Beantworten
Vorstehend ein seltsamer BK, 16:03 ./. 16:24?
Die Aussage zum Artikel war grundsätzlich richtig, nur der Wirkmechanismus ein anderer.
  • Der Artikel hat heute eine expandierte Größe von 1.912.364 Bytes, erlaubt sind 2 MB.
  • Zur Auswertung auf defekte Weblinks bindet das Lua-Modul auf der Diskussionsseite den Artikel ein, expandiert ihn und prüft darin die URL.
  • Dabei findest du in der Liste der in die Diskussionsseite eingebundener Vorlagen auch alle im Artikel benutzten, etwa „Veraltet“, obwohl die ja gar nicht in der Diskussionsseite vorkommen.
  • Dabei wurde offenkundig das Limit gesprengt durch den am Limit tänzelnden Artikel.
  • Die wirksame Größe der Diskussionsseite „ist doch noch ziemlich klein“ ist nicht das was du sehen kannst.
Der Artikel und einige seiner Brüder sind seit Jahren Dauerbrenner etlicher Anfragen auf FZW usw.
  • Sie sind bis exakt an das Limit von 2 MB herangeschrieben.
  • Sobald der IA-Bot ein defektes Weblink vermerkt, explodiert der Artikel wieder neu.
  • Als „Abhilfe“ werden dann IQ-Vorlagen usw. durch direkte Wikisyntax-URL ersetzt usw., weil dadurch einmal COinS wegfällt (meist >1 kB) usw., oder es werden Einzelnachweise gelöscht oder enzyklopädische Angaben gekürzt, bis es wieder „passt“.
Dieser Artikel und seine Brüder sind wie beschrieben auf mehrere aufzuteilen.
  • Das ist seit vielen Jahren ein einzige Pfuscherei.
  • Das Rumgemurkse ist auch längst projektweit bekannt, bzw. berüchtigt.
  • Sobald die Programmierung einer der zu Hunderten eingebundener Vorlagen einige Bytes mehr produziert, wird das Limit wieder geknackt.
Meine im August vorgenommene Anpassung des Lua-Moduls hat, nichts, aber so abolut rein gar überhaupt nichts damit zu tun.
Deine Eingabe eines ungültigen Werts für den Lauf= hatte einfach nur die Ausführung komplett zerschossen.
VG --PerfektesChaos 17:34, 6. Sep. 2023 (CEST)Beantworten
„Dabei findest du in der Liste der in die Diskussionsseite eingebundener Vorlagen auch alle im Artikel benutzten, etwa „Veraltet“, obwohl die ja gar nicht in der Diskussionsseite vorkommen.“ (PerfektesChaos)
Auf der Diskussionsseite werden nur die folgenden eingebundener Vorlagen angezeigt, und diese kommen auch nur vor!?
Folgende Vorlagen werden von dieser Seite verwendet:
    Vorlage:Anker (Quelltext anzeigen) (schreibgeschützt (nur Administratoren))
    Vorlage:Defekter Weblink (Quelltext anzeigen) (schreibgeschützt (nur Administratoren))
    Vorlage:Diskussionsseite (bearbeiten) (schreibgeschützt (nur Sichter))
    Vorlage:Diskussionsseite/styles.css (bearbeiten)
    Vorlage:Hilfe/clickbutton (bearbeiten)
    Vorlage:Info (bearbeiten) (schreibgeschützt (nur angemeldete, nicht neue Benutzer))
    Vorlage:Kasten (bearbeiten) (schreibgeschützt (nur Sichter))
    Vorlage:MediaWiki-Button/styles.css (bearbeiten)
    Vorlage:Neuer Abschnitt (bearbeiten) (schreibgeschützt (nur Sichter))
    Vorlage:Neuer Abschnitt/URL (bearbeiten) (schreibgeschützt (nur Sichter))
    Vorlage:Nicht archivieren (bearbeiten) (schreibgeschützt (nur angemeldete, nicht neue Benutzer))
    Modul:TemplUtl (bearbeiten) (schreibgeschützt (nur Sichter))
    Modul:Vorlage:Anker (bearbeiten) (schreibgeschützt (nur Sichter))
    Modul:Vorlage:Defekter Weblink (bearbeiten) (schreibgeschützt (nur Sichter))
„Deine Eingabe eines ungültigen Werts für den Lauf= hatte einfach nur die Ausführung komplett zerschossen.“ (PerfektesChaos 17:34)
Wieso ungültiger Wert? Es erfolgt dadurch Angabe eines gültigen ISO-Datums (Lauf=2015-10-01) keine Fehlernachricht von der Vorlage und dadurch werden die folgenden Vorlagen wieder aufgelöst.
--WiKi1939 (Diskussion 18:37, 6. Sep. 2023 (CEST)Beantworten

Das Modul kennt aus local Serie = "2015-10" den momentan gültigen Lauf.

  • Wenn dort ein anderes Datum steht, dann geht es davon aus, dass es sich um einen (älteren) Rest eines nicht mehr aktuellen Bot-Laufs handelt.
  • Dementsprechend löst es wohl eine Wartungskat „Ehemaliger Bot-Lauf“ aus.
  • Damit schaltet sich der Abschnitt soweit stumm, führt keine Aktivitäten mehr aus, und wartet darauf dass der aus einem früheren Bot-Lauf stammende Abschnitt eliminiert werden kann.
  • Wenn du da also irgendwelche Phantasie-Werte hineinschreibst, dann löst du völlig andere Effekte aus.
  • Und wenn du dem Abschnitt vorgaukelst, er sei inzwischen durch einen weiteren Bot-Lauf obsolet gemacht worden, dann bindet er sinnvollerweise auch nicht mehr den Artikeltext ein.
  • Würde er das tun, dann würden voraussichtlich auch alle im Artikel eingebundenen Vorlagen auf der Diskussionsseite ebenfalls als eingebunden gelistet werden. Kannst du zu jedem kleineren Artikel mit hiesiger Vorlage überprüfen.
  • Die Vorlagenparameter haben wohldefinierte Werte, und wenn du da absichtlich Schrott angibst, dann kommt halt eine Fehlfunktion heraus.
  • Das Gewurschtel kostet mich jetzt schon über eine Stunde bei glühender Hitze; Zeit und Nerven, die ich nciht habe und die Hunderten anderer Aufgaben verlorengeht.
  • Die atlantischen pazifischen Saisons irgendwecher Übel sind seit einem Jahrzehnt Dauerbrenner in den Hilferufen, weil sie bis auf 2 MB ausgereizt sind, was regelmäßig schiefgeht. Seit einem Jahrzehnt lautet die Antwort: Artikel aufteilen; völlig unzumutbar, auf den inzwischen aufgekommenen Smartphones katastrophal, bei langsamen Internet Totalschaden. Die eigentliche Ursache des Problems wird nicht beseitigt.

VG --PerfektesChaos 19:24, 6. Sep. 2023 (CEST)Beantworten

Diskussion:Pazifische Taifunsaison 2014 sagt es doch:
  • Defekter Weblink * Ehemaliger Bot-Lauf: 2015-10-01 (GiftBot) – GiftBot (Diskussion) 06:48, 12. Feb. 2016 (CET)
Angenommen, im November würde ein neuer Bot-Lauf gestartet mit dem sinnfälligen Bezeichner 2023-11, dann würde der Serienbezeichner im Lua-Modul entsprechend aktualisiert.
  • In dem Moment würden sämtliche aus 2015 stammenden Abschnitte als „Ehemaliger Bot-Lauf“ umswitchen und keine produktive Aktivität mehr entwickeln.
  • Eine Wartungskat ist jetzt im Moment nicht definiert, weil die Situation bislang nicht eingetreten ist.
  • Sie würde es ermöglichen, alle Diskussionsseiten aufzufinden, in denen noch ein obsoleter Abschnitt vorhanden ist, und einen Bot-Lauf kontrollieren, der alle diese Abschnitte aus den Artikeldisk herauslöscht, und falls die Seite dadurch inhaltsleer dann einen SLA stellen würde.
  • Der Bezeichner ist nicht irgendwie ein beliebiges Datum; er könnte auch MickyMaus lauten. Damit er selbsterklärend wird, hatte ich Jahreszahl und Monat für den mehrere Monate andauernden Bot-Kauf gewählt. Entscheidend ist, dass der Parameter dieser Vorlage identisch mit der im Modul hinterlegten Sereinbezeichnung ist; alles andere gilt als Überbleibsel früherer Bot-Läufe.
VG --PerfektesChaos 00:11, 7. Sep. 2023 (CEST)Beantworten