Benutzerin Diskussion:Giftpflanze/Archiv/2014/01

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Season’s greetings

HNY!

Zu den HTTP-Statuscodes erlaube ich mir auf Hintergrundmaterial hinzuweisen, falls du diese Seite noch nicht kennen solltest.

Schönes Rest-2014 noch --PerfektesChaos 17:10, 1. Jan. 2014 (CET)

Hihi, danke, das kannte ich noch nicht. :) Ebenfalls jahreszeitlich übliche Grüße, Giftpflanze 20:50, 1. Jan. 2014 (CET)

Links zu Alpha-Centauri

Hallo Giftpflanze.

Die Alpha-Centauri-Sendungen von Harald Lesch sind so gut, dass sie regelmäßig als "vom Feinsten" gelten können. Entsprechend sind sie in vielen Physik-Artikeln verlinkt. Leider hat der Bayrische Rundfunk die Angewohnheit alle paar Jahre die URLs zu verschieben. Dabei geht es um eine dreistellige Zahl von Links. Um uns von der Redaktion Physik die dann nötige Anpassung zu erleichtern, haben wir die Vorlage {{vorlage:Alpha Centauri}} gebaut.

Nachdem der BR mal wieder den Pfad geändert hatte, habe ich eben die Vorlage entsprechend angepasst. Jetzt sollten die von der Vorlage erzeugten Weblinks alle wieder funktionieren. Allerdings sitzt in den Disk-Seiten der Artikel natürlich noch die Warnung des Gift-Bots. Kann man die irgendwie automatisiert los werden?

Und für die Zukunft: Wäre es möglich, dem Gif-Bot eine Ausnahmeregelung beizubringen? Etwa in der Art, dass für den Fall, dass ein Alpha-Centauri-Link defekt ist, dies nicht auf der Disk. des Artikels, sondern auf der QS-Seite der Physik-Redaktion vermerkt wird? Idealerweise nur einmal und nicht n-Mal. Denn bei einer Verschiebung sind typischerweise alle Alpha-Centaur-Links defekt.

Auf jeden Fall vielen Dank für den Bot. Ohne ihn hätte ich gar nicht gemerkt, dass der BR verschoben hat. Gruß, ---<)kmk(>- (Diskussion) 00:02, 7. Jan. 2014 (CET)

Hallo KaiMartin, lies doch mal Wikipedia_Diskussion:Lua/Werkstatt/Defekter_Weblink_Bot#Zwischenschritt:_Power-Fixing - damit müsste das Problem abgefangen werden.--Mabschaaf 00:14, 7. Jan. 2014 (CET)
Ja, so eine Vorab-Information über Link-Cluster würde für die Zukunft helfen. Ist das schon umgesetzt und beim nächsten Lauf des Gift-Bost aktiv?
Und was ist mit den aktuellen Gift-Bot-Meldungen zu Alpha-Centauri auf den Diskussionsseiten? Gibt es dazu eine andere Chance als sie von Hand abzuklappern?---<)kmk(>- (Diskussion) 00:47, 7. Jan. 2014 (CET)
Könntest Du mal eine Disku-Seite verlinken, auf der noch der Hinweis auf einen defekten Alpha-Centauri-Link steht?--Mabschaaf 13:05, 7. Jan. 2014 (CET)
Ich werde beim nächsten Mal auf jeden Fall Vorabinformationen geben. Zu den noch vorhandenen erledigten Meldungen: Die wollte ich komplett beim nächsten Lauf entfernen, um die Anzahl der Bearbeitungen zu minimieren. Die jetzt schon zu entfernen halte ich für nicht notwendig. Falls es dich jedoch sehr schmerzt und du sie per Hand entfernen möchtest, würde ein spezieller Botlauf Sinn machen, allerdings stecke ich bis über den Kopf in Arbeit (und das ist nicht mal eben so gemacht). Ich würde jetzt in dem Fall auf BA verweisen, aber da wird ja momentan auch kaum etwas abgearbeitet – Giftpflanze 19:14, 7. Jan. 2014 (CET)

Es stellt sich raus, dass die Lage ein gutes Stück unübersichtlicher ist als ich dachte. Nicht alle Alpha-Centauri-Links sind gleich:

  • Alle beim BR verfügbaren Videos haben eine Mediathek-URL
  • Bei den meisten, aber nicht bei allen Videos der Mediathek funktioniert der alte Weblink immer noch.
  • Bei den meisten, aber nicht bei allen Videos ist der Mediathek-Dateiname der gleiche wie bei der alten URL. Einige haben einen neuen Namen bekommen, der statt einem Stichwort nur noch eine Nummer enthält.
  • Es sind aus rechtlichen Gründen nur die Sendungen beim BR erhältlich, die in den letzten fünf Jahren wiederholt wurden. Dadurch sind einzelne Sendungen aus dem Angebot des BR heraus gefallen. Das betrifft zum Beispiel die Sendung "Gibt es Überlichtgeschwindigkeit?". Das Video zu dieser Sendung gibt es nur noch über Youtube.

Anders als ich dachte, sind nicht alle 200 Alpha-Centauri-Links ungültig geworden, sondern nur einige. Bei meinen Stichproben hatte ich gestern offenbar besonderes "Glück" nacheinander vier Nieten gezogen zu haben. Das heißt, dass es doch keine massenhaft ungültigen Weblinks gab und entsprechend keine jetzt überflüssigen Bot-Hinweise auf den Diskussionsseiten. Die erwähnten Einzelfälle brauchen eine händisch eingerichtete Ausnahmebehandlung. Wir werden wohl die Alpha-Centauri-Vorlage so aufbohren (müssen), dass sie auch auf Youtube-Videos verweisen kann.
Danke schonmal im voraus für die Vorab-Info beim nächsten Botlauf. ---<)kmk(>- (Diskussion) 20:50, 7. Jan. 2014 (CET)

WP:LT/ggu

Hübsches Teilchen.

  • Kann eine echte Alternative zum markAdmins werden.
  • Die Doku-Seite habe ich heute mal ein wenig den anderen angepasst und ausgebaut.

Bug-Report:

  • Die Seiten melden sich mit einem max-age=86400 GMT.
    • Ich weiß nicht, ob du das angeordnet hast, oder ob das von wmflabs generiert wird.
    • Das GMT muss jedenfalls raus; es macht die Zahlenangabe ungültig.
    • 86400 Sekunden sind auch immer ein Tag; egal ob auf den Malediven oder in London.
  • Mit deinem JavaScript-Output habe ich allerlei Probleme.
    • Der momentane Rückgabewert ist syntaktisch falsch. JS würde versuchen, den Wert der Variablen bureaucrat vom Wert der Variablen dewiki zu subtrahieren. Das wird nix.
    • Obendrein würdest du, selbst wenn das durch Unterstreichungsstriche ersetzt würde, den globalen Namensraum einsauen. Den halten wir aber seit einigen Jahren sauber. Alternative: JSON-Objekt (siehe unten).
    • new Array() ist zwar syntaktisch richtig, aber seit längerer Zeit aus der Mode. Man schreibt nur noch [] und allenfalls zur Reservierung eines Arrays mit numerischer Zahl leerer Elemente das alte Format.
    • Besser ist die Antwort als JSON:
{ "dewiki": {
    "bureaucrat": ["APPER", "Inkowik", "Itti", "MBq", "Merlissimo"],
    "checkuser": ["Drahreg01", "Filzstift", "Kulac", "Theghaz"],
    "oversight": ["Millbart", "Nolispanmo", "PDD", "Ra%27ike", "XenonX3"]
  },
  "metawiki": {
    "steward": ["Amqui", "Avraham", "Barras", "Bencmq", "Bennylin", "Billinghurst", "Bsadowski1", "DerHexer", "Elfix", "J.delanoy", "Jon_Harald_S%C3%B8by", "Jusjih", "Jyothis", "Leinad", "M7", "MBisanz", "MF-Warburg", "Mardetanha", "Matanya", "Mathonius", "Melos", "Mentifisto", "Pathoschild", "Pundit", "Quentinv57", "QuiteUnusual", "Ruslik0", "Shizhao", "Snowolf", "Tegel", "Teles", "Thogo", "Trijnstel", "Vituzzu", "Wikitanvir", "Wpedzich"]
  }
}
  • JS-Programmierer können allerdings nicht darauf zugreifen, weil man von wikipedia.org aus kein Ajax auf wmflabs.org machen darf. Ich würde mir die Infos also über die normale API holen müssen und hätte nichts von JSON.
  • Viel genialer wäre allerdings ein selbstausführbares Skript wie folgt, dass auch in einer Wiki-Seite verwendbar wäre und zukünftig analog etwas für eine Live-Datenbank defekter Weblinks sein könnte:
( function ( mw ) {
   "use strict";
   var UGM;
   if ( mw ) {
      if ( typeof mw.libs.userGroupMembers !== "object" || ! mw.libs.userGroupMembers ) {
         mw.libs.userGroupMembers = { };
      }
      UGM = mw.libs.userGroupMembers;
      UGM._version = -1.0;
      UGM._update = "2014-01-19T19:01:23+0000";
      if ( ! UGM.dewiki ) {
         UGM.dewiki = { };
      }
      UGM.dewiki.bureaucrat =
         ["APPER", "Inkowik", "Itti", "MBq", "Merlissimo"];
      UGM.dewiki.checkuser =
         ["Drahreg01", "Filzstift", "Kulac", "Theghaz"];
      UGM.dewiki.oversight =
         ["Millbart", "Nolispanmo", "PDD", "Ra%27ike", "XenonX3"];
      if ( ! UGM.metawiki ) {
         UGM.metawiki = { };
      }
      UGM.metawiki.steward =
         ["Amqui", "Avraham", "Barras", "Bencmq", "Bennylin", "Billinghurst", "Bsadowski1", "DerHexer", "Elfix", "J.delanoy", "Jon_Harald_S%C3%B8by", "Jusjih", "Jyothis", "Leinad", "M7", "MBisanz", "MF-Warburg", "Mardetanha", "Matanya", "Mathonius", "Melos", "Mentifisto", "Pathoschild", "Pundit", "Quentinv57", "QuiteUnusual", "Ruslik0", "Shizhao", "Snowolf", "Tegel", "Teles", "Thogo", "Trijnstel", "Vituzzu", "Wikitanvir", "Wpedzich"];
      if ( typeof UGM._callback === "function" ) {
         UGM._callback();
      }
   }
}( window.mediaWiki ) );

Die Infos kannst du dann auch flott archivieren; wer mag schon Bug reports.

Liebe Grüße --PerfektesChaos 21:33, 19. Jan. 2014 (CET)

Danke für die Kritik, nur bin ich gar nicht mal die Autorin dieser Software, ich bin zwar als Maintainerin eingetragen, dies aber nur, weil ich dieses Tool (als einzige?) nutze und mich zweimal beschwerte, als es nicht verfügbar war. Ich habe wikivoyage als mögliches Wiki hinzugefügt, ansonsten verstehe ich nicht viel von PHP, das mit dem GMT kann ich aber noch lösen. Den Rest verstehe ich gerade überhaupt nicht. Ich biete dir an, das Tool selbst nach deinen Wünschen zu verändern. -- Giftpflanze 22:02, 19. Jan. 2014 (CET) PS: Oder frag doch mal tim.landscheidt, der hat da einige commits gemacht.
Und ich verstehe Null von diesen Tool-Welten.
Dann verstehe ich aber, dass du da keine Entwicklerin sein magst.
Das JavaScript ist aus Sicherheitsgründen in einer Wiki-Seite ohnehin zurzeit nicht nutzbar; aber auf den skizzierten Weg mit selbstausführbarem Skript kommen wir dann mal zurück, wenn die Live-Datenbank defekter Weblinks einer Wiki-Seite antworten soll.
Mehr als das neckische CSS braucht es sowieso nicht.
Dann also bald erl.
Frage an die Fachfrau: Gibt es eigentlich eine Benutzerin mit botflag? Wäre das erstrebenswert?
LG --PerfektesChaos 22:14, 19. Jan. 2014 (CET)


Ich kann auch kein PHP; aber ich patche mal.

Zeile 48–75:

// if cssmarker-output format is choosen, check whether it is given and valid, if not die
if ( !preg_match( "/\\w/", $_GET['localuser'] ) && ( $_GET['format'] == "cssmarker" ) ) die( "invalid localised username" );
// if no caching time in seconds is given, three days are used (60*60*24*3)
if ( !array_key_exists( 'cache', $_GET ) || !$_GET['cache'] ) $cache = 259200; else $cache = $_GET['cache'];
// check if the cache format is ok, if not die
if ( !preg_match( "/^[0-9]+$/", $cache ) ) die( "invalid cache format" );
if ( $cache < 86400 ) {        // 1 day
        $cache = 86400;
}

$queryhash = md5( $_GET['format'] . "-" . $_GET['localuser'] . "-" . $_GET['query'] );

switch ( $_GET['format'] ) {
        case "wikilist":
                header( 'Content-type: text/plain' );
                break;
        case "jsarenc":
                header( 'Content-type: text/javascript' );
                break;
        case "cssmarker":
                header( 'Content-type: text/css' );
                break;
}

header( "Expires: " . gmdate( "D, d M Y H:i:s", time() + $cache ) );
header( "Cache-Control: max-age=" . $cache );

Lustig. Auf github driften die Zeilennummerierung und die Zeilen auseinander (siehe Seitenende).

Zeile 124–130:

 if ( $_GET['format'] == "jsarenc" ) {
                $output .= "${wiki}_${group} = [";
                for ( $i = 0; $i < $userCount; ++$i ) {
                        $output .= "\"" . str_replace( '%21', '!', urlencode( str_replace( " ", "_", $users[$i] ) ) ) . "\""; if ( $i != $userCount - 1 ) $output .= ", ";
                }
                $output .= "];\n\n";
        }

Schön wenn dann schon # BUGGY: im Quellcode steht.

Was ich geändert habe, siehst du ja dann beim Diff.

Kann ich auch für meine JavaScript-Vorschläge machen; aber einstweilen braucht die ohnehin niemand nirgendwozu.

Liebe Grüße --PerfektesChaos 14:58, 20. Jan. 2014 (CET)

Defekte Weblinks

Hallo Giftpflanze, bist Du gerade oder demnächst auf Suche nach defekten Weblinks? Sobald es eine neue Liste gibt, kannst Du mir die bitte vorab (vor den Diskseitenmeldungen) zukommen lassen, damit man den Teil mit mehfach verwendeten URL vorab per Bot fixt. Viele Grüße --Septembermorgen (Diskussion) 21:42, 20. Jan. 2014 (CET)

@Septembermorgen: Schon gesehen? ;-) --Mabschaaf 21:45, 20. Jan. 2014 (CET)
Danke. Nein, noch nicht. Gruß --Septembermorgen (Diskussion) 21:47, 20. Jan. 2014 (CET)
btw. Hat jemand einen brauchbaren Comandline-Webcrawler zum Headertesten für Linux zur Hand? Ich habe mir gestern den Externallinks-Dump geholt und in eine neu installiert maria-db eingespielt (hat überraschend lange gedauert, bis die 2,5GB geladen waren!). Der Crawler sollte wenn möglich mehrere URIs gleichzeitig prüfen. Mein bisheriges Verfahren ist strikt seriell, und wäre damit viel zu langsam. In den Rohdaten (ohne Filter auf Namensraum) sind es übrigen 14Mio URIs, bei distincter Zählung immer noch 12Mio. Frohes Schaffen — Boshomi ☕⌨☺22:50, 20. Jan. 2014 (CET)

Erneuter Missmatch bei LA/EA nach Datum und nach Kategorie

Hi Giftpflanze,

evtl. könntest du mal wieder deine Zaubertools anwerfen und die Eintragungen LA/EA nach Datum und in der entsp. Kategorie vergleichen. Es gibt wieder Abweichungen die für den normalsteblichen nicht auffindbar sind. Danke im Voraus! MfG--Krib (Diskussion) 08:09, 24. Jan. 2014 (CET)

nur Kategorie nur Liste
Lesenswerte Artikel MZ 125
Exzellente Artikel
Informative Listen Liste der Straßen und Plätze in Berlin-Heinersdorf
Danke für deine Mühe, aber irgendwas stimmt nicht (hab MZ 125 korrigiert und die S.+P. in Berlin-Heinersdorf sind in der Kat aufgeführt). Bei den LA sind wir laut Liste nach Datum bei 3637 und laut KAT bei 3634 (Diff=3). Bei den EA sind wir laut Liste nach Datum bei 2271 und lat KAT bei 2267 (Diff=4). Es ist zum verrückt werden, wir hatten es ja korrigiert vor nicht allzu langer Zeit. MfG--Krib (Diskussion) 21:33, 24. Jan. 2014 (CET)
Die informative Liste ist im Januar schon korrigiert worden, die obigen Daten sind vom 31. Dezember 2013. Die Differenzen sind wohl wieder auf einen Datenbankfehler zurückzuführen (war da nicht mal was?), ich werde mir das wannanders noch angucken. – Giftpflanze 13:58, 25. Jan. 2014 (CET)
Danke! MfG--Krib (Diskussion) 14:03, 25. Jan. 2014 (CET)