Wikipedia:Technik/Cloud/giftbot/weblinksuche
führt eine Suche nach in Seiten enthaltenen URL durch ähnlich Spezial:Weblinksuche, ist jedoch nach Namensräumen filterbar und es können weitere Platzhalter benutzt werden. Anders als auf der Spezialseite wird auch die Gesamtzahl der Treffer (URL, nicht Trefferseiten) angegeben.
Mittels der multilingualen Version linksearch können auch anderssprachige Wikipedia-Versionen analysiert werden.
Syntax für die zu suchende URL
[Quelltext bearbeiten]Platzhalter
- Als Platzhalter können
%
und_
benutzt werden. %
steht für beliebig viele (auch null) Zeichen._
steht für genau ein Zeichen.- Ist die URL am Ende nicht vollständig, muss sie mit einem Prozentzeichen abgeschlossen werden (anders als auf der Spezialseite!).
- Beispiele:
http://%.wikipedia.org/wiki/%
http://www.wiki_edia.org/
- Sollen die Zeichen
%
oder_
Teil der URL sein, müssen sie mit\
maskiert werden. - Beispiele:
http://de.wikipedia.org/wiki/\%25-Darstellung
http://de.wikipedia.org/wiki/Erster\_Weltkrieg
Protokoll
- Im Gegensatz zur Spezialseite muss das Protokoll immer mit angegeben werden.
- Zu beachten ist dabei allerdings, dass es auch protokollrelative URLs gibt, bei denen die Protokollangabe fehlt, diese beginnen dann mit
//
.
URL und URL-Parameter
[Quelltext bearbeiten]Nachstehend sind die Parameter aufgelistet, wie sie in der URL benutzt werden.
- Die Basis-URL lautet:
https://giftbot.toolforge.org/weblinksuche.fcgi
- Daran ist mit einem vorangehenden Fragezeichen
?
die Parameterliste anzuhängen. - Es folgen Zuweisungen name
=
Wert - Dabei darf Wert keine Leerzeichen enthalten; muss bei bestimmten Zeichen ggf. kodiert werden.
- Die einzelnen Zuweisungen name
=
Wert sind durch&
voneinander zu trennen.
- target
- Suchmuster für die URL
- namespace
- Nummer des Namensraums, auf den die Treffer beschränkt werden sollen
- Keine Angabe: Alle Namensräume
- associated
1
– Namensräume sowohl für Inhaltsseite wie auch zugeordnete Diskussionsseite durchsuchen0
(Vorgabe) – nur direkt angegebenennamespace=
analysieren, ansonsten alle Namensräume- limit
- Maximalzahl der Treffer pro Ergebnisseite
- Keine Angabe:
100
- offset
- Laufende Nummer des Treffers, ab dem die Ergebnissseite angezeigt werden soll
- Keine Angabe:
0
(ab dem ersten)
Es wird ein interaktives Formular angezeigt.
- Anschließend folgt in Reihenfolge der gefundenen URL die Trefferliste.
Aktualität
[Quelltext bearbeiten]Unter normalen Umständen werden schon innerhalb von Sekunden die URL-Änderungen im Artikel auch in der Giftbot/Weblinksuche sichtbar. Manchmal kommt es jedoch vor, dass die zugrundeliegende Datenbank „s5“ nur verzögert aktualisiert wird. Mit diesem Link kann man überprüfen, ob die Datenbank aktuell ist: Replag reported by heartbeat_p – wenn bei „s5“ eine Verzögerung von 0 angegeben ist, dann ist die Datenbank, und damit auch das Ergebnis der Giftbot/weblinksuche aktuell. Eine Verzögerung bei „s5“ hat eine negative Auswirkung auf eine Vielzahl von Werkzeugen. Bei stundenlanger Verzögerung und zusätzlich stark steigender Tendenz (Zunahme von 55 sek innerhalb einer Minute) kann eine Fehlermeldung auf Phabricator nützlich sein.