Wikipedia Diskussion:Meinungsbilder/Boteinsatz bei toten Links

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Initiator gesucht[Quelltext bearbeiten]

Ich hb einfach mal was zum Starten geschrieben, hab aber von den technischen Details keine Ahnung. Wer mag die Federführung als Initiator übernehmen? Gestumblindi, Drahreg01, Giftzwerg 88, Mirer, Yotwen, andere Interessierte? --Martina Disk. 07:57, 14. Jul. 2017 (CEST)

Da meine Sichtweisen hier selten mehrheitsfähig sind, denke ich es wäre besser, wenn jemand anderes die Federführung übernähme.
Wichtig fände ich auch die Diskussionen nicht zu sehr ausufern zu lassen (die letzten MB-Versuche machen da wenig Mut) und Trollereien und BNS-Aktionen unbeantwortet zu lassen. Auch das käme wohl nicht gut an und würde zu Manipulationsvorwürfen und weiteren BNS-Aktionen führen. Wenn wir hier z. B. die allgemeine Diskussion führen wollen/müssen, ob Bots gut oder böse sind, dann können wir das MB gleich wieder einstampfen. Dafür bietet ein konkretes MB zu einem Bot nicht den Rahmen und nötig bzw. hilfreich, ist diese Diskussion hier auch nicht.
Die Disks müssen um konkrete Aktionen/Änderungen geführt werden, um auf der Vorderseite jedem einen möglichst einfachen Einblick zu geben, welche Folgen das jeweils hat. So kann jeder einschätzen, welche Änderungen man persönlich möchte und welche nicht (mehr).
Auf die Art würde man für diesen einen Bot eine klare Grenze erkennen können, was gewünscht ist und was nicht. Darauf aufbauend könnte man dann weiterführende Diskussionen (zu Bots im Allgemeinen oder anderen Formen der Archivierung) an anderer Stelle weiterführen. --mirer (Diskussion) 17:50, 14. Jul. 2017 (CEST)
@Martina Nolte: Danke für deine Initiative! Ich werde dieses ziemlich verplante Wochenende kaum dazu kommen, mich wirklich damit zu befassen, trage mich daher jetzt noch nicht ein, stelle mich aber ab nächster Woche gerne als (Co-)Initiator zur Verfügung. Gestumblindi 21:39, 14. Jul. 2017 (CEST)
Prima! Das MB kann locker ein paar Tage warten. Ich wurde gefragt ob ich mithelfe und das tue ich. Aber als Initiator muss umseitig jemand anderes herhalten. --Martina Disk. 21:59, 14. Jul. 2017 (CEST)
Könntest du dir vielleicht vorstellen, Initial-Initiatorin ;-) zu bleiben, bis ich mich nächste Woche eintrage, damit der MB-Entwurf in der Zwischenzeit nicht ganz so initiatorlos und scheinbar unbetreut herumhängt, kaum wurde er angelegt? Und auch danach würde ich dich eigentlich gerne als Co-Initiatorin sehen, wenn du dir das vorstellen könntest, es braucht hier ja nicht nur Kenntnis technischer Details (da blicke ich auch nicht überall durch), sondern vor allem Strukturierungswillen und -fähigkeit :-) Gestumblindi 22:24, 14. Jul. 2017 (CEST)
Initial-Initiatorin, nette Wortschöpfung. Ok, dann also, bis du Zeit hast. Ich muss ja nicht umseitig als Wasauchimmer-Initiatorin stehen, um beim Sortieren mitzuhelfen. --Martina Disk. 06:59, 15. Jul. 2017 (CEST)
@Martina Nolte: Ich habe mich jetzt als Initiator eingetragen, dich aber umseitig noch stehengelassen - einfach immer noch in der Hoffnung, dass du zumindest Co-Initiatorin bleiben magst; wenn nicht, nun, dann nimm deinen Namen eben raus :-) Gestumblindi 23:43, 18. Jul. 2017 (CEST) PS, Vorwarnung: Ich werde am kommenden Wochenende bzw. Freitag bis Montag voraussichtlich wiederum kaum bis gar keine Zeit für dieses MB bzw. die Wikipedia überhaupt finden.
Gestumblindi: Ich bin lieber Unterstützerin. :-)
Ich hoffe, ich komme am Wochenende dazu, ein paar der technischen Informationen über den Bot von weiter unten in den Entwurf einzubauen. Ich hab auch noch ein, zwei weitere Fragen an den Bot-Papa. Ich finde, erst wenn die (derzeitigen) Funktionen und Potenziale des Bots bekannt sind, können wir an den Pro- und Kontraargumenten und an den Vorschlägen zu den Abstimmoptionen arbeiten. --Martina Disk. 05:35, 22. Jul. 2017 (CEST)
PS @ Gestumblindi : Hab mich jetzt doch wieder als Co-Initiatorin einetragen. Ich werd ja vermutlich einen großen Anteil am MB-Entwurf haben; daher ist das dann wohl angemessener. --Martina Disk. 23:10, 22. Jul. 2017 (CEST)
Kurzer Nachtrag hier noch, ich bin hier raus (komplett). Viel Erfolg! --mirer (Diskussion) 03:11, 18. Jul. 2017 (CEST)

Die Lösung an der Wurzel packen[Quelltext bearbeiten]

Das Problem ist: Irgendwann wird jeder Weblink nicht mehr funktionieren und die ursprüngliche Information anzeigen. Das werden wir auch mit Bots nicht feststellen können, der Klassiker ist, das anstatt des gewünschten Artikels nun eine Standardseite angezeigt wird, z.B. "wir sind umgezogen nach Blabla.com". Ist eine gültige Seite also keine gemecker vom Bot. Richtig wäre aus meiner Sicht folgendes Vorgehen:

1. Ein Einzelnachweis mit URL wird in der Wikipedia eingefügt

2. Ein Bot (der ruhig auch von der Foundation gebaut wird) macht einen Snapshot der Seite und legt diesen als PDF ab

3. Der Link auf das PDF mit Zeitstempel wird beim Einzelnachweis integriert und ist auch zugänglich wenn sich der originale Weblink geändert hat. Damit ist für den Leser deutlich wo sich die ursprüngliche Information befunden hat, was nach dem Ändern auf den Internetarchive link nur indirekt möglich ist

4. Wir umgehen das Risiko das wir nun eingehen uns 100% auf das INternet Archiv zu verlassen. Das kann von heute auf morgen geschlossen und eingestellt werden.


Groetjes --Neozoon (Diskussion) 08:20, 14. Jul. 2017 (CEST)

Eine technisch gesehen gar nicht so schlechte Idee. Wenn das aber bedeutet, dass die Inhalte der nicht mehr vorhandenen Seite dann selbstständig durch die Wikipedia verbreitet werden, wirft das urheberrechtliche Fragen auf. Ein Link ist immer in Ordnung, ein Zitat innerhalb der Grenzen des Zitatrechts auch, aber ein Verbreitungsrecht für fremde Inhalte hat die Wikipedia nicht. Das ist schon beim IA ein Problem, warum sollte man es sich dann auch noch selbst ans Bein binden? Drucker (Diskussion) 12:51, 14. Jul. 2017 (CEST)
Mit diesem Vorschlag willst du die Wikipedia zu einem eigenen Internetarchiv umbauen. Das Internetarchiv macht bereits den Snapshot. Mit der Angabe "Abgerufen am" hat der Link auch einen Zeitstempel. Die Adresse des IA enthält auch immer die ursprüngliche Adresse. Wir machen uns mit diesem Vorschlag die doppelte Arbeit und einen Bot brauchen wir trotzdem. Bei einem PDF lassen sich zudem bestimmte Inhalte nicht darstellen, die das IA problemlos bereithalten kann z. B. interaktive Seiten, skalierbare Grafiken, Video, Sounddateien, Javaskript usw. Bei einem simplen PDF kannst du keinen Link klicken. Man müsste außerdem eine Menge Server mehr bereitstellen, nur um diese zusätzlichen Daten zu verwalten (Resourcen und Geldverschwendung). Das Internetarchiv hat außerdem Seiten archiviert, die bisher noch keiner von uns eingebunden hat. Das ist z. B. von Belang, wenn man einen älteren Artikel aus einer anderen Sprache importiert. Ebenso können wir nicht rückwirkend PDFs von Seiten erstellen, die früher mal anders ausgesehen haben. Wie der Vorredner gesagt hat, können wir die PDFs nicht als Dateien unter freier Lizenz speichern, d. h. für Benutzer wäre es schwer nachvollziehbar, warum die einen Dateien frei nutzbar sind, die anderen aber nicht. Das ist also aus vielen Gründen keine bessere Idee und ohne die Zustimmung der Foundation ist das ohnehin nicht zu machen. --Giftzwerg 88 (Diskussion) 17:31, 14. Jul. 2017 (CEST)
Ich würde den Vorschlag auch nicht hier diskutieren, da er mit dem hier vorgeschlagenen Bot und seinen Möglichkeiten nichts zu tun hat. Das gehört eher zur Projektdiskussion.
Dort kann man dann über Urheberrechte, die Foundation und ihre Ressourcen philosophieren. Konkret wird sich da zeitnah nichts tun, während wir hier einen ganz konkreten Bot relativ zeitnah einen großen Berg Arbeit abarbeiten lassen können. Wie viel er abarbeiten darf (und in welcher Art genau), kann dann die Community bestimmen. --mirer (Diskussion) 17:40, 14. Jul. 2017 (CEST)

Veraltete Daten[Quelltext bearbeiten]

Eine archivierte Seite liefert immer nur Informationen vom Datum X. Möglicherweise sind aktuellere Informationen verfügbar, die müssen aber händisch gesucht werden. Das ist regelmäßig bei Umstrukturierungsmaßnamen der Zieldomains der Fall, bei denen Verzeichnisstrukturen geändert werden. Aus einem meiner Bereiche ist GameSpot so ein Fall, die haben vor ein paar Jahren alle ihre Verzeichnisse umstrukturiert, so dass auf einen Schlag alle Verweise auf diese URL tot waren, aber durch händisches Umbiegen der Links recht einfach zu aktualisieren waren. Das ist ausdrücklich kein Argument gegen den Bot, sondern die Bitte um Modifikation: Es muss eine Möglichkeit geben, vor der Änderung des Bots selbst aktiv zu werden, oder zumindest zu erkennen, wo der Bot gewirkt hat. Erster, unausgereifter Vorschlag: Der Giftbot weist weiterhin per Diskmeldung auf tote Links hin. Dadurch taucht der Link auf Wartungsseiten auf. Nach drei Monaten wird der IAB aktiv, ändert den Link, löscht den Giftbot-Hinweis und setzt einen eigenen ein, der den alten Link, den Archivlink sowie, falls vorhanden, die Parameter "titel" und "zitat" aus der Vorlage:Internetquelle beinhaltet (die sind immer erster Ansatz für die manuelle Korrektur). Diesen Hinweis sollte jeder, der den Link manuell auf eine aktuelle Nicht-Archiv-Version geprüft hat, löschen dürfen ("kein regulärer Diskussionsbeitrag"). Meiner Meinung nach deckt das alle Bedürfnisse meiner "Arbeit" mit toten Links ab; für andere Bereiche mögen ganz andere Dinge wichtig sein. Viele Grüße, Grueslayer 09:04, 14. Jul. 2017 (CEST)

Benutze http://dispenser.homenet.org/~dispenser/view/Checklinks den Weblink-Checker. Der zeigt dir sofort alle toten Seiten in rot an, auch wenn sie im Artikel einen funktionierenden IA-Link haben, d. h. auch nach Änderungen durch den Bot kann man schnell und einfach feststellen, welche Links auf Archiv zeigen und welche normal arbeiten. Ich kann also immer noch ziemlich einfach nachträglich einen Link aktualisieren--Giftzwerg 88 (Diskussion) 17:53, 14. Jul. 2017 (CEST)
Hallo Giftzwerg 88,
danke für den Link (den ich nicht kannte). Am von mir geschilderten Aspekt geht er aber vorbei, da er für eine Seite gedacht ist. Für Wartung braucht's aber eine Sammlung von Artikeln, die Du ohne Wartungsbausteine nicht gefudnen hättest.
Viele Grüße, Grueslayer 21:45, 17. Jul. 2017 (CEST)
Das ist sowas wie der Giftbot für die Westentasche. Bots können Massen von Artikeln bearbeiten, der Mensch immer nur wenige in einer gewissen Zeit. Wenn du also einen Artikel in einem aktuellen Zustand halten willst, damit der Bot nichts zu tun hat, so ist das ein ziemlich cooles Tool, mit dem man binnen kurzer Zeit sieht, ob es Handlungsbedarf gibt, aßerdem sind da noch Google, Internetarchiv und andere Seiten, die man damit per simplem Mausklick durchsuchen kann, ohne die URL nochmals ins Suchfenster eingeben zu müssen. --Giftzwerg 88 (Diskussion) 22:59, 17. Jul. 2017 (CEST)
Natürlich sind es, wie schon in der Kurier-Diskussion thematisiert, manchmal genau die veralteten Daten, die man haben möchte. Nämlich u.a. dann, wenn es um eine Information geht, die sich auf einen bestimmten Zeitpunkt in der Vergangenheit bezieht, und die auf einer inzwischen umstrukturierten und aktualisierten Website möglicherweise gar nicht mehr verfügbar ist. Gestumblindi 21:42, 14. Jul. 2017 (CEST)
pluseins. So oder so guckt idealerweise ein Mensch irgendwann nach, ob ein besserer Beleg vorhanden ist. Bis dahin kann ein (zusätzlicher) Archivlink eine gute Zwischenlösung sein. --Martina Disk. 21:53, 14. Jul. 2017 (CEST)

Einige technisch-organisatorische Fragen[Quelltext bearbeiten]

  1. Irrtümlich als nicht erreichbar erscheinend
    • Uns sind derzeit Seiten aus über 500 Domains bekannt, die tatsächlich erreichbar sind, aber uns bei Bot-Besuchen keine befriedigende Antwort gaben.
    • Menschliche Benutzer mit normalen Browsern erhalten bei gelegentlichen Besuchen dieser Seiten sinnvolle inhaltliche Ergebnisse.
    • Ursachen könnten sein, dass dieser Server zu oft vom Bot besucht wird, seine ihn als Bot ausweisende Agenten-Codierung nicht akzeptiert wird oder Merkmale im technischen Dialog nicht zu einem Mensch mit Browser passen.
    • Wie geht der in Aussicht genommene Bot mit den fälschlich als unerreichbar erscheinenden Seiten um?
  2. Archivlink bereits durch GiftBot angeboten
    • GiftBot hatte 2015/16 geprüft, ob es zu einer nicht erreichbaren Seite Versionen im Internet Archive geben würde; teilweise sogar eine bestimmte Version angeboten und dies auf der Diskussionsseite verlinkt.
    • Für zurzeit fast 200.000 Artikel wird dies angeboten.
    • Soll der in Aussicht genommene Botlauf diese uns eigentlich bereits bekannte Information in einem erneuten Edit in den Artikel schreiben, oder würden solche Dubletten ausgeschlossen?
  3. In der deutschsprachigen Wikipedia liegt der Anteil mittels Vorlagen formatierter Zitationen im unteren einstelligen Prozentbereich.
    • Die Zahl der Weblinks per Standard-Vorlage in Einzelnachweisen dürfte ein bis zwei Prozent nicht wesentlich übersteigen.
    • Ein bislang nicht bekannter Mechanismus solle in den eingebundenen Vorlagen einen neuen Parameter einfügen, der einen angebotenen aber bislang nicht durch einen Menschen kontrollierten Link auf das Internet Archive in den Artikelquelltext schreibt, der dann ein bisschen aber noch nicht so richtig in der Artikelansicht dargestellt werden solle.
    • Wie soll der Bot mit den frei (ohne Vorlage) formatierten Quelltextpassagen verfahren, die den weitaus größten Anteil der Einzelnachweise ausmachen?
    • Neben den Standard-Vorlagen gibt es viele weitere Vorlagen, die für eine spezielle Website oder einen Themenbereich (etwa im Rahmen von Vorlage:EWQ) Weblinks bereitstellen. Auch hier kann es zu Ausfällen kommen. Wie würde der Bot damit umgehen?
  4. Inhalt der Archivseite
    • Ein Grund für die hierzuwiki eingeforderte menschliche Gegenkontrolle ist, dass auf der archivierten Seite einfach nur stehen könnte, dass dieses Angebot seit einiger Zeit nicht mehr verfügbar wäre; dies jedoch nicht vom ursprünglichen Webserver per 404 etc. technisch erkennbar als unerreichbar markiert wurde.
    • Erkennt der Bot diese Situation, und verwendet ggf. eine besser geeignete und inhaltlich ebenfalls geeignete frühere Archivversion, auf der noch der vollständige Inhalt dargeboten wird?

VG --PerfektesChaos 22:20, 15. Jul. 2017 (CEST)

Sehr gute Fragen. Danke. Für Antworten rufe ich mal User:Cyberpower678 hierher. --Martina Disk. 04:31, 16. Jul. 2017 (CEST)
Hier sind meine Antworten:
  1. IABot's URL Algorithmus:
    • IABot leitet unter solchen Umständen auch, aber wahrscheinlich nicht so Ernst. IABot's Datenbank kann mit der Domain tool modifiziert werden bei solchen fällen. Die Domain tool können nur Wikipedia Administratoren benutzten, aber es noch nicht für dewiki erreichbar. Tool Roots, wie ich, legen die betroffenen Domains in eine Weisseliste. Normale Benutzer melden lebendige URLs die als tot verwechselt sind mit dieser Tool. Damit werden meistens die URLs selber in den DB korrigiert, und in anderen fällen, mir weiter geschickt zum untersuchen.
    • Wenn IABot eine URL besucht, der Bot sieht aus wie ein Chrome Webbrowser, den Server gegenüber. Aber JS ist nicht unterstützt. Also der Algorithmus ist 99% akkurate mit Webseiten als Lebend oder als Tot zu erkennen.
    • Das ist leider nicht in meiner Kontrolle. IABot wohnt bei Labs, und andere Tools und bots laden manche Webseiten viel zu schnell, und als Ergebnis wird Labs blockiert, und als Konsequenz wird der Bot auch. IABot minimiert Kontakt mit Webseiten in dem es eine Wartezeit von 3 Tagen zwischen jeder Check macht. Nach 3 durchgefallene Checks wird der erst dan als Tot anerkannt. Wenn der Bot blockiert ist, kommt es als Tot heraus. In solchen fällen, wird die Domain in der Weisseliste hinzugefügt.
    • Jeder Benutzer kann IABot Fehler direkt bei IABot korrigieren. Es gibt tools die es für meiste fälle die Probleme beheben, und die Tools sind super leicht und einfach.
  2. Dupletten von GiftBot
    • IABot kann genau das Selbe machen.
    • Ok
    • Es werden Dubletten geben außer wir lassen ein Bot Skript laufen die für mir URLs und Page IDs produzieren so das ich es im Voraus als gemeldet markieren kann. Aber wenn IABot die Hauptartikeln modifizieren tut, dann ist es irrelevant.
  3. Citaten Vorlagen
    • Ok
    • Kann man machen.
    • IABot kann die Links entweder ersetzen oder eine Archivvorlage verwenden und ein bot Markierung setzten. Enwiki benutzt {{Webarchive}}. Ich überlasse die Entscheidung bei dewiki Benutzer.
    • Die werden ignoriert. Dedizierte Vorlagen können bei der Vorlage selber repariert werden, es ist sinnlos fuer ein Bot die zu Analysieren.
  4. Archivseiten
    • Ok
    • Wenn der Original URL noch als lebendig erkennt wird, dann macht das Bot nichts. Sollte er aber nicht mehr Funktionieren, oder als tot markiert sein, wird eine Archivseite, möglichst von eine Datum dichtest zu dem originalem Zugriffszeitpunkt, gesucht and hinzugefügt, die als funktionsfähig anerkannt wird.
Hoffentlich helfen die Antworten.—CYBERPOWER (Diskussion) 16:00, 18. Jul. 2017 (CEST)
  • 2. Archivlink bereits durch GiftBot angeboten
    • Es bedürfte einer ausdrücklichen MB-Option, dass ein Bot eine uns bereits durch GiftBot aus 2015/16 aus der Diskussionseite bekannte Archivversion erneut als Vorschlag in den ANR hineinschreiben solle, obwohl durch dieselbe Information bereits einmal VG und die Beos von Bot-Aktivitäten beobachtender Bearbeiter belastet wurden.
  • 3. Nicht mittels Standard-Vorlagen formatierte Zitationen
    • Es geht um die beiden Vorlage:Internetquelle und Vorlage:cite web (et al.).
    • Nur wenn eine dieser beiden Vorlagen verwendet wurde und auch ein Abrufdatum angegeben ist, könne der Bot eine bestimmte, zeitlich naheliegende Version vorschlagen.
    • Diese beiden sollen jeweils um neue Parameter ergänzt werden, die eine zusätzliche kommentierende Meldung in der Artikelansicht erzeugen:
      „Inhaltlich bislang ungeprüfter Archivlink, bitte kontrollieren und danach geeignet anpassen“.
  • 3b. Reine Quelltextangabe ohne Vorlage
    • Der vorgestellte Algorithmus sieht vor, dass das Abrufdatum dem Bot bekannt sein muss, damit eine konkrete Version im IA vorgeschlagen werden kann.
    • Dazu ist eine Interpretation der relativ uneinheitlichen Quelltextgestaltung notwendig; aber ziemlich durchgesetzt hätte sich eine in der Nähe gelegene Formulierung
      [;] abgerufen [am] 20. August 2017
    • Es bedürfte einer ausdrücklichen MB-Option, dass ein Bot in allen diesen Fällen eine erst noch zu erstellende Vorlage einfügen solle, in deren Ausgabe sich immer auch eine Formulierung finden würde wie etwa:
      „Inhaltlich bislang ungeprüfter Archivlink, bitte kontrollieren und danach geeignet anpassen“.
  • 4. Inhalt der Archivseite
    • Das ist nicht richtig.
    • Betrachten wir folgendes Szenario:
      • Im März 2016 veröffentlicht eine Website statistische Daten.
      • Am 30. Dezember 2016 fügt unser Autor eine URL darauf in den Artikel ein.
      • Am 3. Januar 2017 schreibt die Firma in ihre Website an dieser URL, dass das mit den Statistiken zu aufwändig wäre und sie das künftig nicht mehr machen würde; markiert jedoch nicht als 404; bietet hingegen eine JavaScript-basierte Suche in der Website an.
      • Am 10. Januar 2017 nimmt archive.org diesen Text in das Archiv auf.
      • Am 1. Juli 2017 nimmt die Firma diese URL aus dem Angebot, oder geht komplett pleite, jedenfalls ist die URL nun ganz kaputt.
      • Nunmehr bemerkt das der Bot und fügt einen Hinweis auf die Archivversion vom 10. Januar 2017 ein.
      • Jede Version aus dem Sommer 2016 wäre hingegen geeignet.
    • Wir kennen zur Genüge das This Domain is for sale, $100 only.
    • Deshalb besteht die deWP auf menschlicher Kontrolle.
  • 5. Neue Frage: Bereits vom Menschen zurückgewiesene Archivversion
    • Angenommen, ein menschlicher Bearbeiter hat die vorgeschlagene Archivversion geprüft und für untauglich befunden, und keine bessere Lösung für das Problem.
    • Löscht er nun den Vorgang, kommt einige Wochen später der Bot erneut vorbei und meldet den status quo ante.
      • Darauf muss sich nunmehr ein menschlicher Bearbeiter erneut mit der Angelegenheit befassen, prüft den Inhalt der Archivversion, findet sie ungeeignet, löscht die Bot-Info wieder.
      • Darauf kommt einige Wochen später der Bot erneut vorbei und meldet den status quo ante.
    • Macht der erste Bearbeiter einfach gar nichts, weiß der Bot, dass er das ja schon bearbeitet hatte.
      • Dafür befasst sich alle paar Wochen ein anderer Autor mit dem Vorgang, liest die Archivversion, verwirft sie, löscht oder lässt es stehen. Vielleicht kommt derselbe Wikipedianer sogar alle paar Monate an denselben Artikel, kann sich aber schon längst nicht mehr an diesen konkreten Fall erinnern.
    • Es muss also durch bestimmte Parameter für genau diese URL oder aber durch Markierung des gesamten Artikels durch die Autoren dem Bot kommuniziert werden, dass diese Zuordnung dieser defekten URL zu dieser konkreten Archivversion ungeeignet ist.
    • Es bedarf also einer detaillierten Anleitung für alle Wikipedia-Autoren, wie sie wann mit dem Bot-Eintrag umgehen sollen und mit welchen technischen Mitteln sie in welcher Situation mit dem Bot zu kommunizieren hätten. Viel Spaß.

Greetings --PerfektesChaos 14:03, 20. Jul. 2017 (CEST)


gudn tach!
danke Cyberpower678, fuer deine muehe, auf deutsch zu antworten, aber ich glaube, es waere sinnvoller/verstaendlicher, wenn du auf englisch antworten wuerdest. notfalls kann ja hier jemand die antwort uebersetzen. -- seth 17:55, 16. Jul. 2017 (CEST)
Habe ich natürlich befürchtet. Welcher Satz ist nicht verständlich?—CYBERPOWER (Diskussion) 18:12, 16. Jul. 2017 (CEST)
wenn du im ersten satz "leidet" ("suffers") statt "leitet" meintest, habe ich glaube ich alles verstanden. aber ich musste sehr langsam und manche saetze mehrfach lesen. eine weitere alternative waere, dass du erlaubst, dass deine beitraege sprachlich ueberarbeitet werden. (bei bedarf koennen wir diese diskussion auch gerne auf deiner talk page fortfuehren.) -- seth 22:39, 16. Jul. 2017 (CEST)
Das wäre wohl die beste Lösung! Cyberpowers Beiträge sind - auch auf deutsch - sehr gut, müssten lediglich an ein oder zwei Stellen korrigiert werden (und vielleicht für die nicht-technische Allgemeinheit an drei Weiteren "geglättet" werden. Falls Cyberpower damit einverstanden wäre und du Seth das übernehmen würdest, wären die Beiträge für jeden (auch die nicht-englischsprachigen-Nerds :D ) direkt problemlos verständlich und unmittelbar vom Autor (ohne Übersetzung). --mirer (Diskussion) 04:14, 17. Jul. 2017 (CEST)
Ich habe keine Probleme damit. Seth, oder jemand anders, kann meine Sätze korrigieren. Und ja, ich meinte leidet, nicht leitet. Sorry, das war ein Typfehler. Ein dank an alle.—CYBERPOWER (Diskussion) 23:36, 17. Jul. 2017 (CEST)

Statistische Betrachtung[Quelltext bearbeiten]

  • Wir kennen ungefähr die Alterungsrate von URL, und es lässt sich hochrechnen, dass gut 100.000 URL seit 2016 defekt wurden, von denen wir noch nichts wissen.
    • Von diesen 100.000 URL sind etwa 1 % mit einer der beiden Standard-Vorlagen formatiert, bei denen das Einfügen eines neuen Parameters relativ unstrittig wäre. Das sind 1000 URL.
    • Zu bedenken ist nebenbei, dass nur bestimmte Typen von URL in das IA aufgenommen werden; sehr dynamische Datenbankabfragen usw. (etwa auch der stündliche Wetterbericht an jedem Ort) oder per robots.txt ausgeschlossene Seiten schon mal nicht.
    • Die frühere zufällige Registrierung einer Archivversion hatte eine eher magere Quote; da seit einiger Zeit wohl automatisch in Wiki-Projekten neu eingefügte URL einigermaßen zeitnah im Archiv hnterlegt werden, mag die Trefferwahrscheinlichkeit optimistisch 30 % betragen.
    • Damit beträgt die erwartbare Gesamtmenge seit dem letzten GiftBot-Lauf, für die dieses MB aussichtsreiche Optionen liefern würde, 300 URL.
    • Auch bei diesen ist noch nicht alles getan und fertig, sondern sie wären noch jeweils auf inhaltliche Passung zu kontrollieren.
    • Nimmt man all die Arbeitskraft und Zeit, die für das Lesen und teilweise auch Kommentieren der PRD, Kurierdisku und dieses MB-Entwurfs bei allen WPlern draufgegangen sind, nebst geistiger Energie beim Durchdringen der Problematik, dann hätten vermutlich statt dessen in 1000 Artikeln alle GiftBot-URL komplett abgearbeitet werden können.
    • Effiziente Projektbeteiligung sieht anders aus.
  • Bitte etwas weniger Technikgläubigkeit, etwas weniger Delegation des eigenen Verstandes an Algorithmen, die einem auf zauberhafte aber leider überhaupt nicht begriffene Weise schon irgendwie automatisch die Artikel richtig schreiben und pflegen werden.

VG --PerfektesChaos 14:03, 20. Jul. 2017 (CEST)

Ich komme mit diesen Statistics nicht klar. Wie kommst du auf 300 links werden gerettet wenn 100,000 tot sind. Wenn 100,000 tot sind werden 100,000 entweder markiert oder gerettet. Deine Statistik liegt leider weit daneben.—CYBERPOWER (Diskussion) 20:54, 20. Jul. 2017 (CEST)

mehr technische Fragen[Quelltext bearbeiten]

@User:Cyberpower678: Ich habe ein paar weitere Fragen. Vorweg ein paar Fragen zum Hintergrund deines Bot-Projektes:

  1. Seit wann wirst du von Internet Archive für deine Arbeit an dem Bot bezahlt? Gibt es irgendwo öffentliche Informationen bzw. eine Projektseite über Beginn, Umfang, Inhalt und Dauer deines Auftrags? Ist ein Ende des Auftrags absehbar? Wie geht es danach weiter?
  2. Gibt es öffentliche Informationen über das von dir erwähnte Kooperationsprojekt "No-404" der Wikimedia Foundation mit dem Internet Archive?

Jetzt kommen ein paar Fragen zu den Bot-Funktionalitäten. Disclaimer: Ich bin programmiertechnisch völlig kenntnisfrei und hoffe, dass ich keine völlig blöde Fragen stelle. :-)

  1. Was macht der InternetArchiveBot, wenn bei der Einfügung eines Weblinks oder eines Einzelnachweises keine Standadisierte Vorlage benutzt wurde, sondern wenn der Einzelnachweis lediglich aus dem Link besteht (kein Autor, kein Titel, kein Datum)?
  2. Wirst du die Struktur der Bot-Einträge an die hiesige Vorlage {{Webarchiv}} anpassen?
  3. In Fällen, in denen im Internet Archive keine Version verfügbar ist, aber bei WebCite oder bei Archive Today eine Kopie verfügbar ist: Wärest du bereit, den InternetArchiveBot mit weitgehend denselben Funktionen auch auf andere Archive auszuweiten? Oder würden wir für diese Fälle weiterhin den GiftBot laufen lassen müssen?

Zum Schluss eine ziemlich grundsätzliche Anmerkung und Frage: Die deutschsprachgie Community könnte dem bereits in Betrieb genommenen "GiftBot" erlauben, die verfügbaren Archivlinks - anbieterneutral - direkt in den Artikel statt auf die Diskussionsseite zu setzen. Worin bestehen deiner Meinung nach die technischen und funktionalen Vorteile des IAB gegenüber dem GiftBot? Ich frage all dies ausschließlich, um die technischen Details besser zu verstehen und das Meinungsbild sorgfältiger vorbereiten zu können. Ich selbst habe noch keine feste Meinung zu den Vorschlägen, sondern erstmal nur etliche Fragen. Danke im Voraus für deine Zeit und Mühe! --Martina Disk. 22:17, 22. Jul. 2017 (CEST)

@Martina Nolte: Hier sind meine Antworten:
  1. Seit Februar 2017, der Botprojekt began im Juni 2015. Ich werde nur finanziert so das dieser Botprojekt weiter entwickelt werden kann. Ich werde fuer mein Zeit bezahlt. Die Bedingungen einfach fortschritt machen und mich mit Gesetze und Wikipedia regeln einhalten. Weitere Informationen gebe ich leider nicht aus. IA präsentiert dieses Jahr bei Wikimania, und ich bin da auch dabei.
  2. Die No-404 Projektseite kann warscheinlich Kaldari (Diskussion • Beiträge • hochgeladene Dateien • Sperr-Logbuch • globale Beiträge • SUL • Logbuch) oder Ocaasi (Diskussion • Beiträge • hochgeladene Dateien • Sperr-Logbuch • globale Beiträge • SUL • Logbuch) geben. Die sind WMF Mitarbeiter. Es gibt aber m:Community_Tech/Migrate_dead_external_links_to_archives.
  3. Das kann ich besser mit Beispielen beantworten. Ausserhalb Referenzen macht es sowas. Der Grund dafür ist so das Artikelformatierung nicht gestört oder zerstört wird. Innerhalb Referenzen macht es sowas. Dabei werden die Datums von den Versionenverlauf festgestellt. Bei dewiki wird {{Webarchiv}} verwendet.
  4. Jeder wiki hat seinen eigene Struktur. Es wird auf einzelnen Wikis angepasst.
  5. IABot checkt persönlich nur Internet Archive, aber unterstütz 20 Archiv Dienste. Es prüft nur bei IA nach weil die andere Dienste viel zu langsam sind. Enwiki kann sich dass nicht leisten. Es gibt aber eine weiter bot des mit IABot kommuniziert und liefert Archivkopien von andere Dienste an IABot. Die helfen sich gegenseitig und lernen voneinander. IABot lernt auch direkt bei Wikipedia Seiten selber. Archivkopien die schon existieren, werden eingespeichert und weiter verwendet so das es immer möglichst eine Funktionsfähigen Kopie liefert.
GiftBot ist wahrscheinlich nur Programmiert auf Diskussionsseiten zu posten. Dabei kann IABot alles machen, und kann auf jeder Wikipedia einzeln eingestellt werden. Es gibt sämtliche Opt-out Optionen, und noch Benutzertools bei https://tools.wmflabs.org/iabot womit IABot gesteuert und verbessern werden kann. Die grundliegende Programmiercode wurde über extreme harte Tests und Fehlermeldungen, über Jahren, auf Menschenfähigkeiten gebracht. IABot kann die Formatierung mit fast 100% Genauigkeit verarbeiten, analysieren, und dann modifizieren. GiftBot kann auch um Programmiert werden um IABot noch besser zu machen mit der API. Der API befindet sich bei https://tools.wmflabs.org/iabot/api.php und Dokumentation bei m:InternetArchiveBot/API. Hoffentlich hilft das—CYBERPOWER (Diskussion) 23:27, 22. Jul. 2017 (CEST)
Ein Hinweis: Bei en:Bobrinsky gibt es einen solchen Link: Homepage of the Bogoroditsk Museum. Der InternetArchiveBot hat ihn offenbar als tot identifiziert und kurzerhand durch einen Link aus dem Internetarchiv ersetzt: [1]. Er ist aber gar nicht tot, weshalb ich das rückgängig gemacht habe (und die website per Tool als zugänglich gemeldet habe); es handelt sich um ein false positive, die nach meinem Eindruck ausgesprochen häufig sind. Es scheint, wenn der Bot eine Site nicht findet und keine Anhaltspunkte zum Datum hat, ersetzt er sie einfach durch den Link aufs Archiv. Ist das so korrekt?--Mautpreller (Diskussion) 23:16, 22. Jul. 2017 (CEST)
@Mautpreller: Hallo. Wie gehts? Die scheinen nur häufig zu sein weil der Bot leider blockiert wird. In solchen fällen kann IABot nicht erkennen ob es tot ist, oder blockiert ist. Es gibt keine Automatisierte Methode sowas zu erkennen. Dabei sehe ich dein False Positive Meldung. Ich habe nachgeschaut und der Kode selber erkennt den als Lebendig aber weil Labs blockiert ist, und IABot wohnt bei Labs hat IABot es als tot getäuscht. Um dabei dagegen zu kämpfen habe ich jetzt die ganze Domain auf der Weissliste Gesetz so das IABot all URLs in dieser domain ignoriert. IABot ERSETZT NUR wenn der link sich nicht in einer Vorlage UND in einer Referenz befindet. Wenn der Link in einer Vorlage ist, benutzt er die Vorlage und HEFTE die Archiv URL an die originale mit |archiveurl=. Wenn sich der Link innerhalb eine Referenz befindet aber ohne Vorlage, heftet er dann {{en:Template:Webarchive}} oder wandelt es in einer Vorlage um. Links in Vorlagen umzuwandeln kann abgeschaltet werden, so das es nur {{en:Template:Webarchive}}. IABot kann fuer jeden einzelnen Wikipedia unterschiedlich konfiguriert werden.—CYBERPOWER (Diskussion) 23:41, 22. Jul. 2017 (CEST)

@User:Cyberpower678: Vielen Dank für deine schnelle Reaktion und die Informationen. Die vielen spezifischen Konfigurationsmöglichkeiten sind sehr nett.

  • Wenn dein Auftrag durch IA irgendwann enden sollte, wirst du den Bot dann wieder ehrenamtlich betreiben und pflegen?
  • Kannst du uns bitte einen Link geben, wo man die Übergabe/Lieferung von Archivlinks anderer Dienste an den IABot anschauen und nachvollziehen kann?
  • Welche sind die 20 Archivdienste, die der IABot verarbeiten kann? Hast du einen Link?
  • Kannst du dir vorstellen, die Meldungen von false positives in der deutschsprachigen Wikipedia entgegen zu nehmen? Die wenigsten von uns haben einen Labs-Account und ich fände es gut, wenn die technischen Barrieren für die Benutzer so niedrig wie möglich gehalten werden könnten.

Danke nochmal! --Martina Disk. 00:39, 23. Jul. 2017 (CEST)

  • Ja.
  • https://tools.wmflabs.org/iabot kann dir diese Informationen geben.
  • Heir sind die Arkivdienste:
    1. europarchive.org
    2. archive.org | waybackmachine.org
    3. archive.is | archive.today | archive.fo | archive.li | archive.es
    4. mementoweb.org
    5. webcitation.org
    6. archive-it.org
    7. arquivo.pt
    8. loc.gov
    9. webharvest.gov
    10. bibalex.org
    11. collectionscanada.com
    12. veebiarhiiv.digar.ee
    13. vefsafn.is
    14. proni.gov
    15. uni-lj.si
    16. stanford.edu
    17. nationalarchives.gov.uk
    18. parliament.uk
    19. nlb.gov.sg
    20. perma.cc
    21. nla.gov.au
    22. webarchive.org.uk
    23. freezepage.com
    Die folgenden werden erkannt als ungültiger Arkivdienst
    1. webcache.googleusercontent.com - Nicht dauerhaft
    2. wikiwix.com - kein zugriff auf Arkivdatum
  • Du brauchst keine Labs Konto. Nur einen Wikipedia Konto. Beim anmelden wird der Benutzter gefragt ob dieser Tool dein Konto zugreifen darf. Es ist komplett sicher und erlaubt.
Viele Grüße—CYBERPOWER (Diskussion) 00:57, 23. Jul. 2017 (CEST)
@User:Cyberpower678: Oh, ich wusste nicht, dass SUL auf Labs funktioniert - danke! Ich finde die obige Dienste-Liste dort nicht. Aber wie gesagt, ich bin kein Techie. Für mich gibt es dort "Analyze a page", "Submit a bot job", "View job data", Manage URL Data: "Permission error", "Report false positives", "Report a bug", "Activity log for this wiki" (derzeit enWP), User search tool, Interface information, False positive report: "Permission error", Bot Queue: "Permission error". Nochmal: Je höher die technischen Hürden für den durchschnittlichen Wikiepdianer sind, desto höher das Risiko, dass der AIBot abgelehnt wird. Wärst du bereit, Meldungen von false positives oder von anderen Problemen in der deutschsprachigen Wikipedia entgegen zu nehmen? Danke! --Martina Disk. 01:42, 23. Jul. 2017 (CEST)
@Martina Nolte: Die Liste findet man nicht irgendwo. Das ist das aller erste mal das es gelistet wird. Die Tools sind noch nicht ganz verfügbar fuer dewiki weil ich dewiki Unterstützung noch nicht Programmiert habe. Ja ich kann die Meldungen auch bei Wikipedia akzeptieren, aber die Tools sind fuer beide Parteien viel leichter. Ich bevorzuge aber der Englischsprachigen Wikipedia fuer die Meldungen.—CYBERPOWER (Diskussion) 14:31, 23. Jul. 2017 (CEST)
die Tools sind fuer beide Parteien viel leichter. Nein. Ich nehme an, für Dich sind sie einfacher, für mich waren sie schwieriger. Ich brauchte relativ lang, um mich zurechtzufinden, und noch länger, um zu kapieren, ob meine Meldung angekommen ist oder nicht.--Mautpreller (Diskussion) 16:01, 23. Jul. 2017 (CEST)
@Mautpreller: Das ist natürlich schade. Die Idee da hinter war das es leichter fuer mich UND Benutzer sein sollte in dem es dann Zeit spart Probleme zu melden. Bei enwiki, und svwiki, ist es gut angekommen. Der Bot hinterlässt eine Nachricht wo False Positives gemeldet werden kann und die haben sich damit klar gefunden.—CYBERPOWER (Diskussion) 21:38, 23. Jul. 2017 (CEST)
Ich finde Labs auch nicht intuitiv. Wir machen regelmäßig die Erfahrung, dass externe Angebote, Tools, Gadgets deutlich weniger genutzt werden als lokale Seiten. Tollentwickler nutzen Labs, aber Benutzer wollen da selten mitmachen. Anwenderfreundlichkeit ist wichtig für die Akzeptanz.
Zum Vergleich: Der GiftBot bietet für die Meldung von false positives einen Link an, mit dem der Benutzer eine weitgehend vorgefertige Meldung lokal absetzen kann. Beispiel Diskussion:A-Junioren-Bundesliga 2008/09, Klick auf "... dann bitte berichten..." führt zu [2] mit kinderleichter preload-Funktion und eindeutigen Nutzungshinweisen.
Könnte man eine hiesige Seite anlegen und dich über die globale Benachrichtigungsfunktion (WP:Echo/en:Wikipedia:Notifications) auf neue Einträge hinweisen? --Martina Disk. 18:24, 23. Jul. 2017 (CEST)
@Martina Nolte: Ist es nicht ultimativ was auf Labs steckt was wichtig ist? Es gibt viele Tools die einfach nicht einfach sind. Dabei habe ich meine so gebaut das die einfach sein sollten. Natürlich akzeptiere ich Meldungen auf meiner Talk Seite, aber wenn man sich mit meine Tools auskennt, merkt man schon das es viel leichter und schneller ist Bot Probleme zu beheben. So lange ich notifiziert werde, kann man auch eine Seite erstellen. Aber ich arbeite hauptsächlich auf enwiki.—CYBERPOWER (Diskussion) 21:38, 23. Jul. 2017 (CEST)
Um das mal zu erklären: Ich bekomme zunächst mal die Meldung: "Hi Mautpreller, In order to complete your request, IABotManagementConsole needs permission to perform the following actions on your behalf on all projects of this site: Interact with pages: Edit existing pages; Edit protected pages; Create, edit, and move pages." Was bedeutet das? Ich habe eine Minute überlegt: Wer ist "IABotManagementConsole"? Wieso braucht der meine Erlaubnis, und wozu? Was bedeutet es, dass er "on my behalf" etwas tut? Macht er dann Edits in meinem Namen? Nach einigem Nachdenken konnte ich mir das nicht vorstellen und dachte, na gut. Gebe ich also jemandem, den ich nicht kenne, eine Erlaubnis, deren Sinn ich nicht verstehe. Dann kriege ich das Fenster "Report false positives". Okay, das kann ich verstehen. Ich gebe eine URL ein und drücke "Submit". Es kommt ein neues Fenster mit 5 Alternativen, die ich nicht klar auseinanderhalten kann. Das erste sagt mir: "These URLs will be reported as false positives and reset in the DB later:" Hier ist die URL wiederholt, die ich gemeldet habe, mit der Bemerkung "No response from server". Aha. Was muss ich jetzt tun? Obendrüber steht: "Please review the following URLs and confirm that they are really not dead." Wie mach ich das? ich habe zuerst einen Schritt zurück mit dem Browser versucht, weil ich nicht sicher war, ob ich hier richtig bin. Natürlich war ich dann "draußen" und kam nicht mehr zurück. Also nochmal. Vielleicht ist gemeint, einfach die URL nochmal anzuklicken? Ich habs zwar schon versucht, aber vielleicht will er das? Der Link funktioniert, aber jetzt bin ich am Linkziel. Wie komme ich zurück? Im Browser geht das nicht bzw. die Seite muss neu geladen werden. Dann komme ich drauf, dass ich gar nicht den Link anklicken muss, sondern den Submit-Button unten. Nun bekomme ich aber keine Meldung: Your report has been received, thank you, sondern ich komme wieder zurück auf die Seite, wo ich False Positives melden kann. Ich weiß jetzt nicht: Hat es geklappt oder nicht? Hab ich was falsch oder alles richtig gemacht? Der GiftBot hat eine viel komfortablere Meldefunktion, bei der man sofort sieht, was man machen soll, und vor allem, was man gemacht hat.--Mautpreller (Diskussion) 22:39, 23. Jul. 2017 (CEST)
  • Der dort genutzte Mechanismus, sich mit dem Wikimedia-Account in ein Tool o.ä. einzuloggen, ist seit Jahren sehr verbreitet. auf der Seite Special:OAuthManageMyGrants kann man nachsehen, was man da so alles authorisiert hat und das auch widerrufen. Ein Tool fordert in der Regel nur jene Rechte an, die es auch gebraucht – das kann bisweilen auch bedeuten, dass Seiten bearbeitet werden. Ob das hier der Fall ist, kann ich nicht beurteilen.
  • Es geht bei diesem Einloggen immer auch um accountability. Sonst könnte ja irgendein Troll kommen und einfach alle Links als False-Positives setzen, oder so, und so das Tool komplett „deaktivieren“. Am Ende muss klar sein, wer eine Aktion veranlasst hat. Wenn Du das ganz normal benutzest, hast Du dadurch keinen Nachteil.
  • Deine Aktionsbeschreibung kann ich nicht so recht nachvollziehen, bin aber selbst noch nicht so richtig vertraut mit dem IABot-Backend.
  • Der Giftbot hat eine „komfortablere“ Meldefunktion in dem Sinne, dass sie onwiki stattfindet. Meines Wissens erzeugt sie auf Seiten der Betreiber deshalb ziemlichen Diskomfort, weil der Rückfluss nicht so gut abgestimmt ist. IABot hat das Meldewesen weitgehend automatisiert, weshalb das Teil dauerhaft und auf mehreren Wikis laufen kann.
MisterSynergy (Diskussion) 22:57, 23. Jul. 2017 (CEST)
Der GiftBot hat einfach deshalb eine viel komfortablere Meldefunktion, weil man als User sieht, was man tut und was passiert ist. Ich hab hier Schritt für Schritt aufgeschrieben, welche Erfahrungen ich gemacht habe (dh parallel eine der zahlreichen False Positives eingegeben und ausprobiert, was dann passiert; eine echte übrigens, kein Übungsbeispiel; übrigens schon zum zweiten Mal). Den klassischen Fehler in Sachen usability sehe ich vor allem in Deinem Kommentar: Auf der Seite Special:OAuthManageMyGrants kann man nachsehen, was man da so alles authorisiert hat und das auch widerrufen. Ein Tool fordert in der Regel nur jene Rechte an, die es auch gebraucht – das kann bisweilen auch bedeuten, dass Seiten bearbeitet werden. Ob das hier der Fall ist, kann ich nicht beurteilen. Das nützt mir rein überhaupt nichts, wenn ich mit dieser Situation konfrontiert bin. es erinnert mich an die Planungsunterlagen, die auf Alpha Centauri ausliegen.--Mautpreller (Diskussion) 23:10, 23. Jul. 2017 (CEST)
Das war Hintergrundinformation zum dem OAuth-Mechanismus, die mir aufgrund Deines Beitrages als hilfreicher Kommentar erschien. Magst Du mir die URL einmal nennen? Ich möchte das gern selbst einmal versuchen, habe aber leider gerade keinen Testfall zur Hand. —MisterSynergy (Diskussion) 23:13, 23. Jul. 2017 (CEST)
Die URL, die ich eingegeben hatte, war http://pod2.stat.gov.rs/ObjavljenePublikacije/Popis2011/Knjiga20.pdf. Es ist die erste der sechs URLs, die im Artikel en:Bosilegrad zuletzt vom InternetArchiveBot als unerreichbar gemeldet wurden. Auch die folgenden fünf sind erreichbar.--Mautpreller (Diskussion) 23:19, 23. Jul. 2017 (CEST)
Danke. Über “Manage URL data” -> “Manage individual URLs” -> URL eingeben, Enter -> dann Drop-down-Menü bei “Live status” hat es geklappt. Zuvor habe ich doch noch einen anderen Fall gefunden, der über “Submit Bug Report” -> “Report False Positive” ebenfalls geändert werden konnte. Da steht auch jeweils ein Logbuch dabei, in dem das festgehalten wird. Ich mag die Oberfläche trotzdem bisher nicht so recht. —MisterSynergy (Diskussion) 23:30, 23. Jul. 2017 (CEST)
  • @Mautpreller: Tut mir leid das es so schwierig war. Ja, ich habe eine Meldung von dir bekommen. Ich habe alle Seiten von stat.gov.rs auf die Weisseliste getan. Ich bin Begrüße immer Meinungen wie man es verbessern kann.
  • @MisterSynergy: Was kann ich besser machen um es leichter zu machen?—CYBERPOWER (Diskussion) 23:38, 23. Jul. 2017 (CEST)
Das muss ich mir nochmal anschauen, ich spiele da nochmal mit rum. Ein paar Sachen schonmal so:
  • Hier hat das Teil zu schnell geschossen. Ich habe die betreffende Seite analysiert, und da wurde dann ohne weitere Rückfrage direkt ein Archivlink angebracht – leider ein falsch-positiver. Da hätte ich gern zunächst einmal das Analyseergebnis angeschaut und dann noch einmal bestätigt, um die Seite zu bearbeiten.
  • sports-reference.com ist whitelisted. Was heißt whitelisted genau? Etwa, dass in jedem Fall ein Archivlink angebracht wird? Es gibt zwar Gerüchte bei der Site, sie würde bald offline gehen, aber das ist seit einem Jahr nicht passiert. Bei enwiki sind mir viele von solchen Archivlinks aufgefallen, die eigentlich zu diesem Zeitpunkt überhaupt nicht nötig wären.
  • Ich muss mich noch an die Informationen gewöhnen, die man da so sehen kann. Ich hätte das selbst glaub ich irgendwie anders aufgezogen, kann aber noch nicht sagen wie genau. Ich würde dann die Bug-report-Funktion nutzen, falls ich Ideen habe.
  • Das Tool kann IMHO gern https-only sein.
MisterSynergy (Diskussion) 23:54, 23. Jul. 2017 (CEST)
  • Um das zu beheben, muss einiges ändern. Aber der Hinweis oben auf der Tool sagt das es eine Edit machen könnte.
  • Eine Deutsche Übersetzung wäre wahrscheinlich viel hilfreicher, aber oben auf der URL data tool, steht "Privileged users can un/set the live state to whitelisted. This treats the URL as alive and locks it in that state so it cannot be modified by the bot or by users lacking permission to do so." Eine Whitelist, Weisseliste, ist ein Liste wo IABot URLs, oder Domains, als lebendig klassifiziert wird und nicht nach prüft ob es wirklich lebt.
  • Der Tool muss übersetzt werden. Hier kann man es übersetzen.
  • Kein Problem, aber das ist nicht in meiner Kontrolle.
CYBERPOWER (Diskussion) 00:21, 24. Jul. 2017 (CEST)
@User:Cyberpower678: Ich werde nicht in Montréal sein.
Ja, die Informationen wie false positives müssen natürlich auf Labs eingespeist werden. Die Listen könnte aber eventuell ein Bot von deWP nach Labs transferieren? Ich möchte nur erst einmal verstehen, wie der Arbeitsablauf für den normalen Benutzer aussieht, was machbar ist und was nicht machbar ist. Je höher die technischen Hürden, je weiter weg die Mitwirkung ausgelagert wird, je komplizierter die Mithilfe wird, desto geringer werden die Aussichten sein, dass ein noch so gutes Tool von der Gemeinschaft akzeptiert wird. Gut zu wissen, dass das IABot-Interface ins Deutsche übersetzt werden kann - das ist sicher hilfreich. --Martina Disk. 01:51, 24. Jul. 2017 (CEST)
@Martina Nolte: Schade das du nicht dabei bist. Wäre nett gewesen. Ein bot kann schon die Existierende False Positives zu IABot transferieren. Mit meiner tools kann ich die bestätigen als False Positives oder ob die richtig erkannt werden. Um False Positives zu melden, ist es recht leicht, nach meiner Meinung. Bei https://tools.wmflabs.org/iabot/index.php?page=reportfalsepositive kann man False Positives melden. Man muss nur die lebendige links in den Formular einfüllen, auf Weiter klicken, dann fragt er dich um zu bestätigen das die Links wirklich lebendig sind, dabei nochmal auf Weiter klicken und die False Positives sind gemeldet. Entweder hat der Tool automatisch die Links korrigiert, oder es wird dann an mir weiter gemeldet. Das IABot Interface hat auch Benutzerrechte, und alle Benutzer mit mindesten 10 Edits, und mindestens 10 Tage alt auf Wikipedia, besitzt den einfachsten Benutzergruppe. Damit kann man False Positives melden und IABot auf Artikeln aufrufen. Sehe https://tools.wmflabs.org/iabot/index.php?page=metainfo für weitere Information darüber. Es erklärt wie man bestimmte Benutzergruppen zugreifen kann und unten werden die Benutzerflags erklärt.

pro-/kontra-argumente[Quelltext bearbeiten]

gudn tach!
wie sind die pro- bzw. kontra-punkte gemeint? gegenueber was sind es vor- bzw. nachteile? -- seth 17:58, 16. Jul. 2017 (CEST)

@seth: Das ist bislang nur eine ganz grobe Ideensammlung für den Anfang. Gib uns bitte etwas Zeit. Ich warte auf Gestumblindi (siehe ganz oben). --Martina Disk. 18:10, 16. Jul. 2017 (CEST)
kein problem. -- seth 22:25, 16. Jul. 2017 (CEST)

Ist das reif für ein MB?[Quelltext bearbeiten]

Ist denn diese Fragestellung wirklich reif für ein MB? Ich hatte in der Diskussion dein Eindruck, dass die Teilnehmer der Idee überwiegend sehr skeptisch gegenüber standen, einen Bot an die Artikel ranzulassen (im Unterschied zur Disk). Dann würde der Initiator versuchen, eine Idee gegen eine deutliche Mehrheit der bisher mit dem Thema befassten Wikipedianer durchzusetzen. Das zahlt sich in der Praxis eher nicht aus. Beim bisherigen Stand der Diskussion rate ich von einem MB ab. Das bringt nur mal wieder böses Blut. Grüße --h-stt !? 17:49, 17. Jul. 2017 (CEST)

Das Problem ist, dass ein nicht diskutierter Bot auch böses Blut erzeugt. Die deutsche Wikipedia ist ja dafür bekannt, dass Aversionen gegen Bots gepflegt werden.--Giftzwerg 88 (Diskussion) 23:04, 17. Jul. 2017 (CEST)
In den bisherigen Diskussionen über den Bot gab es alles von Begeisterung über Zurückhaltung und Skeptik bis Ablehnung. Derzeit finden wir ja erstmal heraus, was genau der Bot alles kann und was nicht. Das können wir dann umseitig beschreiben und die verfügbaren Optionen zur Abstimmung stellen. Ich sehe das ziemlich unaufgeregt. --Martina Disk. 06:10, 18. Jul. 2017 (CEST)

@H-stt: Ich hatte zuletzt (am 8. Juli) in der aktuellen Kurierdiskussion ein Meinungsbild angeregt, da die dortigen Diskussionsteilnehmer nach meinem Eindruck der Idee eben gerade nicht "überwiegend sehr skeptisch" gegenüberstanden. Wie Martina schreibt, das Spektrum der Meinungen ist breit, wobei jedoch die harsche Total-Ablehnung eines Boteinsatzes (auch für mich überraschenderweise) kaum mehr vorkommt. Als Versuch einer Zusammenfassung der Positionen der dortigen Teilnehmer an der deutschsprachigen Diskussion (sie mögen mich korrigieren, wenn ich falsch liege):

  • Drahreg01 sieht die Gefahr einer Zementierung des Status quo, würde aber eine Vorgehensweise mit Markierung "inhaltlich nicht geprüfter und automatisch gesetzter Archivlink einer am {Datum} toten URL – bitte prüfen" für denkbar halten.
  • Varina würde eine komplett automatische Ersetzung für problematisch halten, einen Einsatz des Bots zum Beheben des Missstands, "dass Aussagen durch tote Weblinks unbelegt werden", aber begrüssen.
  • Matthiasb plädiert für eine differenzierte Herangehensweise, wobei er die Notwendigkeit von Mementos in Fällen, in denen es darum geht, auf aktualisierten/umgebauten Websites nicht mehr Auffindbares zu belegen, anführt.
  • Mirer "will diesen Bot!" und findet, dass er für Einzelnachweise "(fast) nur Vorteile" bringe.
  • Raymond: "Ich halte den Bot für die Reparatur defekter Online-Einzelnachweise für sehr sinnvoll", jedoch nicht für den Abschnitt "Weblinks".
  • Martina Nolte "Für mich klingt dein Bot (mit den Opt-out-Möglichkeiten) wirklich gut!", ist aber wie ich der Ansicht, dass es mindestens eine Umfrage für einen Einsatz des Bots brauche.
  • Giftzwerg 88 spricht sich für den Bot aus, "ohne Bot wird sich der Artikel entsprechend der wachsenden Zahl von toten Links unbemerkt und stillschweigend verschlechtern".
  • Bobo11 spricht sich dafür aus, früher anzusetzen und bereits beim Setzen von Weblinks sicherzustellen, dass ein passender Archivlink generiert wird.
  • H-stt kritisiert Archivlinks am konkreten Beispiel von defekten Links zum National Park Service der USA, die er durch aktualisierte Live-Links zum aktualisierten Angebot des NPS ersetzen konnte.
  • H7 hätte sich bei einem konkreten Problem einen solchen Bot gewünscht, "mir kann keiner weismachen, so ein Bot sei nicht sinnvoll".
  • Sebastian Wallroth spricht sich für den Bot aus und wünscht sich dabei ähnlich wie Bobo11, dass auch bereits per Bot rechtzeitig für Archivlinks gesorgt wird ("Ein Bot würde alle Weblinks in der Wikipedia crawlen und sicher stellen, dass auf Archive.org eine Kopie der Seite vorliegt. Wenn ein Weblink tot ist und eine Kopie bei archive.org vorliegt, wird der Archivlink bei Wikipedia eingetragen").
  • Ich selbst, Gestumblindi, denke, dass wir aus praktischen Gründen kaum mehr um einen Boteinsatz herumkommen ("Man hat schlicht keine Zeit / Kapazität, um jeden Fall einzeln zu prüfen. Das ist tatsächlich die Situation, in der wir uns befinden, dieser Realität muss man ins Auge sehen") und sehe am ehesten einen semi-automatischen Einsatz auf Wunsch der Artikelautoren.

Der Vollständigkeit halber (ich hoffe, ich habe niemanden vergessen): Stepro hat dort nur gewünscht, die Diskussion auf deutsch zu führen, sich aber inhaltlich nicht weiter geäussert. In der vorangehenden, auf die ausführliche Darstellung von Cyberpower678 folgenden englischen Diskussion schrieb MisterSynergy, dass er nicht glaube, dass die Community einen solchen Bot in der deutschsprachigen Wikipedia zulassen würde, und dass er sogar erstaunt wäre, wenn eine semi-automatische Funktionalität Zustimmung finden sollte (das war im Wesentlichen auch meine Vermutung in der kurzen ersten Diskussion auf WP:PRD). Diese Vermutung/Befürchtung wird aber inzwischen von den oben zusammengefassten Statements nicht untermauert, sondern eher in Frage gestellt. Succu fragt im englischen Abschnitt nach Urheberrechtsverletzungen durch den Bot, was ich nicht recht nachvollziehen kann. Holder wünscht einen Einsatz des Bots in der alemannischen und Joe Watzmo in der bairischen Wikipedia (@Holder, Joe Watzmo: Cyberpower678 hat dafür um einen Konsens-Nachweis in den jeweiligen Wikipedias gebeten, hat die Sache schon Fortschritte gemacht?). Gestumblindi 23:36, 18. Jul. 2017 (CEST)

Ja, Semi-Automatisch wird am sinnvollsten sein. Mir schwebt folgendes vor;
1. Mit einem Bot Ref-Webseitenlinks sichern lassen (denn ohne vorhandene Archivversion klappt Rest nicht).
2. Das wenn eine Webseite down ist (Fehler 404 usw), dass per Bot auf der Diskussionsseite ein Hinweis generiert wird (ist ja schon jetzt der Fall).
3. Das dieser Meldung ein Link auf die richtige Archivversion (die aus Schritt 1), als Ersatzvorschlag angefügt wird. (ggf. erst wenn Botlauf zweimal die selbe Webseite down gemeldet hat.)
4. Per Bot, bei den Totenlinks im Artikel einen Hinweis setzen lässt, dass auf Diskussionsseite Archivversion-Link hinterlegt ist.
Das Ersetzen des Weblinks im Artikel würde ich aktuell noch händisch machen lassen (es ist einfach eine gesundes Misstrauen angebracht, ob der vorgeschlagene Archivlink auch der richtige ist). Wenn man im Artikel ein Hinweis ist, wo man die Archivversion findet, ist das schon die halbe Miete.
Am besten lässt man über Punkte 3+4 im MB einzeln abstimmen (Punkt 1 Tut den Autoren nicht weh Punkt 2 haben wir schon). Dann wird klarer wie weit die Comunity bereit ist, denn Bot's das Feld zu überlassen.--Bobo11 (Diskussion) 23:56, 18. Jul. 2017 (CEST)
Danke für die Zusammenfassung, Gestumblindi. Ich sehe weiter die Gefahr, dass man erst viel diskutiert und einen Modus ausarbeitet, dieser aber später doch (von anderen Autoren) nicht akzeptiert wird. Deshalb ist ein robustes Meinungsbild sicher das beste Mandat zur Absicherung der Aktion. Zurzeit ist die Vielfalt der Unterstützungsmöglichkeiten durch den Bot das Hauptproblem, weshalb sich wohl auch niemand wirklich festlegen mag. Wie könnte man das auf brauchbar wenige, dafür aber klare Konzepte eindampfen? —MisterSynergy (Diskussion) 06:48, 19. Jul. 2017 (CEST)
@Gestumblindi: Die Abstimmung in der Alemannischen Wikipedia ist 11:0 für die Einführung des Archivbots ausgefallen (Holder ist zur Zeit im Urlaub, ich weiß deshalb nicht, ob die sich schon an Cyberpower678 gewendet haben, ich gehe davon aus), in bar.wiki läuft die Abstimmung noch (bislang ebenfalls keine Gegenstimme). --Joe Watzmo (Diskussion) 06:50, 19. Jul. 2017 (CEST)
Dann erhebe ich die Fundamentalopposition. Ich möchte nicht, dass ein Bot an den Inhalten der deWP bastelt. Auch nicht in dieser reduzierten und vermeintlich beherrschbaren Form. Beim Überprüfen der botgenerierten Hinweise auf tote Weblinks sind mir zu oft false positive Meldungen aufgefallenw, also Einträge für Weblinks, die bei mir ohne jedes Problem liefen. Eine automatische Ersetzung solcher Links durch Archivversionen hat gravierende Nachteile, ich lehne sie ab. Kulturell spricht gegen einen solchen Bot alles, was generell gegen Weblinks als Belege spricht: Sie sind, anders als Papierbelege, nicht stabil. Websites können sich bei gleicher URL inhaltlich ändern, sie können "umziehen" und gelöscht werden. Bei Papier ist das nicht der Fall. Deshalb ist Papier nach wie vor vorzuziehen, der Bot würde Weblinks einfacher, "verlässlicher" machen und damit fördern. Ich möchte auch das nicht. Grüße --h-stt !? 16:27, 19. Jul. 2017 (CEST)
Du hast sicher einen Lösungsvorschlag, wie wir das Toter-Link-Problem ohne Bot in den Griff bekommen? Das Problem an sich ist ja nun einmal in der Welt, und Onlinequellen sind als Belege in einer Onlineenzyklopadie unverzichtbar. —MisterSynergy (Diskussion) 17:11, 19. Jul. 2017 (CEST)
Wie bisher: Botmeldungen auf der Disk. Reparatur nur durch Menschen. Grüße --h-stt !? 18:17, 19. Jul. 2017 (CEST)
Das ist weniger Fundamentalopposition als nach Deinem Kommentar befürchtet, aber immernoch ziemlich viel angesichts der Tatsache, dass die Botmeldungen auf den Diskussionsseiten nicht zufriedenstellend durch Menschen weggearbeitet werden. —MisterSynergy (Diskussion) 18:54, 19. Jul. 2017 (CEST)
Wen nicht befriedigend? Tote Links sind nun mal ein inherentes Risiko, das man immer eingeht, wenn man Weblinks als Belege einsetzt. Dass immer mal wieder ein paar Links nicht mehr erreichbar sind, stellt daher für mich kein fundamentales Problem dar. Die Botläufe mit Markierung auf der Disk funktionieren. Die Abarbeitung findet stetig statt und macht Fortschritte. Effizienz (durch Bots) ist nicht alles, denn der Boteinsatz bring eigene Risiken mit (siehe oben). Ich lehne ihn daher im Inhalt der Wikipedia ab. Grüße --h-stt !? 19:07, 19. Jul. 2017 (CEST)
Der Botlauf auf den Diskussionsseiten funktioniert nicht wirklich – das letzte Update ist eineinhalb Jahre alt und ein kontinuierlicher Betrieb ist offenbar nicht so recht praktikabel möglich und vor allem wäre er sehr aufwändig. Nach meiner Erinnerung ist ca. eine Viertelmillion Meldungen nach wie vor unbearbeitet, und nach dem Weblinkkorrektur-Wikiprojekt liegt die Zahl der Artikel mit defekten Weblinks mittlerweile deutlich über einer halben Million. Natürlich kann man da sagen: „Pech gehabt, lieber Leser!“ und einfach den toten Link da stehen lassen. Ein automatisch eingefügter Archivlink, der ja deutlichst als solcher zu erkennen ist, bietet da in jedem Fall einen Mehrwert.
Trotzdem bin ich von Deiner Form der Fundamentalopposition nicht überrascht, ich habe sie in genau der Form erwartet. Wenns ums effiziente Arbeiten geht, stellt sich leider immer jemand früh in den Weg. Aus dem Grund habe ich bei dem Botbetreiber auf der Kurierdisk versucht anzufragen, wie wir mit seinem Alogrithmus das Problem nach hier etablierten Methoden angehen könnten (i.e. Diskussionsseitenmeldungen, oder sonst geeignete Abfrage der Auswertung seiner Linkprüfung). Leider hat er nicht so recht geantwortet, vielleicht war meine Anfrage auch nicht klar genug. Wenn das hier scheitert und am Ende überhaupt kein Botbetrieb stattfindet (und sei es nur auf Diskussionsseiten), dann wäre ich jedenfalls einmal mehr ziemlich frustriert. Die Giftbot-Meldungen im für mich interessanten Themenbereich habe ich damals sofort abgeräumt, und jetzt fault das seit 18 Monaten vor sich hin, ohne dass ich daran was machen könnte :( MisterSynergy (Diskussion) 19:26, 19. Jul. 2017 (CEST)
@MisterSynergy: Tut mir leid. Ich habe deine Frage total übersehen. Um es kurz zu beantworten, es gibt ein IABot API. Sehe m:InternetArchiveBot/API. Hoffentlich hilft es.—CYBERPOWER (Diskussion) 03:41, 20. Jul. 2017 (CEST)
@Cyberpower678: ja genau sowas suche ich, das sieht grundsätzlich auch ganz hilfreich aus und ich schaue mir das mal ein wenig genauer an. Mit dewiki funktioniert das aber noch nicht, korrekt? —MisterSynergy (Diskussion) 10:43, 20. Jul. 2017 (CEST)
@MisterSyneregy: Dewiki funktioniert noch nicht. Aber sämtliche Funktionen gibts auch wenn dewiki noch nicht unterstützt ist.—CYBERPOWER (Diskussion) 16:28, 20. Jul. 2017 (CEST)
@Cyberpower678: Das API scheint in der Tat ganz nützlich zu sein, unabhängig von der Botaktivität im wiki selbst. Ich wäre Dir höchst dankbar, wenn Du die Datenbank mit den Ergebnissen der Weblinkprüfungen für dewiki aufsetzen würdest, selbst wenn das hier (mal wieder, und nicht unerwartet) zerredet wird und am Ende keine Botaktivität stattfinden darf. —MisterSynergy (Diskussion) 19:47, 20. Jul. 2017 (CEST)
@Cyberpower678: Hast Du das hier mglw. übersehen? Dankeschön und Viele Grüße! —MisterSynergy (Diskussion) 18:34, 22. Jul. 2017 (CEST)
Nein habe ich nicht. Das kann ich schon machen. :-)—CYBERPOWER (Diskussion) 22:47, 22. Jul. 2017 (CEST)
Ich kann mit einer Viertelmillion toter Links leben. Wenn sie wichtig sind, wird sie irgendwann irgendwer korrigieren. Ich möchte nicht mit einem Bot leben, der im Inhalt rumbastelt, solange er Fehler macht, die Menschen nicht machen. Grüße --h-stt !? 18:44, 20. Jul. 2017 (CEST)
@H-stt: "Kulturell spricht gegen einen solchen Bot alles, was generell gegen Weblinks als Belege spricht: Sie sind, anders als Papierbelege, nicht stabil" - diese Argumentation könnte man ja gerade "pro Bot" umdrehen: Durch Archivlinks werden ansonsten flüchtige Internet-Belege zumindest so lange stabil, wie das Archiv existiert. Persönlich ziehe ich Papier-Belege auch vor, aber die Realität ist nun mal, dass wir hier sehr viele Online-Belege haben und sich vieles heutzutage auch gar nicht mehr anders belegen lässt. Und was die false positives angeht: IABot ist ja nicht GiftBot. Nichts gegen die sehr wertvolle Arbeit des GiftBot, aber es ist durchaus möglich, dass das Problem von false positives beim IABot nicht so ausgeprägt ist, da er anders programmiert ist. Weiter oben hat Cyberpower678 geschrieben: "Wenn IABot eine URL besucht, der Bot sieht aus wie ein Chrome Webbrowser, den Server gegenüber. Aber JS ist nicht unterstützt. Also der Algorithmus ist 99% akkurate mit Webseiten als Lebend oder als Tot zu erkennen." Natürlich ist die absolute Zahl fälschlicherweise als tot erkannter Links auch dann, wenn der Bot zu 99% richtig liegt, bei hunderttausenden toten Links immer noch beträchtlich. Aber den Lesern würde durch ein paar tausend fälschlich als tot markierte Links wohl ein geringerer Nachteil erwachsen als durch hunderttausende, die wirklich nicht mehr erreichbar sind. Im übrigen würde ich aber eh nicht für einen vollautomatischen Einsatz quer durch die Wikipedia plädieren. Gestumblindi 03:22, 20. Jul. 2017 (CEST)
Wenn ich das recht sehe hat der Bot ja die Option, dass man ihm sagen kann welche Webseiten bei seinen Suchläufen prinzipiell ignorieren soll. Man kann ihm also sagen welche der 1% fälschlicherweise als Tod erkannt Webseiten, er gar nicht mehr beachten soll. Weil sie eben der Web-Programmierung als tot erkennt, aber in echt noch On sind. Somit kann das Problem entschärft werden, weil man für ihn die Problem-Seiten markieren kann. Sein wir doch ganz ehrlich, lieber 1% händisch pflegen als 100%. Genau wegen der nicht 100% Fehlerfreiheit bin ich ja auch einer der gegen ein automatisches Ersetzen bin. Mit dem Auftrag "nur Markieren", kann man beim händischen Nachbearbeiten solche "Faxen" erkennen.--Bobo11 (Diskussion) 09:39, 20. Jul. 2017 (CEST)
Das ist jetzt etwas off topic, aber könnte man mal mit Aka reden, ob er in seine Heldengalerie tote Weblinks integrieren kann? Gamification ist immer ein guter Antrieb und würde die "Schlagzahl" bei der Tote-Weblinks-Abarbeitung erhöhen. Außerdem könnte man vielleicht mal im Kurier auf dieses Tool von Hgzh hinweisen (andere Namen einsetzen), damit ein paar Leute zumindest mal feststellen, was sich da vor ihrer Haustür an Schimmel angesetzt hat. Ansonsten bleibe ich bei dem, was ich weiter oben schon gesagt habe - Bot gut, aber Information, was gemacht wurde und wie der Ursprungszustand war, auf Disk und per Wartungsliste auffindbar. Viele Grüße, Grueslayer 11:08, 20. Jul. 2017 (CEST)
@Gestumblindi: Aber den Lesern würde durch ein paar tausend fälschlich als tot markierte Links wohl ein geringerer Nachteil erwachsen als durch hunderttausende, die wirklich nicht mehr erreichbar sind. Vehementer Widerspruch. Ein toter Weblink ist ärgerlich, ein fälschlich als tot angegebener Link ist ein Fehler und unbedingt zu vermeiden, zumal es keinerlei Garantie gibt, dass der Archiv-Link die "richtige" Version zeigt. Mit solchen Experimenten setzt man die Seriosität auch derjenigen Wikipedia-Artikel, die seriös sind, aufs Spiel. Einen automatisierten Eingriff in den Artikelnamensraum sollte man genau aus diesem Grund nicht zulassen. Als Hilfsmittel okay, als Editor m.E. ausgeschlossen.--Mautpreller (Diskussion) 13:39, 20. Jul. 2017 (CEST)
Jeder false positive ist ein echter und schwerwiegender Fehler. Während tote Weblinks einfach die natürliche Folge des link rots sind und immanente Folge jeder Entscheidung für Weblinks als Belege. Ich spreche mich für eine Priorität der guten alten Papierbelege aus. Weil sie dieses Problem nicht kennen. Wenn man schon Weblinks benutzt (tue ich ja auch, ständig), muss man halt mit link rot leben. Ein Bot und automatisierte Archivlinks sind keine zufriedenstellende Lösung. Bots können nicht prüfen, ob die Archivversion den belegten Inhalt aufweist, Bots machen false positive-Fehler, Bots können nicht prüfen, ob der Beleg nicht nur umgezogen ist und in identischer Form unter einer neuen URL zur Verfügung steht. Das alles können nur Menschen. Grüße --h-stt !? 18:41, 20. Jul. 2017 (CEST)
Nun das „false positive“ ist eine Argument, dass man Bot's nichts ersetzen lässt. Der Hinweis "ursprüngelicher Weblink ist tot, möglicher Ersatz wäre >Hier<" kann Fehler vertragen. Sei es jetzt das der Weblink nicht Tod ist, oder die vorgeschlagenen Ersatzseite eben kein Ersatz ist. --Bobo11 (Diskussion) 00:33, 21. Jul. 2017 (CEST)
Nö, dann wird im Artikelnamensraum behauptet, dass der Link tot ist. Das ist dann glatt falsch. Das hieße, dass wir einen Bot Fehler in den ANR schreiben lassen.--Mautpreller (Diskussion) 13:35, 21. Jul. 2017 (CEST)
Ebenfals NÖ @Mautpreller:, der Bot hat die Option das er nur auf Dsikusion schreiben darf. Da ist es sicher kein Fehler. Deswegen hab ich heute -ich hoffe in deinem Sinn- vorne die Version 0 eingefügt.--Bobo11 (Diskussion) 22:57, 21. Jul. 2017 (CEST)
Okay, wenn der ANR nicht angetastet wird, dann in Ordnung. Noch lautet aber die Frage: "Das vorliegende Meinungsbild schlägt vor, dem InternetArchiveBot für definierte Aufgaben zu erlauben, Änderungen im Artikelnamensraum der deutschsprachigen Wikipedia vorzunehmen." Für Variante 0 müsste man dann mit Nein stimmen.--Mautpreller (Diskussion) 11:41, 22. Jul. 2017 (CEST)
Wenn "der ANR nicht angetastet wird", dann verstehe ich nicht, worin der Vorteil gegenüber dem GiftBot bestünde. Nochmal, Bobo11, kannst du bitte mit konkreten Vorschlägen auf der Vorderseite warten, bis sich Initiator(en) und Unterstützer einig sind. Der vorzeitige Vorstoß stiftet Verwirrung und verursacht Mehrheit. --Martina Disk. 21:20, 23. Jul. 2017 (CEST)
Ohne ANR-Aktivität bestünde der Vorteil gegenüber dem Giftbot darin, dass wir jederzeit aktuelle Informationen über alle URLs haben. Soweit ich das verstanden habe, ist das mit dem Giftbot zu aufwändig, weshalb wir nur alle paar Jahre einen neuen Botlauf bekommen. —MisterSynergy (Diskussion) 21:25, 23. Jul. 2017 (CEST)
Oh okay, so war das nicht bei mir angekommen. Ich dachte, wir lassen den GiftBot absichtlich nicht so oft laufen, weil so viele Seiten betroffen sind? Wer kann das mit Bestimmtheit sagen (und die Gründe einigermaßen OMA-tauglich erklären)? Danke! --Martina Disk. 21:29, 23. Jul. 2017 (CEST)
Naja das ist halt so das Problem. Vor dem letzten Giftbotlauf hatte ich meinen Arbeitsbereich gut runtergearbeitet, dann kam der 2015/16er-Lauf und da kam eine gute neue Zahl von Fällen rein, die ich auch sofort erledigt habe (dauerte ja drei Monate oder so). Seitdem… ist nichts mehr (stimmt nicht ganz: Giftpflanze hat mir dankenswerterweise auf Nachfrage meinen Arbeitsbereich einmal extra ausgewertet). AFAIK hat das Betreiberteam durchaus neuere Daten vorhanden (oder kann sie recht schnell ermitteln), aber das dauerhaft zu verteilen ist nicht so einfach. Es war ja auch so, dass das Zurückmelden der False-Positives mit augenscheinlich einigem Aufwand für das Giftbot-Team verbunden war.
Um zumindest hier eine Verbesserung hinzubekommen, habe ich weiter oben den Benutzer:Cyperpower678 als Betreiber des IABots gefragt, ob er uns die Linkprüfergebnisse in seinem Tool zur Verfügung stellen kann. Das plant er jetzt auch. Das API erlaubt dann nämlich die Abfrage von toten Links, so dass wir jederzeit aktuelle Daten haben können. Es wäre dann gar denkbar, dass überhaupt kein IABot hier tätig wird (auch nicht auf Diskussionsseiten), sondern dass bspw. der Taxonbot das monatlich oder so abfragt und regelmäßig die Portalwartungslisten damit befüllt. Ich kann die Prüfergebnisse des IABots noch nicht einschätzen (Giftbot war da ziemlich gut, fand ich), aber der technische Unterbau scheint mir beim IABot deutlich umfangreicher zu sein, was dann eben auch die Nutzungsszenarien erweitert. —MisterSynergy (Diskussion) 21:48, 23. Jul. 2017 (CEST)
@MisterSynergy: Um klar zu sein, die URLs die bei der Deutschen Wikipedia benutzt werden sind nur aktuell wenn IABot zumindest of der Deutschen Wikipedia im Hintergrund läuft, so das er die Links weiter prüfen tut. Das heisst, der geht rum und analysiert die Links, aber macht absolute nichts of Wikipedia. Aber andere Bots/Tools kann mit dem API auch links als Tot markieren und bessere Archiv URLs IABot weiter geben.—CYBERPOWER (Diskussion) 21:59, 23. Jul. 2017 (CEST)
Richtig, im Hintergrund müssten natürlich die Links geprüft werden und es wird einige Zeit dauern, bis das einmal alle geprüft sind (ich glaube es gibt gerade so 20M Weblinks). Das kann jedoch so sehr im Hintergrund passieren, dass onwiki keinerlei Aktivität bemerkbar ist. In dem Falle wärest Du bequem raus, denn niemand kann (und will) Dir das Prüfen von Links verbieten. Auf welche Weise die Ergebnisse dann verteilt werden, müssten wir hier entscheiden, und Du machst uns hier im Grunde gerade das Angebot, das bei Gefallen auch gleich zu erledigen.
Wir müssen immer im Kopf behalten, dass das eigentlich ein mindestens zweischrittiger Prozess ist. Die Prüfung und das Vorhalten der Prüfergebnisse findet ohne Aktivität im Wiki statt, und da haben wir zurzeit keine ständig laufende Alternative zum IABot-Framework. Als zweiten Schritt hat man dann die Verteilung der Ergebnisse in die Communities, oder eben auch eine automatische Reparatur, sofern gewünscht. —MisterSynergy (Diskussion) 22:06, 23. Jul. 2017 (CEST)
MisterSynergy: Für reine Prüfläufe und Einträge auf eine oder mehrere Ergebnisliste(n), braucht der Bot aber doch kein Meinungsbild, oder?
Meiner Auffassung nach brauchen wir auch kein Meinungsbild, um auf Diskussionsseiten die unerledigten GiftBoteinträge um weitere defekte Links zu ergänzen. Hier wäre lediglich eine Abstimmung der beiden Botbetreieber(teams) nötig. Wünschenswert wäre auch, wenn der IABot die bereits bekannten false positives eingefüttert bekäme, und möglichst die abgearbeiteten älteren GiftBot-Einträge (in der Versionsgeschichte) nicht nochmal einträgt. Das Meinungsbild halte ich nur für nötig, wenn der Bot irgendetwas im Artikelnamensraum anstellen soll.
@Gestumblindi, @all: Oder wie seht ihr das? --Martina Disk. 02:10, 24. Jul. 2017 (CEST)
Martina, da stimme ich ganz zu. Die Skepsis besteht gegenüber Boteinsätzen im ANR. Wenn IABot, wie Cyberpower678 schreibt, nur im Hintergrund laufen, "herumgehen" und Links analysieren, dabei aber nichts in der Wikipedia machen würde, könnte wohl kaum jemand etwas dagegen haben. Das könnte man m.E. ganz unabhängig von diesem Meinungsbild machen bzw. auch wenn ein Einsatz des IABots hier abgelehnt werden sollte. Gestumblindi 10:16, 24. Jul. 2017 (CEST)
Ich hätte auch deutlich weniger Bedenken, wenn Aktivität im ANR ausgeschlossen wird, frage mich allerdings, wie der GiftBot und der IABot dabei harmonieren. Nach meinem Eindruck funktioniert der GiftBot eher besser. Ich habe allerdings die Idee nicht voll verstanden. Es gibt da den Vorschlag, dass die Links analysiert werden, aber "keinerlei Aktivität onwiki" stattfindet. Das ist aber ja nur der Anfang, denn irgendwie muss die Community die Ergebnisse erfahren ("zweiter Schritt", MisterSynergy). Das kann zum Beispiel auf der Diskussionsseite geschehen, nur fragt sich, in welcher Form. Wenn neben der GiftBot-Meldung auch noch die IABot-Meldung auf der Disk aufschlägt, womöglich mit differierenden Ergebnissen, ist das nicht unbedingt ein Gewinn. MisterSynergys Anliegen war, die Ergebnisse der Prüfung ständig oder wenigstens öfter zu erfahren, wenn ich es recht sehe, aber dafür braucht man ja eigentlich nicht zwei Bots, oder?--Mautpreller (Diskussion) 10:28, 24. Jul. 2017 (CEST)
Beide Meldungen zu vermischen halte ich für ein schwieriges Unterfangen seitens der involvierten Botbetreiber, und eigentlich auch für unerwünscht seitens der Community. Es wäre schon schön, wenn direkt klar ist welcher Bot hier welches Prüfergebnis produziert hat. Sonst melde ich Falsch-positive möglicherweise dem falschen Bot, oder so. Differierende Ergebnisse halte ich nicht für problematisch, denn Weblinkprüfung ist keine triviale Angelegenheit und mehr Ergebnisse führen am Ende nur zu besseren Lösungsoptionen. Bei zwei Bots wäre das auch noch bei Weitem nicht unübersichtlich. Letztlich ist das onwiki-Meldungsmanagement über Diskussionsseiten hier aber aus technischer Sicht eigentlich eine schlechte Lösung.
Wenn Benutzerin:Giftpflanze & Team mit ihrem Bot einen Permabetrieb hinbekämen, wäre ich schon komplett zufrieden und IABot-Funktionalität wäre nicht mehr notwendig, trotzdem noch nützlich. Eine Toolvielfalt haben wir an vielen Stellen, und das ist eigentlich immer positiv zu beurteilen. —MisterSynergy (Diskussion) 10:38, 24. Jul. 2017 (CEST)
@MisterSynergy: Falls zwei Bots parallel laufen, sollten Falschpositive auf den ignore-Listen beider Bots stehen, oder? Im Idealfall macht der User nur einen Eintrag, der an beide Bots ausgeliefert wird. @Mautpreller: Meinem Verstädnis nach kann der IABot auf Labs oder onwiki (?) eine Liste (mutmaßlich) kaputter Links anlegen und anzeigen, in welchen Artikeln sie vorkommen. Anscheinend ist eine solche Liste auf Labs nur für die Administratoren eines freigeschalteten Wikis einsehbar - insofern ist mir unklar, welche Information dort zu sehen wäre. Diese erkannten Links können auf eine Wartungsliste eingetragen werden (wo??) und/oder auf die Diskussionsseiten der betroffenen Artikel. Der IABot ließe sich vom GiftBot mit Links und Artikeldiskseiten "füttern", die der IABot ignorieren soll (um Duplikate zu vermeiden). Er kann offenbar auch mit der Liste der false positives vom GiftBot "angelernt" werden. Theoretisch. (Ich sehe noch nicht den Wunsch des GiftBot-Teams, ihren Bot quasi zum Zulieferer des IABot umzustricken.) --Martina Disk. 09:14, 26. Jul. 2017 (CEST)
Sollte IABot tatsächlich in betrieb sein, auch nur im Hintergrund, kann die Ignorier liste auf IABot verwaltet werden, nur so als Idee. Giftbot kann die URLs von IABot abfragen, und IABot antwortet ob es Weissgelistet ist oder nicht. Eine zentrale DB macht es für zwei bots viel leichter, und IABot bietet dieses DB nicht für Dewiki URLs aber andere wikis, einschliesslich enwiki, auch. Die Ignorier liste ist schon wahrscheinlich mehr Komplett. Nur so eine Idee. Hier ist eine Beispiel. IABot wurde nachgefragt über Informationen über die URL https://kso.etjanster.lantmateriet.se/?e=625021&n=7511594&z=8&profile=default_fjallkartan_noauth. Das gibt eine JSON Antwort, und bei "live_state" steht da "whitelisted". Das heisst IABot ignoriert dieses URL und betrachtet den immer als Lebendig und prüft nicht nach ob es wirklich lebt oder nicht.—CYBERPOWER (Diskussion) 15:18, 26. Jul. 2017 (CEST)

Abstimm Version 1[Quelltext bearbeiten]

Ich war mal so frei und hab eine eher restriktive aber meiner Meinung nach mehrheitsfähigen Abstimmoption eingefügt. Das wir den Bot zulassen aber eben nur als Markier-Hilfe, und der Ersatz des Toten Weblinks durch Archiv-Weblink muss händisch erfolgen. --Bobo11 (Diskussion) 10:21, 19. Jul. 2017 (CEST)

Damit es auch eine echte Versionsabstimmung wird, Version 2 für alle Weblinks. Im Gegesatz zur Version 1 wo er auf Referenzierungs Weblinks beschränkt wird. --Bobo11 (Diskussion) 12:56, 19. Jul. 2017 (CEST)
Und natürlich nach die Option 3, Volle Rechte, sprich soll seien Fähigkeiten nutzen dürfen. Wer eine Weitere Option sieht nur zu.--Bobo11 (Diskussion) 13:05, 19. Jul. 2017 (CEST)
Ich kam, sah und schrieb - eine Unteroption. Den Vorschlag 2 kann man nämlich sehr gut als Opt-Out (Bot ist Standard, man kann sich aus seinem arbeitsbereich nehmen) und Opt-In (wenn man die Hilfe will, kommt ein Auftrag) aufteilen. Grüße, Grand-Duc ist kein Großherzog (Diskussion) 17:11, 19. Jul. 2017 (CEST)
@Grand-Duc: die Option gäbe es auch in der 1 Variante. Aber ob das sinnvoll ist und das die Abstimmenden verstehen, dass hier wirklich die Frage. Das solle man versuchen auf dösseln, und verständlich zu erklären was denn nun ohne Nachfrage Freigeschaltet wird, bzw. was von einem Portal gesperrt werden kann. Bzw. Was eben per Zuruf freigeschaltet werden soll, der Rest aber vom Bot ignoriert wird. ICh vermute auch, dass das ein Schritt für Schritt sein sollte. Solange der eben keine toten-Links löscht, kann man da noch eingreifen, wenn der Bot nicht das macht was man von ihm verspricht.--Bobo11 (Diskussion) 23:51, 19. Jul. 2017 (CEST)

Man sollte tatsächlich eine Opt-in-Abstimmvariante vorsehen. Mir reicht übrigens nicht die Opt-out-Version für Portale. Unerlässlich ist die Möglichkeit, einzelne Artikel gegen Botaktivitäten zu schützen.--Mautpreller (Diskussion) 13:48, 20. Jul. 2017 (CEST)

Vorschlag 1 könnte lauten: Keine Botedits im Artikelnamensraum. Nur auf der Diskussionsseite und/oder in einer Wartungsliste wird angegeben, dass der Link nicht geht, und ein Archivlink vorgeschlagen. Das ist die einzige Variante, der ich zustimmen könnte.--Mautpreller (Diskussion) 14:42, 20. Jul. 2017 (CEST)

Das die jetzige Version 1 und die Version 2a Mit Opt-in-Abstimmvariante in der Auswirkung ähnlich sind, kann meine Abstimmoption 1 durchaus weg, damit es nicht zu viele werden. Denn in der 2a werden die Nicht-Reflinks nur dann freigegeben, wenn es das entsprechend Portal als sinnvoll erachtet. @Mautpreller: nur zu füge deine Vorschlag an erster Stelle ein. Mir ist es recht wenn jemand auf Abstimmversion mit einer ganz strenge Handhabung kommt. Denn es soll wirklich mal geklärt werden, wo und wie weit wir Bot's zulassen wollen. Einmal eine Richtschnur für Bot's zu haben würde nicht Schaden. Damit man nicht jedes mal eine Grundsatzdiskussion lostreten muss, wenn jemand mit einer Bot-Idee anklopft. Ich bin mir auch sicher, dass auch die Entwickler gerne wissen würden, was ihre Bots' in der De:Wikipedia können müssen (z.B. Was ein- und ausgeschaltet werden können muss). --Bobo11 (Diskussion) 00:04, 21. Jul. 2017 (CEST)

Automatische Reparaturen[Quelltext bearbeiten]

kommen m.E. überhaupt nicht in Frage. Aufnahme in eine Wartungskategorie bzw. Hinweis auf der Diskussionsseite sind hingegen nützlich. Jeder automatisierte Edit im Artikelnamensraum kann Schaden stiften, wenn er nicht vorher von verantwortlich handelnden Menschen geprüft wird. Dagegen wiegt das "Hinterherhinken" bei toten Links nicht schwer.--Mautpreller (Diskussion) 13:32, 20. Jul. 2017 (CEST)

Nun es steht bis jetzt nur eine Version vorne zur Wahl, die genau das zulassen würde. Das diese Version Mehrheitsfähig ist, da hab ich auch so meine Zweifel. Sie muss aber eben rein, damit man ein klares Resultat hat, wie weit die Leute hier bereit sind Bot's zu vertrauen. Fehler zu suchen und zu markieren, ist in der Regel stupide Drecksarbeit, um es mal deutlich zu sagen. Ist es nicht sinnvoller die doch endliche menschliche Arbeitszeit auf den Bereich zu konzentrieren, wo Bedenken vorliegen? Was ja nicht anderes heissen würde als, dass man sich auf die Fehlerbehebung konzentriert. Und sich bei der Fehlersuche bzw Fehlererkennung sich durch Helferelein's unterstützen lässt. --Bobo11 (Diskussion) 23:55, 20. Jul. 2017 (CEST)
Sehe ich anders. Wir sollten m.E. nur zur Abstimmung stellen, was wir wirklich wollen und für mehrheitsfähig halten. --Martina Disk. 02:09, 23. Jul. 2017 (CEST)

Urheberrecht?[Quelltext bearbeiten]

In wiefern stellen die im Internet Archive vorgehaltenen Kopien keinen Verstoß gegen das Urheberrecht in Deutschland, Österreich und der Schweiz dar? --Succu (Diskussion) 00:14, 21. Jul. 2017 (CEST)

@Succu: Das ist eine interessante Frage. Allerdings eine, die man (auch) an anderer Stelle stellen könnte - schliesslich wird das Verlinken des Internet Archive in der deutschsprachigen Wikipedia bereits breit praktiziert, mit aktuell schon über 52'000 Links, wir haben dafür Vorlagen wie {{Webarchiv}} bzw. Parameter in den Weblink-Vorlagen usw. Der aktuelle Status in der deutschsprachigen Wikipedia ist damit seit Jahren, dass das Internet Archive intensiv genutzt wird - und auch wenn man die urheberrechtliche Situation theoretisch hinterfragen kann, so scheint sich der Betreiber des IA selbst in Amerika gut auf fair use berufen zu können, auch die deutschsprachige Wikipedia ist letztlich ein Projekt der amerikanischen Wikimedia Foundation, und damit sind Links auf das IA wohl haltbar. Ich weiss nicht, ob dieses Meinungsbild der richtige Ort für die Grundsatzfrage ist, ob man aus DACH-urheberrechtlicher Sicht überhaupt auf das Internet Archive verlinken soll/kann/darf, und würde eher sagen: die Grundsatzfrage scheint aktuell durch die Praxis bejaht, hier stellen wir nur die Frage, ob man dafür auch einen Bot einsetzen kann. Gestumblindi 00:29, 21. Jul. 2017 (CEST)
Ich halte das für fahrlässig. Urheberrechtliche Fragen sollte man ernst nehmen, d.h. eine Abwägung vornehmen, ob das im Einzelfall tragbar ist oder nicht. Also verantwortlich handeln. Das kann ein Bot nicht.--Mautpreller (Diskussion) 10:27, 21. Jul. 2017 (CEST)
Ich bezweifle, dass die gespeicherten Komplettkopien von beispielsweise Webseiten oder PDFs durch Fair Use gerechtfertigt werden können. --Succu (Diskussion) 22:54, 21. Jul. 2017 (CEST)
Vor allem auf Dauer! Temporäre Kopien mögen ja noch gehen, Permanentkopien wohl kaum.--Mautpreller (Diskussion) 11:49, 22. Jul. 2017 (CEST)

Viele solche Fälle betreffen Internetrepräsentationen von Druckerzeugnissen. Bei korrekter Angabe der Publikation ist ein Weblink ein Zusatz-Service. Ich bin keineswegs begeistert davon, wenn an solchen, öfter mal toten, Links herumgefummelt wird. Wenn der Link tot ist, ist es kein Drama, dann muss man halt die Publikation suchen und notfalls bestellen. Ein automatisch bereitgestellter Internetlink ist nicht nur urheberrechtlich höchst problematisch, sondern leitet auch weg von der Publikation selbst. Nützlicher wäre da, wenn schon, ein Bot, der (auf der Diskussionsseite, niemals im Artikel!) mangelhafte bibliografische Angaben anmeckert. --Mautpreller (Diskussion) 12:43, 21. Jul. 2017 (CEST)

Wenn das urheberrechtlich so problematisch wäre, wäre das längst von einem Gericht festgestellt worden. Zur Erinnerung: nicht nur das Internetarchiv, sondern auch die Wikimediaprojekte unterliegen dem amerikanischen Urherberrecht.--Giftzwerg 88 (Diskussion) 13:16, 22. Jul. 2017 (CEST)
Du irrst Giftzwerg 88. Als Urheber eine Textes muß ich allerdings ggf. dieses Recht international einklagen, was weder spaßig noch billig ist. --Succu (Diskussion) 23:12, 22. Jul. 2017 (CEST)
Nicht nur dem amerikanischen. Die Veröffentlichung findet nicht nur in den USA statt. Es ist auch ein Unterschied, ob historische Texte erfasst werden oder aktuelle, und vor allem ist es ein Unterschied, ob ein Archiv aufgebaut wird oder dieses von einer der meistbesuchten Websites der Welt auf automatisiertem Weg zugänglich gemacht wird.--Mautpreller (Diskussion) 13:20, 22. Jul. 2017 (CEST)
Hättest du recht, wäre Google schon längst dichtgemacht.--Giftzwerg 88 (Diskussion) 13:22, 22. Jul. 2017 (CEST)
Google stellt Temporärkopien her, nicht Permanentkopien.--Mautpreller (Diskussion) 13:32, 22. Jul. 2017 (CEST)

Jetzt mal etwas allgemeiner: als Nichtjurist kann ich sowieso nicht beurteilen, wie es um die rechtliche Situation eines Weblinks aussieht. Mir kommen gleich mehrere Fragen:

  • In Deutschland (und vielen anderen europäischen Ländern) dürften man einen Dienst wie das Internet Archive aus urheberrechtlichen Gründen vermutlich nicht betreiben. In den Vereinigten Staaten scheint das möglich zu sein. Richtig?
  • Wie soll ich entscheiden, ob der Inhalt einer beliebigen im Internet Archive gespeicherten Seite gegen das Urheberrecht verstößt? Welche Rechtssysteme findet überhaupt Anwendung, und warum? Welcher Art von Vergehen mache ich mich schuldig, wenn ich einen Link in der Wikipedia platziere, der gegen irgendsoein Recht verstößt?
  • Weblinks zum Internet Archive sind hier nicht unüblich (Gestumblindi hat oben Zahlen genannt), aber die Urheberrechtsproblematik scheint dabei bisher keine Rolle gespielt zu haben. Warum?
  • In unserem Regelwerk und den Hilfeseiten finden sich nur äußerst wenige Stellen dazu. Ich finde spontan Wikipedia:Weblinks#Einzelrichtlinien, speziell Punkt 7, wobei auf die Archivierungssituation dort nicht adressiert wird, und Hilfe:FAQ Rechtliches#Externe Links zu Seiten mit strafbarem Inhalt – erlaubt oder verboten?
  • Im Internet Archive gespeicherte Seiten kann man als Seitenbetreiber meines Wissens löschen lassen, auf verschiedenen Wegen. Opt out ist zwar im deutschsprachigen Kulturraum keine feine Art, aber ansonsten doch sehr weit verbreitet.

Das ist nach 16.5 Jahren Projektlaufzeit wirklich alles nicht viel, und ich würde mich ernsthaft wundern, wenn diese rechtliche Fragestellung hier ernsthaftes Problempotenzial für den Projektbetreiber oder die Projektmitarbeiter aufwerfen sollte. —MisterSynergy (Diskussion) 18:50, 22. Jul. 2017 (CEST)

Ich hab selbst schon Links auf das Achiv gesetzt, dabei ging es aber um Texte, die gemeinfrei sind. Ganz schön heikel wird das bei Texten, die etwa gegen WP:BIO verstoßen. Beispielsweise: Vor 15 Jahren wurde in Zeitungen mit vollem Namen über eine Verurteilung berichtet, die Strafe ist seit zwölf Jahren abgesessen, die Lemmaperson hat das Recht auf Resozialisierung, wir verlinken per Internet-Archiv den uralten Zeitungsartikel. Aber auch bei Urheberrechtsverstößen: Kurzzeitig stand ein urheberrechtsgeschützter Text unter Verletzung des Urheberrechts im Netz, jemand verlinkt darauf, das Internet-Archiv archiviert ihn, kurz darauf muss der Text aus dem Netz genommen werden. Aber die archivierte Fassung ist noch da und schlummert vor sich hin, bis sie ein Bot wieder leicht zugänglich macht.--Mautpreller (Diskussion) 20:16, 22. Jul. 2017 (CEST)
@Mautpreller: Während das Internet Archive ursprünglich rechtmässig im Web stehende Inhalte unter Berufung auf fair use als Archivversionen vorhält, gehe ich davon aus, dass es Inhalte, die schon "live" nicht rechtmässig online gestellt wurden bzw. Urheberrechtsverletzungen waren, auf Ersuchen der Rechteinhaber durchaus löscht bzw. per Digital Millennium Copyright Act (DMCA) sogar löschen muss (allerdings muss der Rechteinhaber dazu natürlich erstmal aktiv werden). Dem Internet Archive drohen dabei m.W. keine juristischen Konsequenzen, wenn es Löschaufforderungen per DMCA nachkommt. Was Verstösse gegen WP:BIO angeht: Das ist ja eigentlich kein archivspezifisches Problem. Wenn sich die Frage stellt, ob in einem Personenartikel über eine längst abgesessene Strafe berichtet werden soll/darf, dann ist diese Frage völlig unabhängig davon, ob der alte Zeitungsartikel nun im IA verfügbar ist, gar noch "live" online (in den USA mit ihren schwach ausgeprägten Persönlichkeitsrechten häufig der Fall) oder "nur" in einer gedruckten Zeitung, die man ja eben auch als Beleg angeben könnte. Das IA ist diesbezüglich doch nicht "böser" als Bibliotheken, die physische Zeitungen aufbewahren. Gestumblindi 10:44, 24. Jul. 2017 (CEST)
Ich sehe da schon einen Unterschied, und der liegt in der Reichweite begründet. (Und das ist durchaus ein juristisches Problem.) Mal an einem Beispiel: Über eine Straftat wird in Zeitungen berichtet oder ein urheberrechtsgeschützter Text wird abgedruckt. Natürlich gibt es diese als Druckwerke noch, bei Lesern und auch in Archiven, aber man muss wissen, was man genau sucht, um es zu finden. Manchmal findet man dasselbe sogar noch in einem Buch, das allerdings eine mäßige Auflage hat und auch erstmal gefunden werden muss. Das tangiert Persönlichkeits- und Urheberrechte zwar, aber da die Reichweite so gering ist, lohnt es sich kaum, dagegen vorzugehen, möglicherweise würde diese relativ schwer zugängliche, auf ein beschränktes Publikum und einen beschränkten Zweck bezogene Angabe sogar als rechtmäßig eingestuft. Wenn dieselbe Angabe aber in der Wikipedia zugänglich ist, über einen InternetArchive-Link belegt, hat sich die Reichweite auf einen Schlag ungeheuer ausgedehnt. Jeder (!!), der zB einen Namen oder ein Werk googlet, wird umgehend mit der Nase drauf gestoßen. Das ist eine viel massivere Verletzung der Rechte, als das vorher evtl. der Fall gewesen war. Die Rechte sind immer auch eine Frage des Grades (und der vergangenen Zeit und des Kontexts, in dem solche Texte verbreitet werden). Die nächste Stufe wird erreicht, wenn das ohne menschliche Kontrolle geschieht, wenn also in einem automatisierten Prozess, naturgemäß ohne Rücksicht auf den Kontext, den Zeitverlauf etc., eine alte, relativ schwer findbare und zugängliche Aussage nebst Repräsentation auf einer der meistbenutzten Websites der Welt veröffentlicht wird. Hier ist verantwortliches Handeln überhaupt nicht mehr möglich, man kann nicht mehr abwägen, man kann überhaupt nicht mehr "rechtstreu" agieren. Das könnte künftig nicht nur riesige juristische Probleme aufwerfen, es ist auch moralisch unvertretbar.--Mautpreller (Diskussion) 11:02, 24. Jul. 2017 (CEST)
@Mautpreller: Ich denke, hier liegt ein kleiner Denkfehler vor: Die enorme Reichweite wird doch bereits durch die Ausführungen in der Wikipedia generiert. Ob wir dafür dann einen Internet-Archive-Link oder einen gedruckten Zeitungsartikel als Beleg verwenden, spielt an diesem Punkt bereits keine grosse Rolle mehr. Den Beleglink klicken eh die wenigsten Leser an. Wenn du in einem Artikel eine bestimmte deines Erachtens persönlichkeitsrechtsverletzende Information aus einem alten Zeitungsartikel nicht drinhaben willst, hilft es dir nicht weiter, einen IA-Link zu verbieten, darum geht es doch gar nicht. Gestumblindi 11:21, 24. Jul. 2017 (CEST)
Du hast insofern recht, als die wichtigste Entscheidung im Wikipedia-Artikel getroffen wird (nämlich die Veröffentlichung der Angabe und des Links). Bloß siehst Du es zu statisch. Ich halte es zunächst für ganz unwahrscheinlich, dass den Beleglink "die wenigsten Leser anklicken", und zwar ganz besonders in solchen (wichtigen, da Rechte betreffenden) Fragen, um die es hier geht. Zudem ist die Entscheidung im Wikipedia-Artikel selbst ganz wesentlich davon abhängig, dass ein "Beleg" verfügbar und für jedermann einsehbar ist. Vor allem aber kann ein "broken link" ja schlicht bedeuten, dass die ursprüngliche Veröffentlichung aus bestimmten Gründen nicht mehr online zugänglich ist. Sei es, weil es zu lange her ist, sei es, dass der Text aus rechtlichen Gründen vom Netz genommen wurde, sei es, dass er korrigiert wurde, sei es, weil er urheberrechtlich als problematisch angesehen wird, sei es, dass bspw. die Rechtslage für Zeitungsarchive sich geändert hat, es gibt sehr viele Möglichkeiten. Dies zu "korrigieren" ist prinzipiell problematisch, weil man das im Einzelnen nicht alles wissen kann. Man kann aber immer noch eine Entscheidung treffen: den Link rauswerfen (und vielleicht auch die zugehörige Angabe), einen anderen, saubereren Beleg suchen, sich trotzdem für den IA-Link entscheiden und das dann auch verantworten. Das ist kompliziert, aber wenigstens im Prinzip noch beherrschbar (ob in der Praxis, mag dahingestellt bleiben). Ein automatisierter Prozess ist hingegen nicht mehr beherrschbar. Deswegen meine ich eben, dass es juristisch wie moralisch unvertretbar ist, solche im Ernstfall extrem bedeutsamen Dinge einem Bot zu überlassen, der prinzipiell schon nicht verantwortlich handeln kann.--Mautpreller (Diskussion) 11:40, 24. Jul. 2017 (CEST)
(BK) : Ich sehe zumindest ein ethisches Problem. Wir stellen uns hier die Aufgabe „freies Wissen“ zu erschaffen, also insbesonderes auch eines, das frei von potentiellen URVs ist. Da passen m.E. derartige Verlinkungen nicht dazu. Wie überall muss man erst klagen um sein Urheberrecht einzufordern. In den Artikeln en:Internet Archive und en:Wayback Machine findet man dazu ein paar Beispiele. --Succu (Diskussion) 20:21, 22. Jul. 2017 (CEST)
Ich teile die urheberrechtlichen Bedenken, aber Mehrheitsaufassung oder "de facto-Haltung" scheint zu sein, dass die Archive nach US-Recht zulässig sind.
Mautpreller, in den von dir zu Recht genannten Fällen wäre ein für diesen Link spezifisches Opt-Out verfügbar: {{cbignore}} --Martina Disk. 23:33, 22. Jul. 2017 (CEST)
Succu, ich habe die urheberrechtlichen Fragen umseitig aufgenommen. Gibt der Eintrag in die Kontra-Argumente deine Kritik angemessen wider? --Martina Disk. 23:35, 22. Jul. 2017 (CEST)
Meinst du diese Änderung, Martina? --Succu (Diskussion) 23:40, 22. Jul. 2017 (CEST)
@Succu : Ja. --Martina Disk. 23:44, 22. Jul. 2017 (CEST)
So ja, sonst nein. --Succu (Diskussion) 23:54, 22. Jul. 2017 (CEST)
Ok, danke! --Martina Disk. 23:58, 22. Jul. 2017 (CEST)

Ich habe mal explizit ausgedrückt, dass die Weiternutzung der Grund ist, warum trotz Fair-Use-Konformität Bedenken bestehen. Nach wie vor steht umseitig: … sie verstoßen aber gegen das Urheberrecht in Deutschland, Österreich und der Schweiz. Ist das wirklich als absolute Aussage haltbar, oder wäre nicht eine Einschränkung wie "vermutlich", "wahrscheinlich" oder "unter Umständen" korrekt? Hier übrigens noch zwei Links zu der Frage: „… Insofern bleibt das weitere rechtliche Schicksal der Waybackmaschinen unklar …“[3]; „… Verlinken gehöre zu den Kernfunktionen des Internets und sei unmittelbar mit der Meinungs-, Informations- und Gewerbefreiheit verbunden …“[4] --dealerofsalvation 07:42, 10. Aug. 2017 (CEST)

Ob die Verlinkung urheberrechtlich relevant ist, mag unsicher sein; ohne jeden Zweifel ist jedoch die dauerhafte, unbeschränkte Veröffentlichung eines urheberrechtlich geschützten Texts ohne Genehmigung des Urhebers ein Verstoß gegen das Urheberrecht. D.h. das Internet Archive verstößt in diesen Fällen gegen urheberrechtliche Bestimmungen. Das betrifft natürlich nicht alle Texte, sondern nur die urheberrechtlich geschützten. Die Verlinkung solcher Texte ist aber aus verschiedenen Gründen problematisch. Links auf URV mögen im Einzelfall tragbar und unbedenklich sein, als automatisierte Massenanwendung sind sie es nicht.--Mautpreller (Diskussion) 13:12, 10. Aug. 2017 (CEST)
Wir können nichts daran ändern, dass das IA online ist. Insofern ist irrelevant, ob das IA gegen DACH-Recht verstößt. Relevant ist, ob Links auf IA DACH-rechtskonform sind. Auch wenn die Foundation aufgrunddessen nichts zu befürchten hat, wohl aber evtl. unsere Autoren und Nachnutzer. Also, Diskussionsstand ist wohl, dass Links möglicherweise DACH-rechtswidrig sind. Finde ich schon wichtig, das korrekt wiederzugeben. Außerdem bezweifelt niemand, dass das IA und somit auch Links dadauf generell US-rechtskonform sind. Ist es eigentlich sinnvoll, ggf. zu erwähnen, dass Bearbeiter, sofern sie in DACH ansässig sind, sich ggf. durch eine Verlinkung rechtlicher Verfolgung durch aussetzen? --dealerofsalvation 08:58, 15. Aug. 2017 (CEST)
Das ist jetzt ein Argument für den Einsatz eines Bot? Cyberpower678 ist offensichtlich nicht in DACH ansässig und der Server auf dem sein Bot läuft auch nicht. Er würde als rechtskonform handeln, ein ganz normaler User aus DACH hingegen möglicherweise nicht. --Wurgl (Diskussion) 11:03, 15. Aug. 2017 (CEST)

Ob eine Verlinkung rechtswidrig ist, bemisst sich nicht nach dem Standort des Servers oder dem Wohnsitz des Verlinkers. Da die Veröffentlichung für den deutschen Sprachraum bestimmt ist, muss sie die rechtlichen Regelungen dieses Sprachraums beachten. Die Archivdateien sind dann klar rechtswidrig, wenn sie in DACH urheberrechtsgeschützte Werke verbreiten. Sie können auch rechtswidrig sein, wenn sie Texte verbreiten, die im DACH-Raum wegen Regelungen des Persönlichkeitsschutzes nicht verbreitet werden dürfen. Allerdings sind Archivversionen nicht so leicht zu finden, so dass der Verbreitungsgrad relativ gering ist. Links darauf sind vor allem deshalb möglicherweise rechtswidrig, weil sie die sonst nicht leicht aufzufindenden Rechtsverletzungen für ein sehr breites Publikum zugänglich machen.--Mautpreller (Diskussion) 13:53, 15. Aug. 2017 (CEST)

Ob das Internet Archive nach deutschem Urheberrecht zulässig ist, ist für dieses Meinungsbild meiner Meinung nach nicht entscheidend. Wir verlinken bereits tausendfach auf Internetarchive und die Archivlinks werden auch vom GiftBot vorgeschlagen. Eine Entscheidung gegen Archivlinks allgemein (die ich für fatal halte) müsste also allgemein getroffen und umgesetzt werden. Am Ende des Tages ist es an der WMF, zu entscheiden, ob sie Archivlinks auf ihren Servern haben möchte.--Cirdan ± 15:58, 15. Aug. 2017 (CEST)
Entschuldige, aber das finde ich grob verharmlosend. Es geht nicht darum, ob "das InternetArchive zulässig ist" oder ob die WMF Archivlinks "auf ihren Servern haben möchte". Es geht darum, dass die Veröffentlichung von Texten gesetzlichen Spielregeln unterliegt, im deutschen Sprachraum vor allem dem Urheberrecht. Wenn das InternetArchive eine Webseite mit einem urheberrechtsgeschützten Text veröffentlicht, ist das ebenso rechtswidrig, wie wenn ein Verlag diesen Text drucken würde, ohne im Besitz der Rechte zu sein. Freilich sind solche Veröffentlichungen eine Frage des Grades der Öffentlichkeit. Der Archivlink ist nicht "sehr" öffentlich (allerdings wohl öffentlich genug). Wenn wir jedoch im Artikelnamensraum einen Link darauf legen, wird der Text plötzlich sehr öffentlich. Und zwar auch dann, wenn die Seite längst gelöscht ist. Ich finde es durchaus sehr entscheidend für dieses Meinungsbild, ob wir eine solche Praxis verantworten können und wollen, insbesondere ohne menschliche Kontrolle.--Mautpreller (Diskussion) 16:12, 15. Aug. 2017 (CEST)
Ab wann wird ein Text eigentlich "sehr" öffentlich? Ich habe zahlreiche Artikel im Blickfeld mit Abrufzahlen ≪1/Tag; davon haben wir sogar ziemlich viele, und gerade dort fehlt es oft an Wartung. Für die Sichtbarkeit eines Archivlinks spielen solche Artikel wohl keine Rolle. —MisterSynergy (Diskussion) 17:18, 15. Aug. 2017 (CEST)
Ich glaube nicht, dass es dafür eine feste Grenze gibt. Es kann sein, dass das in bestimmten Gebieten kaum eine Rolle spielt. Bei Biografien z.B. ist allerdings von einer sehr hohen Sichtbarkeit auszugehen, weil jeder, der etwas über eine Person wissen will, in Google nachguckt und zu Wikipedia geleitet wird.--Mautpreller (Diskussion) 19:28, 15. Aug. 2017 (CEST)

Da die Veröffentlichung für den deutschen Sprachraum bestimmt ist, muss sie die rechtlichen Regelungen dieses Sprachraums beachten - nicht dass ich das schlecht finde, aber mich würde interessieren, wo das festgelegt ist oder wer das entschieden hat. --dealerofsalvation 18:16, 15. Aug. 2017 (CEST)

@dealerofsalvation: Siehe etwa Wikipedia:WikiProjekt Urheberrecht/Almanach, Ziffer 0. Genaueres können sicherlich unsere Urheberrechtler mitteilen. Ein ziemlich zufällig ausgewählter Beleg: http://blog-it-recht.de/2010/04/06/bgh-zustandigkeit-deutscher-gerichte-bei-klage-gegen-internetveroffentlichung-einer-international-tatigen-zeitung/. Natürlich heißt "klagen können" nicht "recht kriegen".--Mautpreller (Diskussion) 19:26, 15. Aug. 2017 (CEST)

Um das nochmals klazustellen: Das ist kein grundsätzliches Plädoyer gegen Archivlinks. Der weitaus größte Teil von ihnen wird zumindest unschädlich, manchmal auch nützlich sein. Ich bin etwas skeptisch bezüglich des Nutzens in den Themengebieten, in denen ich arbeite (dort kenne ich kaum Beispiele), aber das heißt nicht, dass sie anderswo nicht sehr nützlich sein könnten.

Bloß: Es gibt (vermutlich wenige) Fälle, in denen wirklich großer Schaden eintreten kann. Ich plädiere deshalb dafür, Archivlinks immer nur nach Abwägung zu setzen. Natürlich kann auch die Abwägung schiefgehen, aber so besteht wenigstens die Chance, diesen Schaden abzuwenden. Automatisches Einsetzen von Archivlinks im Artikelnamensraum erscheint mir angesichts dessen unverantwortlich.--Mautpreller (Diskussion) 19:58, 15. Aug. 2017 (CEST)

Ich finde die Argumentation nicht stichhaltig. Zunächst wirdvermutet, dass all diese über 20 Archivdienste gegen DACH-Recht verstoßen. Ein Indiz dafür- etwa ein Urteil aus diesem Rechtsraum - wird nicht erbracht. Aus dieser Vermutung wird abgeleitet, dass auch die Verlinkung auf die Archive gegen DACH-Recht verstoße (auch hier beleglos). Die Schlussfolgerung ist, dass irgendwer (wrr?) nun ein Rechtsrisiko eingehe, indem auf Archive verlinkt werde. Wikipedia-Tradition ist genau dss Gegenteil: Wenn es Unsicherheit bezgl. der Rechtslage gubt, wir aber eigentlich sicher sind, dass wir korrekt handeln, lassen wir das einen Bot machen (Beispiel Flickr-Importe und Lizenz bestätigung). Die Argumentation müsstealso zum Pro. --Martina Disk. 20:23, 15. Aug. 2017 (CEST)

Martina, nein, da stimme ich nicht zu. Wir wollen uns rechtstreu verhalten (hoffe ich doch wenigstens). Zum Beispiel einen Zeitungsartikel, der mal für zwei Wochen legal online war, zu kopieren und dauerhaft und prominent über Jahre zugänglich zu machen, ist nicht rechtstreu. Es ist eine klare Urheberrechtsverletzung. In der Wikipedia selbst würde das niemals geduldet. Es ist nicht unsere Sache zu sagen, das sollen die Archive nicht machen. Es ist aber sehr wohl unsere Sache zu entscheiden und zu verantworten, diese Urheberrechtsverletzung dauerhaft und prominent zugänglich zu machen. Ich kann mir viele Fälle vorstellen, wo das sowohl juristisch als auch moralisch nicht sonderlich heikel ist. Es gibt aber definitiv Fälle, in denen wir damit in Teufels Küche kommen können. Nur zwei Beispiele: Es gibt Rechteverwalter (Kästner, Adorno etc.), die sehr rigide gegen alle urheberrechtlich unsauberen Publikationen im Netz vorgehen. Das Zeug stand mal kurz im Netz und musste dann (übrigens zu Recht) wieder runtergenommen werden. Wollen wir wirklich per automatisierten Prozess solche URV dauerhaft bewahren? Damit würde sich die Wikipedia-Community als ganze (!) juristisch schuldig machen. Und: Kurz nach einer Verurteilung gibt es viele sehr detaillierte Berichte mit voller Namensnennung in der Presse. Zu diesem Zeitpunkt legal. Zehn oder fünfzehn Jahre später sind diese Berichte nicht mehr legal, sondern verletzen die Persönlichkeitsrechte der Betroffenen (Recht auf Resozialisierung). Wollen wir wirklich per automatisierten Prozess solche Persönlichkeitsrechtsverletzungen schaffen? Nein, solche Entscheidungen müssen von Menschen getroffen und verantwortet werden. Die Entscheidung kann unterschiedlich ausfallen. Einem Bot aber kann man sie nicht anvertrauen.--Mautpreller (Diskussion) 21:37, 15. Aug. 2017 (CEST)
Im Übrigen richtet sich die Argumentation keineswegs nur auf "Rechtsrisiken". Die Frage ist doch auch, was wir wollen. Wollen wir Urheber- und Persönlichkeitsrechtsverletzungen per Bot Vorschub leisten oder wollen wir das nicht tun? Mein Standpunkt ist hier klar: Nein, wir handeln eben weder moralisch noch juristisch korrekt, wenn wir das tun.--Mautpreller (Diskussion) 21:50, 15. Aug. 2017 (CEST)
Was die Persönlichkeitsrechte angeht: Wenn da eine Verletzung besteht, dann ja schon im Wikipedia-Artikel, dessen Inhalte durch den (Archiv-)Link "nur" belegt werden. Wenn man zum Schluss kommt, dass im Einzelfall aus Resozialisierungsgründen bestimmte Ereignisse in der Vergangenheit einer Person nicht mehr in der Wikipedia Erwähnung finden sollen, ist also schon am Artikeltext anzusetzen - und dann fällt eh auch der Beleg komplett weg, mit oder ohne Archivlink. Aber im Prinzip drehen wir uns im Kreis, das hatten wir ja schon am 24. Juli. Gestumblindi 22:36, 15. Aug. 2017 (CEST)
In der Tat. Es würde im Wikipedia-Artikel aber ziemlich sicher nicht stehen, wenn der Link nicht da wäre. Im Übrigen kann der Text des Wikipedia-Artikels in Ordnung sein, ohne dass eine erneute Veröffentlichung des archivierten Texts in Ordnung wäre. Ich verstehe offen gesagt diesen in meinen Augen fahrlässigen Umgang nicht. Man nimmt so sehenden Auges in Kauf, dass in der längst nicht mehr vernünftig wartbaren Artikelmasse der de-wp juristisch und moralisch hochproblematische Konservierungen von Links automatisch vorgenommen werden. Natürlich kann man das manuell korrigieren, aber wer soll das schaffen? Die werden so stehen bleiben, bis es irgendwann schrecklich knallt.--Mautpreller (Diskussion) 22:53, 15. Aug. 2017 (CEST)
@Mautpreller: "Es würde im Wikipedia-Artikel aber ziemlich sicher nicht stehen, wenn der Link nicht da wäre": Nicht unbedingt, man kann auch eine gedruckte Zeitung oder Zeitschrift als Beleg angeben. Das ist dann ein Beleg "für die Ewigkeit", mit dem Nachteil, dass er relativ aufwendig zu überprüfen ist. - "Im Übrigen kann der Text des Wikipedia-Artikels in Ordnung sein, ohne dass eine erneute Veröffentlichung des archivierten Texts in Ordnung wäre": Das wird jetzt relativ theoretisch. Kennst du einen realen Fall, und sei es nur ein einziger, der in diese Richtung geht? Übrigens habe ich deinen Wunsch "Mich würden mal Beispiele interessieren, bei denen ein Archivlink nützlich und angebracht ist" an anderer Stelle dieser Diskussionsseite gesehen und will noch darauf eingehen, hatte an eine kleine Tabelle mit Beispielen verschiedener Arten nützlicher Archivlinks gedacht. Gestumblindi 23:24, 15. Aug. 2017 (CEST)
Ich kenn solche Fälle, will sie aber aus gutem Grund nicht hier breittreten. Deshalb allgemeiner: Ein Beleg aus einer gedruckten Zeitung kann natürlich problematisch für das Persönlichkeitsrecht sein. Es kommt allerdings darauf an, wofür er benutzt wird, er kann auch für unproblematische Dinge verwendet werden (d.h. das Problematische wird einfach nicht übernommen). Der Unterschied ist: Wenn wir den gedruckten Text als Beleg nutzen, veröffentlichen wir ihn nicht, während ein Link einer Veröffentlichung sehr nahe kommt, dann machen wir seinen Inhalt vollständig für eine große Öffentlichkeit sehr leicht zugänglich. Genau darum sind doch solche Links so beliebt. In die Bibliothek zu gehen ist viel aufwändiger, als ein Onlinedokument zu verlinken. Manchmal ist es sehr gut, dass man diesen Aufwand verlangt (manchmal auch nicht). Daher soll es eben nicht automatisiert geschehen.--Mautpreller (Diskussion) 10:13, 16. Aug. 2017 (CEST)
PS: Eine Tabelle mit Beispielen nützlicher Archivlinks fände ich sehr gut.--Mautpreller (Diskussion) 10:19, 16. Aug. 2017 (CEST)
Dein Bedenken bezgl. WP:BIO (Resozialisierung wurde doch längst beantwortet: Für den (toten) Link würde ein Opt-out gesetzt. Problem erledigt. Wenn sich die Rechtsprechugn darauf einigt, dass Archivlinks aus urheberrechtlichen Gründen grundsätzlich nicht zulässig sind, dann fliegen alle raus - egal, ob ein Bot oder Mensch sie gesetzt hat. Ich finde, deine Argumentation dreht sich im Kreis. Ich verstehe deine Bedenken durchaus, teilweise teile ich sie auch (wir sollten m.E: keien Archive verwenden, die den Urhebern/Seitenbetreibern kein Opt-out erlauben (wenigstens eine nachträgliche Entfernung). Aber all dies hängt nicht an der Frage, ob wir einem Bot erlauben diese Links zu setzen. --Martina Disk. 02:05, 16. Aug. 2017 (CEST)
Es hängt nicht allein an der Frage, ob wir dem Bot erlauben, diese Links zu setzen, das stimmt. Bloß wenn man schon beklagt, dass die Anpassung toter Links so aufwändig sei, dass man das gar nicht "menschlich" schaffen könne - wie kann man dann annehmen, dass man die unbekannten Fälle prüfen kann, die evtl. urheberrechtlich oder persönlichkeitsrechtlich problematisch sind? Ja, man kann Opt-out setzen oder schlicht den Link löschen, wenn man diese Fälle kennt. Das Problem ist doch, dass ein automatischer Prozess unterschiedslos alle Fälle erfasst, eben gerade ohne Prüfung.--Mautpreller (Diskussion) 10:13, 16. Aug. 2017 (CEST)
[5]. --Mautpreller (Diskussion) 22:09, 15. Aug. 2017 (CEST)
Hi! Interessante Diskussion. Die Frage, ob die Wayback Machine des Internet Archive nach deutschem Urheberrecht legal ist, finde ich sehr spannend. Dabei muss man zunächst beachten, dass das Internet Archive bei weitem nicht die einzige Institution ist, die Websites archiviert – auch Nationalbibliotheken mehrerer europäischer Staaten speichern systematisch und ohne ausdrückliche Einwilligung der betroffenen Betreiber und Rechteinhaber. Mir ist kein Fall bekannt, in dem gegen eine solche Speicherung geklagt wurde. Hoeren hat zumindest Bedenken (MMR 1/2006, V), Bahr geht von der Unzulässigkeit aus (JurPC Web-Dok. 29/2002). Man müsste mal schauen, ob es dazu jüngere Literatur gibt. All das sagt natürlich nichts darüber aus, ob wir verlinken dürfen oder nicht (grundsätzlich dürfen wir). Als letzte Verteidigungslinie könnte ich mir auch hier vorstellen, von einer so genannten schlichten Einwilligung auszugehen, mit welcher der Bundesgerichtshof auch Bildersuchmaschinen rechtfertigt. Hilft das weiter? Gruß, --Gnom (Diskussion) 00:09, 17. Aug. 2017 (CEST)
Ein bisschen. Der Kern der von Dir zitierten Beiträge scheint doch darin zu bestehen, dass eine Speicherung für einen beschränkten Zweck und Kreis dauerhaft bzw. für einen bestimmten Zeitraum unbeschränkt gerechtfertigt sein kann, eine dauerhafte unbeschränkte Veröffentlichung aber tendenziell eher nicht. Verstehe ich das richtig? Wenn es jüngere Literatur dazu gibt, würde mich das sehr interessieren. Das gilt auch für die automatisierte Verlinkung, die die Zugänglichkeit ja noch erhöht.--Mautpreller (Diskussion) 11:29, 17. Aug. 2017 (CEST)
Im Gegensatz zum Internet Archive handhaben die Nationalbibliotheken den Zugang zu den gespeicherten Websites tatsächlich sehr restriktiv. Beispielsweise ist das "Webarchiv Schweiz" der Schweizerischen Nationalbibliothek ausser in der NB selbst nur an einzelnen, besonders abgesicherten Arbeitsplätzen in den Kantonsbibliotheken einsehbar - PCs, die so konfiguriert sind, dass man sich die Sites dort nur anschauen, aber weder ausdrucken noch Inhalte auf einen Datenträger speichern kann... das ist natürlich schon ein ganz anderer Ansatz als das offen zugängliche IA. Gestumblindi 12:50, 17. Aug. 2017 (CEST)
Man kann andere urheberrechtsgeschützte Inhalte ja auch über einen Bibliotheksausweis bekommen (und sogar speichern und ausdrucken), im Rahmen von Lizenzen, etwa bei der Bayerischen Staatsbibliothek. Aber auch da muss man einen Ausweis beantragen, die Texte werden nicht einfach veröffentlicht.--Mautpreller (Diskussion) 12:58, 17. Aug. 2017 (CEST)
Wobei der Grund hierfür wohl eher nicht urheberrechtlicher Art ist, sondern die technischen und finanziellen Ressourcen der Bibliothek schont/fördert. Mit dem Urheberrecht ist es wie mit der Schwangerschaft: ein bisschen gibt es nicht. Entweder etwas ist unzulässig (da hilft auch nicht, den Zugriff ein bisschen zu kontrollieren) oder zulässig. Also dürfen wir entweder massenhaft drauf verlinken oder gar nicht. Du vermischt dies andauernd mit qualitativen Argumenten - deshalb dreht sich die Diskussion zu einem Gutteil im Kreis. --Martina Disk. 20:52, 17. Aug. 2017 (CEST)
Nein, da irrst Du. Der entscheidende Begriff beim Urheberrecht ist die Veröffentlichung. Und Du weißt doch auch ganz gut, dass es verschiedene Lizenzen gibt. Für einmaligen Druck oder dauerhafte Vorhaltung, für wssenschaftliche oder kommerzielle Verwendung usw. Es ist eben nicht so, dass jegliche Veröffentlichung "zulässig oder nicht zulässig" ist, sondern es kommt auf die Art und den Zweck und die Reichweite der Veröffentlichung an.--Mautpreller (Diskussion) 21:27, 17. Aug. 2017 (CEST)
Naja, in Bezug auf die Verlinkung der Wayback Machine in der Wikipedia hat Martina Recht. Entweder wir verbieten es ganz, oder wir erlauben es überall. Gruß, --Gnom (Diskussion) 22:40, 17. Aug. 2017 (CEST)
Das verstehe ich nicht. Wenn ein klar urheberrechtsgeschützter Text im Archiv zugänglich ist, sollten wir ihn nicht mit unseren Mitteln zugänglich machen. Wenn es sich aber nicht um einen urheberrechtlich geschützten Text handelt (davon gibts auch viele im Archiv), dann ist das unproblematisch. Da kann und muss man doch differenzieren.--Mautpreller (Diskussion) 10:03, 18. Aug. 2017 (CEST)
Es kann sein, dass man hier in der Tat differenzieren muss. Aber grundsätzlich ist es eben urheberrechtlich unbeachtlich, ob wir die Wayback Machine hierzuwiki eben nur vereinzelt oder massenhaft verlinken. Gruß, --Gnom (Diskussion) 11:05, 18. Aug. 2017 (CEST)
Du meinst, dass eine automatisierte Verlinkung urheberrechtlich unbedenklich ist? --Mautpreller (Diskussion) 11:39, 18. Aug. 2017 (CEST)
Man könnte das ja auch ganz schlaumeierisch sehen und sagen: bei einer automatisierten Verlinkung ist es schwerer, einen einzelnen Wikipedianer (der den Link zum Archiv manuell gesetzt hätte) haftbar zu machen - "schuld" wäre dann höchstens der Botbetreiber (der im Falle von IABot wohl nicht im deutschsprachigen Raum sitzt) oder die WMF, für die das in den USA sowieso legales fair use ist. Gestumblindi 21:26, 18. Aug. 2017 (CEST)
Ja, genau das meine ich. Die Wikipedianer sollten sich zum Recht des Urhebers bekennen, über die Veröffentlichung seines Werks zu bestimmen. Sie sollten es nicht zu umgehen versuchen.--Mautpreller (Diskussion) 22:29, 18. Aug. 2017 (CEST)
Hm, ich habe mich offenbar immer noch nicht verständlich ausgedrückt. Ich meinte Folgendes: Aktuell verlinken wir die Wayback Machine ja bereits allerorten, und zwar durch "von Hand" eingefügte Links. Urheberrechtlich macht die Umstellung auf eine wie auch immer geartete "automatische" Verlinkung keinen Unterschied. (Man kann sich dann natürlich streiten, wer im Fall einer angenommenen Urheberrechtsverletzung der Täter ist, darauf kommt es mir aber nicht an.) Ich möchte nur sagen, dass urheberrechtlich grundsätzlich kein Unterschied zwischen einer vereinzelten Verlinkung von Hand und einer massenhaften Verlinkung durch einen Bot liegt. Wir hätten dann halt nur, wenn man die Wayback Machine als urheberrechtswidrig ansieht, mehr Links auf Rechtsverstöße als vorher. (Wobei "Links auf Rechtsverstöße" auch noch etwas anderes ist als "Rechtsverstöße".) Gruß, --Gnom (Diskussion) 01:05, 19. Aug. 2017 (CEST)
Ich möchte fürs Protokoll nochmal festhalten, dass die Archivierung ist in den USA kein Rechtsverstoß, sondern als Fair Use legitimiert ist. --Martina Disk. 15:50, 19. Aug. 2017 (CEST)
In den USA zweifellos. Die Archivdateien sind aber auch für den deutschen Sprachraum bestimmt und werden dort abgerufen.--Mautpreller (Diskussion) 15:57, 19. Aug. 2017 (CEST)
Wir drehen uns im Kreis. Du sagst die Archivierung mag zwar in den USA zulässig sein, nach DACH-Recht ist sie aber unzulässig; deshalb ist die Verlinkung im DACH-Rechtsraum unzulässig. Ich sage: Die Verlinkung auf eine zulässige Archivierung ist zulässig. Gnom sagt: Selbst wenn die Archivierung in den USA nach DACH-Recht nicht zulässig wäre, ist es fraglich, ob dadurch auch die Verlinkung unzulässig wäre. Und außerdem sage ich (und ich verstehe Gnom ebenfalls so): Wenn irgendwann die DACH-Rechtsprechung eine Verlinkung im DACH-Rechtsraum tatsächlich für nicht zulässig erklären sollte, dann entfernen wir alle diese Links (außer solche auf ungeschützte Inhalte). Wikipediaweit. Irgendwann. Vielleicht. Qualität des verlinkten Inhalts hin oder her. Wahrscheinlich würden wir das einen Bot machen lassen.
Für das vorliegende Meinungsbild hat diese Frage praktisch keine Bedeutung. --Martina Disk. 17:01, 19. Aug. 2017 (CEST)

Nummerchaos[Quelltext bearbeiten]

Das Nummernchaos ist aktuell mit voller Absicht. Damit die Diskussion nicht all zu fest gestört wird. Ich möchte am Schluss die verscheiden Abstimmoptionen so ordnen, dass sie von der Einschränkungennher einigermassen logisch geordnet sind. Mir schwebt hier vor, dass je mehr Freiheiten der Bot bekommt, desto weiter unten ist dierer Vorschlag. Damit es den Abstimmen eben leichter fällt abzustimmen, dass wenn er zur Endscheidung kommt „Diese Vorschlag geht es mir zu weit“, die darunter eben auch ablehnen kann. Oder eben, dass wenn er sein Wunschversion gefunden hat, denen darüber auch zustimmen kann. Ich werde also 2a und 2b sicher untereinander austauschen zuerst In dann Out.--Bobo11 (Diskussion) 10:36, 21. Jul. 2017 (CEST)

Bobo11: Meiner Meinung nach haben wir noch gar nicht genug technische Informationen, um konkrete Vorschläge für die Abstimmoptionen zu formulieren. Und dann fände ich es außerdem sinnvoller, wenn sich die Initatoren und Unterstützer des Meinungsbildes erst einmal hier auf dieser Seite auf Abstimmoptionen einigen. Ich verstehe deinen umsetigen Vorstoß, denn es ist oft einfach anhand konkreter Textvorschläge zu diskuteiren. Aber ich finde das noch etwas verfrüht. --Martina Disk. 23:00, 22. Jul. 2017 (CEST)

Monokultur[Quelltext bearbeiten]

Was mich daran besonders bestürzt, ist die Monokultur, die entsteht. Man bewegt sich im Ernstfall nur noch in Wikipedia und Internet-Archiv, sozusagen in einer Parallelwelt. Dabei sind doch gerade die unabhängigen Veröffentlichungen das entscheidende Korrektiv. Ich finde es nicht tragisch, wenn eine Angabe mal unbelegt bleibt; viel schlimmer ist es, wenn die Leser nur noch in dieser Surrogatwelt navigieren. Die vereinnahmende Tendenz, die bereits die Wikipedia hat und die sich mit Wikidata ausgedehnt hat, würde damit noch einen weiteren Anbieter erfassen. Da sind mir unvollkommene Artikel mit toten Links noch zehnmal lieber als diese Monokultur, die peu à peu die Zuverlässigkeit der Angaben untergräbt.--Mautpreller (Diskussion) 12:57, 21. Jul. 2017 (CEST)

Nur dass diese Parallelwelt die wirkliche Welt abbildet. Ich wüsste nicht wieso die Existenz von IA irgendwelche unabhängigen Veröffentlichungen in Frage stellt. In der Tat finde ich unbelegte Angaben schlimmer als einen Beleg, der auf IA zeigt, vor allem dann, wenn ein Artikel dutzende von Belegen angibt auf Webseiten, die nicht mehr exisitieren. Das suggeriert einen Beleg, der nicht mehr existiert und du kannst es nicht sehen, bis du mal auf einen der Links klickst. Tote und nicht mehr überprüfbare Links untergraben also nach deiner Ansicht nach nicht die Zuverlässigkeit von Angaben. Sollten wir also einen Bot laufen lassen, der alle Links vom Internetarchiv auf Error 401 umleitet um die Zuverlässigkeit des Artikels zu erhöhen?--Giftzwerg 88 (Diskussion) 13:29, 22. Jul. 2017 (CEST)
Typisch ist zum Beispiel: Eine Wikipedia macht eine Angabe. Die wird von Wikidata übernommen und in alle möglichen Netzwerke eingespeist. Sie wird auch gleich per Übersetzungstool in alle möglichen anderen Wikipedien eingebaut, meist ohne echte Prüfung. Beleg war irgendeine Website, die wird nun per Internet Archive dauerhaft angezeigt, wenn sie "broken" ist. - Aber: Die vorhandene Literatur sowie die zahlreichen anderen, unabhängigen Datensammlungen sind sich keineswegs einig. Vielleicht ist die Angabe sogar falsch. Möglicherweise ist entweder eine richtige Angabe verfügbar oder man muss festhalten, dass die Angabe unsicher ist. Möglicherweise ist sie auch längst korrigiert, evtl. sogar innerhalb derselben Publikation. - Die leicht erreichbare, automatisch erzeugte Angabe aus dem Wikipedia-Wikidata-InternetArchive-Netzwerk wird nunmehr von allen möglichen neuen Publikationen wiederum übernommen, es ergibt sich ein Selbstbestätigungszirkel. Eine (gar professionelle quellenkritische) Prüfung außerhalb dieses Netzwerks findet nicht mehr statt. Eine neue, in sich schlüssige Realität wird an die Stelle der alten gesetzt, die Unklarheiten, Widersprüche und "loose ends" noch nicht zugedeckt hatte. Willst Du Beispiele? Kannst Du haben. - Wir sollten keinen Bot laufen lassen, sondern vielmehr Mut zur Lücke haben. Die präziseste Angabe ist oft: weiß man nicht genau. Broken links machen das gar nicht übel deutlich. Ich denke, dass es nur in seltenen Einzelfällen sinnvoll ist, diese Momentaufnahmen zu verewigen.--Mautpreller (Diskussion) 13:49, 22. Jul. 2017 (CEST)

Check[Quelltext bearbeiten]

Werfen wir doch mal einen Blick auf Ellon Castle. Da sind, durch Versionsimport aus en, Edits des InternetArchiveBot enthalten. Angeblich wurden vier Quellen "gerettet". Drei davon sind aktuell erreichbar und mussten folglich überhaupt nicht gerettet werden. --Mautpreller (Diskussion) 15:32, 21. Jul. 2017 (CEST)

Die vierte Quelle würdest du also unbesehen opfern. Und woher weißt du, ob die jetztige Internetquelle das selbe zeigt wie zur Zeit als der Artikel verfasst wurde? Das ist wie wenn man mit dem Boot auf den See fährt, den Schatz versenkt und eine Kerbe am Boot macht um zu wissen, an welcher Stelle die Kiste zu suchen ist. Das IA ermöglicht eine Navigation nach Webseite und nach Zeit, ein Service der nicht von jeder Webseite angeboten wird. Tausende von seriösen Newsseiten werden verlinkt, der Link bleibt gleich, aber fast jeden Tag ändert sich die Seite und es wird wirklich schwer herauszufinden, was vor einem Jahr an einem bestimmten Datum dort stand. Eine Tote Quelle ist so viel wert wie keine Quelle, schlimmer noch, sie gaukelt einen Beleg vor, der nicht existiert und führt somit den Leser hinters Licht.--Giftzwerg 88 (Diskussion) 13:44, 22. Jul. 2017 (CEST)
Die vierte Quelle würde ich korrekt formatieren, sie ist nämlich im Prinzip erreichbar. Es ging mir hier aber vor allem darum, die Behauptungen über die Zuverlässigkeit des InternetArchiveBot (insbesondere Vermeidung von false positives) in Zweifel zu ziehen.--Mautpreller (Diskussion) 13:51, 22. Jul. 2017 (CEST)
Übrigens auch in diesem Fall: Die Einträge auf Historic Scotland sind teilweise aufgesplittet und umgebaut worden. Wieviel Sinn hat es, eine Permanentkopie eines vorübergehenden Zustands der Datenbank zu verewigen und zudem zu begünstigen gegenüber dem aktuellen Stand? Das müsste ein Mensch entscheiden. Ganz sicher kein Bot.--Mautpreller (Diskussion) 14:07, 22. Jul. 2017 (CEST)
Du must dazu überhaupt in der Lage sein den Unterschied zwischen aktuellem und vergangenem Stand zu erkennen, denn sonst hast du keine Möglichkeit das zu entscheiden. Dein Argument ist, dass es besser ist, wenn die Bearbeiter nichts über die Vergangheit der Webseite erfahren und nicht wissen, was der anfängliche Bearbeiter dort gesehen hat.--Giftzwerg 88 (Diskussion) 16:28, 22. Jul. 2017 (CEST)
Mit dem selben Argument sollten wir ältere Auflagen eines Werks aus den Bibliotheken entfernen und nur die neueste beibehalten. Alsdann erschaffen wir eine Lücke in der Überprfübarkeit von Literaturangaben auf die älteren Auflagen. Da aber es dann nicht mehr überprüfbar ist, sollten wir den Mut zur Lücke haben und auch die alte Literaturangabe entfernen. Lieber unbequellte Aussagen, als eine alte Version des Werks benutzen.--Giftzwerg 88 (Diskussion) 16:35, 22. Jul. 2017 (CEST)
Natürlich bin ich da ganz anderer Ansicht. Die alten Auflagen eines Buchs sind als "fertige" Veröffentlichungen unverzichtbar, die alten Zugänge zu einer Datenbank hingegen stellen lediglich einen zufälligen Stand dar, der zu keinem Zeitpunkt als "Auflage" intendiert war. Der Punkt ist auch nicht, dass es nicht interessant sein könnte, einen alten Stand zu kennen; der Punkt ist, dass es sich um einen zufälligen Ausschnitt handelt, der zudem im Artikel privilegiert wird, allein deshalb, weil ein Wikipedia-Autor zu einem bestimmten Zeitpunkt einen Abruf getätigt hat. Der steht dann im Artikel (!), nicht der heutige Stand und oft genug nicht mal der Verweis auf die Quelle. Wir sind dann verantwortlich dafür, einer breiten Öffentlichkeit eine Version zur Verfügung zu stellen, die womöglich schnellstens wieder vom Netz genommen worden ist. Und das automatisiert, d.h. in quantitativen Dimensionen, die wir schon rein arbeitsmäßig nicht prüfen und damit auch nicht verantworten können. Es ist natürlich auch nicht so gedacht: Die Vorstellung ist, dass man sich die Prüfung sparen kann, weil der Bot den Beleg ja konserviert. Wie vernünftig ist es dagegen, unvollkommen belegte Artikel einfach stehen zu lassen und damit gerade die Unvollkommenheit der Überlieferungssituation einzuräumen und herauszustellen - außer man hat tatsächlich eine bessere Quelle gefunden (was ja auch nur in einem kleinen Teil des Artikelbestands zu bewältigen ist).--Mautpreller (Diskussion) 17:00, 22. Jul. 2017 (CEST)
Mal ganz einfach ausgedrückt: Ich meine, dass sich in solchen Vorhaben ein grenzenloser technologischer Optimismus abbildet. Dieser ist meiner Ansicht nicht nur ganz ungerechtfertigt, er hat auch erhebliche destruktive Folgen. Er wirkt sich zerstörerisch auf die in einem langen Prozess entwickelten Techniken, Medien und Fähigkeiten der Repräsentation von Inhalten aus, ohne dafür neue zu entwickeln. Das Projekt Wikipedia war doch von Beginn an auch ein "Ermächtigungsprojekt", das die menschliche Souveränität zum Umgang mit Information erweitert hat (Demokratisierung, wenigstens der Möglichkeit nach Aufhebung der Trennung zwischen Leser und Schreiber, Unabhängigkeit von Gatekeepermechanismen usw.). Dazu ist technische Unterstützung gewiss wichtig, bloß ist dies das Gegenteil: eine erneute Ent-Mächtigung des menschlichen Akteurs zugunsten automatischer Abläufe.--Mautpreller (Diskussion) 17:34, 22. Jul. 2017 (CEST)
Ok ich kann deinen genzenlosen technologischen Pessimismus nicht teilen. Computer und das Internet wurde wohl nicht für dich erfunden. Du solltest besser für alles was du wissen willst direkt in die Bibliothek fahren und besser nicht das Internet benutzen, das dich dermaßen entmächtigt. Wenn du irgendwas wichtiges zu sagen hast, schreibe besser mit Tinte auf Papier als auf eine Webseite, denn da kann man es auch in Jahren noch nachlesen. Sollten wir das Internetarchiv nicht gleich noch auf die Blacklist setzen, wenn es doch so zerstörerisch ist? Immerhin wird ja dort ein veralteter Stand des Wissens bewahrt. Ich frage mich warum eigentlich Wikiartikel noch die Versionsgeschichte haben, doch nicht etwa um herauszufinden was der veraltete Stand des Artikels war? Wir sollten also jeden Artikel in seinem jetzigen Zustand als unumstößliches Faktum akzeptieren und zuverlässig verhindern, dass irgendjemand Zugriff auf alte Quellen haben kann, die bei der Verfassung des Artikels noch verfügbar waren und es begrüßen, wenn die alte Webseite nicht mehr existiert und keiner mehr weiß was dort zu sehen war. Lieber tausendmal einen Leser in die Wüste schicken. Ich weiß auch nicht, welchen inneren Wert es hat unvollkommene Artikel in ihrer Unvollkommenheit herauszustellen und in dieser Form zu akzeptieren anstatt eine Version zu zeigen, die gut und richtig belegt war und zur Zeit ihrer Entstehung in diesem Sinne vollkommen. Es ist wie wenn du bei der alten Auflage eines Werks die Fußnoten rausreißen würdest und nur noch die Zahlen im Text verbleiben. Ich verstehe nicht, was dieser Bot angeblich zerstört, was nicht alleine schon dadurch zerstört ist, das die Webseite in ihrer ursprünglichen Form nicht mehr sichtbar ist.--Giftzwerg 88 (Diskussion) 18:09, 22. Jul. 2017 (CEST)
Willst dus nicht verstehen? Die Versionsgeschichte bietet mir doch nicht privilegiert eine alte Version an, sondern alle. Das geht natürlich nur unter besonderen Umständen, eben in einem Wiki. Der Bot bietet genau eine zufällige Version, ausschließlich durch einen ebenso zufälligen Zugriff ausgewählt und in keiner Weise qualifiziert. Er leitet überhaupt nicht mehr hin zum Fundort (den es möglicherweise auch gar nicht mehr gibt), geschweige denn zur eigentlichen Quelle der Information. Er leitet nur noch ins Internet Archive, daas wiederum die Seite aufgenommen hat, weil in einer Wikipedia ein Linkk auf diese gesetzt wurde. Siehst Du den Zirkel wirklich nicht?--Mautpreller (Diskussion) 18:24, 22. Jul. 2017 (CEST)
Das ist nicht korrekt. Wenn der Archivlink wie gewohnt mit den üblichen Vorlagen gesetzt wird, sind sowohl der (möglicherweise tote) Originallink, der Archivlink, das Archivierungsdatum und überhaupt die Archiveigenschaft des Links deutlich für jeden erkennbar. Da wird nichts verschleiert oder unzugänglich gemacht. —MisterSynergy (Diskussion) 18:29, 22. Jul. 2017 (CEST)
Dann sehen wir uns doch mal Ellon Castle an. Einzelnachweis 9:
Edward Charles Shaw: The Kennedys — An Unusual Western Family. Manitoba Historical Society. Archiviert vom Original am 20. September 2015. Abgerufen am 6. Juli 2017.
Da steht ein Autor und ein Titel, der Titel ist verlinkt mit einer Seite, die eine Fehlermeldung ergibt ("The requested URL was rejected"). An dieser Stelle steht nichts von einem Archivlink. Das kommt erst hinterher, nämlich nach dem Punkt. Die Fehlermeldungsseite wurde also "archiviert von einem Original". Die Webadresse des "Originals" hingegen ergibt keine Fehlermeldung, sondern eine Web-Repräsentation eines Artikels, der ursprünglich in den Transactions der Manitoba Historical Society (Serie 3, Nr. 29, 1972/73) erschienen ist.
Tolle Leistung. Der "ursprüngliche" Link funktioniert völlig problemlos, er wird aber erst im zweiten Satz angegeben (nach "Archiviert vom Original"). Im ersten Satz und damit privilegiert erscheint eine Fehlermeldung. Wäre der Bot überhaupt nicht eingesetzt worden, wäre der Text an dieser Stelle bedeutend besser. Es geht hier übrigens auch nicht um eine Momentaufnahme, dieser Text ist so (!) vor 45 Jahren gedruckt worden. Zusätzlich zum Internetlink wäre hier vielmehr die Angabe des ursprünglichen Druckorts erwünscht. Das kann man (nur!) ohne jeglichen Boteinsatz per Hand machen.--Mautpreller (Diskussion) 18:47, 22. Jul. 2017 (CEST)
Wir können uns gern noch die anderen drei Stellen anschauen, die alle ihre eigenen Macken haben.--Mautpreller (Diskussion) 18:47, 22. Jul. 2017 (CEST)
Die ursprüngliche Seite bleibt im Archivlink erhalten und wird auch dort eindeutig angezeigt. Der Bot veranlaßt das IA jedesmal wenn ein Link gesetzt wird, diese Seite zu archivieren. Wenn also auf eine Seite mehrfach verlinkt wird, sagen wir mal weil mehrfach zu unterschiedlichen Zeiten oder von unterschiedlichen Artikeln auf die Seite verwiesen wird, so wird es automatisch mehrfache Archivierungen geben. Diese Version ist also keineswegs zufällig, sondern genau die Version, die beim Erstellen des ursprünglichen Links vorhanden war. Der Bot leitet auf die Archivseite auch nur in dem Fall wenn die ursprüngliche Seite nicht mehr da ist. Es gibt also die Quelle nicht mehr, qua Definition. Ich denke der Artikelersteller wollte, als er den Link setzte, auf eine Information verweisen. Der Bot macht nichts anderes, als dass er diese Information für die Zukunft verfügbar macht. Möglicherweise gibt es die Information immer noch, aber auf einer anderen Seite. Ich weiß das nicht, der Bot weiß es nicht, der Leser weiß das nicht, aber der Link zeigt einen Fehler. Wenn ich nun hingehe ins Internetarchiv, so werde ich feststellen, dass es dort eine ganze Menge von Versionen gibt, keineswegs nur eine. Wenn es aber um den Beleg einer Information geht, sind alle anderen Versionen im besten Fall identisch, im zweifelsfall aber auch vollkommen anders, somit für meinen Zweck unbrauchbar. Es nutzt also gar nichts, wenn ein Link auf eine Seite gesetzt ist und keiner weiß, ob das das ist, was der Artikelersteller seinerzeit gesehen hat. Ich verstehe immer noch nicht, was der zukünftige Nutzen von einem Link ist auf einen Fundort, der entweder was anderes anzeigt, als der Artikelersteller gesehen hat, oder der eine Fehlermeldung anzeigt. Du meinst immer eine neuere Version dieser Information an welcher Stelle auch immer sei automatisch besser, das ist aber nicht immer so. Manchmal gehts ja um ein wörtliches Zitat und wie soll ich eigentlich herausfinden, dass der Artikel auf einer veralteten Quelle basiert, wenn ich die alte Quelle nicht kenne und auch nicht den möglichen Unterschied zu einer neuen Quelle? Nach deiner Ansicht sind ja unbequellte Informationen völlig OK. Richtig ist, dass uns der Bot nicht davor bewahrt, dass Artikelinhalte veralten. Ein Link auf Bildzeitung, Seite eins ist nur dann eine brauchbare Information, wenn ich nicht die aktuelle Seite eins sehen kann, sondern die, die beim Erstellen aktuell war. Die Arbeit immer wieder nach dem neuesten Stand zu suchen, wird uns der Bot nicht abnehmen, aber er kann uns dabei helfen, wenn wir wissen, was damals auf Seite eins zu lesen war.--Giftzwerg 88 (Diskussion) 18:58, 22. Jul. 2017 (CEST)
Es gibt übrigens 17 Versionen der Seite auf dem Internetarchiv zu finden, die durchaus Unterschiede haben: https://web.archive.org/web/*/http://www.mhs.mb.ca/docs/transactions/3/kennedys.shtml--Giftzwerg 88 (Diskussion) 19:07, 22. Jul. 2017 (CEST)
Es handelt sich um einen Text, der im Jg. 1972/73 der MHS-Transactions im Druck erschienen ist. Der Text hat sich nicht verändert, allenfalls die Präsentationsform. Vielleicht war er kurz mal down, wahrscheinlicher ist wohl, dass der Bot nicht erkannt hat, dass der Link problemlos funktioniert. Weshalb ich ja auch vermute, dass die angeblich so niedrige Fehlerkennungsrate geschwindelt ist.--Mautpreller (Diskussion) 19:17, 22. Jul. 2017 (CEST)

Dein Link geht auf WebCite, nicht auf das Internetarchiv. Das sind zwei paar Stiefel und ich glaube nicht, dass dieser Link von einem Bot gesetzt wurde. Und natürlich wird das Internet Archiv eine Fehlermeldung archivieren, wenn zur Zeit der Archivierung die Seite down ist. Das ist aber für gewöhnlich ein anderer Zeitpunkt, als der, zu der dieser Link in den Artikel eingepflegt wird.--Giftzwerg 88 (Diskussion) 19:26, 22. Jul. 2017 (CEST)

Das ist nicht "mein Link", sondern der im Artikel. Ich würde einen solchen Link selbstverständlich nicht setzen. Es stimmt, soweit ich das in dem intransparenten Vorlagengestrüpp erkennen kann, dass er ursprünglich von dem en:user:Sagaciousphil gesetzt wurde, der InternetArchivebot hat ihn aber mehefach neu formatiert.--Mautpreller (Diskussion) 19:34, 22. Jul. 2017 (CEST)

Wie gesagt hat das Internetarchiv 17 Versionen aus einem Zeitraum von über 10 Jahren, die korrekte und lesbare Versionen dieser Seite sind.--Giftzwerg 88 (Diskussion) 19:39, 22. Jul. 2017 (CEST)

Die wären gar nicht nötig, denn der Text ist on und die Webrepräsentation eines gedruckten Texts.--Mautpreller (Diskussion) 19:41, 22. Jul. 2017 (CEST)

Oder: Hab mir mal die (zufällig) letzte Veränderung des Bots in en angeguckt, en:Bobby Nichols. Nu, dass es die Seite (in diesem Fall) tatsächlich nicht mehr gibt, hat schon so seinen Grund, die Werte haben sich nämlich verändert. Es gibt diese Scorecard nämlich wieder, hier: https://louisvilleky.gov/sites/default/files/parks/golf/bobby_nichols_score_card_web.jpg, freilich mit anderen Werten als die Archivversion. Komischerweise stimmt der Artikel aber mit der neuen und nicht mit der Archivversion überein, d.h. durch die automatische Einsetzung der Archivversion entsteht ein Widerspruch zwischen dem Beleg und dem Text (sowie dem zweiten Beleg, der noch vorhanden ist). Was hat der Bot hier Nützliches getan? Nichts, sondern ausschließlich Verwirrung gestiftet. Wäre gar nichts getan worden, wäre alles in Ordnung, widerspruchsfrei und belegt. Es gäbe zwar einen toten Link, aber da noch ein gültiger Beleg da ist, wäre das nicht schlimm. Noch besser wäre es natürlich gewesen, den aktuellen Link zu suchen. So haben wir die schlechteste aller Varianten: eine Inkonsistenz, die ausschließlich durch den Bot erzeugt wurde, die er aber (natürlich) nicht bemerken konnte.--Mautpreller (Diskussion) 20:43, 22. Jul. 2017 (CEST)

Nächste Stichprobe, wieder die zufällig letzte: en:Bobrinsky. Der Weblink http://bogoroditsk.amr-museum.ru/ funktioniert, was dem Bot offenbar nicht aufgefallen ist. Die Ersetzung durch den Archiv-Link https://web.archive.org/web/20051122102336/http://bogoroditsk.amr-museum.ru/ ist daher unsinnig. Vielleicht kann man noch mehr Zufallsstichproben machen, die ersten beiden sind nicht günstig ausgefallen.--Mautpreller (Diskussion) 21:28, 22. Jul. 2017 (CEST)

Mautpreller: Auch der GiftBot macht Fehler. Ich persönlich neige daher insgesamt zu einer Anbringung eines Archivlinks zusätzlich zum toten Link. Ich würde keinem Bot das Ersetzen erlauben wollen, sondern ein Mensch sollte beide Links (live, Archiv) prüfen und am Ende eine qualitative Entscheidung treffen. Das kann kein Bot, weder der IABot noch der GiftBot. Interessant wäre ein Vergleich der beiden Bots in Hinblick auf (potenziellen) Leistungsumfang, Features, Performance, Zuverlässigkeit. --Martina Disk. 23:41, 22. Jul. 2017 (CEST)

Ja, das wäre sicher interessant, wird allerdings nichts an meiner festen Überzeugung ändern, dass keiner der Bots im ANR agieren darf. Für die Talk Page wäre es aber durchaus interessant, welches Programm "besser" ist.--Mautpreller (Diskussion) 00:26, 23. Jul. 2017 (CEST)
Ich versuche nicht, deine (oder irgendwessen) Überzeugung zu ändern. Ich versuche Informationen über die technischen Möglichkeiten (beider Bots) zu bekommen und Argumente zu verstehen und umseitig zusammenzufassen. Und natürlich: mir eine eigene Meinung zu bilden. :-) --Martina Disk. 01:55, 23. Jul. 2017 (CEST)

GiftBot[Quelltext bearbeiten]

Benutzer:Giftpflanze, Benutzer:Doc Taxon, all: Angesichts des Abarbeitungsstaus neige ich zu einem zusätzlichen Archivlink im Artikel, würde aber gerne auch andere Archivdienste sehen (eben keine "#Monokultur"). Der GiftBot ist etabliert, akzeptiert, anbieterunabhängig. Ihr seid - soweit ich weiß - unabhängig, transparent, mit den lokalen Gegebenheiten vertraut. Möglicherweise könnte der GiftBot vieles umsetzen, was der IABot kann? Könnt ihr bitte ein paar Vergleichsinfos geben zu den Funktionaliäten und optionen? Was davon wäre mit dem GiftBot relativ leicht umsetzbar? Habt ihr Zahlen zur Zuverlässigkeit/Performance? --Martina Disk. 01:57, 23. Jul. 2017 (CEST)

Bei der Überlegung, was man alles mit einem nicht mehr funktionierenden Link anstellen kann, habe ich damals Veränderungen im ANR, um diese Links als tot zu kennzeichnen, ausgeschlossen, weil es eben eine unüberschaubare Anzahl an Vorlagen gibt, mit denen man jeweils auf ganz eigene Weise umgehen müsste. IABot scheint, soweit ich es verstanden habe, nur mit zwei Zitationsvorlagen und nackten Links klarkommen zu müssen, was natürlich viel einfacher ist. Mein Code schreibt aber dementsprechend nur auf Artikeldiskussionsseiten. Als Archiv wird auch WebCite/webcitation.org durchsucht, was einigermaßen brauchbar ist. Nach manueller Aussiebung von false positives scheint es bislang noch 2000 kleinere falschpositive Domains gegeben zu haben. Ich finde deine Fragen etwas unklar und bitte dich, einfach noch mal genauer zu fragen, falls du noch mehr wissen möchtest. – Giftpflanze 03:48, 23. Jul. 2017 (CEST)
Danke, Benutzer:Giftpflanze! Hm. Ich hab wenig Ahnung von den programmiertechnischen Anforderungen, deshalb kann ich vielleicht nicht so superspezifisch fragen. Ich versuche zu erfahren, ob der IABot sozusagen alternativlos ist, wenn es um die automatisierte Ersetzung durch Archivlinks oder Hinzufügung von Archivlinks direkt in unsere Artikel geht. Oder ob der GiftBot mit überschaubarem Aufwand so umprogrammiert werden könnte, dass er in Zukunft vergleichbare Aufgaben übernimmt. Wäre dies der Fall, dann würde ein Meinungsbild zu diesen Fragen komplett anders aussehen (müssen). Welche der folgenden Optionen hältst du für machbar mit deinem Bot, sagen wir "GiftBot 2.0" (schreib gerne direkt in die Tabelle):
Optionen mit: IABot GiftBot "GiftBot 2.0"
fortlaufende Erkennung und Kennzeichnung defekter Weblinks (Einzelnachweise und Links im Abschnitt Weblinks) ✔ Ja ✔ Ja
Eintrag defekter Links in eine Wartungskategorie ✔ Ja ✔ Ja
nur oder zusätzliche Nachricht auf der Artikeldiskussionsseite ✔ Ja ✔ Ja
Ergänzung des defekten Weblinks im Artikel mit einem zusätzlichen Link zur Archivversion ✘ Nein ✔ Ja
Vollständiges Ersetzen des defekten Weblinks durch einen Link zur Archivversion ✘ Nein ✔ Ja (aber schlechte Idee)
Einschränkung des Bots auf Einzelnachweise möglich (keine Änderungen im Abschnitt Weblinks) (meldet alle defekten Links auf der Disk.) ✔ Ja
Weblinks in speziellen Vorlagen (z.B. {{EWQ}}, {{DNB-Portal}} ignorieren ? ✔ Ja
Anbringen einer Prüfbitte (Kennzeichnung als Boteintrag) (auf der Disk) nicht nötig, da kontinuierlich
Opt-out für ausgewählte Links mit {{cbignore}} ✘ Nein ✔ Ja
Opt-out für ausgewählte Artikel mit {{Bots}} ✘ Nein ✔ Ja
(nur) Nachricht auf der Artikeldiskussionsseite ausgewählter Artikel mit {{cbtalkonly}} ✔ Ja (für alle Artikel) ✔ Ja
* Änderung im Artikel, aber keine Benachrichtigung auf der Dikussionsseite mit {{cbnotalk}} ✘ Nein ✔ Ja
Opt-Out für irrtümlich als nicht erreichbar erkannte Webaddressen („False positives“): Auf [6] (nur für Admins einsehbar) ✔ Ja auf Modul:Vorlage:Defekter Weblink/Ignorieren (lokal, für alle sichtbar) ✔ Ja
Meldung von False positives auf [7] ✔ Ja auf Wikipedia:Defekte_Weblinks/Bot2015-Problem (lokal, für alle sichtbar) ✔ Ja
prüft nur archive.org, erlaubt "Lieferung" weiterer Archivlinks via Bot/wmfLabs archive.org, WebCite archive.org, WebCite
wmflabs-API (Dokumentation) ✘ Nein, aber Datenbank s51072__dwl_p mit defekten Links auf s3 ✔ Ja

Könnte der GiftBot relativ einfach auf folgende Aufgaben umprogrammiert werden (welche ja / welche nicht)?

Ist mein Anliegen jetzt besser verständlich? --Martina Disk. 09:27, 23. Jul. 2017 (CEST)
Ok, das ist auch nicht ganz einfach, aber immerhin weiß ich, was ich beantworten soll. Die beschriebenen Aufgaben sind alle möglich. Eine Anmerkung noch zur fortlaufenden Arbeitsweise, dass ich nur einzelne, umfangreiche Suchläufe durchführen könne: Das ist Quark, die laufen automatisch in etwa zweiwöchigem Rhythmus. Die Auslieferung (auf die Diskussionsseiten) ginge auch kontinuierlich, aber das wäre wohl ein bisschen viel für alle. – Giftpflanze 03:01, 24. Jul. 2017 (CEST)
Giftpflanze, vielen Dank! Wenn ich dich richtig verstehe, kann der GiftBot weitgehend dasselbe wie der IABot leisten, richtig? Wie schätzt du die Möglichkeiten der Zusammenarbeit beider Bots ein? Wäre es aus deiner Sicht sinnvoll, hilfreich und (mit vertretbarem Aufwand) machbar, die beiden Bots zusammenarbeiten zu lassen?
Gestumblindi, ich glaube, ein MB müsste komplett anders aufgesetzt werden, wenn ein "GiftBot 2.0" machbar wäre. Was meinst du? --Martina Disk. 06:38, 26. Jul. 2017 (CEST)
Ich bin hier etwas verwirrt, existiert GiftBot 2.0 schon, oder muss es noch programmiert werden. IABot kann mit anderen bots gut zu recht kommen. GiftBot kann direct mit IABot kommunizieren.—CYBERPOWER (Diskussion) 06:46, 26. Jul. 2017 (CEST)
User:cyberpower678: Sorry, wenn ich mich missverständlich ausgedrückt habe. Einen GiftBot 2.0 gibt es noch nicht, er klingt aber sehr machbar. Meiner Meinung nach sollten wir alle technischen Möglichkeiten in Betracht ziehen. Benutzerin:Giftpflanze und Benutzer:Doc Taxon sind geschätzte Kollegen, sie haben viel Arbeit in die Programmierung und Wartung des GiftBots investiert. Wenn wir die Bot-Aufgaben zur Abarbeitung defekter Weblinks in Zukunft eventuell ausweiten, sollte auch ihre Arbeit und Erfahrung möglichst umfassend einbezogen werden. Ich möchte jedenfalls nicht eine Communityabstimmung vorbereiten, die bewährte Mitarbeiter und ihre Arbeit auch nur im Ansatz verdrängt. Anders sähe es aus, wenn die beiden zum Beispiel sagen würden, sie würden die Aufgabe gerne ganz oder überwiegend an dich abgeben. das habe ich aber nicht herausgelesen. Also bin ich immer noch dabei, mich in der Vielfalt der technischen Möglichkeiten zu orientieren und fühle mich noch nicht in der Lage, konkrete Vorschläge für ein Meinungsbild zu machen.
Benutzerin:Giftpflanze, was würdest du empfehlen? Alles beim Alten lassen, oder die Botaufgaben ausweiten? Das vollständige Ersetzen defekter Weblinks im Artikel durch einen Link zur Archivversion findest du eine schlechte Idee (ich auch, und ich halte das auch nicht für mehrheitsfähig). Was hieltest du davon, Einzelnachweise um einen Linkvorschlag zu ergänzen? Keine Links im Abschnitt Weblinks, keine Links in Spezialvorlagen. Und die Archivlinks zunächst als Bot-Vorschlag gekennzeichnet. Ich stelle mir vor, die Vorlage {{Cite web}} ließe sich so erweitern, dass ein Bot noch nicht das Feld "archiveurl" befüllt, sondern neue Felder "botarchiveurl1", "archivedate1", "botarchiveurl2", "archivedate2" (oder so ähnlich), so dass der Archivlink nach dem Originallink steht und außerdem für den Leser unter Vorbehalt steht.[1] Mache ich irgendwo einen Denkfehler, unterschätze die Auswirkungen, die Fehlerquellen, die Mehrarbeit, oder übersehe ich etwas Elementares? --Martina Disk. 08:54, 26. Jul. 2017 (CEST)
    Ich rede von Erfahrung das Vorlagen zu ändern ist relativ leicht für ein Bot Programm. Quellen die nicht im Vorlagen befinden, sind wesentlich schwieriger und habe mehr als ein Jahr daran schaffen müssen bis IABot es righting machen konnte. Nur so eine Gedanke. Ich habe kein Problem mit GiftBot 2.0, aber ich dachte ich sollte euch darüber klar machen was für Technishe Hürden da auf tauchen können, hauptsächlich weil anscheinend nur 2% von alle Quellen hier Vorlagen sind.—CYBERPOWER (Diskussion) 15:00, 26. Jul. 2017 (CEST)
    Danke, User:Cyberpower678, das sind alles gute Ideen und Anregungen! Warten wir mal auf Feedback von Gestumblindi und Giftpflanze, okay? --Martina Disk. 02:48, 27. Jul. 2017 (CEST)
    @Martina: Danke für den Mail-Ping, die Verlinkung meines Benutzernamens am 26. Juli hatte offenbar aus irgendeinem Grund keine Benachrichtigung ausgelöst. - Mir ist noch nicht recht klar, was die Idee von "GiftBot 2.0" wäre. Eine völlig autonome Alternative zu IABot, sozusagen ein Konkurrenzvorschlag? Oder eine Kooperation mit IABot im Sinne des obigen Beitrags von Cyberpower ("GiftBot kann direct mit IABot kommunizieren"), dass also GiftBot auf Basis von IABot-Resultaten agieren würde? Wenn ich obige Tabelle richtig verstehe, bietet Giftpflanze einen "GiftBot 2.0" an, der alles kann, was auch IABot kann. Dieser ist aber noch nicht geschrieben - im Gegensatz zu IABot. Dann wäre die Frage wohl: Ist es wirklich sinnvoll, nun nochmal mit wahrscheinlich grossem Aufwand einen Bot (GiftBot 2.0) zu programmieren, wenn die von der Community gewünschten Aufgaben auch von einem bereits existierenden Bot (IABot) erfüllt werden könnten? Klingt jedenfalls nicht so effizient. Nur um bewährte Mitarbeiter nicht zu "verdrängen"? Ich denke, das kann doch kaum ein Argument sein - oder würden sich Giftpflanze und DocTaxon wirklich "verdrängt" fühlen, wenn ihnen Arbeit abgenommen wird? Wenn die Situation so ist, dann stehen wir ja nun als Community und potentielle "Kunden" der Bot-Angebote plötzlich vor einem ungewöhnlichen "Luxusproblem": mehrere Botbetreiber reissen sich darum, uns beim Problem defekter Weblinks behilflich zu sein? ;-) - Sollte es wirklich dergestalt um eine Wahl zwischen dem Einsatz von IABot und GiftBot 2.0 gehen, dann müsste ein MB wirklich zweiteilig aufgebaut werden. Teil 1: Was genau wollen wir? Was soll der Bot machen (wenn überhaupt etwas)? Teil 2: Beauftragen wir mit dem Wunsch IABot oder wünschen wir uns, dass Giftpflanze einen GiftBot 2.0 schreibt? Gestumblindi 16:42, 29. Jul. 2017 (CEST)
    @ Gestumblindi : Nach derzeitigem Stand würde ich annehmen, dass etliche Benutzer den IABot ablehnen und uns vorwerfen, dass wir die eigenen Mitarbeiter und "bordeigene Mittel" außer Acht gelassen hätten. Zunächst woltle ich gerne von Giftpflanze und DocTaxon wissen, ob sie froh wären, wenn der IABot irhe Arbeit übernimmt und sie ihm höchstens noch "zuarbeiten", oder ob es ihnen lieber wäre, den GiftBot auf zusätzliche Aufgaben zu erweitern/umzuprogrammieren. Das würde doch stark beeinflussen, wie das Meinungsbild aufgesetzt wird, oder nicht? Erst wenn wir wissen, ob wir ein Luxusproblem haben, oder ob wir quasi eine (weitgehende) Ablösung des GiftBots anstreben, können wir anfangen, konkrete Botfunktionen und Formulierungsvorschläge für die Abstimmung diskuteiren. Von dir wollte ich gerne hören, ob du eine ähnliche oder andere Auffassung hast und wie du weiter vorgehen willst. --Martina Disk. 00:54, 30. Jul. 2017 (CEST)

    Wenn Bearbeitung des ANR im MB angenommen wird, ist es am zweckmäßigsten, dies den IABot durchführen zu lassen, da dieser schon fertig programmiert und getestet ist. Wenn nur die Bearbeitung des Diskussionsnamensraumes angenommen wird, hängt es davon ab, ob ich Zeit haben werde, denn ich hoffe im September/Oktober ein Medizinstudium aufnehmen zu können. Ich hatte zwar auch in den stressigen 3 Jahren, in denen ich mein Abitur nachgeholt habe, etwas Zeit nebenher, aber vorhersehen kann ich das nicht. @Cyberpower678: Kannst du die Vorlage:Defekter Weblink (Doku: Wikipedia:Lua/Modul/Vorlage:Defekter Weblink) und ihre Parameter benutzen? Wie sähe eine Diskussionsseitenmeldung von dir aus? @PerfektesChaos: Ich weiß, dass du gewaltige Pläne hast, was die Zukunft der Erkennung defekter Weblinks angeht, als ich mir sie angeschaut habe, habe ich dankend die Finger davon gelassen. Und auch an @Mabschaaf: Was denkt ihr, wie oft wir den GiftBot in Zukunft laufen lassen könnten? Was würden sich die Initiatoren und Mitdiskutanten wünschen? Schließlich sehe ich auch noch weitere Möglichkeiten der Zusammenarbeit zwischen IABot und GiftBot: Wir könnten die Listen mit false positives austauschen, davon würden wir beide profitieren. IABots API verstehe ich beim besten Willen nicht und das Einfachste ist immer noch eine einfache Datei. Meine liegt für alle mit Toolsforge-Zugang lesbar in ~tools.giftbot/exceptions. – Giftpflanze 18:47, 30. Jul. 2017 (CEST)

    @Giftplanze: Diskussionsseitenmeldungen werden hier gesteuert. Sehe das als Beispiel. Ich komme mit dieser Vorlage nicht ganz im Klaren. Wie genau wird es benutzt. Mit eine paar kleine Änderungen, kann ich es bestimmt verwenden. Was genau über IABot's API verstehst du nicht?—CYBERPOWER (Diskussion) 19:00, 30. Jul. 2017 (CEST)
    Diese Steuerungsseiten habe ich schon gesehen, was mir aber fehlte war ein konkretes Beispiel. Werden da dann einfach Links aufgezählt? Es wäre schön, wenn du auf so eine Meldung verlinken könntest. Die Abschnitte 2 und 3 der in Klammern verlinkten Seite sagen eigentlich alles. Vielleicht geht es dir wie mir, wenn ich die Dokumentation der API deines Bots anschaue, da verstehe ich nämlich auch nur Bahnhof. Warum so kompliziert und ist das überhaupt sicher? Gibt es auch einen Direktzugriff über eine (öffentliche) Datenbank? – Giftpflanze 19:16, 30. Jul. 2017 (CEST)
    Meinung als Mitdiskutant:
    • Ich wünsche mir eigentlich „nur“ einen Dauerbetrieb in der Art, dass ich einzelne Artikel und/oder komplette Themenbereiche jederzeit Linkwarten kann, und eben nicht auf den nächsten Botlauf warten muss. Wer das macht ist mir relativ egal; ich mag aber nicht den Gedanken dabei, dass das jemanden komplett dauerhaft auslasten würde. Effizienz ist bei der Angelegenheit irre wichtig, gerade auch auf Betreiberseite.
    • Die Diskussionsseitenbenachrichtigungen mag ich nicht so, da zeigt der IABot mit dem API wie es gehen könnte. Ein Gadget oder eine Spezialseite oder sowas könnten mit einem API kommunizieren und so gleichzeitig für Effizienz sorgen, die Wartung für die Benutzer onwiki halten, und die Bearbeitungslast von den Diskussionsseiten nehmen. Gleichzeitig verbleibt dort nichts veraltendes und vergessenes.
    • Ob es ANR-Aktivität durch Bots gibt, ist mir letztlich egal.
    Viele Grüße (und Danke für das Betreiben des Giftbots), MisterSynergy (Diskussion) 21:34, 30. Jul. 2017 (CEST)

    @Martina Nolte, Giftpflanze, Cyberpower678, MisterSynergy, PerfektesChaos: Ich bin inzwischen zur Ansicht gelangt, dass es besser wäre, dieses Meinungsbild nicht "botspezifisch" aufzusetzen. Eine Diskussion darüber, wer genau nun mit welchem Bot oder welchen Bots agieren kann/will/soll, lenkt doch nur von der zentralen Frage ab, um die es hier gehen muss: Ob die Community bestimmte Markierungen, Ersetzungen oder Ergänzungen toter Links durch Bots will und wenn ja, in welchem Masse. Wenn sie das verneint, braucht man sich gar nicht mehr über einzelne Bots zu unterhalten. Wenn sie es bejaht, können wir es den Botbetreibern wie Cyberpower678 und Giftpflanze überlassen, sich diesbezüglich abzustimmen, dann hätten sie in einem definierten Rahmen "freie Bahn" - wer genau was macht, würde dann einfach von ihrer Kapazität und dem, was sie untereinander aushandeln, abhängen. Giftpflanze schrieb ja gerade "Wenn Bearbeitung des ANR im MB angenommen wird, ist es am zweckmäßigsten, dies den IABot durchführen zu lassen, da dieser schon fertig programmiert und getestet ist". Ich denke, das gehört nicht zu den Fragen, die wir als Community klären müssen. Darum würde ich das MB gerne nach Wikipedia:Meinungsbilder/Boteinsatz bei toten Links verschieben und entsprechend anpassen. Meinungen? Gestumblindi 23:11, 30. Jul. 2017 (CEST)

    Ich habe persoenlich keine Meinung über das Meinungsbild, so lange es mir sagt "Ja ich kann IABot aufbauen", oder "Nein, keine Bots sind hier wilkommen." Natürlich, bevorzuge eine JA Antwort. :-). @Giftpflanze: Hier gibt es ein konkretes Beispiel, wie so eine Meldung gepostet wird. Mann kann verlinken. Bis auf Authentifizierung, ist es eigentlich recht leicht zum verstehen. Mit dieser API kannst IABot's DB zugreifen und Modifiziern, und ja es ist abgesichert. Sicherheit war Priorität Nummer 1. Lese zugriff braucht kein Konto. Also der API is öffentlich. Ich kann dir es erklären. Was genau willst du machen?—CYBERPOWER (Diskussion) 23:26, 30. Jul. 2017 (CEST)
    +1; dachte das wäre eh klar. —MisterSynergy (Diskussion) 23:20, 30. Jul. 2017 (CEST)
    Okay, Giftpflanzes Votum ist ja nun recht klar. Damit können wir m.E. die konkreten Vorschläge angehen. Gestumblindi, ich fände eine Verschiebung auf einen anbieterunabhängigen Titel gut. --Martina Disk. 23:55, 30. Jul. 2017 (CEST)
    Dann würde ich gern mal die Frage aufwerfen, ob es wirklich darum gehen soll, einem Bot "zu erlauben, Änderungen im Artikelnamensraum der deutschsprachigen Wikipedia vorzunehmen". Wenn ja, kann ich nur auf klare Ablehnung hoffen. Dabei hätte ich gar nichts gegen Mister Synergys Wunsch, öfter und schneller Rückmeldungen zu toten Links zu bekommen. Fragt sich mithin, ob es klug ist, die Frage so zu stellen.--Mautpreller (Diskussion) 00:08, 31. Jul. 2017 (CEST)
    Es ist ja angedacht, mehrere Vorschläge zur Abstimmung zu stellen. Ja, es wird meinem Verständnis nach auch mindestens einen Vorschlag zu Änderungen direkt im ANR geben. --Martina Disk. 00:48, 31. Jul. 2017 (CEST)
    Für Bot-Edits ausserhalb des ANR braucht es kein MB; dass diese zulässig sind, ist ja eh schon der Status quo (GiftBot auf Artikeldiskussionsseiten). Eine entsprechende Abstimmungsoption ist damit m.E. auch überflüssig. Sinn dieses Meinungsbildes ist es, zu klären, ob Bots nun neuerdings auch bestimmte Änderungen im ANR vornehmen dürfen, um das Problem toter Weblinks anzugehen. Gestumblindi 03:55, 31. Jul. 2017 (CEST)
    Wie Du willst. Dann wird es hoffentlich deutlich abgelehnt werden, auch wenn der Bot prinzipiell nützlich sein könnte, sofern er nicht in den ANR schreibt. Unter "Kontra" müsste dann stehen: Ungeachtet des potenziellen Nutzens solcher Bots können automatisierte Edits im Artikelnamensraum nicht zugelassen werden.--Mautpreller (Diskussion) 10:28, 31. Jul. 2017 (CEST)
    Du darfst das gerne ergänzen. Gestumblindi 12:52, 31. Jul. 2017 (CEST)
    • @Martina Nolte: Ich möchte nicht Narzisstisch klingen, aber laut Mautpreller (Diskussion • Beiträge • hochgeladene Dateien • Sperr-Logbuch • globale Beiträge • SUL • Logbuch) halt ich es für eine sehr schlechte Idee dieser MB vom IABot/GiftBot auf ANR freizuschalten, die von erfahrenen Bot Betreiber betrieben werden, auf generell Bots auf ANR zu erlauben, wenn dewiki schon ein Grosses Problem mit bots in ANR hat. Ich halte es eher sinnvoller mit kleine Schritte anzufangen. IABot existiert schon und kann konkrete Beispiele zeigen an was es machen kann. GiftBot existiert auch schon, und beide zusammen können die Bots nur Vertrauenswürdiger werden.—CYBERPOWER (Diskussion) 14:15, 31. Jul. 2017 (CEST)
    @Cyberpower678: Wie man's macht, ist's falsch! Verschoben und verallgemeinert habe ich das Meinungsbild unter anderem aufgrund der Befürchtungen von Martina, dass ein IABot-spezifisches MB (wie es ursprünglich benannt und eingerichtet war), bei der Community schlecht ankommen könnte. Du befürchtest nun hingegen, dass die Community eine generelle Erlaubnis für Bots eher ablehnen würde und eher zustimmen würde, wenn es ausdrücklich nur um eine Erlaubnis für die bewährten Bots GiftBot und IABot geht. Hm... natürlich könnten wir das MB nochmal umbennen: Wikipedia:Meinungsbilder/Einsatz von InternetArchiveBot und GiftBot bei toten Links und die Vorschläge würden ausschliesslich diesen beiden und keinen anderen Bots Eingriffe in den ANR erlauben? Allerdings würde mir das wenig zukunftssicher scheinen - und es ist ja nicht so, dass es noch gar keine ANR-Edits durch Bots gibt. So entfernen Dateientlinkerbot und CommonsDelinker Einbindungen gelöschter Dateien. Und früher (vor Wikidata) wurden Interwiki-Links standardmässig von Bots gewartet, was auch zu Falschverlinkungen geführt hat, aber akzeptiert war. Was meinen andere? Gestumblindi 21:58, 31. Jul. 2017 (CEST)
    Ich würde das weiter unabhängig vom Botbetreiber gestalten. Die allgemeine Aversion gegenüber Botaktivitäten in dewiki liegt nicht daran, dass wir hier soviele inkompetente Botbetreiber hätten die nichts als Chaos anrichteten. Das Gegenteil ist der Fall, der Botzulassungsprozess funktioniert im Allgemeinen gut und Fehler machen die Bots selten. Wir brauchen „lediglich“ Regeln darüber, wieviel Automatismus bei der Weblinkwartung erlaubt sein sollte, und dann können die interessierten Botbetreiber sich im Rahmen dieser Regeln um die Arbeit streiten. Mehr als die beiden genannten Kandidaten mit Erfahrung werden sich da vermutlich aber nicht vordrängeln, schätze ich. —MisterSynergy (Diskussion) 22:13, 31. Jul. 2017 (CEST)
    Na gut. Ich überlasse es dann euch und beantworten nur Fragen.—CYBERPOWER (Diskussion) 22:25, 31. Jul. 2017 (CEST)
    Ich habe keine Sorge, dass in diesem Themenfeld unerwartet ein völlig neuer Botbetreiber aufschlagen und Chaos verursachen würde. Wenn er einen guten Job machen würde, wäre eh alles prima. Wenn er Chaos verusachen würde, würde der Bot kurzerhand abgeschaltet. --Martina Disk. 07:22, 1. Aug. 2017 (CEST)

    Weitere Gift-Bot-Läufe[Quelltext bearbeiten]

    Giftpflanze hat u.a. mich oben gefragt wie oft wir den GiftBot in Zukunft laufen lassen könnten - darauf möchte ich noch antworten, auch wenn die Diskussion inzwischen weitergelaufen ist.

    Ich war immer der Überzeugung, dass der Giftbot seine eigenen Disku-Meldungen (mehr oder minder) regelmäßig überarbeiten, d.h. aktualisieren soll. Ich sehe auch praktisch keine Gründe, das nicht zu tun, vor allem, weil die Technik steht und man dazu - so wie ich es aus der Ferne beurteile - nur auf "Start" drücken müsste. Dabei wären nicht mehr im Artikel vorhandene, aber auf der Disku noch als "tot" gemeldete Links zu entfernen und ggf. weitere, zwischenzeitlich verrottete Links aufzunehmen.

    Der einzige gelegentlich vorgebrachte Grund, der gegen eine solche regelmäßige Tätigkeit des Bots sprechen würde, wäre die Belästigung der Autoren durch ein Fluten der Beobachtungsliste. Ich finde dieses Argument aber schwach. Autoren, die ihre "Babys" pflegen, sind froh über frische Meldungen und aktuelle Diskus, für Portale/Redaktionen gilt gleiches. Um den Nerv-Effekt trotzdem zu dämpfen, könnte man ja ein paar Bremsen einbauen:

    • Es werden nur tote Links auf der Disku hinzugefügt/entfernt, wenn sie in einer gesichteten Artikelversion enthalten (bzw. nicht mehr enthalten) sind.
    • Die Disku-Meldung wird nur dann geändert, wenn der Artikel seit mindestens einer Woche nicht mehr bearbeitet wurde, er also einen "stabilen" Zustand erreicht hat
    • Die Disku-Meldung wird nur dann geändert, wenn die letzte Bot-Änderung der Meldung mindestens zwei Monate zurückliegt.

    Damit sollte sicher vermieden werden können, dass der Bot beispielsweise versucht, einem Edit-War im Artikel auf der Disku hinterherzuhecheln.

    Der wirklich große Vorteil regelmäßiger Bot-Aktualisierungen der Disku-Meldung wäre, dass sich menschliche Bearbeiter nicht mehr auch noch um die Pflege der Disku-Meldung kümmern müssen, weil klar wäre, dass der Bot hinterherräumt. Dass "Linkfixer" das sowieso nicht regelmäßig tun, sieht man an Kategorie:Wikipedia:Defekte Weblinks/Bot/Keine auffindbaren URL - dort stehen aktuell über 12700 Seiten, die auf der Disku noch eine Botmeldung haben, deren gemeldeten Links aber im Artikel gar nicht mehr vorhanden sind. Wie viele Seiten teilweise abgearbeitete Meldungen haben (die einer Aktualisierung bedürften), kann mW nicht gezählt werden.

    Sicher wäre hierzu eine 3M oder 4M hilfreich, ggf. könnte man die Eingangsfrage auch via Umfrage klären.--Mabschaaf 19:07, 31. Jul. 2017 (CEST)

    Das finde ich supergute Anregungen, besonders das Löschen abgearbeiteter Links von der Diskussionsseite und häufigere Botläufe würde ich begrüßen. Ich bin aber auch der Meinung, dass das Meinungsbild nicht die Abläufe auf der Diskussionsseite zum gegenstand haben sollte, sondern lediglich Vorschläge für Boteingriffe im Artikelnamensraum machen sollte. Also Umfrage: natürlich gerne, aber bitte unabhängig vom Meinungsbild. Gestumblindi, was meinst du? --Martina Disk. 07:22, 1. Aug. 2017 (CEST)
    Zu behaupten (und umseitig zu schreiben), dass Botbearbeitungen im ANR die Ausnahme darstellen und dass nur wenige Bots dort agieren dürfen, halte ich für sehr fragwürdig. Was ist auch zum Beispiel mit den ehemaligen Interwikibots und der Umkategorisierung, den Vorlagenänderungen und notwendigen Syntaxkorrekturen? Jeder Bot hat prinzipiell die Berechtigung, Aufgaben im ANR zu erledigen (solange sinnvoll, fehlerfrei und mit der Zustimmung der Gemeinschaft, was wir hier ja gerade zu eruieren versuchen). – Giftpflanze 12:19, 1. Aug. 2017 (CEST)
    @Martina Der Einsatz von GiftBot auf Diskussionsseiten ist ja bereits allgemein akzeptiert, Aktivitäten ausserhalb des ANR sollten sicher nicht Gegenstand dieses MB sein, aber vielleicht wäre eine (separate) Umfrage angezeigt, um sicherzustellen, dass die Community auch häufigere GiftBot-Läufe mit dem damit einhergehenden häufigeren Auftauchen geänderter Diskussionsseiten auf Beobachtungslisten akzeptieren würde. Dies wäre aber meines Erachtens auch erst sinnvoll, nachdem dieses Meinungsbild durchgeführt wurde und falls darin Eingriffe in den ANR abgelehnt werden - denn sollten Korrekturen/Markierungen direkt im ANR angenommen werden, hätten wir ja eine ganz andere Ausgangslage. @Giftpflanze: Ich finde es nicht falsch, wenn Martina "Im Artikelnamensraum wurde bisher eine geringe Anzahl von Bots zugelassen" schreibt. Das ist schon so, insbesondere verglichen mit der englischen Wikipedia, wo es ja schon zu Editwars zwischen Bots gekommen sein soll. Man kann die Aufzählung der Bots, die bisher im ANR aktiv sind oder waren, in der Zustandsbeschreibung gerne noch komplettieren. Sehr viele sind es nun wirklich nicht. Und manche Diskutierende scheinen ja der Ansicht zu sein, dass ein Ändern von Weblinks einen bedeutend tieferen Eingriff in den ANR darstellt als das, was wir den Bots bislang gestatteten. Gestumblindi 15:22, 1. Aug. 2017 (CEST)
    Ich habe mit GiftBot auch schon mehrere kleinere Botaufträge im ANR durchgeführt und die Aussage wird auch nicht richtiger, wenn wir noch ein paar aufzählen. – Giftpflanze 17:47, 1. Aug. 2017 (CEST)
    Das ist wohl auch eine Frage der individuellen Einschätzung, was als "geringe Anzahl" gilt. Mein persönlicher Eindruck ist, wie wohl auch jener Martinas, dass der Bot-Einsatz im ANR bei uns verglichen mit anderen Sprachversionen bislang äusserst zurückhaltend erfolgt. Man denke nur an die schwedische Wikipedia, wo Bots Massen von Artikeln gar vollautomatisch generieren, ohne menschlichen Eingriff! In Kategorie:Benutzer:Bot mit Flag stehen ganze 44 aktive Bots (in der englischen WP sind es 243), davon sind die meisten kaum oder gar nicht im ANR aktiv. Gestumblindi 18:03, 1. Aug. 2017 (CEST)
    Giftpflanze + Gestumblindi: Ich wollte hauptsächlich zum Ausdruck bringen, dass wir zwar nocht nicht sehr viel Boteinsätze im ANR kennen, aber es eben auch nicht der erste Boteinsatz im ANR wäre. Dies richtet sich an alle, die es für quasi revolutionär hielten, einem Bot Änderungen in Artikeln zu erlauben. Das ist ja offensichtlich nicht zutreffend. Die Formulierung "geringe Anzahl" ist ja offensichtlich missverständlich. Ich denke, wir sollten stattdessen schlicht die bisherigen Bots und ihre Aufgaben im ANR benennen. Ich mach mal umseitig einen entsprechenden Formulierungsvorschlag. --Martina Disk. 07:57, 2. Aug. 2017 (CEST)

    erledigt-Markierung[Quelltext bearbeiten]

    Was mich vor allem interessiert: Kann man auf einfache Weise (beispielsweise durch erl. in der Überschrift) eine Meldung auf der Diskussionsseite als "erledigt" markieren, so dass der Bot das erkennt und den Link nicht mehr anmeckert?--Mautpreller (Diskussion) 11:04, 23. Jul. 2017 (CEST)

    @Mautpreller: Ich kann nicht fuer GiftBot sprechen, aber sollte IABot nur auf Diskussionsseiten Nachrichten hinterlassen, kann er merken welche URLs schon angemeckert wurden. Dabei lässt er nur eine Nachricht wenn schon eine neue tote URL entdeckt wurde.—CYBERPOWER (Diskussion) 21:45, 23. Jul. 2017 (CEST)
    Ich halte das nicht für besonders intuitiv, aber machbar ist das schon. Vielleicht gibt es ja noch eine Möglichkeit, die auch einfach für mich umzusetzen ist. – Giftpflanze 03:01, 24. Jul. 2017 (CEST)
    Ich bin da nicht sonderlich festgelegt. Ich möchte nur den "Anstoß" für eine Artikelveränderung auf der Disk nicht löschen, es soll erkennbar bleiben, warum etwas geändert wurde. Wenn es ein Häkchen "abgearbeitet" gibt oder Ähnliches, ist alles gut.--Mautpreller (Diskussion) 10:38, 24. Jul. 2017 (CEST)
    Mautpreller: Warum soll das erhalten bleiben? Ich hab dieses Unterthema mal in einen eigenen Abschnitt abgegrenzt. --Martina Disk. 06:38, 26. Jul. 2017 (CEST)
    Weil ich finde, dass Anstöße zu Artikelveränderungen samt Reaktion immer dokumentiert werden sollten.--Mautpreller (Diskussion) 17:18, 26. Jul. 2017 (CEST)
    Mautpreller : Nachvollziehbar. Andererseits würde dein Vorschlag dazu führen, dass jeder einzeln gemeldete Link als erledigt gekennzeichnet werden müsste, wenn jemand eine gemeldete Liste nur teilweise abarbeitet. Das könnte Kuddelmuddel geben. Vermutlich ist das Löschen der erledigten Links bei der Abarbeitung eindeutiger und insgesamt die einfachste Lösung. Und am Ende kann man die "geleerte" Meldung natürlich am besten ganz löschen. --Martina Disk. 02:32, 27. Jul. 2017 (CEST)
    Gerade in diesen Fällen erscheint es mir besonders wichtig, die Nachrichten aufzubewahren. Gibt es wirklich nicht die Möglichkeit, pro gemeldetem Link abzuhaken: erledigt? Es gibt ja sehr verschiedene mögliche Reaktionen: Botfehler, Link war erreichbar; Korrektur, Live-Link eingesetzt; Streichung des Links, überflüssig; besserer Nachweis, Link gestrichen; Angabe falsch, daher samt Link gestrichen und evtl. neue eingesetzt; Archiv-Link eingesetzt; Broken Link erhalten, hier die beste Möglichkeit. Für den Bot ist wichtig, dass er weiß, es hat sich jemand drum gekümmert, daher erledigt. Für die Weiterentwicklung des Artikels könnten diese Meldungen aber wichtig sein.--Mautpreller (Diskussion) 09:50, 27. Jul. 2017 (CEST)
    Das leuchtet ein. Wenn alle gemeldeten Links (wie auch immer) abgearbeitet sind, müsste der Artikel aber aus der Kategorie defekter Weblink-Seiten entfernt werden. Wie dies technisch zu bewerkstelligen ist, sollte m.E. beim Bot diskutiert werden. Ich halte das für zu kleinteilig, um ins MB einzufließen. Falls du das als Abstimmoption aufgenommen sehen willst, bitte ich dich um einen konkreten Formulierungsvorschlag und eine Klärung der technischen Machbarkeit. Okay?--Martina Disk. 20:23, 27. Jul. 2017 (CEST)
    Nö, im MB muss es wirklich nicht sein.--Mautpreller (Diskussion) 21:03, 27. Jul. 2017 (CEST)

    false positive durch Block des Bots[Quelltext bearbeiten]

    Hi, oben wurde nicht weiter thematisiert, dass der Botbetreiber angab, false positives seien dadurch zustande gekommen, dass der Bot blockiert wurde während ein "normaler" Benutzer den Inhalt sehen würde. Der Bot hätte dann den Link als tot interpretiert und durch die Archivversion ersetzt. Dazu habe ich zwei Anmerkungen: Mit welcher Frequenz prüft dieser Bot die Links eigentlich, dass er offenbar von Serverbetreibern als lästig empfunden und geblockt wurde? Zweitens: Warum interpretiert der Bot einen HTTP-Statuscode 403 "forbidden" als 404 "not found" oder überhaupt als Problem, das ein Umschreiben auf die Archivversion rechtfertigt? Auf korrekt betriebenen Servern hat 403 eine völlig andere Bedeutung als 404 und ich glaube nicht, dass der Bot auf ein 403 mit einem Umschreiben reagieren sollte. Kurzfassung: Ich bin mir nicht sicher, dass der Botbetreiber die Netzkultur, insbesondere mittelgroßer Serveradmins so versteht, dass er sich konstruktiv mit seinem Bot im Web bewegen sollte. Grüße --h-stt !? 15:28, 25. Jul. 2017 (CEST)

    Eine gegeben Link hat eine Wartezeit von 3 Tage zwischen jede Prüfung. IABot wohnt aber bei Labs und dafür sind da andere Tools und Bots die bestimmte Server belästigen. In vielen fällen wenn eine 403 erkannt wird, ladet im Browser bei mir auch eine 403. Selten bekommt der Bot eine 403 Antwort weil der Bot vom Server blockiert wird. Da habe ich genügend Erfahrung gemacht. Tut mir leid aber dien letze Satz ist eher beleidigend mir gegenüber. Ich kenne mich mit der Netzkultur gut aus. Ich schaffe schon seit 2015 an IABot, und noch nie wurde meine Erfahrung mit Netzkultur in Frage gestellt. Ich Arbeite von Erfahrung, und nicht von Theorie.—CYBERPOWER (Diskussion) 00:09, 26. Jul. 2017 (CEST)
    Kannst du das mit den 403 noch mal erklären? Wieso reagiert dein Bot überhaupt auf einen 403? Zur Frequenz: Läuft dein Bot wirklich alle drei Tage durch alle Weblinks? Das gibt ja eine Frequenz, die nicht mal der Googlebot erreicht. Jede größere, vielfach verlinkte Website (Medien, Institutionen, etc) muss da ja aufmerksam werden. Und dein Bot teilt sich auch noch die IP mit all den anderen Lab-Projekten? Na super. Den würde ich auch blocken, wenn ich Admin in einem unterfinanzierten Projekt am Rande der Leistungsfähigkeit wäre. Welchen User-Agent gibt dein Bot denn an? Viele Fragen, aber bevor du die nicht beantwortest, kann ich mir kein Bild machen. Grüße --h-stt !? 16:50, 26. Jul. 2017 (CEST)
    Eine 403 ist eine Fehlermeldung das heisst zugriff verweigert. Aber in meisten Fällen, ist das nicht benutzt um der Bot zu blockieren sind alle Benutzer. Deshalb reagiert der Bot drauf. Nochmal sage ich das ich von Erfahrung hier arbeite. Nein er prüft nicht alle 24 Million+ Links jede 3 Tage, sondern das die Prüfwartezeit mindestens 3 Tage sind. Der prüft nur Links die auf eine gegebene Artikel gefunden wurde, wahrend der Bot es gerade analysiert, und nur wenn es schon vor mehr als 3 Tage vorhin geprüft wurde. Sonst prüft er nicht. Das gleicht sich aus das der durchschnittliche Link jeden 2. Woche geprüft wird. Der bot sieht aus wie ein Chrome web browser.—CYBERPOWER (Diskussion) 18:31, 26. Jul. 2017 (CEST)

    h-stt, bitte halte die Diskussion sachlich. Danke. --Martina Disk. 05:35, 26. Jul. 2017 (CEST)

    Hmmm - sieh dir mal die Fragen da oben an. Bin ich unhöflich oder haben wir es da mit einem Bot und Botbetreiber zu tun, der im Netz Amok läuft und von verschiedenen Admins überall in der Welt völlig zu recht geblockt wird? Und uns dann die deshalb falsch interpretierten Weblinks zerschießt? Hey, wer ist denn hier unhöflich und verletzt die Netiquette? Grüße --h-stt !? 16:50, 26. Jul. 2017 (CEST)
    Ich empfinde Deine Beiträge in diesem Thema ebenfalls als unsachlich. Du weißt im Grunde kaum etwas über das Prüfverhalten des Bots und hast ihn trotzdem schon verurteilt; wenig überraschend passt das zu Deiner Agenda, den Bot hier nicht zum Einsatz zu bringen. —MisterSynergy (Diskussion) 17:15, 26. Jul. 2017 (CEST)
    Im gleichen Beitrag, in dem du deine Höflichkeit beteuerst, schreibst du von "einem Bot und Botbetreiber (...) der im Netz Amok läuft"? Eigenartiges Höflichkeitsverständnis. Man kann Kritik oder Bedenken auch anders anbringen. Gestumblindi 23:16, 26. Jul. 2017 (CEST)

    Die Fehlerquelle für die ungewöhnlich hohe Zahl an false positives ist ja jetzt ausgemacht und der Fehler beseitigt (siehe eins drunter). Da kann man dies ja nun abschließen. --Martina Disk. 02:28, 27. Jul. 2017 (CEST)

    False Positives durch ein Technischen Fehler behoben[Quelltext bearbeiten]

    Manche haben gemeldet das viele False Positives gemeldet wurden in letzter Zeit. Es hat sich ergeben das es von eine Technischen Fehler gekommen ist, und nicht von der Algorithmus vom IABot. Dieses Fehler wurde in v1.5beta behoben.—CYBERPOWER (Diskussion) 15:03, 26. Jul. 2017 (CEST)

    Danke für die Info. In solchen Fällen würde der Bot hier vermutlich vom Brtreiber deaktiviert oder von einem Admin gesperrt, bis der Fehler behoben ist. --Martina Disk. 19:58, 26. Jul. 2017 (CEST)
    Nur um klar zu sein, es kann noch False Positives geben, aber die außergewöhnliche hohe Zahl davon sollte wesentlich reduziert sein.—CYBERPOWER (Diskussion) 02:52, 27. Jul. 2017 (CEST)
    Danke. Klar. Kein Bot ist 100% fehlerfrei. --Martina Disk. 20:26, 27. Jul. 2017 (CEST)

    Bequemlichkeit[Quelltext bearbeiten]

    Mal ehrlich, wenn ich auf einer Diskussionsseite die Giftbot-Meldung sehe, dann kümmere ich mich als Gelegenheitsautor nicht darum. Weshalb mein Egoismus? Weil es ein (zugegebenermaßen nicht zu großer!) Aufwand ist, den Link selbst zu ersetzen. Ich stoße zum Beispiel hier auf den Bothinweis. Ich weiß (eigentlich), was zu tun ist:

    • ich klicke auf den fehlerhaften Link und prüfe, ob ich durchkomme.
    • ich klicke auf den Webarchiv-Link und prüfe, ob sinnvoller Inhalt archiviert ist
      • ich entferne den false-positive-Bothinweis, oder... Ach nein, doch nicht, es muss irgendwie reported werden, was soll ich da schreiben - ach was, vergiss es einfach, der Link funktioniert ja doch, und der Gift-Hinweis schadet niemandem.
      • ich gehe auf die Artikelseite und muss den falschen Link finden (Schwierigkeit 1, denn die Links sehen komplett anders aus und sind ggf. als Einzelnachweis versteckt...), dann muss ich den Webarchiv-Link nehmen und auf eigene Faust auseinandernehmen (Schwierigkeit 2), um ihn dann in irgendso eine Vorlage (Schwierigkeit 3: wo finde ich die? Such such, natürlich im Bothinweis gut verlinkt, aber es öffnet dann schon den fünften Tab im Browser, wo man auch noch die Wahl der Qual unterschiedlicher Varianten hat...), also, in die nun copy-pastete Webarchiv-Vorlage muss ich den Archivlink hineinfummeln (Schwierigkeit 4), dann abspeichern. Puh geschafft.
    • Und eigentlich hätte ich zuvor lieber erst den Inhalt sowohl des Artikels wie auch des Einzelnachweises inhaltlich prüfen müssen: Stimmen Behauptungen, finde ich Aussagen wieder?
    • Im vorliegenden Fall funktioniert für mich weder der Defekte Weblink, noch das Internetarchiv. Wie kann ich da etwas reporten? - ach was, vergiss es einfach, die Links funktionieren halt alle nicht, vielleicht browserabhängig?, und jemand anders wird es bestimmt sicher eventuell irgendwann richten.

    So leider meine Erfahrungen mit dem Giftbot. Rechne ich mal bei 300.000 Botmeldungen für jede Link-Korrektur eine Bearbeitungszeit von 2 bis 10 Minuten und postuliere festangestellte Wikipedia-Editoren, dann fallen 5 bis 25 Personenjahre Arbeit an. Ergo betreibe ich diesen Aufwand nur, wenn mir ein Thema gerade am Herzen liegt. Dieses MB ist richtig, wichtig, und sinnvoll, auch wenn ich dem vollautomatischen Bot trotzdem skeptisch gegenüberstehe.

    Wie schön wäre es, wenn man als Nutzer mit folgendem Tool konfroniert wird: Botmeldung des defekten Weblinks auf der Diskussion gesichtet. Angegeben sind zwei Links, die ich prüfen kann (s.o. auf Funktion und auf Inhalt). Dann aber nicht der Krimskrams mit manuellem Ersetzen, sondern mehr oder weniger nur ein Button, den ich als Confirmed-User betätigen kann... Und beim nächsten Botdurchlauf (einmal pro Woche? pro Monat? Egal, selbst einmal im Jahr wäre besser als der jetzige Zustand) kann der Bot dann selbsttätig in so markierten Artikeln den defekten Link durch den Webarchiv-Link ersetzen. Liest sich vermutlich einfacher, als es für die Programmierer ist, ich weiß. --Enyavar (Diskussion) 18:19, 28. Jul. 2017 (CEST)

    Ja, ich würde mir wünschen der Bot böte für jeden angebotenen Archivink eine Kopiervorlage an, die beide Links (Original und Archiv) enthielte. So, wie man sie nach Prüfung direkt in den Artikel setzen könnte. Das würde die Abarbeitung wesentlich erleichtern, und ich würde mich da häufiger rum kümmern als bisher. --Martina Disk. 23:58, 30. Jul. 2017 (CEST)

    Löschung[Quelltext bearbeiten]

    "Falls die GiftBot-Meldung der einzige Eintrag auf der Diskussionsseite war, soll mit der Vorlage {{Löschen}} die Seite zum Schnellöschen vorgeschlagen werden. Diese Löschung wird durch einen Administrator vorgenommen." - Wer sagt das? Wo steht das? Ich würde das ganz grundsätzlich nie tun.--Mautpreller (Diskussion) 19:47, 1. Aug. 2017 (CEST)

    Das sagt ein Meinungsbild, an dem du damals auch teilgenommen hattest - angenommen wurde die Option, dass Diskussionsseiten in solchen Fällen gelöscht werden sollen (du warst dagegen). "Ausschliesslich erledigte Bothinweise" ist somit auch eine der Standard-Löschbegründungen, die einem in der Drop-Down-Liste beim Löschen angeboten werden. Gestumblindi 20:03, 1. Aug. 2017 (CEST)
    Tatsächlich. Wie ärgerlich, das war mir völlig entfallen. War halt wieder mal'n Schritt zur Zerstörung von Nachvollziehbarkeit. Es gab schon schlimmere MB-Ergebnisse, aber schön ist es nicht. Na gut.--Mautpreller (Diskussion) 20:44, 1. Aug. 2017 (CEST)
    Die Nachvollziehbarkeit ist ja durch die Versionsgeschichte der Artikel selbst durchaus gegeben. Auch ohne die Botmeldungen auf der Diskussionsseite kann man jederzeit nachvollziehen, wann welcher Link eingesetzt bzw. ersetzt oder entfernt wurde. Gestumblindi 17:56, 6. Aug. 2017 (CEST)

    Sache der Portale[Quelltext bearbeiten]

    Warum der Portale? Das müsste auch für einzelne Artikel möglich sein. Sehr viele Artikel gehören nicht zu einem funktionierenden Portal, um andere streiten sich verschiedene Portale.--Mautpreller (Diskussion) 21:25, 1. Aug. 2017 (CEST)

    Das stimmt. Ich hatte den Opt-In-Vorschlag schon etwas umformuliert, da stand ja "nur auf Anforderung eines Portals" - aber manchmal sind die, die sich zuständig fühlen, nicht als "Portal" (wie P:SCHIFF), sondern zum Beispiel als "Redaktion" (wie WP:RFF), anders oder gar nicht strukturiert organisiert. Könnte man statt "Sache der Portale" so etwas wie "Sache der Portale, Redaktionen oder Hauptautoren, je nach Organisation im betreffenden Bereich" schreiben? Gestumblindi 00:10, 2. Aug. 2017 (CEST)
    Ja, find ich gut.--Mautpreller (Diskussion) 09:42, 2. Aug. 2017 (CEST)

    Ich hab das jetzt entsprechend bei Vorschlag 1 ergänzt. Mit den Vorschlägen an sich bin ich aber nicht einverstanden. Dazu mehr im übernächsten Abschnitt. --Martina Disk. 05:51, 3. Aug. 2017 (CEST)

    Problembeschreibung und Lösungsansatz[Quelltext bearbeiten]

    "Anderthalb Jahre nach dem letzten Suchlauf des GiftBots gibt es auf 263.467 Diskussionsseiten immer noch einen oder mehrere unerledigte Bothinweise zu defekten Weblinks. Für fast 200.000 Artikel wird ein Archivlink auf archive.org oder webcitation.org angeboten. Dem Leser wird im Artikel jedoch weiterhin nur der tote Link gezeigt." Das stimmt so nicht. Die Bothinweise sind zum Teil durchaus erledigt, der tote Weblink wird zum Teil nicht mehr angezeigt. Diese Zahl misst die auf Diskussionsseiten vorhandenen Meldungen, nicht jedoch, ob die "toten" Links noch im Artikel vorhanden sind.

    "Es ist offensichtlich, dass der Rückstau defekter Weblinks mit der gegebenen Kapazität der Wikipedia-Community nicht zu bewältigen ist." Das ist m.E. nicht richtig, es ist keineswegs "offensichtlich" (siehe auch oben). Wie verschiedentlich angemerkt, ist das auch mindestens nicht ausschließlich ein Problem der Kapazität (sondern auch der Bearbeitungsfreundlichkeit und der Beurteilung, wie sinnvoll eine Ersetzung toter Links ist). Es ist zudem kein "Lösungsansatz". Der "Lösungsansatz" ist das, was Gestumblindi zuvor geschrieben hatte: Es wird vorgeschlagen, weiter als bisher vom Prinzip "Nur Menschen bearbeiten Artikel" abzurücken und Bots die sichtbare Einsetzung von Archivlinks direkt im Artikelnamensraum zu gestatten.--Mautpreller (Diskussion) 12:07, 2. Aug. 2017 (CEST)

    Und das ist auch gut so. Dann wäre das Problem, dass Links im Artikel gefixt wurden, aber auf der Disk noch als defekt gekennzeichnet sind, auch vom Tisch. Viele Grüße, Grueslayer 12:11, 2. Aug. 2017 (CEST)
    Und wieso ist das ein Problem? Im Übrigen ist auf der Diskussionsseite oft durchaus angemerkt, dass der Link ersetzt wurde, das steht dann da groß und breit zu lesen. Es ist die bekannte Frage, was wichtiger ist: dass die Arbeit vernünftig gemacht wird oder dass die automatisierten Wartungstools reibungslos funktionieren. --Mautpreller (Diskussion) 12:17, 2. Aug. 2017 (CEST)
    Beides, aber das habe ich ja ziemlich weit oben schon skizziert. Übrigens kritisiertest Du, dass man die Arbeit eines Bots überprüfen müsse, die automatische Benachrichtigung über eine Ersetzung möchtest Du aber (interpretiere ich...) unkritisch hinnehmen. Das passt nicht. Ich persönlich prüfe auch angeblich ersetzte Links kurz nach. Etwas nachlässig allerdings, zugegeben. Viele Grüße, Grueslayer 18:34, 2. Aug. 2017 (CEST)
    Das verstehe ich nicht. Eine "automatische Benachrichtigung über eine Ersetzung" möchte ich natürlich nicht, weil ich Botedits im ANR grundsätzlich ablehne.--Mautpreller (Diskussion) 19:48, 2. Aug. 2017 (CEST) Gemeint war natürlich eine manuelle (menschliche).--Mautpreller (Diskussion) 20:04, 2. Aug. 2017 (CEST)

    Die Zahlen sind mM nur mit großer Vorsicht gegenüberstellbar:

    • Was wir kennen, ist die Zahl der Diskus mit Botmeldung - das sind derzeit 263.386. Dies schließt ein die Anzahl der Diskus mit komplett abgearbeiteter Linkliste aber noch vorhandener Meldung (12.764 Seiten).
    • Nicht bekannt ist dagegen die Anzahl der gemeldeten Links, die noch immer in der Botmeldung stehen und die Anzahl der Links, die zwar noch gemeldet sind, aber entweder schon in den Artikeln repariert oder entfernt sind, nicht jedoch aus den Botmeldungen entfernt wurden.
    • Wo die Zahl 200.000 angebotene Archivlinks auf archive.org oder webcitation.org herkommt, kann ich nicht nachvollziehen
    • Ursprünglich wurden im Durchschnitt 1,52 Links pro Seite als defekt gemeldet (556.698 Links / 365.671 Seiten) (Quelle)
      • Legt man diese Zahl zugrunde, käme man momentan auf (263.386 - 12.764 Seiten) * 1,52 Links pro Seite = noch rund 381.000 verbleibende tote Links
      • Tatsächlich müsste die Zahl niedriger sein, da mit dieser Methode teilweise abgearbeitete Linklisten nicht erfasst werden

    Ich wüsste derzeit keine Möglichkeit, diese Abschätzungen durch "harte" Zahlen zu ersetzen.--Mabschaaf 19:51, 2. Aug. 2017 (CEST)

    Tatsächlich ist die Zahl höher, weil ja neue tote Links nicht erfasst sind. Benutzerin:Giftpflanze, Benutzer:Cyberpower678: Kann eine/r von euch mit vertretbarem Aufwand die aktuelle Anzahl der mutmaßlich toten Weblinks in der deutschsprachigen Wikipedia ermitteln?
    Mabschaaf: Für deine ersten zwei Bullets hab ich umseitig mal eine Präzisierung versucht. Jetzt besser?
    Die fast 200.000 Artikel kommen von [{{fullurl:Spezial:Suche|search=hastemplate%3A%22Defekter+Weblink%22+insource%3A%2Fwba%3D2%2F&ns1=1}} fast 200.000 Artikel] . Hatte ich von weiter oben in den MB-Entwurf übernommen. Falls das falsch ist, lasse ich mich natürlich gerne aufklären. Kann gut sein, dss ich manches technisches Detail (noch) nicht verstehe.--Martina Disk. 06:57, 3. Aug. 2017 (CEST)
    Besser, m.E. Mir wäre aber auch daran gelegen, dass unter "Lösungsansatz" klar und deutlich steht: Es wird vorgeschlagen, dass Bots erlaubt wird, einen Archivlink direkt und für die Leser sichtbar im Artikel einzusetzen. Das scheint mir nämlich der Knackpunkt zu sein, über den abgestimmt werden muss.--Mautpreller (Diskussion) 10:17, 3. Aug. 2017 (CEST)
    @Martina Nolte: Die von Dir genannte Suche ermittelt die Anzahl der Disku-Seiten, auf denen mindestens ein Archivlink angeboten wird. Das dabei ermittelte Ergebnis hat leider keine Aussagekraft darüber, wie viele Links zu einem Artikel als defekt gemeldet wurden und zu wie vielen davon ein Archivlink genutzt werden könnte (wie bspw. auf Diskussion:Alagie_Sarr: 5 defekte Links, 1 Archivlinkvorschlag).
    Ein aktueller Giftbot-Lauf würde übrigens 938.141 defekte Links auf 622.835 Seiten melden (die Suche danach läuft nämlich kontinuierlich, siehe Wikipedia:WikiProjekt_Weblinkwartung#Statistik, letzte Zeile).--Mabschaaf 12:38, 3. Aug. 2017 (CEST)
    Nur der Vollständigkeit halber: mit wba= werden nur Internet-Archive-Links erfasst. Mit cit=5 und cit=6 werden WebCitation-Links erfasst, das sind dann noch einmal zusammen 6.025, was aber mit dann insgesamt 202.388 auch nichts an etwa 200.000 ändert. – Giftpflanze 15:53, 3. Aug. 2017 (CEST)
    @Mabschaaf+Giftpflanze: Danke für die Zusatzinfos! Habe sie umseitig eingebaut. --Martina Disk. 07:27, 4. Aug. 2017 (CEST)

    Vorschlag[Quelltext bearbeiten]

    Bezugnehmend auf Mautpreller, 10:17, 3. Aug. 2017, schlage ich folgenden Text vor und bitte um Feedback/ Verbesserungsvorschläge:

    Das vorliegende Meinungsbild schlägt vor, Bots wie GiftBot oder InternetArchiveBot zu erlauben, bei defekten Weblinks einen Archivlink direkt und für die Leser sichtbar in Artikel der deutschsprachigen Wikipedia einzusetzen. Es werden vier verschiedene Varianten für erlaubte Botaktionen zur Auswahl gestellt.

    Vorschläge[Quelltext bearbeiten]

    Ich möchte eine Diskussion darüber starten, welche Varianten zur Abstimmung gestellt werden sollen. Zwecks Übersichtlichkeit; dies sind die derzeitigen Vorschläge:

    • 1 - Archivlink zusätzlich, nur für Einzelnachweise
    • 2a - Archivlink zusätzlich, Einzelnachweise und Abschnitt Weblinks, mit Opt-out-Optionen
    • 2b - Archivlink zusätzlich, Einzelnachweise und Abschnitt Weblinks, nur nach Opt-in
    • 3 - alle IABot-Funktionen erlaubt

    Vorschlag 1 und 2a finde ich gut. Für Vorschlag 2b fehlt mir die Begründung; mir fallen auf Anhieb Szenarien ein, in denen eine solche Option eher für Verwirrung und lange Diskussionen führen würden. Vor allem mangels eines klaren Verfahrens und Festlegung der Zuständigkeit. Ausgerechnet diejenigen Artikel, für die sich weder ein Portal nocht "Hauptautoren" zuständig fühlen, würden weder händisch gewartet noch per Opt-in-Votum automatisiert gewartet. Vorschlag 3 halte ich für völlig unrealistisch. Ich finde nicht, dass wir eine Option vorschlagen sollten, von der wir schon wissen, dass sie keine Chance hat. --Martina Disk. 06:01, 3. Aug. 2017 (CEST)

    Ich würde Vorschlag 3 gerne drinlassen, auch wenn eine Annahme unrealistisch sein mag, da das Resultat durchaus auch überraschend ausfallen könnte. Hier diskutieren wenige, am MB selbst werden viele teilnehmen, und vielleicht sind es mehr als man denkt, die den Bot in seiner ganzen "Pracht" begrüssen würden. 2b ist schwierig, ja. Eigentlich ist es ja doch recht naheliegend, zu sagen: Wer den Bot will, soll den Bot kriegen. Opt-In eben. Das Problem sind die von dir genannten oft unklaren Zuständigkeiten, abgesehen von der Inkaufnahme, dass der Bot ausgerechnet dort nicht aktiv würde, wo sich niemand zuständig fühlt und er darum vielleicht besonders nützlich sein könnte. Vielleicht lässt sich aber doch eine brauchbare Opt-In-Variante zurechtzimmern? Ich denke noch etwas darüber nach, werde mich hier wieder zum Thema melden... Gestumblindi 23:43, 3. Aug. 2017 (CEST)
    Okay, danke.
    Eine Anregung zum derzeitigen Vorschlag 1, darin heißt es: "Meldung defekter Weblinks auf der Diskussionsseite wie bisher durch den GiftBot". Ich würde das einschränken: für Links, für die noch keine Archivversion im Artikel verlinkt ist Das kann einen wesentlichen Unterschied machen. Manche wie Mautpreller wollen die Weblink-Historie auf der Disk. erhalten wissen, aber Wikipedia:Meinungsbilder/Umgang mit leeren Diskussionsseiten nach Entfernen erledigter Defekter-Weblink-Meldungen verstehe ich eher gegenteilig. Redundante Hinweise auf der Disk sollten meiner Einschätzung nach verhindert werden. Hinweise auf der Disk. würde ich bei Annahme des Meinungsbildes daher beschränken auf
    • Hinweise auf tote Weblinks, zu denen der meldende Bot keine Archivversion gefunden hat (das könnte ein sehr gutes, ergänzendes Betätigungsfeld für den GiftBot werden mit Linkvorschlägen zu Webcite; ansonsten: beim IABot ist dies die Option "notify_error_on_talk")
    • Hinweise auf tote Links im Abschnitt Weblinks und ggf. Vorschläge zu Archivversionen
    --Martina Disk. 07:08, 4. Aug. 2017 (CEST)

    Beispiel[Quelltext bearbeiten]

    Wenn ich mir die erste Seite in der kategorie Defekter Weblink/Bot anschaue: Diskussion:Liste von Flugunfällen und Abschüssen von Luftfahrzeugen im Afghanistankrieg, wird mir noch fragwürdiger, wie nützlich hier Archivlinks sind. Das ist eine reichlich wüste Liste, an der seit ca. 2012 inhaltlich nichts mehr gemacht wurde. Die Archivlinks sind solche Meldungen: http://wayback.archive.org/web/20140105161239/http://www.defendamerica.mil/photoessays/apr2002/p042402a2.html. Ob die Seite defendamerica.mil jemals zitierfähig war, mag man wirklich mit Fug und Recht bestreiten. Es ist nicht mehr ohne weiteres aufzuklären, ob es sich um dieselbe Organisation handelt, die die Seite http://defendamerica.nraila.org betreibt.

    Was ist damit gewonnen, wenn wir derart eher dubiose Weblinks verewigen? Es ist offensichtlich, dass das Problem dieser Liste nicht in den defekten Einzelbelegen besteht. Sondern vielmehr darin, dass die irgendwann mal aus aktuellen Meldungen wild zusammengestückelt wurde und dann schlicht liegenblieb. Es werden da nur noch "technische" Edits vorgenommen. Wahrscheinlich gibt es längst solide Literatur zum Thema. Gut möglich, dass die Hälfte sich mittlerweile als falsch erwiesen hat oder umgekehrt die Hälfte fehlt. Wir werden solche Artikelfriedhöfe wahrscheinlich nie beseitigen (was m.E. das Beste wäre), eine gründliche Aufarbeitung, die das Einzige wäre, was dieser Liste noch nützen könnte, ist nicht in Sicht.--Mautpreller (Diskussion) 11:58, 3. Aug. 2017 (CEST)

    Und was tragen defekt bleibende Weblinks dann zur Verbesserung der Situation bei? Was ist damit gewonnen wenn wir aus schlecht belegten Aussagen völlig unbelegte Aussagen werden lassen? Wenn ich eine unbelegte Aussage lese, lösche ich sie nie, weil man sonst 70 % aller Inhalte löschen könnte. Wenn ich eine schlecht belegte Aussage sehe, dann lösche ich sie u. U., oder suche eine bessere Quelle, weil ich die Qualität der Quelle beurteilen kann. Bei archivierten Weblinks kann ich das auch im Nachhinein.
    Wenn man den Artikel inhaltlich für Kappes hält, setzt man eben einen Überarbeiten-Baustein oder stellt einen LA.
    Man kann beim Archivlink sowie auf der aktuellen Seite oft auf "About", oder im Deutschen "Impressum" klicken, und dann sieht man wer die Website betreibt und wer sie zum Zeitpunkt des Snapshots betrieben hat. In Deinem Beispiel funktioniert das und ich sehe: Der Betreiber ist nicht mehr der selbe. Wenn eine Domain den Besitzer wechselt hat man das gleiche Problem. Nur dass man ohne Archivlink dann gar keine Möglichkeit mehr hat zu sehen, ob der Betreiber gewechselt hat. --Nothingserious (Diskussion) 12:15, 3. Aug. 2017 (CEST)
    Falsche Frage. Das ist eine Liste, die wahrscheinlich unrettbar ist, weil sie eben aus alten Newsmeldungen zusammengezimmert wurde (vermutlich durch Übersetzung aus der englischen Liste entstanden). Was wird durch solche technischen Edits gewonnen, sollte man vielmehr fragen. Antwort: Verewigung eines Uraltstands. Die Liste erscheint dann belegt und enzyklopädisch, aber sie ist es nicht. Es wird ein Schein von Exaktheit erzeugt. Ist das ein Gewinn? Ich meine nein.--Mautpreller (Diskussion) 12:23, 3. Aug. 2017 (CEST)
    (BKBK) Wenn solch eine Ersetzung niemandem auffällt, dann tut sie auch niemandem weh. Stolpert jedoch jemand über eine solche Ersetzung auf der watchlist, dann kann er den Link und ggf. auch fraglichen Inhalt entfernen – und es kümmert sich wenigstens überhaupt einmal jemand darum. Solange die Links nur auf irgendwelchen Hinterzimmerseiten gemeldet werden, rührt häufig einfach niemand den fraglichen Link an. Das wissen wir alle, die Fallzahlen sind ja bekannt und wurden auch auf dieser Seite vielfach diskutiert.
    Ich verstehe nicht, warum „Augen zumachen“ hier als valide Lösungsstrategie angesehen werden kann, nur weil der Vorschlag in solchen Einzelfällen, die Du hier hervorkramst, händische Nacharbeit notwendig machen würde. Die Situation mit toten Weblinks ist bekanntermaßen seit langem schwierig, sie wird auch mit der Zeit nur noch schwieriger, und alle Aktivitäten außerhalb des ANR haben sich als zu wirkungslos herausgestellt. —MisterSynergy (Diskussion) 12:24, 3. Aug. 2017 (CEST)
    Yo, ich finde tatsächlich "Augenzumachen" hier die einzige Möglichkeit. Ich sehe keine Chance, sie löschen zu lassen (was mir am liebsten wäre, das Ding ist so und so unbrauchbar). Ich sehe nicht, dass es Interesse gibt, sie in einen brauchbaren Zustand zu bringen. Mag sie verrotten. Den Schein zu wahren trägt nichts aus.--Mautpreller (Diskussion) 12:28, 3. Aug. 2017 (CEST)
    Hier klemmen und verrotten so viele Dinge, weil wir mit Rücksicht auf die vorsichtigsten Mitarbeiter alle mit stumpfen Steinzeitwerkzeugen arbeiten müssen. Das hier vorbereitete Meinungsbild wird diesen einseitigen Zustand leider nur weiter manifestieren. Ich hatte tatsächlich mal überlegt mich als Unterstützer einzutragen, sobald Abstimmungsreife vorliegt. Mache ich aber nicht mehr, weil das hier mit verschiedenen diffusen Bedenken an einem Punkt angelangt ist, an dem die Community wohl sicher nicht zustimmen wird. Eine Ablehung der vorgeschlagenen Aktion möchte ich der Community aber mit Blick auf zukünftige Vorhaben ersparen. —MisterSynergy (Diskussion) 12:53, 3. Aug. 2017 (CEST)
    Was ist daran diffus? Ich würde mich über ein Beispiel freuen, wo der Archivlink nützlich ist. Eines kenne ich selbst: Franz Paul Schneider, erster Weblink. Es sind nach meiner (sehr selektiven) Beobachtung nur sehr wenige Fälle, wo ein Archivlink sinnvoll und wünschenswert ist. Du bist offensichtlich anderer Ansicht, dann demonstrier das doch mal.--Mautpreller (Diskussion) 13:00, 3. Aug. 2017 (CEST)
    Wir arbeiten in sehr verschiedenen Bereichen, und Du scheinst wenig Einblick in meinen Bereich zu haben (ist andersrum auch so). Ich kann kaum auf Printerzeugnisse zurückgreifen, erst recht nicht auf solche mit wissenschaftlichem Charakter. Die gibt es einfach nicht. Fast alle Quellen sind Onlinequellen, und linkrot ist dann natürlich ein relevantes und ernstes Problem. Es ist deshalb höchst frustrierend, wenn andere Benutzer sinngemäß sagen: „Pech gehabt, lass es verrotten“, oder „nimm doch gedruckte Quellen, die sind eh besser“, oder „da hat eh niemand Interesse an einer Reparatur“. Nach meiner Erfahrung aus den vergangenen Botläufen sind die archivierten Versionen durchaus in der überwiegenden Mehrzahl brauchbar, und dann auch meist alternativlos mangels anderer untoter Quellen.
    Ich habe ja mittlerweile auch mehrfach kundgetan, dass ich mit einem kontinuierlichen Botlauf außerhalb des ANR leben könnte, um wenigstens weiter händisch am Problem rumfummeln zu können. Problematischer als diese Tatsache ist zurzeit nämlich, dass ich einfach keine Informationen über tote Links zur Verfügung stehen habe. Ich hoffe lediglich, dass für kontinuierliche Botaktionen ohne ANR-Aktivität dann auch Betreiber bereit wären, habe da leider kleinere Zweifel. —MisterSynergy (Diskussion) 13:20, 3. Aug. 2017 (CEST)
    Das gestehe ich völlig zu. Gib doch mal'n Beispiel, wie das aussehen kann. Was mich an dieser Debatte etwas nervt (deswegen auch immer die Beispiele), ist, dass einerseits mit riesigen Zahlen erheblicher Bedarf signalisiert wird, ohne dass man sich ein Bild davon machen könnte, was konkret tatsächlich anliegt. Andererseits dass man (vielleicht deshalb) von konkreten eigenen Erfahrungen ausgeht und diese auf andere Bereiche überträgt, ohne das explizit zu machen. Deswegen liegt mir ziemlich viel daran, den tatsächlichen Beitrag von Archivlinks zur Qualität von Artikeln in konkreten Fällen abschätzen zu können. Es wäre ja durchaus denkbar, dass man sachlich/fachlich Bereiche abgrenzen kann, wo ein Boteinsatz sinnvoll ist, und andere, wo er nicht sinnvoll ist. Meine Bedenken kommen doch nicht zuletzt daher, dass ich eine Archivlink-Flut in Artikeln befürchte, wo diese sachlich nicht angezeigt und/oder aus urheberrechtlichen, persönlichkeitsrechtlichen oder schlicht inhaltlich-editorischen Gründen störend sind. Das muss ja nicht für alle Artikel zutreffen.--Mautpreller (Diskussion) 13:52, 3. Aug. 2017 (CEST)
    BTW: Deshalb finde ich die Opt-in-Lösung auch gar nicht so abwegig. Du könntest z.B. sagen: In den von mir beobachteten Artikeln ist in aller Regel ein Archivlink sinnvoll und nützlich und lässt sich auch kaum durch etwas anderes ersetzen. Also fordere ich dafür den Bot an. Ich könnte sagen: In den von mir beobachteten Artikeln ist ein Archivlink in der Regel schädlich und nur in Ausnahmefällen brauchbar. Also fordere ich keinen Bot an. Natürlich wirft das ein neues Problem auf, nämlich das der Abgrenzung. Das wird sicher nicht ohne Nerv gehen. Das Gute an einer solchen Idee wäre aber, dass man sich zunächst mal auf Bereiche beschränken könnte, wo nach Meinung der Bearbeiter eindeutig Bedarf besteht. Man hätte keinen "Dammbruch", sondern eine Speziallösung für ein eingegrenztes Feld.--Mautpreller (Diskussion) 14:41, 3. Aug. 2017 (CEST)
    Ich fürchte schon jetzt den daraus resultierenden Zank. Das Problem der Abgrenzung hast Du selbst genannt, allgemein könnte man das sicher gut auf die Frage nach dem (Nicht-)Eigentum an Artikeln zurückführen. Am Ende würde das also weniger bereichsweise entschieden werden, sondern es würde die Hauptautorenregel greifen, und das ist aber wieder schwierig umzusetzen. Jeden Artikel mit Ver- oder Gebotstags für Botbearbeitungen auszustatten halte ich für keine gute Idee, und auf Einzellinkbasis wird das schon gar nicht klappen. So gesehen: ich verstehe Deine Argumente, weiß aber nicht ob wir das so machen sollten (bzw. ob ich die Idee unterstützen soll). —MisterSynergy (Diskussion) 14:58, 3. Aug. 2017 (CEST)
    Ich fürchte, dass eine Opt-in-Variante vor allem die ohnehin schon unterversorgten (wenig beobachteten und wenig gewarteten) Artikel drastisch "ver(link)rotten" lassen würde. In den gut gepflegten Artikeln wäre die händische Pflege nach einer Botmeldung auf der Disk. vermutlich weniger ein Problem als in dem Bereich, wo sich noch nicht mal jemand findet, der ein Opt-in veranlasst. Vielleicht könnte man als Kompromiss die Opt-In-Variante dahingehend ergänzen, dass ein automatisches Opt-in erfolgt, wenn in einem Artikel seit - sagen wir einfach mal - sechs Monaten nur kleine Änderungen oder Botänderungen vorgenommen wurden? Ping hierzu auch an Benutzer:Gestumblindi. --Martina Disk. 07:38, 4. Aug. 2017 (CEST)
    Das finde ich allerdings gerade nicht günstig. Es würde bedeuten, dass in Artikeln, in denen eh nur noch botartig agierende Wartungsleute editieren, noch mehr "technische Edits" dazukommen. Wär ein klassisches Feature zur Wahrung des Scheins.--Mautpreller (Diskussion) 10:23, 4. Aug. 2017 (CEST)
    Du vermengst in diesem Abschnitt zwei Argumente. Das eine kritisiert die Bewahrung schlechter, unbrauchbarer Weblinks, die von Anfang an nicht als Quelle hätten genutzt werden sollen. Die willst du nicht in "Stahl gegossen" sehen. Und mit dir werden wahrscheinlich andere dasselbe sagen (hstt hat in eine ähnliche Richtung argumentiert). Du führst damit hier eine Grundsatzdebatte ins Feld, die du de facto verloren hast. Es werden nunmal massenhaft Weblinks als Quellen/Belege benutzt. Die stehen nicht immer in Einklang mit WP:Q-Anforderungen und viele bleiben unter dem Radar. Konsequenerweise müsstest du alle Informationen löschen, die auf (deiner Meinung nach) ungeeigneten Quellen basieren. Nur dann macht deine Forderung nach dauerhaft toten Links überhaupt Sinn. Für den Leser sieht die Information nach wie vor "belegt" aus. Er kann sie nicht einmal mehr selbst gegenprüfen und sich ein eigenes Bild von der Qualität und Verlässlichkeit der Quelle machen. Das halte ich für schlecht.
    Dein zweites wiederholtes Argument gegen botgenerierte Archivlinks: "Wahrung des Scheins". Ich finde genau das Gegenteil. Ein toter Link sieht immer noch wie ein ehemals gültiger Beleg aus - das wahrt in meinen Augen den Schein in trügerischer Weise. Die Überprüfbarkeit - ein zentraler Grund dafür, dass ein Hinweis auf die Quelle in der Zusammenfassungszeile schon lange nicht mehr genügt, - geht verloren. Der Leser und andere Wikipedianer können nicht mehr nachvollziehen, ob die Quelle brauchbar war, ob sie korrekt genutzt und wiedergegeben wurde, ob die Quelle als unbrauchbar gelöscht werden sollte, womöglich die gesamte darauf basierende Information gelöscht werden sollte. Wir zementieren diesen Zustand und wahren den Schein, wenn wir die Inhalte nicht über Alternativlinks prüfbar haben. Lieber als ein Archivlink ist mir persönlich ein Buch oder live Weblink, aber offensichtlich fasst das über lange Zeiträume neimand an. Auch ich habe die Hoffnung, dass Änderungen im Artikel doch eher auf Interesse anderer Autoren stoßen und inhaltlich geprüft werden. Wenn der Archivlink einen Bothinweis und eine Prüfbitte - sozusagen einen Wartungsbaustein - enthält, wird für den Leser eben kein Schein gewahrt. Und intern stehen die Chancen auf eine auch inhaltliche/qualitative Prüfung wesentlich höher (Stichwort Wartungsbausteinwettbewerb).
    Vor allem aber: Deine Fundamentalkritik kann ich nur dahingehend verstehen, dass du so oder so das gesamte Meinungsbild ablehnst. Du kannst später ganz einfach das MB und alle Vorschläge ablehnen. Das finde ich völlig okay. Ansonsten nehme ich auch gerne deine Vorschläge auf für bessere Formulierungen, bessere Abstimmvarianten, bessere technische Erklärungen. Du kannst dich auch gerne an der Ausformulierung der Kontra-Argumente beteiligen. Eben konstruktive Beiträge zum MB leisten. Das MB einschlafen zu lassen, weil du eine grundsätzlich andere Auffassung zu Archivlinks hast, ist aber sicher keine Lösung. --Martina Disk. 08:41, 6. Aug. 2017 (CEST)
    Ja gut, da sind wir ganz schlicht unterschiedlicher Meinung. Ein Archivlink auf einen momentanen Zustand einer Website schafft nur die Illusion der Überprüfbarkeit, und genau die sollte man eben nicht schaffen. Um das Beispiel von oben zu bemühen: Die Liste müsste entweder sehr grundlegend überarbeitet werden (was die Entfernung fast sämtlicher Belege einschließen würde) oder gelöscht werden. Alles andere bessert nichts, sondern perpetuiert nur das Übel. Es wäre besser, der Artikel würde nackt dastehen als mit einem untauglichen und auch noch technisch aufgemotzten Belegapparat. Worum es mir geht: Ich sehe ein, dass die Nutzung technischer Tools zur Auffindung toter Links sinnvoll sein kann. Ich sehe auch ein, dass unter bestimmten Bedingungen und in bestimmten Artikelfeldern Archivlinks sinnvoll sein können. Dem will ich nicht im Weg stehen. Ich erwarte aber in anderen Artikelfeldern eine massive Erschütterung der Seriosität und Brauchbarkeit der Wikipedia. Daher bin ich an Möglichkeiten interessiert, wie diese beiden Dinge miteinander zu verbinden sind. Tatsächlich glaube ich nicht, dass ein allgemein geltendes Meinungsbild dazu geeignet ist.--Mautpreller (Diskussion) 20:04, 9. Aug. 2017 (CEST)

    Idee: Pilotprojekt[Quelltext bearbeiten]

    Ja, ich seh den Haken schon. Ändert bloß nichts daran, dass ich einer flächendeckenden Einsetzung von Archivlinks niemals zustimmen könnte. Andere Idee: Wie wärs mit einem Pilotprojekt? Zeitlich begrenzter Versuch für ein begrenztes Gebiet, danach Evaluation.--Mautpreller (Diskussion) 15:06, 3. Aug. 2017 (CEST)
    Ja, da habe ich keine spontanen Bauchschmerzen mit. Es würde in jedem Fall helfen, das Botverhalten und den resultierenden Nutzen überhaupt einmal realistisch abschätzen zu können. Es bräuchte einen Themenbereich, in dem die relevanten Hauptautoren sich einig sind, und ein paar Benutzer, die das überwachen und die Ergebnisse geeignet protokollieren. Ggf. auch eine vorab definierte Notaus-Bedingung, falls was aus dem Ruder läuft. Weiterhin müsste der Testlauf mit vertretbarem Aufwand auch auf Seiten des Botbetreibers realisierbar sein. Ein Meinungsbild hielte ich danach für passender, sofern der Testlauf kein Desaster war. Wer hat dazu sonst eine Meinung? —MisterSynergy (Diskussion) 15:21, 3. Aug. 2017 (CEST)
    Halte ich für unkritisch, wenn die Stichprobe klein ist (sagen wir mal max. 100 Edits), die ZQ aussagekräftig („Testedit für Wikipedia:Meinungsbilder/Boteinsatz bei toten Links“, ggf. gefolgt von der sonst üblicherweise verwendeten ZQ) und die Aktion kurzfristig vorher auf WP:AN angekündigt wird.
    Ich würde dafür aber eher keinen spezifischen Themenbereich auswählen, sondern mehr oder minder zufällig (alle Artikel-IDs von x bis x+100 oder alphabetisch aufsteigend auf einen definierten Artikel folgend) editieren lassen, so finden die unterschiedlichsten Autoren etwas auf ihrer Beo.--Mabschaaf 18:12, 3. Aug. 2017 (CEST)

    Das wäre eine andere Variante. Hat auch was für sich, ich wäre allerdings zunächst mal an dem evtl. Nutzen für bestimmte Themengebiete interessiert und weniger an der "Overall-"Tauglichkeit.--Mautpreller (Diskussion) 19:40, 3. Aug. 2017 (CEST)

    Das wäre wohl eine Frage an den Botbetreiber, was er leisten kann: Wenn er beispielsweise eine dedizierte Kategorie abarbeiten kann, könnte das eine themenspezifische oder eine vergleichsweise allgemeine sein.--Mabschaaf 19:56, 3. Aug. 2017 (CEST)

    Klingt gut. Ich weiß allerdings nicht, woher der umseitige Opt-in-Vorschlag überhaupt stammt. Ich glaube nicht, dass diese Variante von Cyberpower678 erwähnt wurde. Benutzer:Cyberpower678: Ist ein Opt-in für einzelne Artikel oder für ausgewählte Kategorien (z.B. Kategorie:Liste (Deutsche Meister)) verfügbar? --Martina Disk. 08:29, 4. Aug. 2017 (CEST)

    Siehe oben, Abschnitt "Abstimm Version 1". Die Pilotprojekt-Idee ist allerdings als Alternative zum Opt-in-Vorschlag entstanden, und genau genommen sogar dazu, jetzt ein Meinungsbild zu veranstalten. Der Gedanke war eher, dass man an einer handhabbaren Größe mal Vorstellungen darüber gewinnt, wie sich der Boteinsatz auswirken würde.--Mautpreller (Diskussion) 10:20, 4. Aug. 2017 (CEST)
    Ja, die Idee hab ich schon kapiert. Ich glaube nur, die "Abstimm Version 2b" mit einem grundsätzlichen Opt-in hat sich irgendwer ausgedacht. In dem Katalog der Funktionalitäten ist nur von einem Opt-out für ausgewählte Links oder - via {{Nobots}} - für ausgewählte Artikel die Rede. Auch auf Meta (muss noch zuende übersetzt werden) erkenne ich nichts dergleichen. Ich frage mich daher, ob der IABot ein Opt-in überhaupt im Angebot hat. Cyberpower678 kann das beantworten. --Martina Disk. 10:36, 4. Aug. 2017 (CEST)
    Es war Grand-duc (im Zusammenspiel mit Bobo).--Mautpreller (Diskussion) 10:40, 4. Aug. 2017 (CEST)
    @Martina Nolte: IABot hat kein opt-in im Moment, aber mit https://tools.wmflabs.org/iabot/index.php?page=runbotqueue kann man IABot auf gewünschte Artikeln aufrufen.—CYBERPOWER (Diskussion) 13:29, 4. Aug. 2017 (CEST)
    Was soll denn ein Opt-In bei 2.000.000 Artikeln bringen? Das kriegen 100 Autoren mit, 10 nutzen es und decken damit einen Artikelanteil im Promillebereich ab (Zahlen zu Illustrationszwecken ausgedacht). Dafür braucht sich niemand hinzusetzen und etwas zu programmieren. Die Option würde ich persönlich nicht zur Wahl stellen, da sie zwar technisch möglich, aber sinnlos ist. Viele Grüße, Grueslayer 10:22, 4. Aug. 2017 (CEST)
    Wieso ist das sinnlos? Gegenthese: Es sind nicht "2.000.000 Artikel", in denen Archivlinks sinnvoll wären, sondern nur ein Bruchteil davon. Die Frage ist, welche. Aber wir waren hier eigentlich bei der Idee eines Pilotprojekts und nicht mehr beim Opt-in.--Mautpreller (Diskussion) 10:27, 4. Aug. 2017 (CEST)
    Nach dem Lesen und Übersetzen der Konfigurationsmöglichkeiten des IABot ist meinem Verständnis nach ein Pilotprojekt nicht in deinem Sinne machbar, Mautpreller, weil es kein Opt-in für begrenzte Artikelgruppen bzw. Kategorien gibt. Der IABot läuft wenn dann in allen Artikeln minus denen, für die händisch ein Opt-Out (via {{Nobots}}) gesetzt ist. Optionen für einen Probelauf sind daher (meinem Verständnis nach):
    • den IABot bei uns aktivieren, aber zunächst alle Optionen deaktivieren. Dann via https://tools.wmflabs.org/iabot/index.php?page=runbotqueue einzelne Artikel prüfen lassen.
    • ein Durchsuchen der als tot markierten Links (in {{Toter Link}}) in der deWP und eine Benachrichtigung mit einem Archivlink-Vorschlag oder einer Rückmeldung, dass der Link doch live ist. Ich garantiere dir aber, dass es Mecker gibt, wenn wir einen solchen Botlauf mit Flutung der Diskussionsseiten quasi im Hinterzimmer entschieden wird.
    • Eventuell kann User:Cyberpower678 den IABot anstelle der Artikeldiskussionsseiten eine Sammelliste auf einer anderen Ausgabeseite befüllen lassen? (Ich stelle mir vor, dass dort der Artikelname , der Link zum Artikel, die tote URL und der angebotene Archivlink gelistet würden. Geht das? Mautpreller, dann könntest du den Bot auf Zuverlässigkeit prüfen.

    Weitere Meinungen hierzu? Ich möchte nicht, dass der Wunsch nach einem "Probelauf" das Meinungsbild lahmlegt. Der laufene Betrieb des IABot kann ja auf enWP recht gut nachvollzogen werden. Von daher ist mir das Anliegen sowieso nicht wirklich verständlich. --Martina Disk. 07:58, 6. Aug. 2017 (CEST)

    Sehe das ähnlich. Neben der englischen Wikipedia könnte auch der Einsatz des IABot in der uns nahestehenden alemannischen Wikipedia, der anscheinend kurz bevorsteht, als "Probelauf" angesehen werden. Gestumblindi 16:56, 6. Aug. 2017 (CEST)
    Prima! Danke für den Hinweis. :-) --Martina Disk. 22:27, 6. Aug. 2017 (CEST)

    Probelauf Physik[Quelltext bearbeiten]

    Ich habe das Portal Physik gefragt. --mfb (Diskussion) 00:26, 7. Aug. 2017 (CEST)
    Wenn ich das recht sehe, sind Co-Initiatorin Martina und ich uns hier einig, im Rahmen dieses Meinungsbildes eher keine Option "Probelauf" anbieten zu wollen. Wie gesagt: Andere Wikipedien bzw. Wikimedia-Projekte, die den Bot bereits einsetzen, reichen zur Demonstration eigentlich völlig aus. Gestumblindi 00:33, 7. Aug. 2017 (CEST)
    Schadet es? Es hängt nichts davon ab. Sofern es nicht zu viel Aufwand ist, sehe ich keine Nachteile. --mfb (Diskussion) 09:26, 7. Aug. 2017 (CEST)
    Hat die Zustimmung des Portals. Falls ihr Beispieledits in deutschsprachigen Artikeln machen wollt, können die gerne in Artikeln in der Kategorie:Physik und Unterkategorien gemacht werden. --mfb (Diskussion) 13:39, 7. Aug. 2017 (CEST)
    @mfb: Für alle 12217 Seiten im Kategoriebaum der Physik? Ich habe Sorge, dass dies das Meinungsbild zu lange auf Eis legen würde, bis ihr alle Änderungen prüfen und hier eine Rückmeldung geben könntet. Ich kann mir aber inzwischen gut vorstellen, eine Liste mit - sagen wir - 500 Artikellinks zu erstellen und in einen Probelauf zu schicken (311 hab ich schon zusammen :-) ). Vorher muss noch eine lokale #Dead-link.js mit Cyberpower678 abgestimmt werden. Und ihr müsstet im Probelauf erstmal mit den englischen Seiten umgehen (FAQ, Falschpositive melden.) Wäre das okay?
    @Gestumblindi: Einen sehr (!) kleinen Probelauf mit ein paar Hundert Artikeln fände ich vielleicht doch ganz gut. Das wird auch deutlich machen, welche anderen Vorbereitungen noch nötig sind (Versionsimporte?, Übersetzungen, Vorlagen erstellen, Projektseiten anpassen usw.) Was meinst du? --Martina Disk. 07:47, 8. Aug. 2017 (CEST)
    @Martina Nolte: Einen sehr kleinen Probelauf in einem definierten Bereich mit Zustimmung bzw. auf Wunsch eines Portals könnte ich mir auch vorstellen - das wäre dann aber, denke ich, Bestandteil der Vorbereitung des Meinungsbildes und nichts, worüber hier abgestimmt werden soll, oder? Gestumblindi 13:15, 8. Aug. 2017 (CEST)
    Genau. Sobald Cyberpower die dealink.js eingerichtrt hat, kann ich den Probelauf starten i--Martina Disk. 15:43, 8. Aug. 2017 (CEST)
    Wie weiter oben besprochen, dachten wir an rund 100 Edits. Die sind innerhalb eines Tages problemlos überprüft. 300-500 gehen auch, das bedeutet trotzdem eine Rückmeldung zu 100+ Artikeln innerhalb eines Tages und mehr danach. --mfb (Diskussion) 17:54, 8. Aug. 2017 (CEST)
    mfb: Oh, okay - das hatte ich uebersehen. Dann sind wir uns ja einig. Klasse - danke! --Martina Disk. 20:26, 8. Aug. 2017 (CEST)

    Probelauf Schach[Quelltext bearbeiten]

    Das Portal:Schach hat auch nichts gegen einen Probelauf in den Schachartikeln. 129.13.72.198 13:41, 7. Aug. 2017 (CEST)
    Hast du bitte einen Link zu dieser Entscheidung des Portals? --Martina Disk. 07:47, 8. Aug. 2017 (CEST)

    kein Probelauf[Quelltext bearbeiten]

    Ich hatte ein Botflag beantragt. Dort stellte sich heraus, dass für einen Testlauf von 100 Edits kein Botflag erforderlich ist, aber ein Geschwindigkeitslimit (Edits pro Minute) gilt, dss der IABot wohl nicht einhalten kann. Oder so. Der Forderungskatalog, den Einzelne dort aufstellen, reicht von hier an den Mond. Das halte ich nicht für angemessen für einen simplen Test und würde sagen, wir sagen das dann mal ab. Oder was meinst du, Gestumblindi ? --Martina Disk. 20:57, 10. Aug. 2017 (CEST)

    Antworten von PerfektesChaos könnte man auch ohne Unterschrift erkennen: typischerweise in Form einer Aufzählung und recht lang ;-) - Nun, einen Probelauf fand ich von Anfang an zwar denkbar, aber nicht wirklich notwendig, da man bereits in anderen Wikipedien nachvollziehen kann, wie der Bot so arbeitet. Insofern können wir den Probelauf-Vorschlag gerne vergessen. Gestumblindi 21:29, 10. Aug. 2017 (CEST)
    Wobei ein Testwiki keine schlechte Idee ist. Viele Grüße, Grueslayer 21:52, 10. Aug. 2017 (CEST)
    100 Edits wären von einem sehr aktiven Portal sehr zeitnah gepflegt worden. Niemand von denen, die sich einen Testlauf vor einem MB gewünscht haben, hat sich bei den Botanfragen beteiligt und sich für den Testlauf eingesetzt. Das wäre viel schneller und einfacher zu haben gewesen, als alles nochmal von vorne in einem nochmal anderen Wiki vorzubereiten. Ich jedenfalls hab wenig Interesse meine Zeit mit strategischen Winkelzugspielen zu verbringen und mich von Pontius nach Pilatus schicken zu lassen. Wer einen Testlauf braucht, um sich eine Meinung zu bilden, müsste sich dann jetzt selbst kümmern.
    Cyberpower wird den Bot nicht ohne "offizielle Erlaubnis" laufen lassen. Kann ich gut nachvollziehen; der will sich vermutlich nicht die Finger verbrennen. Wenn ihm der Botflag nicht für einen Probelauf gegeben und ihm nicht mal für einen kleinen Probelauf ein Okay auf einer Funktionsseite - sinnigerweise bei den Botanfragen - zugestanden wird, gibt es halt keinen Probelauf.
    Der Bot läuft seit Jahren. Bearbeitungslisten auf diversen Wikis sind schon jetzt einsehbar. Ich werde aber - sobald ich die Einzelheiten genug verstanden habe - eine Vorher-Nachher-Liste erstellen, wo jeder sehen kann, was der Bot aus verschieden formatierten Links macht und wie der Unterschied in verschiedenen Vorlagen aussieht. Für Leute wie mich, die von den programmiertechnischen Details keinen Plan haben, wird das hilfreich sein, um sich eine eigene Meinung zu bilden. --Martina Disk. 05:59, 11. Aug. 2017 (CEST)
    Ich hab mir ein paar zufällige Botergebnisse auf der englischen Wikipedia angesehen und war nicht begeistert. Mehrere Beispiele dafür stehen oben. Habe also sehr wohl "Tests" gemacht. Ich "brauche" einen Testlauf nicht, um mir eine Meinung zu bilden, ob man einen derartigen Bot auf den ANR loslassen soll, damit habe ich nie hinter dem Berg gehalten. Ich würde mir eher so etwas wünschen, um den Nutzen der Markierung toter Links und des Vorschlagens von Archivlinks (womöglich nicht im ANR) abschätzen zu können. Bislang ist da kaum Material vorgelegt worden, lediglich riesige Zahlen. Bei jedem konkreten Beispiel, das ich mir bislang angeguckt habe (s.o.), war der Nutzen gering, zum Teil entstand Schaden. Nur in Ausnahmefällen war mit dem Archivlink etwas anzufangen. Ich halte es aber für glaubwürdig, was Mister Synergy sagte: Es gibt Bereiche (offensichtlich nicht "meine"), wo Archivlinks nützlich wären. Nur um das zu verifizieren, habe ich ein Pilotprojekt vorgeschlagen. Im Sinne des Meinungsbilds mag das nicht "konstruktiv" sein, denn bei positivem Verlauf würde das heißen: In bestimmten Bereichen wäre der Bot nützlich. Es würde also weiterhin auf Ablehnung des MB in der vorgelegten Form hinauslaufen, jedoch auf die Nutzung des Bots in begrenzten Teilbereichen. Ich würde das für einen Erkenntnisgewinn halten.--Mautpreller (Diskussion) 13:33, 11. Aug. 2017 (CEST)
    Dann war dein Vorschlag wohl nur eine Finte. Bin ich glatt drauf reingefallen. Naja, dann wissen wir das ja jetzt. --Martina Disk. 15:39, 11. Aug. 2017 (CEST)
    Allmählich beginne ich mich zu ärgern. Das steht doch dort alles schon: Test der Tauglichkeit für begrenzte Gebiete, als Alternative zum MB "jetzt" (Diskussion mit MisterSynergy), dass ich einem flächendeckenden Boteinsatz im ANR nie zustimmen würde, hab ich nun schon oft genug gesagt. Was heißt da "Finte"? Ich glaube wirklich und ganz ernsthaft, dass ein Test in einem begrenzten Gebiet vor allem mal was dafür hergeben würde, was eigentlich konkret das Problem ist, wie groß es ist, welche Bereiche es betrifft und was Archivlinks da an Nutzen und Schaden bringen könnten. Das würde auch für den Fall Informationen bieten, dass ein Bot nicht im ANR agiert, sondern Archivlinks auf der Disk vorschlägt. D.h. mich interessiert anlässlich des MB, wo und wann Archivlinks überhaupt von Nutzen sind. Du magst das für eine abwegige Frage halten, ich seh das anders. Täuschung kannst Du mir aber gewiss nicht vorwerfen.--Mautpreller (Diskussion) 17:41, 11. Aug. 2017 (CEST)
    Ok dann hatte ich dich falsch verstanden. Wenn du eine gänzlich andere Einsatzidee für den Bot hast, als wir hier zum MB vorbereiten, steht es dir selbstverständlich frei diese vorzubereiten und auf den entsprechenden Kanälen vorzuschlagen. --Martina Disk. 20:29, 11. Aug. 2017 (CEST)

    doch Probelauf[Quelltext bearbeiten]

    @mfb, Cyberpower678: Wir haben von MBq (Bürokrat) jetzt doch ein Okay für einen Testlauf bekommen. Danke an Cirdan für die Mithilfe beim Antrag! Cyberpower678, dies ist eine offizielle Erlaubnis für einen eingeschränkten Zweck (100 Testedits), noch kein Botflag und noch ohne das Sichterrecht. Über die grundsätzliche Erlaubnis für den IABot wird das Meinungsbild entscheiden. Ich weiß ja, dass du auf der Wikimania bist, also keine Eile. Bitte sag mir Bescheid, wenn runbotsingle und runbotqueue aktiv sind und ich den Testlauf starten kann. Ich möchte vorher zwei, drei Artikel einzeln testen, um sicherzustellen, dass meine Texte in Zusammenfassungszeilen und auf Diskussionsseiten korrekt dargestellt werden. Es wäre auch klesse, wenn bis dahin die {{subst:plural:... von hier in die Dead-links.js übernommen werden könnten. (Es sieht derzeit so aus, als wären die schon alle gesubstet und in die Pluralform festgeschrieben worden.) Muss ich noch etwas anderes wissen doer beachten? --Martina Disk. 04:49, 13. Aug. 2017 (CEST)

    Sehe JS Diskussionsseite.—CYBERPOWER (Diskussion) 15:20, 13. Aug. 2017 (CEST)

    Dead-link.js[Quelltext bearbeiten]

    User:Cyberpower678: Egal ob für den Probelauf oder später nach Annahme des Meinungsbilds oder sogar bei Ablehnung der Bearbeitungen im Artikelnamensraum (main pages) - früher oder später brauchst du sowieso Übersetzungen für eine lokale Dead-links.js. Dafür kannst du die folgende Tabelle (unten) benutzen. Ich habe diejenigen Parameter/Werte gesetzt, deren Annahme ich für am wahrscheinlichsten halte. Auch für einen begrenzten Probelauf wären das m.E. erstmal die besten Optionen. Sag Bescheid, wenn etwas unklar ist oder ich etwas flasch verstanden habe oder wenn du glaubst, dass etwas so nicht gut funktionieren kann. Danke! --Martina Disk. 07:47, 8. Aug. 2017 (CEST)

    @Martina Nolte: touch_archive ist aktiv in deiner Tabelle. touch_archive überschreibt existierende Arkiv URLs mit was der Bot für richtig hält. Ich glaube nicht das dewiki das Akzeptieren wird. archive2_tags und archive3_tags sind unzulässige Werte. Die gehören im cite_tags Parameter. Die solltest du in Ruhe lassen. notify_error_on_talk ist wenn die Wayback Machine eine Quelle nicht archivieren kann. Dabei tut sich sowieso nichts wenn archive_alive aus ist. Die solltest du vielleicht aus lassen.—CYBERPOWER (Diskussion) 16:49, 8. Aug. 2017 (CEST)
    Übrigens gibt es auch m:InternetArchiveBot/FAQ.—CYBERPOWER (Diskussion) 16:50, 8. Aug. 2017 (CEST)
    @Martina Nolte: Benutzer:InternetArchiveBot/Dead-links.jsCYBERPOWER (Diskussion) 17:30, 8. Aug. 2017 (CEST)
    @Cyberpower678:: Vielen Dank!
    touch_archive auf 0 erledigt Erledigt
    notify_error_on_talk auf 0 erledigt Erledigt
    archive2_tags ✔ Ok
    cite_tags (das ist nicht <ref>/,ref name="">?) finde ich nirgends in der Dead-links.js. In deWP sind das {{Webarchiv}}, {{Internetquelle}}, {{Cite web}}.
    In Benutzer:InternetArchiveBot/Dead-links.js sind offenbar alle {{subst:plural:... schon gesubstet worden? :-( Ich hoffe, es werden Leerzeilen eingefügt?
    Bot Flag: ich guck nachher mal, wo du das kriegst. --Martina Disk. 21:03, 8. Aug. 2017 (CEST)
    @Martina Nolte: Da musst du wohl die ContentModel ändern. Spezial:ChangeContentModel macht das für dich. Stell es auf JSON.—CYBERPOWER (Diskussion) 21:07, 8. Aug. 2017 (CEST)
    Zum Botflag hier entlang bitte: WP:BOT/BFA. Allerdings werden Testedits dort für gewöhnlich ohne Flag durchgeführt. Hier scheinen es ein paar mehr zu sein *schulterzuck* – Giftpflanze 21:51, 8. Aug. 2017 (CEST)
    @User:Cyberpower678: Nur Administratoren können Spezial:ChangeContentModel sehen und ändern. Was ist JSON? Das wird jetzt zu technisch für mich. Hier müsste Gestumblindi einsteigen. Bitte sagt mir Bescheid, wenn der IABot sozusagen "scharfgeschaltet" ist. Ich möchte und vielleicht möchte ja auch noch jemand anderes ein paar ausgewählte Artikel gezielt einzeln testen, bevor wir den größeren Physik-Testlauf starten.
    Giftpflanze: Danke! Ich hab ein Botflag beantragt.
    Und nochmal an Cyberpower678: Kannst du die {{subst:plural:... (aus der Tabelle unten) so in das Dead-links.js übernehmen, dass die Zusammenfassungszeilen, Überschriften und Nachihten nachher wahlweise in Singular doer Plural ausformuliert werden? Außerdem: Willst du die Benutzerseite des Benutzer:InternetArchiveBot selbst ins Deutsche übersetzen, oder bist du einverstanden, wenn das jemand anderes macht? --Martina Disk. 04:19, 9. Aug. 2017 (CEST)

    **link_scan** 1
    **page_scan** 0
    **dead_only** 0
    **tag_override** 1
    **archive_by_accessdate** 1
    **touch_archive** 0
    **notify_on_talk** 1
    **notify_error_on_talk** 0
    **talk_message_header** "{{subst:plural:{linksrescued}|Defekter Weblink|Defekte Weblinks}}"
    **talk_message** " {{nicht archivieren|Zeigen=nein}}


    {{Kasten|1={{subst:plural:{linksrescued}|Der folgende Weblink wurde|Die folgenden {linksrescued} Weblinks wurden}} von einem Bot („InternetArchiveBot“) als nicht erreichbar erkannt.
    * Ausführliche Erläuterungen und Hilfe zur korrekten Behebung {{subst:plural:{linksrescued}|dieses Fehlers|dieser Fehler}} finden sich auf [[Wikipedia:Defekte Weblinks]] und in der [[:en:Benutzer:Cyberpower678/FaQs#InternetArchiveBot|FAQ des Bots]] (englisch; lokale FAQ wird noch erstellt).
    * Ist ein von einem Bot als defekt gemeldeter externer Link doch erreichbar, dann bitte [https://tools.wmflabs.org/iabot/index.php?page=reportfalsepositive hier berichten]. Sonstige Probleme mit dem Bot bitte [[Benutzer Diskussion:Cyberpower678|hier melden]]. }}

    Der Bot hat mit [{diff} dieser Bearbeitung] {{subst:plural:{linksrescued}|diesen Weblink|diese {linksrescued} Weblinks}} im Artikel [[{namespacepage}]] verändert:
    {modifiedlinks}

    Bitte prüfe die {{subst:plural:{linksrescued}|Bearbeitung|Bearbeitungen}} und lösche dann diesen Eintrag. "

    **talk_message_header_talk_only** "{{subst:plural:{linksrescued}|Defekter Weblink|Defekte Weblinks}}"
    **talk_message_talk_only** " {{nicht archivieren|Zeigen=nein}}


    {{Kasten|1={{subst:plural:{linksrescued}|Der folgende Weblink wurde|Die folgenden {linksrescued} Weblinks wurden}} von einem Bot („InternetArchiveBot“) als nicht erreichbar erkannt.
    * Ausführliche Erläuterungen und Hilfe zur korrekten Behebung {{subst:plural:{linksrescued}|dieses Fehlers|dieser Fehler}} finden sich auf [[Wikipedia:Defekte Weblinks]] und in der [[:en:Benutzer:Cyberpower678/FaQs#InternetArchiveBot|FAQ des Bots]] (englisch; lokale FAQ wird noch erstellt).
    * Ist ein von einem Bot als defekt gemeldeter externer Link doch erreichbar, dann bitte [https://tools.wmflabs.org/iabot/index.php?page=reportfalsepositive hier berichten]. Sonstige Probleme mit dem Bot bitte [[Benutzer Diskussion:Cyberpower678|hier melden]]. }}

    Der Bot hat {{subst:plural:{linksrescued}|diesen defekten Weblink|diese {linksrescued} defekten Weblinks}} im Artikel [[{namespacepage}]] gefunden:
    {modifiedlinks}

    Bitte prüfe und korrigiere {{subst:plural:{linksrescued}|den Weblink|die Weblinks}} und lösche dann diesen Eintrag." "

    **talk_error_message_header** "Probleme beim Archivieren {{subst:plural:{linksrescued}|eines|von}} Weblinks"
    **talk_error_message** " {{nicht archivieren|Zeigen=nein}}


    {{Kasten|1={{subst:plural:{linksnotrescued}|Der folgende Weblink konnte|Die folgenden {linksnotrescued} Weblinks konnten}} von einem Bot („InternetArchiveBot“) nicht archiviert werden.
    * Ausführliche Erläuterungen und Hilfe zur korrekten Behebung {{subst:plural:{linksrescued}|dieses Fehlers|dieser Fehler}} finden sich auf [[Wikipedia:Defekte Weblinks]] und in der [[:en:Benutzer:Cyberpower678/FaQs#InternetArchiveBot|FAQ des Bots]] (englisch; lokale FAQ wird noch erstellt).
    * Ist ein von einem Bot als defekt gemeldeter externer Link doch erreichbar, dann bitte [https://tools.wmflabs.org/iabot/index.php?page=reportfalsepositive hier berichten]. Sonstige Probleme mit dem Bot bitte [[Benutzer Diskussion:Cyberpower678|hier melden]]. }}

    Bei der Archivierung hat der Bot für {{subst:plural:{linksnotrescued}|diesen Weblink|diese {linksnotrescued} Weblinks}} folgende Fehlermeldungen erhalten:
    {problematiclinks}
    Der Bot wird keine weiteren Versuche zur Archivierung {{subst:plural:{linksnotrescued}|dieses|dieser}} Weblinks unternehmen. "

    **deadlink_tags** "{{Toter Link}}" "{{Internetquelle}}" (offline=ja )
    **archive1_tags**
    **archive2_tags**
    **archive3_tags**
    **paywall_tags** "{{Subscription required}}"
    "{{Registration required}}"
    **verify_dead** 1
    **archive_alive** 0
    **notify_on_talk_only** 0
    **convert_archives** 1
    **mladdarchivetalkonly** "{link} wurde als defekt erkannt. Vielleicht ist eine archivierte Version geeignet: {newarchive}"
    **mltaggedtalkonly** "{link} wurde als defekt erkannt. Der Bot hat keine Archivversion in der [[Wayback Machine]] gefunden. Andere Archive wie [[WebCite]] und [[Archive.today|Archive.is]] wurden nicht geprüft."
    **mltagremovedtalkonly** "{link} wurde als tot markiert, aber der Bot erkennt ihn als live (aufrufbar). Bitte prüfe den Link und entferne ggf. im Artikel die Markierung als toter Link."
    **mladdarchive** "Der Bot hat die URL {link} um den Archivlink {newarchive} ergänzt."
    **mlmodifyarchive** "Der Bot hat für die URL {link} den früheren Archivlink {oldarchive} durch den neuen Archivlink {newarchive} ersetzt."
    **mlfix** "Der Bot hat die Formatierung/Syntax der URL {link} korrigiert."
    **mltagged** "Der Bot hat für die URL {link} die Vorlage {{Vorlage|Toter Link}} eingefügt."
    **mltagremoved** "Der Bot hat für die URL {link} die Vorlage {{Vorlage|Toter Link}} entfernt."
    **mldefault** "Der Bot hat einen Einzelnachweis mit der URL {link} verändert. "
    **plerror** "{problem} ergab Fehlermeldung: {error}"
    **maineditsummary** "Testedit für [[Wikipedia:Meinungsbilder/Boteinsatz bei toten Links]]: {linksrescued} Archivlink(s) ergänzt und {linkstagged} Links als defekt/tot markiert."
    **errortalkeditsummary** "Botbenachrichtigung über Fehler beim Versuch der Archivierung von Links"
    **talkeditsummary** "Testedit für [[Wikipedia:Meinungsbilder/Boteinsatz bei toten Links]]: veränderte Links in Einzelnachweisen; bitte überprüfen"

    Fragen an Cyberpower[Quelltext bearbeiten]

    @User:Cyberpower678: Nachdem ich m:InternetArchiveBot nach m:InternetArchiveBot/de übersetzt habe (ich hoffe, das prüft noch jemand mit besserem technischen Verständnis), habe ich ein paar neue Fragen:

    Im umseitigen Entwurf für das Meinungsbild kündigen wir an, dass der IABot im Artikel einen zusätzlichen Hinweis (i Info:) an den Link anhängen kann.

    • Beispiel: Aus dem ursprünglichen Einzelnachweis
      Abwasserbeseitigung. Abgerufen am 13. Februar 2011.

    soll nach der Botbearbeitung werden:

    • Abwasserbeseitigung. Archiviert vom Original am 13. Februar 2011, abgerufen am 13. Februar 2011.
      i Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft (bitte prüfe den Link gemäß Anleitung und entferne dann diesen Hinweis)

    In den Konfigurationsoptionen ist für mich nicht erkennbar, wie ein solcher Hinweis angebracht werden könnte. Offenbar kann man in der Dead-links.js nur Formulierungen für die Zusammenfassungszeile (...editsummary) und für Nachrichten auf der Diskussionsseite festlegen, nicht aber für die Bearbeitungen im Artikel selbst. Verstehe ich das richtig? Würdest du das noch für die deutschsprachige Wikipedia programmieren können und wollen, falls dies eine Bedingung für die Annahme des Meinungsbildes ist? (Sonst müssen wir das aus dem Entwurf nehmen. Kann man machen, aber ich schätze die Chancen schlechter ein, wenn ein bot-generierter Link nicht als solcher kenntlich gemacht wird).

    In den Konfigurationsoptionen gibt es die Möglichkeit citation_tags, talk_only_tag, no_talk_tags, ignore_tags aufzulisten. In en:User:InternetArchiveBot/Dead-links.js finde ich die aber nicht wieder.

    • <ref> und <ref name=""> sind vermutlich sowieso dieselben Steuerungsparameter wie in der englischen Wikipedia. Könnten auch noch andere citation tags in Frage kommen und wie würde das mit dem IABot kommuniziert?
    • Du hast geschrieben, in der enWP wird no_talk_tags gesteuert mit der Vorlage: {{cbnotalk}} Wie wird das mit dem IABot kommuniziert? Wie würde dies auf deWP gesteuert?
    • Die gleiche Frage gilt für talk_only_tag und {{cbtalkonly}}
    • Wie wird ignore_tags gesteuert?
    • en:User:InternetArchiveBot/Dead-links.js listet paywall_tags; diese Funktion ist auf m:InternetArchiveBot#Configuration nicht dokumentiert. Was hat es damit auf sich?

    Außerdem habe ich die rund 500 bekannten false positives in reportfalsepositive eingetragen (c&p'd) und erhielt die Meldung. These URLs were not found in the DB and will be ignored für die gesamte Linkliste. Jetzt frage ich mich, wie wir diese schon bekannten Links in den IABot einspeisen könnten, um Doppelmeldungen zu vermeiden.

    Danke im Voraus für deine Antworten! --Martina Disk. 08:00, 6. Aug. 2017 (CEST)

    Die false positives findest du eher hier: WP:Defekte Weblinks/Bot2015-Problem/Archiv, oder hier: toollabs:giftbot/exceptionsGiftpflanze 13:02, 6. Aug. 2017 (CEST)
    Danke, Giftpflanze! Das Ergebnis der Meldung dieser Links an den IABot hab ich in eine Klappbox hierunter übertragen. Ich weiß nicht, wieso mein Account der "English Wikipedia" zugeordnet wird und ob das irgendeine Auswirkung auf die Verarbeitung hat. Am wenigtsen verstehe ich die Rückmeldung "These URLs were not found in the DB and will be ignored:". Welche Datenbank und was bedeutet das für die Verarbeitung meienr Meldung, User:Cyberpower678? Irritierend ist auch, dass man nach dem Senden keine Bestätigung bekommt, sondern stattdessen eine Aufforderung sich (nochmal) anzumelden: "Login required. To use the tools on this interface, you must be logged in with your Wikipedia account. Login to get started." --Martina Disk. 22:20, 6. Aug. 2017 (CEST)
    :IABot-Rückmeldung nach Eingabe der false positives des GiftBots and IABot:

    6. August 2017, GiftBot-Liste an IABot

    IABot Management Interface

       Run Bot
       Manage URL Data
       Submit Bug Report
       Meta
    
       English Wikipedia
       Martina Nolte
    

    Report false positives Please review the following URLs and confirm that they are really not dead. These URLs will be reported as false positives and reset in the DB later:

       http://www.austchartbook.com.au/ (NO RESPONSE FROM SERVER)
       http://www.penguins.co.nz/ (NO RESPONSE FROM SERVER)
       http://www.vd17.de/ (NO RESPONSE FROM SERVER)
       http://www.manyue.com/ (NO RESPONSE FROM SERVER)
       http://www.cm-serpa.pt/ (NO RESPONSE FROM SERVER)
       http://www.sciglass.info/ (NO RESPONSE FROM SERVER)
       http://www.vingtsun.org.hk/ (NO RESPONSE FROM SERVER)
       http://www.comune.bormio.so.it/ (NO RESPONSE FROM SERVER)
       http://www.whiteestate.org/ (NO RESPONSE FROM SERVER)
       http://www.michelle-rodriguez.com/ (NO RESPONSE FROM SERVER)
       http://www.comunemarianopoli.it/ (NO RESPONSE FROM SERVER)
       http://www.pfcslavia.com/ (NO RESPONSE FROM SERVER)
       http://www.comune.anzio.roma.it/ (NO RESPONSE FROM SERVER)
       http://www.comune.castelbuono.pa.it/ (NO RESPONSE FROM SERVER)
       http://www.almanzowilderfarm.com/ (NO RESPONSE FROM SERVER)
       http://www.unistrasi.it/ (NO RESPONSE FROM SERVER)
       http://www.pawpaw.kysu.edu/ (NO RESPONSE FROM SERVER)
       http://www.basiliquenddm.org/ (NO RESPONSE FROM SERVER)
       http://www.burghofspiele.com/ (NO RESPONSE FROM SERVER)
       http://www.toursanluis.com/ (NO RESPONSE FROM SERVER)
       http://www.karin-keller-sutter.ch/ (NO RESPONSE FROM SERVER)
       http://www.orlandosanfordairport.com/ (NO RESPONSE FROM SERVER)
       http://www.comune.issime.ao.it/ (NO RESPONSE FROM SERVER)
       http://destroyerhistory.org/ (NO RESPONSE FROM SERVER)
       http://www.jys.gov.cn/ (NO RESPONSE FROM SERVER)
       http://www.comune.biccari.fg.it/ (NO RESPONSE FROM SERVER)
       http://www.linxixian.gov.cn/ (NO RESPONSE FROM SERVER)
       http://www.ktf.kz/ (NO RESPONSE FROM SERVER)
       http://www.ktf.kz/ (NO RESPONSE FROM SERVER)
       http://icie.zkm.de/ (NO RESPONSE FROM SERVER)
       http://www.bellwitch.org/ (NO RESPONSE FROM SERVER)
       http://borex.lngs.infn.it/ (NO RESPONSE FROM SERVER)
       http://www.tanghe.gov.cn/ (NO RESPONSE FROM SERVER)
       http://www.anguo.gov.cn/ (NO RESPONSE FROM SERVER)
       http://www.xushui.gov.cn/ (NO RESPONSE FROM SERVER)
       http://www.qingxian.gov.cn/ (NO RESPONSE FROM SERVER)
       http://www.qianxi.gov.cn/ (NO RESPONSE FROM SERVER)
       http://www.cmmaputo.gov.mz/ (NO RESPONSE FROM SERVER)
       http://www.rma.org.bt/ (NO RESPONSE FROM SERVER)
       http://www.reconversionbcv.org.ve/ (NO RESPONSE FROM SERVER)
       http://www.xuefeiyang.com/ (NO RESPONSE FROM SERVER)
       http://www.ville.namur.be/ (NO RESPONSE FROM SERVER)
    

    These URLs were not found dead and will be reset in the DB immediately:

       http://www.3dlabs.com/
       http://www.samos.gr/
       http://bpb.pharm.or.jp/
    

    These URLs are already alive or have since been whitelisted and will not be reported:

       http://botprize.org/
       http://dvdadecoder.sourceforge.net/
       http://econ.worldbank.org/external/default/main?ImgPagePK=64202990&entityID=000094946_03032704080562&menuPK=64168175&pagePK=64210502&theSitePK=477938&piPK=64210520
       http://icarus.lngs.infn.it/
       http://knutepunkt.laiv.org/2009/book/LarpInKamenskyForest/kp09_LarpInKamenskyForest.pdf
       http://maltarailway.com/
       http://scn.sap.com/
       http://www.abc.org.uk/
       http://www.aiud.ro/
       http://www.alphornmusik.ch/
       http://www.anathema.ws/
       http://www.anm.org.br/
       http://www.annebishop.com/
       http://www.arte-quartett.com/
       http://www.automobilmuseum.no/
       http://www.aytojaen.es/
       http://www.bankofscotland.co.uk/
       http://www.barbaracartland.com/
       http://www.barometerworld.co.uk/
       http://www.bekescsaba.hu/
       http://www.benbova.net/
       http://www.bifan.kr/
       http://www.brun.li/
       http://www.burg-gutenberg.li/
       http://www.catedraldeburgos.es/
       http://www.cjteleorman.ro/
       http://www.cm-coimbra.pt/
       http://www.cm-obidos.pt/
       http://www.co.nobles.mn.us/
       http://www.cobx.org/
       http://www.comune.taranto.it/
       http://www.der-club.de/
       http://www.dimbola.co.uk/
       http://www.donglan.gov.cn/
       http://www.eggersriet.ch/
       http://www.entlebuch.ch/
       http://www.epfischer.com/
       http://www.es.govt.nz/
       http://www.fcg.gx.cei.gov.cn/
       http://www.floggingmolly.com/
       http://www.flugplatz-mollis.ch/
       http://www.fortstocktonpioneer.com/
       http://www.gaoyang.gov.cn/
       http://www.garyversace.com/
       http://www.glattfelden.ch/
       http://www.gleckstein.ch/
       http://www.goto.jobs/
       http://www.gustav-mahler.org/
       http://www.hamden.com/
       http://www.haworthia.info/
       http://www.hedingen.ch/
       http://www.hellevoetsluis.nl/
       http://www.hnyanling.gov.cn/
       http://www.hollandiahuette.ch/
       http://www.huinanxian.gov.cn/
       http://www.ipda.org.br/
       http://www.irtad.net/
       http://www.jan-klein.de/
       http://www.jawor.pl/
       http://www.jennersdorf.eu/
       http://www.jinr.ru/
       http://www.johanniskirchturm.de/
       http://www.kazakhstanlive.com/
       http://www.kingloek.nl/
       http://www.kirchengesangsbund.ch/
       http://www.kultur-in-buer.de/
       http://www.laishui.gov.cn/
       http://www.langendorf-so.ch/
       http://www.laphroaig.com/
       http://www.lauderchabad.at/
       http://www.mahedrysdale.com/
       http://www.mainzer-dom.de/
       http://www.marcochiudinelli.com/
       http://www.mariariccardawesseling.com/
       http://www.meganlindholm.com/
       http://www.mein-nein.de/
       http://www.menkemaborg.nl/
       http://www.mtm-vereinigung.at/
       http://www.mu-staremesto.cz/
       http://www.nantung.com/
       http://www.naturland.de/
       http://www.newknoxville.com/
       http://www.nydegg.ch/
       http://www.oberaarjochhuette.ch/
       http://www.pauluskirche.ch/
       http://www.peaceculture.net/
       http://www.philzone.com/
       http://www.porta-marathon.de/
       http://www.rachelcarson.org/
       http://www.robertdeansmith.com/
       http://www.robinhobb.com/
       http://www.roland-dahinden.ch/
       http://www.royaldaring.be/
       http://www.runducity.iway.na/
       http://www.ruralartdeco.co.nz/
       http://www.sanlorenzomaggiorenapoli.it/
       http://www.smurfitkappa.com/
       http://www.sportfreunde-katernberg.de/
       http://www.st-johann-hb.de/
       http://www.starrigger.net/
       http://www.stationsweb.nl/
       http://www.stimmhorn.ch/
       http://www.stmartin-in-the-fields.org/
       http://www.tapi.info/
       http://www.tebasa.com.ar/
       http://www.thegabba.com.au/
       http://www.toffen.ch/
       http://www.topfield.co.kr/
       http://www.touralsace.fr/
       http://www.tsv-amicitia-viernheim.de/
       http://www.uelenart.com/english3.htm
       http://www.vaugneray.com/
       http://www.vicigaming.com/
       http://www.villageofossining.org/
       http://www.visitator-ermland.de/
       http://www.visitorlando.com/
       http://www.vkp.de/
       http://www.vrenischneider.ch/
       http://www.welland.ca/
       http://www.weststellingwerf.nl/
       http://www.whitesnake.com/
       http://www.whiteturf.ch/
       http://www.winkelhock.de/
       http://www.wolfhalden.ch/
       http://www.xbp.gov.cn/
       http://www.xq.gov.cn/
       http://www.yks.gov.cn/
       http://www.zdnet.co.kr/news/news_view.asp?artice_id=20100520113301&type=det
       http://www.zend.com/
    

    These URLs are already reported and will be ignored:

    These URLs were not found in the DB and will be ignored:

       ftp://ftp.met.fsu.edu/pub/weather/tropical/*
       http://193.205.158.207:8082/*
       http://203.155.220.239/*
       http://90.146.8.18/*
       http://allafrica.com/*
       http://altfrankfurt.com/*
       http://anthro.palomar.edu/
       http://apimusic.org/*
       http://app.statistics.sk/*
       http://arbeitsinspektion.gv.at/*
       http://archiv.mopo.de/*
       http://archiv.sachsen.de/*
       http://arhangelskstat.ru/*
       http://armenianstudies.csufresno.edu/*
       http://assets.chemportals.merck.de/documents/sds/emd/deu/de/*
       http://audio.cimec.ro/*
       http://australian-charts.com/*
       http://austriancharts.at/*
       http://avalon.law.yale.edu/*
       http://babel.de/art2005*.html
       http://bases.athle.com/*
       http://beacon.findbuch.de/*
       http://biographies.parliament.uk/*
       http://bisds.infosys.iab.de/*
       http://bivouac.com/*
       http://blazkavcic.com/eng
       http://blogs.ottawacitizen.com/*
       http://botu07.bio.uu.nl/*
       http://boxrec.com/*
       http://brunelleschi.imss.fi.it/*
       http://buecher.heilpflanzen-welt.de/*
       http://buendersv.de/
       http://catalogus-professorum-halensis.de/*
       http://charts.org.nz/*
       http://chessmetrics.com/*
       http://collections.europeanalocal.de/*
       http://cometography.com/*
       http://content.karger.com/*
       http://content.stuttgarter-zeitung.de/*
       http://cultura.gencat.cat/*
       http://danishcharts.com/*
       http://data.biathlonworld.com/*
       http://daten.bwb.org/*
       http://delta-intkey.com/*
       http://denkmalverzeichnis.magdeburg.de/*
       https://depatisnet.dpma.de/*
       http://deu.archinform.net/*
       http://digibib.ub.uni-greifswald.de/*
       http://digital.library.okstate.edu/*
       http://digi.ub.uni-heidelberg.de/*
       http://diglib.hab.de/*
       http://dioezese-linz.at/*
       http://dlib.stanford.edu:6520/*
       http://dlib.statistics.gr/*
       http://d-nb.info/*
       http://doku.iab.de/*
       http://download.journals.elsevierhealth.com/*
       http://download.springer.com/*
       http://dutchcharts.nl/*
       http://dwardmac.pitzer.edu/*
       https://dx.doi.org/10.1006%2F*
       https://dx.doi.org/10.1007%2FBF01765693
       https://dx.doi.org/10.1007%2FBF02268626
       https://dx.doi.org/10.1007%2FBF0246*
       https://dx.doi.org/10.1007%2FBF02539521
       https://dx.doi.org/10.1007%2Fs10156-*
       https://dx.doi.org/10.1007%2Fs10267-*
       https://dx.doi.org/10.1007%2Fs10302-003-0068-y
       http://dx.doi.org/10.1016/*
       https://dx.doi.org/10.1016%2F*
       https://dx.doi.org/10.1017%2F*
       https://dx.doi.org/10.1021%2F*
       https://dx.doi.org/10.1023%2F*
       https://dx.doi.org/10.1024%2F*
       https://dx.doi.org/10.1026%2F*
       https://dx.doi.org/10.1027%2F*
       https://dx.doi.org/10.1037%2F*
       https://dx.doi.org/10.1038%2F*
       https://dx.doi.org/10.1053%2F*
       https://dx.doi.org/10.1054%2F*
       https://dx.doi.org/10.1055%2FB-9783131740816
       https://dx.doi.org/10.1067%2F*
       https://dx.doi.org/10.1068%2Fd040249
       https://dx.doi.org/10.1078%2F*
       https://dx.doi.org/10.1086%2F*
       http://dx.doi.org/10.1088/*
       https://dx.doi.org/10.1088%2F*
       https://dx.doi.org/10.1093%2Fref:odnb%2F*
       https://dx.doi.org/10.1097%2F*
       https://dx.doi.org/10.1111%2F*
       https://dx.doi.org/10.1159%2F000055858
       https://dx.doi.org/10.1130%2F*
       https://dx.doi.org/10.11609%2FJoTT.o3334.4604-7
       https://dx.doi.org/10.1263%2Fjbb.101.501
       https://dx.doi.org/10.1179%2F*
       https://dx.doi.org/10.1188%2F*
       https://dx.doi.org/10.1353%2Feen.2006.0007
       https://dx.doi.org/10.1387%2F*
       https://dx.doi.org/10.1400%2F*
       https://dx.doi.org/10.1484%2F*
       https://dx.doi.org/10.1511%2F*
       http://dx.doi.org/10.1525/*
       https://dx.doi.org/10.1525%2F*
       https://dx.doi.org/10.1529%2F*
       https://dx.doi.org/10.1556%2F*
       https://dx.doi.org/10.1580%2F*
       https://dx.doi.org/10.1629%2F*
       https://dx.doi.org/10.1888%2F*
       https://dx.doi.org/10.2133%2F*
       https://dx.doi.org/10.2203%2F*
       https://dx.doi.org/10.2225%2F*
       https://dx.doi.org/10.2298%2F*
       https://dx.doi.org/10.2349%2F*
       https://dx.doi.org/10.2353%2F*
       https://dx.doi.org/10.2753%2F*
       https://dx.doi.org/10.2903%2F*
       https://dx.doi.org/10.2968%2F*
       https://dx.doi.org/10.2977%2F*
       https://dx.doi.org/10.3114%2F*
       https://dx.doi.org/10.3138%2F*
       https://dx.doi.org/10.3141%2F*
       https://dx.doi.org/10.3149%2F*
       https://dx.doi.org/10.3168%2F*
       https://dx.doi.org/10.3203%2F*
       https://dx.doi.org/10.3233%2F*
       https://dx.doi.org/10.3321%2F*
       https://dx.doi.org/10.3372%2F*
       https://dx.doi.org/10.3764%2F*
       https://dx.doi.org/10.3797%2F*
       https://dx.doi.org/10.3816%2F*
       https://dx.doi.org/10.3929%2F*
       https://dx.doi.org/10.3941%2Fjrcr.v3i7.271
       https://dx.doi.org/10.3941%2F*
       https://dx.doi.org/10.4054%2F*
       https://dx.doi.org/10.4065%2F*
       https://dx.doi.org/10.4171%2F*
       https://dx.doi.org/10.5271%2F*
       https://dx.doi.org/10.5305%2Famerjintelaw.107.4.0823
       https://dx.doi.org/10.5414%2FNHP40123
       https://dx.doi.org/10.5923%2F*
       https://dx.doi.org/10.5936%2F*
       https://dx.doi.org/10.5937%2F*
       https://dx.doi.org/10.7202%2F*
       https://dx.doi.org/10.7868%2FS0031031X14040023
       http://e-collection.*.ethz.ch/*
       http://encyclopediaofukraine.com/*
       http://epa.oszk.hu/01600/01635/00086/pdf/foldtani_kozl_1910_01-02.pdf
       http://epguides.com/*
       http://erudit.org/*
       http://www.erudit.org/*
       http://eurotouronline.eu/*
       http://evworld.com/*
       http://faostat.fao.org/*
       http://faql.de/*
       http://feb-web.ru/*
       http://fei.infostradasports.com/*
       http://*.fei.org/*
       http://finnishcharts.com/*
       http://flora.nhm-wien.ac.at/*
       http://fluggs.wupperverband.de/*
       http://fotbal.idnes.cz/*
       http://fr.jpost.com/*
       http://futbol.sportec.es/*
       http://galerie10.at/*
       http://gaonchart.co.kr/*
       http://gemeinde.*.bz.it/*
       http://geonames.usgs.gov/*,404,503
       http://germancharts.com/*
       http://germanhistorydocs.ghi-dc.org/*
       http://gisportal-umwelt.bayern.de/*
       http://hemeroteca.abc.es/*
       http://hepatisnet.dpma.de/*
       http://hispanoteca.eu/*
       http://list.historicengland.org.uk/*
       http://historico.elpais.com.uy/*
       http://hitparade.ch/*
       http://hockeyarenas.net/*
       http://home.pages.at/*
       http://hvbg.hessen.de/*
       http://imgbase-scd-ulp.u-strasbg.fr/*
       http://ine.gub.uy/*
       http://info.wyborcza.pl/temat/wyborcza/Anna+Wolff-Pow%C4%99ska
       http://insee.fr/*
       http://ip51cc4e92.adsl-surfen.hetnet.nl/*
       http://irish-charts.com/*
       http://isles.egov.mv/*
       http://italiancharts.com/*
       http://*.jstor.org/*
       http://kulturportal.maerkischeallgemeine.de/*
       http://lagis-hessen.de/*
       http://lagis.online.uni-marburg.de/*
       http://lccn.loc.gov/*
       http://legacy.roadrunnerrecords.com/*
       http://legislature.camera.it/*
       http://lescharts.com/*
       http://list.english-heritage.org.uk/*
       http://mapserver2.statssa.gov.za/*
       http://mariners.records.nsw.gov.au/*
       http://mesta.obce.cz/*
       http://metocph.nmci.navy.mil/*
       http://molodezhnaja.ch/*
       http://motlc.specialcol.wiesenthal.com/*
       http://msi.nga.mil/*
       http://municipiodechalco.gob.mx/
       http://nachtkritik.de/*
       http://natura2000.eea.europa.eu/*
       http://norwegiancharts.com/*
       http://notes9.senato.it/*
       http://nrhp.mnhs.org/*
       http://nscb.gov.ph/*
       http://ofdk-kogl.at/*
       http://odysseus.culture.gr/*
       http://oireachtas.ie/*
       http://omim.org/entry/*
       http://on1.zkm.de/*
       http://ora-web.swkk.de/*
       http://www.orgel-zh.ch/*
       http://ospkibook.sourceforge.net/
       http://palmguide.org/*
       http://portal.statistics.sk/*
       http://portuguesecharts.com/*
       http://press.catholica.va/*
       http://press.vatican.va/*
       http://prospecierara.ch/*
       http://pse5-esd5.ainc-inac.gc.ca/*
       http://purl.pt/*
       http://radchem.nevada.edu/*
       http://rdk.zikg.net/*
       http://rebase.neb.com/*
       http://repertoire.bmi.com/*
       http://researcharchive.calacademy.org/*
       http://residence.aec.at/*
       http://resources.metapress.com/*
       http://results.worldcurling.org/*
       http://r-hockey.ru/*
       http://rock.geosociety.org/*
       https://roempp.thieme.de/*
       http://rsssf.com/*
       http://schulen.eduhi.at/*
       http://scopeq.cc.univie.ac.at/*
       http://services.biathlonresults.com/*
       http://shipbuildinghistory.com/*
       http://sig.magrama.gob.es/*
       http://spanishcharts.com/*
       http://special.lib.gla.ac.uk/*
       https://portal.bvl.bund.de/psm/jsp/
       https://service.salzburg.gv.at/*
       http://stephanscom.at/*
       http://st-marien-neuss.de/*
       http://swedishcharts.com/*
       http://swisscharts.com/*
       http://ted.europa.eu/*
       http://tehrantimes.com/*
       http://*.thefreedictionary.com/*
       http://thebulletin.metapress.com/*
       http://timms.uni-tuebingen.de/*
       http://tps.cr.nps.gov/*
       http://trackfield.brinkster.net/*
       http://versita.metapress.com/*
       http://viaf.org/viaf/*
       http://vz.lt/*
       http://webopac0.hwwa.de/*
       http://webopac.hwwa.de/*
       http://webrzs.stat.gov.rs/*
       http://website.musikhochschule-muenchen.de/*
       http://web.telecom.cz/*
       http://web.worldbank.org/*
       http://webworld.unesco.org/*
       http://wiki-de.genealogy.net/GOV:*
       http://www2.dsi.gov.tr/*
       http://www1.jur.uva.nl/*
       http://www1.nls.niedersachsen.de/*
       http://www2.amnesty.de/*
       http://www2.bonn.de/*
       http://www2.egeonet.gr/*
       http://www2.iaaf.org/*
       http://www2.rgzm.de/*
       http://www2.sbg.ac.at/*
       http://www2.solingen.de/*
       http://www2.uni-osnabrueck.de/*
       http://www.abpd.org.br/*
       http://www.academia.org.br/*
       http://www.a-c-b.eu/
       http://www.acros.com/*
       http://www.adam-ries-bund.de/*
       http://www.adfc-tourenportal.de/*
       http://www.al-bankligaen.dk/*
       http://www.altdorf.de/*
       http://www.americanmafia.com/*
       http://www.americanscientist.org/*
       http://www.ankerstein.de/anker/frames-D.htm
       http://www.aoml.noaa.gov/*
       http://www.archivdatenbank.lha-rlp.de/speyer/*
       http://www.aria.com.au/*
       http://www.army.mil/cmh*
       http://www.arquivoltas.com/*
       http://www.artnet.de/artist/*
       http://www.asanet.org/*
       http://www.asc-csa.gc.ca/*
       http://www.assemblee-nationale.fr/*
       http://www.aurora-magazin.at/*
       http://www.austro-hungarian-army.co.uk/*
       http://www.badliebenwerda.de/*
       http://www.bad-sulza.de/rathaus/verwaltungsbereich/gemeindn/kaatsch/kaatsch.htm
       https://www.banatic.interieur.gouv.fr/*
       http://www.basidiochecklist.info/*
       http://www.bayern-online.com/*
       http://www.bcomm-scotland.independent.gov.uk/*
       http://www.bertelsmann-stiftung.de/*
       https://www.bgbl.de/*
       http://www.bgs.ac.uk/*
       http://www.bibf.net/*
       http://www.biodiversityexplorer.org/*
       http://www.biologie.uni-hamburg.de/*
       http://www.biyografi.net/*
       http://www.blaek.de/*
       http://www.bobross.nl/de/index.php?id=14
       http://www.bonn.de/*
       http://www.bosy-online.de/*
       http://www.brasilbase.pro.br/*
       http://www.britac.ac.uk/*
       http://www.british-history.ac.uk/*
       http://www.bsc-eoc.org/*
       http://www.bsv-ski.de/*
       http://www.bucknell.edu/*
       http://www.bundessortenamt.de/*
       http://www.bvbinfo.com/*
       http://www.caa.co.uk/*
       http://www.caiaragon.com/*
       http://www.capif.org.ar/*
       http://www.caribbeanelections.com/*
       http://www.cartografia.asturias.es/*
       http://www.cbat.eps.harvard.edu/*
       http://www.cello.org/*
       http://www.cfa.harvard.edu/iau/*
       http://www.cfa.harvard.edu/mpec/*
       http://www.cg65.fr/*
       http://www.chabad.org/*
       http://www.chidlovski.net/*
       http://www.chinapost.com.tw/*
       http://www.cidgallup.com/en
       http://www.citwf.com/*
       http://www.commerce.state.ak.us/*
       http://www.conceptcarz.com/*
       http://www.confedilizia.it/*
       http://www.consilium.europa.eu/*
       http://www.correo.com.uy/*
       http://crew-united.com/*
       http://www.cr.nps.gov/*
       http://www.crowesbase.com/*
       http://www.csa.gov.et/*
       http://www.cso.ie/*
       http://www.ct.gov/*
       http://www.cultura.abt.ro/*
       http://www.culturalheritage.gov.mt/*
       http://www.culturela.org/*
       http://www.cyranos.ch/*
       http://www.dartsdatabase.co.uk/*
       http://www-db.lbmv.de/*
       http://www.deagel.com/*
       http://www.demogr.mpg.de/*
       http://www.dermis.net/*
       http://www.dgap.de/*
       http://www.disa.ukzn.ac.za/*
       http://www.discogs.com/*
       http://www.djlp.jugendliteratur.org/*
       http://www.dnp.go.th/*
       http://www.dnr.mo.gov/*
       http://www.doerentrup-lippe.de/index2.htm
       http://www.dohr.de/*
       http://www.doris.at/*
       http://www.dtig.org/*
       http://www.dzs.hr/*
       http://www.editorsguild.com/*
       http://www.efsa.europa.eu/*
       http://www.eia.doe.gov/*
       http://www.eldoblaje.com/*
       http://www.eliechtensteinensia.li/*
       http://www.elpais.com.uy/*
       http://www.elsterwerda.de/*
       http://www.elternbrief.at/*
       http://www.emporis.com/*
       http://www.emporis.de/*
       http://www.enbw.com/*
       http://www.enciclopediadelcalcio.it/*
       http://www.encyclopedia.chicagohistory.org/*
       http://www.ericr.nl/*
       http://www.erzbistum-muenchen.de/*
       http://www.esslinger-zeitung.de/*
       http://www.eurosurveillance.org/*
       http://www.ex-canaries.co.uk/*
       http://www.ey.com/*
       http://www.feb.es/*
       http://www.federalreserve.gov/*
       http://www.fichas.fam.bo/*
       http://www.finalesrugby.com/*
       http://www.footgoal.net/*
       http://www.for.gov.bc.ca/*
       http://www.furious.com/*
       http://www.futbolxxi.com/*
       http://www.gbase.ch/*
       http://www.gbe-bund.de/*
       http://www.gbrathletics.com/*
       http://www.gen-gen.ch/*
       http://www.geobreizh.bzh/*
       http://www.geobreizh.com/*
       http://www.geohive.com/*
       http://www.geoinformatik.uni-rostock.de/*
       http://www.geosociety.org/*
       http://www.gibson.com/*
       http://www.gizapyramids.org/*
       http://www.gl.ch/*
       http://www.globaldogproductions.info/*
       http://www.globes.co.il/*
       http://www.governo.it/*
       http://www.gro-scotland.gov.uk/*
       http://www.gtp.gr/*
       http://www.guilfordrail.com/*
       http://www.gutenberg.org/*
       http://www.hab.de/*
       http://www.habitas.org.uk/*
       http://www.hadis.hessen.de/*
       http://www.haendel.it/*
       http://www.halle.de/*
       http://www.hamburgerpersoenlichkeiten.de/*
       http://www.handball.no/*
       http://www.hartmann-ag.com/
       http://www.hebrewbooks.org/*
       http://www.heimat-pfalz.de/*
       http://www.heimatsammlung.de/*
       http://www.hekerle.net/*
       http://www.heritagegateway.org.uk/*
       http://www.herp.it/*
       http://www.hessen.de/*
       http://www.hessenrecht.hessen.de/*
       http://www.hessischer-landtag.de/*
       http://www.hhof.com/*
       http://www.historicplaces.ca/*
       http://www.history.army.mil/*
       http://www.historylink.org/*
       http://www.hitlisten.nu/*
       http://www.hnl-statistika.com/*
       http://www.hockeyarenas.net/*
       http://www.hoerspiele.de/*
       http://www.iab.de/*
       http://www.iafd.com/*
       http://www.icrc.org/*
       http://www.ictvdb.org/*
       http://www.identifont.com/*
       http://www.ifpi.at/*
       http://www.iht.com/*
       http://www.ilportalesardo.it/*
       http://www.imagesofengland.org.uk/*
       http://www.imj.org.il/*
       http://www.ine.gob.bo/*
       http://www.ine.gub.uy/*
       http://www.infolex.lt/*
       http://www.ingolstadt.de/*
       http://www.ins.nat.tn/*
       http://www.ipu.org/*
       http://www.irishtimes.com/*
       http://www.ispf.pf/*
       http://www.isro.org/*
       http://www.itaucultural.org.br/*
       http://www.iwineinstitute.com/*
       http://www.jarnvag.net/*
       http://www.juranet.ch/*
       http://www.jura.uni-sb.de/*
       http://www.kajak-channel.de/*
       http://www.kaogu.cn/*
       http://www.kct-tabor.cz/*
       http://www.kfa.or.kr/*
       http://www.khaleeejtimes.com/*
       http://www.kitlv-journals.nl/*
       http://www.kmdb.or.kr/*
       http://www.ksi.is/*
       http://www.kuladig.de/*
       http://www.labiennale.org/*
       http://www.laciociaria.it/*
       http://www.landesrecht-hessen.de/*
       http://www.landkreis-mueritz.de/*
       http://www.landtag-bz.org/*
       http://www.lavoz.com.ar/*
       http://www.lawnet.sabah.gov.my/*
       http://www.law.umkc.edu/*
       http://www.lbm.rlp.de/*
       http://www.legaseriea.it/*
       http://www.legendsofhockey.net/*
       http://www.leighrayment.com/*
       http://www.leps.it/*
       http://www.lescharts.com/*
       http://www.leser-welt.de/*
       http://www.letempsarchives.ch/*
       http://www.lib.rochester.edu/*
       http://www.lighthousefriends.com/*
       http://www.lilienthal-museum.de/*
       http://www.linz.at/*
       http://www.literaturwissenschaft-online.uni-kiel.de/*
       http://www.litteraturpriser.dk/*
       http://www.lortel.org/*
       http://www.lrs.lt/*
       http://www.luwg.rlp.de/*
       http://www.lvr.de/*
       http://www.lvva-raduraksti.lv/*
       http://www.mainz.de/*
       http://www.mallorcazeitung.es/*,56
       http://www.maltadata.com/*
       http://www.mathpages.com/*
       http://www.mcaviglia.ch/*
       http://www.mcgi.state.mi.us/*
       http://www.mddep.gouv.qc.ca/*
       http://www.melbourne2006.com.au/*
       http://www.metalunderground.com/*
       http://www.mgh.de/*
       http://www.mi.brandenburg.de/sixcms/list.php\?*
       http://www.mic.no/*
       http://www.military-today.com/*
       http://www.minden.de/*
       http://www.minorplanetcenter.net/*
       http://www.mitmachwoerterbuch.lvr.de/*
       http://www.mla.org/*
       http://www.mobil.hessen.de/*
       http://www.molodezhnaja.ch/*
       http://www.monumentos.pt/*
       http://www.mpifg.de/*
       http://www.mps.it/*
       http://www.msv-duisburg.de/*
       http://www.mtg.musin.de/cms3/Schulprofil2
       http://www.museum.ru/*
       http://www.musicweb-international.com/*
       http://www.naa.net/*
       http://www.nachrichten.ch/*
       http://www.nachtkritik.de/*
       http://www.na.fs.fed.us/*
       http://www.napoleon.org/*
       http://www.nat.is/*
       http://www.naturschutzdaten.saarland.de/*
       http://www.nawa.apps.be.ch/*
       http://www.nba.fi/*
       http://www.ncbi.nlm.nih.gov/entrez/*db=OMIM*
       http://www.ncbi.nlm.nih.gov/ICTVdb/*
       http://www.ncbi.nlm.nih.gov/omim/*
       http://www.ncbi.nlm.nih.gov/sites/entrez*db=omim*
       http://www.nga.org/*
       http://www.nn-online.de/*
       http://www.nrw-literatur-im-netz.de/*
       http://www.nscb.gov.ph/*
       http://www.ntsb.gov/*
       http://www.nvr.navy.mil/*
       http://www.nz-online.de/*
       http://www.oas.org/*
       http://www.oceaniafootball.com/*
       http://www.ohchr.org/*
       http://www.old-computers.com/*
       http://www.one.cu/*
       http://www.ontheisses.org/*
       http://www.ontla.on.ca/*
       http://www.opsi.gov.uk/*
       http://www.orden-online.de/news/2011/08/30/mauritius-choriol-wiedergewählt
       http://www.orgelinformation.de/*
       http://www.ortszeitungen.de/*
       http://www.osnabrueck.de/*
       http://www.ottovaencyklopedie.cz/
       http://www.pageantopolis.com/*
       http://www.paho.org/*
       http://www.palermoweb.com/*
       http://www.panynj.gov/*
       http://www.parareligion.ch/*
       http://www.parc-cotentin-bessin.fr/*
       http://www.parlamento.gub.uy/*
       http://www.parlamento.pt/*
       http://www.parliament.tas.gov.au/*
       http://www.pastscape.org.uk/*
       http://www.pc.gc.ca/*
       http://www.perepis2002.ru/*
       http://www.pfaf.org/*
       http://www.phf.uni-rostock.de/*
       http://www.philological.bham.ac.uk/*
       http://www.phil.uni-sb.de/*
       http://www.planet-vienna.com/*
       http://www.polizei-bw.de/*
       http://www.pollanetsquad.it/*
       http://www.portal.state.pa.us/*
       http://www.potsdam-mittelmark.de/*
       http://www.presse-partner.de/*
       http://www.presstv.ir/*
       http://www.provinz.bz.it/denkmalpflege/themen/1071.asp\?status=detail&id=*
       http://www.pxweb.bfs.admin.ch/*
       http://www.quirinale.it/*
       http://www.radiovaticana.org/*
       http://www.rbedrosian.com/*
       http://www.reggaeid.co.uk/*
       http://www.regione.sicilia.it/*
       http://www.regione.taa.it/*
       http://www.religion-online.org/*
       http://www.remembertheaba.com/*
       http://www.rheinische-geschichte.lvr.de/*
       http://www.rheinische-landeskunde.lvr.de/*
       http://www.rockabilly.nl/*
       http://www.rocklistmusic.co.uk/*
       http://www.rogersmushrooms.com/*
       http://www.romanicoaragones.com/*
       http://www.russianspaceweb.com/*
       http://www.rz.uni-karlsruhe.de/*
       http://www.saar-orgelland.de/*
       http://www.sabah.gov.my/*
       http://www.sadei.es/*
       http://www.saexplorer.co.za/*
       http://www.salite.ch/*
       http://www.schleswig-holstein.de/*
       http://www.schlossspiele.com/
       http://www.schule.suedtirol.it/*
       http://www.schumannzwickau.de/*
       http://www.scottish.parliament.uk/*
       http://www.scrol.gov.uk/*
       http://www.senate.gov.ph/*
       http://www.senkyo.janjan.jp/*
       http://www.seplan.go.gov.br/*
       http://www.sff.net/*
       http://www.sfi.se/*
       http://www.sfmoma.org/*
       http://www.sfu.ac.at/*
       http://www.sg.ch/*
       http://www.shortnews.de/*
       http://www.sil.org/*
       http://www.sino.uni-heidelberg.de/*
       http://www.skeletonsport.com/*
       http://www.ski-db.com/*
       http://www.slovenia.info/*
       http://www.smtvsanmarino.sm/*
       http://www.snookerdatabase.co.uk/*
       http://www.snopes.com/*
       http://www.space.com/*
       http://www.squashsite.co.uk/*
       http://www.stadtplandienst.de/*
       http://www.stadt.sg.ch/*
       http://www.stamps.fo/*
       http://www.stat.gov.mk/*
       http://www.statice.is/*
       http://www.statistics.sk/*
       http://www.statistik.baden-wuerttemberg.de/*
       http://www.statistikbanken.dk/*
       http://www.statistik-portal.de/*
       http://www.statutelaw.gov.uk/*
       http://www.stb.dot.gov/*
       http://www.stratigraphy.org/*
       http://www.streetmap.co.uk/*
       http://www.suhrkamp.de/*
       http://www.supersport.com/*
       http://www.svenskakyrkan.se/*
       http://www.swetzel.ch/*
       http://www.swisscastles.ch/*
       http://www.sz.ch/*
       http://www.tablelandsway.com.au/*
       http://www.tcmap.com.cn/*
       http://www.terkepcentrum.hu/*
       http://www.ter-sncf.com/*
       http://www.tfaoi.com/*
       http://www.thebaseballcube.com/*
       http://www.thelancet.com/*
       http://www.thepresidency.gov.za/*
       http://www.th.gov.bc.ca/*
       https://www.thieme.de/*
       http://www.thecanadianencyclopedia.com/*?
       http://www.tirisdienste.at/*
       http://www.tlfq.ulaval.ca/*
       http://www.toonopedia.com/*
       http://www.touregypt.net/*
       http://www.trinews.at/*
       http://www.turkfutbolu.net/*
       http://www.tyndalehouse.com/*
       http://www.u-bootarchiv.de/
       http://www.ucv.ch/*
       http://www.udape.gob.bo/portales_html/portalSIG/*
       http://www.ufg.ac.at/*
       http://www.ukcdogs.com/*
       http://www.ukrstat.gov.ua/*
       http://www.ulmer.de/*
       http://www.ultimateungulate.com/*
       http://www.ultratop.be/*
       http://www.umweltdaten.landsh.de/*
       http://www.unhchr.ch/*
       http://www.usarmygermany.com/*
       http://www.ushistory.org/*,56
       http://www.usnwc.edu/*
       http://www.vag.de/*
       http://www.vancouver2010.com/*
       http://www.veikkausliiga.com/*
       http://www.verwaltung.uni-halle.de/*
       http://www.vg-potsdam.brandenburg.de/*
       http://www.virtuelles-kupferstichkabinett.de/*
       http://www.vlaky.net/*
       http://www.volkswagen-media-services.com/*
       http://www.vorarlberg.at/*
       http://www.vrr.de/*
       http://www.wahlen.hessen.de/*
       http://www.wallonie-en-ligne.net/*
       http://www.wandersite.ch/*
       http://www.wdpa.org/*
       http://www.weyer-neustadt.de/*
       http://www.wilnet.ch/*
       http://www.wlb-unna.com/*
       http://www.wolfsburg.de/*
       http://www.worldwidealbums.net/*
       http://www.wrecksite.eu/*
       http://www.yivoencyclopedia.org/*
       http://www.zin.ru/*
       http://www.zmo.de/*
       http://www.zzf-pdm.de/*
       http://zipcodezoo.com/*
       http://zukunft-braucht-erinnerung.de/*
       http://www.seattlerobotics.org/*
       http://www.dm.unito.it/*
       http://www.lfsag.unito.it/*
       http://www2.dm.unito.it/*
       http://www.cisi.unito.it/*
       http://www.asgard.nu/*
       http://www.dls.ym.edu.tw/*
       http://ppp.unipv.it/*
       http://fisica.unipv.it/*
       http://musei.unipv.it/*
       http://www.faz.net/dynamic/*
       http://www.ursulakleguin.com/*
       http://www.genecards.org/*
       http://www.musee-magritte-museum.be/*
       http://www.famousartistsgallery.com/*
       http://www.unep.fr/*
       http://www.russianmuseums.info/*
       http://taxonomicon.taxonomy.nl/*
       http://fotocollectie.huisdoorn.nl/*
       http://192.124.238.252/*
       http://waynesword.palomar.edu/*
       http://www.marcheworldwide.org/*
       http://www.hbcpnetbase.com/*
       http://www.saxonica.com/*
       http://www.ems-ph.org/*
       http://www.mdz-nbn-resolving.de/*
       http://nbn-resolving.de/urn:nbn:de:bvb:12-*
       http://nbn-resolving.de/urn:nbn:de:hbz:061:*
       http://nbn-resolving.de/urn:nbn:de:gbv:23-drucke/*
       http://nbn-resolving.de/urn/resolver.pl?urn=urn:nbn:de:bvb:12-*
       http://nbn-resolving.de/urn/resolver.pl?urn=urn:nbn:de:hbz:061:*
       http://abbasales.hpage.co.in/*
       https://web.archive.org/web/*/http://www.zukunft-braucht-erinnerung.de/*
       http://www.cbs.nl/*
       http://enrin.grida.no/*
       http://www.todayinliterature.com/*
       http://www.pep-web.org/*
       http://www.heimatkundlicher-arbeitskreis.de/*
       http://www.patsyclinetribute.com/*
       http://www.sec.state.ma.us/*
       http://www.bnf.fr/*
       http://www.donbosco-medien.de/*
       http://katalog.svkul.cz/*
       http://www.tandf.co.uk/*
       http://lib.lbhc.edu/*
       http://www.worldwisdom.com/*
       http://www.dfpug.com/*
       http://www.landesausstellung2012.at/*
       http://www.mikroskop-museum.de/*
       http://micro.magnet.fsu.edu/*
       http://www.micro.magnet.fsu.edu/*
       http://www.greifenseeschutz.ch/
       http://www.ejournal.at/*
       http://www.rheology.org/*
       http://www.schillerinstitute.org/*
       http://www.sde.gov.ar/*
       http://albanisches-institut.ch/*
       http://www.blackwellpublishing.com/*
       http://epub.library.ucla.edu/*
       http://digital2.library.ucla.edu/*
       http://digital.library.ucla.edu/*
       http://oralhistory.library.ucla.edu/*
       http://polaris.gseis.ucla.edu/*
       https://www.bri.ucla.edu/*
       http://www.fusion.ucla.edu/*
       http://www.bpao.go.th/bpaoweb/*
       http://eng.nesdb.go.th/*
       http://www.nordostthailand.de/*
       http://www.nesdb.go.th/*
       http://www.swri.org/*
       http://www.vvvheerenveen.nl/*
       http://www.euromids.com/*
       http://www.maerchengesellschaft.de/
       http://www.le-terrier.net/*
       http://www.gradierwerk-bad-orb.de/
       http://www.digitalgametechnology.com/*
       http://www.eurocosm.com/*
       http://www.oberndorf.co.at/*
       http://www.pfarreoberndorf.at/*
       http://map.ioer.de/*
       http://digi.vatlib.it/*
       http://www.kahl-main.de/*
       http://www.pnr-foret-orient.fr/*
       http://www.oxfordmusiconline.com/subscriber/*
       http://www.bergamoestoria.it/*
       http://www.waterfordcity.ie/*
       http://www.epsy.de/*
       http://btxmuseum.de/*
       http://www.archive.ero.dk/*
       http://www.weinsberg.de/*
       http://201.147.150.252:8080/*
       http://www.gemeinde-thuemmlitzwal.de/*
       http://www.electropedia.org/*
       http://www.teapo.com/*
       http://www.capxon-europe.com/*
       http://www.rubycon.co.jp/*
       http://www.elna.co.jp/*
       http://www.europechemicon.de/*
       http://www.jamicon.com.tw/*
       http://buch.archinform.net/*
       http://opac.tiroler-landesmuseen.at/*
       http://www.anjf.sg.ch/*
       http://www.jfv.tg.ch/*
       http://www.selfkantbahn.de/*
       http://www.crassier.ch/*
       http://www.yale.edu/buxheim/
       http://www.realinstitutoelcano.org/*
       http://www.digital-cp.com/*
       http://www.livresbsd.ch/
       http://www.gesellschaftdeutschesarboretum.de/
       http://www.nkstec.ac.th/*
       http://www.sanjuaninn.net/
       http://www.naturpark-fichtelgebirge.org/*
       http://www.khandro.net/*
       http://www.chromatechnology.com.tw/*
       http://www.niccomp.com/*
       http://www.denkmalpflege-qlb.de/*
       http://www.klinikum-quedlinburg.de/
       http://www.akko.muni.il/
       http://www.aarhusportalen.dk/*
       http://www.cjbotosani.ro/*
       http://www.heiligerantonius.org/*
       http://gedichte.xbib.de/*
       http://www.marvac.com/*
       http://www.lohr.de/*
       http://www.bethanien-kinderdoerfer.de/*
       http://www.ocls.info/*
       http://springerlink.com/*
       http://www.schwamendingen.info/*
       http://www.seaweed.ie/*
       http://www.comicforschung.de/*
       http://www.verwaltungmodern.de/*
       http://www.rheingau-taunus-monatsanzeiger.de/*
       http://kupferspuren.artwork-agentur.de/*
       http://www.nzflag.com/*
       http://www.scienzz.de/*
       http://www.rgs.org/*
       http://planet.uwc.ac.za/*
       http://lib.gig.ac.cn/*
       http://stadtplan.magdeburg.de/*
       http://dsboresund.dk/*
       http://www.biat.uni-flensburg.de/*
       http://www.mal-jork.de/*
       http://www.weilheim-schongau.de/*
       http://www.dresden-fernsehen.de/*
       http://www.hydrosciences.fr/*
       http://www.bane.dk/*
       http://www.tunnel-stoppen.de/*
       https://web.archive.org/web/20080219232012/http://www.mdr.de/doku/1311318.html
       http://faculty.madisoncollege.edu/*
       http://www.reagan.utexas.edu/*
       http://217.86.229.143/*
       http://www.orsam.org.tr/*
       http://www.annemarielevine.com/*
       http://www.karunadu.gov.in/*
       http://bg-patriarshia.bg/*
       http://www.jacob-ludvigsen.dk/
       http://umzg.zrc-sazu.si/*
       http://compositae.landcareresearch.co.nz/*
       http://www.biosci.utexas.edu/prc/pdfs/Nesom-Lundellia11.pdf
       http://www.jur.uva.nl/*
       http://botanicaserbica.bio.bg.ac.rs/*
       http://www.qsbg.or.th/*
       http://www.mahagoni-magazin.de/malerei/*
       http://www.artvalue.com/*
       http://fondationbeyeler.tumblr.com/post/59103009659/schluesselwerk-beim-ersten-klaren-wort-au-premier
       http://design.fh-joanneum.at/*
       http://www.foodintolerances.org/*
       http://www.moneyhouse.ch/*
       http://www.kran-info.ch/
       http://www.zefix.ch/*
       http://www.cannstatter-zeitung.de/*
       http://www.bad-friedrichshall.de/*
       http://www.sechselaeuten.ch/*
       http://www.cm-aveiro.pt/*
       http://www.portodeaveiro.pt/
       http://www.teatroaveirense.pt/
       http://www.beyerpeacock.co.uk/*
       http://www.samedan.ch/*
       http://www.maur.ch/*
       http://www.gronataget.se/*
       http://www.taskforce-flugplatz-duebendorf.ch/*
       http://www.forum-flugplatz.ch/*
       http://www.netzwissen.com/*
       http://www.salzgitter.de/stadtleben/downloads/Salzgittersee.pdf
       http://85.125.85.170/*
       https://av.getinfo.de/*
       http://www.digilife.be/*
       http://www.museenmaur.ch/*
       http://www.chatta.ch/
       http://www.schlossgartenbahn.de/
       http://www.abtauchen.com/*
       http://www.zoo.ch/*
       http://www.guitardaterproject.org/*
       http://www.freundemasoalas.ch/
       http://www.sagogn.ch/*
       http://www.schoenste-parks.de/
       http://std.iec.ch/*
       http://mansfeld.ipk-gatersleben.de/*
       http://www.unep-wcmc-apps.org/*
       http://www.bangkokair.com/*
       http://www.worldairlineawards.com/*
       http://www.2all.co.il/*
       http://www.hounslow.gov.uk/*
       http://colbond-geosynthetics.com/*
       http://digitalestamboom.nl/*
       http://www.dbnl.org/*
       http://www.unesco.or.kr/*
       http://www.hoefe.ch/
       http://www.technovelgy.com/*
       http://www.ssb-buettgen.de/*
       http://www.schuetzenbruderschaft-buettgen.de/*
       http://www.elkader-iowa.com/*
       http://www.saxifraga.org/*
       http://www.altn.com/*
       http://www.olionatura.de/*
       http://www.textexcavation.com/*
       http://www.sachsen-fernsehen.de/*
       http://www.jugendheim-gersbach.de/*
       http://schneekopf.tv/*
       http://www.datum-und-uhrzeit.de/*
       http://www.weltzeit.de/*
       http://www.gardatrentino.it/*
       http://linkinghub.elsevier.com/*
       http://www.schweizerseiten.ch/*
       http://www.it-au-1915-1918.com/*
       http://www.capxongroup.com/*
       http://195.75.145.68/*
       http://le-rail.ch/*
       http://www.iogt.org/*
       http://www.chem.unep.ch/*
       http://www.pops.int/*
       http://www.biomedexperts.com/*
       http://www.snookermania.de/*
       http://www.german-snooker-tour.de/
       http://www.bog.gov.gh/*
       http://pharm1.pharmazie.uni-greifswald.de/*
       http://www.hit-karlsruhe.de/*
       http://rhsweb.org/*
       http://www.tlv.se/*
       http://www.bruckner-orchester.at/*
       http://www.tela-botanica.org/*
       http://www.colorizer.org/*
       http://www.dornbirn-mfc.com/*
       http://www.detewe.de/*
       http://www.seebad-hiddensee.de/*
       http://www.ivb.at/*
       http://www.ostbahn.at/*
       http://www.pretschen.de/*
       http://www.maerkische-heide.de/*
       http://www.kirchen-schaeftlarn.de/
       http://www.eyevet.ch/*
       http://www.blw.admin.ch/*
       http://www.ecaa.ntu.edu.tw/*
       http://www.belousenko.com/*
       http://207.232.26.141/*
       http://www.mpif.org/*
       http://www.mdr.de/sachsen-anhalt/magdeburg/Chronik-Tunnelbau-Magdeburg100.html
       http://www.kircheborby.de/*
       http://www.georgdanzer.at/*
       http://www.cistuspage.org.uk/*
       http://www.segelschulschiff-deutschland.de/*
       https://www.usc.edu/org/*
       http://www.christchindlimarkt-herisau.ch/
       http://www.langenhorn-archiv.de/*
       http://www.benessereischia.it/*
       http://www.vorderer-bayerischer-wald.de/*
       http://www.hs2-mattighofen.eduhi.at/*
       http://europa.gmgnet.li/*
       http://www.vaduz.li/*
       http://www.vysoketatry.com/*
       http://www.jssgallery.org/*
       http://www.dsu.dk/*
       http://www.kloster-arnsburg.de/*
       http://www.metalworkinginsider.info/*
       http://www.doiserbia.nb.rs/*
       http://csem.ch/*
       http://www.tropenland.at/*
       http://www.dasurf.com/*
       http://hosting.zkm.de/*
       http://www.rasdorf.de/*
       http://84.205.229.30/*
       http://www.dma.ufg.ac.at/*
       http://www.bilinguisme.ch/*
       http://bigstory.ap.org/*
       http://www.tyndalearchive.com/*
       http://www.nad.gr/*
       http://www.dodekanes.eu/
       http://www.wildundstark.ch/*
       http://www.katolsk.fo/*
       http://www.plmtm.com/
       http://www.nyrock.com/*
       http://thinkexist.com/*
       http://www.fbsd.de/*
       http://www.weyermann.de/*
       http://www.authorsden.com/*
       http://www.perle-der-empore.de/*
       http://www.avenirsocial.ch/*
       http://www.spfplus.ch/
       http://www.topozone.com/*
       http://www.porcupinetree.com/*
       http://www.frastanz.at/*
       http://images.umweltberatung.at/*
       http://www.hordaland.no/*
       http://www.birminghampost.co.uk/*/
       http://www.hootpage.com/*
       http://www.franziskushaus-au.de/
       http://www.nycago.org/*
       http://www.sfmuseum.org/*
       http://theatreorgans.com/*
       http://www.bauernkriege.de/*
       http://www.lms-coburg.de/*
       http://www.engineering-timelines.com/*
       http://www.fledermausfreundliches-haus.de/*
       http://www.althusius.de/
       http://archimede.imss.fi.it/*
       http://www.newmedia-art.info/*
       http://ftp.sg.oca.ch/*
       http://www.hapkimudo.co.kr/*
       http://www.ulmato.de/*
       http://www.hotelgastro.ch/*
       http://www.vdu.ch/
       http://www.chemicalland21.com/*
       http://www.salzgitter-aktuell.de/*
       http://palatin.com/*
       http://www.gelest.com/*
       http://www.ambrosiana.eu/*
       http://www.ciclimoser.com/
       http://www.helipictures.de/*
       http://www.acnp.org/*
       http://lassesen.com/*
       http://www.abendschulen.at/
       http://palin.iccu.sbn.it/*
       http://www.mtiinstruments.com/*
       http://www.virginiasemi.com/*
       http://www.vm.rwth-aachen.de/*
       http://diplom.archlab.tuwien.ac.at/*
       http://sports.nationalpost.com/*
       http://www.htllt-hollabrunn.ac.at/
       http://www.htl-hl.ac.at/*
       http://www.outpresso.com/
       http://www.komatsu-kohag.com/*
       http://www.soul-patrol.com/*
       http://www.dom-mainz.de/*
       http://www.erzbistum-muenchen-und-freising.de/*
       http://www.holysepulchre.custodia.org/*
       http://www.paucasals.org/*
       http://www.motobit.com/*
       http://www.rdm.com/*
       http://www.aslsp.org/*
       http://145.253.206.229/*
       http://www.primaria-constanta.ro/*
       http://www.ziuadecj.ro/*
       http://pseudo-poseidonios.net/*
       http://www.die-domschaetze.de/*
       http://www.domorgel-regensburg.de/*
       http://www.delta-intkey.com/*
       http://www.plantsystematics.com/*
       http://catalogue.bnf.fr/*
       http://www.epd-film.de/33178_*.php
       http://www.epd-film.de/33194_89478.php
       http://www.astridlindgren.se/*
       http://www.schoeffengrund.de/*
       http://www.theatra.de/*
       http://www.billmumy.com/*
       http://naa.net/*
       http://sor.cua.edu/*
       http://www.dgim.de/*
       http://www.oni.escuelas.edu.ar/*
       http://www.cadicaa.com.ar/
       http://www.wienand-koeln.de/*
       http://www.heilbronn-marketing.de/*
       http://moorstation.org/*
       http://www.icrp.org/*
       http://www.tisa-von-der-schulenburg.de/*
       http://www.bdparadisio.com/*
       http://www.kuno-sperrdienst.de/
       http://www.chessmetrics.com/*
       http://www.schachversand.de/*
       http://www.oculum.de/*
       http://www.armeemuseum.de/*
       http://www.congreso.gob.pe/comisiones/*
       http://www.congreso.gob.pe/congresista/*,47,98
       http://www.congreso.gob.pe/Docs/*
       http://www.congreso.gob.pe/museo/mensajes/*,98
       http://www.erlen-verein.ch/
       http://pfarre-waldhausen.dioezese-linz.at/
       http://www.silentsaregolden.com/*
       http://www.sicherheit.info/*
       http://www.karate-gkd.de/*
       http://87.106.7.141:8080/*
       http://www.promedialeventina.ch/
       http://hitlisten.nu/*
       http://arts.nationalpost.com/*
       http://www.qatar-tribune.com/*
       https://www.koreatimes.co.kr/*
       http://www.fofweb.com/*
       http://www.synagoge-karlsruhe.de/*
       http://www.col.org.il/*
       http://www.betdin.de/
       http://yeshivagedola.de/*
       http://www.chabadberlin.de/*
       http://de.chabad.org/*
       http://www.jugendliteratur.org/*
       http://www.literanauten.org/
       http://www.basilicadelsanto.org/*
       http://www.autoindustria.com/*
       http://bilimp.dk/*
       http://www.internationaltransportforum.org/*
       http://www.gesneriads.ca/*
       http://www.unisg.ch/www/*
       http://www.crma.org/*
       http://www.biology.sc.chula.ac.th/*
       http://www.orgel.ch/*
       http://services.datasport.com/*
       http://ironman.ch/*
       http://www.cardiovascular-regeneration.com/
       http://www.icq.eps.harvard.edu/*
       http://www.christophschoener.de/
       http://www.virtualdali.com/*
       http://stat.smmu.edu.cn/*
       http://www.goldengatephoto.com/*
       http://www.nicoleamrein.ch/*
       http://www.offringa.nl/*
       http://www.hispanoteca.eu/*
       http://www.im.microbios.org/*
       http://www.vinylretter.de/*
       http://www.bogner-lehner.com/*
       http://www.goreyography.com/*
       http://www.tkyt.com/*
       http://toc.mercedes-benz.com/*
       http://dlibrary.acu.edu.au/*
       http://www.kunsthalle-sparkasse.de/suchergebnisse/kuenstler/*
       http://orgues-et-vitraux.ch/*
       http://www.jacobus.de/*
       http://www.frieden.gkgbe.ch/
       http://www.paroisse.gkgbe.ch/
       http://www.hymntime.com/*
       http://www.lpr-hessen.de/*
       http://www.unikomradios.ch/
       http://www.naturland.de/unser_team.html
       http://www.naturland.de/richtlinien.html#*
       http://www.naturland.de/de/*
       http://www.naturland.de/fileadmin/MDB/documents/Richtlinien_deutsch/Naturland-Richtlinien_*.pdf
       https://irma.nps.gov/Reference.mvc/*
       https://irma.nps.gov/App/Reference/*
       http://www.offenekirche.ch/*
       http://www.musicemissions.com/*
       http://www.witzenhausen.eu/*
       http://www.werra-meissner.de/*
       http://www.kamig.at/
       http://www.klimabuendnis.at/*
       http://www.scout.at/*
       http://www.bs-pinkafeld.at/
       http://www.bfw-pinkafeld.at/
       http://www.as-manufaktur.de/
       http://www.clubvanankervrienden.nl/
       http://wuerzburg.adlibhosting.com/*
       http://2cu.at/*
       http://www.eye.ch/*
       http://www.3dschach.de/
       http://www.sfr-frankfurt.de/*
       http://www.burg-stettenfels.de/*
       http://www.appenzellerlinks.ch/*
       http://tresor.tudelft.nl/*
       http://www.klausdierks.com/*
       http://www.deutschinnamibia.org/*
       http://www.superiorcourts.org.na/*
       http://www.walvisbaycc.org.na/*
       http://www.kavangorc.com.na/*
       http://www.nshr.org.na/*
       http://www.erc.com.na/*
       http://www.rcchurch.na/*
       http://www.mbs.org.na/
       http://www.fairness-stiftung.de/*
       http://www.sunnyportal.com/*
       http://www.mobbingscout.de/*
       http://www.breendonk.be/*
       http://www.cism-milsport.org/*
       http://mediation.centrepompidou.fr/*
       http://www.interieur.gov.dz/*
       http://www.ons.dz/*
       http://www.kenilworthchessclub.org/*
       http://www.goldenerviolinschluessel.ch/*
       http://www.falera.net/*
       http://archives.ucl.ac.uk/*
       http://www.anr.ch/
       http://www.raf-lincolnshire.info/*
       http://www.sigurd-hoel.no/*
       http://www.augnet.org/*
       http://www.export.by/*
       http://db.re.fh-koeln.de/*
       http://www.rmd-wasserstrassen.de/*
       http://www.lakartidningen.se/*
       http://www.dampfschiff.ch/*
       http://www.horgarsveit.is/
       http://www.sac-bodan.ch/
       http://www.tatstat.ru/*
       http://atlas.socpol.ru/*
       http://www.unserekleinefarm.net/*
       http://birdbase.hokkaido-ies.go.jp/*
       http://museumkierling.com/
       http://www.technik-museum.ch/*
       http://gerdtams.de/*
       http://www.baulinks.de/*
       http://www.photon.de/*
       http://www.ivh.de/*
       http://www.energiesparhaus.at/*
       http://www.umweltberichtbeiderbasel.ch/*
       http://home.schule.at/*
       http://www.lza.de/*
       https://community.fhv.at/
       http://www.drmorsbachverlag.de/*
       http://www.st-johanniskirche.de/*
       http://www.kultur-vollzug.de/*
       http://www.orlogsbasen.dk/*
       http://campus.belmont.edu/*
       http://aspweb.ovi.cnr.it/*
       http://www.basedow.ch/*
       http://www.coskunfineart.com/*
       http://www.valsot.ch/*
       http://www.loewenstein.de/*
       http://www.atlashymenoptera.net/*
       http://orawww.uibk.ac.at/apex/*
       http://www.balgrist.ch/*
       http://www.nogaqrp.org/*
       http://www.biberstein.ch/*
       http://www.films.com/*
       http://www.onlinezeitung24.de/*
       http://www.burkhardtsdorf.de/*
       http://www.imedias.ch/*
       http://www.deutschegeschichten.de/*
       http://www2.academieroyale.be/*
       http://mediatheque.cite-musique.fr/*
       http://www.fish.govt.nz/*
       http://www.jazzbiographies.com/*
       http://www.cornwall-online.co.uk/*
       http://www.tierwelt.ch/*
       http://www.sabirdstamps.com/*
       http://www.trabert.de/*
       http://www.fshbz.ch/
       http://www.wim-musiktherapie.at/*
       http://patmissin.com/
       http://www.heinzenberg.ch/*
       https://www.statistik-bw.de/Wahlen/Kommunalwahlen_2014/GTabelle.asp?216022
       http://www.kals.at/*
       http://userpage.fu-berlin.de/~ram/*
       http://www.forum-konkrete-kunst-erfurt.de/*
       http://www.sportunion-arbesbach.at/
       http://www.altfrankfurt.com/*
       http://www.orgelbau-babel.de/*
       http://www.riedholz.ch/
       http://www.e-vulcan.ro/
       http://tephroweb.ch/*
       http://www.arni-ag.ch/*
       http://www.scaspang.at/*
       http://landtag-bw.de/cms/sites/LTBW/home/aktuelles/pressemitteilungen/2014/november/1702014.html
       http://www.schoeller-textiles.com/*
       http://www.jesuitenkirche-luzern.ch/*
       http://www.pflege.kssg.ch/*
       http://results.championchip-thailand.com/*
       http://www.strivetriathlon.de/
       http://wahl.luenecom.de/*
       http://www.giovis.com/*
       http://www.stadtmarketing-halle.de/*
       http://www.kakteen.org/
       http://cactus.at/
       http://www.biologie.uni-rostock.de/*
       http://www.obeckyselka.cz/*
       http://www.bern360.ch/
       http://www.chorzempa.com/*
       http://www.heimatbund.de/*
       http://www.bmcc.nsw.gov.au/*
       http://www.cimbria.ch/*
       http://www.elycathedral.org/*
       http://www.diocesi.lodi.it/*
       http://www.lnvg-gg.de/
       http://www.americanjourneys.org/*
       http://www.classicitaliani.it/*
       http://www.bibliometrie.info/
       http://www.bml.firenze.sbn.it/*
       http://www.musikhaus-cremer.de/*
       http://www.storia900bivc.it/*
       http://www.martinswerk.de/*
       http://www2.aia.pref.aichi.jp/*
       http://dept.kent.edu/*
       http://planning.city.cleveland.oh.us/*
       http://www.cmsdnet.net/*
       http://www.nuisancelaw.com/*
       http://www.lusotopie.sciencespobordeaux.fr/*
       http://www.shannonheritage.com/*
       http://www.versuntraite.com/*
       http://www.mosibuebe.ch/*
       http://www.kwrg.de/
       http://www.kunkelspass.ch/
       http://www.windworldindia.com/
       http://swetzel.ch/*
       http://www.mybasel.ch/*
       http://www.nobel-hug.ch/*
       http://www.geschichtswerkstatt-oberhausen.de/*
       http://www.kubus-sils.ch/*
       http://www.brasilhandebol.com.br/*
       http://www.u-bootarchiv.de/index.php
       http://www.bratti.gr/*
       http://www.phillesh.net/*
       http://www.music.lv/*
       http://biederitz.st01.de/*
       http://iws.collin.edu/*
       http://libwww.library.phila.gov/*
       http://jüdischer-friedhof-altona.de/
       http://www.cmhg.gc.ca/*
       http://geosite.jankrogh.com/*
       http://www.kulturraum-klagenfurt.at/*
       http://www.jci-ec2014.com/
       http://www.rhodes.aegean.gr/*
       http://www.oshc.org.hk/*
       http://www.hanspeterreimann.com/*
       http://www.historicalatlas.ca/*
       http://www.teatromassimobellini.it/*
       http://www.rappler.com/*
       http://homepage.braunvieh.ch/*
       http://www.popentertainment.com/*
       http://burkhardtsdorf.de/*
       http://dbs.hab.de/*
       http://www.eparchiapiana.it/*
       http://kb.se/*
       http://www.historikertag.uni-kiel.de/*
       http://www.anpost.ie/*
       http://www.döbeln.de/*
       http://cvl.univie.ac.at/*
       http://info.flightmapper.net/*
       http://polsak.ivest.no/*
       http://www.norskbane.no/*
       http://www.oma.aero/*
       http://www2.uwe.ac.uk/*
       http://www.sgs-cqe.de/*
       http://www.geschichte-in-miniaturen.de/*
       http://www.ville-sallaumines.fr/
       http://www.dipbot.unict.it/*
       http://www.zeitzeugnisse.ch/*
       http://www.steffsigner.ch/
       http://www.lewinsky.ch/*
       http://hausen.pcom.de/*
       http://www.rev.hu/*
       http://www.umweltberatung.at/*
       http://www.trg-radio.de/*
       http://www.mdsbattery.co.uk/*
       http://www.railteam.eu/*
       http://www.spreewald-center.de/*
       http://www.aloj.us.es/*
       http://www.dv-wagen.ch/*
       http://www.ontheissues.org/*
       http://www.purl.org/stefan_ram/*
       http://www.rook.org/*
       http://www.kingchess.de/
       http://www.doctorzebra.com/*
       http://www.sprachverein.ch/*
       http://www.everestnews.com/*
       http://www.imagno.at/index.php\?*
       https://www.bigmac.de/*
       http://www.theengineer.co.uk/*
       http://www.stockholmstidningen.se/
       http://www.psfilmfest.org/*
       http://www.frank-kupfer.de/
       http://www.antonius-wuppertal.de/*
       https://web.archive.org/web/*/http://homepage.mac.com/dtrapp/*
       http://pubs.acs.org/*
       http://www.traubisoda.at/*
       http://www.tinnitusjournal.com/*
       http://www.vaticanoweb.com/*
       http://www.hnoc.org/*
       http://www.punkt3.de/*
       http://www.exiqon.com/*
       http://www.bamts.ru/*
       http://www.paolocurti.com/*
       http://www.florianast.ch/
       http://www.freilichtbuehne-spandau.de/
       http://www.hans-huber-stiftung.ch/*
       http://www.druglibrary.net/*
       http://www.jacobygindler.ch/*
       http://jpbrodbeck.ch/
       http://www.lucasniggli.ch/*
       http://www.pme.ch/*
       http://www.bumis.ch/*
       http://www.saengerin-monique.ch/
       http://www.janesoceania.com/*
       http://www.ccg-gcc.gc.ca/*
       http://faculty.evansville.edu/*
       http://www.foreignbanks.ch/*
       http://www.kiskinizs.hu/
       http://www.tv1864.de/
       http://www.delamar.tv/*
       http://www.janewelch.com/*
       http://user.demogr.mpg.de/*
       http://www.everesthistory.com/*
       http://www.diariodeibiza.es/*
       http://www.dscc.gov.mo/*
       http://scifan.com/*
       http://bu.univ-angers.fr/*
       http://www.sf-leihbuch.de/*
       http://archivio.comune.siena.it/*
       http://www.umad.de/*
       http://www.ncaapublications.com/*
       http://www.rcaarburg.ch/*
       http://services-techniques.met.wallonie.be/*
       http://www.sacha.org/*
       http://arachnid.biosci.utexas.edu/*
       http://www.thesaints.ch/*
       http://members.westnet.com.au/*
       http://www.composer.ch/*
       http://www.vitalfrey.com/*
       http://sport.idnes.cz/*
       http://www.photolondon.org.uk/*
       http://www.hardheim.de/*
       http://www.diethelmkeller.com/*
       http://www.abstimmungen.sg.ch/*
       http://viewfinder.english-heritage.org.uk/*
       http://www.mariagail.at/
       http://www.berner-troubadours.ch/*
       http://www.alagoinhas.ba.gov.br/*
       http://www.dfo-mpo.gc.ca/*
       http://www.clown-grock.ch/*
       http://www.gymbox.net/*
       http://www.retecivica.trieste.it/*
       http://laws-lois.justice.gc.ca/*
       http://www.feb-patrimoine.com/*
       http://www.kso-ochsenfurt.de/*
       https://web.archive.org/web/20121227111247/http://www.vfl-bochum.de/site/_teams/_profis/kader/spieler/dabrowski_christophp.htm
       http://www.secondwi.com/*
       http://www.abc-of-mountaineering.com/*
       http://www.p-s-v.de/
       http://www.pdi-berlin.de/*
       http://www.secretariadeambiente.cba.gov.ar/*
       http://www.dia.org/*
       http://www.quivelda.com/
       http://www.bl.uk/manuscripts/*,47
       http://www.cesl.edu.cn/*
       http://www.rheumanet.org/*
       http://www.ronaldv.nl/*
       http://www.sankt-nicolai.de/
       http://www2.law.ed.ac.uk/*
       http://franco-bavaria.de.fc-host29.de/*
       http://www.franco-bavaria.de/
       http://webb24.de/*
       http://www.smurfitkappa.de/
       http://www.chlorischile.cl/*
       http://www.botmuc.de/*
       http://www.orgelmakerij.nl/*
       http://www.nomos-shop.de/*
       http://corp.canadiantire.ca/*
       http://www.hoch-alm.de/
       http://www.vevey.ch/*
       http://www.cime.es/*
       http://rz48.rostock.de/*
       http://www.turbo.at/*
       http://www.guh-elektro.de/*
       http://www.waldstatt.ch/*
       http://camserver.z-online.ch/*
       http://www.heimatverein-augustdorf.de/
       http://vertpaleo.org/*
       http://www.michaelsgemeinde-bensheim.de/*
       http://www.socher.org/
       http://www.kalefeld.de/*
       http://www.ziegerhofer-music.com/
       http://www.wildgatter-hildesheim.de/
       http://www.wildpark-schwarze-berge.de/*
       http://www.kpmg.de/*
       http://www.toptop.dk/*
       http://www.icra.it/*
       http://www.plakatkontor.de/*
       http://www.aari.nw.ru/*
       http://www.akene.de/*
       http://hirr.hartsem.edu/*
       http://www.pfarrei-fridolfing.de/
       http://emi.emitel.pl/*
       http://cf.hum.uva.nl/*
       http://alfred.med.yale.edu/*
       http://www.jeremydays.de/*
       http://www.chydenius.net/*
       http://www.vienna.convention.at/*
       http://celestrak.com/*
       http://www.schloss-oberlichtenau.com/*
       http://www.ambassadorbridge.com/*
       http://www.ueckermuende.de/*
       http://www.police.pl/*
       http://honeywell.com/*
       http://www.givat-brenner.co.il/*
       https://kclpure.kcl.ac.uk/*
       http://www.glitterhouse.com/*
       http://www.baden.ch/*
       http://www.librettodopera.it/*
       http://www.chem.cmu.edu/*
       http://holocaustmusic.ort.org/*
       http://www.seniorenhilfe-ok.de/*
       http://www.margarete-berghoff.de/*
       http://www.pv-hoevelhof.de/
       http://www.woelfersheim.de/*
       http://www.leipzig-fernsehen.de/*
       http://fm2.fieldmuseum.org/*
       http://www.solidarische-oekonomie.de/*
       http://www.diplomatie.gouv.mc/dataweb/*
       http://www.szczecin.pl/*
       http://home.kelley.iupui.edu/*
       http://www.acls.org/*
       http://www.michael-steinbrecher.de/*
       http://www.christophdreyer.de/
       http://www.georgianicolson.com/*
       http://om.yr.no/*
       http://www.francisnaumann.com/*
       http://www.concin-recht.at/
       http://www.gammelbilen.no/
       http://www.sac-bernina.ch/*
       http://www.forraskut.hu/
       http://www.tuerkei-reise-info.de/*
       http://www.heritageireland.ie/*
       http://www.midamericon.org/*
       http://www.franzklammerfoundation.com/*
       http://www.euwe.nl/
       http://www.fuerstundvolk.li/*
       http://snl.no/Administrasjonsrådet
       http://www.botanicalkeys.co.uk/*
       http://www.sammlung-im-obersteg.ch/*
       http://www.georg-ahrens.de/
       http://www.law.fsu.edu/*
       http://www.altalex.com/*
       http://www.commsvr.com/*
       http://www2.medioambiente.gov.ar/*
       http://www.bryantpark.org/*
       http://www.rcz.ch/*
       http://www.aelplibahn.ch/
       http://www.hilariakramer.com/
       http://www.kapelle-toggeburgerbuebe.ch/*
       http://www.andersmusic.ch/*
       http://www.verein-schoenfeld.de/
       http://www.christianbucher.ch/
       http://www.*.gouv.fr/*
       http://www.mv-taschenbuch.de/*
       http://www.gbase.de/xbox/gameindex/Grasshopper+Manufacture/8076.html
       http://www.deetron.com/
       http://www.langwies.ch/*
       http://www.ernstwidmer.ch/*
       http://www.hanskennel.com/
       http://rotes-wien.dort.pw/
       http://www.max-e-keller.ch/*
       http://www.panfloete.ch/*
       http://agram.saariste.nl/*
       http://www.aphorismen-archiv.de/*
       http://www.neo-entertainment.de/*
       http://www.worldfantasy.org/*
       https://web.archive.org/web/20131010191521/http://www.ifpi.org/content/section_news/ifpi_awards.html
       http://extranet.kr-vysocina.cz/*
       http://www.vulkanhaus-strohn.de/*
       http://service.adfc-tourenportal.de/*
       http://www.radionav.ro/radiography.html
       http://www.mitropolia.sliven.net/
       http://www.desbrosses.at/*
       http://gesneriads.ca/*
       http://cms.herbalgram.org/herbalgram/issue83/article3433.html?Issue=83
       http://www.php.isn.ethz.ch/*
       http://www.cons.sm/*
       http://www.johnstonpress.co.uk/*
       http://monte.hrz.tu-freiberg.de/*
       http://www.bostonphoenix.com/*
       http://www.pjsymes.com.au/*
       http://www.iecat.net/*
       http://www.birdwatching.org.il/*
       http://www.eurorijeka2010.com/*
       http://www.cbpmr.net/*
       http://www.pfarre-gumpendorf.at/*
       http://www.edinet.ch/*
       https://web.archive.org/web/20131010193215/http://www.ifpi.org/content/section_news/mid_east_2010.html
       http://www.kuester-pressedruck.de/
       http://www.tribalmania.com/*
       http://www.freiwilligenserver.de/*
       http://www.kornfeld.ch/*
       http://www.ics.li/*
       http://mmh.cz/*
       http://www.talle-im-kalletal.de/
       http://www.esthergassler.ch/*
       http://www.rhipsalis.com/*
       https://web.archive.org/web/20131004135534/http://www.ruhr-uni-bochum.de/boga/html/Cleistocactus_smaragdiflorus_Foto.html
       http://www.buetzer.info/*
       http://www.caritas-lueneburg.de/*
       http://www.caritas-magdeburg.de/*
       http://www.autorenatelier.de/
       http://scena.hgu.hr/*
       http://www.de.northsails.com/*
       http://www.phayul.com/*
       http://www.artoftheprint.com/*
       http://www.archives.nantes.fr/*
       http://www.limmatwest.ch/*
       http://www.northwest.is/*
       http://www.ageplaytimes.com/*
       http://sachsens-schlösser.de/*
       http://www.generali.at/*
       http://www.expropriation-der-expropriateure.de/*
       http://www.lenac.hr/*
       http://www.mtshouston.org/*
       http://www.medsafe.govt.nz/*
       http://www.fachschule-gartenbau.de/*
       http://assets.unicef.ch/*
       http://www.radziwill.com/*
       http://www.cavr.com/*
       http://d.orgazmik.com/*
       http://www.gislab.up.wroc.pl/*
       http://www.fabula.org/*
       http://www2.landskrona.se/*
       http://www.k-line.com/
       http://www.jowettjupiter.co.uk/*
       http://www.fronteira-alorna.pt/
       http://www.zoeteman.net/*
       http://lescharts.ch/*
       http://www.aks.or.at/
       http://www.radroutenplaner.nrw.de/*
       http://www.machadodeassis.org.br/*
       http://viipip.com/*
       http://www.nordsud.unina.it/*
       http://www.ecomunitate.ro/*
       http://www2.rio.rj.gov.br/*
       http://libgen.io/*,502,504
       http://www.jazz.com/*
       https://web.archive.org/web/20131004120958/http://www.ruhr-uni-bochum.de/boga/html/Acacia_baileyana_Foto.html
       http://www.weltcup-klingenthal.de/*
       http://www.michael-buhre.de/
       http://thephoenix.com/*
       http://www.vfl-bochum.de/*
       http://sic.mfa.government.bg/*
       http://www.keb-drive.de/
       http://www.deux-sevres.com/*
       http://www.divineword.org/*
       http://www.kloster-brede.de/*
       http://www.tutzinger-brahms-tage.de/*
       http://www.ha1011.domainkunden.de/*
       http://www.vogelsang-ip.de/*
       https://mv.cartellverband.de/*
       http://www.tvreinach.ch/*
       http://www.kupferspuren.eu/*
       http://www.eggerstanden.ch/*
       http://www.starair.dk/*
       http://www.whois.telecoms.gov.bb/*
       http://www.denkmalpflege.tg.ch/*
       http://www.frauenfeld.ch/*
       http://www.thurgaumobil.tg.ch/*
       http://www.ilga.gov/house/*
       http://digisrv-1.biblio.etc.tu-bs.de:8080/*
       http://europe.ineta.org/*
       http://www.johanneskirche.org/*
       http://www.yizheng.gov.cn/*
       http://www.retro-futurismus.de/*
       https://portal.tirol.gv.at/LteWeb/*
       http://www.ruffatti.com/*
       http://www.infodienst-ausschreibungen.de/*
       http://www.wdvorsfelde.de/*
       http://www.hc-aschersleben.de/*
       http://www.canlecon.org/*
       http://collectionscanada.gc.ca/*
       http://www.shoufcedar.org/*
       https://web.archive.org/web/20130902202349/http://www.history.navy.mil/library/online/navycvn21.htm
       http://www.zirkus-stey.ch/
       http://schneegans.de/*
       http://www.alszq.gov.cn/*
       http://polyglotted.tumblr.com/*
       http://www.ivarsbil.se/*
       http://www1.stift-klosterneuburg.at/*
       http://www.geg-gt.de/*
       http://www.primaria-iasi.ro/*
       http://www.tecknau.ch/*
       http://www.heiliggeist-berlin.de/*
       http://www.jugend.landtag-bz.org/*
       http://alphornmusik.ch/*
       http://www-nw.uni-regensburg.de/*
       http://jfk.ci.dallas.tx.us/*
       http://www.freienbach.ch/*
       http://www.kidsburg.de/*
       http://www.premicon.de/*
       http://www.radikale.net/*
       http://edition.presstv.ir/*
       http://skibsregister.dma.dk/*
       http://www.provincia.*.it/*
       http://www.ostpreussen.de/*
       http://belnpp.rosenergoatom.ru/rus/about/history/
       http://www.naturecureindia.info/*
       http://www.omim.org/*
       http://cabrio.bibliotheek.brugge.be/*
       http://www.rainermschroeder.com/*
       http://www.beinwilamsee.ch/*
       http://lexbrowser.provinz.bz.it/*
       https://web.archive.org/web/20090227161147/http://www.billboard.com/bbcom/news/article_display.jsp?vnu_content_id=1003657321
       https://web.archive.org/web/20090226043634/http://www.billboard.com/bbcom/news/article_display.jsp?vnu_content_id=1003580358
       http://www.schloss-weitra.at/*
       http://www.mascagni.org/*
       http://www.montegral.com/
       http://www.smw3.com/*
       http://www.sporton.de/*
       http://herbarium.usu.edu/*
       http://dioxin20xx.org/*
       http://www.cojeco.cz/*
       http://www.lrc.rpi.edu/*
       http://chronique.efa.gr/*
       http://www.sachsens-schlösser.de/*
       https://www.generali.at/*
       http://www.willowtip.com/*
       http://www.allempires.com/*
       http://www.atlantisdiscovered.org/*
       http://www.bsac.com/*
       http://hacquetia.zrc-sazu.si/*
       http://www.dürnten.ch/*
       http://www.hofstetten.zh.ch/*
       http://www.dutempsdescerisesauxfeuillesmortes.net/*
       http://archives.metoperafamily.org/*
       http://www.movietone.com/*
       http://ns1763.ca/*
       http://www.keramikfreunde.ch/*
       http://www.inifom.gob.ni/*
       http://www.watg.com/*
       http://www.pireasnet.gr/*
       http://www.linhe.gov.cn/*
       http://www.karldeutsch.de/*
       http://www.safety.com.cn/*
       http://www.tcsw.ch/
       http://www.dupuis.com/*
       http://www.mendonutah.net/*
       http://www.imonumenti.it/*
       http://www.kulturbox.de/*
       http://www.comune.fucecchio.fi.it/*
       http://www.nabu-springe.de/*
       http://www.vonbank-orgelbau.at/*
       http://www.nationaltrustcollections.org.uk/*
       http://cms.neustadt-donau.de/*
       http://www.basler-fashion.com/*
       http://www.miur.it/*
       http://www.mfa.gov.hu/*
       http://www.pecorinoromano.net/*
       http://www.clarkforkidaho.com/*
       http://www.psychotherapiekongress.ch/*
       http://aica.kuk.net/*
       http://www.tazzari-zero.com/*
       http://townlife.it/
       http://www.fiat500.ch/*
       http://www.classicalcdreview.com/*
       http://duma39.ru/*
       http://www.slsa.sa.gov.au/*
       http://www.rrpicturearchives.net/*
       http://www.mcb.harvard.edu/losick/
       http://minnen.sundsvall.se/*
       http://setesdalsbanen.no/diesellokomotiv/
       http://www.bbgev.de/*,403
       http://dsu9604.dsu.dk/*
       http://dsu.dk/*
       https://www.dot.ny.gov/*
       http://www.portrait-hille.de/*
       http://tudigit.ulb.tu-darmstadt.de/cgi-bin/*
       http://www.drvm.org/*
       http://www.cloudsandclocks.net/*
       http://www.escartonduqueyras.com/*
       http://www.peermusicclassical.com/*
       http://www.michaelsschule.de/*
       http://www.charleshobson.com/*
       http://www.meine-mühle.de/
       http://www.trex.ch/*
       http://www.nhma.gr/*
       http://www.suezcanal.gov.eg/*
       http://193.197.34.225/*
       http://www.buseck.de/*
       http://piamontealegre.tumblr.com/*
       http://www.epguides.com/*
       http://www.coniallemann.ch/
       http://www.drums4life.com/
       http://www.all-c-music.org/
       http://www.dieterhattrup.de/
       http://www.ovb-online.de/*
       http://www.athc.cat/
       http://www.pieridesfoundation.com.cy/*
       http://www.insects.ch/*
       http://www.thermalisme.nat.tn/*
       http://nbn-resolving.de/urn:nbn:no-nb_digibok_*
       http://uk.bane.dk/*
       http://www.rothrist.ch/*
       http://www.aguascalientes.gob.mx/*
       http://www.posten.ax/*
       http://www.hoyasaxa.com/*
       http://www.shearwateraviationmuseum.ns.ca/*
       http://www.row2k.com/*
       http://www.kiwiaircraftimages.com/*
       http://chor.helbling.at/*
       http://www.cheserex.ch/*
       http://www.reinidietschi.ch/*
       http://www.neue-ufer.de/*
       http://bibliotecadigital.rah.es/*
       https://prm.rfi.it/*
       http://www2.comune.marsala.tp.it/*
       http://www.phillyhall.org/*
       http://www.jewishsports.org/*
       http://bc.ub.leidenuniv.nl/*
       http://www.veterantog-vest.dk/*
       http://www.vargveum.no/*
       http://www.euromaint.com/*
       http://www.tibro.se/*
       http://www.corpusmusicae.com/*
       http://www.sknorderstedt.de/
       http://divi.dsu.dk/*
       http://www.geographie.uni-koeln.de/*,47
       http://www.mecondor.com/*
       http://www.umea.ch/*
       http://www.luftfahrtmuseum-wernigerode.de/*
       http://www.sntc.org.sz/*
       http://www.jimthompsonhouse.com/*
       http://web.zhbluzern.ch/*
       http://carsologica.zrc-sazu.si/*
       http://www.hoegermann.de/*
       http://porcupinetree.com/*
       http://digitalcollections.lib.neu.edu/*
       http://www.dsbuppland.se/*
       http://www.cbl.org.br/
       http://www.pmitatinga.sp.gov.br/
       http://www.youtuberepeater.com/*
       http://www.divisionsskak.dk/*
       http://www.tischlein.ch/
       http://www.meteo.unican.es/*
       http://rcsl.iscte.pt/*
       https://www.dorftv.at/*
       http://www.steffsigner.com/
       http://www.appenzeller-biber.ch/*
       http://wendland-net.de/*
       http://www3.stat.sinica.edu.tw/*
       http://www.iwh-halle.de/*
       http://www.aberdeenquest.com/*
       http://www.aberdeenships.com/*
       http://www.teaching.nt.gov.au/*
       http://psycnet.apa.org/*
       http://367ture.dk/*
       http://www.367ture.dk/*
       ftp://gw.winslow.bg/*
       http://www.biblio.com.br/*
       http://www.bookreviews.org/*
       http://video.nhl.com/*
       http://www.lammermuirpipeorgans.co.uk/*
       http://subweb.diis.dk/*
       http://www.buchermunicipal.com/
       http://www.ville-petit-couronne.fr/*
       http://www.sharmillfilms.com.au/*
       http://www.kurganmash.ru/*
       http://www.traben-trarbach.de/*
       http://www.artis-causa.de/*
       http://www.mymap.se/*
       http://www.radverkehrsnetz.nrw.de/*
       http://reifezeit.net27.de/*
       http://www.architekturführer-bremen.de/*
       http://urn.nb.no/*
       http://www4.utsouthwestern.edu/*
       http://toptop.dk/*
       http://www.primariacalan.ro/*
       http://www.kynos-verlag.de/*
       http://www.jeannedarc.com.fr/*
       http://www.maidofheaven.com/*
       http://seebutz.ch/*
       http://www.regionalgeschichte-verden.de/*,28
       http://lcrs.geographie.uni-marburg.de/*
       https://www.zwischengas.com/*
       http://www.warboats.org/*
       http://www.mareud.com/*
       http://www.stift-freiburg.de/*
       http://www.rowater.ro/*
       http://www.hidroelectrica.ro/*
       http://www.aspet.org/*
       http://www.abxair.com/*
       http://www.juris.de/*(?)
       http://www.swissinnovate.org/*
       http://www.jack-campbell.com/*
       http://www.marbuch-verlag.de/*
       http://www.helvetiasacra.ch/*
       http://www.hrgigermuseum.com/*
       http://www.creditgate.com/*
       http://jhs.pharm.or.jp/
       http://iscbfm.org/
       http://x-desk.suedsalz.de/*
       http://twanight.org/*
       http://www.kingarthursknights.com/*
       http://www.netaccounting-ds.com/
       http://www2.demis.nl/*
       http://www.demis.nl/
       http://www.sciencecourseware.org/*
       http://mitropolia.sliven.net/*
       http://www.litsite.org/*
       http://www.ermatingen.ch/*
       http://www.heimatschutz.ch/*
       http://www.elortiba.org/*
       http://www.bashof.org/*
       http://www.nb.no/*
       http://www.waspweb.org/*
       http://musee-batiment.planet-allier.com/*
       http://www.setterfield.org/*
       http://puffin.creighton.edu/*
       http://www.eisacktal.com/*
       http://www.edition-steinbauer.com/*
       http://www.sac-bern.ch/*
       http://www.gaef.de/*
       http://www.dsm5.org/*
       http://m.vatican.va/*
       http://www.politicspa.com/*
       http://www.hoepli.it/*
       http://www.inlandsbanan.se/*
       http://www.grec.net/*
       http://legxv.camera.it/*
       http://dendigitalebyport.byhistorie.dk/*
       http://www.itatinga.sp.gov.br/*
       http://194.242.233.150/*
       http://www.originlab.com/*
       http://basilio.fundaj.gov.br/*
       http://www.istanbulchallenger.org/*
       http://www.institutosports.com.br/*
       http://www.heimatverein-hagen-atw.de/*
       http://www.hockeyslovakia.sk/*
       http://www.israel-opera.co.il/*
       http://www.ncos.ca/*
       http://www.austrian-canadian-council.ca/*
       http://vlaamseopera.be/*
       http://www.klovsjofjall.se/
       http://www.napoleonica.org/*
       http://www.limr.org/*
       http://www.mairie-saintromainlepuy.fr/*,404
       https://web.archive.org/web/20131008152319/http://www.math.wisc.edu/~hans/vitae2012
       http://www.schuebue.de/*
       http://www.galizien-deutsche.de/*
       https://www.prospecierara.ch/*
       http://www.artwanted.com/*
       http://cbat.eps.harvard.edu/*
       http://54.247.69.120/*
       http://cm.observer.at/*
       http://www.sendbote.com/*
       http://www.clipa.com/*
       http://www.nimbus.it/*
       http://www.sdmjk.dk/*
       http://www.buettikon.ch/*
       http://www.ltkliberec.cz/*
       http://www.jeffhecht.com/*
       http://www.gerhildkomander.de/*
       http://www.mkb.de/*
       http://www.cuisimonde.com/*
       http://www.buezminden.de/
       http://www.miol.it/*
       http://www.readingmuseum.org.uk/*
       http://mengwen.kyzq.gov.cn/
       http://www.npv.ch/*
       http://www.transfax.co.il/*
       http://www.toeff-magazin.ch/*
       http://www.bms.com/*
       http://jchemed.chem.wisc.edu/Journal/issues/*
       http://app.olg-ol.niedersachsen.de/*
       http://www.lutry.ch/*
       http://www.hms.harvard.edu/*
       http://www.feldenkraisinternational.org/
       http://www.sickkids.ca/*
       http://danielhechter.com/
       http://dms.hms.harvard.edu/*
       http://dioezese-linzold.at/*
       http://www.rettet-das-kind-noe.at/*
       http://www.wju.edu/*
       http://www.elhistoriador.com.ar/*
       http://www.bbg-ev.de/*
       http://www.bloso.be/*
       https://www.the-asci.org/*
       http://www.hin.is/*
       http://www.terz.ch/*
       http://www.moen-atlas.dk/*
       http://www.higharctic.org/*
       http://www.bautzen.de/*
       http://www.waz-zh.ch/*
       http://www.sherlock-holmes.co.uk/*
       http://www.burgenseite.ch/*
       http://www.jedenspeigen.at/*
       http://www.iiclisbona.esteri.it/*
       http://www.amcham.it/*
       http://www.sandmädchen.de/
       http://vflnagold-handball.de/
       http://www.maritimenz.govt.nz/*
       http://www.fishpal.com/*
       http://www.artvalue.fr/*
       http://www.detlef-kraft.de/
       http://www.alscher-restaurierung.de/*
       http://www.spanishcharts.com/*
       http://www.esbl.ee/*
       http://www.grewaco.ch/*
       http://www.ussr-autosport.ru/*
       http://www.dgk-herzfuehrer.de/
       http://www2.landtag-bz.org/*
       http://www.chinaphar.com/*
       http://www.chxb.cn/*
       http://www.effendirecords.com/*
       http://www.robiweber.ch/
       http://www.galerie-dogan.de/*
       http://www.trinkhalle-wildbad.org/
       https://www.enbw.com/*
       http://www.zweitakte.de/*
       http://gizapyramids.org/*
       http://www.e-ariana.com/*
       http://www.spessart-mainland.de/*
       http://www.tee-verein.de/
       http://www.catalysisclubchicago.org/*
       http://www.jazz-kalender.de/*
       http://www.rga.de/*
       http://www.carnoules.fr/*
       http://www.brambus.com/*
       http://www.aarau.ch/*
       http://www.quartiervereinesg.ch/*
       http://notices-patrimoine.region-alsace.eu/*
       http://www.stefan.keller.name/
       http://www.genzyme.de/*
       http://www.klartext-verlag.de/*
       http://nat.is/*
       http://www.doellersheim.at/*
       http://hebrewbooks.org/*
       http://www.skalden.at/
       http://www.juedischegemeinde.at/*
       http://cms.awo-sh.de/*
       http://www.adeva.com/*
       http://www.frontiersinpolymerscience.com/*
       http://www.edwards.com/*
       http://www2.chiesacattolica.it/*
       http://gcc.upb.de/*
       http://www.fotografus.hu/*3
       http://www.giarmatavii.ro/*
       http://www.hnv.de/*
       http://www.kab-schweiz.ch/
       http://www.weltnotwerk.de/
       http://www.fuenfseenlandaktuell.de/*
       http://icasualties.org/*
       http://www2.psy.unsw.edu.au/*
       http://www.billardligen.de/*
       http://www.brennwert.info/*
       http://www.myragalleries.com/*
       http://ni.www.techfak.uni-bielefeld.de/*
       http://www.dancelab.com/*
       http://www2.cm-evora.pt/*
       http://www.immunetolerance.elsevier.com/*
       http://www.pfleger-stiftung.de/*
       http://www.futbolamateur-varios.superweb.cl/*
       http://www.peter-foehn.ch/
       http://www.kozlonyok.hu/*
       http://ktp.isam.org.tr/*
       http://www.lgh-gmuend.de/*
       http://cad-cook.architektur.tu-darmstadt.de/*
       http://gepris.dfg.de/*
       http://www.altopiano7comuni.it/*
       http://www.e-familytree.net/*
       http://www.lakesuperiorstreams.org/*
       http://lafraye.fr/
       http://faktaark.statkart.no/*
       http://www1.inecol.edu.mx/*
       http://www.ffm-montreal.org/*
       http://www.alliancemusic.com/*
       http://aria.com.au/*
       http://www.icelandicmusic.com/*
       http://ps.mnhn.lu/*
       http://www.fspiano.net/*
       http://www.windsurfing-academy.com/*
       http://ipc.infostradasports.com/*
       http://census.cso.ie/*
       http://ww2.volksmusik.de/*
       http://namenbuch.gmg.biz/*
       http://www.pflueger-orgelbau.at/*
       http://lux.fh-reutlingen.de/*
       http://www.igel-monitor.de/*
       http://www.schlacht-bei-minden.com/*
       http://www.guji.com.cn/*
       http://mhc-macris.net/*
       http://hplc-säule.de/
       http://www.irishlichens.ie/*
       http://www.xecutives.net/*
       http://www.kath-zollikon.ch/*
       http://www.oberrieden.ch/*
       http://dsiphoto.mnhn.fr/*
       http://www.kleiner-michel.de/*
       http://archiwebture.citechaillot.fr/*
       http://www.darmstadt-online.de/*
       http://datenbank.spinnenwerk.de/*
       http://www.perpignan.catholique.fr/*
       http://www.dicamillocompanion.com/*
       http://80.66.4.117/*
       http://www.kzvk-hannover.de/*
       http://www.pfarre-scheibbs.at/*
       http://www.webstein.ch/*
       http://prv.mfah.org/*
       http://www.super-art.com/*
       http://chicago.gopride.com/*
       http://www.geira.pt/*
       http://www.turningwheel.ch/
       http://bricks.eurob.org/*
       http://eurob.org/*
       http://stadiums.findthebest.com/*
       http://www.fornohuette.ch/*
       http://www.konkordiahuette.ch/*
       http://www.turtmannhuette.ch/*
       http://www.gspaltenhornhuette.ch/
       http://daibieunhandan.vn/*
       http://www.alternatives-wandern.ch/*
       http://www.mincetur.gob.pe/*
       http://www.walterjorge.com/*
       http://www.bibliotecaflorestal.ufv.br/*
       http://www.orientmuseum.ru/
       http://www.bma.arch.unige.it/*
       http://dermis.net/*
       http://www.zahnwissen.de/*
       http://www.theatreorgans.com/*
       http://www.eisenbrauns.com/*
       http://bdigital.binal.ac.pa/*
       http://www.ecoledetravail.fr/
       http://jeeves.mmg.uci.edu/*
       http://www.colonia-prima.de/*
       http://www.mdk.de/*
       http://globalbrief.ca/*
       http://www.pieterskerk.com/*
       http://www.garage61.it/*
       http://s1000d.org/
       http://www.xl.com/*
       http://www.inah.gob.mx/*
       http://kirchenchor.baden-st-stephan.at/*
       http://www.rinck.ch/*
       http://www.bibliobuses.com/
       http://remembertheaba.com/*
       http://www.amigamemo.com/*
       http://www.voegel-ohne-beine.de/*
       http://www.pvgs-salzwedel.de/*
       http://www.mauren.li/*
       http://auskunft.stadtbibliothek.magdeburg.de/*
       http://www.uster.ref.ch/*
       http://historico.ovaciondigital.com.uy/*
       http://www.left-hand-brofeldt.dk/*
       http://pfarre-attersee.dioezese-linz.at/*
       http://www.preseren.net/*
       http://www.stiftmelk.at/*
       http://www.triathlon-grassau.de/*
       http://www.mhst.net/*
       http://www.muelheimer-verband.de/*
       http://www.markranstaedt.de/*
       http://www.inggo.com/*
       http://www.ordre-national.gouv.qc.ca/*
       http://ordre-national.gouv.qc.ca/
       http://www.gypsyfestival.ch/
       http://www.foedekam.be/*
       http://fxcuisine.com/*
       http://www.info.umu.se/*
       http://faustball2015.com/*
       http://www.winkelmayer.at/
       http://www.atarimuseum.com/*
       http://www.unamaki.ca/*
       http://www.photorail.com/*
       http://www.hivleitfaden.de/*
       http://www.earthlife.net/*
       http://www.beerculture.com/*
       http://cis.alma.unibo.it/*
       http://www.ejil.org/*
       http://archivo.lavoz.com.ar/*
       http://www.tabla-schule.ch/*
       http://www.danskehavnelods.dk/*
       http://www.eschen.li/*
       http://www.schaan.li/*
       http://www.schulenburg-leine.de/*
       http://www.bb.is/*
       http://www.dipalme.org/*
       http://www.prosafiental.ch/*
       http://www.tianjinopen.com/*
       http://www.messageries-maritimes.org/*
       http://www.theshipslist.com/*
       http://www.nolimitsdiving.dk/*
       http://digitalarkivet.uib.no/*
       http://www.caphorniers.cl/*
       http://mic.no/*
       http://langendorff-stiftung.de/*
       http://www.grundverkehr.at/*
       http://www.tlf-timelinefilm.de/*
       http://imagingeverest.rgs.org/*
       http://www.rifugiobalma.it/*
       http://maamodt.asp.radford.edu/*
       http://www.microlabgallery.com/*
       http://servefir.ruv.is/*
       http://www.gitschenen.ch/
       http://centralops.net/*
       http://www.stellar-database.com/*
       http://www.reu.org/*
       http://www.wetter-hessen.de/w3a/default.jsp
       http://www.gross-zimmern.de/*
       http://grazer-huette.members.cablelink.at/*
       http://www.hengsthuette.at/
       http://zsigmondyhuette.com/
       http://www.schauspielschule.com/
       http://www.museumsjournal.de/*
       http://www.berghotel-faulhorn.ch/
       http://www.allstar.fiu.edu/*
       http://www.lisisteurer.at/
       http://www.hiersemann.de/*
       http://immigrants.harpweek.com/*
       http://www.massmoments.org/*
       http://www.ixyspower.com/*
       http://www.body-life.ch/*
       http://www.cvm.qc.ca/*
       http://www.921emt.edu.tw/*
       http://www.rodina.cz/*
       http://de.phorio.com/*
       http://www.vossloh-rail-services.com/*
       http://intranet.library.arizona.edu/*
       http://www.uclm.es/*
       http://books.google.at/books?id=2ps4AAAAIAAJ&pg=PA486&img=1&pgis=1&dq=%22Murray+Dickie%22+Baden&sig=ACfU3U0LoHt2R2RbEvdNcFhqgCy4n42U_A&edge=0
       http://www3.apoverlag.at/*
       http://www.bgfu.de/*
       http://www.bgl-net.de/*
       http://webspace.pugetsound.edu/*
       http://www.icmm.ac.cn/*
       http://www3.dermis.net/*
       http://www3.recht.makrolog.de/*
       http://www.liturgia.it/*
       http://www.caritas-eichstaett.de/*
       http://www.eurowilson.org/*
       http://www.stifterschule.at/
       http://www.roman-kempf.de/
       http://www.vaticanradio.org/*
       http://www.snowdonia-active.com/*
       http://www.schwerhoerigen-netz.de/*
       http://www.annals.edu.sg/*
       http://www.coquilletribe.org/*
       http://www.hotel-tyrol.com/*
       http://www.reky.cz/*
       http://www.lngs.infn.it/*
       http://www.asianscientist.com/*
       http://koreatimes.co.kr/*
       http://www.aerospeed.fr/
       http://www.shishou.gov.cn/*
       http://www.denizmuzeleri.tsk.tr/*
       http://www.kkoe.net/*
       http://www.sins.ch/*
       http://www.logistik.uni-rostock.de/*
       http://www.urs-marti.ch/
       http://library.stu.edu/*
       http://www.villedebreteuilsuriton.fr/*
       http://www.nassandres.fr/
       http://www.davidbordwell.net/*
       http://www.devonkarst.org.uk/*
       http://www.arnstorf.de/*
       http://www.oenp.or.at/
       http://www.jean-paul.de/*
       http://www.poliarcheo.it/*
       http://www.cdi.ensp.unl.pt/*
       http://www.fracht.com/
       http://www.hvs-handball.de/*
       http://www.holzerkennung.at/*
       http://wwwueb.asuch.cas.cz/*
       http://www.heraldmag.org/*
       http://www.artinfo.ru/*
       http://www.k26.com/*
       http://www.cefic.org/*
       http://mushroom-collecting.com/*
       http://www.aagpbl.org/*
       http://www.mike-hawthorn.org.uk/*
       http://www.kuka-systems.com/*
       http://www.packardmuseum.org/*
       http://www.herculaneum.org/*
       http://www.post-journal.com/*
       http://www.gametheory.net/*
       http://www.mpi-fg-koeln.mpg.de/*
       http://blacksea.ehw.gr/*
       http://facultyweb.cortland.edu/*
       http://www.abagnale.com/*
       http://wrosystem.um.wroc.pl/*
       http://www.ezeri.lv/*
       http://www.epolyglot.net/*
       ftp://ftp.fao.org/*,9,28
       ftp://ftp.dpvta.uniud.it/*
       ftp://ftp.idsoftware.com/*
       ftp://www.socbotanica.cl/*
       ftp://ftp.nodc.noaa.gov/*
       ftp://ftp.rsasecurity.com/*
       ftp://ftp.sendmail.org/*8
       ftp://ftp2.kms.dk/*
       ftp://ftp2.stahl-online.de/*
       ftp://mersenne.org/*8
       http://www.bias.de/*
       http://www.sfmuseum.net/*
       http://www.jinr.ru/news_article.asp\?n_id=*
       http://www.inp.nsk.su/activity/annuals/2012_e.pdf
       http://www.cap.ca/*
       http://www.bergwerk-kaepfnach.ch/
       http://www.natur-erleben.niedersachsen.de/suche/navigator.php
       http://cms.education.gov.il/*
       http://walter-benjamin-bluemchen.tumblr.com/*
       http://www.ingral.de/*
       http://www.mid.ru/*
       http://www.hinduism.co.za/*
       http://www.strickhof.ch/*
       http://www.worldrose.org/*
       http://memorial.hazorea.org.il/*
       http://www.dafyddapgwilym.net/*
       http://www.andeangeology.equipu.cl/*
       http://www.xiangfen.gov.cn/
       http://www.china-tour.cn/*
       http://www.peacepsych.org/*
       http://www.greatships.net/*
       http://www.politonline.ch/*
       http://www.chrono-tm.org/*
       http://www.muzeumcheb.cz/*
       http://manokarjera.cv.lt/*
       http://www.strasin.com/*
       http://toulon.org/
       http://www.ostruzno.eu/
       http://www.cidh.oas.org/*
       http://www.udb.edu.sv/*
       http://www.feusisberg.ch/
       http://www.cesar.umd.edu/*
       http://www.bsnpr.com/*
       http://www.my-boat.ch/*
       http://www.cssvj.edu.lb/*
       http://www.kuredux.com/*
       http://www.longyao.gov.cn/
       http://www.celestialchurch.com/*
       http://www.crnindia.com/*
       http://www.rbi.org.in/*
       http://www.casentino.toscana.it/*
       http://www.bcv.cv/*
       http://www.bon.com.na/*
       http://www.tlalnepantla.gob.mx/*
       http://archive.fieldmuseum.org/*
       http://www.vietnamtourasia.com/*
       http://www.motoi.biz/
       http://www.munchausen.org/*
       http://www.rbz.co.zw/*
       http://www.museumblumenstein.ch/*
       http://www.bcv.org.ve/*,56
       http://www.asolangenstein.eduhi.at/*
       http://www.ceremoniaire.net/*
       http://www.wbcsd.org/*
       http://www.ebpm.com/*
       http://www.nflibrary.ca/*
       http://www.cctsbeijing.com/*,28
       http://www.altenberge.de/*
       http://www.sachsa-online.de/*
       http://www.yangshuochina.com/*
       http://www.itspakistan.net/*
       http://www.lifeinkorea.com/*
       http://www.skullsite.com/*
       http://www.kreuznacherdiakonie.de/*
       http://www.caam.org.cn/*
       http://solar-sicherheit.de/*
       http://www.lsd.info/*
       http://www.heritage.lt/*
       http://www.tracksounds.com/*
       http://www.golden-dawn.org/*
       http://www.curriculum.edu.au/*
       http://www.guzelbahce.bel.tr/
       http://www.burgenkids.ch/*
       http://www.pnm.pt/*
       http://www.yildizeli.bel.tr/
       http://www.evren.bel.tr/
       http://www.italyworldclub.com/
       http://www.horasan.bel.tr/
    

    IABot Management Interface (v1.2beta3; IABot v1.5beta; checkIfDead v1.3) ©2017 Cyberpower678

    Active users in the last 5 minutes: 2
    • @Martina Nolte: Ich bin bereit IABot so einzurichten wie es möglich geht so das dewiki, IABot mit offenen Armen akzeptieren will. Das heist dieses Botmarkierung kann ich in IABot's dewiki Modul programmieren. IABot hat verschiedene arbeite Module für unterschiedliche Wikipedias. Die Artikel Bearbeitung wird zum Grossteil im Modul Programmiert, aber die Konfigurationsoptionen, kann IABot's Benehmen ändern. Ich kann mal eine Prototyp Modul installieren und zur Verfügung stellen. Parameter die nicht definiert sind, sind auf Standardwerte gesetzt. Die Standardwerte für citation_tags, talk_only_tag, no_talk_tags, ignore_tags, sind jeweils die komplette Liste von Zitat vorlagen in alle Sprachen IABot kennt, Vorlage:Cbtalkonly, Vorlage:Cbnotalk, und Vorlage:Cbignore.
      • IABot erkannt alle Zitatvorlagen, in alle programmierte Sprachen. Wenn dewiki integriert wird, werden alle Deutsche Vorlagen mit programmiert.
      • Die Vorlage:Cbnotalk Vorlage wird im Artikel irgendwo platziert. IABot erkennt das als Signal keine Nachricht zu hinterlassen.
      • Die Vorlage:Cbtalkonly Vorlage wird im Artikel irgendwo platziert. IABot erkennt das als Signal nur eine Nachricht zu hinterlassen, und die Artikel in Ruhe zu lassen.
      • Die Vorlage:Cbignore Vorlage wird an ein Referenz oder Link angeheftet im Artikel. IABot erkennt das als Signal um eine bestimmte Quelle komplett zu ignorieren.
      • IABot erkennt . Wenn die Vorlage im Artikel irgendwo platziert wird, IABot bleibt vom Artikel fern, unter hinterlässt keine Nachricht.
      • paywall_tags ist eine Liste von Vorlagen die Quellen für IABot identifizieren, die eine Konto braucht um den Inhalt zuzugreifen. IABot merkt sich die Domains um false positives zu vermeiden. Kurz erklärt IABot lernt davon.
      • IABot's DB muss erst mal die URL eingespeichert haben, und dass passiert nur wenn IABot die URL von einer Artikel aufnimmt. Um es abzukürzen kann ich die dewiki DB abrufen und die URLs einspeichern. Dann kann die FP liste ein gespeist werden.
      • Die Tool sollte dich nicht ausloggen. Sessions sollte dauerhaft sein. English Wikipedia ist der Standard Wikipedia. Du kannst deins auswählen wenn ich IABot für dewiki Programmiert habe.
    • Hoffentlich hilft das.—CYBERPOWER (Diskussion) 03:10, 7. Aug. 2017 (CEST)
    @User:Cyberpower678: Super, vielen Dank! Es wäre klasse, wenn du die dewiki URLS in deine Datenbank aufnehmen könntest. Früher oder später werden Daten und Dienste deines Bots für uns hilfreich sein. Ich bin überzeugt, dass deine Arbeit nicht vergebens sein wird.
    Ich habe angefangen Dead-links.js ins Deutsche zu übersetzen (und auch sprachlich an unsere bisherigen Nachrichten anzupassen). Falls wir - wie es oben angeregt wird - auf Portalwunsch einen oder zwei Probeläufe/Pilottests (via runbotqueue) durchführen, ist die für dich dann schon weitgehend vorbereitet. Einen Probelauf würden wir mit den vorhandenen Mitteln und Vorlagen laufen lassen; d.h. ohne die individuellen/händischen Opt-outs (cbnotalk, cbignore, cbtalkonly). Ich gucke mir mal an, was uns sonst noch dafür noch fehlt. --Martina Disk. 03:26, 8. Aug. 2017 (CEST)
    nachträglicher Ping an @User:Cyberpower678 für die Nachricht eins höher. --Martina Disk. 03:26, 8. Aug. 2017 (CEST)

    Aktuelle Situation[Quelltext bearbeiten]

    Das nur der GitftBot das macht stimmt so nicht, meiner macht auch was. Bei mir ist es allerdings „halbautomatisch“, also ein Mensch stellt eine Ersetzungstabelle zusammen, und mein Bot kümmert sich dann um sonst sehr mühselige ersetzen. In diesem Jahr war da zwar noch nicht so viel, aber im letzten Jahr habe ich damit schätzungsweise mehr als 80.000 ANR Edits durchgeführt (außer dieser Aufgabe macht mein Bot sonst nur sehr selten Edits im ANR). Viele Grüße, Luke081515 16:26, 8. Aug. 2017 (CEST)

    Luke: Danke. Das wusste ich nicht. Wie heißt dein Bot? Benutzer:Luke081515Bot - ich passe das umseitig an. --Martina Disk. 04:22, 9. Aug. 2017 (CEST)

    To-do-Liste[Quelltext bearbeiten]

    Folgende Aufgaben sind noch zu erledigen:

    IABot False Positive Rate auf fast 0 reduzieren[Quelltext bearbeiten]

    Eine import Liste wird wahrscheinlich unnötig sein. Sehe dieses Ticket. Ich arbeite an eine Method False Positives automatisch zu entdecken, und selber korrigieren.—CYBERPOWER (Diskussion) 15:21, 9. Aug. 2017 (CEST)

    Ok, klingt klasse! Wir sollten unbedingt vermeiden, dass bereits gemeldete false positives nochmal eingetragen werden. --Martina Disk. 15:37, 9. Aug. 2017 (CEST)
    Das ist … genial. – Giftpflanze 16:46, 9. Aug. 2017 (CEST)

    Nochmals Lösungsansatz[Quelltext bearbeiten]

    "Es ist offensichtlich, dass der Rückstau defekter Weblinks mit der gegebenen Kapazität der Wikipedia-Community nicht zu bewältigen ist." Das ist eine Tatsachenbehauptung, die m.E. mindestens partiell falsch ist. Es ist sehr fraglich und mit den gegebenen Mitteln nicht zu beantworten, ob der Befund (viele Botmeldungen unbearbeitet) wirklich an der "Kapazität" der Wikipedia-Community liegt. In der Diskussion wurde eine ganze Reihe von anderen Gründen besprochen. Einer davon, nämlich der Mangel an Bedienungskomfort, spielt sogar in den Pro-Argumenten eine bedeutende Rolle. Im Übrigen müssten die vom Bot gesetzten Links ohnehin von ebender Community überprüft werden, der die Kapazität dazu abgesprochen wird. "Offensichtlich" scheint mir hier nichts.--Mautpreller (Diskussion) 23:21, 9. Aug. 2017 (CEST)

    Mir schon. Aber du kannst gerne einen Umformulierungsvorschlag machen. --Leyo 23:25, 9. Aug. 2017 (CEST)
    Eine Möglichkeit wäre zum Beispiel: Zahlreiche tote Weblinks sind trotz der bisherigen Möglichkeiten, diese auf der Diskussionsseite zu melden, nicht ausgeräumt. Wir sehen nicht, dass dies sich unter den gegebenen Bedingungen bessern wird. (Und so weiter.) --Mautpreller (Diskussion) 23:37, 9. Aug. 2017 (CEST)
    Damit bin ich (als Urheber der kritisierten Formulierung) einverstanden, möchtest du deinen Vorschlag umsetzen? Gestumblindi 00:47, 10. Aug. 2017 (CEST)

    Können wir bitte Zahlreiche tote Weblinks sind trotz der bisherigen Möglichkeiten, diese auf der Diskussionsseite zu melden, nicht ausgeräumt. umformulieren zu Zahlreiche tote Weblinks sind trotz Meldungen auf der Diskussionsseite nicht ausgeräumt.  ? Es gibt ja nicht nur die Möglichkeit zur Meldung, sondern eine sechsstellige Zahl wurde gemeldet (und trotzdem nicht abgearbeitet). Liest sich außerdem flüssiger, finde ich. :-) --Martina Disk. 04:55, 10. Aug. 2017 (CEST)

    Gestumblindi: Ich hier fang mal an, dich zu offenen Fragen anzupingen. --Martina Disk. 15:42, 11. Aug. 2017 (CEST)
    Wie ich sehe, wurde diese Stelle schon entsprechend geändert und ich bin damit einverstanden. Gestumblindi 20:41, 11. Aug. 2017 (CEST)

    Ergänzen vs. Ersetzen: welche Vorlagen darf der Bot benutzen?[Quelltext bearbeiten]

    Ich finde die Formulierungen in den derzeitigen Vorschlägen bezüglich Ersetzen des Originallinks und Ergänzen durch einen Archivlink nicht eindeutig. {{Webarchiv}} ergänzt den Archivlink in der Vorlage, aber für den Leser ist der Originallink nicht mehr sichtbar, für ihn wurde der Originallink durch einen Archivlink ersetzt. Demnach müsste die Verwendung von {{Webarchiv}} durch einen Archivbot eine eigene Vorschlagsvariante 3 sein, oder?
    Außerdem ist mir bei den Vorlagen {{Toter Link}} und {{Webarchiv}} nicht klar, woraus die überhaupt gebildet werden. Aus einem "nackten" Link, der nicht in eine Weblinkvorlage eingebunden war? Wenn ja, wie würde der Bot dann erkennen, was der Titel, Herausgeber, das Datum, das Zugriffsdatum waren? Ich veranschauliche das mal hier drunter. --Martina Disk. 07:47, 10. Aug. 2017 (CEST)

    Ein Spaßvogel hat meinen umseitigen toten Abwasser-Beispiellink (Archivversion) aus Wikipedia entfernt, noch nicht einmal mit dem verfügbaren live Link ersetzt. Danke dafür. --Martina Disk. 09:09, 10. Aug. 2017 (CEST)

    Neues Beispiel

    Der Bot ermittelt aus der Versionsgeschichte das Datum der Einfügung und behandelt dies als das Zugriffsdatum. Anschlie0end sucht der Bot eine Archivversion möglichst kurz vor dem Zugriffsdatum. Angenommen, es wäre von Anfang an eine Vorlage verwendet worden; dann sähe das Vorher-Nachher mit dem Bot so aus:

    Vorlage Parameter Vorher nachher
    {{Toter Link}} Variante 1 url = ASFINAG-Serviceheft – ASFINAG Autobahnmeistereien – Regionale Zuständigkeiten (PDF; 6,58 MB; Seite 8 von 61) ASFINAG-Serviceheft – ASFINAG Autobahnmeistereien – Regionale Zuständigkeiten (PDF; 6,58 MB; Seite 8 von 61)@2Vorlage:Toter Link/www.asfinag.at Seite nicht mehr abrufbar; Suche in Webarchiven: ASFINAG Autobahnmeistereien – Regionale Zuständigkeiten
    {{Toter Link}} Variante 2 url = ASFINAG-Serviceheft – ASFINAG Autobahnmeistereien – Regionale Zuständigkeiten (PDF; 6,58 MB; Seite 8 von 61) ASFINAG-Serviceheft – ASFINAG Autobahnmeistereien – Regionale Zuständigkeiten (PDF; 6,58 MB; Seite 8 von 61) (Seite nicht mehr abrufbar) ]
    {{Webarchiv}} url=
    wayback=
    (oder webciteID=
    oder archive-is=)
    ASFINAG-Serviceheft – ASFINAG Autobahnmeistereien – Regionale Zuständigkeiten (PDF; 6,58 MB; Seite 8 von 61) ASFINAG-Serviceheft – ASFINAG Autobahnmeistereien – Regionale Zuständigkeiten (PDF; 6,58 MB; Seite 8 von 61) Archivversion (Memento vom 5. November 2012 im Internet Archive)
    {{Internetquelle}}
    Variante 1
    url=
    offline=
    archiv-url=
    ASFINAG Autobahnmeistereien – Regionale Zuständigkeiten. Abgerufen am 28. November 2012. ASFINAG Autobahnmeistereien – Regionale Zuständigkeiten. Umweltportal, archiviert vom Original am 5. November 2012, abgerufen am 28. November 2012.
    {{Internetquelle}}
    Variante 2
    url=
    offline= ja
    archiv-url=
    ASFINAG Autobahnmeistereien – Regionale Zuständigkeiten. (Nicht mehr online verfügbar.) Ehemals im Original, abgerufen am 28. November 2012.@2Vorlage:Toter Link/www.asfinag.at (Seite nicht mehr abrufbar; Suche in Webarchiven) ASFINAG Autobahnmeistereien – Regionale Zuständigkeiten. Archiviert vom Original am 5. November 2012, abgerufen am 28. November 2012.
    {{Cite web}}
    Variante 1
    url=
    offline=
    archiveurl=
    ASFINAG Autobahnmeistereien – Regionale Zuständigkeiten. Abgerufen am 13. Februar 2011. ASFINAG Autobahnmeistereien – Regionale Zuständigkeiten. Archiviert vom Original am 5. November 2012.
    {{Cite web}}
    Variante 2
    url=
    offline= ja
    archiveurl=
    ASFINAG Autobahnmeistereien – Regionale Zuständigkeiten. Abgerufen am 13. Februar 2011.@2Vorlage:Toter Link/www.asfinag.at (Seite nicht mehr abrufbar; Suche in Webarchiven) ASFINAG Autobahnmeistereien – Regionale Zuständigkeiten. Archiviert vom Original am 5. November 2012.
    Gestumblindi: Wie verstehst du das "Ergänzen" in Vorschlag 1 und 2 - muss der Originallink für den Leser sichtbar bleiben oder darf er auch unsichtbar werden und gilt trotzdem als (in der Vorlage) ergänzt? Oder sollten wir dazu eine weitere Abstimmpotion einfügen? Die automatische Archivierung aller bei uns verwendeten Weblinks im Internet Archive erlauben wir in keiner Version, oder? --Martina Disk. 15:45, 11. Aug. 2017 (CEST)
    @Martina Nolte: Meiner Meinung nach sollte der Originallink in diesen Vorschlägen sichtbar bleiben. Hat für den Leser auch den Vorteil, dass er unmittelbar selbst testen kann, ob er wirklich (immer noch) nicht funktioniert, oder vielleicht will er den Link auch anderweitig verwenden. - Die Archivierung bei uns verwendeter Weblinks im IA, ob automatisch oder nicht, hat ja erstmal grundsätzlich keine Auswirkungen auf die Wikipedia (das IA kann archivieren, was es will, unabhängig davon, ob wir einen solchen Archivlink dann auch verwenden), insofern ist das m.E. gar kein Thema, über das man hier abstimmen kann. Wenn jemand dafür sorgen will, dass das IA alles archiviert, was hier verlinkt ist, kann er das machen, wir können ihn ja nicht daran hindern (und warum sollten wir?). Gestumblindi 20:46, 11. Aug. 2017 (CEST)
    @Martina Nolte, Mautpreller: Ich sehe, dass in den Vorschlagstexten unter "Nicht erlaubt" gegenwärtig sogar ausdrücklich "Automatisierte Anforderung von Sicherungen aller in der deutschsprachigen Wikipedia verwendeten Weblinks in einem Archivdienst durch einen hiesigen Bot. (Ob einzelne Archivdienste von sich aus Massenspeicherungen machen, ist jedoch nicht von uns steuerbar)" steht. Ich halte ein solch explizites Verbot aus oben angeführten Gründen für entbehrlich und das MB unnötig verkomplizierend (auf jeden unnötigen Ballast sollte verzichtet werden). Es würde zudem gleichzeitig mit der Erlaubnis für Bots, bestimmte Aktionen vorzunehmen, neu ein bislang so nicht bestehendes Verbot anderer Aktionen einführen - was Abstimmende, die nichts gegen "Massenspeicherungen" in einem Archivdienst haben, vor eine Zwickmühle stellen könnte. Wie gesagt: Ein Bot, der einem Archivdienst Anweisungen gibt, bestimmte Weblinks zu archivieren, ändert in der Wikipedia allein damit noch rein gar nichts. M.E. kein Thema für dieses Meinungsbild. Gestumblindi 22:02, 11. Aug. 2017 (CEST)
    @Martina Nolte, Mautpreller, Gestumblindi: Es werden bereits seit 2013 automatisch alle neu in die Wikipedia eingefügten URLs im Internet Archive archiviert, die lesen per IRC Spezial:Letzte Änderungen mit. Das funktioniert meiner Erfahrung nach recht zuverlässig, es ist daher sehr häufig eine Archivversion zum richtigen Zeitpunkt verfügbar.--Cirdan ± 22:42, 11. Aug. 2017 (CEST)
    @Cirdan: Danke - wenn das eh schon seit Jahren so ist, ist das definitiv ein hier irrelevanter Punkt und wir können das MB diesbezüglich entschlacken. Danke! :-) Gestumblindi 22:50, 11. Aug. 2017 (CEST)
    Als Beispiel: diese Änderung sorgt für die Speicherung sechs Minuten später (die Zeiten im Internet Archive sind UTC): im Internet Archive. Dass dieser Service schon länger funktioniert, sieht man auch daram, dass der letzte GiftBot-Lauf erstaunlich häufig Archivversionen zu genau dem Tag hervorgebracht hat, an dem der Einzelnachweis gesetzt wurde. Wir profitieren also schon jetzt davon.--Cirdan ± 22:55, 11. Aug. 2017 (CEST)

    Gestumblindi : Ich hatte diesen Punkt aufgebracht, weil der IABot ein feature hat, mit dem der Bot alle Links nach IA "meldet". D.h. auch solche aus einer Zeit, bevor IA selbst mit dem Massenspeichern begonnen hat. Und ich glaube eben, dass wir das nicht machen und als Option nicht erlauben sollten. --Martina Disk. 00:45, 12. Aug. 2017 (CEST)

    @Martina Nolte, Cyberpower678: Verstehe ich das Feature richtig: Wenn der IABot prüft, ob ein Link noch funktioniert, besteht die Möglichkeit, dass er ihn gleich ans Internet Archive zum Archivieren meldet, falls dies der Fall ist? Warum genau findest du das eine schlechte Idee, Martina - Mautprellers grundsätzliche Archivierungs-Vorbehalte scheinst du ja nicht zu teilen? Wenn wir hier wirklich auch darüber abstimmen sollen, dann würde ich das als Zusatzfrage gestalten. Es geht ja um etwas anderes als um die Diskussion über Eingriffe in den ANR, sollte nicht damit vermengt werden - und auch nicht Abstimmende vor ein Dilemma stellen, die für einen der Vorschläge sind, ohne zugleich dieses Feature verbieten zu wollen. Die Abstimmung würde also um einen Punkt "Zusatzfrage" ergänzt, diese könnte etwa lauten: "Soll es Bots wie dem IABot erlaubt werden, bei der Überprüfung auf defekte Weblinks zugleich sofort die Archivierung bei Anbietern wie dem Internet Archive auszulösen, wenn ein Weblink noch erreichbar ist?" Gestumblindi 22:54, 12. Aug. 2017 (CEST)
    Internet Archives Archiviert automatisch alle neue Links die zu Wikipedia hinzugefügt wird. IABot muss nichts machen, aber die Fähigkeit besteht das IABot das machen kann besteht aber.—CYBERPOWER (Diskussion) 00:03, 13. Aug. 2017 (CEST)
    Gestumblindi : Für mich macht es einen Unterschied, ob wir vorhandene externe Ressourcen nutzen, oder ob wir einen einzelnen Anbieter aktiv beschicken und damit quasi eine externe Resource unsererseits schaffen. Meiner Meinung nach müssten wir das dann z.B. auch mit WebCite und 19 anderen ? machen (falls ich das nicht flasch verstanden habe, scheint die Technik im Wikiversum länger verfügbar zu sein). Meinem Gefühl nach würden wir mit einer Erlaubnis für dieses Feature ein gänzlich neues Fass aufmachen, das über das Ziel und Thema des MB hinausgeht. So verstehe ich auch deinen Punkt - wir haben solche Verbote nicht - nur kommen wir zu einem anderen Schluss. Ich würde die Funktion verbieten, Du in Vorschlag 3 alle erlauben, also auch diese.
    Ich hab umseitig - entsprechend Giftpflanzes Fragen weiter unten - mal den Vorschlag 3 spezifiziert. Darin sind nicht mehr alle Funktionen des IABot pauschal erlaubt, sondern in einer Positiv- und einer Negativliste abgegrenzt. Die aktive Meldung von Links an die Wayback Machine ist darin nicht enthalten. Wir regeln diesen Punkt also nicht in diesem MB. Ich glaube, so wäre es in unser beider Sinne, oder? Sorry, ich will's nicht komplizierter als nätig machen, aber wir sollten auch nicht versehentlich Dinge erlauben oder verbieten.--Martina Disk. 09:20, 13. Aug. 2017 (CEST)
    @Cyberpower678: Ich glaube, es würde um ältere Links gehen, die schon lange in der Wikipedia sind und die noch nicht archiviert sind. Oder hat das Internet Archive inzwischen eh schon alle in der Wikipedia vorhandenen Links, die noch erreichbar sind, archiviert? Gestumblindi 03:10, 13. Aug. 2017 (CEST)
    @Martina Nolte: So wie ich es sehe, ist ein solches Feature zur Zeit weder erlaubt noch verboten. Da es keine Änderungen in der Wikipedia selbst auslöst und auch keine besonderen Berechtigungen benötigt, können wir einen Bot auch gar nicht daran hindern - wir könnten höchstens den unverbindlichen Wunsch äussern, er möge das doch bitte nicht tun, wobei das Internet Archive nun offenbar ja eh schon, wie diskutiert, ohne unser Zutun seit Jahren alle in der Wikipedia (neu) verlinkten Seiten automatisch archiviert. Insofern ist der Punkt sowieso nur noch von ziemlich limitierter Relevanz, er käme höchstens einmalig zum Zuge, sofern nicht eh schon alles Erreichbare archiviert ist (siehe meine obenstehende Frage an Cyberpower). - Die Formulierung von Vorschlag 3 finde ich gut. Gestumblindi 17:33, 13. Aug. 2017 (CEST)
    Ich glaube, wir sollten hier nicht zwei unterschiedliche Dinge miteinander vermischen: Wikipedia lesen darf jeder, auch jeder Bot. Google und Co lesen in Echtzeit alle Änderungen mit, genauso wie es das Internet Archive tut. Darauf haben wir keinen Einfluss und solange sich diese Dritten an die Nutzungsbedingungen der WMF halten, gibt es auch keinen Grund, etwas dagegen zu unternehmen. Wenn das Internet Archive oder eine andere Institution die von uns verlinkten Seiten archivieren möchte, steht ihnen das frei.
    Etwas anderes ist es, wenn es darum geht, in die Wikipedia zu schreiben. Das können wir als Community im Rahmen der Wikipedia:Grundprinzipien über Meinungsbilder usw. regulieren. Wir sollten uns also darauf beschränken, im Rahmen dieses Meinungsbilds auch nur das zu diskutieren, was überhaupt durch uns geregelt werden kann.--Cirdan ± 18:42, 13. Aug. 2017 (CEST)

    Vorher-Nachher mit dem IABot[Quelltext bearbeiten]

    @User:cyberpower678: Wie handhabt der Bot das fehlende Zugriffsdatum bei solchen "nackten" Links, die nicht in Vorlagen eingebunden waren und für die kein Datum angegeben wurde? Beispiel: ASFINAG-Serviceheft – ASFINAG Autobahnmeistereien – Regionale Zuständigkeiten (PDF; 6,58 MB; Seite 8 von 61) --Martina Disk. 09:09, 10. Aug. 2017 (CEST)

    @Martina Nolte: Der Bot macht eine Binäresuch von der Verlauf.—CYBERPOWER (Diskussion) 14:21, 10. Aug. 2017 (CEST)
    Was bedeutet das? Wie sieht das aus? --Martina Disk. 20:27, 10. Aug. 2017 (CEST)
    @Cyberpower678:: Du meinst vermutlich Binäre Suche. Der Bot durchsucht die Versionen nach dem Datum der Einfügung und sucht nach einer Version möglichst zeitnah vor diesem Edit. Klingt sehr gut! Soweit so klar. Meine Frage ist aber diese:
    Vor ca. 2 Wochen hattest du diesen Link als Beispiel für die Ergänzung eines "nackten" Links in einem Einzelnachweis angegeben. Wir haben sehr viele solcher Einzelnachweise, die keine Weblink-/Zitiervorlage nutzen. Die in deinem Beispiel Bodo Otto verwendete Vorlage {{Webarchive}} ist bei uns eine Weiterleitung auf {{Webarchiv}} und die verhielte sich wie nachfolgend. Das geht also auf deWP nicht. Was würde der Bot bei uns stattdessen machen? --Martina Disk. 06:57, 11. Aug. 2017 (CEST)
    IABot wird für dewiki adaptiert. Webarchiv wird korrect verwendet.—CYBERPOWER (Diskussion) 15:40, 11. Aug. 2017 (CEST)
    Okay, danke! Und als Zugriffsdatum auf den Originallink wird das Datum des Edits in der Versionsgeschichte definiert? --Martina Disk. 15:48, 11. Aug. 2017 (CEST)
    PS: Wird der Titel auch automatisch erkannt und eingesetzt? Wie vermeiden wir, dass der Titel zwimal angezeigt wird? --Martina Disk. 15:52, 11. Aug. 2017 (CEST)/19:10, 12. Aug. 2017 (CEST)

    runbotqueue[Quelltext bearbeiten]

    @User:cyberpower678: runbotqueue ist scheinbar noch nicht für die deutschsprachige Wikipedia eingerichtet. Kannst du das machen, damit ich einzelne Artikel "händisch" testen kann? Du brauchst dafür kein Botflag. --Martina Disk. 09:24, 10. Aug. 2017 (CEST)

    Dewiki muss erst eingerichtet werden. Botqueue ist deaktiviert so lange IABot keine Offizielle Erlaubnis hat.—CYBERPOWER (Diskussion) 14:23, 10. Aug. 2017 (CEST)
    Wenn du uns nichts zum Angucken gibst, entweder in einem Test mit händisch eingegeben Artikeln oder mit einer Vorher-Nachher-Liste, wird es schwieriger die Vorteile des IABot einzuschätzen und sich für ihn zu entscheiden. Ich habe mich jetzt wochenlang eingelesen, um die Funktionalitäten und Optionen in Bezug auf den Output zu verstehen und habe immer noch einige Fragen, wie das dann nachher aussehen wird. Das wird anderen noch viel mehr so gehen. Ich versuche deshalb, die ganze Sache sehr anschaulich darzustellen. Aber ich brauche dafür deine Hilfe. Sonst wird das nichts --Martina Disk. 20:39, 10. Aug. 2017 (CEST)
    Ich gebe dir schon was anzugucken. Nur keine Panik. Ich bitte um etwas Geduld. :-)—CYBERPOWER (Diskussion) 01:42, 11. Aug. 2017 (CEST)
    Okay. :-) --Martina Disk. 05:25, 11. Aug. 2017 (CEST)

    Vorschlag 3 und Auftrag an Bot[Quelltext bearbeiten]

    Was ist an Vorschlag 3 konkret anders als an Vorschlag 2? Vorschlag 1 und 2 erscheinen mir gut abgegrenzt. Was Vorschlag 3 bedeutet ist mir jedoch recht schleierhaft. Werden dann defekte Links komplett durch einen Archivlink ersetzt? Dann sollte man das so schreiben. Oder kommen da noch eine ganze Menge andere Sachen dazu (die Liste, was IABot macht ist zwar lang, aber aus funktioneller Sicht nicht sehr erhellend)? Dann finde ich aber, dass wir besser ganz konkrete Vorschläge aufstellen sollten. Und dann frage ich mich schon länger, was „Auftrag an Bot“ jetzt genau bedeutet. Einerseits finde ich da den Aspekt, dass man den Bot beauftragen kann, einen bestimmten Artikel zu prüfen und Archivlinks einzufügen. Andererseits das Einfügen eines Archivlinks durch den Bot mit der Bitte an die Benutzer, die Richtigkeit dieser Einfügung zu überprüfen. Was davon ist gemeint? – Giftpflanze 19:22, 11. Aug. 2017 (CEST)

    Sehe ich genau so. Die erlaubten Funktionen sollten konkret benannt werden Mit dem Auftrag an den Bot geht es mir wie dir. Ich glaube das hatte Bobo eingefügt. .M.E kann das besser als Bedingung zu den erlaubten Funktionen ergänzt werden. Oder? --Martina Disk. 20:19, 11. Aug. 2017 (CEST)

    @ Giftpflanze, Gestumblindi : So? --Martina Disk. 07:38, 13. Aug. 2017 (CEST)

    Seit 2013 wird jede URL, die in die Wikipedia eingefügt wird, automatisch archiviert[Quelltext bearbeiten]

    Diese Behauptung wurde hier ohne Begründung durch Benutzer:Cirdan eingefügt. Meine Entfernung wurde mehrfach zurückgesetzt (z.B. mit der Begründung „Man kann sich auch lächerlich machen...“). --Succu (Diskussion) 23:12, 11. Aug. 2017 (CEST)

    Ja. Ich habe dir jetzt zwei Links dazugepackt und kann gerne auch das Internet Archive bitten, dir das hier nochmal zu bestätigen. Du könntest aber auch einfach mal selbst nachschauen. Die lesen wie auch oben geschrieben seit 2013 die Letzten Änderungen für ca. 280 Wikipedia mit und archivieren alle neu eingefügten URLs, wie den meisten Benutzern, die die GiftBot-Meldungen abarbeiten, auch aufgefallen sein dürfte.--Cirdan ± 23:15, 11. Aug. 2017 (CEST)
    Siehe auch diesen Kommentar von Wendy Hanamura: „For 3 years we have been crawling ALL Wikipedia links in every language. We at Internet Archive would next really like to work with other Wikipedia groups to have similar bots replacing dead links. Looking for partners to work with us!“--Cirdan ± 23:21, 11. Aug. 2017 (CEST)
    (BK): Zitat aus Wikipedia community and Internet Archive partner to fix one million broken links on Wikipedia: „This has been done by the Internet Archive’s monitoring for all new, and edited, outbound links from English Wikipedia for three years and archiving them soon after changes are made to articles.“ Da steht nicht das dies für alle Wikipedias (z.B. ceb, zh, ...) zutrifft. --Succu (Diskussion) 23:24, 11. Aug. 2017 (CEST)
    „So, what is next for this collaboration between Wikipedia and the Internet Archive? Well… there are nearly 300 Wikipedia language editions to rid of broken links. And, we are exploring ways to help make links added to Wikipedia self-healing. It’s a big job and we could use help.“ --Succu (Diskussion) 23:34, 11. Aug. 2017 (CEST) PS: Wendy Hanamura, Director of Partnerships
    Cirdan hat weiter oben ja auch ein Beispiel aus der Praxis angeführt: Sechs Minuten nach dieser Änderung war die Seite im Internet Archive gespeichert. Ausserdem schreibt er: "Dass dieser Service schon länger funktioniert, sieht man auch daram, dass der letzte GiftBot-Lauf erstaunlich häufig Archivversionen zu genau dem Tag hervorgebracht hat, an dem der Einzelnachweis gesetzt wurde." Kann also sein, dass die automatische Archivierung in der deutschen Wikipedia noch nicht 2013 angefangen hat, aber wohl doch schon vor dem letzten GiftBot-Lauf (November 2015 - Januar 2016). Gestumblindi 23:37, 11. Aug. 2017 (CEST)
    Ich habe gestern und heute mit Wendy und Mark vom Internet Archive persönlich gesprochen, ich denke mir das also nicht aus. Dass die Links automatisch gecrawlt werden ist schon länger so, das sollte allgemein bekannt sein, ist es aber offenbar nicht. Was seit 2013 passiert, ist das automatische Speichern von hinzugefügten URLs praktisch aller Wikipedia-Sprachversionen. Wie lange die de-wp ganz genau dabei ist, weiß ich nicht, aber der Service läuft für 280+ Wikipedias und man kann es recht einfach testen, indem man einfach mal URLs einfügt und dann schaut, ob die Wayback Machine etwas später einen Snapshot dazu hat.
    Was noch nicht alle Wikipedias haben, sondern bisher erst sechs oder sieben, ist ein Service, dass die archivierten Seiten in der Wikipedia verlinkt werden (über den IABot eben). Ungefähr die gleiche Anzahl Wikipedias hat der Botnutzung schon zugestimmt, von den großen Projekten ausstehend sind noch die französische und eben die deutsche Wikipedia.--Cirdan ± 23:47, 11. Aug. 2017 (CEST)
    Weitere Beispiele Archivierung getriggert von hier. Am 15. April habe ich den Artikel Philip Banse mit Weblink angelegt, Wayback hat ein paar Stunden später einen Snapshot. Man erkennt übrigens auch, dass das getriggert wurde, sehe ich gerade: Die Snapshots sind mit NO404-WKP markiert. Dazu mit der Maus das Datum anklicken, dann erscheint oben unter der Übersichtsleiste eine Zeile, wo das vermerkt ist.--Cirdan ± 23:59, 11. Aug. 2017 (CEST)
    Beide Beispiele stammen aus diesem Jahr. Für die obige Behauptung (gilt für deWP) gibt es außer einer mündlichen Information an Cirdan keinen Beleg. Damit ist der Zusatz für mich nach wie vor irreführend. --Succu (Diskussion) 23:05, 12. Aug. 2017 (CEST)
    Das hier ist ein MB, kein Wikipedia-Artikel. Ich akzeptiere hier auch informell belegte Hintergrundinfos, wenn sie plausibel sind, und sehe aktuell keinen Anlass, an Cirdans Angaben zu zweifeln. Gestumblindi 23:24, 12. Aug. 2017 (CEST)
    Bei einer Meinungsbildung kommt es also deiner Meinung nach nicht so darauf an die Fakten klarzustellen...? Du bist immerhin der Initiator des MB. --Succu (Diskussion) 23:51, 12. Aug. 2017 (CEST)
    Theoretisch offen (wenn man Cirdan nicht glauben will) ist ja sowieso nur noch die Frage, ob "seit 2013" stimmt oder ob mit der automatischen Speicherung erst 2014/2015 begonnen wurde. Dass sie aktuell stattfindet, ist ja leicht nachzuvollziehen, und dass sie schon vor dem letzten GiftBot-Lauf begonnen haben muss, ist angesichts der Resultate auch plausibel. Gestumblindi 00:07, 13. Aug. 2017 (CEST)
    @Succu: Du kannst, wie oben verlinkt, auf dieser Website alle Crawl-Daten runterladen. Der erste Eintrag ist von 2013-09-21, wenn ich das richtig sortiert habe. Du kannst in den Daten nachvollziehen, welche URLs archiviert wurden, weil sie in die Wikipedia eingefügt wurden. Wenn es dich also so im Detail interessiert, kannst du in den Datensätzen minutiös die Arbeit des Internet-Archive-Crawlers nachvollziehen. Ich kann sehr gerne auch ein Statement des Internet Archive dazu einholen. Ich sehe allerdings bisher keinen Grund, daran zu zweifeln, was zum Beispiel Wendy Hanamura unter den WMF-Blogbeitrag geschrieben hat und was sie und der Direktor der Wayback-Machine Mark Graham sowohl in ihrem Vortrag (der demnächst auch als Videomitschnitt online stehen wird), als auch in persönlichen Gesprächen mit Community-Mitgliedern und Mitarbeitern von Wikimedia Deutschland (Anlass dazu war dieser Wunsch) gesagt haben. Zumal die Tatsache, dass diese Speicherungen passieren, wohl kaum überraschend ist, schließlich ist das technisch nicht besonders kompliziert umzusetzen, sondern geradezu naheliegend trivial.--Cirdan ± 00:15, 13. Aug. 2017 (CEST)
    Also wenn ich dich richtig verstehe solle ich in Internet Archive crawldata from feed-driven Wikipedia Outlinks Crawl, captured by crawl345.us.archive.org:no404 from Wed Oct 30 21:19:56 PDT 2013 to Wed Oct 30 15:58:29 PDT 2013. nachsehen, ob Links dabei sind, die auch in deWP verwendet wurden? --Succu (Diskussion) 23:40, 13. Aug. 2017 (CEST)
    @Succu: Das kannst du machen, dann könntest du auch überprüfen, ob das Internet Archive wirklich jeden Tag alles archiviert hat. Den Aussagen der Mitarbeiter ist ja nicht zu trauen. Ich war aber so freundlich, die unglaublich komplizierte Aufgabe zu übernehmen, Beispiellinks rauszusuchen, die ich im Abschnitt eins untendrunter verlinkt habe.--Cirdan ± 23:45, 13. Aug. 2017 (CEST)

    Finde ich besorgniserregend. Siehe oben, Wikipedia Diskussion:Meinungsbilder/Boteinsatz bei toten Links#Monokultur.--Mautpreller (Diskussion) 00:13, 12. Aug. 2017 (CEST)

    Ich habe neulich irgenwo gelesen, dass WebCite automatisch und aktiv von Wikipedia beschickt wird. Ich glaube, das war in der enWP. Der IABot kann auch mit deren Links (insgesamt rund 20 Archivdiensten: siehe oben) beschickt werden. --Martina Disk. 00:40, 12. Aug. 2017 (CEST)
    @Mautpreller: Es steht jedem Archivanbieter frei, das auch zu tun, die IRC-Channels mit den letzten Änderungen stehen offen zur Verfügung und werden von zahlreichen Bots gelesen. Ich würde es natürlich sehr begrüßen, wenn andere Archive dem Beispiel des Internet Archive folgen bzw. Wikipedianer entsprechende Services auf Labs einrichten.--Cirdan ± 01:01, 12. Aug. 2017 (CEST)
    Das wäre eher noch schlimmer.--Mautpreller (Diskussion) 11:47, 12. Aug. 2017 (CEST)
    @Mautpreller: Ich würde gerne deine Position besser verstehen. Angenommen – und diesen Vorschlag gab es ja hin und wieder – ich gründe eine Bibliothek, deren Aufgabe es ist, sämtliche in der deutschsprachigen Wikipedia als Beleg genutzte Literatur zu sammeln und zu konservieren, so dass alle Einzelnachweise und Literaturangaben dauerhaft geprüft werden können. Würdest du das (unabhängig von der realistischen Umsetzbarkeit) befürworten? Falls ja, worin besteht dort für dich der Unterschied gegenüber der Arbeit des Internet Archive, die zumindest alle bei uns als Beleg genutzten Websites archivieren? Falls nein, könntest du konkret benennen, was aus deiner Perspektive gegen diese Art der Konservierung von Belegen(?) spricht? (Die Frage, ob und wie diese konservierten Belege aus der Wikipedia erreichbar sein sollen, spielt zunächst keine Rolle, wir diskutieren hier ja nur die Konservierung an sich.)--Cirdan ± 15:48, 12. Aug. 2017 (CEST)
    Ganz unabhängig von der Nutzung lässt sich das nicht darstellen. Aber ich versuchs mal. - Eine Bibliothek, die alle von der Wikipedia als Beleg genutzte Literatur sammelt, wäre ein Ding der Unmöglichkeit. Als spekulative Idee hätte das Vorteile im Handling, weil man nicht auf Bibliotheksbenutzung angewiesen wäre, praktisch wäre so ein Unterfangen Ausdruck extremer Hybris. Auch da ergibt sich jedoch ein Problem: Sind die Exemplare, die in dieser Wikipedia-Bibliothek gesammelt sind, tatsächlich die "richtigen" Vertreter? Nicht alle Varianten einer gedruckten Quelle sind gleich (Textvarianten, Fehler usw.), und vor allem finden sich die Quellen im Allgemeinen in einem konkreten, physischen Zusammenhang, der durch auszugsweise Repräsentation zerstört wird. Es ist gut und nicht schlecht, dass man sich schon um die zahlreichen auf der Welt vorhandenen physischen (und elektronischen) Sammlungen bemühen muss, die ganz unabhängig von der Wikipedia angelegt wurden. So hat man nämlich tatsächlich unabhängiges Material als Grundlage, nicht für unsere Bedürfnisse zugeschnitten, sondern präexistent. So kann ein echter Abgleich funktionieren.
    Hier geht es jedoch um etwas anderes. Es geht um Websites. Das sind ebenfalls Veröffentlichungen, jedoch von anderer Materialität. Sie können heute so und morgen so lauten, sie sind fluide. Oft werden sie schon nicht ultrasolide angelegt, weil man sie leicht ändern kann (und das gilt auch für Scans gedruckter Literatur, wie ich nicht nur einmal erlebt habe). Sie enthalten oft Fehler, die (nach einer Abmahnung, einem Rechtsstreit, einer Aktualisierung usw.) stillschweigend korrigiert werden (oder erst neu reingebracht werden). Man könnte nun sagen, hätte man eine lückenlose Bibliothek all dieser Websites in all ihren wechselnden Zuständen, dann könnte man diese Fluidität perfekt abbilden. Praktisch stimmt das aus mehreren Gründen nicht. Erstens kann sie nicht lückenlos sein und ist es auch nicht. Zweitens kann sie nicht wirklich ausgewertet werden, weil die zu treffenden Entscheidungen immer willkürlich bleiben müssen. Drittens aber entsteht diese "Bibliothek" überhaupt nicht unabhängig, sondern auf unsere Bedürfnisse zugeschnitten. Wer einen Weblink als Beleg verwendet, verewigt damit selbst den momentanen Zustand der Website. Das ist nicht so wie bei einer Bibliothek, die ihre Sammelgebiete unabhängig von uns verfolgt, die Auswahl geschieht nach dem, was wir tun. Die Unabhängigkeit der Quellen von der Wikipedia ist massiv gestört.
    Das mag alles recht theoretisch klingen, praktisch sieht es jedoch nach meinem Eindruck viel bedrohlicher aus. Das liegt an zwei Dingen. Sooft auch betont wird, dass gedruckte Literatur zu bevorzugen wäre, Weblinks sind sehr viel praktischer. Man muss sich nicht einlesen und kann per Googlesuche Splitter zusammensuchen. Vor allem hat man einen "Beleg", der auch RC-Leuten und Sichtern zur Verfügung steht; die Chance, dass man nicht revertiert wird, ist viel größer. Eine echte Überprüfung im Kontext wird da meist nicht geleistet. Sehr viele Artikel bei uns sind deswegen so schlecht, weil sie sich auf zusammengegooglete Weblinks verlassen, obwohl Literatur vorhanden ist (die man freilich lesen und nicht nur durchsuchen müsste). Es gibt mittlerweile genügend Leute, die ernsthaft glauben, dass die Wikipedia sich nur auf Onlinequellen aufbaue und das auch richtig sei. Dramatischer ist aber das zweite Merkmal: Das InternetArchive sammelt ja diese Versionen nicht nur, es veröffentlicht sie. Wenn wir diese Links nutzen, wird eine Website plötzlich in einem beliebigen willkürlichen Zustand zu einer extrem breit rezipierten Veröffentlichung, völlig unkontrolliert und ohne jeden Blick auf Urheber- und Persönlichkeitsrechte, auch ohne jeden Blick auf Korrektheit. Mag sein, einen Tag später ist die Seite vom Netz genommen worden, weil ihr Inhalt falsch war - tut nichts, unser Bot veröffentlicht sie für die Ewigkeit!
    Und jetzt der Bogen zur Monokultur. Hier schreiben wir etwas auf einer der meistgenutzten Webseiten der Welt. Wir legen einen Weblink als Beleg, weil das so schnell geht und unmittelbar überzeugend wirkt. Der Link verschwindet irgendwann, aber das InternetArchive hat ihn gesichert, weil er ja bei uns als Beleg genutzt wurde. Veränderungen der verlinkten Website (die ja sehr gute Gründe haben könnten) werden an dieser Stelle gar nicht mehr registriert, es ist ja der Archivlink da. Die "belegte" Stelle findet über Wikidata, Übersetzungstools und diverse Mirrors in alle möglichen anderen Netze Eingang. Neue Veröffentlichungen (print oder online) finden die Behauptung nun überall im Netz, vielleicht sogar in Bibliotheksdatenbanken, die wiederum von Wikidata gespeist werden, und nehmen die Richtigkeit an. Sie werden wiederum zitiert. Auf einer äußerst schmalen empirischen Basis ist eine weltweit genutzte und akzeptierte Tatsache entstanden. Da dieses Basis aber so schmal ist, kann es sehr gut sein, dass sie schlicht falsch ist. Ein Abgleich mit den unabhängigen Beständen wäre unbedingt erforderlich, aber er wird nicht geschehen. Das Problem ist, dass man sich, und diese bereits vorhandene Tendenz wird durch die ganze InternetArchive-IABot-Geschichte verstärkt, in einer Art Inzucht bewegt. Es kommt einfach nichts mehr dazu, die Wikipedia-Welt wird gegenüber der wikipedia-unabhängigen Welt dominant und schiebt sich vor sie.
    Die einzige Möglichkeit, die ich sehe, um dieser Tendenz entgegenzuwirken, ist "slowing down". Jede Schnittstelle von Netz zu Netz bedarf menschlicher Prüfung und Entscheidung und muss vom leser nachvollzogen werden können. Das geht langsamer, aber nur so wird der Unabhängigkeit der div. Datensammlungen Genüge getan. Es ist zweifellos so, dass es "bürokratische" Abläufe gibt, die ebenfalls einer menschlichen Prüfung im Wege stehen können und an denen man deshalb arbeiten muss. Aber die Parallelwelt, die durch die automatisierte Einspeisung entsteht, ist bedrohlicher, weil sie prinzipiell eine solche Prüfung gar nicht mehr braucht und vorsieht.--Mautpreller (Diskussion) 16:38, 12. Aug. 2017 (CEST)
    Vielen Dank für die ausführliche Darstellung. Ich denke, ich verstehe deine Position jetzt wesentlich besser.--Cirdan ± 17:34, 12. Aug. 2017 (CEST)
    Die Kehrseite der Medaille "Web im Fluss vs. künstlich-statischer Archivlink", Mautpreller, gibt es aber auch: Sehr häufig (meiner Erfahrung nach: meistens!) verschwinden Inhalte von Websites nicht etwa weil sie falsch oder gar illegal gewesen wären, sondern im Zuge von Umstrukturierungen. Organisationen, Behörden, Firmen setzen nach ein paar Jahren ihre Website gerne mal komplett neu auf und plötzlich sind alte Medienmitteilungen, Protokolle, Jahresberichte etc. einfach unter den Tisch gefallen - "ist nicht mehr wichtig, das Zeug ist zehn Jahre alt, unsere frische neue Website soll vorstellen, was wir gerade machen"... wir aber brauchen das "alte Zeug", um Entwicklungen dieser letzten zehn Jahre zu belegen. Ebenfalls zur Kehrseite gehören Fälle, in denen Inhalte entfernt werden, weil sie nicht mehr zum Selbstbild einer Körperschaft passen - absolut korrekte Inhalte, die wir nicht mehr sehen sollen, die unterdrückt werden sollen. Ein dramatisches aktuelles Beispiel findet sich ja in den USA. Du hast sicher auch davon gehört, hier einer der vielen Artikel zum Thema: "Forscher fürchten Zensur und Eingriffe der US-Regierung. Eine Professorin versucht nun, sensible Daten in Sicherheit zu bringen - bevor es zu spät ist. (...) Gespeichert werden die Daten entweder im Internet Archive, einer seit 1996 bestehenden gemeinnützigen Online-Bibliothek, oder in der neu eingerichteten Datenbank datarefuge.org." Das ist sicher auch nicht das einzige Land, in dem nach einem Regierungswechsel und damit verbundener Neugestaltung offizieller Websites relevante Inhalte verschwinden, selbst wenn es nicht einmal darum gehen sollte, irgendwas zu unterdrücken - sondern "nur" um den frischen Auftritt mit den Inhalten, die man nun der Öffentlichkeit präsentieren möchte.
    Die Frage ist nun, was das kleinere Übel ist. Für dich ist offenbar klar: Wir können, ja müssen Hunderttausende von defekten Weblinks permanent in Kauf nehmen, um der Gefahr entgegenzuwirken, dass zweifelhafte oder falsche Behauptungen durch Archivlinks zementiert werden. Defekte Links in einem Artikel sind nach dieser Auffassung gar nicht schlecht, sondern zeigen unserer Leserschaft, dass der Artikel auf Angaben basiert, die sich zumindest unter dieser Adresse aktuell nicht mehr im Web finden, und diese wird dadurch im Idealfall zu eigenen Recherchen und Überprüfung der Inhalte angeregt - ja? Nun, das kann man so sehen. Auch ich kann diese Position nachvollziehen - aber ich teile sie nicht, immer noch nicht. Insbesondere dann nicht, wenn es darum geht, einen defekten Link durch das Angebot eines Archivlinks zu ergänzen, nicht ihn zu ersetzen. Wenn man nur ergänzt, kaschiert man die Tatsache, dass ein Link eigentlich defekt ist und die Inhalte veraltet sein könnten, m.E. nicht zu sehr. Ich sehe die möglichen negativen Auswirkungen von Archivlinks nicht so dramatisch. Man kann ja immer nachvollziehen, dass es sich um einen Archivlink handelt und auf welchen Stand sich der Artikeltext bezieht. Ist die Information falsch, kann sie korrigiert und der Link durch einen geeigneten Beleg ersetzt werden - Archiv hin oder her.
    Du schreibst Die "belegte" Stelle findet über Wikidata, Übersetzungstools und diverse Mirrors in alle möglichen anderen Netze Eingang. Neue Veröffentlichungen (print oder online) finden die Behauptung nun überall im Netz, vielleicht sogar in Bibliotheksdatenbanken, die wiederum von Wikidata gespeist werden, und nehmen die Richtigkeit an. - das trifft alles auch auf Stellen mit defekten oder gar keinen Belegen zu. Wikipedia-Inhalte werden doch typischerweise breit übernommen, ohne dass ihre Belege überprüft würden. Leider. Ich glaube nicht, dass es diesbezüglich einen grossen Unterschied macht, ob man nun einen Archivlink setzt oder nicht. Der Archivlink hat dabei immerhin den Vorteil, dass man nachvollziehen kann, woher mit welchem Stand die Information kam, und zumindest bestätigt werden kann: "ja, am 30. Juli 2009 stand wirklich das Zitierte auf dieser Website". - Da die meisten defekten Weblinks, die ich antreffe, wie gesagt eher in die Kategorie "einer Umstrukturierung zum Opfer gefallen" gehören, sehe ich es als das kleinere Übel an, in einem prozentual wohl sehr geringen Teil der Artikel Belege mit falschen Inhalten vorerst zu "konservieren". Aktuell würde ich, wenn das MB jetzt starten würde, für Vorschlag 1 stimmen. Gestumblindi 20:33, 12. Aug. 2017 (CEST)
    Ja klar gibt es das. In manchen solcher Fälle können Archivlinks daher nützlich sein, wenn ich auch bislang nur wenige Einzelfälle kenne. Bloß können sie eben auch schädlich sein. Deswegen, mein Credo, sollten sie nie automatisiert gesetzt werden, zumindest nicht im Artikelnamensraum, sondern immer nur nach verantwortlicher Abwägung. Ich denke mit Schaudern daran, welche Probleme wir uns beispielsweise mit dem hier beschriebenen Thema einhandeln könnten. Nicht dass diese Probleme völlig vermeidbar wären, aber sie nehmen eine ganz andere Form an, wenn ein Archivlink automatisch in den Artikel gepackt wird. Menschliche Abwägung braucht Zeit, und die sollten wir uns nehmen und uns nicht von horrenden Toter-Link-Zahlen ins Bockshorn jagen lassen.--Mautpreller (Diskussion) 20:58, 12. Aug. 2017 (CEST)
    PS: Du sagst: "Ist die Information falsch, kann sie korrigiert und der Link durch einen geeigneten Beleg ersetzt werden." Ja, das stimmt ohne Frage. Man kann auch die Botmeldung einfach aus dem Artikel entfernen. Aber wird das jemand tun? Wird jemand gar die Information auf Korrektheit überprüfen? Schließlich heißt es doch, die manuelle Bearbeitung der Weblinks überschreite unsere Kapazitäten? Ich glaube nicht, dass das geschehen wird. Der Beleg ist ja da. Solche Botbearbeitungen werden auf Dauer stehen bleiben.--Mautpreller (Diskussion) 21:05, 12. Aug. 2017 (CEST)
    @Mautpreller: Du setzt voraus, dass die Wahrscheinlichkeit, dass eine Information falsch war oder aus anderen Gründen nicht mehr in unseren Artikel gehört, im Falle von Archivlinks höher ist als bei solchen, die immer noch "live" im Web verfügbar sind. Tatsächlich wimmelt es aber im Web von falschen oder veralteten Angaben, die seit vielen Jahren unverändert online herumgammeln, nicht aktualisierten "Zombie-Sites" und dergleichen. Und es wimmelt von korrekten, immer noch relevanten Angaben, die aufgrund einer Umstrukturierung oder Einstellung eines Online-Angebotes nur noch über Archivlinks abrufbar sind. Nicht mein "Credo" (ich bin in solchen Dingen nicht tiefgläubig), aber meine Ansicht ist, dass das automatisierte Anbieten von Archiv- zusätzlich zu den defekten Originallinks in der weit überwiegenden Zahl der Fälle gegenüber dem Status "gar kein funktionierender Link" eine Verbesserung darstellen würde. So kann man wenigstens einfach überprüfen, ob unter diesem Link überhaupt jemals die Information zu finden war, die eine Behauptung im Artikel belegen soll (oft genug kommt es ja auch vor, dass ein Link von Anfang an überhaupt nicht als Beleg geeignet ist). Ja, man braucht deine Argumentation sogar nur leicht zu adaptieren, um zu einem gegenteiligen Schluss zu gelangen, indem man sagt: Ein toter Link erweckt beim Leser, der ihm nicht mehr folgen kann, den Eindruck "Das ist eine belegte Information, leider kann ich den Link nicht mehr aufrufen, aber das muss mal da gestanden haben", selbst wenn das nie der Fall war. Bietet man ihm hingegen einen Archivlink an, besteht eine gewisse Wahrscheinlichkeit, dass er diesem auch folgt und sich anschaut, ob die behaupteten Inhalte wirklich vorhanden sind/waren. Letztlich vermute ich allerdings, dass die meisten LeserInnen im Alltag die Einzelnachweise überhaupt nicht beachten, und wenn, dann sehr oberflächlich: "ahja, viele Belege, schön", ohne irgendwelchen Links zu folgen oder gedruckte Literaturstellen nachzuschlagen. Auch ich mache das nur, wenn ich mich gerade vertieft mit einem Thema befasse oder mir etwas sehr erstaunlich oder unglaubwürdig vorkommt. Gestumblindi 22:15, 12. Aug. 2017 (CEST)
    Letztlich habe ich den Eindruck, dass Du genau wie ich glaubst: Diese Botbearbeitungen werden auf Dauer stehen bleiben. Wir kriegen eine riesige Menge von Archivlinks automatisch in den ANR gespült, deren größten Teil niemand überprüfen wird. Nur glaubst Du, in der Mehrzahl der Fälle werden die schon in Ordnung sein und die Ausreißer könne man tolerieren.--Mautpreller (Diskussion) 22:30, 12. Aug. 2017 (CEST)
    Ja, das ist tatsächlich meine Ansicht. Keine Verschlechterung gegenüber dem aktuellen Zustand (unverändert richtige oder falsche Information in der Wikipedia mit totem Link, die - falls nötig - auch erst korrigiert wird, wenn jemand den Link aktiv überprüft). Und man kann wenigstens... ach, ich will mich nicht wiederholen. Gestumblindi 22:42, 12. Aug. 2017 (CEST)

    Archivierungen seit 2013[Quelltext bearbeiten]

    Benutzer:Cirdan, Succu: Können wir uns darauf einigen, dass umstrittende Inhalte hier auf der Disk. besprochen werden. Ich dachte, ich hätte mit meiner Verschiebung einen Kompromiss angeboten, ihr scheint euch da aber immer noch weiter zu behakeln. Wo genau besteht die Differenz zwischen euch? --Martina Disk. 03:42, 13. Aug. 2017 (CEST)

    Ich hab hier nochmal die Formulierung nachjustiert. Es werden ja nicht Links gespeichert, sondern die Webseiten, zu denen wir Links setzen. 2013 hat das automatische Speichern begonnen, aber da wir nicht wissen, seit wann genau dies für die deutschsprachige Wikipedia gemacht wird, hab ich das in "mittlerweile" umformuliert. Wichtig ist mir an dieser Stelle auch, deutlich zu machen, dass dies offenbar schon seit Jahren gemacht wird, wir diese Archivlinks aber bislang händisch einpflegen. --Martina Disk. 04:19, 13. Aug. 2017 (CEST)
    @Martina Nolte: Danke für die weitere Verbesserung! Ich werde morgen nochmal explizit erfragen, seit wann das für die deutschsprachige Wikipedia gemacht wird.--Cirdan ± 05:25, 13. Aug. 2017 (CEST)
    Klasse, danke! Ich fände (aus reiner Neugier) auch spannend zu erfahren, ob Wikimedia und Internet Archive schon länger hierzu kooperieren. --Martina Disk. 05:35, 13. Aug. 2017 (CEST)
    Nein, eine formale Kooperation gibt es nicht. WMDE ist aus allen Wolken gefallen (vgl. Wikipedia:Umfragen/Technische_Wünsche_2017/Wartung#Automatisches_speichern_des_Inhalts_externer_Links_ins_Internet_Archive_.28archive.org.29) und zur WMF bestand bisher nur loser Kontakt, obwohl beide in San Francisco sitzen. Das soll sich aber ändern. Sobald der Wikimania-Talk als Video verfügbar ist, verlinke ich ihn.--Cirdan ± 14:27, 13. Aug. 2017 (CEST)
    Also ist die Behauptung auch für deWP geschähe dies seit 2013 falsch? Übrigens habe ich bei meinen Korrekturen defekter Weblinks nie den bestehenden Link zum IA aufgegriffen, denn in fast allen Fällen handelte es sich lediglich um eine geänderte URL, die zum identischen (manchmal "aufgehübschten") Inhalt führte. Die anderen Fälle waren entbehrliche Weblinks. --Succu (Diskussion) 23:03, 13. Aug. 2017 (CEST)
    Mich würden mal Beispiele interessieren, bei denen ein Archivlink nützlich und angebracht ist. In den von mir beobachteten Artikeln habe ich ein (1) Beispiel dafür gefunden.--Mautpreller (Diskussion) 23:08, 13. Aug. 2017 (CEST)
    (BK) Nein, warum sollte die Aussage, das geschehe seit 2013, falsch sein? Die Archivierung läuft, wie ich dir nun mehrfach verlinkt habe, seit 2013 und das lässt sich wie beschrieben auf verschiedenste Weise nachvollziehen.--Cirdan ± 23:10, 13. Aug. 2017 (CEST)
    Nur schließen deine unverbindlichen Antworten nie explizit deWP ein. BTW: du wolltest es erfragen... --Succu (Diskussion) 23:12, 13. Aug. 2017 (CEST)
    Entschuldige bitte, aber liest du meine Links überhaupt? Sie archivieren seit 2013 praktisch für alle relevanten Wikipedia-Sprachversionen. Das sage ich schon seitdem ich mich hier eingeklinkt aber, aber dir scheinen weder meine Aussage, noch meine Links, noch die Server-Logs(!), noch die Markierungen in den Snapshots(!) dafür zu genügen. Wenn es dich so brennend interessiert, schreib doch bitte einfach an mark@archive.org und frag den Chef des ganzen persönlich.--Cirdan ± 23:15, 13. Aug. 2017 (CEST)
    „für alle relevanten Wikipedia-Sprachversionen“? Wenn das so ist dann verlinke doch bitte noch mal für mich Deppen auf diese Liste. Danke --Succu (Diskussion) 23:21, 13. Aug. 2017 (CEST)
    Weil es so unglaublich schwierig ist: Wikipedia Near Real Time (from IRC) archivierter Link von 2014 (gefunden über Diskussion:11_Freunde#Defekte_Weblinks). Und voila, hier ein per Wikipedia Near Real Time (from IRC) archivierter Link von 2013 (gefunden über Diskussion:3D-Druck#Defekte_Weblinks). Einfach oben rechts auf „About this capture“ klicken. Und wie gesagt, sie machen das für 280 Sprachversionen, diese Info habe ich aus erster Hand, das kannst du demnächst auch im Wikimania-Video nachvollziehen (oder einfach Mark eine E-Mail schreiben). Überzeugt dich das jetzt, dass ich hier keine Verschwörungstheorien verbreite?--Cirdan ± 23:22, 13. Aug. 2017 (CEST)
    (BK) Um den Link auf Realisierung keramischer Prototyping mittels 3D-Druck und Heißgießen zu fixen brauchts keinen Archivlink. Simples Suchen im Web genügt. Verschwörungstheorie? Ehrlich? Und ich benötige auch keine Anleitung zur Selbsthilfe. Ich finde es nur befremdlich, das es seitens des IA keinen Blog-Eintrag o.ä. gibt wo man das "offiziell" 2003/14 nachlesen kann. Wir sollen uns statt dessen auf dein Wort und auf einen gerade abgehaltenen Wikimania 2017 Beitrag verlassen. Sorry das ich skeptisch bleibe. --Succu (Diskussion) 00:08, 14. Aug. 2017 (CEST)
    @Succu: "Simples Suchen im Web genügt" - ja, das stimmt natürlich sehr oft. Für viele tote Weblinks lässt sich ohne grosse Probleme brauchbarer Ersatz finden, ohne dass man ein Webarchiv bemühen müsste. Nur muss das eben auch jemand machen. Für Hunderttausende, vielleicht fast eine Million defekter Weblinks in unseren Artikeln hat die hiesige Community aber nicht die nötige Kapazität. Es werden immer mehr. Und das ist der Ausgangspunkt dieses Meinungsbildes: Wenn wir Menschen mit dem Korrigieren nicht nachkommen, kann ein Bot mit Archivlinks das Problem wenigstens lindern. Sicher, manchmal wäre ein "live-Link" besser als ein Archivlink. Manchmal ist aber auch der Archivlink besser (wenn sich der Artikelinhalt auf einen bestimmten Inhalt, wie er zum Zeitpunkt der Archivierung vorlag, bezieht). Auf jeden Fall hindern Archivlinks niemanden daran, Artikel, Einzelnachweise und zugehörige Weblinks hochwertig manuell zu aktualisieren - stellen aber in der Zwischenzeit, bis das vielleicht nach Jahren tatsächlich mal jemand macht, die Nachvollziehbarkeit sicher. Gestumblindi 00:34, 14. Aug. 2017 (CEST)
    @Succu: Wie sinnig oder unsinnig dieser Archivlink ist, ist hier nicht die Frage. Ich werde mir ganz bestimmt nicht die Mühe machen, ausschließlich enzyklopädisch sinnvolle Beispiele dafür zu präsentieren, dass das Internet Archive seit 2013 alles archiviert. Denn schließlich archivieren sie, auch wenn du das hier mit immer neuen Begründungen anzweifelst, alles, was wir hier verlinken.
    Ich bin ehrlich gesagt völlig ratlos, was du noch alles sehen willst, um überzeugt zu sein, dass meine Aussagen hier und die Aussagen der IA-Mitarbeiter unter dem WMF-Blogpost stimmen. Du hast die Server-Logs, ich habe dir Beispiele präsentiert (bei denen explizit dabei steht, dass es sich um automatische Archivierungen handelt! Du kannst problemlos tausende Weitere finden, indem du einfach so wie ich zufällig Seiten aus Kategorie:Wikipedia:Defekte Weblinks/Bot auswählst), du hast die E-Mail-Adresse des Direktors der Wayback-Machine, mit Cyberpower liest hier der vom IA unterstützte Bot-Betreiber mit, WMDE hat exakt die selben Informationen vom IA erhalten (vgl. hier), die Software-Lösung ist trivial – und es gibt bisher überhaupt gar keinen einzigen Hinweis darauf, dass daran zu zweifeln wäre, dass das IA seit 2013 automatisch archiviert. Warum sollte ich hier falsche Dinge behaupten? Ich werde daher meine Bemühungen einstellen, dich überzeugen zu wollen.--Cirdan ± 03:54, 14. Aug. 2017 (CEST)
    Suchen im Web funktioniert, wenn man weiß wonach man suchen soll. Ja, dank Webarchiv kann man den Inhalt welcher irgendwas belegen soll nachlesen und dann kann man eine neue Adresse auf der Webseite suchen. Nur wenn ich den Link aus dem Webarchive schon hab, warum soll ich dann nach einer Alternative suchen? Das wäre ja doppelte Arbeit. Sowas kann ich machen wenn sich die Struktur einer Webseite ändert und ich viele hundert Links nach dem gleichen Schema hab, aber nicht bei Einzelnachweisen die auf selten verlinkte Seiten verweisen. --Wurgl (Diskussion) 23:46, 14. Aug. 2017 (CEST)
    Wenn die Angaben hier vernünftig sind (Titel des Dokumentes ist angegeben) brauche ich das Webarchiv nicht. Sonst, da hast du recht, hilft mir das Webarchiv die korrekte neue Verlinkung zu finden. Hinterher ist der Hilfslink aufs Webarchiv entbehrlich. Und das ist auch gut so. --Succu (Diskussion) 22:03, 15. Aug. 2017 (CEST)

    Ergänzung Archivlink zu live URL?[Quelltext bearbeiten]

    Gestumblindi: Mir fällt gerade nochmal was auf. Wir gehen die ganze Zeit davon aus, dass ein Archivlink nur bei Bedarf gesetzt wird, also wenn der Originallink nicht mehr aufrufbar ist. Sowohl unsere Vorlagen {{Internetquelle}} und {{Cite web}} als auch der IABot sind aber nutzbar, um Archivlinks sozusagen "vorsorglich" anzubringen, obwohl der Link noch live ist. Ich würde das eigentlich nicht aus Versehen erlauben wollen. Eigentlich möchte ich das sogar ausdrücklich verbieten. Die massenhafte automatiserte Verlinkung eines externen Anbieters, ohne dass eine Verbesserung des Artikels erreicht wird (weil der Originallink ja noch live ist), halte ich für unzulässig. Was meinst du? --Martina Disk. 07:53, 13. Aug. 2017 (CEST)

    Ich persönlich fände es in einer Reihe von Fällen sogar sinnvoll, sofort Archivlinks (nicht unbedingt nur zum Internet Archive, sondern ganz generell einen Link zu einer archivierten Version irgendeines Anbieters) mit zu speichern. Damit kann immer geprüft werden, welche Informationen zum Zeitpunkt der Verlinkung auf der Website standen, oder ob zwischenzeitlich etwa Zahlen aktualisiert wurden. Diese Links müssen ja dem Leser nicht angezeigt werden, aber man könnte direkt den Archivlink hinterlegen und würde sich damit die Arbeit sparen, später immer wieder alle Links auf Erreichbarkeit prüfen zu müssen. Jedenfalls würde ich das nicht im Rahmen dieses MBs explizit verbieten wollen, sondern in einem weiteren Meinungsbild regeln. Schließlich stellt sich dann die Frage, wie wir die verschiedenen Archivanbieter behandeln, denn wir werden wohl kaum mehr als einen Archivlink hinterlegen wollen.
    Mein Vorschlag wäre, hier im erstmal zu klären, ob die Community überhaupt die automatische Ergänzung von Archivlinks bei toten Links möchte. Die Ersetzung von toten Links durch Archivlinks auf Vorschlag des GiftBots oder durch manuelle Suche ist ja bereits gelebte Praxis, dieser Schritt wäre also nicht so groß.--Cirdan ± 18:46, 13. Aug. 2017 (CEST)
    @Martina Nolte: Ich sehe das ähnlich wie Cirdan und denke nicht, dass das ein Thema für dieses Meinungsbild sein sollte. - Auch die "Frage, wie wir die verschiedenen Archivanbieter behandeln", kann man hier wohl noch nicht klären (die Vorschläge sind ja nicht anbieterspezifisch formuliert), wobei ich ausser WebCite eigentlich gar keine für Wikipedia-Zwecke brauchbare Alternative zum Internet Archive sehe. archive.is sehe ich als ungeeignet an und bin der Ansicht, dass wir auf Links zu diesem eher obskur erscheinenden Anbieter möglichst verzichten sollten, da wir durch die Anonymität seiner Betreiber und die unklare Struktur ("ein kleines Team, bestehend aus einigen wenigen Personen") keine Ahnung haben können, wie es um die Zukunftssicherheit des Angebots bestellt ist. Das Internet Archive hingegen ist wie z.B. auch die Wikimedia Foundation eine gemeinnützige Nonprofit-Organisation nach amerikanischem Recht (en:501(c)(3) organization), als solche etabliert und besteht seit über 20 Jahren. Dass es nicht plötzlich zumachen wird und unzählige tote Archivlinks hinterlässt, kann man somit mit gutem Grund annehmen. Auch WebCite existiert schon seit 20 Jahren und hat als Einrichtung der Universität von Toronto einen seriösen Hintergrund. Kennt ihr neben den genannten noch andere "Archivanbieter", die in Frage kämen? Gestumblindi 21:31, 13. Aug. 2017 (CEST)
    Okay, lassen wir das also offen (weder ausdrücklich erlaubt, noch ausdrücklich verboten).
    Gestumblindi: Cyberpower hatte oben eine Liste mit 20 Diensten. Die Frage nach den "brauchbaren" Archivdiensten werden wir mit dem heisigen MB nicht klären, aber an anderer Stelle könnte das mal angegangen werden. ich habe jezt mehrfach Vorbehalte gegen archive.is (Archive Today) wahrgenommen; wir nutzen das im Artikelnamensraum aber nach der Wayback Machine wohl mit Abstand am häufigsten:
    --Martina Disk. 04:57, 15. Aug. 2017 (CEST)
    @Martina Nolte: Viele der Dienste in der Liste oben sind wohl thematisch bzw. geographisch beschränkt und keine universellen Webarchive. Genannt wird da beispielsweise als Nr. 17 nationalarchives.gov.uk - das ist das britische Nationalarchiv, das unter http://www.nationalarchives.gov.uk/webarchive/ die Websites der Regierung des Vereinigten Königreichs archiviert. - Dass wir so viele Links zu archive.is haben, ist m.E. bedenklich, eben aufgrund der Intransparenz und damit völlig unklaren Zukunftssicherheit des Angebots. Keine Ahnung, wie es dazu gekommen ist, dass es so breit berücksichtigt wurde. Man sollte vielleicht mal ein Projekt starten, archive.is-Links möglichst zu ersetzen (durch Live-Links, archive.org, WebCite oder andere seriöse Anbieter). Aber ja, das führt über den Rahmen dieses Meinungsbildes hinaus. Gestumblindi 21:46, 18. Aug. 2017 (CEST)

    De-archivieren im Internet Archive; robots.txt[Quelltext bearbeiten]

    @Cyberpower678: ich habe zwei Fragen zur Funktionsweise des Internet Archives:

    • Serverbetreiber können das Archivieren im Internet Archive unterbinden, indem sie in der Datei robots.txt eine entsprechende Anweisung reinschreiben. Wird das auch dann respektiert, wenn eine Archivierung durch einen Link in Wikipedia getriggert wird? Oder nimmt man dann ein größeres Interesse an den Inhalten an, und archiviert trotz des Nichtarchivierungswunsches in der robots.txt?
    • Über die robots.txt kann eine archivierte Version auch einfach wieder aus dem Internet Archive entfernt werden. Möglicherweise gibt es weitere Möglichkeiten für Serverbetreiber, dort Inhalte wieder entfernen zu lassen. Sollte das passieren, bekommt Dein Bot das dann mit und würde er den nun toten Archivlink irgendwann auch wieder aus der Wikipedia entfernen?

    Viele Grüße, MisterSynergy (Diskussion) 00:19, 17. Aug. 2017 (CEST)

    Die erste Frage finde ich an den falschen Adressaten gerichtet und auch eigentlich nicht "unser Bier". Die zweite Frage ist für uns aber auf jeden Fall relevant! Guter Punkt. Tote Archivlinks haben wir dann ja eventuell schon jetzt. Vielleicht stellt Internet Archive dem IABot eine Liste mit wieder gelöschten Archivversionen zur Verfügung? Eine der möglichen Funktionen des Bots ist aber auch, schon in Artikeln vorhandene Archivlinks zu überprüfen und ggf. zu reparieren (siehe touch_archive und mlmodifyarchive). Ich weiß nicht, ob das auch gelöschte Archivlinks der Wayback Machine beinhaltet. In den Vorschlägen 1 und 2 erlauben wir das Feature bislang nicht. Das wäre - je nach Cyberpowers Antwort - zu überdenken. Bin gespannt. --Martina Disk. 03:37, 17. Aug. 2017 (CEST)
    Die erste Frage ist IMO insofern „unser Bier“, als dass sie lose mit den verschiedenen diskutierten rechtlichen Problemen zusammenhängt. Wenn ein Serverbetreiber es komplett (sogar rückwirkend) selbst in der Hand hätte, eine Nicht-Archivierung über seine Serverkonfiguration zu erwirken, dann liegt es eben auch in seiner Verantwortung, die möglichen rechtlichen Probleme einer Archivierung mit dem IA zu regeln. Wie bereits angemerkt ist die „amerikanische“ opt-out-Methode hier bei uns sicher eher ungewohnt und unbeliebt, aber letztlich ist sie völlig üblich im Internet. Wer seinen Server verantwortungsvoll betreibt, nimmt die Archivierungsaktivitäten übrigens auch zeitnah in Serverlogs wahr und kann reagieren, sofern das für notwendig erachtet wird.
    Ich frage Cyberpower678, weil er mit dem IA zusammenarbeitet und ggf. dort weitere Informationen zum Archivierungsverhalten einholen kann. —MisterSynergy (Diskussion) 08:07, 17. Aug. 2017 (CEST)
    "Rechtliche Probleme", die "lose zusammenhängen"? Nochmal: Diese Archivdienste sind in den USA als Fair Use legal. Außer robots.txt gibt es ein weiteres "Opt-out": DMCA-Meldungen. Auch dies ein Standardverfahren in den USA (zunehmend auch in Deutschland bekannt und genutzt). Namentlich Internet Archive ist eine steuerbegünstigte non-profit-Organisation mit namhaften Spendern und staatlichen Fördermitteln. Die Verlinkung zu einem legalen Webangebot ist legal. Abweichende DACH-Rechtsprechung gibt es offensichtlich nicht.
    Bzgl. Infos von IA: If you have any questions or comments regarding these terms and policies or the Archive’s data collection practices, please contact the Archive at info@archive.org or Internet Archive, 300 Funston Ave., San Francisco, CA 94118, phone 415-561-6767--Martina Disk. 03:56, 18. Aug. 2017 (CEST)
    "Wieder gelöschte Archivversionen" gibt es meines Wissens ausser evtl. nach DMCA-Requests nicht (aber Cyberpower weiss das sicher genauer); ich glaube, dass Websites, die per robots.txt für das Internet Archive gesperrt werden, danach zwar nicht mehr öffentlich im Archiv abrufbar sind, das IA die einmal gespeicherten alten Versionen aber behält und auch wieder zugänglich macht, wenn sich die robots.txt entsprechend ändert. Das ist auch sehr sinnvoll, da Domains ja gelegentlich den Besitzer wechseln - eine Domain kann 2017 einen völlig anderen Besitzer und Inhalt haben als 2007. Wenn nun der neue Besitzer von example.org die ganze Domain für das Internet Archive sperren lässt, sind plötzlich auch die Inhalte von 2007 (mit denen der neue Besitzer der Domain nichts zu tun und an denen er keine Rechte hat), deren Urheber vielleicht gar nichts dagegen hätte, nicht mehr abrufbar. Aber in weiteren zehn Jahren kann es wiederum anders aussehen ;-) Gestumblindi 04:50, 18. Aug. 2017 (CEST)
    • @MisterSynergy: Internet Archives archiviert nicht wenn ein Robots.txt existiert, aber alle Archivs die noch existieren werden NICHT gelöscht sondern nur blockiert. Internet Archives arbeitet an eine nicht so strenges Implementation Robots.txt zu respektieren. Das heisst das Robots.txt blockierte Arkivkopien wieder zugreifbar sind. IABot ist nicht programmiert tote Archivlinks zu entfernen, aber es gibt ein anderen Bot dem die Archivlinks regelmäßig prüfen.—CYBERPOWER (Diskussion) 12:24, 18. Aug. 2017 (CEST)
    Ich werfe hier einfach mal folgenden link ein: Robots.txt meant for search engines don’t work well for web archives. IA wird künftig die Robots.txt mehr und mehr ignorieren. -- Michi 16:43, 18. Aug. 2017 (CEST)
    Aus den von mir oben angetönten Gründen ist das wohl auch sinnvoll. Um aus dem von dir verlinkten Blogbeitrag zu zitieren: We have also seen an upsurge of the use of robots.txt files to remove entire domains from search engines when they transition from a live web site into a parked domain, which has historically also removed the entire domain from view in the Wayback Machine. In other words, a site goes out of business and then the parked domain is “blocked” from search engines and no one can look at the history of that site in the Wayback Machine anymore. We receive inquiries and complaints on these “disappeared” sites almost daily. Gestumblindi 21:13, 18. Aug. 2017 (CEST)