Zum Inhalt springen

Wikipedia:Weblinks/Block/archive.today

Abschnitt hinzufügen
aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 23 Tagen von ⵓ in Abschnitt archive.today und archive.is

Auf dieser Seite werden Anfragen zu Sperrungen und Entsperrungen der im Titel oder der Überschrift genannten Website, Domain oder Sub-Domain besprochen.















archive.today und archive.is

[Quelltext bearbeiten]

related:

Die Shorturl-Funktion von archive.today sollte geblockt werden (siehe Wikipedia:Web#Einzelrichtlinien Nr.14) . Mit dem Tool url-converter steht eine Funktion zur Gewinnung der Lang-urls zur Verfügung. Nachdem ich die alten Shorturls im ANR inzwischen alle umgestellt habe, und der url-converter (bis auf leicht ergänzbare Zusatzfunktionalitäten) funktioniert, sollte die zwingende Verwendung von Langurls kein größeres Problem darstellen.

Zu blocken wäre alle Links die dem Muster \barchive.(today|is)/\w{5,8}\b(#selection\b)? entsprechen. Frohes Schaffen — Boshomi ☕⌨☺11:40, 6. Jul. 2014 (CEST)Beantworten

gudn tach!
hmm, derzeit sind kurzlinks auf die domains noch auf recht vielen (grob geschaetzt, rund 300) seiten ausserhalb des main namespace verlinkt, siehe special:linksearch/*.archive.today, special:linksearch/*.archive.is
die ersetzung im main namespace war sicherlich sinnvoll, aber ausserhalb weiss ich nicht, wie viel sinn eine link-ersetz-aktion macht. klar, ich koenne einen bot drauf ansetzen. trotzdem bliebe es bei eigentlich sinnlosen edits. man muesste die edits aber bei einer SBL-aufnahme durchfuehren, weil ansonsten archiv-bots und ggf. user, wenn sie manuell threads verschieben, probleme bekommen koennen.
ein ausweg waere, das edit filter darauf anzusetzen; also eingeschraenkt auf den main namespace. -- seth 20:53, 8. Jul. 2014 (CEST)Beantworten
Nur mal als Verständnisfrage: Warum sind kurze URIs unerwünscht? --Pölkky 21:01, 8. Jul. 2014 (CEST)Beantworten
gudn tach!
<ergänzung>special:linksearch/https://*.archive.today und special:linksearch/https://*.archive.is (es wird auch https gelieftert, bei fehlender Protokollangabe gibt die MW-Software per default http zurück.) Frohes Schaffen — Boshomi ☕⌨☺20:16, 9. Jul. 2014 (CEST)Beantworten
es geht nicht um kurze URLs, sondern um URL shortener (im deutschen manchmal "kurzurls" bezeichnet). die koennen als sperrumgehung der SBL benutzt werden und werden deshalb gesperrt, normalerweise sogar global, aber bei einer so haeufig eingesetzten domain wird das schwierig. -- seth 21:36, 8. Jul. 2014 (CEST)Beantworten
+1 zusätzlich kommt hinzu, dass die Domain als Privatprojekt auf rechtlich recht schwachen Beinen steht. Es ist durchaus möglich, dass die Domain von einen Tag auf den anderen ersatzlos schließen muss. In so einem Fall bräuchten wir die Originalurls wie einen Hungernder einen Bissen Brot, wenn es um die Suche nach Ersatz für die dann toten Links geht. Frohes Schaffen — Boshomi ☕⌨☺22:09, 8. Jul. 2014 (CEST)Beantworten
Ich denke eine Einschränkung auf ns:0 (Artikel), ns:10(Vorlage), ns:6(Datei) und ns:14(Kategorie) wäre meiner Meinung nach schon ein Vollprogamm, und würde so ziemlich alles abdecken was die nach außen sichtbare Enzyklopädie betrifft, wobei ns:0 99% der Fälle abdeckt.  Frohes Schaffen — Boshomi ☕⌨☺22:09, 8. Jul. 2014 (CEST)Beantworten
in den letzten 14 Tagen ware es rund 3 Links pro Tag die hier neu eingebracht wurden. Bei nicht wenigen wurden hier Mementos auf archive.org/web/ eingetragen, vermutlich weil sich diese Seiten dadurch wieder im Googleindex befinden, was bei archive.org nicht der Fall ist. Frohes Schaffen — Boshomi ☕⌨☺10:22, 26. Jul. 2014 (CEST)Beantworten
gudn tach!
sorry fuer die verspaetung, hab jetzt WP:Bearbeitungsfilter/182 angelegt. erst mal wird nur mitgeloggt. wenn's funzt und nicht binnen kurzer zeit false positives auftreten, koennen wir ein warning ausgeben lassen. -- seth 13:04, 26. Jul. 2014 (CEST)Beantworten
no Problem. Mir ist das ganz recht wenn das ganze langsam und für die Anwender wenig überraschen passiert. Ich bin derzeit jedenfalls zumindest täglich erreichbar, und kann Benutzern helfen, die momentan noch Probleme beim Auffinden der Langlinks haben.  Frohes Schaffen — Boshomi ☕⌨☺14:37, 26. Jul. 2014 (CEST)Beantworten
archive.today ist derzeit überhaupt nicht erreichbar. Ich bitte daher um die Scharfschaltung, denn die hinzukommenden Link wie auf John_Penrose_Barron oder Rodrigo Guarteche sind nicht mehr auflösbar.  Frohes Schaffen — Boshomi ☕⌨☺20:59, 3. Aug. 2014 (CEST)Beantworten
Nach rund eine halben Tag scheint archive.today nun wieder erreichbar zu sein. Frohes Schaffen — Boshomi ☕⌨☺23:17, 3. Aug. 2014 (CEST)Beantworten
gudn tach!
ich tue mich etwas schwer damit, die regel scharfzuschalten. habe mir gerade einige der link additions angeschaut und dabei festgestellt, dass die fast immer mit groesseren aenderungen einhergingen. die gefahr ist, dass die leute aus technischem unvermoegen ihre aenderung nicht abspeichern und somit die aenderungen dann verloren gehen.
vielleicht ist es vorerst noch besser, wenn wir nur mitloggen und dadurch selbst geringfuegig mehr arbeit haben.
und wenn archive.today tatsaechlich abgeschaltet werden sollte, wird vermutlich auch niemand mehr darauf verlinken. -- seth 23:22, 3. Aug. 2014 (CEST)Beantworten
* Insgesamt bin ich bei dir, solange die Domain erreichbar ist, ist ein benutzerfreundlicher Umgang die beste Variante.
* Ich habe mich mit Filtern noch wenig beschäftigt, vermute aber dass der Filter nicht anspricht, wenn eine Seite neu erstellt wird, bzw. vom BNR in den ANR verschoben wird. Das betrifft etwa ein viertel aller Fälle seit Einrichtung des Filters 182. Schön wäre es, wenn der Filter nicht nur mitloggt, sondern auch nützliche Hinweise wie einen Link auf url-converter geben könnte.
* Der Fall mit der .is-Domain (John_Penrose_Barron) ist auffällig, da dies vermutlich aus einer anderen Quelle (andere Sprachversion?) stammt. ".is" ist jedenfalls schon seit 3 Monaten nur noch eine Weiterleitung.  Frohes Schaffen — Boshomi ☕⌨☺23:46, 3. Aug. 2014 (CEST)Beantworten
Der Betreiber schreibt: If you are concerned which domain (archive.is or archive.today) to use in the permanent links, I would bet on archive.is, which is redirecting to archive.today and will redirect to a new domain in case of problems with archive.today. Also wäre es nach wie vor besser, nach archive.is als nach archive.today zu verlinken. --Grip99 02:30, 5. Aug. 2014 (CEST)Beantworten
In der deutschen Wikipedia ist die Domain praktisch vollständig über Vorlagen eingebunden, eine neuerliche Umstellung weitgehend problemlos. Diesen Satz kenne ich, allerdings scheint die '.is'-Domain derzeit praktisch vollständig aus der Codebasis getilt zu sein, jedenfalls liefern Header-Files und sonstige Infos die man auslesen kann, ausschließlich die '.today' Domain. Die '.is'-Domain wurde im April abgeschaltet, und ist folglich für normale User kaum noch auffindbar, ausgenommen alte Verlinkungen z.B in anderen Sprachversionen der Wikipedia. Dort liegen Kurzlinks noch in hoher 5-stelliger Zahl vor, und das ist ein ernsthaftes Problem, da bei mangelhafter Linkbeschreibung zu einem kompletten Informationsverlust eintreteten könnte. Frohes Schaffen — Boshomi ☕⌨☺07:45, 5. Aug. 2014 (CEST)Beantworten
archive.org war für mich auch in den letzten Tagen öfters unerreichbar. Müssen nun auch alles archive.org-Links gelöscht werden? Schön langsam werden die autoritären Tendenzen bei WP ärgerlich. Solange Paywalls nur mit archive.ph umgangen werden können (archive.org machts meistens leider nicht), warum soll das nicht genutzt werden, solange es geht? Die Manipulationen bei archive.ph betrafen nur wenige Seiten in einer persönlichen Auseinandersetzung und nicht die vielen anderen Millionen Archivseiten. Wenn es da Probleme gäbe, die sich wiederholen, dann wäre eine Sperre gerechtfertigt.
Es ist nicht unsere Aufgabe Ersatzgericht zu sein. Der Sinn des Rechtsstaates ist, dass einmal gestraft wird und dann die Sache erledigt ist (Resozialisierung ist dann ja das rechtlich offizielle Ziel). Diese Tendenz zum Zeigefingermoralismus, zum permanenten Strafen, ist doch auch eine Form von Krieg.
Üblicherweise sollte sowieso die Original-URL dabei sein, wenn Bausteine für die Referenzen verwendet werden... ich bin nach wie für für die freie Informationsverbreitung wo es nur geht. --Martin Mair (Diskussion) 14:04, 28. Mär. 2026 (CET)Beantworten
@Martin Mair: Die Situation bei Webarchiven ist derzeit allgemein unerfreulich. Das Internet Archive steht unter enormen Druck durch eine lange Reihe an extrem teuren Gerichtsprozessen, bei Archive.today ist es das Problem, dass es an einer Einzelperson hängt, ob das Archiv erreichbar ist oder auch nicht, weshalb es von heute auf morgen verloren gehen kann. Wir müssen also möglichst viele Inhalte die derzeit bei Archive.today gespeichert sind an eine andere Stelle bringen. Das muss aber wegen der rechtlchen Situation in einem Staat erfolgen, der eine starke Fair-Use-Rechtstradtion verfügt.  Frohes Schaffen   −) Defekte URLs - Hilf mit! [​ɪ​​u:] 17:54, 28. Mär. 2026 (CET)Beantworten

Der Filter 182 ist übrigens ein ganz guter Trollfilter. Ein Drittel aller Treffer entfallen auf die IP 217.85.*.*  Frohes Schaffen — Boshomi ☕⌨☺22:09, 24. Sep. 2014 (CEST)Beantworten

gudn tach user:Boshomi!
ich denke, statt einer filterregel sollte das eher per bot-generierter wartungsliste und user-ansprachen erledigt werden. vielleicht kann ich das die tage CamelBot beibringen. 182 werde ich dann deaktivieren. -- seth 20:38, 26. Dez. 2018 (CET)Beantworten
seth: Ja, das ist eine gute Idee. Ich bin bis auf weiteres sehr knapp mit meiner Freizeit, sodass die Bot-Lösung tatsächlich ein Vorteil wäre.  Frohes Schaffen — Boshomi Defekte URLs - Hilfe mit!08:12, 28. Dez. 2018 (CET)Beantworten
gudn tach!
user:CamelBot sollte von nun an die wartungsliste user:CamelBot/maintenance_list/archive.today befuellen. ausserdem sollte er selbststaendig die links ersetzen, wenn archive.is und die original-links erreichbar sind. #182 habe ich abgeschaltet. -- seth 21:10, 29. Dez. 2018 (CET)Beantworten

Umgang nach DDoS 2026

[Quelltext bearbeiten]

Umgang mit schwierigen Fällen

[Quelltext bearbeiten]
Als Antwort auf user talk:Mützelzipfe#Hinweis_zu_Verlinkungen_von_archive.(today,is,fo,li,md,ph,vn) (nicht signierter Beitrag von Lustiger seth (Diskussion | Beiträge) 21:35, 26. Feb. 2026 (CET))Beantworten

@Mützelzipfe: Bei Archive.today wissen wir dass es ein Projekt einer Einzelperson ist. Das bedeutet, es ist ein Zwischenspeicher für eine unbekannte Zeitspanne. In dieser Zeit sollte nach möglichkeit Ersatz geschaffen werden, entweder in dem Archive.today anderswo archiviert wird, oder in dem man alternative Belege findet. Aber ich stimme zu, besser als ein Toter Link ist es allemal. Vielleicht findet sich ein Autor und schreibt mit Hilfe unserer Belege einen Zitierfähigen Artikel oder ein Buch, das dann auch als Ersatz tauglich wäre.

Das Auffinden von alternativen Belegen ist häufig extrem schwierig. Sollte aber vorgenommen werden, solange Archive.today noch existiert, denn so lange können wir Suchanfragen mit Informationen aus dem Originalbeleg stellen und vergleichen ob Ersatzbelege gleichwertige Informationen enthalten. Frohes Schaffen   −) Defekte URLs - Hilf mit! [​ɪ​​u:] 18:41, 26. Feb. 2026 (CET)Beantworten

archive.today(……) blockt etliche Cookies und alle Scripte. Erst dadurch werden viele Archiv-Versionen zugänglich, während bspw. archive.org zuweilen in Dauerschleifen eine Seite neu lädt. Deswegen setze ich in diesen bestimmten Fällen und dann, wenn es nur dort etwas gibt, auf archive.today. -- ~2026-11728-00 (Diskussion) 20:41, 26. Feb. 2026 (CET)Beantworten
Ja, das habe ich auch schon beobachte. Gestern in meinen Edits war einer Fall in dem eine URL zuerst in web.archive.org hochgeladen war, und dieses weiter nach archive.today. Während das web.archive.org Memento nicht funktionierte, funktionierte das Memento in archive.today. Nur ist archive.today eine dauerhafte Lösung, nur eine Zwischenlösung.
Bei Internet Archive haben wir das Problem, dass dort seit gefühlt 15 Jahren kaum Software-Updates durchgeführt werden. Damit fällt es immer weiter hinter Webstandards zurück. Frohes Schaffen   −) Defekte URLs - Hilf mit! [​ɪ​​u:] 00:06, 27. Feb. 2026 (CET)Beantworten
Sorry, aber die Hoffnung, dass es irgendwann mal einen neueren Inhalt geben würde, der dann als Zitierquelle nutzen könnte ist doch illusorisch. Wenn man sich die Listen der defekten Weblinks anschaut, findet man auch viele Artikel, die seit dem Besuch des Bots vor acht Jahren nicht mehr angefasst worden sind (Beispiel). Manche dieser Artikel würden nach heutigem Stand die WP-Relevanzhürde gar nicht erst schaffen. Wenn beispielsweise ein Artikel existiert von einem Fußballverein in Hinter-dem-Mond, der 1950 die Vereinsliga gewonnen hat, und dies mit einem Archiv-Artikel aus der Gemeindezeitung belegt war, dann ist die Wahrscheinlichkeit, dass jemand dieses Thema erneut aufgreift, gleich Null. Außerdem vermute ich, dass nur sehr selten jemand, der diesen Artikel liest, sich die Mühe machen wird, das Archiv auch wirklich aufzurufen. Es dient meiner Ansicht nach hauptsächlich dem Zweck, die WP-Belegpflicht zu erfüllen. --Mützelzipfe (Diskussion) 14:35, 27. Feb. 2026 (CET)Beantworten
Stimmt, viele Artikel werden kaum gewartet. Der Artikel Kerugoya wurde 2010 von eine IP angelegt und seither hat sich kaum jemand darum gekümmert. 2012/13 hatte archive.today einen Gutteil der erreichbaren Links aus dewiki archviert, weshalb überhaupt noch Links vorhaden sind, alle bestehenden waren tot. Igendwann muss der Artikel wohl neu geschrieben werden. Das wird bei einer 40000 Einwohner-Gemeinde wohl gelingen, bei einem Afrikanischen Sportler, der zweifelsfrei relevant wäre, würde das kaum machbar sein.
Andererseits, jemand der so einen Artikel liest, ist dann wohl eher an Belegen und Weblinks interessiert als an dem veralteten Artikel selbst. Das gilt auch für Friewillige, die irgendwann mal den Artikel vielleicht doch ausbauen wollen. Frohes Schaffen   −) Defekte URLs - Hilf mit! [​ɪ​​u:] 15:35, 27. Feb. 2026 (CET)Beantworten