Wikipedia:Technik/Archiv/Umstellung auf Unicode/Nachbetrachtung

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Nun ist die Umstellung auf Unicode gelaufen, die deutsche Wikipedia läuft mit UTF-8 und die befürchtete Katastrophe ist ausgeblieben. Ganz ohne Probleme ist die Umstellung allerdings nicht abgelaufen.

Allgemein sei zunächst anzumerken, dass offenbar die Benutzer anderer Wikipedias leidensfähiger sind, viele der aufgetretenen Bugs sind auch anderswo zu beobachten, scheinen dort aber entweder niemanden zu stören, oder wurden gar nicht bemerkt.

was man besser lösen kann

[Quelltext bearbeiten]
  • Vor allem sollte nach der nächsten Umstellung SOFORT der globale Cache geleert werden.
  • Links mit %FC und ähnlichem sollten schon vorher ersetzt werden, solange man noch alle entziffern kann.

noch offene Bugs, die damit aufgedeckt wurden

[Quelltext bearbeiten]
  • Wikimedia mag keine Bilder, die Sonderzeichen im Dateinamen haben
  • jeder Benutzername mit einem Sonderzeichen muss einmalig "repariert" werden

Bugs, die inzwischen behoben sind

[Quelltext bearbeiten]
  • Die Suche hab manchmal "halbe Buchstaben" angezeigt

Browserspass

[Quelltext bearbeiten]

Allgemein sind hier eher weniger Probleme aufgetreten. Das größte Problem ist einige schlampig programmierte Zusatzsoftware, die die automatische Zeichensatzerkennung vieler Browser lahmlegt, und zwangsweise ISO-8859-1 anzeigt. Browser selbst, die Probleme machen, sind kein Problem. Leider verhalten sich Benutzer, die man auf Probleme hinweist uneinsichtig, eine Reaktion ist bisher IMMER unterblieben, stattdessen wird behauptet, der Fehler liege beim Provider oder wo auch immer - nur nicht bei einem selbst.

Etwas Sorgen macht die Tatsache, dass sich die Zahl der Problembrowser nicht senkt.

prinzipielles

[Quelltext bearbeiten]
  • einige optisch identische Zeichen haben in Unicode verschiedene Kennungen.
  • Die befürchtete Verlängerung der Artikel ist unterblieben, die Länge der Artikel ist in dem Umstellungszeitraum nicht mehr gewachsen, als sie es sonst auch tut. Neben der Einsparung durch 2-4 Byte für das Zeichen statt bis zu 8 Byte für eine Entity kommt noch der Wegfall von doppelten Links der Form [[Lodz|Łódź]] hinzu, der weiteren Platz einspart.