Diskussion:CESU-8
aus Wikipedia, der freien Enzyklopädie
Kannst du mal ein konkretes Beispiel von Zeichen und ihrer Kodierung geben?-- Nichtich 19:04, 18. Okt 2005 (CEST)
Beispiele für solche Zeichen in Titeln von wiki-Artikeln: http://meta.wikimedia.org/wiki/User:Brion_VIBBER/Unicode_high_chars
Ich verstehe garnicht, warum es diese Kodierung überhaupt gibt. Wieso sollte irgendjemand Unicode so komisch kodieren wollen? Ist nicht ganz normales UTF-8 in JEDEM Fall die bessere Wahl? UTF-8 braucht weniger Speicherplatz und lässt sich einfacher (de)kodieren. Wenn man dieses komische CESU-8 lesen will muss man es ja zweimal dekodieren. Weiß hier jemand, wofür CESU-8 gut ist? 84.58.102.236 15:24, 25. Mai 2007 (CEST)
- Das entsteht, wenn man die Existenz von Unicode-Zeichen jenseits der ersten Gruppe (alles, was 32 Bit bei UTF-16 braucht) ignoriert, also "Unicode = 16 Bit" denkt, und dann einen UTF-8-Konverter schreibt.
- Eigentlich ist das nur ein Konverter UCS-2 -> UTF-8, aber wenn man ihn auf UTF-16 loslässt, kommt eben dieses CESU-8 heraus.

