Diskussion:UTF-32

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 5 Jahren von Divof in Abschnitt Unicode Standard
Zur Navigation springen Zur Suche springen

Byte ist eine adressierbare Speichereinheit, die groß genug ist, um ein beliebiges Zeichen der englischen Sprache aus dem Basis-Zeichensatz aufzunehmen. (bei ASCII: 1 Zeichen = 8 Bit = 1 Byte; bei UTF-32: 1 Zeichen = 32 Bit = 4 Oktette = 1 Byte ! Oder nicht? (nicht signierter Beitrag von 85.182.66.62 (Diskussion | Beiträge) 00:29, 17. Sep. 2005 (CEST)) Beantworten

Nein. Bei ASCII waeren es 7 bit, bei Unicode 21. RedNifre 02:34, 15. Feb. 2008 (CET)Beantworten

Das war früher mal. Heutzutage gilt 1 Byte = 8 Bit. (nicht signierter Beitrag von 80.135.161.31 (Diskussion | Beiträge) 06:34, 25. Feb. 2009 (CET)) Beantworten

Falsch. Vgl. Datenwort, Byte. --Benji 00:18, 26. Feb. 2009 (CET)Beantworten

Auch ASCII Zeichen werden in 8 Bit codiert, wobei nur die hinteren 7 verwendet werden, beim erweiterten ASCII / ANSI sind es die vollen 8 Bit (z.B. im ISO-8859-n) Interessant bei UTF-16 und UTF-32 ist auch daß Nullbytes enthalten sein können. Textinterpreter, welche das Nullbyte als String-Ende interpretieren, können hier Probleme bekommen. Auch ein wichtiger Aspekt für C-Programmierer. (nicht signierter Beitrag von 37.209.77.237 (Diskussion) 22:47, 12. Dez. 2012 (CET))Beantworten

Angeblicher Vorteil des O(1)-Zugriffes[Quelltext bearbeiten]

Der Vorteil existiert nur, wenn man 1 Zeichen = 1 Codepoint festlegt. Je nach Unicode-Normalisierungsform brauchen Zeichen mit Diakritika aber mehr als einen Codepoint, etwa wenn ein Ü als <U+0055 U+0308> kodiert wird (wie es z.B. bei OS X geschieht). Für viele Zeichen-Diakritika-Kombinationen existieren auch gar keine "pre-composed" Zeichen, so dass man diese mit mehreren Codepoints ausdrücken muss, etwa kyrillische Vokale mit Betonungszeichen. Wer also meint, mit der Verwendung von UTF-32 müsse er sich um Zeichenkodierungen mit variabler Länge nicht mehr herumplagen, macht es sich zu einfach oder unterstützt (ggf. unwissentlich) nur eine Teilmenge von Unicode. :-( --RokerHRO 10:42, 15. Mär. 2010 (CET)Beantworten

Unicode Standard[Quelltext bearbeiten]

"Im aktuellen Unicode Standard 5.1 [...]", das ist doch nicht mehr im Ansatz aktuell, oder? Wir sind inzwischen bei v11. Felix D. (Diskussion) 11:40, 9. Sep. 2018 (CEST)Beantworten