Universal Coded Character Set

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Universal Character Set)
Zur Navigation springen Zur Suche springen

Der Universal Coded Character Set (UCS) ist eine Zeichenkodierung, die in der internationalen Norm ISO/IEC 10646 definiert ist. Diese deckt sich vollständig mit den korrespondierenden Unicode-Kodierungen UTF-16 und UTF-32.[1]

Er wird von ISO/IEC/JTC1/SC2/WG2 entwickelt.

Seit der Revision 2011 (ISO/IEC 10646:2011) sind die Kodierungen in jeder Hinsicht identisch mit denen des jeweiligen UNICODE-Standards.

Die Gruppe arbeitet sehr eng mit dem Unicode-Konsortium zusammen, das die Standards ständig in neuen Versionen synchronisiert. Aufgrund dessen sind alle Kodierungen aus Interoperabilitätsgründen auf die bei Unicode erlaubten 1.112.064 (= 220+216, abzüglich 211 Surrogate von UTF-16) Zeichen (von U+00000 bis U+0D7FF, sowie U+0E000 bis U+10FFFF) beschränkt.

Ursprünglich wurden diese beiden Formate definiert:

  • UCS-2: obsolete Kodierung in 2 Byte; dabei lässt sich nur die Basic Multilingual Plane kodieren. Dies ermöglicht die Codierung der meisten lebenden Sprachen und der gebräuchlicheren Sonderzeichen. UCS-2 ist nicht mehr Bestandteil des Standards. UCS-2 war auch der Zeichensatz von Microsoft Windows NT, während seit Windows 2000 UTF-16 eingesetzt wird.
  • UCS-4: Kodierung in 4 Byte (entspricht UTF-32)

In der Version ISO/IEC 10646-3:2003 werden die gleichen Formate UTF-8, UTF-16 und UTF-32 beschrieben wie in Unicode 4.0. Seit Revision 2011 sind die Standards hinsichtlich der Kodierungen deckungsgleich.

Gegenüberstellung der Versionen[1][Bearbeiten | Quelltext bearbeiten]

  • ISO/IEC 10646-1:1993 ≈ Unicode 1.1
    • plus ISO/IEC 10646-1:1993/Amd 5:1998 bis ISO/IEC 10646-1:1993/Amd 7:1997 ≈ Unicode 2.0/2.1
  • ISO/IEC 10646-1:2000 ≈ Unicode 3.0
    • plus ISO/IEC 10646-2:2001 ≈ Unicode 3.1
    • plus ISO/IEC 10646-1:2000/Amd 1:2002 ≈ Unicode 3.2
  • ISO/IEC 10646-3:2003 ≈ Unicode 4.0
    • plus ISO/IEC 10646:2003/Amd 1:2005 ≈ Unicode 4.1
    • plus ISO/IEC 10646:2003/Amd 2:2006 ≈ Unicode 5.0
    • plus ISO/IEC 10646:2003/Amd 3:2008 und ISO/IEC 10646:2003/Amd 4:2008 ≈ Unicode 5.1
    • plus ISO/IEC 10646:2003/Amd 5:2008 und ISO/IEC 10646:2003/Amd 6:2009 ≈ Unicode 5.2
  • ISO/IEC 10646:2011 ≈ Unicode 6.0
  • ISO/IEC 10646:2012 ≈ Unicode 6.1/6.2/6.3
    • plus ISO/IEC 10646:2012/Amd 1:2013 und ISO/IEC 10646:2012/Amd 1 ≈ Unicode 7.0
  • ISO/IEC 10646:2014 und ISO/IEC 10646:2014/Amd 1:2015 ≈ Unicode 8.0
    • plus ISO/IEC 10646:2014/Amd 2:2016 ≈ Unicode 9.0
  • ISO/IEC 10646:2017 ≈ Unicode 10.0

Weblinks[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. a b The Unicode® Standard Version 10.0 – Core Specification: Appendix C Relationship to ISO/IEC 10646. The Unicode Consortium, S. 907–908, abgerufen am 12. April 2018 (englisch).