ISO/IEC 2022

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

ISO/IEC 2022, Informationstechnologie – Zeichensatzstruktur- und -erweiterungstechniken (englisch Information Technology—Character code structure and extension techniques) ist ein ISO-Standard, der eine Technik zur Kodierung mehrerer Zeichensätze sowie Sprachen, die nicht in 7 Bits kodiert werden können, definiert.

Der Zeichensatz sollte das Problem unterschiedlicher zueinander inkompatibler Zeichenkodierungen lösen sowie die Kodierung ostasiatischer Schriftsysteme ermöglichen. Ein in ISO 2022 kodierter String kann problemlos durch 7-Bit-Kanäle transportiert werden, welches die Verwendung des Zeichensatzes im Mail- und Usenetverkehr ermöglicht. Mithilfe von meist drei oder vier Byte großen Escapesequenzen kann zwischen mehreren Zeichensätzen geschaltet werden. Pro Escapesequenz können, abhängig von ihrer Definition, entweder 94, 8.836 (in einer 94×94-Matrix) oder 830.584 (in einer dreidimensionalen 94×94×94-Matrix) Zeichen kodiert werden.

Jedoch konnte sich ISO/IEC 2022 nur im ostasiatischen Mailverkehr durchsetzen, für westliche Sprachen wurde keine Version veröffentlicht. Stattdessen wurde Unicode entwickelt, um diese Aufgabe zu erfüllen.

Es gibt drei Versionen von ISO/IEC 2022 für die drei ostasiatischen Schriften, ISO-2022-JP, ISO-2022-KR und ISO-2022-CN.

ISO-2022-JP[Bearbeiten]

ISO-2022-JP kodiert die japanische Schrift. Sie wird häufig im Mailverkehr eingesetzt, ansonsten wird eher auf Shift_JIS oder EUC-JP zurückgegriffen.

Die ursprüngliche Version wird in RFC 1468 beschrieben und enthält die folgenden vier Escape-Sequenzen:

ISO-2022-JP-1 wird in RFC 2237 beschrieben und fügt eine weitere Escapesequenz hinzu:

ISO-2022-JP-2 wird in RFC 1554 beschrieben und fügt weitere Escapesequenzen zur Unterstützung weiterer Sprachen hinzu. Sie erweitert ISO-2022-JP-1 um die folgenden Escapesequenzen:

ISO-2022-JP-3 erweitert die ursprüngliche Version um folgende Escapesequenzen:

ISO-2022-JP-2004 erweitert ISO-2022-JP-3 um die folgende Escapesequenz:

ISO-2022-KR[Bearbeiten]

ISO-2022-KR kodiert die koreanische Schrift und wird neben EUC-KR auf koreanischen Websites verwendet. Sie enthält nur eine einzige Escapesequenz:

ISO-2022-CN[Bearbeiten]

ISO-2022-CN kodiert die chinesische Schrift (sowohl Kurz- als auch Langzeichen) und wird in RFC 1922 beschrieben. Sie wird fast nie verwendet, EUC-CN bzw. Big5 und im Mailverkehr HZ sind viel häufiger anzutreffen. Die Kodierung enthält die folgenden Escapesequenzen:

ISO-2022-CN-EXT erweitert den ursprünglichen Zeichensatz um die folgenden Escapesequenzen:

Weblinks[Bearbeiten]