Big5

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Big5 ist eine Zeichenkodierung für traditionelle chinesische Schriftzeichen. Sie kodiert 13.062 chinesische Schriftzeichen (zwei Schriftzeichen sind allerdings doppelt kodiert) und ist bei weitem der am meisten benutzte Zeichensatz in der Republik China (Taiwan). Der Name Big5 leitet sich davon ab, dass dieser Standard von den fünf größten taiwanischen Computerherstellern gemeinsam entwickelt wurde.

Geschichte[Bearbeiten]

Bevor Big5 existierte, wurden in Taiwan verschiedene zueinander inkompatible Zeichensätze wie IBM 5550 verwendet. Big5 sollte diese Zeichensätze ablösen und wurde 1984 eingeführt.

Nach der Einführung fand Big5 große Verbreitung und wurde u. a. in veränderter Form in Windows als Codepage 950 eingeführt. Später wurde CNS 11643 eingeführt, um Big5 abzulösen, dieses Vorhaben scheiterte jedoch. Aufgrund dessen wurde Big5 selber 2003 zum offiziellen Standard Taiwans erklärt.

Außer in Taiwan wird Big5 in Hongkong und Macau verwendet, die ebenfalls Langzeichen benutzen.

Kodierung[Bearbeiten]

Für die Kodierung der chinesischen Schriftzeichen werden in Big5 Bytepaare verwendet. Das erste Byte in einem solchen Paar wird Lead Byte (führendes Byte) genannt und kann Werte von 0xA1 bis 0xC6 oder 0xC9 bis 0xF9 annehmen. Das zweite Byte wird Trail Byte (folgendes Byte) genannt und kann Werte 0x40 bis 0x7e oder 0xa1 bis 0xfe annehmen. Inoffiziell werden die Bytes, bei denen das oberste Bit nicht gesetzt ist (0x00 bis 0x7F) als ASCII-Zeichen interpretiert. Dadurch haben Zeichen in Big5 eine variable Länge von 1 oder 2 Byte.

Aufbau und Struktur[Bearbeiten]

Big5 ist in mehrere Bereiche eingeteilt:

  • Der Bereich von 0x8140 bis 0xA0FE ist reserviert für private Nutzung.
  • Der Bereich von 0xA140 bis 0xA3FF kodiert Satzzeichen, das griechische Alphabet und Symbole.
  • Der Bereich von 0xA440 bis 0xC67E kodiert chinesische Schriftzeichen, die zuerst nach Strichen und dann nach Radikal sortiert werden.
  • Der Bereich von 0xC6A1 bis 0xC8FE ist reserviert für private Nutzung.
  • Der Bereich von 0xC940 bis 0xF9D5 kodiert weitere chinesische Schriftzeichen, die ebenfalls zuerst nach Strichen und dann nach Radikal sortiert werden.
  • Der Bereich von 0xF9D6 bis 0xFEFE ist reserviert für private Nutzung.

Erweiterungen[Bearbeiten]

Da Big5 viele benötigte Zeichen fehlen, haben sowohl Unternehmen als auch staatliche Institute eigene Erweiterungen zu Big5 entwickelt.

E-Ten[Bearbeiten]

E-Ten hat für ihr Betriebssystem einige Zeichen aus dem IBM 5550-Zeichensatz hinzugefügt:

  • Der Bereich 0xA3C0-0xA3E0 enthält Steuerzeichen.
  • Der Bereich 0xC6A1-0xC875 enthält eingekreiste und eingeklammerte Ziffern, Radikale, japanische Kana sowie die kyrillische Schrift.
  • Der Bereich 0xF9D6-0xF9FE enthält sieben zusätzliche chinesische Schriftzeichen sowie Rahmenzeichnung.

Microsoft[Bearbeiten]

Microsoft hat für Windows die Codepage 950 erstellt, die praktisch identisch zu Big5 ist, aber zusätzlich die Zeichen aus dem Bereich 0xF9D6-0xF9FE der E-Ten-Erweiterungen sowie das Eurozeichen enthält.

HKSCS[Bearbeiten]

Hongkong benutzt ebenfalls Big5. Da dieser Zeichensatz jedoch viele benötigte Zeichen für das Kantonesische nicht enthält, hat Hongkong den Hong Kong Supplementary Character Set entwickelt, der auf Big5 basiert, jedoch viele zusätzliche Schriftzeichen enthält.

Weblinks[Bearbeiten]