Thai Industrial Standard 620-2533

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Thai Industrial Standard 620-2533 ist unter der Abkürzung TIS-620 allgemein bekannt als der verbreitetste Zeichensatz und Zeichenkodierung für die Thailändische Schrift. Der Standard wurde vom Thai Industrial Standards Institute (TISI), einem Organ der königlich-thailändischen Regierung, verabschiedet und ist der allein gültige Standard im Königreich Thailand.

Der beschreibende Name des Standards lautet: "Standard für Codes thailändischer Buchstaben zum Gebrauch im Computer" (Thai: รหัสสำหรับ อักขระไทย ที่ใช้กับ คอมพิวเตอร).

Der Zusatz "2533" bezieht sich auf die Jahreszahl nach dem buddhistischen Kalender (1990), in dem der Standard veröffentlicht wurde. Die Vorgängerversion, TIS-620-2529 (1986), gilt damit nicht mehr.

Struktur[Bearbeiten]

TIS-620 ist eine konventionelle ASCII-Erweiterung, die zu 7-Bit-ASCII vollständig kompatibel ist und im 8-Bit-Hexadezimal-Bereich zwischen A1 und FB die thailändischen Buchstaben kodiert. Aufgrund der komplexen Platzierung der thailändischen Vokale und Tonzeichen wird TIS-620 nur zum Informationsaustausch verwendet. Für eine korrekte Darstellung wird zusätzlich eine Rendering-Engine für thailändischen Text benötigt.

Varianten[Bearbeiten]

Eine fast identische Version von TIS-620 wurde 1999 als ISO 8859-11 adaptiert. Der einzige Unterschied ist, dass in ISO 8859-11 das Zeichen A0 (Hex) als geschütztes Leerzeichen definiert ist, während es in TIS-620 zwar reserviert, aber nicht definiert ist. (In der Praxis wird dieser kleine Unterschied normalerweise ignoriert.)

Der Zeichensatz ISO 8859-11 wurde auch als ISO-IR-166 bei Ecma International registriert, aber diese Variante enthält auch explizite Escape-Sequenzen, um Anfang und Ende eines thailändischen Wortes zu markieren. (Im Thailändischen werden keine Zwischenräume zwischen den Wörtern gesetzt.)

Die Windows-Codepage 874 basiert ebenfalls auf TIS-620, fügt allerdings einige weitere Zeichen hinzu.

Die Reihenfolge der Zeichen in TIS-620 wurde in Unicode (ISO 10646) ebenfalls übernommen. Der Unicode-Block Thailändisch reicht von U+0E01 bis U+0E7F. TIS-620-Zeichen können ganz einfach nach UTF-16 konvertiert werden. Man muss nur jedem Byte das Präfix 0E hinzufügen und die Hex-Zahl A0 vom Wert abziehen.

TIS-620
x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 xA xB xC xD xE xF
0x unused
1x
2x SP ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~
8x unused
9x
Ax  
Bx
Cx
Dx  ั  ิ  ี  ึ  ื  ุ  ู  ฺ         ฿
Ex  ็  ่  ้  ๊  ๋  ์  ํ  ๎
Fx        

Eventuell muss die Darstellung im Browser vergrößert werden, um alle Zeichen lesbar darzustellen.

In der oberen Tabelle ist 20 das reguläre SPACE Zeichen. Die Werte 00-1F, 7F. 80-9F, A0, DB-DE und FC-FF sind in TIS-620 keinen Zeichen zugeordnet.

Weblinks[Bearbeiten]