Indian Script Code for Information Interchange

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Indian Script Code for Information Interchange (ISCII) ist die indische nationale Norm für die Kodierung der Zeichen der verschiedenen indischen Schriften, die sämtlich Abkömmlinge der Brahmi-Schrift sind. Sie sind prinzipiell sehr ähnlich strukturiert, jedoch sind die Buchstabenformen sehr unterschiedlich. So versucht ISCII, die logische Struktur dieser Schriften zu kodieren, während die Auswahl der speziellen Buchstabenformen von einer Auszeichnungssprache (engl.: Markup) oder einer Schrifttechnik wie OpenType vorgenommen wird.

ISCII umfasst die folgenden Schriften: Bengali, Devanagari, Gujarati, Gurmukhi, Kannada, Malayalam, Oriya, Tamilisch und Telugu.

Wird ein Text auf eine andere Schrift umgestellt, erfolgt eine automatische Transliteration.

ISCII ist ein 8-Bit Zeichensatz, bei dem, wie bei den ISO 8859 und vielen anderen Zeichensätzen, die unteren 128 Zeichen dem ASCII-Standard entsprechen.

In Unicode ist die Kodierungsart von ISCII weitgehend beibehalten worden. Hier aber sind die unterschiedlichen Schriften in separaten jeweils 128 Byte großen Codeblöcken im Bereich U+0900 bis U+0DFF kodiert.

Code …0 …1 …2 …3 …4 …5 …6 …7 …8 …9 …A …B …C …D …E …F
A… NBSP CB AV VSG A Ā I Ī U Ū R E Ē Ai O
B… O Au Õ Ka Kha Ga Gha Nga Ca Cha Ja Jha Nya Tta Ttha Dda
C… Ddha Nna Ta Tha Da Dha Na Nnna Pa Pha Ba Bha Ma Ya Yya Ra
D… Rra La Lla Llla Va Sha Ssa Sa Ha INV ā i ī u ū r
E… e ē ai o ō au õ Halant Nukta Danda ATR
F… EXT 0 1 2 3 4 5 6 7 8 9
INV
Unsichtbares (invisible) Zeichen, mit dem in Verbindung mit Halant (siehe unten) sogenannte Halbformen kombinierender Zeichen isoliert dargestellt werden können, z.B. क (ka) + ् (Halant) + INV = क्‍ In Unicode folgt auf das Halant U+094D stattdessen das Zeichen ZERO WIDTH JOINER U+200D.
INV wird auch als (leeres) Basiszeichen zur Darstellung kombinierender Vokalzeichen verwendet. In Unicode wird stattdessen NBSP U+00A0 oder der gepunktete Kreis ◌ U+25CC verwendet.
ATR
Schalter zur Auswahl eines bestimmten Skripts bis sum Zeilenende. Steht dazu vor einem Bytecode.
EXT
Vedischer Akzent. Auswahl durch folgendes Byte.
Halant (Virama)
Entfernt den vorhergehenden inhärenten Vokal, bzw. verbindet Konsonanten zu Clustern, z.B. क (ka) + ् (Halant) + त (ta) = क्त (kta). Die Sequenz ् (Halant) + ् (Halant) erzeugt ein explizites Halant, z.B. क (ka) + ् (Halant) + ् (Halant) + त (ta) = क्‌त. Die Sequenz ् (Halant) + ़ (Nukta) erzeugt Halbkonsonanten, wenn möglich, z.B. क (ka) + ् (Halant) + ़ (Nukta) + त (ta) = क्‍त.
ISCII Unicode
Halant Halant
Halant + Halant Halant + ZWNJ
Halant + Nukta Halant + ZWJ
Nukta
Erzeugt nachgestellt seltenere Zeichen ohne eigenen Code, z.B. क (ka) + ़ (Nukta) = क़ (qa).

Siehe auch[Bearbeiten]

Weblinks[Bearbeiten]