Unicodeblock Vereinheitlichte CJK-Ideogramme

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
CJK-Ideogramm 次 in Kurzzeichen, Langzeichen, Kanji und Hanja

Der Unicodeblock Vereinheitlichte CJK-Ideogramme (engl. CJK Unified Ideographs, U+4E00 bis U+9FFF) enthält die grundlegenden chinesischen Schriftzeichen, die nicht nur in der chinesischen Schrift benutzt werden, sondern unter dem Namen Kanji auch einen Bestandteil der japanischen und als Hanja einen kleinen Teil der in Südkorea benutzten koreanischen Schrift ausmachen. Viele Zeichen in diesem Block werden in allen drei Schriftsystemen benutzt, viele aber auch nur in einem oder zweien der drei. Als Chữ nôm wurden chinesische Schriftzeichen früher auch für das Vietnamesische benutzt. Die Sortierung der ursprünglichen 20.902 Zeichen folgt der Sortierung im Kangxi-Wörterbuch nach Radikalen, wobei die Zeichen mit der geringsten Anzahl an Strichen zuerst gelistet sind.

Die Bezeichnungen „Ideographs“ im Original bzw. „Ideogramme“ in der Übersetzung sind irreführend, da die damit dargestellten Schriften strenggenommen keine Begriffsschriften (vgl. Ideographie) sind.

Der Block ist Resultat der vor allem im Fernen Osten kontroversen[1] Han-Vereinheitlichung (englisch han unification),[2] die chinesische, japanische, und koreanische Zeichen an derselben Stelle kodiert und die Darstellung des jeweiligen Zeichens von der ausgewählten Schrift abhängig macht. Als einziger Unicode-Block mit CJK-Zeichen fiel dieser Block jedoch unter die source separation rule, die besagt, dass Zeichen, die in einem früheren Zeichensatz separat kodiert wurden, auch in Unicode separat kodiert werden.[3]

Seit der Unicode-Version 5.1 ist es mit Variantenselektoren möglich, bestimmte Varianten von CJK-Ideogrammen anzuzeigen. Momentan sind als einzige Varianten die Zeichen aus dem Adobe-Japan1-Zeichensatz definiert.[4]

Tabelle[Bearbeiten]

Die Zeichen belegen in geschlossener Reihenfolge die Codepoints U+4E00 bis U+9FCC. Alle Zeichen haben die allgemeine Kategorie "Anderer Buchstabe" und die bidirektionale Klasse "Links nach rechts". Benannt sind sie nach dem Schema "CJK UNIFIED IDEOGRAPH-XXXX", wobei "XXXX" der hexadezimale Codepoint ist.

Unicodenummer Zeichen
(400 %)
Offizielle Bezeichnung Beschreibung
U+4E00 (19968) CJK UNIFIED IDEOGRAPH-4E00 CJK-Ideagraph 4E00
U+4E01 (19969) CJK UNIFIED IDEOGRAPH-4E01 CJK-Ideagraph 4E01
U+9FCB (40907) CJK UNIFIED IDEOGRAPH-9FCB CJK-Ideagraph 9FCB
U+9FCC (40908) CJK UNIFIED IDEOGRAPH-9FCC CJK-Ideagraph 9FCC

Zeichentabelle[Bearbeiten]

Aufgrund der Größe dieses Blocks befindet sich die Zeichentabelle aufgeteilt unter:

Grafiktafeln[Bearbeiten]

Aufgrund der Größe dieses Blocks befinden sich die Grafiktafeln unter Unicodeblock Vereinheitlichte CJK-Ideogramme/Grafiktafeln

Einzelnachweise und Quellen[Bearbeiten]

  1. The secret life of Unicode
  2. The Unicode Standard 4.0, Appendix A - Han Unification History (PDF; 65 kB)
  3. The Unicode Standard, 4.0, Chapter 11 - East Asian Scripts (PDF; 618 kB)
  4. PRI 108: Combined registration of the Adobe-Japan1 collection and of sequences in that collection

Weblinks[Bearbeiten]

Vorlage:Navigationsleiste Unicode/Wartung/2