KOI8-U

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

KOI8-U aus der KOI8-Familie ist ein Zeichensatz, der für die Zeichenkodierung des kyrillischen Alphabetes für die ukrainische Sprache in Computersystemen benutzt wird und verwendet nur ein einzelnes Byte zur Kodierung.

KOI8-U ist eine Übermenge von ASCII und enthält somit auch die 26 Buchstaben des Lateinischen Alphabets. KOI8-U teilt viele Eigenschaften mit KOI8-R für Russisch. Der internationale Zeichensatz-Standard Unicode ersetzt KOI8-U vollständig.

KOI-U ist beschrieben in RFC 2319[1] und ist IANA-registriert und für MIME zugelassen.

…0 …1 …2 …3 …4 …5 …6 …7 …8 …9 …A …B …C …D …E …F
0… ungenutzt
1…
2… SP ! " # $ % & ' ( ) * + , - . /
3… 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4… @ A B C D E F G H I J K L M N O
5… P Q R S T U V W X Y Z [ \ ] ^ _
6… ` a b c d e f g h i j k l m n o
7… p q r s t u v w x y z { | } ~
8…
9… NBSP ° ² · ÷
A… ё є і ї ґ
B… Ё Є І Ї Ґ ©
C… ю а б ц д е ф г х и й к л м н о
D… п я р с т у ж в ь ы з ш э щ ч ъ
E… Ю А Б Ц Д Е Ф Г Х И Й К Л М Н О
F… П Я Р С Т У Ж В Ь Ы З Ш Э Щ Ч Ъ

Die Unterschiede zu KOI8-R sind an den Positionen A4hex, A6hex, A7hex, ADhex und B4hex, B6hex, B7hex, BDhex (in obiger Tabelle farblich hervorgehoben), wo die vier zusätzlich benötigten Buchstaben kodiert sind.

Während RFC 2319[1] sagt, dass 95hex Unicode U+2219 (∙) sein soll, wird es oft in U+2022 (•) umgesetzt, wegen der Kompatibilität mit Codepage 1251. Einige Referenzen haben einen Tippfehler und ordnen fehlerhafterweise B4hex U+0403 zu, anstatt des korrekten U+0404. Dieser Tippfehler befindet sich auch im Anhang A von RFC 2319, aber die Tabelle im Haupttext ist korrekt.

  • RFC 2319 – Ukrainian Character Set KOI8-U [Errata: RFC 2319]. April 1998 (englisch).

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. a b RFC 2319 – Ukrainian Character Set KOI8-U [Errata: RFC 2319]. April 1998 (englisch).