KOI8-U

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

KOI8-U aus der KOI8-Familie ist ein Zeichensatz, der für die Zeichenkodierung des kyrillischen Alphabetes für die ukrainische Sprache in Computersystemen benutzt wird und verwendet nur ein einzelnes Byte zur Kodierung.

KOI8-U ist eine Übermenge von ASCII und enthält somit auch die 26 Buchstaben des Lateinischen Alphabets. KOI8-U teilt viele Eigenschaften mit KOI8-R für Russisch. Der internationale Zeichensatz-Standard Unicode ersetzt KOI8-U vollständig.

KOI-U ist beschrieben in RFC 2319 und ist IANA-registriert und für MIME zugelassen.

Tabelle[Bearbeiten]

KOI8-U
x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 xA xB xC xD xE xF
0x ungenutzt
1x
2x SP ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { | } ~
8x
9x NBSP ° ² · ÷
Ax ё є і ї ґ
Bx Ё Є І Ї Ґ ©
Cx ю а б ц д е ф г х и й к л м н о
Dx п я р с т у ж в ь ы з ш э щ ч ъ
Ex Ю А Б Ц Д Е Ф Г Х И Й К Л М Н О
Fx П Я Р С Т У Ж В Ь Ы З Ш Э Щ Ч Ъ

Die Unterschiede zu KOI8-R sind an den Positionen 0xA4, 0xA6, 0xA7, 0xAD und 0xB4, 0xB6, 0xB7, 0xBD (in obiger Tabelle farblich hervorgehoben), wo die vier zusätzlich benötigten Buchstaben kodiert sind.

Während RFC 2319 sagt, dass 0x95 Unicode U+2219 (∙) sein soll, wird es oft in U+2022 (•) umgesetzt, wegen der Kompatibilität mit Codepage 1251. Einige Referenzen haben einen Tippfehler und ordnen fehlerhafterweise 0xB4 U+0403 zu, anstatt des korrekten U+0404. Dieser Tippfehler ist auch im Anhang A von RFC 2319, aber die Tabelle im Haupttext ist korrekt.

Siehe auch[Bearbeiten]

Weblinks[Bearbeiten]