Windows-1252

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
Windows-Codepages
874 Thai
932 Japanisch
936 Vereinfachtes Chinesisch
949 Koreanisch
950 Traditionelles Chinesisch
1250 Mitteleuropäisch
1251 Kyrillisch
1252 Westeuropäisch
1253 Griechisch
1254 Türkisch
1255 Hebräisch
1256 Arabisch
1257 Baltisch
1258 Vietnamesisch

Windows-1252 auch CP 1252 sowie Westeuropäisch (Western European) oder ANSI. ist eine 8-Bit-Zeichenkodierung, die für das Betriebssystem Microsoft Windows entwickelt wurde. Der Zeichensatz basiert auf ISO 8859-1, weicht aber im Bereich 8016 – 9F16 von dieser ab, statt der C1-Steuerzeichen beinhalten diese 32 Positionen hier 27 darstellbare Zeichen, u. a. die in ISO 8859-15 hinzugekommenen und einige für bessere Typografie notwendige Zeichen. Manche Applikationen vermischen die Definition von ISO 8859-1 und Windows-1252. Da diese beispielsweise in HTML die zusätzlichen Steuerzeichen aus ISO 8859-1 keine Bedeutung haben, werden oft die druckbaren Zeichen aus Windows-1252 verwendet. Aus diesem Grund schreibt der neue HTML5-Standard vor, dass als ISO 8859-1 markierte Texte als Windows-1252 zu interpretieren sind.[1] Nichtsdestotrotz ist Windows-1252 ebenfalls bei der IANA registriert.[2] Im Oktober 2017 verwenden 4,6 % aller Websites die Zeichenkodierung implizit als ISO 8859-1, bei 0,8 % der Websites wird explizit Windows-1252 verwendet[3][4], bei jeweils fallender Tendenz. Latin-1 ist damit nach UTF-8 (89,9 %) die zweithäufigste Kodierung von Websites. Die Unterschiede zwischen all diesen Kodierungen sowie generell mangelnde Konsequenz bei der Unterstützung verschiedener Zeichensätze sind ein häufiges Interoperabilitätsproblem.

Code …0 …1 …2 …3 …4 …5 …6 …7 …8 …9 …A …B …C …D …E …F
0… NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI
1… DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US
2… SP ! " # $ % & ' ( ) * + , - . /
3… 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4… @ A B C D E F G H I J K L M N O
5… P Q R S T U V W X Y Z [ \ ] ^ _
6… ` a b c d e f g h i j k l m n o
7… p q r s t u v w x y z { | } ~ DEL
8… ƒ ˆ Š Œ Ž
9… ˜ š œ ž Ÿ
A… NBSP ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ SHY ® ¯
B… ° ± ² ³ ´ µ · ¸ ¹ º » ¼ ½ ¾ ¿
C… À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï
D… Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß
E… à á â ã ä å æ ç è é ê ë ì í î ï
F… ð ñ ò ó ô õ ö ÷ ø ù ú û ü ý þ ÿ

Da Unicode auf der ISO 8859-1 Codierung aufbaut, sind die Unicode Codepoints der nicht farbig unterlegten Zeichen zu den Codewerten in Windows-1252 identisch. Für farbig hinterlegten von ISO 8859-1 abweichenden Codepoints ergibt sich folgendes Mapping

Unicode-Mapping der zu ISO 8859-1 verschiedenen Zeichen
…0 …1 …2 …3 …4 …5 …6 …7 …8 …9 …A …B …C …D …E …F
8…
U+20ac

U+201a
ƒ
U+0192

U+201e

U+2026

U+2020

U+2021
ˆ
U+02c6

U+2030
Š
U+0160

U+2039
Œ
U+0152
Ž
U+017d
 
9…  
U+2018

U+2019

U+201c

U+201d

U+2022

U+2013

U+2014
˜
U+02dc

U+2122
š
U+0161

U+203a
œ
U+0153
ž
U+017e
Ÿ
U+0178

Unterschiede zwischen ISO 8859-1, ISO 8859-15, Windows-1252 und Unicode[Bearbeiten | Quelltext bearbeiten]

Windows-1252 enthält neben den Zeichen aus ISO 8859-1 auch diejenigen Zeichen, welche in ISO 8859-15 hinzugefügt wurden und dort einige weniger oft gebrauchten Zeichen aus ISO 8859-1 ersetzen. Allerdings unterscheidet sich bei diesen Zeichen die Position sowohl zwischen Windows-1252 und ISO 8859-15 als auch zu der Codierung in Unicode. Alle Zeichen die nicht in einer der beiden ISO-Codierungen auftauchen belegen dabei die folgenden Positionen.

Unterschiede zwischen ISO 8859-1, ISO 8859-15, Windows-1252 und Unicode
Zeichen Š š Ž ž Œ œ Ÿ ¤ ¦ ¨ ´ ¸ ¼ ½ ¾
ISO 8859-1 A4 A6 A8 B4 B8 BC BD BE
ISO 8859-15 A4 A6 A8 B4 B8 BC BD BE
Windows-1252 80 8A 9A 8E 9E 8C 9C 9F A4 A6 A8 B4 B8 BC BD BE
Unicode 20AC 160 161 17D 17E 152 153 178 A4 A6 A8 B4 B8 BC BD BE

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. HTML 5.1 Nightly Editor’s Draft 19 February 2013, 8.2.2.2 Character encodings, aufgerufen am 19. Februar 2013.
  2. iana.org
  3. Character encoding w3techs.com.
  4. Faq w3techs.com.