Internationalisierter Domainname
Als internationalisierte Domainnamen (englisch internationalized domain name; IDN), umgangssprachlich auch Umlautdomain oder Sonderzeichendomain, werden Domainnamen bezeichnet, die Umlaute, diakritische Zeichen oder Buchstaben aus anderen Alphabeten als dem lateinischen Alphabet enthalten. Solche Zeichen waren ursprünglich im Domain Name System nicht vorgesehen und wurden nachträglich durch den Internetstandard Internationalizing Domain Names in Applications (IDNA) ermöglicht.
Grundsätzlich sind alle Unicode-Zeichen in IDNs zulässig. Jede Vergabestelle für Domains regelt jedoch individuell, welche Zeichen sie für Domain-Registrierungen erlaubt.
Inhaltsverzeichnis |
Funktionsweise [Bearbeiten]
Unicode-Domainnamen werden zu ASCII-kompatiblen Kodierungen (englisch ASCII-compatible encoding; ACE) umgewandelt. Die Umwandlung erfolgt beim Client (zum Beispiel dem Browser oder Mailprogramm), sodass die Server-Infrastruktur nicht angepasst werden muss. Statt der Unicode-Strings kann der Benutzer im Client auch direkt die ACE-Strings eingeben. So können auch Clients ohne IDN-Fähigkeit mit internationalisierten Domains arbeiten, sofern der Benutzer den ACE-String kennt. Dies ist jedoch umständlicher, da man als Benutzer aus einem ACE-String den Unicode-Domainnamen nicht direkt ablesen kann.
Im ursprünglichen IDNA-Verfahren von 2003 (RFC 3490) wurden die Domainnamen zunächst durch das Nameprep-Verfahren normalisiert. Die Normalisierung bestand darin, alle Großbuchstaben durch Kleinbuchstaben zu ersetzen und äquivalente Zeichen auszutauschen. So war zum Beispiel „ß“ als äquivalent zu „ss“ spezifiziert, sodass die Domainnamen „STRaße“ und „strasse“ identisch waren. Mit der neuen Version IDNA2008, die von 2008 bis 2010 entwickelt wurde (RFC 5890), ist die Normalisierung nicht länger Teil von IDNA, sondern liegt im Verantwortungsbereich der Benutzerschnittstelle. IDNA2008 schreibt zwar keine Normalisierung mehr vor, empfiehlt aber einen allgemeinen Algorithmus, bei dem die Umwandlung von Groß- zu Kleinbuchstaben und ein paar weitere Regeln weiterhin vorgesehen sind. Bei .de ist es seit dem 16. November 2010 (für Inhaber einer Domain mit „ss“ schon vorher) möglich, separate Domains mit „ß“ zu registrieren.[1]
Im Anschluss an die Normalisierung werden mittels Punycode die Nicht-ASCII-Zeichen aus dem Namen entfernt und am Ende des Namens ein daraus abgeleiteter ASCII-String hinzugefügt, in dem die Position und Art des Unicode-Zeichens kodiert ist. Um einen IDN- von einem ASCII-Domainnamen zu unterscheiden, beginnt der Punycode-String mit dem Präfix xn--. Die ungewöhnliche Zeichenfolge xn-- wurde gewählt, weil sie in realen Wörtern oder Eigennamen praktisch nicht vorkommt und Konflikte mit ASCII-Domains daher äußerst unwahrscheinlich sind.
Zeichensätze [Bearbeiten]
Nachfolgend wird für einige Top-Level-Domains aufgelistet, welche Nicht-ASCII-Zeichen in den jeweiligen IDN-Domains erlaubt sind:
.de-Domains[2]
- à á â ã ä å æ ā ă ą ç ć ĉ ċ č ď đ è é ê ë ē ĕ ė ę ě ĝ ğ ġ ģ ĥ ħ ì í î ï ĩ ī ĭ į ı ð ĵ ķ ĸ ĺ ļ ľ ł ñ ń ņ ň ŋ ò ó ô õ ö ø ō ŏ ő œ ŕ ŗ ř ś ŝ ş š ţ ť ŧ ù ú û ü ũ ū ŭ ů ű ų ÿ ŷ ŵ ý ź ż ž þ ß[1]
Der Anteil von IDNs an allen registrierten Domains unterhalb von .de beträgt rund vier Prozent.[3]
.com- und .net-Domains
- à á â ã ä å æ ā ă ą ç ć ĉ ċ č ď đ è é ê ë ē ĕ ė ę ě ĝ ğ ġ ģ ĥ ħ ì í î ï ĩ ī ĭ į ı ð ĵ ķ ĸ ĺ ļ ľ ł ñ ń ņ ň ŋ ò ó ô õ ö ø ō ŏ ő œ ŕ ŗ ř ś ŝ ş š ţ ť ŧ ù ú û ü ũ ū ŭ ů ű ų ÿ ŷ ŵ ý ź ż ž þ
.eu-Domains[4]
- à á â ã ä å æ ā ă ą ç ć ĉ ċ č ď đ è é ê ë ē ĕ ė ę ě ĝ ğ ġ ģ ĥ ħ ì í î ï ĩ ī ĭ į ı ð ĵ ķ ĺ ļ ľ ŀ ł ñ ń ņ ň ʼn ŋ ò ó ô õ ö ø ō ŏ ő œ ŕ ŗ ř ś ŝ š ș ť ŧ ț ù ú û ü ũ ū ŭ ů ű ų ŵ ý ÿ ŷ ź ż ž þ ΐ ά έ ή ί ΰ α β γ δ ε ζ η θ ι κ λ μ ν ξ ο π ρ ς σ τ υ φ χ ψ ω ϊ ϋ ό ύ ώ а б в г д е ж з и й к л м н о п р с т у ф х ц ч ш щ ъ ы ь э ю я ἀ ἁ ἂ ἃ ἄ ἅ ἆ ἇ ἐ ἑ ἒ ἓ ἔ ἕ ἠ ἡ ἢ ἣ ἤ ἥ ἦ ἧ ἰ ἱ ἲ ἳ ἴ ἵ ἶ ἷ ὀ ὁ ὂ ὃ ὄ ὅ ὐ ὑ ὒ ὓ ὔ ὕ ὖ ὗ ὠ ὡ ὢ ὣ ὤ ὥ ὦ ὧ ὰ ά ὲ έ ὴ ή ὶ ί ὸ ό ὺ ύ ὼ ώ ᾀ ᾁ ᾂ ᾃ ᾄ ᾅ ᾆ ᾇ ᾐ ᾑ ᾒ ᾓ ᾔ ᾕ ᾖ ᾗ ᾠ ᾡ ᾢ ᾣ ᾤ ᾥ ᾦ ᾧ ᾰ ᾱ ᾲ ᾳ ᾴ ᾶ ᾷ ῂ ῃ ῄ ῆ ῇ ῐ ῑ ῒ ΐ ῖ ῗ ῠ ῡ ῢ ΰ ῤ ῥ ῦ ῧ ῲ ῳ ῴ ῶ ῷ
.info-Domains[5]
- á ä å æ ā ą ć č é ē ė ę ģ í ī į ð ķ ļ ł ñ ń ņ ó ö ø ō ő ŗ ś š ú ü ū ű ų ý ź ż ž þ
.at-Domains[6]
- à á â ã ä å æ ç è é ê ë ì í î ï ð ñ ò ó ô õ ö ø œ š ù ú û ü ý ÿ ž þ
.ch- und .li-Domains[7]
- à á â ã ä å æ ç è é ê ë ì í î ï ð ñ ò ó ô õ ö ø œ ù ú û ü ý ÿ þ
.org-Domains
- ä ö ü
Seit Mai 2010 gibt es auch IDN-Top-Level-Domains und damit komplette Domains aus nicht-lateinischen Buchstaben.[8] So gibt es beispielsweise die Toplevel-Domain مصر., die das arabische Wort für Ägypten (Misr) darstellt; die Homepage des ägyptischen Ministeriums für Kommunikation und Informationstechnologie ist über die ausschließlich aus arabischen Zeichen bestehende Domain http://موقع.وزارة-الاتصالات.مصر/ erreichbar. Der Domainname ist dabei dem Arabischen entsprechend von rechts nach links zu lesen.
Beispiel-Domains [Bearbeiten]
dömäin.example → xn--dmin-moa0i.example äaaa.example → xn--aaa-pla.example aäaa.example → xn--aaa-qla.example aaäa.example → xn--aaa-rla.example aaaä.example → xn--aaa-sla.example déjà.vu.example → xn--dj-kia8a.vu.example efraín.example → xn--efran-2sa.example ñandú.example → xn--and-6ma2c.example foo.âbcdéf.example → foo.xn--bcdf-9na9b.example موقع.وزارة-الاتصالات.مصر → xn--4gbrim.xn----ymcbaaajlc6dj7bxne2c.xn--wgbh1c
Eine Whois-Abfrage der Form whois -h whois.denic.de -- -C ISO-8859-1 example.com bzw. whois -h whois.denic.de -- -C UTF-8 example.com auf Unicode-basierenden Systemen liefert bei registrierten Domains u. a. die Schreibweise in Punycode.
Unterstützung im Browser [Bearbeiten]
Die Unterstützung für internationalisierte Domainnamen ist in aktuellen Browsern gängig.
Einige IDN-fähige Browser:
- Chrome
- Firefox ab Version 0.8
- Konqueror ab KDE 3.2 mit GNU IDN Library
- Internet Explorer ab Version 7.0
- Mozilla Application Suite ab Version 1.4
- Netscape Navigator ab Version 7.1
- Opera ab Version 7.11
- Safari ab Version 1.2 (v125)
- SeaMonkey ab Version 1.0
Quellen [Bearbeiten]
- ↑ a b „ß“ künftig in zulässigem Zeichensatz für .de-Domains, Pressemitteilung der DENIC, 26. Oktober 2010
- ↑ DENIC IDN-Liste
- ↑ Statistik der Domainentwicklung auf denic.de
- ↑ Unterstützte Schriftzeichen. The European Registry of Internet Domain Names.
- ↑ IDN Language Tables auf http://www.info.info/information/internationalized-domain-names
- ↑ IDNs bei nic.at
- ↑ Allgemeine Geschäftsbedingungen für die Registrierung und Verwaltung von Domain-Namen unter ".ch" und ".li", Anhang 2
- ↑ Erste komplett nicht-lateinische Domains gehen online auf Heise-online