Der In­ter­na­tio­nal Te­le­com­mu­ni­ca­ti­on Union (ITU) zufolge nutzen weltweit mehr als drei Mil­li­ar­den Menschen die Mög­lich­kei­ten des World Wide Web – immer öfter auch in der eigenen Mut­ter­spra­che. Möglich machen dies in­ter­na­tio­na­le Domain-Namen (IDN), die In­ter­net­nut­zen­den seit 2003 zur Verfügung stehen. Wir erklären, wie IDN-Domains funk­tio­nie­ren.

Was ist ein in­ter­na­tio­na­li­sier­ter Domain-Name (IDN)?

Die IETF (Internet En­gi­nee­ring Task Force) be­zeich­net IDNs als Domain-Namen, die über die Buch­sta­ben des la­tei­ni­schen Alphabets hinaus Son­der­zei­chen wie bei­spiels­wei­se Umlaute oder Zeichen anderer Alphabete be­inhal­ten. Diese Domain-Namen werden jedoch nicht vom Domain Name System (DNS) ver­stan­den, das für die Über­set­zung von URLs in IP-Adressen zuständig ist. Das DNS basiert auf dem li­mi­tier­ten Stan­dard­zei­chen­satz ASCII.

Um IDNs für das DNS sowie andere In­ter­net­pro­to­kol­le ver­ständ­lich zu machen, wurde 2003 der In­ter­net­stan­dard „In­ter­na­tio­na­li­zing Domain Names in Ap­pli­ca­ti­ons“ (IDNA) ins Leben gerufen. Dieser definiert eine stan­dar­di­sier­te Über­set­zung von Unicode zu ASCII und er­mög­licht somit die Ver­wen­dung von Nicht-ASCII-Zeichen in Domain-Namen.

Domain kaufen
Re­gis­trie­ren Sie Ihre perfekte Domain
  • Inklusive 1 SSL-Wildcard-Zer­ti­fi­kat pro Vertrag
  • Inklusive Domain Lock
  • Inklusive Domain Connect für einfache DNS-Ein­rich­tung

Funk­ti­ons­wei­se des IDNA

Um si­cher­zu­stel­len, dass in­ter­na­tio­na­li­sier­te Domain-Namen auch von den zahl­rei­chen Systemen im Internet ver­ar­bei­tet werden können, die lediglich den ASCII-Zei­chen­satz un­ter­stüt­zen, lässt sich jeder IDN, der im Unicode vorliegt, in einen ACE-String über­set­zen, der auf ASCII-Zeichen beruht. So werden URLs im Browser bei­spiels­wei­se mit Umlauten angezeigt, während der Server die Adressen aus­schließ­lich ASCII-kom­pa­ti­bel ver­ar­bei­tet. Spe­zi­fi­ziert wird dieses Verfahren im In­ter­net­stan­dard IDNA2003 sowie in der Über­ar­bei­tung IDNA2008, die im Jahr 2010 zu­ge­las­sen wurde. Die Über­set­zung von Unicode nach ASCII erfolgt cli­ent­sei­tig (im Web­brow­ser, E-Mail-Programm etc.) auf Grundlage eines stan­dar­di­sier­ten Ko­die­rungs­ver­fah­rens, das Punycode genannt wird.

Punycode

Der im RFC 3492 stan­dar­di­sier­te Punycode wurde ent­wi­ckelt, um Unicode-Zei­chen­ket­ten eindeutig und ver­lust­frei in ASCII-Zeichen dar­stel­len zu können. Dabei werden alle Nicht-ASCII-Zeichen aus dem Domain-Namen entfernt, kodiert und durch einen Bin­de­strich getrennt angehängt. Diese Codefolge enthält die In­for­ma­ti­on, um welches Uni­code­zei­chen es sich handelt, sowie dessen Position im Domain-Namen. Darüber hinaus wird jedem so er­stell­ten ACE-String das Präfix xn– vor­an­ge­stellt, das die Zei­chen­fol­ge un­miss­ver­ständ­lich als kodierten IDN gemäß IDNA und Punycode kenn­zeich­net. In unserem Artikel zu Punycode finden Sie eine aus­führ­li­che Erklärung des Ko­die­rungs­ver­fah­rens sowie einige Beispiele.

Tipp

Mit einem Online-IDN-Domain-Converter können Sie IDNs nach dem Punycode-Verfahren in ihren ent­spre­chen­den ACE-Strings umwandeln.

Un­ter­schie­de zwischen IDNA2003 und IDNA2008

Im ur­sprüng­li­chen Verfahren von 2003 wurden in­ter­na­tio­na­li­sier­te URLs vor der Punycode-Kodierung im Nameprep-Verfahren nor­ma­li­siert. Dabei wurden Groß­buch­sta­ben zu Klein­buch­sta­ben um­ge­wan­delt, Steu­er­zei­chen entfernt und äqui­va­len­te Zeichen in eine ein­heit­li­che Form gebracht. Seit IDNA2008 ist Nameprep jedoch nicht mehr Teil des Über­set­zungs­ver­fah­rens. IDNA gibt somit keine Nor­ma­li­sie­rung mehr vor, empfiehlt jedoch einen Al­go­rith­mus, der Groß­buch­sta­ben in Klein­buch­sta­ben umwandelt.

Diese Anpassung kommt auch Nutzern im deutschen Sprach­raum entgegen, da das in Deutsch­land geläufige Uni­code­zei­chen „ß“ gemäß IDNA2003 ur­sprüng­lich als Äqui­va­lent zu „ss“ definiert wurde. Domains wie www.fußball-ergebnisse.de wurden im Nameprep-Verfahren somit au­to­ma­tisch zu www.fussball-ergebnisse.de nor­ma­li­siert. Diese Anpassung findet nach IDNA2008 nicht mehr statt. Seit 2010 wird das „ß“ als „Latin small letter sharp s“ korrekt in­ter­pre­tiert und kann als Teil einer IDN-Domain re­gis­triert werden.

Darüber hinaus werden rund 8.000 Zeichen, die unter IDNA2003 in Domain-Namen möglich waren, unter IDNA2008 nicht mehr un­ter­stützt. Vier Zeichen inklusive „ß“ werden seit der Über­ar­bei­tung des Standards anders in­ter­pre­tiert als zuvor. Eine de­tail­lier­te Dis­kus­si­on der Un­ter­schie­de zwischen IDNA2003 und IDNA2008 findet sich im Unicode Technical Standard #46. In folgender Tabelle finden Sie eine Zu­sam­men­fas­sung der Haupt­un­ter­schie­de.

IDNA2003 IDNA2008
Nameprep-Verfahren gefordert Keine Nor­ma­li­sie­rung vor­ge­ge­ben
Gültig für Unicode 3.2 Gültig für Unicode Versionen ab 5.2
Strikte Regeln für links­läu­fi­ge Schriften Klarere Regeln für links­läu­fi­ge Schriften
Groß- und Klein­buch­sta­ben werden als separate Zeichen be­trach­tet Groß­buch­sta­ben werden in Klein­buch­sta­ben um­ge­wan­delt
Viele Symbole sind verboten, z. B. grafische Symbole, die zu keinem Schrift­sys­tem gehören, sowie manche Satz­zei­chen
„Remapping“ von manchen Unicode-Zeichen entfernt, da dies zu Un­re­gel­mä­ßig­kei­ten führen könnte

Probleme mit IDNs

In­zwi­schen sollten alle gängigen Internet-Programme IDN verstehen. Zu Problemen mit in­ter­na­tio­na­li­sier­ten Domain-Namen kommt es aber mitunter dadurch, dass der Umstieg von IDNA2003 zu IDNA2008 im Internet noch nicht kon­se­quent vollzogen wurde. Eine Feh­ler­quel­le im deutschen Sprach­raum ist die un­ter­schied­li­che In­ter­pre­ta­ti­on des „ß“. Da IDNA2003 „ß“ zwingend zu „ss“ umwandelt, sind spezielle ß-Domains, die gemäß IDNA2008 re­gis­triert werden können, für Systeme, die nach dem ver­al­te­ten Standard kon­ver­tie­ren, oft nicht auf­find­bar. Statt­des­sen gelangen Nutzer auf die ent­spre­chen­de Domain mit „ss“. Umgehen lassen sich solche Schwie­rig­kei­ten, indem Web­sei­ten­be­trei­ber beide Varianten re­gis­trie­ren und die zweite Domain auf die prio­ri­sier­te Schreib­wei­se per Domain-Wei­ter­lei­tung (Redirect) umleiten.

Domain-Check
Zum Hauptmenü