IDN - Internationalized Domain Names

Domain-Namen mit Akzenten und Umlauten

Domain-Namen unter .ch und .li können auch Nicht-ASCII-Zeichen wie Umlaute und Akzente enthalten. Solche Domain-Namen, die Umlaute, andere diakritische Zeichen oder Buchstaben aus anderen Alphabeten als dem lateinischen Alphabet enthalten, werden als Internationalized Domain Names (IDN) bezeichnet. Die für .ch- und .li-Domain-Namen zulässigen Zeichen sind in den Anhängen 1 und 2 der AGB aufgelistet.

ACE-String

Grundsätzlich gab es zwei verschiedene Möglichkeiten, IDN einzuführen. Die erste war, dass Anpassungen im DNS Unicode-Zeichen direkt verwendbar machen würden. Dieser Eingriff war dann aber zu einschneidend. So entschied man sich für die zweite Möglichkeit, einen Algorithmus festzulegen, wie ein Unicode-String in einen zulässigen ASCII-Domain-Namen umgewandelt werden soll. Dieser ACE-String (ACE steht für ASCII Compatible Encoding) wird dann im DNS eingetragen. Seit der Einführung von IDN ist der Eintrag im DNS erstmals mit dem Domain-Namen nicht mehr identisch.

Name Preparation, Punycode

Damit ein Unicode-String in einen ACE-String konvertiert werden kann, müssen gewisse Voraussetzungen erfüllt sein. Dies wird durch die Prozedur "Nameprep" sichergestellt. Sie überprüft, ob keine unzulässigen Zeichen vorkommen. Umlaute, die aus zwei Zeichen zusammengesetzt sind, müssen durch eines ersetzt werden, z.B. a + ¨ = ä. Man nennt diesen Vorgang "Normalization". Weiter werden lateinische Grossbuchstaben immer in Kleinbuchstaben umgewandelt, was als "Case Mapping" oder "Case Folding" bezeichnet wird.

Wenn nach erfolgter "Name Preparation" ASCII-fremde Zeichen im String enthalten sind, kennzeichnet das System diesen String mit dem Präfix xn--. Punycode entnimmt dem eigentlichen Domain-Namen die ASCII-fremden Zeichen, merkt sich die Position dieser Zeichen und hängt sie, durch einen weiteren Bindestrich abgetrennt, in codierter Form am Schluss wieder an.

Ein Beispiel

Konsequenzen

Der Domain-Name und der DNS-Eintrag sind bei IDN nicht identisch.

bücher.ch ist der Domain-Name,
xn--bcher-kva.ch ist der ACE-String und wird ins DNS eingetragen.

Die aus der algorithmischen Bearbeitung resultierende Zeichenkette ist aus technischen Gründen länger als der Domain-Name selbst. Der Domain-Name "bücher.ch" hat eine Länge von 6 Zeichen. Der ACE-String hat jedoch eine Länge von 13 Zeichen. Für die maximal zulässige Länge eines Domain-Namens ist die Länge des ACE-Strings massgeblich.

bücher.ch = Domain-Name: muss mindestens 3 Zeichen enthalten,
xn--bcher-kva.ch = ACE-String/DNS-Eintrag: darf maximal 63 Zeichen enthalten (ohne TLD).

IETF-Standards

  • RFC 3492 Encoding Scheme (Punycode)
  • RFC 5890 IDNA (Internationalized Domain Names for Applications): Framework
  • RFC 5891 IDNA: Protocol
  • RFC 5892 IDNA: Unicode Code Points
  • RFC 5893 IDNA: Right-to-Left Scripts
  • RFC 5894 IDNA: Background, Explanations, and Rationale

Aktuelle Browser und E-Mail-Programme unterstützen IDN. Dennoch sollte man für wichtige Anwendungen nicht allein auf einen IDN setzen.

Switch garantiert die Tauglichkeit von Domain-Namen mit Umlauten und Akzenten gemäss Anhang 2 der AGB im Zusammenhang mit Programmen wie Browsern und E-Mail-Programmen nicht und übernimmt diesbezüglich keine Haftung.