IDN - Internationalized Domain Names

Domain-Namen mit Akzenten und Umlauten

Die Einführung von .ch- und .li-Domain-Namen mit Akzenten und Umlauten (sogenannte IDN) erfolgte im März 2004. Die Abkürzung IDN bedeutet Internationalized Domain Name und wird verwendet für Domain-Namen, die Umlaute, diakritische Zeichen oder Buchstaben aus anderen Alphabeten als dem lateinischen Alphabet enthalten.

Die zusätzlichen Zeichen

Die Basis bildet der Zeichensatz der Unicode-Tabelle Latin-1 Supplement, von der ein Teil zur Registrierung zugelassen wurde. Es handelt sich um folgende Zeichen:

zusätzlich zu den bis dahin zugelassenen 37 Zeichen aus dem ASCII-Zeichensatz:

Im Dezember 2005 wurde zusätzlich folgendes Zeichen aus dem Zeichensatz der Unicode-Tabelle Latin Extended-A eingeführt:

Ob ein Bedarf für eine zusätzliche Erweiterung besteht, wird laufend geprüft. Die technisch einwandfreie Funktion der Registrierung und des DNS (Domain Name System) hat für uns oberste Priorität. Deshalb werden weitere als die bereits genannten Zeichen jeweils nur schrittweise eingeführt.

Länge von 63 Zeichen möglich

Seit März 2004 kann ein Domain-Name maximal 63 Zeichen lang sein (davor waren es 24 Zeichen). Bei der Berechnung der Länge eines Domain-Namens wird gezählt, was zwischen www. und .ch oder .li steht. Massgebend ist der sogenannte ACE-String des Domain-Namens (siehe unten), der bei Namen ohne Umlaute und Sonderzeichen gleich lang ist, bei solchen mit Umlauten und Sonderzeichen jedoch, bedingt durch den Algorithmus, länger ist. Beispiele:

www.switch.ch ist 6 Stellen lang,
www.ethz.ch ist 4 Stellen lang,
www.bücher.ch ist jedoch nicht 6, sondern 13 Stellen lang, da der zugehörige ACE-String xn--bcher-kva.ch heisst.

ACE-String

Grundsätzlich gab es zwei verschiedene Möglichkeiten, IDN einzuführen. Die erste war, dass Anpassungen im DNS Unicode-Zeichen direkt verwendbar machen würden. Dieser Eingriff war dann aber zu einschneidend. So entschied man sich für die zweite Möglichkeit, einen Algorithmus festzulegen, wie ein Unicode-String in einen zulässigen ASCII-Domain-Namen umgewandelt werden soll. Dieser ACE-String (ACE steht für ASCII Compatible Encoding) wird dann im DNS eingetragen. Seit der Einführung von IDN ist der Eintrag im DNS erstmals mit dem Domain-Namen nicht mehr identisch.

Name Preparation, Punycode

Damit ein Unicode-String in einen ACE-String konvertiert werden kann, müssen gewisse Voraussetzungen erfüllt sein. Dies wird durch die Prozedur "Nameprep" sichergestellt. Sie überprüft, ob keine unzulässigen Zeichen vorkommen. Umlaute, die aus zwei Zeichen zusammengesetzt sind, müssen durch eines ersetzt werden, z.B. a + ¨ = ä. Man nennt diesen Vorgang "Normalization". Weiter werden lateinische Grossbuchstaben immer in Kleinbuchstaben umgewandelt, was als "Case Mapping" oder "Case Folding" bezeichnet wird.

Wenn nach erfolgter "Name Preparation" ASCII-fremde Zeichen im String enthalten sind, kennzeichnet das System diesen String mit dem Präfix xn--. Punycode entnimmt dem eigentlichen Domain-Namen die ASCII-fremden Zeichen, merkt sich die Position dieser Zeichen und hängt sie, durch einen weiteren Bindestrich abgetrennt, in codierter Form am Schluss wieder an.

Ein Beispiel

Konsequenzen

Der Domain-Name und der DNS-Eintrag sind bei IDN zwei verschiedene Dinge.

bücher.ch ist der Domain-Name,
xn--bcher-kva.ch
ist der ACE-String und wird ins DNS eingetragen.

Die aus der algorithmischen Bearbeitung resultierende Zeichenkette ist aus technischen Gründen um einige Stellen länger als der Domain-Name selbst. Der Domain-Name "www.buecher.ch" ist 7 Stellen lang. Der ACE-String ist jedoch 13 Stellen lang.

bücher.ch = Domain-Name: muss mindestens 3 Stellen lang sein,
xn--bcher-kva.ch = DNS-Eintrag: darf maximal 63 Stellen lang sein.

IETF-Standards
  • RFC 3492 Encoding Scheme (Punycode)
  • RFC 5890 IDNA (Internationalized Domain Names for Applications): Framework
  • RFC 5891 IDNA: Protocol
  • RFC 5892 IDNA: Unicode Code Points
  • RFC 5893 IDNA: Right-to-Left Scripts
  • RFC 5894 IDNA: Background, Explanations, and Rationale

Die Unterstützung für IDN-Domain-Namen ist mittlerweile in aktuellen Browsern und E-Mail-Programmen gängig. Es ist aber nach wie vor zu empfehlen, für wichtige Anwendungen nicht allein auf einen IDN zu setzen.

SWITCH garantiert die Tauglichkeit von Domain-Namen mit Umlauten und Akzenten gemäss Anhang 2 der AGB im Zusammenhang mit Programmen wie Browsern und E-Mail-Programmen nicht und übernimmt diesbezüglich keine Haftung.

Nicht alle Zeichen sind auf der Tastatur verfügbar. Allein in der Schweiz gibt es vier Standards mit unterschiedlicher Tastaturbelegung. Es ist jedoch anzunehmen, dass ein Domain-Name mit schwedischen Sonderzeichen von jemandem registriert wird, der über eine entsprechende Tastatur verfügt. Dasselbe gilt z.B. für spanische oder deutsche Zeichen. Die folgende Tabelle liefert Erklärungen und Eingabehilfen für das Eintippen aller neuen Zeichen.

Auf einem PC kann jedes Zeichen auch als ASCII-Code über die Zehnertastatur eingegeben werden. Dazu "Num Lock" aktivieren, die "Alt"-Taste gedrückt halten und z.B. "133" eintippen. Beim Loslassen der "Alt"-Taste erscheint das Zeichen à. Bei einem Notebook zuerst mit der "FN"-Taste "Num Lock" aktivieren und ebenso mit der "Alt"-Taste "133" im Zehnerblock eingeben.

Macintosh-Benutzern steht für die Eingabe von Zeichen aus verschiedenen Zeichensätzen die "Zeichenübersicht" zur Verfügung.