IDN - Internationalized Domain Names

Nomi a dominio con accenti e dieresi

Dal 1° marzo 2004 è consentito registrare nomi a dominio .ch e .li con accenti e dieresi (cosiddetti IDN). L'abbreviazione IDN sta per Internationalized Domain Name e viene utilizzata per i nomi a dominio che contengono dieresi, segni diacritici o lettere di alfabeti diversi da quello latino.

I nuovi caratteri

La base è costituita dal set di caratteri della tabella Unicode Latin-1 Supplement, una parte della quale è stata ammessa per la registrazione. Si tratta dei seguenti caratteri:

oltre ai 37 caratteri del set di caratteri ASCII finora ammessi:

Il 1° dicembre 2005 il seguente carattere dal set di caratteri della tabella Unicode Latin Extended-A è stato introdotto:

L'esigenza di un ulteriore ampliamento è oggetto di verifiche continue. Il funzionamento tecnicamente ineccepibile della registrazione e del DNS (Domain Name System) riveste per noi una priorità assoluta. Pertanto, i caratteri diversi da quelli già menzionati verranno introdotti solo gradualmente.

Lunghezza di 63 caratteri possibile

Dal 1° marzo 2004 un nome a dominio può avere una lunghezza massima di 63 caratteri (in passato erano 24 caratteri). Nel calcolo della lunghezza di un nome a dominio si conta cosa si trova tra www. e .ch oppure .li. È determinante la cosiddetta stringa ACE del nome a dominio (vedi in basso), che ha la stessa lunghezza nei nomi senza dieresi e caratteri speciali; tuttavia, essa è più lunga nei nomi con dieresi e caratteri speciali, a causa dell'algoritmo. Esempi:

www.switch.ch è lungo 6 posizioni,
www.ethz.ch è lungo 4 posizioni,
www.età.ch non è lungo 3 posizioni, bensì 10, poiché la stringa ACE corrispondente si chiama xn--et-kia.ch.

Stringa ACE

In linea di massima vi erano due possibilità diverse per introdurre gli IDN. La prima consisteva nel rendere direttamente utilizzabili i caratteri Unicode nel DNS. Ma questo intervento era troppo drastico. Pertanto, si è optato per la seconda possibilità, ovvero la definizione di un algoritmo per trasformare una stringa Unicode in un nome a dominio ASCII ammissibile. Questa stringa ACE (ACE significa ASCII Compatible Encoding) viene poi riportata nel DNS. Dopo l'introduzione degli IDN, per la prima volta la registrazione nel DNS non è più identica al nome a dominio.

Name Preparation, Punycode

Affinché una stringa Unicode possa essere convertita in una stringa ACE, occorre soddisfare determinati presupposti. Ciò viene fatto mediante la procedura "Nameprep". Essa verifica se vi sono caratteri non ammessi. Le dieresi composte da due caratteri devono essere sostituite da un carattere, per esempio a + ¨ = ä. Questa procedura è denominata "Normalization". Inoltre, le lettere latine maiuscole vengono sempre trasformata in lettere minuscole, il che viene definito come "Case Mapping" o "Case Folding".

Se, a "Name Preparation" avvenuta, la stringa contiene caratteri estranei al codice ASCII, il sistema contrassegna questa stringa con il prefisso xn--. Punycode rimuove dal nome a dominio effettivo i caratteri estranei al codice ASCII, ricorda la posizione di questi caratteri e li riaggiunge alla fine, in forma codificata e separati da un ulteriore trattino.

Un esempio

Conseguenze

Il nome a dominio e la registrazione DNS sono due cose diverse con IDN.

età.ch è il nome a dominio,
xn--et-kia.ch è la stringa ACE e viene registrata nel DNS.

Per motivi tecnici, la catena di caratteri risultante dall'elaborazione algoritmica è più lunga di alcune posizioni rispetto allo stesso nome a dominio. Il nome a dominio "www.età.ch" è lungo 3 posizioni. La stringa ACE, tuttavia, è lunga 10 posizioni.

età.ch = nome a dominio = deve essere lungo almeno 3 posizioni,
xn--et-kia.ch = registrazione DNS = può avere una lunghezza massima di 63 posizioni.

Standard IETF
  • RFC 3492 Encoding Scheme (Punycode)
  • RFC 5890 IDNA (Internationalized Domain Names for Applications): Framework
  • RFC 5891 IDNA: Protocol
  • RFC 5892 IDNA: Unicode Code Points
  • RFC 5893 IDNA: Right-to-Left Scripts
  • RFC 5894 IDNA: Background, Explanations, and Rationale

Mettiamo a disposizione qui, senza pretese di completezza, una lista di programmi idonei agli IDN (Web-Browser o programmi di e-mail). Vi preghiamo di rivolgervi direttamente ai produttori in caso di domande o problemi.

Browser
Programmi di e-mail
  • MS Outlook e Outlook Express per Windows con il Plug-In i–NavOutlook di VeriSign
  • Apple Mail dalla versione 3.2 (Mac OS X 10.5)

SWITCH non garantisce l'idoneità di nomi a dominio con dieresi e accenti ai sensi dell'allegato 2 delle CG in collegamento con programmi come browser e programmi di e-mail e non si assume alcuna responsabilità a questo riguardo.

Non tutti i caratteri sono disponibili sulla tastiera. Nella sola Svizzera vi sono quattro standard con disposizioni diverse della tastiera. Tuttavia, si presuppone che un nome a dominio con caratteri speciali svedesi venga registrato da qualcuno che dispone di una tastiera corrispondente. Lo stesso vale, per esempio, per i caratteri spagnoli o tedeschi. La seguente tabella fornisce spiegazioni e ausili per digitare tutti i nuovi caratteri.

Su un PC ogni carattere può essere digitato sul tastierino numerico anche come codice ASCII. Attivare a questo scopo "Num Lock", tenere premuto il tasto "Alt" e digitare, per esempio, "133". Lasciando il tasto "Alt" apparirà il carattere à. Su un notebook attivare dapprima "Num Lock" con il tasto "FN" e digitare "133" sul tastierino numerico tenendo premuto il tasto "Alt".

Gli utenti di Macintosh hanno a disposizione il "Visore caratteri" per digitare caratteri di vari set di caratteri.