IDN - Internationalized Domain Names

Nomi a dominio con accenti e dieresi

L'introduzione dei nomi a dominio .ch e .li con accenti e dieresi (cosiddetti IDN) è avvenuta nel marzo 2004. L'abbreviazione IDN sta per Internationalized Domain Name e viene utilizzata per i nomi a dominio che contengono dieresi, segni diacritici o lettere di alfabeti diversi da quello latino.

I caratteri aggiuntivi

La base è costituita dal set di caratteri della tabella Unicode Latin-1 Supplement, una parte della quale è stata ammessa per la registrazione. Si tratta dei seguenti caratteri:

oltre ai 37 caratteri del set di caratteri ASCII consentiti fino a quel momento:

Nel dicembre 2005 il seguente carattere dal set di caratteri della tabella Unicode Latin Extended-A è stato introdotto:

L'esigenza di un ulteriore ampliamento è oggetto di verifiche continue. Il funzionamento tecnicamente ineccepibile della registrazione e del DNS (Domain Name System) riveste per noi una priorità assoluta. Pertanto, i caratteri diversi da quelli già menzionati verranno introdotti solo gradualmente.

Lunghezza di 63 caratteri possibile

Dal marzo 2004, un nome a dominio può avere una lunghezza massima di 63 caratteri (prima era di 24 caratteri). Nel calcolo della lunghezza di un nome a dominio si conta cosa si trova tra www. e .ch oppure .li. È determinante la cosiddetta stringa ACE del nome a dominio (vedi in basso), che ha la stessa lunghezza nei nomi senza dieresi e caratteri speciali; tuttavia, essa è più lunga nei nomi con dieresi e caratteri speciali, a causa dell'algoritmo. Esempi:

www.switch.ch è lungo 6 posizioni,
www.ethz.ch è lungo 4 posizioni,
www.età.ch non è lungo 3 posizioni, bensì 10, poiché la stringa ACE corrispondente si chiama xn--et-kia.ch.

Stringa ACE

In linea di massima vi erano due possibilità diverse per introdurre gli IDN. La prima consisteva nel rendere direttamente utilizzabili i caratteri Unicode nel DNS. Ma questo intervento era troppo drastico. Pertanto, si è optato per la seconda possibilità, ovvero la definizione di un algoritmo per trasformare una stringa Unicode in un nome a dominio ASCII ammissibile. Questa stringa ACE (ACE significa ASCII Compatible Encoding) viene poi riportata nel DNS. Dopo l'introduzione degli IDN, per la prima volta la registrazione nel DNS non è più identica al nome a dominio.

Name Preparation, Punycode

Affinché una stringa Unicode possa essere convertita in una stringa ACE, occorre soddisfare determinati presupposti. Ciò viene fatto mediante la procedura "Nameprep". Essa verifica se vi sono caratteri non ammessi. Le dieresi composte da due caratteri devono essere sostituite da un carattere, per esempio a + ¨ = ä. Questa procedura è denominata "Normalization". Inoltre, le lettere latine maiuscole vengono sempre trasformata in lettere minuscole, il che viene definito come "Case Mapping" o "Case Folding".

Se, a "Name Preparation" avvenuta, la stringa contiene caratteri estranei al codice ASCII, il sistema contrassegna questa stringa con il prefisso xn--. Punycode rimuove dal nome a dominio effettivo i caratteri estranei al codice ASCII, ricorda la posizione di questi caratteri e li riaggiunge alla fine, in forma codificata e separati da un ulteriore trattino.

Un esempio

Conseguenze

Il nome a dominio e la registrazione DNS sono due cose diverse con IDN.

età.ch è il nome a dominio,
xn--et-kia.ch è la stringa ACE e viene registrata nel DNS.

Per motivi tecnici, la catena di caratteri risultante dall'elaborazione algoritmica è più lunga di alcune posizioni rispetto allo stesso nome a dominio. Il nome a dominio "www.età.ch" è lungo 3 posizioni. La stringa ACE, tuttavia, è lunga 10 posizioni.

età.ch = nome a dominio = deve essere lungo almeno 3 posizioni,
xn--et-kia.ch = registrazione DNS = può avere una lunghezza massima di 63 posizioni.

Standard IETF
  • RFC 3492 Encoding Scheme (Punycode)
  • RFC 5890 IDNA (Internationalized Domain Names for Applications): Framework
  • RFC 5891 IDNA: Protocol
  • RFC 5892 IDNA: Unicode Code Points
  • RFC 5893 IDNA: Right-to-Left Scripts
  • RFC 5894 IDNA: Background, Explanations, and Rationale

Il supporto per i nomi a dominio IDN è ormai comune negli attuali browser e programmi di e-mail. Tuttavia, si raccomanda di non affidarsi esclusivamente a un IDN per le applicazioni importanti.

SWITCH non garantisce l'idoneità di nomi a dominio con dieresi e accenti ai sensi dell'allegato 2 delle CG in collegamento con programmi come browser e programmi di e-mail e non si assume alcuna responsabilità a questo riguardo.

Non tutti i caratteri sono disponibili sulla tastiera. Nella sola Svizzera vi sono quattro standard con disposizioni diverse della tastiera. Tuttavia, si presuppone che un nome a dominio con caratteri speciali svedesi venga registrato da qualcuno che dispone di una tastiera corrispondente. Lo stesso vale, per esempio, per i caratteri spagnoli o tedeschi. La seguente tabella fornisce spiegazioni e ausili per digitare tutti i nuovi caratteri.

Su un PC ogni carattere può essere digitato sul tastierino numerico anche come Codice ASCII. Attivare a questo scopo "Num Lock", tenere premuto il tasto "Alt" e digitare, per esempio, "133". Lasciando il tasto "Alt" apparirà il carattere à. Su un notebook attivare dapprima "Num Lock" con il tasto "FN" e digitare "133" sul tastierino numerico tenendo premuto il tasto "Alt".

Gli utenti di Macintosh hanno a disposizione il "Visore caratteri" per digitare caratteri di vari set di caratteri.