DI RECENTE ACCOMAZZI...
CERCA
» Ricerca avanzata
MAILING LIST

Se vuoi iscriverti alla mailing list di Luca Accomazzi inserisci qui la tua mail:

Vuoi ricevere i messaggi immediatamente (50 invii / giorno) o in differita e in gruppo
(due invii / giorno)?

» Vuoi saperne di più?

La prima w del www

Sappiatelo: se la mattina il vostro capo entra in ufficio urlando “Presto! Dobbiamo realizzare una versione in gujurati del sito web aziendale” sarà una giornata pesante.
Lo chiamano www (world wide web, letteralmente “la ragnatela mondiale”), ma c’è ancora molto da fare prima che l’Internet si possa usare facilmente con tutte le lingue e gli alfabeti. Concause: errori storici, peculiarità dei linguaggi umani, caratteristiche bizzarre della cultura. Tutte insospettabili per chi non ha un capo amante del gujurati (o del devanagari).

Cominciamo dall’ovvio: fare un sito di importanza nazionale, per una impresa svizzera, significa pubblicare tutte le informazioni in perlomeno tre lingue. Questa è già una complicazione ma impallidisce se la confrontiamo con altre situazioni: per esempio, in Malesia si parla una sola lingua, ma metà della popolazione la scrive con l’alfabeto latino e l’altra con l’alfabeto arabo (che si scrive da destra verso sinistra). D’altra parte, l’azienda svizzera che si aspettasse di poter comunicare grazie al suo sito trilingue con la maggior parte del mondo -- magari aggiungendo semplicemente l’inglese -- andrà incontro a sorprese sgradevoli. I ticinesi, che condividono la medesima lingua con gli italiani, sanno che ci sono alcune piccole differenze nel linguaggio con le persone d’oltreconfine: un abitante di Milano resterà perplesso se gli parlate di “un Natel” e non capirà la felicità di un ragazzo di Lugano appena uscito dall’università che si vanti di essere “licenziato”. Questi piccoli trabocchetti, facilmente evitabili quando si realizza una pagina web nella nostra lingua, contano poco se li paragoniamo a problemi analoghi che assillano il francese e il tedesco. Gli svizzeri romandi, per esempio, per indicare il numero ottanta usano una parola differente rispetto a quanto fanno i francesi. Francesi e svizzeri di lingua francese quando scrivono una parola usando lettere maiuscole tralasciano gli accenti, mentre i canadesi di lingua francese considerano questo un grave errore d’ortografia. Per la lingua tedesca, le varianti regionali sono ancora più marcate ed è difficilissimo creare un testo scorrevole e ugualmente leggibile dagli abitanti della Svizzera centrale, Repubblica federale tedesca e Austria -- per non parlare di polacchi dell’ovest e italiani della provincia di Bolzano.

Un detto popolare tra gli informatici sostiene che “errare è umano, ma per complicare davvero le cose ci vuole un computer”. I calcolatori storicamente nascono negli Stati Uniti d’America e così, quando si tratta di studiare un codice che permetta alle macchine di memorizzare ed elaborare i testi, il primo standard ad emergere è l’infame ASCII (si pronuncia “aschi” ed è la sigla di American Standard Code for Information Interchange). Quel codice permette di rappresentare nella memoria degli elaboratori, usando i numeri compresi tra 0 e 127, molte lettere, cifre, simboli d’interpunzione: ma sono comprese soltanto le lettere usate nell’alfabeto inglese. Non c’è spazio neppure per i caratteri come “è”, “ç”, “ß” o “ñ” (indispensabili rispettivamente per chi scrive in italiano, francese, tedesco o spagnolo). Quando nacquero i personal computer, i produttori estesero lo standard ASCII con altri 128, in modo da soddisfare le esigenze della clientela extra-americana. Si creò così una babele di codici incompatibili, perché ogni mercato regionale finì per trovarsi con una codifica propria non standard e incompatibile con tutte le altre (perché i codici numerici compresi tra il 128 e il 255 venivano riutilizzati in ogni zona a scopi differenti).
A volte nacquero più non-standard in conflitto tra loro per risolvere il medesimo problema. Esemplare (in negativo) è il caso del cirillico, alfabeto usato da gran parte delle lingue slave. Nel 1981 Microsoft inventò un codice utilizzabile per rappresentare il cirillico all’interno dei PC MS-DOS, impegnando i codici non-ASCII di numero compreso tra il 128 e il 255. Nel 1984 quando Apple presentò Macintosh pensò bene di creare un codice per il cirillico, scegliendo però una rappresentazione differente da quella Microsoft e rendendo impossibile l’interscambio di file tra un Mac e un PC. Pochi anni dopo, quando Microsoft creò il sistema operativo OS/2 in società con IBM, reinventò i codici del cirillico creando una codifica incompatibile con quella adottata da MS-DOS. La casa di Bill Gates bissò poi questa pessima idea alla fine degli anni Ottanta quando apparve Windows. Potevano gli utenti Unix essere da meno? No: nasce per essi il codice KOI-8, differente da tutti i precedenti. Finalmente nel 1994, in piena era Internet, l’Istituto Mondiale degli Standard (l’ISO di Ginevra) decide di normalizzare la situazione e stabilisce a tavolino una codifica “standard” per il cirillico, che è completamente differente da tutti e cinque i metodi precedentemente visti e che per questo motivo è generalmente ignorata. Il risultato pratico di questa selva di incomprensioni e piccole rivalità è che oggi chi voglia creare una pagina Web visibile dal cento per cento dei russi è costretto a realizzarla sei volte: una per ciascuna delle codifiche. La soluzione? Bisognerebbe adottare Unicode, un super-codice esteso che comprende non 256 ma 65.536 caratteri: 10.236 simboli alfanumerici standard (come la frazione "un mezzo" o il pallino ° che usiamo per i gradi) e lettere (di tutti gli alfabeti). Comprende anche 27.786 ideogrammi per le lingue dove a un singolo segno corrisponde una parola. Peccato che sia supportato solo nei sistema operativi più recenti, come Mac OS X e Windows XP. Eppure, Unicode è l’unico metodo standard per gestire le lingue che ISO non standardizzò nel 1994, come il cinese o le lingue indiane come quelle citate all’inizio dell’articolo.
Tutto sommato, forse sarebbe più semplice mandare il capo a quel paese e cercarsi un altro posto di lavoro.


Questo articolo fa parte di uno dei miei percorsi. Se vuoi saperne di più su questo argomento, visita il resto del percorso cliccando qui.