Originariamente pubblicato in data 28/10/2005
A
C
C
O
M
A
Z
Z
I
Archiviazione: non mettetela in soffitta
Archiviazione: non mettetela in soffitta
Per un privato cittadino, la necessità di archiviare informazioni può sembrare un problema da poco. Per le aziende è un dovere e una potenziale risorsa: ma dannatamente problematica
Per un privato cittadino, la necessità di archiviare informazioni può sembrare un problema da poco. Tutti noi abbiamo in casa qualche raccoglitore di materiale assortito: fatture pagate, estratti conto conservati per il caso di contestazioni con la banca, i libretti di istruzione degli elettrodomestici. Molti genitori poi amano conservare disegni o testi scritti dai figli piccoli, per commuoversi e occasionalmente imbarazzare la progenie dopo una ventina d'anni; e, naturalmente, quasi tutti hanno un cassetto pieno di fotografie da qualche parte.Per le aziende, la necessità è meno romantica, ma a volte altrettanto affascinante. Lo scrivente ricorderà per tutta la vita la visita agli archivi di una società agro-chimica dalla storia più che centenaria: stanze piene di documenti vergati al pennino, disegni e schemi strabordanti dalle scaffalature. Le moderne imprese ricorrono ovviamente al calcolatore (e, come nel caso citato, devono poi risolvere il grattacapo costituito dagli archivi cartacei storici) ma devono sottostare a obblighi di legge precisi e necessità operative che, a ben riflettere, appaiono impressionanti. Prendete ad esempio l'industria aeronautica. Nel 1935 la Douglas produsse i primi velivoli DC-3. Settant'anni dopo, alcuni aerei di quel tipo sono ancora in cielo, e alcuni componenti del resto furono riutilizzati nel modello DC-5 prodotto dagli anni Cinquanta: quindi possiamo aspettarci che la documentazione relativa possa essere ancora rilevante per la sicurezza di alcune vite umane almeno per altri venti anni. Nel frattempo l'azienda si è fusa nella McDonnell Douglas, che è stata acquisita dalla Boeing...
Gli archivi cartacei di una volta temevano soprattutto la confusione, la perdita di leggibilità e gli incendi, ma gli archivi informatici d'oggigiorno non sono certo a prova di bomba. La superficie magnetizzata di un nastro non dura certo in eterno, e i CD incisi sui personal computer temono sia la luce che il calore (quelli industriali sono, invece, resistenti al primo fattore). Un problema più grave e più subdolo è l'obsolescenza dei formati: e anche in questo caso permetteteci un esempio personale. Lo scrivente redasse nel 1988 la sua tesi di dottorato in informatica utilizzando il sistema di videoscrittura Microsoft Word versione 3.0. Anche se i dischi sono ancora leggibili e anche se il programma esiste ancora oggi, i documenti sono inutilizzabili: la versione corrente di Microsoft Word infatti non è in grado di leggere i documenti prodotti dal suo antenato diretto, ma solo quelli redatti con la versione 6.0 o successiva. Sul mercato c'è anche di peggio: il programma che questo quotidiano utilizza per impaginare le sue edizioni è, da sempre, in grado esclusivamente di leggere i documenti creati con la versione corrente e con la versione immediatamente precedente. La redazione dunque per mantenere copie elettroniche leggibili dei numeri usciti deve esportarle, ogni giorno, in formati standard più duraturi, come lo HTML usato su Internet o il PDF.
In Building the 100 year archive, uno studio pubblicato durante la scorsa estate, la Forrester Research (una tra le più stimate società statunitensi di ricerca nel settore informatico) paragona la situazione addirittura all'accumulazione di scorie nucleari: i dati si accumulano e tutti sperano che venga inventata una soluzione alternativa prima che la situazione divenga insostenibile.
Alcune forme di documenti digitali sono più resistenti di altre al passaggio dei decenni. Il testo puro stipato nei primi calcolatori commerciali degli anni Cinquanta, per esempio, è leggibile ancor oggi dai moderni sistemi se le antiche schede perforate vengono convertite a odierni dischi rigidi. Più problematici sono i database, come per esempio le anagrafi comunali, e un problema aperto è costituito dai documenti CAD, ovvero i progetti architettonici di edifici e strade. La Forrester consiglia una serie di strategie alle aziende sue clienti: adottare ove possibile i programmi e i sistemi open source, come il famoso Linux, che tendono a favorire formati aperti e ben documentati degli archivi; aderire a iniziative globali per la conservazione degli archivi digitali, come il progetto OAIS nato per iniziativa NASA; indicizzare i documenti conservati utilizzando sistemi consolidati e frutto di standard internazionali come RDF, mantenendo gli indici fisicamente distanti dagli archivi stessi.
Alcuni problemi sono più sottili ma non meno delicati. Gli straordinari fotomontaggi digitali e gli effetti speciali che tutti noi siamo ormai abituati a vedere nelle pubblicità e nei film ci dimostrano che con i calcolatori è facile forgiare alterazioni di testi, foto e filmati: anche senza scomodare visioni orwelliane in cui le dittature alterano i documenti storici per insegnare ai propri cittadini una storia passata che non è mai avvenuta, è chiaro che bisogna impedire a potenziali malfattori di alterare gli archivi informatici per coprire le tracce di comportamenti contro la legge. La soluzione in questo caso si chiama "firma digitale": i documenti originali vanno "chiusi" dall'autore responsabile e attraverso un meccanismo informatico chiamato hashing vanno corredati di una breve scrittura che ne certifica data e ora di redazione e identità dell'autore. Per fare un esempio concreto, ecco una firma digitale di questo articolo ottenuta con il programma "PGP": un calcolatore può usarla per verificare che l'articolista sia davvero la persona che lo firma e per controllare che la redazione del giornale non ne abbia cambiato neppure una virgola:
iQA/AwUBQ1tNZG01QY9fQW8qEQIePwCgmFL70/VYdFgBrD1ITX0K9a2vXtAAoLNdFvr2ZubXmRycepOTDlMjU824=ZnHN
Agli occhi di un uomo la firma digitale sembra una sequenza di segni alfanumerici senza senso, ma essa risolve il problema e richiede relativamente poco spazio se confrontata al testo originale.