DI RECENTE ACCOMAZZI...
CERCA
» Ricerca avanzata
MAILING LIST

Se vuoi iscriverti alla mailing list di Luca Accomazzi inserisci qui la tua mail:

Vuoi ricevere i messaggi immediatamente (50 invii / giorno) o in differita e in gruppo
(due invii / giorno)?

» Vuoi saperne di più?

Suoni e calcolatori

Una percentuale sempre maggiore di calcolatori nasce oggi già dotata di caratteristiche multimediali, e tra queste di altoparlanti, circuiteria audio stereofonica, e microfono. In questo articolo esaminiamo caratteristiche e peculiarità dell'audio su calcolatore. Scopriremo così i vari standard, e i vantaggi e svantaggi di ciascuno.

Un calcolatore è, sotto sotto, uno strumento che macina numeri. Tutti i dati, al suo interno, sono rappresentati con cifre. Non è difficile immaginarsi come sia possibile raffigirare una immagine in maniera numerica (posto rosso uguale a uno, blu uguale a due, verde uguale a tre, eccetera...), ma non è altrettanto semplice capire come il PC possa memorizzare e riprodurre un suono.


La matematica del suono

Un suono nella sua forma più pura è costituito da una onda, come quella visibile in figura 1. Quando un pianista preme il tasto del "do", per esempio, un martelletto preme con forza una corda, che vibra. Le vibrazioni della corda spostano l'aria circostante con fluttuazioni periodiche, e il treno di aria in movimento che raggiunge le nostre orecchie ci offre la percezione auditiva.


Un calcolatore, dunque, potrebbe memorizzare un suono puro, come quello della figura, rappresentandolo come una funzione matematica. Il calcolatore può poi riprodurre il suono attivando la circuiteria del suo altoparlante per generare un'onda sonora il più possibile vicina a quella, astratta, che ha memorizzato in forma matematica.
C'è qualche complicazione. Tanto per cominciare, l'altoparlantino di cui sono dotati tutti i PC al mondo è estremamente limitato, e può generare solo onde sonore sgraziate, le cosiddette "onde quadre", che all'orecchio umano appaiono sgraziate e rumorose.


Così, storicamente, gli utenti di PC hanno dovuto acquistare schede sonore aggiuntive, come la SoundBlaster, per dotare il loro calcolatore della capacità di emettere suoni aggraziati. I calcolatori moderni, come i PC multimediali o i Macintosh, incorporano sin dalla fabbrica una scheda sonora di serie.
Ma c'è di più: il suono di uno strumento reale difficilmente può venire rappresentato con una onda semplice. Il calcolatore deve combinare tra di loro più funzioni matematiche semplici per ottenere una rappresentazione adeguata di un suono complesso. In figura qui sotto vediamo come due suoni semplici (in arancione e in azzurro) possano venire sommati tra loro per ottenere una onda sonora complessa (in violetto).


Quando, però, il suono si fa molto complicato, e varia molto nel tempo, diventa impossibile rappresentarlo in forma puramente matematica. Per esempio, sarebbe praticamente impossibile usare formule matematiche per memorizzare un discorso pronunciato da una voce umana.
Per ottenere questo risultato è necessario trasformare il calcolatore in una specie di registratore digitale. Il suono convertito in forma numerica (di modo che il calcolatore possa manipolarlo) si dice "digitalizzato". Il procedimento è il medesimo che viene usato nei comuni CD audio, e viene spiegato nel prossimo paragrafo.


La digitalizzazione

Per rappresentare un suono qualsiasi al suo interno, il calcolatore ricorre alla digitalizzazione. Il computer memorizza il valore numerico dell'onda sonora a intervalli di tempo regolari. Per esempio, nella figura vediamo come si potrebbe digitalizzare un suono nel periodo di tempo tra 1,5 e 2 secondi (i secondi sono indicati in orizzontale).


Per sei volte (una ogni decimo di secondo) la circuiteria sonora del calcolatore misura la forza dell'onda, e memorizza il risultato in forma numerica, ovvero digitale.
Nel momento 1,5 l'onda misura forza 1,33. Nel momento 1,6 l'onda vale 1,49. Nel momento 1,7 la lettura è di 1,62. Le letture successive riportano 1,74; 1,82; e 1,88. La sequenza dei numeri letti (1,33; 1,49; 1,62; 1,74; 1,82; 1,88) costituisce la rappresentazione digitale del suono.
In un personal computer moderno ben equipaggiato (per esempio, un PC dotato di scheda SoundBlaster di modello recente, oppure un Power Macintosh) la digitalizzazione avviene 44.000 volte al secondo. Quindi, il nostro calcolatore deve memorizzare 44.000 numeri per ogni singolo secondo di suono.
Poiché ogni singola digitalizzazione occupa uno spazio di due byte, questo significa che un secondo di musica, o parlato, ad alta fedeltà, finisce per occupare 88.000 byte di memoria, ovvero 88 chilobyte. Non è poco: un personal computer dotato della non disprezzabile quantità di 16 MB di memoria RAM può consumarla interamente nel tentativo di memorizzare poco più di tre minuti di musica. I conti sono presto fatti: 16 MB equivalgono a sedici milioni di byte (per la precisione, 16.777.216). Dividendo questo valore per 88.000 otteniamo 190. Centonovanta secondi di musica.
Un altro calcolo del genere è illuminante per i patiti della musica. Un disco CD può stipare sino a 650 MB di informazioni: chi esaminasse un CD-ROM, come quelli che PC Pratico regala mensilmente ai suoi lettori, troverebbe infatti che questa è la dimensione di un dischetto argenteo. Facendo i conti, scopriamo che la durata massima di un CD è quella che ci aspettavamo: settantaquattro minuti di musica ad alta fedeltà.
I calcolatori moderni possono ridurre la fedeltà di un suono, dimezzando o riducendo a un quarto il numero di campioni digitali per secondo. Un suono può venire digitalizzato a "soli" 22.000 campioni per secondo, o al limite anche a soli 11.000: le dimensioni del file generato diventano proporzionalmente più piccole.


Compressioni e formati

Come abbiamo visto, un suono digitalizzato occupa moltissimo spazio in memoria e su disco. Non c'è da stupirsi che i programmatori abbiano deciso di comprimere i suoni ogni qual volta possibile. Il nostro lettore ha probabilmente qualche familiarità con le compressioni di tipo Zip, Arj, Lzw e via enumerando: una compressione analoga può venire usata sui suoni digitalizzati, ottenendo compressioni sinoa lla metà delle dimensioni originali.
Ma si può fare di più: se il programmatore è disposto a sacrificare parte della qualità del suono, la compressione può raggiungere valori molto più alti. Prendiamo il caso della voce umana: tutti noi sappiamo che la voce appare distorta durante una trasmissione telefonica, eppure non abbiamo problemi a seguire un interlocutore dall'altro capo della cornetta. Quando il telefono venne concepito, nel secolo scorso, gli ingegneri che lo progettarono pensarono bene di ridurre il numero di suoni che viaggiano lungo il cavo, in modo da poter inviare più conversazioni su un unico cavo. Analogamente, si possono "tagliare" parte delle informazioni sonore per ottnere compressioni migliori. Sui Macintosh, per esempio, la voce umana viene tipicamente compressa con un sistema chiamato MACE-6, che riduce di ben sei volte le dimensioni originarie del suono digitalizzato.


Spartiti e forme d'onda

Sin qui, abbiamo visto due tecniche molto diverse: nella prima un suono è rappresentato nella sua forma matematica. Nella seconda viene registrato. Nel primo caso abbiamo una rappresentazione compatta di un suono semplice. Nel secondo caso abbiamo una rappresentazione ingombrante ma molto flessibile.
È possibile combinare i vantaggi delle due rappresentazioni. Immaginate di digitalizzare il suono del "do" di centro di un pianoforte. I numeri che rappresentano il suono possono venire manipolati per rendere il suono più acuto o più grave di una ottava. La registrazione del "do", dunque, può venire utilizzata per generare molte note differenti. Chi realizzasse una tabella di tutte le note avrebbe così a disposizione tutti i dati sufficienti per creare un piano virtuale (viene normalmente chiamato un "piano campionato", perché abbiamo a disposizione un campione di ciascuna nota). Associando al piano uno spartito possiamo realizzare un programma che suona un brano musicale.


I formati della musica

Su calcolatore esistono molti formati per memorizzare le immagini, ciascuno adatto a qualche scopo particolare. Analogamente, si possono trovare in uso una gran varietà di formati audio: tutti quelli significativi sono riassunti nella tabella di questa pagina. Di ciascun formato abbiamo riportato l'ambiente nel quale è più diffuso, come tratta la campionatura e che tipo di compressione supporti.
Solo due formati, tra tutti qualli riportati, usano il metodo dello spartito e dello strumento campionato: si tratta di MIDI e MOD. MIDI (musical instruments digital interface) è il più importante standard musicale al mondo, che però delega al calcolatore o allo strumento ospite la ricerca della campionatura. MOD è un formato nato sui personal computer della famiglia Amiga e in seguito divenuto molto popolare anche su PC e su Mac.
Tutti gli altri formati contengono un suono digitalizzato. I più importanti sono lo AIFF e il µLaw. AIFF (audio interchange file format) è nato da uno sforzo di Electronic Arts, noto sviluppatore di videogiochi. È stato poi adottato da altri produttori, tra cui Apple Computer che lo ha popolarizzato su Macintosh, il calcolatore oggi più usato dai musicisti professionisti. Apple ha adottato AIFF per la traccia audio all'interno dei filmati QuickTime, e poiché QuickTime è ormai diventato lo standard di fatto per la creazione e distribuzione del multimedia, AIFF è divenuto molto importante anche per il mondo Windows. Ne esiste anche una variante compressa, lo AIFF-C.

FormatoPiattaformaRappresentazione strumentoRappresentazione musicaCompressione
.auSun-DigitalizzataSì
8SVXAmiga-Digitalizzata
AIFFQuickTime-DigitalizzataNo
AIFF-CMacintosh-DigitalizzataSino a 6 volte
IMAInternet-Digitalizzata4 volte
MIDITutte-SpartitoNo
MODTutteCampionatoSpartitoNo
VocSoundBlaster-DigitalizzataNo
WaveWindows-DigitalizzataNo
µ-LawInternet-Digitalizzata2 volte


Questo articolo fa parte di uno dei miei percorsi. Se vuoi saperne di più su questo argomento, visita il resto del percorso cliccando qui.