DI RECENTE ACCOMAZZI...
CERCA
» Ricerca avanzata
MAILING LIST

Se vuoi iscriverti alla mailing list di Luca Accomazzi inserisci qui la tua mail:

Vuoi ricevere i messaggi immediatamente (50 invii / giorno) o in differita e in gruppo
(due invii / giorno)?

» Vuoi saperne di più?

Sintesi vocale nel 2003

Si è svolto durante il mese di ottobre, nella città di New York, la nona edizione dell’annuale incontro SpeechTEK: un evento che riunisce aziende e programmatori specializzati nel campo della sintesi vocale. SpeechTEK ha una forte componente commerciale, una fiera campionaria in cui i produttori di programmi che parlano e ascoltano cercano acquirenti per le loro tecnologie, ma anche un aspetto scientifico, in cui i ricercatori si confrontano e discutono le più recenti tecniche e idee del ramo.
Secondo l’organizzatore dell’evento, James Larson, “dobbiamo abbandonare la fiducia malriposta nell’idea che un calcolatore possa davvero capirci, o che noi possiamo intrattenere una conversazione significativa con una macchina. Fatto ciò, le nuove tecnologie nel campo della sintesi vocale sono assolutamente stupefacenti”. Alcuni dei nuovi prodotti mostrati nei padiglioni, in effetti, fanno pensare ai fantascientifici “cervelli elettronici” che la fantascienza degli anni Cinquanta aveva immaginato, ma a detta dei progettisti si tratta esclusivamente di astuzie tecnologiche. Un calcolatore che ascolta attraverso la linea telefonica le richieste di un consumatore e poi gli offre una risposta pertinente, tipicamente non è altro che un repositorio di suoni organizzati per parole chiave (cioè, una registrazione di tutti i nomi di tutti i prodotti, più parole come “guasto”, “assistenza”, “intervento”, “riparazione”, “installazione”, “fattura” eccetera). Il sistema si limita a confrontare i suoni emessi dal consumatore con quelli che ha in memoria: se riconosce “installazione” e “pincopallo” trasmetterà in risposta sulla linea telefonica una registrazione in cui viene spiegato agli acquirenti del prodotto pincopallo come toglierlo dalla scatola e cominciare a utilizzarlo.
L’effetto però è prodigioso: e così a SpeechTEK si sono visti sportelli bancomat senza tastiera e schermo che colloquiano a voce con il risparmiatore, telefoni cellulari senza tastiera (utilissimi per chi ha mani grandi ma vuole un telefonino piccolissimo), IBM ha presentato una versione del suo sistema WebSphere che permette di inserire un colloquio a voce tra il navigatore di Internet e il sito web. La manifestazione si è chiusa con una sfida: gli sviluppatori intervenuti dovevano realizzare entro otto ore un calcolatore che, attraverso domande mirate, guidasse a voce un automobilista e gli permettesse di diagnosticare un qualsiasi guasto alla vettura. Uno dei concorrenti ci è riuscito, inserendo ben trecentosettantotto possibili guasti nel sistema.


Questo articolo fa parte di uno dei miei percorsi. Se vuoi saperne di più su questo argomento, visita il resto del percorso cliccando qui.