Lander Muñagorri Garmendia / 2014-05-06 / 1.147 hitz
EHUko Aholab ikerketa taldeak ahots bihurgailu bat garatu du, BERRIAren webgune berrituan albisteak irakurtzeko gai izango dena. Kazetaritzaren narrazio estiloan irakurriko duen lehena da.
Ordenagailu bat ari da hizketan pertsona baten ordez. Sarean jarritako albiste bat irakurtzen ari da, baina ez da metalezko ahots mekanikorik entzuten. Atzean geratu da makinen mintzaira halakoa zen garaia, eta egun giza ahotsa entzun daiteke. Hori gertatzen da, bederen, BERRIA egunkariak beta prozesuan jarrita daukan Beta.berria.info webgune berrian. Izan ere, azken uneko albisteak irakurtzeko aukeraz gain, horiek entzuteko aukera ere ematen du sareko atariak. Baina albistea ez du pertsona batek irakurtzen, EHUko Aholab ikerketa taldeak garatutako ahots sintetizatzaile batek baizik. «Teknika oso abanguardista erabili dugu horretarako», azaldu du Inma Hernaez Aholabeko arduradunak. Gainera, inguruko hedabideetan «parekorik ez duen» zerbitzua da. Aplikazio horrek, beraz, «eskuak edo begiak okupatuta eduki arren ere» albisteak entzuteko aukera emango dio erabiltzaileari.
Azken hogei urteetan esparru hori lantzen aritu da laborategia, hau da, testu bat irakurtzeko gai izango den sintetizatzaile edo ahotsak lantzen. Horrela garatu zuten, esaterako, euskarazko lehenengo ahots bihurgailua. Beraz, une honetan martxan dagoen programa azken hogei urteetako lanketaren ondorio dela nabarmendu du Hernaezek. Esperientzia hori guztia klik bakar batean laburbil daiteke. BERRIAren albiste batean sartzearekin batera, ordenagailuko pantailan bozgorailu baten irudia azaltzen da, eta, bertan sakatuta, albiste hori entzun daiteke. «Gure laborategia ikerketan aritzen da batez ere, baina BERRIAk proposamen interesgarria egin zigun, aplikazio oso bat garatzeko eskatu baitziguten». Gustura dago orain arteko ikerketek aplikazio zehatz bat eduki dutelako.
Ordenagailuko aplikazioak giza ahotsarekin irakurtzen du testu hori, eta horren atzean lan handia dagoela aitortu du Aholabeko arduradunak. Horretarako, lehen pauso gisa arau linguistikoak zeintzuk izan behar diren zehazten diote aplikazioari. Alegia, sintetizatzaileari hizkuntzak dituen bereizgarriak azaltzen dizkiote, eta, horretarako, hizkuntzaren corpusa zehaztu beharra dauka ikerketa taldeak. Izan ere, ahots bihurgailuak jakin behar du soinu kate bat sortzeko hizkuntza horretan zein azentu erabiltzen den. «Soinu bati hitzaren lehen silaban azentua edukitzea dagokio agian, baina hitz hori bera esaldiaren leku batean edo bestean egon, doinu ezberdina dagokio». Horregatik, Hernaezek dio lehen fase hori dela garrantzitsuena, esaldiak zein eratan irakurri behar diren zehaztu behar baitzaio programari.
Kazetaritza narratiboa
Aplikazio honetan, gainera, lehen pauso hori oso konplexua izan dela adierazi du Hernaezek, «egunkari bateko hizkuntza oso aberatsa delako». Besteak beste, atzerriko pertsonen izen-abizenak, siglak, zenbakiak eta kirol emaitzak irakurtzeko moduak nolakoa izan behar duen azaldu behar izan dutelako. Baina, horrez gain, berezitasun bat ere sartu diote: kazetaritzaren ezaugarri narratiboetara egokitu dute irakurketa. Orain arteko ahots sintetizatzaileek testua esaldika irakurtzen zuten. Aholaben lanketarekin, ordea, «ahotsak parrafo osoa irakurtzen du». Beste era batera esanda, doinua nola eman eta irakurketaren jarraipena egiteko modu berri bat landu dute. «Guretzat oso zati polita izan da hori, berritzailea delako, eta erronka baten moduan hartu dugu».
Hori horrela izan dadin, gainera, ereduak ere hartu dituzte. Hain zuzen ere, ETB1eko albistegietako hainbat bideo aztertu dituzte Aholabeko laborategian, eta melodia eredu estatistikoaren arabera ikertu. Doinuaren gorabehera zein izaten den ikusi dute horrela, eta kazetaritzaren ezaugarri narratiboak zeintzuk diren estatistikoki landu. Martxan jarritako ahots bihurgailuak, beraz, albistegietako doinuarekin irakurtzen ditu BERRIAko webgunean jarrita dauden albisteak. «Albisteak irakurtzeko doinu egoki bat behar da, eta hori lortu nahi izan dugu kasu honetan».
Ahotsa grabatzen
Programak izan beharko lituzkeen arau linguistikoak zeintzuk diren zehaztu ondoren, seinale akustikoak grabatu zituzten. Kasu honetan, 2.000 esaldi artean irakurri behar izan dituzte bi hizlari profesionalek. «Ahotsaren tonua eta abiadura berdin mantentzen saiatu behar dute». Eta, horregatik, oso prozesu nekagarria izan dela aitortu du Hernaezek.
Behin grabaketa horiek egin ondoren, ordenagailuek esaldi horiek moztu egiten dituzte, parametro akustiko batzuen arabera. Eta hortik parametro horiek testuarekin elkartzen ditu aplikazioak. «Iraganean, silaba eta soinu ezberdinak hartzen zituzten ahots sintetizatzaileek, eta bata bestearen atzetik itsasten zituen». Aholab ikerketa taldeak garatu duen proiektua, ordea, horretan ere berritzailea izan da. «Orain, ahotsa sortzeko metodoa ez da zuzenean uhina hartu eta batea bestearen ondoren itsasten den prozesu etengabe bat; parametro akustikoak kalkulatu, eta hortik sortzen dugu uhina». Alegia, aurretik landutako corpusa kontuan hartzen du zein doinu eman behar zaion jakiteko.
Horren ondorioz, azken proiektu horren ahots uhin naturalago bat lortu dela nabarmendu nahi izan du Hernaezek. «Une honetan puntan dagoen aplikazio bat da», esan du. BERRIAko webgunean kargatuko diren albisteak euskara batuan irakurriko ditu aplikazioak, eta ildo horretan bakarra ere bada. Edonola ere, Aholabeko arduradunak argi utzi nahi izan du proiektuko ahotsa ez dela pertsona jakin batena, hainbat pertsonak egin dituzten grabazioen artetik sortutako ahots sintetiko bat baizik. «Beraz, inorena ez den ahots batek irakurriko ditu albisteak». Inorena eta era berean denena den ahots batek, hain zuzen ere. Abian da albisteak irakurtzeko espresuki sortu den ahots berria.
—————————–
Galdu diren ahotsak berreskuratzeko
Aholab ikerketa taldeak ahots banku bat sortu du, ahots bihurgailu bat behar duten pertsonei sintetizatzaile bat emateko. Horretaz gain, Iparraldeko euskalkiak bilduko dituen sintetitzatzailea ere ari da lantzen.
Aholab ikerketa taldeak BERRIA egunkariko webguneko albisteak irakurriko dituen aplikazio berri bat sortu du, baina Inma Hernaez bertako arduradunak argi utzi nahi izan du euren esparrua ikerketarena dela batez ere. Eta, ildo horretan, ahots sintetizatzaile berri honen teknologia aprobetxatu ahal izan dute, ikerketa arloan sakontzeko aukera eman diolako laborategiari. Horien artean dago, esaterako, ahots bankuaren proiektua. Nahi duen orok norberaren ahotsa eman diezaioke egitasmoari, ondoren berarekin ahots sintetizatzaile bat sortzeko. Hau da, eskatzen duen orok bere ahotsaren ahots bihurgailu digital bat eduki ahal izango du. «Horrek aplikazio ugari izan ditzake; istripu baten ondorioz ahotsa galdu duen pertsona batek bere ahots propioa edukitzea, esaterako».
Prozesu hori posible izan dadin, hainbat ahotsekin sortutako ahots sintetiko bat sortuta daukate Aholab laborategiko kideek. BERRIAko albisteak irakurriko dituen ahotsa ere halakoa da. Behin batez besteko edo ahots sintetiko hori lortu ondoren, www.aholab.ehu.es/zure_tts webgunean ahotsa eman ahal izango du hala nahiko lukeenak. «Ahots sintetiko horri ahots berriaren tonua eta bereizgarriak emateko aukera dago», azaldu du ikerlariak.
Hori da Jesus Aceroren kasua. Bere ahotsa eman dio Aholabeko plataformari, «ikerketan aurrera egiteko ardura» zuela pentsatu zuelako. «Gainera, nire ahotsa beharko lukeen edozeini ematea ez zait batere arrotza egiten». Ahotsa eman eta handik hilabete batzuetara jaso dezake erabiltzaileak bere ahotsaren bertsio digitala.
Iparraldeko ahoskeraren bila
Orain arteko saio guztiak euskara batuarekin egin dituzte Aholab laborategiko ikerlariek, baina ahots sintetiko berri bat sortzen ari dira Baionako Iker enpresarekin batera. Iparraldeko euskalkien bereizgarriak bilduko lituzkeen batez besteko ahots bat sortzea litzateke helburua. «Prozesu konplexua izan da, doinu ezberdinak baitauzkate», Hernaezen arabera. Corpus berezi bat landu behar izan dute horretarako. Herria aldizkariko zenbait testu hartu dituzte, baita beste zenbait webgunetakoak ere. Bilketa lan hori amaituta, denetara 4.000 esaldi grabatu dituzte, eta prozesua azaroan amaituko dela aurreikusten du ikerlariak.
Grabaketa horietan parte hartu du, besteak beste, Arantza Idieder Euskal Irratietako esatariak. «Grabaketak gogorrak izan dira, bi eta hiru ordu artean irauten baitzuen, eta tonu estandarrean egin behar izatea oso nekagarria izan da». Iparraldeko euskalkia orain arte erregistratu gabe egon delako aurrerapauso handia izan daitekeela ere uste du, eta etorkizunean ahots sintetikoak garatzeko aukera aberasgarria izango dela nabarmendu. Orain arte ordenagailuek euskara batuan hitz egin zuten soilik, baina etorkizunean Iparraldeko azentua ere eduki ahal izango dute gailu elektronikoek.