Itziar Cortes: “Etorkizun hurbil bat irudikatzea hizkuntza teknologietan zaila da”

Itziar Cortes: “Etorkizun hurbil bat irudikatzea hizkuntza teknologietan zaila da”

Miren Garate

Elhuyarrek eta Donostia Kulturak Emakume zientzialarien argitan solasaldi zikloa antolatu dute, emakume zientzialariak ezagutarazteko. Hiru saio izango dira, eta asteartean izango da lehena: Itziar Cortes Etxabe (Zarautz, 1985) informatika ingeniari eta Elhuyarreko Hizkuntza eta Teknologia unitateko koordinatzaileak Hizkuntzak aro digitalean hitzaldia emango du. Ernest Lluch kultur etxeko areto nagusian izango da, 19:00etan. Beste bi saioak apirilaren 18an eta maiatzaren 16an izango dira, eta, hurrenez hurren, Marian Iriarte Ormazabal EHUko Kimika Fakultateko dekanoak eta Aiora Zabala Aizpuru Ekonomia Ekologikoan doktoreak parte hartuko dute.

Hizkuntzak aro digitalean hitzaldia emango duzu asteartean, eta, besteak beste, hizkuntza teknologien arloko erronkak izango dituzu hizpide. Zer landuko duzu hitzaldian?

Nire ikuspegia emango dut euskarak eta hizkuntza teknologiek gaur egungo gizartean daukaten eragin edo garrantziaz. Adibidez, aipatuko dut euskarak zergatik egon behar duen mundu digitalean. Gaur egun, euskarak indar handia du arlo horretan, baina gehiago behar du, beste hizkuntzek gain ez hartzeko.

Elhuyarreko Hezkuntza eta Teknologia alorreko koordinatzailea zara. Zuen proiekturik ezagunenetako bat itzultzaile automatikoa da (Elia.eus). Euskarak arlo digitalen dituen erronka guztien artean hura garatzea jo duzue lehentasuntzat?

Ni orain dela hamalau urte hasi nintzen Elhuyarren lanean, eta itzultzaile automatikoarekin hasi nintzen. Garai hartan ikerketan hasi nintzen, ikerketan boladan zeuden teknikak aplikatzen. Gaur egun, jada teknika horiek ez dira erabiltzen. Itzulpen automatikoak zer bide egin duen ikusi dut. Googlek itzulpen automatiko neuronala atera zuen 2016an, eta guk 2018an merkaturatu genuen gure lehen itzultzailea. Abangoardia horretan egoten saiatu gara. Itzultzaile automatikoa izan da, agian, gure produktu ikusgarriena, baina beste hainbat ere baditugu.

Zein, adibidez?

Orain dela aste batzuk aurkeztu genuen ahotsa sortzeko sistema (Ttsneuronala.elhuyar.eus), sintesirakoa, eta euskaraz funtzionatzen du. Testua ahots bihurtzeko sistema bat da; hau da, beste hizkuntza teknologia bat. Aurretik ere bagenituen itzulpen automatikoko sistemak eta ahotsak sintetizatzeko sistemak, baina azken teknikak erabiltzen saiatzen gara, adimen artifizialean oinarritutakoak; horri esker, sistema askoz hobeak izatea lortzen dugu, eta, ondorioz, hobeto sartzen dira gizartera, eta gehiago erabiltzen dira.

Etorkizunera begira, zein izan daitezke lehentasunak hizkuntza teknologietan?

Etorkizun hurbil bat irudikatzea oso zaila da. 2022 amaieran, beste boom handi bat etorri zen: ChatGPT. Sare neuronaletan oinarritutako modelo batzuk dira, aurrez entrenatuak eta asko dakitenak. Elkarrizketa bat sortzeko gaitasuna dute, ulertu egin dezakete, hizkuntza horretan erantzunak sortzen dituzte, eta testuak sortu, laburtu eta aztertzeko erabiltzen dira. Jada oso ondo funtzionatzen dute hizkuntza handietan, baina, adimen artifizialeko beste sistema guztiek bezala, alborapenaren arazoa ere hor dago: generoari, arrazari eta abar lotutako alborapena sortzen da. Ezin dugu guztia sistema horien mende utzi.

Zer arrisku ikusten dizkiozu sistema horri?

Hilabete gutxi daramatza martxan, baina batzuek jada hari galdetzen dizkiote zalantzak, bilatzaileetan integratzen ari dira… Adimen artifizialak dituen erantzunak egia absolutua dira? Horrelako galderak egin beharko genizkioke geure buruari. AEBetako informazioarekin bakarrik baldin badago entrenatuta, badakigu zer informazio emango digun. Komeni da ikertzea eta garatzea, eta euskararako propio egindako sistemak lortzea, nolabaiteko burujabetza teknologikoa izateko. Bestela, erraldoien esku geratzen zara; batez ere hizkuntza txikiak.

Esaten da arlo digitalean ez dagoela euskara erabiltzeko ohitura handirik.

Ohiturak sortzeko, euskarazko sistemak behar ditugu: nire telebistak ez badu ulertzen euskaraz, gaztelaniaz edo ingelesez egin beharko diot; ulertzen badu, euskaraz egingo diot. Zirkulu bat da. Elhuyarren aukera horiek sortzeko lanean ari gara. Adibidez, euskaraz ulertuko duen bozgoragailu adimendun bat sortzeko proiektu bat daukagu. Tokiko informazioa emango du, eta abar. Egun, bozgoragailu adimendunek ez dute euskara ulertzen.

Horrelako proiektuak garatzeko arazoetako bat merkatu kuota izango da, ezta?

Batetik, datuen arazoa dago: horrelako sistemak sortzeko datu multzo handiak behar dira, eta euskaraz ez dauzkagu hainbeste. Beraz, euskararako propio sortutako algoritmoak edo teknikak aplikatu behar izaten ditugu, edo datu gutxirekin ahalik eta emaitzarik onenak lortzen saiatu. Bestetik, erabilera ere txikiagoa da beste hizkuntzekin alderatuta.

Emakume zientzialariak ezagutzea da Emakume zientzialarien argitan zikloaren helburua. Informatika ingeniaria zara. Zer bide egin duzu orain arte?

Elhuyarren egin nuen karrera bukaerako proiektua, eta hor ezagutu nuen zer zen hizkuntzaren azterketa, zer ziren hizkuntzaren teknologiak… Asko interesatu zitzaidan, eta master bat egin nuen hizkuntzaren azterketan eta prozesamenduan. Elhuyarren, ikertzaile eta garatzaile aritu nintzen hasieran, eta 2020tik, kudeaketan eta zuzendaritzan ari naiz.

Emakume informatikari gehiago dago gaur egun?

Oraindik ere emakume gutxik aukeratzen dute karrera hori.

Etengabe aldatzen da teknologia. Alde horretatik, nekagarria da zuen lana?

Intentsoa eta interesgarria da. Guretzat kritikoa da egunean egotea, bai ikerketan, bai garapeneko azken kontuetan. Oso teknologia berriekin iritsi nahi dugu gizartera eta bezeroengana, eta, horrenbestez, oso adi egon behar dugu beti.

Leave a Reply

Your email address will not be published.