(110) Euskara eta gaztelaniazko kontra-narratiben sorkuntza: datuen sorrera eta ebaluazioa
Laburpena
Kontra-narratibak (KN) gorroto-diskurtsoen (GD) erantzun ez-negatiboak dira, online gorrotoa eta haren hedapena murrizten laguntzen dutenak. Sare sozialetan GDaren presentzia hazi den arren, KNen sorkuntza automatikoari buruzko ikerketa mugatua da oraindik, eta egindako lan gehienak ingeleserako izan dira. Artikulu honek CONAN-EUS aurkezten du, euskarazko eta gaztelaniazko KNen sorkuntzarako datu-multzoa, Itzulpen Automatikoa (IA) eta post-edizio profesionala erabiliz sortua. Ingelesezko CONAN datu-multzoaren corpus paralelo gisa, hizkuntza anitzeko eta hizkuntza arteko KNen sorkuntzan ikerketa ahalbidetzen du. mT5 hizkuntza ereduarekin egindako esperimentuetan ikusten da post-editatutako datuek KNen sorkuntza-kalitatea hobetzen dutela. Eskuzko ebaluazioak baieztatu du datuen eskuzko berrikusketa beharrezkoa dela. Hizkuntza anitzeko datu-gehikuntzak gaztelaniari mesede egiten dio, baina ez euskarari, hizkuntza anitzeko eredu sortzaileen erronkak agerian utziz.