(110) Euskara eta gaztelaniazko kontra-narratiben sorkuntza: datuen sorrera eta ebaluazioa

Jaione Bengoetxea1, Itziar Gonzalez-Dios1, Rodrigo Agerri1
1HiTZ Basque Center for Language Technology - Ixa, University of the Basque Country UPV/EHU

Laburpena

Kontra-narratibak (KN) gorroto-diskurtsoen (GD) erantzun ez-negatiboak dira, online gorrotoa eta haren hedapena murrizten laguntzen dutenak. Sare sozialetan GDaren presentzia hazi den arren, KNen sorkuntza automatikoari buruzko ikerketa mugatua da oraindik, eta egindako lan gehienak ingeleserako izan dira. Artikulu honek CONAN-EUS aurkezten du, euskarazko eta gaztelaniazko KNen sorkuntzarako datu-multzoa, Itzulpen Automatikoa (IA) eta post-edizio profesionala erabiliz sortua. Ingelesezko CONAN datu-multzoaren corpus paralelo gisa, hizkuntza anitzeko eta hizkuntza arteko KNen sorkuntzan ikerketa ahalbidetzen du. mT5 hizkuntza ereduarekin egindako esperimentuetan ikusten da post-editatutako datuek KNen sorkuntza-kalitatea hobetzen dutela. Eskuzko ebaluazioak baieztatu du datuen eskuzko berrikusketa beharrezkoa dela. Hizkuntza anitzeko datu-gehikuntzak gaztelaniari mesede egiten dio, baina ez euskarari, hizkuntza anitzeko eredu sortzaileen erronkak agerian utziz.

Gako-hitzak: kontra-narratibak, gorroto-diskurtsoa, eleaniztasuna, testu sorkuntza