(107) Euskarazko lehen C1 ebaluatzaile automatikoa

Ekhi Azurmendi1, Xabier Arregi1, Oier Lopez de Lacalle1
1HiTZ Center -- Ixa, University of the Basque Country (UPV/EHU)

Laburpena

Artikulu honetan euskarazko idazlanek C1 maila duten edo ez zehazten duen ebaluatzaile automatiko bat garatu dugu. Sistema elikatzeko HABE eta HiTZ arteko hitzarmenaren bitartez lortutako transkribatutako 10.000 idazlan erabili dira. Idazlanen gaiak eduki dezaketen eragina aztertzeko entrenamenduak bi eratara diseinatu ditugu, epealdi bakarreko testuak bakarrik erabilita eta bi epealdietakoekin. Oinarri lerroak finkatzeko euskarazko bi Hizkuntza Eredu (HE), RoBERTa eta Latxa, ereduak entrenatu ditugu, eta ondoren datu eskasiari aurre egiteko, sistemaren gaindoitzea ekiditeko eta errendimendua hobetzeko teknika ezberdinak landu: EDA, SCL eta erregulazioa. Azkenik, sistema ezberdinen portaeren analisiak burutu ditugu, ereduen kalibrazioa eta artefaktuen eragina neurtzeko.

Gako-hitzak: adimen artifiziala, ikasketa automatikoa, hizkuntza ereduak, idazlanen kalifikazio automatikoa