(70) Molekulen propietateen iragarpena sare neuronalen bitartez datu urritasun egoeretan

Amaia Elizaran1, Gustavo Ariel Schwartz2
1Centro de Física de Materiales (CSIC-UPVEHU), 2Centro de Física de Materiales (CSIC-UPV/EHU)

Laburpena

Molekulen egitura kimikotik abiatuta haien propietateak iragartzen dituen sare neuronal errepikari (RNN) bat aurkezten dugu. Egitura kimikoak SMILES errepresentazio molekularrarekin kodifikatzen ditugu sareko sarrera datu bezala erabiltzeko. Oro har, sare neuronal artifizialek emaitza onak ematen dituzte datu askorekin entrenatzen direnean, baina arazoak izaten dituzte datu urritasun egoeretan. Beraz, lan hau datu urritasun egoeretan zentratua dago eta horri aurre egiteko hainbat bide aztertu ditugu. Gure hipotesiaren arabera, algoritmoa antzekoak diren datuekin entrenatuz gero, emaitzak hobetu egingo lirateke. Horrela, datuen arteko mota ezberdinetako antzekotasunak aztertu ditugu; hala nola, SMILES-en arteko antzekotasunei, bai eta ezaugarri bektoreen arteko antzekotasunei erreparatu diegu.

Gako-hitzak: RNN, SMILES, datu urritasuna