ŠTEFÁNIK, Michal a Petr SOJKA. Towards Domain Robustness of Neural Language Models. In Horák, Rychlý, Rambousek. Recent Advances in Slavonic Natural Language Processing (RASLAN 2021). Brno: Tribun EU, 2021, s. 91-103. ISBN 978-80-263-1670-1.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Towards Domain Robustness of Neural Language Models
Autoři ŠTEFÁNIK, Michal (703 Slovensko, garant, domácí) a Petr SOJKA (203 Česká republika, domácí).
Vydání Brno, Recent Advances in Slavonic Natural Language Processing (RASLAN 2021), od s. 91-103, 13 s. 2021.
Nakladatel Tribun EU
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10200 1.2 Computer and information sciences
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW Full text PDF Domovská stránka workshopu
Kód RIV RIV/00216224:14330/21:00123248
Organizační jednotka Fakulta informatiky
ISBN 978-80-263-1670-1
ISSN 2336-4289
Klíčová slova anglicky Generalization; Debiasing; Domain extrapolation; Domain adaptation; Domain robustness; Neural language models
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 15. 5. 2024 10:24.
Anotace
This work summarises recent progress in generalization evaluation and training of deep neural networks, categorized in data-centric and model-centric overviews. Grounded in the results of the referenced work, we propose three future directions towards reaching higher robustness of language models to an unknown domain or its adaptation to an existing domain of interest. In the example propositions that practically complement each of the directions, we introduce novel ideas of a) dynamic objective selection, b) language modeling respecting the token similarities to the ground truth and c) a framework of additive component of the loss utilizing the well-performing generalization measures.
Návaznosti
MUNI/A/1573/2020, interní kód MUNázev: Aplikovaný výzkum: vyhledávání, analýza a vizualizace rozsáhlých dat, zpracování přirozeného jazyka, umělá inteligence pro analýzu biomedicínských obrazů.
Investor: Masarykova univerzita, Aplikovaný výzkum: vyhledávání, analýza a vizualizace rozsáhlých dat, zpracování přirozeného jazyka, umělá inteligence pro analýzu biomedicínských obrazů.
VytisknoutZobrazeno: 23. 8. 2024 21:15