DENISOVÁ, Michaela a Pavel RYCHLÝ. When Word Pairs Matter - Analysis of the English-Slovak Evaluation Dataset. In Horák, Rychlý, Rambousek. Proceedings of the Fifteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2021. Brno: Tribun EU, 2021, s. 141-149. ISBN 978-80-263-1670-1.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název When Word Pairs Matter - Analysis of the English-Slovak Evaluation Dataset
Autoři DENISOVÁ, Michaela (703 Slovensko, garant, domácí) a Pavel RYCHLÝ (203 Česká republika, domácí).
Vydání Brno, Proceedings of the Fifteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2021, od s. 141-149, 9 s. 2021.
Nakladatel Tribun EU
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10200 1.2 Computer and information sciences
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW Domovská stránka workshopu Plný text
Kód RIV RIV/00216224:14330/21:00123252
Organizační jednotka Fakulta informatiky
ISBN 978-80-263-1670-1
ISSN 2336-4289
Klíčová slova anglicky Cross-lingual word embeddings; Ground truth dictionary; Evaluation; English; Slovak
Změnil Změnila: Mgr. Michaela Denisová, učo 449884. Změněno: 16. 1. 2024 09:18.
Anotace
Cross-lingual word embeddings facilitate the transfer of lexical knowledge across languages, and they are mainly used for finding transla- tion equivalents. Translation equivalents obtained in this way are usually evaluated with the help of ground truth dictionaries. However, the evalu- ation process, including the ground truth dictionaries, differs from model to model, impeding the correct interpretation of the results. Therefore, in this paper, we provide a thorough analysis of the English-Slovak ground truth dictionary and employ our analysis in evaluating two cross-lingual word embedding models. We show that word pairs choice is an important factor when accurately reflecting the model’s performance.
Návaznosti
LM2018101, projekt VaVNázev: Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy (Akronym: LINDAT/CLARIAH-CZ)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, LINDAT/CLARIAH-CZ - Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy
VytisknoutZobrazeno: 25. 4. 2024 08:37