2021
When Word Pairs Matter - Analysis of the English-Slovak Evaluation Dataset
DENISOVÁ, Michaela a Pavel RYCHLÝZákladní údaje
Originální název
When Word Pairs Matter - Analysis of the English-Slovak Evaluation Dataset
Autoři
DENISOVÁ, Michaela (703 Slovensko, garant, domácí) a Pavel RYCHLÝ (203 Česká republika, domácí)
Vydání
Brno, Proceedings of the Fifteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2021, od s. 141-149, 9 s. 2021
Nakladatel
Tribun EU
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10200 1.2 Computer and information sciences
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
tištěná verze "print"
Kód RIV
RIV/00216224:14330/21:00123252
Organizační jednotka
Fakulta informatiky
ISBN
978-80-263-1670-1
ISSN
Klíčová slova anglicky
Cross-lingual word embeddings; Ground truth dictionary; Evaluation; English; Slovak
Změněno: 15. 5. 2024 09:28, RNDr. Pavel Šmerk, Ph.D.
Anotace
V originále
Cross-lingual word embeddings facilitate the transfer of lexical knowledge across languages, and they are mainly used for finding transla- tion equivalents. Translation equivalents obtained in this way are usually evaluated with the help of ground truth dictionaries. However, the evalu- ation process, including the ground truth dictionaries, differs from model to model, impeding the correct interpretation of the results. Therefore, in this paper, we provide a thorough analysis of the English-Slovak ground truth dictionary and employ our analysis in evaluating two cross-lingual word embedding models. We show that word pairs choice is an important factor when accurately reflecting the model’s performance.
Návaznosti
LM2018101, projekt VaV |
|