2024
Fantastic Examples and Where to Find Them - Compiling Czech Dataset for Evaluating Dictionary Examples
DENISOVÁ, Michaela a Pavel RYCHLÝZákladní údaje
Originální název
Fantastic Examples and Where to Find Them - Compiling Czech Dataset for Evaluating Dictionary Examples
Autoři
DENISOVÁ, Michaela ORCID a Pavel RYCHLÝ
Vydání
Brno, Proceedings of the Eighteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, od s. 37-46, 10 s. 2024
Nakladatel
Tribun EU
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
tištěná verze "print"
Odkazy
Označené pro přenos do RIV
Ano
Kód RIV
RIV/00216224:14330/24:00137913
Organizační jednotka
Fakulta informatiky
ISBN
978-80-263-1835-4
ISSN
Klíčová slova anglicky
Dictionary examples; GDEX; Evaluation
Příznaky
Recenzováno
Změněno: 25. 3. 2025 07:56, Mgr. Michaela Denisová
Anotace
V originále
Examples are an important part of a dictionary entry, helping users better understand the word and its usage in context. However, selecting good examples is a challenging and time-consuming task due to varying selection criteria and the vast amount of data to choose from. While different tools have been developed to address this, evaluation remains flawed and lacks standardisation. In this paper, we compile an evaluation dataset for the Czech language, using the GDEX tool and manual annotations to classify examples and explain the classification. Based on our findings, we propose general annotation guidelines to improve consistency. This dataset serves as a foundation for the unified evaluation of dictionary example scoring tools and opens discussion on how to annotate examples. Additionally, we make the dataset publicly available.
Návaznosti
| MUNI/A/1590/2023, interní kód MU |
|