D 2024

Fantastic Examples and Where to Find Them - Compiling Czech Dataset for Evaluating Dictionary Examples

DENISOVÁ, Michaela a Pavel RYCHLÝ

Základní údaje

Originální název

Fantastic Examples and Where to Find Them - Compiling Czech Dataset for Evaluating Dictionary Examples

Autoři

DENISOVÁ, Michaela ORCID a Pavel RYCHLÝ

Vydání

Brno, Proceedings of the Eighteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, od s. 37-46, 10 s. 2024

Nakladatel

Tribun EU

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14330/24:00137913

Organizační jednotka

Fakulta informatiky

ISBN

978-80-263-1835-4

ISSN

Klíčová slova anglicky

Dictionary examples; GDEX; Evaluation

Příznaky

Recenzováno
Změněno: 25. 3. 2025 07:56, Mgr. Michaela Denisová

Anotace

V originále

Examples are an important part of a dictionary entry, helping users better understand the word and its usage in context. However, selecting good examples is a challenging and time-consuming task due to varying selection criteria and the vast amount of data to choose from. While different tools have been developed to address this, evaluation remains flawed and lacks standardisation. In this paper, we compile an evaluation dataset for the Czech language, using the GDEX tool and manual annotations to classify examples and explain the classification. Based on our findings, we propose general annotation guidelines to improve consistency. This dataset serves as a foundation for the unified evaluation of dictionary example scoring tools and opens discussion on how to annotate examples. Additionally, we make the dataset publicly available.

Návaznosti

MUNI/A/1590/2023, interní kód MU
Název: Využití technik umělé inteligence pro zpracování dat, komplexní analýzy a vizualizaci rozsáhlých dat
Investor: Masarykova univerzita, Využití technik umělé inteligence pro zpracování dat, komplexní analýzy a vizualizaci rozsáhlých dat