D 2025

Enhancing Bilingual Lexicon Induction with Dynamic Translation

DENISOVÁ, Michaela a Pavel RYCHLÝ

Základní údaje

Originální název

Enhancing Bilingual Lexicon Induction with Dynamic Translation

Autoři

DENISOVÁ, Michaela ORCID (703 Slovensko, garant, domácí) a Pavel RYCHLÝ (203 Česká republika, domácí)

Vydání

Porto, Proceedings of the 17th International Conference on Agents and Artificial Intelligence - Volume 2: ICAART, od s. 735-744, 10 s. 2025

Nakladatel

SciTePress

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

elektronická verze "online"

Organizační jednotka

Fakulta informatiky

ISBN

978-989-758-737-5

ISSN

Klíčová slova anglicky

cross-Lingual embedding models; parameter k; classification neural network

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 25. 3. 2025 08:12, Mgr. Michaela Denisová

Anotace

V originále

Bilingual lexicon induction (BLI) has been a popular task for evaluating cross-lingual word embeddings (CWEs). The prevalent metric employed in the evaluation is precision at k, where k represents the number of target words retrieved for each source word. However, establishing a fixed k for the entire evaluation dataset proves challenging due to varying target word counts for each source word. This leads to limited results, compromising either precision or recall. In this paper, we present a novel classification-based approach with dynamic k for bilingual lexicon induction that aims to identify all relevant target words for each source word by exploiting the information derived from the aligned embeddings while offering a balanced trade-off between precision and recall. On top of that, it enables the evaluation of the existing CWEs using dynamic k. Compared to the standard baseline systems and evaluation procedures, it provides competitive results.

Návaznosti

MUNI/A/1638/2024, interní kód MU
Název: Umělá inteligence a správa komplexních rozsáhlých dat
Investor: Masarykova univerzita, Umělá inteligence a správa komplexních rozsáhlých dat