D 2023

Fine-Grained Language Relatedness for Zero-Shot Silesian-English Translation

SIGNORONI, Edoardo

Základní údaje

Originální název

Fine-Grained Language Relatedness for Zero-Shot Silesian-English Translation

Vydání

Brno, RASLAN 2023 Recent Advances in Slavonic Natural Language Processing, od s. 145-156, 12 s. 2023

Nakladatel

Tribun EU

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10200 1.2 Computer and information sciences

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14330/23:00136158

Organizační jednotka

Fakulta informatiky

ISBN

978-80-263-1793-7

ISSN

EID Scopus

Klíčová slova anglicky

machine translation;large language models;English;Silesian;evaluation;zero-shot

Příznaky

Recenzováno
Změněno: 19. 6. 2024 06:45, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

When parallel corpora are not available to train or fine-tune Machine Translation (MT) systems, one solution is to use data from a related language, and operate in a zero-shot setting. We explore the behaviour and performance of two pre-trained Large Language Models (LLMs) for zero-shot Silesian-English translation, by fine-tuning them on increasingly related languages. Our experiment shows that using data from related languages generally improves the zero-shot translation performance for our language pair, but the optimal fine-grained choice inside the Slavic language family is non-trivial and depends on the model characteristics.

Návaznosti

LM2018101, projekt VaV
Název: Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy (Akronym: LINDAT/CLARIAH-CZ)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, LINDAT/CLARIAH-CZ - Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy

Přiložené soubory