D 2021

Evaluating the State-of-the-Art Sentence Alignment System on Literary Texts

SIGNORONI, Edoardo

Základní údaje

Originální název

Evaluating the State-of-the-Art Sentence Alignment System on Literary Texts

Autoři

SIGNORONI, Edoardo (380 Itálie, garant, domácí)

Vydání

Brno, Recent Advances in Slavonic Natural Language Processing (RASLAN 2021), od s. 115-124, 10 s. 2021

Nakladatel

Tribun EU

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10200 1.2 Computer and information sciences

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Kód RIV

RIV/00216224:14330/21:00125090

Organizační jednotka

Fakulta informatiky

ISBN

978-80-263-1670-1

ISSN

Klíčová slova anglicky

Parallel corpora; Automatic alignment; Literary text
Změněno: 15. 5. 2024 10:23, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

Sentence alignment is a useful task with many applications in Natural Language Processing and Digital Humanities. This paper presents an evaluation of Vecalign, the state-of-the-art method for automatic sen- tence alignment, on two bilingual corpora built from literary texts. This preliminary study shows that Vecalign performs well for literary texts and gives insights on its remaining issues through a qualitative evaluation of the output alignments.

Návaznosti

EF19_073/0016943, projekt VaV
Název: Interní grantová agentura Masarykovy univerzity
MUNI/IGA/1334/2021, interní kód MU
Název: A New Machine Translation-based approach to Parallel Corpora Alignment
Investor: Masarykova univerzita, A New Machine Translation-based approach to Parallel Corpora Alignment