MEDVEĎ, Marek, Vít BAISA a Aleš HORÁK. Increasing Coverage of Translation Memories with Linguistically Motivated Segment Combination Methods. In Constantin Orasan and Rohit Gupta. Proceedings of The Workshop on Natural Language Processing for Translation Memories (NLP4TM). Bulgaria: INCOMA Ltd. Shoumen, 2015, s. 31-35. ISBN 978-954-452-032-8.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Increasing Coverage of Translation Memories with Linguistically Motivated Segment Combination Methods
Autoři MEDVEĎ, Marek (703 Slovensko, domácí), Vít BAISA (203 Česká republika, domácí) a Aleš HORÁK (203 Česká republika, garant, domácí).
Vydání Bulgaria, Proceedings of The Workshop on Natural Language Processing for Translation Memories (NLP4TM), od s. 31-35, 5 s. 2015.
Nakladatel INCOMA Ltd. Shoumen
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Bulharsko
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW The workshop on Natural Language Processing for Translation Memories
Kód RIV RIV/00216224:14330/15:00081035
Organizační jednotka Fakulta informatiky
ISBN 978-954-452-032-8
Klíčová slova anglicky transaltion memories; DGT; MemoQ; Moses; segment; CAT
Změnil Změnil: RNDr. Marek Medveď, Ph.D., učo 359226. Změněno: 5. 1. 2016 15:14.
Anotace
Translation memories (TMs) used in computer-aided translation (CAT) systems are the highest-quality source of parallel texts since they consist of segment translation pairs approved by professional human translators. The obvious problem is their size and coverage of new document segments when compared with other parallel data. In this paper, we describe several methods for expanding translation memories using linguistically motivated segment combining approaches concentrated on preserving the high translational quality. The evaluation of the methods was done on a medium-size real-world translation memory and documents provided by a Czech translation company as well as on a large publicly available DGT translation memory published by European Commission. The asset of the TM expansion methods were evaluated by the pre-translation analysis of widely used MemoQ CAT system and the METEOR metric was used for measuring the quality of fully expanded new translation segments.
Návaznosti
GA15-13277S, projekt VaVNázev: Hyperintensionální logika pro analýzu přirozeného jazyka
Investor: Grantová agentura ČR, Hyperintensionální logika pro analýzu přirozeného jazyka
LM2010013, projekt VaVNázev: LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat (Akronym: LINDAT-Clarin)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Projekt LINDAT-Clarin - Vybudování a provoz českého uzlu pan-evropské infrastruktury pro výzkum
7F14047, projekt VaVNázev: Harvesting big text data for under-resourced languages (Akronym: HaBiT)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Harvesting big text data for under-resourced languages
VytisknoutZobrazeno: 26. 4. 2024 03:33