2016
European Union Language Resources in Sketch Engine
BAISA, Vít, Jan MICHELFEIT, Marek MEDVEĎ a Miloš JAKUBÍČEKZákladní údaje
Originální název
European Union Language Resources in Sketch Engine
Autoři
BAISA, Vít (203 Česká republika, domácí), Jan MICHELFEIT (203 Česká republika, domácí), Marek MEDVEĎ (703 Slovensko, domácí) a Miloš JAKUBÍČEK (203 Česká republika, domácí)
Vydání
Portorož, Slovenia, Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016), od s. 2799-2803, 5 s. 2016
Nakladatel
European Language Resources Association (ELRA)
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Slovinsko
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
elektronická verze "online"
Odkazy
Kód RIV
RIV/00216224:14330/16:00087949
Organizační jednotka
Fakulta informatiky
ISBN
978-2-9517408-9-1
Klíčová slova anglicky
JRC-Acquis; DCEP; DGT-TM; Europarl; EUR-Lex; Sketch Engine; parallel corpus; word sketch; parallel concordance
Štítky
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 3. 1. 2017 11:12, RNDr. Marek Medveď, Ph.D.
Anotace
V originále
Several parallel corpora built from European Union language resources are presented here. They were processed by state-of-the-art tools and made available for researchers in the Sketch Engine corpus management system. A completely new resource is introduced: EUR-Lex corpus, being one of the largest parallel corpus available at the moment, containing 840 million tokens of English and having the largest language pair (English-French) with more than 25 million aligned segments (paragraphs).
Návaznosti
GA15-13277S, projekt VaV |
| ||
LM2015071, projekt VaV |
| ||
MUNI/A/0945/2015, interní kód MU |
| ||
7F14047, projekt VaV |
|