2008
Building Big Czech Corpus : Collecting and Converting Czech Corpora
HANČAR, PavelZákladní údaje
Originální název
Building Big Czech Corpus : Collecting and Converting Czech Corpora
Název česky
Budování velkého českého korpusu : shromáždění a konverze českých korpusů
Autoři
HANČAR, Pavel (203 Česká republika, garant, domácí)
Vydání
Masaryk University, Brno, RASLAN 2008, od s. 94-97, 100 s. 2008
Nakladatel
Masaryk University, Brno
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
60200 6.2 Languages and Literature
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
tištěná verze "print"
Odkazy
Kód RIV
RIV/00216224:14330/08:00024361
Organizační jednotka
Fakulta informatiky
ISBN
978-80-210-4741-9
UT WoS
000302212600015
Klíčová slova anglicky
corpus; desamb; vertjoin;
Změněno: 7. 6. 2021 22:14, RNDr. Pavel Šmerk, Ph.D.
V originále
This paper describes a creating of a big Czech corpus from many Czech corpora kept on the NLP Centre server. It describes new tools developed for this purpose, difficulties which may come up and a way how solve them.
Česky
Tento článek popisuje vytváření velkého českého korpusu z mnoha českých korpusů uložených na serveru centra NLP. Popisuje nástroje vytvořené k tomuto účelu, potíže, které se mohou objevit, a cesty jejich řešení.
Návaznosti
1ET200610406, projekt VaV |
|