Detailed Information on Publication Record
2008
Building Big Czech Corpus : Collecting and Converting Czech Corpora
HANČAR, PavelBasic information
Original name
Building Big Czech Corpus : Collecting and Converting Czech Corpora
Name in Czech
Budování velkého českého korpusu : shromáždění a konverze českých korpusů
Authors
HANČAR, Pavel (203 Czech Republic, guarantor, belonging to the institution)
Edition
Masaryk University, Brno, RASLAN 2008, p. 94-97, 100 pp. 2008
Publisher
Masaryk University, Brno
Other information
Language
English
Type of outcome
Stať ve sborníku
Field of Study
60200 6.2 Languages and Literature
Country of publisher
Czech Republic
Confidentiality degree
není předmětem státního či obchodního tajemství
Publication form
printed version "print"
References:
RIV identification code
RIV/00216224:14330/08:00024361
Organization unit
Faculty of Informatics
ISBN
978-80-210-4741-9
UT WoS
000302212600015
Keywords in English
corpus; desamb; vertjoin;
Změněno: 7/6/2021 22:14, RNDr. Pavel Šmerk, Ph.D.
V originále
This paper describes a creating of a big Czech corpus from many Czech corpora kept on the NLP Centre server. It describes new tools developed for this purpose, difficulties which may come up and a way how solve them.
In Czech
Tento článek popisuje vytváření velkého českého korpusu z mnoha českých korpusů uložených na serveru centra NLP. Popisuje nástroje vytvořené k tomuto účelu, potíže, které se mohou objevit, a cesty jejich řešení.
Links
1ET200610406, research and development project |
|