HANČAR, Pavel. Building Big Czech Corpus : Collecting and Converting Czech Corpora. In RASLAN 2008. Masaryk University, Brno: Masaryk University, Brno, 2008, s. 94-97, 100 s. ISBN 978-80-210-4741-9.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Building Big Czech Corpus : Collecting and Converting Czech Corpora
Název česky Budování velkého českého korpusu : shromáždění a konverze českých korpusů
Autoři HANČAR, Pavel (203 Česká republika, garant, domácí).
Vydání Masaryk University, Brno, RASLAN 2008, od s. 94-97, 100 s. 2008.
Nakladatel Masaryk University, Brno
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 60200 6.2 Languages and Literature
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW URL
Kód RIV RIV/00216224:14330/08:00024361
Organizační jednotka Fakulta informatiky
ISBN 978-80-210-4741-9
UT WoS 000302212600015
Klíčová slova anglicky corpus; desamb; vertjoin;
Štítky corpus, desamb, vertjoin
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 7. 6. 2021 22:14.
Anotace
This paper describes a creating of a big Czech corpus from many Czech corpora kept on the NLP Centre server. It describes new tools developed for this purpose, difficulties which may come up and a way how solve them.
Anotace česky
Tento článek popisuje vytváření velkého českého korpusu z mnoha českých korpusů uložených na serveru centra NLP. Popisuje nástroje vytvořené k tomuto účelu, potíže, které se mohou objevit, a cesty jejich řešení.
Návaznosti
1ET200610406, projekt VaVNázev: Jazyková poradna na internetu
Investor: Akademie věd ČR, Jazyková poradna na internetu
VytisknoutZobrazeno: 4. 10. 2024 16:01