D 2008

Building Big Czech Corpus : Collecting and Converting Czech Corpora

HANČAR, Pavel

Basic information

Original name

Building Big Czech Corpus : Collecting and Converting Czech Corpora

Name in Czech

Budování velkého českého korpusu : shromáždění a konverze českých korpusů

Authors

HANČAR, Pavel (203 Czech Republic, guarantor, belonging to the institution)

Edition

Masaryk University, Brno, RASLAN 2008, p. 94-97, 100 pp. 2008

Publisher

Masaryk University, Brno

Other information

Language

English

Type of outcome

Stať ve sborníku

Field of Study

60200 6.2 Languages and Literature

Country of publisher

Czech Republic

Confidentiality degree

není předmětem státního či obchodního tajemství

Publication form

printed version "print"

References:

RIV identification code

RIV/00216224:14330/08:00024361

Organization unit

Faculty of Informatics

ISBN

978-80-210-4741-9

UT WoS

000302212600015

Keywords in English

corpus; desamb; vertjoin;
Změněno: 7/6/2021 22:14, RNDr. Pavel Šmerk, Ph.D.

Abstract

V originále

This paper describes a creating of a big Czech corpus from many Czech corpora kept on the NLP Centre server. It describes new tools developed for this purpose, difficulties which may come up and a way how solve them.

In Czech

Tento článek popisuje vytváření velkého českého korpusu z mnoha českých korpusů uložených na serveru centra NLP. Popisuje nástroje vytvořené k tomuto účelu, potíže, které se mohou objevit, a cesty jejich řešení.

Links

1ET200610406, research and development project
Name: Jazyková poradna na internetu
Investor: Academy of Sciences of the Czech Republic, Internet Language Consulting Service