D 2008

Building Big Czech Corpus : Collecting and Converting Czech Corpora

HANČAR, Pavel

Základní údaje

Originální název

Building Big Czech Corpus : Collecting and Converting Czech Corpora

Název česky

Budování velkého českého korpusu : shromáždění a konverze českých korpusů

Autoři

HANČAR, Pavel (203 Česká republika, garant, domácí)

Vydání

Masaryk University, Brno, RASLAN 2008, od s. 94-97, 100 s. 2008

Nakladatel

Masaryk University, Brno

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

60200 6.2 Languages and Literature

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Kód RIV

RIV/00216224:14330/08:00024361

Organizační jednotka

Fakulta informatiky

ISBN

978-80-210-4741-9

UT WoS

000302212600015

Klíčová slova anglicky

corpus; desamb; vertjoin;

Štítky

Změněno: 7. 6. 2021 22:14, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

This paper describes a creating of a big Czech corpus from many Czech corpora kept on the NLP Centre server. It describes new tools developed for this purpose, difficulties which may come up and a way how solve them.

Česky

Tento článek popisuje vytváření velkého českého korpusu z mnoha českých korpusů uložených na serveru centra NLP. Popisuje nástroje vytvořené k tomuto účelu, potíže, které se mohou objevit, a cesty jejich řešení.

Návaznosti

1ET200610406, projekt VaV
Název: Jazyková poradna na internetu
Investor: Akademie věd ČR, Jazyková poradna na internetu