2004
Manatee, Bonito and Word Sketches for Czech
RYCHLÝ, Pavel a Pavel SMRŽZákladní údaje
Originální název
Manatee, Bonito and Word Sketches for Czech
Název česky
Manatee, Bonito a Word Sketches pro češtinu
Autoři
RYCHLÝ, Pavel (203 Česká republika, garant) a Pavel SMRŽ (203 Česká republika)
Vydání
Saint-Petersburg, Proceedings of the Second International Conference on Corpus Linguisitcs, od s. 124-132, 9 s. 2004
Nakladatel
Saint-Petersburg State University Press
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Rusko
Utajení
není předmětem státního či obchodního tajemství
Odkazy
Kód RIV
RIV/00216224:14330/04:00009665
Organizační jednotka
Fakulta informatiky
ISBN
5-288-03531-8
Klíčová slova anglicky
corpora; corpus management; statistics; word sketches
Štítky
Změněno: 18. 1. 2005 11:22, doc. RNDr. Pavel Smrž, Ph.D.
V originále
This paper deals with a newly designed and developed system Manatee that can be employed to manage corpora, especially extremely large ones with billions of words, and enables the efficient evaluation of complex queries and the computation of advanced statistics. The main functions of the tool are presented here, together with the introduction of its web-based graphical user interface, Bonito. The sophisticated statistical processing is demonstrated in an example of computing of Word Sketches. Special attention is paid to the definition of the word sketches for Czech and problems connected to its free word order
Česky
Příspěvek se věnuje nově navrženému a vyvinutému systému Manatee, který může být použit pro management korpusů, zejména rozsáhlých, např. s miliardou slov. Rovněž představuje nové webovské uživatelské prostředí Bonito a systém Word Sketches pro češtinu.
Návaznosti
MSM 143300003, záměr |
| ||
1ET100300419, projekt VaV |
|