RYCHLÝ, Pavel a Pavel SMRŽ. Manatee, Bonito and Word Sketches for Czech. In Proceedings of the Second International Conference on Corpus Linguisitcs. Saint-Petersburg: Saint-Petersburg State University Press, 2004, s. 124-132. ISBN 5-288-03531-8.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Manatee, Bonito and Word Sketches for Czech
Název česky Manatee, Bonito a Word Sketches pro češtinu
Autoři RYCHLÝ, Pavel (203 Česká republika, garant) a Pavel SMRŽ (203 Česká republika).
Vydání Saint-Petersburg, Proceedings of the Second International Conference on Corpus Linguisitcs, od s. 124-132, 9 s. 2004.
Nakladatel Saint-Petersburg State University Press
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Rusko
Utajení není předmětem státního či obchodního tajemství
WWW URL
Kód RIV RIV/00216224:14330/04:00009665
Organizační jednotka Fakulta informatiky
ISBN 5-288-03531-8
Klíčová slova anglicky corpora; corpus management; statistics; word sketches
Štítky corpora, Corpus Management, statistics, word sketches
Změnil Změnil: doc. RNDr. Pavel Smrž, Ph.D., učo 1297. Změněno: 18. 1. 2005 11:22.
Anotace
This paper deals with a newly designed and developed system Manatee that can be employed to manage corpora, especially extremely large ones with billions of words, and enables the efficient evaluation of complex queries and the computation of advanced statistics. The main functions of the tool are presented here, together with the introduction of its web-based graphical user interface, Bonito. The sophisticated statistical processing is demonstrated in an example of computing of Word Sketches. Special attention is paid to the definition of the word sketches for Czech and problems connected to its free word order
Anotace česky
Příspěvek se věnuje nově navrženému a vyvinutému systému Manatee, který může být použit pro management korpusů, zejména rozsáhlých, např. s miliardou slov. Rovněž představuje nové webovské uživatelské prostředí Bonito a systém Word Sketches pro češtinu.
Návaznosti
MSM 143300003, záměrNázev: Interakce člověka s počítačem, dialogové systémy a asistivní technologie
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Interakce člověka s počítačem, dialogové systémy a asistivní technologie
1ET100300419, projekt VaVNázev: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Akademie věd ČR, Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
VytisknoutZobrazeno: 9. 5. 2024 06:59