D 2004

Manatee, Bonito and Word Sketches for Czech

RYCHLÝ, Pavel a Pavel SMRŽ

Základní údaje

Originální název

Manatee, Bonito and Word Sketches for Czech

Název česky

Manatee, Bonito a Word Sketches pro češtinu

Autoři

RYCHLÝ, Pavel (203 Česká republika, garant) a Pavel SMRŽ (203 Česká republika)

Vydání

Saint-Petersburg, Proceedings of the Second International Conference on Corpus Linguisitcs, od s. 124-132, 9 s. 2004

Nakladatel

Saint-Petersburg State University Press

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Rusko

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Kód RIV

RIV/00216224:14330/04:00009665

Organizační jednotka

Fakulta informatiky

ISBN

5-288-03531-8

Klíčová slova anglicky

corpora; corpus management; statistics; word sketches
Změněno: 18. 1. 2005 11:22, doc. RNDr. Pavel Smrž, Ph.D.

Anotace

V originále

This paper deals with a newly designed and developed system Manatee that can be employed to manage corpora, especially extremely large ones with billions of words, and enables the efficient evaluation of complex queries and the computation of advanced statistics. The main functions of the tool are presented here, together with the introduction of its web-based graphical user interface, Bonito. The sophisticated statistical processing is demonstrated in an example of computing of Word Sketches. Special attention is paid to the definition of the word sketches for Czech and problems connected to its free word order

Česky

Příspěvek se věnuje nově navrženému a vyvinutému systému Manatee, který může být použit pro management korpusů, zejména rozsáhlých, např. s miliardou slov. Rovněž představuje nové webovské uživatelské prostředí Bonito a systém Word Sketches pro češtinu.

Návaznosti

MSM 143300003, záměr
Název: Interakce člověka s počítačem, dialogové systémy a asistivní technologie
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Interakce člověka s počítačem, dialogové systémy a asistivní technologie
1ET100300419, projekt VaV
Název: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Akademie věd ČR, Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu