2004
Corpus Analysis for Lexical Database Construction: A Case of Russian and Czech Wordnets
SMRŽ, Pavel a Anna SINOPALNIKOVAZákladní údaje
Originální název
Corpus Analysis for Lexical Database Construction: A Case of Russian and Czech Wordnets
Název česky
Korpusová analýza pro tvorbu lexikálních databází - Případová studie ruského a českého wordnetu
Autoři
SMRŽ, Pavel (203 Česká republika, garant) a Anna SINOPALNIKOVA (643 Rusko)
Vydání
Saint-Petersburg, Russia, Proceedings of the 33th International Conference on Linguistics, od s. 23-29, 7 s. 2004
Nakladatel
Saint-Petersburg State University Press
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Rusko
Utajení
není předmětem státního či obchodního tajemství
Odkazy
Kód RIV
RIV/00216224:14330/04:00010449
Organizační jednotka
Fakulta informatiky
Klíčová slova anglicky
corpus; lexical database; lexico-syntactic patterns; word sketches
Změněno: 18. 1. 2005 11:22, doc. RNDr. Pavel Smrž, Ph.D.
V originále
The paper deals with corpus-based methods applied to the particular tasks of lexical database construction. Different techniques of the corpus analysis are discussed and their applicability for the tasks is assessed. Corpus management system Manatee + Bonito developed at the Faculty of Informatics, Masaryk University in Brno, Czech Republic, is presented as a tool that enables to perform all discussed linguistic studies. We mainly focus on the methods of substitutions and extractions of lexico-syntactic patterns that present a kind of standard approaches to the creation of lexical databases. We also briefly mention the employment of word sketches a new technique in lexicography aiming at speed up of corpus analysis work
Česky
Příspěvek se zabývá korpusovými metodami aplikovanými při výstavbě lexkální databáze.
Návaznosti
GA405/03/0913, projekt VaV |
| ||
MSM 143300003, záměr |
|