D 2004

Corpus Analysis for Lexical Database Construction: A Case of Russian and Czech Wordnets

SMRŽ, Pavel a Anna SINOPALNIKOVA

Základní údaje

Originální název

Corpus Analysis for Lexical Database Construction: A Case of Russian and Czech Wordnets

Název česky

Korpusová analýza pro tvorbu lexikálních databází - Případová studie ruského a českého wordnetu

Autoři

SMRŽ, Pavel (203 Česká republika, garant) a Anna SINOPALNIKOVA (643 Rusko)

Vydání

Saint-Petersburg, Russia, Proceedings of the 33th International Conference on Linguistics, od s. 23-29, 7 s. 2004

Nakladatel

Saint-Petersburg State University Press

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Rusko

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Kód RIV

RIV/00216224:14330/04:00010449

Organizační jednotka

Fakulta informatiky

Klíčová slova anglicky

corpus; lexical database; lexico-syntactic patterns; word sketches
Změněno: 18. 1. 2005 11:22, doc. RNDr. Pavel Smrž, Ph.D.

Anotace

V originále

The paper deals with corpus-based methods applied to the particular tasks of lexical database construction. Different techniques of the corpus analysis are discussed and their applicability for the tasks is assessed. Corpus management system Manatee + Bonito developed at the Faculty of Informatics, Masaryk University in Brno, Czech Republic, is presented as a tool that enables to perform all discussed linguistic studies. We mainly focus on the methods of substitutions and extractions of lexico-syntactic patterns that present a kind of standard approaches to the creation of lexical databases. We also briefly mention the employment of word sketches a new technique in lexicography aiming at speed up of corpus analysis work

Česky

Příspěvek se zabývá korpusovými metodami aplikovanými při výstavbě lexkální databáze.

Návaznosti

GA405/03/0913, projekt VaV
Název: Velké jazykové korpusy a jejich automatická analýza
Investor: Grantová agentura ČR, Velké jazykové korpusy a jejich automatická analýza
MSM 143300003, záměr
Název: Interakce člověka s počítačem, dialogové systémy a asistivní technologie
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Interakce člověka s počítačem, dialogové systémy a asistivní technologie