D 2007

Derivational Relations in Czech WordNet

PALA, Karel a Dana HLAVÁČKOVÁ

Základní údaje

Originální název

Derivational Relations in Czech WordNet

Název česky

Derivační vztahy v českém WordNetu

Autoři

PALA, Karel (203 Česká republika, garant) a Dana HLAVÁČKOVÁ (203 Česká republika)

Vydání

1. vyd. Praha, Proceedings of the Workshop on Balto-Slavonic Natural Language Processing, od s. 75-81, 6 s. 2007

Nakladatel

Universita Karlova, ÚFAL MFF UK

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14330/07:00019440

Organizační jednotka

Fakulta informatiky

ISBN

978-1-932432-88-6

Klíčová slova anglicky

derivational relations; WordNet; semantic networks; computer processing

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 17. 12. 2007 19:52, Mgr. Dana Hlaváčková, Ph.D.

Anotace

V originále

In the paper we describe enriching Czech WordNet with the derivational relations that in highly inflectional languages like Czech form typical derivational nests (or subnets). Derivational relations are mostly of semantic nature and their regularity in Czech allows us to add them to the WordNet almost automatically. For this purpose we have used the derivational version of morphological analyzer Ajka that is able to handle the basic and most productive derivational relations in Czech. Using a special derivational interface developed in our NLP Lab we have explored the semantic nature of the selected noun derivational suffixes and established a set of the semantically labeled derivational relations, presently 14. We have added them to the Czech WordNet and in this way enriched it with approx. 30 000 new Czech synsets. A similar enrichment for Princeton WordNet has been reported in its recently released version 3.0, we will comment on the partial similarities and differences.

Česky

Formální popis slovotvorných vztahů v češtině, stanovení hlavních typů a jejich zpracování na slovníku 126 000 českých substantivních kmenů. Propojení s literály v českém Wordnetu

Návaznosti

LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
1ET100300414, projekt VaV
Název: Inteligentní metody pro zvýšení spolehlivosti elektrických sítí
Investor: Akademie věd ČR, Inteligentní metody pro zvýšení spolehlivosti elektrických sítí
1ET208050401, projekt VaV
Název: E-learning v kontextu sémantického webu
Investor: Akademie věd ČR, E-learning v kontextu sémantického webu