Semantic Classes of Czech Verbs

D 2009

Semantic Classes of Czech Verbs

PALA, Karel; Dana HLAVÁČKOVÁ a Maria KHOKHLOVÁ

Základní údaje

Originální název

Semantic Classes of Czech Verbs

Název česky

Sémantické třídy českých sloves

Autoři

PALA, Karel; Dana HLAVÁČKOVÁ a Maria KHOKHLOVÁ

Vydání

první. Warszava, Proceedings of the Conference on Intelligent Information Systems 2009, od s. 207-217, 10 s. 2009

Nakladatel

IPI PAN Warszava

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Polsko

Utajení

není předmětem státního či obchodního tajemství

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14330/09:00029755

Organizační jednotka

Fakulta informatiky

ISBN

978-83-60434-59-8

Klíčová slova česky

sémantická klasifikace sloves - sémantické třídy českých sloves - lexikální databáze VerbaLex - valenční rámce

Klíčová slova anglicky

semantic classes of Czech verbs - lexical database VerbaLex - valency frames

Změněno: 19. 11. 2011 18:57, Mgr. Dana Hlaváčková, Ph.D.

Anotace

ORIG CZ

V originále

In this paper semantic classes of Czech verbs are presented as they are obtained from the lexical database VerbaLex that has recently been built at the NLP Centre FI MU. At the moment we have in VerbaLex 82 semantic classes covering 10,482 Czech verb lemmata and 19,556 verb valency frames. We discuss the criteria for establishing semantic classes: the most important one is grouping verbs according to their senses. The second one exploits relations between semantic classes of Czech verbs and semantic roles and subcategorization features as they are used in VerbaLex valency frames. We also touch on the issue of the ontology that could be used to describe the meanings of the verbs in the semantic classes. The semantic classification of Czech verbs can be extended for other languages via Interlingual Index (ILI) existing in WordNets and it can be used in the various applications in the NLP area (machine translation, syntactic analysis, semantic search, information extraction and others).

Česky

V článku jsou představeny sémantické třídy českých sloves, jak byly získány z lexikální databáze VerbaLex nedávno vytvořené v Centru zpracování přirozeného jazyka FI MU.

Návaznosti

GV405/96/K214, projekt VaV

Název: Čeština ve věku počítačů: Textové korpusy a lexikální i gramatická základna pro rozvoj češtiny v 21. století

Investor: Grantová agentura ČR, Čeština ve věku počítačů: Textové korpusy a lexikální i gramatická základna pro rozvoj češtiny v 21. století

Přehled o publikaci