D 2010

Reprezentace významu sloves (valence a sémantické role)

PALA, Karel a Dana HLAVÁČKOVÁ

Základní údaje

Originální název

Reprezentace významu sloves (valence a sémantické role)

Název česky

Reprezentace významu sloves (valence a sémantické role)

Název anglicky

Representation of Verb Meanings (valencies and semantic roles)

Autoři

PALA, Karel a Dana HLAVÁČKOVÁ

Vydání

první. Praha, Sborník konference Kognice 2010, 7 s. 2010

Nakladatel

Kognice

Další údaje

Typ výsledku

Stať ve sborníku

Utajení

není předmětem státního či obchodního tajemství

Označené pro přenos do RIV

Ne

Organizační jednotka

Fakulta informatiky

Klíčová slova česky

sémantická reprezentace významu sloves slovesné valenční rámce VerbaLex

Klíčová slova anglicky

representation of the verb meanings valency frames VerbaLex semantic roles
Změněno: 14. 12. 2010 23:09, prof. PhDr. Karel Pala, CSc.

Anotace

V originále

V článku věnujeme pozornost valenčním rámcům českých sloves a lexikální databázi VerbaLex čítající 6 360 synsetů, 21 193 literálů, 10 482 lemmat, 19 556 valenčních rámců a 82 sémantických tříd. Databáze vznikala od r. 2005 v Centru zpracování přirozeného jazyka FI MU v Brně. Zmíníme se také o podobných zdrojích jak pro češtinu (Vallex, (Lopatková, Žabokrtský)), tak i pro angličtinu (WordNet, (Fellbaum a VerbNet, Kipper)). Základními jednotkami (hesly) jsou slovesná lemmata organizovaná v synonymických řadách (synsetech) s čísly významů, která mají v českém WordNetu (CzWN). Jednotlivým lemmatům jsou přiřazeny komplexní valenční rámce (KVR) zachycující informaci o morfosyntaktických (pády) a sémantických vlastnostech slovesných argumentů. Sémantické ohodnocení argumentů zachycujeme sémantickými rolemi tvořenými: a) hlavními rolemi založenými na prvcích vybraných z vrcholové ontologie EuroWordNetu (Vossen et al), tj. cca 40 značkami jako SUBS – substance, ENT – entita, PART – part, COM – communication, ACT – action, INS – instrument, GROUP – group aj. b) subkategorizačními rysy majícímí podobu literálů vybraných z Princetonského WordNetu (PWN), jichž je kolem 1000. Literály jsou součástmi uzlů v hypero/hyponymických stromech tvořících posloupnosti sémantických rysů popisujících význam lexikálních jednotek vyskytujících se v konkrétních valenčních rámcích.

Návaznosti

GAP401/10/0792, projekt VaV
Název: Temporální aspekty znalostí a informací
Investor: Grantová agentura ČR, Temporální aspekty znalostí a informací