D 2009

Measuring Coverage of a Valency Lexicon using Full Syntactic Analysis

JAKUBÍČEK, Miloš, Vojtěch KOVÁŘ a Aleš HORÁK

Základní údaje

Originální název

Measuring Coverage of a Valency Lexicon using Full Syntactic Analysis

Název česky

Měření pokrytí valenčního slovníku pomocí syntaktické analýzy

Autoři

JAKUBÍČEK, Miloš (203 Česká republika, garant), Vojtěch KOVÁŘ (203 Česká republika) a Aleš HORÁK (203 Česká republika)

Vydání

1. vyd. Brno, RASLAN 2009 : Recent Advances in Slavonic Natural Language Processing, od s. 75-79, 5 s. 2009

Nakladatel

Masaryk University

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Kód RIV

RIV/00216224:14330/09:00029783

Organizační jednotka

Fakulta informatiky

ISBN

978-80-210-5048-8

Klíčová slova česky

slovesné valence; valenční slovník; syntaktická analýza

Klíčová slova anglicky

verb valency; valency lexicon; parsing; syntactic analysis

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 20. 10. 2010 13:07, RNDr. Miloš Jakubíček, Ph.D.

Anotace

V originále

Recent development showed that valency information provides a great benefit in many areas of natural language processing. Building valency lexicons is however a complex and time-consuming task from both theoretical and practical points of view, since designing of he lexicon plays a crucial role in its future usability as well as its careful and considerated preparation. As for any manually created resource, it is complicated to evaluate its quality. In this paper we consider the usage of the syntactic parser synt for estimating the coverage of the Verbalex verb valency lexicon for Czech. For this task we extended the phrase extraction functionality of the parser, which we describe briefly. Finally we discuss our results and further development.

Česky

Poslední vývoj ukázal, že informace o slovesných valencích jsou obrovským přínosem v mnoha oblastech zpracování přirozeného jazyka. Vytváření valenčních slovníků je ovšem komplikovaný a časové velmi náročný úkol jak z teoretického, tak i praktického hlediska, neboť návrh i pečlivá příprava slovníku hrají klíčovou roli pro jeho budoucí využitelnost. Podobně jako u ostatních ručně vytvářených jazykových zdrojů není přitom jednoduché vyhodnotit jeho kvalitu. V tomto článku ukazujeme využití syntaktického analýzoru synt k určení pokrytí českého valenčního slovníku Verbalex. Za tímto účelem bylo rozšířena funkcionalita analyzátoru, která je stručně popsána. Závěrem jsou diskutovány získané výsledky a jejich budoucí využití.

Návaznosti

GA407/07/0679, projekt VaV
Název: Právní e-slovník - PES
Investor: Grantová agentura ČR, Právní e-slovník - PES
LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
2C06009, projekt VaV
Název: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce