D 2009

Measuring Coverage of a Valency Lexicon using Full Syntactic Analysis

JAKUBÍČEK, Miloš, Vojtěch KOVÁŘ and Aleš HORÁK

Basic information

Original name

Measuring Coverage of a Valency Lexicon using Full Syntactic Analysis

Name in Czech

Měření pokrytí valenčního slovníku pomocí syntaktické analýzy

Authors

JAKUBÍČEK, Miloš (203 Czech Republic, guarantor), Vojtěch KOVÁŘ (203 Czech Republic) and Aleš HORÁK (203 Czech Republic)

Edition

1. vyd. Brno, RASLAN 2009 : Recent Advances in Slavonic Natural Language Processing, p. 75-79, 5 pp. 2009

Publisher

Masaryk University

Other information

Language

English

Type of outcome

Stať ve sborníku

Field of Study

10201 Computer sciences, information science, bioinformatics

Country of publisher

Czech Republic

Confidentiality degree

není předmětem státního či obchodního tajemství

References:

RIV identification code

RIV/00216224:14330/09:00029783

Organization unit

Faculty of Informatics

ISBN

978-80-210-5048-8

Keywords (in Czech)

slovesné valence; valenční slovník; syntaktická analýza

Keywords in English

verb valency; valency lexicon; parsing; syntactic analysis

Tags

International impact, Reviewed
Změněno: 20/10/2010 13:07, RNDr. Miloš Jakubíček, Ph.D.

Abstract

V originále

Recent development showed that valency information provides a great benefit in many areas of natural language processing. Building valency lexicons is however a complex and time-consuming task from both theoretical and practical points of view, since designing of he lexicon plays a crucial role in its future usability as well as its careful and considerated preparation. As for any manually created resource, it is complicated to evaluate its quality. In this paper we consider the usage of the syntactic parser synt for estimating the coverage of the Verbalex verb valency lexicon for Czech. For this task we extended the phrase extraction functionality of the parser, which we describe briefly. Finally we discuss our results and further development.

In Czech

Poslední vývoj ukázal, že informace o slovesných valencích jsou obrovským přínosem v mnoha oblastech zpracování přirozeného jazyka. Vytváření valenčních slovníků je ovšem komplikovaný a časové velmi náročný úkol jak z teoretického, tak i praktického hlediska, neboť návrh i pečlivá příprava slovníku hrají klíčovou roli pro jeho budoucí využitelnost. Podobně jako u ostatních ručně vytvářených jazykových zdrojů není přitom jednoduché vyhodnotit jeho kvalitu. V tomto článku ukazujeme využití syntaktického analýzoru synt k určení pokrytí českého valenčního slovníku Verbalex. Za tímto účelem bylo rozšířena funkcionalita analyzátoru, která je stručně popsána. Závěrem jsou diskutovány získané výsledky a jejich budoucí využití.

Links

GA407/07/0679, research and development project
Name: Právní e-slovník - PES
Investor: Czech Science Foundation, Legal e-dictionary - PES
LC536, research and development project
Name: Centrum komputační lingvistiky
Investor: Ministry of Education, Youth and Sports of the CR, Centrum komputační lingvistiky
2C06009, research and development project
Name: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Acronym: COT-SEWing)
Investor: Ministry of Education, Youth and Sports of the CR