2005
Tool for robust stochastic parsing using optimal maximum coverage
KADLEC, Vladimír; Jean-Cédric CHAPPELIER and Martin RAJMANBasic information
Original name
Tool for robust stochastic parsing using optimal maximum coverage
Name in Czech
Nástroj pro robustní pravděpodobnostní syntaktickou analýzu založený na optimálním maximálním pokrytí
Authors
KADLEC, Vladimír (203 Czech Republic, guarantor); Jean-Cédric CHAPPELIER (756 Switzerland) and Martin RAJMAN (756 Switzerland)
Edition
2005. vyd. Brno, Czech Republic, 16 pp. Technical Reports, FIMU-RS-2005-05, 2005
Publisher
Faculty of Informatics, MU
Other information
Language
English
Type of outcome
Book on a specialized topic
Field of Study
10201 Computer sciences, information science, bioinformatics
Country of publisher
Czech Republic
Confidentiality degree
is not subject to a state or trade secret
RIV identification code
RIV/00216224:14330/05:00012488
Organization unit
Faculty of Informatics
Keywords in English
robust; parsing; coverage; NLP
Changed: 19/1/2006 17:12, RNDr. Vladimír Kadlec, Ph.D.
In the original language
This report presents a robust syntactic parser that is able to return a ``correct" derivation tree even if the grammar cannot generate the input sentence. The following two steps solution is proposed: the finest corresponding most probable optimal maximum coverage is generated first, then the trees from this coverage are glued into one resulting tree. We discuss the implementation of this method with the SLP toolkit and libkp library.
In Czech
Tento report popisuje robustní syntaktický analyzátor, který je schopen vrátit ,,správný'' derivační strom i v případech, kdy není možné vygenerovat vstupní větu pomocí dané gramatiky. Analýza probíhá ve dvou krocích: nejdříve je vygenerováno příslušné nejpravděpodobnější maximální optimální pokrytí, následovně jsou stromy z tohoto pokrytí spojeny do jednoho výsledného stromu. Diskutujeme implementaci pomocí nástrojů SLP toolkit a knihovny libkp.
Links
GA201/05/2781, research and development project |
| ||
1ET100300414, research and development project |
|