2005
Robust stochastic parsing using optimal maximum coverage
KADLEC, Vladimír, Marita AILOMAA, Jean-Cédric CHAPPELIER a Martin RAJMANZákladní údaje
Originální název
Robust stochastic parsing using optimal maximum coverage
Název česky
Robustní pravděpodobnostní syntaktická analýza založená na optimálním maximálním pokrytí
Autoři
KADLEC, Vladimír (203 Česká republika, garant), Marita AILOMAA (752 Švédsko), Jean-Cédric CHAPPELIER (756 Švýcarsko) a Martin RAJMAN (756 Švýcarsko)
Vydání
2005. vyd. Shoumen, Bulgaria, Proceedings of The International Conference Recent Advances In Natural Language Processing (RANLP) 2005, od s. 258-263, 6 s. 2005
Nakladatel
INCOMA
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Kód RIV
RIV/00216224:14330/05:00012724
Organizační jednotka
Fakulta informatiky
ISBN
954-91743-3-6
Klíčová slova anglicky
robust; parsing; coverage; NLP
Změněno: 19. 1. 2006 17:11, RNDr. Vladimír Kadlec, Ph.D.
V originále
This paper presents a robust syntactic parser that is able to return a ``correct'' derivation tree even if the grammar cannot generate the input sentence. The following two steps solution is proposed: the corresponding most probable optimal maximum coverage is generated first, then the trees from this coverage are glued into one resulting tree. The technique was tested on the ATIS and Susanne corpora and experimental results, as well as conclusions on performance, are provided.
Česky
Tento článek popisuje robustní syntaktický analyzátor, který je schopen vrátit ,,správný'' derivační strom i v případech, kdy není možné vygenerovat vstupní větu pomocí dané gramatiky. Analýza probíhá ve dvou krocích: nejdříve je vygenerováno příslušné nejpravděpodobnější maximální optimální pokrytí, následovně jsou stromy z tohoto pokrytí spojeny do jednoho výsledného stromu. Tato technika byla otestována na korpusech ATIS a Susanne. Jsou diskutovány dosažené výsledky a možnosti dalšího využití.
Návaznosti
GA201/05/2781, projekt VaV |
| ||
1ET100300414, projekt VaV |
|