D 2005

Robust stochastic parsing using optimal maximum coverage

KADLEC, Vladimír, Marita AILOMAA, Jean-Cédric CHAPPELIER a Martin RAJMAN

Základní údaje

Originální název

Robust stochastic parsing using optimal maximum coverage

Název česky

Robustní pravděpodobnostní syntaktická analýza založená na optimálním maximálním pokrytí

Autoři

KADLEC, Vladimír (203 Česká republika, garant), Marita AILOMAA (752 Švédsko), Jean-Cédric CHAPPELIER (756 Švýcarsko) a Martin RAJMAN (756 Švýcarsko)

Vydání

2005. vyd. Shoumen, Bulgaria, Proceedings of The International Conference Recent Advances In Natural Language Processing (RANLP) 2005, od s. 258-263, 6 s. 2005

Nakladatel

INCOMA

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14330/05:00012724

Organizační jednotka

Fakulta informatiky

ISBN

954-91743-3-6

Klíčová slova anglicky

robust; parsing; coverage; NLP

Štítky

Změněno: 19. 1. 2006 17:11, RNDr. Vladimír Kadlec, Ph.D.

Anotace

V originále

This paper presents a robust syntactic parser that is able to return a ``correct'' derivation tree even if the grammar cannot generate the input sentence. The following two steps solution is proposed: the corresponding most probable optimal maximum coverage is generated first, then the trees from this coverage are glued into one resulting tree. The technique was tested on the ATIS and Susanne corpora and experimental results, as well as conclusions on performance, are provided.

Česky

Tento článek popisuje robustní syntaktický analyzátor, který je schopen vrátit ,,správný'' derivační strom i v případech, kdy není možné vygenerovat vstupní větu pomocí dané gramatiky. Analýza probíhá ve dvou krocích: nejdříve je vygenerováno příslušné nejpravděpodobnější maximální optimální pokrytí, následovně jsou stromy z tohoto pokrytí spojeny do jednoho výsledného stromu. Tato technika byla otestována na korpusech ATIS a Susanne. Jsou diskutovány dosažené výsledky a možnosti dalšího využití.

Návaznosti

GA201/05/2781, projekt VaV
Název: Překlad českých vět do konstrukcí transparentní intenzionální logiky
Investor: Grantová agentura ČR, Překlad českých vět do konstrukcí transparentní intenzionální logiky
1ET100300414, projekt VaV
Název: Inteligentní metody pro zvýšení spolehlivosti elektrických sítí
Investor: Akademie věd ČR, Inteligentní metody pro zvýšení spolehlivosti elektrických sítí