B 2005

Tool for robust stochastic parsing using optimal maximum coverage

KADLEC, Vladimír; Jean-Cédric CHAPPELIER and Martin RAJMAN

Basic information

Original name

Tool for robust stochastic parsing using optimal maximum coverage

Name in Czech

Nástroj pro robustní pravděpodobnostní syntaktickou analýzu založený na optimálním maximálním pokrytí

Authors

KADLEC, Vladimír (203 Czech Republic, guarantor); Jean-Cédric CHAPPELIER (756 Switzerland) and Martin RAJMAN (756 Switzerland)

Edition

2005. vyd. Brno, Czech Republic, 16 pp. Technical Reports, FIMU-RS-2005-05, 2005

Publisher

Faculty of Informatics, MU

Other information

Language

English

Type of outcome

Book on a specialized topic

Field of Study

10201 Computer sciences, information science, bioinformatics

Country of publisher

Czech Republic

Confidentiality degree

is not subject to a state or trade secret

RIV identification code

RIV/00216224:14330/05:00012488

Organization unit

Faculty of Informatics

Keywords in English

robust; parsing; coverage; NLP
Changed: 19/1/2006 17:12, RNDr. Vladimír Kadlec, Ph.D.

Abstract

In the original language

This report presents a robust syntactic parser that is able to return a ``correct" derivation tree even if the grammar cannot generate the input sentence. The following two steps solution is proposed: the finest corresponding most probable optimal maximum coverage is generated first, then the trees from this coverage are glued into one resulting tree. We discuss the implementation of this method with the SLP toolkit and libkp library.

In Czech

Tento report popisuje robustní syntaktický analyzátor, který je schopen vrátit ,,správný'' derivační strom i v případech, kdy není možné vygenerovat vstupní větu pomocí dané gramatiky. Analýza probíhá ve dvou krocích: nejdříve je vygenerováno příslušné nejpravděpodobnější maximální optimální pokrytí, následovně jsou stromy z tohoto pokrytí spojeny do jednoho výsledného stromu. Diskutujeme implementaci pomocí nástrojů SLP toolkit a knihovny libkp.

Links

GA201/05/2781, research and development project
Name: Překlad českých vět do konstrukcí transparentní intenzionální logiky
Investor: Czech Science Foundation, Translation of Czech Sentences to Transparent Intensional Logic Constructions
1ET100300414, research and development project
Name: Inteligentní metody pro zvýšení spolehlivosti elektrických sítí
Investor: Academy of Sciences of the Czech Republic, Intelligentmethods for incresing of reliability of electrical networks