Robust stochastic parsing: comparing two approaches for
processing extra-grammatical sentences

D 2005

Robust stochastic parsing: comparing two approaches for processing extra-grammatical sentences

AILOMAA, Marita, Vladimír KADLEC, Jean-Cédric CHAPPELIER a Martin RAJMAN

Základní údaje

Originální název

Robust stochastic parsing: comparing two approaches for processing extra-grammatical sentences

Název česky

Robustní syntaktická analýza: Porovnání dvou přístupů pro zpracování ne-gramatických vět

Autoři

AILOMAA, Marita (752 Švédsko), Vladimír KADLEC (203 Česká republika, garant), Jean-Cédric CHAPPELIER (756 Švýcarsko) a Martin RAJMAN (756 Švýcarsko)

Vydání

2005. vyd. Finland, Proceedings of the 15th Nordic Conference of Computational Linguistics (NODALIDA) 2005, od s. 21-29, 8 s. 2005

Nakladatel

University of Joensuu

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Finsko

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14330/05:00012486

Organizační jednotka

Fakulta informatiky

Klíčová slova anglicky

robust; parsing; NLP

Štítky

NLP, parsing, robust

Změněno: 19. 1. 2006 17:11, RNDr. Vladimír Kadlec, Ph.D.

Anotace

ORIG CZ

V originále

This paper compares two techniques for robust parsing of extra-grammatical natural language that might be of interest in large scale Textual Data Analysis applications. The first one returns a "correct" derivation for any extra-grammatical sentence by generating the finest corresponding most probable optimal maximum coverage. The second one extends the initial grammar by adding relaxed grammar rules in a controlled manner. Both techniques use a stochastic parser that selects a "best" solution among multiple analyses. The techniques were tested on the ATIS and Susanne corp ora and exp erimental results, as well as conclusions on performance comparison, are provided.

Česky

Článek porovnává dvě techniky pro robustní syntaktickou analýzu ne-gramatických vět. Tyto techniky mohou nalézt využití v šikokém spektru aplikací pro zpracování textových dat. První technika vrací "korektní" analýzu pro jakoukouliv ne-gramatickou větu vygenerováním příslušného nejpravděpodobnějšího optimálního maximálního pokrytí. Druhá technika rozšiřuje původní gramatiku přidáním volných pravidel. Obě techniky používají pravděpodobnostní syntaktický analyzátor. Techniky byly testovány na korpusech ATIS a Susanne.

Návaznosti

GA201/05/2781, projekt VaV

Název: Překlad českých vět do konstrukcí transparentní intenzionální logiky

Investor: Grantová agentura ČR, Překlad českých vět do konstrukcí transparentní intenzionální logiky

1ET100300414, projekt VaV

Název: Inteligentní metody pro zvýšení spolehlivosti elektrických sítí

Investor: Akademie věd ČR, Inteligentní metody pro zvýšení spolehlivosti elektrických sítí

Podrobný výpis o publikaci