D 2005

Efficient Processing of Extra-grammatical Sentences: Comparing and Combining two approaches to Robust Stochastic Parsing

AILOMAA, Marita, Vladimír KADLEC, Jean-Cédric CHAPPELIER a Martin RAJMAN

Základní údaje

Originální název

Efficient Processing of Extra-grammatical Sentences: Comparing and Combining two approaches to Robust Stochastic Parsing

Název česky

Efektivní zpracování ne-gramatických vět: Porovnání a kombinace dvou přístupů k robustní syntaktické analýze

Autoři

AILOMAA, Marita (752 Švédsko), Vladimír KADLEC (203 Česká republika, garant), Jean-Cédric CHAPPELIER (756 Švýcarsko) a Martin RAJMAN (756 Švýcarsko)

Vydání

2005. vyd. Francie, Proceedings of the Applied Stochastic Models and Data Analysis (ASMDA) 2005, od s. 81-89, 8 s. 2005

Nakladatel

ENST Bretagne

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Francie

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14330/05:00012485

Organizační jednotka

Fakulta informatiky

ISBN

2-908849-15-1

Klíčová slova anglicky

robust; parsing; coverage

Štítky

Změněno: 19. 1. 2006 17:10, RNDr. Vladimír Kadlec, Ph.D.

Anotace

V originále

This paper compares two techniques for robust parsing of extra-grammatical natural language that might be of interest in large scale Textual Data Analysis applications. The first one returns a "correct" derivation for any extra-grammatical sentence by generating the finest corresponding most probable optimal maximum coverage. The second one extends the initial grammar by adding relaxed grammar rules in a controlled manner. Both techniques use a stochastic parser that selects a "best" solution among multiple analyses. The techniques were tested on the ATIS and Susanne corp ora and exp erimental results, as well as conclusions on performance comparison, are provided.

Česky

Článek porovnává dvě techniky pro robustní syntaktickou analýzu ne-gramatických vět. Tyto techniky mohou nalézt využití v šikokém spektru aplikací pro zpracování textových dat. První technika vrací "korektní" analýzu pro jakoukouliv ne-gramatickou větu vygenerováním příslušného nejpravděpodobnějšího optimálního maximálního pokrytí. Druhá technika rozšiřuje původní gramatiku přidáním volných pravidel. Obě techniky používají pravděpodobnostní syntaktický analyzátor. Techniky byly testovány na korpusech ATIS a Susanne.

Návaznosti

GA201/05/2781, projekt VaV
Název: Překlad českých vět do konstrukcí transparentní intenzionální logiky
Investor: Grantová agentura ČR, Překlad českých vět do konstrukcí transparentní intenzionální logiky
1ET100300414, projekt VaV
Název: Inteligentní metody pro zvýšení spolehlivosti elektrických sítí
Investor: Akademie věd ČR, Inteligentní metody pro zvýšení spolehlivosti elektrických sítí