2005
Efficient Processing of Extra-grammatical Sentences: Comparing and Combining two approaches to Robust Stochastic Parsing
AILOMAA, Marita, Vladimír KADLEC, Jean-Cédric CHAPPELIER a Martin RAJMANZákladní údaje
Originální název
Efficient Processing of Extra-grammatical Sentences: Comparing and Combining two approaches to Robust Stochastic Parsing
Název česky
Efektivní zpracování ne-gramatických vět: Porovnání a kombinace dvou přístupů k robustní syntaktické analýze
Autoři
AILOMAA, Marita (752 Švédsko), Vladimír KADLEC (203 Česká republika, garant), Jean-Cédric CHAPPELIER (756 Švýcarsko) a Martin RAJMAN (756 Švýcarsko)
Vydání
2005. vyd. Francie, Proceedings of the Applied Stochastic Models and Data Analysis (ASMDA) 2005, od s. 81-89, 8 s. 2005
Nakladatel
ENST Bretagne
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Francie
Utajení
není předmětem státního či obchodního tajemství
Kód RIV
RIV/00216224:14330/05:00012485
Organizační jednotka
Fakulta informatiky
ISBN
2-908849-15-1
Klíčová slova anglicky
robust; parsing; coverage
Změněno: 19. 1. 2006 17:10, RNDr. Vladimír Kadlec, Ph.D.
V originále
This paper compares two techniques for robust parsing of extra-grammatical natural language that might be of interest in large scale Textual Data Analysis applications. The first one returns a "correct" derivation for any extra-grammatical sentence by generating the finest corresponding most probable optimal maximum coverage. The second one extends the initial grammar by adding relaxed grammar rules in a controlled manner. Both techniques use a stochastic parser that selects a "best" solution among multiple analyses. The techniques were tested on the ATIS and Susanne corp ora and exp erimental results, as well as conclusions on performance comparison, are provided.
Česky
Článek porovnává dvě techniky pro robustní syntaktickou analýzu ne-gramatických vět. Tyto techniky mohou nalézt využití v šikokém spektru aplikací pro zpracování textových dat. První technika vrací "korektní" analýzu pro jakoukouliv ne-gramatickou větu vygenerováním příslušného nejpravděpodobnějšího optimálního maximálního pokrytí. Druhá technika rozšiřuje původní gramatiku přidáním volných pravidel. Obě techniky používají pravděpodobnostní syntaktický analyzátor. Techniky byly testovány na korpusech ATIS a Susanne.
Návaznosti
GA201/05/2781, projekt VaV |
| ||
1ET100300414, projekt VaV |
|