2005
Robust stochastic parsing: comparing two approaches for processing extra-grammatical sentences
AILOMAA, Marita, Vladimír KADLEC, Jean-Cédric CHAPPELIER a Martin RAJMANZákladní údaje
Originální název
Robust stochastic parsing: comparing two approaches for processing extra-grammatical sentences
Název česky
Robustní syntaktická analýza: Porovnání dvou přístupů pro zpracování ne-gramatických vět
Autoři
AILOMAA, Marita (752 Švédsko), Vladimír KADLEC (203 Česká republika, garant), Jean-Cédric CHAPPELIER (756 Švýcarsko) a Martin RAJMAN (756 Švýcarsko)
Vydání
2005. vyd. Finland, Proceedings of the 15th Nordic Conference of Computational Linguistics (NODALIDA) 2005, od s. 21-29, 8 s. 2005
Nakladatel
University of Joensuu
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Finsko
Utajení
není předmětem státního či obchodního tajemství
Kód RIV
RIV/00216224:14330/05:00012486
Organizační jednotka
Fakulta informatiky
Klíčová slova anglicky
robust; parsing; NLP
Změněno: 19. 1. 2006 17:11, RNDr. Vladimír Kadlec, Ph.D.
V originále
This paper compares two techniques for robust parsing of extra-grammatical natural language that might be of interest in large scale Textual Data Analysis applications. The first one returns a "correct" derivation for any extra-grammatical sentence by generating the finest corresponding most probable optimal maximum coverage. The second one extends the initial grammar by adding relaxed grammar rules in a controlled manner. Both techniques use a stochastic parser that selects a "best" solution among multiple analyses. The techniques were tested on the ATIS and Susanne corp ora and exp erimental results, as well as conclusions on performance comparison, are provided.
Česky
Článek porovnává dvě techniky pro robustní syntaktickou analýzu ne-gramatických vět. Tyto techniky mohou nalézt využití v šikokém spektru aplikací pro zpracování textových dat. První technika vrací "korektní" analýzu pro jakoukouliv ne-gramatickou větu vygenerováním příslušného nejpravděpodobnějšího optimálního maximálního pokrytí. Druhá technika rozšiřuje původní gramatiku přidáním volných pravidel. Obě techniky používají pravděpodobnostní syntaktický analyzátor. Techniky byly testovány na korpusech ATIS a Susanne.
Návaznosti
GA201/05/2781, projekt VaV |
| ||
1ET100300414, projekt VaV |
|