D
2005
Robust stochastic parsing: comparing two approaches for processing extra-grammatical sentences
AILOMAA, Marita; Vladimír KADLEC; Jean-Cédric CHAPPELIER a Martin RAJMAN
Základní údaje
Originální název
Robust stochastic parsing: comparing two approaches for processing extra-grammatical sentences
Název česky
Robustní syntaktická analýza: Porovnání dvou přístupů pro zpracování ne-gramatických vět
Autoři
AILOMAA, Marita (752 Švédsko); Vladimír KADLEC (203 Česká republika, garant); Jean-Cédric CHAPPELIER (756 Švýcarsko) a Martin RAJMAN (756 Švýcarsko)
Vydání
2005. vyd. Finland, Proceedings of the 15th Nordic Conference of Computational Linguistics (NODALIDA) 2005, od s. 21-29, 8 s. 2005
Nakladatel
University of Joensuu
Další údaje
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Utajení
není předmětem státního či obchodního tajemství
Kód RIV
RIV/00216224:14330/05:00012486
Organizační jednotka
Fakulta informatiky
Klíčová slova anglicky
robust; parsing; NLP
V originále
This paper compares two techniques for robust parsing of extra-grammatical natural language that might be of interest in large scale Textual Data Analysis applications. The first one returns a "correct" derivation for any extra-grammatical sentence by generating the finest corresponding most probable optimal maximum coverage. The second one extends the initial grammar by adding relaxed grammar rules in a controlled manner. Both techniques use a stochastic parser that selects a "best" solution among multiple analyses. The techniques were tested on the ATIS and Susanne corp ora and exp erimental results, as well as conclusions on performance comparison, are provided.
Česky
Článek porovnává dvě techniky pro robustní syntaktickou analýzu ne-gramatických vět. Tyto techniky mohou nalézt využití v šikokém spektru aplikací pro zpracování textových dat. První technika vrací "korektní" analýzu pro jakoukouliv ne-gramatickou větu vygenerováním příslušného nejpravděpodobnějšího optimálního maximálního pokrytí. Druhá technika rozšiřuje původní gramatiku přidáním volných pravidel. Obě techniky používají pravděpodobnostní syntaktický analyzátor. Techniky byly testovány na korpusech ATIS a Susanne.
Návaznosti
GA201/05/2781, projekt VaV | Název: Překlad českých vět do konstrukcí transparentní intenzionální logiky | Investor: Grantová agentura ČR, Překlad českých vět do konstrukcí transparentní intenzionální logiky |
|
1ET100300414, projekt VaV | Název: Inteligentní metody pro zvýšení spolehlivosti elektrických sítí | Investor: Akademie věd ČR, Inteligentní metody pro zvýšení spolehlivosti elektrických sítí |
|
Zobrazeno: 27. 8. 2025 19:27