2008
New Methods for Pruning and Ordering of Syntax Parsing Trees
KOVÁŘ, Vojtěch, Aleš HORÁK a Vladimír KADLECZákladní údaje
Originální název
New Methods for Pruning and Ordering of Syntax Parsing Trees
Název česky
Nové metody pro prořezávání a řazení syntaktických stromů
Autoři
KOVÁŘ, Vojtěch (203 Česká republika, domácí), Aleš HORÁK (203 Česká republika, garant, domácí) a Vladimír KADLEC (203 Česká republika)
Vydání
Berlin, Heidelberg, Proceedings of Text, Speech and Dialogue 2008, od s. 125-131, 7 s. 2008
Nakladatel
Springer
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Impakt faktor
Impact factor: 0.402 v roce 2005
Kód RIV
RIV/00216224:14330/08:00024306
Organizační jednotka
Fakulta informatiky
ISBN
978-3-540-87390-7
ISSN
UT WoS
000259634700018
Klíčová slova anglicky
syntactic analysis; parsing; natural language processing
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 8. 11. 2011 13:34, RNDr. Vojtěch Kovář, Ph.D.
V originále
Most robust rule-based syntax parsing techniques face the problem of high number of possible syntax trees as the output. There are two possible solutions to this: either release the request for robustness and provide special rules for uncovered phenomena, or equip the parser with filtering and ordering techniques. We describe the implementation and evaluation of the latter approach. In this paper, we present new techniques of pruning and ordering the resulting syntax trees in the Czech parser synt. We describe the principles of the methods and present results of measurements of effectiveness of these methods both per method and in combination, as computed for 10,000 corpus sentences.
Česky
Robustní techniky syntaktické analýzy přirozených jazyků se vyrovnávají s problémem velkého počtu možných syntaktických stromů na výstupu. Jedním z možných přístupů k tomuto problému je vybavení analyzátoru filtrovacími a řadícími metodami. Představujeme implementaci a vyhodnocení dvou nových technik řazení a filtrování v analyzátoru češtiny synt. Popisujeme principy těchto metod a měření efektivity a úspěšnosti pro 10 000 korpusových vět.
Návaznosti
GA201/05/2781, projekt VaV |
| ||
LC536, projekt VaV |
| ||
1ET100300414, projekt VaV |
|