Detailed Information on Publication Record
2011
Effective Parsing Using Competing CFG Rules
JAKUBÍČEK, MilošBasic information
Original name
Effective Parsing Using Competing CFG Rules
Authors
JAKUBÍČEK, Miloš (203 Czech Republic, guarantor, belonging to the institution)
Edition
Berlin, Heidelberg, Proceedings of Text, Speech and Dialogue 2011, p. 115-122, 8 pp. 2011
Publisher
Springer Verlag
Other information
Language
English
Type of outcome
Stať ve sborníku
Field of Study
10201 Computer sciences, information science, bioinformatics
Country of publisher
Czech Republic
Confidentiality degree
není předmětem státního či obchodního tajemství
References:
RIV identification code
RIV/00216224:14330/11:00049948
Organization unit
Faculty of Informatics
ISBN
978-3-642-23537-5
UT WoS
000312640500015
Keywords in English
parsing; syntactic analysis; CFG; competing rule
Tags
International impact, Reviewed
Změněno: 27/6/2012 12:01, RNDr. Miloš Jakubíček, Ph.D.
V originále
In this paper a new pruning method for a rule-based parser is described that relies on separating the underlying grammar rules into several mutually competing levels. This method has been developed and exploited for Czech in the syntactic parser Synt to reduce the number of possible output derivation trees. The algorithm behind operates on a so called packed forest of trees, a compressing data structure used for internal representation of parallel analyses, and thus performs very effectively. An evaluation of its contribution has been performed on the Brno Phrasal Treebank showing that the algorithm significantly prunes the resulting tree space while preserving perspective parses.
In Czech
Článek představuje novou prořezávací metodu pro pravidlový syntaktický analyzátor, která je založena na rozdělení gramatických pravidel do několika vzájemně se vylučujících úrovní. Tato metoda byla vyvinuta a využita pro český syntaktický analyzátor Synt za účelem snížení počtu výstupních syntaktických stromů. Související algoritmy jsou velmi efektivní díky tomu, že využívají kompresivní datové struktury, která zahrnuje všechny paralelní analýzy. Vyhodnocení přínosu vyvinuté metody bylo provedeno na stromovém korpusu Brno Phrasal Treebank a prokazuje výrazné snížení počtu výstupních stromů, aniž by tím zároveň byla dotčena přesnost analýzy.
Links
GAP401/10/0792, research and development project |
| ||
VF20102014003, research and development project |
| ||
248307, interní kód MU |
|