D 2008

New Methods for Pruning and Ordering of Syntax Parsing Trees

KOVÁŘ, Vojtěch, Aleš HORÁK and Vladimír KADLEC

Basic information

Original name

New Methods for Pruning and Ordering of Syntax Parsing Trees

Name in Czech

Nové metody pro prořezávání a řazení syntaktických stromů

Authors

KOVÁŘ, Vojtěch (203 Czech Republic, belonging to the institution), Aleš HORÁK (203 Czech Republic, guarantor, belonging to the institution) and Vladimír KADLEC (203 Czech Republic)

Edition

Berlin, Heidelberg, Proceedings of Text, Speech and Dialogue 2008, p. 125-131, 7 pp. 2008

Publisher

Springer

Other information

Language

English

Type of outcome

Stať ve sborníku

Field of Study

10201 Computer sciences, information science, bioinformatics

Country of publisher

Czech Republic

Confidentiality degree

není předmětem státního či obchodního tajemství

Impact factor

Impact factor: 0.402 in 2005

RIV identification code

RIV/00216224:14330/08:00024306

Organization unit

Faculty of Informatics

ISBN

978-3-540-87390-7

ISSN

UT WoS

000259634700018

Keywords in English

syntactic analysis; parsing; natural language processing

Tags

International impact, Reviewed
Změněno: 8/11/2011 13:34, RNDr. Vojtěch Kovář, Ph.D.

Abstract

V originále

Most robust rule-based syntax parsing techniques face the problem of high number of possible syntax trees as the output. There are two possible solutions to this: either release the request for robustness and provide special rules for uncovered phenomena, or equip the parser with filtering and ordering techniques. We describe the implementation and evaluation of the latter approach. In this paper, we present new techniques of pruning and ordering the resulting syntax trees in the Czech parser synt. We describe the principles of the methods and present results of measurements of effectiveness of these methods both per method and in combination, as computed for 10,000 corpus sentences.

In Czech

Robustní techniky syntaktické analýzy přirozených jazyků se vyrovnávají s problémem velkého počtu možných syntaktických stromů na výstupu. Jedním z možných přístupů k tomuto problému je vybavení analyzátoru filtrovacími a řadícími metodami. Představujeme implementaci a vyhodnocení dvou nových technik řazení a filtrování v analyzátoru češtiny synt. Popisujeme principy těchto metod a měření efektivity a úspěšnosti pro 10 000 korpusových vět.

Links

GA201/05/2781, research and development project
Name: Překlad českých vět do konstrukcí transparentní intenzionální logiky
Investor: Czech Science Foundation, Translation of Czech Sentences to Transparent Intensional Logic Constructions
LC536, research and development project
Name: Centrum komputační lingvistiky
Investor: Ministry of Education, Youth and Sports of the CR, Centrum komputační lingvistiky
1ET100300414, research and development project
Name: Inteligentní metody pro zvýšení spolehlivosti elektrických sítí
Investor: Academy of Sciences of the Czech Republic, Intelligentmethods for incresing of reliability of electrical networks