D 2008

New Methods for Pruning and Ordering of Syntax Parsing Trees

KOVÁŘ, Vojtěch, Aleš HORÁK a Vladimír KADLEC

Základní údaje

Originální název

New Methods for Pruning and Ordering of Syntax Parsing Trees

Název česky

Nové metody pro prořezávání a řazení syntaktických stromů

Autoři

KOVÁŘ, Vojtěch (203 Česká republika, domácí), Aleš HORÁK (203 Česká republika, garant, domácí) a Vladimír KADLEC (203 Česká republika)

Vydání

Berlin, Heidelberg, Proceedings of Text, Speech and Dialogue 2008, od s. 125-131, 7 s. 2008

Nakladatel

Springer

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Impakt faktor

Impact factor: 0.402 v roce 2005

Kód RIV

RIV/00216224:14330/08:00024306

Organizační jednotka

Fakulta informatiky

ISBN

978-3-540-87390-7

ISSN

UT WoS

000259634700018

Klíčová slova anglicky

syntactic analysis; parsing; natural language processing

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 8. 11. 2011 13:34, RNDr. Vojtěch Kovář, Ph.D.

Anotace

V originále

Most robust rule-based syntax parsing techniques face the problem of high number of possible syntax trees as the output. There are two possible solutions to this: either release the request for robustness and provide special rules for uncovered phenomena, or equip the parser with filtering and ordering techniques. We describe the implementation and evaluation of the latter approach. In this paper, we present new techniques of pruning and ordering the resulting syntax trees in the Czech parser synt. We describe the principles of the methods and present results of measurements of effectiveness of these methods both per method and in combination, as computed for 10,000 corpus sentences.

Česky

Robustní techniky syntaktické analýzy přirozených jazyků se vyrovnávají s problémem velkého počtu možných syntaktických stromů na výstupu. Jedním z možných přístupů k tomuto problému je vybavení analyzátoru filtrovacími a řadícími metodami. Představujeme implementaci a vyhodnocení dvou nových technik řazení a filtrování v analyzátoru češtiny synt. Popisujeme principy těchto metod a měření efektivity a úspěšnosti pro 10 000 korpusových vět.

Návaznosti

GA201/05/2781, projekt VaV
Název: Překlad českých vět do konstrukcí transparentní intenzionální logiky
Investor: Grantová agentura ČR, Překlad českých vět do konstrukcí transparentní intenzionální logiky
LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
1ET100300414, projekt VaV
Název: Inteligentní metody pro zvýšení spolehlivosti elektrických sítí
Investor: Akademie věd ČR, Inteligentní metody pro zvýšení spolehlivosti elektrických sítí