D 2006

Grammar Development for Czech Syntactic Parser with Corpus-based Techniques

KOVÁŘ, Vojtěch; Vladimír KADLEC a Aleš HORÁK

Základní údaje

Originální název

Grammar Development for Czech Syntactic Parser with Corpus-based Techniques

Název česky

Vývoj gramatik pro syntaktický analyzátor češtiny pomocí korpusových technik

Autoři

Vydání

Saint-Petersburg, Proceedings of Corpus Linguistic 2006, od s. 159-165, 7 s. 2006

Nakladatel

Saint-Petersburg State University

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Rusko

Utajení

není předmětem státního či obchodního tajemství

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14330/06:00015507

Organizační jednotka

Fakulta informatiky

ISBN

5-288-04181-4

Klíčová slova anglicky

parsing grammar czech corpus

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 20. 10. 2010 14:31, RNDr. Vojtěch Kovář, Ph.D.

Anotace

V originále

In the paper, we present the description of the Czech syntactic parser synt developed at FI MU NLP laboratory. The presented system is based on the meta-grammar formalism with a head-driven chart parser. The parsing technique provides fast analysis of the context free backbone with successive evaluation of the contextual constraints using so called ``forest of values.'' The meta-grammar formalism allows to capture complicated grammatic relations with a maintainable number of rules. Besides the description of the synt system, we display the process of the meta-grammar development. One of the first phases is formed by construction of corpus data for testing. In the paper, we demonstrate the exploitation of the corpus on testing a method for detection of the ``best analysis'' selection with the results of testing the synt analysis on Czech corpus.

Česky

V článku je prezentována metoda snižující snižující počet syntaktických struktur, které vrací syntaktický analyzátor češtiny synt.

Návaznosti

GA201/05/2781, projekt VaV
Název: Překlad českých vět do konstrukcí transparentní intenzionální logiky
Investor: Grantová agentura ČR, Překlad českých vět do konstrukcí transparentní intenzionální logiky
LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
1ET100300414, projekt VaV
Název: Inteligentní metody pro zvýšení spolehlivosti elektrických sítí
Investor: Akademie věd ČR, Inteligentní metody pro zvýšení spolehlivosti elektrických sítí