D 2008

Extraction of Syntactic Structures Based on the Czech Parser Synt

JAKUBÍČEK, Miloš

Základní údaje

Originální název

Extraction of Syntactic Structures Based on the Czech Parser Synt

Název česky

Extrakce synaktických struktur na základě analyzátoru češtiny Synt

Autoři

JAKUBÍČEK, Miloš (203 Česká republika, garant)

Vydání

Brno, Proceedings of Recent Advances in Slavonic Natural Language Processing 2008, s. 56-62, 2008

Nakladatel

Masaryk University

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Kód RIV

RIV/00216224:14330/08:00024368

Organizační jednotka

Fakulta informatiky

ISBN

978-80-210-4741-9

UT WoS

000302212600010

Klíčová slova anglicky

synt;syntactic analysis;syntactic structures;parsing

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 20. 10. 2010 13:06, RNDr. Miloš Jakubíček, Ph.D.

Anotace

V originále

In this paper we describe the usage of the syntactic parser Synt to gain information about syntactic structures (such as noun or verb phrases) of common sentences in Czech. These structures are from the analysis point of view usually identical to nonterminals in the grammar used by the parser to find possible valid derivations of the given sentence. The parser has been extended in such a way that enables its highly ambiguous output to be used for extracting those syntactic structures unambiguously and gives several ways how to identify them. To achieve this, some previously unused results of syntactic analysis have been evolved leading to more precise morphological analysis and hence also deeper distinction among various syntactic (sub)structures. Finally, we present an application for shallow valency extraction.

Česky

Článek popisuje využití syntaktického analyzátoru Synt k získání informací o syntaktických strukturách z běžného českého textu. Tyto struktury z pohledu analýzy zpravidla odpovídají neterminálům v gramatice využívané parserem k nalezení platných odvození zadané věty. Tento parser byl rozšířen tak, aby nabízel několik způsobů, jak využít jeho masivně víceznačný výstup k jednoznačné extrakci syntaktických struktur. Za tímto účelem byly zapojeny i některé dosud nevyužité výsledky syntaktické analýzy vedoucí ke zpřesnění morfologické analýzy a tím i k většímu rozlišení různých syntaktických (pod)struktur. Závěrem je představeno využití pro hrubou extrakci slovesných valencí.

Návaznosti

1ET100300414, projekt VaV
Název: Inteligentní metody pro zvýšení spolehlivosti elektrických sítí
Investor: Akademie věd ČR, Inteligentní metody pro zvýšení spolehlivosti elektrických sítí
1ET100300419, projekt VaV
Název: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Akademie věd ČR, Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
2C06009, projekt VaV
Název: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce