B 2008

Extrakce strukturních informací z běžného textu na základě syntaktického analyzátoru

JAKUBÍČEK, Miloš

Základní údaje

Originální název

Extrakce strukturních informací z běžného textu na základě syntaktického analyzátoru

Název anglicky

Structural Information Extraction from Common Texts Based on Syntactic Parser

Vydání

2008

Nakladatel

Masarykova Univerzita

Další údaje

Jazyk

čeština

Typ výsledku

Odborná kniha

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Organizační jednotka

Fakulta informatiky

Klíčová slova česky

syntaktická analýza, syntaktické struktury, morfologická analýza, desambiguace, extrakce struktur, zpracování přirozeného jazyka

Klíčová slova anglicky

syntactic analysis, parsing, syntactic structures, morphological analysis, desambiguation, extraction of structures, natural language processing

Příznaky

Recenzováno
Změněno: 20. 10. 2010 13:06, RNDr. Miloš Jakubíček, Ph.D.

Anotace

V originále

Práce popisuje využití syntaktického analyzátoru synt, vyvíjeného v Laboratoři zpracování přirozeného jazyka FI MU, k získání informací o syntaktických strukturách běžných vět v českém jazyce (jako jsou např. jmenné či slovesné skupiny), které z pohledu syntaktické analýzy zpravidla odpovídají neterminálům v gramatice, na základě které hledá analyzátor možná platná odvození zadané věty. Tento syntaktický analyzátor byl rozšířen tak, aby stávající výstup využil k extrakci těchto syntaktických struktur a umožnil různým způsobem jejich identifikaci. Za tímto účelem byly v analyzátoru rozpracovány i některé dosud nevyužité výsledky syntaktické analýzy, jež umožňují další zpřesnění morfologické analýzy, a tím i větší rozčlenění syntaktických (pod)struktur.

Anglicky

This thesis describes the utilization of syntactic parser synt (developed in the Natural language processing laboratory at FI MU) to gain information about syntactic structures (such as noun or verb phrases) of common sentences in Czech. These structures are from the analysis point of view usually identical to non-terminals in the grammar used by the parser to be searched for possible valid derivations of given sentence. This syntactic parser has been extended in such a way that enables the current output to be used to extracting those syntactic structures and give several ways how to identify them. To achieve this, some previously unused results of syntactic analysis have been evolved which led to more accurately morphological analysis and hence also deeper distinction among various syntactic (sub)structures.