2008
Extrakce strukturních informací z běžného textu na základě syntaktického analyzátoru
JAKUBÍČEK, MilošZákladní údaje
Originální název
Extrakce strukturních informací z běžného textu na základě syntaktického analyzátoru
Název anglicky
Structural Information Extraction from Common Texts Based on Syntactic Parser
Autoři
Vydání
2008
Nakladatel
Masarykova Univerzita
Další údaje
Jazyk
čeština
Typ výsledku
Odborná kniha
Obor
10201 Computer sciences, information science, bioinformatics
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Odkazy
Organizační jednotka
Fakulta informatiky
Klíčová slova česky
syntaktická analýza, syntaktické struktury, morfologická analýza, desambiguace, extrakce struktur, zpracování přirozeného jazyka
Klíčová slova anglicky
syntactic analysis, parsing, syntactic structures, morphological analysis, desambiguation, extraction of structures, natural language processing
Příznaky
Recenzováno
Změněno: 20. 10. 2010 13:06, RNDr. Miloš Jakubíček, Ph.D.
V originále
Práce popisuje využití syntaktického analyzátoru synt, vyvíjeného v Laboratoři zpracování přirozeného jazyka FI MU, k získání informací o syntaktických strukturách běžných vět v českém jazyce (jako jsou např. jmenné či slovesné skupiny), které z pohledu syntaktické analýzy zpravidla odpovídají neterminálům v gramatice, na základě které hledá analyzátor možná platná odvození zadané věty. Tento syntaktický analyzátor byl rozšířen tak, aby stávající výstup využil k extrakci těchto syntaktických struktur a umožnil různým způsobem jejich identifikaci. Za tímto účelem byly v analyzátoru rozpracovány i některé dosud nevyužité výsledky syntaktické analýzy, jež umožňují další zpřesnění morfologické analýzy, a tím i větší rozčlenění syntaktických (pod)struktur.
Anglicky
This thesis describes the utilization of syntactic parser synt (developed in the Natural language processing laboratory at FI MU) to gain information about syntactic structures (such as noun or verb phrases) of common sentences in Czech. These structures are from the analysis point of view usually identical to non-terminals in the grammar used by the parser to be searched for possible valid derivations of given sentence. This syntactic parser has been extended in such a way that enables the current output to be used to extracting those syntactic structures and give several ways how to identify them. To achieve this, some previously unused results of syntactic analysis have been evolved which led to more accurately morphological analysis and hence also deeper distinction among various syntactic (sub)structures.