JAKUBÍČEK, Miloš. Extrakce strukturních informací z běžného textu na základě syntaktického analyzátoru. Masarykova Univerzita, 2008.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Extrakce strukturních informací z běžného textu na základě syntaktického analyzátoru
Název anglicky Structural Information Extraction from Common Texts Based on Syntactic Parser
Autoři JAKUBÍČEK, Miloš.
Vydání 2008.
Nakladatel Masarykova Univerzita
Další údaje
Originální jazyk čeština
Typ výsledku Odborná kniha
Obor 10201 Computer sciences, information science, bioinformatics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
WWW URL
Organizační jednotka Fakulta informatiky
Klíčová slova česky syntaktická analýza, syntaktické struktury, morfologická analýza, desambiguace, extrakce struktur, zpracování přirozeného jazyka
Klíčová slova anglicky syntactic analysis, parsing, syntactic structures, morphological analysis, desambiguation, extraction of structures, natural language processing
Příznaky Recenzováno
Změnil Změnil: RNDr. Miloš Jakubíček, Ph.D., učo 172962. Změněno: 20. 10. 2010 13:06.
Anotace
Práce popisuje využití syntaktického analyzátoru synt, vyvíjeného v Laboratoři zpracování přirozeného jazyka FI MU, k získání informací o syntaktických strukturách běžných vět v českém jazyce (jako jsou např. jmenné či slovesné skupiny), které z pohledu syntaktické analýzy zpravidla odpovídají neterminálům v gramatice, na základě které hledá analyzátor možná platná odvození zadané věty. Tento syntaktický analyzátor byl rozšířen tak, aby stávající výstup využil k extrakci těchto syntaktických struktur a umožnil různým způsobem jejich identifikaci. Za tímto účelem byly v analyzátoru rozpracovány i některé dosud nevyužité výsledky syntaktické analýzy, jež umožňují další zpřesnění morfologické analýzy, a tím i větší rozčlenění syntaktických (pod)struktur.
Anotace anglicky
This thesis describes the utilization of syntactic parser synt (developed in the Natural language processing laboratory at FI MU) to gain information about syntactic structures (such as noun or verb phrases) of common sentences in Czech. These structures are from the analysis point of view usually identical to non-terminals in the grammar used by the parser to be searched for possible valid derivations of given sentence. This syntactic parser has been extended in such a way that enables the current output to be used to extracting those syntactic structures and give several ways how to identify them. To achieve this, some previously unused results of syntactic analysis have been evolved which led to more accurately morphological analysis and hence also deeper distinction among various syntactic (sub)structures.
VytisknoutZobrazeno: 17. 7. 2024 22:40