Závěrečná práce: Matej Pavla: Automatické vyhledávání odpovědi na otázku
Diplomová práce
Automatické vyhledávání odpovědi na otázku
Automatic Question Answering System
Anotace
Automatické odpovedanie na otázky v prirodzenom jazyku (ang. Question Answering, QA) je jeden z najťažších problémov spracovania prirodzeného jazyka; Zahŕňa rozoznávanie anafor, znalosť situačného kontextu a inferencií, používanie synonym a celkové porozumenie daného textu, atď. Tieto problému nie sú zatiaľ uspokojivo vyriešené. Táto práca sa zameriava na špecifické prípady odpovedania na otázku: prípady …více
Abstract
Automatic answering of questions asked in natural language (Question Answering, QA) is one of the most difficult tasks of natural language processing; It includes detecting anaphoras, knowledge of situational context and inference, using synonyms and overall understanding of given text, etc. These are problems, which are not satisfactorily resolved, yet. This thesis will focus on more specific QA cases …více
Zadání práce
Automatické odpovídání na otázky v přirozeném jazyce (question answering, dále QA) je jedním z nejtěžších úkolů zpracování přirozeného jazyka. Zahrnuje např. rozpoznání anafor, znalost situačního kontextu a inference, využití synonymie a celkové porozumění textu apod., což jsou problémy, které dosud nejsou uspokojivě vyřešeny. Tato práce se bude zabývat zjednodušeným úkolem odpovídání na otázky, a to případem, kdy odpověď na otázku je explicitně obsažena ve zdrojovém textu (tj. práce se nebude zabývat vyplýváním, rozpoznáváním anafor atd.). Na druhou stranu je vyžadováno, aby odpověď na otázku byla co nejkratší a nejpřesnější, v ideálním případě jediná věta nebo její část.
Cílem práce je návrh a implementace systému pro odpovídání na otázky s výše popsanými omezeními s využitím syntaktické analýzy. Student vytvoří speciální sadu pravidel pro syntaktický analyzátor, která bude provádět analýzu vhodnou pro QA. Dále navrhne program, který na základě syntaktické analýzy dané otázky vyhledá nejvhodnější odpověď ve znalostní bázi, která bude tvořena texty zpracovanými tímtéž procesem syntaktické analýzy. Student vytvoří i základní webové rozhraní k systému.
Nedílnou součástí práce bude základní vyhodnocení úspěšnosti navrženého systému. Práce bude odevzdána jednak ve formě textu popisujícího teoretický úvod, popis a srovnání souvisejících projektů ve světě, analýzu, popis implementace a vyhodnocení vlastního systému, a jednak ve formě funkčního implementovaného systému schopného odpovídat na otázky z předem známé a analyzované sady českých textů (např. část české wikipedie).
27. 5. 2014 08:28, doc. RNDr. Aleš Horák, Ph.D., učo 1648
- Zadáno/změněno 24. 6. 2014 16:52, Helena Kryštofová
- Záznam založen 12. 3. 2014 13:23, Alena Dvořáková
- Zveřejnit od 26. 5. 2014 09:00, Alena Dvořáková
- Práce převzata 26. 5. 2014 09:00, Alena Dvořáková
Konzultant
Literatura
- HORÁK, Aleš. Computer Processing of Czech Syntax and Semantics. 1st edition. Brno, Czech Republic: Librix.eu, 2008, 241 s. 1st edition. ISBN 978-80-7399-375-7.
- KOVÁŘ, Vojtěch; Aleš HORÁK a Miloš JAKUBÍČEK. Syntactic Analysis as Pattern Matching: The SET Parsing System. In Proceedings of 4th Language & Technology Conference. Poznań (Poland): Wydawnictwo Poznańskie, 2009, s. 100-104. ISBN 978-83-7177-746-2.
Práce na příbuzné téma
Seznam prací, které mají shodná klíčová slova.
-
Návrh a implementace systému pro extrakci informací
Mgr. Martin Polák -
Maladie de Crohn – Traduction et analyse du texte spécialisé en médecine
Mgr. Kateřina Volfová -
Axes of Robustness of Neural Language Models
Mgr. Michal Štefánik, Ph.D., učo 422237 -
Analysis of Knowledge in Sentences
doc. RNDr. Aleš Horák, Ph.D., učo 1648 -
Issues Related to Translating Marketing Texts Produced by ICT Companies
Mgr. Petra Fusek, učo 261866 -
Madagascar: Guide culturel, traduction et analyse linguistique et traductologique
Bc. Pavlína Bělehradová -
Nástroje pro vyhledávání definic a použití v jazyce C
Mgr. Erich Duda -
Syntaktická problematika v současných učebnicích češtiny pro SŠ
Mgr. et Mgr. Alexandra Müllerová




