Diplomová práce

Automatické vyhledávání odpovědi na otázku

Automatic Question Answering System

Matej Pavla
Anotace

Automatické odpovedanie na otázky v prirodzenom jazyku (ang. Question Answering, QA) je jeden z najťažších problémov spracovania prirodzeného jazyka; Zahŕňa rozoznávanie anafor, znalosť situačného kontextu a inferencií, používanie synonym a celkové porozumenie daného textu, atď. Tieto problému nie sú zatiaľ uspokojivo vyriešené. Táto práca sa zameriava na špecifické prípady odpovedania na otázku: prípady …více

Abstract

Automatic answering of questions asked in natural language (Question Answering, QA) is one of the most difficult tasks of natural language processing; It includes detecting anaphoras, knowledge of situational context and inference, using synonyms and overall understanding of given text, etc. These are problems, which are not satisfactorily resolved, yet. This thesis will focus on more specific QA cases …více

Zadání práce

Automatické odpovídání na otázky v přirozeném jazyce (question answering, dále QA) je jedním z nejtěžších úkolů zpracování přirozeného jazyka. Zahrnuje např. rozpoznání anafor, znalost situačního kontextu a inference, využití synonymie a celkové porozumění textu apod., což jsou problémy, které dosud nejsou uspokojivě vyřešeny. Tato práce se bude zabývat zjednodušeným úkolem odpovídání na otázky, a to případem, kdy odpověď na otázku je explicitně obsažena ve zdrojovém textu (tj. práce se nebude zabývat vyplýváním, rozpoznáváním anafor atd.). Na druhou stranu je vyžadováno, aby odpověď na otázku byla co nejkratší a nejpřesnější, v ideálním případě jediná věta nebo její část.

Cílem práce je návrh a implementace systému pro odpovídání na otázky s výše popsanými omezeními s využitím syntaktické analýzy. Student vytvoří speciální sadu pravidel pro syntaktický analyzátor, která bude provádět analýzu vhodnou pro QA. Dále navrhne program, který na základě syntaktické analýzy dané otázky vyhledá nejvhodnější odpověď ve znalostní bázi, která bude tvořena texty zpracovanými tímtéž procesem syntaktické analýzy. Student vytvoří i základní webové rozhraní k systému.

Nedílnou součástí práce bude základní vyhodnocení úspěšnosti navrženého systému. Práce bude odevzdána jednak ve formě textu popisujícího teoretický úvod, popis a srovnání souvisejících projektů ve světě, analýzu, popis implementace a vyhodnocení vlastního systému, a jednak ve formě funkčního implementovaného systému schopného odpovídat na otázky z předem známé a analyzované sady českých textů (např. část české wikipedie).

Práce zkontrolována:
27. 5. 2014 08:28, doc. RNDr. Aleš Horák, Ph.D., učo 1648
Jazyk práce
angličtina angličtina
Termín obhajoby
24. 6. 2014
Práce byla úspěšně obhájena

Vedoucí

doc. RNDr. Aleš Horák, Ph.D., učo 1648
KSUZD FI MU

Oponent

RNDr. Zuzana Nevěřilová, Ph.D., učo 3839
ÚČJ FF MU

Konzultant

RNDr. Vojtěch Kovář, Ph.D., učo 139915
ÚČJ FF MU

Literatura

  • HORÁK, Aleš. Computer Processing of Czech Syntax and Semantics. 1st edition. Brno, Czech Republic: Librix.eu, 2008, 241 s. 1st edition. ISBN 978-80-7399-375-7.
  • KOVÁŘ, Vojtěch; Aleš HORÁK a Miloš JAKUBÍČEK. Syntactic Analysis as Pattern Matching: The SET Parsing System. In Proceedings of 4th Language & Technology Conference. Poznań (Poland): Wydawnictwo Poznańskie, 2009, s. 100-104. ISBN 978-83-7177-746-2.

Masarykova univerzita Fakulta informatiky
Studijní program
Aplikovaná informatika
 
Název
Vložil
Vloženo
Práva
Archiv závěrečné práce Matej Pavla FI N-AP AP rgjmi/8
Dvořáková, A.
12. 3. 2014
  • Přidání souboru

    Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
  • Další operace se soubory

    Podrobnosti lze zjistit označením příslušného řádku.
  • Pohled pro experty

    Pro častou práci je možné zvolit režim Více možností.
  • Vyhledávání souborů

    Vyhledávaný výraz můžete zadat přímo do adresního řádku.
  • Rychlý přístup k souborům

    Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.