Závěrečná práce: Radek Mejzlík: Kdo, co, o čem - TextVis aneb vizualizace obsahu textu
Bakalářská práce
Kdo, co, o čem - TextVis aneb vizualizace obsahu textu
Who, What, about What - TextVis or Text Content Visualisation
Anotace
Práce se zabývá problematikou automatické extrakce informací z nestrukturovaných textů v přirozeném jazyce jako jsou příspěvky na sociálních sítích či novinové články. Praktickou část práce tvoří analýza, návrh a implementace systému pro extrakci informací s názvem TextVis. Součástí systému je konzolová aplikace, jejímž účelem je identifikace entit a vztahů v česky psaných textech, analýza polarity …více
Abstract
The thesis explores the field of automatic information extraction from unstuctured natural language texts such as social media posts or news articles. The practical part of the thesis consists of the analysis, design and implementation of an information extraction system named TextVis. The system comes with a console application whose purpose is the detection of entities and their relations in Czech …více
Zadání práce
Analýza internetových textů slouží jako velice důležitý podklad pro aktuální mediální analýzy nejrůznějších jevů a situací, jako jsou např. volby, oblíbenost určitého výrobku nebo vztahy mezi známými osobnostmi a firmami. Všechny stávající produkty zakládají (zejména v případě češtiny) pouze na statistických výpočtech nad slovy a jejich četnostmi.
Cílem práce je navrhnout a implementovat systém, který využije metody a nástroje jazykové analýzy vyvinuté v Laboratoři zpracování přirozeného jazyka na FI MU pro extrakci a reprezentaci funkčních vztahů v internetových textech. Konkrétně systém zpracuje data z rozpoznaných pojmenovaných entit (osoby, firmy, místa, ...), ze syntaktické analýzy extrakce faktů (kdo, co, kde, ...) a z rozpoznání polarity textu (pozitivní/negativní). Tato data systém agreguje, zobecní nalezené vztahy a výsledek umožní efektivně prohledávat v podobě tabulek a síťových grafů. Vstupní texty pro analýzu budou pocházet z monitorovaných webových dokumentů typu blogy, novinové články nebo příspěvky na sociálních sítích.
Výsledná práce se bude skládat jednak z praktické části v podobě funkčního implementovaného systému, jednak z textové části obsahující přehled řešených projektů na podobné téma ve světě, popis použitých podkladových technik, analýzu, návrh a popis implementace vlastního systému a jeho ověření na netriviálních datech.
20. 5. 2022 13:45, doc. RNDr. Aleš Horák, Ph.D., učo 1648
Práce na příbuzné téma
Seznam prací, které mají shodná klíčová slova.
-
Interaktivní nástroj pro kontrolu uživatelských oprávnění
Ing. Patrik Martinek -
Webová aplikace pro tvorbu statických grafových vizualizací
Mgr. Jana Seko -
Detekce vztahů mezi postavami
Mgr. Pavlína Machová -
Webová knihovna materiálů pro Blender
Mgr. Lukáš Kakos -
Vizualizace vazeb digitálního technologického pasportu Masarykovy univerzity
Mgr. Břetislav Dančák -
Analýza a vizualizace výpočtů v nástroji Galaxy
Mgr. Tomáš Vondrák -
Vybrané aspekty kartografické vizualizace dat senzorů
Mgr. Karla Tynklová, učo 212865 -
Interaktivní vizualizace 3D molekulárních motivů
Mgr. Jan Richter




