PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2021
Rozsah
2/1/0. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučováno online.
Vyučující
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
Mgr. Vít Nováček, PhD (přednášející)
Bc. Adam Bajger (pomocník)
Garance
doc. RNDr. Lubomír Popelínský, Ph.D.
Katedra strojového učení a zpracování dat - Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat - Fakulta informatiky
Předpoklady
Předpokládá se znalost základů strojového učení v rozsahu předmětu IB031 Úvod do strojového učení.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 54 mateřských oborů, zobrazit
Cíle předmětu
Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
Výstupy z učení
Student bude schopen
- předzpracovat textová data pro text mining;
- vytvořit systém pro analýzu textu pomocí metod strojového učení;
- porozumět vědeckým pracem z tohoto oboru;
- napsat technickou zprávu z této oblasti.
Osnova
  • Zpracování přirozeného jazyka. Korpusy. Nástroje.
  • Přehled metod strojového učení
  • Desambiguace. Morfologická desambiguace a desambiguace významu slov
  • Mělká syntaktická analýza a strojové učení
  • Kategorizace dokumentů
  • Extrakce informace z textu
  • Sumarizace,analýza sentimentu a další metody pro dolování v textu
  • Detekce anomálií v textu. Novelty detection
  • Keyness. Detekce klíčových slov
  • Shlukování dokumentů a termů
  • Web mining
Literatura
    doporučená literatura
  • Charu C. Aggarwal, Machine Learning for Text. Springer 2018
  • MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999. xxxvii, 68. ISBN 0-262-13360-1. info
  • LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007. xix, 532. ISBN 9783540378815. info
    neurčeno
  • Mining text data. Edited by Charu C. Aggarwal - ChengXiang Zhai. New York: Springer Science+Business Media, 2012. xi, 522. ISBN 9781461432227. info
Výukové metody
přednáška následovaná praktickými ukázkami a řešením projektu
Metody hodnocení
Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
Informace učitele
http://www.fi.muni.cz/~popel/lectures/ll/
Další komentáře
Předmět je vyučován každoročně.
Výuka probíhá každý týden.
Předmět je zařazen také v obdobích podzim 2003, podzim 2004, podzim 2005, podzim 2006, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2020.
  • Statistika zápisu (nejnovější)
  • Permalink: https://is.muni.cz/predmet/fi/podzim2021/PA164