PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2024
Rozsah
2/1/0. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučováno prezenčně.
Vyučující
doc. Mgr. Bc. Vít Nováček, PhD (přednášející)
RNDr. Ondřej Sotolář (pomocník)
Garance
doc. Mgr. Bc. Vít Nováček, PhD
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky
Předpoklady
Předpokládá se základní znalost strojového učení v rozsahu předmětu IB031, počítačové lingvistiky v rozsahu PA153 a neuronových sítí v rozsahu PV021. Výuka probíhá v angličitně (v češtině jen pokud s tím studující souhlasí). Výstupy studentů mohou být anglicky, česky nebo slovensky (v jiném jazyce jen pokud s tím vyučující souhlasí).
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 29 mateřských oborů, zobrazit
Cíle předmětu
Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
Výstupy z učení
Student bude schopen
- předzpracovat textová data pro text mining;
- vytvořit systém pro analýzu textu pomocí metod strojového učení;
- porozumět vědeckým pracem z tohoto oboru;
- napsat technickou zprávu z této oblasti.
Osnova
  • Přehled kurzu, ukázka pipeline (před)zpracování textu
  • Rychlý a špinavý úvod do ML
  • Distribuční sémantika, LSA, slovní vložky
  • Hluboké neuronové sítě pro NLP
  • Jazykové modely a jejich aplikace
  • AutoML pro NLP
  • Studentská posterová sekce (sekce), včetně rozsáhlé zpětné vazby během práce studentů a její prezentace
  • Příklad aplikace: analýza sentimentu
  • Příklad aplikace: získávání znalostí z textu
  • Zvané přednášk(y) mezinárodních odborníků o různých aplikacích ML v oblasti NLP
  • Prezentace závěrečného projektu
Výukové metody
přednáška následovaná samostatnou prací a praktickými ukázkami ve cvičeních, řešení projektu
Metody hodnocení
Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení jsou prezentace projektu.
Vyučovací jazyk
Angličtina
Další komentáře
Předmět je vyučován každoročně.
Výuka probíhá každý týden.
Předmět je zařazen také v obdobích podzim 2003, podzim 2004, podzim 2005, podzim 2006, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2020, podzim 2021, podzim 2022, podzim 2023.

PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2023
Rozsah
2/1/0. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučováno prezenčně.
Vyučující
doc. Mgr. Bc. Vít Nováček, PhD (přednášející)
Garance
doc. Mgr. Bc. Vít Nováček, PhD
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky
Rozvrh
Po 14:00–15:50 A318
  • Rozvrh seminárních/paralelních skupin:
PA164/01: St 27. 9. až St 6. 12. každou lichou středu 18:00–19:50 C525, V. Nováček
Předpoklady
Předpokládá se základní znalost strojového učení v rozsahu předmětu IB031, počítačové lingvistiky v rozsahu PA153 a neuronových sítí v rozsahu PV021. Výuka probíhá v angličitně (v češtině jen pokud s tím studující souhlasí). Výstupy studentů mohou být anglicky, česky nebo slovensky (v jiném jazyce jen pokud s tím vyučující souhlasí).
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 55 mateřských oborů, zobrazit
Cíle předmětu
Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
Výstupy z učení
Student bude schopen
- předzpracovat textová data pro text mining;
- vytvořit systém pro analýzu textu pomocí metod strojového učení;
- porozumět vědeckým pracem z tohoto oboru;
- napsat technickou zprávu z této oblasti.
Osnova
  • Přehled kurzu, ukázka pipeline (před)zpracování textu
  • Rychlý a špinavý úvod do ML
  • Distribuční sémantika, LSA, slovní vložky
  • Hluboké neuronové sítě pro NLP
  • Jazykové modely a jejich aplikace
  • AutoML pro NLP
  • Studentská posterová sekce (sekce), včetně rozsáhlé zpětné vazby během práce studentů a její prezentace
  • Příklad aplikace: analýza sentimentu
  • Příklad aplikace: získávání znalostí z textu
  • Zvané přednášk(y) mezinárodních odborníků o různých aplikacích ML v oblasti NLP
  • Prezentace závěrečného projektu
Literatura
    doporučená literatura
  • Chang, Yupeng, et al. "A survey on evaluation of large language models." ACM Transactions on Intelligent Systems and Technology 15.3 (2024): 1-45.
  • Zhao, Wayne Xin, et al. "A survey of large language models." arXiv preprint arXiv:2303.18223 (2023).
  • Charu C. Aggarwal, Machine Learning for Text. Springer 2018
  • Mining text data. Edited by Charu C. Aggarwal - ChengXiang Zhai. New York: Springer Science+Business Media, 2012, xi, 522. ISBN 9781461432227. info
  • MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
Výukové metody
přednáška následovaná samostatnou prací a praktickými ukázkami ve cvičeních, řešení projektu
Metody hodnocení
Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení jsou prezentace projektu.
Vyučovací jazyk
Angličtina
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2003, podzim 2004, podzim 2005, podzim 2006, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2020, podzim 2021, podzim 2022, podzim 2024.

PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2022
Rozsah
2/1/0. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučováno prezenčně.
Vyučující
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
doc. Mgr. Bc. Vít Nováček, PhD (přednášející)
RNDr. Ondřej Sotolář (pomocník)
Garance
doc. RNDr. Lubomír Popelínský, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky
Rozvrh
Po 14:00–15:50 A217
  • Rozvrh seminárních/paralelních skupin:
PA164/01: každou sudou středu 18:00–19:50 B116, V. Nováček
Předpoklady
Předpokládá se základní znalost strojového učení v rozsahu předmětu IB031, počítačové lingvistiky v rozsahu PA153 a neuronových sítí v rozsahu PV021. Výuka probíhá v angličitně (v češtině jen pokud s tím studující souhlasí). Výstupy studentů mohou být anglicky, česky nebo slovensky (v jiném jazyce jen pokud s tím vyučující souhlasí).
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 55 mateřských oborů, zobrazit
Cíle předmětu
Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
Výstupy z učení
Student bude schopen
- předzpracovat textová data pro text mining;
- vytvořit systém pro analýzu textu pomocí metod strojového učení;
- porozumět vědeckým pracem z tohoto oboru;
- napsat technickou zprávu z této oblasti.
Osnova
  • Zpracování přirozeného jazyka. Korpusy. Nástroje.
  • Přehled metod strojového učení
  • Desambiguace. Morfologická desambiguace a desambiguace významu slov
  • Mělká syntaktická analýza a strojové učení
  • Kategorizace dokumentů
  • Extrakce informace z textu
  • Sumarizace,analýza sentimentu a další metody pro dolování v textu
  • Detekce anomálií v textu. Novelty detection
  • Keyness. Detekce klíčových slov
  • Shlukování dokumentů a termů
  • Web mining
Literatura
    doporučená literatura
  • Charu C. Aggarwal, Machine Learning for Text. Springer 2018
  • MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
  • LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
    neurčeno
  • Mining text data. Edited by Charu C. Aggarwal - ChengXiang Zhai. New York: Springer Science+Business Media, 2012, xi, 522. ISBN 9781461432227. info
Výukové metody
přednáška následovaná praktickými ukázkami a řešením projektu
Metody hodnocení
Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
Vyučovací jazyk
Angličtina
Informace učitele
http://www.fi.muni.cz/~popel/lectures/ll/
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2003, podzim 2004, podzim 2005, podzim 2006, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2020, podzim 2021, podzim 2023, podzim 2024.

PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2021
Rozsah
2/1/0. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučováno prezenčně.
Vyučující
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
doc. Mgr. Bc. Vít Nováček, PhD (přednášející)
Garance
doc. RNDr. Lubomír Popelínský, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky
Rozvrh
Čt 16. 9. až Čt 9. 12. Čt 12:00–13:50 A318
  • Rozvrh seminárních/paralelních skupin:
PA164/01: Čt 23. 9. až Čt 2. 12. každý sudý čtvrtek 18:00–19:50 B117, V. Nováček
Předpoklady
Předpokládá se základní znalost strojového učení v rozsahu předmětu IB031, počítačové lingvistiky v rozsahu PA153 a neuronových sítí v rozsahu PV021. Výuka probíhá v angličitně (v češtině jen pokud s tím studující souhlasí). Výstupy studentů mohou být anglicky, česky nebo slovensky (v jiném jazyce jen pokud s tím vyučující souhlasí).
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 54 mateřských oborů, zobrazit
Cíle předmětu
Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
Výstupy z učení
Student bude schopen
- předzpracovat textová data pro text mining;
- vytvořit systém pro analýzu textu pomocí metod strojového učení;
- porozumět vědeckým pracem z tohoto oboru;
- napsat technickou zprávu z této oblasti.
Osnova
  • Zpracování přirozeného jazyka. Korpusy. Nástroje.
  • Přehled metod strojového učení
  • Desambiguace. Morfologická desambiguace a desambiguace významu slov
  • Mělká syntaktická analýza a strojové učení
  • Kategorizace dokumentů
  • Extrakce informace z textu
  • Sumarizace,analýza sentimentu a další metody pro dolování v textu
  • Detekce anomálií v textu. Novelty detection
  • Keyness. Detekce klíčových slov
  • Shlukování dokumentů a termů
  • Web mining
Literatura
    doporučená literatura
  • Charu C. Aggarwal, Machine Learning for Text. Springer 2018
  • MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
  • LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
    neurčeno
  • Mining text data. Edited by Charu C. Aggarwal - ChengXiang Zhai. New York: Springer Science+Business Media, 2012, xi, 522. ISBN 9781461432227. info
Výukové metody
přednáška následovaná praktickými ukázkami a řešením projektu
Metody hodnocení
Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
Vyučovací jazyk
Angličtina
Informace učitele
http://www.fi.muni.cz/~popel/lectures/ll/
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2003, podzim 2004, podzim 2005, podzim 2006, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2020, podzim 2022, podzim 2023, podzim 2024.

PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2020
Rozsah
2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučováno online.
Vyučující
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
Mgr. Adam Bajger (pomocník)
Garance
doc. RNDr. Lubomír Popelínský, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky
Rozvrh
Po 9:00–11:50 A318
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 54 mateřských oborů, zobrazit
Cíle předmětu
Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
Výstupy z učení
Student bude schopen
- předzpracovat textová data pro text mining;
- vytvořit systém pro analýzu textu pomocí metod strojového učení;
- porozumět vědeckým pracem z tohoto oboru;
- napsat technickou zprávu z této oblasti.
Osnova
  • Zpracování přirozeného jazyka. Korpusy. Nástroje.
  • Přehled metod strojového učení
  • Desambiguace. Morfologická desambiguace a desambiguace významu slov
  • Mělká syntaktická analýza a strojové učení
  • Kategorizace dokumentů
  • Extrakce informace z textu
  • Sumarizace,analýza sentimentu a další metody pro dolování v textu
  • Web mining
  • Aplikace: texty s časově-prostorovou informací, biomedicínské a biologické texty
Literatura
    doporučená literatura
  • LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
  • MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
    neurčeno
  • Mining text data. Edited by Charu C. Aggarwal - ChengXiang Zhai. New York: Springer Science+Business Media, 2012, xi, 522. ISBN 9781461432227. info
Výukové metody
přednáška následovaná praktickými ukázkami a řešením projektu
Metody hodnocení
Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
Informace učitele
http://www.fi.muni.cz/~popel/lectures/ll/
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2003, podzim 2004, podzim 2005, podzim 2006, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2021, podzim 2022, podzim 2023, podzim 2024.

PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2018
Rozsah
2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
RNDr. Karel Vaculík, Ph.D. (pomocník)
Mgr. Veronika Krejčířová (pomocník)
Garance
prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky
Dodavatelské pracoviště: Katedra teorie programování – Fakulta informatiky
Rozvrh
St 8:00–10:50 C513
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 25 mateřských oborů, zobrazit
Cíle předmětu
Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
Výstupy z učení
Student bude schopen
- předzpracovat textová data pro text mining;
- vytvořit systém pro analýzu textu pomocí metod strojového učení;
- porozumět vědeckým pracem z tohoto oboru;
- napsat technickou zprávu z této oblasti.
Osnova
  • Zpracování přirozeného jazyka. Korpusy. Nástroje.
  • Přehled metod strojového učení
  • Desambiguace. Morfologická desambiguace a desambiguace významu slov
  • Mělká syntaktická analýza a strojové učení
  • Kategorizace dokumentů
  • Extrakce informace z textu
  • Sumarizace,analýza sentimentu a další metody pro dolování v textu
  • Web mining
  • Aplikace: texty s časově-prostorovou informací, biomedicínské a biologické texty
Literatura
    doporučená literatura
  • LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
  • MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
    neurčeno
  • Mining text data. Edited by Charu C. Aggarwal - ChengXiang Zhai. New York: Springer Science+Business Media, 2012, xi, 522. ISBN 9781461432227. info
Výukové metody
přednáška následovaná praktickými ukázkami a řešením projektu
Metody hodnocení
Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
Informace učitele
http://www.fi.muni.cz/~popel/lectures/ll/
Předmět je zařazen také v obdobích podzim 2003, podzim 2004, podzim 2005, podzim 2006, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2020, podzim 2021, podzim 2022, podzim 2023, podzim 2024.

PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2017
Rozsah
2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
RNDr. Karel Vaculík, Ph.D. (pomocník)
Mgr. Veronika Krejčířová (pomocník)
Garance
prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky
Dodavatelské pracoviště: Katedra teorie programování – Fakulta informatiky
Rozvrh
Po 9:00–11:50 C525
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 25 mateřských oborů, zobrazit
Cíle předmětu
Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
Výstupy z učení
Student bude schopen
- předzpracovat textová data pro text mining;
- vytvořit systém pro analýzu textu pomocí metod strojového učení;
- porozumět vědeckým pracem z tohoto oboru;
- napsat technickou zprávu z této oblasti.
Osnova
  • Zpracování přirozeného jazyka. Korpusy. Nástroje.
  • Přehled metod strojového učení
  • Desambiguace. Morfologická desambiguace a desambiguace významu slov
  • Mělká syntaktická analýza a strojové učení
  • Kategorizace dokumentů
  • Extrakce informace z textu
  • Sumarizace,analýza sentimentu a další metody pro dolování v textu
  • Web mining
  • Aplikace: texty s časově-prostorovou informací, biomedicínské a biologické texty
Literatura
    doporučená literatura
  • LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
  • MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
    neurčeno
  • Mining text data. Edited by Charu C. Aggarwal - ChengXiang Zhai. New York: Springer Science+Business Media, 2012, xi, 522. ISBN 9781461432227. info
Výukové metody
přednáška následovaná praktickými ukázkami a řešením projektu
Metody hodnocení
Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
Informace učitele
http://www.fi.muni.cz/~popel/lectures/ll/
Další komentáře
Studijní materiály
Předmět je zařazen také v obdobích podzim 2003, podzim 2004, podzim 2005, podzim 2006, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2018, podzim 2020, podzim 2021, podzim 2022, podzim 2023, podzim 2024.

PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2016
Rozsah
2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
RNDr. Karel Vaculík, Ph.D. (pomocník)
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
Mgr. Jan Sedlák (pomocník)
Garance
prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky
Dodavatelské pracoviště: Katedra teorie programování – Fakulta informatiky
Rozvrh
St 10:00–12:50 B411
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 25 mateřských oborů, zobrazit
Cíle předmětu
Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
Osnova
  • Zpracování přirozeného jazyka. Korpusy. Nástroje.
  • Přehled metod strojového učení
  • Desambiguace. Morfologická desambiguace a desambiguace významu slov
  • Mělká syntaktická analýza a strojové učení
  • Kategorizace dokumentů
  • Extrakce informace z textu
  • Sumarizace,analýza sentimentu a další metody pro dolování v textu
  • Web mining
  • Aplikace: texty s časově-prostorovou informací, biomedicínské a biologické texty
Literatura
    doporučená literatura
  • LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
  • MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
    neurčeno
  • Mining text data. Edited by Charu C. Aggarwal - ChengXiang Zhai. New York: Springer Science+Business Media, 2012, xi, 522. ISBN 9781461432227. info
Výukové metody
přednáška následovaná praktickými ukázkami a řešením projektu
Metody hodnocení
Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
Informace učitele
http://www.fi.muni.cz/~popel/lectures/ll/
Další komentáře
Studijní materiály
Předmět je zařazen také v obdobích podzim 2003, podzim 2004, podzim 2005, podzim 2006, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2017, podzim 2018, podzim 2020, podzim 2021, podzim 2022, podzim 2023, podzim 2024.

PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2015
Rozsah
2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
RNDr. Karel Vaculík, Ph.D. (pomocník)
RNDr. Hana Bydžovská, Ph.D. (pomocník)
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
Garance
prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky
Dodavatelské pracoviště: Katedra teorie programování – Fakulta informatiky
Rozvrh
Út 8:00–9:50 C416
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 25 mateřských oborů, zobrazit
Cíle předmětu
Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
Osnova
  • Zpracování přirozeného jazyka. Korpusy. Nástroje.
  • Přehled metod strojového učení
  • Desambiguace. Morfologická desambiguace a desambiguace významu slov
  • Mělká syntaktická analýza a strojové učení
  • Kategorizace dokumentů
  • Extrakce informace z textu
  • Sumarizace,analýza sentimentu a další metody pro dolování v textu
  • Web mining
  • Aplikace: texty s časově-prostorovou informací, biomedicínské a biologické texty
Literatura
    doporučená literatura
  • LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
  • MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
    neurčeno
  • Mining text data. Edited by Charu C. Aggarwal - ChengXiang Zhai. New York: Springer Science+Business Media, 2012, xi, 522. ISBN 9781461432227. info
Výukové metody
přednáška následovaná praktickými ukázkami a řešením projektu
Metody hodnocení
Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
Informace učitele
http://www.fi.muni.cz/~popel/lectures/ll/
Další komentáře
Studijní materiály
Předmět je zařazen také v obdobích podzim 2003, podzim 2004, podzim 2005, podzim 2006, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2016, podzim 2017, podzim 2018, podzim 2020, podzim 2021, podzim 2022, podzim 2023, podzim 2024.

PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2014
Rozsah
2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
RNDr. Hana Bydžovská, Ph.D. (pomocník)
Mgr. Lukáš Másilko (pomocník)
RNDr. Karel Vaculík, Ph.D. (pomocník)
Garance
prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky
Dodavatelské pracoviště: Katedra teorie programování – Fakulta informatiky
Rozvrh
Út 8:00–9:50 C511
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 24 mateřských oborů, zobrazit
Cíle předmětu
Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
Osnova
  • Zpracování přirozeného jazyka. Korpusy. Nástroje.
  • Přehled metod strojového učení
  • Desambiguace. Morfologická desambiguace a desambiguace významu slov
  • Mělká syntaktická analýza a strojové učení
  • Kategorizace dokumentů
  • Extrakce informace z textu
  • Další metody pro dolování v textu
  • Web mining
  • Aplikace: texty s časově-prostorovou informací, biomedicínské a biologické texty
Literatura
    doporučená literatura
  • MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
  • Learning language in logic. Edited by Sašo Džeroski - James Cussens. Berlin: Springer, 2000, x, 299. ISBN 3540411453. info
  • LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
Výukové metody
přednáška následovaná praktickými ukázkami a řešením projektu
Metody hodnocení
Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
Informace učitele
http://www.fi.muni.cz/~popel/lectures/ll/
Další komentáře
Studijní materiály
Předmět je zařazen také v obdobích podzim 2003, podzim 2004, podzim 2005, podzim 2006, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2020, podzim 2021, podzim 2022, podzim 2023, podzim 2024.

PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2013
Rozsah
2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
Mgr. Juraj Jurčo (pomocník)
RNDr. Karel Vaculík, Ph.D. (pomocník)
Garance
prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky
Dodavatelské pracoviště: Katedra teorie programování – Fakulta informatiky
Rozvrh
Út 12:00–13:50 B410
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 24 mateřských oborů, zobrazit
Cíle předmětu
Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
Osnova
  • Zpracování přirozeného jazyka. Korpusy. Nástroje.
  • Přehled metod strojového učení
  • Desambiguace. Morfologická desambiguace a desambiguace významu slov
  • Mělká syntaktická analýza a strojové učení
  • Kategorizace dokumentů
  • Extrakce informace z textu
  • Další metody pro dolování v textu
  • Web mining
  • Aplikace: texty s časově-prostorovou informací, biomedicínské a biologické texty
Literatura
    doporučená literatura
  • MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
  • Learning language in logic. Edited by Sašo Džeroski - James Cussens. Berlin: Springer, 2000, x, 299. ISBN 3540411453. info
  • LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
Výukové metody
přednáška následovaná praktickými ukázkami a řešením projektu
Metody hodnocení
Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
Informace učitele
http://www.fi.muni.cz/~popel/lectures/ll/
Předmět je zařazen také v obdobích podzim 2003, podzim 2004, podzim 2005, podzim 2006, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2020, podzim 2021, podzim 2022, podzim 2023, podzim 2024.

PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2012
Rozsah
2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
Mgr. Juraj Jurčo (pomocník)
Garance
prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky
Dodavatelské pracoviště: Katedra teorie programování – Fakulta informatiky
Rozvrh
St 10:00–11:50 B410
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 24 mateřských oborů, zobrazit
Cíle předmětu
Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
Osnova
  • Zpracování přirozeného jazyka. Korpusy. Nástroje.
  • Přehled metod strojového učení
  • Desambiguace. Morfologická desambiguace a desambiguace významu slov
  • Mělká syntaktická analýza a strojové učení
  • Kategorizace dokumentů
  • Extrakce informace z textu
  • Další metody pro dolování v textu
  • Web mining
  • Aplikace: texty s časově-prostorovou informací, biomedicínské a biologické texty
Literatura
    doporučená literatura
  • MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
  • Learning language in logic. Edited by Sašo Džeroski - James Cussens. Berlin: Springer, 2000, x, 299. ISBN 3540411453. info
  • LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
Výukové metody
přednáška následovaná praktickými ukázkami a řešením projektu
Metody hodnocení
Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
Informace učitele
http://www.fi.muni.cz/~popel/lectures/ll/
Další komentáře
Studijní materiály
Předmět je zařazen také v obdobích podzim 2003, podzim 2004, podzim 2005, podzim 2006, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2020, podzim 2021, podzim 2022, podzim 2023, podzim 2024.

PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2011
Rozsah
2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
Mgr. Jan Knotek (pomocník)
RNDr. Petr Kosina, Ph.D. (pomocník)
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
Garance
prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky
Rozvrh
St 14:00–15:50 B411, St 16:00–16:50 B001
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 24 mateřských oborů, zobrazit
Cíle předmětu
Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
Osnova
  • Zpracování přirozeného jazyka. Korpusy. Nástroje.
  • Přehled metod strojového učení
  • Desambiguace. Morfologická desambiguace a desambiguace významu slov
  • Mělká syntaktická analýza a strojové učení
  • Kategorizace dokumentů
  • Extrakce informace z textu
  • Další metody pro dolování v textu
  • Dolování v hypertextu a WWW
Literatura
  • MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
  • Learning language in logic. Edited by Sašo Džeroski - James Cussens. Berlin: Springer, 2000, x, 299. ISBN 3540411453. info
Výukové metody
přednáška následovaná praktickými ukázkami a řešením projektu
Metody hodnocení
Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
Informace učitele
http://www.fi.muni.cz/~popel/lectures/ll/
Další komentáře
Studijní materiály
Předmět je zařazen také v obdobích podzim 2003, podzim 2004, podzim 2005, podzim 2006, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2020, podzim 2021, podzim 2022, podzim 2023, podzim 2024.

PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2010
Rozsah
2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
Mgr. Jan Knotek (pomocník)
RNDr. Petr Kosina, Ph.D. (pomocník)
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
Garance
prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky
Rozvrh
Út 12:00–13:50 B411
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 23 mateřských oborů, zobrazit
Cíle předmětu
Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
Osnova
  • Zpracování přirozeného jazyka. Korpusy. Nástroje.
  • Přehled metod strojového učení
  • Desambiguace. Morfologická desambiguace a desambiguace významu slov
  • Mělká syntaktická analýza a strojové učení
  • Kategorizace dokumentů
  • Extrakce informace z textu
  • Další metody pro dolování v textu
  • Dolování v hypertextu a WWW
Literatura
  • MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
  • Learning language in logic. Edited by Sašo Džeroski - James Cussens. Berlin: Springer, 2000, x, 299. ISBN 3540411453. info
Výukové metody
přednáška následovaná praktickými ukázkami a řešením projektu
Metody hodnocení
Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
Informace učitele
http://www.fi.muni.cz/~popel/lectures/ll/
Další komentáře
Studijní materiály
Předmět je zařazen také v obdobích podzim 2003, podzim 2004, podzim 2005, podzim 2006, podzim 2007, podzim 2008, podzim 2009, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2020, podzim 2021, podzim 2022, podzim 2023, podzim 2024.

PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2009
Rozsah
2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
RNDr. Petr Kosina, Ph.D. (pomocník)
RNDr. Antonín Pavelka, Ph.D. (pomocník)
Garance
prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky
Rozvrh
Út 8:00–10:50 B410
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 22 mateřských oborů, zobrazit
Cíle předmětu
Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
Osnova
  • Zpracování přirozeného jazyka. Korpusy. Nástroje.
  • Přehled metod strojového učení
  • Desambiguace. Morfologická desambiguace a desambiguace významu slov
  • Mělká a úplná syntaktická analýza a strojové učení
  • Kategorizace dokumentů
  • Extrakce informace z textu
  • Další metody pro dolování v textu
  • Dolování v hypertextu a WWW
  • Sémantický web a tvorba ontologií
Literatura
  • MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
  • Learning language in logic. Edited by Sašo Džeroski - James Cussens. Berlin: Springer, 2000, x, 299. ISBN 3540411453. info
Výukové metody
přednáška následovaná praktickými cvičeními a řešením projektu
Metody hodnocení
Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
Informace učitele
http://www.fi.muni.cz/~popel/lectures/ll/
Další komentáře
Studijní materiály
Předmět je zařazen také v obdobích podzim 2003, podzim 2004, podzim 2005, podzim 2006, podzim 2007, podzim 2008, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2020, podzim 2021, podzim 2022, podzim 2023, podzim 2024.

PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2008
Rozsah
2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
RNDr. Jan Blaťák, Ph.D. (cvičící)
Garance
prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky
Rozvrh
Út 12:00–13:50 B410
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 18 mateřských oborů, zobrazit
Cíle předmětu
Přehled učicích metod a systémů pro zpracování přirozeného jazyka. Součástí předmětu je projekt.
Osnova
  • Zpracování přirozeného jazyka. Korpusy. Nástroje.
  • Přehled metod strojového učení
  • Desambiguace. Morfologická desambiguace a desambiguace významu slov
  • Mělká a úplná syntaktická analýza a strojové učení
  • Kategorizace dokumentů
  • Extrakce informace z textu
  • Další metody pro dolování v textu
  • Dolování v hypertextu a WWW
  • Sémantický web a tvorba ontologií
Literatura
  • MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
  • Learning language in logic. Edited by Sašo Džeroski - James Cussens. Berlin: Springer, 2000, x, 299. ISBN 3540411453. info
Metody hodnocení
Součástí předmětu je projekt.
Informace učitele
http://www.fi.muni.cz/~popel/lectures/ll/
Další komentáře
Studijní materiály
Předmět je zařazen také v obdobích podzim 2003, podzim 2004, podzim 2005, podzim 2006, podzim 2007, podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2020, podzim 2021, podzim 2022, podzim 2023, podzim 2024.

PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2007
Rozsah
2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
RNDr. Jan Blaťák, Ph.D. (cvičící)
Garance
prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky
Rozvrh
St 9:00–11:50 B411
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 18 mateřských oborů, zobrazit
Cíle předmětu
Přehled učicích metod a systémů pro zpracování přirozeného jazyka. Součástí předmětu je projekt.
Osnova
  • Zpracování přirozeného jazyka. Korpusy. Nástroje.
  • Přehled metod strojového učení
  • Desambiguace. Morfologická desambiguace a desambiguace významu slov
  • Mělká a úplná syntaktická analýza a strojové učení
  • Kategorizace dokumentů
  • Extrakce informace z textu
  • Další metody pro dolování v textu
  • Dolování v hypertextu a WWW
  • Sémantický web a tvorba ontologií
Literatura
  • MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
  • Learning language in logic. Edited by Sašo Džeroski - James Cussens. Berlin: Springer, 2000, x, 299. ISBN 3540411453. info
Metody hodnocení
Součástí předmětu je projekt.
Informace učitele
http://www.fi.muni.cz/~popel/lectures/ll/
Předmět je zařazen také v obdobích podzim 2003, podzim 2004, podzim 2005, podzim 2006, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2020, podzim 2021, podzim 2022, podzim 2023, podzim 2024.

PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2006
Rozsah
2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
RNDr. Jan Blaťák, Ph.D. (cvičící)
Garance
prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky
Rozvrh
St 12:00–13:50 B411, St 14:00–14:50 B001
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 6 mateřských oborů, zobrazit
Cíle předmětu
Přehled učicích metod a systémů pro zpracování přirozeného jazyka. Součástí předmětu je projekt.
Osnova
  • Zpracování přirozeného jazyka. Korpusy. Nástroje.
  • Přehled metod strojového učení
  • Desambiguace. Morfologická desambiguace a desambiguace významu slov
  • Mělká a úplná syntaktická analýza a strojové učení
  • Kategorizace dokumentů
  • Extrakce informace z textu
  • Další metody pro dolování v textu
  • Dolování v hypertextu a WWW
  • Sémantický web a tvorba ontologií
Literatura
  • MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
  • Learning language in logic. Edited by Sašo Džeroski - James Cussens. Berlin: Springer, 2000, x, 299. ISBN 3540411453. info
Metody hodnocení
Součástí předmětu je projekt.
Informace učitele
http://www.fi.muni.cz/~popel/lectures/ll/
Předmět je zařazen také v obdobích podzim 2003, podzim 2004, podzim 2005, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2020, podzim 2021, podzim 2022, podzim 2023, podzim 2024.

PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2005
Rozsah
2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
RNDr. Jan Blaťák, Ph.D. (cvičící)
Garance
prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky
Rozvrh
St 14:00–16:50 B410
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 6 mateřských oborů, zobrazit
Cíle předmětu
Přehled učicích metod a systémů pro zpracování přirozeneého jazyka. Součástí předmětu je projekt.
Osnova
  • Zpracování přirozeného jazyka. Korpusy. Nástroje.
  • Přehled metod strojového učení
  • Desambiguace. Morfologická desambiguace a desambiguace významu slov
  • Mělká a úplná syntaktická analýza a strojové učení
  • Hledání lexikálních jednotek a kolokací
  • Kategorizace dokumentů
  • Extrakce informace z textu
  • Dolování v textu
  • Dolování v hypertextu a WWW
  • Sémantický web Literatura:
Literatura
  • MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
  • Learning language in logic. Edited by Sašo Džeroski - James Cussens. Berlin: Springer, 2000, x, 299. ISBN 3540411453. info
Metody hodnocení
Součástí předmětu je projekt.
Informace učitele
http://www.fi.muni.cz/~popel/lectures/ll/
Předmět je zařazen také v obdobích podzim 2003, podzim 2004, podzim 2006, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2020, podzim 2021, podzim 2022, podzim 2023, podzim 2024.

PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2004
Rozsah
2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
RNDr. Jan Blaťák, Ph.D. (cvičící)
Garance
prof. PhDr. Karel Pala, CSc.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Rozvrh
Čt 12:00–13:50 B410, Čt 16:00–17:50 B001
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 6 mateřských oborů, zobrazit
Cíle předmětu
Přehled učicích metod a systémů pro zpracování přirozeneého jazyka. Součástí předmětu je projekt.
Osnova
  • Zpracování přirozeného jazyka. Korpusy. Nástroje.
  • Přehled metod strojového učení
  • Desambiguace. Morfologická desambiguace a desambiguace významu slov
  • Mělká a úplná syntaktická analýza a strojové učení
  • Hledání lexikálních jednotek a kolokací
  • Kategorizace dokumentů
  • Extrakce informace z textu
  • Dolování v textu
  • Dolování v hypertextu a WWW
  • Sémantický web Literatura:
Literatura
  • MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
  • Learning language in logic. Edited by Sašo Džeroski - James Cussens. Berlin: Springer, 2000, x, 299. ISBN 3540411453. info
Metody hodnocení
Součástí předmětu je projekt.
Informace učitele
http://www.fi.muni.cz/~popel/lectures/ll/
Předmět je zařazen také v obdobích podzim 2003, podzim 2005, podzim 2006, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2020, podzim 2021, podzim 2022, podzim 2023, podzim 2024.

PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2003
Rozsah
2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
Mgr. Miloslav Nepil, Ph.D. (přednášející)
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
Garance
prof. PhDr. Karel Pala, CSc.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Rozvrh
Út 18:00–19:50 B001, St 10:00–11:50 X Datový projektor, St 10:00–11:50 B410
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Bude podán přehled učicích metod a systémů pro zpracování přirozeneého jazyka. Důraz je kladen na aplikace těchto metod. Součástí předmětu je projekt.
Osnova
  • Zpracování přirozeného jazyka. Korpusy. Nástroje.
  • Přehled metod strojového učení
  • Desambiguace. Morfologická desambiguace a desambiguace významu slov
  • Mělká a úplná syntaktická analýza a strojové učení
  • Hledání lexikálních jednotek a kolokací
  • Kategorizace dokumentů
  • Extrakce informace z textu
  • Dolování v textu
  • Dolování v hypertextu a WWW
  • Sémantický web Literatura:
Metody hodnocení
Součástí předmětu je projekt.
Informace učitele
http://www.fi.muni.cz/~popel/lectures/ll/
Předmět je zařazen také v obdobích podzim 2004, podzim 2005, podzim 2006, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2020, podzim 2021, podzim 2022, podzim 2023, podzim 2024.

PA164 Strojové učení a přirozený jazyk

Fakulta informatiky
podzim 2019

Předmět se v období podzim 2019 nevypisuje.

Rozsah
2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
Garance
doc. RNDr. Lubomír Popelínský, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 54 mateřských oborů, zobrazit
Cíle předmětu
Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
Výstupy z učení
Student bude schopen
- předzpracovat textová data pro text mining;
- vytvořit systém pro analýzu textu pomocí metod strojového učení;
- porozumět vědeckým pracem z tohoto oboru;
- napsat technickou zprávu z této oblasti.
Osnova
  • Zpracování přirozeného jazyka. Korpusy. Nástroje.
  • Přehled metod strojového učení
  • Desambiguace. Morfologická desambiguace a desambiguace významu slov
  • Mělká syntaktická analýza a strojové učení
  • Kategorizace dokumentů
  • Extrakce informace z textu
  • Sumarizace,analýza sentimentu a další metody pro dolování v textu
  • Web mining
  • Aplikace: texty s časově-prostorovou informací, biomedicínské a biologické texty
Literatura
    doporučená literatura
  • LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
  • MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
    neurčeno
  • Mining text data. Edited by Charu C. Aggarwal - ChengXiang Zhai. New York: Springer Science+Business Media, 2012, xi, 522. ISBN 9781461432227. info
Výukové metody
přednáška následovaná praktickými ukázkami a řešením projektu
Metody hodnocení
Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
Informace učitele
http://www.fi.muni.cz/~popel/lectures/ll/
Další komentáře
Výuka probíhá každý týden.
Předmět je zařazen také v obdobích podzim 2003, podzim 2004, podzim 2005, podzim 2006, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2020, podzim 2021, podzim 2022, podzim 2023, podzim 2024.