PA164 Machine learning and natural language processing
Fakulta informatikypodzim 2024
- Rozsah
- 2/1/0. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučováno kontaktně - Vyučující
- doc. Mgr. Bc. Vít Nováček, PhD (přednášející)
RNDr. Ondřej Sotolář (pomocník) - Garance
- doc. Mgr. Bc. Vít Nováček, PhD
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky - Rozvrh
- Po 23. 9. až Po 16. 12. Po 14:00–15:50 C525
- Rozvrh seminárních/paralelních skupin:
- Předpoklady
- Předpokládá se základní znalost strojového učení v rozsahu předmětu IB031, počítačové lingvistiky v rozsahu PA153 a neuronových sítí v rozsahu PV021. Výuka probíhá v angličitně (v češtině jen pokud s tím studující souhlasí). Výstupy studentů mohou být anglicky, česky nebo slovensky (v jiném jazyce jen pokud s tím vyučující souhlasí).
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 29 mateřských oborů, zobrazit
- Cíle předmětu
- Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
- Výstupy z učení
- Student bude schopen
- předzpracovat textová data pro text mining;
- vytvořit systém pro analýzu textu pomocí metod strojového učení;
- porozumět vědeckým pracem z tohoto oboru;
- napsat technickou zprávu z této oblasti. - Osnova
- Přehled kurzu, ukázka pipeline (před)zpracování textu
- Rychlý a špinavý úvod do ML
- Distribuční sémantika, LSA, slovní vložky
- Hluboké neuronové sítě pro NLP
- Jazykové modely a jejich aplikace
- AutoML pro NLP
- Studentská posterová sekce (sekce), včetně rozsáhlé zpětné vazby během práce studentů a její prezentace
- Příklad aplikace: analýza sentimentu
- Příklad aplikace: získávání znalostí z textu
- Zvané přednášk(y) mezinárodních odborníků o různých aplikacích ML v oblasti NLP
- Prezentace závěrečného projektu
- Literatura
- doporučená literatura
- Charu C. Aggarwal, Machine Learning for Text. Springer 2018
- MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
- LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
- neurčeno
- Mining text data. Edited by Charu C. Aggarwal - ChengXiang Zhai. New York: Springer Science+Business Media, 2012, xi, 522. ISBN 9781461432227. info
- Výukové metody
- přednáška následovaná samostatnou prací a praktickými ukázkami ve cvičeních, řešení projektu
- Metody hodnocení
- Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení jsou prezentace projektu.
- Vyučovací jazyk
- Angličtina
- Další komentáře
- Studijní materiály
Předmět je vyučován každoročně.
PA164 Strojové učení a přirozený jazyk
Fakulta informatikypodzim 2023
- Rozsah
- 2/1/0. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
- Vyučující
- doc. Mgr. Bc. Vít Nováček, PhD (přednášející)
- Garance
- doc. Mgr. Bc. Vít Nováček, PhD
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky - Rozvrh
- Po 14:00–15:50 A318
- Rozvrh seminárních/paralelních skupin:
- Předpoklady
- Předpokládá se základní znalost strojového učení v rozsahu předmětu IB031, počítačové lingvistiky v rozsahu PA153 a neuronových sítí v rozsahu PV021. Výuka probíhá v angličitně (v češtině jen pokud s tím studující souhlasí). Výstupy studentů mohou být anglicky, česky nebo slovensky (v jiném jazyce jen pokud s tím vyučující souhlasí).
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 55 mateřských oborů, zobrazit
- Cíle předmětu
- Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
- Výstupy z učení
- Student bude schopen
- předzpracovat textová data pro text mining;
- vytvořit systém pro analýzu textu pomocí metod strojového učení;
- porozumět vědeckým pracem z tohoto oboru;
- napsat technickou zprávu z této oblasti. - Osnova
- Přehled kurzu, ukázka pipeline (před)zpracování textu
- Rychlý a špinavý úvod do ML
- Distribuční sémantika, LSA, slovní vložky
- Hluboké neuronové sítě pro NLP
- Jazykové modely a jejich aplikace
- AutoML pro NLP
- Studentská posterová sekce (sekce), včetně rozsáhlé zpětné vazby během práce studentů a její prezentace
- Příklad aplikace: analýza sentimentu
- Příklad aplikace: získávání znalostí z textu
- Zvané přednášk(y) mezinárodních odborníků o různých aplikacích ML v oblasti NLP
- Prezentace závěrečného projektu
- Literatura
- doporučená literatura
- Chang, Yupeng, et al. "A survey on evaluation of large language models." ACM Transactions on Intelligent Systems and Technology 15.3 (2024): 1-45.
- Zhao, Wayne Xin, et al. "A survey of large language models." arXiv preprint arXiv:2303.18223 (2023).
- Charu C. Aggarwal, Machine Learning for Text. Springer 2018
- Mining text data. Edited by Charu C. Aggarwal - ChengXiang Zhai. New York: Springer Science+Business Media, 2012, xi, 522. ISBN 9781461432227. info
- MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
- Výukové metody
- přednáška následovaná samostatnou prací a praktickými ukázkami ve cvičeních, řešení projektu
- Metody hodnocení
- Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení jsou prezentace projektu.
- Vyučovací jazyk
- Angličtina
- Další komentáře
- Studijní materiály
Předmět je vyučován každoročně.
PA164 Strojové učení a přirozený jazyk
Fakulta informatikypodzim 2022
- Rozsah
- 2/1/0. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
- Vyučující
- doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
doc. Mgr. Bc. Vít Nováček, PhD (přednášející)
RNDr. Ondřej Sotolář (pomocník) - Garance
- doc. RNDr. Lubomír Popelínský, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky - Rozvrh
- Po 14:00–15:50 A217
- Rozvrh seminárních/paralelních skupin:
- Předpoklady
- Předpokládá se základní znalost strojového učení v rozsahu předmětu IB031, počítačové lingvistiky v rozsahu PA153 a neuronových sítí v rozsahu PV021. Výuka probíhá v angličitně (v češtině jen pokud s tím studující souhlasí). Výstupy studentů mohou být anglicky, česky nebo slovensky (v jiném jazyce jen pokud s tím vyučující souhlasí).
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 55 mateřských oborů, zobrazit
- Cíle předmětu
- Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
- Výstupy z učení
- Student bude schopen
- předzpracovat textová data pro text mining;
- vytvořit systém pro analýzu textu pomocí metod strojového učení;
- porozumět vědeckým pracem z tohoto oboru;
- napsat technickou zprávu z této oblasti. - Osnova
- Zpracování přirozeného jazyka. Korpusy. Nástroje.
- Přehled metod strojového učení
- Desambiguace. Morfologická desambiguace a desambiguace významu slov
- Mělká syntaktická analýza a strojové učení
- Kategorizace dokumentů
- Extrakce informace z textu
- Sumarizace,analýza sentimentu a další metody pro dolování v textu
- Detekce anomálií v textu. Novelty detection
- Keyness. Detekce klíčových slov
- Shlukování dokumentů a termů
- Web mining
- Literatura
- doporučená literatura
- Charu C. Aggarwal, Machine Learning for Text. Springer 2018
- MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
- LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
- neurčeno
- Mining text data. Edited by Charu C. Aggarwal - ChengXiang Zhai. New York: Springer Science+Business Media, 2012, xi, 522. ISBN 9781461432227. info
- Výukové metody
- přednáška následovaná praktickými ukázkami a řešením projektu
- Metody hodnocení
- Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
- Vyučovací jazyk
- Angličtina
- Informace učitele
- http://www.fi.muni.cz/~popel/lectures/ll/
- Další komentáře
- Studijní materiály
Předmět je vyučován každoročně.
PA164 Strojové učení a přirozený jazyk
Fakulta informatikypodzim 2021
- Rozsah
- 2/1/0. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
- Vyučující
- doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
doc. Mgr. Bc. Vít Nováček, PhD (přednášející) - Garance
- doc. RNDr. Lubomír Popelínský, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky - Rozvrh
- Čt 16. 9. až Čt 9. 12. Čt 12:00–13:50 A318
- Rozvrh seminárních/paralelních skupin:
- Předpoklady
- Předpokládá se základní znalost strojového učení v rozsahu předmětu IB031, počítačové lingvistiky v rozsahu PA153 a neuronových sítí v rozsahu PV021. Výuka probíhá v angličitně (v češtině jen pokud s tím studující souhlasí). Výstupy studentů mohou být anglicky, česky nebo slovensky (v jiném jazyce jen pokud s tím vyučující souhlasí).
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 54 mateřských oborů, zobrazit
- Cíle předmětu
- Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
- Výstupy z učení
- Student bude schopen
- předzpracovat textová data pro text mining;
- vytvořit systém pro analýzu textu pomocí metod strojového učení;
- porozumět vědeckým pracem z tohoto oboru;
- napsat technickou zprávu z této oblasti. - Osnova
- Zpracování přirozeného jazyka. Korpusy. Nástroje.
- Přehled metod strojového učení
- Desambiguace. Morfologická desambiguace a desambiguace významu slov
- Mělká syntaktická analýza a strojové učení
- Kategorizace dokumentů
- Extrakce informace z textu
- Sumarizace,analýza sentimentu a další metody pro dolování v textu
- Detekce anomálií v textu. Novelty detection
- Keyness. Detekce klíčových slov
- Shlukování dokumentů a termů
- Web mining
- Literatura
- doporučená literatura
- Charu C. Aggarwal, Machine Learning for Text. Springer 2018
- MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
- LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
- neurčeno
- Mining text data. Edited by Charu C. Aggarwal - ChengXiang Zhai. New York: Springer Science+Business Media, 2012, xi, 522. ISBN 9781461432227. info
- Výukové metody
- přednáška následovaná praktickými ukázkami a řešením projektu
- Metody hodnocení
- Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
- Vyučovací jazyk
- Angličtina
- Informace učitele
- http://www.fi.muni.cz/~popel/lectures/ll/
- Další komentáře
- Studijní materiály
Předmět je vyučován každoročně.
PA164 Strojové učení a přirozený jazyk
Fakulta informatikypodzim 2020
- Rozsah
- 2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
- Vyučující
- doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
Mgr. Adam Bajger (pomocník) - Garance
- doc. RNDr. Lubomír Popelínský, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky - Rozvrh
- Po 9:00–11:50 A318
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 54 mateřských oborů, zobrazit
- Cíle předmětu
- Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
- Výstupy z učení
- Student bude schopen
- předzpracovat textová data pro text mining;
- vytvořit systém pro analýzu textu pomocí metod strojového učení;
- porozumět vědeckým pracem z tohoto oboru;
- napsat technickou zprávu z této oblasti. - Osnova
- Zpracování přirozeného jazyka. Korpusy. Nástroje.
- Přehled metod strojového učení
- Desambiguace. Morfologická desambiguace a desambiguace významu slov
- Mělká syntaktická analýza a strojové učení
- Kategorizace dokumentů
- Extrakce informace z textu
- Sumarizace,analýza sentimentu a další metody pro dolování v textu
- Web mining
- Aplikace: texty s časově-prostorovou informací, biomedicínské a biologické texty
- Literatura
- doporučená literatura
- LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
- MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
- neurčeno
- Mining text data. Edited by Charu C. Aggarwal - ChengXiang Zhai. New York: Springer Science+Business Media, 2012, xi, 522. ISBN 9781461432227. info
- Výukové metody
- přednáška následovaná praktickými ukázkami a řešením projektu
- Metody hodnocení
- Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
- Informace učitele
- http://www.fi.muni.cz/~popel/lectures/ll/
- Další komentáře
- Studijní materiály
Předmět je vyučován každoročně.
PA164 Strojové učení a přirozený jazyk
Fakulta informatikypodzim 2018
- Rozsah
- 2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
- Vyučující
- doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
RNDr. Karel Vaculík, Ph.D. (pomocník)
Mgr. Veronika Krejčířová (pomocník) - Garance
- prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky
Dodavatelské pracoviště: Katedra teorie programování – Fakulta informatiky - Rozvrh
- St 8:00–10:50 C513
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 25 mateřských oborů, zobrazit
- Cíle předmětu
- Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
- Výstupy z učení
- Student bude schopen
- předzpracovat textová data pro text mining;
- vytvořit systém pro analýzu textu pomocí metod strojového učení;
- porozumět vědeckým pracem z tohoto oboru;
- napsat technickou zprávu z této oblasti. - Osnova
- Zpracování přirozeného jazyka. Korpusy. Nástroje.
- Přehled metod strojového učení
- Desambiguace. Morfologická desambiguace a desambiguace významu slov
- Mělká syntaktická analýza a strojové učení
- Kategorizace dokumentů
- Extrakce informace z textu
- Sumarizace,analýza sentimentu a další metody pro dolování v textu
- Web mining
- Aplikace: texty s časově-prostorovou informací, biomedicínské a biologické texty
- Literatura
- doporučená literatura
- LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
- MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
- neurčeno
- Mining text data. Edited by Charu C. Aggarwal - ChengXiang Zhai. New York: Springer Science+Business Media, 2012, xi, 522. ISBN 9781461432227. info
- Výukové metody
- přednáška následovaná praktickými ukázkami a řešením projektu
- Metody hodnocení
- Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
- Informace učitele
- http://www.fi.muni.cz/~popel/lectures/ll/
PA164 Strojové učení a přirozený jazyk
Fakulta informatikypodzim 2017
- Rozsah
- 2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
- Vyučující
- doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
RNDr. Karel Vaculík, Ph.D. (pomocník)
Mgr. Veronika Krejčířová (pomocník) - Garance
- prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky
Dodavatelské pracoviště: Katedra teorie programování – Fakulta informatiky - Rozvrh
- Po 9:00–11:50 C525
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 25 mateřských oborů, zobrazit
- Cíle předmětu
- Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
- Výstupy z učení
- Student bude schopen
- předzpracovat textová data pro text mining;
- vytvořit systém pro analýzu textu pomocí metod strojového učení;
- porozumět vědeckým pracem z tohoto oboru;
- napsat technickou zprávu z této oblasti. - Osnova
- Zpracování přirozeného jazyka. Korpusy. Nástroje.
- Přehled metod strojového učení
- Desambiguace. Morfologická desambiguace a desambiguace významu slov
- Mělká syntaktická analýza a strojové učení
- Kategorizace dokumentů
- Extrakce informace z textu
- Sumarizace,analýza sentimentu a další metody pro dolování v textu
- Web mining
- Aplikace: texty s časově-prostorovou informací, biomedicínské a biologické texty
- Literatura
- doporučená literatura
- LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
- MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
- neurčeno
- Mining text data. Edited by Charu C. Aggarwal - ChengXiang Zhai. New York: Springer Science+Business Media, 2012, xi, 522. ISBN 9781461432227. info
- Výukové metody
- přednáška následovaná praktickými ukázkami a řešením projektu
- Metody hodnocení
- Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
- Informace učitele
- http://www.fi.muni.cz/~popel/lectures/ll/
- Další komentáře
- Studijní materiály
PA164 Strojové učení a přirozený jazyk
Fakulta informatikypodzim 2016
- Rozsah
- 2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
- Vyučující
- RNDr. Karel Vaculík, Ph.D. (pomocník)
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
Mgr. Jan Sedlák (pomocník) - Garance
- prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky
Dodavatelské pracoviště: Katedra teorie programování – Fakulta informatiky - Rozvrh
- St 10:00–12:50 B411
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 25 mateřských oborů, zobrazit
- Cíle předmětu
- Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
- Osnova
- Zpracování přirozeného jazyka. Korpusy. Nástroje.
- Přehled metod strojového učení
- Desambiguace. Morfologická desambiguace a desambiguace významu slov
- Mělká syntaktická analýza a strojové učení
- Kategorizace dokumentů
- Extrakce informace z textu
- Sumarizace,analýza sentimentu a další metody pro dolování v textu
- Web mining
- Aplikace: texty s časově-prostorovou informací, biomedicínské a biologické texty
- Literatura
- doporučená literatura
- LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
- MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
- neurčeno
- Mining text data. Edited by Charu C. Aggarwal - ChengXiang Zhai. New York: Springer Science+Business Media, 2012, xi, 522. ISBN 9781461432227. info
- Výukové metody
- přednáška následovaná praktickými ukázkami a řešením projektu
- Metody hodnocení
- Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
- Informace učitele
- http://www.fi.muni.cz/~popel/lectures/ll/
- Další komentáře
- Studijní materiály
PA164 Strojové učení a přirozený jazyk
Fakulta informatikypodzim 2015
- Rozsah
- 2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
- Vyučující
- RNDr. Karel Vaculík, Ph.D. (pomocník)
RNDr. Hana Bydžovská, Ph.D. (pomocník)
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející) - Garance
- prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky
Dodavatelské pracoviště: Katedra teorie programování – Fakulta informatiky - Rozvrh
- Út 8:00–9:50 C416
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 25 mateřských oborů, zobrazit
- Cíle předmětu
- Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
- Osnova
- Zpracování přirozeného jazyka. Korpusy. Nástroje.
- Přehled metod strojového učení
- Desambiguace. Morfologická desambiguace a desambiguace významu slov
- Mělká syntaktická analýza a strojové učení
- Kategorizace dokumentů
- Extrakce informace z textu
- Sumarizace,analýza sentimentu a další metody pro dolování v textu
- Web mining
- Aplikace: texty s časově-prostorovou informací, biomedicínské a biologické texty
- Literatura
- doporučená literatura
- LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
- MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
- neurčeno
- Mining text data. Edited by Charu C. Aggarwal - ChengXiang Zhai. New York: Springer Science+Business Media, 2012, xi, 522. ISBN 9781461432227. info
- Výukové metody
- přednáška následovaná praktickými ukázkami a řešením projektu
- Metody hodnocení
- Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
- Informace učitele
- http://www.fi.muni.cz/~popel/lectures/ll/
- Další komentáře
- Studijní materiály
PA164 Strojové učení a přirozený jazyk
Fakulta informatikypodzim 2014
- Rozsah
- 2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
- Vyučující
- doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
RNDr. Hana Bydžovská, Ph.D. (pomocník)
Mgr. Lukáš Másilko (pomocník)
RNDr. Karel Vaculík, Ph.D. (pomocník) - Garance
- prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky
Dodavatelské pracoviště: Katedra teorie programování – Fakulta informatiky - Rozvrh
- Út 8:00–9:50 C511
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 24 mateřských oborů, zobrazit
- Cíle předmětu
- Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
- Osnova
- Zpracování přirozeného jazyka. Korpusy. Nástroje.
- Přehled metod strojového učení
- Desambiguace. Morfologická desambiguace a desambiguace významu slov
- Mělká syntaktická analýza a strojové učení
- Kategorizace dokumentů
- Extrakce informace z textu
- Další metody pro dolování v textu
- Web mining
- Aplikace: texty s časově-prostorovou informací, biomedicínské a biologické texty
- Literatura
- doporučená literatura
- MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
- Learning language in logic. Edited by Sašo Džeroski - James Cussens. Berlin: Springer, 2000, x, 299. ISBN 3540411453. info
- LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
- Výukové metody
- přednáška následovaná praktickými ukázkami a řešením projektu
- Metody hodnocení
- Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
- Informace učitele
- http://www.fi.muni.cz/~popel/lectures/ll/
- Další komentáře
- Studijní materiály
PA164 Strojové učení a přirozený jazyk
Fakulta informatikypodzim 2013
- Rozsah
- 2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
- Vyučující
- doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
Mgr. Juraj Jurčo (pomocník)
RNDr. Karel Vaculík, Ph.D. (pomocník) - Garance
- prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky
Dodavatelské pracoviště: Katedra teorie programování – Fakulta informatiky - Rozvrh
- Út 12:00–13:50 B410
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 24 mateřských oborů, zobrazit
- Cíle předmětu
- Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
- Osnova
- Zpracování přirozeného jazyka. Korpusy. Nástroje.
- Přehled metod strojového učení
- Desambiguace. Morfologická desambiguace a desambiguace významu slov
- Mělká syntaktická analýza a strojové učení
- Kategorizace dokumentů
- Extrakce informace z textu
- Další metody pro dolování v textu
- Web mining
- Aplikace: texty s časově-prostorovou informací, biomedicínské a biologické texty
- Literatura
- doporučená literatura
- MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
- Learning language in logic. Edited by Sašo Džeroski - James Cussens. Berlin: Springer, 2000, x, 299. ISBN 3540411453. info
- LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
- Výukové metody
- přednáška následovaná praktickými ukázkami a řešením projektu
- Metody hodnocení
- Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
- Informace učitele
- http://www.fi.muni.cz/~popel/lectures/ll/
PA164 Strojové učení a přirozený jazyk
Fakulta informatikypodzim 2012
- Rozsah
- 2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
- Vyučující
- doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
Mgr. Juraj Jurčo (pomocník) - Garance
- prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky
Dodavatelské pracoviště: Katedra teorie programování – Fakulta informatiky - Rozvrh
- St 10:00–11:50 B410
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 24 mateřských oborů, zobrazit
- Cíle předmětu
- Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
- Osnova
- Zpracování přirozeného jazyka. Korpusy. Nástroje.
- Přehled metod strojového učení
- Desambiguace. Morfologická desambiguace a desambiguace významu slov
- Mělká syntaktická analýza a strojové učení
- Kategorizace dokumentů
- Extrakce informace z textu
- Další metody pro dolování v textu
- Web mining
- Aplikace: texty s časově-prostorovou informací, biomedicínské a biologické texty
- Literatura
- doporučená literatura
- MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
- Learning language in logic. Edited by Sašo Džeroski - James Cussens. Berlin: Springer, 2000, x, 299. ISBN 3540411453. info
- LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
- Výukové metody
- přednáška následovaná praktickými ukázkami a řešením projektu
- Metody hodnocení
- Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
- Informace učitele
- http://www.fi.muni.cz/~popel/lectures/ll/
- Další komentáře
- Studijní materiály
PA164 Strojové učení a přirozený jazyk
Fakulta informatikypodzim 2011
- Rozsah
- 2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
- Vyučující
- Mgr. Jan Knotek (pomocník)
RNDr. Petr Kosina, Ph.D. (pomocník)
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející) - Garance
- prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky - Rozvrh
- St 14:00–15:50 B411, St 16:00–16:50 B001
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 24 mateřských oborů, zobrazit
- Cíle předmětu
- Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
- Osnova
- Zpracování přirozeného jazyka. Korpusy. Nástroje.
- Přehled metod strojového učení
- Desambiguace. Morfologická desambiguace a desambiguace významu slov
- Mělká syntaktická analýza a strojové učení
- Kategorizace dokumentů
- Extrakce informace z textu
- Další metody pro dolování v textu
- Dolování v hypertextu a WWW
- Literatura
- Výukové metody
- přednáška následovaná praktickými ukázkami a řešením projektu
- Metody hodnocení
- Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
- Informace učitele
- http://www.fi.muni.cz/~popel/lectures/ll/
- Další komentáře
- Studijní materiály
PA164 Strojové učení a přirozený jazyk
Fakulta informatikypodzim 2010
- Rozsah
- 2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
- Vyučující
- Mgr. Jan Knotek (pomocník)
RNDr. Petr Kosina, Ph.D. (pomocník)
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející) - Garance
- prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky - Rozvrh
- Út 12:00–13:50 B411
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 23 mateřských oborů, zobrazit
- Cíle předmětu
- Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
- Osnova
- Zpracování přirozeného jazyka. Korpusy. Nástroje.
- Přehled metod strojového učení
- Desambiguace. Morfologická desambiguace a desambiguace významu slov
- Mělká syntaktická analýza a strojové učení
- Kategorizace dokumentů
- Extrakce informace z textu
- Další metody pro dolování v textu
- Dolování v hypertextu a WWW
- Literatura
- Výukové metody
- přednáška následovaná praktickými ukázkami a řešením projektu
- Metody hodnocení
- Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
- Informace učitele
- http://www.fi.muni.cz/~popel/lectures/ll/
- Další komentáře
- Studijní materiály
PA164 Strojové učení a přirozený jazyk
Fakulta informatikypodzim 2009
- Rozsah
- 2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
- Vyučující
- doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
RNDr. Petr Kosina, Ph.D. (pomocník)
RNDr. Antonín Pavelka, Ph.D. (pomocník) - Garance
- prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky - Rozvrh
- Út 8:00–10:50 B410
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 22 mateřských oborů, zobrazit
- Cíle předmětu
- Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
- Osnova
- Zpracování přirozeného jazyka. Korpusy. Nástroje.
- Přehled metod strojového učení
- Desambiguace. Morfologická desambiguace a desambiguace významu slov
- Mělká a úplná syntaktická analýza a strojové učení
- Kategorizace dokumentů
- Extrakce informace z textu
- Další metody pro dolování v textu
- Dolování v hypertextu a WWW
- Sémantický web a tvorba ontologií
- Literatura
- Výukové metody
- přednáška následovaná praktickými cvičeními a řešením projektu
- Metody hodnocení
- Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
- Informace učitele
- http://www.fi.muni.cz/~popel/lectures/ll/
- Další komentáře
- Studijní materiály
PA164 Strojové učení a přirozený jazyk
Fakulta informatikypodzim 2008
- Rozsah
- 2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
- Vyučující
- doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
RNDr. Jan Blaťák, Ph.D. (cvičící) - Garance
- prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky - Rozvrh
- Út 12:00–13:50 B410
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 18 mateřských oborů, zobrazit
- Cíle předmětu
- Přehled učicích metod a systémů pro zpracování přirozeného jazyka. Součástí předmětu je projekt.
- Osnova
- Zpracování přirozeného jazyka. Korpusy. Nástroje.
- Přehled metod strojového učení
- Desambiguace. Morfologická desambiguace a desambiguace významu slov
- Mělká a úplná syntaktická analýza a strojové učení
- Kategorizace dokumentů
- Extrakce informace z textu
- Další metody pro dolování v textu
- Dolování v hypertextu a WWW
- Sémantický web a tvorba ontologií
- Literatura
- Metody hodnocení
- Součástí předmětu je projekt.
- Informace učitele
- http://www.fi.muni.cz/~popel/lectures/ll/
- Další komentáře
- Studijní materiály
PA164 Strojové učení a přirozený jazyk
Fakulta informatikypodzim 2007
- Rozsah
- 2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
- Vyučující
- doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
RNDr. Jan Blaťák, Ph.D. (cvičící) - Garance
- prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky - Rozvrh
- St 9:00–11:50 B411
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 18 mateřských oborů, zobrazit
- Cíle předmětu
- Přehled učicích metod a systémů pro zpracování přirozeného jazyka. Součástí předmětu je projekt.
- Osnova
- Zpracování přirozeného jazyka. Korpusy. Nástroje.
- Přehled metod strojového učení
- Desambiguace. Morfologická desambiguace a desambiguace významu slov
- Mělká a úplná syntaktická analýza a strojové učení
- Kategorizace dokumentů
- Extrakce informace z textu
- Další metody pro dolování v textu
- Dolování v hypertextu a WWW
- Sémantický web a tvorba ontologií
- Literatura
- Metody hodnocení
- Součástí předmětu je projekt.
- Informace učitele
- http://www.fi.muni.cz/~popel/lectures/ll/
PA164 Strojové učení a přirozený jazyk
Fakulta informatikypodzim 2006
- Rozsah
- 2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
- Vyučující
- doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
RNDr. Jan Blaťák, Ph.D. (cvičící) - Garance
- prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky - Rozvrh
- St 12:00–13:50 B411, St 14:00–14:50 B001
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 6 mateřských oborů, zobrazit
- Cíle předmětu
- Přehled učicích metod a systémů pro zpracování přirozeného jazyka. Součástí předmětu je projekt.
- Osnova
- Zpracování přirozeného jazyka. Korpusy. Nástroje.
- Přehled metod strojového učení
- Desambiguace. Morfologická desambiguace a desambiguace významu slov
- Mělká a úplná syntaktická analýza a strojové učení
- Kategorizace dokumentů
- Extrakce informace z textu
- Další metody pro dolování v textu
- Dolování v hypertextu a WWW
- Sémantický web a tvorba ontologií
- Literatura
- Metody hodnocení
- Součástí předmětu je projekt.
- Informace učitele
- http://www.fi.muni.cz/~popel/lectures/ll/
PA164 Strojové učení a přirozený jazyk
Fakulta informatikypodzim 2005
- Rozsah
- 2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
- Vyučující
- doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
RNDr. Jan Blaťák, Ph.D. (cvičící) - Garance
- prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky - Rozvrh
- St 14:00–16:50 B410
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 6 mateřských oborů, zobrazit
- Cíle předmětu
- Přehled učicích metod a systémů pro zpracování přirozeneého jazyka. Součástí předmětu je projekt.
- Osnova
- Zpracování přirozeného jazyka. Korpusy. Nástroje.
- Přehled metod strojového učení
- Desambiguace. Morfologická desambiguace a desambiguace významu slov
- Mělká a úplná syntaktická analýza a strojové učení
- Hledání lexikálních jednotek a kolokací
- Kategorizace dokumentů
- Extrakce informace z textu
- Dolování v textu
- Dolování v hypertextu a WWW
- Sémantický web Literatura:
- Literatura
- Metody hodnocení
- Součástí předmětu je projekt.
- Informace učitele
- http://www.fi.muni.cz/~popel/lectures/ll/
PA164 Strojové učení a přirozený jazyk
Fakulta informatikypodzim 2004
- Rozsah
- 2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
- Vyučující
- doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
RNDr. Jan Blaťák, Ph.D. (cvičící) - Garance
- prof. PhDr. Karel Pala, CSc.
Katedra strojového učení a zpracování dat – Fakulta informatiky - Rozvrh
- Čt 12:00–13:50 B410, Čt 16:00–17:50 B001
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 6 mateřských oborů, zobrazit
- Cíle předmětu
- Přehled učicích metod a systémů pro zpracování přirozeneého jazyka. Součástí předmětu je projekt.
- Osnova
- Zpracování přirozeného jazyka. Korpusy. Nástroje.
- Přehled metod strojového učení
- Desambiguace. Morfologická desambiguace a desambiguace významu slov
- Mělká a úplná syntaktická analýza a strojové učení
- Hledání lexikálních jednotek a kolokací
- Kategorizace dokumentů
- Extrakce informace z textu
- Dolování v textu
- Dolování v hypertextu a WWW
- Sémantický web Literatura:
- Literatura
- Metody hodnocení
- Součástí předmětu je projekt.
- Informace učitele
- http://www.fi.muni.cz/~popel/lectures/ll/
PA164 Strojové učení a přirozený jazyk
Fakulta informatikypodzim 2003
- Rozsah
- 2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
- Vyučující
- Mgr. Miloslav Nepil, Ph.D. (přednášející)
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející) - Garance
- prof. PhDr. Karel Pala, CSc.
Katedra strojového učení a zpracování dat – Fakulta informatiky - Rozvrh
- Út 18:00–19:50 B001, St 10:00–11:50 X Datový projektor, St 10:00–11:50 B410
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- Aplikovaná informatika (program FI, N-AP)
- Informatika (program FI, M-IN)
- Informatika (program FI, N-IN)
- Učitelství výpočetní techniky pro střední školy (program FI, N-SS)
- Cíle předmětu
- Bude podán přehled učicích metod a systémů pro zpracování přirozeneého jazyka. Důraz je kladen na aplikace těchto metod. Součástí předmětu je projekt.
- Osnova
- Zpracování přirozeného jazyka. Korpusy. Nástroje.
- Přehled metod strojového učení
- Desambiguace. Morfologická desambiguace a desambiguace významu slov
- Mělká a úplná syntaktická analýza a strojové učení
- Hledání lexikálních jednotek a kolokací
- Kategorizace dokumentů
- Extrakce informace z textu
- Dolování v textu
- Dolování v hypertextu a WWW
- Sémantický web Literatura:
- Metody hodnocení
- Součástí předmětu je projekt.
- Informace učitele
- http://www.fi.muni.cz/~popel/lectures/ll/
PA164 Strojové učení a přirozený jazyk
Fakulta informatikypodzim 2019
Předmět se v období podzim 2019 nevypisuje.
- Rozsah
- 2/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
- Vyučující
- doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
- Garance
- doc. RNDr. Lubomír Popelínský, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky - Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 54 mateřských oborů, zobrazit
- Cíle předmětu
- Student získá přehled o metodách a nástrojích strojového učení pro analýzy přirozeného jazyka (text mining, natural language learning). Na konci tohoto kurzu bude student schopen použít získané znalosti pro vytvoření systémů pro analýzu textu pomocí metod strojového učení. Bude schopen porozumět vědeckým pracem z tohoto oboru.
- Výstupy z učení
- Student bude schopen
- předzpracovat textová data pro text mining;
- vytvořit systém pro analýzu textu pomocí metod strojového učení;
- porozumět vědeckým pracem z tohoto oboru;
- napsat technickou zprávu z této oblasti. - Osnova
- Zpracování přirozeného jazyka. Korpusy. Nástroje.
- Přehled metod strojového učení
- Desambiguace. Morfologická desambiguace a desambiguace významu slov
- Mělká syntaktická analýza a strojové učení
- Kategorizace dokumentů
- Extrakce informace z textu
- Sumarizace,analýza sentimentu a další metody pro dolování v textu
- Web mining
- Aplikace: texty s časově-prostorovou informací, biomedicínské a biologické texty
- Literatura
- doporučená literatura
- LIU, Bing. Web data mining : exploring hyperlinks, contents, and usage data. Berlin: Springer, 2007, xix, 532. ISBN 9783540378815. info
- MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
- neurčeno
- Mining text data. Edited by Charu C. Aggarwal - ChengXiang Zhai. New York: Springer Science+Business Media, 2012, xi, 522. ISBN 9781461432227. info
- Výukové metody
- přednáška následovaná praktickými ukázkami a řešením projektu
- Metody hodnocení
- Písemná příprava na zkoušku, ústní zkouška. Součástí ukončení je obhajoba projektu.
- Informace učitele
- http://www.fi.muni.cz/~popel/lectures/ll/
- Další komentáře
- Výuka probíhá každý týden.
- Statistika zápisu (nejnovější)