PV056 Machine Learning and Data Mining

Fakulta informatiky
jaro 2024
Rozsah
2/0/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
Bc. Terézia Fialová (pomocník)
doc. RNDr. Jan Sedmidubský, Ph.D. (pomocník)
RNDr. Ondřej Sotolář (pomocník)
Bc. Jonáš Tichý (pomocník)
Garance
doc. RNDr. Lubomír Popelínský, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Kontaktní osoba: doc. RNDr. Lubomír Popelínský, Ph.D.
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky
Rozvrh
Út 16:00–17:50 B204
Předpoklady
Předpokládá se znalost základů strojového učení v rozsahu předmětu IB031 Úvod do strojového učení.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 74 mateřských oborů, zobrazit
Cíle předmětu
Na konci tohoto kurzu bude student schopen pracovat s metodami strojového učení a dobývání znalostí z dat. Bude schopen vytvářet nástroje pro analýzu dat, které těchto metod využívají.
Výstupy z učení
Student bude schopen
- předzpracovat data pro data mining;
- znát pokročilé metody strojového učení a data mining a umět je používat;
- navrhnout, implementovat a ověřit metodu strojového učení a data mining;
- napsat technickou zprávu z této oblasti.
Osnova
  • Přehled základních metod strojového učení
  • Pokročilé metody strojového učení. Kombinace učících algoritmů. metalearning, preference learning. Učení v multirelačních datech. Dolování v grafech a sekvencích.
  • Teorie strojového učení Bias-varinace tradeoff. Modely učení
  • Big data analytics
  • Hledání častých vzorů a asociačních pravidel: algoritmus Apriori; alternativy; časté vzory v multirelačních datech.
  • Detekce odlehlých bodů
  • Předzpracování dat: výběr atributů; konstrukce nových atributů; metody vzorkování; aktivní učení.
  • Vizualizace dat, visual analytics
  • Dobývání znalostí z vybraných typů dat: dolování v textu, dolování v temporálních a časově prostorových datech, dobývání znalostí z webu. Dolování ve výukových datech. Dobývání znalostí, biologické vědy a bioinformatika
Literatura
    doporučená literatura
  • HAN, Jiawei a Micheline KAMBER. Data mining : concepts and techniques. 2nd ed. San Francisco, CA: Morgan Kaufmann, 2006, xxviii, 77. ISBN 1558609016. URL info
    neurčeno
  • FLACH, Peter A. Machine learning : the art and science of algorithms that make sense of data. New York: Cambridge University Press, 2012, xvii, 396. ISBN 1107422221. info
  • BERKA, Petr. Dobývání znalostí z databází. Vyd. 1. Praha: Academia, 2003, 366 s. ISBN 8020010629. info
  • Relational data mining. Edited by Sašo Džeroski - Nada Lavrač. Berlin: Springer, 2001, xix, 398. ISBN 3540422897. info
Výukové metody
Přednáška, projekt.
Metody hodnocení
Písemná a ústní zkouška. Nutnou podmínkou absolvování je obhajoba projektu.
Vyučovací jazyk
Angličtina
Informace učitele
http://www.fi.muni.cz/usr/popelinsky/lectures/kdd/
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Nachází se v prerekvizitách jiných předmětů
Předmět je zařazen také v obdobích jaro 2003, jaro 2004, jaro 2005, jaro 2006, jaro 2007, jaro 2008, jaro 2009, jaro 2010, jaro 2011, jaro 2012, jaro 2013, jaro 2014, jaro 2015, jaro 2016, jaro 2017, jaro 2018, jaro 2019, jaro 2020, jaro 2021, jaro 2022, jaro 2023, jaro 2025.