Data mining I - distanční výuka II
RNDr. Radim Navrátil, Ph.D.
Data mining I - distanční výuka II
Info
Období
jaro 2020

20.4. - 26.4. Shluková analýza

Osnova: Popište úlohu shlukové analýzy. Popište algoritmus a uveďte metody hierarchického shlukování. V čem se nehierarchické shlukování liší od hierarchického. Popište metodu k-means a k-medoids. Jaké metody se používají pro určení výsledného počtu shluků?

Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/sci/jaro2020/M8DM1/um/prednasky/DM1-09-Shlukova_analyza.pdf
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/sci/jaro2020/M8DM1/um/prednasky/video/Cluster.mkv

CvičeníVe Studijních materiálech je vloženo zadání cvičení 9 na tento týden. Zde posílám několik komentářů ke cvičení: 

Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/sci/jaro2020/M8DM1/um/cviceni/09_-_shlukova_analyza/cviceni09.mkv

27.4. - 3.5. Lineární regrese

Osnova: Popište model lineární regrese, jeho předpoklady a interpretujte parametry modelu. Co to je multikolinearita? Jak se identifikuje a jaké může mít následky? Popište hřebenovou regresi a LASSO. K čemu se tyto metody používají?

Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/sci/jaro2020/M8DM1/um/prednasky/DM1-10-Linearni_regrese.pdf
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/sci/jaro2020/M8DM1/um/prednasky/video/Regrese.mkv

Cvičení: Ve Studijních materiálech je vloženo zadání cvičení 10 na tento týden. Na cvičení je popsána syntaxe procedur pro lineární regresi. Zde posílám několik komentářů ke cvičení: 

Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/sci/jaro2020/M8DM1/um/cviceni/10_-_linearni_regrese/cviceni10.mkv


4.5. - 10.5. Logistická regrese

Osnova: Popište model logistické regrese. Co znamenají jednotlivé parametry tohoto modelu? Co to je logistické skóre? Jak se v logistické regresi odhadují hodnoty závisle proměnné? Co to je ROC a Lorenzova křivka? Uveďte číselné charakteristiky odvozené od těchto křivek.

Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/sci/jaro2020/M8DM1/um/prednasky/DM1-11-Logisticka_regrese.pdf
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/sci/jaro2020/M8DM1/um/prednasky/video/LogReg.mkv

Cvičení: Ve Studijních materiálech je vloženo zadání cvičení 11 na tento týden. V řadě vašich projektů se logistická regrese může hodit, tak si ji zcela jistě vyzkoušíte na vašich datech. Zde posílám několik komentářů ke cvičení: 

Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/sci/jaro2020/M8DM1/um/cviceni/11_-_logisticka_regrese/cviceni11.mkv


11.5. - 17.5. Rozhodovací stromy; rozhodovací stromy + analýza nákupního košíku

Osnova: Jakou úlohu řešíme pomocí rozhodovacích stromů? Popište algoritmy CART a CHAID. K čemu slouží a jak funguje prořezávání? Uveďte číselné charakteristiky popisující kvalitu modelu.

Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/sci/jaro2020/M8DM1/um/prednasky/DM1-12-Rozhodovaci__stromy.pdf
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/sci/jaro2020/M8DM1/um/prednasky/video/Stromy.mkv

Cvičení: Na posledním cvičení budeme pracovat v SAS Enterprise Mineru. V něm si vyzkoušíme analýzu nákupního košíku a konstrukci rozhodovacích stromů. Vše potřebné najdete ve Studijních materiálech. V původním videokomentáři ke cvičení nastal problém se zobrazováním vyskakovacích oken. Proto jsem do Studijních materiálů doplnil ještě krátký komentář, alespoň k výsledkům, zbytek snad odvodíte z původního komentáře.

Předchozí
Následující