BKM_DAMI Datamining

Ekonomicko-správní fakulta
jaro 2025
Rozsah
tutorial 12 hodin. 6 kr. Ukončení: zk.
Vyučující
Ing. Mgr. Jakub Buček (přednášející)
doc. Mgr. Maria Králová, Ph.D. (přednášející)
Ing. Jakub Weiner (přednášející)
Garance
doc. Mgr. Maria Králová, Ph.D.
Oddělení aplikované matematiky a informatiky – Ekonomicko-správní fakulta
Kontaktní osoba: Lenka Hráčková
Dodavatelské pracoviště: Oddělení aplikované matematiky a informatiky – Ekonomicko-správní fakulta
Předpoklady
FORMA ( K )
Základní pojmy teorie pravděpodobnosti a matematické statistiky.
Omezení zápisu do předmětu
Předmět je určen pouze studentům mateřských oborů.
Mateřské obory/plány
Cíle předmětu
Cílem předmětu je poskytnout studentům pokročilejší nástroje pro řešení úloh, se kterými se mohou setkat v komerční praxi (např. segmentace zákazníků, vyhodnocení marketingové strategie, analýza nákupního koše a další úlohy). Dále se studenti seznámí s praktickými postupy při přípravě, zpracování a analýze dat a rovněž bude věnována pozornost interpretaci a prezentaci dosažených výsledků.
Výuka bude probíhat v systému R, který patří mezi nejpoužívanější statistické nástroje jak v akademické, tak komerční sféře. Mimo to je zdarma ke stažení pro všechny běžné operační systémy na https://cran.r-project.org/.
Výstupy z učení
Absolvováním kurzu získají studenti následující dovednosti:
- Budou schopni definovat vlastní projektový záměr (business case), zvolit vhodnou metodu k jeho splnění a správně interpretovat a prezentovat výsledky pro širší audienci (typicky pro nižší a střední management).
- Budou umět připravit a zpracovat data pro další analýzu.
- Budou schopni systematicky odhalovat chyby v datových souborech a také budou ovládat metody, jak s těmito chybami dále pracovat.
Osnova
  • Na každém ze tří tutoriálů bude představen samostatný projektový záměr (business case), v rámci jehož řešení budou prezentovány tyto okruhy témat:

    • Definování projektového záměru
    • Příprava a zpracování dat (zejména zacházení s chybějícími daty a diskretizace dat)
    • Explorace dat
    • Redukce dimenziality (např. PCA)
    • Asociační analýza (analýza nákupního koše)
    • Klasifikační úlohy (např. stromy, logistická regrese)
    • Shluková analýza (hierarichické a nehierarchické shlukování)
    • Interpretace a prezentace výsledků
Literatura
    doporučená literatura
  • HENDL, Jan. Big data : věda o datech - základy a aplikace. První vydání. Praha: Grada Publishing, 2021, 224 stran. ISBN 9788027130313. URL info
  • TORGO, Luís. Data mining with R : learning with case studies. Second edition. Boca Raton: CRC Press/Taylor & Francis Group, 2017, xix, 405. ISBN 9781482234893. info
  • WICKHAM, Hadley a Garrett GROLEMUND. R for data science : import, tidy, transform, visualize, and model data. First edition. Sebastopol, CA: O'Reilly, 2016, xxv, 492. ISBN 9781491910399. info
Výukové metody
Teoreticky a prakticky zaměřené tutoriály s důrazem na aktivní přístup studentů. Studium doporučené literatury, samostatná práce na projektových záměrech.
Metody hodnocení
Podmínkou pro ukončení předmětu je vypracování a obhajoba semestrálního projektu. Při hodnocení je kladen důraz především na vymezení daného projektového záměru (business case), vhodně zvolené a provedené metody, správnou interpretaci a prezentaci výsledků. For Erazmus students: online participation at seminars via MS Teams, active participation at seminar work project, presence at final exam.
Další komentáře
Předmět je vyučován každoročně.
Výuka probíhá blokově.
Poznámka k četnosti výuky: 12 hodin.
Předmět je zařazen také v obdobích jaro 2023, jaro 2024.