M9DM2 Data mining II

Přírodovědecká fakulta
podzim 2014
Rozsah
2/2/0. 4 kr. (příf plus uk plus > 4). Ukončení: zk.
Vyučující
RNDr. Radim Navrátil, Ph.D. (přednášející)
Garance
doc. RNDr. Martin Kolář, Ph.D.
Ústav matematiky a statistiky – Ústavy – Přírodovědecká fakulta
Kontaktní osoba: Mgr. Martin Řezáč, Ph.D.
Dodavatelské pracoviště: Ústav matematiky a statistiky – Ústavy – Přírodovědecká fakulta
Rozvrh
St 10:00–11:50 M6,01011
  • Rozvrh seminárních/paralelních skupin:
M9DM2/01: Čt 12:00–13:50 MP1,01014, M. Vinkler
Předpoklady
M8DM1 Data mining I
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Data mining, neboli dolování z dat či vytěžování dat, je analytická metodologie získávání netriviálních skrytých a potenciálně užitečných informací z dat. Kurz navazuje na kurz Data mining I a jeho cílem je prohloubení již získaných znalostí v této oblasti. Na konci tohoto kurzu bude student schopen: (1) popsat základní (logistická regrese) a pokročilé metody (shluková analýza, Coxova regrese) vývoje skóringových funkcí, (2) aplikovat tyto metody na konkrétní data a (3) vytvořit skóringovou funkci v systému SAS (v rámci počítačového praktika), (4) interpretovat výstupy skóringové funkce spolu se souvisejícími finančními ukazateli.
Osnova
  • Credit scoring - základní pojmy
  • Úvod do SAS EG/ SAS EM
  • Metodologie vývoje skóringových funkcí
  • Příprava dat – pokročilé techniky
  • Shluková analýza
  • Coxova regrese
  • Evaluace modelu II
  • Stanovení cut-off, RAROA, CRE
  • Monitoring
Literatura
  • THOMAS, L. C. Consumer credit models : pricing, profit, and portfolios. 1st pub. Oxford: Oxford University Press, 2009, xii, 385. ISBN 9780199232130. info
  • ANDERSON, Raymond. The credit scoring toolkit : theory and practice for retail credit risk management and decision automation. 1st pub. Oxford: Oxford University Press, 2007, lvi, 731. ISBN 9780199226405. info
  • SIDDIQI, Naeem. Credit risk scorecards : developing and implementing intelligent credit scoring. Hoboken, N.J.: Wiley, 2006, xi, 196. ISBN 047175451X. info
  • THOMAS, L. C., David B. EDELMAN a Jonathan N. CROOK. Credit scoring and its applications. Philadelphia, Pa.: Society for Industrial and Applied Mathematics, 2002, xiv, 248. ISBN 0898714834. URL info
Výukové metody
Přednáška: 2 hod. týdně.
Cvičení: 2 hod. týdně.
Metody hodnocení
Semestrální projekt (k uznání je třeba 100% správné zpracování), ústní zkouška (k úspěšnému zvládnutí je třeba správně zodpovědět alespoň 70% otázek).
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2011, podzim 2012, podzim 2013, podzim 2016, podzim 2018, podzim 2019, podzim 2020, podzim 2021, podzim 2022, podzim 2023, podzim 2024.