BPE_AVED Analýza a vizualizace ekonomických dat

Ekonomicko-správní fakulta
podzim 2019
Rozsah
1/1. 6 kr. Ukončení: zk.
Vyučující
Ing. Michal Kvasnička, Ph.D. (cvičící)
doc. Ing. Štěpán Mikula, Ph.D. (cvičící)
Garance
Ing. Michal Kvasnička, Ph.D.
Katedra ekonomie – Ekonomicko-správní fakulta
Kontaktní osoba: Mgr. Jarmila Šveňhová
Dodavatelské pracoviště: Katedra ekonomie – Ekonomicko-správní fakulta
Rozvrh seminárních/paralelních skupin
BPE_AVED/01: St 8:00–9:50 VT204, M. Kvasnička, Š. Mikula
Předpoklady
Není vyžadována žádná předchozí znalost programování, jazyka R, statistiky ani ekonometrie. Vyžadována je pouze základní schopnost pracovat s počítačem a ochota naučit se programovat.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 50 stud.
Momentální stav registrace a zápisu: zapsáno: 1/50, pouze zareg.: 0/50, pouze zareg. s předností (mateřské obory): 0/50
Mateřské obory/plány
předmět má 19 mateřských oborů, zobrazit
Cíle předmětu
Cílem předmětu je poskytnout studentům praktické nástroje pro přípravu, analýzu a vizualizaci ekonomických dat.
Získané dovednosti mohou studenti využít nejen při zpracování svých bakalářských a diplomových prací, ale i v komerční praxi, zejména v analýze finančních trhů, mezinárodního obchodu, organizace trhů, migrace, dopravy, ekonomii hospodářské soutěže, mikroekonomických, makroekonomických a dalších úlohách. Předmět také položí potřebný základ pro další studium a použití pokročilých statistických metod, ekonometrie, data miningu a data science.
Důraz je v předmětu kladen na praktické ovládnutí nástrojů, které jsou nejčastěji používány při analýze ekonomických dat.
Příklady použití nástrojů najdete na adrese https://is.muni.cz/auth/el/1456/podzim2017/BPE_AVED/um/62799066/priklad_analyzy_a_vizualizace_dat.html


Výuka bude probíhat v systému R. R je světově nejpoužívanější statistický nástroj pro analýzu dat, který umožňuje aplikovat veškeré statistické, ekonometrické, data-miningové a jiné metody bez nutnosti používání dodatečného pomocného software (například Excelu, Gretlu, Statistica, SPSS a podobně). R se používá jak v akademické sféře, tak v komerční praxi. Používají ho například firmy Google, Facebook a Microsoft. R je zdarma ke stažení pro všechny operační systémy na https://cran.r-project.org/.


Většina potřebné literatury (včetně povinné) je dostupná legálně on-line.
Výstupy z učení
Absolvováním předmětu studenti získají následující dovednosti:
  • Budou umět načíst data v téměř libovolném formátu a struktuře z lokálních zdrojů i on-line databází, vyčistit je a převést do přehledné struktury, která umožní jejich snadnou analýzu.
  • Budou schopni zpracovávat velké objemy dat – transformovat je, agregovat a spojovat různé datové soubory.
  • Budou umět systematicky odhalovat chyby v datových souborech.
  • Dokážou pokročilým způsobem vizualizovat individuální veličiny různých typů i vztahy mezi nimi.
  • Budou schopni provést jak počáteční průzkumnou analýzu dat, tak jejich následnou statistickou a ekonometrickou analýzu.
  • Budou umět své projekty zpracovávat tak, aby je bylo možné replikovat a automaticky aktualizovat, například v případě získání nových dat.
  • Osnova
    • 1. Úvod do systému R: instalace, spuštění a ukončení systému R, instalace a používání knihoven, nápověda, viněty, vývojové prostředí (RStudio), psaní a spouštění skriptů
    • 2. Data a proměnné: přiřazení dat do proměnných; datové typy, převody mezi nimi, datové struktury; aritmetické operace; načítání a ukládání dat
    • 3. Informace k datům: atributy, subsety, faktory, datumy, objekty a jejich třídy
    • 4. Automatické zpracování dat 1: volání funkcí, základní matematické a statistické funkce a testy
    • 5. Automatické zpracování dat 2: tvorba vlastních funkcí, funkcionály; sekvence, samplování a množinové operace
    • 6. Automatické zpracování dat 3: Práce s řetězci - regulární výrazy, transformace řetězů a získávání dat z řetězců
    • 7. Automatické zpracování dat 4: Dobře formátovaná data - struktura dobře formátovaných dat a převod dat na dobře formátovaná data
    • 8. Automatické zpracování dat 5: Transformace dat, výběry z dat, agregace dat, spojování informací z různých datových souborů
    • 9. Vizualizace dat 1: gramatika grafů a vizualizace jednorozměrných dat
    • 10. Vizualizace dat 2: vizualizace vztahů v datech
    • 11. Úvod do ekonometrie v R
    • 12. Průzkumná analýza dat (EDA)
    • 13. Reprodukovatelný výstup: návrh přehledné a udržovatelné struktury dat a kódu, tvorba automaticky generovaných dokumentů, které obsahují text i výstupy analýzy dat
    Literatura
      povinná literatura
    • WICKHAM, Hadley a Garrett GROLEMUND. R for data science : import, tidy, transform, visualize, and model data. First edition. Sebastopol, CA: O'Reilly. xxv, 492. ISBN 9781491910399. 2016. info
    • PENG, Roger D. R Programming for Data Science. Leanpub. 182 s. 2015. info
    • WICKHAM, Hadley a Carson SIEVERT. Ggplot2 : elegant graphics for data analysis. Second edition. Switzerland: Springer. xvi, 260. ISBN 9783319242750. 2016. info
      doporučená literatura
    • HADLEY, Wickham. Tidy Data. Advances in Business-Related Scientific Research Conference 2014 in Roma (ABSRC 2014 Roma). roč. 59, č. 10, 2014. info
    • KABACOFF, Robert. R in action : data analysis and graphics with R. Shelter Island, NY: Manning. xxiv, 447. ISBN 9781935182399. 2011. info
    • WICKHAM, Hadley. Advanced R. Boca Raton: CRC Press. xxii, 456. ISBN 9781466586963. 2015. info
    • KLEIBER, Christian a Achim ZEILEIS. Applied Econometrics with R. [New York]: Springer. x, 221. ISBN 9780387773162. 2008. info
    • VERZANI, John. Using R for introductory statistics. Boca Raton: Chapman & Hall/CRC. xvi, 414. ISBN 1584884509. 2005. info
    Výukové metody
    Výuka se skládá z domácí přípravy, ve které si studenti nastudují připravené materiály (nahrávky přednášek a lecture notes, které vysvětlují základní teorii a koncepty), a z prezenčních cvičení. Cvičení probíhají v počítačové laboratoři a jsou věnována praktickému použití získaných dovedností na skutečných nebo stylizovaných datových souborech.
    Metody hodnocení
    Předmět je hodnocen na základě účasti (10 %), prezenčních testů na začátku hodiny (10 %), průběžně odevzdávaných domácích úkolů (40 %) a závěrečné praktické zkoušky (40 %). Domácí úkoly i závěrečná praktická zkouška spočívají v přípravě, analýze a vizualizaci zadaných dat. K úspěšnému absolvování předmětu je třeba získat aspoň 50 % možných bodů ze závěrečné zkoušky i 50 % možných bodů celkem.
    Úkoly se odevzdávají průběžně ve formě kódu.
    Při zkoušce je možné používat veškeré materiály dostupné ve vývojovém prostředí, na internetu i vlastní poznámky. Zakázána je komunikace s živými lidmi, a to všemi prostředky.


    Jakékoli opisování, zaznamenávání nebo vynášení testů, používání nedovolených pomůcek jakož i komunikačních prostředků nebo jiné narušování objektivity zkoušky (zápočtu) bude považováno za nesplnění podmínek k ukončení předmětu a za hrubé porušení studijních předpisů. Následkem toho uzavře vyučující zkoušku (zápočet) hodnocením v ISu známkou "F" a děkan zahájí disciplinární řízení, jehož výsledkem může být až ukončení studia.
    Informace učitele
    https://is.muni.cz/auth/el/1456/podzim2016/BPE_AVED/
    Další komentáře
    Studijní materiály
    Předmět je vyučován každoročně.
    Nachází se v prerekvizitách jiných předmětů
    Předmět je zařazen také v obdobích podzim 2016, podzim 2017, podzim 2018, podzim 2020, podzim 2021, podzim 2022.