Vizualizace dat
Mgr. Tomáš Marek
Vizualizace dat
Info
Období
podzim 2019
Cílem volitelného předmětu je rozvíjet dovednosti studentů v oblasti designu efektivní a smysluplné vizualizace. Naučí se používat základní nástroje k vizualizaci dat, dokážou vizualizovaná data evaluovat a budou schopni diskutovat grafické reprezentace dat z hlediska jejich efektivity v různých kontextech. V teoretické rovině budou obeznámeni se základy vizuálního vnímání, designu a estetiky ve vizualizaci dat.
Učitel doporučuje studovat od 26. 9. 2019 do 3. 10. 2019.
Učitel doporučuje studovat od 3. 10. 2019 do 10. 10. 2019.
Učitel doporučuje studovat od 10. 10. 2019 do 17. 10. 2019.
Učitel doporučuje studovat od 17. 10. 2019 do 24. 10. 2019.
Učitel doporučuje studovat od 24. 10. 2019 do 31. 10. 2019.
Učitel doporučuje studovat od 31. 10. 2019 do 7. 11. 2019.
Učitel doporučuje studovat od 7. 11. 2019 do 14. 11. 2019.
Učitel doporučuje studovat od 14. 11. 2019 do 21. 11. 2019.
Učitel doporučuje studovat od 21. 11. 2019 do 28. 11. 2019.
Učitel doporučuje studovat od 28. 11. 2019 do 5. 12. 2019.
Učitel doporučuje studovat od 5. 12. 2019 do 12. 12. 2019.
Učitel doporučuje studovat od 12. 12. 2019 do 19. 12. 2019.

1. Úvodní hodina

Prezentace a materiály k přednášce

Prezentace VIZ1 (26. 9. 2019)
Prezentace k úvodní přednášce do předmětu Vizualizace dat.
Záznam přednášky VIZ1 pro kombinované studenty
Pro zobrazení záznamu je třeba být přihlášen do IS MUNI.

Podmínky ukončení předmětu

  1. Průběžné samostatné úkoly budou zadány vždy v interaktivní osnově předmětu. Odevzdávárny budou otevřeny tamtéž. Musíte mít splněno pro připuštění k testu! Nejsou bodovány – cílem je procvičit si odborné dovednosti.
  2. Zkouška bude ústní. Budeme se bavit o vizualizaci, společně hodnotit vizualizace a promýšlet je.
  3. Docházka je 50 % pro prezenční studenty. Kombinovaní studenti plní vše jako prezenční studenti, kromě docházky - není třeba. Kombinovaní studenti vypracují úkol navíc, bude zadán později.
K proklikání tento týden
Kontrolní otázky pro tento týden
  • Proč využíváme vizualizaci dat?
  • Co ilustruje Anscombův kvartet?
  • Co charakterizuje pole vizualizace dat v současnosti?
  • Jaký je rozdíl mezi infografikou a vizualizací?
  • Jaký je rozdíl mezi sciviz, infoviz a geoviz?
Rozšiřující literatura pro tento týden

  • Cairo, A. (2013). The functional art: an introduction to information graphics and visualization.
    Berkeley, California: New Riders.
  • Jaroš, R., & Pauknerová, P. (Eds.). (2017). Nejen kruhy: vizuální přístupy v zobrazování dat a informací.
    V Praze: Vysoká škola uměleckoprůmyslová.
  • Rosling, H., Rosling, O., & Rosling Rönnlund, A. (2018). Faktomluva: deset důvodů, proč se mýlíme v pohledu na svět - a proč jsou věci lepší, než vypadají. V Brně: Jan Melvil Publishing.


2. Historie vizualizace

Prezentace a materiály k přednášce

Prezentace VIZ2 (3. 10. 2019)
Prezentace k druhé přednášce předmětu Vizualizace dat.
Záznam přednášky VIZ2 pro kombinované studenty
Pro zobrazení záznamu je třeba být přihlášen do IS MUNI.
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/phil/podzim2019/ISKM56/ode/viz-du1/

Domácí úkol VIZ-DÚ1

Na webu http://datavis.ca/milestones/index.php
prozkoumejte historii datové vizualizace.

Varianta 1: Vyberte si jednu formu/vizualizaci z historie, popište jak funguje a pokuste se odhalit, jak ovlivnila současnou podobu vizualizace. Můžeme se s ní ještě dnes setkat? V jaké podobě? V jakém kontextu?

Varianta 2: Vyberte si jednu technologii a zamyslete se, jaký dopad měla na vizualizaci dat.

Krátké zamyšlení sepište do textového souboru a odevzdejte do odevzdávárny do 17. 10. 2019. Nutný rozsah není udán - důležité je se seznámit s prací a databází Friendlyho (viz web) a uvědomit si, co všechno mělo vliv na rozvoj vizualizace. Vaše zamyšlení tak může být jeden odstavec i dvě normostrany - rozsah je na Vás, důležitý je smysl.

K proklikání tento týden
Kontrolní otázky pro tento týden
  • Na jaké milníky a příběhy z historie vizualizace si vzpomínáte?
  • Co považujeme za první graf zobrazující kvantitativní data?
  • Čím bylo specifické období, které Friendly nazývá jako doba temna?
  • Dokážete popsat, co je to umělecká vizualizace?
  • Víte, co jsou to eco-feedback technologie a jakou roli v nich hraje vizualizace?
Rozšiřující literatura pro tento týden
  • DRUCKER, Johanna. Graphesis: visual forms of knowledge production. Cambridge, Massachusetts: Harvard University Press, 2014. ISBN 978-0674724938.
  • HANZELÍNOVÁ, Lada. Informační grafika: Otto Neurath - Isotype. 2. vydání. Červený Kostelec: Pavel Mervart, 2015. Hermés (Pavel Mervart). ISBN 978-80-7465-146-5.
  • FRIENDLY, Michael. Milestones in the History of Data Visualization: A Case Study in Statistical Historiography. WEIHS, Claus a Wolfgang GAUL, ed. Classification — the Ubiquitous Challenge [online]. Berlin/Heidelberg: Springer-Verlag, 2005, s. 34-52 [cit. 2019-10-05]. Studies in Classification, Data Analysis, and Knowledge Organization. DOI: 10.1007/3-540-28084-7_4. ISBN 3-540-25677-6. Dostupné z: http://link.springer.com/10.1007/3-540-28084-7_4

3. Základy vizualizace dat

Prezentace a materiály k přednášce

Prezentace VIZ3 (10. 10. 2019)
Prezentace ke třetí přednášce předmětu Vizualizace dat.
Záznam přednášky VIZ3 pro kombinované studenty
Pro zobrazení záznamu je třeba být přihlášen do IS MUNI.
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/phil/podzim2019/ISKM56/ode/viz-du2/
Domácí úkol VIZ-DÚ2

Vyberte si téma: a) vyhazování odpadků , b) pití tekutin nebo c) vyberte si vlastní vhodné téma (můžete ho konzultovat). Navrhněte sledované atributy: každý záznam má min. čtyři atributy, i víc je v pohodě… (např. kdyby téma bylo průchody dveřmi, zaznamenávat můžu čas, barvy, typ, směr otevírání, pocit, materiál,...). Sbírejte jeden celý týden data.

Sbližte se se svými daty: hledejte v datech, kategorizujte a organizujte, najděte hlubší porozumění, hledejte příběhy a vzory.

Kreslete: navrhněte, jak to celé zobrazit. Sketche, návrhy, pokusy. Využijte, co víte z dnešní přednášky. Pokud jste zapomněli některé atributy nějakou dobu sledovat, nezapomeňte nejistoty promítnout i do výsledku.

Nezapomeňte sepsat legendu: vysvětlete, jak to číst a co je jak kódováno… Výsledek už stačí jen vyfotit/naskenovat a hodit do odevzdávárny. Fyzický výstup doneste do hodiny. Nevyužívejte při tvorbě počítač. Vyvarujte se běžných vizuálních metafor a typů grafů.

Inspiraci hledejte v prezentaci. Podrobnější zadání úkolu hledejte ve videozáznamu přednášky.

Kontrolní otázky pro tento týden
  • Jaké jsou základní vizualizační ingredience?
  • Dokážete vysvětlit, co jsou to vizuální proměnné?
  • Jaký je rozdíl mezi ikonou a glyfem?
  • Co znamená aditivní a substitutivní hodnota u Normana?
  • Jaké typy měřítek známe?
  • Podle jakých hledisek můžeme organizovat vizualizaci?
Rozšiřující literatura pro tento týden
  • BERTIN, Jacques a William J. BERG. Semiology of graphics: diagrams, networks, maps. Redlands, Calif.: Distributed by Ingram Publisher Services, 2010. ISBN 978-1589482616.
  • CLEVELAND, William S. a Robert MCGILL. Graphical Perception: Theory, Experimentation, and Application to the Development of Graphical Methods. Journal of the American Statistical Association [online]. 1984, 79(387) [cit. 2019-10-14]. DOI: 10.2307/2288400. ISSN 01621459. Dostupné z: https://www.jstor.org/stable/2288400?origin=crossref
  • CLEVELAND, William S. The elements of graphing data. Rev. ed. Murray Hill, N.J.: AT&T Bell Laboratories, 1994. ISBN 978-0963488411.

4. Základy vizuálního vnímání

Prezentace a materiály k přednášce

Prezentace VIZ4 (17. 10. 2019)
Prezentace ke čtvrté přednášce předmětu Vizualizace dat.
Záznam přednášky VIZ4 pro kombinované studenty
Pro zobrazení záznamu je třeba být přihlášen do IS MUNI.

Kontrolní otázky pro tento týden
  • Jak popisuje proces vizuální vnímání Colin Ware?
  • Co jsou to předpozornostní atributy a jak je využít?
  • Jaká znáte zákony gestaltu a jak je můžeme aplikovat?
  • Jaké potíže je třeba řešit u krátkodobé paměti?
Rozšiřující literatura pro tento týden
  • WARE, Colin. Information visualization: perception for design. Third edition. Waltham, MA: Morgan Kaufmann, 2013. ISBN 978-0123814647.
  • WARE, Colin. Visual Thinking for Design. Waltham, MA: Morgan Kaufmann, 2008. ISBN 978-0123708960.

5. Barva ve vizualizaci

Prezentace a materiály k přednášce

Prezentace VIZ5 (24. 10. 2019)
Prezentace k páté přednášce předmětu Vizualizace dat.

Záznam přednášky VIZ5 pro kombinované studenty
Pro zobrazení záznamu je třeba být přihlášen do IS MUNI.

Kontrolní otázky pro tento týden
  • Jaké největší potíže s barvou musíme ve vizualizaci řešit?
  • Co je to barevný model HCL?
  • Jaké anomálie barevného vidění známe? Jaký mohou mít dopad na vizualizaci?
  • Co je to sémanticky rezonantní volba barvy?
  • Jak volíme barevné škály a palety a jaké typy stupnic využíváme?
Rozšiřující literatura pro tento týden

  • WARE, Colin. Information visualization: perception for design. Third edition. Waltham, MA: Morgan Kaufmann, 2013. ISBN 978-0123814647.
  • WARE, Colin. Visual Thinking for Design. Waltham, MA: Morgan Kaufmann, 2008. ISBN 978-0123708960.

6. Smysl a estetika vizualizace

Prezentace a materiály k přednášce

Prezentace VIZ6 (31. 10. 2019)
Prezentace k šesté přednášce předmětu Vizualizace dat.
Záznam přednášky VIZ6 pro kombinované studenty
Pro zobrazení záznamu je třeba být přihlášen do IS MUNI.

Testovací dataset pro Charticulator (.csv)
Upraveno a zmenšeno z https://bit.ly/2WptSZD

Nástroje k vyzkoušení
Kontrolní otázky pro tento týden
  • Co znamená, když řekneme, že by vizualizace měla mít smysl?
  • Co je to "data density" a jaký je smysl tohoto konceptu?
  • K čemu slouží vzorec pro výpočet data-ink poměru a jaký má smysl to počítat?
  • Co označujeme jako chartjunk a může mít i pozitivní roli?
  • Proč jsou problematické 3D efekty ve vizualizaci která nemá třetí rozměr?
Rozšiřující literatura pro tento týden
  • HOLMES, Nigel. Designer's guide to creating charts & diagrams. New York: Watson-Guptill Publications, 1984. ISBN 978-0823013159.
  • TUFTE, Edward R. The visual display of quantitative information. 2nd ed. Cheshire, Conn.: Graphics Press, c2001. ISBN 0-9613921-4-2.
  • TUFTE, Edward R. Visual explanations: images and quantities, evidence and narrative. Cheshire, Conn.: Graphics Press, c1997. ISBN 0-9613921-2-6.

7. Estetika a manipulace

Prezentace a materiály k přednášce

Prezentace VIZ7 (7. 11. 2019)
Prezentace k sedmé přednášce předmětu Vizualizace dat.
Záznam přednášky VIZ7 pro kombinované studenty
Pro zobrazení záznamu je třeba být přihlášen do IS MUNI.

Kontrolní otázky pro tento týden
  • Jaké základní metody se používají při manipulaci vizualizací?
  • Co je to podeskávání osy a je vždy nutné se mu vyhnout?
  • Co je to lie-factor a jak se počítá?
Rozšiřující literatura pro tento týden
  • CAIRO, Alberto. How Charts Lie. W. W. Norton & Company, 2019. ISBN 1324001569.
  • HUFF, Darrell. How to Lie with Statistics. New York: Norton, 1954. ISBN 0-393-31072-8.

RV | Výzkumy ve vizualizaci

Z důvodu pietního shromáždění akademické obce MU v Kounicových kolejích
u příležitosti 80. výročí listopadu 1939 je na 14. 11. 2019 od 15:00 hod vyhlášeno
rektorské volno.

Místo této hodiny budou k samostudiu připraveny výzkumy z oblasti vizualizace dat rozšiřující témata,
která probíráme na přednáškách,

Výzkumy ke studiu
  • BATEMAN, Scott, Regan L. MANDRYK, Carl GUTWIN, Aaron GENEST, David MCDINE a Christopher BROOKS. Useful junk? In: Proceedings of the 28th international conference on Human factors in computing systems - CHI '10 [online]. New York, New York, USA: ACM Press, 2010, 2010, s. 2573- [cit. 2019-10-30]. DOI: 10.1145/1753326.1753716. ISBN 9781605589299. Dostupné z: http://hci.usask.ca/publications/view.php?id=173

  • KELLEHER, Christa a Thorsten WAGENER. Ten guidelines for effective data visualization in scientific publications. Environmental Modelling & Software [online]. 2011, 26(6), 822-827 [cit. 2019-11-14]. DOI: 10.1016/j.envsoft.2010.12.006. ISSN 13648152. Dostupné z: https://linkinghub.elsevier.com/retrieve/pii/S1364815210003270

  • TORY, M. a T. MOLLER. Human factors in visualization research. IEEE Transactions on Visualization and Computer Graphics [online]. 2004, 10(1), 72-84 [cit. 2019-11-14]. DOI: 10.1109/TVCG.2004.1260759. ISSN 1077-2626. Dostupné z: http://ieeexplore.ieee.org/document/1260759/

8. Vizualizační formy prakticky

Prezentace a materiály k přednášce

Prezentace VIZ8 (21. 11. 2019)
Prezentace k osmé přednášce předmětu Vizualizace dat.
Záznam přednášky VIZ8 pro kombinované studenty
Pro zobrazení záznamu je třeba být přihlášen do IS MUNI.

Nástroje k vyzkoušení
Kontrolní otázky pro tento týden
  • Jaká pravidla se vážou k základním statistickým grafům?
  • Co je to tzv. slopegraph a proč ho využíváme?
  • Jaký největší problém provází plošné grafy?
  • Proč nefunguje korelační diagram v 3D bez interaktivity?
  • Jakým způsobem lze řešit problém s mnoha datovými řadami?
  • Jaké formy se využívají při vizualizaci vícerozměrných dat?
  • Jaký je rozdíl mezi sloupcovým grafem a histogramem?
  • Jak se čte krabicový graf?
  • Jaké formy jsou vhodné pro hierarchická data?
Rozšiřující literatura pro tento týden
  • HARRIS, Robert L. Information graphics: a comprehensive illustrated reference. New York: Oxford University Press, 1999. ISBN 978-0195135329.

9. Vizualizace v žurnalistice

Informace k přednášce hostujícího lektora

Tuto přednášku hostuje Honza Boček z portálu iRozhlas.cz a s tématem datové žurnalistiky.
Záznam z přednášky nebyl pořízen.

10. Praktické cvičení

1. Redesign grafu z diplomové práce

Jedno z možných řešení (.zip)
Heslo k otevření souboru: "vizdata"
Zadání úkolu do hodiny - TOTO NENÍ DOMÁCÍ ÚKOL

Na obrázku z původní práce vidíte graf, který není příliš kvalitní. Nenabízí žádnou analýzu a jako nástroj k exploraci dat také příliš nefunguje. Zásadním je ukázat především výkyvy v produkci jednotlivých fakult. Pokuste se nad stejnými daty (k dispozici jako .xlsx) vytvořit graf, který budete sami považovat za efektivnější.

2. Explorace a vizualizace školních dat

Otázky a úkoly k datasetu do hodiny - TOTO NENÍ DOMÁCÍ ÚKOL

Pokuste se tyto otázky zodpovědět skrze vizuální analýzu dat.

  1. Vytvořte jednoduchý koláčový graf v Excelu, který bude zobrazovat poměr pohlaví studentů.
  2. Existuje vztah mezi absencí studentů a množstvím jejich aktivity ve výuce (ať už prezenční nebo absenční)?
  3. Existuje vztah mezi absencí studentů a jejich celkovou studijní úspěšností (L, M, H)?
  4. Existuje vztah mezi skutečností, že rodiče žáků vyplnili školní dotazník a jejich spokojeností se školou?
  5. Pokuste se využít Excel k tvorbě kartogramu nad daty o původu studentů.

11. Mapové vizualizace

Informace k přednášce hostujícího lektora

Tuto přednášku hostuje Honza Pospíšil a s tématem mapové vizualizace.
Záznam z přednášky nebyl pořízen.