Bi8190 Vizualizace biologických dat

Přírodovědecká fakulta
jaro 2014
Rozsah
0/2. 2 kr. (příf plus uk plus > 4). Ukončení: z.
Vyučující
Mgr. David Zelený, Ph.D. (cvičící)
Garance
Mgr. David Zelený, Ph.D.
Ústav botaniky a zoologie – Biologická sekce – Přírodovědecká fakulta
Kontaktní osoba: Mgr. David Zelený, Ph.D.
Dodavatelské pracoviště: Ústav botaniky a zoologie – Biologická sekce – Přírodovědecká fakulta
Rozvrh
Pá 8:00–11:50 B09/316
Předpoklady
Kurz Vizualizace biologických dat má dva základní cíle: 1) seznámit studenty se základy a moderními trendy ve vizualizaci vědeckých dat (jak by měl správně vypadat obrázek ve vědecké publikaci, aby byl přehledný a informativní zároveň, jaké jsou možnosti zobrazení různých typů dat, jaké jsou vhodné elektronické formáty atd.), a 2) naučit studenty, jak jednotlivé jednodušší i složitější grafy vytvořit v programu R. Data se vyplatí zobrazit i před vlastní analýzou, aby jsme viděli, co v datech "vlastně je". Vhodné zobrazení výsledků analýzy je zase důležité proto, že obrázky jsou v publikacích většinou to, co čtenáře zaujme (nebo zarazí) na první pohled. Ve své podstatě je kurz poměrně technicky zaměřen a probíhá jako praktické cvičení u počítače se spuštěným eRkem; teoretické části přednášky jsou ihned následovány praktickým cvičením, ve kterém si studenti hned vyzkouší, jak věci fungují. Vhodnou prerekvizitou kurzu je Bi7560 Úvod do R, není však podmínkou - na úvod kurzu budou studenti intenzivní formou seznámeni se základy práce v programu R. Kurz se doplňuje s kurzy Bi7920 Zpracování biologických dat a Bi7550 Practical Analysis of Biological Data – Seminar, které jsou také zaměřeny na práci s eRkem (zatímco Bi7920 Zpracování biologických dat se věnuje analytickému zpracování jednorozměrných dat a Bi7550 Practical Analysis of Biological Data – Seminar se zabývá daty mnohorozměrnými, kurz Vizualizace je zaměřen na grafickou prezentaci dat). Výhodou je také předchozí absolvování kurzu Bi5040 Biostatistika - základní kurz.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Tento kurz si klade dvojí cíl: naučit studenty základy prezentace biologických dat v grafické podobě včetně vytváření efektních a přehledných grafů, a prohloubit jejich schopnost v používání programu R pro jiné než statistické účely.
Osnova
  • 1) Základy práce s programem R.
  • 2) Základní pravidla pro vizualizaci dat - různé typy dat vyžadují různé typy grafů. Co v obrázcích nesmí chybět a co tam naopak nemusí být? Jak vytvořit jednoduché grafy (boxploty, histogramy, scatterploty) v programu R?
  • 3) Barvy - které kombinace nelze použít, jaké barvy zvolit pro tisk nebo pro osoby s poruchou barevného vnímání, jak barvu v Rku namíchat, kdy barvu používat a kdy ne?
  • 4) Formáty obrázků - použít raději jpg, bmp, tiff, nebo snad pdf či eps? Jaké jsou mezi formáty rozdíly a jak v eRku tyto formáty vytvořit? Které formáty jsou vhodné pro jaké účely?
  • 5) Pokročilejší zobrazení dat - trellis diagramy a 3D grafika.
  • 6) Jak vytvořit grafy podle vlastních představ? (takříkajíc from scratch, z náčrtku).
Literatura
  • MURRELL, Paul. R graphics. Boca Raton, Fla.: Chapman & Hall/CRC. xix, 301. ISBN 158488486X. 2006. info
  • URL: http://www.stat.auckland.ac.nz/~paul/RGraphics/rgraphics.html
Výukové metody
Výuka bude probíhat v počítačové učebně přímo u zapnutého počítače s Rkem - co se studenti dozvědí, to si ihned vyzkouší. První hodinu věnujeme shrnutí toho, co můžou studenti od předmětu očekávat a co naopak ne, abychom zabránili potenciálnímu zklamání z nenaplněných očekávání. V průběhu kurzu budou zadány 3 domácí úkoly, vypracování alespoň 2 bude jedna z podmínek k získání zápočtu. Aktivní účast na přednáškách není povinná, nicméně je vřele doporučená - učební křivka pro program R je zejména zpočátku poměrně strmá a komu ujede vlak, ten ho už nemusí chytit. Na závěr kurzu si každý student vyzkouší vizuální zpracování vlastních nebo zapůjčených dat, které pak odprezentuje na závěrečné hodině (v rámci malého workshopu). Vypracování této prezentace je druhou podmínkou k získání zápočtu.
Metody hodnocení
Poslední dvouhodinu věnujeme "workshopu", na kterém bude každý krátce prezentovat výsledky svojí práce, s následnou diskusí na téma co mohlo být uděláno líp a co hůř. Na základě této prezentace a vypracovaných domácích úkolů (alespoň tří ze čtyř) bude udělován zápočet.
Informace učitele
http://www.davidzeleny.net/wiki/doku.php/vizualizace:start
Přednáška v počítačovně bude s největší pravděpodobností probíhat jednou za 14 dní, dvě přednášky v kuse s krátkou přestávkou. Klasická dvouhodinovka se pro tento typ předmětu neosvědčila, protože na spojení teoretické a praktické části v ní není dost času.
Další komentáře
Studijní materiály
Předmět je vyučován jednou za dva roky.
Poznámka k periodicitě výuky: v jarním semestru sudých let (2008, 2010, ...).
Předmět je zařazen také v obdobích jaro 2008 - akreditace, jaro 2007, jaro 2008, jaro 2010, jaro 2012, jaro 2012 - akreditace, podzim 2016, podzim 2018.