C1170 Aplikovaná statistika pro bioinformatiky I

Přírodovědecká fakulta
jaro 2026
Rozsah
2/2. 5 kr. Ukončení: zk.
Vyučováno kontaktně
Vyučující
Mgr. Veronika Horská, Ph.D. (přednášející)
Garance
prof. RNDr. Michaela Wimmerová, Ph.D.
Národní centrum pro výzkum biomolekul – Přírodovědecká fakulta
Kontaktní osoba: RNDr. Tomáš Raček, Ph.D.
Dodavatelské pracoviště: Národní centrum pro výzkum biomolekul – Přírodovědecká fakulta
Předpoklady
Znalost matematiky na úrovni střední školy.
Omezení zápisu do předmětu
Předmět je otevřen studentům libovolného oboru.
Cíle předmětu
Cílem předmětu je seznámit studenta se základními statistickými metodami a principy a zajistit dostatečné procvičení těchto metod na reálných bioinformatických datech s využitím statistického softwaru R.
Výstupy z učení
Po absolvování předmětu bude student schopen:
- naplánovat vlastní experiment, včetně stanovení cílů experimentu;
- definovat statistické hypotézy, jejichž testování povede ke splnění cílů experimentu;
- sesbírat data a přehledně zpracovat všechny potřebné podklady k provedení datové analýzy;
- použít vhodné statistické metody k získání prvotního náhledu na datový soubor;
- provést datovou analýzu korektně ověřující definované statistické hypotézy;
- vyvodit z výsledků datové analýzy správné statistické závěry;
- správně interpretovat statistické závěry v oboru bioinformatiky;
- reprezentovat výsledky datové analýzy přehlednou formou v podobě prezentace.
Osnova
  • Úvod do aplikované statistiky, motivace a cíle předmětu, příklady reálných bioinformatických dat a jejich datové analýzy provedené v softwaru R, základy práce se softwarem R.
  • Typy dat; průzkumová analýza (EDA): vizualizace dat, základní číselné charakteristiky.
  • Vybrané pravděpodobnostní modely pro diskrétní náhodné veličiny.
  • Vybrané pravděpodobnostní modely pro spojité náhodné veličiny.
  • Úvod do testování hypotéz, jednorozměrné a dvourozměrné testy normality.
  • Jednovýběrové parametrické testy: o střední hodnotě, o rozptylu, o korelačním koeficientu, o pravděpodobnosti.
  • Dvouvýběrové parametrické testy: o rozdílu středních hodnot, o podílu rozptylů, o rozdílu korelačních koeficientů, o rozdílu dvou pravděpodobností a o podílu šancí.
  • Jednovýběrové a dvouvýběrové neparametrické testy o mediánech.
  • Plánování experimentu, sběr dat a zpracování podkladů k provedení datové analýzy.
  • Reprezentace výsledků datové analýzy formou prezentace s využitím softwaru LaTeX .
Literatura
    doporučená literatura
  • SHAHBABA, Babak. Biostatistics with R : an introduction to statistics through biological data. Dordrecht: Springer, 2012, xvi, 352. ISBN 9781461413011. info
  • CASELLA, George a Roger L. BERGER. Statistical inference. 2nd ed. Pacific Grove, Calif.: Duxbury, 2002, xxviii, 66. ISBN 8131503941. info
  • BUDÍKOVÁ, Marie; Tomáš LERCH a Štěpán MIKOLÁŠ. Základní statistické metody. 1. vyd. Brno: Masarykova univerzita, 2005, 170 s. ISBN 978-80-210-3886-8. info
Výukové metody
Přednášky: 2 hodiny týdně; teoretické přednášky zaměřené na seznámení se se statistickými pojmy a metodami.
Cvičení: 2 hodiny týdně; praktická cvičení na počítači zaměřená na aplikaci statistických metod při analýze bioinformatických dat s využitím statistického software R.
Metody hodnocení
Podmínka pro přihlášení na zkoušku: průběžná semestrální práce spočívající v aktivní prezenční účasti na cvičeních (povoleny jsou 2 neomluvené absence); vypracování a odevzdání řešení tří domácích úkolů reflektujících látku probíranou na cvičeních.
Zkouška: závěrečná semestrální písemná práce (nutné získat alespoň 50 % bodů); prezentace výsledků statistické analýzy (cca 10 min), kterou student zpracovává buď na vlastních datech nebo na poskytnutých datech.
Další komentáře
Předmět je vyučován každoročně.
Výuka probíhá každý týden.

  • Statistika zápisu (nejnovější)
  • Permalink: https://is.muni.cz/predmet/sci/jaro2026/C1170