E7528 Analýza genomických a proteomických dat

Přírodovědecká fakulta
jaro 2026
Rozsah
2/1/0. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: k, z.
Vyučováno kontaktně
Vyučující
Mgr. Eva Budinská, Ph.D. (přednášející)
Garance
Mgr. Eva Budinská, Ph.D.
RECETOX – Přírodovědecká fakulta
Kontaktní osoba: Mgr. Eva Budinská, Ph.D.
Dodavatelské pracoviště: RECETOX – Přírodovědecká fakulta
Rozvrh
Po 16. 2. až Pá 22. 5. St 11:00–13:50 F01B1/709
Předpoklady
( Bi5040 Biostatistika - základní kurz || Bi5045 Biostatistika pro mat. biol. || Bi5046 Biostatistika pro mat. biol. || E5046 Biostatistika pro mat. biol. ) && E8600 Vícerozměrné metody && E7527 Analýza dat v R && Bi4010 Základy molekulární biologie && E0034 Analýza a klasif dat
Bi5040 Biostatistika – základní kurz, nebo Bi5045 Biostatistika pro matematickou biologii Nutným předpokladem je dobrá znalost základní metodologie biostatistiky a základů molekulární biologie a genetiky . Doporučeno je absolvování předmětu Bi7527 Analýza dat v R, Bi8600 Vícerozměrné statistické metody, Bi4010 Základy molekulární biologie, Bi3060 Obecná genetika a B7250 Genetika člověka, Bi5510 Detekce biomarkerů z omicsových experimentů
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 30 stud.
Momentální stav registrace a zápisu: zapsáno: 5/30, pouze zareg.: 0/30, pouze zareg. s předností (mateřské obory): 0/30
Jiné omezení: Doporučení absolvovat Bi8600, Bi4010, Bi3060
Mateřské obory/plány
Anotace
Cílem kurzu je naučit studenty aplikovat a kriticky hodnotit pokročilé statistické přístupy používané při analýze vysokohustotních genomických a proteomických dat, získaných mikročipovými a hmotnostně-spektrometrickými technologiemi, a to od předzpracování a normalizace surových dat až po jejich biologickou interpretaci.
Výstupy z učení
  • Rozumí biologickým otázkám řešitelným pomocí vysokohustotních genomických a proteomických dat a dokáže je převést do statistického rámce.

  • Orientuje se ve vybraných technologiích generujících tato data (DNA mikročipy včetně epigenetických a SNP čipů, arrayCGH, hmotnostní spektrometrie) a chápe jejich technické principy v kontextu následného statistického modelování.

  • Rozumí charakteru dat produkovaných těmito technologiemi (distribuce, závislosti, heteroskedasticita, systematické chyby) a jejich důsledkům pro volbu analytických metod.

  • Dokáže navrhnout a realizovat kompletní analytický workflow od kvantifikace a předzpracování surových dat po inferenční a biologickou interpretaci výsledků.

  • Identifikuje a statisticky modeluje zdroje technické variability (včetně batch efektu), posoudí jejich vliv na výsledky a aplikuje adekvátní korekční postupy.

  • Rozumí principům normalizace, transformace a standardizace dat a dokáže zdůvodnit volbu konkrétní metody s ohledem na povahu dat.

  • Formuluje statistické hypotézy vycházející z biologického zadání a vybírá vhodné inferenční metody včetně lineárních modelů (např. SAM, limma) a korekce vícenásobného testování.

  • Kriticky hodnotí předpoklady a limity metod používaných pro analýzu diferenciální exprese a vysokodimenzionální klasifikaci.

  • Aplikuje metody klasifikace a predikce tříd ve vysokodimenzionálních datech, rozumí jejich validačním strategiím (včetně MAQC II) a dokáže interpretovat jejich výkonnost.

  • Volí a interpretuje vícerozměrné regresní modely včetně modelů přežití (Kaplan-Meier, Coxův model proporcionálních rizik) v kontextu omických dat.

  • Rozumí statistickým principům analýzy genových sad, pathway analýzy a síťových přístupů a dokáže tyto metody kriticky aplikovat.

  • Aplikuje meta-analytické postupy (včetně Fisherovy Z-transformace) a chápe jejich předpoklady a omezení při integraci více studií.

  • Samostatně pracuje v prostředí R a Bioconductor a využívá relevantní nástroje s porozuměním jejich metodologickému základu.


  • Klíčová témata
    • Vysokohustotní genomická a proteomická data: charakter dat, zdroje variability a technologicky podmíněný šum
    • Kvantifikace a předzpracování mikročipových dat (image analysis, sumarizace signálu)
    • Normalizace a transformace dat mikročipových technologií
    • Specifika epigenetických a SNP mikročipů (beta/M hodnoty, technické biasy)
    • Kvantifikace, normalizace a specifika dat proteinové hmotnostní spektrometrie
    • Modelování systematických efektů a korekce batch efektu
    • Lineární modely a vícenásobné testování v genomice a proteomice (SAM, limma)
    • Vysokodimenzionální klasifikace a predikční modely
    • Neřízené metody a objevování struktur v datech
    • Regresní modely a analýza přežití v omických datech
    • Analýza genových sad a síťové přístupy
    • Meta-analýza genomických a proteomických studií
    Studijní zdroje a literatura
      doporučená literatura
    • Meta-analysis and combining information in genetics and genomics. Edited by Rudy Guerra - Darlene Renee Goldstein. Boca Raton: CRC Press, 2010, xxiii, 335. ISBN 9781584885221. info
    • GENTLEMAN, Robert. R programming for bioinformatics. Boca Raton: CRC Press, 2009, xii, 314. ISBN 9781420063677. info
    • Bioinformatics and computational biology solutions using R and bioconductor. Edited by Robert Gentleman. New York: Springer, 2005, xix, 473. ISBN 0387251464. info
    • Data analysis and visualization in genomics and proteomics. Edited by Francisco Azuaje - Joaquín Dopazo. Hoboken, NJ: John Wiley, 2005, xv, 267. ISBN 0470094397. info
    • DRĄGHICI, Sorin. Data analysis tools for DNA microaarays. Boca Raton: Chapman & Hall/CRC, 2003, 477 s. +. ISBN 1-58488-315-4. info
    Přístupy, postupy a metody používané ve výuce
    Výuka bude probíhat formou přednášek s teoretickou přípravou a praktickými cvičeními v programu R a jeho nástavbě Bioconductor. V úvodu přednášky se vysvětlí koncepty a metody, a následně si studenti vyzkouší jejich aplikaci na reálných datech. Začátkem semestru si student vybere jeden projekt, který bude splňovat nároky (detaily v první přednášce), na kterém pak bude v průběhu semestru pracovat. Ve druhé půlce semestru pak budou studenti své průběžné výsledky prezentovat na přednáškách.
    Způsob ověření výstupů z učení a požadavky na ukončení
    Závěrečný písemný test se bude skládat z přibližně 10 otázek hodnocených 20 body. Body získané za tento test budou tvořit 50% z celkového finálního hodnocení. Dalších 20 bodů (50% hodnocení) bude uděleno za aktivitu při přednáškách a cvičeních (5 bodů) a za kvalitu zpracování projektu (15 bodů). Pro úspěšné ukončení předmětu je nutné dosáhnout minimálně 21 bodů, z toho 10 bodů z projektu. Studenti můžou při testu používat všechny studijní materiály, protože otázky jsou koncipovány tak, aby vyzkoušeli především znalost obecných principů a schopnost využít nabyté znalosti při řešení praktických příkladů.
    Další komentáře
    Studijní materiály
    Předmět je vyučován každoročně.
    Předmět je zařazen také v obdobích jaro 2023, jaro 2024, jaro 2025.
    • Statistika zápisu (nejnovější)
    • Permalink: https://is.muni.cz/predmet/sci/jaro2026/E7528