PřF:E7528 Analýza genom proteom dat - Informace o předmětu
E7528 Analýza genomických a proteomických dat
Přírodovědecká fakultajaro 2026
- Rozsah
- 2/1/0. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: k, z.
Vyučováno kontaktně - Vyučující
- Mgr. Eva Budinská, Ph.D. (přednášející)
- Garance
- Mgr. Eva Budinská, Ph.D.
RECETOX – Přírodovědecká fakulta
Kontaktní osoba: Mgr. Eva Budinská, Ph.D.
Dodavatelské pracoviště: RECETOX – Přírodovědecká fakulta - Rozvrh
- Po 16. 2. až Pá 22. 5. St 11:00–13:50 F01B1/709
- Předpoklady
- ( Bi5040 Biostatistika - základní kurz || Bi5045 Biostatistika pro mat. biol. || Bi5046 Biostatistika pro mat. biol. || E5046 Biostatistika pro mat. biol. ) && E8600 Vícerozměrné metody && E7527 Analýza dat v R && Bi4010 Základy molekulární biologie && E0034 Analýza a klasif dat
Bi5040 Biostatistika – základní kurz, nebo Bi5045 Biostatistika pro matematickou biologii Nutným předpokladem je dobrá znalost základní metodologie biostatistiky a základů molekulární biologie a genetiky . Doporučeno je absolvování předmětu Bi7527 Analýza dat v R, Bi8600 Vícerozměrné statistické metody, Bi4010 Základy molekulární biologie, Bi3060 Obecná genetika a B7250 Genetika člověka, Bi5510 Detekce biomarkerů z omicsových experimentů - Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 30 stud.
Momentální stav registrace a zápisu: zapsáno: 5/30, pouze zareg.: 0/30, pouze zareg. s předností (mateřské obory): 0/30
Jiné omezení: Doporučení absolvovat Bi8600, Bi4010, Bi3060 - Mateřské obory/plány
- Biomedicínská bioinformatika (program PřF, N-MBB)
- Epidemiologie a modelování (program PřF, N-MBB)
- Anotace
- Cílem kurzu je naučit studenty aplikovat a kriticky hodnotit pokročilé statistické přístupy používané při analýze vysokohustotních genomických a proteomických dat, získaných mikročipovými a hmotnostně-spektrometrickými technologiemi, a to od předzpracování a normalizace surových dat až po jejich biologickou interpretaci.
- Výstupy z učení
Rozumí biologickým otázkám řešitelným pomocí vysokohustotních genomických a proteomických dat a dokáže je převést do statistického rámce.
Orientuje se ve vybraných technologiích generujících tato data (DNA mikročipy včetně epigenetických a SNP čipů, arrayCGH, hmotnostní spektrometrie) a chápe jejich technické principy v kontextu následného statistického modelování.
Rozumí charakteru dat produkovaných těmito technologiemi (distribuce, závislosti, heteroskedasticita, systematické chyby) a jejich důsledkům pro volbu analytických metod.
Dokáže navrhnout a realizovat kompletní analytický workflow od kvantifikace a předzpracování surových dat po inferenční a biologickou interpretaci výsledků.
Identifikuje a statisticky modeluje zdroje technické variability (včetně batch efektu), posoudí jejich vliv na výsledky a aplikuje adekvátní korekční postupy.
Rozumí principům normalizace, transformace a standardizace dat a dokáže zdůvodnit volbu konkrétní metody s ohledem na povahu dat.
Formuluje statistické hypotézy vycházející z biologického zadání a vybírá vhodné inferenční metody včetně lineárních modelů (např. SAM, limma) a korekce vícenásobného testování.
Kriticky hodnotí předpoklady a limity metod používaných pro analýzu diferenciální exprese a vysokodimenzionální klasifikaci.
Aplikuje metody klasifikace a predikce tříd ve vysokodimenzionálních datech, rozumí jejich validačním strategiím (včetně MAQC II) a dokáže interpretovat jejich výkonnost.
Volí a interpretuje vícerozměrné regresní modely včetně modelů přežití (Kaplan-Meier, Coxův model proporcionálních rizik) v kontextu omických dat.
Rozumí statistickým principům analýzy genových sad, pathway analýzy a síťových přístupů a dokáže tyto metody kriticky aplikovat.
Aplikuje meta-analytické postupy (včetně Fisherovy Z-transformace) a chápe jejich předpoklady a omezení při integraci více studií.
Samostatně pracuje v prostředí R a Bioconductor a využívá relevantní nástroje s porozuměním jejich metodologickému základu.
- Klíčová témata
- Vysokohustotní genomická a proteomická data: charakter dat, zdroje variability a technologicky podmíněný šum
- Kvantifikace a předzpracování mikročipových dat (image analysis, sumarizace signálu)
- Normalizace a transformace dat mikročipových technologií
- Specifika epigenetických a SNP mikročipů (beta/M hodnoty, technické biasy)
- Kvantifikace, normalizace a specifika dat proteinové hmotnostní spektrometrie
- Modelování systematických efektů a korekce batch efektu
- Lineární modely a vícenásobné testování v genomice a proteomice (SAM, limma)
- Vysokodimenzionální klasifikace a predikční modely
- Neřízené metody a objevování struktur v datech
- Regresní modely a analýza přežití v omických datech
- Analýza genových sad a síťové přístupy
- Meta-analýza genomických a proteomických studií
- Studijní zdroje a literatura
- doporučená literatura
- Meta-analysis and combining information in genetics and genomics. Edited by Rudy Guerra - Darlene Renee Goldstein. Boca Raton: CRC Press, 2010, xxiii, 335. ISBN 9781584885221. info
- GENTLEMAN, Robert. R programming for bioinformatics. Boca Raton: CRC Press, 2009, xii, 314. ISBN 9781420063677. info
- Bioinformatics and computational biology solutions using R and bioconductor. Edited by Robert Gentleman. New York: Springer, 2005, xix, 473. ISBN 0387251464. info
- Data analysis and visualization in genomics and proteomics. Edited by Francisco Azuaje - Joaquín Dopazo. Hoboken, NJ: John Wiley, 2005, xv, 267. ISBN 0470094397. info
- DRĄGHICI, Sorin. Data analysis tools for DNA microaarays. Boca Raton: Chapman & Hall/CRC, 2003, 477 s. +. ISBN 1-58488-315-4. info
- Přístupy, postupy a metody používané ve výuce
- Výuka bude probíhat formou přednášek s teoretickou přípravou a praktickými cvičeními v programu R a jeho nástavbě Bioconductor. V úvodu přednášky se vysvětlí koncepty a metody, a následně si studenti vyzkouší jejich aplikaci na reálných datech. Začátkem semestru si student vybere jeden projekt, který bude splňovat nároky (detaily v první přednášce), na kterém pak bude v průběhu semestru pracovat. Ve druhé půlce semestru pak budou studenti své průběžné výsledky prezentovat na přednáškách.
- Způsob ověření výstupů z učení a požadavky na ukončení
- Závěrečný písemný test se bude skládat z přibližně 10 otázek hodnocených 20 body. Body získané za tento test budou tvořit 50% z celkového finálního hodnocení. Dalších 20 bodů (50% hodnocení) bude uděleno za aktivitu při přednáškách a cvičeních (5 bodů) a za kvalitu zpracování projektu (15 bodů). Pro úspěšné ukončení předmětu je nutné dosáhnout minimálně 21 bodů, z toho 10 bodů z projektu. Studenti můžou při testu používat všechny studijní materiály, protože otázky jsou koncipovány tak, aby vyzkoušeli především znalost obecných principů a schopnost využít nabyté znalosti při řešení praktických příkladů.
- Další komentáře
- Studijní materiály
Předmět je vyučován každoročně.
- Statistika zápisu (nejnovější)
- Permalink: https://is.muni.cz/predmet/sci/jaro2026/E7528