Bi7528 Analýza genomických a proteomických dat

Přírodovědecká fakulta
podzim 2013
Rozsah
2/0/0. 2 kr. (příf plus uk plus > 4). Doporučované ukončení: zk. Jiná možná ukončení: k, kz, z.
Vyučující
Mgr. Eva Budinská, Ph.D. (přednášející)
Garance
prof. RNDr. Ladislav Dušek, Ph.D.
RECETOX - Přírodovědecká fakulta
Kontaktní osoba: Mgr. Eva Budinská, Ph.D.
Dodavatelské pracoviště: RECETOX - Přírodovědecká fakulta
Rozvrh
Po 12:00–13:50 A1/609 - IBA (A1,6.p, Kamenice 3)
Předpoklady
Bi5040 Biostatistika - základní kurz || Bi5045 Biostatistika pro mat. biol.
Bi5040 Biostatistika – základní kurz, nebo Bi5045 Biostatistika pro matematickou biologii Nutným předpokladem je dobrá znalost základní metodologie biostatistiky a základů molekulární biologie a genetiky . Doporučeno je absolvování předmětu Bi7527 Analýza dat v R, Bi8600 Vícerozměrné statistické metody, DSMBz01 Molekulární biologie a genetika, Bi3060 Obecná genetika a B7250 Genetika člověka
Omezení zápisu do předmětu
Předmět je otevřen studentům libovolného oboru.
Předmět si smí zapsat nejvýše 30 stud.
Momentální stav registrace a zápisu: zapsáno: 0/30, pouze zareg.: 0/30, pouze zareg. s předností (mateřské obory): 0/30
Jiné omezení: Doporučení absolvovat Bi8600, DSMBz01, Bi3060
Cíle předmětu
Student po absolvování kurzu:;
Zná otázky, na které lze odpovědět studiem genomických a proteomických dat.;
Zná vybrané technologie, které jsou zdroji vysokohustotních genomických a proteomických dat (typy DNA mikročipů, arrayCGH, 2D gelová elektroforéza, MASS spektrometrie);
Zná typy dat produkovaných genomickými a proteomickými technologiemi a jejich problémy z pohledu analytika;
Umi vyjmenovat obecné základní kroky analýzy genomických a proteomických dat.;
Zná pro analýzu potřebné technické detaily technologie mikročipů, hmotnostní spektrometrie a 2D gelové elektroforézy.;
Rozumí základním metodám kvantifikace měření těchto technologií a následným úpravám jejich hodnot při vytváření finálního datového souboru.;
Zná specifické, na technologii závislé zdroje nežádoucího technického šumu v datech.;
Pomocí grafických nástrojů a statistických metod dokáže identifikovat přítomnost a zdroj tohoto šumu v datech.;
Umí aplikovat statistické metody používané pro odstranění nežádoucího šumu.;
Dokáže provést transformaci zdrojových dat (normalizaci);
Standardizuje měření mezi jednotlivými datovými soubory.;
Vytvoří finální datový soubor pro další analýzy.;
Dokáže identifikovat a odstranit efekt dávky (batch effect) v datech.;
Popíše obecné principy analýzy genomických a proteomických dat.;
Na základě biologického zadání správně určí typ potřebné analýzy.;
Navrhne analytický postup pro příkladovou studii. ;
Na základě biologického zadání správně určí typ hypotézy a metody jejího testování.;
Rozumí specifickým metodám porovnávání hypotéz, jako je SAM a limma.;
Aplikuje testování hypotéz pro určení odlišně exprimovaných genů/proteinů.;
Zná statistické metody predikce tříd a umí je aplikovat na příkladová data.;
Zná metody dolování dat pro predikci tříd a umí je použít v genomických datech.;
Zná pozitiva a negativa metod pro predikci a umí se rozhodnout, kterou aplikovat.;
Aplikuje MAQC II standardy pro tvorbu klasifikátorů z microarray dat.;
Vybere a aplikuje vhodné vícerozměrné regresní metody pro propojení vztahu exprese genů/proteinů s dalšími (např. klinickými) faktory.;
Na genomických datech provede analýzu přežití pomocí Kaplan-Meierovych odhadů a Coxova modelu proporcionálních rizik.;
Zná princip a metody analýzy genových sad;
Zná princip a základní metody konstrukce genových sítí;
Aplikuje na modelovém příkladu nejběžnější metody analýzy genových sad a pathway analýzy.;
Vyhledá vysokohustotní genomické a proteomické data ve veřejných databázích.;
Použije Fisherovu Z-transformaci a další meta-analytické transformace.;
Aplikuje meta-analytické metody seřazení výsledků analýzy odlišné genové/proteinové exprese z více zdrojů.;
Pracuje v SW prostředí R a Bioconductor pro úpravy a analýzu genomických a proteomických dat.;
Aplikuje vybrané balíky R a Bioconductor a jejich funkce v úpravě a analýze dat.;
Osnova
  • 1.Současné výzvy a technologie genomiky a proteomiky;
  • 2.Princip a analýza obrazu DNA mikročipů;
  • 3.Úprava a normalizace dat cDNA mikročipů;
  • 4.Úprava a normalizace dat oligonukleotidových mikročipů;
  • 5.Získávání, úprava a normalizace dat hmotnostní spektrometrie ;
  • 6.Získávání, úprava a normalizace dat 2D gelové elektroforézy ;
  • 7.Základní principy analýzy genomických a proteomických dat ;
  • 8.Porovnávání tříd;
  • 9.Predikce tříd ;
  • 10.Objevování tříd ;
  • 11.Analýza přežití a další regrese;
  • 12.Analýza genových sad a genových sítí ;
  • 13.Analýza arrayCGH mikročipů ;
  • 14.Meta-analýza;
Literatura
    doporučená literatura
  • Meta-analysis and combining information in genetics and genomics. Edited by Rudy Guerra - Darlene Renee Goldstein. Boca Raton: CRC Press, 2010. xxiii, 335. ISBN 9781584885221. info
  • GENTLEMAN, Robert. R programming for bioinformatics. Boca Raton: CRC Press, 2009. xii, 314. ISBN 9781420063677. info
  • Bioinformatics and computational biology solutions using R and bioconductor. Edited by Robert Gentleman. New York: Springer, 2005. xix, 473. ISBN 0387251464. info
  • Data analysis and visualization in genomics and proteomics. Edited by Francisco Azuaje - Joaquín Dopazo. Hoboken, NJ: John Wiley, 2005. xv, 267. ISBN 0470094397. info
  • DRĄGHICI, Sorin. Data analysis tools for DNA microaarays. Boca Raton: Chapman & Hall/CRC, 2003. 477 s. +. ISBN 1-58488-315-4. info
Výukové metody
Výuka bude probíhat formou přednášek s teoretickou přípravou a praktickými cvičeními v programu R a jeho nástavbě Bioconductor. V úvodu přednášky se vysvětlí koncepty a metody, a následně si studenti vyzkouší jejich aplikaci na reálných datech.
Metody hodnocení
Závěrečná zkouška probíhá formou písemného testu, který obsahuje 10 otázek, celkově za 30 bodů. Studenti můžou při testu používat všechny studijní materiály, protože otázky jsou koncipovány tak, aby vyzkoušeli především znalost obecných principů a schopnost využít nabyté znalosti při řešení praktických příkladů. Pro úspěšné absolvování zkoušky je nutno při testu dosáhnout minimálně 16 bodů.
Další komentáře
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2010 - akreditace, podzim 2009, podzim 2010, podzim 2011, podzim 2011 - akreditace, podzim 2012, podzim 2014, jaro 2016, jaro 2017, jaro 2018, jaro 2019, jaro 2020.