Bi7492 Analýza sekvencí DNA

Přírodovědecká fakulta
podzim 2010 - akreditace
Rozsah
2/1. 3 kr. (příf plus uk plus > 4). Ukončení: zk.
Vyučující
doc. Mgr. Natália Martínková, Ph.D. (přednášející)
Garance
prof. RNDr. Ladislav Dušek, Ph.D.
RECETOX – Přírodovědecká fakulta
Předpoklady
Studenti musí mít základní znalosti z molekulární biologie a genetiky a být dostatečně schopní porozumět angličtině na navigaci probíraných webových stránek. Doporučuje se absolvovat Neparametrické metody (K. Kubošová).
Omezení zápisu do předmětu
Předmět je otevřen studentům libovolného oboru.
Předmět si smí zapsat nejvýše 30 stud.
Momentální stav registrace a zápisu: zapsáno: 0/30, pouze zareg.: 0/30, pouze zareg. s předností (mateřské obory): 0/30
Cíle předmětu
Předmět patří mezi pokročilé kurzy analýzy dat. Poskytuje návod jak modelovat a vyhodnotit velké množství dat sekvencí DNA získaných jednak genomovým sekvencováním a jednak přístupných ve veřejných databázích. Studenti se naučí zpracovávat bioinformatická data od fáze počáteční analýzy obrazu, jeho přeložení do sekvence DNA, přes validaci dat až po anotaci sekvence. Následně se seznámí s metodami, jak dát konkrétní výsledek do souvislostí, určit vztahy mezi zkoumanými jednotkami formou fylogenetické rekonstrukce a interpretovat získaný model. Předmět je koncipován s důrazem na řešení komplexních a rozsáhlých problémů přehlednými a intuitivními postupy.
Osnova
  • 1. Genomika: (a) Typy genomů, organizace genomu, variabilita, (b) Sekvencování genomů – next-gen sequencing, pyrosequencing, sequencing by ligation, ChIP-seq.
  • 2. Genome assembly: (a) De-novo, resequencing, detekce mutací, (b) Contig, délka a počet contigů, (c) Parametry sestavování contigů, (d) Coverage – detekce variability.
  • 3. Vyhledávání sekvencí: (a) GenBank, EMBL, DDBJ, UniProt, (b) Entréz, SRS, (c) Knihovny, vzájemné reference, návaznost dat.
  • 4. BLAST: (a) Nukleotidový, proteínový blast, megablast, psi-blast, (b) Princip vyhledávání, (c) Vyhodnocení, E-value.
  • 5. Anotace genomické sekvence: (a) Predikce RNA, (b) GC content, (c) Predikce proteinů – Prokaryota.
  • 6. Anotace genomické sekvence: (a) Predikce proteinů – Eukaryota, (b) Detekce domén.
  • 7. Alignment: (a) Homologické pozice, (b) Lokální, globální alignment – možnosti sestavení, (c) Dynamické programování.
  • 8. Modelování příbuznosti: (a) Fylogenetický strom - interpretace.
  • 9. Substituční model: (a) Evoluce sekvence, typy mutací, (b) Parametry modelů, (c) Problémy a řešení.
  • 10. Fylogenetika: (a) Fylogenetická analýza – neighbour-joining, maximum parsimony, (b) Průkaznost vztahů, bootstrap.
  • 11. Maximum likelihood: (a) Likelihood funkce, (b) Randomised axelerated maximum likelihood.
  • 12. Bayesiánská analýza: (a) Posteriórní pravděpodobnost, (b) Vliv priors na výsledek, (c) Konvergence, Metropolis-coupled MCMC.
  • 13. Evoluce druhů a genů: (a) Bayesian estimation of species trees, (b) Supermatice, (c) Superstromy.
  • 14. Vizualizace.
Výukové metody
Přednášky, diskuse, analýza cvičných dat.
Metody hodnocení
Závěrečný písemný test, analýza dat.
Předmět je zařazen také v obdobích podzim 2010, podzim 2011, podzim 2011 - akreditace, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, jaro 2018, jaro 2019, podzim 2019, jaro 2020, podzim 2020, jaro 2021, podzim 2021.