Bi7492 Analýza sekvencí DNA

Přírodovědecká fakulta
podzim 2010
Rozsah
2/1. 3 kr. (příf plus uk plus > 4). Ukončení: zk.
Vyučující
doc. Mgr. Natália Martínková, Ph.D. (přednášející)
Garance
prof. RNDr. Ladislav Dušek, Ph.D.
RECETOX – Přírodovědecká fakulta
Rozvrh
Pá 14:00–15:50 F01B1/709
Předpoklady
Studenti musí mít základní znalosti z molekulární biologie a genetiky a být dostatečně schopní porozumět angličtině na navigaci probíraných webových stránek. Doporučuje se absolvovat Neparametrické metody (K. Kubošová) a Stochastické modely (M. Budíková).
Omezení zápisu do předmětu
Předmět je otevřen studentům libovolného oboru.
Předmět si smí zapsat nejvýše 30 stud.
Momentální stav registrace a zápisu: zapsáno: 0/30, pouze zareg.: 0/30, pouze zareg. s předností (mateřské obory): 0/30
Cíle předmětu
Po absolvování tohoto předmětu bude student schopen:
- navrhnout hypotézu a testovat ji;
- sestavit kompletní sekvenci DNA z grafických výstupů sekvencování;
- využít informace dostupné v genetických databázích;
- identifikovat neznámou sekvenci vyhledáváním v genetické databázy a porovnáním záznamů algoritmy BLASTu;
- shodnotit identifikaci sekvence;
- vypočítat genetické vzdálenosti za použití adekvátního substitučního modelu;
- rekonstruovat fylogenetické stromy s využitím distančních metod, maximální parsimonie, maximální věrohodnosti a bayesiánské inference;
- interpretovat fylogenetické vztahy mezi sekvencemi a kriticky posoudit konfliktní výsledky.
Osnova
  • 1. Genomika: (a) Typy genomů, organizace genomu, variabilita, (b) Sekvencování genomů – next-gen sequencing, pyrosequencing, sequencing by ligation, ChIP-seq.
  • 2. Genome assembly: (a) De-novo, resequencing, detekce mutací, (b) Contig, délka a počet contigů, (c) Parametry sestavování contigů, (d) Coverage – detekce variability.
  • 3. Vyhledávání sekvencí: (a) GenBank, EMBL, DDBJ, UniProt, (b) Entréz, SRS, (c) Knihovny, vzájemné reference, návaznost dat.
  • 4. BLAST: (a) Nukleotidový, proteínový blast, megablast, psi-blast, (b) Princip vyhledávání, (c) Vyhodnocení, E-value.
  • 5. Anotace genomické sekvence: (a) Predikce RNA, (b) genomické ostrovy, (c) Predikce proteinů – Prokaryota.
  • 6. Anotace genomické sekvence: (a) Predikce proteinů – Eukaryota, (b) CpG ostrovy, (c) Zápis anotace.
  • 7. Alignment: (a) Homologické pozice, (b) Lokální, globální alignment – možnosti sestavení, (c) Dynamické programování.
  • 8. Modelování příbuznosti: (a) Fylogenetický strom - terminologie, interpretace, (b) Porovnání stromů.
  • 9. Substituční model: (a) Genetické vzdálenosti, (b) Parametry modelů, (c) Problémy a řešení.
  • 10. Fylogenetika: (a) Fylogenetická analýza – neighbour-joining, maximum parsimony, (b) Průkaznost vztahů, bootstrap.
  • 11. Maximum likelihood: (a) Likelihood funkce, (b) Randomised axelerated maximum likelihood.
  • 12. Bayesiánská analýza: (a) Posteriórní pravděpodobnost, (b) Vliv priors na výsledek, (c) Konvergence, Metropolis-coupled MCMC.
  • 13. Evoluce druhů a genů: (a) Supermatice, (b) Superstromy, (c) Bayesian estimation of species trees.
  • 14. Vizualizace.
Literatura
  • FELSENSTEIN, Joseph. Inferring phylogenies. Sunderland, Mass.: Sinauer Associates, 2004, xx, 664. ISBN 0878931775. info
  • CVRČKOVÁ, Fatima. Úvod do praktické bioinformatiky. Vyd. 1. Praha: Academia, 2006, 148 s. ISBN 8020013601. info
  • ZIMA, Jan. Genetické metody v zoologii. 1. vyd. Praha: Karolinum, 2004, 239 s. ISBN 8024607956. info
Výukové metody
Přednášky, diskuse, analýza cvičných dat.
Metody hodnocení
Pětiminutové písemné testy v průběhu semestru, závěrečný projekt podle návrhu studenta, ústní interpretace projektu na zkoušce, závěrečný písemný test.
Další komentáře
Studijní materiály
Předmět je zařazen také v obdobích podzim 2010 - akreditace, podzim 2011, podzim 2011 - akreditace, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, jaro 2018, jaro 2019, podzim 2019, jaro 2020, podzim 2020, jaro 2021, podzim 2021.