Bi5444 Analysis of sequencing data

Přírodovědecká fakulta
podzim 2017
Rozsah
2/1/0. 2 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
Mgr. Eva Budinská, Ph.D. (přednášející)
doc. MUDr. Mgr. Marek Mráz, Ph.D. (přednášející)
Mgr. Jan Oppelt, Ph.D. (přednášející)
Hana Válková (pomocník)
Garance
prof. RNDr. Ladislav Dušek, Ph.D.
RECETOX - Přírodovědecká fakulta
Kontaktní osoba: Mgr. Eva Budinská, Ph.D.
Dodavatelské pracoviště: RECETOX - Přírodovědecká fakulta
Rozvrh
Po 18. 9. až Pá 15. 12. Út 9:00–10:50 A4-118, Út 11:00–11:50 A4-118
Předpoklady
Předpokládá se alespoň základní znalost práce v systému Linux, znalost molekulární biologie a základní znalosti programování. Znalost základů statistiky a práce v R je výhodou.
Omezení zápisu do předmětu
Předmět je otevřen studentům libovolného oboru.
Cíle předmětu
Student na konci tohoto kurzu bude:
- znát nejnovější metody NGS (sekvenování nové a třetí generace), jejich využití a typy dat, který produkují.
- schopen rozlišit typ metody na základě dat.
- znát základní schéma analýzy dat.
- umět pracovat v prostředí Linux, Bash a R na úrovni dostatečné pro analýzu NGS dat.
- znát vybrané nástroje pro zpracování dat a aplikovat je na reálných datech.
- schopen provést analýzu NGS dat od kontroly kvality přes namapování až po detekci odlišně exprimovaných genů (u RNA-Seq), variant (CNV s SNP), skládaní genomu, atp.
Výstupy z učení
Student na konci tohoto kurzu bude:
- znát nejnovější metody NGS (sekvenování nové a třetí generace), jejich využití a typy dat, který produkují.
- schopen rozlišit typ metody na základě dat.
- znát základní schéma analýzy dat.
- umět pracovat v prostředí Linux, Bash a R na úrovni dostatečné pro analýzu NGS dat.
- znát vybrané nástroje pro zpracování dat a aplikovat je na reálných datech.
- schopen provést analýzu NGS dat od kontroly kvality přes namapování až po detekci odlišně exprimovaných genů (u RNA-Seq), variant (CNV s SNP), skládaní genomu, atp.
Osnova
  • 1. Úvod k NGS technologiím: krátký úvod do biologie, sekvenování, historie, technologie NGS a jejich využití, extrakce vzorků, přípravy knihoven, základní slovník pojmů.
  • 2. Základní schéma analýzy dat: jak vypadají data, definice obecných kroků analýzy NGS dat, odlišnosti v závislosti od aplikace (např. variant calling vs RNA-Seq...), představení projektů.
  • 3. Rozdělení studentských projektů a úvod do SW pro analýzu dat: krátký úvod práce v Linuxu, Bash a R, formáty dat a rozdíly mezi nimi, on-line kurzy, diskuze nad projekty.
  • 4. Kontrola kvality, zpracování dat, upřesnění a zahájení práce na projektech: nástroje pro kontrolu kvality, Phred score, pre-processing dat, ukázka na příkladových datech.
  • 5. Mapování a post-processing: databáze referenčních genomů, anotace, rozdíly mezi nimi a použití, vysvětlení algoritmů pro mapování, rozdíly mezi spliced/non-spliced nástroji a jejich využití, kontrola kvality mapování, vizualizace mapování.
  • 6. Teorie ke specifikám analýzy projektů 1. (na základě výběru studentů)
  • 7. Teorie ke specifikám analýzy projektů 2. (na základě výběru studentů)
  • 8. Teorie ke specifikám analýzy projektů 3. (na základě výběru studentů)
  • 9. Teorie ke specifikám analýzy projektů 4. (na základě výběru studentů)
  • 10. Zpracování projektů, konzultace.
  • 11. Zpracování a dokončování projektů, konzultace.
  • 12. Prezentace výsledků projektů.
Výukové metody
Ve výuce bude použita teoretická příprava kombinovaná s praktickými cvičeními a ukázkami na vzorových datech.
Začátkem semestru bude představeno několik biologických problémů/projektů, různých typů NGS dat (RNA-Seq, WES, targeted genome sequencing, ChIP-Seq, paired-end, single-end, lidská DNA, rostlinná DNA, ...). Studenti se rozdělí do skupin a každá skupina si vybere jeden projekt, na kterém pak budou v průběhu semestru pracovat a používat je jako vzorová data pro aplikaci představených metod. Ve druhé půlce semestru pak budou studenti své průběžné výsledky prezentovat na přednáškách. Přednášky pak budou dle typu projektu věnovány specifickým problémům a metodám analýzy dat daného typu.
Nakonec studenti zakončí semestr prezentací svých výsledků v angličtině.
Metody hodnocení
Pro úspěšné ukončení předmětu je nutné dosáhnout minimálně 20 bodů.
Max. 20 bodů (50% hodnocení) bude uděleno za zpracování projektu (max. 5 bodů za prezentace projektu během semestru a max. 15 bodů za zpracování projektu).
Studenti s ukončením předmětu zkouškou musí absolvovat závěrečný písemný test, který se bude skládat z 10 otázek hodnocených celkově 20 body. Body získané za tento test budou tvořit 50% z celkového finálního hodnocení.
Přihlášení ke zkoušce je podmíněno odevzdáním projektu, v jehož hodnocení musí student dosáhnout minimálně 10 bodů (hodnocení projektů trvá 5 dní).
Vyučovací jazyk
Angličtina
Informace učitele
Kapacita předmětu je omezena na 22 studentů. Předmět je vyučován v angličině.
Capacity of the course is limited to 22 students. The course is taught in English.
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2015, podzim 2016, podzim 2018, podzim 2019.