Bi6590 Zpracování biosystematických dat

Přírodovědecká fakulta
jaro 2021
Rozsah
2/1/0. 3 kr. (příf plus uk plus > 4). Ukončení: zk.
Vyučující
Mgr. Petr Šmarda, Ph.D. (přednášející)
Garance
Mgr. Petr Šmarda, Ph.D.
Ústav botaniky a zoologie – Biologická sekce – Přírodovědecká fakulta
Kontaktní osoba: Mgr. Petr Šmarda, Ph.D.
Dodavatelské pracoviště: Ústav botaniky a zoologie – Biologická sekce – Přírodovědecká fakulta
Rozvrh
Po 1. 3. až Pá 14. 5. Út 13:00–15:50 online_B4
Předpoklady
( Bi2030 Fylog. a diver. vyš. rostlin && Bi2030c Fylog. a div. vyš. rostl. -cv. )
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 15 stud.
Momentální stav registrace a zápisu: zapsáno: 0/15, pouze zareg.: 0/15, pouze zareg. s předností (mateřské obory): 0/15
Mateřské obory/plány
Cíle předmětu
V tomto předmětu se seznámíte s hlavními statistickými metodami (hlavně těmi vícerozměrnými) se kterými se můžete setkat při řešení vašich biosystematických, taxonomických a fylogenetických studií. Hlavním cílem je bez zbytečné matematiky vás naučit o jednotlivých metodách přemýšlet a aktivně je používat při plánovaní a hodnocení svých pokusů, analýz a sběrů. Každou metodu si budete mít možnost na vlastní kůži vyzkoušet samostatně v cvičeních následujících za teoretickými hodinami hodinami. Měli by jste se naučit jak si správně a efektivně klást otázky a tvořit hypotézy; kolik, proč, odkud a jaké vzorky sbírat, kolik a proč čeho měřit. Naučíte se dívat se na vícerozměrná data pomocí ordinačních diagramů (PCA, PCoA, CVA, NMDS), testovat vzájemně různé druhy vícerozměrných dat (Mantel test, Procrustes analysis), vytvářet a testovat klasifikace vašich vzorků a hledat nejvhodnější určovací/diskriminující znaky skupin vhodné např. do určovacích klíčů (discriminant analysis). Dozvíte se jak vytvářet dendrogramy a evoluční/fylogenetické stromy z morfologických a molekulárních/sekvenčních dat (UPGMA, NJ trees, LS trees, minimum evolution trees, maximum parsimony), co se dá z jednotlivých stromů zjistit, jak to interpretovat. Naučíte se jak testovat fylogenetickou závislost znaků, jak správně počítat korelace a regrese s fylogeneticky závislými daty a jak modelovat evoluci znaků na stromech.
Výstupy z učení
Po absolvování předmětu bude student umět:
– Plánovat efektivní design sběru dat
– Samostatně analyzovat vlastní data pomocí vhodných statistických metod (klasických lineárních, vícerozměrných, fylogenetických)
– Vytvářet fylogenetické (evoluční) strom na základě DNA sekvenčních nebo morfologických dat
– Správně interpretovat výsledky jednotlivých analýz a diskutovat jejich případné slabiny
Osnova
  • 1. Základní členění metod a typů dat; základní popisná statistika
  • 2. Jednoduché statistické testy I, pravděpodobnost, významnost
  • 3. Jednoduché statistické testy II, korelace, regrese, plánování experimentů, problém pseudoreplikace, tvoření hypotéz
  • 4. Koeficienty podobnosti, matice podobnosti, testování maticových dat
  • 5. Ordinační metody I – základní rozdělení, tvorba ordinačního diagramu
  • 6. Ordinační metody II – interpretace diagramů, testování shluků, porovnávání ordinací
  • 7. Shluková analýza I – rozdělení metod, shlukovací algoritmy, konstrukce stromů
  • 8. Shluková analýza II – testování kvality stromů, porovnávání stromů a jejich interpretace
  • 9. Diskriminační analýza, výběr nejvhodnějších určovacích znaků
  • 10. Evoluční stromy I – fylogenetický přístup, fylogenetické termíny a popis fylogenetického stromu, alignment
  • 11. Evoluční stromy II – popis základních metod konstrukce stromů (maximum likelihood, parsimony), testování kvality stromů, interpretace stromů
  • 12. Evoluční stromy III – testování evoluce znaků, molekulární hodiny
  • 13. Statistika a fylogeneze na internetu, grafická prezentace výsledků
  • 14. Fylogenetické komparativní metody – testování fylogenetické závislosti dat, fylogenetický signál, fylogeneticky korigované korelace a regrese (PIC, pgls), počítání ancestrálních stavů znaků na stromě
Literatura
    doporučená literatura
  • MARHOLD, Karol a Jan SUDA. Statistické zpracování mnohorozměrných dat v taxonomii : (fenetické metody). 1. vyd. Praha: Karolinum, 2002, 159 s. ISBN 8024604388. info
  • PODANI, János. Introduction to the exploration of multivariate biological data. Leiden: Backhyus Publishers, 2000, vi, 407. ISBN 9057820676. info
  • Sneath PHA, Sokal RR (1973): Numerical taxonomy. W.H. Freeman, San Francisco
  • LEGENDRE, Pierre a Louis LEGENDRE. Numerical ecology. 3rd engl. ed. Amsterdam: Elsevier, 2012, xvi, 990. ISBN 9780444538680. info
  • Garland T. et al. (1992): Procedures for the analysis of comparative data using phylogenetically independant contrasts. Systematic Biology 41: 18-32.
  • Modern phylogenetic comparative methods and their application in evolutionary biology : concepts and practice. Edited by László Zsolt Garamszegi. Berlin: Springer, 2014, xv, 552. ISBN 9783662435496. info
  • Webb CO., Ackerly DD., Kembel SW. (2008): Phylocom: software for the analysis of phylogenetic community structure and trait evolution. Bioinformatics 24: 2098-2100.
Výukové metody
přednáška, samostatné praktické zpracování vzorových a vlastních dat
Metody hodnocení
K zápočtu vypracují studenti vlastní analýzu přidělených nebo vlastních dat.
Další komentáře
Studijní materiály
Předmět je vyučován jednou za dva roky.
Poznámka k periodicitě výuky: jaro lichých let (případně dle zájmu studentů).
Předmět je zařazen také v obdobích jaro 2008 - akreditace, jaro 2011 - akreditace, jaro 2007, jaro 2008, jaro 2009, jaro 2010, jaro 2011, jaro 2012, jaro 2012 - akreditace, jaro 2013, jaro 2014, jaro 2015, jaro 2016, jaro 2017, jaro 2019, jaro 2023, jaro 2025.