4/22/2009 Fylogenetická evoluční analýza Pro zajímavost, nebude součástí zkoušky... Důležité, pravděpodobně bude u zkoušky... Fylogeneze = vývoj druhu (vývoj nových druhů) procesem evoluce. Fylogenetika = věda zkoumající fylogenezi, příbuzenské vztahy a vývoj organismů. Evoluce bioinformatika Fylogeneze nezahrnuje pouze podobnosti a rozdíly \ i \ i \j \j mezi organismy 1 T l 1 _ yy Y ...ale také jejich i tav evoluční vztahy. Fylogenetická data • Fylogenetická data jsou získávána zkoumáním charakteristických znaků studovaných organismů. Prvotně používány MORFOLOGICKÉ znaky. Problém - fosilní pozůstatky většinou NEKVALITNÍ, neposkytují žádané informace nebo se VŮBEC nedochovají. Molekulární fylogenetická data • Jediný experiment může poskytnout informace o mnoha znacích. Každá nukleotidová AAGACGGCACCGACAACGACTACAACGACGCCGTCGTGGTGATCAACTGGCCGCTCGGCT pOZÍCe V Sekvenci RlŮŽe GG TGGT GGG G TGG GT G GG GTGG TGGTG TGGTG GTGGGGGGTGGGGT být pOVaŽOVána Za GGGACGGCAACGGC-TGGAC—CAAGGGCGCCTACACCGCCACGAACTGA---------- jeden ZNAK, který Se ACGACGTGCCCGGAACCTATGGCAATAACTCCGGC-TCGTTCAGTGTCAATATTGGAAAG vyskytuje Ve ČTYŘECH rozdílných STAVECH. • Jednotlivé stavy jsou jednoznačné a nezaměnitelné (A x C x G x T). Na rozdíl od morfologických znaků (tvar), u nichž existuje mnoho přechodových forem. • Molekulární data se dají snadno převést do „Číselné" formy. Vhodné pro matematické a statistické analýzy. Proteinové sekvence x DNA sekvence • Pro fylogenetickou analýzu využívány PŘEVÁŽNĚ DNA sekvence. DNA poskytuje mnohem více fylogenetických informací než protein. -Giy-Aia-m ■ l«u■ Asp-Arj- Tiché mutace ggagccatattagataga- Variabilita uspořádání genomu ■GGAGCÄATŤTTTGATAGA- (kódujjcj x „ekÓdUJÍ Oblastí) -c3r.Ai.-ib Ph« ajp-atí- pcR automatické sekvencování 1 4/22/2009 Fylogenetický strom Cíl fylogenetické analýzy - fylogenetický strom popisující evoluční vztahy mezi studovanými organismy. Současné taxony (geny) = terminální (externí) uzly, vrcholy Interní uzly = rozdělení společného „předka" Délky větví = úměrné velikosti změny v průběhu evoluce Periferní větve Větve Vnitřní větve Interní uzly Terminální \ (externí) uzly Fylogenetický strom (strom) Fylogenetický strom *^lnterB4l ředit Fylogenetický strom BEZ KORENE (unrooted). Není známý nejstarší společný předek (bod). Vypovídá pouze o příbuzenských vztazích mezi geny, ne o „cestě" kterou se evoluce ubírala. Fylogenetický strom S KOŘENEM (rooted). Nutný alespoň jeden gen, který je méně příbuzný s A,B,C,D, než jsou tyto geny mezi sebou navzájem = „outgroup" W v, V v. r Fylogenetický strom „Genový" strom x „druhový strom" • Genový strom - odvozen ze srovnání ortologních genů. Předpokládá se, že bude přesnější než strom získaný pomocí morfologických dat. • Genový strom ^ druhový strom. Genový strom - vnitřní uzly představují rozdělení původního GENU (mutace). Druhový strom - vnitřní uzly představují rozdělení populace původního DRUHU do dvou skupin (geografická izolace). „Genový" strom x „druhový strom" • Mutace a vznik nového druhu se s největší pravděpodobností neodehrají současně. UME • Mutace předchází *y■*-tf**n.i»ji separaci — v populaci se VV\ nacházejí obě alely genu. xx\ Po rozdělení populací může , dojít ke ztrátě jedné alely. // 2 4/22/2009 Tvorba evolučních stromů „ANgnment" sekvencí - nezbytný pro vytvoření Stromu. Vyhodnocení rozdílů mezi jednotlivými nukletidovými sekvencemi, většinou „multiple alignment". Kru ffcsin Bell Bele lfcľll Ubil IlClI äS-l£ľIJJIÍii£äiJi" -CfiSiKi..... . .* . ... .1 : .. ____ I..J..J..1.. .....-ii.'.* S34 äC3äi£áiTii-riHi tí:í:- it i i: n;Ti tt:i:-: act Jak převést „multiple alignment" na strom? Neexistuje „nejlepší metoda". Několik metod je používáno souběžně, žádnou nelze označit za lepší než ostatní. Distanční matrice. Slouží k určení délky větví. S^ftiQftTfilOc i4/2° I 1 ASS CC AACACAf ÄOCT S ? CC 0.20 í 0.05 0.I& 4 Jak převést „multiple alignment" na strom? • Neighbor-joining method-„spojování sousedních objektů" (Saitou a Nei 1987). Využívá distanční matrici. ÍSITlrírtaľtinEP^rB-^ncyTbTHCTrinf írHAůd 1») RtmPUl Ofr*0 íe^UflftMí from *í *HF Jak převést „multiple alignment" na strom? • Neighbor-joining method - „spojování sousedních objektů" (Saitou a Nei 1987). Využívá distanční matrici. + Jednoduché = rychlé + Vhodné pro velké soubory dat + Vhodné pro prvotní analýzu Informace z alignmentu velmi zredukována Poskytuje pouze jeden výsledný strom Jak převést „multiple alignment" na strom? Metody maximální úspornosti - maximum parsimony method. Předpokládá (správně???), že evoluce jde nejkratší možnou cestou, tj. správný fylogenetický strom je ten, který požaduje minimum nukleotidových změn, aby bylo dosaženo daného rozdílů mezi sekvencemi. Preciznější Větší nároky na manipulaci s daty Čím vice sekvencí, tím více topologií stromů je nutné vyzkoušet 5 sekvencí =15 stromů, 10 sekvencí = 2 027 025 stromů Jak převést „multiple alignment" na strom? Parsimonie: Fitcnova parsimonie Wagnerova parsimonie (reverzibilita změn) Dollova parsimonie („novinka" může zaniknout) Caminova-Sokalova parsimonie (změny ireverzibilní) Vážená parsimonie Generalizovaná parsimonie Metoda maximální pravděpodobnosti Metoda minimální evoluce 3 4/22/2009 Výsledky fylogenetické analýzy Topologie Stromu — evoluční vztahy mezi srovnávanými (DNA) sekvencemi. Kdy došlo k divergenci sekvencí? Kdy vznikly „dnešní" sekvence, tj. moderní organismy? Nutné využít MOLEKULÁRNÍ HODINY. Předpoklad: k nukleotidovým substitucím dochází s KONSTANTNÍ četností. Molekulární hodiny Rozdíl mezi sekvencemi odpovídá době, která uplynula od jejich rozdělení (divergence). Ke kolika substitucím dojde za milion let? Nutná kalibrace!!! Niimbra ^ substitutions x Number per lineare 2 2X13 Molekulární hodiny Rozdílné u různých organismů. Rozdílné i v rámci jednoho organismu! Software pro fylogenetickou analýzu PI1YL1P ■i"" IP iťv : .■" i ■. .'irnw i --- i- n |'-v. v i nfopmii frí ir'iii.r ytt.'r-:.......■. ^r.í.v. g-př-i !: i- :■ ■-■!:■ . ■ D«fl i* "rmt oo-H aria'.' dffŕTŕuE kix*j oí ĽompiŕT r-nou u-jmAle Thf wtrit.crô » dssfaitd ■« C"i jod ŕTí^paH-ŕ? zc< í-h: kula i-»J .ii4*-J-n? icdlof«inK mů-m -rfDľvA. m p™— "T*~"* ~**r ——— ll b- dhéh ANS [ C ve j c< rati ae Antwd&a OTXInnMh: OUÍ, ind ««wafc a* fí nisd:J it MS Ua-kxn PAMI. tnů-iím m ú Já^i Ír mi-. S^cil iú «dEEtdu- fMtů^tai tůd rtu kpwfcíŕi lo lakh d* cMUuHy praeeii. «ksytaicw r i rfjti~i i il n*ri idtM ;1EP. MOLPHV. PbrML. M[ t MacClade http://abacus.gene.ucl.ac.uk/software/paml.html http://macclade.org/index.html 4 Shrnutí Fylogenetika = věda zkoumající fylogenezi, příbuzenské vztahy a vývoj organismů. Morfologická data/molekulární data (sekvence). Fylogenetické stromy: topologie (příbuznost + evoluce) a molekulové hodiny. Tvorba stromů: alignment + parsimonie, Neighb joining method,... Clustal+NJPIot, PAUP, PHYLIP, PAML