Mnohonásobné sekvenční přiložení  Mnohonásobné sekvenční přiložení  Konsenzuální sekvence  Konstrukce přiložení  Manuální konstrukce přiložení  Automatická konstrukce přiložení  Využití mnohonásobného sekvenčního přiložení  PSI-BLAST  Databáze mnohonásobného sekvenčního přiložení Osnova Mnohonásobné přiložení 2/44 Mnohonásobné sekvenční přiložení je 2D tabulka, ve které řádky představují jednotlivé sekvence a sloupce představují pozice aminokyselinových zbytků. Mnohonásobné sekvenční přiložení Mnohonásobné přiložení 3/44 Mnohonásobné sekvenční přiložení je 2D tabulka, ve které řádky představují jednotlivé sekvence a sloupce představují pozice aminokyselinových zbytků.  Informativnější než párové přiložení  Vhodné pro analýzu genových rodin  Vhodné pro identifikaci důležitých zbytků  Barevně kódované podle vlastností Mnohonásobné sekvenční přiložení Mnohonásobné přiložení 4/44 Mnohonásobné sekvenční přiložení Mnohonásobné přiložení 5/44  Jediná sekvence reprezentující mnohonásobné přiložení Konsenzuální sekvence Mnohonásobné přiložení 6/44  Jediná sekvence reprezentující mnohonásobné přiložení  Ukazuje četnost výskytu aminokyselinových zbytků v každé pozici Konsenzuální sekvence Mnohonásobné přiložení 7/44 GVLIQVG  Hledání korespondence mezi aminokyselinovými zbytky Konstrukce přiložení GVLIRQSG GVPIRQSG Mnohonásobné přiložení 8/44 GVLI-QVG |||| | |  Hledání korespondence mezi aminokyselinovými zbytky Konstrukce přiložení GVLIRQSG || ||||| GVPIRQSG Mnohonásobné přiložení 9/44 GVLI-QVG |||| | |  Hledání korespondence mezi aminokyselinovými zbytky Konstrukce přiložení GVLIRQSG || ||||| GVPIRQSG Mnohonásobné přiložení 10/44 GVLI-QVG |||| | |  Hledání korespondence mezi aminokyselinovými zbytky Konstrukce přiložení GVLIRQSG GVLIRQSG || ||||| S → V R GVPIRQSG L → P Mnohonásobné přiložení 11/44  Manuální  Automatická  ClustalW  Nejznámější a nejpoužívanější  MUSCLE  Přesné a velmi rychlé  TCoffee  Velmi přesné a pomalé Konstrukce přiložení Mnohonásobné přiložení 12/44  BioEdit  Editor sekvenčních přiložení  Manuální i automatická konstrukce přiložení  Analýza sekvencí  Příprava sekvencí Manuální konstrukce přiložení Mnohonásobné přiložení 13/44 Automatická konstrukce přiložení vstupní sekvence Mnohonásobné přiložení 14/44 vstupní sekvence distanční matice Automatická konstrukce přiložení Mnohonásobné přiložení 15/44 Automatická konstrukce přiložení vstupní sekvence distanční matice evoluční strom Mnohonásobné přiložení 16/44 vstupní sekvence distanční matice evoluční strom Automatická konstrukce přiložení párové přiložení C a D párové přiložení A a B Mnohonásobné přiložení 17/44 vstupní sekvence distanční matice evoluční strom párové přiložení C a D párové přiložení A a B párové přiložení konsenzu C/D a A/B Automatická konstrukce přiložení Mnohonásobné přiložení 18/44 vstupní sekvence distanční matice evoluční strom párové přiložení E s konsenzem A/B/C/D Automatická konstrukce přiložení párové přiložení C a D párové přiložení A a B párové přiložení konsenzu C/D a A/B Mnohonásobné přiložení 19/44 vstupní sekvence distanční matice evoluční strom párové přiložení C a D párové přiložení A a B párové přiložení konsenzu C/D a A/B párové přiložení E s konsenzem A/B/C/D finální přiložení Automatická konstrukce přiložení Mnohonásobné přiložení 20/44  Konstrukce kvalitního párového přiložení sekvencí  Identifikace konzervovaných zbytků  Identifikace zajímavých sekvencí  Rekonstrukce fylogenetických stromů  Citlivé prohledání prohledání sekvenčních databází Využití mnohonásobného přiložení Mnohonásobné přiložení 21/44  Konstrukce kvalitního párového přiložení sekvencí Využití mnohonásobného přiložení Mnohonásobné přiložení 22/44  Konstrukce kvalitního párového přiložení sekvencí Využití mnohonásobného přiložení Mnohonásobné přiložení 23/44  Identifikace konzervovaných aminokyselinových zbytků Využití mnohonásobného přiložení Mnohonásobné přiložení 24/44  Identifikace konzervovaných aminokyselinových zbytků  Sloupce s identickými zbytky ve všech sekvencích  Konzervované zbytky jsou důležité pro strukturu nebo funkci Využití mnohonásobného přiložení Mnohonásobné přiložení 25/44  Identifikace zajímavých sekvencí Využití mnohonásobného přiložení Mnohonásobné přiložení 26/44  Identifikace zajímavých sekvencí Využití mnohonásobného přiložení Mnohonásobné přiložení 27/44 GVLI-QVG |||| | |  Rekonstrukce fylogenetických stromů GVLIRQSG GVLIRQSG || ||||| S → V R GVPIRQSG L → P Využití mnohonásobného přiložení Mnohonásobné přiložení 28/44 GVLI-QVG |||| | |  Rekonstrukce fylogenetických stromů  Předpověď - již neexistujících - sekvencí předků GVLIRQSG GVLIRQSG || ||||| S → V R předek GVPIRQSG L → P Využití mnohonásobného přiložení Mnohonásobné přiložení 29/44  Citlivé prohledání sekvenčních databází Využití mnohonásobného přiložení Mnohonásobné přiložení 30/44  Citlivé prohledání sekvenčních databází  PSI-BLAST – detekce slabých biologicky významných podobností Využití mnohonásobného přiložení Mnohonásobné přiložení 31/44  První iterace PSI-BLAST Mnohonásobné přiložení 32/44  První iterace Profile Multiple sequence alignment PSI-BLAST Mnohonásobné přiložení 33/44  Druhá iterace Profile PSI-BLAST Mnohonásobné přiložení 34/44  Druhá iterace Additional homologs PSI-BLAST Mnohonásobné přiložení 35/44  Druhá iterace New profile PSI-BLAST Mnohonásobné přiložení 36/44  Druhá iterace Iterated PSI-BLAST Mnohonásobné přiložení 37/44 MSLGAKPFGEKKFIEIKGRRMAYIDEG TGDPILFQHGNPTSSYLWRNI PSI-BLAST  Vstup Mnohonásobné přiložení 38/44 Skóre E-hodnota PSI-BLAST  Výsledek Mnohonásobné přiložení 39/44  Skóre  Normalizované skóre = součet substitucí a penalizací za mezery  Nedostatečně kvantifikuje významnost (vyšší je lepší)  E-hodnota  Rovna počtu BLAST přiložení s příslušným skóre, která mohou vzniknout náhodou  Kvantifikuje významnost přiložení (nižší je lepší)  Významné jsou hity s E-hodnotou <0.01 PSI-BLAST Mnohonásobné přiložení 40/44 Přiložení PSI-BLAST  Výsledek Mnohonásobné přiložení 41/44  Pfam Databáze mnohonásobného přiložení Mnohonásobné přiložení 42/44  Pfam Databáze mnohonásobného přiložení Mnohonásobné přiložení 43/44  Claverie, J-M., & Notredame, C. (2006) Bioinformatics for Dummies (2nd ed.) Wiley Publishing, Hoboken, p. 436.  Xiong, J. (2006) Essential Bioinformatics, Cambridge University Press, New York, p. 352.  MUSCLE: http://www.drive5.com/muscle/  TCoffee: http://tcoffee.vital-it.ch/cgi-bin/Tcoffee/tcoffee_cgi/index.cgi  ClustalW: http://www.ch.embnet.org/software/ClustalW.html  BioEdit: http://www.mbio.ncsu.edu/BioEdit/bioedit.html  PSI-BLAST: http://blast.ncbi.nlm.nih.gov/Blast.cgi  PhyML: http://www.phylogeny.fr/  PHYLIP: http://evolution.genetics.washington.edu/phylip.html  MPI Toolkit: http://toolkit.tuebingen.mpg.de/  Pfam: http://pfam.sanger.ac.uk/ Reference Mnohonásobné přiložení 44/44