IV107 Bioinformatika I -Přednáška 7 Interakce DNA-protein Interakce protein-protein Fylogenetické analýzy Příště Práce s expresními daty IV107 Bioinformatika I Přednáška 7 Katedra informačních technologií Masarykova Univerzita Brno Jaro 2016 Předchozí týden Interakce DNA-protein Interakce protein-protein Fylogenetické analýzy Příště Práce s expresními daty IV107 Bioinformatika I -Přednáška 7 Analýza proteinových sekvencí ► identifikace domén ► predikce sekundární struktury ► modelování a predikce 3-D struktury □ S Křížová DNA IV107 Bioinformatika I -Přednáška 7 Interakce DNA-protein Interakce protein-protein Fylogenetické analýzy Příště Práce s expresními daty < E-' U <2 H < /N^Nttcgcaagacc^ttcatttcatttggagaggv^N/^i ^\/\aagcgttctgg^ aagtaaagtaaacctctcct/\^\ Triplexová DNA IV107 Bioinformatika I -Přednáška 7 Interakce DNA-protein Interakce protein-protein Fylogenetické analýzy Příště Práce s expresními daty C-G-C h*sí triplŕl T-A-A base lidplíl Tetraplexová DNA h i dR M_ WH H h—n N—H N n n n H y y / -1 t- / 5 -V 5* interaiofeťuUr C14 DNA intramolecular n;, m; i..íi ba:4;crr-typť í i4 DNA foisltťt-typí G4 DNA IV107 Bioinformatika I Přednáška 7 Interakce DNA-protein Interakce protein-protein Fylogenetické analýzy Příště Práce s expresními daty Duplicitní sekvenční vzory a jejich vztah k struktuře DNA IV107 Bioinformatika I Přednáška 7 Interakce DNA-protein Interakce protein-protein Fylogenetické analýzy Příště Práce s expresními daty Repeat (angl.): inverted (palindrom) křížová DNA, vazební místo dimerů tandem posun v DNA (slipped DNA), periodické substruktury, telomery dispersed mobilní DNA, libovolní funkční motivy Tandemové opakování sekvence v genomu C.elegans -AAATGA-AA-ATTTCCGGCAAATCGGCAATTTGCCTA m f LU = IV107 Bioinformatika I Přednáška 7 Interakce DNA-protein Interakce protein-protein Fylogenetické analýzy Příště Práce s expresními daty ence landscape Interakce DNA-protein Interakce protein-protein Fylogenetické analýzy Příště Práce s expresními daty IV107 Bioinformatika I -Přednáška 7 2 2 2 3\ 3\ 232 2 35553255555535 gtccgatcctctgt □ o > o "O CD ■-ojto D3n o cd co cd cd co q. dj C/>< i—H o cq cd cd 5' 7T cd* dj dj_ n 3 ďj o cd "o o ®. "6 o ®. 3' > o ®. 3' o q. 9. V- n -j a TT Bi Xlandscape - rozdíl 1 1 J ti DC DC DC AS DC DC DC 9 1 1 gcacccggts positionl7SE ZEcm level; 2 tgtccccaslcaccgcgctgg 1780A 1790" length; 1 frequency: 0 filter; none -G4 ^™ ^™ -10 1 4 IS 64 —-1 J IV107 Bioinformatika I Prednáška 7 Interakce DNA-protein Interakce protein-protein Fylogenetické analýzy Příště Práce s expresními daty Odčítáme hodnoty zjištěny ve dvou databázích. Pokud je rozdíl dostatečně velký, zvýrazní se daná hodnota_barevně. Xlandscape - neočekávaná frekvence 11111 i i i n ill ii IV107 Bioinformatika I Přednáška 7 Interakce DNA-protein Interakce protein-protein Fylogenetické analýzy Příště Práce s expresními daty ccggccgtggggcaatqcaacs^tcccagcaca^ ; ■ (íQg^ggaggggcagagaewcQ^aíccccagccK 1200- 1210" 1220A IľTc 1240- 1250A 12S0^ 1270" 12T positions zoon level; 1 length; 11 filter: filter frequencies -í Např. očekáváme, že fo(ACGTA) = f(ACGT) x f (A) TRANSFAC/TESS/JASPAR IV107 Bioinformatika I -Prednáška 7 Interakce DNA-protein Interakce protein-protein Fylogenetické analýzy Příště Práce s expresními daty http://jaspar.genereg.net/ ► Jaké sekvence rozpoznáva transkripční faktor Egr-1 ? ► Jaký faktor se váže na sekvenci GATATACGG DIP IV107 Bioinformatika I -Prednáška 7 Interakce DNA-protein Interakce protein-protein Fylogenetické analýzy Příště Práce s expresními daty Protein A PIR Ocnhank Organism Description Funel i on Enzyme Code Supe i" family Cellular Localization Experiment #1 Protein B Swisŕiprot PIR Genbank Organism Description Function Fnzyme Code Superfamily Cellular Localization Interaction Protein A Protein B Domain involved and Range of amino acid Dissociation constant pm1d/uid ľ ode Technique Author Title Journal Year Experiment #n PMTD/UID code Technique Author Title Journal Year http://dip.doe-mbi.ucla.edu/ □ rS - = _g = DIP IV107 Bioinformatika I -Prednáška 7 Interakce DNA-protein Interakce protein-protein Fylogenetické analýzy Příště Práce s expresními daty Cell Cycle Control Transcription http://dip.doe-mbi.ucla.edu/ Základem fylogenetické analýzy je znalost párových vzdáleností IV107 Bioinformatika I Přednáška 7 Interakce DNA-protein Interakce protein-protein Fylogenetické analýzy Příště Práce s expresními daty A B C D A 0 B 3 0 C 2 4 0 D 3 1 2 0 Vzdálenostní matice Metody konstrukce stromů Interakce DNA-protein Interakce protein-protein Fylogenetické analýzy Příště Práce s expresními daty IV107 Bioinformatika I -Přednáška 7 ► UPGMA ► Neighbor-joining ► Maximum parsimony ► Maximum likelihood http://upload.wikimedia.Org/wikipedia/en/3/36/ITOL_Tree_of_life.jpg □ S Newick format IV107 Bioinformatika I Prednáška 7 Interakce DNA-protein Interakce protein-protein Fylogenetické analýzy Příště Práce s expresními daty 0.1 F 0.2 0.3 0.5 E 0.4 0.2, (C : 0.3, D : 0.4) : 0.5); *D (A: 0.1,6 □ rS - = _š = UPGMA IV107 Bioinformatika I -Prednáška 7 Interakce DNA-protein Interakce protein-protein Fylogenetické analýzy Příště Práce s expresními daty A B C D ^^^^H A 0 B 3 0 C 2 4 0 D 3 1 2 0 A DB C A 0 DB 3 0 C 2 3 0 Fylogenetický strom příbuznosti DNA primátů IV107 Bioinformatika I Přednáška 7 Interakce DNA-protein Interakce protein-protein Fylogenetické analýzy Příště Práce s expresními daty UPGMA Distance Tree of Primates using Jukes-Cantor model % \ \ X X X X V V \. ^ V\XV\>X\V\\\ Genographic Project - https://genographic.nationalgeographic.com/ Map of the Crusader Y Chromosomes in Lebanon French fü«jona 1 origiraof European Crusaders Origin of Crusader a rmi« 1 1 Combined Crusaders The LevanL —+■ European Crusaders — Combined Crusaders blarnic Expansion —ř 636 0 20Í 1 i CHIoman CuleCE(AD) 400 «00 KOMilfi 0 200 400 «0 BOO K ikxr__-i C 30OS National Ceograph c Society IV107 Bioinformatika I Prednáška 7 Interakce DNA-protein Interakce protein-protein Fylogenetické analýzy Příště Práce s expresními daty Zkoumáním DNA na chromozomu Y byla zjištěna příbuznost křesíanů v Libanonu s Evropany. x IV107 Bioinformatika I -Přednáška 7 Interakce DNA-protein Interakce protein-protein Fylogenetické analýzy Příště Práce s expresními daty Příště IV107 Bioinformatika I -Přednáška 7 Interakce DNA-protein Interakce protein-protein Fylogenetické analýzy Příště Práce s expresními daty Práce s expresními daty Outline IV107 Bioinformatika I Přednáška 7 Příloha For Further Reading Příloha For Further Reading IV107 Bioinformatika I Přednáška 7 Příloha For Further Reading X