Eduard Kejnovský + Roman Hobza EVOLUČNÍ GENOMIKA III. EVOLUCE GENOMŮ OBSAH 1.Velikost genomu 2. Extrémní genomy 3. Změny ve velikosti genomu 4. Nekódující DNA a velikost genomu 5 .Topografie genomu 6. Genomové projekty VELIKOST GENOMU Bakterie: ~ 0.5 – 9 mil bp ~ tisíce genů Virus (bakteriofág) ~ 50 kb ~ stovky genů Genomy bakterií a virů - genomy malé, kompaktní - efektivní využití 7/12 Genom = celková genetická informace buňky nebo viru V průběhu evoluce se genomy zvětšují 10 000x menší než zrnko soli Obří viry – megaviry, mimiviry Velikost genomu srovnatelná s bakteriemi - Pandoravirus salinus (genom 2.5Mbp) Velikost kapsidy srovnatelná s bakteriemi - Pithovirus sibericum (velký 1.5µm) - izolovány 1992 z améby (Acanthamoeba) - kódují ribozómy a kapsidy - metabolické geny (~2500 genů pro proteiny) - 10% repetitivní DNA jen částečná závislost na hostiteli (proteosyntéza) Virofágy: parazitují na megavirech, Sputnik 18kb/21 genů Co bylo dříve – buňka nebo mimivirus? Vyšší organizmy: kde se nachází DNA? člověk ~ 3 000 000 000 bp Genom = celková genetická informace buňky nebo viru 2nm x 1m 1cm -> 5000km 11/27 savci ptáci plazi obojživelníci ryby kostnaté ryby chrupavčité ostnokožci korýši hmyz měkkýši červi plísně rostliny řasy houby grampozitivní bakterie gramnegativní bakterie mykoplazmata 106 107 108 109 1010 1011 Velikosti genomů Velikosti genomů a paradox hodnoty C GENOM = celková genetická informace organizmu (geny i negenové oblasti/repetice) Paradox hodnoty C = velikost genomu organizmu není v korelaci s komplexitou organizmu např. jednobuněčná měňavka (Amoeba dubia) má 200x větší genom než člověk Podisma pedestris 18,000 Mb Drosophila melanogaster 180 Mb 100x Klíčem k řešení paradoxu hodnoty C jsou opakující se úseky DNA (repetice) Genomy jsou repetitivní a dynamické drosophila_200 Frittilaria asyriaca 130Gb Amoeba dubia 670Gb Velikosti genomů a paradox hodnoty C Proč se genomy nezbaví repetitivní DNA? Jaké síly udržují repetitivní DNA? Jaká je role repetitivní DNA? člověk 3Gb Klíč k řešení paradoxu hodnoty C se nachází v negenových oblastech velikost genomu podíl genů podíl TE velikost genomu Hlavní komponenty eukaryotického genomu Kódující části genů: - u prokaryot tvoří většinu genomu - u eukaryot méně, člověk 24 000 genů – 1.5% Introny: - původně považovány za příčinu C-paradoxu, - tvoří většinu genů Pseudogeny: - klasické, retropseudogeny, - 19000 člověk, 14000 myš, 51 kur, 33 kvasinka, 176 drosophila Mobilní elementy: - LTR, nonLTR – SINE, LINE, DNA transposony- MITE Satelitní DNA: Numt, Nupt: - inzerce promiskuitní DNA “Triumphs as well as failures of nature's past experiments appear to be contained in our genome” - Susumu Ohno „The majority of the genome consisted of now-extinct genes“ - Susumu Ohno Evoluce genomů - citáty „The evolution of the large-scale features of the genome is one of the most difficult, perharps the most difficult, question in evolutionary biology“ - Maynard Smith http://www.nndb.com/people/095/000044960/jmsmith.jpg Velikosti genomů prokaryot •Bakteriální genom: 6´105 ->107 (=0.6-10Mb) • - nejmenší známý: Mycoplasma genitalium • (480 genů kódujících proteiny, 3 rRNA geny, 37 tRNA genů) • •Procesy ovlivňující velikost bakteriálního genomu: • - genová duplikace, malé delece a inzerce, transpozice, horizontální přenos, ztráta genů v parazitických liniích, atd. Velikost genomů prokaryot je zhruba úměrná počtu genů Velikosti genomů prokaryot EXTRÉMNÍ GENOMY Strategie: 1. odstranění či inaktivace genů (top-down) 2. syntéza minimálního genom (bottom-up) „Životní minimum“ bakterie Život s pouhými 271 geny Mycoplasma laboratorium (Synthia) - nahradili genom M. capricolum uměle nasyntetizovanou DNA M. mycoides - nový software přebudoval původní hardware, vodoznaky v umělé DNA http://sp6.fotolog.com/photo/54/45/12/aida_rg/1201358749_f.jpg 11/12 Související obrázek Genomy umíme nejen číst ale také psát Syntetický život: Pouhých 271 genů Craig Venter Transplantace genomu: Největší prokaryotické genomy Pseudomonas aeruginosa (bakterie): - 5500 genů - přes 6 Mb - přirozeně rezistentní k antibiotikům (ochranný obal) - R-faktor, žije ve společenství jiných bakterií, konjugace - lidský patogen (kožní n., močové, dýchací a trávicí cesty) - - Nostoc punctiforme (sinice): - 7432 ORF - 8.9 Mb - repetice, transpozony - fotoautotrofní, také fakultativně heterotrofní - možnost symbiózy s rostlinami i houbami Repetice N.p. •Eukaryotický genom: 8.8´106~ 6.9´1011 • (8.8Mb – 670Gb) •Nejmenší známý: Saccharomyces cerevisiae •Největší známý: Amoeba dubia Velikosti genomů eukaryot Velikosti eukaryotických genomů NEjsou úměrné počtu genů nebo komplexitě organizmu ZMĚNY VE VELIKOSTI GENOMU Zvětšení genomu •celkové zvětšení: polyploidizace (duplikace celého genomu) •duplikace části genomu, zmnožení počtu chromosomů •duplikace genů a skupin genů • •amplifikace transpozonů •inzerce virové DNA •inzerce organelové DNA •expanze (mikro)satelitů Vzrůstající komplexita živých forem byla doprovázena vzrůstem velikosti genomů a počtu genů Evoluční síly ovlivňující velikost genomu Změny ve velikosti genomů: plynulé nebo skoky? Plynulost: - savci, ptáci, kostnaté ryby - postupná akumulace nebo delece, malé segmenty DNA - normální distribuce velikostí genomů v těchto skupinách - podíl jedinečných sekvencí konstantní, mění se spolu se změnou velikosti genomu, je dán velikostí intronů Skoky (kvantové změny): - bezobratlí, rostliny (50% nahosemenných je polyploidní), vyjímečně obratlovci - polyplodizace, přidatná replikace některého chromosomu, kryptopolyploidizace (koordinovaná replikace všech repeticí v genomu – Chironomus) - kvantové rozdíly mezi blízkými příbuznými, velké rozdíly ve velikostech genomů Růst velikosti genomu: Polyplodizace Chyba v meioze vede k diploidním gametám Fúze diploidní a haploidní gamety vede k triplodnímu jádru, organizmus je však sterilní Autopolyploidie: multiplikace jedné základní sady chromosomů, jeden organizmus, chyba při meioze (růže…) Allopolyploidie: kombinace geneticky odlišných sad chromosomů (pšenice…) Kryptopolyploidie: dávná polyplodizace, organizmus se jeví jako diploidní, přestavby – delece, translokace…, kvasinka, obratlovci, obilniny, odhalení až sekvenací Polyploidní plodiny - tetraploidi: kukuřice, bavlna, brambor, zelí - hexaploidi: pšenice, chrysantéma - oktoploidi: jahodník Genom kvasinky: Polyploidizace nebo duplikace segmentů? •54 nepřekrývajících se duplikovaných oblastí •50 z nich si zachovalo stejnou orientaci vzhledem k centroméře •nebyla nalezena žádná triplikovaná oblast, přičemž 7 oblastí by bylo očekáváno dle Poissonova rozložení •příbuzné druhy bez duplikace – Kluveromyces waltii a Ashbya gossypii •457 genových párů – 17% se vyvíjí rychleji než jejich homology u K. waltii Duplikace jsou výsledkem tetraploidie spíše než postupných regionálních duplikací Polyploidizace v linii obratlovců •Duplikace genomu před 450 mil let napomohla vzrůstu komplexity a diverzifikaci obratlovců S. Ohno: - dvě genomové duplikace u obratlovců – hypotéza „2R“ (2 rounds) - některé genové rodiny mají 4 členy u obratlovců a jednu u bezobratlých - srovnání ježovky (bezobratlý) s obratlovci (člověkem, myší a rybou Fugu) - v genomu člověka dlouhé segmenty ve čtyřech kopiích podél všech chromosomů Polyploidizace u rostlin Arabidopsis: - duplikace před 200 a 80 mil. let - možná i více než 4 genomové duplikace - asi 60% genomu leží v duplikovaných segmentech - 50% genů v nich je konzervováno Počet genů a evoluce duplikovaného genomu ABCDEFGHIJKLM NOPQRSTUVWXYZ a b c d e f g h i j k l m n o p q r s t u v w x y z ABCDEFGHIJKLM NOPQRSTUVWXYZ a b c d e f g h i j k l m n o p q r s t u v w x y z AB DEF HI KLM N PQ TUV X Z b c e g h j k m n o p r s t v w x y I KLM N PQ TUV X Z b c e g h j k m s t v w x y n o p r AB DEF H I KLM N PQ TUV X Z AB D e’ g h j k m s t v w x y n o p r bc E’F H 26 genes, 2 chomosomes 26 genes, 2 chomosomes Tetraploidizace Ztráta genů 52 genes, 4 chomosomes Translokace Crossing over 36 genes, 4 chomosomes Vzrůst počtu genů, potlačení šumu a biologická komplexita Prokaryota/eukaryota: Potlačení šumu - separace transkripce a translace, jaderná membrána a histony Obratlovci: Potlačení šumu – metylace genů, mobilních elementů a duplikátů RNA interference (smallRNAs) prokaryota eukaryota obratlovci Mechanizmy zvětšení genomů •Duplikativní (retro)transpozice •Nerovnoměrný (unequal) crossing-over •Replikační klouzání (Replication slippage) •Genová amplifikace (rolling circle replication) NEKÓDUJÍCÍ DNA a VELIKOST GENOMU Teorie úlohy nekódující DNA: adaptivní role vs. sobecká DNA - Jaké evoluční síly produkují „zbytečnou“DNA? - Jaká je role „zbytečné“DNA? - Proč selekce toleruje „zbytečnou“ DNA? Adaptivní role: - vliv nadbytečné DNA na fenotyp - vliv na velikost jádra a buňky - ochrana kódujících sekvencí před mutacemi - pufrování koncentrace regulačních proteinů Sobecká DNA (junk DNA): - jsou to jen parazitické sekvence, mobilní elementy, fixace genetickým driftem, velikost genomu je tolerovatelné maximum závisející na ekologických a vývojových potřebách organizmu Genomová obezita u rostlin – jednosměrný proces? Teorie sobecké DNA (Dawkins, 1976) -jediným cílem DNA je se replikovat Dva modely: - pouze růst genomů - růst i zmenšování genomů Limity růstu genomů: - fitness hostitele - mechanizmy potlačující amplifikaci – metylace - mechanizmy odstraňování repeticí – rekombinace - BARE – 42x více soloLTR než vnitřních částí (dávná aktivita) - rekombinace uvnitř elementů i mezi elementy - selekce na kratší LTR, solo LTR nejdelší Big Bang v genomu kukuřice •- polyploidizace •- amplifikace TE (6 mil let) •- inzerce do mezigenových oblastí PNAS 98, 8163-8164 (2001) Závislost velikosti genomu na zaměpisné šířce a nadmořské výšce - korelace mezi velikostí genomu a teplotním režimem - větší genomy nebo polyploidi: - arktické lososovité ryby - zooplankton arktických jezer (Daphnia, Bosmina) - rostliny v polárních oblastech - populace v teplých oblastech jsou diploidní http://www.clubcientificobezmiliana.org/blog/wp-content/uploads/2012/10/Pulga.jpg Obsah DNA je proměnlivý i v rámci jedince Zvýšení obsahu DNA - endopolyploidie a polytenie: - drosophila - polytenní chromosomy ve slinných žlázách - Daphnia - tkáňově-specifické rozdíly v ploidii, 2-2048C, vliv na morfologii hlavy indukovanou predátorem - Bombyx mori – 1 000 000 ploidní buňky žláz - hedvábí - korelace ploidie a velikosti buňky - - - Snížení obsahu DNA v somatických buňkách: - nematoda, bičíkovci, dvoukřídlí, - např. Cyclops strenuus – somatické b. mají 5% obsahu DNA oproti oplozenému vajíčku - vysvětlení z hlediska sobecké DNA – delece DNA ze slepé somatické linie a ne ze zárodečné linie - změna obsahu DNA během života jako odpověď na stimuly – Lamarckismus Daphnia pulex Bombyx mori Cyclops strenuus Vliv velikosti genomu na fenotyp Velikost genomu koreluje s: + - velikostí jádra - velikostí buňky (nucleotypic effect) - dobou mitózy a meiózy - minimální generační dobou - velikostí semen - odpovědí letniček vůči CO2 - dobou vývoje embrya u mloků - - - rychlostí bazálního metabolismu u obratlovců (negativní korelace) (malý genom ptáků a netopýrů - rychlý metabolismus při letu, velký genom ryb - estivace za hypoxických podmínek) - morfologickou komplexitou mozků u žab a mloků (negativní korelace) http://blisty.cz/img.php?id=-8228&size=350&mc=ffffff&mg=0&cp=0 http://g.cz/sites/default/files/g/2014/10/abstract-bird-vs-aeroplane-600x800.jpg TOPOGRAFIE GENOMU Uspořádání genů v genomech Syntenie - konzervativita pořadí genů A B C1 C2 D E A B C E druhy I. II. III. • konzervativita genů • rozdílné mezigenové sekvence Makro- vs. mikro- kolinearita - konzervativita v dlouhých úsecích - mikrostruktura více dynamická, mix s jinými geny - polyploidie urychlí evoluci mikrostruktury - změny již u prvních generací syntetického alotetraploida u Brassica (Bancroft, 2001) Nedávná divergence: A. thaliana vs. Capsella rubella: divergence před 6.2-9.8 mil. let Dávná divergence: A. thaliana vs. tomato: divergence před 150mil. let Rychlá evoluce oblasti rezistence k patogenu - gen „RPP5“ – rezistence k Perenospora parasitica - - rozdíly mezi A.t. ekotypy Lansberg erecta a Columbia - - většinou pseudogeny - tandemové duplikace a nerovnoměrný crossing-over je mechanizmem rychlé evoluce Lansberg erecta Columbia (Bancroft, 2001) Arabidopsis thaliana Počty chromosomů u různých druhů Ch1Ct1 Extrémisté: mravenec Myrmecia pilosula – 1 pár, samec 1 chromosom kapradina Ophioglossum reticulatum – 630 párů Různé počty chromosomů u blízce příbuzných druhů jelínků Muntiacus různé druhy: Evoluce pohlavních chromosomů A A alela determinující pohlaví proto X proto Y potlačení rekombinace a akumulace repetitivní DNA X Y X Y X 0 S. latifolia savci hmyz ztráta chromosomu Y degenerace chromosomu Y Lidský chromosom Y: „Sál plný zrcadel“ PAR1 PAR2 Palindromy: • 3 000 000 bází dlouhé • 99.9% identita Homologní oblasti mezi X a Y Duplikativní přenos z X Palindromy •Objev palindromu je zajímavý ve světle objevů na lidském chromosomu Y •Osekvenován euchromatin Y, nejzajímavějšími sekvencemi obří palindromy o vysoké identitě svědčí o genové konverzi (Y nemá partnera tak se páruje sám se sebou) •My jsme našli opdobné struktury v mladých sex chromosomech •Popiseujeme v popularním článku ve Vesmíru Recyklace pohlavních chromosomů u drozofily První Y chromosom: „original Y“: - vymizel před více než 60 mil. lety Druhý Y chromosom: „ancestral Y“: - párování B chromosomu s X chromosomem ~ před 60 mil let - získání úžitečných genů z autosomů - degenerace Třetí Y chromosom: „neo Y“ - fúze X s autosomem - připojení ancestrálního Y na A, recovery - opět degenerace neo-Y Silenka širolistá: model pro studium mladých pohlavních chromosomů člověk (Homo sapiens): 300 mil let silenka širolistá (Silene latifolia): 10 mil let Degenerace chromosomu Y již v časných fázích jeho evoluce Akumulace repeticí na mladém chromosomu Y (CAA)n •Jaká DNA se akumuluje na Y? Zjistili jsme, že promiskuitní plastidová DNA •Dovolte odbočku: organely byly původně volně žijící bakterie, po endosymbioze (vznik eukaryotické b.) přenos genů do jádra •U člověka také akumulace mitochondriální DNA na Y Degenerace genů na chromosomu Y: Více repetitivní DNA v genech na chromosomu Y • Co bylo dříve? Akumulace repeticí nebo degenerace genů? Srovnání lidských a myších chromosomů člověk myš Od evoluční divergence došlo k četným přestavbám, které umístily bloky genů do různých kombinací. Chromosomové přestavby fig4 fig3 rekombinace mezi repeticemi zlom a znovuspojení (del., dupl., inv.) •Isochory: bloky genomové DNA (stovky kb-Mb) s charakteristickým GC-obsahem, ostrý přechod (G. Bernardi) •- shlukování do skupin s diskrétními GC-obsahy, u člověka typy L1, L2, H1, H2 a H3 (GC nejbohatší, tvoří jen 3% ale obsahuje 25% genů) -Mozaiková struktura genomu obratovců a rostlin Izochorový model organizace genomu Původ izochor: 1. Výsledek mutací? 2. Výsledek selekce? 3. Genová konverze? http://www.istitutoveneto.it/flex/FixedPages/Common/exampleTemplates/img_soci/237.jpg http://image.slidesharecdn.com/2014-03-07delivery-140518080754-phpapp02/95/comparative-genomics-and -visualisation-part-1-79-638.jpg?cb=1400402528 GENOMOVÉ PROJEKTY První genomové projekty - začátek éry genomiky 1977: první kompletní genom (virus) - bakteriofág phiX174 (5 386 bp) Sanger et al., Nature 265, 687-695. 1995: první kompletní genom autonomního organizmu - bakterie Haemophilus infuenzae (1.38 Mb) Fleischmann et al., Science 269, 496-512. 1996: první eukaryotický organizmus - kvasinka Saccharomyces cerevisiae Goffeau et al., Science 274, 563-567. Genomové projekty 2000: Drosophila melanogaster (137 Mb/13 500 genů) 1996: Saccharomyces cerevisiae (12 Mb/ 6548 genes) 1998: Caenorhabditis elegans (97 Mb/19 099 genů) Mus musculus (3 300 Mb) 2000: Arabidopsis thaliana (125 Mb/25 500 genů) Sekvenování lidského genomu Genomes OnLine Database (GOLD): https://gold.jgi.doe.gov/ Jak zjistit stav genomových projektů Genbank - sekvence DNA, veřejně přístupná SRA –sequence read archive – NGS data SWISS-PROT - sekvence proteinů, popis funkce, struktury domén dbEST - sekvence cDNA z různých organizmů REBASE - restriktázy a metylázy PEDANT - kompletní nebo parciální sekvence genomů PDB - 3D koordináty makromolekulárních struktur REPBASE – repetitivní sekvence 7.3.2019 Objem dat v databázích roste exponenciálně Počet bází 1014bp The International Nucleotide Sequence Database Collaboration (INSDC; http://www.insdc.org) Genomové sekvenační projekty (počet genomů) Sekvenační centra http://previews.figshare.com/1090780/preview_1090780.jpg Související obrázek Prudký pokles ceny sekvenování genomu (člověk) http://www.genome.gov/images/content/costpergenome2015_4.jpg Které jiné zboží zlevnilo téměř 100 000x ???