Evoluce bakteriálních genomů Charakteristické rysy: Rychlé a rozsáhlé změny ve struktuře a informačním obsahu genomu (plasticita, dynamické změny) Hlavní mechanismy: - Vnitřní přestavby - Získávání genů a genetických elementů (HGT) Evoluce kmenů v rámci druhu - adaptace na nové podmínky prostředí Mechanismy evoluce bakteriálních genomů transformace získávání genů HGT bakteriální genom Udržování genů poskytujících selekční výhody plazmid fágy Aditivní evoluce Reduktivní evoluce Fágy, plazmidy, IS, Tn, PAI genové duplikace, přestavby inaktivace genů, pseudogeny ztráta genů Procesyzískávánía pozměňování genovýchfunkcí Ztrátygenových funkcívnitřními mechanismy rekombinace, delece Bakteriální kmeny téhož druhu se mohou geneticky významně lišit. Bakterie, které se podrobují četnému horizontálnímu přenosu mají otevřené genomy. Společné geny pro všechny kmeny se označují jako „core“ genom daného druhu. Souhrn všech genů zjištěný u všech kmenů daného druhu se označuje jako „pan“ genom. Charakteristika „core“ a „pan“ genomu bakterií Struktura genomu odráží životní styl bakterie Příčiny změn ve velikosti a obsahu genomu Společný předek Redukce genomu delecemi Získávání genů HGT Mutace, přeskupení Intracelulární druhy a patogeny Extracelulární druhy, fakultativní patogeny Všechny životní styly Genomické ostrovy Mechanismy odpovědné za plasticitu genomu Genetický element nebo mechanismus Důsledky A. Zisk vlastností (procesy, genetické elementy) Bodové mutace Změna genové exprese Homologní rekombinace Přeskupení DNA, inverze, duplikace, delece DNA Integrace DNA přenesené HGT Transformace Získání přídatné genetické informace IS elementy, transpozony Inzerce, delece, inverze DNA, změny genové exprese Integrony Přenosy genů, přeskupení DNA Konjugace, plazmidy, konjugativní transpozony, HGT, mobilizace jiných elementů (plazmidů, chromozomu). zisk nových genů Transdukce, bakteriofágy Získání přídatné genetické informace, fágové konverze Kapsdukce, GTA, VTA HGT, Získání přídatné genetické informace Genomové ostrovy a ostrůvky HGT, integrace a delece velkých úseků DNA B. Ztráta vlastností (procesy) Bodové mutace Změny v genové expresi, ztráta funkce genů Homologní rekombinace Přeskupení DNA, delece n. inverze úseků DNA, integrace genů získaných HGT Transpozice Změny genové exprese, ztráta funkce genů, delece úseků genomu Vnitřní přestavby replikonů navozené přítomností repeticí •Duplikace (amplifikace) •Delece •Inverze Typ přestavbyTypy repeticí • geny rRNA a tRNA • Inzerční sekvence • transpozony • krátké repetice • rhs a Chi-sekvence Homologní rekombinace Transpozice Místně-specifická rekombinace Nerovnoměrný crossing-over Mechanismus Přestavby navozené interakcí repetic (výsledky homologní rekombinace) delecedelece duplikace inverze R = 150-1000 bp Imunogenní proteiny pro adhesi vykazující sekvenční variace u obou druhů zodpovědné za únik před imunitním systémem P1, P40, P90 Homologní rekombinace navozující přestavby Fylogenetický strom sestrojený z RFLP podmíněných přesuny IS1, IS2, IS3, IS4, IS30, IS150, IS186 Změny v genomu po dlouhodobém uchovávání kultur E. coli a S. typhimurium ➢změny lokalizace IS ➢změny velikosti genomu ➢změny fenotypu 1 rok Evoluční historie chromozomu E. coli (srovnání E. coli K12-MG1655 a kmenů se známou genealogií) 67 událostí: 37 inzercí a 30 delecí  90% ORF je pro všechny kmeny společné  jedinečná DNA o délce kb až Mb: Geny přenesené horizontálně na mobilních elementech: ➢ plazmidy ➢ bakteriofágy ➢ transpozony ➢ genové kazety ➢ genomické ostrovy Rozdíly v genomech E. coli a S. typhimurium (divergence obou druhů před 120-150 milony let) - rozdíly způsobené rozsáhlými genomovými přestavbami: ➢ velké inverze zahrnující až 10% genomu ➢ četné oblasti jedinečné každému druhu tzv. „smyčky“ –inzerce nebo delece až 15% délky chromozomu s náhodnou distribucí - druhově-specifické geny získané horizontálním přenosem • geny lac u E. coli, geny pro invazivitu u S. typhimurium Závěry z analýz přestaveb genomu E. coli a S. typhimurium (u neselektovaných kultur) • Průměrný lokus je duplikován v každé z 1000 buněk • 10% buněk v kultuře nese duplikaci některé oblasti chromozomu • Velikost duplikací: 140 kb – 2100 kb ➢Distribuce duplikací není náhodná ➢Duplikace jsou ohraničeny dlouhými přímými repeticemi různého typu Duplikace funkcí adaptace na změny prostředí • zvýšení dávky genů • vytvoření redundantní DNA pro následnou genetickou divergenci paralogní geny – adaptace na nová prostředí Vytváření paralogních genů duplikací a divergencí Původní funkce + Nová funkce Původní gen Původní gen Divergence (mutace a selekce nové funkce) Původní gen, nutnost zachování jeho funkce Duplikace genu, vznik homologu Nový gen - paralog Evoluční vztahy mezi ortologními a paralogními geny Jako homologní jsou označovány geny odvozené z jednoho společného (ancestrálního) genu. V roce 1970 bylo navrženo dělení homologních genů na dva typy: geny paralogní a geny ortologní. Paralogní geny jsou výsledkem duplikace ancestrálního genu, zatímco ortologní geny jsou výsledkem speciace. Druh A Společný předek speciace Druh B Duplikace genu ortologní geny Divergence během evoluce paralogní geny zvýšený adaptivní potenciál Evoluce bakteriálních replikonů - vznik plazmidů Původní genom tvořený několika menšími replikony Vytváření hybridů těchto replikonů vzájemnou integrací Rozklad hybridů za vzniku větších nízkokopiových stabilních replikonů (chromozomů) nesoucích většinu genů, a malých vysokokopiových replikonů (plazmidů) Opakování procesu integrace a rozkladu, optimalizace informačního obsahu replikonů Výhoda vyššího počtu kopií: 1. vyšší dávka genů, 2. vyšší šance mutací 3. přenos mezi buňkami chromozom Plazmid (vícekopiový) F x F´ Horizontální přenos genů ❑ Často přenášené: operační geny (metabolismus a regulace, buněčná struktura) ❑ Zřídka přenášené: informační geny (transkripce, translace) Horizontální přenos genů je spjat s variabilními genetickými elementy profágy, plazmidy, IS-elementy, transpozony, integrony Počet horizontálně přenesených genů u vybraných druhů bakterií a archeií Druh Velikost genomu (Mbp) Počet ORF Horizontálně přenesené ORF Proteobacteria počet % Escherichia coli 4,64 4289 381 9,6 Haemophilus influenzae 1,83 96 96 6,2 Helicobacter pylori 1,67 1553 89 6,4 Rickettsia prowazekii 1,11 834 28 3,6 Gram-pozitivní bakterie Bacillus subtilis 4,21 4100 537 14,5 Mycoplasma genitalium 0,58 480 67 14,5 Mycoplasma pneumoniae 0,82 677 39 5,9 Mycobacterium tuberculosis 4,41 3918 187 5,0 Spirochaete Borrelia burgdorferi 0,91 850 12 1,56 Treponema pallidum 1,14 1031 77 8,3 Chlamydiae Chlamydia trachomatis 1,04 894 36 4,3 Deinococcus radiodurans 2,65 2580 95 3,92 Synechocystis sp. 3,57 3169 219 7,5 Thermotoga maritima 1,86 1846 198 11,63 Archaea Aeropyrium pernix 1,67 2694 370 14,0 Methanobacterium therm. 1,75 1869 179 10,3 Methanococcus jannaschii 1,66 1715 77 5,0 Pyrococcus abyssi 1,76 1765 124 7,35 1% bakteriálních genů bylo získáno HGT z eukaryot Horizontálně přenesené geny (HGT) u E. coli K12 MG1655 (po divergenci E. coli a S. typhimurium) Genom E. coli obsahuje relikty 755 HGT (18% genomu = 548 kb, 234 přenosových událostí) ➢Vyšší proporce genů HGT v oblasti terminátoru replikace ➢Lokalizace genů HGT poblíž genů pro tRNA (přenos pomocí fágů) ➢V blízkosti genů přenesených HGT se nachází 68% všech inzerčních sekvencí - IS jsou přenášeny spolu s geny HGT (jsou součástí např. ostrovů) - IS navozují integraci přenášené DNA Genetický element Označení Faktory virulence nebo jiné funkce Ostrovy patogenity Enteropatogenní E. coli PAI Adhesiny, hemolyziny, cytotoxiny Enterohemorhagické E. coli LEE (esp-LEE) Adhesiny, enterotoxiny Vibrio cholera O1, 0139 VPI (vibrio path. island) Pilusy, regulace Staphylococcus aureus TSST-1-PAI (SaPI1 aj) Exotoxinový PAI Enterotoxinový PAI Toxin toxického šoku Exotoxin Enterotoxin Ostrůvky patogenity E. coli, Shigella dysenteriae Lokus chuA a shuA –haem Fe Příjem hemu Salmonella enterica sv. Typhimurium Lokus msgA/pagC Protein vnější membrány, přežívání v makrofágách Streptococcus pyogenes Oblast vir proteázy Plazmidy E. coli (mimo střevo) pHly, Vir plazmidy Hemolyzin, cytotoxický nektrotizující faktor intestinální E. coli pO157,Vir plazmidy Adheziny, enterotoxiny, kataláza, hemolyzin Shigella flexneri pWR100, pWR501 Invasiny, enterotoxin Clostridium tetani pCL1 Tetanový toxin Bakteriofágy Clostridium botulinum cI Botulotoxin A, B Corynebacterium diphtheriae b Difterický toxin A, B E. coli (enterohemorhagické) H19, 933 Shiga toxin A, B S. aureus f42 Enterotoxin A, B V. cholerae CTXf Cholerový toxin A, B Příklady genetických elementů přenášených horizontálně Genomické ostrovy („fitness“ ostrovy) části genomů se znaky mobilních genetických elementů s odlišným obsahem GC, ohraničené repeticemi a geny pro mobilitu ➢ ostrovy patogenity ➢ ekologické ostrovy ➢ saprofytické ostrovy ➢ symbiosové ostrovy Charakteristické pro jednotlivé kmeny v rámci druhu Obecná struktura ostrovů patogenity Ostrov patogenity Geny pro virulenci Počet nukleotidů Inzerční sekvenceGen pro integrázu Přímá opakování Obecné rysy a typy genomických ostrovů (GEIs) Distribuce ostrovů patogenity u S. enteritica serovar Typhi Vznik genomických ostrovů u patogenních a environmentálních mikrobů Přenos fágem Schematické znázornění životního stylu mobilních genomických ostrovů sestávající z následujících kroků: 1. Zisk ostrova horizontálním přenosem 2. Začlenění do chromozomu hostitele místně specifickou rekombinací 3. Vývoj ostrova přestavbami n. ztrátami genů (3a) nebo jejich ziskem (3b). 4. Vyčlenění ostrova z chromozomu 5. Přenos do dalšího recipienta Model vzniku ostrovů patogenity u patogenních E. coli Kmeny E. coli adaptované na různá prostředí Enterohemorhagické k. Enteropatogenní k. Uropatogenní k. Fág (shiga toxin) plazmid plazmid Původní genom plazmidtRNA, att LEE (Locus of enterocyte effacement ) Escherichia coli secreted protein C Horizontálně získané virulenční faktory zodpovědné za patogenitu enterohemorhagického kmene E. coli O157:H7 LEE = locus for enterocyte effacement (uchycení na střevní sliznici a její léze) Plazmid O157 získaný patrně konjugací Sukcese genetických událostí vedoucích k virulenci druhů Shigella Kmeny Shigella jsou odvozeny z E. coli po získání virulenčního plazmidu a dvou chromozomových genů (SHI-1, SHI-2) a po ztrátě několika málo genů z genomu E. coli (lyzindekarboxyláza – inhibice toxinů) r. Shigella x Escherichia coli K-12 90% homologie DNA (!) Kolinearita genů Rekombinace po HGT LDC Vliv ztráty genů na patogenitu enterobakterií Genomové delece („černé díry“ ) zvyšující virulenci u Shigella spp. a u enteroinvazivních kmenů E. coli (EIEC) Výsledek hybridizace sond z 14 různých genů E. coli K12 z oblasti genomu 4254428-4406306 bp k genomové DNA reprezentativních kmenů Shigella a EIEC (+ = pozitivní hybridizace, - = negativní hybridizace) K12 Shigella spp., původce bacilární dysentérie, se liší od příbuzných komensálních kmenů Escherichia coli přítomností plazmidu, který kóduje virulenční funkce. Patogenní baktérie však vedle toho mohou postrádat vlastnosti, které jsou charakteristické pro nepatogenní druhy. Enzym lysindekarboxyláza (LDC) je přítomen u ≈90% kmenů E. coli kmenů, avšak vždy chybí u kmenů Shigella. Pokud je gen cadA kódující LDC zaveden do Shigella flexneri 2a, její virulence se sníží a je silně inhibována aktivita enterotoxinu. Inhibitorem enterotoxinu je kadaverin, což je produkt reakce katalyzované LCD. Srovnání genomů S. flexneri 2a a laboratorního kmene E. coli K-12 ukázalo, že v oblasti, kde se nachází cadA je u shigely rozsáhlá delece. Vybrané kmeny Shigella spp. a enteroinvazívních kmenů E. coli mají podobné delece genu cadA. Tyto výsledky naznačují, že patogenní kmeny Shigella spp. se vyvinuly z E. coli nejen po získání virulenčních genů nesenýcvh na plazmidu, ale současnou ztrátou genů v důsledku delece. Vytvoření těchto “černých děr” , tj. delece genů, které jsou škodlivé pro patogenní způsob života, představují evoluční proces, který umožňuje patogenu zvýšit jeho virulenci. To, že kadaverin snižuje aktivitu enterotoxinu, může představovat obecný návod a model pro “antitoxinovou terapii” – nový způsob léčby infekčních onemocnění. ZACHYTÁVÁNÍ GENŮ INTEGRONY Integron obsahuje: 1. att místo, umožňující opakové zachycení genů nebo genových kazet 2. Gen intl kódující integrázu, rozpoznávající 59 bp rekombinační místa 3. Promotor umožňující expresi vloženého genu Gen (nebo genová kazeta) Genová kazeta v CTn (případně v plazmidu) Integron obsahuje místně-specifický rekombinační systém schopný začleňovat a exprimovat geny přítomné ve strukturách nazývaných mobilní genové kazety. Integrony byly původně identifikovány na mobilních elementech patogenních bakterií jako hlavní rezervoáry genů antibiotické rezistence. Patří mezi starobylé vzájemně fylogeneticky odlišné struktury, zjištěny u 10% sekvenovaných bakteriálních genomů. Diverzita kazet je extrémně vysoká – mají tedy významnou úlohu v adaptaci, nejen vzhledem k rezistenci k antibiotikům. Integrony jsou genetické struktury schopné zachytit nebo vyčlenit genové kazety, které obvykle kódují determinanty antimikrobiální rezistence. I když integrony nejsou schopné se samy mobilizovat (přenášet) jsou obvykle asociovány s transpozony a často jsou lokalizovány na plazmidech, což usnadňuje jejich přenos. Jsou tak ideálně vhodné pro šíření a rekombinace genů antimikrobiální rezistence. Super-integron Vibrio cholerae Obsahuje více než 100 kazet kódujících rezistenci k různým antibiotikům a další většinou neznámé funkce (jejich původ není znám) konzervativní sekvence s vysokou homologií oblasti mezi kazetami odpovídající potenciálním attC místům Typy stafylokokových chromozomových kazet (SCCmec) zodpovědných za rezistenci kmenů S. aureus k meticilinu Oportunní patogen schopný vyvolat onemocnění u vnímavých pacientů Primární patogen vyvolávající onemocnění jako součást svého životního stylu EVOLUČNÍ PROCES VYŽADUJÍCÍ ZÍSKÁNÍ VIRULENČNÍCH NEBO ZTRÁTU NEVIRULENČNÍCH ZNAKŮ Komensál nevyvolává buď žádné poškození nebo jen inaparentní onemocnění; může vyvolat imunitní odpověď EVOLUČNÍ PROCES VYŽADUJÍCÍ ZÍSKÁNÍ VIRULENČNÍCH NEBO ZTRÁTU NEVIRULENČNÍCH ZNAKŮ ADAPTIVNÍ PROCES VYVOLANÝ HOSTITELEM HOSTITEL ORGANISMUS, KTERÝ JE KOLONIZOVÁN NEBO INFIKOVÁN Interakce patogen-hostitel u bakteriálních infekčních onemocnění Minimální genom Definice: Základní sada esenciálních genů, kterou daný organismus potřebuje k udržení života. Představuje silně redukovanou sestavu genů jeho genomu, která se liší v závislosti na životním stylu a podmínkách prostředí (růstové požadavky, dostupné zdroje živin atp). Závisí na podmínkách experimentu, při nichž jsou esenciální geny určovány. Cíle studia minimálního genomu 1. Poznání životně nezbytných enzymových funkcí – pochopení prebiotické existence – předchůdců prvních bakterií 2. Pochopení vývoje bakteriálních druhů 3. Předpoklad pro přípravu bakterií s umělým genomem (Mycoplasma laboratorium) - produkce látek pro průmyslové využití (paliva, plasty, farmaka) Přístupy ke stanovení minimálního genomu A. Teoretické přístupy 1. Bioinformatický přístup – srovnání genomů různých organismů a vyhledání těch genů (genových funkcí), které jsou konzervovány u většiny druhů – tyto geny jsou esenciální, udržují se v podobných formách u všech 2. Modelování buněčných procesů, zejména metabolických drah. Vyhledání biochemických modulů a jejich konfrontace s genetickým základem. Přístupy ke stanovení minimálního genomu B. Experimentální přístupy – navození delece/inaktivace genů Inaktivace esenciálního genu není slučitelná s přežitím 1. Využití sebevražedných plazmidů. Plazmid obsahuje sekvence homologní se sekvencemi ohraničujícími úsek genomu určený k deletování. Po začlenění plazmidu do genomu dojde k intramolekulární rekombinaci, která vede buď k odstranění plazmidu nebo žádaného úseku genomu (chromozomu). Lze využít též lineární DNA – princip je stejný jako u plazmidu). 2. Transpozonová mutageneze. Náhodné začlenění transpozonu vede k inzerční inaktivaci genů a ztrátě jejich funkcí 3. CRISPR-Cas. Inaktivace genů. 4. Antisense RNA. Inaktivace transkriptů strukturních genů. Navození delece úseku chromozomu pomocí plazmidu Úsek, který má být deletován Deleční mutant Rozklad intramolekulární rekombinací Začlenění sebevražedného plazmidu zprostředkované RecA, selekce Standardní typ chromozom Organismus Počet esenciálních genů Escherichia coli 1617 Haemophilus influenzae 642 Streptococcus pneumoniae 244 Mycoplasma genitalium 381 Vibrio cholerae 779 Staphylococcus aureus 653 Saccharomyces cerevisiae 1110 Počet esenciálních genů je odlišný pro různé organismy – každý organismus má odlišný počet esenciálních genů v závislosti na tom, který konkrétní kmen a za jakých podmínek je testován. U bakterií (nebo např. u kvasinek) byly všechny nebo většina genů deletována jednotlivě, aby se zjistilo, které z nich jsou pro přežití nezbytné. Takové testy se obvykle provádějí na bohatých mediích obsahujících všechny živiny – když jsou všechny živiny přítomny, nebudou geny vyžadované pro jejich syntézu „esenciální“, když jsou ale kmeny pěstovány na minimální půdě, řada genů vyžadovaných pro syntézu určitých živin (nebo např. vitamínů) bude esenciálních. V tabulce jsou počty zjištěné na bohatých mediích. Bakteriální druh počet genů velikost genomu Mbp Candidatus Hodgkinia cicadicola Dsem 169 0.14 Candidatus Carsonella ruddii PV 182 0.16 Candidatus Sulcia muelleri GWSS 227 0.25 Candidatus Sulcia muelleri SMDSEM 242 0.28 Buchnera aphidicola str. Cinara cedri 357 0.4261 Mycoplasma genitalium G37 475 0.58 Candidatus Phytoplasma mali 479 0.6 Buchnera aphidicola str. Baizongia pistaciae 504 0.6224 Nanoarchaeum equitans Kin4-M 540 0.49 Prokaryota s nejmenším genomem a počtem genů Mitochondrie: genom o velikosti 6- 300 kb, jednotky až desítky genů Mitozom je organela nacházející se u některých jednobuněčných eukaryotních organismů, žijících v podmínkách s nedostatkem kyslíku, či jako vnitrobuněční paraziti. Byl nalezen a pojmenován teprve nedávno a ještě se přesně neví, jak těmto organismům prospívá. Hydrogenozom je membránou uzavřená organela některých anaerobních nálevníků, trichomonád či hub. Je asi 1 mikrometr velká a produkuje molekulární vodík. Známé jsou hydrogenozomy především u parazitických prvoků (Trichomonas) Srovnání informačního obsahu sekvenovaných genomů ➢Počet informačních genů je v každém genomu zhruba stejný, i když se jejich velikosti značně liší. ➢Počet genů ostatních funkčních kategorií je mnohem variabilnější a má tendenci se zvyšovat. ➢Se zvětšováním velikosti genomu přibývá paralogních genů a zvětšuje se též biochemická komplexita organismu. ➢ Jedna čtvrtina ORF u každého druhu je jedinečná a nemá významnou sekvenční homologii k žádné dostupné proteinové sekvenci. Zhruba třetina (~100) esenciálních genů nemá žádnou ze známých funkci ZÁVĚRY VYVOZENÉ Z ANALÝZY MINIMÁLNÍCH GENOMŮ • Každý genom obsahuje dva typy genů – Esenciální geny zajišťující základní biologické procesy – Geny pro dosažení selektivní výhody v daném prostředí (metabolismus – nové substráty, nové faktory virulence) • Minimální sada genů je společná pro všechny druhy (současný odhad ~ 206 kódujících genů) • Prostředí určuje, který gen je pro daný druh esenciální a který je postradatelný The assembly of a synthetic M. mycoides genome in yeast. A synthetic M. mycoides genome was assembled from 1078 overlapping DNA cassettes in three steps. In the first step, 1080-bp cassettes (orange arrows), produced from overlapping synthetic oligonucleotides, were recombined in sets of 10 to produce 109 ~10-kb assemblies (blue arrows). These were then recombined in sets of 10 to produce 11 ~100-kb assemblies (green arrows). In the final stage of assembly, these 11 fragments were recombined into the complete genome (red circle). With the exception of two constructs that were enzymatically pieced together in vitro (white arrows), assemblies were carried out by in vivo homologous recombination in yeast. Major variations from the natural genome are shown as yellow circles. These include four watermarked regions (WM1 to WM4), a 4-kb region that was intentionally deleted (94D), and elements for growth in yeast and genome transplantation. In addition, there are 20 locations with nucleotide polymorphisms (asterisks). Coordinates of the genome are relative to the first nucleotide of the natural M. mycoides sequence. The designed sequence is 1,077,947 bp. The locations of the Asc I and BssH II restriction sites are shown. Cassettes 1 and 800-810 were unnecessary and removed from the assembly strategy. Cassette 2 overlaps cassette 1104, and cassette 799 overlaps cassette 811. Science 2 July 2010: vol. 329 no. 5987 pp. 52-56 Creation of a Bacterial Cell Controlled by a Chemically Synthesized Genome Mycoplasma mycoides Mycoplasma capricolum Science 2 July 2010: vol. 329 no. 5987 pp. 52-56 Creation of a Bacterial Cell Controlled by a Chemically Synthesized Genome • VENTERINSTITVTE • CRAIGVENTER • HAMSMITH • CINDIANDCLYDE • GLASSANDCLYDE