RESTRIKCE A MODIFIKACE FÁGOVÉ DNA Kmeny E. coli K a K(P1) + mají vzájemně odlišnou hostitelskou specifitu (K a P1) = obsahují odlišné RM-systémy po jednom cyklu Fágy po jednom růstovém cyklu na hostiteli získávají nové hostitelské spektrum. Nejedná se o mutaci - změna se týká celé populace a není dědičná – epigenetická záležitost. Experimentální důkaz přítomnosti a působení RM systémů Kmen E. coli obsahující RM systém EcoB Kmen E. coli obsahující RM systém EcoK nemodifikovaný fág Plaka vytvořená fágem, který se na kmeni B modifikoval Plaka vytvořená fágem, který se na kmeni K modifikoval RESTRIKČNĚ-MODIFIKAČNÍ (RM) SYSTÉMY Složkami standardního restrikčně-modifikačního (RM) systému jsou sekvenčně specifické enzymy: A. modifikační metyláza (metyltransferáza) B. restrikční endonukleáza Restrikci a modifikaci podléhá jen dsDNA: 1. Při infekci fágem 2. Při přenosech DNA transdukcí a konjugací, omezeně transformací (při umělé tr.) Monitrování příjmu exogenní DNA – „imunitní systém prokaryot“ N6mA C5mC N6mA Donor metylové skupiny: SAM (AdoMet) SYSTÉMY RESTRIKCE A METYLACE 1. Hsd systémy (host specificity of DNA) třídy (typy) I, II, III, IV restrikční a metylační aktivita 2. Systémy restrikce modifikované DNA Mar, Mrr (methylated-adenine), DpnI Mcr (methylated-cytosine) 3. Systémy metylující specifické sekvence DNA Dam (adenine-methylation) Dcm (cytosine-methylation) 95% 1-2 geny, 30 protein štěpí jen modifikovanou DNA GENY KÓDUJÍCÍ RM-SYSTÉMY JSOU NESENY NA RŮZNÝCH REPLIKONECH lokalizace genů na chromozomu, plazmidech, nebo profágách xbaI Xanthomonas campestris M.Vch0211 Vibrio cholera hphI Vibrio metschnikovii CAA68 Lactococcus lactis Integron Rle39BITranspozon Sth368I Streptocvoccus thermophilus hsdMS S. aureus Integrační komulativní element/genomický ostrov hindIII H. influenzae sau42I S. aureus ecoO1091 E. coli bsuMI B. subtilis Bakteriofág/profág paeR71 P. aeruginosa ecoRI E. coli ssoII Shigella sonnei bsp6I Bacillus sp. Plazmid Příklad RM systémuMobilní element Přítomnost genů RM systémů na mobilních elementech PODJEDNOTKOVÉ SLOŽENÍ ENZYMOVÉHO KOMPLEXU TYPU I Multifunkční komplex S = rozpoznání cílové sekvence M = vazebné místo pro SAM a aktivní místo pro metylaci R = aktivní místo pro hydrolýzu ATP, pro translokaci DNA a pro štěpení Alosterický efektor umožňující rozpoznání cílové sekvence SAM se uvolňuje před štěpením INTERAKCE ENZYMŮ RM SYSTÉMU TYPU I S CÍLOVOU SEKVENCÍ NA DNA 1. Vyhledání rozpoznávací sekvence 2. Podle stavu sekvence (M, NM, H-M) dochází k a) uvolnění enzymu b) restrikci c) metylaci Interakce enzymového komplexu s rozpoznávacím místem ATP-dependentní translokace DNA - ke štěpení dochází po kolizi DNA řetězců v místě navázaného enzymu štěpení MODELY TRANSLOKACE DNA ZPROSTŘEDKOVANÉ ENZYMY RM SYSTÉMŮ TYPU I Smyčky pozorované v EM Pokud jsou místa nemodifikovaná, vytváří se rozpoznávací komplex, vázaný na rozpoznávací místo, a jím je DNA protahována (translokována) až k místu vzdálenému zhruba 1000 bp nebo více, kde pak proběhne štěpení. Navázaný restrikční enzym smyčka TRD = target recognition domain Geny hsdS mohou rekombinovat – představují dvě alely Struktura rozpoznávací podjednotky Pro RM systém typu I je nezbytná funkční hsdS její mutace vede k fenotypu r- m-. S- M-RMUTACE V GENECH RM SYSTÉMU r+/-/m- RM SYSTÉMY, U NICHŽ JE ŠTĚPENA MODIFIKOVANÁ DNA (KMEN NETVOŘÍ METYLÁZU) E. coli K12 Mar = methyladenine restriction (GmeAC, GmeAG) Mrr = methyladenine recognition and restriction Mcr = methylcytosine restriction - modified cytosine restriction (GmeCG - C5, N4, HM-C5) štěpení sekvence v několika místech (štěpí též neglukozylovanou fágovou DNA) Diplocooccus (Streptococcus) pneumoniae: RM systém DpnI - štěpí GmACT (Caulobacter, Neisseria, Acholeplasma, Streptomyces) Kóduje místně specifickou metylázu Na úrovni populace Standardní RM systém Mechanismy, kterými plazmidy a fágy unikají restrikci 1. Neobvyklé modifikace DNA 2. Nízká frekvence cílových míst 3. Tvorba proteinů, které interferují s jednou nebo více aktivitami RM systému 4. DNA vstupující do buňky ve formě ssDNA (konjugativní plazmidy nebo některé fágy), neuniká restrikci, ale stává se k nim citlivá po syntéze druhého vlákna. Fág MU – funkce MOM: konverze adeninu na A-(1acetamido)adenin, který je necitlivý k EcoKI a EcoBI. Plazmidy: Ard (alleviation of restriction) - antirestrikční protein, zmírnění restrickce Fág lambda: Ral (restriction alleviation) - antirestrikční protein - zvýšení modifikační aktivity enzymů typuAI na NM DNA Fágy T3 a T7: (proteiny Ocr = overcoming restriction) inaktivace enzymů typu I (zábrana jejich vazby na DNA) Fág P1: Dar-proteiny (defense against restriction) ? rozklad SAM Příklady antirestrikčních mechanismů 1. "Loss" of restriction sites. Some phage have many fewer recognition sites for certain restriction endonucleases than you would predict by random chance. For example, the phages T3 and T7 lack the 5-bp EcoRII recognition site CC(A or T)GG. This is thought to arise by selection for phage with mutations that prevent cleavage by restriction endonucleases commonly encountered in their hosts 2. Modified bases. Some phage have modified bases that prevent recognition by restriction endonucleases. For example, phages T2 and T4 have hydroxylmethylcytosine instead of cytosine in their DNA. 3. Self-methylation. Some phage encode a methylase that can modify their DNA so that it is not cleaved by certain restriction endonucleases. For example, the E. coli phages T2, T4, and the Myxococcus phage Mx8 encode dAdenine methylases (dam). Certain plasmids also encode methylases that may provide protection against restriction endonucleases 4. Activation of a host methylase. Some phage encode a protein that stimulates the host's methylase to modify the phage DNA. For example, the Lambda Ral ("restriction alleviation") protein enhances methylation by the HsdM subunit of the EcoK and EcoB restriction systems]. Ral seems to act by stimulating the expression of the host hsdS and hsdM genes 5. Degradation of host S-adensylmethionine. Some host restriction systems only recognize modified DNA (e.g. the McrA and McrB systems in E. coli). Phage T3 encodes a S-adensylmethionine hydrolase activity that degrades the substrate required for methylation by host enzymes, thus avoiding modification of the phage DNA and subsequent cleavage by modification-dependent host endonucleases 6. Inhibition of host restriction endonucleases. Many conjugal plasmids produce antirestriction proteins (called Ard) that specifically inhibit Type I restriction endonucleases. The Ard proteins have a motif that is very similar to a motif found in the HsdS subunit, thus it is possible that the Ard proteins prevent proper assembly of the restriction endonuclease complex by binding to the other Hsd subunits. Phage T3 produces a protein called Ocr which inhibits host methylases, resulting in resistance to modification-dependent restriction systems 7. DNA repair systems. Activity of certain phage genes may allow repair of the double-stranded breaks produced by restriction endonucleases. For example, the lambda Gam and Red proteins may repair the cleaved DNA by recombination with another copy of the phage DNA Ocr 0,3 Promotor genu ard Lokalizace genu ocr/0,3 na fágovém genomu Lokalizace genu ard na plazmidu Antirestrikční protein Glukozylace HMC zbytků DNA Tsudých fágů je účinnou ochranou před většinou RE – a navíc slouží k identifikaci fágové DNA, takže enzymy kódované fágy mohou selektivně degradovat hostitelský chromozom Evoluce interakcí mezi T-sudými fágy a hostiteli 5-hydroxymetyl- cytosin The prr locus was originally described as coding a ribonuclease that is activated after phage T4 infection to cut within the anticodon of a specific tRNA, inactivating protein synthesis and thus blocking phage development. glykozylace hmC RM štěpí DNA obsahující HMC Fágový gen IPI brání působení Gmr Gmr štěpí DNA obsahující HMC Modifikovaný systém Gmr (fúze genů Gmr) brání působení IPI Fágové mutanty necitlivé k modifikovanému systému Gmr. Neznámý mechanismus Evoluce interakcí mezi T-sudými fágy a hostiteli SYSTÉMY METYLACE DNA (E. COLI K12) 1. Systém Dam (dam-metyláza) metylace A v GATC (donor met = SAM) GATC - regulační funkce: počátek replikace, promotory, reparace, transpozice sekvence GATC je rozpoznávána 15% RE typu II, je přítomna u 50% všech 4N-RM-systémů, není však cílovou sekvencí pro restriktázy v žádném z druhů enterobaktérií. 2. DNA cytozin metylační - Dcm (E. coli K12) metylace cytozinu na C5 v sekvenci CC(A/T)GG (?funkce při reparaci na velmi krátké vzdálenosti) - V buňkách není přítomna RE rozpoznávající metylovanou sekvenci – nejedná se tudíž o standardní RM systém VÝSKYT RM SYSTÉMU U ENTEROBAKTERIÍ (3 DRUHY) 30% kmenů (z 1000 studovaných) obsahuje RM systém u 170 RM systémů bylo zjištěno jen 33 různých cílových sekvencí nebyly zjištěny RM systémy rozpoznávající 4 bpmísta (včetně GATC) – účast na regulacích VÝZNAM RESTRIKCE Ochrana integrity vlastní DNA obrana před bakteriofágy (typ II) …dočasné působení –epigenetické změny, na úrovni populace nutná obměna Systém napomáhající rekombinaci cizorodé DNA (typ I) štěpení DNA (náhodně) mimo rozpoznávací sekvenci umožní rekombinaci mnoha genů - analýza přenosu genů transdukcí a konjugací podporuje vliv RM systémů při vzniku mozaikových genomů (E. coli) ? „Selfish DNA“ molekulární paraziti bakterií. RM systémy typu II se udržují prostřednictvím plazmidů, které je kódují (usmrcení bezplazmidových buněk) RM systémy jako mechanismus postsegregačního zabíjení restriktáza metyláza "immigration control region" Gen hsdS může být nahrazen genem hsdS z jiného RM systému stejné třídy, nebo geny mohou vzájemně rekombinovat Odlišný obsah GC – indicie přenosu HGT VYUŽITÍ RM SYSTÉMŮ V EUKARYOTICKÝCH BUŇKÁCH Transgenní linie myších buněk exprimující geny RM systémů 1. přenos a exprese genu M.PaeR7 (Pseudomonas aeruginosa) - metyláza CTCGmeAG 2. přenos a exprese genu R.PaeR7 - endonukleáza (restriktáza) 3. infekce buněk HSV1 adenoviry - očekávaná rezistence buněk - vytvoření organizmu rezistentního k virům (nebo jen určitých tkání) Další možnost: studium vlivu metylace na genovou expresi Geny pro R a M bývají blízko sebe, ale ne v transkripčních jednotkách Konzervativní motiv Evoluce bakteriálních genomů Charakteristické rysy: Rychlé a rozsáhlé změny ve struktuře a informačním obsahu genomu (plasticita, dynamické změny) - Vnitřní přestavby - Získávání a ztráty genů a genetických elementů Vývoj kmenů v rámci druhu Adaptace na nové podmínky Mechanismy evoluce bakteriálních genomů transformace získávání genů HGT bakteriální genom Udržování genů poskytujících selekční výhody plazmid fágy Aditivní evoluce Reduktivní evoluce Fágy, plazmidy, IS, Tn, PAI genové duplikace, přestavby inaktivace genů, psedogeny ztráta genů Procesyzískávánía pozměňování genovýchfunkcí Ztrátygenových funkcívnitřními mechanismy rekombinace, delece Struktura genomu odráží životní styl bakterie Příčiny změn ve velikosti a obsahu genomu Mechanismy odpovědné za plasticitu genomu Změny genové exprese, ztráta funkce genůTranspozice Přeskupení DNA, dalece DNA, integrace genů získaných HGT Homologií rekombinace Změny v genové expresi, ztráta funkce genůBodové mutace B. Ztráta vlastností HGT, integrace a delece velkých úseků DNAGenomové ostrovy a ostrůvky HGTGTA, VTA HGT, transdukce, fágová konverzeBakteriofágy Konjugace, HGT, mobilizace jiných elementů (plazmidů, chromozomu) Konjugativní transpozony, plazmidy Přenos genů, přeskupení DNAIntegrony Inzerce, dalece , inverze DNA, změny genové expreseIS elementy, transpozony Získání přídatné genetické informaceTransformace Přeskupení DNA, inverze, duplikace, dalece DNA Integrace DNA přenesené HGT Homologií rekombinace Změna genové expreseBodové mutace A. Zisk vlastností DůsledkyGenetický element nebo mechanismus Spektrum faktorů podílejících se na změnách genomů Vnitřní přestavby replikonů navozené přítomností repeticí •Duplikace (amplifikace) •Delece •Inverze Typ přestavbyTypy repeticí • geny rRNA a tRNA • Inzerční sekvence • transpozony • krátké repetice • rhs a Chi-sekvence Homologní rekombinace Transpozice Místně-specifická rekombinace Nerovnoměrný crossing-over Mechanismus Přestavby navozené interakcí repetic (homologní rekombinace) 150-1000 bp Fylogenetický strom sestrojený z RFLP podmíněných přesuny IS1, IS2, IS3, IS4, IS30, IS150, IS186 Změny v genomu po dlouhodobém uchovávání kultur E. coli a S. typhimurium změny lokalizace IS změny velikosti genomu změny fenotypu Evoluční historie chromozomu E. coli (srovnání E. coli K12-MG1655 a kmenů se známou genealogií) 67 událostí: 37 inzercí a 30 delecí 90% ORF je pro všechny geny společné kb až Mb jedinečné DNA: * geny přenesené horizontálně plazmidy bakteriofágy transpozony genové kazety Rozdíly v genomech E. coli a S. typhimurium (divergence obou druhů před 120-150 milony let) - rozdíly způsobené rozsáhlými genomovými přestavbami: velké inverze zahrnující až 10% genomu četné oblasti jedinečné každému druhu tzv. „smyčky“ –inzerce nebo delece až 15% délky chromozomu s náhodnou distribucí - druhově-specifické geny získané horizontálním přenosem • geny lac u E. coli, geny pro invazivitu u S. typhimurium Závěry z analýz přestaveb genomu E. coli a S. typhimurium (u neselektovaných kultur) • Průměrný lokus je duplikován v každé z 1000 buněk • 10% buněk v kultuře nese duplikaci některé oblasti chromozomu • Velikost duplikací: 140 kb – 2100 kb Distribuce duplikací není náhodná Duplikace jsou ohraničeny dlouhými přímými repeticemi různého typu Duplikace funkcí adaptace na změny prostředí • zvýšení dávky genů • vytvoření redundantní DNA pro následnou genetickou divergenci paralogní geny – adaptace na nová prostředí Vytváření paralogních genů duplikací a divergencí Evoluční vztahy mezi ortologními a paralogními geny zvýšený adaptivní potenciál Vznik plazmidů během evoluce bakteriálních replikonů Původní genom tvořený několika menšími replikony Vytváření hybridů těchto replikonů vzájemnou integrací Rozklad hybridů za vzniku větších nízkokopiových stabilních replikonů (chromozomů) nesoucích většinu genů, a malých vysokokopiových replikonů (plazmidů) Opakování procesu integrace a rozkladu, optimalizace informačního obsahu replikonů Výhoda vyššího počtu kopií: 1. vyšší dávka genů, 2. vyšší šance mutací 3. přenos mezi buňkami chromozom Plazmid (vícekopiový) Horizontální přenos genů Často přenášené: operační geny (metabolismus a regulace, buněčná struktura) Zřídka přenášené: informační geny (transkripce, translace) Horizontální přenos genů je spjat s variabilními genetickými elementy profágy, plazmidy, IS-elementy, transpozony, integrony Počet horizontálně přenesených genů u vybraných druhů bakterií a archeií Druh Velikost genomu (Mbp) Počet ORF Horizontálně přenesené ORF Proteobacteria počet % Escherichia coli 4,64 4289 381 9,6 Haemophilus influenzae 1,83 96 96 6,2 Helicobacter pylori 1,67 1553 89 6,4 Rickettsia prowazekii 1,11 834 28 3,6 Gram-pozitivní bakterie Bacillus subtilis 4,21 4100 537 14,5 M ycoplasma genitalium 0,58 480 67 14,5 M ycoplasma pneumoniae 0,82 677 39 5,9 M ycobacterium tuberculosis 4,41 3918 187 5,0 Spirochaete Borrelia burgdorferi 0,91 850 12 1,56 Treponema pallidum 1,14 1031 77 8,3 Chlamydiae Chlamydia trachomatis 1,04 894 36 4,3 Deinococcus radiodurans 2,65 2580 95 3,92 Synechocystis sp. 3,57 3169 219 7,5 Thermotoga maritima 1,86 1846 198 11,63 Archaea Aeropyrium pernix 1,67 2694 370 14,0 M ethanobacterium therm. 1,75 1869 179 10,3 M ethanococcus jannaschii 1,66 1715 77 5,0 Pyrococcus abyssi 1,76 1765 124 7,35 1% bakteriálních genů bylo získáno HGT z eukaryot Horizontálně přenesené geny (HGT) u E. coli K12 MG1655 (po divergenci E. coli a S. typhimurium) Genom E. coli obsahuje relikty 755 HGT (18% genomu = 548 kb, 234 přenosových událostí) Vyšší proporce HTG v oblasti terminátoru replikace Lokalizace HTG poblíž genů pro tRNA (přenos pomocí fágů) V blízkosti HGT se nachází 68% všech inzerčních sekvencí - IS jsou přenášeny spolu HTG - IS navozují integraci přenášené DNA Cholerový toxin A, BCTXφV. cholerae Enterotoxin A, Bφ42S. aureus Shiga toxin A, BH19, 933E. coli (enterohemorhagické) Difterický toxin A, BβCorynebacterium diphtheriae Botulotoxin A, BcIClostridium botulinum Bakteriofágy Tetanový toxinpCL1Clostridium tetani Invasiny, enterotoxinpWR100, pWR501Shigella flexneri Adheziny, enterotoxiny, kataláza, hemolyzinpO157,Vir plazmidyintestinální E. coli Hemolyzin, cytotoxický nektrotizující faktorpHly, Vir plazmidyE. coli (mimo střevo) Plazmidy proteázyOblast virStreptococcus pyogenes Protein vnější membrány, přežívání v makrofágáchLokus msgA/pagCSalmonella enterica sv. Typhimurium Příjem hemuLokus chuA a shuAE. coli, Shigella dysenteriae Ostrůvky patogenity Toxin toxického šoku Exotoxin Enterotoxin TSST-1-PAI (SaPI1 aj) Exotoxinový PAI Enterotoxinový PAI Staphylococcus aureus Pilusy, regulaceVPI (vibrio path. island)Vibrio cholera O1, 0139 Adhesiny, enterotoxinyLEE (esp-LEE)Enterohemorhagické E. coli Adhesiny, hemolyziny, cytotoxinyPAIEnteropatogenní E. coli Ostrovy patogenity Faktory virulence nebo jiné funkceOznačeníGenetický element Odhadované stáří genů horizontálně přenesených do chromozomu E. coli MG1655 a jejich lokalizace v genomu IS sekvence, profágy, Rhs Stáří genů KbzískanéDNA Genomické ostrovy („fitness“ ostrovy) části genomů se znaky mobilních genetických elementů s odlišným obsahem GC, ohraničené repeticemi a geny pro mobilitu ostrovy patogenity ekologické ostrovy saprofytické ostrovy symbiosové ostrovy Charakteristické pro jednotlivé kmeny v rámci druhu Obecná struktura ostrovů patogenity Ostrov patogenity Geny pro virulenci Počet nukleotidů Inzerční sekvenceGen pro inzegrázu Přímá opakování Význačné rysy ostrovů patogenity ♦Nesou jeden nebo několik genů pro virulenci ♦Jsou přítomny jen u patogenních kmenů daného druhu ♦Představují relativně velké úseky genomu (10 – 200 kb) ♦Mají odlišný obsah GC a jiné využívání kodonů ♦Jsou často umístěny poblíž genů pro tRNA (kotvy pro inzerci cizí) ♦Jsou často spojeny s mobilními genetickými elementy. ♦Často jsou ohraničeny DR (16-130 bp) - rozpoznávací místa pro enzymy zajišťující integraci a excizi mobilních elementů (integráza nebo transponáza) ♦Jsou často nestabilní a jsou deletovány s různými frekvencemi. ♦Mají mozaikovitou strukturu – jsou složené z elementů, které se během evoluce v různé době a z různých zdrojů akumulovaly do určitých míst. Distribuce ostrovů patogenity u S. enteritica serovar Typhi Vznik genomických ostrovů u patogenních a environmentálních mikrobů Přenos fágem Model vzniku ostrovů patogenity u patogenních E. coli Kmeny E. coli adaptované na různá prostředí Enterohemolytické k. Enteropatogenní k. Uropatogenní k. Fág (shiga toxin) plazmid plazmid Původní genom plazmidtRNA, att Horizontálně získané virulenční faktory zodpovědné za patogenitu enterohemorhagického kmene E. coli O157:H7 LEE = locus for enterocyte effacement (uchycení na střevní sliznici a její léze) Plazmid O157 získaný patrně konjugací Sukcese genetických událostí vedoucích k virulenci druhů Shigella Kmeny Shigella jsou odvozeny z E. coli po získání virulenčního plazmidu a dvou chromozomových genů (SHI-1, SHI-2) a po ztrátě několika málo genů z genomu E. coli (lyzindekarboxyláza – inhibice toxinů) r. Shigella x Escherichia coli K-12 90% homologie DNA (!) Kolinearita genů Rekombinace po HGT Vliv ztráty genů ztráty genů na patogenitu enterobakterí Genomové delece („černé díry“ ) zvyšující virulenci u Shigella spp. a u enteroinvazivních kmenů E. coli (EIEC) Výsledek hybridizace sond z 14 různých genů E. coli K12 z oblasti genomu 4254428-4406306 bp k genomové DNA reprezentativních kmenů Shigella a EIEC (+ = pozitivní hybridizace, - = negativní hybridizace) ZACHYTÁVÁNÍ GENŮ INTEGRONY Integron obsahuje: 1. att místo, umožňující opakové zachycení genů nebo genových kazet 2. Gen intl kódující integrázu, rozpoznávající různá 59 bp rekombinační místa 3. Promotor umožňující expresi vloženého genu Vibrio cholerae – obsahuje superintegrony s mnoha genovými kazetami Gen (nebo genová kazeta) Genová kazeta v CTn (v plazmidu) Typy stafylokokových chromozomových kazet (SCCmec) zodpovědných za rezistenci kmenů S. aureus k meticilinu Oportunní patogen schopný vyvolat onemocnění u vnímavých pacientů Primární patogen vyvolávající onemocnění jako součást svého životního stylu EVOLUČNÍ PROCES VYŽADUJÍCÍ ZÍSKÁNÍ VIRULENČNÍCH NEBO ZTRÁTU NEVIRULENČNÍCH ZNAKŮ Komensál nevyvolává buď žádné poškození nebo jen inaparentní onemocnění; může vyvolat imunitní odpověď EVOLUČNÍ PROCES VYŽADUJÍCÍ ZÍSKÁNÍ VIRULENČNÍCH NEBO ZTRÁTU NEVIRULENČNÍCH ZNAKŮ ADAPTIVNÍ PROCES VYVOLANÝ HOSTITELEM HOSTITEL ORGANISMUS, KTERÝ JE KOLONIZOVÁN NEBO INFIKOVÁN Interakce patogen-hostitel u bakteriálních infekčních onemocnění Závěry vyvozené z analýzy minimálních genomů Každý genom je složen ze dvou typů genů - Esenciální geny zajišťující základní biologické procesy - Geny pro dosažení selektivní výhody v daném prostředí Prostředí určuje, který gen je pro daný druh základní a který postradatelný Zhruba třetina (~100) esenciálních genů nemá žádnou ze známých funkci ZÁVĚRY VYVOZENÉ Z ANALÝZY MINIMÁLNÍCH GENOMŮ • Každý genom obsahuje dva typy genů – Esenciální geny zajišťující základní biologické procesy – Geny pro dosažení selektivní výhody v daném prostředí (metabolismus – nové substráty, nové faktory virulence) • Minimální sada genů je společná pro všechny druhy (současný odhad ~ 206 kódujících genů) • Prostředí určuje, který gen je pro daný druh esenciální a který je postradatelný Srovnání informačního obsahu sekvencovaných genomů Počet informačních genů je v každém genomu zhruba stejný, i když se jejich velikosti značně liší. Počet genů ostatních funkčních kategorií je mnohem variabilnější a má tendenci se zvyšovat. Se zvětšováním velikosti genomu přibývá paralogních genů a zvětšuje se též biochemická komplexita organismu. Jedna čtvrtina ORF u každého druhu je jedinečná a nemá významnou sekvenční homologii k žádné dostupné proteinové sekvenci.