Využití rekombinantní DNA při studiu mikroorganismů doc. RNDr. Milan Bartoš, Ph.D. bartosm@vfu.cz Přírodovědecká fakulta MU, 2014 Obsah přednášky Celogenomové metody sekvenování Sekvenování H. influenzae Sekvenování S. cerevisiae Contigy, jejich zpracování Využití repetitivních sekvencí Studium genové exprese a funkce genů Analýza transkriptů Analýza regulačních míst Techniky mutageneze in vitro 10)Příklad analýzy bakteriálního genu Doporučená literatura Brown (2010): Gene Cloning & DNA Analysis. Wiley-Blackwell, Sixth edition GENE CLONING & DNA ANALYSIS Metody sekvenování Základní metody jsme probírali nedávno, tak si je pouze zopakujte Celogenomové sekvenování Využívají automatických systémů, ručně už by to nikdo nedělal Ručního sekvenování se využívá ve výzkumných laboratořích k ověřování identity klonů nebo k analýze konstruktů, sekvenují se relativně malé počty vzorků Dva přístupy k celogenomovému sekvenování Metoda tzv. „shotgun" > Genom je štěpen na nahodilé krátké fragmenty > Fragmenty jsou sekvenovány > Na fragmentech jsou identifikovány překryvy Metoda využívající „contigy" > Nejprve jsou připraveny série překrývajících se klonů = contiq > Pořadí contigů je známo > Jednotlivé contigy jsou sekvenovány Shotgun Klíčovým požadavkem jsou p ŕe kry v y mezi všemi jednotlivě získanými sekvencemi > Identifikace jednotlivých překryvů musí být přesná a bezrozporná > Každá chyba může zničit celý náročný proces > Riziko chyby roste s velikostí genomu i Metoda je vhodná pro malé bakteriální genomy Metodou shotgun byl osekvenován genom Haemophilus influenzae Co je to za bakterii ten Haemophilus influenzae? Čeleď Barvení Tvar Kyslík Patogenita Pasteurellaceae Gramnegativní Tyčinka Aerobní, fakultativně anaerobní Oportunní patogen 10 Sekvenování genomu H. influenzae První sekvenovaný buněčný genom, 1995 > Craig Venter, TIGR > Velikost kružnicového genomu je 1 830140 bp > 1 740 strukturních genů > 58 genů pro tRNA > 18 dalších genů pro RNA Postup sekvenování H. influenzae genomová DNA sonikace ^ fragmenty DNA r r zpracovaní výsledků sekvenování knihovna klonů tfragmenty 1,6-2,0 kbp elektroforéza r Sekvenování genomu H. influenzae Proč sonikace a ne restriktázy? > Po restriktázách by mohly zůstat mezery Kontrola přítomnosti mezer Příprava oligonukleotidových sond Contig I Y 1 Contig II r Contig III r t—d t—= 1 2 5 6 Contig I Contig test sonda 2 genové knihovny sonda 5 sonda 2 a 5 < pokrývají stejný fragment Sekvenování genomu H. influenzae Proč sonikace a ne restriktázy? > Po restriktázách by mohly zůstat mezery Další údaje > 19 687 klonů > 28 643 záznamů o sekvenování > 4 339 záznamů kratších 400 bp - byly odstraněny > analýza zbylých 24 304 záznamů trvala počítači 30 hodin > získáno bylo 140 specifických contigů Metoda shotgun není vhodná pro sekvenování repetitivních sekvencí. Ty se ale u bakterií příliš často nevyskytují. Contigy Tvorba série překrývajících se klonů DNA fragmentů > Je pracnější, trvá déle a stojí víc peněz Metoda vhodná i pro dlouhé sekvence s repeticemi Sekvenování chromozómu III S. cerevisiae První eukaryotický chromozóm, 1992 Contigy 29 klonů fragmentů o průměrné délce 10,8 kbp v kosmidech Jak na contigy? 1) Procházení chromozómu (chromosome walking 2) Fingerprinting klonů (clone fingerprinting) 3) PCR repetitive DNA 4) Analýza výskytu míst označené sekvence (sequence tagged site, STS) 20 Procházení chromozómu 1) Z genomové knihovny je vybrán jeden klon 2) Klon je naznačen a použit jako hybridizační sonda dalších klonů v knihovně 3) Klony, které poskytují signál se překrývají s použitou sondou 4) Nové klony jsou naznačeny a použity k dalšímu kolu hybridizace ... Příklad procházení chromozómu Testování knihovny klonem A1 Testování knihovny klonem 14 ABCDEFGHIJ A1 F2 Fingerprinting klonů 1) Nezačíná se z jednoho místa 2) Vyhledávají se dvojice překrývajících klonů Sestavte kontig klonů z následujících překryvů ^H-, HÍHtH H2 PCR repetitivní DNA PCR z roztroušených repetitivních elementů (interspersed repeat element PCR, IRE-PCR) dvě identické repetice ■ r pripojení primem DNA PCR amplikon překrývající oblasti mezi sousedícími repeticemi PCR repetitivní DNA - vyhodnocení Klon č. M 1 2 3 — — společný pruh - _ — klony č. 2 a 3 se pravděpodobně překrývají Mapování génom u mykobakterií s využitím inzertních sekvencí Inzerční sekvence jsou transponovatelné Zopakujme si - IS901 RFLP profily pro studium epizootologie MAA kbp N A B C D E F G \ J K L M 0 P Q] 10.0-► ►— 8.0-► 7.0-► ►— 6.0-► — ► 5.0 -► — — — — — — — —► ► — —--— — — 4.0-► 3.0-► ► — > ► > &E*E §E*= iá 2.0-► _ _ _ _ _ _ _ ► ►— ►— — > ► ► — — — ► ► ► ►— — ► ► ► —► ► — = = = = = = Jaké otázky jsme si položili Do jakých míst se začleňuje \S901? > Identifikovali jsme celkem 16 lokusů Kde jsou fragmenty těchto lokusů umístěny na RFLP mapě po štěpení Pvi/ll? > Mapovali jsme u 25 různých izolátů MAA lokusů Souvisí nějak inzerce \S901 s fyziologickými vlastnostmi příslušných kmenů MAA? > Inzerce \S901 do genu katE - kataláza > Rezistence k izonikotinhydrazidu 30 Jak jsme mapovali pozice IS901 ? > Metoda tzv. inverzní PCR > Metoda tzv. anchor PCR - velmi podobná PCR repetitivní DNA Průběh inverzní PCR pro IS901 \S901 \S901 \S901 | reštrikční štěpení 1 ligace Průběh inverzní PCR pro IS901 IS901 X ligace sekvenování PCR produktů Anchor PCR Anchor primer \S901 PCR Nahodilý primer sekvenování Výsledná fyzikální mapa pozic IS901 kbp N A B C D E F G H I JKLMOPQRSTUVWXY on CC □ □ DCZ3CZ3C3 CC 0044 0.Q — CC 7.0 — — — — 6.0 — CD Rv2750 b b b b b b b := :=: b b b b 50 — B B S— B B B B B B CC Rv3891c =3 s3 e= gsi c=3 rz^ := es H cs si c= e=j si c=3 si s=] =: =: c= 4.0 -3.0 - 2.0 - 1.0 - cc — _ B — CC — — — — qbbbbbbb ssssssst^js^QSQs CC Rv3167 — — b CC Rv0774c 1=1 b B3 b! — [=: S=) Hl H H H H DB BB sbd OB TC H H (K (K i—i |oc14 B B B B B B B B B B B B B B B B B B B B B CC kalE dnaJ CC FR300 B B B — — — B CC *ptt3 CC CC CC CC CC CC CC _CC CC CC CC CC CC_a_CC CC CC_CC_ 09 08 08 08 08 Analýza výskytu míst označené sekvence sequence tagged site, STS > vyhledávání párů klonů, které obsahují sekvenci DNA, která se v daném genomu vyskytuje jen 1x > takové klony se zákonitě musí překrývat > často jde o gen, jehož sekvence už je známa > lze navrhnout specifické primery a získat specifickou sondu > sondou „vyšetříme" genomovou knihovnu Jak to vypadá při STS? klony F2 a C3 se musí překrývat Studium genové exprese a funkce genů Pro lepší pochopení si zopakujte fáze genové exprese ze základní přednášky z molekulární biologie Geny jednoduché a složené Gen jednoduchý - prokaryota kódující sekvence transkripce ^ mRNA Gen složený - eukaryota intron AílU transkripce I T primární transkript hnRNA sestřih ^ mRNA 40 Vedle transkriptů strukturních genů existují také transkripty > Genů pro rRNA > Genů pro tRNA > Genů regulačních Detekce transkriptů - Northern blotting Umožňuje stanovit přítomnost a délku transkriptů denaturační elektroforéza M 1 2 3 71 rRNA M 1 2 3 hybridizační signál Dejte si pozor na to, aby gel byl opravdu denaturující, jinak se transkripty pohybují v nativním a jinak v denaturovanom stavu A když už máme konkrétní transkript? > Převést zpětnou transkripcí do cDNA > Sekvenovat 1) Zopakujte si metody zpětné transkripce 2) Kterou z metod nemůžeme použít a proč? Nelze použít nahodilé hexanukleotidy, protože sekvence transkriptu by nebyla celá Hybridizace mezi genem a RNA Stanovení exonů a intronů Hybridy DNA-mRNA introny Opracování S1 nukleázou Degradace alkáliemi Mapování S1 nukleázou Určení počátku a konce transkriptů fragment Sau3A, 400bp gen klonování do M13 a příprava ssDNA Sau3A Sau3A Mapovaní S1 nukleázou připojení mRNA S1 nukleáza hydroxid / počátek transkripce, 150 bp od začátku translace stanovení velikosti elektroforézou, 150 bp DNA Mapování S1 nukleázou Stejnou strategii lze použít k > Mapování 5-konců > Mapování 3-konců > Mapování rozhraní intron-exon Prodloužení primem Slouží jen k mapování 5'- konců transkriptů > Musíme znát alespoň část sekvence transkriptů 5' i- 1 RNA transkript ^ připojení primem 3' extenze zpětnou transkriptázou 3' i 5 denaturace, stanovení délky cDNA 239 Prodloužení primem Porovnání délky výsledné cDNA s kódující částí DNA získáme informace o poloze transkriptu > 3'- konec nově syntetizované cDNA odpovídá 5'- konci transkriptu (počátku transkripce) 5' 3' DNA cDNA počátek transkripce 239 pozice 5-konce primeru 50 Metoda RT-PCR > Standardní procedura RT-PCR kopíruje vnitřní oblast molekuly RNA > Neposkytuje informace o koncích molekuly RNA Metoda RT-PCR > Standardní procedura RT-PCR kopíruje vnitřní oblast molekuly RNA > Neposkytuje informace o koncích molekuly RNA 5' reverse primer 3' Metoda RT-PCR > Standardní procedura RT-PCR kopíruje vnitřní oblast molekuly RNA > Neposkytuje informace o koncích molekuly RNA hexanukleotidy RACE rapid amplification of cDNA ends > umožňuje identifikovat 3'- i 5'- konce RNA molekul > má mnoho variant 5' 5-RACE 3' - RNA ^ připojení primem 3' ,extenze zpětnou transkriptázou 3' 5 denaturace ttttt přidání A ke 3-konci ^—^— terminálni transferázou 3' 5' připojení primem s TTTTT Pokračuje standardní PCR syntéza druhého řetězce Taq polymerázou RACE rapid amplification of cDNA ends > umožňuje identifikovat 3'- i 5'- konce RNA molekul > má mnoho variant Sekvenováním produktu PCR získáme znalost přesného počátku transkripce Studium regulace genové exprese Obecné schéma regulačních míst kontrolní sekvence promotor kontrolní sekvence gen Na regulační místa se váží regulační proteiny Hledání vazebných míst pro proteiny > Gelová retardace komplexů DNA-protein > Footprinting pomocí DNázy I > Test modifikované interference > Deleční analýza Gelová retardace komplexů DNA protein Protein vázaný na DNA fragment snižuje pohyblivost fragmentu na gelové elektroforéze 1 - pouze DNA fragment 2 - DNA fragment s navázaným proteinem 60 Provedení gelové retardace i—n- R R R H t t R R R i štěpení restriktázou R I-1 I 1 H I i smíchání s regulačním proteinem —i I- \ stanovení elektroforetické pohyblivosti ... nasleduje > Příslušný fragment DNA je lokalizován na reštrikční mapě > Je stanovena nukleotidová sekvence Protože jsou vazebná místa většinou krátká (kolem 10 bp), není tento způsob mapování dost přesný Footprinting pomocí DNázy I > Umožňuje stanovit umístění řídící oblasti v rámci restrikčního fragmentu identifikovaného gelovou retardací > Využívá skutečnosti, že je sekvence DNA vázající se k proteinu chráněna před účinkem DNázy I Provedení footprintingu I fragmenty DNA koncové značení + regulační protein štěpí se kterákoli vazba, která není chráněna proteinem Provedení footprintingu II Odstranění proteinu, gelová elektroforéza (PAGE) a detekce značených fragmentů délky fragmentů 1 2 místo, kam se váže protein 1 = kontrola, žádný navázaný protein 2 = testovaná DNA + navázaný protein T footprint Test modifikované interference Vazebný protein chrání větší úsek DNA než jenom přesně ty nukleotidy, které jsou regulační oblastí Test modifikované interference i koncově značené reštrikční fragmenty ■_0 H-• modifikace jednoho z mf _I_mm m m m O 1 I nukleotidu I smíchání s regulačním proteinem i—o na modifikovaný nukleotid se neváže Test modifikované interference II Nasleduje delení fragmentu na gelové elektroforéze 1 2 purifikace DNA zpomalené -> _| _ komplexy — — protein-DNA DNA bez . proteinu / PlPendm (rychlejší) _ Určení velikosti na PAGE A tím zjistím, kde přesně v regulační oblasti leží jeden z nukleotidů A to všechno zopakuješ pro každý ze 4 nukleotidů zvlášť a výsledné regulační místo poskládáš Jak vypadá regulační místo tryptofanového qperonu Klebsiella aerogenes jestliže jste na PAGE získali fragmenty o následujících velikostech ? Blokace A = 105,106,111,113,116 a 117 bp Blokace G = 107,115 a 118 bp Blokace C = 110 a 112 bp Blokace T = 108,109 a 114 bp AAGTTCACATGAAG Deleční analýza > Umožňuje lokalizovat kontrolní elementy proti směru transkripce genu > Dokáže určit i funkci příslušné sekvence zesilovač uspavač promotor en delece zesilovače F-=1 f==l gen t-J s- snížena exprese Deleční analýza > Umožňuje lokalizovat kontrolní elementy proti směru transkripce genu > Dokáže určit i funkci příslušné sekvence zesilovač uspavač promotor en delece uspavače gen ^-] L zvýšena exprese Reportérové geny Jejich produkty poskytují zřetelný, snadno monitorovatelný signál zesilovač uspavač promotor zesilovač uspavač promotor Příklady reportérových genů lacZ = p-ga laktóz id áza cat = chloramfenikolacetyltransferáza uidA = p - glukuronidáza GFP = zeleně fluoreskující protein lux = luciferáza Studium produktů translace Provádí se v bezbuněčných extraktech - platí pro analýzu rostlinných a živočišných genů Zopakujte si přednášky z genetiky bakterií Sekvenci genu můžeme změnit in vitro A pak se můžeme zamyslet nad jeho funkcí Existuje celá řada metod mutageneze in vitro > Odstranění restrikčního fragmentu > Odstranění několika nukleotidů Bal31 > Vložení oligonukleotidu > Zavedení bodové mutace do klonovaného genu > ... Smysl cílené mutageneze Změna ve struktuře proteinu > zavedení nových disulfidových můstků > zvýšení počtu vodíkových vazeb > změna terciární struktury > změna stability enzymu > změna dalších vlastností - zvýšení katalytické aktivity a afinity k substrátu - modifikace substrátové specificity - rozšíření pH-optima - zvýšení odolnosti proti oxidačním činidlům a těžkým kovům - zvýšení rezistence vůči proteázám - stabilita v nevodném prostředí Průběh cílené mutageneze 1) Vložení genu do jednořetězcového vektoru, např. M13 2) Vlastní cílená mutageneze 3) Vrácení genu do expresního vektoru Schéma cílené mutageneze téměř komplementární syntetický oligonukleotid ssDNA genu daného enzymu fágový vektor M13 buňky obsahující zmutovanou DNA hybridizace a komplementární doplnění celé molekuly DNA-polymeráza DNA-ligáza transformace do buněk E. coli buňky obsahující původní DNA Schéma cílené mutageneze téměř komplementární syntetický oligonukleotid ssDNA genu daného enzymu fágový vektor M13 buňky obsahující zmutovanou DNA hybridizace a komplementární doplnění celé molekuly DNA-polymeráza DNA-ligáza transformace do buněk E. coli buňky obsahující původní DNA 80 Příklad analýzy bakteriálního genu Trp Operon Klebsiella aerogenes Blumenberg Miroslav a Yanofski Charles (1982): Regulatory Region of the Klebsiella aerogenes Tryptophan Operon, Journal of Bacteriology 152 (1), 49-56. 1) Reštrikční štěpení genomové DNA 2) Klonování fragmentu 3) Sekvenování regulační oblasti 4) Porovnání se Salmonella typhimurium 5) Odvození vlastností transkriptů 6) Konfirmace transkripcí in vitro Zopakujme si regulaci tryptofa nového operonu > Pozitivní regulace > Atenuace Získání fragmentů 1) Restriktázy HincňU a BamH\ 2) Ligace do vektoru pBR322 3) Transformace E. coli trpE a vyhledání prototrofů 4) V pKA1 a pKA2 je celý trp A 5) Uvnitř trpA je BamH\ místo Analýza fragmentů Sekvenování dle Maxam a Gilbert Porovnání sekvence s S. typhimurium Identifikace promotoru, operátoru a vedoucí sekvence s atenuátorem K.AEROGCNES TCTCCAAACAA6G€TT6ACTTTATTCCATTGAACTACTT^CTACfACSC A T S T A C A S.TYPMXMURIUH 10 20 ntT ALA MET HIS PNE ILE THR LEU NIS AASTTCACATGAAS GGGTATCACC ATS AAA ATf CAC TTT ATC ACT CT6 CAC A Mr AA tg gca gcg aca t t 6 a t a MET ALA ALA THR PHE ALA PHE SER A6C 6 T GLY TRP TGG TRP TGG ARG C6C THR ACC T SER TCC ENO T6A 00 CGACGGGCG TA6 90 100 110 ItO 130 140 H gcgt6atcgcgttttgcattcagcatacagatacccggcccgcc AATGAGCGGGCTTTTTATT T AT6AA ACC CTA CAGC a | TGT A T TRPE ISO 1*0 170 MET gin THR SER LYS PRO GCACAAAAATAATACGAACA6GCGACAACAATA ATS CAA ACA TCC AAA ccg ■ u cc PRO Transkripce in vitro 1) Produkty transkripce analyzovány chromatograficky (iontoměničová celulóza) 2) Porovnání transkriptů značených jednotlivými dNTP po štěpení RNázou T1 (štěpí ssRNA v GTP) B 9 12 14 10 15 16 17. 20 Dva oligonukleotidy na 3 -konci Sekvenování vedoucí sekvence leader peptide sequences K.A. I.C. 8.D. 5.T. c.r. 5.M. leader SEQUENCES MET US MET MIS PMI ILE TUB LEU NIS SIR TRP TRP AR6 TMR SER END MET LTS ALA ile phe VAL LEU LTS 6LT TRP TRP AR6 THR SER END MET LTS AlA ue PHE VAL LEU ITS GLT TRP TRP ARO TMR SER END MET ALA ALA THR PHE AlA LEU NIS GIT TRP TRP ARO THR SER END MET LTS ALA TMR PHE VAL LEU HIS 6LT TRP TRP AR6 THR SER END MET ASN THR TYP ILE 5eb LEU NIS GLT TRP TRP arg THR SER LEU LEU arc AU VAL END A 5 AAGUUCACVuGAAG bCCUAUdfcCC I aaguucac suaaaaj S6CUAUC sacaaugaaa aaguucac suaaaai ÍG6UALX ; ac a aug aaa k a guuc acja ug a a g • sgguauc JAAAAUG6CA AUAG4 ac-&uauc :gagauga aa icg«ccucaxg«alx;aga6uuaacaaa(4g^cjÍ^aaaijgaac AAAAUGCACUUUAUCACUCUCCACAGCUGGUSCGC accuccuga GCaauuuucguaclcaaagguuggucECCCACUUCCU64 6CAAUUUUCGUACU6AAAGCUUGGUC SC6CACUUCCUGA &cgac alajugcalajacacgguugguc SCCC ACUUCCU6A gcaacauuucuucu&cacgcuucguc&C&cacuuccuga acauacauuuclkuucacgguuggu^CfeUACCUCCCUC cga; AA aa uag uul uuq sgcgugaucgcg agugua uucac a6ugua uucac egugua ugaac AGUGUC uuac6 6 _5 UUUUGCAUUCA6CAUA CABAUA CAUGCGUAAAGCAAU c«ÍAUA CAUGCGUAAACCAAU CAJEAUA CCC)»pCCCCCC AGCUGUAALKAGCCAAAC UCCGCAAUAUGCAAC Ct 5aua CCC ! JCCCGC S€l«UA>LX:GC6CAUAGCUaJCAUCUGACAAUGCAtiAiaa£Cl 4_B mkCcTRTB aauoUKKKUWJUAUI CCC i KCCGCCUAAuqAGCGGGf juuuuuu Vgcgggc juuuulaaj baua ccc^cc6cc|jguuavgc6gccuwuuuuli i JCCCGCQAA ALKlAGC ŽCCCGCJCCUGAIJGC gcgc JUUUUUUl MM mmM ( 1441 (141 i (141 I (142) (132) (174) SEQUENCES Of TRPC RXDOSOME binding SITE REGIONS K.A. gc ac a a a a auaau a c g a ac aggc g ag a ac a a u a aug E.C. 6AACAAAAUU ACA6AAUA ACA AUG S.D. GAACAAAAUU AGAGAAUAACAAUG S.T. gaacaaaauaa U6A6AAUaACC AUG CP. GAACAAAAUU AAUGAGAAUAAC6AUG S.M. 6GACA6AAUUC ACU66AACCACCGAU6AUG Predikce struktury atenuátoru ... a porovnání celé regulační oblasti s jinými střevními bakteriemi Shrnutí Celogenomové metody sekvenování Sekvenování H. influenzae Sekvenování S. cerevisiae Contigy, jejich zpracování Využití repetitivních sekvencí Studium genové exprese a funkce genů Analýza transkriptů Analýza regulačních míst Techniky mutageneze in vitro 10)Příklad analýzy bakteriálního genu