1 Editace genomů Genome editing, or genome editing with engineered nucleases (GEEN) Postupy genového inženýrství, při nichž se do vybraného místa v cílové DNA pomocí uměle připravených nukleáz (tzv. molekulárních nůžek) vnáší inzerce, delece a nebo se stávající sekvence nahrazuje za jiné (náhrada alel). Tyto nukleázy vytvářejí na určených místech genomu dvouřetězcové zlomy (DSBs: double-stranded breaks), čímž vyvolávají přirozené endogenní buněčné procesy vedoucí k reparaci zlomů: a) Homologní rekombinací (HR) HDR = homology directed recombination (rekombinace řízená homologií) b) Nehomologní spojování volných konců (NHEJ: nonhomologous end-joining) 2 - editace probíhá s přesností až 1 nt - používají se uměle připravené nukleázy – modifikace přirozeně se vyskytujících - podstatou je tvorba zlomu v řetězci DNA (1 ale i 2 zlomy) - v místě štěpení - vznik mutace - vyštěpení celého úseku DNA (genu) - náhrada úseku DNA - lze připravit mutace jakéhokoli typu (včetně náhrady alel – „gene replacement“) - důležitá je funkce reparačních systémů buněk – endogenní procesy - „nezávisle“ na vnesené DNA/RNA 3 Historické etapy v CRISPR biologii a editování genomů 4 - poměrně vysoká frekvence HDR u kvasinek - přenos His3 genu (do His3- kmene) - pozitivní selekce na His - využití neg. selekčního markeru (Ura) - vně sekvence - vytvořeny buňky His3+ a URA- 5 (RGENs) = RNA-guided engineered nucleases - programované nukleázy (jejich cíl je řízen molekulou RNA) Procesy probíhající po vytvoření DSB umělými nukleázami - snaha o vývoj systému pro sekvenčně specifickou tvorbu dsDNA zlomů Lidský genom – 3,2 Gbp – cílem musí být jedinečné sekvence (specificita) - sekvence delší než 20 bp 7 klasická NHEJ - rychlý proces (10-30 minut) - výsledkem jsou malé inzerce/delece - existují i alternativní NHEJ př. microhomology-mediated end joining (MMEJ) - rozsáhlé inzerce, delece, fůze, … 8 HDR - složitější (pomalejší) proces - zapojeno více proteinů - nutná přítomnost homologní sekvence - výsledkem přesně opravená DNA 9 Procesy probíhající po vytvoření DSB umělými nukleázami 10 Overview of possible genome editing outcomes using site-specific nucleases. Nucleaseinduced DNA double-strand breaks (DSBs) can be repaired by homology-directed repair (HDR) or error-prone nonhomologous end joining (NHEJ). (A) In the presence of donor plasmid with extended homology arms, HDR can lead to the introduction of single or multiple transgenes to correct or replace existing genes. (B) In the absence of donor plasmid, NHEJ-mediated repair yields small insertion or deletion mutations at the target that cause gene disruption. In the presence of double-stranded oligonucleotides or in vivo linearized donor plasmid, DNA fragments up to 14 kb have been inserted via NHEJmediated ligation. Simultaneous induction of two DSBs can lead to deletions, inversions and translocations of the intervening segment. 11 Typy nukleáz používané pro editaci genomů Rozpoznání sekvence Interakce protein x DNA Rozpoznání sekvence Interakce protein x DNA Rozpoznání sekvence Interakce protein x DNA 12 Meganukleázy se vyskytují u různých druhů mikroorganismů, mají velmi dlouhé rozpoznávací sekvence (>14bp vs. RE 4-6 bp) a jsou tak přirozeně sekvenčně velmi specifické. Nevýhodou je, že je jich známo relativně málo, a tudíž počet cílových sekvencí je omezen. Mutagenezí byly uměle připraveny varianty meganukleáz, které rozpoznávají další jedinečné sekvence. Byly připraveny rovněž hybridní varianty meganukleáz fúzí dvou domén s odlišnými cílovými místy. Byl použit též postup záměn aminokyselin v doménách interagujících s DNA a docíleno vysoké specifity rozpoznání (method named rationally designed meganuclease (US Patent 8,021,867 B2). Meganukleázy jsou méně toxické pro buňky než ZNF díky tomu, že mají vyšší specificitu/stringenci rozpoznání cílových sekvencí DNA. Jejich navrhování je však časově náročné. MEGANUKLEÁZY 13 i meganukleázy nebakteriálního původu - LAGLIDADG family of homing endonucleases (kódovány introny nebo inteiny), často v mitochondriích a chloroplastech I-SceI 18-bp z mitochondrií Saccharomyces cerevisiae I-CreI chloroplasty Chlamydomonas reinhardtii I-DmoI archea: Desulfurococcus mobilis. oproti RE: - delší rozpoznávací sekvence (nemusí být palindrom, často asymetrické) - vyšší tolerance k malým substitucím v rozpoznávací sekvenci - obvykle vyžadují součinnost dalších proteinů 14 Enzym FokI přirozeně se vyskytující u Flavobacterium okeanokoites je restrikční endonukleáza typu IIS (štěpí blízko rozpoznávací sekvence). Je tvořena N-terminální vazebnou doménou a nespecificky štěpící doménou na C-konci. Výhody FokI pro její využití v GI: - Rozpoznávaná sekvence je oddělena od sekvence, která je štěpena – to umožňuje izolovat doménu enzymu, která štěpí sekvenčně nespecificky. Tato doména pak může být spojena s doménou zodpovědnou za rozpoznání cílové sekvence. - FokI vyžaduje pro svou nukleázovou činnost dimerizaci – zvýší se tím specifita rozpoznání cílového místa. - Byly připraveny modifikované FokI, které fungují jen jako heterodimery, což zvyšuje specificitu rozpoznání cílových sekvencí a eliminuje možnost vytváření nespecifického štěpení v případě homodimerů. - využívá se pro konstrukci ZFN a TALEN nukleáz NUKLEÁZA FokI 15 Typy nukleáz používané pro editaci genomů 16 Struktura proteinu obsahujícího zinkové prsty (zinc finger) Každý zinkový prst sestává asi ze 30 AA v konformaci . Každý prst kontaktuje 3 nebo 4 bp ve velkém žlábku DNA. Dimer Zinc-finger nukleázy (ZFN) navázaný na DNA. Cílová místa pro vazbu ZFN sestávají ze dvou vazebných míst pro zinkové prsty, která jsou oddělena 5-7 bp dlouhou sekvencí, která je štěpena štěpící doménou FokI. Protein TALE v komplexu s cílovou DNA. Jednotlivé repetice proteinu TALE obsahují 33- 35 AA, které rozpoznávají jednotlivé páry bází prostřednictvím dvou hypervariabilních zbytků (repeat-variable diresidues – RVDs) Dimer TALEN navázaný na DNA. Cílová místa pro TALEN jsou tvořena dvěma vazebnými oblastmi pro TALE oddělenými mezerníkovou sekvencí různé délky (12-20 bp). TALE lze upravit tak, aby rozpoznávala jedinečné sekvence vlevo a vpravo. 17 Editace genomů pomocí ZFN - produkovány již otestované firmami: Sigma-Aldrich Sangamo BioSciences - transfekovány obvykle v podobě RNA (či DNA na vektoru) 18 (a) Schematic diagram of a ZFN heterodimer bound to the mutated mtDNA target. Each of the monomeric ZFN consists of the FokI nuclease domain (FokI CD) linked to a zinc-finger peptide. One of the ZFNs (NARPd, red) was designed to bind to the mutated mtDNA site, whereas its companion ZFN binds a native sequence on the opposite DNA strand (COMPa, blue)19. (b) Schematic structure of mtZFN used in the cleavage assay in c. 'mitochondrial targeting sequence (MTS) F' denotes the mitochondrial targeting sequence of F1β-subunit of the human mitochondrial ATP synthase (see ANTICIPATED RESULTS for details). (c) In vitro assay testing the specificity of the F–NARPd–Fok–NES and F–COMPa–Fok–NES constructs (see ANTICIPATED RESULTS for details). 19 Gram negativní bakterie r. Xanthomonas infikují řadu rostlinných druhů, u nichž mohou způsobovat onemocnění. Injikují svými sekrečními systémy do rostlinných buněk řadu efektorových proteinů včetně TAL efektorů. TAL effectors (Transcription Activator-like effectors) mají několik motivů včetně NLS, proto mohou vstupovat do jádra, kde se vážou na promotorové sekvence a aktivují transkripci rostlinných genů, které napomáhají bakteriální infekci (snížení hladiny Cu, zvýšení hladiny glukózy, …) TAL obsahují v centrální části opakující se sekvence aminokyselin, které jsou dlouhé obvykle 34 AA. Typická repetice: LTPEQVVAIASHDGGKQALETVQRLLPVLCQAHG, avšak v pozicích 12 a 13 se vyskytují různé aminokyseliny (místo označované jako repeat variable diresidue n. RVD) – tyto klíčové pro specificitu vazby na sekvenci DNA Byly navrženy TALE (Engineered TAL effectors) schopné se vázat na jakékoliv sekvence DNA díky záměnám aminokyselin.Takové umělé TALE lze využít pro aktivaci nebo represi endogenů u rostlin i živočichů. Engineered TAL effectors lze fúzovat se štěpícími doménami nukleáz (FokI) a vytvářet tak TAL Effector Nucleases (TALENs). TAL effectory (Transcription Activator-like effectors) 20 Struktura TALEN 21 Struktura proteinu obsahujícího zinkové prsty (zinc finger) Každý zinkový prst sestává asi ze 30 AA v konformaci . Každý prst kontaktuje 3 nebo 4 bp ve velkém žlábku DNA. Dimer Zinc-finger nukleázy (ZNF) navázaný na DNA. Cílová místa pro vazbu ZNF sestávají ze dvou vazebných míst pro zinkové prsty, která jsou oddělena 5-7 bp dlouhou sekvencí, která je rozpoznávána štěpící doménou FokI. Protein TALE v komplexu s cílovou DNA. Jednotlivé repetice proteinu TALE obsahují 33- 35 AA, které rozpoznávají jednotlivé páry bází prostřednictvím dvou hypervariabilních zbytků aa (repeat-variable diresidues – RVDs) Dimer TALEN navázaný na DNA. Cílová místa pro TALEN jsou tvořena dvěma vazebnými oblastmi pro TALE oddělenými mezerníkovou sekvencí různé délky (12-20 bp). TALE lze upravit tak, aby rozpoznával jedinečné sekvence vlevo a vpravo. 22 Model for DNA-target specificity of TAL effectors. (A) TAL effectors contain central tandem repeats, NLSs, and an AD. Shown is the amino acid sequence of the first repeat of AvrBs3. Hypervariable amino acids 12 and 13 are shaded in gray. (B) Hypervariable amino acids at position 12 and 13 of the 17.5 AvrBs3 repeats are aligned to the UPA box consensus (14). (C) Repeats of TAL effectors and predicted target sequences in promoters of induced genes were aligned manually. Nucleotides in the upper DNA strand that correspond to the hypervariable amino acids in each repeat were counted on the basis of the following combinations of eight effectors and 23 DNA binding code for TALENs 24 Schéma strategie pro přípravu genetických konstruktů exprimujících chimerické proteiny TALEN – postupná ligace klonovaných monomerů výsledkem je „skládačka“ cílená proti libovolné sekvenci DNA - každý si může sám vytvořit (http://www.addgene.org/TALEN/) K dispozici jsou knihovny monomerů, dimerů, trimerů a tetramerů RE1 RE2 … 25 Umělé nukleázy - odvozené od aktivátoru transkripce + nukleáz - vazba na specifické místo v genomu - do buněk se obvykle dopravují na expresních vektorech - lze je využít pro tvorbu – bodových mutací … - delecí - inzercí - inverzí - duplikací - translokací … ale také pro značení mRNA - podstatou je tvorba dsDNA zlomu a jeho oprava - sekvenční specifita je dána DNA-protein interakcí 26 Systém CRISPR/Cas - přirozený obraný systém bakterií a archeí proti cizorodé DNA 27 Fungování CRISPR-Cas9 komplexu systém pravidelně uspořádaných mezerníků mezi repeticemi CRISPR lokusu cizorodé DNA rozpoznány proteiny Cas (CRISPR associated proteins) a začleněny do CRISPR lokusu lokus má až několik stovek mezerníků, nový mezerník, který je převzat z infikující molekuly, je začleněn jako první (fáze akvizice/adaptace) následně je lokus přepisován za vzniku CRISPRové RNA (pre-crRNA), ta je dále upravována do krátkých molekul CRISPRové RNA (crRNA) Asociace crRNA s transaktivační (transaktivující) tracrRNA a následně s některým z CAS proteinů tento komplex rozpozná a štěpí cizorodou DNA 28 3 hlavní složky systému – crRNA, tracrRNA, Cas proteiny (1-2) - Úseky cizorodé DNA jsou začleněny do bakteriálního genomu do lokusů CRISPR - Lokusy CRISPR jsou přepsány a upraveny do crRNA (crRNA biogenese) - Během interference vytváří endonukleáza Cas9 komplex s crRNA a tracrRNA, který pak štěpí cizorodou DNA obsahující sekvenci 20-ti nukleotidů komplementárních k crRNA poblíž sekvence PAM. 29 30 Spojení linkerem sgRNA vytvořená fúzí crRNA a tracrRNA 31 Struktura chimerické sgRNA a kompexu sgRNA s Cas9 pro vytváření DSB v cílových místech. sgRNA je vytvořena spojením crRNA a tracrRNA. NGG 32 PAM sekvence – protospacer adjacent motif - sekvence v těsném sousedství s cílovou DNA sekvencí - nutná pro účinné štěpení Cas9 nukleázou - původní systém „NGG“ (rozpoznán Cas9 ze Streptococcus pyogenes) - dle systému cílová sekvence musí být ve formátu N20-GG - systémy jiných bakterií nebo upravené systémy – NAG, YG, TTTN, YTN, … 33 34 35 Srovnání struktury crRNA:tracrRNA a sgRNA - systém lze exprimovat z jediného vektoru 36 Příprava konstruktu exprimujícího CRISPR/Cas element hCas9 = sekvence proteinu Cas9 optimalizovaná pro expresi v eukaryotických buňkách. sgRNA = chimerická RNA obsahující úseky crRNA a tracrRNA, která je nezbytná pro dosažení aktivity. PAM není součástí klonované sekvence - pro design lze využít dostupný software - http://crispor.tefor.net/ - http://crispr.mit.edu/ https://crispr.cos.uni-heidelberg.de/ Sekvence sgRNA je navržena tak, aby byla komplementární k cílové genomové sekvenci 37 38 39 40 Možnosti editace genomů pomocí systému CRISPR/Cas9 TSS = transcription start site EGFP = fluorescenční proteiny dCas9 – deficientní na nukleázovou aktivitu Metylázy, acetylázy … 41 dCas9 + aktivační/represorová doména – regulace transkripce - vazba dCas9 na DNA je reverzibilní – tedy i ta regulace je reverzibilní (dočasná) dCas9 + epigenetický regulátor – regulace transkripce - přestože i zde vazba reverzibilní – epigenetické modifikace se mohou přenášet do dceřiných buněk 42 dCas9 + fluorescenční značka - i multicolor formát – více okusů najednou, chromosome painting … - CRISPRainbow Působení modifikovaného systému CRISPR/Cas9 Specificita – dána pouze 20 nt sgRNA - úplná podobnost na 3´konci (seed) a částečná na 5´konci (distal) riziko vzniku off-target štěpení 50 - 1500x výšší specifita (n do 20 bp) ještě vyšší specifita 44 A. Wt Cas9 nukleáza štěpí specificky dsDNA, vytváří DSB a tím navozuje reparaci. Za nepřítomnosti homologní sekvence může dojít k nehomolognímu spojování konců (NHEJ) a vzniku ins/del mutací, přerušujících zasažený gen. Za přítomnosti homologní sekvence může dojít k reparaci s využitím této sekvence a jejími vložení do místa zlomu. B. Mutantní Cas9 nukleáza vytváří místně specifické jednořetězcové zlomy. Dvojice takových sgRNA může vést k tvorbě ds DNA zlomů, které mohou být reparovány s využitím homologní rekombinace či NHEJ (jednořetězcové zlomy zvyšují účinnost HDR). Tento sytém zvyšuje specifitu tvorby ds zlomů. C. Mutantní Cas 9 nukleáza může být připojena k různým efektorovým doménám, které umisťuje na specifické sekvence. Mohou to být TF, represory, fluorescenční značky aj. Analogie ZFN a TALEN 45 CRISPR DNA base editing Fůze nikázy s cytidin deaminázou – konverze C na U blízko PAM - následná konverze U na T díky BER - tvorba substitučních mutací 46 CRISPR RNA base editing CRISPR systémy Cas13a/C2c2 and Cas13b – substrátem je RNA - fůze nukleázy defektního systému s adenosin deaminázou - vzniká inosin (funkčně odpovídá G) – tedy z AT vzniká GC - tvorba substitučních mutací na úrovni RNA 47 Genome wide screen - tvorba rozsáhlé populace cílených mutací (3-6 gRNA na 1 gen) - následně analýza fenotypu - identifikace genů zodpovědných za určitý fenotyp 48 Izolace úseků genomu pomoci dCas9 enChIP (engineered DNA-binding molecule-mediated ChIP) - Hmotnostní spektrometrie, NGS, … 49 Značení endogenních genů - přidání značky (tag) pomocí HDR 50 51 Další CRISPR systémy Cpf1 - má RuvC a nikoli HNH - jediná RNA (vs. crRNA + tracrRNA) - lepivé konce (vs. tupé konce) - PAM (TTN) – AT bohaté oblasti (vs. NGG) - low off-targeting frequency Lepivé konce – možné využití pro přímý přenos genů (obdoba RE klonování) 52 1. Selection of a target nucleotide sequence in the genome; 2. Generation of a nuclease construct directed at the selected target; 3. Delivery of this construct to the cell nucleus; and 4. Analysis of produced mutations. Obecná strategie genomového inženýrování 53 Current and future delivery systems for engineered nucleases: ZFN, TALEN and RGEN 54 55 56 Příklady typů buněk a organismů, které byly geneticky modifikovány pomocí Cas9 57 58 Izolace T lymfocytů z pacientů s různými typy nádorových onemocnění Editace genomu těchto T lymfocytů – editace 3 genů Otestování terapeutického potenciálu takto editovaných buněk Pacient s agresivním nádorem plic Editace genu PD-1 T lymfocytů Otestování terapeutického potenciálu takto editovaných buněk 59 60 stovky off-target mutací u myší po editaci genomu metodou CRISPR/Cas9 vs předchozí studie u linií a myší 61 However, we here demonstrate that the simplest interpretation of data in Schaefer et al.1 is that the two CRISPR–Cas9-treated mice are genetically more closely related to each other than to the control mouse. 62 Další možné využití CRISPR technologie Detekce mutací – zlom v místě mutace indukovaný CRISPR technologií - detekce mutací o nízké frekvenci (problém sekvenování) 63 CAMERA CRISPR-mediated analog multievent recording apparatus - single cell resolution - „záznam“ reakce buňky na stimul - některé buňky ve směsi reagují/jiné nikoli - lze kombinovat různé signály, jejich pořadí 64 DETECTR/SHERLOCK - detekce specifické DNA - využití Cas12/Cas13 (zůstává aktivní i po tvorbě ds zlomu – štěpí ss RNA/DNA) - testováno na detekci různých kmenů HPV – některé spojeny s rizikem karcinomů děložního čípku – rozlišeni infekce těmito kmeny (DETECTR) - využití reportérových molekul – po štěpení vzniká fluorescence - detekce infekce virem ZIKA (SHERLOCK) 65 Gene drive - technologie genového inženýrství, která umožňuje rozšíření dané varianty genu (ů) v populaci prostřednictvím zvýšení pravděpodobnosti přenosu na potomky nad přirozenou hodnotu 50 procent - pouze u jedinců s pohlavním rozmnožováním 66 Gene drive - i přirozené mechanismy – popsány alely genů, jež se nacházejí častěji v gametách - selekce na úrovni gamet (i u lidí) - laboratorně ověřeno Využití – vyhubení škůdců, patogenů, predátorů … (Predator Free 2050 Nový Zéland) … x etika, bezpečnost