1 Editace genomů Genome editing, or genome editing with engineered nucleases (GEEN) Postupy genového inženýrství, při nichž se do vybraného místa v cílové DNA pomocí uměle připravených nukleáz (tzv. molekulárních nůžek) vnáší inzerce, delece a nebo se stávající sekvence nahrazuje za jiné (náhrada alel). Tyto nukleázy vytvářejí na určených místech genomu dvouřetězcové zlomy (DSBs: double-stranded breaks), čímž vyvolávají přirozené endogenní buněčné procesy vedoucí k reparaci zlomů: a) Homologní rekombinací (HR) HDR = homology directed recombination (rekombinace řízená homologií) b) Nehomologní spojování volných konců (NHEJ: nonhomologous end-joining) 2 - editace probíhá s přesností až 1 nt - používají se uměle připravené nukleázy – modifikace přirozeně se vyskytujících - podstatou je tvorba zlomu v řetězci DNA (1 ale i 2 zlomy) - v místě štěpení - vznik mutace - vyštěpení celého úseku DNA (genu) - náhrada úseku DNA - lze připravit mutace jakéhokoli typu (včetně náhrady alel – „gene replacement“) - důležitá je funkce reparačních systémů buněk – endogenní procesy - „nezávisle“ na vnesené DNA/RNA 3 Historické etapy v CRISPR biologii a editování genomů 4 - poměrně vysoká frekvence HDR u kvasinek - přenos His3 genu (do His3- kmene) - pozitivní selekce na His - využití neg. selekčního markeru (Ura) - vně sekvence - vytvořeny buňky His3+ a URA- 5 (RGENs) = RNA-guided engineered nucleases - programované nukleázy (jejich cíl je řízen molekulou RNA) Procesy probíhající po vytvoření DSB umělými nukleázami - snaha o vývoj systému pro sekvenčně specifickou tvorbu dsDNA zlomů Lidský genom – 3,2 Gbp – cílem musí být jedinečné sekvence (specificita) - sekvence delší než 20 bp 7 klasická NHEJ - rychlý proces (10-30 minut) - výsledkem jsou malé inzerce/delece - existují i alternativní NHEJ př. microhomology-mediated end joining (MMEJ) - rozsáhlé inzerce, delece, fůze, … 8 HDR - složitější (pomalejší) proces - zapojeno více proteinů - nutná přítomnost homologní sekvence - výsledkem přesně opravená DNA 9 Procesy probíhající po vytvoření DSB umělými nukleázami 10 Overview of possible genome editing outcomes using site-specific nucleases. Nucleaseinduced DNA double-strand breaks (DSBs) can be repaired by homology-directed repair (HDR) or error-prone nonhomologous end joining (NHEJ). (A) In the presence of donor plasmid with extended homology arms, HDR can lead to the introduction of single or multiple transgenes to correct or replace existing genes. (B) In the absence of donor plasmid, NHEJ-mediated repair yields small insertion or deletion mutations at the target that cause gene disruption. In the presence of double-stranded oligonucleotides or in vivo linearized donor plasmid, DNA fragments up to 14 kb have been inserted via NHEJmediated ligation. Simultaneous induction of two DSBs can lead to deletions, inversions and translocations of the intervening segment. 11 Typy nukleáz používané pro editaci genomů Rozpoznání sekvence Interakce protein x DNA Rozpoznání sekvence Interakce protein x DNA Rozpoznání sekvence Interakce protein x DNA 12 Meganukleázy se vyskytují u různých druhů mikroorganismů, mají velmi dlouhé rozpoznávací sekvence (>14bp vs. RE 4-6 bp) a jsou tak přirozeně sekvenčně velmi specifické. Nevýhodou je, že je jich známo relativně málo, a tudíž počet cílových sekvencí je omezen. Mutagenezí byly uměle připraveny varianty meganukleáz, které rozpoznávají další jedinečné sekvence. Byly připraveny rovněž hybridní varianty meganukleáz fúzí dvou domén s odlišnými cílovými místy. Byl použit též postup záměn aminokyselin v doménách interagujících s DNA a docíleno vysoké specifity rozpoznání (method named rationally designed meganuclease (US Patent 8,021,867 B2). Meganukleázy jsou méně toxické pro buňky než ZNF díky tomu, že mají vyšší specificitu/stringenci rozpoznání cílových sekvencí DNA. Jejich navrhování je však časově náročné. MEGANUKLEÁZY 13 i meganukleázy nebakteriálního původu - LAGLIDADG family of homing endonucleases (kódovány introny nebo inteiny), často v mitochondriích a chloroplastech I-SceI 18-bp z mitochondrií Saccharomyces cerevisiae I-CreI chloroplasty Chlamydomonas reinhardtii I-DmoI archea: Desulfurococcus mobilis. oproti RE: - delší rozpoznávací sekvence (nemusí být palindrom, často asymetrické) - vyšší tolerance k malým substitucím v rozpoznávací sekvenci - obvykle vyžadují součinnost dalších proteinů 14 Enzym FokI přirozeně se vyskytující u Flavobacterium okeanokoites je restrikční endonukleáza typu IIS (štěpí blízko rozpoznávací sekvence). Je tvořena N-terminální vazebnou doménou a nespecificky štěpící doménou na C-konci. Výhody FokI pro její využití v GI: - Rozpoznávaná sekvence je oddělena od sekvence, která je štěpena – to umožňuje izolovat doménu enzymu, která štěpí sekvenčně nespecificky. Tato doména pak může být spojena s doménou zodpovědnou za rozpoznání cílové sekvence. - FokI vyžaduje pro svou nukleázovou činnost dimerizaci – zvýší se tím specifita rozpoznání cílového místa. - Byly připraveny modifikované FokI, které fungují jen jako heterodimery, což zvyšuje specificitu rozpoznání cílových sekvencí a eliminuje možnost vytváření nespecifického štěpení v případě homodimerů. - využívá se pro konstrukci ZFN a TALEN nukleáz NUKLEÁZA FokI 15 Typy nukleáz používané pro editaci genomů 16 Struktura proteinu obsahujícího zinkové prsty (zinc finger) Každý zinkový prst sestává asi ze 30 AA v konformaci ββα. Každý prst kontaktuje 3 nebo 4 bp ve velkém žlábku DNA. Dimer Zinc-finger nukleázy (ZFN) navázaný na DNA. Cílová místa pro vazbu ZFN sestávají ze dvou vazebných míst pro zinkové prsty, která jsou oddělena 5-7 bp dlouhou sekvencí, která je štěpena štěpící doménou FokI. Protein TALE v komplexu s cílovou DNA. Jednotlivé repetice proteinu TALE obsahují 33- 35 AA, které rozpoznávají jednotlivé páry bází prostřednictvím dvou hypervariabilních zbytků (repeat-variable diresidues – RVDs) Dimer TALEN navázaný na DNA. Cílová místa pro TALEN jsou tvořena dvěma vazebnými oblastmi pro TALE oddělenými mezerníkovou sekvencí různé délky (12-20 bp). TALE lze upravit tak, aby rozpoznávala jedinečné sekvence vlevo a vpravo. 17 Editace genomů pomocí ZFN - produkovány již otestované firmami: Sigma-Aldrich Sangamo BioSciences 18 (a) Schematic diagram of a ZFN heterodimer bound to the mutated mtDNA target. Each of the monomeric ZFN consists of the FokI nuclease domain (FokI CD) linked to a zinc-finger peptide. One of the ZFNs (NARPd, red) was designed to bind to the mutated mtDNA site, whereas its companion ZFN binds a native sequence on the opposite DNA strand (COMPa, blue)19. (b) Schematic structure of mtZFN used in the cleavage assay in c. 'mitochondrial targeting sequence (MTS) F' denotes the mitochondrial targeting sequence of F1β-subunit of the human mitochondrial ATP synthase (see ANTICIPATED RESULTS for details). (c) In vitro assay testing the specificity of the F–NARPd–Fok–NES and F–COMPa–Fok–NES constructs (see ANTICIPATED RESULTS for details). 19 Gram negativní bakterie r. Xanthomonas infikují řadu rostlinných druhů, u nichž mohou způsobovat onemocnění. Injikují svými sekrečními systémy do rostlinných buněk řadu efektorových proteinů včetně TAL efektorů. TAL effectors (Transcription Activator-like effectors) mají několik motivů včetně NLS, proto mohou vstupovat do jádra, kde se vážou na promotorové sekvence a aktivují transkripci rostlinných genů, které napomáhají bakteriální infekci (snížení hladiny Cu, zvýšení hladiny glukózy, …) TAL obsahují v centrální části opakující se sekvence aminokyselin v počtu až 33, které jsou dlouhé obvykle 34 AA. Typická repetice: LTPEQVVAIASHDGGKQALETVQRLLPVLCQAHG, avšak v pozicích 12 a 13 se vyskytují různé aminokyseliny (místo označované jako repeat variable diresidue n. RVD) – tyto klíčové pro specificitu vazby na sekvenci DNA Byly navrženy TALE (Engineered TAL effectors) schopné se vázat na jakékoliv sekvence DNA díky záměnám aminokyselin.Takové umělé TALE lze využít pro aktivaci nebo represi endogenů u rostlin i živočichů. Engineered TAL effectors lze fúzovat se štěpícími doménami nukleáz (FokI) a vytvářet tak TAL Effector Nucleases (TALENs). TAL effectory (Transcription Activator-like effectors) 20 Struktura TALEN 21 Struktura proteinu obsahujícího zinkové prsty (zinc finger) Každý zinkový prst sestává asi ze 30 AA v konformaci ββα. Každý prst kontaktuje 3 nebo 4 bp ve velkém žlábku DNA. Dimer Zinc-finger nukleázy (ZNF) navázaný na DNA. Cílová místa pro vazbu ZNF sestávají ze dvou vazebných míst pro zinkové prsty, která jsou oddělena 5-7 bp dlouhou sekvencí, která je rozpoznávána štěpící doménou FokI. Protein TALE v komplexu s cílovou DNA. Jednotlivé repetice proteinu TALE obsahují 33- 35 AA, které rozpoznávají jednotlivé páry bází prostřednictvím dvou hypervariabilních zbytků aa (repeat-variable diresidues – RVDs) Dimer TALEN navázaný na DNA. Cílová místa pro TALEN jsou tvořena dvěma vazebnými oblastmi pro TALE oddělenými mezerníkovou sekvencí různé délky (12-20 bp). TALE lze upravit tak, aby rozpoznával jedinečné sekvence vlevo a vpravo. 22 Model for DNA-target specificity of TAL effectors. (A) TAL effectors contain central tandem repeats, NLSs, and an AD. Shown is the amino acid sequence of the first repeat of AvrBs3. Hypervariable amino acids 12 and 13 are shaded in gray. (B) Hypervariable amino acids at position 12 and 13 of the 17.5 AvrBs3 repeats are aligned to the UPA box consensus (14). (C) Repeats of TAL effectors and predicted target sequences in promoters of induced genes were aligned manually. Nucleotides in the upper DNA strand that correspond to the hypervariable amino acids in each repeat were counted on the basis of the following combinations of eight effectors and 23 DNA binding code for TALENs 24 Schéma strategie pro přípravu genetických konstruktů exprimujících chimerické proteiny TALEN – postupná ligace klonovaných monomerů výsledkem je „skládačka“ cílená proti libovolné sekvenci DNA - každý si může sám vytvořit (http://www.addgene.org/TALEN/) K dispozici jsou knihovny monomerů, dimerů, trimerů a tetramerů RE1 RE2 … 25 Umělé nukleázy - odvozené od aktivátoru transkripce + nukleáz - vazba na specifické místo v genomu - do buněk se obvykle dopravují na expresních vektorech - lze je využít pro tvorbu – bodových mutací … - delecí - inzercí - inverzí - duplikací - translokací … ale také pro značení mRNA - podstatou je tvorba dsDNA zlomu a jeho oprava - sekvenční specifita je dána DNA-protein interakcí 26 Systém CRISPR/Cas - přirozený obraný systém bakterií a archeí proti cizorodé DNA 27 Fungování CRISPR-Cas9 komplexu systém pravidelně uspořádaných mezerníků mezi repeticemi CRISPR lokusu cizorodé DNA rozpoznány proteiny Cas (CRISPR associated proteins) a začleněny do CRISPR lokusu lokus má až několik stovek mezerníků, nový mezerník, který je převzat z infikující molekuly, je začleněn jako první (fáze akvizice/adaptace) následně je lokus přepisován za vzniku CRISPRové RNA (pre-crRNA), ta je dále upravována do krátkých molekul CRISPRové RNA (crRNA) Asociace crRNA s transaktivační (transaktivující) tracrRNA a následně s některým z CAS proteinů tento komplex rozpozná a štěpí cizorodou DNA 28 3 hlavní složky systému – crRNA, tracrRNA, Cas proteiny (1-2) - Úseky cizorodé DNA jsou začleněny do bakteriálního genomu do lokusů CRISPR - Lokusy CRISPR jsou přepsány a upraveny do crRNA (crRNA biogenese) - Během interference vytváří endonukleáza Cas9 komplex s crRNA a tracrRNA, který pak štěpí cizorodou DNA obsahující sekvenci 20-ti nukleotidů komplementárních k crRNA poblíž sekvence PAM. 29 30 Spojení linkerem sgRNA vytvořená fúzí crRNA a tracrRNA 31 Struktura chimerické sgRNA a kompexu sgRNA s Cas9 pro vytváření DSB v cílových místech. sgRNA je vytvořena spojením crRNA a tracrRNA. NGG 32 PAM sekvence – photospacer adjacent motif - sekvence v těsném sousedství s cílovou DNA sekvencí - nutná pro účinné štěpení Cas9 nukleázou - původní systém „NGG“ (rozpoznán Cas9 ze Streptococcus pyogenes) - dle systému cílová sekvence musí být ve formátu N20-GG - systémy jiných bakterií nebo upravené systémy – NAG, YG, TTTN, YTN, … 33 Srovnání struktury crRNA:tracrRNA a sgRNA - systém lze exprimovat z jediného vektoru 34 Příprava konstruktu exprimujícího CRISPR/Cas element hCas9 = sekvence proteinu Cas9 optimalizovaná pro expresi v eukaryotických buňkách. sgRNA = chimerická RNA obsahující úseky crRNA a tracrRNA, která je nezbytná pro dosažení aktivity. PAM není součástí klonované sekvence - pro design lze využít dostupný software - http://zifit.partners.org/ - http://crispr.mit.edu/ Sekvence sgRNA je navržena tak, aby byla komplementární k cílové genomové sekvenci 35 Možnosti editace genomů pomocí systému CRISPR/Cas9 TSS = transcription start site EGFP = fluorescenční proteiny dCas9 – deficientní na nukleázovou aktivitu Metylázy, acetylázy … Působení modifikovaného systému CRISPR/Cas9 Specificita – dána pouze 20 nt sgRNA - úplná podobnost na 3´konci (seed) a částečná na 5´konci (distal) riziko vzniku off-target štěpení 50 - 1500x výšší specifita (n do 20 bp) ještě vyšší specifita 37 A. Wt Cas9 nukleáza štěpí specificky dsDNA, vytváří DSB a tím navozuje reparaci. Za nepřítomnosti homologní sekvence může dojít k nehomolognímu spojování konců (NHEJ) a vzniku ins/del mutací, přerušujících zasažený gen. Za přítomnosti homologní sekvence může dojít k reparaci s využitím této sekvence a jejími vložení do místa zlomu. B. Mutantní Cas9 nukleáza vytváří místně specifické jednořetězcové zlomy. Dvojice takových sgRNA může vést k tvorbě ds DNA zlomů, které mohou být reparovány s využitím homologní rekombinace či NHEJ (jednořetězcové zlomy zvyšují účinnost HDR). Tento sytém zvyšuje specifitu tvorby ds zlomů. C. Mutantní Cas 9 nukleáza může být připojena k různým efektorovým doménám, které umisťuje na specifické sekvence. Mohou to být TF, represory, fluorescenční značky aj. Analogie ZFN a TALEN 38 1. Selection of a target nucleotide sequence in the genome; 2. Generation of a nuclease construct directed at the selected target; 3. Delivery of this construct to the cell nucleus; and 4. Analysis of produced mutations. Obecná strategie genomového inženýrování 39 Current and future delivery systems for engineered nucleases: ZFN, TALEN and RGEN 40 41 42 Příklady typů buněk a organismů, které byly geneticky modifikovány pomocí Cas9 43 44 Izolace T lymfocytů z pacientů s různými typy nádorových onemocnění Editace genomu těchto T lymfocytů – editace 3 genů Otestování terapeutického potenciálu takto editovaných buněk Pacient s agresivním nádorem plic Editace genu PD-1 T lymfocytů Otestování terapeutického potenciálu takto editovaných buněk