Editace genomů Genome editing, or genome editing with engineered nucleases (GEEN) Postupy genového inženýrství, při nichž se do vybraného místa v cílové DNA pomocí uměle připravených nukleáz (tzv. molekulárních nůžek) vnáší inzerce, delece a nebo se stávající sekvence nahrazuje za jiné (náhrada alel). Tyto nukleázy vytvářejí na určených místech genomu dvouřetězcové zlomy (DSBs: double-stranded breaks), čímž vyvolávají přirozené endogenní buněčné procesy vedoucí k reparaci zlomů: a) Homologní rekombinací (HR) b) Nehomologní spojování volných konců (NHEJ: nonhomologous end-joining) Historické etapy v CRISPR biologii a editování genomů (RGENs) = RNA-guided engineered nucleases Procesy probíhající po vytvoření DSB umělými nukleázami Procesy probíhající po vytvoření DSB umělými nukleázami Overview of possible genome editing outcomes using site-specific nucleases. Nucleaseinduced DNA double-strand breaks (DSBs) can be repaired by homology-directed repair (HDR) or error-prone nonhomologous end joining (NHEJ). (A) In the presence of donor plasmid with extended homology arms, HDR can lead to the introduction of single or multiple transgenes to correct or replace existing genes. (B) In the absence of donor plasmid, NHEJ-mediated repair yields small insertion or deletion mutations at the target that cause gene disruption. In the presence of double-stranded oligonucleotides or in vivo linearized donor plasmid, DNA fragments up to 14 kb have been inserted via NHEJmediated ligation. Simultaneous induction of two DSBs can lead to deletions, inversions and translocations of the intervening segment. Typy nukleáz používané pro editaci genomů Typy nukleáz používané pro editaci genomů Nukleázy používané pro editaci genomů Meganukleázy se vyskytují u různých druhů mikroorganismů, mají velmi dlouhé rozpoznávací sekvence (>14bp) a jsou tak přirozeně sekvenčně velmi specifické. Nevýhodou je, že je jich známo relativně málo, a tudíž počet cílových sekvencí je omezen. Mutagenezí byly uměle připraveny varianty meganukleáz, které rozpoznávají další jedinečné sekvence. Byly připraveny rovněž hybridní varianty meganukleáz fúzí dvou s odlišnými cílovými místy. Byl použit též postup záměn aminokyselin v doménách interagujících s DNA a docíleno vysoké specifity rozpoznání (method named rationally designed meganuclease (US Patent 8,021,867 B2). Meganukleázy jsou méně toxické pro buňky než ZNF díky tomu, že mají vyšší specificitu/stringenci rozpoznání cílových sekvencí DNA. Jejich navrhování je však časově náročné. LAGLIDADG family of homing endonucleases (kódovány introny nebo inteiny), často v mitochondriích a chloroplastech I-SceI 18-bp z mitochondrií Saccharomyces cerevisiae I-CreI chloroplasty Chlamydomonas reinhardtii I-DmoI archema: Desulfurococcus mobilis. MEGANUKLEÁZY Enzym FokI přirozeně se vyskytující u Flavobacterium okeanokoites je restrikční endonukleáza typu IIS. Je tvořena N-terminální vazebnou doménou a nespecificky štěpící doménou na C-konci. Výhody FokI pro její využití v GI: - Rozpoznávaná sekvence je oddělena od sekvence, která je štěpena – to umožňuje izolovat doménu enzymu, která štěpí sekvenčně nespecificky. Tato doména pak může být spojena s doménou zodpovědnou za rozpoznání cílové sekvence. - FokI vyžaduje pro svou nukleázovou činnost dimerizaci – zvýší se tím specifita rozpoznání cílového místa. - Byly připraveny modifikované FokI, které fungují jen jako heterodimery, což zvyšuje specificitu rozpoznání cílových sekvencí a eliminuje možnost vytváření nespecifického štěpení v případě homodimerů. NUKLEÁZA FokI Struktura proteinu obsahujícího zinkové prsty (zinc finger) Každý zinkový prst sestává asi ze 30 AA v konformaci ββα. Každý prst kontaktuje 3 nebo 4 bp ve velkém žlábku DNA. Dimer Zinc-finger nukleázy (ZNF) navázaný na DNA. Cílová místa pro vazbu ZNF sestávají ze dvou vazebných míst pro zinkové prsty, která jsou oddělena 5-7 bp dlouhou sekvencí, která je rozpoznávána štěpící doménou FokI. Protein TALE v komplexu s cílovou DNA. Jednotlivé repetice proteinu TALE obsahují 33- 35 AA, které rozpoznávají jednotlivé páry bází prostřednictvím dvou hypervariabilních zbytků (repeat-variable diresidues – RVDs) Dimer TALEN navázaný na DNA. Cílová místa pro TALEN jsou tvořena dvěma vazebnými oblastmi pro TALE oddělenými mezerníkovou sekvencí různé délky (12-20 bp). TALE lze upravit tak, aby rozpoznávala jedinečné sekvence vlevo a vpravo. Figure 1: Each Zinc Finger Nuclease (ZFN) consists of two functional domains: a.) A DNA-binding domain comprised of a chain of two-finger modules, each recognizing a unique hexamer (6 bp) sequence of DNA. Two-finger modules are stitched together to form a Zinc Finger Protein, each with specificity of ≥ 24 bp. b.) A DNA-cleaving domain comprised of the nuclease domain of Fok I. When the DNA-binding and DNA-cleaving domains are fused together, a highly-specific pair of 'genomic scissors' are created. BENEFITS - Rapid disruption of, or integration into, any genomic loci Mutations made are permanent and heritable - Works in a variety of mammalian somatic cell types - Edits induced through a single transfection experiment - Knockout or knock-in cell lines in as little as two months - Single or biallelic edits occur in 1–20% of clone population - No antibiotic selection required for screening Editace genomů pomocí ZNF (a) Schematic diagram of a ZFN heterodimer bound to the mutated mtDNA target. Each of the monomeric ZFN consists of the FokI nuclease domain (FokI CD) linked to a zinc-finger peptide. One of the ZFNs (NARPd, red) was designed to bind to the mutated mtDNA site, whereas its companion ZFN binds a native sequence on the opposite DNA strand (COMPa, blue)19. (b) Schematic structure of mtZFN used in the cleavage assay in c. 'mitochondrial targeting sequence (MTS) F' denotes the mitochondrial targeting sequence of F1β-subunit of the human mitochondrial ATP synthase (see ANTICIPATED RESULTS for details). (c) In vitro assay testing the specificity of the F–NARPd–Fok–NES and F–COMPa–Fok–NES constructs (see ANTICIPATED RESULTS for details). Gram negativní bakterie r. Xanthomonas infikují řadu rostlinných druhů, u nichž mohou způsobovat onemocnění. Injikují svými sekrečními systémy do rostlinných buněk řadu efektorových proteinů včetně TAL efektorů. TAL effectors (Transcription Activator-like effectors) mají několik motivů včetně NLS, proto mohou vstupovat do jádra, kde se vážou na promotorové sekvence a aktivují transkripci rostlinných genů, které napomáhají bakteriální infekci. TAL obsahují v centrální části opakující se sekvence aminokyselin v počtu až 33, které jsou dlouhé obvykle 34 AA. Typická repetice: LTPEQVVAIASHDGGKQALETVQRLLPVLCQAHG, avšak v pozicích 12 a 13 se vyskytují různé aminokyseliny (místo označované jako repeat variable diresidue n. RVD) Byly navrženy TALE (Engineered TAL effectors) schopné se vázat na jakékoliv sekvence DNA díky zaměnám aminokyselin.Takové umělé TALE lze využít pro aktivaci nebo represi endogenů u rostlin i živočichů. Engineered TAL effectors lze fúzovat se štěpícími doménami nukleáz (FokI) a vytvářet tak TAL Effector Nucleases (TALENs). TAL effectory (Transcription Activator-like effectors) Struktura TALEN Struktura proteinu obsahujícího zinkové prsty (zinc finger) Každý zinkový prst sestává asi ze 30 AA v konformaci ββα. Každý prst kontaktuje 3 nebo 4 bp ve velkém žlábku DNA. Dimer Zinc-finger nukleázy (ZNF) navázaný na DNA. Cílová místa pro vazbu ZNF sestávají ze dvou vazebných míst pro zinkové prsty, která jsou oddělena 5-7 bp dlouhou sekvencí, která je rozpoznávána štěpící doménou FokI. Protein TALE v komplexu s cílovou DNA. Jednotlivé repetice proteinu TALE obsahují 33- 35 AA, které rozpoznávají jednotlivé páry bází prostřednictvím dvou hypervariabilních zbytků (repeat-variable diresidues – RVDs) Dimer TALEN navázaný na DNA. Cílová místa pro TALEN jsou tvořena dvěma vazebnými oblastmi pro TALE oddělenými mezerníkovou sekvencí různé délky (12-20 bp). TALE lze upravit tak, aby rozpoznával jedinečné sekvence vlevo a vpravo. Model for DNA-target specificity of TAL effectors. (A) TAL effectors contain central tandem repeats, NLSs, and an AD. Shown is the amino acid sequence of the first repeat of AvrBs3. Hypervariable amino acids 12 and 13 are shaded in gray. (B) Hypervariable amino acids at position 12 and 13 of the 17.5 AvrBs3 repeats are aligned to the UPA box consensus (14). (C) Repeats of TAL effectors and predicted target sequences in promoters of induced genes were aligned manually. Nucleotides in the upper DNA strand that correspond to the hypervariable amino acids in each repeat were counted on the basis of the following combinations of eight effectors and Schéma strategie pro přípravu genetických konstruktů exprimujících chimerické proteiny TALEN – postupná ligace klonovaných monomerů K dispozici jsou knihovny monomerů, dimerů, trimerů a tetramerů RE1 RE2 … Sysém CRISPR/Cas - Úseky cizorodé DNA jsou začleněny do bakteriálního genomu do lokusů CRISPR - Lokusy CRISPR jsou přepsány a upraveny do crRNA (crRNA biogenese) - Během interference vytváří endonukleáza Cas9 komplex s crRNA a tracrRNA, který pak štěpí cizorodou DNA obsahující sekvenci 20-ti nukleotidů komplementárních k crRNA poblíž sekvence PAM. Fungování systému CRISPR-Cas Fungování CRISPR-Cas9 komplexu Spojení linkerem sgRNA vytvořená fúzí crRNA a tracrRNA Struktura chimerické sgRNA a kompexu sgRNA s Cas9 pro vytváření DSB v cílových místech. sgRNA je vytvořena spojením crRNA a tracrRNA. NGG Srovnání struktury crRNA:trancrRNA a sgRNA Příprava konstruktu exprimujícího CRISPR/Cas element hCas9 = sekvence proteinu Cas9 optimalizovaná pro expresi v eukaryotických buňkách. sgRNA = chimerická RNA obsahující úseky crRNA a tracrRNA, která je nezbytná pro dosažení aktivity. Sekvence sgRNA je navržena tak, aby byla komplementární k cílové genomové sekvenci Možnosti editace genomů pomocí systému CRISPR/Cas9 TSS = transcription start site EFGP = fluorescenční proteiny Působení modifikovaného systému CRISPR/Cas9 A. Wt Cas9 nukleáza štěpí specificky dsDNA, vytváří DSB a tím navozuje reparaci. Za nepřítomnosti homologní sekvence může dojít k nehomolognímu spojování konců (NHEJ) a vzniku indelů, přerušujících zasažený gen. Za přítomnosti homologní sekvence může dojít k reparaci s využitím této sekvence a jejími vložení do místa zlomu. B. Mutantní Cas9 nukleáza vytváří místně specifické jednořetězcové zlomy. Dvojice takových sgRNA může zavádět posunuté zlomy, které mohou být reparovány s využitím homologní DNA. C. Mutantní Cas 9 nukleáza může být připojena k různým efektorovým doménám, které umisťuje na specifické sekvence. Mohou to být TF, represory, fluorescenční značky aj. Analogie ZFN a TALEN 1. Selection of a target nucleotide sequence in the genome; 2. Generation of a nuclease construct directed at the selected target; 3. Delivery of this construct to the cell nucleus; and 4. Analysis of produced mutations. Obecná strategie genomového inženýrování Current and future delivery systems for engineered nucleases: ZFN, TALEN and RGEN Příklady typů buněk a organismů, které byly geneticky modifikovány pomocí Cas9