Masivně paralelní sekvenování Boris Tichý Sdílená laboratoř Genomika Brno, 4. 12. 2014 2 Informace je uložená v DNA Informace uložená jako sekvence bazí A, C, G, T V každé lidské buňce je ~ 3 miliardy bazí = ~ 3 metry = ~ 6.6 pikogramů Sekvence DNA je v každé bunce stejná 3 Sekven(c)ování DNA Vytvoření různě dlouhých fragmentů DNA Dideoxy-NTPs → ukončení polymerace Gel → kapilární elektroforéza Značené primery nebo ddNTPs 4 Masivně paralelní sekvenování PCR amplifikace jednotlivých DNA fragmentů nebo Sekvenování jednotlivých DNA fragmentů = Single molecule sequencing Sekvence je čtena při syntéze nového řetězce Technologie a přístroje přizpůsobeny paralelizaci Stovky milionů jednotlivých PCR reakcí a sekvenací najednou (běžně prodávané kapilární sekvenátory jsou max. 96-kapilární) Většinou kratší sekvence – desítky bazí (kapilární – běžně až 1000 bazí) 5 Masivně paralelní sekvenování Sequencing by synthesis Polymeráza Sestavování nového řetězce z jednotlivých nukleotidů Sequencing by ligation Ligáza Sestavování nového řetězce z oligonukleotidů 6 Masivně paralelní sekvenování Technologie Illumina Bridge amplifikace 7 Masivně paralelní sekvenování Technologie Roche/454 Emulzní PCR 8 Masivně paralelní sekvenování Technologie Illumina Sekvenování s reverzibilními terminátory http://www.youtube.com/watch?v=Zqr8_KiuzHU http://www.youtube.com/watch?v=l99aKKHcxC4 9 Masivně paralelní sekvenování Technologie Roche/454 Pyrosekvenování Masivně paralelní sekvenování Technologie Ion Torrent 11 Masivně paralelní sekvenování Sekvenování (hybridizací a) ligací 12 Masivně paralelní sekvenování Technologie SOLiD 13 Masivně paralelní sekvenování Technologie SOLiD 14 Masivně paralelní sekvenování Class IIs restriction endonucleases 400 – 500 bp Technologie cPAL 15 Masivně paralelní sekvenování Technologie cPAL 16 Masivně paralelní sekvenování Technologie cPAL > 2,5 miliardy jamek na ploše velikosti podložního sklíčka (rozestup 0,7 mikrometru) 17 Masivně paralelní sekvenování Technologie SMRT (Single Molecule Real Time) With an active polymerase immobilized at the bottom of each ZMW, nucleotides diffuse into the ZMW chamber. In order to detect incorporation events and identify the base, each of the four nucleotides A, C, G and T are labeled with a different fluorescent color. Since only the bottom 30nm of the ZMW is illuminated, only those nucleotides near the bottom fluoresce. http://www.pacificbiosciences.com /products/smrt-technology/ 18 Masivně paralelní sekvenování Oxford Nanopore https://www.nanoporetech.com/technology/analytes-and-applications-dna-rna- proteins/dna-an-introduction-to-nanopore-sequencing 'Strand sequencing' is a technique that passes intact DNA polymers through a protein nanopore, sequencing in real-time as the DNA translocates the pore. 19 Masivně paralelní sekvenování Paired-end sequencing Illumina 20 Masivně paralelní sekvenování Mate-pair sequencing Illumina 21 Aplikace nových technologií Celogenomový screening Sekvence SNP Strukturní aberace, početní aberace Cílený screening Sekvence SNP Analýza DNA 22 Cílený screening Target enrichment Hybridizace na čipu v roztoku PCR běžná mikrofluidní 23 Cílený screening Exome sequencing Všechny exprimované geny Většinou včetně nekódujících Hybridizace (v roztoku) Gene enrichment Jeden gen – např. dědičné poruchy PCR, hybridizace multiplexing Skupiny genů – např. multifaktoriální nemoci, nádory PCR, hybridizace Úseky genomu – strukturní aberace hybridizace 24 RNA-Seq Transcriptome sequencing Single-end – kvantifikace Paired-end – struktura transkriptů Tag sequencing 3' tagy, kvantifikace, bez informace o struktuře Degradome sequencing 5' tagy, identifikace cílů microRNA Small RNA sequencing MicroRNA kvantifikace i de-novo identifikace SAGE (Serial Analysis of Gene Expression) Konkatemery tagů, původně Sanger sekvenace RIP (RNA ImmunoPrecipitation) Imunoprecipitace, RNA vázající proteiny 25 Epigenomika/epigenetika In biology, and specifically genetics, epigenetics is the study of heritable changes in phenotype (appearance) or gene expression caused by mechanisms other than changes in the underlying DNA sequence, hence the name epi- (Greek: επί- over, above) -genetics. These changes may remain through cell divisions for the remainder of the cell's life and may also last for multiple generations. However, there is no change in the underlying DNA sequence of the organism;[1] instead, non-genetic factors cause the organism's genes to behave (or "express themselves") differently. 26 Epigenomika DNA metylace C → Met-C, snížená exprese Modifikace histonů Aktivní I neaktivní chromatin 27 Chromatinová imunoprecipitace Modifikované histony Acetylované, metylované Další DNA vázající proteiny Transkripční faktory RNA polymerázy Metylovaná DNA Kvalita protilátky Změna epitopu formaldehyd 28 Metylace DNA MeDIP - Imunoprecipitace metylované DNA Protilátka rozpoznávající Met-C Pozice metylovaných úseků DNA Bisulfite treatment Konverze C → U, Met-C se nemění Přesná identifikace jednotlivých metylovaných bazí Některé dědičné choroby, nádory 29 Analýza NGS dat Assembling – vytvoření kontigů De-novo Mapování na referenční sekvenci Identifikace variant SNP (SNV) In/del Strukturní aberace – chromosomy, transkripty Kvantifikace DNA – amplifikace/delece, místa vazby transkripčních faktorů RNA – tagy, exony, transkripty 30 Analýza NGS dat Integrace dat Databáze Protein-protein interakce Ontologie – GO (GeneOntology), MeSH terms Transkripční faktory, microRNA targets Expresní profily – GSEA, profily chemických látek Různé typy dat ChIP + RNA + metylace + DNA copy number 31 Analýza NGS dat Statistická analýza “klasické” statistické metody T-test, ANOVA, neparametrické testy Vícerozměrné analýzy ClusteCring (HCL, k-means), PCA Klasifikační algoritmy Lineární (LDA), nelineární (KNN) Vazba s dalšími informacemi (analýza anotací) Over-reprezentace Sítě 32 Somatické mutace u Chronické Lymfocytární Leukemie Mutace objevující se během vývoje nemoci mohou vést ke zhoršení průběhu Mutace TP53 u CLL Většinou výrazně horší průběh 5-10% případů CLL Často diagnostikovány až v průběhu nemoci Asociace s terapií 33 Somatické mutace u Chronické Lymfocytární Leukemie Mutace TP53 diagnostikované v průběhu nemoci po podání terapie Indukce nebo selekce mutací? Hledání mutací TP53 ve vzorcích před terapií Potřeba vysoce citlivé metody (mutace v <1% buněk) Ultra-deep sekvenování – pokrytí >5000x Roche GS Junior 34 Somatické mutace u Chronické Lymfocytární Leukemie Výsledek U 9 z 10 vzorků mutace nalezena i před terapií 0.25-5% sekvencí Selekce Další plány Rozšíření počtu vyšetřovaných genů Větší skupina pacientů Děkuji za pozornost Středoevropský technologický institut c/o Masarykova univerzita Žerotínovo nám. 9 601 77 Brno, Česká republika www.ceitec.cz | info@ceitec.cz