Moderní metody analýzy genomu 20.2.2013 Interní hematoonkologická klinika LF MU a FN Brno Centrum molekulární biologie a genové terapie CEITEC MU Logo CMBGT_verze 5 final zakladni_CZ Jitka Malčíková FN Brno_modra_obdelnik Sylabus úÚvod (Malčíková) úMicroarrays (Malčíková) úMetody analýzy miRNA a dalších nekódujících RNA (Mráz) úNGS (Tichý) ú454 úSMRT úSequencing by synthesis, sequencing by ligation – Illumina úIonTorrent úAplikace – Genomika, Transkriptomika, Epigenomika (Tichý) úAnalýza interakcí proteinů se specifickými sekvencemi genomu (Štros) úDalší technologie – Fluidigm, Sequenom, Luminex, Nanostring (Tichý) Variabilita genomu § Jednoukleotidové polymorfismy (Single Nucleotide Polymorphisms - SNP) úpolymorfismus vs mutace § Změny v počtu kopií genetického materiálu (Copy Number Variations – CNV) § Velikost repetitivních sekvencí v genomu § § Epigenetické změny – imprinting § Human Faces p16-17 §Genom (3.2 x 109 bp, 20-25 tis genů) § ú ú ú § §Transkriptom ú ú ú ú §Proteom (miliony proteinů) úDynamický systém – odráží momentální stav buňky úHladina proteinu často nekoreluje s hladinou mRNA iceberg § úTranskripce úPosttranskripční modifikace úAlternativní sestřih ú ú úTranslace úPosttranslační modifikace úAlternativní konformace ú ú Moderní metody – analýza „omů“ § §Čipové technologie §Sekvenování nové generace § §Fluidigm – mikrofluidní kvantitativní PCR § §Hmotnostní spektrometrie úAnalýza proteomu,ale i genové exprese, SNP a metylací BioMark™ 6.96 Dynamic Array Cartridge without bg Moderní metody §„High-throughput“ „Large-scale“ „Ultra-deep“ § §Snaha o získání co nejvíce informací § §Výsledkem je ohromné množství dat § §Význam biostatistiky § DNA pod lupou §První individuální genom (kompletní diploidní sekvence konkrétního člověka) – Institut J. C. Ventera úPoužitá technologie: Sangerovo kapilární sekvenování úVýsledky: identifikováno 2,81 miliardy nukleotidů (7,5 nás. pokrytí), 4,1 milionu variant (44 % změn heterozygotních), z toho 3,2 mil. SNP, 292 tis. malých inzercí/delecí ú (Levy, S., et al. PloS Biol 2007) ú §Druhý individuální genom - Baylor College, Texas úPoužitá technologie: sekvenování nové generace úVýsledky: identifikováno 3,3 mil. SNP (7,4 nás. pokrytí), z toho 10 tis. ovlivňuje záměnu aminokyseliny v proteinovém produktu genů § (Wheeler, D.A., et al. Nature, 2008) ú Sekvenování genomů Genomic distribution of SNP density on human chromosomes 1 to 22. The colours show the SNP density, with red indicating higher densities and blue indicating lower densities. Note high rates of SNP variation near the ends of the chromosomes. Genomická distribuce nukleotidových polymorfismů v jednotlivých lidských chromozomech 1 – 22. Červená – vyšší hustota Modrá – nižší hustota Projekt 1000 genomů – „A deep catalog of human genetic variations“ A map of human genome variation from population.scale sequencing. 1000 Genomes Project Consortium, Durbin RM, Abecasis GR, Altshuler DL, Auton A, Brooks LD, Durbin RM, Gibbs RA, Hurles ME, McVean GA., Nature. 2010 Oct 28;467(7319):1061-73. (Sanger Institute, 179 human genomes) Diversity of human copy number variation and multicopy genes. Sudmant PH, Kitzman JO, Antonacci F, Alkan C, Malig M, Tsalenko A, Sampas N, Bruhn L, Shendure J; 1000 Genomes Project, Eichler EE, Abecasis GR, Altshuler DL, Auton A, Brooks LD, Durbin RM, Gibbs RA, Hurles ME, McVean GA., Science. 2010 Oct 29;330(6004):641-6. (University of Washington, Seattle, 159 human genomes) Již bylo v lidském genomu Identifikováno: 15 milionů SNP 1 milion krátkých inzercí/delecí 20 tisíc strukturních variací §Interpretace § §Komerční „direct-to-concumer“ (DTC) genetic testing Úskalí Microarrays Čipové technologie §1995 - Mark Schena §„Quantitative monitoring of gene expression patterns with a complementary DNA microarray“, Science (1995); 270(5235): 467-70. § - Analýza exprese 45 genů Arabidopsis § §1996 - Affymetrix GeneChip § Princip čipových technologií §Princip – sondy vázané na nosný podklad § § §Různé dělení podle úAplikace (genotypizace; exprese RNA, proteinů; epigenetika…) úTechnologie výroby (in situ syntéza; deponování) úTypu sond (umělé chromozómy – BAC, PAC; cDNA; oligonukleotidy) úZnačeni (fluorescence – jedno/více-kanálové; autoradiografie, chemiluminiscence) Nosný podklad §Sklo úmikroskopické sklíčko (25 x 75 mm) úspeciální formáty úrůzné úpravy povrchu – aminosilan, epoxy atd. §Nylonová nebo nitrocelulózová membrána §Plast, gel §Mikrokuličky úBeadArrays® (Illumina) úxMAP (Luminex) Aplikace §Analýza genomových aberací, genotypizace úCGH, SNP čipy úResekvenační čipy ú §Epigenomika úMapování vazby proteinů na DNA (ChIP-on-chip) úMapování metylované DNA (MeDIP-chip) ú §Exprese úmRNA, miRNA úProteiny úBuňky, tkáně Čipová analýza Nanodrop-kapka Nanodrop-cely Buňky, tkáň… Amplifikace a značení Příprava čipu Hybridizace materiálu (RNA,proteinů…) s čipem Skenování čipu Analýza dat, statistické zpracování Spektrofotometr Nanodrop Izolace DNA, RNA, proteinů… Bioanalyser Nanodrop-kapka Nanodrop-cely Kontrola kvality §Nanodrop úkvantifikace nukleových kyselin A260 úměření čistoty: A260/280 (kontaminace proteiny); A260/280 (kontaminace org. látkami) ú § § §Bioanalyser – „lab on a chip“ úDegradace RNA úRIN – RNA integrity number – poměr 28S a 18S rRNA § Čipy pro analýzu genomu §Výchozí materiál - genomová DNA § §Detekce nebalancovaných genomových změn úAmplifikace, delece – CNV – copy number variations úNedetekuje balancované chromozomální translokace úArray CGH ú §Detekce uniparentální dizomie, genotypizace úSNP čipy ú §Detekce mutací, polymorfismů úResekvenační čipy § Postup §Izolace DNA §Kontrola kvality, stanovení kvantity §Amplifikace – celogenomová, PCR §Fragmentace – enzymaticky §Značení - fluorescence §Hybridizace, odmytí §Skenování §Analýza dat CGH - komparativní genomová hybridizace § § Kohybridizace značené DNA vzorku a kontrolní DNA www.advalytix.com (Beckman Coulter) §na sondy navázané na sklíčku úarray CGH – čipová technologie §na normální metafázní chromozomy úklasická CGH, HR-CGH úMetoda molekulární cytogenetiky CGH Rozdělení aCGH podle typu sond § §Délka a hustota pokrytí DNA sond určuje rozlišení čipu § §Úseky genomové DNA vložené do vektorů úYAC (Yeast Artificial chromosome) - 200 -1000 kb úBAC (Bacterial Artificial chromosome) - 50–200 kb úPAC (Phage Artificial chromosome) - 75-200 kb úKosmidy – 30-40 kb úRozlišení ~ 1Mb ú §cDNA - 1-2 kb úPouze genové oblasti úHorší schopnost detekce jednokopiových změn úRozlišení - 1-2 kb ú §Oligonukleotidy - 25-85 bazí úRozlišení - pod 1 kb ú ú Platformy aCGH §Cílené úAnalýza vybraných „hot spot“ oblastí spojených s konkrétním onemocněním ú §Chromozomové § §Celogenomové úSondy rozmístěné úrovnoměrně po genomu úv určitých intervalech úTilling arrays – sondy se překrývají – vysoké rozlišení § Davies et al., 2005 Výsledky aCGH delece 9p izochromozom 17 Delece + amplifikace Krátká delece mono a bialelická SNP čipy § §Čipy umožňující rozlišit nejen CNV, ale i SNP úSondy pro detekci CNV jako u CGH čipů + sondy speciálně navržené pro detekci SNP ú §SNP – jednonukleotidové polymorfismy § §Určení alelového statusu, haplotypu úGenotypizace, asociační studie § §Detekce uniparentální dizomie SNP www.marshall.edu Uniparentální dizomie (UPD) CNN LOH – copy number neutral loss of heterozygozity úVrozená, získaná úHeterodisomie vs isodisomie úVyskytuje se u řady onemocnění mutace monozomie trizomie UPD Normální karyotyp * Princip SNP čipů - Affymetrix § § §25b sondy, záměna 13. nukleotidu - největší vliv na sílu vazby při neshodě § §Jednobarevná detekce úna čip se hybridizuje pouze označená testovaná DNA Princip SNP čipů - Illumina ú1x 50b, single base extension; pouze A/G, A/C, T/C, T/G (dvoubarevná metoda) ú2X 50b, allele specific extension ú ú § Princip SNP čipů - Agilent §60b, SNPs pouze v místech rozpoznávaných restrikčními endonukleázami § Výsledky SNP čipů Amplifikace + delece Uniparentální dizomie § Výsledky SNP čipů - genotypizace SNP Array → • SNP genotyping Využití CGH, SNP čipů §Nádorová genomika úV nádorových buňkách často změny genomu – primární i sekundární §Klinická genetika úPřesnější charakterizace mikrodelečních syndromů úIdentifikace genomových změn u pacientů s mentální retardací i jinými vrozenými postiženími §Prenatální a preimplantační diagnostika §Asociační studie – asociace SNP i CNV s řadou onemocnění (revmatoidní artritida, diabetes, nádorová onemocnění, psychiatrická onemocnění) §Evoluční studie § Resekvenační čipy §Affymetrix úStejný princip jako detekce SNP úSNP = testovány 2 varianty X resekvenování = testovány 4 varianty Resekvenační čipy §APEX úArrayed Primer EXtension úProdloužení sondy o jeden nukleotid komplementární ke vzorku ú4-barevná technologie – nutné speciální vybavení ú Resekvenační čipy – hudba minulosti §Paralelní sekvenace více oblastí §Detekce mutací, na které je čip navržen §Screeningová metodika §Custom arrays – nutno ověřit Sangerovým sekvenováním § §Komerčně dostupné „diagnostické“ čipy úRoche – platforma Affymetrix Cytochrom P450 – FDA approval, CE-IVD P53 v testování Není nutné ověřovat výsledek Jen 1 gen , ale velmi rychlé, „user friendly“ (protokol max 2 dny) úAPEX Dostupné čipy pro konkrétní geny + možný vlastní design Nutné ověřit sekvenací Research use only § Expresní čipy - princip microarray_technology Buňky sledované Buňky kontrolní Historie §1987 Kulesh et al. - cDNA knihovna na papírovém filtru §Přelom 80./90. - E. Southern – in-situ syntéza oligonukleotidů §1991 – Fodor et al. - světlem řízená paralelní syntéza §1995 – Schena et al. - cDNA expresní microarray §1996 – lidská cDNA microarray §1997 – celogenomová (kvasinka) § - cDNA microarray §1997 – celogenomová (kvasinka) § - oligonukleotidová microarray Expresní čipy - typy §Studium exprese mRNA (miRNA) úCelogenomové úExonové (whole transcript) úCílené – konkrétní dráhy, diagnózy ú §High- i low- density §Sondy – krátké I dlouhé oligonukleotidy, cDNA §Sklíčka, cartridge, mikrokuličky, membrány §Jedno- a dvou- kanálové Aplikace §Studium efektů stimulů na genovou expresi úChemikálie (např. léčiva) úFyzikální faktory (záření) úGene knock-out (siRNA) úGene transfection (např. transkripční faktory, mutantní alely) §Studium rozdílů mezi vzorky úTkáně a orgány úDiagnózy Postup §Izolace RNA §Kvantita, kontrola kvality §Přepis RNA úOligo-dT priming Kvalitní RNA 3' biased sondy úRandom priming – hexa-, okta-, nona-mery I degradovaná RNA Celý transkript §Značení - fluorescence §Hybridizace, odmytí §Skenování §Analýza dat úZpracování obrazu úNormalizace úKlastrová analýza (supervised, unsupervised) úIntegrace s dalšími daty – gene ontology, genové interakce, funkční vztahy Výsledky §Identifikace genů rozdílně exprimovaných u konkrétních skupin vzorků ú §Ověření pomocí real-time PCR § § § U_M geny vzorky Využití §Pochopení molekulárních mechanismů §Studium biomarkerů – diagnostické, prognostické, prediktivní § §Komerčně dostupné pro in vitro diagnostiku úFDA cleared / IVDMA (In Vitro Diagnostic Multivariate Index Assays) úMammaPrint® Stanovení rizika metastázování po chirurgickém odstranění nádoru prsu u pacientek v časných stádiích nízké riziko – hormonální terapie X vysoké riziko – agresivnější léčba (chemoterapie) 70 genů úTissue of Origin Test Identifikace původu nádorů – metastáze, nediferencované nebo málo diferencované nádory > 2000 genů úŘada dalších bez certifikace pro IVD (ColoPrint….) ú Proteinové čipy § § §Expresní ústanovení přítomnosti a koncentrace proteinů v komplexních vzorcích §Protilátkové čipy §Lyzátové čipy §Antigen čipy § §Funkční ústudium interakce proteinů s jinými molekulami §proteiny, peptidy, nízkomolekulární látky, oligosacharidy, DNA ú Princip proteinových čipů §Vazba protilátka-antigen - mikrospot ELISA (Enzyme-Linked ImmunoSorbent Assay) úSystém využívající malé množství vázané protilátky a malého objemu vzorku je citlivější než systém se stonásobně větším objemem materiálu úCitlivost řádově ve femtomolech - 106 molekul/ml § úStanovení koncentrace analytu ve vzorku §Koncentraci přímo odpovídá množství vázaného analytu ú (Ekins RP, J Pharm Biomed Anal. 1989) abarray Princip proteinových čipů §Stovky – tisíce proteinů imobilizovaných ve formě mikrospotů na pevném povrchu ú membrány (polystyrenové, PVDF - polyvinyliden fluorid, nitrocelulosové) ú standardní mikroskopická sklíčka §s chemicky modifikovaným povrchem (poly-lysin, aldehydické skupiny) §potažená membránou §Detekční metody úNejčastěji fluorescence úEnzymaticky – značení alkalickou fosfatázou, křenovou peroxidázou úChemiluminiscence úRadioaktivita úZvýšení signálu – značení biotinem – vazba na značený streptavidin úHmotnostní spektrometrie §Protilátkové čipy § §Přímý formát (FPA- forward phase arrays) §Na povrchu spotované protilátky § §Inkubace se vzorkem ú ú ú ú ú ú ú ú ú ú §Detekce stovek antigenů ve vzorku §Expresní profilování – „large-scale“ monitorování proteinové exprese §Cílené na určité buněčné procesy (buněčný cyklus, cytokiny…) §Lyzátové čipy § §Zpětný formát (RPA – reverse phase arrays) §Na povrchu spotované vzorky § (proteinové, tkáňové lyzáty, sérum) §Inkubace se specifickými značenými protilátkami ú ú ú ú ú ú ú ú ú §Srovnání exprese až desítek antigenů u stovek různých vzorků §Nevýhoda – malá hustota studovaných molekul ve spotu § – pre-frakcionace pomocí 2D kapalinové chromatografie § Možnost dvoubarevné detekce Vyšší citlivost a specifita Čipy pro stanovení antigenů Xiaobo et al. 2010 Xiaobo et al. 2010 Sendvičová metoda Přímé značení Čipy pro stanovení protilátek § § Antigen čipy §Na povrchu spotované známé antigeny úsyntetické proteiny, peptidy §Inkubace se sérem obsahujícím studované protilátky §Detekce přítomnosti protilátek ve vzorku, nejčastěji v séru Xiaobo et al. 2010 Bead array - mikrosféry § § §průměr ~ 10 μm (velikost lymfocytu) § polystyrenové nebo latexové kuličky §„kódovány“ rozdílnými barvami nebo velikostmi § Detekce - např. flow cytometricky úrozpoznávání rozdílně kódovaných mikrosfér úidentifikace a kvantifikace proteinů ve vzorku §Množství stanovovaných proteinů je limitováno počtem druhů mikrosfér (~100) §Možnost automatizace §Využití – cílené – zejména detekce cytokinů, ale např. i detekce fúzních proteinů a onkoproteinů ú www.lucerna.chem.ch Buněčné čipy § § §Přímý formát úSpotované protilátky úInkubace s buněčnou suspenzí ú §„Transfekční čipy“ - buňky rostou na povrchu čipu s naspotovanou cDNA §Během růstu přijmou cDNA §Čip se spoty buněk exprimujících různé cizorodé proteiny § §Detekce úPřímo mikroskopicky na sklíčku úDalší charakterizace značenými protilátkami Tkáňové čipy §Varianta RPA čipů (zpětný formát) §Spotují se celé vzorky tkání např. bioptických §Inkubace se značenými protilátkami §Velikost spotu 0,6 - 2mm § nrd1254-f2 Funkční čipy § § §Studium interakce s jinými molekulami úInkubace s jinými proteiny, DNA, malými molekulami (oligosacharidy, terapeutika, …) §Studium posttranslačních modifikací §Studium enzymatické aktivity §Studium kofaktorů a inhibitorů §Studium interakcí ligand-receptor Spotovány nativní proteiny §Potřeba zachování struktury a biologické aktivity § §Nespecifická vazba přímo na povrch úAdsorpce úKovalentní vazba přirozených chemických skupin proteinu na upravený povrch úAktivní část proteinu může být schovaná, problém zachování konformace ú §Chemoselektivní vazba – připojení chemické skupiny na definovanou pozici proteinu → specifická reakce s komplementární chemickou skupinou na povrchu sklíčka úOrientovaná pozice na sklíčku ú §Imobilizace přes specifický rekombinantní tag úZachování orientace, konformace, funguje jako „spacer“ ú Další typy funkčních čipů § § §Doménové čipy úSpotovány pouze jednotlivé domény proteinu úPochopení protein-proteinových interakcí ú §Peptidové čipy úInkubace s proteiny, DNA, malými molekulami (oligosacharidy, terapeutika, …) ú §Čipy s chemickými knihovnami úInkubace s proteiny (enzymy, receptory…) úStudium inhibitorů, studium ligand-receptorových interakcí- vyhledávání terapeutik Typ čipu Molekuly imobilizované na čipu Stanovované molekuly Inkubace Počet spotů Použití expresní protilátkové (přímý formát) známé protilátky antigeny neznámý vzorek - proteinový lyzát > 1000 proteinové profilování lyzátové (zpětný formát) neznámý vzorek - proteinový lyzát antigeny známé protilátky >1000 proteinové profilování antigen čipy známé antigeny protilátky neznámý vzorek – protilátky v séru >1000 stanovení přítomnosti protilátek v séru funkční protein-protein známé proteiny v nativním, funkčním stavu nebo peptidy, nebo chemické látky partnerské molekuly interagující s proteiny nebo proteiny >100 studium interakcí proteinů s partnerskými molekulami protein-DNA, RNA protein-nízkomolekulární látky Enzym- substrát Využití §Studium biomarkerů – diagnostické, prognostické, prediktivní §Identifikace terapeutických cílů §Detekce autoprotilátek, studium imunitní odpovědi § §In vitro diagnostika – více než u ostatních typů čipů úNejčastěji diagnostika autoimunitních onemocnění úDiagnostika infekčních onemocnění ú ChIP-on-chip (Chromatin immunoprecipitation) ChIP-on-chip_wet-lab §Mapování vazby proteinů na DNA úNapř. transkripční faktory ú MeDIP-chip (Methyl-DNA immunoprecipitation) úStejný princip – imunoprecipitace s protilátkou proti 5-metyl-cytosinu ú