Sekvenční analýza doc. RNDr. Milan Bartoš, Ph.D. bartosm@vfu.cz Přírodovědecká fakulta MU, 2013 Obsah přednášky 1) Pojem sekvenování 2) Maxamovo-Gilbertovo sekvenování 3) Sangerova metoda s využitím fluoroforu 4) Pyrosekvenování 5) Nové přístupy k sekvenování 6) Sekvenování RNA 7) Sekvenování proteinů Doporučená literatura www.farmakogenomika.cz Sekvenování Rozhodující metoda pro stanovení nukleotidových sekvencí > Konečná fáze procesu individualizace jednotlivých izolátů > Metoda je pro většinu mikrobiologických aplikací pnlis presna Metody sekvenování nukleových kyselin Chemická metoda sekvenování (Maxamovo-Gilbertovo sekvencování) Enzymová metoda sekvenování (Sangerovo sekvenování) Pyrosekvenování Chemická metoda sekvenování (Maxamovo-Gilbertovo sekvenování) Podstatou je specifické štěpení molekuly ssDNA po modifikaci jednotlivých bází chemickými činidly s následnou elektroforetickou detekcí v denaturujícím polyakrylamidovém gelu. Chemická činidla jsou specifická pro modifikaci určitých bází: G A+G C+T C - DMS - piperidin - hydrazin - hydrazin + NaCI Chemická metoda sekvenování Příprava ssDNA a značení Modifikace bazí Štěpení ssDNA Odečtení výsledku Chemická metoda sekvenování Příprava ssDNA a značení 5 - GATCAGG - 3' 3 - CTAGTCC-5' Modifikace bazí Štěpení ssDNA Odečtení výsledku Asymetrická PCR Využití vazby biotinylovaného primeru 32 p 32P -GATCAGG - 3' Chemická metoda sekvenování Příprava ssDNA a značení Modifikace bazí Štěpení ssDNA Odečtení výsledku 32P -GATCAGG - 3' + DMS piperidin hydrazin Hydrazin + NaCI Chemická metoda sekvenování 32P -GATCAGG - 3' Příprava ssDNA a značení Modifikace bazí Štěpení ssDNA Odečtení výsledku DMS piperidin hydrazin Hydrazin + NaCI Štěpení piperidinem při vysoké teplotě CO ■o I o > —I o > o o CO ro ■o I o > H o > o o CO ro ■o I o > —I o > o o CO ro ■o I o > H O > o 32P -GATCAGG - 3' DMS 32 P -GATCAG 32P -GATCAGG + < piperidin 32 p 32 p 32 p 32 p + hydrazin Hyd raz i n + NaCI GA GATCA GATCAG GATCAGG 32P - GAT 32P 32P - GATC GATC Sangerova metoda d i d eoxy te rm i n áto ry 3' OH H Dideoxyterminátory 3' H H 3' H H Průběh sekvenování 1. denaturace (92-96°C) dsDNA 2. annealing (45-72X) 3. extenze (72°C) Průběh sekvenování 1. denaturace (92-96°C) dsDNA 2. annealing (45-72°C) 3. extenze (72°C) Výsledek sekvenování Následuje rozdělení fragmentů Následuje rozdělení fragmentů Sekvenování - záznam 'AAA6C CTGGGGTGCCTAATGAGTGA GC TA AC TCACATTAAT TGC GTTGC GC TCAC TGCCCGCT' 180 190 200 210 220 230 240 TTCCAGTCGGG 250 AAAC C TGTCGTGCC 260 A GC 1 n y 'GCATTA AT G A ATCGGC CA AC GCGCGGGGA GAG GC GG 0 280 290 300 5T TTGCGT 310 ATTGGGC GCTCTTCC GC 320 33C ľTCC TCGC TCAC T G AC T C GC T GC GC TC G GT C GT TC GGC TGi Kapilární gelová elektroforéza > rozdělí produkty sekvenování podle velikosti > detekuje fluorofory laserem Úkol V praktickém cvičení zařaďte na základě výsledků sekvenování izoláty bakterií čeledi Pasteurellaceae Prohlédněte si animaci na http://wwwnc.cdc.gov/eid/article/13/2/06-1032_article.htm Pyrosekvenování > Metoda popsaná Mostafa Ronaghi et al. v roce 1990 > Určena pro krátké úseky DNA, SNP a úseky metylované Polymerase v------ACCTTGAGTACCATCTAGGA 5»------TGGAACTCA PP, dATP ATP suífutylase -> (d)ADP Apyrase ATP Luciferase (d)AMP > 4 enzymy > velmi přesná > reakce se záhy „zahltí" Průběh pyrosekvenování (DNA)n + dXTP (DNA)n+1 + PPj DNA polymeráza Průběh pyrosekvenování Poíymerase 3>------ACCTTGAGTACCATCTAGGA y------TGGAACTCA PPi+ APS ATP + S042" ATP sulfuryláza Průběh pyrosekvenování Poíymerase V------ACCTTGAGTACCATCTAGGA 5»------TGGAACTCA (d)ADP (d)AMP ATP + luciferin + 02 AMP + PPl + oxyluciferin + C02 + světlo luciferáza Průběh pyrosekvenování Polymerase 3>------ACCTTGAGTACCATCTAGGA y------TGGAACTCA ATP suífutylase ATP Luciferase dXTP dXMP apyraza Parametry pyrosekvenování > žádné značené primery ani značené nukleotidy > žádná elektroforéza > Principem je uvolnění pyrofosfátu při syntéze DNA a emise viditelného světla na konci kaskády reakcí > Množství uvolněného světla je přímo úměrné množství zabudovaných nukleotidů > Namísto standardního ATP se používá 2-deoxyadenosin-5'-a-thio-trifosfát5 který není substrátem pro luciferázu > Rychlost sekvenování = 1 báze za minutu > Délka stanovené sekvence = 100 nukleotidů Pyrosekvenování - záznam Intenzita signálu odpovídá počtu začleněných nukleotidů Prohlédněte si animaci o pyrosekvenování na http://www.youtube.com/watch?v=jylCHBxTKkw&feature =related Sekvenování pomocí hybridizace > Nepřímá metoda využívající DNA čipu > > Výsledek odečten konfokálním mikroskopem Sekvence Q^^na dedukcí T A C G T A A T G C A T C G G C A T G T G A A C C T A C A G A A A C G C Otázka Kdyby byly na čipu naneseny 20 mery, kolik políček by musel obsahovat čip pro sekvenování 1 Mb? Prý celkem 1,112 x 106 Minisekvenování > Metoda využívající technologie DNA čipu > Využívá se pro stanovení jednoduchých nukleotidových polymorfismů > Více variant, metoda je automatizovaná, multiplexní SNP, (CG) (CC) qlql 91*1 9I9I TATA GCCG GCGC lil lllllllllll * O P Exl^rw PCR products • ONA Polymerase Mix o< labeHod ddNTPs 5' 6' Transcnbod RNA o*) labeled ♦ (averse transcriptase ♦ untabtfed oNTPs 4 ► T A CA li í SNP, SNPj SNP3 SNP, SNPj SNP3 TA CA GC CG AC GC í—I—r 7j AA CG CC SNP, -T-O \_ -V -g-O A. -G-0 Capture 9 9 9 í 9 9 r- ~> la a t. It. **00 00 Products ol pnmer oxtertson n solution Nature Reviews | Genetics Emulsní PCR > Amplifikace probíhá v emulsi (voda-olej) > DNA je fragmentována na úseky dlouhé 300-800 bp > Jednotlivé matrice jsou navázány samostatně na povrch jednotlivých kapek obalených primery Emulsní PCR > Amplikon je výsledkem jedinečné PCR > Méně nespecifických produktů ú oo 1 '—^ Conventional PCR Emulsion PCR Komerční aplikace emulsní PCR 454 sekvenční systém firmy Roche > Produkty PCR jsou sekvenovány pyrosekvenováním 454 sekvenční systém Základní kroky > Tvorba jednořetězcových DNA matríc > Připojení adaptérů a vazba na pevné částice > Amplifikace DNA matric v emulzi > Vytvoření sekvenčních dat > Analýza sekvencí různými nástroji bioinformatiky Podívejte se na komerční prezentaci na stránkách http://454.com/products/technology.asp 454 sekvenční systém Výsledný záznam Další moderní přístupy najdete na http://qrf.lshtm.ac.uk/sequenc inq.htm 454/Pyrosequencing (Roche) SOLEXA (lllumina) Sekvenování RNA Whole Transcriptome Shotgun Sequencing (WTSS) > je možno provést sekvenování cDNA a tím získat informaci o obsahu RNA v daném okamžiku života buňky Morin et al. (2008): Profiling the He La S3 transcriptome using randomly primed cDNA and massively parallel short-read sequencing". BioTechniques 45 (1): 81-94. Separace různých druhů RNA ...je prvním krokem při sekvenování RNA m RNA (polyA) ostatní (regulační geny) rRNA (90%) tRNA k separaci se používají nejčastěji magnetické kuličky s poly(T) Separace RNA Isolate Total RNA llllllllllllllllllllllll.......IIIIIIIIIIIIIMIIlAAAAAA Fragmentation and/or Isolation In this case, isolation via Poly(T) coated magnetic beads AAAAA/L mini Poly(A) RNA molecules bind to the Poly(T) magnetic beads Zpětná transkripce ...po separaci RNA následuje její fragmentace na krátké oligonukleotidy .... ... delší úseky RNA totiž tvoří sekundární struktury ... fragmentace ale není vždy nezbytná ... fragmentované molekuly jsou přepsány do cDNA ... ... která je následně podrobena sekvenování Zpětná transkripce Magnetically isolate and wash beads 1 Fragment and/or Reverse Transcribe Iiiiiiiiiiii.......11111 > 1111111 r 111.........niAAAAAA Fragmentation (if not done already), size selection, and sequence ............ TTTTTOwww "..................■"........... iiH|ihihi[ih|iiiii lllumina Solexa, Roche 454, or ABI SOLiD Graphic shown here is lllumina Na jaké fragmenty nastříhat RNA ? Délka čtení 454 lllumina SOUD Podrobnosti k moderním sekvenačním metodám v 5. ročníku Co s vzniklými fragmenty? > Poskládání do souvislých sekvencí > Porovnání s genetickými databázemi pre-mRNA Exon mRNA Short reads Short read is split by intron when aligning to reference Genome Intron Více uslyšíte v 5. ročníku (http://www.ncbi.nlm.nih.gov/) Přímé sekvenování RNA V průběhu přípravy cDNA vznikají artefakty i Snaha sekvenovat RNA přímo i Direct RNA Sequencing (DRSTM) i Helicos Biosciences (http://www.helicosbio.com/) Princip přímého sekvenování RNA > Připojení jednotlivé molekuly k ukotvenému oligo(dT) > Polymerace virtuálního terminátoru http://wwwTsc.org/chemistryworld/News/2009/September/23090903.asp Průběh přímého sekvenování RNA > Připojení k oligo(dT) > Fixace a uzamčení > Polymerace NTP s VT > Odmytí zbylých NTP > Zachycení fluorescence > Odštěpení VT > Polymerace dalšího NTP s VT Využití přímého sekvenování RNA Prvně použita k sekvenování m RNA ze S. cerevisiae Oszolak et al. (2009): Direct DNA sequencing. Nature 8;461(7265):814-8 Firma HelicosBiosciences doporučuje > Kvantitativní mapování polyA/Digitální genová exprese > Analýza transkriptomu > Kvantifikace RNA ve formalínových a parafínových preparátech > Malé RNA/nekódující RNA > Imunoprecipitace RNA > Charakterizace RNA na úrovni atomolů Otázka Jeden attomol, kolik je to molekul RNA o délce 300 a 500 nukleotidů? 1 mol = 6,023 x 1023 molekul 1 x 10'18 = 6,023 x 105 molekul Pro náruživé statistiky Statistical Design and Analysis of RNA Sequencing Data Auer a Doerge (2010): Statistical Design and Analysis of RNA Sequencing Data. Genetics 185:405-416 Novinky ze sekvenování RNA najdete na http://www.rna-seqblog.com/ Ale je to spíš o vyšších eukaryotech Komerční aplikace lllumina (TruSeq RNA Sample Preparation Kits) http://www.illumina.com/applications/sequencing/rna.il mn?source=transcriptome Invitrogen (Ion Total RNA-Seq Kit) http://products.invitrogen.com/ivgn/product/44 75936 Prohlédněte si animaci o lllumina na http://www.youtube.com/watch?v=l99aKKHcxC4&feature =related Otázka z června 2012 Zdroj http://seqanswers.com/forums/showthread.php?t=21016 Can we separate virus using small RNA sequencing? We have a plant material which infected virus. Now we want to know the detail information about the virus. How should we do? Can we use small RNA sequencing to separate it? Thank you! Sekvenování proteinů Sekvenování proteinů ... je stanovení sekvence aminokyselin v polypeptidovém řetězci > První protein, bovinní inzulín byl sekvenován v roce 1953 Frederikem Sangerem > Sanger obdržel Nobelovu cenu v roce 1958 Strategie sekvenování > Zjistit počet polypeptidových řetězců (podjednotek) > Určit počet disulfidických můstků (uvnitř řetězce a mezi řetězci) > Stanovit sekvenci aminokyselin každého z retezcu > Je-li podjednotka příliš dlouhá, fragmentovat na kratší polypeptidy > Sekvenovat fragmenty metodou podle Edmana > Poskládat sekvence analýzou překryvů Analýza koncových skupin > Počet podjednotek lze zjistit podle počtu C konců > Analýza N konců - Dansyl chlorid - Fenylisothiokyanáť Edmanovo reagens - Aminopeptidáza > Analýza C konců - Karboxypeptidáza úsek DNA do sekvence aminokyselin, vyznačte C a N konec kódující DNA-řetězec: 5 - ATG AAA TAC GCT CCC TTA AAA - 3 antikódující DNA-řetězec: 3'- TAC TTT ATG CGA GGG AAT TTT - 5' Tabulka genetického kódu: AAA - Lys GCA -Ala AAU - Asn GCU -Ala ACU -Thr GGG -Gly AUG -Met UAC - Tyr CGA -Arg UGA - Term CGU -Arg UUA - Leu CCC - Pro UUU -Phe N - Met - Lys - Tyr - Ala - Pro - Leu - Lys - C Analýza N konců dansyl chloridem > Hlavní reagencie: 1-d i m etyl aminoftalen-5-sulfonyl chlorid (dansyl chlorid) > Příprava dansylovaného polypeptidu > Kyselá hydrolýza - uvolnění všech AA a N-koncové dansylované AA > Separace aminokyselin > Detekce fluoreskující dansylované AA > Porovnání s dansylovanými standardy AA ^V/V «1 0 R, O R, 0 ^| II II II + MjN — CM — C —MN—CH—C—HM — CH—C--- t «iini»^hlb**«n» i wiltmr|t tMoiid* M,0* nj j:ft 0 J, O R) O HN — CM — C — OH + H,li —CH-C-OM + H,li — CH-C— OH + Analýza N konců podle Edmana I Metoda degradační > Nukleofilní atak fenyl izothiokyanátu, Edmanovo reagens, v mírném alkalickém prostředí (N-metylpiperidin/voda/metan ol) > Tvorba fenylcarbamyl derivátu (PTC-peptid) pne ľ- S ľj í ľ5 ? H;Ň— CH—C—HN —CH —C —HN —CH —C-polypeptlde HjO4 11 l/s i2 I r | jj —HŇ —CM —C—HN - CM —C —HN —CH —C---- S*Vv>^*^-_>,^ PTC p6lyp«pii Kyselina trifluoro octová (TFA) štěpí koncovou aminokyselinu - vzniká thiozolinový derivát a zbylý nemodifikovaný peptid > Thiozolinový derivát je extrahován organickým rozpouštědlem (např. N-butyl chloridem) > Zbylý nemodifikovaný peptid nese volnou koncovou aminokyselinu rif. ŕš ľ2 B "3 0 ;.-Hfl-ČH—C-HN-CH-C-HN-CH-C---- PTC potyptptlde anhydrou* trifluoroac«tic atid (FjCCO)20 V * HNPh In.w..li,,..i,,, deiiv.itiv* R2 0 R3 0 . r 1 i n HjN —CH —C—HN — CH — C— c—o I Peptide chain 9 P 9 9 N N—H N—H W«k O N 5 jqueuut acid C (. C Cr=S C n s y—c—k s M.i.i..»..i, c—O TTA R— CH -¥ < \ / II—c—c it—A r—j* *—«• K-Aj {"° C-O -J H-V it i R —CH .H H— N | |^ R'-CH C=0 C-O I ■ I Pepcid* chuin ooe-midur Analýza N konců podle Edmana III >Thiozolinový derivát extrahovaný v organickém rozpouštědle je opracován kyselinou (25% TFA) -vzniká derivát fenylthiohydantoinu (PTH) > PTH je detekován na základě absorbce UV při 296 nm > PTH AA je separována chromatograficky nebo elfo > AA je detekována podle retenčního času nebo hmotnosti > Sekvenci lze opakovat 40-60x 1 A H HNPh ihi.izolinone Exopeptidázy štěpí AA od konců řetězce > Aminopeptidázy od N-konce > Karboxypeptidázy od C-konce > Oba enzymy jsou vysoce specifické, ale pracují pomalu a některé AA jimi nelze odštěpit 1 1 lJ HjN— CH—C — HN —CH Hj 0 1 1 II — C —HN —CM —C— Polypeptid« Aminopeptldese i P, 0 HjN-CH-C-O- + Hjň R? 0 R, o II I3 1 — CH—C —HN —CH —C---- R«-2 0 1 » ----HN —CM —C—HN — 0 R0 0 1 II ID CH —C—HN—CM —C—0* Polypeptide CaiboxypoplidiKC ■ 1 0 1 •• -HM —CH—C —HN —CH- 0 R„ 0 ■c—o + njh — cm—c—o Štěpení disulfidických můstků > Redukce na thioly prostřednictvím dithiothreitolu nebo 2-merkaptoetanolu > Thioly jsou opracovány alkylačními činidly (např. kyselinou jodooctovou), aby se zabránilo reoxidaci během následujících kroků o II — HN — CH — C — I CHj I CH, I •HN —CH —C— I 0 cywln í 2HSCH2CH3OH Aineic-ipHinth.inol — MN —CH —C---- I CH2 I r CH, I — HM —CH—C---- R n SCHjCHjOH SCH^CHjOH CHjSH CH,OH N CH2OH CH,SH ilitluoihcfHlol (DT11 Účinně sekvenovat lze do 50 aminokyselin, pak se reakce zahltí zplodinami ^ Pracujte s fragmenty Jak získat fragmenty? Trypsin > Štěpí pozitivně nabité AA (Arg nebo Lys), jestliže další AA není prolin > Štěpí od C-konce Endopeptidázy > Pepsin; štěpí u N-konce Phe, Tyr, Trp není-li předchozí AA prolin > Chymotrypsin: štěpí u C-konce Phe, Trp, Tyr jestliže další AA není prolin > Endopeptidáza GluC: štěpí u C-konce Glu Jak získat fragmenty? Exopeptidázy > Leucin aminopeptidáza: štěpí N-koncovou AA leucin, neštěpí N-koncový prolin > Aminopeptidáza M: štěpí všechny AA od N-konce > Karboxypeptidáza A: štěpí všechny AA kromě Arg, Lys, and Pro, zvlášť účinná pro AA s alifatickými a aromatickými postranními řetězci, neštěpí je-li následující AA prolin > Karboxypeptidáza B: štěpí C-koncový Arg a Lys, není-li následující AA prolin > Karboxypeptidáza C: štěpí aminokysliny od C-konce Existují i chemické metody štěpení uvnitř polypeptidových řetězců . Cyanogen bromid Jak rozdělit fragmenty? Tradiční metody > Separace podjednotek po štěpení S-S můstků metodou SDS-PAGE nebo HPLC > Zapotřebí hmotnostní standardy a kalibrační křivka > Přibližný počet AA ve fragmentu lze určit z molekulové hmotnosti fragmentu/110 Moderní postupy > MALDI - přesnější a rychlejší Stanovení sekvence aminokyselin 1) Získání fragmentů více metodami 2) Sekvenování jednotlivých fragmentů 3) Poskládání fragmentů s využitím překryvů trypsin <-> <-><-> Ala-Phe-Lys-Asp-Met-Cys-GIn-Arg-Leu-Pro-Met-Ser-GIn <-><-> <-> CNBr Stanovení pozice S-S můstku 1) Fragmentace polypeptidových řetězců 2) 2D gel směsi fragmentů, stejné podmínky v obou rozměrech 3) Po separaci v prvním rozměru opracovat kyselinou permravenčí, která štěpí všechny S-S můstky 4) Separace ve druhém rozměru - Fragmenty bez S-S můstku se rozmístí podél diagonály - Fragmenty s S-S můstky vytvoří spoty mimo diagonálu - Fragmenty s S-S můstky lze z gelu extrahovat a sekvenovat Příklad analýzy proteinových komplexů A kDa Not Boiled, SDS-PAGE -► 250 — 150 — 100 — 75 — 50 — 25% TFE. SDS-PAGE 37 — 25 -20 — X B kDa Boiled, SDS-PAGE -► 250 — 150 — 100 — 75 — St N> C'i - o tí' -1 50 — Fr SI 25 -20 — DS-PAGE , 1 Gubbens et al. (2008): Protein complexes in bacterial and yeast mitochondrial membranes differ in their sensitivity towards dissociation by SDS. Biochimica et Biophysica Acta (BBA) - Proteins & Proteomics 1784 (12), 2012-2018. Sekvenování MALDI-TOF matrix-assisted laser desorption ionization time-of- flight > varianta hmotnostní spektrometrie > peptidy jsou ionizovány a stanoví se poměr hmoty k náboji na základě doby letu (time-of-flight) k detektoru > vypočte se M a ta je specifická pro každou aminokyselinu Tim»-ot-flight mast sptc Schéma zařízení Target plate spotted with proteins of interest Pulsating light Detection Sample plate / \ Laser Reflection / r -IÜ -in ■ i in 11 ■ i in ■ ■■■ an Ionisation 1 Protein identification Záznam z MALDI-TOF ^UUJU I5LÜLI 10030 5ÜL0 ■"j n Ol W yn i— m cz I.-. n i n j '-Y ill ■r- i-- c 'jI "-J Jl T ■=■ ů "'. u'r rn U. LLi-b. «■!> -- Vr1 u'r i ^1 i 11 DD 16D0 21CÜ Shotgun protein sequencing > Tento koncept vycházející z analogie pro sekvenování DNA se objevil v roce 2007 > Byla zpracována data získaná ze směsi proteinů sekvenovaných hmotnostní spektrometrií > Analýza podobně jako v případě práce s DNA Bandeira et al. (2007): Shotgun Protein Sequencing. Molecular & Cellular Proteomics 6:1123-1134. Kolik materiálu potřebujeme na analýzu? > limit je kolem 2 pmol, tj. asi 1010 molekul > protein by měl být co nejčistší (purifikace HPLC) Shrnutí 1) Pojem sekvenování 2) Maxamovo-Gilbertovo sekvenování 3) Sangerova metoda s využitím fluoroforů 4) Pyrosekvenování 5) Nové přístupy k sekvenování 6) Sekvenování RNA 7) Sekvenování proteinů