Sekvenování nukleových kyselin a analýza DNA sekvencí doc. RNDr. Milan Bartoš, Ph.D. bartosm@vfu.cz Přírodovědecká fakulta MU, 2015 Obsah přednášky 1) Pojem sekvenování 2) Maxamovo-Gilbertovo sekvenování 3) Sangerova metoda s využitím fluoroforu 4) Pyrosekvenování 5) Next generation sequencing 6) Third generation sequencing 7) Příklad reálné analýzy 4ft Doporučená literatura www.farmakogenomika.cz Sekvenování Rozhodující metoda pro stanovení nukleotidových sekvencí > Konečná fáze procesu individualizace jednotlivých izolátů > Metoda je pro většinu mikrobiologických aplikací pnlis presna Metody sekvenování nukleových kyselin Chemická metoda sekvenování (Maxamovo-Gilbertovo sekvencování) Enzymová metoda sekvenování (Sangerovo sekvenování) Pyrosekvenování Chemická metoda sekvenování (Maxamovo-Gilbertovo sekvenování) Podstatou je specifické štěpení molekuly ssDNA po modifikaci jednotlivých bází chemickými činidly s následnou elektroforetickou detekcí v denaturujícím polyakrylamidovém gelu. Chemická činidla jsou specifická pro modifikaci určitých bází: G A+G C+T C DMS piperidin hydrazin hydrazin + NaCI Chemická metoda sekvenování Příprava ssDNA a značení Modifikace bazí Štěpení ssDNA Odečtení výsledku Chemická metoda sekvenování Příprava ssDNA a značení 5'- GATCAGG - 3 3'- CTAGTCC - 5 Modifikace bazí Štěpení ssDNA Odečtení výsledku Asymetrická PCR Využití vazby biotinylovaného primeru 32 p 32 P - GATCAGG - 3 Chemická metoda sekvenování 32 Příprava ssDNA a značení P - GATCAGG - 3 Modifikace bazí Štěpení ssDNA Odečtení výsledku O + DMS piperidin hydrazin Hydrazin + NaCI Chemická metoda sekvenování 32 P - GATCAGG - 3 Příprava ssDNA a značení Modifikace bazí Štěpení ssDNA Odečtení výsledku DMS piperidin hydrazin Hydrazin + NaCI Štěpení piperidinem při vysoké teplotě N) -o I o > N) -o I o > N) -o I o > N) I O > o > o o o > o o o > o o o > o o 32P - GATCAGG - 3' DMS 1 GATCAG GATCAGG + < piperidin i 32 p 32 p 32 p 32 p O + hydrazin i GA GATCA GATCAG GATCAGG Hydrazin + NaCI 32P - GAT 32P 32P - GATC 1 GATC A+G T+C Reálný výsledek chemické metody sekvenování o »- O O H o Převzato z: Site-specific DNA transesterification catalyzed by a restriction enzyme Giedrius Sasnauskas*, Bernard A. Connollyf, Stephen E. Half ord}, and Virginijus Siksnys*§ ^Institute of Biotechnology, Graiciuno 8, Vilnius, LT-02241, Lithuania; flnstitute for Cell and Molecular Biosciences, University of Newcastle, Newcastle upon Tyne NE2 4HH, United Kingdom; and {Department of Biochemistry, School of Medical Sciences, University of Bristol, University Walk, Bristol BS8 1TD, United Kingdom Úkol Z výše uvedeného záznamu odečtěte výslednou nukleotidovou sekvenci Výsledek bude tedy asi tento CTg ggC TgC TgA ACC AgC CCA gCA gCC Cag Tg Sangerova metoda d i d eoxy te rm i n áto ry 3' OH H Dideoxyterminátory 3 H H 3 H H Průběh sekvenování 1. denaturace (92-96°C) dsDNA 2. annealing (45-72°C) 3. extenze (72°C) Průběh sekvenování 1. denaturace (92-96°C) dsDNA 2. annealing (45-72°C) 3. extenze (72°C) Výsledek sekvenování Následuje rozdělení fragmentů Následuje rozdělení fragmentů Sekvenování - záznam 'A AAGC CTG GGGTGC CTAATGAGTGA GC TA AC TC AC A T TAAT T GC GTTGC G C TCAC TGCCC GCT' 180 190 200 210 220 230 240 TTCCAGTCGGG A A AC CTGTC GTGCCAGC TGCATTA ATGA ATCGGC CA AC GCGCGGGGA GAG GC GC 250 260 270 280 290 300 5T TTGC G TATTGGGC GCTCTTCC GC TTCCTCGC TCAC T G AC TC GC T GC GC TC G GTC GTTCGGC TGf 310 320 330 340 v 350 360 37C Kapilární gelová elektroforéza > rozdělí produkty sekvenování podle velikosti > detekuje fluorofory laserem Úkol Na základě výsledků sekvenování zařaďte izoláty bakterií čeledi Pasteurellaceae Použijte výukový materiál Pyrosekvenování > Metoda popsaná Mostafa Ronaghi et al. v roce 1990 > Určena pro krátké úseky DNA, SNP a úseky metylované Polymerase 3'------ACCTTGAGTACCATCTAGGA 5>------TGGAACTCA ATP sulfuryiase -> (d)ADP Apyrase (d)AMP > 4 enzymy > velmi přesná > reakce se záhy „zahltí" Průběh pyrosekvenování II v (DNA)n + dXTP (DNA)n+1 + PP; DNA polymeráza Průběh pyrosekvenování Polymerase 3'------ACCTTGAGTACCATCTAGGA y------TGGAACTCA (d)ADP I (d)AMP PPi+ APS ATP + S042 ATP sulfuryláza Průběh pyrosekvenování Polymerase 3'------ACCTTGAGTACCATCTAGGA y------TGGAACTCA (d)ADP (d)AMP ATP + luciferin + 02 AMP + PPS + oxyluciferin + C02 + světlo luciferáza Průběh pyrosekvenování Polymerase 3'------ACCTTGAGTACCATCTAGGA y------TGGAACTCA ATP sulfurylase dXTP dXMP apyraza Parametry pyrosekvenování > žádné značené primery ani značené nukleotidy > žádná elektroforézal > Principem je uvoln a emise viditelnéhd > Množství uvolněné množství za budova > Namísto standardní 2-deoxyadenosin-J který není substrát Polymerase 3'------ACCTTGAGTACCATCTAGGA y------TGGAACTCA ATP sulfuryiase > Rychlost sekvenování = 1 báze za minutu > Délka stanovené sekvence = 100 nukleotidů Pyrosekvenování - záznam nucleotide sequence G C - A GG CC T G C T A G C T nucleotide added Intenzita signálu odpovídá počtu začleněných nukleotidů Sekvenování pomocí hybridizace > Nepřímá metoda využívající DNA čipů > Výsledek odečten konfokálním mikroskopem > Sekvence Q^^?na dedukcí Otázka Kdyby byly na čipu naneseny 20 mery, kolik políček by musel obsahovat čip pro sekvenování 1 Mb? Prý celkem 1,112 x 106 Minisekvenování > Metoda využívající technologie DNA čipu > Využívá se pro stanovení jednoduchých nukleotidových polymorfismů > Více variant, metoda je automatizovaná, multiplexní (AA) SNP, (CG) SNP3 |CC| TATA GCCG GCGC ._ o o 9l9l 9\P\ 9l9l ......Illlllll ^ C~ _ .............I ' P P E~. PCRproducis A » DNA potymera» • i bbtM ddNTPs SNP, SNP2 SNP3 -TA CA GC CG AC GC Extension I—I V Transcnbed RNA Onolabetod * reverse trarecriptase ♦ unlabaíed oNTPs AA CG CC SNP, SNP2 SNP3 I ~; w SNP, -T-O \___ O O N-G-Q T T SNP2\ SNP, —G-O Capure "N-c-O o G \ O o \ AA CC CC SNP, SNPj SNP3 AA CG CC Products ot pnmer □xtenson ii Solution Náturo Reviews I Genetice Next generation sequencing (NGS) methods (Vysokokapacitni sekvenování) Základní pojmy > Read (čtení) - souvislá DNA sekvence produkovaná sekvenačním procesem (sekvenátorem) > Coverage (pokrytí) - počet vzájemně se překrývajících čtení v dané oblasti genomu (kolikrát je přečten příslušný úsek nebo baze) > Konvenční sekvence (consensus sequence) - idealizovaná sekvence, ve které je každá pozice reprezentována nejčastěji nacházenou bází při porovnávání více různých sekvencí dané oblastí > Contig (kontig) - sada překrývajících se segmentů DNA (čtení) tvořících souvislou (nepřetržitou) konvenční sekvenci > Assembly (skládání) - zarovnávání a překrývání DNA sekvencí (čtení, kontigů) za účelem rekonstrukce původní sekvence DNA molekuly v plné délce > Scaffold - sada propojených nesouvislých (přetržitých) sérií genomových sekvencí skládajících se z kontigů oddělených mezerami (gaps) známých délek Charakteristika NGS > Moderní, vysokokapacitní (high-throughput) technologie sekvenování DNA > Masivní, paralelní, rychlé ... > Snižující se cena, čas, složitost protokolů, četnost chyb — > Zvyšující se množství a kvalita dat, počet a délka čtení (kapacita úložišť dat), repertoár potřebných bioinformatických metod > Široká škála aplikací Čím se liší „Next generation sequencing" od „Third generation sequencing" (TGC)? Sekvenování z jedné molekuly, v reálném čase, in situ, méně (bio)chemie Ur Vstupní materiál pro génom i ku DNA > De novo sekvenování genomu > Resekvenování (ChIP-Seq) > Sekvenování amplikonů (16S) > Sequence capture > Detekce modifikace bazí > Variace genomové informace virová eukaryotická jaderný genom °8§oo °ooo * genom s mitochondrií prokaryotická chromozóm plasmidy O Vstupní materiál pro transkriptomiku RNA Celková RNA Kódující RNA 4 % of total Funkční RNA 96 % of total Pre-mRNA (hnRNA) mRNA tRNA Všechny organismy Pouze eukaryota miRNA siRNA > Sekvenování mRNA > (Whole Transcriptome Shotgun Seq - WTSS) > Detekce polymorfismů (SNP) > Sekvenování dalších typů RNA (miRNA) > Kvantitativní expresní analýza Proces sekvenování mRNA polyA tepelná zpětná Total mRNA selekce mRNA fragmentatace Fragmentova transkripce RNA odstranění ná mRNA rRNA cDNA normalizace -► Normalizovaná cDNA příprava sekv. knihovny L T gace adaptoru selekce fragmentů Sekvenačn í knihovna sekvenace Závisle na aplikaci Sekvenování DNA Kvalita RNA > Kvalita vstupní celkové (total) RNA - RNA integrity number (RIN) > RIN < 7 => nerovnoměrná distribuce čtení podél transkriptu (mezi 5' a 3'- konci) Crtp T UTB ( r, r I,r■' I -,fi || ir-ri, f (i ( N't) 31 => snížená kvalita sekvenačních dat i.:oo » too no los no 100 1« 400 «n ".od md §00 too jw odo mo mu no [FU] 50- RIN > 9 á? [FU] 10- RIN < 7, n-1—1—1—1-r— 25 200 1000 4000 'V [nt] ~l-1—I-1-1-1 25 200 1000 4000 l'i ily t\ lull w too m »10 nil mo no •» iu too m Distribuce délek čtení u 454 technologie Záznam kvality RNA Agilent Bioanalyzer [nt] Syntéza cDNA Celková RNA (ug) mRNA with polyA 3'end SMARTer IIA Oligo: 5'-AAGCAGTGGTATCAACGCAGAGTACGCGGG-3' Poly A+RNA SMARTer IIA Oligonucleotide 5 \y\y\z\y\y\urvy\ur\y\y\^ polyA 3' CDS primer First-strand synthesis by SMARTScribe RT 5 \y\y"yy\/>y\/\y\/\y\/v polyA tailing by SMARTScribe RT 5' vOQQSfc 5 vry-rv-rv'rs*/ns"^^ polyA * 1$f&- Template switching and extension by SMARTScribe RT \s^/\s^n*s\/\s\/\s>~r>- polyA Single step Amplify cDNA byLD PCR with PCR primer Double-stranded cDNA Normalizace cDNA > Za účelem zisku vyrovnaného počtu čtení všech transkriptů nezávisle na míře jejich exprese > Analýza méně četných transkriptů (rare transcripts) ds cDNA ■AAAAA[ ■TTTTTI -AAAAA[ -TTTT abundant transcripts ĽZ3 AAAAA I-1 IZZ1-TTTTTI -AA.A.Wr ■TTTTTC ■AAAAA[ ■TTTTTI -AAAAA[ -TTTT~[ ds cDNA hybrids generated by abundant and intermediate transcripts •AAA AAI —TTTTTC - AAAAAI TTTTTC r_zi izzi- degradation of ds cDNA hybrids I ■AAAAA[ ■TTTTTC -AAAAA[ "TTTT[ denatu ration rare transcripts -AAAAAI-1 ] TTT" ■ AAAAAl-1 -TTTTTC hybridization -ÍAA.ÍA I I ■TT Tl ■AAAAAl-1 ^—TTTTTC equalized ss DNA fraction DSN treatment ■AAAAA i-1 -TTTTTI ■AAAAAl-1 -TTTTTC equalized ss DNA fraction PCR ■AAAAA ■TTTTT 1—1 -AAAAAl-1 ~TTTT[ -AAAAA[ ■TTTTTC TRIMMER cDNA Normalization Kit (Evrogen) DSN = duplex-specific nuclease Současné sekvenační platformy > Roche/454 (GS FLX+/GS Junior) > lllumina Genome Analyzer (H iSeq/M iSeq/NextSeq) > Life Technologies (3500 Genetic Analyzer, Ion Torrent Proton/PGM) > Pacific Biosciences (PACBIO RSII) > Applied Biosystems (SOLiD, 3730x/ DNA Analyzer) 1 Sekvenovani ligacl Oligo Ligation Detection (SOLiD) Ligation cycle Octurner probe* with tour different J' label* 0 » A 0 ,. A gtnnn agnnn tannn , A , ttnnn''■ 3 A > gcnnn*"• A GANNN 0 A <^ f\ 0 gannn-*• i ft AANNN j, Sequencing primer a acgacgctcttccgatctaannn tgctgcgagaaggctagattcaacgaggagctttgcactagccttctcgagcatacg Target tequonce acgacgctcttccgat TGCTGCGAGAAGGCTi DNA ligat gannn »• a aannn gaggagctttgcactagccttctcgagcatacg P Hybridization 1 Ligation > A m Washing acgacgctcttccgatctaagtt* • • Dephosphorylation ^tgctgcgagaaggctagattcaacgaggagctttgcactagccttctcgagcatacg^ Imaging Remaining 5-mor with 5' phoephete group / acgacgctcttccgatctaagtt tgctgcgagaaggctagattcaacgaggagctttgcactagccttctcgagcatacg »' 3* Cleavage Sequencing pnmor shifts 1m sequencing primer >f acgacgctcttccgatctaagttgctcctcgaaacgtgatcgg tgctgcgagaaggctagattcaacgaggagctttgcactagccaactcgagcatacg j, 2"* sequencing primer v s, acgacgctcttccgatctaagttgctcctcgaaacgtgatcg tgctgcgagaaggctagattcaacgaggagctttgcactagccaactcgagcatacg »• _ 1' j, 5* Mquenclng primer ♦ bridge probe v acgacgctcttccgatctajusttgctcctcgaaacgtgatcggt tgctgcgagaaggctagattcaacgaggagctttgcactagccaactcgagcatacg • ' »• Ligation cycle Ligation cycJe Ligation cyde Reversible Terminator (HiSeq, MiSeq, NextSeq) Generovanf klastru na povrchu sekvenacni flow-celly ATTACH DMA TO SURFACE BRIDGE AMPLIFICATION FRAGMENTS BECOME DOUBLE DENATURE THE DOUBLE-STRAND ED COMPLETE AMPLIFICATION STRANDED MOLECULES Reversible Terminator (HiSeq, MiSeq, NextSeq) Sekvenování syntézou Modified polymerase Incorporation Sequencing primer 5' ACACTCTTTCCCTACACGACGCTCTT TAGATGTGAGAAAGGGATGTGCTGCGAGAA Blocked and labeled nucleotides O CAGGAGCATTGCACTAGCCTTCTCGAGCATA 5' Target sequence Laser excitation 5' ACACTCTTTCCCTACAjľGACGCTCTTCCGATCÄ TAGATGTGAGAAAGGGATGTECTGCGAGAAGGCTAGäScGTTGCAGGAGCATTGCACTAGCCTTCTCGAGCATA 5' Imaging Filters A,C,G,T Remove fluorophore/blockage j 5' ACACTCTTTCCCTACACGACGCTCTTCCGATCTT 3' TAGATGTGAGAAAGGGATGTGCTGCGAGAAGGCTAGAACGTTGCAGGAGCATTGCACTAGCCTTCTCGAGCATA 5' Pyrosekvenování (GS FLX, GS Junior) 454 sekvenční systém firmy Roche > Sekvenují se produkty emulsní PCR Emulsní PCR CaUbaodsmin s E —o—r M PSV1 T. Amplifikace probíhá v emulsi (voda-olej) > DNA je fragmentována na úseky dlouhé 300-800 bp > Jednotlivé matrice jsou navázány samostatně na povrch jednotlivých kapek obalených primery Emulsní PCR > Amplikon je výsledkem jedinečné PCR > Méně nespecifických produktů a ...............y.............. J i \CJ Si b \ 1 ..... c \ / \ ) Conventional PCR Emulsion PCR Proces přípravy vzorku pro 454/Roche Příprava sekvenační knihovny Fragmentace Ligace adaptoru 454 sekvenční systém Základní kroky > Tvorba jednořetězcových DNA matríc > Připojení adaptérů a vazba na pevné částice > Amplifikace DNA matríc v emulzi > Vytvoření sekvenčních dat > Analýza sekvencí různými nástroji bioinformatiky Podívejte se na komerční prezentaci na stránkách http://454.com/products/technology.asp 454 sekvenční systém Výsledný záznam 4-flMf 3-m»r 2-me r 1-m*r J* ■ ■ A l s............... >.................-------------- 'ILL mm TTCTGCG 1 1,1 It Další moderní přístupy najdete na http://qrf.lshtm.ac.uk/sequenc inq.htm ''o 454/Pyrosequencing (Roche) Přehled stávajících a nových technik celogenomového sekvenování 7 DNA r r Amplification followed by mass spectrometry In vitro cloning T Sequencing by synthesis T Hybridization and ligation Jurinke et al. (2002) In vivo cloning ( ^ r i r r ^ 454 Solexa Polony MPSS ^ J L J I > ^ J Margulies et al. Bennett et al. Shendure et al. Brenner et al. (2005) (2005) (2005) (2000) Sanger method Sanger et al. <1977> Single molecule X Arrayed fragments Nanopore readers Braslavsky et al. (2003) Kasianowicz et al.(1996) J Hall N J Exp Biol 2007;210:1518-1525 Paired-end x Mate-pair > Paired-end - sekvenování z obou konců fragmentu DNA (< 1 kb) > Mate-pair - molekuly (3-20 kb) circularizované prostřednictvím vnitřního adaptoru Genomic DNA Frag ment (200-500bp> AI c SP1 3P2 I Ligate Adaptors SP2 A2 , Generate Clusters SP2 A2 »PI A1 s Sequence First End Clusters and Paired End Figure 1-2-1 Pipeline of paired-end sequencing (www illumina.com) X Paired-end x Mate-pair > Mate-pair - molekuly (3-20 kb) circularizované prostřednictvím vnitřního adaptoru > Usnadnění skládání (u De Novo genomových projektů) a b c lllumina Roche 454 SOUD Porovnání 454 a polony (SOUD) TSel nomic BW (1) Sheering to small fragments prime připojení adapterů destička pyrosekve (2a) Linker attachment (3a) Amplification 4 (ji J ý ^ (4a) Beads applied to picotiter ptáte fm •.•>••> ».•.».•>.•>.•».•>. ►•«••••••••• • • • • • •!• •!• • •> novani (5a) Pyrosequenang by primer extension (2b) Circularization and linker attachment (3b) Amplification on ePCR beads 1 (4b) Beads immobilized in a monolayer In an acrylamtde matrix (5b) Ligation with oligo pools added in cycles ^n^ou^cojo^ma^ino^^^^^^^^^^^^ cirkulalizace a linearizace monovrstva na PAGE ligace značených oligo Hall N J Exp Biol 2007;210:1518-1525 Porovnání parametrů - princip, výkon, přesnost, doba Sequencer 454 GS FLX HiSeq 2000 SOUDv4 Sanger 3730x1 PacBio RSII Sequencing Pyrosequencing Sequencing by Ligation and two-base Dideoxy chain Sequencing by mechanism synthesis coding termination synthesis Read length 700 bp 50SE, 50PE. 101PE 50 + 35 bp or 50+ 50 bp 400-900 bp > 4000 bp Accuracy 99.9%* 98%,(100PE) 99.94% * raw data 99.999% 99,999% Reads 1M 3G 1200-1400 M — 0.06 M Output data/run 0.7 Gb 600 Gb 120 Gb 1.9-84 Kb 1.6 GB Time/run 24 Hours 3-10 Days 7 Days for SE 14 Days for PE 20Mins-3Hours 30 Min - 3 Hours Advantage Read length, fast High throughput Accuracy High quality, long read length Read length, fast, no amplification, Error rate with real time record Disadvantage polybase more than 6, high cost, low Short read assembly Short read assembly High cost low throughput Low throughput, low accuracy throughput Liu et al. 2012. Comparison of Next-Generation Sequencing Systems. Journal of Biomedicine and Biotechnology. 251364. Porovnání parametrů - náklady, výkon, aplikace Sequencers 454 GS FLX HiSeq 2000 SOLiDv4 3730x1 Instrument price Instrument $500,000, $7000 per run Instrument $690,000, $6000/(30x) human genome Instrument $495,000, $15,000/100 Gb Instrument $95,000, about $4 per 800 bp reaction CPU 2* Intel Xeon X5675 2* Intel Xeon X5560 8* processor 2.0 GHz Pentium IV 3.0 GHz Memory 48 GB 48 GB 16 GB 1GB Hard disk LI TB 3 TB 10 TB 280 GB Automation in library preparation Yes Yes Yes No Other required device REM e system c Bo t system EZ beads system No Cost/million bases $10 $0.07 $0.13 $2400 Sequencers 454 GS FLX HiSeq 2000 SOLiDv4 3730x1 Resequencing Yes Yes De novo Yes Yes Yes Cancer Yes Yes Yes Array Yes Yes Yes Yes High GC sample Yes Yes Yes Bacterial Yes Yes Yes Large genome Yes Yes Mutation detection Yes Yes Yes Yes Liu et al. 2012. Comparison of Next-Generation Sequencing Systems. Journal of Biomedicine and Biotechnology. 251364. Porovnání parametrů - stolní varianty přístrojů PGM MiSeq Junior Output 10MB-100MB I20MB-1.5GB 70 Mb Read length ~ 200 bp Up to 2 x 150 bp 700 bp Sequencing time 2 hours for 1 x 200 bp 3 hours for 1 x 36 single read 18 hours 27 hours for 2 x 150 bp pair end read Sample preparation time 8 samples in parallel, less than 6 hrs As fast as 2 hrs, with 15 minutes hand on time 2 days Sequencing method semiconductor technology with a simple sequencing chemistry Sequencing by synthesis (SBS) Pyrosequencing Potential for development Various parameters Limited factors, major concentrate in flowceU surface Minimize hand on time, (read length, cycle time, accuracy, etc.) size, insert sizes, and how to pack cluster in tighter increase emPCR reproducibility Input amount Hi Ng (Nextera) Data analysis Off instrument On instrument On/Off instrument Liu et al. 2012. Comparison of Next-Generation Sequencing Systems. Journal of Biomedicine and Biotechnology. 251364. Aplikace a využitelnost > de novo DNA/RNA sekvenace - lllumina, Roche/454 (PE), PacBio > Resekvenování - SOUD, lllumina > Detekce SNPs - Roche/454, PacBio (x InDels variation -lllumina, SOUD) > Sequence capture - lllumina > Sanger - sekvenování konkrétních regionů s nízkým pokrytím (diagnostické genotypování), sekvenování malých genomů (plasmidy, viry, fágy ...) > Ion Torrent - kratší amplikony > SOUD - kvantitativní aplikace, malé RNA, epigenomika > HeliScope - kvantitativní aplikace, malé vstupní množství (single molecule) > Kombinace metod? Analýza dat, skládání, anotace Full Bioinformatics Analysis and Reporting DNA Sequencing Data Analysis RNA Sequencing Data Analysis Resequencing/ Profiling de novo mRNA Analysis I II Image Acquisition Quality Metric Assignment I Data Filtering miRNA Analysis Alignment Contig Building J I Contiq Buildin 1 miRNA Base Com I Consensus Calling Scaffold Building Tag Counting Annotation Annotation Annotation notation SNP ID Data Reporting Novel miRNA Prediction I miRNA Target Prediction Analýza dat, skladaní, anotace > Software od výrobce dané technologie (uživ. jednoduché, neefektivní) > Obecné, volně dostupné programy (najít ten správný, porovnat více) > Vyvinutý uživatelem pro danou aplikaci (kvalifikovaní bioinformatici) > Kombinace dat z různých platforem x problém pro assemblery > Specifické chyby technologií, specifické nastavení parametrů analýz > Vícestupňové filtrování dat Sekvenování mikroorganismů > První virus - fíX 174 v roce 1977 > První sekvenovaný mikroorganismus = Haemophillus influenzae, 1995, TIGR > Následovaly Mycoplasma genitalium 1995, Methanococcus jannaschii 1996, Helicobacter pylori 1997, Escherichia coli 1997, Mycobacterium tuberculosis 1998 > První eukaryotický organismus Saccharomyces cervisiae 1996 > V současnosti jsou v databázích stovky sekvencí > Podívejte se na http://www.ncbi.nlm.nih.gov/qenome Úkol Podívejte se do databáze a zjistěte, u kolika halobakterií (třída Halobacteriá) je v současné době známa nukleotidová sekvence genomu, a to jak kompletní, tak i částečná Zjistěte totéž u čeledi Pasteurellaceae A ještě u cyanobakterií (kmen Cyanobacteria) Další příklady I Genome Gallery A selection of notable genomes that have been sequenced. Na úrovni jedné molekuly, v reálném čase, případně in situ > Využití mikro a nanofluidních technologií > Bez potřeby celogenomové amplifikace pomocí MDA - Q29 DNA polymerázové reakce nebo PCR amplifikace knihoven > Redukce enzymových reakcí (využití charakteristických vlastností jednotlivých bází-ovlivnění toku elektrického proudu) > Sekvenování lidského genomu (pokrytí 30x) za cenu nižší než 1000 $ ohlášena společností lllumina (platforma HiSeq X Ten) Jak sekvenuje SMRT? Technologie třetí generace Single-Molecule Real-Time seq - SMRT Pac Bio (without amplification necessary for signal detection) Technologie třetí generace B — F Pacific Biosciences technology direct observation of DNA synthesis on single DNA molecules in real time. A DNA polymerase is confined in a zero-mode waveguide and base additions measured with florescence detection of gamma-labeled phosphonucleotides. Reveo technology direct inspection of stretching ssDNA using electric current change detection (electron microscopy) Oxford Nanopores technologies measuring translocation of nucleotides cleaved from a DNA molecule across a pore, driven by the force of differential ion concentrations across the membrane. IBM - silicon based nanopores DNA transistor technology reads individual bases of ssDNA molecules as they pass through a narrow aperture based on the unique electronic signature of each individual nucleotide. Gold bands represent metal and gray bands dielectric layers of the transistor. Technologie třetí generace Minion versus MinlON A loyal servant of another, A single-molecule sensing instrument usually more powerful, based on nanopores technology, being. Plánovaní sekvenačního experimentu > Vstupní materiál (dostatečné množství, dobrá kvalita) > Výběr aplikace => metody/platformy > Vlastní zpracování x servis > Výpočetní kapacita (úložiště, operační prostor, zálohy) > Bioinformatické zázemí A teď se podíváme na něco praktického Použijte připravený výukový materiál ze sekvenování zástupců čeledi Pasteurellaceae Shrnutí 1) Pojem sekvenování 2) Maxamovo-Gilbertovo sekvenování 3) Sangerova metoda s využitím fluoroforů 4) Pyrosekvenování 5) Next generation sequencing 6) Third generation sequencing 7) Příklad reálné analýzy