Sekvenování viromu pomocí NGS: PROČ a JAK Mgr. Lenka Kramná doc.MUDr. Ondřej Cinek PhD. Laboratoř molekulární genetiky, Pediatrická klinika a Ústav lékařské mikrobiologie, FN Motol a 2. lékařská fakulta Univerzity Karlovy v Praze Sekvenování viromu je složité http://viralzone.expasy.org Genom virů: DNA/ RNA ss/ ds pozitivní/ negativní Bakterie: lze odlišit pomocí vybrané variabilní oblasti genu pro 16S Viry: neexistuje podobná oblast: - u všech virů - dostatečně variabilní Sekvenování viromu je složité Sekvenace náhodných fragmentů (shotgun) První užití metody •Prof. Eric Delwart • nové viry u nemocných • nové viry u zvířat • • ze vzorku stolice: • místo primární infekce • pokud infekce, vysoká kvantita virů http://labmed.ucsf.edu/about/faculty/labmed-edelwart.html Proč jsme to začali dělat: Enterovirus: jedna z příčin Diabetu 1. typu? 1.Vzorek stolice: - všechny enterovirové kmeny - podívat se také do oblastí mimo VP1 (celý genom) - na nalezené konkrétní genotypy navrhnout primery 2.Vzorek krve: - nalézt tento konkrétní virus - porovnat, zda odpovídá období nástupu diabetu u pacienta Proč jsme to začali dělat: Enterovirus: jedna z příčin Diabetu 1. typu? Supernatant stolice: -Pokud infekce, velmi vysoká virová nálož. Zdravé děti: Enterovirus: 97mil. kopií/ ul Adenovirus: 2,5mil. kopií/ ul BKV v moči: 1012 kopií/ ul Lidských buněk: 0 Stolice: - 1/3 materiálu jsou lidské buňky Krev: -Pokud infekce, nízká virová nálož (do 100 kopií/ ul = a to už je problém) - -Vysoká kontaminace lidskou DNA Proč jsme to začali dělat: Enterovirus: jedna z příčin Diabetu 1. typu? tenké střevo, primární replikace tonzily a jiné, primární replikace virémie replikace v cílovém orgánu (vzácně) virémie infekce fekálně-orální cestou Viry + buněčné struktury = ribosomy Vzorek stolice: zbytky potravy, střevní epitel, bakterie, viry Centrifugace, filtrace přes bakteriální filtr (0,45 µm) Filtrát + HBBS Vysokorychlostí centrifugace: 45 000 g, 3h, 10°C pročištěné virové částice + buněčné struktury = ribosomy Rnáza + Dnáza: virové částice chrání kapsida Izolace RNA/ DNA: Qiagen Viral RNA Mini Kit Jak to probíhá v našich rukách NNNNNNNN NNNNNNNN NNNNNNNN NNNNNNNN NNNNNNNN NNNNNNNN NNNNNNNN NNNNNNNN NNNNNNNN NNNNNNNN NNNNNNNN NNNNNNNN NNNNNNNN NNNNNNNN NNNNNNNN NNNNNNNN T1 T1 T1 T1 T1 T1 T1 T1 RNA cDNA dsDNA Reverzní transkripce: náhodné primery s tagem Syntéza druhého řetězce pomocí Klenowova fragmentu: využije náhodné primery s tagem z předchozí reakce Amplifikace: tagy jsou teď použity jako místo pro primer (předtím přečištění EXO+SAP) Jak to probíhá v našich rukách http://www.illumina.com/images/products/miseq.jpg Nextera XT MiSeq Illumina (2X250) 24 vzorků / run přibl. 15 mil. sekvencí na run Sample 1 Sample 2 Ladder Next-generation sequencing Produkt k sekvenování K separaci správných délek používáme Ampure beads v poměru ke vzorku 2:1 Nextera XT DNA - pouze 1ng vstupní DNA - adaptory připo- jené pomocí enzymu, z každé strany uštípne 50nt, plus 12 cykl. PCR (k separaci správných délek používáme Ampure v poměru ke vzorku 2 : 1) - pouze 1ng vstupní DNA - adaptory připo- jené pomocí enzymu, z každé strany uštípne 50nt, plus 12 cykl. PCR Velvet: de-novo assembly valce-prouzky Konsenzus Identifikace pomocí BLASTu: omezení na celé virové genomy Velvet: de-novo assembly Netranslatovaná oblast Oblast zvětšení Celý kontig pokrytí Analýza Kvazispecies: evoluce Analýza 1.Assembly kontigů na referenční sekvenci 2.Návrh primerů 3.Dosekvenování mezer Získání celých virových genomů Typizace picornavirů Lidský parechovirus: Human parechovirus 1, 40 000/ 100 000 reads BWA mapper, program Geneious Lidský enterovirus: Echovirus 25, 124/ 100 000 reads Typizace picornavirů BWA mapper, program Geneious Následná analýza translace oprava chyb assembly Následná analýza translace oprava chyb assembly identifikace změn v AMK U čeho jsme nakonec skončili: Pilotní studie T1D autoimmunity onset Stool sample (-3 months) Stool sample (-6 months) Stool sample (-9 months) Pilotní studie Finská DIPP (Diabetes Prediction and Prevention) kohorta 19 pacientů: následně T1D 19 kontrol: stejné genetické riziko, pohlaví, datum a místo narození Celkem 96 vzorků stolic T1D autoimmunity onset Stool sample (-3 months) Stool sample (-6 months) Stool sample (-9 months) patient control T1D autoimmunity onset Stool sample (-3 months) Stool sample (-6 months) Stool sample (-9 months) Obsah sekvencí: MEGAN5 200 000 to 1 500 000 reads per sample Obsah virových sekvencí Výsledky NGS: lidské viry Virus Případy (n=48) Kontroly (n=48) Asociace: OR [95% Cl] Enterovirus 0 1 - Parechovirus 3 2 1.5[0.25 – 8.9] Bocavirus 1 2 0.5[0.04 – 5.5] Sapovirus 1 0 - Anellovirus 1 1 - > -3months Matching pair ID 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. • Parechovirus Lidské viry -3 months Matching pair ID 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. -6 months • Parechovirus Lidské viry -3 months Matching pair ID 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. • Parechovirus -6 months -9 months Lidské viry infekce ve střevě probíhají bouřlivě, ale krátce Výsledky: potvrzení výsledků NGS pomocí PCR Virus Případy (n=48) Kontroly (n=48) Asociace: OR [Cl 95%] Enterovirus 7 3 2.5[0.61 – 10.2] Parechovirus 3 8 0.35[0.09 – 1.4] Bocavirus 2 2 - Sapovirus 1 0 - Náš NGS protokol detekuje viry v kvantitě 100 kopií / μl vyizolované NK a vyšší Bakteriofágy E. coli fág fágy ve střevě jsou téměř výhradně temperátní a přetrvávají dlouho Co jsme si z toho odnesli Bakterie a fágy ve střevě: Střevo = největší imunitní orgán… V otevřených prostředích: zejména lýtické fágy: „kill the winner“ „red queen coevolution“ Střevo: polouzavřený systém, nejvíce lysogenní fágy (temperátní) Infekce jedním fágem působí protektivně proti infekci jiným fágem. Bakteriální imunitní systém: (CRISPR-CAS = části fágových genomů do bakteriální DNA) Nedokážeme rozlišit. We currently have only about 200 complete phage genomes. This number may seem large, but actually it is extremely small considering that phages outnumber bacteria in many environments by a factor of 10 and represent, with approximately 1031 tailed phage particles, numerically the largest share of biological material on Earth (240). Up to 107 particles/ ml were found in ocean water and sediment (30, 36, 176, 238, 240). Considering these vast numbers of phages and the number of bacteria coexisting in these niches, it has been estimated that 1025 phage infections are initiated every second worldwide (177); this has probably occurred for the last 3 billion years. Co jsme si z toho odnesli Velký podíl neznámých sekvencí: -ne všechny je důležité identifikovat -vybrat jen ty, které jsou významně zvýšeny u případů oproti kontrolám Prázdné tečky: vzorek byl pozitivní pouze v NGS Plné tečky: vzorek byl pozitivní Pod šedou zónou: pouze pomocí PCR Threshold for positivity at 50 reads Co jsme si z toho odnesli Srovnání NGS a klasické PCR: Co jsme si z toho odnesli Dá se předejít užitím unikátní kombinace indexů… Umožňuje identifikovat viry „nezkresleně“ (bez předchozích znalostí, co očekávat) Bez předchozí izolace viru na buněčných kulturách Kromě virových sekvencí je přítomna i bakteriální 16S Méně citlivá než specifická PCR, zatím nevhodná pro klinické účely + - Problémy vs. výhody Zajímavé: CrAssPhage Zajímavé: CrAssPhage Praktické využití •Neznámá epidemie průjmů u dětí v Motole –na oddělení XY častý výskyt průjmů neznámého původu –v létě, horko, otevřené okno, na parapety sedali holuby –po instalaci bodců holuby přestali létat a průjmy ustaly.. –PCR negativní na všechny známé viry. V elektronovém mikroskopu částice podobné Calicivirům • Praktické využití •Identifikace původu adenovirových infekcí v Motole –velmi podobné genomy = získání v nemocnici –rozdílné genomy = přinesli si z domu –Sangerové sekvenování (jen VP1), není schopno odhalit Děkuji za pozornostJ