Genetické metody v zoologii DNA Msat paternita - barvy Fig1 Josef Bryja (bryja@brno.cas.cz) Miloš Macholán (macholan@iach.cz) Výsledek obrázku pro pipeta Datum Přednášející Kde Téma 21.2.2019 J. Bryja UKB Úvod (význam genetických metod v zoologii a evoluční biologii; základní přehled metod, atd.). Analýza DNA I (izolace DNA, genetické markery - jaderná vs. mimojaderná DNA, PCR, real-time PCR, Sangerovo sekvenování) 28.2.2019 J. Bryja UKB Analýza DNA II ("single-locus" DNA markery: mikrosatelity, LINE, SINE) 7.3.2019 M. Macholán UKB Analýza fenotypu (signální fenotypy, epigenetické znaky, kvantitativní znaky, analýza landmarků) 14.3.2019 J. Bryja UKB Analýza DNA III (SNP a jejich analýza: RFLP, DGGE, TGGE, SSCP, klonování, nové techniky SNP genotypizace - SNP chipy atd.) 21.3.2019 M. Macholán UKB Cytogenetika (analýza karyotypu, proužkování, FISH, „painting“). Elektroforéza proteinů 28.3.2019 J. Bryja UKB Analýza DNA IV ("multi-locus" DNA markery: minisatelitový fingerprinting, RAPD, AFLP) 4.4.2019 J. Bryja UKB Analýza DNA V (Úvod do "high-throughput sequencing" = NGS technologií) 11.4.2019 J. Bryja UKB Analýza DNA VI (Aplikace technologií NGS, např. metagenomika, hybrid enrichment, RADseq, ddRADseq, atd.) 18.4.2019 J. Bryja UKB Analýza genové exprese (microarrays, qPCR, transcriptomika, RNAseq) 25.4.2019 J. Bryja UKB Základní manipulace s genetickými daty I (jaderná data založená na frekvencích - základní analýzy genetické variability a struktury populací, HWE, STRUCTURE, atd.) 2.5.2019 M. Macholán UKB Základní manipulace s genetickými daty II (analýza sekvencí - datové formáty, alignování sekvencí, základní práce s databázemi - GenBank, NCBI, BLAST, Dryad, TreeBASE aj.) 9.5.2019 J. Bryja + doktorandi ÚBO AV ČR, Studenec Analýza DNA v laboratoři (blokové cvičení) - izolace a elektroforéza DNA, PCR, real-time PCR, mikrosatelity, Sangerovo sekvenování, BLAST, ukázka NGS dat 16.5.2019 rezerva Doporučená literatura (česká) Genetické metody v zoologii Jan Zima, Miloš Macholán, Pavel Munclinger, Jaroslav Piálek Nakladatelství Karolinum 2004 SANY0231 •M. Macholán •Základy fylogenetické analýzy (2014) Proč? Problém: zoologie, taxonomie ekologie, evoluční biologie klasické metody morfologická, ekologická, bionomická data Genetické metody: genetická data Další úroveň poznání Odpovědi na nové otázky Na které otázky lze nalézt odpověď jen s využitím genetických metod? • •rekonstrukce fylogenetických vztahů mezi populacemi, druhy či vyššími taxony (konvergence) • •kryptické druhy •složení společenstev – metabarcoding • •izolace populací (tj. počet migrantů) – nemusí být zřejmá • •identifikace z trusu, chlupů - pohyb jedinců skrytě žijících druhů • •paternita – páření často skryté a nemusí vést k oplození • •a mnoho dalších ... • • viz Molekulární ekologie – podzimní semestr Genome Transcriptome Proteome DNA mRNA Proteins Transcription Translation Genomics Transcriptomics Proteomics GP_FA7TYN03040706_inv 3 billion bases 20-30,000 genes ~100,000 proteins Functional Genomics Genetické metody = studium genetické variability Úrovně genetické variability •druhy a vyšší taxony – fylogenetické analýzy (fylogenetická systematika) http://files.cichlidy.webnode.cz/200000032-2ab122baab/cichlasomatini_2010.jpg http://upload.wikimedia.org/wikipedia/commons/thumb/3/3a/Fylo-savci.jpg/400px-Fylo-savci.jpg •populace až druh – studium speciace, fylogeografie, delimitace druhů, hybridizace Úrovně genetické variability Úrovně genetické variability •populace – populační biologie, ochranářská genetika Pracovní_hýli ? Úrovně genetické variability •jedinec – analýzy příbuznosti (behaviorální ekologie, např. analýzy paternity) Genetické metody v zoologii •jak genetická data získat, tj. které techniky použít • •základní typy a zpracování (editace) genetických dat •Mechanismy mikroevoluce (jaro) • •Molekulární ekologie (podzim) Genetické DNA markery •kódující DNA (geny) •přepisované sekvence (cca 20-25 tisíc genů u obratlovců) •genetický kód •vytvářejí fenotyp •podléhají přírodnímu výběru •rostoucí význam v ekologickém výzkumu •nekódující DNA •nefunkční (neznámá funkce) •neutrální k přírodnímu výběru •většina DNA u eukaryot (až 95% u obratlovců) •pseudogeny •repetitivní DNA Repetitivní DNA DNA Typical sequence length (bp) Location Satellites (>106 repeats/genome) 5-100 Tandem arrays, scattered throughout the genome Minisatellites (>103 loci/genome) 20-300 Tandem arrays up to 5 kb in length, scattered throughout the genome Microsatellites (>104 loci/genome) 1-6 Tandem arrays up to a few 100 bp in length, scattered throughout the genome Telomeres 4-8 Tandem arrays up to 1kb in legth, at the ends of each chromosome SINEs (>105/genome) 50-500 (100-300) Interspersed throughout the genome LINEs (>103/genome) 1-5 k Interspersed throughout the genome Kódující („funkční“) DNA 1)ribosomální DNA 2) 2)jaderné strukturální geny (protein-coding genes) 3) 3)mitochondriální DNA 1. Ribosomální DNA • geny pro ribozomální RNA – mnoho shluků (operonů) u eukaryot • 16S, 23S, and 5S – málo kopií u prokaryot • rDNAs – phylogeny, ITS – population structure, barcoding (fungi, helminths) 2. Jaderné geny •nízká variabilita mezi jedinci – významná funkce, purifikující selekce (nejsou často používány jako genetické markery) •introny – více variabilní než exony, často ve fylogenetických analýzách •alozymy •MHC geny •SNPs – narůstající význam (jednoduché mutace způsobují významnou funkční změnu) •studium transkripce - transkriptomika 3. Mitochondriální DNA Saccone et al. 2001 • maternaly inherited (?) • no recombination (?) • no heterozygotes (?) • mnoho kopií v každé buňce (ca. 8000 u člověka) – lépe se analyzuje • « numts » nuclear copies of mtDNA • vhodná pro fylogenetické a fylogeografické analýzy 14 kbp (Caenorhabditis) 42 kbp (Placeopecten) Dýchací řetězec v mitochondriích red = mtDNA blue = nDNA • koevoluce jaderné a mitochondriální DNA → DNA-barcoding, nejčastější marker pro určování druhů „Molekulárně-genetické“ metody •analýza polymorfismu DNA (genetické markery) •konzervativní vs. variabilní úseky (« loci ») •sekvenční polymorfismus: CGCATCTCTAGCTTCGATTCAGGAA CGCATCTCTAGCTTTGATTCAGGAA „Molekulárně-genetické“ metody •analýza polymorfismu DNA (genetické markery) •konzervativní vs. variabilní úseky (« loci ») •sekvenční polymorfismus •délkový polymorfismus CGCACATCTCTAGCTTCGATTCAGGAA CGCATCTCTAGCTTTGATTCAGGAA Vznik DNA polymorfismu •mutace (transice, transverze, inzerce, delece) •rekombinace (kombinace změn vzniklých mutacemi, duplikace a delece při rekombinačních chybách) •transpozice •Þ obecná molekulární genetika Genotypizace – stanovení genotypu •stanovení formy určitého úseku DNA (alely = 2n, haplotypu = 1n) • 1)izolace celkové DNA z tkání 2)amplifikace požadovaného úseku DNA (PCR-based methods) 3)studium variability daného úseku (lokus) 4) Základní struktura molekuly DNA http://bootstrike.com/Genetics/DNA/images/structure.gif 3´- OH konec (nutný k navázání dalšího nukleotidu při syntéze DNA) 5´- fosfátový konec (ve vodném roztoku způsobuje záporný náboj) Enzymy používané při molekulárně-genetických manipulacích •DNA-polymeráza •DNA-exonukleáza, DNA-endonukleáza •DNA-ligáza •DNA-transkriptáza •RNA-reverzní transkriptáza Izolace DNA •rozmanitý biologický materiál – musí obsahovat buněčná jádra nebo mitochondrie s nedegradovanou DNA •dnes většinou komerční kity (cca 50-100 Kč/vzorek, ale pro některé aplikace i doslova „za pár korun“) • •Izolace RNA (exprese specifických genů) – dříve problém, dnes RNAlater Způsoby získání DNA z volně žijících živočichů: 1.destrukční – živočich je usmrcen kvůli získání tkání potřebných na genetické analýzy 1. 2. nedestrukční (invazivní) – živočich je odchycen a je mu odebrán vzorek tkáně nebo krve n 3. neinvazivní – zdroj DNA je „zanechán za živočichem“ a je získán bez potřeby odchytu, manipulace či dokonce pozorování Fixace materiálu •čerstvá tkáň •čistý EtOH •rychlé vysušení •speciální extrakční pufry •zamražení •formaldehyd •opakované zamražování •rozvlhčování sušeného materiálu •další fixační média + - § speciální metody pro izolaci ze subrecentního materiálu (mamuti, hmyz v jantaru, neandrtálci apod.) PCR Polymerase chain reaction (jak z málo DNA udělat hodně) Kary Mullis (1983 – na dálnici ze San Francisca do Mendocina) - odměna 10 000 USD - patent pak prodán Roche za 300 000 000 USD) 1993 – Nobelova cena http://i.kinja-img.com/gawker-media/image/upload/s--8qoFUoQi--/18dyxuq3x41k7jpg.jpg Amplifikace DNA – PCR Druh Velikost genomu (bp) Počet chromozómů (1n) Caenorhabditis elegans 8,0 x 107 4 Drosophila melanogaster 1,65 x 108 4 Xenopus laevis 3,0 x 109 18 Mus musculus 3,0 x 109 20 Homo sapiens 3,0 x 109 23 PCR •Z celkové DNA si namnožíme jen úsek, který nás zajímá. • •Co se bude množit? To určí primery. • •Primery – krátké oligonukleotidy komplementární k úsekům ohraničujícím místo našeho zájmu. • primer AGGGGACGTACACTCAGCTTT templát TCCCCTGCATGTGAGTCGAAA primer primer DNA templátu tento úsek se bude množit Denaturace (obvykle 95°C) při zvýšení teploty se oddělí komplementární vlákna DNA Při ochlazení dojde k reasociaci Primery přidané v nadbytku kmitají díky Brownově pohybu Některé se dostanou do blízkosti komplementárních míst Při ochlazení primery přisednou rychleji než dojde k vzájemné reasociaci dlouhých vláken DNA (obvykle 50 - 65°C) – „annealing“ V úseku mezi primery zůstanou vlákna DNA oddělena Primery jsou prodlužovány přidáváním nukleotidů podle sekvence templátu (obvykle 72°C – optimum pro Taq polymerázu) > Při dalším zahřátí dojde k oddělení templátu a nově vzniklých vláken Po ochlazení primery přisednou na templát i nově vzniklé fragmenty („annealing“) > Při 72°C dojde opět k prodlužování primerů a vzniku nových kopií Při dalším zahřátí… > Ochlazení – nasednutí primerů 72°C vznik nových fragmentů 95°C denaturace Inhibice PCR vysokou koncentrací DNA Příklad programu 95°C 3 min 95°C 30 s 60°C 30 s 72°C 1 min 35x zpět 72°C 10 min Cykly (obvykle 20-40): denaturace (95°C ) nasednutí primerů (50-65°C ) elongace=polymerizace (72°C ) Nejprve však často prodlužená denaturace celkové DNA Nakonec prodloužená elongace • pcr Co když PCR nefunguje? •Měníme teplotu „annealingu“ (nejlépe použijeme gradient teplot, pokud to náš cykler umí) Vyšší teplota=vyšší specificita •Měníme koncentraci Mg2+ iontů •Navrhneme nové primery Studium variability nasyntetizovaného úseku 1)délkový polymorfismus •elektroforéza DNA (DNA = záporný náboj) http://www.aldebaran.cz/bulletin/2009_38/DNA_part.gif Rozdělení fragmentů DNA podle velikosti („molekulové síto“) •Agarosa - Hrubé rozdělení (do rozdílu 15 bp) • •Polyakrylamid – Přesnější rozdělení (4 bp) • •Sekvenátor, kapilární elektroforéza (fragmentační analýza) – nejpřesnější (fluorescenčně značené PCR fragmenty, např. značené primery) tools_1a 3LOKCELE detektor laserový paprsek - + Studium variability nasyntetizovaného úseku 2)sekvenční polymorfismus •sekvencování •SNP („single nucleotide polymorphism“) analýza – mnoho různých metod (viz další přednášky) REAL TIME PCR (= „kvantitativní PCR“) SANY0264zmenseny In this presentation, we will be using Sybr green to monitor DNA synthesis. Sybr green is a dye which binds to double stranded DNA but not to single-stranded DNA and is frequently used to monitor the synthesis of DNA during real-time PCR reactions. When it is bound to double stranded DNA it fluoresces very brightly (much more brightly than ethidium bromide does, which is why we use Sybr Green rather than ethidium bromide; we also use Sybr green because the ratio of fluorescence in the presence of double-stranded DNA to the fluorescence in the presence of single-stranded DNA is much higher that the ratio for ethidium bromide). Other methods can also be used to detect the product during real-time PCR, but will not be discussed here. However, many of the principles discussed below apply to any real-time PCR reaction. Problém •Kvantitativní rozdíly v expresi genů (tj. množství specifické mRNA určitého genu → reverzní transkripce → cDNA) • •Neinvazivní metody – nutnost stanovit, kdy je ještě ve vzorku dostatek DNA cílového druhu pro smysluplnou analýzu • •Genotypizace SNPs atd. (viz další přednášky) • • • Real time PCR was developed because of the need to quantitate differences in mRNA expression. PCR methods are particularly valuable when amounts of RNA are low since the fact that they involve an amplification step means they are more sensitive. „Real-time PCR“ •fluorescence je měřena v každém cyklu (signál odpovídá množství PCR produktu) •křivky se zvedají po určitém množství cyklů, které odpovídá počátečnímu množství DNA •srovnání s kalibrační křivkou umožňuje kvantifikaci Fluorescenční strategie •Nespecifická detekce •SYBR Green, EVA Green, ... • •Specifická detekce (vyšší přesnost = specificita k amplifikovanému úseku) •hydrolyzační sondy (TaqMan) •hybridizační sondy (FRET, Molecular beacon) •others ... SYBR Green / EVA Green •„barvička“ po inkorporaci (interkalaci) do dsDNA poskytuje zvýšenou fluorescenci TaqMan hydrolyzační sondy •intaktní sonda = žádná fluorescence („Quencher“ blokuje „Reporter“) •5´-exonukleázová aktivita DNA-polymerázy degraduje sondu → uvolnění fluorescence „Molecular beacon“ hybridizační sondy •specifická 3D struktura intaktní sondy („vlásenka“) – nevyzařuje žádnou fluorescenci •„Quencher“ uvolní „Reporter“ po dosednutí na amplifikovaný úsek (v annealing fázi) Real-time PCR přístroje SANY0264zmenseny A gene which is to be used as a loading control (or internal standard) should have various features - see slide. Absolutní kvantifikace 1)Vytvoření kalibrační křivky (vzorky se známou koncentrací templátu) 2) 2) Real-time PCR se vzorkem s neznámým množstvím DNA, např. z trusu inflexní bod (konvexní se mění na konkávní) We can plot the Ct values for the dilutions against concentration - the result is a linear graph. It should have an excellent correlation coefficient (certainly more than 0.990). Stanovení koncentrace DNA při neinvazivních analýzách Log DNA concentration (pg) Positive PCR Allelic dropout Genotypizace jen „dobrých“ vzorků Morin et al. 2000 Relativní kvantifikace - standardy •Měření kvantity určité DNA, např. úroveň exprese (tj. určité RNA=cDNA) nebo množství mitochondrií (tj. mtDNA) (např. v různých typech tkání nebo treatement vs. non-treatement atd.) •housekeeping geny – slouží jako standard pro měření •stejný počet kopií ve všech buňkách (např. geny kódující cytoskelet) •exprimované ve všech buňkách, nezávislé na experimentu •v různých systémech takto fungují různé geny – nutno vždy znovu ověřit a optimalizovat • A gene which is to be used as a loading control (or internal standard) should have various features - see slide. [USEMAP] https://www.youtube.com/watch?v=FIgGKkcLLuo PCR a qPCR s hydrolyzační sondou - VIDEO PCR qPCR kapilární elektroforéza Sangerovo sekvenování Sekvencování DNA •Maxam-Gilbertova (chemická) metoda: bázově-specifická chem. modifikace a štěpení fragmentů DNA •Sangerova (enzymatická) metoda: terminace replikace pomocí ddNTP • •paralelní „high-throughput“ sekvenování: = NGS („next-generation sequencing“) Sangerovo sekvenování DNA Sekvenační reakce: -směs standardních nukleotidů a značených dideoxynukleotidů -jeden specifický nebo universální primer – poskytuje volný 3´-konec DNA (ve velkém množství kopií) PCR produkt naklonovaný fragment „dideoxy metoda“ Frederick Sanger (1918-2013) Nobel prize 1958 (struktura inzulínu) a 1980 (sekvenování bílkovin a nukleových kyselin) „vektor“ - jen jeden primer - vysoká koncentrace templátu (hodně kopií – buď PCR nebo klony v bakteriích) - směs deoxynukleotidů a fluorescenčně značených dideoxynukleotidů AAGTCAGTCTAAATGCGATTGGGA Primer - F Rev. Primer - R TTCAGTCAGATTTACGCTAACCCT Rev. Primer - F Primer - R Primer - F -OH 1. Denaturace - 96°C 2. Nasednutí primeru - 50-60°C Sekvenační „PCR“ – jen jeden primer AAGTCAGTCTAAATGCGATTGGGA Primer - F Rev. Primer - R TTCAGTCAGATTTACGCTAACCCT Rev. Primer - F Primer - R Primer - F - AAG-OH 1. Denaturace - 96°C 2. Nasednutí primeru - 50-60°C 3. Polymerizace - 72°C Přisedání deoxynukleotidů ... AAGTCAGTCTAAATGCGATTGGGA Primer - F Rev. Primer - R TTCAGTCAGATTTACGCTAACCCT Rev. Primer - F Primer - R Primer - F - AAGTCAGTC=O 1. Denaturace - 96°C 2. Nasednutí primeru - 50-60°C 3. Polymerizace - 72°C Přisedání deoxynukleotidů ... ... až narazí na dideoxynukleotid Sekvenační „PCR“ – jen jeden primer TTCAGTCAGATTTACGCTAACCCT Rev. Primer - F Primer - R Primer - F - AAGTCAGTCTAA=O 1. Denaturace - 96°C 2. Nasednutí primeru - 50-60°C 3. Polymerizace - 72°C 35 x Primer - F - AAGTCAGTC=O Sekvenační „PCR“ – jen jeden primer TTCAGTCAGATTTACGCTAACCCT Rev. Primer - F Primer - R Primer - F - AAGT=O 1. Denaturace - 96°C 2. Nasednutí primeru - 50-60°C 3. Polymerizace - 72°C 35 x Primer - F - AAGTCAGTC=O Primer - F - AAGTCAGTCTAA=O Sekvenační „PCR“ – jen jeden primer Primer - F - AAGTCAGTC=O Primer - F - AAGTCAGTCTAA=O Primer - F - AAGT=O ... a řada dalších fragmentů, každý z nich označený fluorescenčním dideoxynukleotidem Kapilární elektroforéza - seřazení fragmentů podle délky - detekce barvy dideoxynukleotidů Výsledek sekvenační „PCR“ Detekce fragmentů – kapilární elektroforéza Primer - F - AAGTC=O Primer - F - AAGTCAGTCTA=O Primer - F - AAGTCAGTCTAA=O Primer - F - AAGTCA=O Primer - F - AAGTCAGTCT=O Primer - F - AAGTCAGTC=O Primer - F - AAGTCAGT=O Primer - F - AAGTCAG=O - + tools_1a - + laser beam detector capillary electrophoresis Detekce fragmentů – kapilární elektroforéza TTCAGTCAGATTTACGCTAACCCT Rev. Primer - F Primer - R Primer - F - AAGTC=O Primer - F - AAGTCAGTCTA=O Primer - F - AAGTCAGTCTAA=O Primer - F - AAGTCA=O Primer - F - AAGTCAGTCT=O Primer - F - AAGTCAGTC=O Primer - F - AAGTCAGT=O Primer - F - AAGTCAG=O - + Fig1 AAGTCAGTCTAAATGCGATTGGGA Primer - F Rev. Primer - R krátké -------------- dlouhé (rychlé) ------------ (pomalé) •Sekvence délky 500 – 1000 bp (cca 100 Kč za sekvenci, bez PCR a přečištění PCR produktu) • •4 kapiláry - destička s 96 vzorky za noc • •Jsou i sekvenátory s 96 kapilárami Editace sekvencí „raw data“ (.ab1 file) electrophoretogram „basecalling“ (specializovaný software)