Molekulárně genetická diagnostika .#!**• srnSfl .#!**• ělení lékařské geneti FN Brno &■ >•• *•• buněk v lidském těle »letní sestavu chromozomů-genom y, např. erytrocyty) DNA Strand Chromozomy se nacházejí v jádru téměř každé buňky. Každý z chromozomů obsahuje soubory informací, zvané geny. chromozom svinutý chromatin buněčného jádra) Struktura DNA byla objevena v roce 1953 britskými vědci Francisem Crickem (vlevo) a Rosalindem Franklinem, a americkým btochemikem Jamesem Watsonem (vpravo). deoxyribonukleová kyselina (DNA) osa jednoho z řetězců DNA báze (chemické sloučeniny tvořící DNA a kódující geny) dva DNA řetězce navzájem obtočené vytvářejí dvojšroubovici Short region of DNA double helix (five turns) Chromatin section /7WÜK0WX/ 30 nm chromatin fiber with nucleosomes tightly packed Part of a chromosome section Condensed section of a metaphase chromosome • Každý z 46 lidských chromozomů je tvořen jednou molekulou dvoušrobovicové DNA I DNA z jedné buňky je dlouhá přibližně 2 metry • Proteiny zvané histony tvoří jádro, kolem kterého je DNA navinuta v dvojité smyčce I tvořené přibližně 146 pb - NUKLEOZÓM • Stovky sekvenčně specifických DNA-vazebných proteinů, které rozpoznávají krátké úseky DNA • Jejich vazba má důležitý význam pro regulaci genové aktivity (genové exprese) |^ [y] f^ Deoxyribon ukleová kyselina •je nositelkou genetické info n s výjimkou těch nebuněčných c lace vš W cln LIMII1I1II ;>a ■ Chromosom DNA •je pro život nezbytnou látkou, a buňkám zadává jejich prograi celého organismu pre DNA - polymer je obecně látka vzniklá v organismu kondenzací z více stejných či různých nízkomolekulárních látek Jejich molekulová hmotnost se pohybuje v řádech tisíců až milionů. Z chemického hlediska jde o DNA je tvorená ctyrmi typy skládají se ze tří složek: fosfátu (vazebný zbytek kyseliny fosforečné) deoxyfybózy(pětiuhlíkový cukr-pentóza) nukleové báze (konkrétní dusíkaté heterocyklické sloučeniny). báze SI nukleotid jsou kovalentně spojeny v polynukleotidovém řetězci cukerfosfátovou páteří, ze které vyčnívají jednotlivé báze Nukleové báze V DNA se v různých kombinacích vyskytují čtyři nukleové báze: purinové báze - adenin(A) pyrimidinové báze - thymin - (T) guanin (G) cytosin(C). Purinové bá^e *° adenin NH; Nf£>C-fv \ U ŕCH H Adenine (AJ HM -ŕ> guanin hn; 6 sc^\ ■!\ H Guanine (Gl Vynmtdinové bá^e *» uracil... RNA *° thymin ... DNA *° cytosin 0 II 0 :| i HNf * sCH HNÍ^>C-CH3 Nť^>CH xCÍ 1 3CH H H H Urazil (U) Thymine IT) Cytosin e (C I (A) Less than 10kb 0 1 btRNATyľ 100% iii m Historie H4 100% i i i ^n a-lnterferon 100% Insulin . 33%| 38% ß-Globin i ! Class I (B) Lesslhan 100kb 10 kb 0 10 20 30 40 50 60 70 80 90 100 kb 4- 4- 4- , ' HLA 46% Serum albumin a-, (II) collagen 120% ' ^mtf HPRT 4% i i i i ^^^ Apolipoprotein B 33% LDLreceptori 11% Phenylalanine hydroxylase 3% (C) More than 100 kb 100 200 300 400 500 600 700 800 900 100011001200 Factor VI11 3%! CFTR 2.4%! i i NF1 ' 4% Utrophin 1.4% 18001900 2400 2500 kb YH—KV Heavy chain immunoglobulin re light chain immunoglobulin Dystrophin 0.6% i Figure 7.6: Human genes vary enormously in size and exon content. Exon content is shown as a percentage of the lengths of indicated genes. Note the generally inverse relationship between gene length and percentage of exon content. Asterisks emphasize that the lengths given for the indicated Ig heavy chain and light chain loci wespond to the germiine organizations. Immunoglobulin and T-cell receptor genes have unique organizations, requiring cell-specific irnatic rearrangements in order to be expressed in B or T lymphocytes respectively (see page 177). CFTR, cystic fibrosis transmembrane regulator; HPRT, hypoxanthine phosphoribosyl transferase; NF1, neurofibromatous type 1. Nukleozidy vznikají vazbou baží na 1 'uhlík pentózy ^U uridin 1 1 Ar A H ^ 1 ^| H-0-CH2 -0-^_ <■ _—— ^^--. i 1 | DNA Molekulu DNA tvoří dva polynukleotidove řetězce jsou navzájem spojeny vodíkovými můstky mezi páry baží dvouřetězcová DNA kostra cukerného fosfátu páry bází vázaných vodíkovými můstky Šipky na řetězcích DNA označují jejich polaritu obě vlákna jsou vůči sobě antiparalerní Komplementární páry baží A-T dva vodíkové můstky G-C tři vodíkové můstky Báze se mohou párovat jen v případě, Ze jsou oba řetězce antiparalerní Dvoušroubovice DNA Nukleotidy jsou spojeny navzájem fosfodiesterovými vazbami mezi 3'hydroxylovou skupinou (-OH) jednoho sacharidu a 5'fosfátovou skupinou (-P) druhého sacharidu Oba konce vlákna jsou chemicky odlišné —► každý polynukleotidovy řetězec má jinou polaritu základní jednotka genetické informace Každý gen podmiňuje vytvoření určitého konkrétního znaku gen obsahuje informaci k tvorbě určitého proteinu má určitou funkci (katalyckou, regulační, stavební) T.H.Morgan vytváří konkrétníí znak Každý gen lze ztotožnit s určitým úsekem chromozomu Morganovy zákony A) Geny jsou na chromozomech uspořádány lineárně za sebou, Jejich umístění na daném chromozomu je neměnné Každý gen má na chromozomu svoje místo - lokus B) Všechny geny, které se nacházejína stejném chromozomu, jsou ve vazbě, neboli vytvářejí vazebnou skupinu □Geny □ Strukturami geny obsahují informace o primární struktuře proteinů, popř. polypeptidu > geny kódující proteiny se^tavební funkcí :ákladní složky cytoskeletu a mezibuněčné hmoty (tubulin, kolagen, elastin, aktin,myosin) >geny kódující proteiny s biochemickou nebo fyziologickou funkcí f enzymy, buněčné receptory, regulační proteiny, protilátky, hormony □ Geny pro funkční RNA jejich transkripční produkty nepodléhají translaci c eny kódující tRNA a rRNA Table 7.7: Average sizes of exons and introns in human genes Gene product Size of gene Number ot exons Average size Average size of exon (bp) of intron (kb) tRNAtvr 0.1 2 50 0.02 1.4 3 155 0.48 ß-GLobin 1.6 3 150 0.49 Class 1 HLA 3.5 8 187 0.26 Serum albumin 18 14 137 1.1 Type VII collagen 31 118 77 0.19 Complement C3 41 29 122 0.9 Phenylalanine 90 26 96 3.5 hydroxylase Factor VIII 186 26 375 7.1 CFTR (cystic fibrosis) 250 27 227 9.1 Dystrophin 2400 79 180 30.0 11 Struktura genu Exony úseky kódujících sekvencí jsou jen malým zlomkem délky celého genu Introny nekódující sekvence nejsou překládány do proteinu velikost 80-10 000 nukleotidů Mela Forma genu Každý gen se vyskytuje v různých konkrétních formách alelách Gen podmiňuje určitý znak Alela obsahuje „návod" k vytvořen určité konkrétní podoby znaku ^*i _ fc. Alela dominantní- převažující recesivní - ustupující kodominance - alely se společně podílejí na konečné podobě znaku Genotyp Soubor alel daného jedince Genotypy jedinců stejného druhu mohou být rozdílné Fenotyp Vnější projev genotypů Soubor všech znaků organismu. Homozygot Jedinci se shodným párem alel příslušného genu Heterozygot Jedinci s odlišnými alami příslušného genu OTEC PŘENAŠEČ non mt/non mt non mt/mutace 1. alela 2. alela Genom Soubor všech genů daného organismu Veškerá genetická informace obsažená v DNA v lidských buňkách □ jaderný genom Hrubé Mítochondrit endoplazmatické retikulum Q mimojaderný genom - mitochondriální Genom u jedinců stejného druhu je stejný Lidský génom Nuclear genome 3000 Mb 65 000-60 000 genes I -30% Geněš and gehe-related sequences 70% I--------- Unique or moderately repetitive ~10% | -90% Extragenic DNA Coding DNA Nohcoding DNA Human genome Mitochondrial genome ^16.6 kb« 37 genes ■- TworRNA genes 22 tRNA genes 13polypepfide-encoding genes -80% -20% Uniqueor low copy numbei Moderate to highly repetitive Lidský jaderný a mitochondriální genom Nuclear genome Mitochondrial genome Size No. of different DNA molecules Total no. of DNA molecules per cell Associated protein No. of genes Gene density Repetitive DNA Transcription Introns % of coding DNA Codon usage Recombination Inheritance 3000 Mb 23 (in XX) or 24 (in XY) cells, all linear 23 in haploid cells; 46 in diploid cells Several classes of histone and nonhistone protein -65 000-80 000 -1/40 kb Large fraction, see Figure 7.1. The great bulk of genes are transcribed individually Found in most genes -3% See Figure 1.22 At least once for each pair of homologs at meiosis Mendelian for sequences on X and autosomes; paternal for sequences on Y 16.6 kb One circular DNA molecule Several x 103 Largely free of protein 37 1/0.45 kb Very little Continuous transcription of multiple genes Absent -93% See Figure 1.22 None Exclusively maternal Genom x Genotyp Genom u jedinců stejného druhu je stejný Genotypy jedinců stejného druhu mohou být rozdílné Human Genome Project Projekt lidský génom tóljsBafiaino '"»Nlfllttli 'III7MH CCGACATGAG CTGCATCTGA GAÄCCfiCCAA CCACACTGTC AG AC G CG A ŕ* ATTTTGQCAA ftATACCCATC ,AT fťactc '^GTCGACgGT ACAQTTAŮOT AGCCGCTGAA 7AOACAACAT ATTATTATAA AAAAAAGAAC ctTatgtttc OATCCTflTArt ATCTCGACCT ATCGTCCAOA GTTCTACTAA ATGTÁÄGATA TTAňAAACAG AACGCGTCAT CTCTTCUAGĽ TRATTOACAC TTA" CAŮGTTTAŮA GTTACAAGCT GGGTGGATAA TI TAGGATAT AAnnCAAAAA AGAACTTTTG AA7ACTCGAG ŤŮI CTfiGA 1986: Santa Fe - DoE Intl. Meetin >antc jJames Watso m: stu 0( „vstoupitna cestu od dvojišroubovic k 3 miliardám schodů lidského genomu" j1988: Kongres USA schválil 15 lety proj a dotaci 3 mid USD íAj j1 990: začátek projektu j2005: predpokladané ukončení Koordinace: 1988: HUGO (Human Genome Or HUGO Europe - Americas - Pacifi ganizatio ES Kil BS "F 2 3 > CO ~i n n n N n Nárůst údajů o sekvenci DNA 5,000 4,500 4,000 U 3,500 i, 3,000 g 2,500 2,000 íij P 1,500 1,000 500 0 Finished Unfinished (draft and p re-draft) "T--------T" O O O O O öi öi O) o tr> o> oi oci dOíOiooiooio ooo| Month [Í^SBĚl i! % 3Vi«u ■** ,■.„ .K B 1 . H. *tf -- . M-Ä F-K Hl ifi; JU ■■: ■ j ft t 'J>* : J n .ilT ' _■... Ill' ■ -..-' jSWfu I" TV 1 "jH jT'i iTiPťIIJ ■ší'-tíi iľ't iJlOBi .-.!■ ■ .-. ■ ■m '" j; ■1" .t. -r H ■^C& *^j ^ . m vJSfc. ■ «9 r-T ■Ä^st - jhN ť^ L| • :' u-„'■ tJ' y *■'* ^ ■ *Á*#*S i Human Genome Project Table 11. Genome overview. Size of the genome (including gaps) 2.91 Cbp Size of the genome (excluding gaps) 2.66 Gbp Longest contig 1.99 Mbp Longest scaffold 14.4 Mbp Percent of A+T in the genome 54 Percent of G+C in the genome 38 Percent of undetermined bases in the genome 9 Most GC-rich 50 kb Chr. 2 (66%) Least GC-rich 50 kb Chr. X (25%) Percent of genome classified as repeats 35 Jshjymberof annotated genes .26,383 Percent of annotated genes with unknown function 42 j^umber of genes (hypothetical and annotated) 39,114 Percent of hypothetical and annotated genes with unknown function 59............... Gene with the most exons Titin (234 exons) rAvej3gg-ggflfi_^£_-. 11 kbp Most gene-rich chromosome Chr. 19 (23 genes/Mb) Least gene-rich chromosomes Chr. 13 (5 genes/Mb), Chr. Y (5 genes/Mb) Total size of gene deserts (>500 kb with no annotated genes) 605 Mbp Percent of base pairs spanned by genes 25.5 to 37.8* Percent of base pairs spanned by exons 1,1 to 1.4* . Percent of base pairs spanned by introns 24.4 to 36.4* , , Percent of base pairs in intergenic DNA 74.5 to 63.6* Chromosome with highest proportion of DNA in annotated exons Chr. 19 (9.33) Chromosome with lowest proportion of DNA in annotated exons Chr. Y (0.36) Longest intergenic region (between annotated + hypothetical genes) Chr. 13 (3,038,416 bp) Rate of SNP variation 1/1250 bp •In these ranges, the percentages correspond to the annotated gene set (26, 383 genes) and the hypothetical + annotated gene set (39,114 genes), respectively. ^■r Přenos genetické informace 5'-|conec řetězce I O ~o-p=o o H2C O, ___ syntetizovaný řetězec O ~0-P=Q i O HÍ -°- A trd OH 3'-konec řetězce O O ~0- P -O- P -O- P -O-CH, X>. l O" I O" * I dřfosfát HO deoxyribonukleosidtrifosfát vstupující do reakce Genetická informace je přenášena z generace na generaci v nezměněné formě 5 ■:■:■■■■:■■■■:■■:■:■ ■"<■:■■■■"■■■■■■■■ ■■:■:. v,:.-. -.■■*,.. rodičovská DNA nově syntetizované řetězce J^m WIOMMIWW 51 směr pohybu replikační vidličky Obrázek 6-16 Polarita DNA-řetězců v replikační vidličce. Ústřední dogma molekulární biologie Všechny typy buněk dekódují genetickou informaci tímto způsobem Tok genetické informace DNA i RNA i PROTEIN RNA RNA se liší od DNA v těchto aspektech: □nukleotidy v RNA se nazývají rybonukleotidy, protože cukernou složkou je riboza □v RNA se vyskytují báze adenin guanin thymin nahrazen ura HOCH 2 ,0, OH OH ribosa vyskytuje se v RNA OH HOCH^O OH H^i OH II deoxy ribosa vyskytuje se v DNA O O HC im ,c. NH II I HC C. % N H uracil vyskytuje se v RNA O H3CX ^ C NH N xo H thymin vyskytuje se v DNA 03 RNA jed n o řetězcová molekula na základě párování baží se může sbalit do různých tvarů Typ RNA mRNA rRNA tRNA malé RNA Funkce kódování proteinů součást ribozomů, účast na proteosynté; adaptor mezi mRNA a aminokyselinou při proteosyntéze účast na sestřhu pre-RNA, účast na transportu proteinů do ER 5'-konec O O H,C -O báze O OH 1 O—P=0 1 o H2C P, O OH I O—P=0 r I O ' I H,C P U ribosa O OH I "O—p=o I o H2C J3 O OH (C) 3'-konec Tok genetické informace EUKARYOTA Transkripce Nukleotidové sekvence signalizují začátek a konec transkripce i |(B) PROMOTOR (startovní signál) -35 -10 5' 3' -TAGTGTATTGACATGATAGAAGCACTCTACTATATTCTCAATAGGTCCACG---3'~\DHA -ATCACATAACTGTACTATCTTCGTGAGATGATATAAGAGTTATCCAGGTGC- / start I transkripce templátový řetězec 5' +> 3- RNA AGGUCCACG TERMINATOR konec T 5'------C C C A C A G C C 3' AACTTTCTTTAATGA------3 GGGTGTCGGCGGTCAAGGCGACCGCCGTAAAATTGAAAGAA TTCCG CTG GCGG CA G ACC G transkripce TA AT G A-----?-\DNA ATTACT------5'JUNA templátový řetězec CCCACAGCCGCCAGUUCCGCUGGCGGCAUUUU RNA Posttranskripční úpravy RNA processing Transkripcí vzniká primární transkript upravován v jádře modifikace 5'konce primárního transkriptu mnoho eukariotních mRNA má modifikaci na 2'OH skupině skupině ribosy Sestřich RNA RNA splicing Z primárního transkriptu jsou vystřiženy všechny introny a exony jsou spojeny Výsledkem je molekula mRNA, která obsahuje nepřerušenou kódující sekvenci Tři nukleoti sekvence potřebné pro vyštěpení intronu r—1-—I r^—i i 5' 3' r - - AG GUAAGU --\ V-UAAC- UAG G-• exon 1 VIT intron L J T část primárního transkriptu =30 nukleotidů exon 2 *•---------»- odstraněni' intronu 5' 3' ?■><-&& G ~-^ úsek mRNA exon 1 exon 2 C sekvence jsou nutí vyštěpení intronu rozpoznávány snRNP částicemi, které rozštěpí exon-intronové hranice a spojí sousední exony rostoucí polypeptidový řetězec Translace mRNA Tříkrokový cyklus: 1. krok aminoacyl-tRNA navázána do rybosomu 2. krok vzniká nová peptidická vazba 3. Krok uvolnění tRNA bez navázané aminokyseliny Čtecí rámce Při translaci je nukleotidová sekvence mRNA čtena z 5'konce po trojicích nukleotidů 51 3' CUC i i AG C G U U i i ACC M AU Leu-------Ser--------Vaí——Thr — CiiUCAiiGCG UUA CCA , ;U — Ser--------Ala--------Leu-------Pro- CUiiCAG CGU i i UAC m CAU — Gin-------Arg—------Tyr------His — Genetický kód AGA UUA AGG UUG GCA CGA GGA CUA Gcc CGC GGC AUA CUC GCG CGG GAC AAC UGC GAA CAA GGG CAC AUC CUG AAA AGC AGU CCA U CA ACA CCC UCC ACC UUC CCG UCG ACG GCU CGU GAU AAU UGU GAG CAG GGU CAU AUU CUU AAG AUG UUU CCU UCU ACU Ala Arg Asp Asn Cys Glu Gin Gly His ARD lie Leu Lys Met Phe Pro Ser Thr N Q H M Univerzální pro všechny organismy Degenerovaný Mutace jakákoliv,dědičná změna v genetické materiálu Kt-jVäSjH • 1 1 v /> 1 1 ícnz třel v v r v Epimutačé - nejsou to zmeny ve fenotypu, které jsou důsledkem Mutace - pozitivní (zdroj variability, selekce) - neutrální # Kazdy člověk 5 -10 patologických mutací Mutace ■i ' spontální x indukované gametická x somatická dominantní x recesivní V r r V j r prime x zpetne (revers Bodové mutace * Chromozómové mu1 Genomové mutace Mutace Typy mutací • delece od 1 bp po megabáze • inzerce včetně duplikací jednobázové substitutce missense transverze nonsense tranzice splice site silent )osunové (frameshift v důsledku delecí, inzercí, poruch splicingu • „dynamické" (expanzia rep. sekv.) tandemové repetice, které často expandují během meiózy Podle sekvence: -v kódující sekvenci v nekódující sekvenci Expanding aflele — +mm tfntfWi IVofnnaJ' allele Mutace Klasifikace mutací z hlediska efektu na genový produkt 1. Produkt se sníženou až nulovou funkcí (loss-of-function) - nejčastěji je produktem genu enzym - častým typem mutace je delece genu 2. Produkt s abnormální funkcí(gain-of-function) - najčastěji je produktem neenzymatický protein - časté u nádorů (sómat, mutace), zřídka u monogen, chorob - delece genu se neuplatňuje (nevede k nové funkci) všeobecně mutace typu 1 jsou najčastěji recesívní, typu 2 dominantní - u některých genů jsou známé oba typy (výsledkem je alelová heterogenita) mutací dle funkce •• • mí - žádný funkční protein j - většinou recesivní •* - enzymopatie JTi» Hypermorfňí' Zisk nových vlastností Nomenklatura mutací Human Gene Mutation Database: www.hgmd.org J^-'fi * •• • ■"•"..'■ Substituce aminokyselín Qedno- alebo trojpísmenové symboly) - R117H nebo Arg117His: substituce arg za his na AA 117 - G542X: glycín 542 nahrazený stop-kodónem Substituce nukloeotidů (A z inic. kodónu ATG je vždy +1) - 1162G>A: výmena G na poziciil 162 za A - IVS4+2G>T: záměna G za T v druhé bázi intronu 4 Delece a inzerce (symboly del resp. ins) - F508del: delece fenylalaninu 508 - 622-626del: delece 5 nt začínající 622 - 409-41 OinsC: vložení C mezi 409 a 410