Molekulárně genetická diagnostika Budoucnost medicíny: tahounem bude genetika \ Prof. MUDr. Antonín Doležal, DrSc. 30. prosince 2008, MF Dnes DNA deoxyribonukleová kyselina ve své struktuře kóduje a zadává buňkám jejich program a tím předurčuje vývoj a vlastnosti celého organismu James Watson Francis Crick „We have discovered the secret of life! ft m ( l'J «. - Crick and Watson's DNA molecular model, 1953. "Watson and Crick staring up at their model of the Double Helix is one of the most iconic pictures of the 20th Century. A replica of the model now gathers dust in a glass case in a dark corner of the top floor of the Science Museum. Here, a man glances at it as he walks past. Does he know the story?" Dave Kinahan. biologická makromolekula Biologická makromolekula čili biomakromolekula nebo biopolymer je obecně látka vzniklá v organismu kondenzací z více stejných či různých nízkomolekulárních látek Jejich molekulová hmotnost se pohybuje v řádech tisíců až milionů. Z chemického hlediska jde nukleové kyseliny, proteiny a polysacharidy DNA je tvořená čtyřmi typy nukleotid skládají se ze tří složek: fosfátu (vazebný zbytek kyseliny fosforečné) deoxyrybózy($húu\úikový cukr-pentóza) nukleové báze (konkrétní dusíkaté heterocyklické sl< jsou kovalentně spojeny v polynukleotidovém řetězci cukerfosfátovou páteří, ze které vyčnívají jednotlivé báze J Jukleové héze purinové báze adenin(A) guanin (G pyrimidinové báze - thymin - (T cytosin(C). Purinové bá^e Pyrimidinové bá^e v° adenin NH2 4 > it H,N guanin H Adenine IA) Guanine (G) *° uracil... RNA v° thymin ... DNA HN3 4 5C ,ci 1 5c ÍCH II CH H Uracil (U) H N 0 II CH, NT H Thymine (T) *° cytosin NH? ! Cytosi ne (C) Nukleozidy vznikají vazbou bazí na 1 uhlík pentózy D f Molekulu DNA tvorí dva polynukleotidové řetězce jsou navzájem spojeny vodíkovými můstky mezi páry bazí □ ® ■ ■ • Šipky na řetězcích DNA označují jejich polaritu, obě vlákna JSOU vůči sobě antiparalerní Komplementární páry bazí A-T dva vodíkové můstky G-C tři vodíkové můstky Báze se mohou párovat jen v případě, Ze jsou oba řetězce antiparalerní Nukleotidy jsou spojeny navzájem fosfodiesterovými vazbami mezi 3 hydroxylovou skupinou (-OH) jednoho sacharidu a 5 fosfátovou skupinou (—P) druhého sacharidu Oba konce vlákna jsou chemicky odlišné každý polynukleotidový řetězec má jinou polaritu Gen •Každý gen podmiňuje vytvoření určitého konkrétního znaku gen obsahuje informaci k tvorbě určitého proteinu má určitou funkci (katalyckou, regulační, stavební) T.H.Morgan vytváří konkrétníí znak Každý gen lze ztotožnit s určitým úsekem chromozomu Morganovy zákony A) Geny jsou na chromozomech uspořádány lineárně za sebou, Jejich umístění na daném chromozomu je neměnné Každý gen má na chromozomu svoje místo - lokus B) Všechny geny, které se nacházejína stejném chromozomu, jsou ve va2bě, neboli vytvářejí vazebnou skupinu □ Geny □ Strukturami geny obsahují informace o primární struktuře proteinů, popř. polypeptidů ^geny kódující proteiny se stavební funkcí zákiadní složky cytoskeletu a mezibuněčné hmoty (tubulin, kolagen, elastin, aktin,myosin) ^geny kódující proteiny s biochemickou nebo fyziologickou funkcí ei, zymy, buněčné receptory, regulační proteiny, protilátky, hormony □ Geny pro funkční RNA jejich transkripční produkty nepodléhají translaci gei./ kódující tRNA a rRNA Exony úseky kódujících sekvencí jsou jen malým zlomkem délky celého genu Introny nekódující sekvence nejsou překládány do proteinu velikost 80-10 000 nukleotidů Gen Solitární gen: • v celém genomu v jediné kopii (asi polovina genů) Genová rodina: • skupina genů evolučně pocházející z jediného genu, v evoluci postupná diverzifikace sekvence a funkce Pseudogen: • gen který zmutoval natolik že nemůže být přepisován (v celém genomu > 20 000) Zpracovaný ("processed") pseudogen: • pseudogen vzniklý zpětným přepisem mRNA a integrací do genomu Alela obsahuje „návod" k vytvořen určité konkrétní podoby znaku Alela • dominantní - převažující • recesivní - ustupující • kodominance - alely se společně podílejí na konečné podobě znaku Genotyp Soubor alel daného jedince Genotypy jedinců stejného druhu mohou být rozdílné Fenotyp Vnější projev genotypů Soubor všech znaků organismu. Homozygot Jedinci se shodným párem alel příslušného genu Heterozygot Jedinci s odlišnými alami příslušného genu Přenos genetické informace replikace DNA o o \ o II II \ li P-O-P- o-p- 1 1 * 1 o- cr cr difosfát deoxyribonukleosidtrifosfát vstupující do reakce směr pohybu replikační vidličky Obrázek 6-16 Polarita DNA-řetězců v replikační vidličce. 5'-konec řetězce Tok genetické informace EUKARYOTA cytoplasma buněčné jádro ntrony exony gen primární RNA-transkript mRNA transkripce přidání 5' -Čepičky a poly(a)-konce IAAAA | sestřih rna aaaa export IAAAA , TRANSLACE RNA RNA se liší od DNA v těchto aspektech: □nukleotidy v RNA se nazývají rybonukleotidy, protože cukernou složkou je riboza □v RNA se vyskytují báze adenin ^^^^^^^^^^^^^^ cytosin |H I I............... guanin - I thymin nahrazen uracilem jednořetězcová molekula na základě párování bazí se může sbalit do různých tvarů Typ RNA mRNA rRNA tRNA malé RNA Funkce -kódování proteinů ^^^^^^^^^ součást ribozomů, účast na proteosyntéze adaptor mezi mRNA a aminokyselinou při proteosyntéze účast na sestřhu pre-RNA, účast na transportu proteinů do ER Transkripce Nukleotidové sekvence signalizují RNA-polymeráze začátek a konec transkripce promotor terminátor 1(B) PROMOTOR (startovní signál) -35 -10 + 1 5' 3' -TAGTGTATTGACATGATAGAAGCACTCTACTATATTCTCAATAGGTCCACG-3'~| DNA -ATCACATAACTGTACTATCTTCGTGAGATGATATAAGAGTTATCCAGGTGC-5'J A start transkripce templátový řetězec 3' AGGUCCACG RNA TERMINÁTOR konec T 5' 3' - CCCACAGCCGCCAGTTCCGCTGGCGGCATTTTAACTTTCTTTAATGA-3'-| DNA GGGTGTCGGCGGTCAAGGCGACCGCCGTAAAATTGAAAGAAATTAC T-5'-1 transkripce CCCACAGCCGCCAGUUCCGCUGGCGGCAUUUU templátový řetězec 3' RNA Posttranskripční úpravy RNA processing Transkripcí vzniká primární transkript upravován v jádře Pridaní čepičky modifikace 5 konce primárního transkriptu mnoho eukariotních mRNA má modifikaci na 2 OH skupině skupině ribosy 2. Polyadenylace odštěpení 3 konce primárního transkriptu, je nahrazen přidáním několika adeninů (poly(A)konec) Sestřich RNA RNA splicing Z primárního transkriptu jsou vystřiženy všechny introny a exony jsou spojeny Výsledkem je molekula mRNA, která obsahuje nepřerušenou kódující sekvenci Tři nukleotidové sekvence jsou nutné k rozpoznávání a vyštěpení intronu rozpoznávány snRNP částicemi, které rozštěpí exon-intronové hranice a spojí sousední exony Translace mRNA Tříkrokový cyklus: 1. krok aminoacyl-tRNA navázána do rybosomu 2. krok vzniká nová peptidická vazba 3. Krok uvolnění tRNA bez navázané aminokyseliny rostoucí polypeptidový řetězec 2. krok H2N H;.N H2N- Čtecí rámce Při translaci je nukleotidová sekvence mRNA čtena z 5 konce po trojicích nukleotidů Genetický kód □ je reprezentován 64 kodóny vyjadřuje 20 standartních aminokyselin □ je degenerovaný táž aminokyselina je kódována několika kodóny □ kodóny UAA, UAG, AGA jsou nesmyslné □ je univerzální pro všechny organismy Genetický kód AGA UUA AGC AGG UUG AGU GCA CGA GGA CUA CCA UCA ACA GUA CGC GGC AUA CUC CCC UCC ACC GUC UAA GCG CGG GAC AAC UGC GAA CAA GGG CAC AUC CUG AAA UUC CCG UCG ACG UAC GUG UAG GCU CGU GAU AAU UGU GAG CAG GGU ČAU AUU CUU A AG AUG UUU CCU UCU ACU UGG UAU GUU UGA Ala A Arg R Asp Asn Cys Glu Gin Gly D N His H He Leu Lys Met Pne Pro Ser I M Thr Trp Tyr Val W stop Genetický kód Nucleotide base First Second Third Uracil (U) Cytosine (C) Adenine (A) Guanine (G) Uracil (U) F Phenylalanine (Phe; F Phenylalanine (Phe S Serine (Ser) S Serine (Ser) Y Tyrosine (Tyr) Y Tyrosine (Tyr) C Cysteine (Cys) C Cysteine (Cys) U C L Leucine (Leu) S Serine (Ser) Stop Codon Stop Codon A L Leucine (Leu) S Serine (Ser) Stop Codon W Tryptophan (Trp) G Cytoslne (C) L Leucine (Leu) L Leucine (Leu) L Leucine (Leu) L Leucine (Leu) P Proline (Pro) P Proline (Pro) P Proline (Pro) P Proline (Pro) H Histidine (His) H Histidine (His) Q Glutamine (Gin) Q Glutamine (Gin) R Arginine (Arg) R Arginine (Arg) R Arginine (Arg) R Arginine (Arg) U C A G Adenine (A) 1 Isoleucine (He) 1 Isoleucine (He) 1 Isoleucine (lie) T Threonine (Thr) T Threonine (Thr) T Threonine (Thr) N Asparagine (Asn) N Asparagine (Asn) K Lysine (Lys) S Serine (Ser) S Serine (Ser) R Arginine (Arg) U C A Start (Methionine) T Threonine (Thr) K Lysine (Lys) R Arginine (Arg) G Guanine (G) V Valine (Val) V Valine (Val) V Valine (Val) V Valine (Val) A Alanine (Ala) A Alanine (Ala) A Alanine (Ala) A Alanine (Ala) D Aspartic acid (Asp) D Aspartic acid (Asp) E Glutamic acid (Glu) E Glutamic acid (Glu) G Glycine (Gly) G Glycine (Gly) G Glycine (Gly) G Glycine (Gly) U C A G Genetický kód A. Genetic code for ail amino acids in mRN A Start AUG Stop UAA UAG UGA A (Ala) GCU GCC GCG GCA C (Cys) UGU UGC D (Asp) GAU GAC E (Glu) GAG GAA F (Phe) UUU UUC G (Gly) GGU GGC GGG GGA H (His) CAU CAC I (He) AUU AUC AUA K (Lys) AAG AAA L (Leu) CUU cue CUG CUA UUG UUA M (Met) AUG N (Asn) AAU AAC P (Pro) CCU CCC CCG CCA Q (Gin) CAG CAA R (Arg) CGU CGC CGG CAA AGG AGA S (Ser) UCU UCC UCG UCA AGU AGC T(ľhr) ACU ACC ACG ACA V (Val) GUU GUC GUG GUA W (Trp) UGG Y (Tyr) UAU UAC B (Asx) Asn oder Asp Z (Glx) Gin oder Glu B. Abbreviated code A B C CAGUCUAUGGCAAAUAAGGUAGACCAU met ala asn lys val asp his tyr gly lys stop leu trp glu ile arg stop C. Open reading frame UUA CCU AUU AAA AAA CGG (íeu)—(Pro)—(He)—(Lys)——(Lys)—(Arg) CUG CCG AUA AAG AAG CGA D. Coding by similar nucleotide sequences Francis Crick % gf Ústřední dogma molekulární biologie přenos genetické informace mezi biopolymery Génom u jedinců stejného druhu je stejný Human Genome Project Projekt lidský génom Human Genome Project Projekt lidský genom □ 1986: Santa Fe □James Watson: □ „vstoupit na cestu od dvojišroubovice □ k 3 miliardám schodů lidského genomu" □ 1988: Kongres USA schválil 15 letý projekt a dotaci 3 mld USD "lř ^ 3 ^ □ 1990: začátek projektu □2005: předpokládané ukončení • Walter Gilbert: „až budeme mít v ruce úplnou sekvenci lidského genomu, budeme vědět, co dělá člověka člověkem."... Human Genome Project Projekt lidský genom Cíle Určit úplnou sekvenci genomu (3,2 Gb) Identifikovat a mapovat geny, určit jejiich strukturu a funkci v zdraví i v patologii ■Identifikovat důležité mimogenové sekvence Všechny data uložit v veřejně přístupných databázích ■Sekvenovat genomy modelových organizmů (drozofila, myš, C. elegans, A. thaliana a i.) Zkoumat etické, právní a sociální aspekty The Genome International Sequencing Consortium: Initial sequencing and analysis of the human genome. Nature 409,860-621,2001 Venter, J.C. et al.: The sequence of the human genome.Science 291:1304-1351,2001 Human Genome Project Projekt lidský génom V roce 2003 vědci popsali DNA sekvenci 3 miliard párů bazí tvořících lidský genom Human Genome Project Projekt lidský génom Co bylo zjištěno H