Základní pojmy molekulární genetiky • genetická informace, gen, genetický kód • Struktura a informační obsah genomů O prokaryotický génom O eukaryotický génom (jaderný, mitochondriový, chloroplastový) O virový génom i Základní pojmy molekulární genetiky • Gen = Informační a funkční jednotka obsahující genetickou informaci o primární struktuře f unkčnío molekuly translačního produktu (proteinu) nebo funkční molekuly produktů transkripce RNA (tRNA, rRNA, snRNA a dalších RNA) nepodléhajících translaci • Genetická informace = informace primárně obsažená v nukleotidové sekvenci genomové DNA (genomové RNA u RNA-virů) • Genetický kód = systém pravidel, podle kterých jednotlivé kodony určují na ribozomu zařazení standardních aminokyselin do polypeptidu • Genom = všechny molekuly DNA (nebo RNA u RNA virů) živé soustavy, které se vyznačují replikací a dědí se na potomstvo (Genom = soubor veškeré genetické informace konkrétního organismu) (The total genetic content in one set of chromosomes - haploidní sada) • Genotyp = genetická konstituce organismu reprezentovaná souborem alel (tj. konkrétních variant genů) a sekvencí jeho genomu • Fenotyp = soubor znaků a vlastností, kterými se v daném prostředí projevuje daný organismus (vyjádření genotypu) 2 Způsoby přenosu genetické informace DNA (chromozom, genofor) 5' GAACTC 3' uchování genetické informace Replikace genová exprese 1. Transkripce (přepis) mRNA 5 GAACUC 3 2. Translace (překlad) PROTEIN Glu-Leu (strukturní složky, enzymy) Funkce (struktura, metabolismus) 5' GAACTC 3' (přenos na potomstvo) změna genetické informace MUTACE i 5' GAACCC 3' I Glu-Pro i Změna funkce proteinu Značení řetězců nukleových kyselin podle jejich funkce při přenosu genetické informace dsDNA 5' -► 3' kódující (pozitivní) [nepřepisující se] 5 3 ♦ 3 5 antikódující (negativní) (-DNA) [přepisující se] I transkripce i 5 3'* mRNA 5' GATC 3' 3' CTAG 5' i 5' GAUČ 3' RNA v genomu viru • pozitivní (+) = překládá se do virových proteinů (plní funkci mRNA) negativní (-) = nepřekládá se, slouží k replikaci (regulační funkce) Ústřední dogma molekulární biologie Prenos genetické informace je možný z NK do NK nebo z NK do proteinu, ale není možný z proteinu do proteinu nebo z proteinu do N K F.H.C. Crick - 1958 •v a r transkripce DNA j -► t replikace i DNA translace RNA zpetna transkripce t 4 replikace i ---U--- protein RNA 5 Způsoby vyjádření genetické informace • informace o primární struktuře proteinů • informace o primární struktuře RNA (u DNA sekvencí) nebo DNA ( u RNA sekvencí) • informace, určující navázání proteinů na sekvence NK (regulační funkce) • informace o vazbě regulačních RNA na DNA Konkrétní formy genů • Geny strukturní = přepisují se do molekul mRNA, které se překládají a kódují Polypeptid (translační produkt) O strukturní gen jednoduchý, neobsahující introny O strukturní gen složený, tvořený exony a introny • Geny pro funkční typy RNA = přepisují se do molekul RNA, které se nepřekládají (tRNA, rRNA, snRNA, miRNA a další funkční typy) • Geny jako regulační oblast = úsek DNA, na nějž se váže regulační protein nebo molekula regulační RNA (nepřepisují se ani nepřekládají) 7 Vztah mezi geny a jejich produkty 5' ATG TAG 3' STRUKTURNÍ GEN GEN PRO FUNKČNÍ RNA REGULAČNÍ OBLAST DNA (genomová) 3TAC I ATC I ^ 5' transkripce transkripce interakce s proteiny AUG mR>IA UAG tRNA nebo rRNA 5' I 3' translace dna-viry, prokaryota, eukaryota primární struktura Polypeptid u (proteinu) AUG UAG STRUKTURNÍ GEN 5' translace primární struktura Polypeptid u (proteinu) interakce s proteiny rna-viry RNA (genomová) U RNA-virů neexistují geny pro tRNA nebo rRNA. 8 Rozdíl mezi jednoduchým složeným strukturním genem Rozdíl mezi jednoduchým a složeným strukturním genem spočívá v tom, že složený gen je sestaven z intronů a exonů a jeho primární transkript podléhá sestřihu, kdežto jednoduchý gen neobsahuje ani introny ani exony a jeho primární transkript nepodléhá sestřihu. jednoduchý strukturní gen transkripce primární transkript m RNA (prokaryota) translace primární struktura Polypeptid u (proteinu) složený strukturní gen transkripce primární transkript hnRNA (eukaryota) ses mRNA třih translace primární struktura polypeptidu (proteinu) Schéma posttranskripční úpravy sestřihem složený gen exon mtron exon ■ transkripce i posttranskripční úprava mRNA primární transkript (pre-mRNA, hnRNA) Při sestřihu se z primárního transkriptu vyštěpí přepis intronu a spojí se přepisy exonů 10 Důkaz přítomnosti intronů v genu pro ovalbumin Heteroduplex DNA-mRNA v EM PolylA) tail intron DNA mRNA Srovnání jednoduchého bakteriálního a složeného eukaryontního strukturního genu kódující oblast _I bakteriální gen kódující oblasti nekódující oblasti (exony) (introny) eukaryontní gen 12 Organizace genů na chromozomu obratlovců a jejich přepis do mRNA L one gene of 105 nucleotide pairs H X I I ■ I T IT E TTT I Ť I regulatory DNA sequences intron exon DNA TRANSCRIPTION 5% lil 1 * 1* primary RNA transcript f 3' RNA SPLICING 5' ^ft 3' mRNA intron sequence exon sequence 13 Velikost vybraných genů člověka (v kbp), velikost m RNA a počty intronů velikost genu kb velikost niRNA kb počet intronů ß-Globin 1.5 0.6 2 Insulin 1.7 0.4 2 Protein kinase C 11 1.4 7 Albumin 25 2.1 14 Catalase 34 1.6 12 LDL receptor 45 5.5 17 Factor VIII 186 9 25 Thyroglobulin 300 8.7 36 Dystrophin* more than 17 more than 2000 50 14 Překlad genetické informace UCG CAU m ko dofiy ras jnftrJä rozeznává svým antikodonem kodon pro mmimkymímu, kterou nese. Jinými gmeikšoy informací m rnfíMA apřakíádáji do ímmlmot^mlin v polypeptidmém mtěmi Kompletní dešifrování genetického kódu: 1966 15 Standardní genetický kód (na úrovni RNA) History of the names of the stop codons First, the amber codon was named following experiments in the Benzer's lab at Caltech. In searching for a mutation that would allow a type of phage mutant to grow, Seymour Benzer said that whoever identified the mutation would get to name it after themself (in some versions of the story, it would be named after the discoverer's mother). The graduate student who isolated the mutation was a young man named Harris Bernstein, whose name "Bernstein" in German means "amber". Thus, the UAG codon, known as a nonsense codon (later known as a stop codon), was named the amber codon. Later, the other two stop codons were called "ochre" (UAA) and "opal" (UGA) (sometimes called, "umber") to maintain the color metaphor. What happened to the graduate student? He became a famous molecular biologist. Vysvětlivky: (SC) = selenocystein, (PL) = pyrolyzin, (I) = iniciační kodon Kodony 1 mi i mi U u C > G ber u Sér c Ser I * ISlP: Ser Trp G C Leu Pro Arg U Leu Pro Arg C Leu Pro Arg A Leu Pro Arg G A Ihr U ,"* "•■ ->'.\ji .'VV'■ '•' Thr ':: ■ C lie Thr lř: A 1 1 Thr G G Val Ala • ' •..... Gíy U Val Ata Gly . c Val Ala Gly A Val Ala • Gly G N = nesmyslný kodon,} = iniciačr 1.2.3 = poradí nukleotidů v kod< Kodonové rodiny jsou vyznačeny sady červeně; ií kodon. Dnu. /modře, Základní vlastnosti genetického kódu • je tripletový (třípísmenový) • obsahuje 64 kodonů • je degenerovaný - jedna aminokyselina může být kódována více kodony redundance • 61 kodonů má smysl (kódují aminokyseliny) • většina kodonů je synonymních (tj. odlišné kodony kódují stejnou aminokyselinu) • synonymní kodony jsou zařazeny do kodonových rodin a dvoukodonových sad • 3 kodony jsou nesmyslné (stop kodony, terminační kodony): UAA - ochre, UAG - amber, UGA - opal • 3 kodony jsou bifunkční: O UGA - opal = nesmyslný nebo kóduje selenocystein (21. aminokyselina) O UAG - amber = nesmyslný nebo kóduje pyrolyzin (22. aminokyselina) O AUG = působí jako iniciační při translaci nebo kóduje metionin • je univerzální, tj. většina kodonů má stejný smysl ve všech živých soustavách (prokaryota, eukaryota, viry) 17 Charakteristika standardního genetického kódu 8 kodonových rodín tj. 32 kodonů 8 dvoukodonových sad UC tj. 16 kodonů 5 dvoukodonových sad AG tj- 10 kodonů 1 iniciační a bifunkční kodon AUG tj- 1 kodon 3 terminační kodony tj. 3 kodony (z toho dva bifunkční) 1 kodon lle AU A tj. 1 kodon 1 kodon Trp UGG tj. 1 kodon celkem 64 kodonů Genetický kód 64 kodonů (tripletů), 61 se smyslem, 3 beze smyslu (3 bifunkční) AGA UUA AGC AGG UUG AGU GCA CGA GGA CUA CCA UCA ACA GUA GCC CGC GGC AUA CUC ccc UCC ACC GUC UAA GCG CG G GAC AAC UGC GAA CAA GGG CAC AUC CUG AAA uuc CCG UCG ACG UAC GUG UAG GCU CGU GAU AAU UGU GAG CAG GGU CAU AUU CUU AAG AUG uuu CCU UCU ACU UGG UAU GUU UGA Ala Arg Asp Asn Cys Glu Gin Gly His lle Leu Lys Met Pne Pro Ser Thr Trp Tyr Val stop A R D N C E Q G H L K M F P S W Y V Stop kodony (terminační kodony, kodony beze smyslu): UAA = ochre (stop), UAG = amber (bifunkční), UGA = opal (bifunkční) AUG = kodon pro Met a iniciační kodon (bifunkční) UGA - selenocystein (21 standardní aminokyselina) UAG - pyrrolyzin (22 standardní aminokyselina) Čtení kodonů Čtení kodonů (tripletů) závisí na tom, u kterého nukleotidu dané sekvence stanovíme počátek čtení. Čtecí rámec (reading frame) - jeden ze tří možných způsobů rozpoznávání tripletů v nukleotidové sekvenci. Je dán polohou nukleotidu, na kterém začíná čtení atgatgatgatg -► 3 čtecí rámce i i atgatgatgatq 1. ATG ATG ATG 1 t g at g at g a tg—£ čtecí rámce .1 gatgatgat 2. TGA TGA TGA 3. GAT GAT GAT ORF = open reading frame = otevřený čtecí rámec dsDNA 5' ATCGTCTTGAAGTGCGTGTTAG 3' 3' TAGCAGAACTTCACGCACAATC 5' Struktura genomů • Prokaryotický genom O chromozom (nukleoid) - bakteriální chromozom O plazmidy • Eukaryotický genom O soubor chromozomů v jádře (jaderný genom) O Mitochondrie (mitochondriový genom) O chloroplasty (u rostlin) (chloroplastový genom) O plazmidy • + složky genomů: proviry, transpozony, aj. • nDNA = jaderná, ds lineární • mtDNA = mitochondriová, ds kružnicová nebo lineární • ctDNA = chloroplastová, ds kružnicová • virový genom = DNA (ds, ss) nebo RNA (ds, ss) Živé soustavy Tn domény organizmů (16S RNA a 18S RNA) o Bakterie (Bacteria) o Archea (Archea) o E u kary a (Eukarya) buněčné O jednobuněčné O mnohobuněčné nebuněčné O viry O viroidy Všechny způsoby přenosu genetické informace. Mají všechny složky translačního systému. (aa-tRNA-syntetázy, tRNA, ribozomy) Jsou v translaci závislé na hostitelských buňkách. Viry = živé soustavy schopné reprodukce v závislosti na translačním systému hostitelských buněk. prokaryotický typ buňky "s. — jádro bez jaderné membrány í nedělí se mitoticky ( y ■ DNA kružnicová (většinou) nebo lineární eukaryotický typ buňky jádro obaleno jadernou membránou dělí se mitoticky chromozomy = chromatin (proteiny + DNA) 22 Univerzálni fylogenetický strom Zelené nesirné Mitochondrie I bakterie Purpurové bakterie Chloroplasty Sinice Flavobakterie \ 7 Gram pozitivní bakterie Methanosarcina Methanobacterium Methanococcus Thermoproteus Entaméby | Hlenky| Živočichové Houby \ Pyrodictium Therm ococcus Thermotoga ARCHEA BAKTERIE Aquifex ^^^^^^^^^^^^^^^^^^^^^^^^^ UNIVERZÁLNÍ PŘEDEK PROGENOT Extrémní halofilové Rostliny N á levnící Mastigophora Giardia 23 Table 8.1 Structural aspects of genomes. Organismal Typical genome level Genome type size (bp) Localization Structural proteins virus dsOm dsRNA. ssDNA, 10M(P ss^NA; linear or circular bacteria dsDNA; usually circular 10*-107 archaea dsONA; usually circular 10MCP viral envelope* capsiaVenvekjpe proteins capsid cy-oplasn HU, IHF, minor proteins (see Table 8.2) cytcoasT histo^e-Hke orceins lor.ain histcoe fcfc ar-n interact through handshafc e motif, see main text) eukaryotes dsDMA; irear 107~10M nudeus histones; non-histone proteins 24 Velikost genomu jednotlivých skupin organismů kvetoucí rostliny ptáci savci plazi obojživelníci kostnaté ryby chrupavčité ryby ostnokožci korýši hmyz měkkýši červi houby řasy bakterie mykoplazmata viry ■ I mm 10 10 10 10 10 DNA content (bp) Velikost genomu se udává v počtech párů bází: bp = pár bází nt = nukleotid kbp = 1000 bp Mbp = 1000 kbp Gbp = 1000 Mbp 1 bp = 660 D 1 mm DNA = 3 Mbp Paradox hodnoty C - velikost genomu neodpovídá vývojovému postavení (celkové komplexitě) organismů 25 Počet genů a velikost geno-mu u zástupců jednotlivých skupin organismů [ TABLE 4.01 I Genome Sizes ^^^^^^ Number Amount Number of Organism of Genes of DNA (bp) Chromosomes Viruses Bacteriophage MS2 Tobacco Mosaic Virus OX 174 bacteriophage Influenza T4 bacteriophage Poxvirus Bacteriophage G Prokaryotes Mitochondrion (human) Mitochondrion [Arabidopsis) Chloroplast (Arabidopsis) Nanoarchaeum equitans Mycoplasma genitalium Methanococcus Escherichia coli Myxococcus Eukaryotes (haploid genome) Encephalitozoon Saccharomyces Caenorhabditis Drosophila Homo sapiens Arabidopsis Oryza sativa (Rice) 4 4 11 12 200 300 680 37 57 128 550 480 1,500 4,000 9,000 2,000 5,700 19,000 12,000 25,000 25,000 45,000 3,600 6,400 5,387 13,500 165,000 187,000 498,000 16,569 366,923 154,478 490,000 580,000 1.7Mbp 4.6 Mbp 9.5 Mbp 2.5 Mbp 12.5 Mbp 100 Mbp 140 Mbp 3,300 Mbp 115Mbp 430 Mbp 1 (ssRNA)* 1 (ssRNA)* 1 (ssDNA) 8 (ssRNA) 11 16 6 5 23 5 12 *ssRNA = single stranded RNA; ssDNA stranded DNA. single stranded DNA; all other genomes consist of double Účinnost sekvenování DNA a historie analýzy DNA Současnost: 1. Stále vyšší účinnost sekvenování, nižší cena 2. Nové bioinformatické přístupy 3. Aplikace v biomedicíně (zejm. v onkológii) 4. Komercionalizace 5. Analýza mikrobiomu a metagenomu významné objevy ve vývoji sekvenování účinnost bp/osoba/rok 15 ZEL 1 500 15 000 150 000 000 1868 1944 1953 1965 1970 1977 1979 25 00C 100 000 1 000 000 účinnost bp/prístrojírok 1980 X 1986 1990 1995 1996 1998 1998 2000 2001 2002 2004 2005 Miescher: objev DNA Avery: důkaz, že DNA je „genetický materiál" Watson & Crick: objev struktury DNA jako dvojité šroubovice Holley: určeni sekvence tRNA*'* kvasinek • K sekvenování RNA byly použitý metódy špecifického enzymatického trávení RNA a chromatografie, což vyžadovalo velká množství analyzovaného vzorku. Wu: Sequenced X cohesive end DNA • Primed synthesis concept and 2-D electrophoresis were used; samples were labeled and less material was required. Sanger: Developed dideoxy termination sequencing procedure; Gilbert: Developed chemical degradation sequencing protocol • Chain termination and chemical degradation concepts were developed. • Polyacrylamide gel electrophoresis was used to separate DNA tracts. Goad: Proposed GenBank prototype Messing: Developed M13 cloning vectors • Cloning system was applied. Hood: Developed partially automated sequencing system • Sequencing reactions were optimized. • Assorted sequencing strategies were applied and computer assisted-data handling was started. Watson: Human genome project initiated Venter: First bacterial genomes sequenced • Automated fluorescent sequencing instruments and robotic operations were applied to the process. • PCR sequencing concept was introduced. International consortium of scientists: First eukaryotic genome-yeast-sequenced • Collaborations between teams of scientists. PerkinElmer, Inc.: Developed 96-capillary sequencer • Fully automated 96-capillary electrophoresis sequencing system becomes available to research laboratories. Complete sequence of the Caenorhabditis elegans genome Complete sequence of the euchromatic portion of the Drosophila metanogaster genome; Complete sequence of the Arabidopsis thaliana genome International Human Genome Sequencing Consortium and Celera Genomics scientists: First drafts of the sequence of the human genome published International Rice Genome Sequencing Project and Syngenta scientists: First drafts of the genomic sequences of two rice subspecies; Mouse Genome Sequencing Consortium: First draft of the sequence of the mouse genome Rat Genome Sequencing Project Consortium: First draft of the sequence of the rat genome; International Human Gene Sequencing Consortium: Nearly complete (99% of euchromatin) sequence of the human genome Časový průběh sekvenování genomů IiÍÍ3sl8on and debate in scientific community fíŔC repoft, B ■C g) í- o. _, ,_ &seque-cinc ... „ ^— , C. cj'Cí.viľ'Jsjyčc'Uencincj—= -........ -tuiu 'M QERtf II^M' O ill". Li u íl _ \;/íí lhmšj)a sentencing r~-j v*^-1-i-i«-.» —■ -'-5-■»—~ -".'*. .,■*" ;,- —i ^ J, ^ , S......u S, 3-ŕ Genetic maps Microsatellites maps . -si—= i SNPs sequencing Full len Genomic sequencing ľ téL™___b ' i^-ít.— L/ Genetic maps —— pA^j •/■r-: .*•]• í,__ S Physical maps, i i j* Pilot sequencíi Microsatellites SNPs I ČDNA sequencing 1 ESTs ____ —- Full length qui rŕ Working Genomic sequencing ■d;í1e U Pilot project, 15% -^Jjraft^j^ Chromosome 22 Chromosome 21 28 Projekty sekvenování genomů modelových organizmů Escherichia coli (4.6 Mb) - bakterie, prokaryotický organismus • známá struktura genomu, regulace a funkce genů • dobře prostudovány biochemické dráhy Saccharomyces cerevisiae (14 Mb) - kvasinka, jednobuněčný eukaryotický organismus • známá struktura genomu, regulací a funkce genů • probíhá mitóza a meióza • velký počet dobře definovaných mutant • vysoká frekvence homologní rekombinace - snadné záměny alel Caenorhabditis e/egans (100 Mb) - jednoduchý mnohobuněčný organismus (hlístice, červ) • obsahuje 959 buněk, jejichž vývojové linie jsou známy • detailně prostudovaný nervový systém (302 neuronů a jejich spojení) modelový organismus vývojové biologie (procesy diferenciace) 29 Projekty sekvenování genomů modelových organismů Drosophila melanogaster (165 Mb) - zástupce hmyzu objekt klasické genetiky dobře prostudována struktura genů, jejich regulace a funkce • řada dobře definovaných mutant. Fugu rubripes (400 Mb) - ryba • model genomu obratlovců • nízká proporce repetitivních sekvencí • vysoká proporce exonů • relativně krátké geny ve srovnání s lidskými homologními geny (vhodný pro identifikaci lidských kódujících genů) Danio rerio - ryba Studium vývoje obratlovců. Velká embrya s rychlým růstem. Studium genetických poruch u člověka. 30 Projekty sekvencování génomů modelových organismů Arabidopsis thaliana (100 Mb) - kvetoucí rostlina neobvykle malý génom nízký počet chromozomů nízká proporce retitivních sekvencí vysoký počet semen (10 000) během krátké generační doby Mus musculus - myš, savec (3000 Mb) geneticky nejlépe prostudovaný savec vhodný experimentální model pro studium mutací a genetická křížení vazba genů podobná jako u člověka možnost přípravy transgenních myší s genetickými modifikacemi model studia genové exprese a funkce genů. metagenom = genetický materiál pocházející z určitého prostředí mikrobiom = mikrobiální osídlení lidského těla 31 Prokaryotický génom • Složky O Bakteriální chromozom (nukleoid) O Mobilní elementy (Plazmidy, inzerční sekvence, transpozony, genomické ostrovy, integrony aj) O Bakteriofágy, profágy 32 STRUKTURA PROKARYOTICKYCH GENOMU Mozaikový charakter Endochromozomy (1,2) Přídatné genetické elementy (A-H) - Plazmidy (H, F) - Profágy a defektní profágy (B, D, E, G) - Genomické ostrovy (A, C) - IS-elementy, transpozony, integrony (I) Vysoká dynamika a plasticita Variabilní složka genomu - adaptace na prostředí 33 TOPOLOGIE PROKARYOTICKÉHO GENOM U Replikony I I DRUH CHROMOZOMY PLAZMIDY LINEÁRNÍ LINEÁRNÍ Escherichia coli 1 (4,6 WM Bacillus cereus 1(5 Mb) » 1 (2,4 Mb) < MniDDannnoaa . několik (2,6 Mb) Vibrio cholerae 2 .9+1,1 Mb) Borrelia burgdorferi 1 (0,9Mb) (kfo) 12 (kb) Agrobacterium tumefaciens 1 (2,1 Mb) Streptomyces lividans 1 (8 Mb) -► 1 (50 kb) Prokaryota s lineárním chromozomem • Streptomyces (ambofaciens, lividans) 10 Mb • Borrelia burgdorferi (B. hermsii) 0.95 Mb O + lineární plazmidy • Coxiella burnetii 2,1 Mb • Paracoccus denitrificans - tři molekuly DNA O 2; 1,1; 0,64 Mb, dvě jsou lineární • Agrobacterium tumefaciens • a řada dalších... 35 Velikost genomu prokaryot Genetická organizace prokaryotického genomu • velmi kompaktní genom s malými mezerami mezi geny • většina genomu je obsazena strukturními geny • malá část (10 %) je tvořena nekódující DNA • operonové uspořádání genů (většinou funkčně příbuzných) • pořadí genů není u prokaryot konzervováno - důsledek přestaveb genomu a horizontálního přenosu genů 37 Velikost a genový obsah vybraných prokaryotických genomů druh velikost genomu v párech nukleotidů předpovězený počet genů Archaea Archaeoglobusfitlgidus 2 178 400 2 486 Meth ano sarcina acetworans 5 751 492 4 721 Nanoarchaeum equtians 490 885 582 Pyrococcusfurtosus 1 908 256 2 228 Sulfolo bus solfata ricus 2 992 245 3 033 Thermoplasma volcanium 1 584 804 1548 Eubacteria Bacillus subtilis 4 214 630 4 225 Bordetella parapertussis 4 773 551 4 467 Bradyrhi%pbium japonkum 9 105 828 8 373 Buchnera aphidicda 615 980 550 Chlamydia pneumoniae kmenAR39 1 229 853 1167 Escherichia coli kmen Kl2 MG 165 5 4Ó39 675 4 467 Escherichia coli kmen Ol 57 EDL933 5 528 970 5 463 Haemophilus influenzae Rd KW20 1 830 138 1789 Legionella pneumophila kmen Paris 3 503 610 3 136 Mycobacterium tuberculosis kmen CDC 4 403 837 4 293 Myco bacterium genitalium 580 076 525 Neisseria meningitidis Z2491 2 184 406 2 208 Pseudomonas syringae kmen DC3000 6 397 126 5 660 Rickettsia typhi 1 111 496 919 Salmonella typhimurium 4 857 432 4 622 Staphylococcus aureus kmen MW2 2 820 462 2 712 Streptomyces coelicolor 8 667 507 7 912 Ureaplasma parumATCC 700970 751 719 653 Yersinia pestis kmen KIM 4 600 755 4 240 Údaje jsou převzaty z webové stránky NCBI (http://www.ncbi.nlm.nih.gov/Genomes/), kveten 2008. Počet genů u prokaryot je proporcionální velikosti jejich genomu - paradox hodnoty C u nich neplatí Organizmus Velikost genomu (Mbp) Počet ORF T. pallidum B. burgdorferi H. pylori A. fulgidus B. subtilis M. tuberculosis E. coli 1.14 1.44 1.66 2.18 4.20 4.41 4.60 1040 1751 1657 2 437 4100 3 924 4 288 1 gen ~ 1 kbp Klasifikace 4288 genů E. coli podle jejich funkce funkce fágů, transpozonů a plazmidů replikace DNA, rekombinace, reparace DNA metabolizmus uhlíkatých sloučenin metabolizmus aminokyselin další geny se známou funkcí regulační funkce translace, proteinový metabolizmus ústřední intermediární metabolizmus adaptace, ochranné funkce buněčná stěna, strukturní membránové komponenty metabolizmus nukleotidů transkripce, metabolizmus RNA mastné kyseliny, fosfolipidový metabolizmus energetický metabolizmus transportní proteiny potenciální enzymy 40 Struktura chromozomu E. coli hlp, hu-proteiny, enzymy a faktory účastnící se replikace a transkripce 41 Charakteristika plazmidů dsDNA - kružnicová nebo lineární, velikost: 1-1000 kb Základní typy plazmidů: • kryptické - funkce neznámá • epizomální - reverzibilní intergace do chromozomu hostitele • konjugativní - schopné přenosu konjugací • mobilizovatelné - přenositelné za přítomnosti konjugativního plazmidů 42 Příklady plazmidů: • F-plazmidy (fertilitní faktor, konjugativní) O zodpovědné za konjugaci • R-plazmidy (R-faktory) O zodpovědné za rezistenci k antibiotikům • kolicinogenní (Col-plazmidy) O tvorba proteinů s antibiotikovým charakterem (Enterobacteriaceae, aj.) • Ti-plazmidy (tumory indukující) O tvorba nádorů u dvouděložných rostlin (Agrobacterium tumefaciens) • plazmidy odbourávající organické sloučeniny (Pseudomonas) • plazmidy podílející se na fixaci vzdušného dusíku (Rhizobium). • plazmidy používané jako vektory pro přenos DNA (pBR322, pUC) 43 Eukaryotický typ buněk • Jádro je ohraničeno od cytoplazmy membránou • Dělení buněk probíhá mitózou nebo meiózou • Genetický materiál tvoří chromatin • Buněčná stěna je odlišná od prokaryotické nebo chybí • Buňka obsahuje organely: mitochondrie, chloroplasty, cytoplazmatické retikulum, Golgiho aparát, lysozomy aj. Přenosy genetické informace u eukaryot probíhají principiálně stejně jako u prokaryot 44 Složky eukaryotického genomu • jaderný genom - lineární chromozomy v různém počtu • mitochondriový genom - kružnicové nebo lineární genofory • c h loro plastový genom (rostliny) - kružnicové genofory • plazmidy (velmi vzácně) - kružnicové genofory 45 Chromatin = genetický materiál eukaryotické buňky 30 % NK (DNA + RNA) + 70 % proteinů Základní formy organizace chromatinu chromatinová síť vláken v interfázi jednotlivé chromozomy při mitóze - euchromatin (transkripčně aktivní) z* chromatin (méně kondenzovaný, slabě barvitelný bazickými barvivy) heteroterochromatin (transkripčně inaktivní konstitutivní f aku Itativní centroméra + teloméra dočasně netranskribované geny, změny během ontogenetického vývoje 46 Struktura mitotických chromozomů ■*-1 1 lil 10 D Tandem repeats Centromere-associated tandem repeats Telomeric and sub-telomeric repeats Dispersed Tyl/copia retroelements and microsatellites LINEs Single and low-copy sequences including genes 47 Funkční složky eukaryotických chromozomů • centromera - zajišťuje segregaci chromozomů do dceřiných buněk při mitóze (meióze) • telomera - koncová oblast - její struktura zajišťuje dokončení replikace lineárního chromozomu Typické telomerové repetice: OTTGGGG - Tetrahymena OTTAGGG - člověk • počátky replikace (ori) 48 Úrovně kondenzace chrom a ti nu krátký úsek dvojšroubovice DNA „korálková" farma chromát! h u 30-nm ctiromalinové Vlákno s poskládanými nukfeosomy úsek chromosomu v rozvinuté, fbrrně ůplhý mitótický chioinosom I 700 n m i T 14Q0 nm 1 Výsledek: Každá molekula DNA je zabalena do mitotického chromozomu tak, že je 50 OOOkrát kratší než v rozvinuté formě Nukleozómová struktura DNA 8 -114 bp spojníková DNA í jádrové histony nukleosomu f „korálková" forma chromatinu L nukleáza štěpí spojníkovou DNA nukleosom obsahuje 200 nukleotidových párů DNA n__ uvolněná částice jádra ( nukleosomu disociace ve vysoké koncentraci soli T 11 nm ± oktamerní histonové jádro I disociace dvoušroubovice DNA ze 146 nukleotidových párů r""!—í—i 4^ ^ H2A H2B H3 H4 50 histonový oktamer DNA Histonový oktamer lze si lze velmi zjednodušeně představit jako válec, kolem něhož se otáčí DNA. 10-11 nm 6 nm molekulární model Funkce histonu H1 při spojování nukleozomů Molekulární struktura eukaryotického chromozomu 30 nm vlákno - solenoidová struktura Závit solenoidu tvořený Proteiny chromatin u A. Histony • Bázické proteiny obsahující vysokou proporci argininu a lyzinu (20-30%). U některých organismů jsou ve spermiích přítomny protaminy, které jsou bohaté na arginin. • Histony jsou velmi konzervativní (zejména H3 a H4). U bakterií se vyskytují toliko HLP, u archeí se nacházejí histony, které jsou jen částečné homologní s H3 a H4. B. Proteiny nehistonové povahy • proteiny s enzymovými funkcemi, zajišťující replikaci a transkripci (polymerazy, ligázy aj) a enzymy modifikující histony při remodelaci chromatinu (acetyltransferazy, metylazy aj) -regulace genové exprese • HMG-proteiny (high mobility group), navozující změny chromatinu během transkripce 54 Struktura 30 nm chromatinového vlákna -nukleozom 1 závit (otáčka) 30 nm-chromatinového vlákna, který sestává ze šesti nukleozomů propojených dsDNA. 30 nm-chromatinové vlákno proteinové lešení chromatinová doména (chromatinová smyčka) replikace transkripce Tento obrázek je idealizujícím schématem. Chromatinové domény nejsou stejně velké. Jejich délka je 60-150 kb. 55 Modely přetváření nukleozomové struktury chromatin u ^ Genová exprese, replikace DNA a další procesy vyžadující přístupnost DNA uložené v nukleozomech Kovalentní modifikace histonů H2A HB2 H3 H4 K S K K K 9 10 14 18 23 NC S K K K 15 8 12 histone-fold domain S - serin, K - lyzin Ac = acetyl (lyzin) Me = metyl (lyzin) P = fosfát (serin) c u = ubiquitin v__✓ „Histonový kód u • změna struktury chromatinu (de/kondenzace) • exprese genů • umlčení genů 57 Sekvence eukaryotického genomu Jedinečné sekvence (strukturní geny) přímé tandemové r. ATGCATGCATGC *-*-* í Jednotka repetice Repetice rozptýlené r. / \ obrácené ATGC...GCAT K- krátké dlouhé 100-300 bp > 300 bp Alu transpozony IR LTR retroviřy IR (inverted repeat) ATGČ--------GCAT Obrácená (koncová) repetice TACG--------CGTA <- LTR A-► LTR (Long Terminal Repeat) : GTATG-----CATAC--------------------------GTATG-—CAT AC Dlouhá koncová repetice CATAC-----GTATG---------------------------CATAC-—GTATG. 58 Typy genů na eukaryotické jaderné DNA • Jedinečné geny (1 kopie, většina strukturních genů) • Tandemové repetice (geny pro rRNA, geny pro histony) • Genové rodiny (skupiny příbuzných genů - geny pro globin, aktin aj.) • Pseudogeny (inaktivní kopie genů) • Rozptýlené genové repetice (kopie genů nebo genových rodin rozptýlené po genomu - geny pro tRNA, snRNA aj.) • Orfany (orphans, ORFANS) = URF = ORF s neznámou funkcí, bez homologie ke známým genům • Mezerníky - sekvence oddělující geny nebo skupiny genů a) přepisované b) nepřepisované 59 Projekt analýzy lidského genomu Human Genome Project (HGP) • 1985 - první úvahy • 1987 - první finanční zdroje • 1990 - oficiálni zahájení Dept. Energy, NIH, HUGO Cíle dílčích etap: 1. Konstrukce genetické mapy s vysokým rozlišením 2. Konstrukce fyzikálních map různého typu 3. Téměř úplná sekvence genomu stanovena v roce 2003 (2001-publikace v Náture a Science), dokončeno 2005 O identifikovat a lokalizovat geny v genomu člověka O stanovit rozdíly v genetické výbavě jedinců O jak rozdíly v genetické výbavě predisponují jedince k chorobám Součást projektu: • Rozvoj metodologie analýzy genomu (mapování genů, sestavování sekvencí) • Bioinformatika (sběr a zpracování dat) • Analýza genomu modelových organismů eo Projekt diverzity lidského genomu (Human Genome Diversity Project) • Studium genetických variaci v etnických skupinách 1. Původ člověka, migrace prehistorických populací, sociální struktura populací. 2. Adaptace a choroby. Náchylnost populací k chorobám (hypertenze, thalasemie, srpkovitá anémie aj). 3. Forenzní antropologie. Variabilita DNA markem, spolehlivost DNA-fingerprintů, identifikace jedinců. Matt Ridley: Genom - Životopis lidského druhu v třiadvaceti kapitolách. Portál, Praha 2001. 61 Lidský mezinárodní projekt HapMap (Haplotype map) Cíl projektu: identifikovat a mapovat SNP („snips", single-nucleotide polymorphisms) v různých populacích, zjistit jejich asociaci s geny zodpovědnými za choroby a tím stanovit rizika vzniku chorob (270 národů ze čtyř větví lidstva - Američanů, původem evropských bělochů, v Číňanů, Japonců a Yoruby ze západní Afriky) Drobné změny v lidském genomu: jednonukleotidové polymorfismy = SNP - záměny nukleotidů v četnosti 1 : 2 000 (podobnost genomů u nepříbuzných lidí -99,5%) Haplotyp: skupina vázaných SNP v určité oblasti chromozomu využívaných jako markery (jsou vázány k určitým genům (alelám) - asociace s geny zodpovědnými např. za choroby) původ DNA: SNP1 SNP2 SNP3 SNP4 jedinec 1 TACAGGATC — TTCGGGCCA — AATCCATGC — AAGCTCGGA jedinec 2 TACAAGATC — TTCGAGCCA — AATCCATGC — AAGCTCGGA jedinec 3 TACAGGATC — TTCGAGCCA — AATCTATGC — AAGCTCGGA jedinec 4 TACAGGATC — TTCGAGCCA — AATCCATGC — AAGCCCGGA i i i i f i i i t T T t haplotyp 1 G G C T haplotyp 2 A A C T haplotyp 3 G A T T haplotyp 4 G A C C Četnost výskytu 1:1 200 62 Typy DNA-sekvencí v lidském genomu lidský genorr 3 miliardy bp Geny a genům podobné sekvence 20-30% Nekódující sekvence >90% Introny, promotoiy, zaváděcí sekvence —I Pseudogeny Kódující sekvence NA Buňky vyšších rostlin 2s5xl05 až 2,0 xlO6 kružnicová nebo lineární pozoruhodná variabilita ve velikosti, struktuře a genetické organizaci nejen mezi druhy, ale také u stejného organizmu, a tedy i ve stejné buňce Prvoci 3,0 x 104 až 6,0 x 104 kružnicová nebo lineární rozdíly mezi druhy, Kvasinky 2,0 x I04 až 1,0x10? kružnicová jednotná uvnitř stejného druhu, ale rozdíly mezi druhy ♦ Velmi charakteristické pro mtDNA vyšších rostlin jsou úseky, které se podobají DNA chloroplastů. Specifické rysy mitochondriového genomu 1. Geny jsou uspořádány velmi hustě, téměř celá sekvence je tvořena strukturními geny nebo se přepisuje do rRNA a tRNA 2. K translaci je využíváno jen 22 tRNA, které jsou schopny díky kolísavému párování bazí přečíst všechny kodony 3. Genetický kód používaný v mitochondriích (některých organismů) se liší od standardního genetického kódu. 4 ze 64 kodonů mají jiny smysl (zřejmě v důsledku malého počtu proteinů kódovaných v mitochondriích byly tyto změny během evoluce tolerovány) • pro zajištění fungování mitochondrií je vyžadováno 90 genů lokalizovaných v jaderném genomu • mitochondriové geny se dědí nemendelisticky (matroklinně, cytoplazmatická dědičnost) - studium lidských populací • podléhá rychleji mutacím (10-100x častěji něž jaderný genom, reparační procesy omezene)Mutace mitochodnrií zodpovídají za řadu onemocnění (neurodegerativní,, svalové aj.) 73 Většina proteinů v organelách je kódovaná jaderným genomem Kooperace jaderných genů s geny na mtDNA lidského genomu Funkční produkt Podjednotky (protomery) funkčního produktu určené geny lokalizovanými na mtDNA určené geny lokalizovanými v jádře buňky NADH-dehydrogenáza 7 podjednotek >41 podjednotek Sukcinát CoQ-oxidoreduktáza 0 podjednotek 4 podjednotky Komplex cytochromu b-cl 1 podjednotka 10 podjednotek Cytochrom c-oxidáza 3 podjednotky 10 podjednotek HMranspo rtu jící ATP-syntáza 2 podjednotky 14 podjednotek rRNA mitochondrií 2 0 tRNA mitochondrií 22 0 mRNA mitochondrií 13 0 DNA- a RNA-polymerázy 0 všechny Ribozomové proteiny 0 -70 Onemocnění jako důsledek mutací mtDNA a nDNA Biogeneze proteinů dýchacího řetězce v lidských mitochondriích \ •••• -1000 different nuclear-encoded mitochondrial proteins mitochondrial DNA translokázy 13 mtDNA- mitochondrial encoded proteins ribosome 76 Genom chloroplastů 77 Genetická organizace genomu chloroplastu Geny chloroplastů Nicotiana tabacum Funkce Počet genů Transkripce RNA-polymeráza 4 Translace rRNA 4 tRNA 30 Ribozomové proteiny 21 Fotosyntéza Fixace C02 1 Fotosystém I 5 Fotosystém II 14 Cytbchromový komplex b/f 5 H+transportující ATP-syntáza 6 "Tm^unTÉce" NAD(P)H-dehydrogenázový komplex 11 Clp-proteáza 1 Acetyl-KoA-karboxyláza (EC 6.4.1.2) 1 Membrána plastidu 1 Maturázy (str. 394) 1 Otevřené čtecí rámce kódující více než 29 aminokyse -lín 30 - Geny chloroplastů jsou podobné genům cyanobakterií Původ mitochondrií a chloroplastů (endosymbiotická teorie) • MITOCHONDRIE • chemoorganotrofní prokaryotické améboidní anaerobní před-buňky s aerobní respirací * chůdci eukaryotických buněk (protomitochondrie) • CHLOROPLASTY • fotolitotrofní prokaryotické buňky _^ améboidní předchůdci (fotosyntetizující protochloroplasty) eukaryotických buněk • Nepřímé důkazy: O přehrádečné dělení mitochondrií O konformace DNA (kružnicová forma) O translační aparát podobný prokaryotům • podobnost sedimentačních koeficientů ribozomů • podobnost sekvencí mt-rRNA s rRNA bakterie E. coli 80 Původ mitochondrií „symbiont Nuclear envelope „protoeukaryot" Anaerobic eukaryotic precursor Aerobic eukaryotic cell protomitochondrie 81 Genom virů • Viry O Prokaryotické (bakteriofágy) • DNA • RNA O Eukaryotické • živočišné DNA/RNA • rostlinné DNA/RNA • houbové DNA/RNA • Typy genomové N K O ssDNA - lineární nebo kužnicová O dsDNA - lineární nebo kružnicová O ssRNA - lineární O dsRNA - lineární Segmentovaný genom 82 Struktura virových částic DNA Matrix Capsid bakteriofág virus HIV 83 Rozdělení virů podle typu genomu 1. dsDNA-► dsDNA I virion + mRNA-► proteiny (většina DNA fágů, herpesvirus, poxvirus, adenovirus, SV40) 2. +ssDNA —► -ssDNA - I +mRNA -ssDNA —► +ssDNA +mRNA (parvoviry, 1X174) > +ssDNA > proteiny virion > -ssDNA proteiny virion 84 Retroviry (HIV) RT RT H-ssRNA-------------> -ssDNA------> dsDNA integrace do chromozomu aktivace VX +RNA mRNA H-ssRNA I + proteiny —► virion 85 86 Model struktury centromery metafázního chromozomu Konzervativní struktury centromer u kvasinky 20 nm nukleozomy mikrotubulus dělicího vřeténka .centromera I 110 nukleotidů -►! (-40 nm DNA) konzervativní elementy I III ATAAGTCACATGAT - - TGATTTCCGAA TATTCAGTGTACTA - a» DP.SM/oAl . ACTAAAGGCTT í í vazba specifických proteinů 87 Model lidské telomery stabilizované tvorbou t-smyčky vysoce konzervativní sekvence - tandemové repetice centromera (TTAGGG)fl 111111111111111 I I I I I I I M M I I I M I (AATCCC)n —v— komplex TRF-2 komplex TRF-1 Specifita struktury telomery: - zabraňuje odbourávání konců chromozomů DNázami - brání spojování (fúzím) konců různých chromozomů - umožňuje replikaci lineárních chromozomu 89 90