Základní pojmy molekulární genetiky • genetická informace, gen, genetický kód • Struktura a informační obsah genomů O prokaryotický génom O eukaryotický génom (jaderný, mitochondriový, chloroplastový) O virový génom i Základní pojmy molekulární genetiky • Gen = Informační a funkční jednotka obsahující genetickou informaci o primární struktuře funkčníomolekuly translačního produktu (proteinu) nebo funkční molekuly produktů transkripce RNA (tRNA, rRNA, snRNA a dalších RNA) nepodléhajících translaci • Genetická informace = informace primárně obsažená v nukleo-tidové sekvenci DNA (genomové RNA u RNA-virů) • Genetický kód = systém pravidel, podle kterých jednotlivé kodony určují na ribozomu zařazení standardních aminokyselin do poly-peptidu • Genom = všechny molekuly DNA (nebo RNA u RNA virů) živé soustavy, které se vyznačují replikací a dědí se na potomstvo (Genom = soubor veškeré genetické informace konkrétního organismu) (The total genetic content in one set of chromosomes) • Genotyp = genetická konstituce organismu reprezentovaná soubo-rem alel (tj. konkrétních variant genů) a sekvencí jeho genomu • Fenotyp = soubor znaků a vlastností, kterými se v daném prostředí projevuje daný organismus (vyjádření genotypu) 2 Způsoby přenosu genetické informace genová exprese 1. Transkripce (přepis) 2. Translace (překlad) DNA (chromozom, genofor) 5' GAACTC 3' uchování genetické informace Replikace 5' GAACTC 3' (přenos na potomstvo) změna genetické informace MUTACE | 5' GAACCC 3' mRNA 5' GAACUC 3' PROTEIN (strukturní složky, enzymy) Funkce (struktura, metabolismus) Glu-Leu Glu-Pro 1 Změna funkce proteinu Značení řetězců nukleových kyselin podle jejich funkce při přenosu genetické informace dsDNA 5' -► 3' kódující (pozitivní) [nepřepisující se] 5 ..............................3 * 3 5 antikódující (negativní) (-DNA) [přepisující se] I transkripce i 5 ..............................3'* mRNA 5' GATC 3' 3' CTAG 5' 5' GAUČ 3' RNA v genomu viru • pozitivní (+) = překládá se do virových proteinů (plní funkci mRNA) • negativní (-) = nepřekládá se, slouží k replikaci (regulační funkce) Ústřední dogma molekulární biologie prenos genetické informace je možný z NK do NK nebo z NK do proteinu, ale není možný z proteinu do proteinu nebo z proteinu do NK F.H.C. Crick - 1958 DNA t replikace i DNA transkripce zpětná transkripce translace RNA t i replikace i ---U--- protein RNA 5 Způsoby vyjádření genetické informace • informace o primární struktuře proteinů • informace o primární struktuře RNA (u DNA sekvencí) nebo DNA ( u RNA sekvencí) • informace, určující navázání proteinů na sekvence NK (regulační funkce) Konkrétní formy genů • Geny strukturní = přepisují se do molekul mRNA, které se překládají kódují Polypeptid (translační produkt) O strukturní gen jednoduchý, neobsahující introny O strukturní gen složený, tvořený exony a introny • Geny pro funkční typy RNA = přepisují se do molekul RNA, které se nepřekládají (tRNA, rRNA, snRNA a dalších funkčních typů) • Geny jako regulační oblast = úsek DNA, na nějž se váže regulační protein/y (nepřepisují se ani nepřekládají) 7 Vztah mezí geny a jejích produkty 5" ATG TAG STRUKTURNÍ GEN 3TAC | transkripce GEN PRO FUNKČNÍ RNA _y_ DNA (genomová) ATC AUG transkripce interakce s proteiny 5' m RNA UAG tRNA nebo rRNA 3" translace ▼ D NA-VIRY, PROKARYOTA, EUKARYOTA primární struktura polypeptidu (proteinu) AUG UAG STRUKTURNÍ GEN 5" it 3" translace interakce s proteiny primární struktura polypeptidu (proteinu) RNA (genomová) U RNA-virů neexistují geny pro tRNA nebo rRNA. 8 Rozdíl mezi jednoduchým složeným strukturním genem Rozdíl mezi jednoduchým a složeným strukturním genem spočívá v tom, že složený gen je sestaven z intronů a exonů a jeho primární transkript podléhá sestřihu, kdežto jednoduchý gen neobsahuje ani introny ani exony a jeho primární transkript nepodléhá sestřihu. jednoduchý strukturní gen transkripce i primární transkript mRNA (prokaryota) translace primární struktura Polypeptid u (proteinu) složený strukturní gen transkripce i primární transkript hnRNA (eukaryota) sestřih mRNA translace primární struktura polypeptidu (proteinu) Schéma posttranskrípční úpravy sestřihem složený gen posttranskrípční úprava primární transkript (preRNA, hnRNA) mRNA Při sestřihu se z primárního transkriptu vyštěpí přepis intronu a spojí se přepisy exonů 10 Srovnání jednoduchého bakteriálního a složeného eukaryontního strukturního genu kódující oblast eukaryontní gen 11 Organizace genů na chromozomu obratlovců a jejich přepis do mRNA chromosome of 1.5 x 1(r nucleotide pairs, containing about 3000 genes Velikost vybraných genů člověka (v kbp), velikost mRNA a počty intronů Number of Gene Size mRNA Size Introns ß-Globin 1.5 0.6 2 Insulin 1.7 0.4 2 Protein kinase C 11 1.4 7 Albumin 25 2.1 14 Catalase 34 1.6 12 LDL receptor 45 5.5 17 Factor VIII 186 9 25 Thyroglobulin 300 8.7 36 Dystrophin* more than 17 more than 2000 50 13 Překlad genetické informace UCG CAU GC^C akodonynamRNA AG C n II A n PS re = antikodony tRNA Sgrl [ His] f AlaJ * aminokyseliny nesené tRNA Transferové RNA rozeznává svým sntikodonem na mRNA kodon pro aminokyselinu, kterou nese. Jinými slovy čte genetickou informaci na mRNA a překládá ji do pořadí aminokyselin v polypeptidovém řetězci. 14 Standardní genetický kód (na úrovni RNA) History of the names of the stop codons First, the amber codon was named following experiments in the Benzer's lab at Caltech. In searching for a mutation that would allow a type of phage mutant to grow, Seymour Benzer said that whoever identified the mutation would get to name it after themself (in some versions of the story, it would be named after the discoverer's mother). The graduate student who isolated the mutation was a young man named Harris Bernstein, whose name "Bernstein" in German means "amber". Thus, the UAG codon, known as a nonsense codon (later known as a stop codon), was named the amber codon. Later, the other two stop codons were called "ochre" (UAA) and "opal" (UGA) (sometimes called, "umber") to maintain the color metaphor. What happened to the graduate student? He became a famous molecular biologist. Vysvětlivky: (SC) = selenocystein, (PL) = pyrrolyzin, (I) = iniciační kodon Kodony 1. . 2. U U C :U; A .r..'.;.;.:::.; Pne ser Cvs _.... "no Ser Cys ; -.Gl.j: Ser N A Leu Ser N (PL) 1 Trp ľ "• G G ■ Leu Pro His Arg U Leu Pro Arg o;,..cV:.::' Leu Pro Gin Arg A Leu Pro Gin Arg G A He I hr Asn Ser U He Thr Asn Ser :' c He Thř Lys Arg Thr Lys Arg G G Val Ala Asp Gly U ť: Val Ala Asp Gly Val Ala Olu Gly A Val Ala J Glu Gly G N = nesmyslný kodon, I = iniciační kodon. 1.2.3 - pořadí nukleotidů v kodonu. Kodonové rodiny jsou vyznačeny m odře, sady červeně. Základní vlastností genetického kódu • je tripletový (třípísmenový) • obsahuje 64 kodonů • je degenerovaný - jedna aminokyselina může být kódována více kodony • 61 kodonů má smysl (kódují aminokyseliny) • většina kodonů je synonymních (tj. odlišné kodony kódují stejnou aminokyselinu) • synonymní kodony jsou zařazeny do kodonových rodin a dvoukodonových sad • 3 kodony jsou nesmyslné (stop kodony, terminační kodony): UAA - ochre, UAG - amber, UGA - opal • 3 kodony jsou bifunkční: O UGA - opal = nesmyslný nebo kóduje selenocystein (21 st. aminokyselina) O UAG - amber = nesmyslný nebo kóduje pyrrolyzin (22 st. aminokyselina) O AUG = působí jako iniciační při translaci nebo kóduje metionin • je univerzální, tj. většina kodonů má stejný smysl ve všech živých soustavách (prokaryota, eukaryota, viry) 16 Charakteristika standardního genetického kódu 8 kodonových rodin tj. 32 kodonů 8 dvoukodonových sad UC tj. 16 kodonů 5 dvou kodonových sad AG tj. 10 kodonů 1 iniciační a bifunkční kodon AUG tj. 1 kodon 3 terminační kodony tj. 3 kodony 1 kodon lle AU A tj. 1 kodon 1 kodon Trp UGG tj. 1 kodon celkem 64 kodonů Genetický kód 64 kodonů (tripletů), 61 se smyslem, 3 beze smyslu (3 bifunkční) aga uua agc % ag g uug agu 1 gca cga gga cua cca uca aca gua gcc cgc ggc aua cuc ccc ucc acc guc uaa f gcg cg g gac aac ugc gaa caa ggg cac auc cug aaa uuc ccg ucg acg uac gug uagI gcu cg u gau aau ugu gag cag ggu cau au u cuu aag aug uuu ccu ucu acu ugg uau guu ugä'J Ala Arg Asp As n Cys Glu Gin Gly His lie Leu Lys Met Phe Pro Ser ľhr Trp Tyr Val - stop 1 a R D N c E Q G H I l k M F P S t W Y V Stop kodony (terminační kodony, kodony beze smyslu): UAA = ochre, UAG = amber (bifunkční), UGA = opal (bifunkční) AUG = kodon pro Met a iniciační kodon (bifunkční) UGA - selenocystein (21 standardní aminokyselina) UAG - pyrrolyzin (22 standardní aminokyselina) 18 Čtení kodonů Čtení kodonů (tripletů) závisí na tom, u kterého nukleotidu dané sekvence stanovíme počátek čtení. ATGATGATGATG i ATGATGATGATG 1. ATG ATG ATG TG AT GAT G A TG—»5 čtecí rámce 2. TGA TGA TGA 1 3. GAT GAT GAT GATGATGATí ORF = open reading frame = otevřený čtecí rámec dsDNA 5' ATCGTCTTGAAGTGCGTGTTAG 3' 3' TAGCAGAACTTCACGCACAATC 5' Struktura genomů • Prokaryotický genom O chromozom (nukleoid) O plazmidy • Eukaryotický genom O soubor chromozomů O mitochondrie O chloroplasty (u rostlin) O plazmidy • + proviry, transpozony • nDNA = jaderná, ds lineární • mtDNA = mitochondriová, ds kružnicová nebo lineární • ctDNA = chloroplastová, ds kružnicová • virový genom = DNA (ds, ss) nebo RNA (ds, ss) 20 Živé soustavy Tři domény organizmů (16S RNA a 18S RNA) o Bakterie (Bacteria) o Archea (Archea) viry o Eukarya (Eukarya) buněčné O jednobuněčné O mnohobuněčné nebuněčné O viry O viroidy Všechny způsoby přenosu genetické informace. Mají všechny složky translačního systému. (aa-tRNA-syntetázy, tRNA, ribozomy) Jsou v translaci závislé na hostitelských buňkách. Viry = živé soustavy schopné reprodukce v závislosti na translačním systému hostitelských buněk. prokaryotický typ buňky jádro bez jaderné membrány nedělí se mitoticky DNA kružnicová (většinou) nebo lineární eukaryotický typ buňky jádro obaleno jadernou membránou dělí se mitoticky chromozomy = chromatin (proteiny + DNA) 21 Univerzální fylogenetický strom ia PROGENOT Velikost genomu jednotlivých skupin organismů kvetoucí rostliny ptáci savci plazi obojživelníci kostnaté ryby chrupavčité ryby ostnokožci korýši hmyz měkkýši červi houby řasy bakterie mykoplazmata viry " "I-"" ' m ■M í M álll it f- i? ti 3 4 5 6 7 8 10 10 10 10 10 10 DNA content (bp) 9 10 10 11 10 10 Velikost genomu se udává v počtech párů bází: bp = pár bází nt = nukleotid kbp = 1000 bp Mbp = 1000 kbp Gbp = 1000 Mbp 1 bp = 660 D 1 mm DNA = 3 Mbp Paradox hodnoty C - velikost genomu neodpovídá vývojovému postavení (celkové komplexitě) organismů 23 TABLE 4.01 Genome Sizes Počet genů a velikost geno-mu u zástupců jednotlivých skupin organismů Number Amount Number of Organism of Genes of DNA (bp) Chromosomes Viruses Bacteriophage MS2 4 3,000 1 (ssRNA)* Tobacco Mosaic Virus 4 6,400 1 (ssRNA)* X174 bacteriophage 11 5,387 1 (ssDNA) Influenza 12 13,500 8 (ssRNA) T4 bacteriophage 200 165,000 1 Poxvirus 300 187,000 1 Bacteriophage G Ó80 498,000 1 Prokarvotes Mitochondrion (human) 37 16,569 1 Mitochondrion (Arabidopsis) 57 366,923 1 Chloroplast (Arabidopsis) 128 154,478 1 Nanoarchaeum equitans 550 490,000 1 Mycoplasma genitalium 480 580,000 1 Mefhanococcus 1,500 1.7Mbp 1 Escherichia coli 4,000 4.6 Mbp 1 Myxococcus 9,000 9.5 Mbp 1 Eukaryotes (haploid genome) Encephalitozoon 2,000 2.5 Mbp 11 Saccharomyces 5,700 12.5 Mbp 16 Caenorhabditis 19,000 100 Mbp 6 Drosophila 12,000 140 Mbp 5 Homo sapiens 25,000 3,300 Mbp 23 Arabidopsis 25,000 115Mbp 5 Oryza sativa (Rice) 45,000 430 Mbp 12 *ssRNA = single stranded RNA; ssDNA = stranded DNA. single stranded DNA; all other genomes consist of double Účinnost sekvenování DNA a historie analýzy DNA Současnost: 1. Stále vyšší účinnost sekvenování, nižší cena 2. Nové bioinformatické přístupy 3. Aplikace v biomedicíně (zejm. v onkológii) 4. Komercionalizace 5. Analýza mikrobiomu významné objevy ve vývojt sekvenování účinnost bp/osoteírok I 15 j I 150 I I 1 500 I 15 000 I I Či ooo I 10D 000 I 000 ooo I 1668 I 19«; I J I 1970 I I 1977 137= I I960 I 19B6 účinnost bprprfstrojfrok I 1995 I 1996 I 150 00O0O0~l I 1^ 2000 2002 Minsi-Jicr objev DNA Avery: důkaz, ze DNA je „genetický materiál" Watson & Crick: objev struktury DNA jako dvojité šrouboviee Hollcy: určení sekvencc tRNAŕli k vasinek - K sekvenováni RNA byty použitý melody špecifického enzyma&ckého trávení RNAa chromatografie, což vyžadovalo velkä množství analyzovaného vzorku. Wu: Sequenced X cohesive end DNA * Primed synthesis concept and 2-D eJettfOphoresis were used; samples were labeled and less material was required. Sanger: Developed dideoxy termination sequencing procedure; Gilbert: Developed chemical degradation sequencing protocol * Chain termination and chemical degradation concept were developed- * PolyacrylamirJe gel electrophoresis was used (o separate DNA tracts. Goad: Proposed GenBank prototype Messing: Developed M13 cloning vectors * Cloning system was applied. Mood: Developed partially automated sequencing system * Sequencing reactions were optimized. ■ Assorted sequencing strategies were applied and computer assisled-data handling was started Watson: Human genome project initiated Venter: First bacterial genomes sequenced * Automated fluorescent sequencing instruments and robotic operations were applied to the process. ♦ PGR seouencirig concept was introduced. International consortium of scientists: First eukaryotic genome-yeast-sequenced • Collaborations between teams of scientists. pL-'kir.EhiKT. Inc.: Developed 9&capillary sequencer ♦ Fully automated 96-capillary electrophoresis sequencing system becomes available to research laboratories. Complete sequence of the Caenorhabtiftis eiegans genome Complete sequence of the euchromatlc portion of the Drosophiia meianogastsr genome; Complete sequence of the Arabidopsis thatiana genome International Human Genome Sequencing Consortium and Calera Genomics scientists: First drafts of the sequence of the human genome published International Rice Genome Sequencing Project and Syngenta scientists: First drafts of the genomic sequences of two rice subspecies; Mouse Genome Sequencing Consortium: First draft of the sequence of the mouse gervome Rat Genome Sequencing Project Consortium: First draft of the sequence of the rat genome; International Human Gene Sequencing Consortium: Nearly complete (99% of euchromatln) sequence of the human gonoma Časový průběh sekvencování genomů 1984 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 Discussion and debate in scientific community NRC report C TO ff 0 1 O CO t/l s o Generic maps — Physical maps cDNA sequencing Genomic sequencing Genetic maps Physical maps § cDMA sequencing x Genomic sequencing Bacterial genome sequencing S. cerevisiae sequencing H.fJu E. coli 39 species C. elegans sequencing D- meianogaster sequencing A. thaliana sequencing Microsatellites SNPs ESTs Full length Pilot sequencing Microsatollitos SNPs ESTs Full length Working Pilot project, 15% draft, 90% Finishing, -100% -rf-* Chromosome 22 Chromosome 21 Přehled kompletně sekvenovaných genomů (2008) Total species (5149) Viruses Eukaryata .- Archaea Plasmids 2115 1822 ^\ 72 \ 38 Bacteria Viroids 1063 39 Total records {9571) Viruses 3261 Viroids 41 Eukaryota 1041 chromosomes 1827 organelles 39 plaamids Plasmids 39 Bacteria 1563 chromosomes 1634 plas m ids Archaea 67 chromosomes 59 plasmids Současný stav ARCHAEA TOTAL: 453 Genome: 430 Transcriptome: 16 Resequencing: 5 Uncultured: BACTERIA TOTAL: 19134 Genome: 18670 Transcriptome: 17 Resequencing: 213 Uncultured: 896 EUKARYA TOTAL: 3181 Genome: 1734 EST/Transcriptom e: 789 Resequencing: 510 Uncultured: 4 Projekty sekvenování genomů modelových organizmů Escherichia coli (4.6 Mb) - bakterie, prokaryotický organismus • známá struktura genomu, regulace a funkce genů • dobře prostudovány biochemické dráhy Saccharomyces cerevisiae (14 Mb) - kvasinka, jednobuněčný eukaryotický organismus • známá struktura genomu, regulací a funkce genů • probíhá mitóza a meióza • velký počet dobře definovaných mutant • vysoká frekvence homologní rekombinace - snadné záměny alel Caenorhabditis elegans (100 Mb) - jednoduchý mnohobuněčný organismus (hlístice, červ) • obsahuje 959 buněk, jejichž vývojové linie jsou známy • detailně prostudovaný nervový systém (302 neuronů a jejich spojení) • modelový organismus vývojové biologie (procesy diferenciace) 28 Projekty sekvencování genomů modelových organismů Drosophila melanogaster (165 Mb) - zástupce hmyzu • objekt klasické genetiky • dobře prostudována struktura genů, jejich regulace a funkce • řada dobře definovaných mutant. Fugu rubripes (400 Mb) - ryba • model genomu obratlovců • nízká proporce repetitivních sekvencí • vysoká proporce exonů • relativně krátké geny ve srovnání s lidskými homologními geny (vhodný pro identifikaci lidských kódujících genů) 29 Projekty sekvencování genomů modelových organismů Arabidopsis thaliana (100 Mb) - kvetoucí rostlina neobvykle malý génom nízký počet chromozomů nízká proporce retitivních sekvencí vysoký počet semen (10 000) během krátké generační doby Mus musculus - myš, savec (3000 Mb) geneticky nejlépe prostudovaný savec vhodný experimentální model pro studium mutací a genetická křížení vazba genů podobná jako u člověka možnost přípravy transgenních myší s genetickými modifikacemi • model studia genové exprese a funkce genů. metagenom = genetický materiál pocházející z prostředí 30 Prokaryotický génom • Složky O Bakteriální chromozom (nukleoid) O Mobilní elementy (Plazmidy, inzerční sekvence, transpozony, genomické ostrovy, integrony aj) O Bakteriofágy, profágy STRUKTURA PROKARYOTICKÝCH GENOMU Mozaikový charakter Endochromozomy (1,2) Přídatné genetické elementy (A-H) - Plazmidy (H, F) - Profágy a defektní profágy (B, D, E, G) - Genomické ostrovy (A, C) - IS-elementy, transpozony, integrony (I) Vysoká dynamika a plasticita Variabilní složka genomu - adaptace na prostředí 32 TOPOLOGIE PROKARYOTICKEHO GENOMU Replikony CHROMOZOM - kružnicový - lineární I PLAZMIDY - kružnicové lineární DRUH CHROMOZOMY PLAZMIDY KRUŽNICOVÉ LINEÁRNI KRUZNICOVE LINEÁRNI Escherichia coli 1 (4,6 Mb) několik Bacillus cereus 1(5 Mb) ■ 1 (2,4 Mb) a i........... »—► 0 . několik (2,6 Mb) Vibrio cholerae 2 (2,9+1,1 Mb) Borrelia burgdorferi 1 (0,9Mb) 9 (kb) 12 (kb) Agrobacterium tumefaciens 1 (2,8 Mb) 1 (2,1 Mb) 2 (0,75 Mb) Streptomyces lividans 1 (8Mb) <--► 1 (50 kb) Prokaryota s lineárním chromozomem • Streptomyces (ambofaciens, lividans) 10 Mb • Borrelia burgdorferi (B. hermsii) 0.95 Mb O + lineární plazmidy • Coxiella burnetii 2,1 Mb • Paracoccus denitrificans - tři molekuly DNA O 2; 1,1; 0,64 Mb, dvě jsou lineární • Agrobacterium tumefaciens • a řada dalších... 34 Velikost génom u prokaryot ' ■ ■_ i_i_I_i_I_i_I_i-1_.....-L "specialisté" o 1 "generalisté" 3 4 5 6 7 8 Velikost génom u (Mbp) 9 10 Genetická organizace prokaryotického genomu • velmi kompaktní genom s malými mezerami mezi geny • většina genomu je obsazena strukturními geny • malá část (10 %) je tvořena nekódující DNA • operonové uspořádání genů (většinou funkčně příbuzných) • pořadí genů není u prokaryot konzervováno - důsledek přestaveb genomu a horizontálního přenosu genů 36 Velikost a genový obsah vybraných prokaryotkkých genomů druh velikost genomu v párech nukleotidů předpovězený počet genů Archaea Arcbaeoglobusfitlgidtts 2178 400 2 486 Methanosarcina acetivorans 5 751 492 4 721 Nanoarcbaeum equitans 490 885 582 Pyrococcusfunosus 1908 256 2 228 Sulfolobus solfataricus 2 992 245 3 033 Thermoplasma volcanium 1584 804 1548 Eubacteria Bacillus subtilis 4 214 630 4 225 Bordetella parapertussis 4 773 551 4 467 Bradyrhi^obium japonicum 9105 828 8 373 Buchnera aphidicola 615 980 550 Chlamydia pneumoniae kme n ÄR3 9 1229 853 1167 Escherichia coli kmen K12 MG1655 4 639 675 4 467 Escherichia coli kmen 0157 EDL933 5 528 970 5 463 Haemophilus influenzae Rd KW20 1830 138 1789 Legionella pneumophila kmen Paris 3 503 610 3136 Mycobacterium tuberculosis kmen CDC 4 403 837 4 293 Myco bacterium genitalium 580 076 525 Neisseria meningitidis Z2491 2184 406 2 208 Pseudomonas syringae kmen DC3000 6 397 126 5 660 Rickettsia typhi 1111 496 919 Salmonella typhimurium 4 857 432 4 622 Staphylococcus aureus kmen MW2 2 820 462 2 712 Streptomyces coelicolor 8 667 507 7 912 Ureaplasma parum ATCC 700970 751 719 653 Yersinia pest is kmen KIM 4 600 755 4 240 Údaje jsou převzaty z webové stránky N GBl (http://www.ncbi.nlm.nih.gov/Genomes/), květen 2008. Počet genů u prokaryot je proporcionální velikosti jejich genomu - paradox hodnoty C u nich neplatí Organizmus Velikost genomu (Mbp) Počet ORF T. pallidum B. burgdorferi H. pylori A. fiilgidus B. subtilis M. tuberculosis E. coli 1.14 1.44 1.66 2.18 4.20 4.41 4.60 1040 1751 1657 2 437 4100 3 924 4 288 1 gen - 1 kbp Klasifikace 4288 genů E. coli podle jejich funkce funkce fágů, transpozonů a plazmidů replikace DNA, rekombinace, reparace DNA metabolizmus uhlíkatých sloučenin metabolizmus aminokyselin další geny - se známou funkcí regulační - funkce translace, proteinový metabolizmus ústřední intermediární metabolizmus adaptace, ochranné funkce buněčná stěna, strukturní membránové komponenty metabolizmus nukleotidů transkripce, metabolizmus RNA mastné kyseliny, fosfolipidový metabolizmus energetický metabolizmus transportní proteiny potenciální enzymy 39 Struktura chromozomu E. coli Bakteriální nukleoid HLP, HU-proteiny, enzymy a faktory účastnící se replikace a transkripce 40 Charakteristika plazmidů dsDNA - kružnicová nebo lineárni, velikost: 1-1000 kb Základní typy plazmidů: • kryptické - funkce neznámá • epizomální - reverzibilní intergace do chromozomu hostitele • konjugativní - schopné přenosu konjugací • mobilizovatelné - přenositelné za přítomnosti konjugativního plazmidů 41 Příklady plazmidů: • F-plazmidy (fertilitní faktor, konjugativní) O zodpovědné za konjugaci • R-plazmidy (R-faktory) O zodpovědné za rezistenci k antibiotikům • kolicinogenní (Col-plazmidy) O tvorba proteinů s antibiotikovým charakterem (Enterobacteriaceae, aj.) • Ti-plazmidy (tumory indukující) O tvorba nádorů u dvouděložných rostlin (Agrobacterium tumefaciens) • plazmidy odbourávající organické sloučeniny (Pseudomonas) • plazmidy podílející se na fixaci vzdušného dusíku (Rhizobium). • Plazmidy používané jako vektory pro přenos DNA (pBR322, pUC) 42 Eukaryotícký typ buněk • Jádro je ohraničeno od cytoplazmy membránou • Dělení buněk probíhá mitózou nebo meiózou • Genetický materiál tvoří chromatin • Buněčná stěna je odlišná od prokaryotické nebo chybí • Buňka obsahuje organely: mitochondrie, chloroplasty, cytoplazmatické retikulum, Golgiho aparát, lysozomy aj. Přenosy genetické informace u eukaryot probíhají principiálně stejně jako u prokaryot 43 Složky eukaryotíckého genomu • jaderný genom - lineární chromozomy v různém počtu • mitochondriový genom - kružnicové nebo lineární genofory • chloroplastový genom (rostliny) - kružnicové genofory • plazmidy (velmi vzácně) - kružnicové genofory 44 Chromati n = genetický materiál eukaryotické buňky 30 % NK (DNA + RNA) + 70 % proteinů Základní formy organizace chromatinu chromatinová síť vláken v interfázi jednotlivé chromozomy při mitóze w euchromatin (transkripčně aktivní) s* chromatin (méně kondenzovaný, slabě barvitelný bazickými barvivy) heteroterochromatin (transkripčně inaktivní konstitutivní f aku Itativní centroméra + teloméra dočasně netranskribované geny, změny během ontogenetického vývoje 45 Struktura mitotických chromozomů mí __ IDO D DD í IS Tandem repeats Centromere-associated tandem repeats Telomeric and sub-telomeric repeats 0 D D I Dispersed Tyf/copia retroelements and microsatellites LINEs Single and low-copy sequences including genes J D 46 Funkční složky eukaryotických chromozomů • centromera - zajišťuje segregaci chromozomů do dceřinných buněk při mitóze (meióze) • telomera - koncová oblast - její struktura zajišťuje dokončení replikace lineárního chromozomu Typické telomerové repetice: OTTGGGG - Tetrahymena OTTAGGG - člověk • počátky replikace (ori) 47 Úrovně kondenzace chromatinu krátký úsek dvojšroubovice DNA „korálková" forma chromatinu 30-nm chromatinové vláknu s poskládanými nukleosomy úsek chromosomu v rozvinuté formě kondenzovaný úsek chromosomu úplný mitotický Chromosom Výsledek: Každá molekula DNA je zabalena do mitotického chromozomu tak, že je 50 OOOkrát kratší než v rozvinuté formě Nukleozómová struktura DNA 8-114 bp spojníková DNA jádrové histony nukleosomu „korálková" forma chromatinu nukleáza štěpí spojníkovou DNA nukleosom obsahuje 200 nukleotidových párů DNA -0L-A--Q.. uvolněná částice jádra nukleosomu disociace ve vysoké koncentraci soli oktamerní h isto nové jádro I disociace dvoušroubovíce DNA ze 146 nukleotidových párů ŕ~]—i—i ^ &3 93 H2A H2B H3 H4 49 histonový oktamer DNA Histonový oktamer lze si lze velmi zjednodušeně představit jako válec, kolem něhož se otáčí DNA. 10-11 nm 6 nm molekulární model Funkce histonu H1 při spojování nukleozomů Molekulární struktura eukaryotického chromozomu 30 nm vlákno - solenoidová struktura Závit solenoidu tvořený roztažený smrštěný (d) Model cik-cak. Proteiny chromatínu A. Histony • Bázické proteiny obsahující vysokou proporci argininu a lyzinu (20-30%). U některých organismů jsou ve spermiích přítomny protaminy, které jsou bohaté na arginin. • Histony jsou velmi konzervativní (zejména H3 a H4). U bakterií se vyskytují toliko HLP, u archeí se nacházejí histony, které jsou jen částečné homologní s H3 a H4. B. Proteiny nehistonové povahy • proteiny s enzymovými funkcemi, zajišťující replikaci a transkripci (polymerazy, ligázy aj) a enzymy modifikující histony při remodelaci chromatinu (acetyltransferazy, metylazy aj) -regulace genové exprese • HMG-proteiny (high mobility group), navozující změny chromatinu během transkripce 53 Struktura 30 nm chromatinového vlákna ukleozom 1 závit (otáčka) 30 nm-chromatinového vlákna, který sestává ze šesti n ukleozomů propojených dsDNA. 30 nm-chromatinové vlákno topo II proteinové lešení chromatinová doména (chromatinová smyčka) replikace transkripce Tento obrázek je idealizujícím schématem. Chromatinové domény nejsou stejně velké. Jejich délka je 60 - 150 kb. Modely přetváření nukleozomové struktury chromatinu remodeling complex A restoration of standard nucleosomes Chromatin remode-lujici komplexy - dočasné změny struktury chromatinu dissociation Of DNA-binding proteins remodeling complex B addition of DNA-binding proteins 4 Genová exprese, replikace DNA a další procesy vyžadující přístupnost DNA uložené v nukleozomech 55 Kovalentní modifikace histonů Ac m j_ 1 Ac = acetyl (lyzin) Me = metyl (lyzin) P = fosfát (serin) HB2 n . l [ i 1 ^—^ 1 > r u = ubiquitin v_ S K 1 5 Ac T T i Ac T K K K K 5 12 15 20 ■W(P) Ac 1 H4 (A) Ac I Ac I Ac Ac I Me l (--■ s 1 K 5 K 8 K 12 K 16 K < 20 "V ac ac ac © „Histonový kód" j_i_lX _ H3 n. ' s ' ■ ' ■ s ^-yc . změna struktury 9 10 h 18 23 27 28 chromatinu (de/kondenzace) • exprese genů • umlčení genů histone-fold domain 56 Sekvence eukaryotického genomu Jedinečné sekvence (strukturní geny) přímé tandemové r. ATGCATGCATGC *->-* í Jednotka repetice Repetice rozptýlené r. / \ obrácené ATGC...GCAT krátké dlouhé 100-300 bp >300bp Alu transpozony IR LTR retrovivy IR (inverted repeat) ATGČ--------GCAT Obrácená (koncová) repetice TACG--------CGTA <- LTR LTR (Long TermiroaJ Repeat) : GTATG-----CATAC--------------------------GTATG-—CATAC Dlouhá koncová repetice CATAG-----GTATG---------------------------CATAC-----GTATG 57 Model struktury centromery metafázního chromozomu víákno dělicího vřeténka ^^^^^^^ Q^^^^ DNA chromatid Konzervativní struktury centromer u kvasinky 20 nm mikrotubulus dělicího vřeténka centromera DNA 110 nukleotidů lH (-40 nm DNA) konzervativní elementy I II III ATAAGTCACATGAT - - TGATTTCCGAA TATTCAGTGTACTA - ™ Dp' ^/oAI - ACTAAAGGCTT í í vazba specifických proteinů 58 Model lidské telomery stabilizované tvorbou t-smyčky t-smyčka vysoce konzervativní sekvence - tandemové repetice \ centromera * 5' - / / (TTAGGG)n Cž ttí á i i n 11111111 í 11111 m{i i in 11 (AATCCC)/? ^) komplex TRF-2 komplex TRF-1 Specifíta struktury telomery: - zabraňuje odbourávání konců chromozomů DNázami - brání spojování (fúzím) konců různých chromozomů - umožňuje replikaci lineárních chromozomů Typy genů na eukaryotícké jaderné DNA • Jedinečné geny (1 kopie, většina strukturních genů) • Tandemové repetice (geny pro rRNA, geny pro histony) • Genové rodiny (skupiny příbuzných genů - geny pro globin, aktin aj.) • Pseudogeny (inaktivní kopie genů) • Rozptýlené genové repetice (kopie genů nebo genových rodin rozptýlené po genomu - geny pro tRNA, snRNA aj.) • Orfany (orphans) = URF = ORF s neznámou funkcí, bez homologie ke známým genům • Orfony (ojediněle se vyskytující kopie genů) • Mezerníky - sekvence oddělující geny nebo skupiny genů a) přepisované b) nepřepisované 60 Projekt analýzy lidského genomu Human Genome Project (HGP) • 1985 - první úvahy • 1987 - první finanční zdroje • 1990 - oficiální zahájení Dept. Energy, NIH, HUGO Cíle dílčích etap: 1. Konstrukce genetické mapy s vysokým rozlišením 2. Konstrukce fyzikálních map různého typu 3. Úplná sekvence genomu stanovena v roce 2003 (2001-publikace v Nature a Science) identifikovat a lokalizovat geny v genomu člověka Sou^sts^rqj^b^^i ly v genetické výbavě jedinců sekvenci) • Bioinformatika (sběr a zpracování dat) • Analýza genomu modelových organismů 61 Projekt díverzíty lidského genomu (Human Genome Díversíty Project) • Studium genetických variací v etnických skupinách 1. Původ člověka, migrace prehistorických populací, sociální struktura populací. 2. Adaptace a choroby. Náchylnost populací k chorobám (hypertenze, thalasemie, srpkovitá anémie aj). 3. Forenzní antropologie. Variabilita DNA markem, spolehlivost DNA-fingerprintů, identifikace jedinců. Matt Ridley: Genom - Životopis lidského druhu v třiadvaceti kapitolách. Portál, Praha 2001. 62 Lidský mezinárodní projekt HapMap Cíl projektu: identifikovat a mapovat SNP („snips", single-nucleotide polymorphisms) v různých populacích, zjistit jejich asociaci s geny zodpovědnými za choroby a tím stanovit rizika vzniku chorob (270 národů ze čtyř větví lidstva - Američanů, původem evropských bělochů, Číňanů, Japonců a Yoruby ze západní Afriky) Drobné změny v lidském genomu: jednonukleotidové polymorfismy = SNP - záměny nukleotidů v četnosti 1 : 2 000 Haplotyp: skupina vázaných SNP v určité oblasti chromozomu využívaných jako markery (jsou vázány k určitým genům - asociace s geny zodpovědnými např. za choroby) původ DNA: SNP1 SNP2 SNP3 SNP4 jedinec 1 TACAGGATC •-• TTCGGGCCA ••- AATCCATGC •-- AAGCTCGGA --• jedinec2 TACAAGATC --- TTCGAGCCA ---AATCCATGC ---AAGCTCGGA---jedinec3 TACAGGATC ---TTCGAGCCA---AATCTATGC ---AAGCTCGGA--- jedinec4 TACAGGATC ---TTCGAGCCA---AATCCATGC --- AAGCCCGGA--- i i I i L_ __ _J~_~_V~i rV_V__ __ _J t y 11 haplotyp 1 G G C T haplotyp 2 A A C T haplotyp 3 G A T T haplotyp 4 G A C C 63 Typy DNA-sekvencí v lidském genomu lidský genom 3 miliardy bp Introny, promotory', zaváděcí sekvence Nekódující sekvence >90% Geny a genům podobné sekvence 20-30% Kódující sekvence <10% Středné až vysoce repetili vní 20-30% Negenová DNA 70-80% Jedinečná nebomaié počty kopii 70-30% —I Pseudogeny | —I Genové fragmenty [ Rozptýlené repetice 40% —I Repetice SINE 1—I Repetice LINE Tandemové repetice i—\ Satelitní DNA 1 60% | —I MinisateKtní DNA [ —I Mikrosatelimí DNA| 64 Statistické údaje o lidském genomu Celková velikost genomu 3289 Mb Chromozomy - největší 279 Mb - nej menší 45 Mb X 163 Mb Y 51 Mb Frakce CpG 41 % Počet ostrovů CpG 28 890 Část genomu kódující proteiny 1,50% Část genomu, která je transkribována 33 % Počet dosud identifikovaných genů 26 500 Celkový počet před povezených genů 22 287 (2008) Střední hustota genů 9-14 genů/Mb Průměrná velikost genu 27 kb Největší gen 2,4 Mb (DMD) Průměrná velikost transkriptu 1340 bp Současný odhad 18 000-20 000 65 Funkční klasifikace genů předpovězených z analýzy sekvence lidského genomu buněčnáadheze(577; 1,9%) chaperon(159;05%) různé (1318; 4,3%) \ \ cytoskeletální strukturní protein (876; 2,8 %) virový protein (100; 0,3% transferový/nosičský protein (203; 0,7 %) transkripční faktor (1850; 6,0 %) enzym se vztahem k nukleovým kyselinám (2308; 7,5 % signální molekula (376; 1,2%; receptor (1543; 5,0% kináza (868; 2,8 %) vybraná regulační molekula (988; 3,2 %) transferáza (610; 2,0 %) syntéza a syntetáza (313; 1,0 %} oxidoreduktáza (656; 2,1 %) lyáza(117; 0,4%) lipáza (56; 0,2 % izomeráza (163; 0,5 %) hydroláza (1227; 4,0%) extracelulární matrix (437; 1,4 %) imunoglobulin (264; 0,9 %) iontový kanál (406; 1,3%) motor (376; 1,2%) svalový strukturní protein (296; 1,0 %) protoonkogen (902; 2,9 %) vybrané proteiny vázající kalcium (34; 0,1 %) intracelulární transportér (350; 1,1 %) transportér (533; 1,7%) neznámá molekulární funkce (12 809; 41,7 %) 66 Genom organel: chloroplastů a mitochondrií Table 14-2 The Size of Organelle Genomes* Type of DNA Size (thousands of nucleotide pairs) Chloroplast DNA Higher plants Chlamydomonas (green alga] Mitochondrial DNA Animals (including flatworms, insects, and mammals) Higher plants Fungi Schizosaccharomyces pombe (fission yeast) Aspergillus nidulans Neurospora crassa Saccharomyces cerevisiae (budding yeast) Chlamydomonas (green alga) Protozoa Trypanosoma brucei Paramecium 120-200 180 16-19 150-2500 17 32 60 78 16 (linear molecule) 22 40 (linear molecule) *These genomes are circular DNA molecules unless indicated otherwise. Počet kopií DNA v organelách: mtDNA: 5-50, ctDNA = 20-80 67 Tab. 16.2 Velikost a genový obsah vybraných mitochondriaIních a chloroplastových genomů druh triviální označení velikost genomu v párech nukleotidů předpovězený počet genů mitochondrial™ genomy Apis mellifera včela 16 343 13 Arabidopsis thaliana huseníček 366924 57 Caenorhabditis elegans hádatko 13 794 12 Candida glabrata kvasinka (infekční) 20 063 37 Chlamydomonas reinhardtii zelená řasa 15 758 25 Drosopbila melanogaster octomílka 19 517 37 Dank rerio dánio pruhované 16 596 37 Homo sapiens člověk 16 571 37 Mus musculus myš 16 299 37 Ory^a sativa ryze 491515 96 Plasmodium falciparum prvok, původce malárie 5 967 3 Rattus norvegicus potkan 16 313 37 Saccbaromyces cerevisiae pekařská kvasinka 85 779 43 Zea mays subsp. mays kukuřice 569 630 218 chloroplastove qenomv Arabidopsis thaliana huseníček 154 478 129 Chlamydomonas reinhardtii zelená řasa 203 828 109 Marchantia polymorpha játrovka 121 024 134 Ory%a sativa rýže 134 525 159 Zea mays subsp. mays kukuřice 140 384 158 Údaje jsou převzaty z webové stránky NCBI (http://www.ncbi.nlm.nih.gov/Genoines/) k 15. květnu 2008. 68 Struktura genomu mitochondrií člověka 16 569 pb, 37 genů Funkce mitochondrií: tvorba ATP oxidací cukrů a mastných kyse mtDNA kóduje: rRNA (12S a 16S), 22 tRNA, cytochrom c-oxidázy, cytochrom b, ATP-syntetázu Mapa lidského mitochondriálního genomu těžký řetězec těžký řetězec H (vyšší obsah purinů) malá 70 Mitochondriová DNA různých skupin organizmů Organizmy Velikost v bp Struktura Charakteristika Buňky více-buněcných živočichu 1,6 až 2,0 x 104 kružnicová každý živočišný druh má svůj vlastní typ mtDNA Buňky vyšších rostlin 2,5 x 105 az 2,0 x 106 kružnicová nebo lineární pozoruhodná variabilita ve velikosti, struktuře a genetické organizaci nejen mezi druhy, ale také u stejného organizmu, a tedy i ve stejné buňce Prvoci 3,0 x 104 v az 6,0x104 kružnicová nebo lineární rozdíly mezi druhy Kvasinky 2,0 x 104 až l,0xl0S kružnicová jednotná uvnitř stejného druhu, ale rozdíly mezi druhy ♦ Velmi charakteristické pro mtDNA vyšších rostlin jsou úseky, které se podobají DNA chloroplastů. Specifické rysy mitochondriového genomu 1. Geny jsou uspořádány velmi hustě, téměř celá sekvence je tvořena strukturními geny nebo se přepisuje do rRNA a tRNA 2. K translaci je využíváno jen 22 tRNA, které jsou schopny díky kolísavému párování bazí přečíst všechny kodony 3. Genetický kód používaný v mitochondriích (některých organismů) se liší od standardního genetického kódu. 4 ze 64 kodonů mají jiný smysl (zřejmě v důsledku malého počtu proteinů kódovaných v mitochondriích byly tyto změny během evoluce tolerovány) • pro zajištění fungování mitochondrií je vyžadováno 90 genů lokalizovaných v jaderném genomu • mitochondriové geny se dědí nemendelisticky (matroklinně, cytoplazmatická dědičnost) - studium lidských populací • podléhá rychleji mutacím (10-100x častěji něž jaderný genom, reparační procesy omezené) 72 Většina proteinů v organelách je kódovaná jaderným genomem Kooperace jaderných genů s geny na mtDNA lidského genomu Funkční produkt Podjednotky (protomery) funkčního produktu určené geny lokalizovanými na mtDNA určené geny lokalizovanými v jádře buňky NADH-dehydrogenáza 7 podjednotek >41 podjednotek Sukcinát CoQ-oxidoreduktáza 0 podjednotek 4 podjednotky Komplex cytochromu b-cl 1 podjednotka 10 podjednotek Cytochrom c-oxidáza 3 podjednotky 10 podjednotek H+-transportující ATP-syntáza 2 podjednotky 14 podjednotek rRNA mitochondrií 2 0 tRNA mitochondrií 22 0 mRNA mitochondrií 13 0 DNA- a RNA-polymerázy 0 všechny Ribozomové proteiny 0 -70 Genom chloroplastů Genetická organizace genomu chloroplastu Geny chloroplastů Nicotiana tabacum Funkce Počet genů Transkripce RNA-polymeráza 4 Translace rRNA 4 tRNA 30 Ribozomové proteiny 21 Fotosyntéza Fixace CO, 1 Fotosysťém I 5 Fotosystém II 14 Cytbchromový komplex b/f 5 Htransportující ATP-syntáza 6 ^RnTTuňTtce'" NAD(P)H-dehydrogenázový komplex 11 Clp-proteáza 1 Acefyl-KoA-karboxyláza (EC 6.4.1.2) 1 Membrána plastidu 1 Matu rázy (str. 394) 1 Otevřené čtecí rámce kódující více než 29 aminokyse -lin 30 Geny chloroplastů jsou podobné genům cyanobakterií 77 Původ mitochondrií a chloroplastů (endosymbiotická teorie) • MITOCHONDRIE • chemoorganotrofní prokaryotické améboidní anaerobní před-buňky s aerobní respirací chůdci eukaryotických buněk (protomitochondrie) • CHLOROPLASTY • fotolitotrofní prokaryotické buňky _^ améboidní předchůdci (fotosyntetizující protochloroplasty) eukaryotických buněk • Nepřímé důkazy: O přehrádečné dělení mitochondrií O konformace DNA (kružnicová forma) O translační aparát podobný prokaryotům • podobnost sedimentačních koeficientů ribozomů • podobnost sekvencí mt-rRNA s rRNA bakterie E. coli 78 Původ mitochondrií „symbiont Nuclear envelope „protoeukaryot" Aerobic eukaryotic cell protomitochondrie 79 Genom vírů • Viry O Prokaryotické (bakteriofágy) • DNA • RNA O Eukaryotické • živočišné DNA/RNA • rostlinné DNA/RNA • houbové DNA/RNA • Typy genomové NK O ssDNA - lineární nebo kužnicová O dsDNA - lineární nebo kružnicová O ssRNA - lineární O dsRNA - lineární Segmentovaný genom 80 Rozdělení vírů podle typu genomu 1. dsDNA-► dsDNA^ | ^ virion + mRNA-► proteiny (většina DNA fágů, herpesvirus, poxvirus, adenovirus, SV40) 2. +ssDNA —► -ssDNA- I +mRNA -ssDNA —► +ssDNA +mRNA (parvoviry, fX174) -> +ssDNA > proteiny -► -ssDNA virion virion > proteiny 81 Rozdělení virů podle typu genomu 3. dsRNA—► dsRNA vinon m RNA-► proteiny * (reoviry) 4. +ssRNA —► -ssRNA-► +ssRNA ^ ~ ví no n mRNA —► proteiny (RNA-fágy, rostlinné viry) 5. -ssRNA-► +ssRNA-► -ssRNA ^ ^ virion mRNA-► proteiny s (vzteklina, ortomyxoviry - chřipka) 82 Retroviry (HIV) RT RT +ssRNA-------------> -ssDNA-------> dsDNA integrace do chromozomu aktivace +RNA mRNA +ssRNA I I proteiny —► virion 83 84