Základní pojmy molekulární genetiky • genetická informace, gen, genetický kód • Struktura a informační obsah genomů O prokaryotický génom O eukaryotický génom (jaderný, mitochondriový, chloroplastový) O virový génom i Základní pojmy molekulární genetiky • Gen = Informační a funkční jednotka obsahující genetickou informaci o primární struktuře funkčnío molekuly translačního produktu (proteinu) nebo funkční molekuly produktů transkripce RNA (tRNA, rRNA, snRNA a dalších RNA) nepodléhajících translaci • Genetická informace = informace primárně obsažená v nukleotidové sekvenci DNA (genomové RNA u RNA-virů) • Genetický kód = systém pravidel, podle kterých jednotlivé kodony určují na ribozomu zařazení standardních aminokyselin do polypeptidu • Genom = všechny molekuly DNA (nebo RNA u RNA virů) živé soustavy, které se vyznačují replikací a dědí se na potomstvo (Genom = soubor veškeré genetické informace konkrétního organismu) (The total genetic content in one set of chromosomes) • Genotyp = genetická konstituce organismu reprezentovaná souborem alel (tj. konkrétních variant genů) a sekvencí jeho genomu • Fenotyp = soubor znaků a vlastností, kterými se v daném prostředí projevuje daný organismus (vyjádření genotypu) 2 Způsoby přenosu genetické informace DNA (chromozom, genofor) 5' GAACTC 3' uchování genetické informace Replikace genová exprese 1. Transkripce (přepis) mß^4 5' GAACUC 3 2. Translace (překlad) PROTEIN Glu-Leu (strukturní složky, enzymy) Funkce (struktura, metabolismus) 5' GAACTC 3' (přenos na potomstvo) změna genetické informace MUTACE 1 5' GAACCC 3' I Glu-Pro I Změna funkce proteinu Značení řetězců nukleových kyselin podle jejich funkce při přenosu genetické informace dsDNA kódující (pozitivní) [nepřepisující se] 3 ' + 5'-3'- antikódující (negativní) (-DNA) [přepisující se] 5' transkripce i m RNA 3 ' + 5' GATC 3' 3' CTAG 5' 5' GAUČ 3' RNA v genomu viru • pozitivní (+) = překládá se do virových proteinů (plní funkci mRNA) • negativní (-) = nepřekládá se, slouží k replikaci (regulační funkce) Ústřední dogma molekulární biologie Prenos genetické informace je možný z NK do NK nebo z NK do proteinu, ale není možný z proteinu do proteinu nebo z proteinu do NK F.H.C. Crick - 1958 transkripce translace DNA t replikace i DNA RNA zpětná transkripce t < replikace i ---U--- protein RNA Způsoby vyjádření genetické informace • informace o primární struktuře proteinů • informace o primární struktuře RNA (u DNA sekvencí) nebo DNA ( u RNA sekvencí) • informace, určující navázání proteinů na sekvence NK (regulační funkce) • informace o vazbě regulačních RNA na DNA Konkrétní formy genů • Geny strukturní = přepisují se do molekul mRNA, které se překládají a kódují Polypeptid (translační produkt) O strukturní gen jednoduchý, neobsahující introny O strukturní gen složený, tvořený exony a introny • Geny pro funkční typy RNA = přepisují se do molekul RNA, které se nepřekládají (tRNA, rRNA, snRNA a další funkční typy) • Geny jako regulační oblast = úsek DNA, na nějž se váže regulační protein/y (nepřepisují se ani nepřekládají) 7 Vztah mezí geny a jejích produkty 5" ATG TAG 3" STRUKTURNÍ GEN GEN PRO FUNKČNÍ RNA REGULAČNÍ OBLAST DNA (genomová) 3TAC | ÄŤČ | ^ Š7 transkripce transkripce interakce s proteiny AUG m RNA UAG tRNA nebo rRNA 5" | 3" \_ translace j D N A-VI RY, PROKARYOTA, EUKARYOTA primární struktura polypeptidu (proteinu) AUG UAG STRUKTURNÍ GEN 5" it 3" translace interakce s proteiny primární struktura polypeptidu (proteinu) RNA-VIR RNA (genomová) U RNA-virů neexistují geny pro tRNA nebo rRNA. 8 Rozdíl mezi jednoduchým složeným strukturním genem Rozdíl mezi jednoduchým a složeným strukturním genem spočívá v tom, že složený gen je sestaven z intronů a exonů a jeho primární transkript podléhá sestřihu, kdežto jednoduchý gen neobsahuje ani introny ani exony a jeho primární transkript nepodléhá sestřihu. jednoduchý strukturní gen transkripce i primární transkript mRNA (prokaryota) translace primární struktura polypeptidu (proteinu) složený strukturní gen transkripce i primární transkript hnRNA (eukaryota) sestřih mRNA translace primární struktura polypeptidu (proteinu) Schéma posttranskripční úpravy sestřihem složený gen exon intron exon transkripce posttranskripční úprava primární transkript (preRNA, hnRNA) mRNA Při sestřihu se z primárního transkriptu vyštěpí přepis intronu a spojí se přepisy exonů 10 Srovnání jednoduchého bakteriálního a složeného eukaryontního strukturního genu kódující oblast bakteriální gen kódující oblasti nekódující oblasti (exony) (introny) _______J eukaryontní gen 11 Organizace genů na chromozomu obratlovců a jejich přepis do mRNA chromosome of 1.5 x 108 nucleotide pairs, containing about 3000 genes 0.5% of chromosome, containing 15 genes ■ Ml 1 one gene of 105 nucleotide pairs ■ ■ I ■ I ■! 1 III I III! IH ~j T T I ■ regulatory DNA sequences intron exon DNA TRANSCRIPTION primary RNA transcript RNA SPLICING 5' 3' mRNA 3' intron sequence exon sequence 12 Velikost vybraných genů člověka (v kbp), velikost mRNA a počty intronů Number of Gene Size mRNA Size Introns ß-Globin 1.5 0.6 2 Insulin 1.7 0.4 2 Protein kinase C 11 1.4 7 Albumin 25 2.1 14 Catalase 34 1.6 12 LDL receptor 45 5.5 17 Factor VIII 186 9 25 Thyroglobulin 300 8.7 36 Dystrophin* more than 17 more than 2000 50 13 Překlad genetické informace _ =kodonynamRNA AIzJ? ^UAILOG = antikodony tRNA His aminokyseliny nesené tRNA Transferová RNA rozeznává svým antikodonem na mRNA kodon pro aminokyselinu, kterou nese. Jinými slovy čte genetickou informaci na mRNA a překládá ji do pořadí aminokyselin v polypeptidovém řetězci. Obr. 106 Kompletní dešifrování genetického kódu: 1966 14 Standardní genetický kód (na úrovni RNA) History of the names of the stop codons First, the amber codon was named following experiments in the Benzer's lab at Caltech. In searching for a mutation that would allow a type of phage mutant to grow, Seymour Benzer said that whoever identified the mutation would get to name it after themself (in some versions of the story, it would be named after the discoverer's mother). The graduate student who isolated the mutation was a young man named Harris Bernstein, whose name "Bernstein" in German means "amber". Thus, the UAG codon, known as a nonsense codon (later known as a stop codon), was named the amber codon. Later, the other two stop codons were called "ochre" (UAA) and "opal" (UGA) (sometimes called, "umber") to maintain the color metaphor. What happened to the graduate student? He became a famous molecular biologist. Vysvětlivky: (SC) = selenocystein, (PL) = pyrolyzin, (I) = iniciační kodon Kodony 1. U C :'LJ: U Phe ser Tyr Cys Phe Ser Tyr Cys Leu Ser N Leu Ser _ Trp : ^ g G Leu Pro His Arg u Leu Pro His Arg Leu Pro Gin Arg A Leu Pro Gin Arg G A He í hr As n Ser U lie Thr Asn Ser C lie Thŕ tys Arg Lys Arg G G Val Ala Asp Gly U Val Ala Asp Gly Val Ala Olu Gly A Val Ala Glu Gly G N = nesmyslný kodon, I = iniciační kodon. 1.2.3 = pořadí nukleotidů v kodortu. Kodonoyé rodiny jsóu vyznačeny m odře, sady červene. Základní vlastností genetického kódu • je tripletový (třípísmenový) • obsahuje 64 kodonů • je degenerovaný - jedna aminokyselina může být kódována více kodony redundance • 61 kodonů má smysl (kódují aminokyseliny) • většina kodonů je synonymních (tj. odlišné kodony kódují stejnou aminokyselinu) • synonym ní kodony jsou zařazeny do kodonových rodin a dvoukodonových sad • 3 kodony jsou nesmyslné (stop kodony, terminační kodony): UAA - och re, UAG - amber, UGA - opal • 3 kodony jsou bifunkční: O UGA - opal = nesmyslný nebo kóduje selenocystein (21 st. aminokyselina) O UAG - amber = nesmyslný nebo kóduje pyrolyzin (22 st. aminokyselina) O AUG = působí jako iniciační při translaci nebo kóduje metionin • je univerzální, tj. většina kodonů má stejný smysl ve všech živých soustavách (prokaryota, eukaryota, viry) 16 Charakteristika standardního genetického kódu 8 kodonových rodin tj. 32 kodonů 8 dvoukodonových sad UC tj. 16 kodonů 5 dvou kodonových sad AG tj. 10 kodonů 1 iniciační a bifunkční kodon AUG tj. 1 kodon 3 terminační kodony tj. 3 kodony (z toho dva bifunkční) 1 kodon lle AU A tj. 1 kodon 1 kodon Trp UGG tj. 1 kodon celkem 64 kodonů Genetický kód 64 kodonů (tripletů), 61 se smyslem, 3 beze smyslu (3 bifunkční) AGA UUA AGC 'Í AGG UUG AGU GCA CGA GGA CUA CCA UCA ACA GUA GCC CGC GGC AUA CUC CCC UCC ACC GUC UAA : G CG CG G GAC AAC UGC GAA CAA GGG CAC AUC CUG AAA UUC CCG UCG ACG UAC GUG UAG | GCU CG U GAU AAU UGU GAG CAG GGU CAU AU U CUU AAG AU G UUU CCU UCU ACU UGG UAU GUU UGA Ala Arg Asp Asn Cys Glu Gin G ly His lle Leu Lys Met Phe Pro Ser Thr Trp Tyr Val stop i A R D N C E Q G H I L K M F P S T W Y V m Stop kodony (terminační kodony, kodony beze smyslu): UAA = ochre (stop), UAG = amber (bifunkční), UGA = opal (bifunkční) AUG = kodon pro Met a iniciační kodon (bifunkční) UGA - selenocystein (21 standardní aminokyselina) UAG - pyrrolyzin (22 standardní aminokyselina) Čtení kodonů Čtení kodonů (tripletů) závisí na tom, u kterého nukleotidu dané sekvence stanovíme počátek čtení. Čtecí rámec (reading frame) - jeden ze tří možných způsobů rozpoznávání tripletů v nukleotidové sekvenci. Je dán polohou nukleotidu, na kterém začíná čtení atgatgatgatg -* 3 čtecí rámce i ' atgatgatgatg 1. ATG ATG ATG tgatgatgatg—$ čtecí rámce , j / gatgatgatg 2. TGA TGA TGA 3. GAT GAT GAT ORF = open reading frame = otevřený čtecí rámec dsDNA 5' ATCGTCTTGAAGTGCGTGTTAG 3' 3' TAGCAGAACTTCACGCACAATC 5' Struktura genomů • Prokaryotický genom O chromozom (nukleoid) - bakteriální chromozom O plazmidy • Eukaryotický genom O soubor chromozomů v jádře (jaderný genom) O Mitochondrie (mitochondriový genom) O chloroplasty (u rostlin) (chloroplastový genom) O plazmidy • + složky genomů: proviry, transpozony, aj. • nDNA = jaderná, ds lineární • mtDNA = mitochondriová, ds kružnicová nebo lineární • ctDNA = chloroplastová, ds kružnicová • virový genom = DNA (ds, ss) nebo RNA (ds, ss) 20 Živé soustavy Tři domény organizmů (16S RNA a 18S RNA) o Bakterie (Bacteria) o Archea (Archea) o Eukarya (Eukarya) buněčné O jednobuněčné O mnohobuněčné nebuněčné O viry O viroidy Všechny způsoby přenosu genetické informace. Mají všechny složky translačního systému. (aa-tRNA-syntetázy, tRNA, ribozomy) Jsou v translaci závislé na hostitelských buňkách. Viry = živé soustavy schopné reprodukce v závislosti na translačním systému hostitelských buněk. prokaryotický typ buňky jádro bez jaderné membrány nedělí se mitoticky DNA kružnicová (většinou) nebo lineární eukaryotický typ buňky jádro obaleno jadernou membránou dělí se mitoticky chromozomy = chromatin (proteiny + DNA) 21 Univerzální fylogenetický strom ia Entaméby Mitochondrie Zelené nesirné bakterie Purpurové bakterie I Chloroplasty I Grampozitivní bakterie Methanosarcina Methanobacteriumi|B Methanococcus Thermoproteus] H) Extrémní halofilové progenot Velikost genomu jednotlivých skupin organismů kvetoucí rostliny ptáci savci plazi obojživelníci kostnaté ryby chrupavčité ryby ostnokožci korýši hmyz měkkýši červi houby řasy bakterie mykoplazmata viry ....... Bp 10 10 10 10 10 10 DNA content (bp) 10 l - ^Bh _ ■ warn 10 10 Velikost genomu se udává v počtech párů bází: bp = pár bází nt = nukleotid kbp = 1000 bp Mbp = 1000 kbp Gbp = 1000 Mbp 1 bp = 660 D 1 mm DNA = 3 Mbp Paradox hodnoty C - velikost genomu neodpovídá vývojovému postavení (celkové komplexitě) organismů 23 TABLE 4.01 Genome Sizes Počet genů a velikost geno-mu u zástupců jednotlivých skupin organismů Number Amount Number of Organism of Genes of DNA (bp) Chromosomes Viruses Bacteriophage MS2 4 3,000 1 (ssRNA)* Tobacco Mosaic Virus 4 6,400 1 (ssRNA)* OXl 74 bacteriophage 11 5,387 1 (ssDNA) Influenza 12 13,500 8 (ssRNA) T4 bacteriophage 200 165,000 1 Poxvirus 300 187,000 1 Bacteriophage G Ó80 498,000 1 Prokarvotes Mitochondrion (human) 37 16,569 1 Mitochondrion [Arabidopsis) 57 366,923 1 Chloroplast (Arabidopsis) 128 154,478 1 Nanoarchaeum equitans 550 490,000 1 Mycoplasma genitalium 480 580,000 1 Mefhanococcus 1,500 1.7Mbp 1 Escherichia coli 4,000 4.6 Mbp 1 Myxococcus 9,000 9.5 Mbp 1 Eukaryotes (haploid genome) Encephalitozoon 2,000 2.5 Mbp 11 Saccharomyces 5,700 12.5 Mbp 16 Caenorhabditis 19,000 100 Mbp 6 Drosophila 12,000 140 Mbp 5 Homo sapiens 25,000 3,300 Mbp 23 Arabidopsis 25,000 115Mbp 5 Oryza sativa (Rice) 45,000 430 Mbp 12 *ssRNA = single stranded RNA; ssDNA - single stranded DNA; all other genomes consist of double stranded DNA. významné objevy ve vývoji sekven ován i Účinnost sekvenování DNA a historie analýzy DNA Současnost: 1. Stále vyšší účinnost sekvenování, nižší cena 2. Nové bioinformatické přístupy 3. Aplikace v biomedicíně (zejm. v onkológii) 4. Komercionalizace 5. Analýza mikrobiomu a metagenomu účinnost bptosobaJrok I 15 j I 150 I I 1 500 I 1S68 1953 1965 1970 I 1977 1979 j um [ 10D 000 I 100Q0OO 1 účinnost I 1980 ^ 1986 fl9SC I 1995 19 üä I 150 000 OOP ~| I 1^ 1996 2000- [ 2001 tfíeschen objev DNA Avery: d jhaz, že DNA je „genetický materiál" Wateon & Crick- objev struktury DNA jako dvojité sroubovice Hglley: určeni sekvence tRNAi|n kvasinek - K sekvenování RNA byty použity melody specifického enzymatického Iráver i RW A a chromatografie, což vyžadovalo vel ká množství analyzovaného vzorku. '.'•>\ Sequenced X cohesive end DNA * Primed synthesis concept and 2-D eJettfOphoresis were used; samples were labeled and less material was required. Sanger: Developed dideoxy termination sequencing procedure; Gilbert: Developed chemical degradation sequencing protocol * Chain termination and chemical degradation concepts were developed. * PolyacrylaiTiHrJe gel electrophoresis was used (o separate DNA tracts. Goad: Proposed GenBank prototype Messing: Developed M13 cloning vectors * Cloning system was applied. Hood: Developed partially automated sequencing system * Sequencing reactions were optimized. ■ Assorted sequencing strategies were applied and computer assisled-data handling was started Watson: Human genome project initiated Venter: First bacterial genomes sequenced * Automated fluorescent sequencing instruments and robotic operations were applied to (tie process. ♦ PGR sequencing concept was introduced. International consortium of scientists: First eukaryotlc genome-yeast-seq uenced * Collaborations between teams of scie-ntists. PerkinEImer, Inc.: Developed 96-capillary sequencer ♦ Fully automated 96-capillary electrophoresis sequencing system becomes available to research laboratories. Complete sequence of the Caenorhabditis eiegans genome Complete sequence of the &u chromatic portion of the Drosophiia meianogaster genome: Compete sequence of the Arabidopsis thaliana genome International Human Genome Sequencing Consortium and Celera Genomics scientists: First drafts of the sequence of the human genome published International Rice Genome Sequencing ProjeCtand Syngenta scientists: First drafts of the genomic sequences of two rice subspecies; Mouse Genome Sequencing Consortium: First draft of the sequence of the mouse genome Rat Genome Sequencing Project Consortium: First draft of the sequence ef the ret genome; International Human Gene Sequencing Consortium; Nearly complete (99-% of euchromatln) sequence of the human genome Časový průběh sekvencování genomů 1084 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 I-//- -I— Discussion and debate in scientific community NRC report I ss c □ OJ E Bacterial genome sequencing S. cerevisiae sequencing H.\lu E co// 39 species C, elegans sequencing D. mefanogaster sequencing _A. thaliana sequencing Genetic maps Microsatellites SNPs $ Physical maps d cDNA sequencing Genomic sequencing Genetic maps Physical maps ESTs Full Pilot sequencing lejncjth^^ Microsatellites SNPs in I cDN A sequencing Genomic sequencing ESTs Full lengthy Working Pilot project, 15% draft, 90% Finishing. -100% -rf— Chromosome 22 Chromosome 21 Přehled kompletně sekvenovaných genomů (2008) Total species (5149) —7—~^—T^T^r^—-^ Viruses Eukaryota Archaea Plasmids 2115 1B22 72 , ,. . , 38 Bacteria Viroids 1063 39 Viroids Plasmids 41 39 Total records (9571) Viruses Eukaryota Bacteria Archaea 3261 1041 chromosomes 1563 chromosomes 67 chromosomes 1827 organelles 1634 plasm ids 59 plasm ids 39 plasm ids Současný stav (2014) ARCHAEA TOTAL: 453 Genome: 430 Transcriptome: Resequencing: 5 Uncultured: 81 BACTERIA TOTAL: 19134 Genome: 18670 Transcriptome: Resequencing: 213 Uncultured: 896 EUKARYA TOTAL: 3181 Genome: 1734 EST/Transcriptome: 789 Resequencing: 510 Uncultured: 4 27 Projekty sekvenování genomů modelových organizmů Escherichia coli (4.6 Mb) - bakterie, prokaryotický organismus známá struktura genomu, regulace a funkce genů • dobře prostudovány biochemické dráhy Saccharomyces cerevisiae (14 Mb) - kvasinka, jednobuněčný eukaryotický organismus známá struktura genomu, regulací a funkce genů • probíhá mitóza a meióza • velký počet dobře definovaných mutant vysoká frekvence homologní rekombinace - snadné záměny alel Caenorhabditis elegans (100 Mb) - jednoduchý mnohobuněčný organismus (hlístice, červ) • obsahuje 959 buněk, jejichž vývojové linie jsou známy detailně prostudovaný nervový systém (302 neuronů a jejich spojení) modelový organismus vývojové biologie (procesy diferenciace) 28 Projekty sekvencování genomů modelových organismů Drosophila melanogaster (165 Mb) - zástupce hmyzu • objekt klasické genetiky dobře prostudována struktura genů, jejich regulace a funkce řada dobře definovaných mutant. Fugu rubripes (400 Mb) - ryba model genomu obratlovců • nízká proporce repetitivních sekvencí vysoká proporce exonů • relativně krátké geny ve srovnání s lidskými homologními geny (vhodný pro identifikaci lidských kódujících genů) 29 Projekty sekvencování genomů modelových organismů Arabidopsis thaliana (100 Mb) - kvetoucí rostlina neobvykle malý génom nízký počet chromozomů nízká proporce retitivních sekvencí vysoký počet semen (10 000) během krátké generační doby Mus museulus - myš, savec (3000 Mb) geneticky nejlépe prostudovaný savec vhodný experimentální model pro studium mutací a genetická křížení vazba genů podobná jako u člověka možnost přípravy transgenních myší s genetickými modifikacemi model studia genové exprese a funkce genů. metagenom = genetický materiál pocházející z prostředí 30 Prokaryotícký génom • Složky O Bakteriální chromozom (nukleoid) O Mobilní elementy (Plazmidy, inzerční sekvence, transpozony, genomické ostrovy, integrony aj) O Bakteriofágy, profágy 31 STRUKTURA PROKARYOTICKÝCH GENOMU Vysoká Mozaikový charakter dynamika a plasticita Endochromozomy (1,2) Přídatné genetické elementy (A-H) . r - Plazmidy (H, F) Variabilní složka - Profágy a defektní profágy (B, D, E, G) genomu - adaptace - Genomické ostrovy (A, C) na Prostredí - IS-elementy, transpozony, integrony (I) TOPOLOGIE PROKARYOTICKEHO GENOMU Replikony CHROMOZOM - kružnicový - lineární PLAZMIDY - kružnicové lineární DRUH CHROMOZOMY PLAZMIDY KRUŽNICOVÉ LINEÁRNI KRUZNICOVE LINEÁRNI Escherichia coli 1 (4,6 Mb) několik Bacillus cereus 1(5 Mb) -1 (2,4 Mb) < «........... 0 -několik (2,6 Mb) Vibrio cholerae 2 (2,9+1,1 Mb) Borrelia burgdorferi 1 (0,9Mb) 9 (kb) 12 (kb) Agrobacterium tumefaciens 1 (2,8 Mb) 1 (2,1 Mb) 2 (0,75 Mb) Streptomyces lividans 1 (8 Mb) <--► 1 (50 kb) Prokaryota s lineárním chromozomem • Streptomyces (ambofaciens, lividans) 10 Mb • Borrelia burgdorferi (B. hermsii) 0.95 Mb O + lineární plazmidy • Coxiella burnetii 2,1 Mb • Paracoccus denitrificans - tři molekuly DNA O 2; 1,1; 0,64 Mb, dvě jsou lineární • Agrobacterium tumefaciens • a řada dalších... 34 Velikost genomu prokaryot Genetická organizace prokaryotického genomu • velmi kompaktní genom s malými mezerami mezi geny • většina genomu je obsazena strukturními geny • malá část (10 %) je tvořena nekódující DNA • operonové uspořádání genů (většinou funkčně příbuzných) • pořadí genů není u prokaryot konzervováno - důsledek přestaveb genomu a horizontálního přenosu genů 36 Velikost a genový obsah vybraných prokaryotických genomu druh velikost genomu v párech nukleotidů předpovězený počet genů Archaea Archaeoglobusfulgidus 2 178 400 2 486 Methanosarcina acetivorans 5 751 492 4 721 Nanoarchaeum equitans 490 885 582 Pyococcusfuriosus 1 908 2 56 2 228 Sulfolobus solfataricus 2 992 245 3 033 Thermoplasma volcanium 1 584 804 1 548 Eubacteria Bacillus subtilis 4 214 630 4 225 Bordetella parapertussis 4 773 551 4 467 Bradyrhi^phium japonicum 9 105 828 8 373 Buchnera aphidkola 615 980 550 Chlamydia pneumoniae kmen AR39 1 229 853 1 167 Escherichia coli kmen K12 MG1655 4 639 675 4 467 Escherichia coli kmen Ol 57 EDL933 5 528 970 5 463 Haemophilus influenzae Rd KW20 1830138 1789 Legionella pneumophila kmen Paris 3 503 610 3 136 Mycobacterium tuberculosis kmen CDC 4 403 837 4 293 Mycobacterium genitalmm 580 076 525 Neisseria meningitidis Z 2491 2 184 406 2 208 Pseudomonas syringae kmen DC3000 6 397126 5 660 Rickettsia typhi 1 111 496 919 Salmonella typhimurium 4 857 432 4 622 Staphylococcus aureus kmen MW2 28 20 46 2 2712 Streptomyces coelicolor 8 667 507 7 912 Ureaplasma parumMCC 700970 751 719 653 Yersinia pestis kmen KIM 4 600 75 5 4 240 Údaje jsou převzaty z webové stránky NC.BI (http://Ww.ncbi.nim,nih.gov/Genomes/), květen 2008. Počet genů u prokaryot je proporcionální velikosti jejich genomu - paradox hodnoty C u nich neplatí Organizmus Velikost genomu (Mbp) Počet ORF T. pallidum B. burgdorferi H. pylori A. fitlgidus B. subtilis M, tuberculosis E. coli 1.14 1.44 1.66 2.18 4.20 4.41 4.60 1040 1751 1657 2 437 4100 3 924 4 288 1 gen - 1 kbp Klasifikace 4288 genů E. coli podle jejich funkce funkce fágů, transpozonů a plazmidů replikace DNA, rekombinace, reparace DNA metabolizmus uhlíkatých sloučenin metabolizmus aminokyselin další geny se známou funkcí regulační funkce translace, proteinový metabolizmus ústřední intermediární metabolizmus adaptace, ochranné funkce buněčná stěna, strukturní membránové komponenty metabolizmus nukleotidů transkripce, metabolizmus RNA mastné kyseliny, fosfolipidový metabolizmus energetický metabolizmus transportní proteiny potenciální enzymy 39 Struktura chromozomu E. coli HLP, HU-proteiny, enzymy a faktory účastnící se replikace a transkripce 40 Charakteristika plazmidů dsDNA - kružnicová nebo lineárni, velikost: 1-1000 kb Základní typy plazmidů: • kryptické - funkce neznámá • epizomální - reverzibilní intergace do chromozomu hostitele • konjugativní - schopné přenosu konjugací • mobilizovatelné - přenositelné za přítomnosti konjugativní ho plazmidů 41 Příklady plazmidů: • F-plazmidy (fertilitní faktor, konjugativní) O zodpovědné za konjugaci • R-plazmidy (R-faktory) O zodpovědné za rezistenci k antibiotikům • kolicinogenní (Col-plazmidy) O tvorba proteinů s antibiotikovým charakterem (Enterobacteriaceae, aj.) • Ti-plazmidy (tumory indukující) O tvorba nádorů u dvouděložných rostlin (Agrobacterium tumefaciens) • plazmidy odbourávající organické sloučeniny (Pseudomonas) • plazmidy podílející se na fixaci vzdušného dusíku (Rhizobium). • Plazmidy používané jako vektory pro přenos DNA (pBR322, pUC) 42 Eukaryotícký typ buněk • Jádro je ohraničeno od cytoplazmy membránou • Dělení buněk probíhá mitózou nebo meiózou • Genetický materiál tvoří chromatin • Buněčná stěna je odlišná od prokaryotické nebo chybí • Buňka obsahuje organely: mitochondrie, chloroplasty, cytoplazmatické retikulum, Golgiho aparát, lysozomy aj. Přenosy genetické informace u eukaryot probíhají principiálně stejně jako u prokaryot 43 Složky eukaryotíckého genomu • jaderný genom - lineární chromozomy v různém počtu • mitochondriový genom - kružnicové nebo lineární genofory • chloroplastový genom (rostliny) - kružnicové genofory • plazmidy (velmi vzácně) - kružnicové genofory 44 Chromati n = genetický materiál eukaryotické buňky 30 % NK (DNA + RNA) + 70 % proteinů Základní formy organizace chromatinu chromatinová síť vláken v interfázi jednotlivé chromozomy při mitóze w euchromatin (transkripčně aktivní) s* chromatin (méně kondenzovaný, slabě barvitelný bazickými barvivy) heteroterochromatin (transkripčně inaktivní konstitutivní faku Itativní centroméra + teloméra dočasně netranskribované geny, změny během ontogenetického vývoje 45 Struktura mitotických chromozomů _:_ J Tandem repeats D DD Centromere-associated tandem repeats Telomeric and sub-telomeric repeats Dispersed Tyf/copio retroelements and microsatellites LINEs Single and low-copy sequences including genes 46 Funkční složky eukaryotických chromozomů • centromera - zajišťuje segregaci chromozomů do dceřiných buněk při mitóze (meióze) • telomera - koncová oblast - její struktura zajišťuje dokončení replikace lineárního chromozomu Typické telomerové repetice: OTTGGGG - Tetrahymena OTTAGGG - člověk • počátky replikace (ori) 47 Úrovně kondenzace chromatinu krátký úsek dvojšroubovice DNA „korálková" forma chromatinu 2,nm LJU-nm chromatinove vláknu s poskládanými nukleosomy úsek chromosomu v rozvinuté formě kondenzovaný úsek chromosomu 1 700 nm úplný mitotický Chromosom Výsledek: Každá molekula DNA je zabalena do mitotického chromozomu tak, že je 50 OOOkrát kratší než v rozvinuté formě Nukleozómová struktura DNA 8-114 bp spojníková DNA jádrové histony nukleosomu „korálková" forma chromatinu nukleáza štěpí spojníkovou DNA nukleosom obsahuje 200 nukleotidových párů DNA uvolněná částice jádra nukleosomu t5|"r disociace ve vysoké koncentraci soli oktamerní histonové jádro I disociace dvoušroubovice DNA ze 146 nukleotidových párů 1 1 H2A H2B H3 H4 49 histonový oktamer dna Histonový oktamer lze si lze velmi zjednodušeně představit jako válec, kolem něhož se otáčí DNA. 10-11 nm 6 nm molekulární model "reálnější pohled na umístění histonů v oktameru Funkce histonu H1 při spojování nukleozomů Molekulární struktura eukaryotického chromozomu 30 nm vlákno - solenoidová struktura Závit solenoidu tvořený i ffl; 6 nukleozomy smrštěný id) Model cik-cak. Proteiny chromatinu A. Histony • Bázické proteiny obsahující vysokou proporci argininu a lyzinu (20-30%). U některých organismů jsou ve spermiích přítomny protaminy, které jsou bohaté na arginin. • Histony jsou velmi konzervativní (zejména H3 a H4). U bakterií se vyskytují toliko HLP, u archeí se nacházejí histony, které jsou jen částečné homologní s H3 a H4. B. Proteiny nehistonové povahy • proteiny s enzymovými funkcemi, zajišťující replikaci a transkripci (polymerazy, ligázy aj) a enzymy modifikující histony při remodelaci chromatinu (acetyltransferazy, metylazy aj) -regulace genové exprese • HMG-proteiny (high mobility group), navozující změny chromatinu během transkripce 53 Struktura 30 nm chromatinového vlákna ukleozom 1 závit (otáčka) 30 nm-chromatinového vlákna, který sestává ze šesti nukleozomů propojených dsDNA. 30 nm-chromatinové vlákno topo II . . Mtopo II proteinové lešení chromatinová doména (chromatinová smyčka) replikace transkripce Tento obrázek je idealizujícím schématem. Chromatinová domény nejsou stejně velké. Jejich délka je 60-150 kb. Modely přetváření nukleozomové struktury chromatinu restoration of standard nucleosomes dissociation Of DNA-binding proteins remodeling complex B remodeling complex A Chromatin remode-lující komplexy - dočasné změny struktury chromatinu addition of DNA-binding proteins Genová exprese, replikace DNA a další procesy vyžadující přístupnost DNA uložené v nukleozomech 55 Kovalentní modifikace histonů &c .'i T_ T Ac = acetyl (lyzin) H2A N<^ k ľ^^Y^30 Me = metyl (lyzin) P = fosfát (serin) HB2 n« i l í I ^—^ 1 ,c u = ubiquitin S K 1 5 Ac T Ac T Ac T Ac T K K K K 5 12 15 20 Me .P) Ac Ac Ac Ac Me H4 n (A) Ac (p) Ac ač ač Ac (?) „Histonový kód" H3 Nl k s k k k ks \ ~y=DC • změna struktury s io u is 23 27 28 chromatinu (de/kondenzace) • exprese genů i s a i" "e 2Ko\ / • umlčení genu histone-fo!d domain 56 Sekvence eukaryotického genomu Jedinečné sekvence (strukturní geny) přímé tandemové r. ATGCATGCATGC *->-f í Jednotka repetice Repetice rozptýlené r. / \ obrácené ATGC...GCAT x- krátké dlouhé 100-300 bp > 300 bp Alu transpozony IR LTR retroviry IR (inverted repeat) ATGČ--------GCAT Obrácená (koncová) repetice TACG--------CGTA <- LTR LTR (Long Terminal Repeat) : GTATG-----CATAC--------------------------GTATG-----CATAC Dlouhá koncová repetice CATAC-----GTATG---------------------------CATAC-—GTATG 57 Model struktury centromery metafázního chromozomu vlákno dělicího vřeténka AYAYAYAV^b ,^$8$ ý^C^G^l DNA chromatid YAYAyAYW^ntromer^^ Konzervativní struktury centromer u kvasinky 20 nm nukleozomy ■ mikrotubulus dělicího vřeténka .centromera DNA 110 nukleotidů *H (-40 nm DNA) konzervativní elementy II III ATAAGTCACATGAT - - TGATTTCCGAA TATTCAGTGTACTA - m Ďp' ^/oAI - ACTAAAGGCTT í í vazba specifických proteinů 58 Model lidské telomery stabilizované tvorbou t-smyčky vysoce konzervativní sekvence - tandemové repetice centromera t-smyčka ........../.......... m 1111111111111111111 11111111111111111111 irr h i li1111111111 í m 11 iiMi 11 m i iv w 1111111111111 nrr ÚJ /...................Vjf1 '*''................i ■ i ■ t ■ i■ i ' / (AATCCC)/? —v— komplex TRF-2 komplex TRF-1 Specifita struktury telomery: - zabraňuje odbourávání konců chromozomů DNázami - brání spojování (fúzím) konců různých chromozomů - umožňuje replikaci lineárních chromozomů Typy genů na eukaryotícké jaderné DNA Jedinečné geny (1 kopie, většina strukturních genů) • Tandemové repetice (geny pro rRNA, geny pro histony) • Genové rodiny (skupiny příbuzných genů - geny pro globin, aktin aj.) • Pseudogeny (inaktivní kopie genů) • Rozptýlené genové repetice (kopie genů nebo genových rodin rozptýlené po genomu - geny pro tRNA, snRNA aj.) • Orfany (orphans) = URF = ORF s neznámou funkcí, bez homologie ke známým genům • Orfony (ojediněle se vyskytující kopie genů) • Mezerníky - sekvence oddělující geny nebo skupiny genů a) přepisované b) nepřepisované 60 Projekt analýzy lidského genomu Human Genome Project (HGP) • 1985 - první úvahy • 1987 - první finanční zdroje • 1990 - oficiální zahájení Dept. Energy, NIH, HUGO Cíle dílčích etap: 1. Konstrukce genetické mapy s vysokým rozlišením 2. Konstrukce fyzikálních map různého typu 3. Téměř úplná sekvence genomu stanovena v roce 2003 (2001-publikace v Nature a Science), dokončeno 2005 O identifikovat a lokalizovat geny v genomu člověka stanovit rozdíly v genetické výbavě jedinců O jak rozdíly v genetické výbavě predisponují jedince k chorobám Součást projektu: • Rozvoj metodologie analýzy genomu (mapování genů, sestavování sekvencí) • Bioinformatika (sběr a zpracování dat) • Analýza genomu modelových organismů ei Projekt díverzíty lidského genomu (Human Genome Díversíty Project) • Studium genetických variací v etnických skupinách 1. Původ člověka, migrace prehistorických populací, sociální struktura populací. 2. Adaptace a choroby. Náchylnost populací k chorobám (hypertenze, thalasemie, srpkovitá anémie aj). 3. Forenzní antropologie. Variabilita DNA markem, spolehlivost DNA-fingerprintů, identifikace jedinců. Matt Ridley: Genom - Životopis lidského druhu v třiadvaceti kapitolách. Portál, Praha 2001. 62 Lidský mezinárodní projekt HapMap (Haplotype map) Cíl projektu: identifikovat a mapovat SNP („snips", single-nucleotide polymorphisms) v různých populacích, zjistit jejich asociaci s geny zodpovědnými za choroby a tím stanovit rizika vzniku chorob (270 národů ze čtyř větví lidstva - Američanů, původem evropských bělochů, Číňanů, Japonců a Yoruby ze západní Afriky) Drobné změny v lidském genomu: jednonukleotidové polymorfismy = SNP - záměny nukleotidů v četnosti 1 : 2 000 (podobnost genomů u nepříbuzných lidí -99,5%) Haplotyp: skupina vázaných SNP v určité oblasti chromozomu využívaných jako markery (jsou vázány k určitým genům - asociace s geny zodpovědnými např. za choroby) původ DNA: SNP1 SNP2 SNP3 SNP4 jedinec 1 TACAGGATC -■■ TTCGGGCCA --- AATCCATGC ■■- AAGCTCGGA --• jedinec 2 TACAAGATC --- TTCGAGCCA ---AATCCATGC ---AAGCTCGGA--- jedinec3 TACAGGATC ---TTCGAGCCA---AATCTATGC ---AAGCTCGGA--- jedinec4 TACAGGATC---TTCGAGCCA---AATCCATGC --- AAGCCCGGA --- i i i i L_ __ _J~_~_V~i rV_V__ __ _J y y y t haplotyp 1 G G C T haplotyp 2 A A C T haplotyp 3 G A T T haplotyp 4 G A C C 63 Typy DNA-sekvencí v lidském genomu lidský genoir 3 miliardy bp fcitrony, promotory', zaváděcí sekvence Nekódující sekvence >90% Geny a genům podobné sekvence 20-30% Kódující sekvence <10% Středně až vysoce repetili vní 20-30% Negenová DNA 70-80% Jedinečná nebomaíé počty kopii —I Pseudogeny I —I Genové fragmenty [ Rozptýlené repetice 40% —I Repetice SINE 1—I Repetice LINE Tandemové repetice i—\ Satelitní DNA 1 60% | —I MinisateKtní DNA [ —I Mikrosatelimí DNA| 64 Statistické údaje o lidském genomu Celková velikost genomu 3289 Mb Chromozomy - největší 279 Mb - nej menší 45 Mb X 163 Mb Y 51 Mb Frakce CpG 41 % Počet ostrovů CpG 28 890 Část genomu kódující proteiny 1,50% Část genomu, která je transkribována 33% Počet dosud identifikovaných genů 26 500 Celkový počet před povezených genů 22 287 (2008) Střední hustota genů 9-14 genů/Mb Průměrná velikost genu 27 kb Největší gen 2,4 Mb (DMD) Průměrná velikost transkriptu 1340 bp Současný odhad 18 000-20 000 65 Funkční klasifikace genů předpovězených z analýzy sekvence lidského genomu různé (1318; 4,3%) virový protein (100; 0,3% transferový/nosičský protein (203; 0,7 %) transkripční faktor (1850; 6,0 % buněčná adheze (577; 1,9 %) chaperon (159; Q5 %) enzym se vztahem k nukleovým kyselinám (2308; 7,5 %) signální molekula (376; 1,2%) receptor (1543; 5,0% kináza (868; 2,8 %) vybraná regulační molekula (988; 3,2 %) transferáza (610; 2,0 %) syntáza a syntetáza (313; 1,0 % oxidoreduktáza (656; 2,1 % lyáza(117; 0/1%) lipáza (56; 0,2 % izomeráza (163; 0,5 %) hydroláza (1227; 4,0% cytoskeletální strukturní protein (876; 2,8 %) extracelulární matrix (437; 1,4%) imunoglobulin (264; 0,9 %) iontový kanál (406; 1,3%) motor (376; 1,2%) svalový strukturní protein (296; 1,0 %) protoonkogen (902; 2,9 %) vybrané proteiny vázající kalcium (34; 0,1 %) intracelulární transportér (350; 1,1 %) transportér (533; 1,7%) neznámá molekulární funkce (12 809; 41,7 %) 66 Genom organel: chloroplastů a mitochondrií Table 14-2 The Size of Organelle Genomes* Type of DNA Size (thousands of nucleotide pairs) Chloroplast DNA Higher plants Chlamydomonas (green alga) Mitochondrial DNA Animals (including flatworms, insects, and mammals) Higher plants Fungi Schizosaccharomyces pombe (fission yeast) Aspergillus nidulans Neurospora crassa Saccharomyces cerevisiae (budding yeast) Chlamydomonas (green alga) Protozoa Trypanosoma brucei Paramecium 120-200 180 16-19 150-2500 17 32 60 78 16 (linear molecule) 22 40 (linear molecule) *These genomes are circular DNA molecules unless indicated otherwise. Počet kopií DNA v organelách: mtDNA: 5-50 i více, ctDNA = 20-80 67 Tab. 16.2 , Velikost a genový obsah vybraných mitochondriálních a chloroplastových genomů druh triviální označení velikost genomu v párech nukleotidů předpovězený počet genů mitochondriälni genomy Apis mellifera včela 16 343 13 Arabidopsis tbaliana huseníček 366 924 57 Caenorbabditis elegans hádatko 13 794 12 Candida glabrata kvasinka (infekční) 20 063 37 Cblamydomonas reinhardtii zelená řasa 15 758 25 Drosopbita melanogaster octomilka 19 517 37 Dank rerio dánio pruhované 16 596 37 Homosapiens člověk 16 571 37 Mus Musculus myš 16 299 37 Ory%a sativa rýže 491515 96 Plasmodium falciparum prvok, původce malárie 5 967 3 Rattus norvegicus potkan 16 313 37 Saccbaromyces cerevisiae pekařská kvasinka 85 779 43 Zea mays subsp. mays kukuřice 569 630 218 chloroplastove qenomv Arabidopsis tbaliana huseníček 154 478 129 Cblamydomonas reinhardtii zelená řasa 203 828 109 Maubantia polymorpha játrovka 121024 134 Ory%a sativa rýže 134 525 159 Zea mays subsp. mays kukuřice 140 384 158 Údaje jsou převzaty z webové stránky NCBI (http://www.ncbi.nlm.nih.gov/Genoines/) k 15. květnu 2008. 68 Struktura genomu mitochondrií člověka 16 569 pb, 37 genů Funkce mitochondrií: tvorba ATP oxidací cukrů a mastných kyselin mtDNA kóduje: rRNA (12S a 16S), 22 tRNA, cytochrom c-oxidázy, cytochrom b, ATP-syntetázu 69 Mapa lidského mitochondriálního genomu těžký řetězec těžký řetězec H (vyšší obsah purinů) ~": malá Mitochondriová DNA různých skupin organizmů Organizmy Velikost v bp Struktura Charakteristika Buňky více-buněčných V• V* I o živočichu 1,6 až 2,0 x 104 kružnicová každý živočišný druh má svůj vlastní typ mtDNA Buňky vyšších rostlin 2,5 x 105 až 2,0 x 106 kružnicová nebo lineární pozoruhodná variabilita ve velikosti, struktuře a genetické organizaci nejen mezi druhy, ale také u stejného organizmu, a tedy i ve stejné buňce Prvoci 3,0 x 104 v az 6,0 x 104 kružnicová nebo lineární rozdíly mezi druhy Kvasinky 2,0 x 104 až 1,0x105 kružnicová jednotná uvnitř stejného druhu, ale rozdíly mezi druhy ♦ Velmi charakteristické pro mtDNA vyšších rostlin jsou úseky, které se podobají DNA chloroplastů. 71 Specifické rysy mitochondriového genomu 1. Geny jsou uspořádány velmi hustě, téměř celá sekvence je tvořena strukturními geny nebo se přepisuje do rRNA a tRNA 2. K translaci je využíváno jen 22 tRNA, které jsou schopny díky kolísavému párování bazí přečíst všechny kodony 3. Genetický kód používaný v mitochondriích (některých organismů) se liší od standardního genetického kódu. 4 ze 64 kodonů mají jiný smysl (zřejmě v důsledku malého počtu proteinů kódovaných v mitochondriích byly tyto změny během evoluce tolerovány) • pro zajištění fungování mitochondrií je vyžadováno 90 genů lokalizovaných v jaderném genomu • mitochondriové geny se dědí nemendelisticky (matroklinně, cytoplazmatická dědičnost) - studium lidských populací • podléhá rychleji mutacím (10-100x častěji něž jaderný genom, reparační procesy omezené) 72 Většina proteinů v organelách je kódovaná jaderným genomem MITOCHONDRION OR CHLOROPLAST organelle DNA — RNA CYTOSOL RNA precursor protein imported protein protein synthesized in organelle Kooperace jaderných genů s geny na mtDNA lidského genomu Funkční produkt Podjednotky (protomery) funkčního produktu určené geny lokalizovanými na mtDNA určené geny lokalizovanými v jádře buňky NADH-dehyd rogenáza 7 podjcdnotek >41 podjednotek Sukcinát CoQ-oxidoreduktáza 0 podjednotek 4 podjednotky Komplex cytochromu b-cl 1 podjednotka 10 podjednotek Cytochrom c-oxidáza 3 podjednotky 10 podjednotek HMransportující ATP-syntáza 2 podjednotky 14 podjednotek rRNA mitochondrií 2 0 tRNA mitochondrií 22 0 mRNA mitochondrií 13 0 DNA- a RNA-polymerázy 0 všechny Ribozomové proteiny 0 -70 Onemocnění jako důsledek mutací mtDNA a nDNA Biogeneze proteinü dychacfho retezce v lidskych mitochondriich nucleus translokäzy RNA cytoplasmic ribosome -1000 different *«••*, nuclear-encoded •*•*•]• mitochondrial proteins mitochondrial DNA (mtDNA) 13 mtDNA- mitochondrial 75 Genom chloroplastů \ invörted repeats containing riboeomal RNA genes total length of genome = 121,024 nucleotide pairs ribulose bisphosphate carboxylase (large subunit) Genetická organizace genomu chloroplastu Geny chloroplastů Nicotiana tabacum Funkce Počet genů Transkripce RNA-polymeráza 4 Translace rRNA 4 tRNA 30 Ribozomové proteiny 21 Fotosyntéza Fixace C02 1 Fotosystém I 5 Fotosystém II 14 Cytbchromový komplex b/f 5 Hľtransportující ATP-syntáza 6 ^JmTTunkce™ NAD(P)H-dehydrogenázový komplex 11 Clp-proteáza 1 Acetyl-KoA-karboxyláza (EC 6.4.1.2) 1 Membrána plastidu 1 Maturázy (str. 394) 1 Otevřené čtecí rámce kódující více než 29 aminokyse -lin 30 Geny chloroplastů jsou podobné genům cyanobakterií Původ mitochondrií a chloroplastů (endosymbiotická teorie) • MITOCHONDRIE • chemoorganotrofní prokaryotické _ améboidní anaerobní před- buňky s aerobní respirací * chůdci eukaryotických buněk (protomitochondrie) • CHLOROPLASTY • fotolitotrofní prokaryotické buňky _^ améboidní předchůdci (fotosyntetizující protochloroplasty) eukaryotických buněk • Nepřímé důkazy: O přehrádečné dělení mitochondrií O konformace DNA (kružnicová forma) O translační aparát podobný prokaryotům • podobnost sedimentačních koeficientů ribozomů • podobnost sekvencí mt-rRNA s rRNA bakterie E. coli 79 Původ mitochondrií Genom vírů • Viry O Prokaryotické (bakteriofágy) • DNA • RNA O Eukaryotické • živočišné DNA/RNA • rostlinné DNA/RNA • houbové DNA/RNA • Typy genomové NK O ssDNA - lineární nebo kužnicová O dsDNA - lineární nebo kružnicová O ssRNA - lineární O dsRNA - lineární Segmentovaný genom 81 Rozdělení vírů podle typu genomu 1. dsDNA-► dsDNA ^ | virion + mRNA-► proteiny ^* (většina DNA fágů, herpesvirus, poxvirus, adenovirus, SV40) 2. +ssDNA —► -ssDNA — I +mRNA -ssDNA —► +ssDNA +mRNA (parvoviry, ÍX174) -> +ssDNA proteiny -► -ssDNA virion virion -► proteiny 82 Rozdělení virů podle typu genomu 3. dsRNA—► dsRNA vinon mRNA-► proteiny ^ (reoviry) 4. +ssRNA —► -ssRNA-► +ssRNA £ ~ virion mRNA —► proteiny (RNA-fágy, rostlinné viry) 5. -ssRNA-► +ssRNA-► -ssRJNA ^ ^ virion mRNA-► proteiny / (vzteklina, ortomyxoviry - chřipka) 83 Retroviry (HIV) RT RT +ssRNA-------------> -ssDNA-------> dsDNA integrace do chromozomu aktivace +RNA mRIN A +ssRNA I I proteiny —► virion 84