PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 PB051 Výpočetní metody v bioinformatice a systémové biologii Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeči Katedra informačních technologií Masarykova Univerzita Brno Jaro 2014 iPiYto projpktjp spnlufinanrován i vreipským sariálním fondem a státním rozpočtem íp-ikě republiky. INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Outline PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Kontaktní údaje PB051 Výpočetní metody v bio informatice a systémové biclcgii - Tydcn 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeči ► Dr. Matej Lexa, C506 (lexa@fi.muni.cz) ► Kurz: Út 16:00-17:50 (C525) ► Konzultace: Čt 13:00-15:00 (C506) ► http://www.fi.muni.cz/~lexa/teaching.html Kontaktní údaje PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče ► Dr. David Šafránek, C518 (xsafran1@fi.muni.cz) Klasifikace PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prt ► Hodnotí se Úkoly 4x5 bodů Semestrální úkol 30 bodů Zkouška 50 bodů ► Klasifikační stupnice ► A 91 -100 ► B 81 -90 ► C 71 - 80 ► D 61 - 70 ► E 51 - 60 F méně než 51 ► Analýza dat v genomovém kontextu ► Statická analýza sítí ► Dynamická analýza sítí ► Aplikace Markovovských modelů v bioinformatice Analýza dat v genomovém kontextu PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prt ► Prohlížeče genomů (UCSC, Ensembl, Argo, GBrowse) Pokročilé funkce UCSC Genome Browser a Table Browser ► Programovatelný přístup ke genomu přes rozhraní Biomart z prostredi R/Bioconductor ► Bioinformatika genové regulace (TRANSFAC, Matlnspector)) ► Datové zdroje týkající se interakčních sítí Náplň předmětu - část systémová biologie PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče ► metody a nástroje statické analýzy a integrace dat integrace dat rekonstrukce sítě genových interakcí z experimentálních dat analýza interakční sítě jako obecného grafu Metody a nástroje statické analýzy PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu f r , , Genomové data prt ► statická analýza síti a integrace dat nástroje: Cytoscape s několika moduly ► rekonstrukce genových regulačních sítí z microarray dat nástroje: GeneNetworks, GinSim ► dynamická analýza pravděpodobnostních modelů genových sítí nástroje: Dizzy ► metabolické sítě a jejich analýza - nástroje: KEGG, metacyc, COPASI Aplikace Markovovských modelů v bioinformatice PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče ► Markovovy řetězce ► Markovovy řetězce proměnného řádu ► Skryté Markovovské modely (HMM) ► HMM profily ► HMM pro identifikaci genů Outline PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Biologie genomu PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče 10-nm íibeí 3(}-nm üb« Biologie genomu PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče i Human Gůrfcnn* ] Geras and Gen* Related- Sequant« 12i]i:aib Biologie genomu PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Genome compacting PB051 Výpočetní metody v bioinformatice a systémové biologii - Týden 1 Eukaryotic transcription PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Selected organizational characteristics of genomes PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče ► by topology modular hierarchical discrete, but elements sometimes fuzzy ► by end-product >• DNA (structure) ► RNA (tRNA, ncRNA, rRNA, siRNA...) protein complexes and particles (membrane sensor, flagellum, viral particle) Struktura genomu PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu ► Geny proteiny (kódující, exon, intron) ► RNA ► Regulační sekvence promotory enhancery jiné ► Repetitivní sekvence mikrosatelity (STR) ► minisatelity (VNTR) satelity ► DNA transpozony, helitrony retrotranspozony (LINE, SINE, LTR) ► Cizí sekvence viry endo(retro)viry ► Oblasti (ne)podobnosti (homology) ► SNP delší strukturní variace Genomické ostrovy Outline PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Genome changes (in sequence or number) ► topology unchanged SNPs (point mutations) tandem repeat expansion/contraction ► 1-point translocation chromosome breakage chromosome fusion ► 2-point translocation deletions, convesions and exchanges (recombination effects) cut-paste (DNA transposon) copy-paste (retrotransposons) roling-circle (helitrons) ► 2-point translocation ► DNA methylation Histone methylation/acetylation Genome module changes PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prt ► at DNA level exonization exon shuffling gene migration genome duplication ► at RNA level alternative splicing transcriptional fusion ► at protein level translational fusion Mutations PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 □ NA (coding stranci) j AC. I ICAAACCl'AI Transcription AUGAAGUUUGG(9u3Cll mRNA _ Trerwlaton | | | ^ J Amino acid sequence ^—Lye—Phe-Gly {*} Norm..i DNA molecule dma (coding slrand) tacttcaaaQcgatt a u o a a s u u u h q c i a a Amino acid sequence ^— Lys — Phe - augISaguuuggcuaa _/ tacttcaaccgatt augaaguuggcuaa" ^— (d) Frameshlft mutation Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeči K M i .j.'—.^ _ PB051 Výpočetní metody v \y\ UTclTI O íl S bio informatice a systémové biologii - Týden 1 Nátur* R»v»¥f5 i G^nstiíc Tandem repeat expansion or contraction PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Increase in repeat length 1> 2> g» 4* * 1 '2*3*4 *G *7 *B *0 *10 *1 Vs%*S V *3 *0 *10 tnitiatíori Dissociation 1 23466789 10 Renybridizotion mdsďignmant Decrease řn repeat length 1 2t 3 4t *1 *2 *3 '4 '5 \ '7 'd 0 '10 '1 '2 "3 "4 "s "e "7 "e 'o '10 12 3 4 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče 5 6 7 8 O 10 11 1 234667BÖ10 The new strand b a different length to the template 4 S S 7 B 0 10 1 23466780 1G 4 6 6 7 8 O 10 Chromosome breakage and repair PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 A. Breakage-and-reunion vil ol ■ radiation makes two breski (i) nort-homologous end joining homologous and joining simple aberration radiation makes more than two breaks complete aberration B. Recomb inational mis re pair (1-hit) NJ homologous "repair" radiation makes a braak aberration C, Exchange theory radiation mak*3 two lesions Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Chiasma and crossinq-over durinq meiosis IS^^S biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Gene cross-over or conversion PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Genů ůůnvar slůn Crossover Gene cross-over or conversion DNAdtiplexespair Homologous slrands are nicked zni Second nicks made in same strand Second nicks made in olherslrand Second strands Nictis are sealed over belwen duplexes, and nicks L are sealed .......... i 11 ■ I i. 111' Genomes are not recombinant, but contain heteroduplexregion Reciprocal recombinant utSMMMMMMMMMMA genomesare generated fTTTTTTTTTIITTT Gene conversion in immunoglobulin PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 <3% V-Region C-Region Pseudogenes Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeči Exon shuffling PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Epidermal growth factor gene with multiple EGF exons [green] Fibroneetin gene with multiple 'finger" axons [orange] . Exon shufflinc _1f—— Exon duplication Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeči Plasm inogen gene with a "kringle" exon [blue] shuffling Portions of ancestral genes TPA gene as it exists today Alternative splicing PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 DNA ^-jjjgfrgjjjfríTteT^TIX^^^ Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeči -Alternative Splicing - Protein A Protein B Protein C Epigenetic regulation of gene activity PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Source: Nery- j: i i ? J A^o^ar A-s-M-cia Lia-n nl Nauru logical Euige-ans Transposons PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Transposons PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Struktura genomu CIms t element CL?» II element Heliiron Dynamika genomu Genomové data prohlížeče New pos-ilion New posil ton Nature Reviews | Genetic; Transposase is the key protein in DNA transposons I Transposase Transposase binds the ends of Ac and Ds elements. \ / Cleavage PB051 Výpočetní metody v bio inform atice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Target DNA |„ itegration into new target site new location Transposons shape genomes of maize varieties A -■' '-^-Sl I -■: It-« 11-»—i t 'jJ^n -^-Kil McC[111M)) <#f%X?_ rik B73(73 Kb) Mu1 T [52 kI/i -to »™™ D 7**? *.H?ro/, , taeSOSS ".tor fHeý rpI35A fiyproT ^tac7077& uee2 -•iiir inn r CML258 (66 kb) r0ý35Á tacBQSS^^^T*^ 7~ 1^ I137TN [121 ki!) hsíi-kun!,hypn,casKdhel NalTel (79 kb) v ™ Coroico (1S9 kb) tae&OSS PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Transposons shape phenotypes of maize EZSTS^ ■ ■ ■ J ■ biologii - Týden 1 kernels Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Transposons shape phenotypes of qrape EZSTS^ I II ■» ■ Ol biologii - Týden 1 varieties Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče 1— Nature Reviewsl Genetics Získávání experimentálních dat o genomu PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 ► organizace (konfokální a elektronová mikroskopie) ► sekvenace ► mapování metylace, nukleozomů ► měření transkripce (RNA-Seq, DNA čipy) ► identifikace regulačních sekvencí (Chip-Seq) ► funkce genů - podrobný výzkum Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče In silico anotace sekvence genomu PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče ► predikce genů (např. GeneMark) ► homologie (zjišťování podobnosti sekvencí) (BLAT, MUMMER, BLAST) ► identifikace opakování (např. RepeatMasker, LTR Finder) Outline PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče UCSC Genome Browser PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Location Edit View Bookmarks Tools Settings Help O 1 Ö O ÍŠ) O ^ f Ü id=7335aB21S,knawnGene=fulí|^j (jjj (j ^| Wí Human chr5:70,256,524-70,29.. Home Genomes Blat Tables Gene Sorter PCR DNA Convert PDF/PS Help UCSC Genome Browser on Human Mar. 2006 Assembly move | <« P^RI * n^T^^n ?o°mml 1.5k] 3n[ 10k | base | ;,oom out | 1.5k |1>T| □sition/search fčhr5:70,256,524-70,284,592 11 jump | clear" slze 28irj69 bp, [ configure UCSC Known Genes Based on UniProtj RefSeti, and GenBsnk mRHň 5MN1 i from GenBsnl Spiiceů E5Ts | http://genorne.ucsc.edu/cgi-bin/hgc?hgsid=733...523&r=70284592&db=rigl86ipi5<=620 Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeči Ensembl Genome Browser PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 D9S2137 □9 S9 74 D9S342 D3S1748 D95IGÜ4 □33956 D3S160 □93175 > LCBorf53 LCDKN2A LCDKM2 I- leii;i'3' I Known Proteincoding ■/e-ip hiauam Rrtative Processed transcript Ivega Haiíara Krawn Proteincodirg RNAPseudogsnsťNowl) BEST gene Haiiana Krown Proleínmdíng Vega Havana Processed pseudogene Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeči D « — PB051 Výpočetní metody v [j lOWSG bio inform atice a systémové biologii - Týden 1 GBrowse view of the Pto DC3000 region near PSPTO_1375 PSPT0_1371 fill proteins uith links to NCBI type III effector HepNl tupe- III iTť.ťpgřŤfl Putative orthologs i Putative orthologs i Putative orthologE i orthologs i Pseudononas aeruginosa PH14 Pseudononas fluorescens Pf-5 Pseudononas putida KT2448 i^~..J.:.;C 1 function IPF01S7 Putative ortholog Psyr_1187 P3P?K.125:' type III chaperon PSPPH_126a Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeči Argo PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 DecodeMe Browser PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Golden Helix Genome Browser PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 : PEotof Column CorrfTrend Jog 10 P from fcwcfahVm Twt* foddlll^ ModeL) [311\ fife Vt™ He)p - 0Ú9«f CÍápífs s EIL Con/ífeiin-liigMP-vak* ß l£ Cwr/Treini +13IO P; &f |vj ^ CwT/rrení -togM P; chr smoůdTí filtr uk SI IB ii_LJ Cuirwl Hstory User ňr»»aiMo SH>_ů-23W* t i b i Corr/Trend -loglO P-value ■ Corc/Trend -toqlQ-P: dv -1 ■ íLwtjTtokI -bal0P:cY»2 ■ Cerpend *{ 10 =t dir - 3 ■ . y ) rvi ». c- - {Jre:i3.;afl4M chra:&q',fl53iM öira:9i'.4Zia«i OirB:i^7.9SM Known GriK Annotation i! mni li i ■ nil li! h:i M.I 111 I II II 111 iii nut i umí i i li hi Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeči IGB PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 JGI Browser PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 ;scaffold_1:1-100000 App!y I Q AA Fit PHA J 'j* Permalirik S%,Add custom tracks + Sll.lll.l "i* Size: 100000 Feature: JAM_UserModels:522 ■LWSi-3! 'O' ''-i! íiiViMl 50ft«)l 0it)ťi«l r-.iíi!'01 -iii'i)! 5 Tom.iěs Iii s'.-afT&ias 1 •i jüiöl tr-enscriEits in c:ai manu.iL II, curatfd » um ni ■ aay7_ESTs Blat. HHII HUHU1' II 'II HI I 1 * tDNA-BaseJ wisWía Informace o kurzu Struktura genomu Dynamika genomu Genomové data prohlížeče RIKEN Genome Browser PB051 Výpočetní metody v bio informatice a systémové biologii - Týden 1 Alf ->G»tn Eetřchpjftí Li FAHlUtlj Im F.v,-.,-: Ll.ř, 0' lJ il'L u Enmrlm^ťiaiTV— 'gUo-u FhttaqDtU BbJ^lniF^H'HijtL,-. ......■ IT I iitUiv I VOM CME UltHM L