Zpracování informací a vizualizace v chemii (C2150) 1. Úvod, databáze molekul ● Přednášející: Martin Prokop ● Email: martinp@chemi.muni.cz ● Pracovna: INBIT/2.10 (v dubnu/květnu přesun do A4) ● Spoluautor přednášek: Zdeněk Kříž ● Web předmětu: ncbr.chemi.muni.cz/~martinp/C2150 ● Účast na cvičeních je povinná ● Nepřítomnost může být omluvena pouze prostřednictvím studijního oddělení (omluva musí být zanesena v informačním systému MU) ● Podmínky pro udělení kolokvia: ● účast na cvičeních ● odevzdané úlohy ze cvičení ● odevzdaný závěrečný projekt Organizační pokyny 3 Osnova kurzu ● Strukturní databáze molekul a jejich prohledávání ● Validace struktur získaných z databází a příprava dat pro molekulové modelování – program WHAT IF a jeho WWW server ● Vizualizace molekul pomocí programu VMD, vizualizace trajektorií molekulové dynamiky ● Zpracování dat a jejich vizualizace pomocí grafů (xmgrace) ● Program TRITON – možnosti vizualizace a aplikace v molekulovém modelování ● Vizualizace molekul v ostatních programech – Chimera, PyMol ● Převod 2D zobrazení molekul do 3D a naopak ● Příprava grafických prezentací (Open Office, PovRay, Inkscape) 4 Databáze molekul ● Metody pro získání 3D struktury molekul lze rozdělit na: ● Experimentální metody (rengenová krystalografie, NMR, elektronová mikroskopie) ● Molekulové modelování ● Struktury získané experimentálními metodami (někdy i molekulovým modelováním) se ukládájí do databází aby byly přístupné i ostatním uživatelům Databáze malých molekul: ● Cambridge Structural Database - CSD (struktury z rentgenové krystalografie) ● Inorganic Crystal Structure Database - ICSD ● Glyco3D Database (zaměřená na cukry) ● 3Dchem database Databáze biopolymerů (proteiny, DNA, RNA ): ● Protein Data Bank – PDB ● Nucleic Acid Database – NDB 5 Jak hledat v databázi ● Znám název molekuly, nebo její sumární vzorec ● U malých molekul znám jejich SMILES kód (CCO – ethanol, c1CCCCc1 – cyklohexan a pod) ● CSD umí hledat podle funkčních skupin (umožňuje přes grafické rozhraní nakreslit vzorec) ● NDB databáze – hledání podle sekvence bazí ● PDB umožňuje několikastupňové prohledávání 6 Cambridge Structural Database - CSD Dostupnost do CSD: ● Komerční licence ● Na MU dostupná na serveru xray.chemi.muni.cz (nutné zřídit účet – doc. Marek Nečas) Co ukládá CSD: ● Data o organických molekulách ● Data o komplexech kovů s organickými molekulami Jakými metodami jsou získávána data: ● RTG krystalografie ● Monokrystalů ● Prášková difrakce Co v CSD nenajdeme: ● Data o polypeptidech, polysacharidech a oligonukleotidech ● Data o anorganických molekulách 7 Cambridge Structural Database - CSD 8 Cambridge Structural Database - CSD 9 Cambridge Structural Database - CSD 10 Inorganic Crystal Structure Database - ICSD ● Dostupná na adrese: www.fiz-karlsruhe.de/icsd.html ● ICSD obsahuje více než 166000 záznamů Co najdeme v ICSD: ● Krystalové struktury prvků ● Krystalové struktury binárních sloučenin ● Krystalové struktury složitějších anorganických sloučenin 11 Protein Data Bank - PDB ● Dostupná na adrese: www.pdb.org 12 Protein Data Bank - PDB ● Dostupná na adrese: www.pdb.org 13 Protein Data Bank - PDB Počet struktur: 88500 ● 77975 – RTG ● 9862 – NMR ● 508 – EM Proteiny/NA/komplexy ● 81922 – protein ● 2500 – DNA/RNA ● 4057 – komplexů 14 Rentgenová krystalografie ● Velmi detailní informace o struktuře molekul ● Pro rigidní systémy nejkvalitnější informace ● U flexibilních systémů někdy špatně rozeznatelné části ● O kvalitě struktury hovoří rozlišení a R-faktor. 15 Rentgenová krystalografie - rozlišení 16 Nukleární magnetická rezonance - NMR ● Struktura v roztoku, ne v pevné fázi. ● Možnost studia flexibilních systémů. ● Výsledkem je set konformací molekuly, který splňuje experimentální kriteria. ● V databázi naleznete jak set 10, 30 , 50 struktur, tak tzv. průměrnou strukturu. 17 Elektronová mikroskopie - EM ● Struktura velkých komplexů ● Samostatně neumožňuje atomární rozlišení, proto se kombinuje s dalšími metodami 26 NDB - prohledávání ● Dostupná na adrese: ndbserver.rutgers.edu/ 27 NDB - prohledávání 28 NDB - prohledávání 29 NDB - prohledávání 30 NDB - prohledávání 31 Glyco3D databáze ● Dostupná na adrese: glyco3d.cermav.cnrs.fr 32 Glyco3D databáze 33 Glyco3D databáze 34 Glyco3D databáze 35 Practical Structural Databases ● Webová adresa: xray.bmc.uu.se/embo/structdb/links.html 36 Úkoly ● Nalezněte v PDB databázi struktury amyloid beta peptidu, vygenerujte report, kerý bude obsahovat: pdb kód, způsob určení 3D dat, rozlišení, biologický zdroj amyloidu. ● Zjistěte kolik struktur je v současné době uloženo v PDB databázi, kolik je určeno pomocí X-ray, NMR a EM. Kolik struktur bylo v databázi uloženo v letech 2010, 2005 a 2001. Pro vyhledání těchto iformaci použijte Advanced Search. ● Úkoly odevzdejte do odevzdávárny