C7790 Počítačová chemie a molekulové modelování -1- 3. Struktura C7790 Počítačová chemie a molekulové modelování I C7800 Počítačová chemie a molekulové modelování I - cvičení Petr Kulhánek kulhanek@chemi.muni.cz Národní centrum pro výzkum biomolekul, Přírodovědecká fakulta Masarykova univerzita, Kotlářská 2, CZ-61137 Brno C7790 Počítačová chemie a molekulové modelování -2Obsah - přednáška  Výpočetní chemie definice, výpočetní chemie versus experiment, přehled řešených projektů, experimentální metody s atomárním a jednomolekulárním rozlišením  Kvantová mechanika I stručný úvod, Bornova-Oppenheimerova aproximace, koncept hyperploch potenciální energie, stručný přehled metod pro výpočet potenciální energie  Struktura struktura, vizualizace, formáty, typy souřadnic (interní, kartézské)  Plochy potenciální energie I definice, stacionární body, jejich charakterizace a význam, optimalizační metody, lokální a globální minima  Kvantová mechanika II volná částice, tuhý rotátor, harmonický oscilátor, atom vodíku, variační a poruchové metody, Hartree-Fockova metoda, semiempirické metody  Plochy potenciální energie II reakční cesty a konformační přeměny, reakční koordináta, hledání tranzitních stavů, vztah potenciální energie k termodynamickým veličinám, primární a sekundární izotopový efekt  Molekulová mechanika I silová pole, vazebné a nevazebné interakce, dalekodosahové interakce, bodové náboje, přehled silových polí  Molekulová dynamika vývoj systému v čase, pohybové rovnice, přehled integračních metod, vlastnosti systému, termostaty, barostaty  Kvantová mechanika III post-HF metody (MPx, CC), CBS, DFT metody, korekce disperzních interakcí, BSSE  Molekulová mechanika II dalekodosahové interakce, modelování rozpouštědel, polarizovatelná silová pole C7790 Počítačová chemie a molekulové modelování -3Konfigurační prostor )(RE R = bod v 3N rozměrném prostoru (N je počet atomů) },,,....,,,,,,{ 222111 NNN zyxzyxzyxR kartézské souřadnice prvního atomu Jednotlivé body tvoří konfigurační prostor. Každý bod v konfiguračním prostoru pak představuje unikátní strukturu daného systému. C7790 Počítačová chemie a molekulové modelování -4Modely – malé molekuly čárový model tyčinkový model CPK model vdW model stejná struktura jiná vizualizace C7790 Počítačová chemie a molekulové modelování -5Modely – biomolekuly čárový model čárový model páteř proteinu cartoon model povrch biomolekuly stejná struktura jiná vizualizace Různé modely slouží k zvýraznění určité strukturní informace nebo vnitřní vlastnosti molekuly či uskupení molekul, které pak usnadňuje snadnější pochopení studovaného problému. C7790 Počítačová chemie a molekulové modelování -6Hrubozrné modely Pustit video! C7790 Počítačová chemie a molekulové modelování -7Počítačová reprezentace struktury Strukturu lze reprezentovat různým způsobem. V chemii se používá více jak 100 formátů. počet atomů komentář značka x y z značka x y z ................... značka x y z 24 chorismate C -1.86100 -0.57700 0.31800 O -2.56800 0.47600 0.32600 O -2.20900 -1.75300 0.64200 C -0.38900 -0.41000 -0.18800 ................................................ H -0.50900 1.67900 -0.44800 Formát xyz je textový soubor s volným formátováním (hodnoty ve sloupcích mohou být odděleny libovolným počtem mezer nebo jiných bílých znaků). Formát XYZ polohy jsou v angstroemech(Å) C7790 Počítačová chemie a molekulové modelování -8Džungle formátů I acr -- ACR format adf -- ADF cartesian input format adfout -- ADF output format alc -- Alchemy format arc -- Accelrys/MSI Biosym/Insight II CAR format bgf -- MSI BGF format box -- Dock 3.5 Box format bs -- Ball and Stick format c3d1 -- Chem3D Cartesian 1 format c3d2 -- Chem3D Cartesian 2 format cac -- CAChe MolStruct format caccrt -- Cacao Cartesian format cache -- CAChe MolStruct format cacint -- Cacao Internal format can -- Canonical SMILES format. car -- Accelrys/MSI Biosym/Insight II CAR format ccc -- CCC format cdx -- ChemDraw binary format cdxml -- ChemDraw CDXML format cht -- Chemtool format cif -- Crystallographic Information File ck -- ChemKin format cml -- Chemical Markup Language cmlr -- CML Reaction format com -- Gaussian 98/03 Input copy -- Copies raw text crk2d -- Chemical Resource Kit diagram(2D) crk3d -- Chemical Resource Kit 3D format csr -- Accelrys/MSI Quanta CSR format cssr -- CSD CSSR format ct -- ChemDraw Connection Table format cub -- OpenDX cube format for APBS cube -- OpenDX cube format for APBS dmol -- DMol3 coordinates format dx -- OpenDX cube format for APBS ent -- Protein Data Bank format fa -- FASTA format fasta -- FASTA format fch -- Gaussian formatted checkpoint file format fchk -- Gaussian formatted checkpoint file format fck -- Gaussian formatted checkpoint file format feat -- Feature format fh -- Fenske-Hall Z-Matrix format fix -- SMILES FIX format fpt -- Fingerprint format fract -- Free Form Fractional format fs -- FastSearching fsa -- FASTA format g03 -- Gaussian98/03 Output g92 -- Gaussian98/03 Output g94 -- Gaussian98/03 Output g98 -- Gaussian98/03 Output gal -- Gaussian98/03 Output gam -- GAMESS Output gamin -- GAMESS Input gamout -- GAMESS Output C7790 Počítačová chemie a molekulové modelování -9Džungle formátů II gau -- Gaussian 98/03 Input gjc -- Gaussian 98/03 Input gjf -- Gaussian 98/03 Input gpr -- Ghemical format gr96 -- GROMOS96 format gukin -- GAMESS-UK Input gukout -- GAMESS-UK Output gzmat -- Gaussian Z-Matrix Input hin -- HyperChem HIN format inchi -- InChI format inp -- GAMESS Input ins -- ShelX format jin -- Jaguar input format jout -- Jaguar output format k -- Compare molecules using InChI mcdl -- MCDL format mcif -- Macromolecular Crystallographic Information mdl -- MDL MOL format ml2 -- Sybyl Mol2 format mmcif -- Macromolecular Crystallographic Information mmd -- MacroModel format mmod -- MacroModel format mol -- MDL MOL format mol2 -- Sybyl Mol2 format molden -- Molden input format molreport -- Open Babel molecule report moo -- MOPAC Output format mop -- MOPAC Cartesian format mopcrt -- MOPAC Cartesian format mopin -- MOPAC Internal mopout -- MOPAC Output format mpc -- MOPAC Cartesian format mpd -- Sybyl descriptor format mpqc -- MPQC output format mpqcin -- MPQC simplified input format msi -- Accelrys/MSI Cerius II MSI format msms -- M.F. Sanner's MSMS input format nw -- NWChem input format nwo -- NWChem output format outmol -- DMol3 coordinates format pc -- PubChem format pcm -- PCModel Format pdb -- Protein Data Bank format png -- PNG files with embedded data pov -- POV-Ray input format pqr -- PQR format pqs -- Parallel Quantum Solutions format prep -- Amber Prep format qcin -- Q-Chem input format qcout -- Q-Chem output format report -- Open Babel report format res -- ShelX format rsmi -- Reaction SMILES format rxn -- MDL RXN format sd -- MDL MOL format sdf -- MDL MOL format C7790 Počítačová chemie a molekulové modelování -10Džungle formátů III smi -- SMILES format smiles -- SMILES format sy2 -- Sybyl Mol2 format t41 -- ADF TAPE41 format tdd -- Thermo format test -- Test format therm -- Thermo format tmol -- TurboMole Coordinate format txt -- Title format txyz -- Tinker MM2 format unixyz -- UniChem XYZ format vmol -- ViewMol format xed -- XED format xml -- General XML format xtc -- XTC format xyz -- XYZ cartesian coordinates format yob -- YASARA.org YOB format zin -- ZINDO input format Výše uvedené formáty obsahují většinou kromě 3D/2D struktury také doprovodné informace jako jsou konektivita, parametry silových polí, náboje, různé vlastnosti apod. C7790 Počítačová chemie a molekulové modelování -11- OpenBabel Konverze programem openbabel: $ module add openbabel $ babel input.xyz output.mol2 Seznam podporovaných formátů: $ babel -L formats http://openbabel.org/wiki/Main_Page Open Babel is a chemical toolbox designed to speak the many languages of chemical data. It's an open, collaborative project allowing anyone to search, convert, analyze, or store data from molecular modeling, chemistry, solid-state materials, biochemistry, or related areas. C7790 Počítačová chemie a molekulové modelování -12- 2D versus 3D struktura 2D struktura obsahuje informaci o atomech a vazbách, kterými jsou spojeny. Tato informace popisuje konstituci (topologii) systému. 3D struktura obsahuje informaci o prostorovém rozmístění atomů. Ostatní informace (např. vazby) jsou dopočitatelné. kyselina benzoová C7790 Počítačová chemie a molekulové modelování -13- 3D -> 2D převod 2D struktura obsahuje informaci o atomech a vazbách, kterými jsou spojeny. Tato informace popisuje konstituci (topologii) systému. 3D struktura obsahuje informaci o prostorovém rozmístění atomů. Ostatní informace (např. vazby) jsou dopočitatelné. převod je snadný kyselina benzoová C7790 Počítačová chemie a molekulové modelování -14- 2D -> 3D převod 2D struktura obsahuje informaci o atomech a vazbách, kterými jsou spojeny. Tato informace popisuje konstituci (topologii) systému. 3D struktura obsahuje informaci o prostorovém rozmístění atomů. Ostatní informace (např. vazby) jsou dopočitatelné. převod je komplikovaný kyselina benzoová C7790 Počítačová chemie a molekulové modelování -15- 2D -> 3D převod 2D struktura obsahuje informaci o atomech a vazbách, kterými jsou spojeny. Tato informace popisuje konstituci (topologii) systému. 3D struktura obsahuje informaci o prostorovém rozmístění atomů. Ostatní informace (např. vazby) jsou dopočitatelné. převod je komplikovaný u velkých systémů nemusí být jednoznačný v důsledku existence více konformerů kyselina benzoová C7790 Počítačová chemie a molekulové modelování -16- 2D -> 3D převod, komplikace cyklohexan židličková konformace konformace zkřížená vanička C7790 Počítačová chemie a molekulové modelování -17- 2D -> 3D převod, komplikace zavřená forma enzymu otevřená forma enzymu Stejná primární struktura (sekvence aminokyselin). C7790 Počítačová chemie a molekulové modelování -18Využití 2D struktur Representace molekul ve 2D formátech se využívá převážně pro ukládání informací do databází a jejich prohledávání, dále k předpovědi chemických vlastností molekul pomocí chemoinformatických přístupů. Nejrozšířenější formáty:  SMILES (Simplified molecular-input line-entry system)  InChI (IUPAC International Chemical Identifier) kyselina benzoová C(=O)(O)c1ccccc1 InChI=1S/C7H6O2/c8-7(9)6-4-2-1-3-5-6/h1-5H,(H,8,9) C7790 Počítačová chemie a molekulové modelování -19Zdroje 3D struktur Experimentální metody  struktury určení pomocí rentgenové strukturní analýzy Cambridge Structural Database (CSD) http://www.ccdc.cam.ac.uk/Solutions/CSDSystem/Pages/CSD.aspx Protein Data Bank (PDB) http://www.pdb.org  struktury určené pomocí NMR Protein Data Bank (PDB) http://www.pdb.org C7790 Počítačová chemie a molekulové modelování -20Zdroje 3D struktur Experimentální metody  struktury určení pomocí rentgenové strukturní analýzy Cambridge Structural Database (CSD) http://www.ccdc.cam.ac.uk/Solutions/CSDSystem/Pages/CSD.aspx Protein Data Bank (PDB) http://www.pdb.org  struktury určené pomocí NMR Protein Data Bank (PDB) http://www.pdb.org Výpočetní metody  molekulové modelování  homologní modelování C7790 Počítačová chemie a molekulové modelování -21Programy pro vytváření/vizualizaci 3D struktur http://en.wikipedia.org/wiki/List_of_molecular_graphics_systems Avogadro http://avogadro.openmolecules.net/wiki/Main_Page Program pro stavbu a vizualizaci molekul. Volně dostupný pro MS Windows a Linux. VMD http://www.ks.uiuc.edu/Research/vmd/ Program pro vizualizaci molekul. Po bezplatné registraci dostupný pro MS Windows a Linux. NEMESIS https://lcc.ncbr.muni.cz/whitezone/development/nemesis/ Program pro stavbu a vizualizaci molekul. Ve vývoji.