Úvod do chemoinformatiky Radka Svobodová 14.10.20222 Proč nahrazovat nebo doplňovat experiment výpočtem? • Vyhneme se práci s toxickými, výbušnými a radioaktivními látkami • Můžeme pracovat i s nestabilními látkami • Ušetříme náklady za chemikálie a za realizaci experimentu • Ušetříme čas experimentálním chemikům :-) • ... 14.10.20223 Chemoinformatika „Chemoinformatika využívá informatických a algoritmických přístupů pro řešení chemických problémů. Převážně se zaměřuje na získání informací z databází malých nebo středně velkých molekul (léků, organických látek, ...).“ Vzniká v devadesátých létech dvacátého století. Rozvoj spojen s dostupností velkého množství dat o molekulách léků apod. a s potřebami farmaceutického průmyslu 14.10.20224 Bioinformatika „Bioinformatika je aplikací statistických a výpočetních metod v oblasti molekulové biologie a genetiky. Převážně se specializuje na zpracování dat z databází biomolekul (sekvence DNA, RNA a proteinů).“ Vzniká v osmdesátých létech dvacátého století. Rozvoj spojen s dostupností nadkritického množství dat o biomolekulách. Specializace: • Strukturní bioinformatika • Sekvenční bioinformatika, NGS . 14.10.20225 Jak zapsat molekulu v počítači? • Zjistit, které informace molekulu popisují • Zapsat je do počítače 14.10.20226 Které informace popisují molekulu? Počty atomů? 14.10.20227 Které informace popisují molekulu? Počty atomů? Málo Počty atomů a umístění vazeb? 14.10.20228 Které informace popisují molekulu? Počty atomů? Málo Počty atomů a umístění vazeb? Lepší Počty atomů, umístění vazeb a poloha atomů v prostoru? Ano 14.10.20229 Model molekuly pro počítačové zpracování Atomy: Body v prostoru U každého uveden chemický symbol prvku Vazby: Dvojice atomů, které jsou vázány Násobnost vazby 14.10.202210 Zápis molekuly v počítači První tři čísla jsou x, y a z souřadnice atomů Počet vazeb První atom je uhlíkPočet atomů První vazba je mezi atomy 1 a 2 a jde o dvojnou vazbu 11 Kvízová otázka: Nakresli tuto molekulu. Jak se daná molekula jmenuje? 14.10.2022 Současné databáze molekul Prožíváme „informační boom“ v oblasti dat o molekulách Důvod: Vysoce výkonné techniky strukturní analýzy Důsledky: ▪ Máme k dispozici miliony struktur malých molekul (organické molekuly, léky, ...) ▪ Známe struktury více než 190 000 proteinů a více než 100 000 000 organických molekul ▪ Jsme schopni zjistit informaci o genomu jednoho člověka za pár dnů Většina těchto informací je veřejně přístupná :-) 14.10.2022 DrugBank – ukázka databáze léků 14.10.2022 DrugBank – ukázka databáze léků PubChem – ukázka databáze organických molekul 14.10.2022 PubChem – ukázka databáze organických molekul 14.10.2022 Ligand Expo – ukázka databáze ligandů 14.10.2022 Ligand Expo – ukázka databáze ligandů 14.10.202219 Vizualizace malé molekuly v počítači Drátový model: Kalotový model (CPK): Tyčinkový model: Tyčinky a kuličky: Protein Data Bank – zdroje dat 20 10% NMR spektroskopie 1% kryo-elektronová mikroskopie 89% Rentgenová krystalografie ... ATOM 46 C GLY A 70 51.536 23.360 40.507 ATOM 47 O GLY A 70 50.947 22.279 40.325 ATOM 48 N ILE A 71 50.965 24.532 40.270 ATOM 49 CA ILE A 71 49.595 24.644 39.786 ... 3D struktura Protein Data Bank 21 > 190 000 biomacromolecular structures 14.10.2022 Protein Data Bank – ukázka databáze proteinů 14.10.2022 Protein Data Bank – ukázka databáze proteinů 14.10.202224 Vizualizace biomolekuly v počítači Cartoon model: Schématický model: 14.10.202225 Chemoinformatika – hlavní oblasti • Podobnostní vyhledávání v databázích • Výpočty a aplikace deskriptorů • QSAR / QSPR • Vytváření a aplikace virtuálních knihoven molekul • Virtuální screening 14.10.202226 Proces návrhu a vývoje léku Uvedení nového léku na trh stojí v průměru 900 milionů dolarů a trvá více než 10 let. Farmaceutické společnosti často zkoumají a testují 10 000 – 30 000 rozličných látek předtím, než je jedna z nich úspěšně uvedena na trh. Látky jsou nejdříve navrženy v základním výzkumu. Poté musí projít předklinickými a klinickými zkouškami. Většina nepostoupí dále, ale ty, které postoupí, mohou nabídnout šanci na kvalitnější život pacientů. 14.10.202227 Proces návrhu a vývoje léků Návrh nových molekul léků a výběr nejvhodnějších Preklinické testy (bakterie, tkáňové kultury, zvířata) Klinické testy (pacienti) > 10 000 molekul ~ 250 molekul ~ 5 mol. 1 nový lék na trhu 5-7let Chemoinformatika je klíčová při výběru nejvhodnějších kandidátů. Umožňuje totiž predikci vlastností nově navržených molekul léků. Nejdražšíčást (miliardydolarů) Čím sofistikovanější je výběr nejvhodnějších kandidátů, tím efektivnější a levnější je celý proces. 14.10.202228 Návrh léku (drug design) Známé léky Nově navržené léky 14.10.202229 Návrh léku (drug design) 14.10.202230 Návrh léku (drug design) Na základě několika známých molekul léků můžeme vytvořit (ručně nebo automaticky) rozsáhlé sady molekul. Tyto sady se nazývají virtuální knihovny a obsahují desetiticíce, staticíce i miliony molekul. Několik z molekul ve virtuální knihovně může být velmi účinnými léky. Ale které to jsou ??? 14.10.202231 Jak zjistit, která z navržených molekul je lékem? Navržené molekuly existují jen na papíře nebo v počítači a nebyly zatím syntetizovány. Nemáme tedy naměřeny jejich fyzikální a chemické vlastnosti ani nevíme nic o jejich aktivitě. Jak tedy určit, která z nich bude vhodným lékem? Máme dvě možnosti: a) Molekuly synetizovat a jejich vlastnosti i aktivitu změřit. b) Vlastnosti i aktivitu molekul odhadnout (predikovat) na základě jejich struktury. Chemoinformatika 14.10.202232 Orgranizace výuky Přednáška + praktická cvičení Prosím, noste si notebooky Občas nepovinné úkoly – možnost získat procenta navíc Ukončení předmětu: Písemka • Teoretické otázky • Příklady a cvičení Povoleny všechny materiály 14.10.202233 Orgranizace výuky 2 Klasifikace: <100%, 90%>: A (90%, 80%>: B (80%, 70%>: C (70%, 60%>: D (60%, 50%>: E (50%, 0%>: F