Strukturní biochemie Skripta k přednášce C9530 Přírodovědecké fakulty Masarykovy univerzity Lukáš Žídek Na přípravě se podíleli Jiří Damborský, Eva Fadrná, Jaromír Marek, Markéta Munzarová, Pavel Plevka 15. prosince 2023 ii Obsah I Procházka ZOO struktur 1 1 Struktura v chemii a biochemii 3 1.1 Konfigurace a konformace................................... 3 1.2 Geometrický popis molekul.................................. 4 1.3 Definice torzního úhlu..................................... 7 2 Struktura proteinů 9 2.1 Proteiny jako příklad biomakromolekul............................ 9 2.2 Stavební jednotky ....................................... 9 2.3 Torzní úhly........................................... 12 2.4 Primární struktura....................................... 14 2.5 Sekundární struktura...................................... 15 2.6 Struktura alfa.......................................... 15 2.7 Struktura beta......................................... 17 2.8 Terciární struktura....................................... 19 2.9 Spojovací prvky......................................... 20 2.10 Hierarchie v rámci terciární struktury ............................ 23 2.11 Alfa-proteiny.......................................... 23 2.12 Beta-proteiny.......................................... 28 2.13 Alfa+beta-proteiny....................................... 38 2.14 Alfa/beta-proteiny....................................... 38 2.15 Uspořádané proteiny bez sekundární struktury....................... 41 2.16 Kvarterní struktura a vyšší struktury............................. 41 3 Struktura nukleových kyselin 45 3.1 Stavební jednotky ....................................... 45 3.2 Torzní úhly........................................... 47 3.3 Primární struktura....................................... 48 3.4 Sekundární struktura...................................... 48 3.5 Terciární struktura....................................... 51 3.6 Kvarterní struktura a vyšší struktury............................. 56 4 Struktura oligo- a polysacharidu 57 4.1 Stavební jednotky ....................................... 57 4.2 Torzní úhly........................................... 57 4.3 Primární struktura....................................... 59 4.4 Sekundární struktura...................................... 59 4.5 Terciární struktura....................................... 59 iii iv OBSAH 5 Struktura biologických membrán 63 5.1 Membrány a biomakromolekuly................................ 63 5.2 Stavební jednotky ....................................... 63 5.3 Geometrie lipidových útvarů.................................. 64 5.4 Tekutost membrán....................................... 64 5.5 Vliv polární skupiny...................................... 64 5.6 Vliv hydrofobního řetězce................................... 65 5.7 Vliv složení........................................... 66 5.8 Vyšší struktury......................................... 66 6 Interakce určující strukturu biomakromolekul 67 6.1 Energie a entropie ....................................... 67 6.2 Síly působící v biomakromolekulách ............................. 68 6.3 Kovalentní vazby........................................ 69 6.4 Van der Waalsovy interakce.................................. 70 6.5 Elektrostatické interakce.................................... 71 6.6 Vodíkové vazby......................................... 71 6.7 Stacking............................................. 72 6.8 Karbonylové interakce..................................... 72 6.9 Voda jako rozpouštědlo .................................... 72 6.10 Elektrostatické interakce ve vodě............................... 72 6.11 Vodíkové vazby ve vodě.................................... 75 6.12 Hydrofobní efekt........................................ 76 6.13 Denaturace........................................... 78 6.14 Celková bilance......................................... 78 6.15 Termodynamika a kinetika................................... 81 II Lov struktur 83 7 Úvod do metod strukturní biochemie 85 8 Příprava vzorku biomakromolekul 87 8.1 Izolace z přírodního materiálu................................. 87 8.2 Metody molekulární biologie.................................. 88 8.3 Expresní vektory........................................ 89 8.4 Molekulové klonování ..................................... 90 8.5 Místně řízená mutageneze................................... 91 8.6 Bakteriální exprese....................................... 91 8.7 Purifikace exprimovaných proteinů.............................. 92 8.8 Chemická syntéza peptidů................................... 92 8.9 Chemická syntéza oligonukleotidů............................... 94 8.10 Chemická syntéza oligosacharidů............................... 94 8.11 Enzymová syntéza nukleových kyselin............................ 94 8.12 Enzymová syntéza proteinů.................................. 95 8.13 Enzymová syntéza oligosacharidů............................... 95 OBSAH v 9 Metody určování sekvence 97 9.1 Sekvenace proteinů....................................... 97 9.2 Edmanovo odbourávání.................................... 98 9.3 Sekvenace hmotnostní spektrometrií............................. 98 9.4 Sekvenace nukleových kyselin................................. 99 9.5 Chemická metoda Maxama a Gilberta............................ 101 9.6 Enzymová neboli dideoxymetoda (Sangerova)........................ 101 9.7 Sekvenace oligosacharidů.................................... 103 10 Optické metody 107 10.1 Elektromagnetické vlnění ................................... 107 10.2 Popis elektromagnetického vlnění............................... 108 10.3 Světlo a molekula........................................ 112 10.4 Světlo a krystal......................................... 114 10.5 Světlo a molekuly v roztoku či skle.............................. 118 10.6 Maloúhlový rozptyl Rôntgenova záření (SAXS)....................... 118 10.7 Absorpce ............................................ 120 10.8 Cirkulární dichroismus..................................... 123 10.9 Vibrace jader.......................................... 125 lO.lORamanova spektra....................................... 129 11 Výpočetní metody 131 11.1 Cíl výpočetních metod ve strukturní biochemii ....................... 131 11.2 Modely biomakromolekul ................................... 132 11.3 Molekulová mechanika..................................... 132 11.4 Hyperplocha potenciální energie................................ 134 11.5 Silové pole............................................ 135 11.6 Implicitní a explicitní solvent................................. 135 11.7 Výpočet elektrostatických interakcí.............................. 137 11.8 Hledání lokálního minima energie............................... 137 11.9 Prohledávání plochy potenciální energie........................... 138 11.10Molekulová dynamika...................................... 138 12 Rentgenová krystalografie 141 12.1 Virtuální náhrada mikroskopu................................. 141 12.2 Braggovy roviny ........................................ 143 12.3 Difrakce na krystalu...................................... 145 12.4 Strukturní faktor........................................ 146 12.5 Krystalizace biomakromolekul................................. 147 12.6 Měření difrakce......................................... 149 12.7 Vyhodnocení dat........................................ 150 12.8 Řešení fázového problému................................... 151 12.9 Pattersonova mapa....................................... 152 12.10Metoda molekulárního přemístění............................... 152 12.11 Přímé metody.......................................... 154 12.12Metody izomorfního nahrazení ................................ 154 12.13Metody využívající anomální rozptyl............................. 156 12.14Určení struktury z difrakčních dat .............................. 159 12.15Kontrola správnosti ...................................... 160 vi OBSAH 13 Elektronová mikroskopie 163 13.1 Elektrony jako vlnění...................................... 163 13.2 Konstrukce elektronového mikroskopu............................ 164 13.3 Výhody a nevýhody elektronové mikroskopie ........................ 164 13.4 Optika a rozlišení mikroskopů................................. 166 13.5 Příprava vzorků pro elektronovou mikroskopii........................ 168 13.6 Typy vzorků v elektronovou mikroskopii........................... 170 13.7 Tvorba a zpracování digitálního obrazu ........................... 171 13.8 Amplitudový a fázový kontrast................................ 172 13.9 Poškození vzorku........................................ 176 13.10Porovnávání dvojrozměrných obrazů............................. 176 13.11 Rekonstrukce trojrozměrné struktury biomakromolekul................... 178 14 Nukleární magnetická rezonance 183 14.1 Jádra atomů jako strukturní sondy.............................. 183 14.2 Srovnání NMR a difrakčních metod.............................. 186 14.3 Magnetické chování jader ................................... 186 14.4 Ovlivnění souborů jader vnějším polem ........................... 188 14.5 Excitace............................................. 188 14.6 Interakce jader s nejbližším okolím.............................. 191 14.7 Interakce s magnetickými poli párovaných elektronů.................... 191 14.8 Přímá interakce s magnetickými dipóly sousedních jader.................. 192 14.9 Vliv sousedních jader zprostředkovaný elektrony vazeb................... 194 14.10Spektrometr a experiment NMR ............................... 197 14.11 Vícerozměrná spektroskopie a korelace frekvencí ...................... 198 14.12Postup strukturní analýzy proteinů pomocí NMR...................... 201 14.13Sekvenční přiřazení....................................... 202 14.14Přiřazení postranních řetězců................................. 204 14.15NMR spektra a struktura proteinů.............................. 204 14.16Sekundární struktura...................................... 207 14.17Výpočet konformace proteinu................................. 208 14.18Struktura nukleových kyselin pomocí NMR......................... 210 14.19Struktura oligosacharidů pomocí NMR............................. 214 14.20Pohyby molekul v NMR.................................... 214 14.21 Omezení metody a pokročilé aplikace............................. 215 15 Bioinformatika 217 15.1 Co to je bioinformatika..................................... 217 15.2 Genomové projekty....................................... 217 15.3 Biologické databáze ...................................... 218 15.4 Databáze sekvencí proteinů.................................. 220 15.5 Databáze sekvencí DNA.................................... 221 15.6 Databáze struktur biomakromolekul............................. 222 15.7 Párové přiložení sekvencí (pairwise sequence alignment).................. 223 15.8 Vícenásobné přiložení (multiple sequence alignment).................... 224 15.9 Předpovídání struktury ze sekvence.............................. 226 15.10Předpověď sekundární struktury............................... 226 15.11 Předpověď terciární struktury................................. 226 15.12Srovnání sekvencí a předpověď terciární struktury..................... 228 15.13AlphaFold2........................................... 230 OBSAH vii III Dodatky 233 A Energie různých interakcí................................... 235 A.l Energie dvou nábojů.................................. 235 A.2 Energie náboje a elektrického dipólu v jedné molekule............... 235 A.3 Energie náboje a elektrického dipólu v různých molekulách............ 237 A.4 Energie dvou elektrických dipólů v jedné molekule................. 238 A.5 Energie dvou elektrických dipólů v různých molekulách .............. 242 A.6 Energie náboje a indukovaného elektrického dipólu................. 244 A.7 Energie permamentního a indukovaného elektrického dipólu............ 244 A. 8 Energie dvou indukovaných elektrických dipólů................... 245 B Metody chemické syntézy na pevném nosiči......................... 247 B. l Karbodiimidová metoda syntézy peptidů ...................... 247 B. 2 Fosforamiditová metoda syntézy nukleotidů..................... 247 C Kvantové metody........................................ 248 C. l Kvantová mechanika atomů.............................. 248 C.2 Molekulové orbitaly .................................. 249 C.3 Metody ab initio.................................... 251 C. 4 Semiempirické metody................................. 254 D Peptidová vazba jako příklad chromoforu .......................... 255 D. l Atomové orbitaly.................................... 255 D.2 Hybridní orbitaly.................................... 255 D.3 Molekulové orbitaly .................................. 258 D.4 Energie stavů a vlnové délky přechodů........................ 260 D.5 Tranzitní dipóly a pravděpodobnosti přechodů ................... 261 E Světlo a sekundární struktura................................. 263 F Anomální rozptyl........................................ 264 G Skalární interakce a přiřazení spekter NMR nukleových kyselin.............. 267 OBSAH Část I Procházka ZOO struktur i Kapitola 1 Struktura v chemii a biochemii 1.1 Konfigurace a konformace Chceme-li studovat strukturu biologicky zajímavých látek, musíme se nejdříve dohodnout na tom, co vlastně pojmem struktura myslíme. Chemické látky se skládají z atomů různých prvků. První informací, kterou o neznámé látce můžeme získat, je tedy údaj, kolik atomů jednotlivých prvků molekula látky obsahuje. Například můžeme zjistit, že molekula naší látky obsahuje čtyři atomy uhlíku, dva atomy kyslíku a osm atomů vodíku. Budeme znát složení látky,1 ale stále ještě nebudeme znát strukturu látky. Teprve když zjistíme, které atomy jsou navzájem spojeny kovalentní vazbou,2 můžeme říci, zda zkoumanou látkou je kyselina máselná, 2-buten-l,4-diol, nebo třeba 3-hydroxybutanon. Ani teď však nemusí být jednoznačně dáno, o jakou chemickou látku jde. Předpokládejme, že řekneme, že zkoumaná látka je 2-buten-l,4-diol. Tímto názvem lze ale označit dvě různé chemikálie s různými vlastnostmi. Tyto dvě látky se budou lišit uspořádáním atomů kolem dvojné vazby. Budou-li obě koncové vazby C-C na jedné straně dvojné vazby, půjde o izomer cis (chemicky úplný název látky bude (/Zj-2-buten-l,4-diol), budou-li koncové C-C vazby směřovat na opačné strany, půjde o izomer trans, neboli f£'/)-2-buten-l,4-diol. Pokud by zkoumanou látkou byl 3-hydroxybutanon, měli bychom podobný problém. Museli bychom si vybrat ze dvou molekul, z nichž jedna je zrcadlovým obrazem druhé.3 Úplný chemický popis by tedy byl (Tíj-S-hydroxybutanon nebo (^-3-hydroxybutanon. Způsob vzájemného uspořádání atomů propojených kovalentními vazbami, tak jak jsme jej probírali v předchozích odstavcích, se nazývá konfigurace. Zatímco kyselina máselná se vyskytuje v jediné konfiguraci, 2-buten-l,4-diol a 3-hydroxybutanon mají po dvou různých konfiguracích (obrázek 1.1). Se znalostí konfigurace již umíme popsat molekulu například chemickým vzorečkem (i s vyznačením chirality). Pokud budeme chtít z trubiček a kuliček sestavit model zkoumané látky (jako na obrázku 1.1), třeba kyseliny máselné, potřebujeme znát víc, než jen konfiguraci. Musíme se například rozhodnout, jestli uhlíkový řetězec ohneme tak, aby byla karboxylová kyselina co nejblíže koncovému methylu, nebo jestli bude uhlíkový řetězec připomínat klikový hřídel a karboxylová skupina bude od methylové co nejdále. Konkrétní rozmístění atomů v prostoru se nazývá konformace. Mezi konfigurací a konformací je důležitý rozdíl. Konformaci našich molekul můžeme měnit pouhým otáčením kolem kovalentních 1 Chemici často mluví o kompozici látky. 2Informace udávající pouze to, které atomy jsou spojeny, se nazývá konektivita. Chemika ovšem zajímá i to, zda jde o vazbu jednoduchou nebo dvojnou. Chemický popis atomů a vazeb v molekule se nazývá konstituce. 3Učeně řečeno, jde o antipody, tedy enantiomery s opačnou chiralitou. Takové látky se liší směrem, kterým stáčí rovinně polarizované světlo. 3 4 KAPITOLA 1. STRUKTURA V CHEMII A BIOCHEMII Obrázek 1.1: Molekuly kyseliny máselné, (^-2-buten-l,4-diolu, fE)-2-buten-l,4-diolu, (Tí^-3-liydroxybutanonu a ^-3-liydroxybutanonu. vazeb, zatímco ke změně konfigurace je třeba kovalentní vazbu přerušit a vytvořit novou.4 Konfigurace a konformace hrají důležitou roli v rozdílech chápání pojmu určení struktury v kontextu malých a velkých molekul. Pokud izolujeme z přírodního zdroje nějakou nízkomolekulární látku (tedy látku, jejíž molekuly se skládají z desítek atomů), například antibiotikum, musíme především určit konfiguraci této látky. Určování konformace je v takovém případě okrajová záležitost. U malých molekul, jako je kyselina máselná, jsou rotace kolem vazeb tak snadné a rychlé, že nemá většinou smyslu o jednotlivých konformerech mluvit. Složitější molekuly se sice vyskytují v jedné či více z několika jasně definovaných konformací, určení těchto konformací ale stále představuje jednodušší část určování struktury. Určováním struktury malých molekul se tedy myslí především určování konfigurace. Situace je zcela odlišná, pokud izolujeme z přírodního zdroje makromolekulu, například protein. Biomakromolekuly se skládají z několika málo druhů monomerních jednotek, jejichž konfigurace je dobře známá. Stačí tedy určit pořadí (sekvenci) těchto stavebních jednotek, a budeme znát konfiguraci celé makromolekuly. Určování sekvence je dnes poměrně snadné, zvlášť u nukleových kyselin a proteinů. U velkých molekul je ale velmi důležité určit konformací. Otáčení kolem některých vazeb je totiž velmi ztíženo, ba téměř znemožněno, zbytkem makromolekuly. K tomu, abychom získali představu o tvaru molekuly, musíme zjistit, v které konformací jsou uvězněny ty vazby, kolem kterých nemůžeme otáčet. Určováním struktury biomakromolekul se proto myslí především určování konformace. A to je úkol obtížný. 1.2 Geometrický popis molekul Z matematického pohledu k určení propojení atomů stačí znát topologii5 molekuly, zatímco určení konformace vyžaduje znalost přesné geometrie. Pokud jsme si v předchozím odstavci řekli, že určování struktury biomakromolekul je vlastně popis jejich konformace, musíme se nejprve seznámit s geometrickým popisem molekul. Geometrie nám umožňuje vytvořit zjednodušený obraz molekul, tedy jejich model (zde slovo „model" znamená opravdu to, co si pod ním zpravidla představíme). Pro potřeby strukturní biochemie většinou stačí považovat atomy za body v prostoru a chemické vazby za úsečky, které body spojují. Uvědomme si, že k vytvoření modelu nestačí znát pouze polohy všech atomů, ale musíme také vědět, mezi kterými atomy je kovalentní vazba (musíme určit topologii molekuly). Polohu atomů v prostoru můžeme určit několika způsoby. Prvním způsobem, který nás asi napadne, 4V některých případech není ke změně konfigurace třeba přerušenit kovalentní vazbu, ale pouze deformovat vazebné úhly, tento detail není ale pro pochopení pojmu konformace zásadní. 5Topologie popisuje vlastnosti geometrických útvarů, které se nemění, když geometrický útvar vystavíme pružné deformaci (natažení nebo zkroucení), která je homeomorfní (každému bodu útvaru před deformací odpovídá jeden bod útvaru po deformaci). Zjednodušeně řečeno, topologie popisuje kvalitativní vlastnosti, zatímco geometrie udává kvantitativní míry. Oblíbeným příkladem rozdílu mezi topologií a geometrií je problém lajnování tenisového hřiště. Topologie nám pomůže vyřešit otázku, jestli lze hřiště nalajnovat jedním tahem, a pokud ne, kolikrát budeme muset lajnovačku přenést. Geometrie nám řekne, jak dlouhé musí jednotlivé čáry být a že spolu musí svírat úhel 90°. 1.2. GEOMETRICKÝ POPIS MOLEKUL Z M 5 X Obrázek 1.2: Kartézská souřadná soustava. Osa x míří k nám, osa y doprava, osa z nahoru. je udat souřadnice x, y, z každého atomu v obvyklé kartézské souřadné soustavě6 (obrázek 1.2). Tento způsob používá například databáze struktur PDB (Protein Data Bank), jak ukazuje příklad na obrázku 1.3. Pro popis modelu molekuly, která je tvořena N atomy, potřebujeme 3N souřadnic. ATOM 1 0 WAT 0 ATOM 2 Hl WAT 0 ATOM 3 H2 WAT 0 Obrázek 1.3: Soubor popisující polohy atomů vody ve formátu, který používá PDB (souřadnice jsou uvedeny v posledních třech sloupcích v jednotkách ángstrôm, což je desetina nanometru). Výhoda kartézských souřadnic je v tom, že je můžeme přímo a jednoduše použít k zobrazení modelu molekuly. Kartézské souřadnice mají ale také své nevýhody. Představme si, že molekulu definovanou na obrázku 1.3 otočíme o 90 ° kolem osy x. Polohy atomů pak budou udány souřadnicemi uvedenými na obrázku 1.4. Jak je vidět, hodnoty dvou souřadnic každého atomu se podstatně změnily - přitom jde stále o tutéž molekulu vody, která má naprosto stejný tvar. Proto se často polohy atomů udávají jiným způsobem. Pro molekulu skládající se z N atomů opět potřebujeme 3N údajů. Z těchto 3N hodnot budou tři udávat polohu těžiště molekuly, další tři natočení molekuly jako celku vzhledem k souřadné soustavě a zbývající údaje (kterých je pochopitelně 3N — 6) vzájemnou polohu atomů uvnitř molekuly.7 Prvních šest údajů nás zpravidla nezajímá, neboť se mění, jak se molekula pohybuje Brownovým pohybem. Zajímá nás pouze posledních 3N — 6 údajů, které jsou pro danou molekulu stejné, ať už je její poloha v souřadné soustavě jakákoli. Tyto údaje se proto nazývají vnitřní souřadnice molekuly. Jako vnitřní souřadnice je zvykem udávat vzdálenosti mezi atomy, které jsou vázány kovalentní vazbou (vazebné vzdálenosti) a úhly, které kovalentní vazby svírají (vazebné úhly). Model molekuly vody, který jsme si uvedli jako příklad, je určen dvěma vazebnými vzdálenostmi 10—Hl | a |0-H2|, které jsou obě rovny 95,7 pm a jedním vazebným úhlem Z H1-0-H2, který je roven 104,5°. 6Soustava souřadná musí být definována tak, jak ukazuje obrázek 1.2. Kdybychom otočili směr jedné osy, popisovali bychom opačný enantiomer. 7Uvedené počty platí pouze pro molekulu, která není lineární. Lineární biomakromolekuly se ovšem nevyskytují, takže se jimi nemusíme zabývat. -0.267 0.021 0.245 0.269 0.014 -0.283 0.096 -0.781 0.686 6 KAPITOLA 1. STRUKTURA V CHEMII A BIOCHEMII ATOM 1 0 WAT 0 -0. ,267 -0, ,096 0, ,269 ATOM 2 HI WAT 0 0. ,021 0, ,781 -0, ,014 ATOM 3 H2 WAT 0 0. ,245 -0, ,686 -0, ,283 Obrázek 1.4: Soubor popisující polohy atomů molekuly vody, která je otočena o 90° vzhledem k molekule definované v souboru na obrázku 1.3. Vazebné vzdálenosti a vazebné úhly postačují k popisu tříatomových molekul, jejichž atomy leží v jedné rovině. Co se ale stane, má-li molekula atomů více? Zkusme se podívat na jednoduchý příklad - molekulu peroxidu vodíku (obrázek 1.5). Tato molekula se skládá ze čtyř atomů, pro její popis tedy potřebujeme 12 souřadnic. Šest z nich popisuje polohu molekuly jako celku, ty nás nezajímají. Z vnitřních souřadnic můžeme určit tři vazebné vzdálenosti, |01-H1| a |02-H2|, které jsou dlouhé 95,0pm a |01-02|, která je dlouhá 147,5 pm. Dále můžeme určit dva vazebné úhly, Z Hl-01-02 a Z 01-02-H2, oba jsou rovny 94,8°. Těmito pěti souřadnicemi není ještě poloha čtyř atomů peroxidu vodíku v prostoru jednoznačně dána, stále můžeme točit modelem kolem vazby O-O, aniž bychom měnili vazebné úhly a vzdálenosti. Šestou vnitřní souřadnicí, kterou musíme určit, je tedy torzní úhel (úhel otočení8 kolem vazby O-O). Tato poslední souřadnice je pro definici struktury biomakromolekul nejdůležitější. Vazebné délky a vzdálenosti jsou totiž téměř stejné ve všech monomerních jednotkách, torzní úhly se ale mohou značně lišit. Můžeme tedy říci, že konformace biomakromolekul je dána hodnotami torzních úhlů. Obrázek 1.5: Molekula peroxidu vodíku. Vazebná délka jednoznačně popisuje dvojici atomů. Protože dvojice bodů musí ležet v jedné přímce, jde z principu o jednorozměrný případ. Podobně vazebný úhel popisuje trojici atomů, která vždy leží v jedné rovině (dvourozměrný případ). Konečně torzní úhel definuje čtveřici atomů a rozšiřuje popis na trojrozměrný prostor. Protože je naším cílem postavit trojrozměrný model molekuly, s žádným dalším typem vnitřních souřadnic se už nesetkáme, i když budeme dále zvětšovat počet atomů. Stavbu modelu molekuly si tedy můžeme popsat následujícím způsobem: • Polohu prvního atomu (označme si jej A) udávají tři souřadnice, které tímto definují polohu celé molekuly v souřadné soustavě. Jsou to souřadnice vnější, které nás většinou nezajímají, v případě jediného atomu nemá smysl mluvit o vnitřních souřadnicích molekuly. • Polohu druhého atomu (B) udává jedna vnitřní souřadnice, vazebná délka |A-B|, a dvě vnější souřadnice, které definují natočení první vazby vůči souřadné soustavě. 8 Jiná možnost, jak tento úhel popsat, je určit úhel, který svírají roviny, ve kterých leží atomy Hl,01,02 a 01,02,H2. Jako vnitřní souřadnici bychom mohli stejně dobře použít dihedrální úhel, tedy doslova úhel mezi dvěma stěnami. 1.3. DEFINICE TORZNÍHO ÚHLU 7 • Polohu třetího atomu (C) udávají dvě vnitřní souřadnice, vazebná délka |B-C| a vazebný úhel Z A-B-C, a jedna vnější souřadnice, která udává natočení druhé vazby vůči souřadné soustavě (teprve tím je definováno natočení celé molekuly v soustavě souřadnic). • Polohu čtvrtého atomu (D) udávají tři vnitřní souřadnice. Pokud jej připojíme k atomu C, bude to vazebná délka |C-D|, vazebný úhel Z B-C-D9 a torzní úhel popisující rotaci kolem vazby B-C. • Polohu všech dalších atomů udávají vždy tři vnitřní souřadnice, v případě nevětveného řetězce (lineárního nebo cyklického) délka vazby s předchozím atomem, úhel mezi dvěma předchozími vazbami a torzní úhel popisující rotaci kolem předposlední vazby. 1.3 Definice torzního úhlu Zatímco definice vazebné délky a vazebného úhlu jsou asi každému zřejmé, definice torzního úhlu si zaslouží pečlivou pozornost. Pro každou kovalentní vazbu, která není koncová, definujeme torzní úhel (popisující rotaci kolem této vazby) následujícím způsobem: 1. Nalezneme řetězec atomů A-B-C-D, který definuje rotaci kolem vazby B-C. Pokud jsou na atom B nebo C (nebo oba) navázány více než dva atomy, určíme atomy A a D podle následujících pravidel: • Je-li vazba B-C součástí hlavního řetězce (páteře) makromolekuly, zvolíme atomy A a D tak, aby byly také součástí hlavního řetězce (páteře). • Je-li vazba B-C součástí postranního řetězce makromolekuly, zvolíme atomy A a D tak, aby měly nejvyšší prioritu podle pravidel používaných v organické chemii (zavedených Cahnem, Ingoldem a Prelogem). 2. Umístíme molekulu v prostoru tak, aby vazba B-C byla kolmá na rovinu papíru. Podíváme se na molekulu ve směru vazby B-C (atom B je blíže k nám a atom C je v zákrytu za ním) a promítneme vazby A-B a C-D do roviny papíru. 3. Změříme úhel mezi průměty vazeb A-B a C-D. Hodnoty úhlu udáváme v rozsahu od —180° do +180°, kladné hodnoty nabývá torzní úhel v případě, že vazba C-D je pootočena oproti vazbě A-B po směru hodinových ručiček (obrázek 1.6). Kromě udání číselných hodnot lze přibližnou hodnotu torzního úhlu popsat slovně. Používají se k tomu různá názvosloví, která jsou také ukázána na obrázku 1.6. První z nich zavádí označení pro nejvýhodnější konformace. Tak jako v případě dvojné vazby C=C jsou výrazně nejvýhodnější hodnoty torzního úhlu 0 a +180° (izoméry cis a trans), v případě jednoduché vazby C-C mezi dvěma sp3 uhlíky jsou nejvýhodnější tři torzní úhly, které se označují gauche(+) (+60°), gauche(-) (—60°) a trans (180°). Druhé názvosloví vychází z rozdělení konformací na dvě skupiny. První skupina, označovaná syn, zahrnuje konformace, ve kterých jsou průměty vazeb A-B a C-D vzájemně pootočeny o méně než 90° jedním či druhým směrem (leží tedy ve stejné polovině kruhu). Naopak druhá skupina, označovaná anti, zahrnuje konformace, ve kterých jsou průměty vazeb A-B a C-D vzájemně pootočeny o více než 90 ° 9Z pouhého geometrického popisu poloh atomů ale ještě nevyplývá, jestli atomy A, B, C, D tvoří lineární řetězec, nebo uzavřený čtyřčlenný kruh. Navíc můžeme geometricky popsat polohu atomů pomocí vzdáleností mezi atomy, které nejsou spojeny chemickou vazbou (a podobně také pomocí úhlů mezi úsečkami spojujícími atomy, které nejsou vázány) a pomocí torzních úhlů popisujících rotaci kolem takových úseček. Je-li tomu tak, atomy mohou tvořit rozvětvenou molekulu nebo trojčlenný kruh s jedním bočním atomem. Pokud jsme si řekli, že k stavbě modelu nestačí topologie, ale musíme znát geometrii, musíme dodat, že geometrie sama také nedefinuje jednoznačně strukturu a vyžaduje také znalost topologie — tedy schéma propojení atomů vazbami. 8 KAPITOLA 1. STRUKTURA V CHEMII A BIOCHEMII CIS ±180° trans Obrázek 1.6: Definice torzních úhlů. Atom B je umístěn ve středu kruhu, atom C je v zákrytu za ním (vazba B-C je kolmá na rovinu kruhu). Průmět vazby A-B do roviny kruhu je vyznačen. Torzní úhel je definován podle toho, do které části kruhu dopadne průmět vazby C-D (žádný konkrétní příklad vyznačen není). Na obrázku jsou uvedeny číselné hodnoty i symbolická označení možných torzních úhlů. V pravé části obrázku je pohled kolmo na rovinu kruhu. Rovina kruhu je vyznačena čárkovaně, šipka ukazuje směr, kterým se díváme, když definujeme torzní úhel. (leží tedy ve opačné polovině kruhu). Tyto dvě skupiny lze kombinovat o údaj popisující, zda čtveřice atomů leží spíše v jedné rovině (periplanární konformace) nebo ve dvou různých rovinách {klinální konformace). Podle tohoto názvosloví tedy hovoříme například o kladném synperiplanárním úhlu (0 až +30°, zkratka +sp), nebo o záporném antiklinálním úhlu (—150 až —90°, zkratka —ac). Kapitola 2 Struktura proteinů 2.1 Proteiny jako příklad biomakromolekul Existují dva důvody, proč je vhodné probírat struktury proteinů (česky bílkovin) jako první ze struktur biomakromolekul. Prvním důvodem je velký význam proteinů a bezpočet funkcí, které v buňce hrají. Strukturou proteinů se proto zabývá nejvíce biochemiků. Druhý důvod je pedagogický. Na strukturách proteinů dobře vyniknou obecná pravidla, se kterými se budeme později setkávat i u jiných biomakromolekul. Jedním z těchto pravidel je stavebnicový charakter struktury. Z několika málo součástek si budeme moci sestavit základní strukturní motivy, jejichž další kombinací získáme i ty nejsložitější struktury. Jiným obecným rysem je hierarchie struktur. To znamená, že strukturní motivy, které můžeme sestavit ze základních dílů biochemické stavebnice, slouží jako stavební díly složitějších strukturních motivů. A tyto složitější struktury jsou zase stavebními kameny ještě složitějších strukturních útvarů a tak dále. Tato hierarchie je u proteinů nejlépe definovaná - biochemici rozlišují primární, sekundární, terciární strukturu i struktury vyšší. V této chvíli asi není jasné, co je tak pozoruhodné na zmíněných rysech biomakromolekulárních struktur - stavebnicovém a hierarchickém uspořádání. Následující stránky by měly ukázat, že tyto základní principy jsou klíčem k pochopení stavby biologicky zajímavých molekul. Složitost makromolekuly není dána složitostí základních stavebních jednotek, ale neuvěřitelným množstvím možností, jak můžeme poměrně jednoduché stavební jednotky kombinovat. Živí tvorové nejsou výjimeční tím, z jakých atomů se skládají, ale vynikají způsobem, jak jsou uspořádány atomy v jejich molekulách, molekuly v buňkách, buňky v orgánech. O kráse katedrály se také dozvíme více z papírového modelu, který nese informaci o architektuře, aniž by říkal cokoli o materiálním složení, než z příslušných hromad kamene, písku a vápna, které naopak nenesou informaci o myšlence architekta. Obecná pravidla stavby biomakromolekul bychom mohli dlouho teoreticky probírat. Mohli bychom se snažit uvěznit tato pravidla do co nejpřesnějších definic, což by se nám stejně nepodařilo. Pojďme se raději podívat na konkrétní příklad biomakromolekulární architektury - na molekuly proteinů. 2.2 Stavební jednotky Základními stavebními jednotkami proteinů jsou a-L-aminokyseliny. Ačkoli je skutečná syntéza proteinů v buňce velmi složitá, formálně můžeme molekulu proteinu získat spojováním karboxylových a aminových skupin kondenzační reakcí, při které se odštěpuje molekula vody. Vzniklý produkt se nazývá peptid. V peptidech jsou zbytky aminokyselin (aminokyselinová rezidua) spojeny amidovou vazbou, která se často označuje jako vazba peptidová. Při kondenzaci většího počtu aminokyselin vzniká lineární 9 10 KAPITOLA 2. STRUKTURA PROTEINŮ molekula, jejíž páteř je tvořena atomy zkondenzovaných karboxylových a aminových skupin a zbytek molekuly aminokyseliny tvoří postranní řetězec. Označení peptid a protein jsou poněkud nejednoznačná a do jisté míry synonymní. V literatuře se můžeme setkat s několika způsoby rozlišování mezi peptidem a proteinem: • Peptidy a proteiny se rozlišují podle počtu aminokyselinových zbytků. Molekuly skládající se ze dvou až deseti aminokyselinových zbytků se označují jako oligopeptidy, molekuly složené z 11 až 100 aminokyselin se označují jako polypeptidy a molekuly obsahující více aminokyselinových zbytků se označují jako proteiny. Přestože je toto dělení oblíbené autory učebnic, je zcela umělé a o struktuře nic nevypovídá. • Jako peptidy se označují kratší řetězce, které snadno přechází z jedné z mnoha možných konformací do jiné a netvoří stabilní trojrozměrné struktury. Naopak jako proteiny se označují delší řetězce, které mají zřetelnou tendenci vyskytovat se v jedné nejvýhodnější konformaci (nebo v závislosti na vnějších podmínkách měnit konformaci v rámci malého počtu možných konformací) a mají tedy dobře definovanou prostorovou strukturu. Je zřejmé, že mezi takto definovanými peptidy a proteiny není jasně vymezená hranice, ale spíše plynulý přechod. Navíc může být i značně velká molekula proteinu málo uspořádaná, připomínající flexibilní peptid. • Při studiu složitějších molekul, které kromě aminokyselinového řetězce obsahují chemicky odlišnou část, se jako polypeptid označuje samotný peptidový řetězec a jako protein celá složená molekula. Jiné názvosloví nazývá peptidovou část apoprotein a celou složenou molekulu holoprotein. Přestože buňka obsahuje větší počet aminokyselin, proteinový řetězec se syntetizuje pouze z 20 geneticky kódovaných (tzv. proteinogenních) aminokyselin.1 Pro jednoznačný popis struktury je nutné zavést jasně definované označení všech atomů aminokyselin. Bylo by samozřejmě možné použít systematického názvosloví organické chemie. Z částečně historických a především praktických důvodů se ale zavádí odlišné biochemické názvosloví, které se řídí pokyny Mezinárodní unie pro čistou a užitou chemii a Mezinárodní unie pro biochemii IUPAC-IUB. Jistě není nutné se všechny detaily názvosloví učit nazpaměť, je ale nezbytné se jimi ve všech případech řídit. Přehled značení atomů aminokyselin můžete najít na obrázku 2.1. Při pohledu na vzorce 20 proteinogenních aminokyselin 2.1 si asi každý uvědomí chemickou různost postranních řetězců. Tato pestrost má zásadní význam pro strukturu i funkci proteinů a vysvětluje, proč jeden typ makromolekuly může mít tak odlišné chemické a fyzikální vlastnosti a hrát tak různé role v životě buňky. Z pohledu interakcí, které určují energetickou výhodnost konformace proteinu, si můžeme aminokyseliny rozdělit na několik typů. • Aminokyseliny, které jsou schopny vytvářet iontovou vazbu, zahrnují arginin, lysin, histidin, ty-rosin, cystein, kyselinu asparagovou a kyselinu glutamovou. Podmínky, za kterých jsou tyto aminokyseliny ionizovány, jsou dány především kyselostí (hodnotou pH) a elektrickou permitivitou jejich nejbližšího okolí. Arginin a lysin tvoří kationty v kyselém a neutrálním prostředí, histidin tvoří kationty v kyselém prostředí. Kyselina asparagová a glutamová tvoří anionty v neutrálním a zásaditém prostředí, cystein v zásaditém a tyrosin jen v silně zásaditém prostředí. Konkrétní hodnoty disociačni konstanty2 závisí na elektrické permitivitě okolí. V hydrofobním jádře proteinu budou postranní řetězce hůře ionizovat, takže kationty se budou tvořit až při nižším pH a anionty až při vyšším pH. ^■V molekulách proteinů izolovaných z buněk nacházíme více než 20 různých aminokyselin. „Nestandardní" aminokyselinové zbytky ale v naprosté většině případů vznikají chemickými úpravami již vzniklého polypeptidového řetězce. Tyto úpravy se nazývají posttranslačnt modifikace a zahrnují zavedení jednoduchých funkčních skupin jako hydroxyl nebo fosfát i navázání velkých molekul jako mastné kyseliny, porfyriny (hem, chlorofyl), oligosacharidy a další. 2Dekadický logaritmus disociační konstanty s opačným znaménkem je roven pH, při kterém je právě polovina molekul disociována. 2.2. STAVEBNÍ JEDNOTKY 11 HSH52 H-N Gly(G) Pro(P) Asn (N) Asp (D) I I Hit /' I H / J h* | J h5 hr2 Hí2' j Ala (A) Val (V) Gin (Q) Glu (E) Hr' H? I I «H»2)3 VWCŽ H^ľ 'C—Cŕ2H82 H-N Hl H-N H-ďW H-N J? — C5,(H5,)3 | h—C* /T ' J H" Hr3 { Ser (S) Leu (L) Pne (F) Lys (K) Vel „/ ue V H-N C^H*), HT,L\ hS-CJ' tfí-hfä I ^jí <5? I j h° hp JhS V j1" '" I H" Hp3 Thr(T) lle(l) Tyr (Y) Arg (R)H T | I V.. Í£ W2 H-N On. -C I H,-/ IHLcf || | | \ f, Cys(C) Met (M) Trp (W) His (H) Obrázek 2.1: Vzorce aminokyselin s atomy označením atomů podle doporučení IUPAC-IUB. Purpurově jsou zvýrazněny atomy, které se podílejí na tvorbě vodíkových vazeb. Barvy troj písmenných a jednopísmenných zkratek aminokyselin rozlišují krátké postranní řetězce (černá), nepolární postranní řetězce (zelená), polární postranní řetězce (purpurová), kyselé (záporně nabité) postranní řetězce (červená) a zásadité (kladně nabité) postranní řetězce (modrá). 12 KAPITOLA 2. STRUKTURA PROTEINŮ • Postranní řetězce schopné dipolárních interakcí jsou zároveň schopné tvořit vodíkové vazby.3 Patří mezi ně všechny aminokyseliny schopné tvořit ionty a navíc serin, threonin, asparagin, glutamin a tryptofan. • Silný hydrofobní efekt vykazují alifatické postranní řetězce prolinu, leucinu, isoleucinu, valinu a do jisté míry alaninu. Míra hydrofobních a lipofilních vlastností je dána délkou alifatického řetězce. Dále můžeme mezi hydrofobní postranní řetězce zařadit aromatické aminokyselinové zbytky tryp-tofanu, tyrosinu a fenylalaninu a sirné zbytky cysteinu a methioninu.4 • Glycin a do jisté míry i alanin, serin a threonin můžeme považovat za zvláštní skupinu „malých" postranních řetězců. Vzhledem k jejich velikosti je totiž obtížné říci, jestli vykazují spíše hydro-filní či hydrofobní charakter. Tím, že zabírají malý prostor poskytují zvýšenou volnost okolním postranním řetězcům. • Prolin má netypickou konfiguraci (cyklický postranní řetězec), která významně omezuje možné konformace proteinové páteře. • Cystein je výjimečný v tom, že může tvořit kovalentní disulfidovou vazbu s postranním řetězcem cysteinu v jiné části proteinu. To je velký zásah do topologie proteinové páteře, který má zásadní vliv na konformaci proteinu. Stejně jako je důležitá různost postranních řetězců, tak je významná neměnnost uspořádání na prvních dvou uhlících. Všechny aminokyseliny můžeme považovat za deriváty alaninu, všechny zachovávají stejnou konfiguraci a-uhlíku (přestože zrcadlová konfigurace D by byla z chemického pohledu stejně dobře možná5). Tato jednotnost základních stavebních dílů umožňuje stavebnicové uspořádání popsané v sekci 2.1. Stejná konfigurace a uhlíku otvírá dveře téměř neomezenému kombinování aminokyselin při zachování pravidelnosti struktur.6 Glycin, který je achirální, a prolin, který se liší konfigurací na dusíku, jsou výjimky, které potvrzují pravidlo a dávají ještě více vyniknout logice stavebnicového uspořádání. 2.3 Torzní úhly Jak jsme diskutovali v sekci 1.2, konformaci biomakromolekuly jednoznačně určují torzní úhly. Podívejme se proto na torzní úhly, se kterými se setkáváme v proteinech (obrázek 2.2). Konformace peptidové páteře aminokyselin je určena třemi torzními úhly, , ip a uj. Čtveřice atomů, které torzní úhel definují (A-B-C-D na stránce 7) jsou pro uvedené úhly následující. V reziduu číslo z je úhel je definován atomy C'i_1, Nj, Cf, C^, úhel tp atomy Nj, Cf, C^, Nj+i a úhel uj atomy Cf, C'i, Nj+i, Cf+1. Protože peptidová vazba se chová částečně jako dvojná vazba7, úhel uj nabývá pro většinu aminokyselin hodnot blízkých 180° (konformace trans). Výjimkou je prolin, který se vyskytuje i v cis konformaci (0 °). Konformace peptidové páteře je tak definována především hodnotami úhlů cp aip. Peptidové konformery je proto možno graficky znázornit jako body v grafu, jehož osy tvoří hodnoty úhlů 3Vodíkové vazby je schopna tvořit každá peptidová vazba, zde je řeč pouze o postranních řetězcích. 4Aromatické aminokyseliny, zařazené do skupinu hydrofobních postranních řetězců, mohou krom van der Waalsovských sil interagovat prostřednictvím elektronů v delokalizovaných 7r-orbitalech. Totéž platí o d-orbitalech síry. Jde o interakce svým popisem připomínající kovalentní vazby, ale mnohonásobně slabší. V našem zjednodušeném výčtu sil působících v biomakromolekulách jsme si je neuváděli. 5Na otázku proč se v proteinech vyskytují právě L-aminokyseliny dosud neznáme uspokojivou odpověď. 6Pokud stejnou strukturu můžeme postavit z většího počtu možných kombinací základních stavebních prvků, je více pravděpodobné, že se s takovou strukturou v buňce setkáme 7Vyjádřeno pojmy molekulových orbitalů, o kterých bude řeč v kapitole 11, pokud leží vodík a oba uhlíky vázané na dusík v jedné rovině (hybridizace sp2), mají orbitaly p dusíku, kyslíku i uhlíku v karbonylu stejnou orientaci, ideální pro překryv a tvorbu delokalizované 7r-vazby. 2.3. TORZNÍ ÚHLY 13 14 KAPITOLA 2. STRUKTURA PROTEINU o y a o o a 1*-8- y o -8-ti -180 0 6+180 0 ¥ £-180 +180 Obrázek 2.3: Ramachandranův diagram s vyznačeným názvoslovím peptidových konformací. Modře jsou označeny konformace výhodnější pro l aminokyseliny. Červeně jsou označeny konformace výhodnější pro d aminokyseliny, které se běžně v geneticky kódovaných proteinech nevyskytují. (p a ip. Takový graf se nazývá Ramachandranův diagram. Běžné konformace peptidové páteře budou diskutovány později. Na obrázku 2.3 je uvedena obecná konvence názvosloví peptidových konformerů. Pro chirální aminokyseliny (všechny běžné kromě glycinu) existují většinou dvojice (zrcadlové obrazy) konformerů, z nichž jeden (označený modře) je výhodný pro L aminokyseliny (ty se běžně vyskytují v proteinech), druhý (označený červeně) by byl výhodnější pro D aminokyseliny: Konformace postranních řetězců je dána torzními úhly, které se značí písmenem a jejichž počet je pochopitelně různý pro různé aminokyseliny. Úhel x1, definovaný atomy N, C", C3, X se nachází nejčastěji v oblasti gauche(-) nebo trans. Konformace gauche(+) je nevýhodná stericky kvůli přiblížení peptidové vazbě, častěji se vyskytuje u serinu a threoninu, kde ze stejných důvodů umožňuje tvorbu vodíkové vazby mezi kyslíkem postranního řetězce a peptidovou vazbou. Valin a isoleucin, které mají dva 7 uhlíky, se vyskytují převážně v konformaci, ve které není žádný 7 uhlík orientován gauche(+) vzhledem k hlavnímu řetězci (pozor na záludnost doporučeného názvosloví organické chemie: u isoleucinu se taková konformace označuje gauche(-), ale u valinu trans). 2.4 Primární struktura Poté, co jsme prošli základní definice, se již můžeme podívat na vlastní struktury. Jak jsme se již zmínili v sekci 2.1, zavedli biochemici hierarchickou posloupnost struktur. Nejnižší úrovní této hierarchie je primární struktura. Primární struktura je pořadí (sekvence) aminokyselin v polypeptidu. Protože konfiguraci jednotlivých aminokyselin známe, poskytne nám primární struktura veškerou informaci o konfiguraci proteinu (s jednou důležitou výjimkou - z primární struktury stále nevíme, které cysteiny jsou spojeny disulfidovou vazbou). Naopak se z primární struktury nedovíme nic o konformaci proteinu. Podle konvence začíná sekvence N-terminální aminokyselinou (obsahuje volnou aminoskupinu) a končí C-terminální aminokyselinou (obsahuje volnou karboxyskupinu). Tímto směrem také probíhá syntéza proteinů v buňce. Pořadí aminokyselin je dáno genetickým kódem, který je zapsán v molekule 2.5. SEKUNDÁRNÍ STRUKTURA 15 deoxyribonukleové kyseliny (DNA). Každým třem monomerním jednotkám DNA (nukleotidům), které tvoří takzvaný kodón, odpovídá jedna monomerní jednotka proteinů (aminokyselina). Vlastní překlad z genetického kódu do „jazyka" aminokyselin je složitý proces, ve kterém hrají nejdůležitější roli různé molekuly ribonukleových kyselin (RNA). Kódovací tabulka je společná všem živým tvorům8. Více si o biosyntéze proteinů řekneme v kapitole 8. V laboratorní praxi je poměrně snadné určit sekvenci DNA a s využitím znalosti kódovací tabulky se tak ihned dozvědět sekvenci proteinu. Proto je primární sekvence proteinu zpravidla známá dříve, než je řešena jeho trojrozměrná struktura9. Ze sekvence je v principu možno předpovědět prostorové uspořádání proteinů, v současnosti je však spolehlivost takových předpovědí omezená. 2.5 Sekundární struktura Zatímco definice primární struktury byla celkem jednoznačná, u vyšších struktur se již definice různých autorů často liší. My budeme mít pod pojmem sekundární struktura na mysli pravidelný, libovolně opakovatelný konformačni motiv polypeptidové páteře10. U proteinů se setkáváme se dvěma základními typy sekundárních struktur. 2.6 Struktura alfa Struktura a je pravotočivá šroubovice neboli helix (obrázek 2.4, pokud čtete skripta v elektronické formě a jste připojeni na internet, můžete si model a šroubovice prohlédnout na svém počítači). Všimněme si, že poskládáním aminokyselin do vyšší struktury vznikl nový tvar, který je sám o sobě chirální. Tato chiralita nijak nesouvisí s chiralitou aminokyselin. Kdybychom postavili a-šroubovici ze samých gly-cinů, byla by stále chirální, tak jako je chirální každý šroub. Stejně bychom mohli postavit z glycinů levotočivou šroubovici, která by byla zrcadlovým obrazem a šroubovice. Ale pozor, pokud sestavíme levotočivou šroubovici z jiných aminokyselin, zrcadlový obraz a šroubovice nezískáme. Vzájemnými zrcadlovými obrazy jsou totiž pravotočivé šroubovice postavené z L aminokyselin (a-šroubovice) a le-votočivé šroubovice postavené z D aminokyselin. Rozdíl mezi levotočivou a pravotočivou šroubovici je v konformaci stavebních dílů, nikoli v jejich konfiguraci. Na úrovni sekundárních struktur můžeme ale šroubovice považovat za útvary s rozdílnou konfigurací11. Toto je typický příklad hierarchie struktur. Na úrovni sekundární struktury má smysl mluvit o šroubovici jako o základním stavebním prvku, jako bychom zapomněli, že jde o útvar daný konformaci aminokyselin, ze kterých je postaven. To si můžeme dovolit, protože konformace aminokyselin jsou natolik uvězněny v určité poloze12, že se šroubovici můžeme zacházet jako se stabilním a rigidním stavebním dílem. Vidíme, že jsme se na hony vzdálili od jasného rozlišení konfigurace a konformace podle rotace kolem vazby, které bylo tak pěkně použitelné na úrovni jednotlivých aminokyselin. Uhly (p i ip odpovídají v a-strukturách konformaci gauche(-) (ideální a šroubovice je definována hodnotami cp = —57 ° aip = —47 °). a-Sroubovice je stabilizována vodíkovými vazbami, které jsou orien- 8Tato univerzalita genetického kódu má své výjimky. Poněkud jednodušší rozpoznávání nukleotidů například v mito-chondriích vede k drobným odchylkám kódovacích pravidel. Jiným příkladem výjimky je využití některých kodónů pro zabudování selenu do molekuly cysteinu (místo síry). 9V současné době je již pro řadu organismů (včetně člověka) známa téměř veškerá genetická informace. U těchto organismů známe tedy sekvenci všech nukleotidů genové DNA. Stačí nám tedy určit, kde geny jednotlivých proteinů začínají a končí (a také, kde jsou přerušeny nekódujícími úseky) k tomu, abychom znali sekvenci všech proteinů, alespoň v okamžiku, kdy jsou v buňce syntetizovány (v mnoha případech se část proteinu odštěpí dříve, než začne protein plnit svoji úlohu). 10Sekundární struktury lze často (alespoň formálně matematicky) popsat jako šroubovice. 1:LPravidla IUPAC-IUB definují nejen konfiguraci čtyřstěnu, používanou na úrovni atomů, ale i konfiguraci šroubových útvarů. Pravotočivé útvary se označují symbolem P, levotočivé symbolem M. 12 Stále samozřejmě mluvíme o konformaci peptidové páteře, nikoli postranních řetězců. 16 KAPITOLA 2. STRUKTURA PROTEINŮ Obrázek 2.4: Model a-šroubovice. Obrázek 2.5: Model šroubovice 3io- továny téměř rovnoběžně s osou helixu13 a tedy i s jeho výsledným dipólovým momentem (nejvýhodnější orientace). Protože vodíkové vazby se tvoří mezi amidovými vodíky a karbonylovými kyslíky peptidových vazeb, jsou aminokyseliny v sousedních závitech šroubovice navzájem posunuty zhruba o jednu třetinu. Na jeden závit tak připadá 3,6 (přibližně 3|) aminokyselin. V proteinové chemii se používá speciální názvosloví šroubovic. Každá šroubovice je popsaná dvěma čísly. První číslo udává počet aminokyselin na jeden závit, u a-šroubovice tedy 3,6. Druhé číslo je definované složitěji. Je založeno na tom, že sousední vodíkové vazby uzavírají ve šroubovicích pravidelné smyčky atomů spojených kovalentními a vodíkovými vazbami. V a-helixech je každá taková smyčka tvořena 13 atomy. Podle názvosloví odvozeného od počtu reziduí na závit a od počtu atomů ve smyčkách by se tedy a-šroubovice označovala jako helix 3.613. Struktura a-šroubovice je energeticky nejvýhodnější stočená forma peptidového řetězce. Těsnější vinutí šroubovice (o | rezidua) tvoří strukturu helixu 3io (3 aminokyseliny na závit, 10 atomů ve smyčkách, viz obrázek 2.6 a model). Tato šroubovice je méně výhodná z pohledu dipólových interakcí (vodíkové vazby jsou orientovány šikmo k ose helixu) a sférického bránění (postranní řetězce jsou v zákrytu). S touto strukturou se setkáváme zejména na C-koncích a-helixů, kde již karbonyly nemají k dispozici amidové vodíky v dalším závitu, se kterými by mohly tvořit stabilizující vodíkové vazby. Je tedy výhodnější šroubovici „utáhnout" do helixu 3io, který umožňuje vytvořit více vodíkových vazeb při stejném počtu aminokyselin. Pokud je šroubovice vinuta naopak o | rezidua volněji než a-helix, tvoří tzv. 7r-šroubovici (helix 4.4i6, viz obrázek 2.6 a model). Vodíkové vazby jsou v 7r-helixu sice orientovány rovnoběžně s osou, energeticky je ale tt-helix nevýhodný a ve strukturách proteinů velmi vzácný. Důvodem je tvorba dutiny 13Ačkoli je latinské slovo helix rodu ženského, v tomto textu používáme mezi biochemiky vžité skloňování podle mužského vzoru hrad. 2.7. STRUKTURA BETA 17 Obrázek 2.6: Model 7r-šroubovice. uvnitř 7r-šroubovice (tím přicházíme o výhodné van der Waalsovy interakce14) a sterické pnutí vedoucí k rozevírání úhlu N-Ca-C Všechny uvedené šroubovice se nacházejí na Ramachandranově diagramu v oblasti a konformací (gauche(—),gauche(—)). Na obrázku 2.6 je tato oblast a povolená pro L-aminokyseliny označena černě. Výjimečnou aminokyselinou je prolin15, který se uprostřed pravotočivé a-šroubovice nevyskytuje ze sterických důvodů (kolize s karbonylem předchozí peptidové vazby). Zrcadlový obraz pravotočivé a-šroubovice odpovídá levotočivé šroubovici s konformací gauche(+), gauche(+) (červená oblast). V této konformací se často nalézají achirální glyciny, občas v ní nalezneme asparagin, pro který je nevýhodnost této konformace kompenzována možností tvorby vodíkové vazby mezi páteří a postranním řetězcem. 2.7 Struktura beta Druhou základní sekundární strukturou proteinů je struktura j3. Na rozdíl od a-šroubovice odpovídá /3-struktura maximálně rozvinuté konformací peptidové páteře. Stejně jako a-šroubovice je /3-struktura stabilizována vodíkovými vazbami. Na rozdíl od a-šroubovice, kdy vodíkové můstky spojovaly atomy aminokyselin téhož helixu, /3-struktury jsou propojeny se sousedními /3-vlákny sítí vodíkových vazeb přibližně kolmých k ose páteře. Spojena mohou být vlákna orientovaná opačným směrem (antiparalelní) nebo stejným směrem (paralelní). Vznikají tak přibližně ploché struktury listů, sheets, propojených sítí vodíkových vazeb (paralelní uspořádání vyžaduje větší odchylku vodíkových vazeb od kolmého směru). Základní strukturu paralelního a antiparalelního skládaného listu ukazuje obrázek 2.8 a modely antiparalelních a paralelních vláken. Reálnou ukázku skládaných listů si můžete prohlédnout v modelu thioredoxinu. Zcela natažená trans,trans konformace peptidové páteře by odpovídala struktuře skládaného listu, ve které by následující aminokyseliny byly navzájem otočeny o 180 ° (formálně by se dala tato struktura považovat za šroubovici, ve které na jeden závit připadnou dvě rezidua). V proteinech se zcela natažená konformace nevyskytuje, hodnoty úhlů (p a ip jsou menší než 180° (cp = —139°, ip = +135° v antiparalelních a = —119°, ijj = +113° v paralelních /3-listech). Peptidová páteř v /3-strukturách je tedy mírně pravotočivá (i /3-struktury jsou vlastně pravotočivé šroubovice) a v důsledku toho jsou /3-listy 14Interakce, které jsou důležité pro stabilitu struktur, jsou více diskutovány v kapitole 6. 15Prolin, jehož konformace jsou omezeny cyklickým postranním řetězcem, a glycin, který je naopak velmi flexibilní, protože postranní řetězec postrádá, jsou konformačně výjimečné aminokyseliny. Polypeptidové řetězce složené z těchto kyselin tvoří pravidelné šroubovice, které ale podle naší definice neoznačujeme jako sekundární struktury (pojem sekundární struktura jsme vyhradili pravidelnému uspořádání, které nezávisí na postranním řetězci). Z těchto struktur je asi nejznámější šroubovice tvořená opakující se sekvencí Gly—Pro—Pro, která se dále splétá do trojšroubovice stabilizované vodíkovými vazbami. Tuto troj šroubovici, která připomíná lano a je mimořádně pevná v tahu, vytváří strukturní protein kolagen. 18 KAPITOLA 2. STRUKTURA PROTEINŮ g~ g+ t 1. -180 0 +180 0 ¥ -180 +180 Obrázek 2.7: Ramachandranův diagram s černě vyznačenou oblastí konformací aminokyselin v šroubovicích proteinů (strukturách a). Červeně je vyznačena oblast levotočivých šroubovic, které by byly výhodnější pro d- aminokyseliny. Obrázek 2.8: Model dvou vláken antiparalelního (nahoře) a paralelního (dole) /3-listu. 2.8. TERCIÁRNÍ STRUKTURA 19 Polypeptidové vlákno Vodíková vazba Obrázek 2.9: Schematické znázornění pravotočivé orientace vodíkových vazeb (vyznačeny černě a čárkovaně) a levotočivého zkratu /3-listů (peptidová páteř je vyznačena červeně). Vlevo pohled shora, vpravo pohled z boku. t g" t g" +180 0 ¥ -180 -180 0 é +180 Obrázek 2.10: Ramachandranův diagram s vyznačenou oblastí konformací aminokyselin v /3-listech proteinů. levotočivě zkrouceny. Skutečnost, že pravotočivost v rámci jednotlivého peptidového řetězce způsobuje levotočivost vzájemného uspořádání různých řetězců, jistě působí na první dojem záhadně. Vše je ale zřejmější, když si dobře prohlédneme schéma na obrázku 2.9. Oblast povolených /3-konformací v Ramachandranově diagramu je poměrně rozsáhlá (obrázek 2.10). Stejně jako a-helixy nejsou /3-struktury výhodné pro prolin, kde cyklická struktura postranního řetězce vyžaduje úhel cp « —60°. Prolin (ale i jiné aminokyseliny) se naopak často vyskytuje v konformaci polyprolin II, s torzními úhly (p « —80 °a^~ 150 °, tedy poblíž oblasti j3 v Ramachandranově diagramu. Zastoupení konformace polyprolin II v takzvaných přirozeně neuspořádaných proteinech je zmíněno níže. 2.8 Terciární struktura Molekuly některých proteinů jsou tvořeny jedinou monotónně se opakující sekundární strukturou (například keratiny16). 16Sekundární struktury se ve vláknitých (fibrilárních) proteinech nevyskytují izolovaně, ale splétají se do vyšších struktur, srovnatelných s kvartérními strukturami globulárních proteinů (viz sekci 2.16). Vytvoření takových vyšších struktur je možné pouze tehdy, když do sebe sekundární struktury přesně zapadají. Takové přesné uspořádání většinou vyžaduje určitou sekvenci aminokyselin, která se ve fibrilárních proteinech mnohokrát opakuje. Vidíme, že zde struktura není 20 KAPITOLA 2. STRUKTURA PROTEINŮ t g" t i -180 0 é +180 0 ¥ -180 +180 Obrázek 2.11: Ramachandranův diagram s vyznačenými konformacemi reverzních ohybů. Šipka naznačuje směr od první ke druhé aminokyselině ohybu, v ohybu III a III' mají obě aminokyseliny stejnou konformaci. Mnohé proteiny nebo jejich části nejsou přítomny v jedné dobře definované konformaci, ale vyskytují se ve směsi velkého množství rychle se přeměňujících konformaci. Takové proteiny se obvykle označují jako přirozeně neuspořádané (intrinsically disordered). Krátkodobě v nich mohou vznikat segmenty sekundárních struktur nebo i terciární struktury, důležité pro jejich funkci. Přechodnými sekundárními strukturami mohou být a-šroubovice, nebo více natažené struktury polyprolin II, tvořené i jinými aminokyselinami, než prolin. Fibrilárními ani přirozeně neuspořádanými proteiny se více zabývat nebudeme. Zaměříme pozornost na proteiny, ve který se prvky sekundárních struktur stavebnicově skládají do přibližně globulárních molekul. Takové skládání polypeptidových řetězců se nazývá terciární strukturou. Aby byla molekulová stavebnice proteinů použitelná, musí krom pravidelných sekundárních struktur (a a j3) obsahovat i spojovací díly. 2.9 Spojovací prvky Spojovacích prvků se ve strukturách proteinů vyskytuje celá řada. Nejjednodušší jsou takzvané ohyby (turns). Jediná aminokyselina v 7 konformaci tvoří inverzní j-ohyb („obyčejný" 7-ohyb je pro L-aminokyseliny sféricky nevýhodný). Takzvané reverzní ohyby (základní z nich jsou značené I a II) se skládají ze dvou aminokyselin a jsou stabilizované vodíkovým můstkem mezi vodíkem peptidové vazby s následující aminokyselinou a karbonylovým kyslíkem peptidové vazby s předcházející aminokyselinou. Ohyb III je vlastně výsek z výše popisované 3io-šroubovice. Později byla identifikována a vyššími římskými čísly označena řada dalších ohybů, kterými se ale zde zabývat nebudeme. Místo toho zmíníme ohyby značené ľ, II' a III'. Až na konfiguraci na uhlíku C" jde o zrcadlové obrazy reverzních ohybů I, II, III. Ramachandranovy diagramy zmíněných jednoduchých ohybů jsou uvedeny na obrázku 2.11. Struktry nej běžnějších reverzních obyhů si můžete prohlédnout na obrázcích 2.12 (ohyby I a II) a 2.13 (ohyby ľ a II'). nezávislá na sekvenci, příčinu ale nenajdeme na úrovni struktur sekundárních, ale vyšších. 2.10. HIERARCHIE V RÁMCI TERCIÁRNÍ STRUKTURY 23 -180 0 +180 -180 0 +180 ó ó Obrázek 2.14: Ramachandranův diagram s vyznačenými konformacemi a-ohybů tvořených dvěma (černě v levém diagramu), třemi (červeně v levém diagramu), nebo čtyřmi (dvě možnosti jsou uvedeny různými barvami v pravém diagramu) aminokyselinami. Šipky ukazují od první ke druhé a od druhé ke třetí aminokyselině. 2.10 Hierarchie v rámci terciární struktury Základní hierarchie struktur (primární, sekundární, terciární) je pro detailní popis struktur proteinů příliš hrubá. Proto se v posledních letech objevily v literatuře jemnější stupně v rámci terciární struktury. Názvosloví takového jemnějšího dělení není ale dosud ustálené a často vychází z terminologie různých počítačových programů, které se snaží struktury proteinů analyzovat. Zkusme si tedy popsat vzrůstající složitost prostorového uspořádání atomů pomocí pojmů běžných ve strukturní biochemii, s tím, že se soustředíme spíš na podstatu věci, než na názvoslovná úskalí. Ohyby (příklady některých byly zmíněny výše) spolu s úseky sekundárních struktur a a j3 tvoří vyšší strukturní prvky, takzvané super sekundární motivy. Jejich kombinací vznikají foldy, které dále tvoří domény (struktury s funkční autonomií) a z domén je složena trojrozměrná struktura celého poly-peptidového řetězce. Následující přehled tříd proteinů ilustruje tuto hierarchii proteinové architektury na strukturách skládaných z různých stavebnicových prvků. 2.11 Alfa-proteiny Proteiny tvořené a-šroubovicemi označujeme jako a-proteiny. Nej jednodušším supersekundárním motivem a-proteinů je dvojice antiparalelních a-šroubovic spojených krátkým ohybem (v anglické literatuře označovaná helix-turn-helix). Typické jsou ohyby skládající se ze dvou, tří, nebo čtyř aminokyselin. Ramachandranovy diagramy typických a-ohybů jsou uvedeny na obrázku 2.14. Jiným příkladem supersekundárního motivu je „zlomený helix" (a-corner), ve kterém je pravidelná a-šroubovice přerušena trojicí aminokyselin v neobvyklé konformaci (obrázek 2.15). Termínem „fold" se označují složitější útvary, které se skládají z několika úseků sekundární struktury a spojovacích prvků. Typickým příkladem je pro a-proteiny svazek antiparalelních helixů (helix bundle). Obrázek 2.16 ukazuje jak je možné kombinací supersekundárního motivu helix-turn-helix sestavit svazek čtyř šroubovic. Existuje více možností, jak propojit pomocí ohybů několik šroubovic, které tvoří svazek. Tak jak jsme hovořili o topologii a konfiguraci jednotlivých atomů, můžeme hovořit o topologii i na 24 KAPITOLA 2. STRUKTURA PROTEINU Obrázek 2.15: Model zlomeného helixu (a-corner). úrovni celých úseků sekundární struktury. Obrázek 2.17 ukazuje možné topologie svazků tvořených čtyřmi helixy. Jak vidíme, těchto možností je šest. Kdybychom podobně analyzovali svazky tvořené více šroubovicemi, dospěli bychom k velkému počtu možných topologií (propojení). Ne každá topologie je ale stejně běžná. Uspořádání, ve kterých se spojovací smyčky "kříží" vyžadují, aby se jedna smyčka druhé vyhnula, což je entropicky nevýhodné. Jistě vás napadla otázka, jaké síly drží svazek šroubovic pohromadě. Odpověď můžeme hledat v rozložení postranních řetězců podél helixů. Když se podíváme na a-šroubovici shora (levá část obrázku 2.18 nahoře), uvidíme takzvané helikální kolo (helical wheel). Postranní řetězce aminokyselin směřují do jedenácti různých směrů (jinými slovy, dvanáctý postranní řetězec míří stejným směrem, jako první). V helikálním kole se velmi často střídají polární a nepolární aminokyseliny tak, že nepolární postranní řetězce tvoří souvislý pruh podél délky helixu (například je nepolární první, pátá, devátá, dvanáctá atd. aminokyselina). Čtyři takové šroubovice se mohou výhodně orientovat tak, aby nepolární pruhy mířily dovnitř svazku a polární ven, do vodného prostředí. Spolu s dalšími interakcemi mezi postranními řetězci tak bude svazek stabilizován hydrofobním efektem. Důsledkem popsaného uspořádání je to, že dojde k vytvoření nepolární dutiny mezi helixy. Protein vlastně odděluje vodné a nepolární prostředí. To je důležité, pokud protein funguje jako katalyzátor chemické reakce, která musí probíhat v nevodném prostředí. Reakce uvnitř proteinu může probíhat i ve vodném prostředí cytoplasmy, protein vlastně tvoří jakousi zkumavku s nevodným rozpouštědlem. Jiným příkladem oddělení vodného a ne-vodného prostředí jsou proteiny, které procházejí lipidovou membránou. Takové proteiny tvoří opačně uspořádané svazky. Nepolární řetězce míří ven do nepolárního prostředí membrány, zatimco polární řetězce utvářejí polární dutinu, která spojuje vodná prostředí na obou stranách membrány (například cytoplasmu s mezibuněčnou tekutinou). Ve většině proteinů nejsou helixy uspořádány rovnoběžně do svazků. Jednotlivé šroubovice navzájem svírají určitý úhel. Logiku takového uspořádání můžeme opět hledat v rozložení postranních řetězců podél helixu. V případě šroubovice 3io tvoří každý čtvrtý (například první, pátý, devátý, atd.) postranní řetězec jakýsi hřebínek na boku šroubovice. V případě a-helixu není každá čtvrtá aminokyselina nad sebou, ale jsou pootočeny vždy o 33,7°. V důsledku toho není spojnice postranních řetězců lišících se o tři aminokyseliny rovnoběžná s osou helixu (jak tomu bylo u šroubovice 3io), ale svírá s ní úhel asi —26°. Jednodušeji řečeno, náš hřebínek postranních řetězců se vine kolem šroubovice. Dvě šroubovice 2.11. ALFA-PROTEINY 25 Obrázek 2.16: Supersekundární motiv helix-turn-lielix a fold svazku tvořeného čtyřmi šroubovicemi. Vpravo je propojení helixů ohyby znázorněno schematicky. 9© Obrázek 2.17: Možné topologie svazků čtyř helixů znázorněné schematicky podle obrázku 2.16. Šipky ukazují směr polypeptidového řetězce, tlustou čarou jsou kresleny kroužky natočené k nám iV-koncem. spolu často interagují tak, že do sebe hřebínky postranních řetězců zapadají jako dvě poloviny zdrhovadla (zipu). Protože se hřebínky vinou kolem šroubovic, musí být osy helixů vzájemně otočeny o —52° (dvojnásobek zmíněných —26 °), aby do sebe hřebínky ideálně zapadly (pravá část obrázku 2.18 nahoře). Proto velice často nacházíme ve strukturách proteinu šroubovice svírající spolu úhel kolem minus padesáti stupňů. Kromě hřebínku tvořeného každou čtvrtou aminokyselinou (říkejme mu i + 4-hřebínek) můžeme nalézt i pro aminokyseliny lišící se o tři rezidua (i + 3-hřebínek) nebo pro sousední aminokyseliny (i + 1-hřebínek). Pokud má i + 4-hřebínek zapadat do i + 3-hřebínku nebo i + 1-hřebínku, musí šroubovice svírat úhel +23° respektive —105°. Schematické modely uspořádání šroubovic s různými hřebínky jsou ukázány na obrázku 2.18 dole. Jakým způsobem můžeme popsat foldy tvořené vzájemně pootočenými šroubovicemi? Analýza struktur proteinů ukázala, že helixy velmi často leží v hranách pomyslných mnohostěnů sestavených z rovnostranných trojúhelníků. Obrázek 2.19 ukazuje možnosti, jak uspořádat tři helixy v osmistěnu, čtyři helixy v dvanáctistěnu, pět helixů v šestnáctistěnu a šest helixů v dvacetistěnu. Když uvážíme i různé možnosti propojení helixů, vidíme, že možných foldů je velké, ale omezené množství. Pomyslné mnohostěny sestavené z šroubovic vlastně představují způsob, jak získat zhruba kulový tvar z rovných úseků sekundární struktury a. Přibližně kulové makromolekuly proteinů opět umožňují oddělit nevodné prostředí uvnitř koule od vodného okolí. Podobně jako v případě svazků šroubovic směřují nepolární postranní řetězce většinou dovnitř molekuly a polární ven. Je zajímavé, že foldy složené z více než šesti šroubovic už do pravidelného mnohostěnu uspořádány nejsou. V těchto foldech jsou jeden nebo dva helixy umístěny uvnitř mnohostěnu nebo svazku šroubovic. Takové centrální helixy obsahují především nepolární postranní řetězce. Půjdeme-li v hierarchii struktur ještě výše, dospějeme na úroveň domény. Tímto termínem se označují uspořádané úseky polypeptidového řetězce, které mají nejen pravidelnou strukturu, ale často 26 KAPITOLA 2. STRUKTURA PROTEINŮ Obrázek 2.18: Nahoře vlevo helikální kolo s pořadovými čísly aminokyselin, vpravo ilustrace helixů, které interagují prostřednictvím do sebe zapadajících hřebínků postranních řetězců. Dole schematické modely a-šroubovic s hřebínky valinů vinoucími se kolem šroubovice (vlevo dva i + 4-hřebínky, uprostřed jeden i + 3-hřebínek a jeden i + 4-hřebínek, vpravo dva i + 3-hřebínky). Z postranních řetězců valinů jsou vždy ukázány pouze methylové skupiny, znázorněné jako modré a zelené kuličky. Pod rovnoběžně orientovanými šroubovicemi jsou vždy ukázány šroubovice svírající takový úhel, aby do sebe hřebínky nejlépe zapadaly. 2.11. ALFA-PROTEINY Obrázek 2.19: Ideální uspořádání šroubovic v hranách pomyslných mnohostěnů, značena barevně. Umístění šroubovic jsou 28 KAPITOLA 2. STRUKTURA PROTEINŮ i svou dobře definovanou funkci (například schopnost specificky vázat jinou molekulu, nebo katalyzo-vat enzymovou reakci). Od podjednotek oligomerních proteinů, o kterých se zmíníme v sekci 2.16, se domény vlastně liší jen tím, že jsou součástí jediného peptidového řetězce. Příkladem a-domény mohou být dva čtyřhelixové svazky. Příklady proteinů obsahujících svazek a-šroubovic a globulární struktury s a-šroubovicemi tvořící hrany mnohostěnů jsou ukázány na stereo-obrázcích 2.20-2.24. 2.12 Beta-proteiny Proteiny tvořené skládanými listy bývají nazývány /3-proteiny. Obdobou supersekundárního motivu helix-turn-helix, který jsme si uvedli pro a-proteiny, je u /3-proteinů takzvaná j3-vlásenka (/3-hairpin), která je součástí struktury zobrazené na obrázku 2.25 (vlásenka je v pravé horní části struktury). Název je inspirován tvarem motivu. V /3-hairpinech jsou dvě antiparalelní j3-vlákna spojena krátkým ohybem (takzvaný j3-turn), který může být tvořen dvěma, třemi, nebo čtyřmi aminokyselinami. V případě dvouaminokyselinových /3-ohybů jde nejčastěji o výše zmíněné typy I' a II'. Ramachandranovy diagramy tří- a čtyřaminokyselinových /3-ohybů jsou uvedeny v levé části obrázku 2.26. Spodní část struktury na obrázku 2.25 je /3-obdobou „zlomeného helixu" a nazývá se j3-corner. Pravá část obrázku 2.26 znázorňuje konformace glycinu na vnitřním vlákně j3-corneru, kde dochází ke zlomu a aminokyseliny, kterou je přerušeno párování /3-listu na vnější straně zlomu. Kombinací supersekundárních struktur vznikají /3-foldy, stejně jak jsme si to popsali u a-proteinů. Skládáním většího počtu antiparalelních j3-vláken vznikají j3-meandry (horní část obrázku 2.27). Možných propojení j3-vláken je samozřejmě více. Jako příklad fi-foldu s odlišnou topologií můžeme uvést motivy řeckého klíče (Greek key) a „rolády" (jellyroll), ukázané ve spodní části obrázku 2.27. Na rozdíl od jasně definovaných šroubovic jsou /3-listy mnohem volnější, jak ukazuje mnohem větší konformační volnost v Ramachandranově diagramu. Struktura /3-proteinů je jen výjimečně tvořena jediným skládaným listem. Často dva skládané listy leží proti sobě a tvoří takzvaný j3-sandwich. Základní princip tvorby této struktury je zřejmý na jejím nejjednodušším příkladu, takzvaném motivu /3-/3-/3 (obrázek 2.28 vlevo). Všimněte si, že existují dvě možnosti propojení antiparalelních /3-vláken. Ukázaná pravotočivá konformace je výhodnější a setkáváme se s ní v proteinech17. V (3-sandwichových foldech jsou jednotlivá vlákna zkroucena obvyklým způsobem a protilehlá vlákna jsou vzájemně pootočena asi o 30°. Postranní řetězce mezi listy j3-sandwiche do sebe nezapadají jako v případě interagujících šroubovic, ale směřují spíše proti sobě a vyplňují prostor mezi listy (obrázek 2.28 vpravo). Opět tak vzniká možnost utvořit nepolární prostředí mezi listy. Dva příklady fi-sandwichů s různou topologií jsou ukázány na obrázku 2.29. Jiným typickým foldem /3-proteinů je takzvaný /3-soudek (j3-barreľ), který umožňuje /3-proteinům vytvořit přibližně kulový útvar, s nepolárními postranními řetězci orientovanými dovnitř a polárními ven (obrázek 2.30). Na rozdíl od j3-sandwiche svírají protilehlá vlákna v /3-soudcích téměř pravý úhel. Vlákna tvořící soudek neleží rovnoběžně s osou soudku, ale svírají s ní určitý úhel. Tento úhel je u různých struktur různý, stejně jako počet vláken tvořících soudek (od čtyř po dvacet). Jen některé kombinace ale umožňují vyplnit soudek postranními řetězci a vytvořit tak nepolární dutinu. Existují také proteiny tvořící /3-soudky s hydrofobními aminokyselinami na povrchu a hydrofilními postranními řetězci mířícími dovnitř. Takové proteiny se zabudovávají do membrán jako póry, kterými mohou procházet malé hydronlní molekuly. 17Výliodnost pravotočivého uspořádání souvisí s tím, že /3-vlákna jsou sama zkroucena. Pokud by byla /3-vlákna zcela natažena, musely by smyčky s prostředním /3-vláknem uzavřít celý kruh, tedy umožnit otočení hlavního řetězce o 360°. Jsou-li /3-vlákna zkroucena o 30°, stačí pravotočivém uspořádání stočit hlavní řetězec o 330°, zatímco levotočivé uspořádání by vyžadovalo přetočení o 390°. Čím je úhel otočení menší, tím více kombinací konformací ve spojovacích smyčkách umožňuje správné napojení řetězců. Výhodnost pravotočivé konformace je tedy entropická. 2.12. BETA-PROTEINY Obrázek 2.20: Protein tvořící svazek a-šroubovic: peptid viru tabákové mozaiky (struktura 4GQH.pdb). 30 KAPITOLA 2. STRUKTURA PROTEINŮ Obrázek 2.21: Protein s globulární strukturu složenou ze tří a-šroubovic tvořících hrany osmistěnu: homeo-doména Engrailed (struktura lENH.pdb). 2.12. BETA-PROTEINY 31 Obrázek 2.22: Protein s globulární strukturu složenou ze čtyř a-šroubovic tvořících hrany dvanáctistěnu: střevní protein vázající vápenaté ionty (struktura 3ICB.pdb). 32 KAPITOLA 2. STRUKTURA PROTEINŮ Obrázek 2.23: Protein, jehož C-koncová doména (levá část obrázku) má globulární strukturu složenou z pěti a-šroubovic tvořících hrany šestnáctistěnu: thermolysin (struktura lTMN.pdb). 2.12. BETA-PROTEINY 33 Obrázek 2.24: Protein s globulární strukturu složenou ze šesti a-šroubovic tvořících hrany dvacetistěnu: parval-bumin (struktura 5CPV.pdb). 34 KAPITOLA 2. STRUKTURA PROTEINŮ Obrázek 2.25: Model struktury obsahující /3-vlásenku (vpravo nahoře) a /3-corner (ve spodní části). t g~ g+ t t g~ g+ t g g" -180 o 6 +180 t g + 0 ¥ g" -180 t +180 -180 0 é +180 0 ¥ -180 +180 Obrázek 2.26: Ramachandranův diagram s vyznačením konfromací tří nebo čtyř aminokyselin v ohybu /?-vlásenky (vlevo) a konformací glycinu, na kterém dochází ke zlomu v /3-corneru (vpravo). Význam šipek je podobný jako na obrázku 2.14. 2.12. BETA-PROTEINY 35 Obrázek 2.27: Nahoře ukázka tvorby /3-meandrů kombinací /3-vlásenek, dole motivy řeckého klíče (vlevo) a „rolády". 2.12. BETA-PROTEINY 37 Obrázek 2.30: Rozvinutý list tvořící /3-soudek (nahoře) a schematický nákres soudku (vlevo dole). Pohled dovnitř soudku (vpravo dole) ukazuje uspořádání nepolárních postranních řetězců uvnitř soudku. Postranní řetězce směřující před rovinu a za rovinu nákresu (po svinutí dovnitř soudku a ven) jsou odlišeny plnou respektive tečkovanou čarou obrysu kroužku. Vodíkové vazby jsou vyznačeny čárkovaně. 38 KAPITOLA 2. STRUKTURA PROTEINŮ Obrázek 2.31: Protein se strukturou /3-sandwiche: transthyretin (struktura lETA.pdb). V bohatství foldů /3-proteinů můžeme narazit i na další uspořádání /3-listů. Jednotlivé listy mohou být uspořádány jako lopatky vrtule či turbíny, mluvíme pak o foldu j3-propeller. Listy mohou tvořit stěny trojbokého hranolu (j3-prism), s vlákny orientovanými kolmo k podstavě nebo rovnoběžně s podstavou. Struktuře fí-sandwiche se podobá takzvaný fi-helix, ve kterém jsou protilehlá vlákna téměř rovnoběžná a velmi málo zkroucená. Celé listy pak jsou mírně šroubovicově zkrouceny (pravotočivé nebo levotočivě). Foldy /3-proteinů nám ukazují, jak lze s rozdílnou architekturou dosáhnout stejného cíle, kterým jsme se zabývali v případě a-proteinů. Tímto cílem je vytvoření stabilní struktury s možností oddělení vodného a nevodného prostředí. I u /3-proteinů jsou z foldů stavěny domény, které dále tvoří celkovou terciární strukturu. Příklady /3-sandwiche a /3-soudku jsou ukázány na obrázcích 2.31 a 2.36. 2.13 Alfa+beta-proteiny Mnohé proteiny obsahují a- i j3-foldy, které jsou spojeny až na úrovni vyšších strukturních celků. Takové proteiny, na jejichž stavbě se podílejí oddělené a-motivy a /3-motivy označujeme zkratkou a + j3. 2.14 Alfa/beta-proteiny Kromě a+/3-proteinů s oddělenými částmi tvořenými buď a nebo j3 strukturami se setkáváme s proteiny, v nichž se kombinují a a j3 struktury již na úrovni supersekundárních motivů. Pro tyto proteiny se používá označení a/j3. Jako příklad supersekundárního motivu tvořeného oběma typy sekundárních struktur můžeme uvést j3-a-j3 motiv (obrázek 2.33 nahoře). Jde o dvě paralelní j3-vlákna, mezi která 2.14. ALFA/BETA-PROTEINY 39 Obrázek 2.32: Protein se strukturou /3-soudku: protein vázající retinol (struktura lRBP.pdb). 40 KAPITOLA 2. STRUKTURA PROTEINU Obrázek 2.33: Vlevo nahoře pravotočivý /3-a-/3 motiv (se schematickým znázorněním topologie), vpravo nahoře schematické znázornění topologie Rossmanova foldu, dole schematické znázornění topologie domény tvořené dvěma Rossmanovými foldy. je vložen opačně orientovaný a-helix. Stejně jako v případě J3-J3-J3 motivu se v proteinech vyskytuje výhodnější pravotočivé uspořádání. Pokračujeme-li v kombinování prvků sekundárních struktur a a /?, získáme j3-a-j3-a-j3 strukturu, která se jinak nazývá Rossmanův fold a tvoří vazebná místa pro nukleotidy (obrázek 2.33 nahoře). Popsané j3-a-j3 motivy mohou být uspořádány do vyšších struktur podobně jako j3-listy. Na obrázku 2.33 dole je příklad domény tvořené dvěma Rossmanovými foldy. Jinou možností je sbalení do cyklických (nebo spíše válcových) struktur, obdobných /3-soudkům. Typickým příkladem je architektura poprvé nalezená u enzymu triosafosfatisomerasy, podle toho nazývaná TIM-barrel. V této struktuře tvoří /3-listy uzavřený soudek, obklopený a šroubovicemi (obrázek 2.34 vlevo). Na rozdíl od /3-soudku jsou tentokrát všechna vlákna orientována jedním směrem, jde o paralelní skládaný list. Je pozoruhodné, že pro architekturu TIM-barrelů platí úplně stejná geometrická pravidla, jako pro /3-soudky. Při tvorbě soudků zjevně nezáleží na tom, zda je skládáme z paralalelních nebo antiparalelních vláken. Klasický TIM-barrel je tvořen osmi /3-vlákny a osmi helixy. Vnitřek je vyplněn třemi vrstvami postranních řetězců. Každá z vrstev je tvořena čtyřmi aminokyselinami, postranní řetězce vrchní a spodní vrstvy míří stejným směrem, zatímco prostřední vrstva je pootočena o 45 °. Bylo by asi zbytečné opakovat, že vnitřek soudku může poskytnout nevodné prostředí. 2.15. USPOŘÁDANÉ PROTEINY BEZ SEKUNDÁRNÍ STRUKTURY 41 Obrázek 2.34: Schematické znázornění topologie TIM-barrelu s vyznačenou polohou postranních řetězců vyplňujících soudek (vlevo) a rozvinutý list tvořící TIM-barrel (vpravo). Příklady Rossmannova foldu a TIM-barrelu jsou ukázány na obrázcích 2.35 a ??. 2.15 Uspořádané proteiny bez sekundární struktury Ve velmi vzácných případech neobsahuje architektura proteinu žádné prvky pravidelné sekundární struktury. Jde o malé proteiny, jejichž struktury jsou stabilizovány disulíidovými vazbami (agglutinin) nebo koordinačními vazbami s navázaným kovovým iontem (například ferredoxin). 2.16 Kvarterní struktura a vyšší struktury Polypeptidy tvořící terciární struktury mohou dále agregovat a tvořit oligomerní molekuly. Architektura takových komplexů se označuje jako kvarterní struktura. Oligomery se mohou skládat buď z několika stejných podjednotek (homooligomery) nebo z podjednotek odlišných (heterooligomery). Na rozdíl od domén tvoří podjednotky samostatné polypeptidové řetězce, které mohou být vzájemně vázány kova-lentními disulíidovými vazbami mezi cysteiny jednotlivých podjednotek, nebo různými nekovalentními interakcemi, které jsme diskutovali v sekci 6.2. Je také časté, že funkce proteinů souvisí s opakovanou disociací a zpětnou asociací podjednotek. Velká část proteinů obsahuje jako součást nepeptidovou molekulu. Může jít o jednoduché kovové ionty nebo o složité organické molekuly, jako například vitaminy, chlorofyl, hem, nukleotidy, oligosa-charidy, mastné kyseliny. Nepeptidová část může být k peptidovému řetězci vázána kovalentně (v enzymologii se takto vázaná molekula nazývá prostetická skupina) nebo nekovalentně. Proteiny se mohou dále shlukovat do nadmolekulárních útvarů (například ribozomů), ve kterých často interagují s molekulami většími a složitějším, než jsou samy - jde zejména o oligosacharidy a nukleové kyseliny. Konečně se mohou proteiny podílet se na stavbě buněčných membrán, organel a jiných biologických útvarů, které svými rozměry přesahují hranice „nanosvěta", ve kterém jsme zvyklí se pohybovat v chemii i biochemii. 42 KAPITOLA 2. STRUKTURA PROTEINŮ Obrázek 2.35: Protein se strukturou Rossmanova foldu: malatdehydrogenasa (struktura 5KKA.pdb). 2.16. KVARTERNÍ STRUKTURA A VYŠŠÍ STRUKTURY 43 Obrázek 2.36: Protein se strukturou TIM-barrelu: triosafosfatisomerasa (struktura 5KKA.pdb). KAPITOLA 2. STRUKTURA PROTEINŮ Kapitola 3 Struktura nukleových kyselin 3.1 Stavební jednotky V sekci 2.2 jsme viděli, že „abeceda proteinů" má dvacet písmen, kterými je dvacet geneticky kódovaných proteinogenních aminokyselin. „Abeceda" nukleových kyselin je mnohem jednodušší, tvoří ji pouze čtyři písmena genetického kódu, čtyři nukleotidy. Chemická struktura stavebních jednotek je ale složitější, než v případě proteinů. Každý nukleotid se skládá z pětiuhlíkatého monosacharidu, na který je navázána esterovou vazbou kyselina fosforečná a A^-glykosidickou vazbou aromatický heterocyklus, zvaný báze (obrázek 3.1). Atomy nukleotidů se číslují podle pokynů IUPAC-IUB, které se liší od standardního chemického názvosloví. Sacharidová a aromatická část nukleotidu se číslují zvlášť, proto se pro odlišení čísla atomů sacharidu označují čárkou. Struktury stavebních jednotek ribonukleové kyseliny (RNA) a deoxyribonukleové kyseliny (DNA) se liší ve dvou detailech. Jak již názvy napovídají, první odlišnost se týká sacharidu. V případě RNA je jím ribosa, zatímco v molekule DNA se vyskytuje deoxyribosa, která postrádá hydroxylovou skupinu na uhlíku C2'. Tato zdánlivá drobnost je příčinou velkých rozdílů ve struktuře a funkci RNA a DNA. Zbytek kyseliny fosforečné je navázán v poloze 5' ribosy či deoxyribosy. Tak jako peptidový řetězec vznikal kondenzací karboxylové a aminové skupiny za vzniku amidové vazby, řetězec nukleové kyseliny vzniká kondenzací fosfátové skupiny vázané na uhlík C5' s hydroxyskupinou vázanou na C3' následujícího nukleotidu1. Kyselina fosforečná je tedy v polynukleotidovém řetězci vázána dvěma esterovými vazbami. Ribosy či deoxyribosy spojené přes fosfát tvoří hlavní řetězec nukleových kyselin (nazývaný cukrfosfátová páteř), který je obdobou peptidové páteře proteinů. Roli postranních řetězců hrají v nukleových kyselinách báze. Zatímco konfigurace cukrfosfátové páteře je stejná v celé molekule, postranní řetězec může tvořit jedna ze čtyř bází. Je to tedy báze, co rozlišuje písmena genetické abecedy. Báze nukleových kyselin jsou amino- a hydroxyderiváty purinu a pyrimidinu (hydroxyskupina přechází tautomerií na oxo-formu). Ve struktuře jedné z bází, pyrimidinu hydroxylovaného v polohách 2 a 4, je druhý chemický rozdíl mezi RNA a DNA. Zatímco v RNA se vyskytuje přímo 2,4-dihydroxypyrimidin (nazývá se uracil), v DNA nacházíme derivát této báze s methylovou skupinou na uhlíku C5 (označovaný jako thymin). Prvním písmenem genetické abecedy je tedy U (=uracil, v RNA) nebo T(=thymin, v DNA). Druhou pyrimidinovou bází je cytosin (C). Všimněme si, jak se liší struktury těchto bází vzhledem k možnosti tvorby vodíkových vazeb. Uracil a thymin mají donor v poloze 3 a akceptory v polohách 2 a 4. U cytosinu jsou v důsledku náhrady hydroxylu v poloze 4 aminoskupinou role donoru a akceptoru v polohách 3 a -'-"Uvědomme si, že v deoxyribose po utvoření této vazby nezbývá žádný volný liydroxyl. Proto je DNA mnohem méně reaktivní než RNA, ve které je na ribose ještě hydroxyl v poloze C2'. 45 46 KAPITOLA 3. STRUKTURA NUKLEOVÝCH KYSELIN T7,s/4 , \ ľ V ..... n\..... V .„ rr,\ ~o \ ÍH5-H6-C6 J N3H3 \ ÍH5" H6 _c| [J N3H3 ^ /VH5' \ / o& Ah5- \ / ,N1_ Q? ^rf* N1— C2 ^P3"—H11 H3 yC3' — H1 ■ ^03' H2" ^03' 02'H2' H62 \ ^H61 \- N6 \ 06 / N4—H41 // M7 / H42 H5 N4-H41 // N7 \ / W ^CÍ H8_f ^C5^\ C5-C4 H8-cf 95 N...... C\8 // A%1 N1 —C2 / \ H6-wo ^ .,0 N9-C4 ~" / /"" \ <í>C2 \ / / \ -í>C2 / N3 \ N1 —C2 / N3 \ ^H21 H2 N2 H22 Obrázek 3.1: Struktura typické stavební jednotky DNA (vlevo nahoře) a RNA (vpravo nahoře). Ve stavebních jednotkách jsou zabudovány báze thymin a uracil, rterými se DNA a RNA liší. Dole jsou ukázány tři báze společné DNA i RNA (cytosin, guanin a adenin). Atomy jsou číslovány podle doporučení IUPAC-IUB. 3.2. TORZNÍ ÚHLY 47 4 vyměněny. Jakýsi zrcadlový obraz vztahů, jaké jsme popsali u pyrimidinových bází, platí i pro další dvě písmena genetického kódu. Jsou to báze odvozené od většího heterocyklu purinu. Adenin (A) má v poloze 6 aminoskupinu (donor) a dusík NI slouží jako akceptor. Guanin (G) má v poloze 6 hydroxyl a v poloze 2 aminoskupinu, takže ve výsledné tautomerní formě jsou donory v polohách 1 a 2 a akceptor v poloze 6. Jako aromatické heterocykly jsou báze nukleových kyselin ploché. V molekule nukleové kyseliny mohou báze vzájemně interagovat buď plochami nebo hranami. Pokud jsou báze uspořádány nad sebou tak, že se k sobě blíží celou plochou (která je vymezena elektrony v delokalizovaných orbitalech, jež dodávají bázi aromatický charakter), dochází ke složité interakci zvané stacking. Pokud se naopak báze k sobě blíží hranami, jsou velmi důležité vodíkové vazby mezi atomy, které tvoří příslušné hrany. Jeden z dusíků bází (NI pyrimidinových a N9 purinových) je vázán glykosidickou vazbou k uhlíku Cl' ribosy nebo deoxyribosy. Ribosa s navázanou bází (bez fosfátu) se nazývá nukleosid. Nukleosidy tvořené uracilem, thyminem, cytosinem, adeninem a guaninem se nazývají (ve stejném pořadí) uridin, thymidin, cytidin, adenosin a guanosin2. 3.2 Torzní úhly Zatímco konformace peptidové páteře aminokyselin je určena třemi torzními úhly, k popisu cukrfosfátové páteře nukleových kyselin je třeba úhlů šest: a (definovaný atomy 03^_1; pí, 05^, C5Q, j3 (definovaný atomy Pí; 05-, C5-, C4£), 7 (definovaný atomy 05-, C5-, C4^, C3-), 5 (definovaný atomy C5-, C4^, C3^, 039, e (definovaný atomy C4^, C3^, 03^, Pí+i), C (definovaný atomy C3^, 03^, Pí+i, 05^+1). K určení geometrie celého nukleotidu je dále třeba určit konformaci furanosového kruhu (deoxy)ribosy a glykosidický torzní úhel x (definovaný atomy 04^, Cl^, Nlj, C2^ u pyrimidinů a 04^, Cl^, N9i, C4^ u purinů). Protože konformace pětičetného cyklu (stejně jako jakéhokoli řetězce pěti atomů, viz sekci 1.2) je jednoznačně dána dvěma torzními úhly a protože jeden z těchto úhlů je již definován úhlem S, celkový počet torzních úhlů potřebných k popisu nukleotidu je osm. Až dosud jsme se vždy zabývali torzními úhly v lineárních řetězcích. Ribosa představuje příklad cyklického řetězce. Pentosový kruh má poměrně bohatý výběr různých konformaci: může být buď v obálkové konformaci (E, envelope), kdy čtyři atomy cyklu leží v rovině, nebo v konformaci zkřížené položidličky (T, twisted halfchair), kdy tři atomy leží v rovině, jeden nad rovinou a jeden pod rovinou. V E konformaci může být každý z pěti atomů buď nad rovinou kruhu {endo, orientován „dovnitř" nukleotidu) nebo pod ní (exo, orientován „ven" z nukleotidu). Schematicky značíme takový atom horním (endo) nebo dolním (exo) indexem (například 3E, C3'-exo). Podobně existuje deset zkřížených konformerů, které rozlišujeme obdobně definovanými indexy. Uhly3 vi popisující konformaci cukerného kruhu4 jsou definovány podél směru (deoxy)ribosového řetězce: v\ definovaný atomy 04^, Cl^, C2^, C3^ až po vq definovaný atomy C4^, 04^, Cl^, C2^. Vidíme, že v pětičlenném kruhu můžeme naměřit pět torzních úhlů vi, z nichž k popisu konformace postačují libovolné dva. Je tedy otázkou, které z nich použít. K popisu furanosových konformaci se často používá formalismus takzvané pseudorotace, který problém volby dvou torzních úhlů obchází definicí dvou nových proměnných, které nahrazují dvojici torzních úhlů. První z těchto proměnných je pseudorotační fáze P. Slouží jako střelka kompasu (obrázek 3.2), na němž je každý typ konformerů definován určitým azimutem. Druhým parametrem, nezbytným k jednoznačnému určení geometrie je pseudorotační amplituda tym, která udává, o kolik je příslušný atom vychýlen z roviny. Pseudorotační parametry lze na endocyklické úhly Ví přepočítat pomocí vztahu 2 Pozor na odlišný význam koncovky -osin u cytosinu a purinových nukleosidů. 3Tyto torzní úhly, definované atomy, které přímo tvoří cyklický řetězec, se nazývají endocyklické. 4V anglické literatuře se pro tento druh konformace používá označení pucker. 48 KAPITOLA 3. STRUKTURA NUKLEOVÝCH KYSELIN vt = Wm cos (P +144°(í -2)) (3.1) Dennice týkající se konformací a pseudorotace jsou opět dány pravidly IUPAC-IUB. 3.3 Primární struktura Význam pojmu primární struktura je u nukleových kyselin stejný jako u proteinů. Pořadí (sekvence) nukleotidů se podle konvence čte od 5' konce do 3' konce vlákna nukleové kyseliny. Zejména v případě prezentace dvoušroubovicových sekvencí je vhodné 5' a 3' konce vláken označit. Jak jsme zmínili v sekci 2.4, je určení sekvence nukleových kyselin poměrně snadné a primární struktura (konfigurace) je vždy známá dříve, než je řešena trojrozměrná struktura (konformace). 3.4 Sekundární struktura Na základě analogie s proteiny sekundární strukturou označujeme pravidelný, libovolně opakovatelný konformační motiv polynukleotidového řetězce. Základními sekundárními strukturami nukleových kyselin jsou dvouvláknové šroubovice stabilizované vodíkovými vazbami mezi bázemi. Všimněme si důležitého rozdílu mezi proteiny a nukleovými kyselinami: u sekundárních struktur proteinů jsme vždy hovořili o vodíkových vazbách mezi atomy páteře, zatímco dvoj šroubovice nukleových kyselin jsou spojené sítí vodíkových vazeb mezi bázemi, které tvoří postranní řetězce polynukleotidu. Sekundární struktura není proto určena pouze konformací páteře, jako v případě proteinů. Je proto třeba definovat všech osm torzních úhlů určujících konformaci nukleotidu, aby byl strukturní motiv jednoznačně popsán. Stejně jako proteiny, tvoří nukleové kyseliny dva základní typy sekundárních struktur, A a B. Na rozdíl od proteinových a a j3 struktur se zmíněné sekundární struktury nukleových kyselin liší poměrně málo. V obou případech jde o pravotočivou dvojšroubovici, ve které jsou antiparalelní vlákna spojena bázemi párujícími se stejným způsobem. Způsob párování bází je klíčem k pochopení struktury dvojšroubovic nukleových kyselin. Vzpomeňme si na sekci 3.1, kde jsme si popisovali uspořádání donorů a akceptorů vodíkových vazeb v bázích. Zkusme si nakreslit jednu purinovou a jednu pyrimidinovou bázi. Začněme šestičlennými kruhy, natočenými „naležato" tak aby dusík NI purinu a dusík N3 pyrimidinu ležely proti sobě. Nakresleme vzorce bází tak, aby jedna glykosidická vazba směřovala vpravo dolů a druhá vlevo dolů (uspořádání cis). V uspořádání, které jsme si právě nakreslili (obrázek 3.3), se báze stýkají hranami, které obsahují nejvíce donorů a akceptorů vodíkových vazeb. Aby se vodíkové vazby mohly vytvořit, musí ležet vždy akceptor proti donorů. To je možné pouze tehdy, když guanin tvoří pár s cytosinem a adenin s uracilem nebo thyminem. Všimněme si, že všechny páry popsané v předchozím odstavci mají téměř stejný tvar (jsou izos-terické). Páruje se vždy menší pyrimidinová báze s větší purinovou a vcelku nezáleží na tom, která je vpravo a která vlevo. Tento způsob párování se nazývá podle Watsona a Cricka a zaručuje věrné předávání genetické informace. Máme-li jedno vlákno, které kóduje dědičnou informaci, může se s každou jeho bází párovat jen jedna určitá báze vlákna druhého. Pokud bude druhé vlákno dosyntetizováno tak, aby se všechny báze párovaly, ponese stejnou informaci. Ale pozor, toto druhé vlákno nebude kopií prvního. Vztah mezi nimi bude stejný jako vztah mezi formou a odlitkem, teprve další syntézou vlákna, které by se párovalo s vláknem novým, bychom získali stejné pořadí bází. Stejný tvar všech párů bází podle Watsona a Cricka umožňuje, aby byly součástí pravidelného útvaru - dvoj šroubovice (viz obrázek 3.7). V ní musí mít správnou hodnotu také osm torzních úhlů, které popisují konformaci nukleotidu. V obou typech dvojšroubovic je konformace taková, že v páru nakresleném tak, jak jsme výše popsali, vystupuje hlavní řetězec báze nakreslené vlevo z roviny papíru k nám a hlavní řetězec báze nakreslené vpravo míří dolů pod rovinu papíru. Tabulka 3.1 udává typické 3.4. SEKUNDÁRNÍ STRUKTURA 49 Obrázek 3.2: Pseudorotační kruh (deoxy)ribosy. Uvnitř kruhu je uvedeno symbolické značení konformací, vně kruhu pseudorodační fáze ve stupních a slovní označení konformací. Na obvodu diagramu jsou schematicky znázorněny struktury jednotlivých konformerů. Atomy jsou symbolizovány kroužky (nejdále od středu je vždy kyslík 04'). Symbol v kroužku uvádí, leží-li daný atom v rovině nákresu (0)> nad rovinou (+), nebo pod rovinou nákresu (—). Znaménka u vazeb udávají, zda je daný torzní úhel kladný nebo záporný. 50 KAPITOLA 3. STRUKTURA NUKLEOVÝCH KYSELIN H T-A C=G Obrázek 3.3: Párování bází podle Watsona a Cricka. hodnoty jednotlivých torzních úhlů (ve stupních) pro obě dvojšroubovice. Pro úplnost je uveden i úhel S, ačkoli je jeho hodnota jednoznačně určena pseudorotačními parametry P a Tabulka 3.1: Hodnoty torzních úhlů ideálních dvojšroubovic. a P 7 5 e C X P B-DNA -41 136 38 139 -133 -57 78 155 40 A-DNA -90 -149 47 83 175 -45 27 13 40 A-RNA -80 175 49 83 -147 -78 13 13 40 Tabulka 3.1 ukazuje, že nejvýraznější rozdíl torzních úhlů se týká konformace cukru. Zatímco (de-oxy)ribosa dvojšroubovice A je v konformaci C3'-endo, deoxyribosa dvojšroubovice B je v konformaci C2'-endo (pro RNA je tato konformace nevýhodná). Vzhledem k jistým odchylkám od takto přesně definovaných konformaci v reálných molekulách se často označují zmíněné konformace cukrů N a S (nalézají se v „severní" (north) respektive ,jižní" (south) části pseudorotačního kompasu). Jak ukazuje obrázek 3.7, cukrfosfátová páteř ovíjí dvojšroubovici zvenčí, takže zbytky kyseliny fosforečné (za běžných podmínek v disociovaném stavu, tedy záporně nabité) jsou velmi dobře přístupné. Báze jsou naopak uvnitř dvojšroubovice, ne však zcela skryté. Mezi páteřemi jsou dostatečně široké žlábky, které umožňují jiným molekulám (nebo jiným částem téhož polynukleotidového řetězce) inter-agovat s bázemi. Každou bázi si můžeme zjednodušeně představit jako trojúhelník (obrázek 3.4). Tyto trojúhelníky jsou párovány jednou hranou (Watson-Crickovou), druhá hrana je přístupná z žlábku po jedné straně páteře a třetí hrana je přístupná z žlábku po druhé straně páteře. Z vnějšího pohledu se liší vzhled žlábků mezi páteřemi jednotlivých vláken na povrchu dvojšroubovic. Dvojšroubovice B má jeden žlábek širší a hlubší (označuje se hluboký nebo velký) a druhý užší a mělčí (označuje se mělký nebo malý), zatímco dvojšroubovice A má jeden žlábek velmi úzký a hluboký (označuje se hluboký) a druhý široký a velmi mělký (označuje se mělký). V obou případech do hlubokého žlábku směřuje hrana, která se u purinů nazývá Hoogsteenova a u pyrimidinů „C-H" hrana5. Do mělkého žlábku naopak směřuje hrana v blízkosti glykosidické vazby, pro kterou byl proto navržen název „sugar-edge" (do češtiny můžeme přeložit „sacharidová"). Při pohledu podél osy dvojšroubovice je patrná dutina ve středu dvojšroubovice A. Dvojšroubovice A má také poněkud pozvolnější stoupání (11 reziduí na závit) ve srovnání s dvojšroubovici B (10 reziduí 5Ve snaze o jednotnost názvosloví se často používá název „Hoogsteenova" i pro „C-H" hranu pyrimidinů. 3.5. TERCIÁRNÍ STRUKTURA 51 na závit). Pro popis vzájemné polohy bází ve dvojšroubovicích byly definovány takzvané helikální parametry (obrázky 3.5 a 3.6). Na první pohled je patrný rozdíl v inklinaci. Zatímco báze v dvojšroubovici B jsou téměř kolmé k ose, normály bází v dvojšroubovici A svírají s osou úhel asi 20°. Dvojšroubovice B a A jsou ukázány na obrázku 3.7 a na modelech A a B. Podobně jako u proteinů se konformace DNA neomezují na popsané typické sekundární struktury. V závislosti na sekvenci a fyzikálních podmínkách se setkáváme s mnoha odlišnými strukturami (viz například zprohýbaná levotočivá dvojšroubovice Z u sekvencí s opakující se dvojicí CG). 3.5 Terciární struktura DNA se jako nosič genetické informace nejčastěji vyskytuje ve formě dvojšroubovice B (i když se za určitých fyziologických podmínek a na určitých místech můžeme setkat s čtyřšroubovicovými, větvenými a jinými strukturami). Prostorové uspořádání RNA je naproti tomu pestřejší a připomíná daleko více terciární struktury proteinů. Molekuly RNA jsou tvořeny úseky dvojšroubovic A (nazývaných stems, stonky) spojenými různými spojovacími prvky. Stejně jako v proteinových ohybech se u spojovacích prvků nukleových kyselin setkáváme s odlišnými hodnotami torzních úhlů a odlišnou tvorbou vodíkových vazeb. Za zmínku stojí, že se párují i báze vyskytující se mimo pravidelné dvojšroubovice. Na rozdíl od kanonických párů, popsaných v sekci 3.4, je zde mnoho možností, jak síť vodíkových vazeb vytvořit. Mimo dvojšroubovice nejsou tvary párů limitovány pravidelnou strukturou, takže guanin se může dobře párovat i s uracilem, adeninem či jiným glycinem. Vodíkové vazby se tvoří nejen mezi dvěma Watson-Crickovými hranami, ale možné jsou všechny kombinace tří hran (Watson-Crickova, Hoogsteenova, sacharidová). Glykosidické vazby navíc nemusí být v poloze cis, ale možná je i poloha trans, kdy glykosidické vazby míří opačným směrem. Celkově je tak k dispozici 12 typů párování (obrázek 3.8), příklady některých nekanonických párů jsou uvedeny na obrázku 3.9. V každém páru je využita jen jedna hrana jednotlivých bází, takže báze párovaná jedním způsobem (například podle Watsona a Cricka) může stále interagovat další hranou (například Hoogs-teenovou). Takovým způsobem vznikají triplety bází, které mohou spojovat dvojšroubovice s dalším vláknem, aniž by se výrazně měnila pravidelná dvoušroubovicová struktura. 52 KAPITOLA 3. STRUKTURA NUKLEOVÝCH KYSELIN ■^-displacement (dy) x-displacement (dx) Stagger (Sz) Stretch (Sy) Shear (Sx) Rise {Dz) Slide (Dy) Shift (Dx) Obrázek 3.5: Translační helikální parametry. V levém horním rohu je znázorněna souřadná soustava, ve které se helikální parametry udávají. Parametry v horní řadě udávají posunutí párů bází jako celků (souběžná posunutí), parametry ve střední řadě udávají vzájemné posunutí bází v jednotlivých párech vůči sobě (protisměrná posunutí), parametry v dolní řadě udávají vzájemná posunutí sousedních párů bází. Posunutí ve směru osy :í\ y, z jsou seřazena zprava doleva. 3.5. TERCIÁRNÍ STRUKTURA 53 Tip (6) Inclination (77) Opening (er) Propeller twist (a;) Buckle (k) Twist (Q) Roll (p) Tilt (r) Obrázek 3.6: Rotační helikální parametry. V levém horním rohu je znázorněna souřadná soustava, ve které se helikální parametry udávají. Parametry v horní řadě udávají natočení párů bází jako celků (souběžné rotace), parametry ve střední řadě udávají vzájemná natočení bází v jednotlivých párech vůči sobě (protisměrné rotace), parametry v dolní řadě udávají vzájemná natočení sousedních párů bází. Rotace kolem osy x, y, z jsou seřazeny zprava doleva. 54 KAPITOLA 3. STRUKTURA NUKLEOVÝCH KYSELIN Obrázek 3.7: Modely DNA šroubovic B a A. Obrázek 3.8: Možné způsoby párování bází. Báze jsou znázorněny jako trojúhelníky s udáním směru hlavního řetězce (0 směřuje dopředu z roviny nákresu, ® směřuje dozadu za rovinu nákresu). Hrany jsou rozlišeny délkou stran trujúhelníku - nejkratší Watson-Crickova, prostřední sacharidová, nejdelší Hoogsteenova nebo „C-H" Nahoře jsou znázorněna párování s cis uspořádáním glykosidických vazeb, dole s trans uspořádáním glykosidických vazeb. 3.5. TERCIÁRNÍ STR UKTURA 55 Obrázek 3.9: Příklady nekanonických párů bází: vlevo nahoře cis párování uracilu (Watson-Crickovou hranou) s adeninem (Hoogsteenovou hranou), vpravo nahoře trans párování dvou adeninů Hoogsteenovými hranami, vlevo dole cis párování dvou cytosinů sacharidovou a ,,C-H" („Hoogsteenovou") hranou, vpravo dole trans párování cytosinu a guaninu Watson-Crickovými hranami. 56 KAPITOLA 3. STRUKTURA NUKLEOVÝCH KYSELIN Obrázek 3.10: Příklady strukturních motivů nukleových kyselin. Zleva vlásenková smyčka (hairpin loops), zlom s včleněným nepárovaným nukleotidem bulge, internal loop, four-way junction, pseudouzel pseudoknot, kissing hairpin. Pravidelné dvojšroubovice a struktury zmíněné v předchozím odstavci mohou tvořit supersekundární motivy podobné proteinovým (obrázek 3.10), jako vlásenkové smyčky (hairpin loops) a zlomy (kinks) v dvojšroubovici. Supersekundární struktury typické pro nukleové kyseliny jsou dále různé vnitřní smyčky (internal loops) a větvení (junctions). Z vyšších strukturních prvků můžeme jmenovat trojšroubovicová uspořádání, kvadruplexy (útvary tvořené čtyřmi vlákny), pseudouzly (pseudoknots), neobvykle vzájemně párované smyčky romanticky označované kissing hairpins (obrázek 3.10). Domény RNA jsou definovány stejně jako v případě proteinů. Například velká podjednotka bakteriální ribosomové RNA je tvořena šesti doménami, z nichž každá má specifickou funkci a samostatnou strukturu. 3.6 Kvartérní struktura a vyšší struktury Pojem kvartérní struktury můžeme převzít tak, jak jsme si jej definovali pro proteiny. Nukleové kyseliny často tvoří funkční oligomerní komplexy s proteiny. Podobně jako proteiny se ribonukleové kyseliny podílí na stavbě nadmolekulárních útvarů (opět můžeme jmenovat ribosom). Pravidelné šroubovice DNA jsou dále svinuty do nadšroubovicových útvarů až po úroveň chromozomů6. Zde je ovšem nutné poznamenat, že nadšroubovice jsou útvary lišící se nejen konformací, ale i konfigurací. K jejich vytvoření a zrušení je totiž nutno přerušit alespoň jedno vlákno. Nadšroubovice se obvykle popisují dvěma čísly, L (linking number) definuje topologii nadšroubovice (kolikrát jsou jednotlivá vlákna překřížena) a T (twist) definuje geometrii (zkroucení dvojšroubovice). 6 Jednotlivá vlákna musí být kruhová nebo pevně uchycená například k proteinům, jinak by se nadšroubovice samovolně rozpletla. Kapitola 4 Struktura oligo- a polysacharidu 4.1 Stavební jednotky Nej nápadnějším rysem, který bude naši diskusi struktur oligosacharidů a polysacharidu provázet, je neobyčejná pestrost. Mnohem větší strukturní různorodost sacharidů ve srovnání s proteiny a nukleovými kyselinami se u oligo- a polysacharidu objevuje již na úrovni monomerních jednotek. Základní stavební jednotky se liší počtem uhlíků (nejčastější jsou hexosy a pentosy), funkční skupinou (aldosy a ketosy), geometrickou isomerií hydroxylů (2™ optických isomerů, kde n je počet chirálních uhlíků), možnou substitucí (sulfátem, karboxylem, aminem, A^-acetylaminem), počtem uhlíků v kruhu (furanosy a pyranosy), konformací cukerného kruhu, polohou a počtem hydroxylů, které tvoří glykosidickou vazbu se sousedním reziduem. Nejběžnější monosacharidové jednotky jsou uvedeny na obrázku 4.1. Názvosloví sacharidů se řídí pokyny IUPAC-IUB. 4.2 Torzní úhly Monosacharidové jednotky se vyskytují nejčastěji ve formě pětičlenných a šestičlenných kruhů. Sacharidy s pětičlenným cyklem se nazývají furanosy, zatímco sacharidy s šestičlenným cyklem se označují jako pyranosy. Možné konformace furanos byly již probrány u nukleových kyselin. K popisu konformace šestičlenných kruhů potřebujeme tři torzní úhly. Nejběžnější konformace šestičlenných cyklů jsou takové, ve kterých vystupují dva protilehlé atomy z roviny, ve které leží zbývající čtyři atomy. Většinou je nejvýhodnější židličková konformace, ve které se pyranosy vyskytují nejčastěji. V židličkové konformaci jeden z protilehlých atomů leží nad rovinou a druhý pod rovinou. Židličkou můžeme proložit rovinu ještě jinak - tak, aby střídavě jeden z atomů ležel nad rovinou a druhý pod rovinou. Vidíme, že takto můžeme sestavit jen dvě různé židličky (v první židličce leží jedna trojice atomů nad rovinou a druhá pod rovinou, v druhé židličce se polohy trojic vymění). Proto existují jen dvě židličkové konformace, které se označují 4Ci nebo 1C*4 (horní index udává číslo atomu nad rovinou, dolní index udává číslo atomů pod rovinou kruhu orientovaného tak, jak ukazuje obrázek 4.1). Která z těchto konformací je energeticky výhodnější, je dáno tím, jaké substituenty jsou vázány na uhlících kruhu. Každý uhlík může vázat kromě svých sousedů v kruhu ještě dva další atomy. Jedna z těchto vazeb míří přibližně kolmo k rovině proložené pyranosovým kruhem (tato poloha se označuje axiální), druhá leží zhruba v této rovině (poloha ekvatoriální). Ze sférických důvodů jsou nejstabilnější konformace s maximálním počtem objemných substituentů v ekvatoriální poloze (4Ci pro D-glukosu). Pokud oba protilehlé atomy leží nad rovinou kruhu, mluvíme o vaničkové konformaci. Takových vaniček můžeme sestrojit šest: 1,AB, 2'5B, 3'°B, í^B, 2,5-B, 3,0-8 (horní indexy opět značí atomy nad 57 58 KAPITOLA 4. STRUKTURA OLIGO- A POLYSACHARIDU HOH, HO OH ct-L-arabinofuranosa-& V/^O HO^-^ CH2OH HO' V-^-Tii-OH OH a-L-arabinopyranosa-4C] 2-deoxy-D-nbosa- i? OH /3-D-nboŕuranosa-3i? HO H HO\/^CH7OH /3-D-galaktopyranosa-4Ci OH OH /3-L-galaktopyranosa- lC$ OH oh ^-D-glukopyranosa-4Ci OH .o'-D-glukofuranosa-'1^ ~0^/ CH,OH -OH OH HO^ HO- /3-D-fruktofuranosa- E OH OH /í-D-fruktopyranosa-1^ OH OH L-fukopyranosa-1^ OH D-ehmovopyranosa-4Ci HO' HO- ŕ-D-xylopyranosa-4^ ľ ch?oh ^ ^ ^v^o nL'Cľ--Z" C>ÍP" ?^ ^£^h hhÄ^VoH ^» hhÄA/' OH HH OH 0H I ^-D-mannopyraiiosa-"1^! HO^V^2-OH /^0-7^CH,0H hc^^011 HO^V^0\ H3C ^7\Q^^ HO^^^X Ĺ^T^^Í-OH 3 l^-1^^í-\c^^o^Lc HOH2C HO kys. /5-D-mannopyranurová-46'i OH glukosamm-4^ galaktosamm-4('. H2N -Ľ^f~ ' OH kys. neurammová-'C. OwbiiJq HN- 0={ OH CH3 kys. W-acetyl] OH •O-""/ COOH Obrázek 4.1: Vzorce nej častějších monosacharidových jednotek oligo- a polysacharidu. Ze dvou možných ano-nierů a a /3 je vždy uveden jen jeden. 4.3. PRIMÁRNÍ STRUKTURA 59 rovinou a dolní indexy atomy pod rovinou). Popis jednotlivých konformací1 se řídí pravidly IUPAC-IUB. Stabilita pyranosových konformerů je tak velká, že je lze považovat za rigidní strukturní jednotky. Konformaci polysacharidového řetězce lze proto zpravidla popsat dvěma (, ip) nebo třemi (, ip, lS) torzními úhly. Uhel (p definuje torzi kolem glykosidické vazby. Uhel uj je nezbytný pokud glykosidickou vazbu tvořící hydroxyl není vázaný přímo na uhlík pyranosového nebo furanosového kruhu, ale na methylenový uhlík (například u (1 —> 6) vázaných aldopyranos nebo (1 —> 5) vázaných ketofuranos). Definice torzních úhlů se řídí pravidly IUPAC-IUB. 4.3 Primární struktura Vzhledem k možnosti větvení a k zmíněné pestrosti monomerních jednotek je definice primární struktury oligo- a polysacharidu složitější než v případě proteinů a nukleových kyselin. Pravidla pro zápis primární struktury oligosacharidů lze nalézt v doporučeních IUPAC-IUC. Další důležitou odlišností od proteinů a nukleových kyselin je skutečnost, že primární strukturu oligo- a polysacharidu nelze přímo vyčíst z genetického kódu. Určování primární struktury je proto v případě sacharidů mnohem obtížnější, než v případě proteinů a nukleových kyselin. 4.4 Sekundární struktura Pestrost sekundárních struktur polysacharidu ostře kontrastuje s dvojicí typických strukturních motivů proteinů a nukleových kyselin. Analogie s popisem sekundárních struktur proteinů jsou ale zřejmé. Stejně jako u proteinů, můžeme sekundární struktury polysacharidu formálně považovat za šroubovice. K jejich popisu bývají používána dvě čísla: počet monosacharidových jednotek na jeden závit n a stoupání šroubovice na jednu monosacharidovou jednotku h (nebo stoupání šroubovice na jeden závit P). Sekundární struktury jsou opět stabilizovány vodíkovými můstky mezi závity téže šroubovice (jako u a-helixu proteinů) nebo spojující dvě polysacharidová vlákna (jako v j3-listech proteinů). Sekundární struktury polysacharidu můžeme dělit na šroubovicově vinuté (například amylosa, analogie s a-šroubovicí proteinů) na natažené (formálně šroubovice, ve které na jeden závit připadnou dvě rezidua, například celulosa, analogie s j3-listy proteinů). Některé struktury polysacharidu nelze zařadit do těchto dvou kategorií, jako například velmi flexibilní dextrany vázané (1 —> 6) glykosidickou vazbou nebo naopak těsně skládané bakteriální (1 —> 2) glukany. 4.5 Terciární struktura Sacharidy mohou tvořit velmi dlouhé řetězce, často s širokou hmotnostní distribucí. Díky větvení mohou vznikat polysacharidy přibližně kulového tvaru. Naopak přesně definované oligosacharidové struktury plní důležitou úlohu v molekulovém rozeznávání. Na rozdíl od proteinů jsou terciární struktury polysacharidu méně prozkoumány. Příkladem architektury polysacharidu může být celulosa, základní složka buněčných stěn rostlin. Sekundárním motivem celulosy je natažený řetězec /3-D-glukopyranos-4Ci spojených (1 —> 4) glykosidickou vazbou. Jde tedy formálně o šroubovici s dvěma /3-D-glukopyranosovými jednotkami na jeden „závit" jinými slovy, 4Ci-židličky /3-D-glukopyranos se střídají tak, že kyslík pyranosového kruhu leží -•-Kromě popsaných konformací, ve kterých jsou atomy ležící mimo rovinu odděleny dvěma atomy kruhu, vyskytují se vzácně i konformace, kde leží mimo rovinu atomy oddělené jen jedním atomem (šikmé židličky, S) nebo sousední atomy (položidličky, H). Podobně jako v případě furanos lze pyransové konformace popsat pomocí pseudorotace. Vzhledem k tomu, že šestičlenné cykly vyžadují tři nezávislé parametry, nevystačíme s pseudorotačním kruhem, ale musíme definovat pseudorotační kouli. 60 KAPITOLA 4. STRUKTURA OLIGO- A POLYSACHARIDU Obrázek 4.2: Uspořádání řetězců v celulose Ia (vlevo) a Ip (vpravo). Střídající se /3-D-glukopyranosové kruhy s kyslíkem nad a pod rovinou řetězce jsou znázorněny jako plné a prázdné obdélníky. jednou nad rovinou a podruhé pod rovinou řetězce. V tomto uspořádání leží všechny hydroxyly v ekva-toriální poloze (v rovině kruhu). Vytváří se tak polární prostředí po bocích celulosového řetězce a nepolární prostředí nad a pod rovinou řetězce. Natažené řetězce se k sobě skládají nepolárními plochami a tvoří krystalovou strukturu označovanou I. Kromě hydrofobních interakcí je tato struktura stabilizována sítí vodíkových vazeb v rámci jednoho řetězce i mezi sousedními řetězci. Je zajímavé, že glykosidická vazba celulosy I je v konformaci trans-gauche a řetězce směřují stejným směrem (paralelní uspořádání), ačkoli energeticky výhodnější je gauche-trans konformace glykosidické vazby a střídavá (antiparalelní) orientace řetězců. Přirozená forma celulosy je tedy metastabilní2, na energeticky nejvýhodnější formu, označovanou II, přechází až umělým zpracováním. Celulosa I se vyskytuje ve dvou formách Ia a Ip, které se liší vzájemným uspořádáním řetězců (obrázek 4.2). Formy Ia a Ip se mohou střídat i v rámci jednoho celulosového vlákna, jehož délka dosahuje do 10 000 /3-D-glukopyranosových jednotek. Jiným příkladem polysacharidu je zásobní látka rostlin, škrob. Základní stavební jednoty škrobu jsou a-D-glukopyranosy-4Ci, spojené (1 —> 4) glykosidickou vazbou. Řetězce a-D-glukopyranos mohou tvořit různé šroubovicové struktury, z nichž nejdůležitější je paralelní dvojšroubovice s výškou závitu 0,5 nm a šesti až sedmi jednotkami na jeden závit. Stejně jako v případě celulosy je důležité uspořádání hydroxylů, které směřují na povrch šroubovic, takže vnitřek šroubovic je nepolární. Škrob se skládá z nevětvených řetězců amylosy a obřích molekul amylopektinu, které jsou tvořeny přibližně milionem a-D-glukopyranosových jednotek, a které obsahují i větvení prostřednictvím (1 —> 6) glykosidické vazby. Větvení nijak nevadí dvojšroubovicové struktuře, naopak ji spíše stabilizuje. Dvoj šroubovicové úseky mezi větveními jsou základem vrstevnaté struktury škrobových zrn (obrázek 4.3). V těchto vrstvách jsou dvojšroubovice pravidelně uspořádány jako v krystalech. Řetězce amylosy jsou nejspíše náhodně rozptýleny jako jednoduché šroubovice mezi amylopektinovými řetězci (zvláště na povrchu škrobových zrn), částečně se mohou také podílet na tvorbě dvoj šroubovic. Stejně jako jiné biomakromolekuly tvoří oligo- a polysacharidy funkční komplexy s proteiny a podílejí se na tvorbě vyšších struktur buněčné architektury. Je také důležité si uvědomit, že velkou skupinou bi-omakromolekul jsou glykoproteiny, jejichž oligosacharidová část je co do velikosti, důležitosti a stability konformace srovnatelná s částí proteinovou. 2 Přítomnost metastabilní celulosy I je vysvětlována tím, že celulosová vlákna se tvoří krátce po biosyntéze, během které rostou celulosové řetězce jedním směrem, a na přeskládání do výhodnějšího antiparalelního uspořádání není dost času. 4.5. TERCIÁRNÍ STRUKTURA 61 Obrázek 4.3: Schematické znázornění větvení amylopektinu. Rovnoběžné čáry představují paralelní dvojšroubovice. KAPITOLA 4. STRUKTURA OLIGO- A POLYSACHARIDU Kapitola 5 Struktura biologických membrán 5.1 Membrány a biomakromolekuly Biologické membrány se od biomakromolekul (proteinů, nukleových kyselin, polysacharidu) zásadně liší. Zatímco biomakromolekuly tvoří dlouhý polymerní řetězec, v němž jsou stavební jednotky pevně spojeny kovalentní vazbou, membrány se skládají z molekul, mezi kterými působí především slabé van der Waalsovy síly. Přesto můžeme nalézt důležitý rys společný membránám i biomakromolekulám. V obou případech je dobře známá konfigurace jednotlivých stavebních jednotek a popisem struktury se myslí určení geometrického uspořádání těchto stavebních jednotek. 5.2 Stavební jednotky Biologické membrány jsou tvořeny látkami, které souhrnně označujeme lipidy. Nejde zde o název odrážející chemické složení, ale spíše fyzikální vlastnosti. Molekuly lipidů obsahují relativně malou polární, často ionizovanou část, která má výrazně hydrofilní chování. Zbytek molekuly je nepolární, výrazně hydrofobní. Molekula lipidu je tedy „vnitřně rozpolcená" - jedna část vyhledává polární (vodné) prostředí, druhá část nepolární prostředí. Chemická struktura lipidů je velmi rozmanitá, k nejběžnějším patří následující tři typy: • Glycerolfosfolipidy (fosfatidy) - k molekule glycerolu jsou vázány esterovou vazbou dvě mastné kyseliny a jeden zbytek kyseliny fosforečné. Z mastných kyselin jsou nejběžnější kyselina pahni-tová (šestnáctiuhlíková nasycená kyselina), osmnáctiuhlíkové kyseliny (nasycená stearová, s jednou dvojnou vazbou v poloze 9 oleová, s dvěma dvojnými vazbami v polohách 9 a 12 linoleová) a kyselina arachidonová (dvacetiuhlíkatá se čtyřmi dvojnými vazbami v polohách 5, 8, 11, 14). Na kyselinu fosforečnou je často další esterovou vazbou vázán kyslík ethanolaminu, serinu, cho-linu, nebo inositolu (cukerný alkohol, na který bývá vázán další jeden nebo dva zbytky kyseliny fosforečné). • Sfingolipidy - k molekule dvacetiuhlíkatého aminodiolu sfmgosinu je vázána amidovou vazbou jedna mastná kyselina a jeden zbytek kyseliny fosforečné, který může být dále esterifikován (nejčastěji cholinem). • Steroly - v živočišných buňkách cholesterol 63 64 KAPITOLA 5. STRUKTURA BIOLOGICKÝCH MEMBRÁN 5.3 Geometrie lipidových útvarů Pokud přidáme lipidy ke směsi nemísitelného polárního a nepolárního rozpouštědla (voda a olej), budou ochotně tvořit rozhraní těchto dvou rozpouštědel. Hydrofobní část lipidu bude mířit do oleje a hydrofilní do vody. Pokud přidáme lipidy pouze do vodného roztoku, budou se jejich molekuly orientovat tak, aby nepolární části byly co nejméně v kontaktu s vodou (hydrofobní efekt diskutovaný v části 6.12). Tvar útvaru, který v důsledku hydrofobního efektu vznikne, závisí na tvaru molekuly lipidu. Pokud je nepolární část lipidu malá, podobá se jeho molekula kuželu, jehož podstavu tvoří polární část. Takovéto kužely můžeme poskládat do zhruba kulového útvaru, který bude uvnitř nepolární a zvenčí polární. Takový útvar se nazývá micela. Lipidy, které jsme si vyjmenovali v sekci 5.2 mají hydrofobní a hydrofilní část přibližně stejnou, takže jejich molekuly se podobají válcům. Na rozdíl od kuželů můžeme válce skládat do plochých útvarů, které se budou orientovat stejně, jako když k sobě přiložíme dva krajíce namazaného chleba. Vznikne dvojvrstva tvořená lipidy, které budou orientovány hydrofobní částí proti sobě. Taková dvojvrstva je základem biologických membrán1. 5.4 Tekutost membrán Voda a jiné látky se mohou vyskytovat v různých skupenstvích, která se liší uspořádáním a volností molekul v trojrozměrném prostoru. V případě biomembrán se setkáváme s dvourozměrnou analogií, mluvíme o různých fázích lipidové dvoj vrstvy. Při nízkých teplotách a velkém natěsnání lipidových molekul na malé ploše se tvoří dvojrozměrné krystaly. Mají-li molekuly trochu více volnosti, dochází k tvorbě dvojrozměrného gelu, tato fáze se označuje Lß (obrázek 5.1). Zvýšením teploty vzniká fáze kapalného krystalu LQ. V ní jsou stále molekuly v těsném kontaktu, mohou se však navzájem pohybovat v rovině dvojvrstvy, jako když se snažíte razit si cestu ulicí plnou lidí. Naproti tomu je téměř nemožné, aby se molekula ze spodní strany dvojvrstvy dostala do horní a naopak. Plynné fázi by odpovídala tak nízká koncentrace lipidů, že by molekuly spolu reagovaly jen zřídka, při náhodných srážkách. To znamená, že by vůbec nedošlo k tvoření dvojvrstvy. K popsaným fázovým přechodům dochází u lipidů, jejichž hydrofobní řetězce jsou orientovány kolmo k rovině dvojvrstvy. Fázové chování lipidů s šikmo orientovanými hydrofobními řetězci je o něco složitější. Při tání gelu, který se tentokrát označuje L^, dochází nejprve k vytvoření zvlněné fáze P^, ve které mají molekuly více volnosti, než v plochém gelu. Teprve dalším fázovým přechodem vzniká fáze kapalného krystalu LQ. V biomembránách se vyskytují lipidy převážně ve fázi kapalných krystalů, velmi blízko fázovému přechodu na gelovou strukturu. Mluví se často o tekuté mozaice, navenek tvořící jasně definovanou membránu, ve které se však mohou molekuly volně pohybovat. 5.5 Vliv polární skupiny Polární část lipidu se v membránách vyskytuje v poměrně přesně definované konformaci. Tato kon-formace je dána požadavkem, aby molekula jako celek byla zhruba válcová a mohla tak neomezeně tvořit ploché struktury. Například v glycerolfosfolipidech obsahujících ethanolamin jsou v gelové fázi oba řetězce mastných kyselin i uhlíková páteř glycerolu orientovány kolmo k dvojvrstvě, zatímco řetězec ethanolaminu směřuje rovnoběžně s rovinou dvojvrstvy. Jde tedy o fázi ~Lß. Záměna ethanolaminu za cholin vede ke změně tvaru molekuly. Glycerol je stále orientován kolmo, ale nabitý řetězec cholinu je 1 Vedle micel a dvojvrstev existuje celá řada možných uspořádání, ve kterých se budou nacházet lipidy, jejichž tvar bude něco mezi válcem a kuželem. V buněčných membránách se setkáváme s podobnou geometrií například v místě styku dvou membrán. 5.6. VLIV HYDROFOBNÍHO ŘETĚZCE 65 oooooooooo ÔÔÔÔÔÔÔÔÔÔ L/3 p' ■T o p 1 p Obrázek 5.1: Fázové přechody lipidových dvoj vrstev. vytočen ven do rozpouštědla a řetězce mastných kyselin míří šikmo k rovině dvoj vrstvy. Vzniká tedy fáze Ľp. Pokud obsahuje lipid volnou kyselinu fosforečnou, je polární část molekuly menší a glycerol se orientuje rovnoběžně s rovinou dvoj vrstvy, aby lépe vyplnil prostor. Řetězce mastných kyselin směřují šikmo k dvoj vrstvě, takže opět jde o fázi L^. 5.6 Vliv hydrofobního řetězce V sekci 5.4 jsme zmínili, že tekutost membrán je dána volností pohybu jednotlivých molekul. Není proto divu, že konformace hydrofobních řetězců úzce souvisí s tekutostí biomembrány. Pokud je hydrofobní řetězec mastné kyseliny nasycený a pokud jsou všechny vazby v tomto řetězci v konformaci trans, zabírá tento řetězec v rovině membrány plošku o průměru 0,42 nm. Takové řetězce tedy mohou být velmi těsně poskládány a vyskytují se v tuhých gelových fázích. Rotace kolem jediné vazby do konformace gauche(+) vede k ohnutí řetězce, který naráz zabírá několikanásobně více místa. Takováto konformační změna tedy znamená obrovské rozvolnění struktury v daném místě. Zmíněný dramatický efekt však může být v příštím okamžiku kompenzován další konformační změnou, při které přejde vazba vzdálená o dva uhlíky od místa zlomu do konformace gauche(-). Dva opačné ohyby se navzájem téměř vyruší a dvakrát zlomený řetězec bude zabírat jen asi o 10% více místa než původní. V čem se bude lišit chování hydrofobního řetězce v případě, že jde o nenasycenou mastnou kyselinu? Pokud budou všechny vazby v konformaci (trans), bude zabírat mnohem více místa než nasycená. Mastné kyseliny totiž obsahují dvojné vazby v konfiguraci cis, které vedou k podobnému ohybu řetězce, jako konformační změny popsané v předchozím odstavci. Pokud ale bude dva uhlíky od dvojné vazby změněna konformace z trans na gauche, bude ohyb řetězce do značné míry vykompenzován. 66 KAPITOLA 5. STRUKTURA BIOLOGICKÝCH MEMBRÁN Můžeme tedy shrnout, že změna konformace z uspořádání trans do polohy gauche může mít v různé situaci opačný účinek. V případě nasycených mastných kyselin vede ke zvýšení tekutosti, zatímco v případě nenasycených nebo již jednou konformačně deformovaných mastných kyselin vede ke zvýšení tuhosti membrány. 5.7 Vliv složení Podobný účinek jako konformační změny postranního řetěze mají i změny složení membrány. Například přídavek cholesterolu do těsně uspořádané, relativně tuhé membrány tvořené nasycenými mastnými kyselinami naruší strukturu membrány a zvýší její tekutost. Naopak přídavek cholesterolu k relativně tekuté membráně obsahující značné množství nenasycených mastných kyselin vede ke zvýšení tuhosti, protože molekula cholesterolu může vyplňovat dutiny, které vznikly v důsledku přítomnosti dvojných vazeb. 5.8 Vyšší struktury Tak jako se biomakromolekuly navzájem spojují a tvoří vyšší komplexy, tak i biomembrány často in-teragují s různými biomakromolekulami. Lipidy tak tvoří jen asi polovinu hmoty buněčných membrán. Velké množství proteinů nabývá správné konformace pouze v přítomnosti membrán. Membránové proteiny mohou lipidovou dvoj vrstvou procházet, a to i několikrát, nebo k ní mohou být připojeny z jedné či druhé strany. Interakce mezi proteiny a membránou mohou být dány hydrofobním jevem, ale proteiny se mohou k lipidům vázat i kovalentními vazbami. Podobně mohou být k lipidům dvoj vrstev vázány i polysacharidy. Funkce membrán není omezena jen na udržování tvaru buněk. Rozhodující část tvorby energie a regulace mnoha buněčných procesů jsou přímo spojeny s rozdělením prostoru biologickými membránami. Kapitola 6 Interakce určující strukturu biomakromolekul 6.1 Energie a entropie Hlavním cílem předchozích kapitol popsat strukturu (tedy konformaci) biomakromolekul. Výsledný statický geometrický model je důležitým základem pro pochopení dynamiky a funkce biologicky zajímavých molekul na atomární úrovni. V této kapitole se zamyslíme nad fyzikálními zákony, které stavby molekul určují. Tedy nad tím, proč se zkoumaná molekula vyskytuje v určité konformaci. Hned v úvodu bychom si měli zdůraznit, že snaha o pochopení základních principů stavby molekul nás vede k velmi zjednodušenému pohledu na molekuly. A nejen nás, stejná zjednodušení používá (a často si to ani neuvědomuje) každý chemik, který kreslí na papír vzorce a montuje z kuliček a trubiček modely molekul. Prvním zjednodušením je již to, že ve vzorcích spojujeme některé atomy čárkami. Říkáme, že mezi těmito atomy existuje kovalentní vazba. Chceme zdůraznit, že mezi atomy spojenými čárkami působí síly, které zasluhují zvláštní pozornost. Jenže i mezi ostatními atomy působí síly, a to síly, které jsou popsány stejnými fyzikálními zákony. Silové působení mezi atomy, které nejsou spojeny kovalentní vazbou, může být dokonce silnější než některé kovalentní vazby. V části 1.1 jsme na kovalentní vazbě založili rozlišování mezi konfigurací a konformaci. V přírodě ale mezi konfigurací a konformaci žádná jasná hranice není. Otáčení kolem některé „jednoduché" vazby může být obtížnější, než otáčení kolem určité „dvojné" vazby. Znamená to, že máme strukturní vzorce založené na konfiguraci a modely založené na konformaci odhodit jako zbytečné a matoucí? Určitě ne, vzorce a modely jsou velmi užitečné pomůcky, které pomáhají chápat základní pravidla a souvislosti výstavby molekul. Musíme si ale uvědomit, že pomocí nich můžeme základní principy ilustrovat, ne však fyzikálně vysvětlit. Proto v této kapitole věnujeme více pozornosti fyzikální podstatě interakcí v molekulách. Výhodnost konformaci lze popsat jedinou veličinou, energií Energie má jednu zvláštnost, není možné určit její absolutní hodnotu. Nemá proto smysl ptát se, jaká je energie určité konformace. Vždy můžeme pouze porovnávat energie různých konformaci mezi sebou. Molekuly se ani v buňkách ani ve zkumavce nevyskytují v jednom exempláři, ale v obrovských počtech. Zastoupení konformaci v takovém souboru molekul není dáno jen energetickou výhodností jednotlivých konformaci, ale také statistikou. Můžeme si to ukázat na jednoduchém příkladu, kde budeme sledovat místo konformaci různé konfigurace. Smícháme stejná látková množství dvou krátkých peptidů. Jeden bude mít sekvenci Lys-Cys-Gly (označíme si KCG podle jednopísmenných zkratek) a druhý Glu-Cys-Gly (označíme si ECG). Předpokládejme, že peptidy vytvoří dimery spojené disulfidovými můstky mezi cysteiny. Mohou tedy vzniknout homodimery KCG-KCG, ECG-ECG a heterodimer KCG-ECG. 67 68 KAPITOLA 6. INTERAKCE URČUJÍCÍ STRUKTURU BIOMAKROMOLEKUL Naším úkolem bude odhadnout, kolik kterých dimerů vznikne. Kdybychom se dívali jen na energii, tak budeme hádat, že vznikne 100% heterodimeru, protože je energeticky výhodnější (obsahuje kladně nabitý lysin a záporně nabitý glutamát, které se budou přitahovat). Kdybychom se dívali jen na statistiku, tak budeme odhadovat 50 % heterodimeru a 25 % každého homodimeru. Skutečnost bude samozřejmě někde mezi. Správné zastoupení konformací v souboru molekul nám poskytne termodynamika. Termodynamika obvykle popisuje soubor molekul ve stavu, kdy jsou jednotlivé konformace v rovnováze. V rovnováze se nevyskytuje jediná konformace s nejnižší energií. Statisticky je také výhodné mít určitou konformační pestrost. Tu popisuje termodynamika veličinou entropie S, úměrnou přirozenému logaritmu počtu rozlišitelných stavů fž. Hodnota konstanty úměrnosti závisí na jednotkách, ve kterých měříme energii. Pro jednotky Jmol-1 je konstantou úměrnosti univerzální plynová konstanta1. Veličina, která zahrnuje oba zmíněné příspěvky, energii jednotlivých konformací i jejich pestrost, se nazývá volná energie. Používají se dvě definice volné energie. Obě zahrnují entropii stejným způsobem, ale liší se v zahrnutí práce spojené se změnami objemu do popisu energie. Helmholtzova volná energie A = U — TS zahrnuje vnitřní energii U vyjádřenou za předpokladu, že se objem, ve kterém jsou molekuly uzavřeny, nemůže měnit. T je termodynamická teplota. Naopak Gibbsova volná energie G = H — TS vychází z předpokladu, že se objem může neomezeně měnit tak, aby nedocházelo k tlakovým změnám. Místo vnitřní energie se proto používá veličina entalpie H, do které je zahrnuta i práce spojená s objemovými změnami. Rozdíl mezi molární vnitřní energií a molární entalpií je roven součinu tlaku a molárnímu objemu (H = U + pV). Toto číslo je ale pro kapalnou vodu tak maličké, že v biochemii jsou hodnoty obou energií prakticky stejné. Proto je i rozdíl mezi Helmholtzovou a Gibbsovou volnou energií zanedbatelný. Protože jde o energie, můžeme spočítat pouze rozdíly A G (a AA). V rovnováze dvou konformačních stavů je rozdíl jejich Gibbsových energií nulový (AG = AH - TAS = AH - RTln fl1/n2 = 0). Z toho vyplývá, že zastoupení jednotlivých konformerních stavů lze spočítat ^=e-w. (6.1) Tento vztah nám také říká, jaké hodnoty energie můžeme považovat za malé a jaké za velké. Pokud bude rozdíl AH (nebo AU) výrazně menší než RT, nebude poměr konformačních stavů vůbec záviset na energii, ale bude pouze odrážet statistiku (v našem případě bude blízký jedné). Energie nižší než teplotní faktor (RT « 2,5kJmol~1 při 300 K neboli 27 °C) můžeme proto zanedbat. 6.2 Síly působící v biomakromolekulách Energie související se strukturou molekul je téměř výhradně elektrického původu. Základem jejího výpočtu je Coulombův zákon, určující jakou silou na sebe působí náboje Qi a Q2 ve vzdálenosti r F=iQ1Qlj (62) 47reo rz kde eg = 8,854 C2 J_1 m_1 je elektrická permitivita vakua. 1Na rozdíl od energie je možné určit entropii v absolutních číslech. Například si představme, že bychom výše uvedený dimer peptidů připravili jen ze dvou molekul KCG a dvou molekul ECG. Pro přehlednost dáme molekulám KCG pořadová čísla 1 a 2 a molekulám ECG pořadová čísla 3 a 4. Existují jen dvě možnosti, jak bude vzniklá směs vypadat: bud' směs homodimeru KCG-KCG + ECG-ECG nebo dvě molekuly heterodimeru KCG-ECG. Směs homodimeru může vzniknout jen jedním způsobem, když molekula číslo 1 zreaguje s molekulou číslo 2 a molekula číslo 3 zreaguje s molekulou číslo 4. Dvojice hereodimerů ale může vzniknout dvěma způsoby: když molekula číslo 1 zreaguje s molekulou číslo 3 a molekula číslo 2 zreaguje s molekulou číslo 4, nebo když molekula číslo 1 zreaguje s molekulou číslo 4 a molekula číslo 2 zreaguje s molekulou číslo 3. Homodimerní výsledek reakce tak představuje jen jeden rozlišitelný stav s nulovou entropií. Heterodimerní výsledek odpovídá dvěma rozlišitelným stavům s entropií S = i?ln2 = 16,6 Jmol-1 K~1. 6.3. KOVALENTNI VAZBY 69 1000 Ai ta -1000 0.2 / nm 1° celková ^ potenciální kinetická 0.1 A! ta -0.1 0.4 © celková / / disperzní 0.2 / nm n^opt 0.4 Obrázek 6.1: Energie atomů vodíku a kyslíku tvořících kovalentní vazbu (vlevo) a atomů helia tvořících van der Waalsovu vazbu (vpravo). Molekuly ovšem obsahují mnoho nabitých částic (jader, elektronů). Proto je konkrétní výpočet celkové energie složitý. Z praktických důvodů se často popisují zvlášť jednotlivé typy příspěvků k celkové energii. Z těchto příspěvků si uvedeme alespoň nejdůležitější. 6.3 Kovalentní vazby Kovalentní vazby určují konfiguraci molekuly. Tyto vazby popisují nejvýhodnější prostorové rozmístění elektronů z pohledu jejich vzájemných interakcí a jejich interakcí s jádry atomů. Popis kovalentních vazeb je poměrně složitý, vyžadující kvantový přístup. Zde se spokojíme s grafem popisujícím změny energie během přibližování atomů schopných tvořit kovalentní vazbu (obrázek 6.1 vlevo). Když se takové atomy přibližují, přestávají pravděpodobnost výskytu elektronů popisovat nezávislé atomové orbitaly, ale elektrony začínají být ovlivněny i polem sousedního jádra. Zpočátku se tak rozšiřuje oblast jejich výskytu a klesá jejich kinetická energie2. Naopak narůstá potenciální energie kvůli interakci s elektrony sousedního atomu. S dalším přibližováním se oblast výskytu elektronů zase zmenšuje a jejich kinetická energie roste. Naopak s přibližováním k sousednímu jádru začne klesat potenciální energie elektronů. Vzdálenost, kde je celková energie nejnižší, se nazývá vazebná vzdálenost (rvaz na obrázku 6.1 vlevo). Přiblížení atomů na tuto vzdálenost je spojeno s poklesem energie řádově o stovky kJmol-1. Kovalentní vazby jsou velmi silné (viz tabulka 6.1), ale souvisí téměř výhradně s primární strukturou. Důležitou výjimkou jsou disulíidové vazby mezi cysteiny, které jsou sice kovalentní, ale určují terciární (případně kvarterní) strukturu proteinů. Jejich vliv je důležitý jen u proteinů vylučovaných ven z cytoplasmy. V cytoplasmě je totiž nadbytek peptidu glutathionu, který obsahuje cystein a tvoří disulíidové vazby s proteiny na úkor intramolekulárních disulfidových můstků v proteinech. 2Kvantová mechanika ukazuje, že není možné zároveň určit přesně polohu a hybnost elektronu (Heisenbergovy relace neurčitosti). Pokut tedy rozšíříme oblast výskytu (polohy) elektronu, můžeme zúžit rozptyl hybnosti. To vede ke snížení kinetické energie, která je úměrná druhé mocnině rychlosti a tedy i hybnosti. 70 KAPITOLA 6. INTERAKCE URČUJÍCÍ STRUKTURU BIOMAKROMOLEKUL Tabulka 6.1: Energie a meziatomové vzdálenosti kovalentních a vazeb (červeně), disperzních interakcí (zeleně) a vodíkových vazeb (modře). Uvedené hodnoty jsou pouze přibližné a závisí na konkrétním chemickém okolí atomů. Atom- • ■atom Uopt j k J mol"1 ropt / nm í"min / nm He-- •He 0,05 0,28 0,25 -H- -H- 440 0,074 -H- H- 0,50 0,24 0,20 -C-- H- 0,45 0,29 0,24 -C- -G- 350 0,154 -C-- •C- 0,50 0,34 0,30 -N- -N- 170 0,145 -N-- •N- 0,85 0,31 0,27 -NH- •N- 13 0,31 -NH- ■0- 8 0,29 -0- -0- 150 0,148 -0-- ■0- 0,95 0,30 0,27 -OH- ■0- 21 0,28 -OH- •N- 29 0,27 6.4 Van der Waalsovy interakce Van der Waalsovy síly jsou univerzální interakce, které působí mezi polárními i nepolárními molekulami a funkčními skupinami. Pokud sledujeme změny energie během přibližování atomů neschopných tvořit kovalentní vazbu (obrázek 6.1 vpravo), pozorujeme pokles energie, který vzdáleně připomíná tvorbu ko-valentní vazby. Optimální vzdálenosti jsou ale delší a poklesy energie výrazně menší, než pro kovalentních vazeb (v případě atomů helia na obrázku 6.1 vpravo 0,05kJmol_1, pro atomy v biomakromolekulách 0,5 kJ mol-1 až lkJmol-1, tabulka 6.1). Pozorovaná energie se skládá z odpudivého a přitažlivého příspěvku. Odpudivou interakcí je takzvaná Pauliho repulze. Při přibližování atomů neschopných tvořit kovalentní vazbu totiž přibližujeme elektrony jednoho atomu k již plně obsazeným orbitalům druhého atomu, což je krajně nevýhodné. Při přiblížení atomů na vzdálenost menší, než označenou rm;n, odpudivé síly začnou převažovat a s dalším přibližováním prudce narůstají. V chemii je nazýváme sterické zábrany a vymezují konformace, které se v makromolekulách vyskytnout nemohou. Například nepozorované torzní úhly a jejich kombinace v Ramachandranově diagramu. Přitažlivou složkou van der Waalsových interakcí jsou takzvané disperzní síly. Jsou to interakce působící mezi elektrickými dipóly, které vznikají pouze krátkodobě v důsledku okamžitého přemístění elektronů v molekule. Pokud se elektrony ve dvou nepolárních molekulách posunou zároveň jedním směrem, sníží se energie elektrostatických interakcí mezi molekulami (ve srovnání s dvojicí stejně vzdálených molekul se symetrickým rozložením elektronů). I když pro každou dvojici interagujících atomů poklesne energie jen maličko, celkový pokles pro celou molekulu je nezanedbatelný a molekuly se proto snaží zaujímat konformace, ve kterých jsou pokud možno všechny atomy v optimální vzdálenosti k jinému atomu (včetně atomů rozpouštědla, tedy vody). 6.5. ELEKTROSTATICKÉ INTERAKCE 71 A B 0.28 nm Obrázek 6.2: Schematické znázornění vody jako polární molekuly (A) a jako molekuly schopné tvořit vodíkovou vazbu (B). 6.5 Elektrostatické interakce Do této kategorie budeme řadit interakce, k jejichž popisu nepotřebujeme kvantovou mechaniku (nemusíme brát do úvahy orbitaly). Iontové interakce představují jednoduché elektrostatické odpuzování stejně nabitých iontů a přitahování opačně nabitých iontů. Energie těchto interakcí klesá s první mocninou vzdálenosti iontů. Dipólové interakce jsou síly působící mezi elektrickými dipólovými momenty, které vznikají v molekule vytvořením nadbytku elektronů v jedné části molekuly a nedostatku elektronů (nadbytku kladného náboje) v jiné části molekuly (nebo chemické skupiny, například postranního řetězce aminokyseliny). Molekula jako celek je přitom navenek neutrální. Elektrický dipól má každá polárni vazba, tedy kovalentní vazba mezi dvěma atomy, ve které je větší výskyt elektronů u jednoho z atomů. Na obrázku 6.2A je ukázána voda jako příklad polární molekuly. Elektrické dipóly se navzájem sčítají, takže větší části makromolekul na sebe mohou působit tímto způsobem. Energie interakcí mezi dvěma dipóly klesá s třetí mocninou jejich vzdálenosti. Protože elektrický dipólový moment má nejen velikost, ale i směr, závisí energie interakce i na vzájemné orientaci dipólů. Kromě interakcí mezi dvěma dipóly se setkáváme i s interakcemi mezi dipólem a iontem. Energie takové interakce klesá s druhou mocninou vzdálenosti iontu a dipólu a závisí na natočení dipólu vzhledem k iontu. Detailnější diskuse a odvození kvantitativních vztahů popisujících energii různých typů elektrostatických interakcí je uvedena v Dodatku A. 6.6 Vodíkové vazby Vodíkové vazby neboli můstky se tvoří mezi vodíkem vázaným velmi polární vazbou na atom zvaný donor (nejčastěji na kyslík nebo dusík) a atomem zvaným akceptor, který může poskytnout elektrony pro vytvoření vazby (opět nejčastěji kyslík nebo dusík). Vliv vodíku je dobře vidět na srovnání optimální vzdálenosti dvou atomů kyslíku interagujících přímo (například dvou karbonylových skupin) s optimální vzdáleností dvou kyslíků interagujících vodíkovou vazbou. Přestože je v druhém případě mezi atomy kyslíku ještě vodík, je jejich vzájemná vzdálenost kratší (0,28 nm oproti 0,30 nm v prvním případě, tabulka 6.1 a obrázek 6.2B). Vodíkové vazby mají částečně kovalentní charakter, ale převážně jsou elektrostatické. Jejich popis je dosti složitý, protože závisí na orientaci zúčastněných dipólových momentů. Vodíkové vazby jsou slabší než vazby kovalentní (jeden vodíkový můstek snižuje energii přibližně o lOkJmol-1 až 20kJmol~1) a proto se nepovažují za vazby určující konfiguraci. Velmi výrazně však zvýhodňují určitou konformaci. 72 KAPITOLA 6. INTERAKCE URČUJÍCÍ STRUKTURU BIOMAKROMOLEKUL 6.7 Stacking Jako stacking se v anglické literatuře označují interakce aromatických aminokyselin v proteinech a zejména bází v nukleových kyselinách. V případě benzenových kruhů jde téměř výhradně o disperzní síly. Heterocykly bází nukleových kyselin mají také elektrické dipólové momenty, které k stackingu rovněž přispívají. Stacking je důležitý faktor stabilizující dvojšroubovice DNA, srovnatelný s párováním bází Watson-Crickovými hranami. Interakce ploch bází (stacking, tedy disperzní síly a dipól-dipólové interakce) snižují energii páru GC o 70kJmol~1 a energii páru AT o 50kJmol_1, zatímco interakce hran (vodíkové vazby a dipól-dipólové interakce) snižují energii páru GC o 120kJmol_1 a energii páru AT o ôSUmor1. 6.8 Karbonylové interakce Jako poslední příklad v našem neúplném seznamu sil v biomakromolekulách si uvedeme interakce mezi uhlíkem jedné karbonylové skupiny a kyslíkem druhé karbonylové skupiny. Energii dvou karbonylů snižuje částečně interakce jejich elektrických dipólových momentů a částečně využití antivazebného or-bitalu 7T* vazby C=0 elektrony v nevazebném orbitalu 2py kyslíku druhého karbonylů. Vhodnou orientaci pro tuto interakci mají sousední karbonyly páteře proteinů v konformacích popsaných následujícími dvojicemi torzních úhlů (4>,ip): (-60°, -45°), (-60°,+135°), (+60°,+45°), (+60°, -135 °). V prvních dvou případech jde o šroubovici a a konformaci polyprolin-II (například v kolagenu), druhé dva případy jsou zrcadlové obrazy výhodné pro aminokyseliny řady D. Snížení energie není velké (lkJmol-1 až 2kJmol~1), ale v součtu pro celou šroubovici není zanedbatelné. V případě konformace polyprolin-II vysvětluje, proč tuto konformaci, která není stabilizovaná vodíkovými vazbami, tvoří často flexibilní (přirozeně neuspořádané) proteiny. 6.9 Voda jako rozpouštědlo Výhodnost určité konformace je dána nejenom vzájemným energetickým působením mezi jednotlivými částmi makromolekuly, ale také interakcemi s okolními molekulami (především s molekulami rozpouštědla) a entropií celé soustavy makromolekula-rozpouštědlo. Uveďme si, jaké obecné chování můžeme očekávat u biomakromolekuly rozpuštěné ve vodném roztoku iontů solí (tedy v prostředí odpovídajícím cytoplazmě). Voda je mimořádná molekula. V běžném ledu jsou molekuly ledu uspořádány v pravidelné krystalové mřížce s maximálním počtem vodíkových můstků, a to i za cenu vytvoření dutin představujících ztrátu disperzních interakcí (obrázek 6.3 vlevo). Když led roztaje, krystalová struktura se částečně zhroutí, dutiny se zaplní, ale 80% energie vodíkových vazeb se zachová (jejich příspěvek klesne z —50kJmol_1 na — 40kJmol~1). Proto si i tekutou vodu můžeme představit jako soubor molekul spojených hustou sítí vodíkových můstků. V tekuté vodě se molekuly stále otáčejí, v nové orientaci ale mohou tvořit nové vodíkové můstky s jinými molekulami vody. Vodíkové můstky se stále ruší a nové stále vznikají, ale celkový počet vodíkových vazeb je zachován bez ohledu na okamžitou orientaci jednotlivých molekul. 6.10 Elektrostatické interakce ve vodě Jak ovlivní přítomnost vody elektrostatické interakce? Ionty rozpuštěné ve vodě neinteragují jenom spolu, ale také s elektrickými dipólovými momenty molekuly vody. Tyto ion-dipólové interakce představují naprostou většinu elektrostatických sil ve vzorku, interakce mezi ionty samými přispívá k celkové energii jen 1,25%. Proto se nám zdá, že elektrostatické interakce ve vodě jsou osmdesátkrát slabší. Je 6.10. ELEKTROSTATICKÉ INTERAKCE VE VODĚ 73 Obrázek 6.3: Struktura ledu (vlevo) a kapalné vody (vpravo). Nahoře jsou atomy kyslíku znázorněny azurově s velikostí odpovídající ropt na obrázku 6.1, dole jsou pro přehlednost zmenšeny a obarveny červeně. Atomy vodíku jsou znázorněny bíle. Dutiny ve strukturách jsou v horních obrázcích vyznačeny černě. Kovalentní vazby jsou v dolních obrázcích vyznačeny hnědě, vodíkové vazby azurově. 74 KAPITOLA 6. INTERAKCE URČUJÍCÍ STRUKTURU BIOMAKROMOLEKUL A B C + 4V» + D Obrázek 6.4: A,B, orientace molekul vody kolem iontového páru. Velké symboly © a 0 představují katión a anion, malé symboly © a 0 představují parciální náboje v molekule vody. C-D, vliv orientace vody na sílu elektrostatické interakce. Symboly + a — znázorňují polarizaci v důsledku orientace vody ke kationtu. Molekula proteinu je zobrazena oranžově, čísla na žlutém pozadí představují relativní sílu interakce vzhledem k případu, kdy by kation byl ve stejné vzdálenosti ve vakuu. třeba zdůraznit, že voda netvoří nějakou stínící bariéru mezi ionty, která by zeslabovala elektrostatické síly. K zeslabení interakcí dochází proto, že molekuly vody se v okolí nábojů mohou natočit tak, aby jejich elektrické dipólové momenty měly nejvýhodnější orientaci k iontům (obrázek 6.4A). K tomu dochází i tehdy, když jsou ionty tak blízko sebe, že se mezi ně molekula vody nevejde (obrázek 6.4B). Pokud se ionty nachází uprostřed proteinu, je elektrostatická interakce mezi nimi zeslabena mnohem méně, přibližně na čtvrtinu až polovinu (dle konkrétních aminokyselin v okolí). Menší vliv proteinu je důsledkem toho, že postranní řetězce se nemohou uvnitř proteinu natáčet tak snadno jako molekuly vody a některé z nich jsou také méně polární, než voda. Pro zahrnutí vlivu vody se nabízí jednoduchá oprava Coulombova zákona: vynásobení konstanty eg ve jmenovateli koeficientem 80 pro vodu a koeficientem dva až čtyři pro protein. Tento koeficient se nazývá relativní permitivita prostředí er. Tento přístup je lákavý především pro výpočetní metody, protože nijak nezpomaluje počítání. Místo jedné konstanty se prostě použije jiná. Obrázek 6.4C-D ale upozorňuje na úskalí tohoto přístupu. Zatímco ve volném roztoku lze vliv vody opravdu popsat 6.11. VODÍKOVÉ VAZBY VE VODĚ 75 Obrázek 6.5: Tvorba struktur stabilizovaných vodíkovým můstkem v proteinech solvatovaných vodou. Atomy uhlíku jsou znázorněny černě, atomy dusíku modře, páteř proteinu symbolizuje černá čára. Molekuly vody, které se nezúčastňují solvatace, jsou nakresleny růžově, solvatující molekuly s použitím stejných barev jako na obrázku 6.3. konstantou er (obrázek 6.4C), na povrchu proteinu jsou elektrostatické síly ovlivněny způsobem mnohem složitějším. 6.11 Vodíkové vazby ve vodě Dále se podívejme, jaký vliv má prostředí vody na tvorbu vodíkových vazeb v biomakromolekulách. Ve vakuu každý vodíkový můstek mezi karbony lem a amidem páteře proteinu sníží energii o 8 kJ mol-1. Pokud je ale protein solvatovaný, tvoří i v rozbaleném stavu vodíkové můstky s vodou (obrázek 6.5 vlevo). Vytvořením sekundární struktury stabilizované vodíkovým můstkem se celkový počet vodíkových vazeb nezmění, místo jedné intermolekulární vznikne jedna intramolekulární (obrázek 6.5 vpravo). Přesto má vznik vodíkového můstku v proteinu mírně stabilizující efekt. K pochopení výhodnosti tvorby vodíkového můstku v biomakromolekule musíme prozkoumat ent-ropické důsledky takové změny. Vytvoření vodíkové vazby mezi karbonylem v jednom místě páteře a vodíkem amidu v jiné části páteře omezí počet konformací, ve kterých se může páteř vyskytovat. Proto se entropie proteinu sníží. Tvorba vodíkového můstku v proteinu se také ale odrazí na možných orientacích molekul vody, které karbonyl a amid před vytvořením můstku solvatovaly. Místo tvorby vodíkové vazby s proteinem, která vyžadovala určitou orientaci dvou molekul vody, mohou tyto molekuly tvořit vodíkové vazby s jinými molekulami vody kolem nich. A takové vodíkové vazby se mohou vytvořit v různých orientacích. Tvorba vodíkové vazby v proteinu tak vede ke zvýšení entropie vody (zvýšení počtu stavů, ve kterých se molekula vody osvobozená ze zajetí proteinu může nacházet). Tento nárůst entropie vody převáží snížení entropie proteinu, ve kterém tvorba vodíkového můstku omezí možné konformace páteře. Z pohledu volné energie místo zisku —8kJmol_1 vnitřní energie (nebo entalpie) proteinu získáme entropii vody. V celkové bilanci to odpovídá za pokojové teploty zisku volné energie AG ~ —6kJmol_1. To je hodnota poměrně malá a závisející na konkrétní situaci. 76 KAPITOLA 6. INTERAKCE URČUJÍCÍ STRUKTURU BIOMAKROMOLEKUL 6.12 Hydrofobní efekt Poslední důsledek solvatace vodou, kterému věnujeme pozornost, je hydrofobní efekt. Dříve, než se podíváme na biomakromolekuly, prozkoumejme chování cyklohexanu, jako příkladu malé nepolární molekuly neschopné tvořit vodíkové vazby. Na obrázku 6.6A je zobrazena rovnováha mezi cyklohexa-nem v plynné fázi, v kapalné fázi a ve vodném roztoku. Za pokojové teploty a atmosférického tlaku preferuje cyklohexan kapalnou fázi před plynnou. Proč ale nepreferuje vodný roztok? Z pohledu ental-pie (nebo vnitřní energie) je stejně výhodné pro molekulu cyklohexanu být obklopena molekulami vody nebo jinými molekulami cyklohexanu. V obou případech získáme —30kJmol_1. Je zřejmé, že ztrácíme nějakou entropii, protože v kapalině má cyklohexan méně volnosti, než v plynné fázi. Proč je ale ztráta entropie o tolik vyšší v případě vodného roztoku? Odpověď je naznačena na obrázku 6.6B,C. Molekuly vody se vždy snaží orientovat tak, aby mohlo vzniknout co nejvíce vodíkových vazeb. Pokud budeme předpokládat, že si tekutá voda zachovává uspořádání ledu, můžeme nalézt šest orientací, ve kterých míří atomy vodíku vybrané molekuly vody k jedné ze sousedních molekul a mohou být donory vodíkových vazeb (obrázek 6.6B). Toto uspořádání se naruší, je-li ve vodě rozpuštěna molekula neschopná tvořit vodíkové vazby. Bude-li to molekula malá (o průměru menším než 1 nm), dokáží se molekuly vody přeskládat tak, aby celkový počet vodíkových vazeb ve vodě zůstal zachován a molekuly vody zůstaly tak blízko rozpuštěné molekuly, aby byly i výhodné disperzní interakce co nejsilnější. Cenu, kterou za to zaplatí, bude ztráta entropie. Pokud bude jedna ze sousedních molekul vody nahrazena molekulou látky, která nemůže být akceptorem vodíkové vazby (například cyklohexanem), existují jen tři orientace, ve kterých může naše být molekula vody donorem dvou vodíkových vazeb (obrázek 6.6C). Růst volné energie v důsledku reorganizace molekul vody je úměrný objemu rozpuštěné molekuly, nebo správněji objemu dutiny, kterou musí voda pro tuto molekulu vytvořit. Když budeme zkoumat změny volné energie při rozpouštění nepolární molekuly větší než 1 nm, zjistíme něco jiného. Nebudeme pozorovat ztrátu entropie, ale naopak ztrátu výhodných interakcí, která se projeví zvýšením vnitřní energie. V okolí velké molekuly se již voda nedokáže přeskládat tak, aby nepřišla o některé vodíkové můstky. Ba ani nedokáže obklopit rozpuštěnou látku tak těsně, aby byly disperzní síly tak silné, jako u malé molekuly. Toto zvýšení energie nebude úměrné objemu, ale povrchu rozpuštěné molekuly. Změny volné energie při solvataci také závisí na tvaru solvatovaného povrchu. Voda v blízkosti plochého povrchu může vytvářet tři vodíkové vazby ze čtyř možných, zatímco molekula vody uzavřená v nepolární dutině nemůže tvořit žádnou vodíkovou vazbu. Jakou roli hraje hydrofobní efekt ve stabilizaci nativní struktury proteinu? Pro získání zjednodušené představy můžeme vyjít z toho, co jsme si řekli o solvataci cyklohexanu. Na obrázku 6.7 jsou vlevo znázorněny čtyři hydrofobní postranní řetězce rozbaleného proteinu. Každý řetězec solvatuje osm molekul vody, které jsou tím omezeny v pohybu. Pro jednoduchost si představme, že hydrofobní postranní řetězce se chovají jako cyklohexan. Poskládáním do nativní struktury, ve které postranní řetězce in-teragují spolu (na obrázku 6.7 vpravo), se sníží počet molekul vody potřebných k solvataci. Uvolněné molekuly se tak stanou součástí struktury vody, ve které mohou tvořit vodíkové vazby, aniž by jejich orientace byly omezeny hydrofobní molekulou. V důsledku toho se zvýší entropie celého systému. Za nativních podmínek je tento vzrůst entropie je větší, než entropická ztráta v důsledku omezení možných konformací postranních řetězců. Celkové snížení volné energie závisí na velikosti postranního řetězce (—2,5 kJmol-1 pro alanin, —8 kJmol-1 pro leucin, —12 kJmol-1 pro fenylalanin). I když hodnoty pro jednotlivé aminokyseliny nejsou velké, vytvoření hydrofobního jádra představuje největší příspěvek ke snížení volné energie při sbalení proteinu do nativní struktury. Na závěr je nutno dodat, že naše vysvětlení skládání nativní struktury proteinu je velmi zjednodušené. Jádro proteinu není tvořeno jen nepolárními postranními řetězci a ke stabilitě proteinů přispívají další vlivy. Navíc sama fyzikální podstata hydrofobního efektu není dosud plně vysvětlena. Experimenty ale přesvědčivě ukazují, že hydrofobní efekt je nej důležitějším příspěvkem ke snížení volné energie proteinu sbaleného do pravidelné struktury a reorganizace molekul vody hraje při tom důležitou roli. 6.12. HYDROFOBNÍ EFEKT 77 Obrázek 6.6: Hydrofobní efekt. A, bilance rovnováh mezi cyklohexanem (světle zelená barva) v plynné fázi, kapalné fázi a ve vodě (azurová barva). Výhodné příspěvky ke změně volné energie ve směru šipky jsou zelené, nevýhodné červené. B,C, příčina výrazného snížení entropie při rozpouštění cyklohexanu ve vodě. Zvýrazněná molekula vody může být donorem dvou vodíkových vazeb (B) v šesti orientacích v čisté vodě, ale (C) jen ve třech orientacích v roztoku cyklohexanu (znázorněn světle zeleně). 78 KAPITOLA 6. INTERAKCE URČUJÍCÍ STRUKTURU BIOMAKROMOLEKUL 4 4 4 * Obrázek 6.7: Stabilizace sbalené nativní konformace proteinu (vpravo) hydrofobním efektem. Hydrofobní postranní řetězce jsou nakresleny světle zeleně, páteř oranžově a molekuly vody azurovou barvou. 6.13 Denaturace Jestliže jsme uvedli, že za nativních podmínek entropický zisk molekul vody převáží entropickou ztrátu postranních řetězců uvězněných v hydrofobním jádře proteinu, musíme dodat, že za odlišných podmínek tomu může být jinak. Rozdíl volné energie sbaleného o rozbaleného proteinu je velmi malý a změnou vnějších podmínek (teplota, tlak, pH, přítomnost dalších látek) můžeme rovnováhu zvrátit ve prospěch rozbaleného stavu. Konkrétním provedením tohoto procesu, zvaného denaturace, se tu zabývat nebudeme. Pouze si jej zjednodušeně popíšeme jako růst celkového objemu molekuly V: nativní protein je sbalený do malé kompaktní struktury, zatímco rozbalený denaturovaný protein zabírá mnohem větší prostor. Co se děje s rozdílem volné energie mezi rozbaleným a sbaleným proteinem během denaturace, docílené například zvyšováním teploty TI Na začátku je rozdíl volné energie A G kladný, rozbalených molekul proteinu je ve vzorku menšina. Jak objem postupně roste, vzdálenosti mezi atomy se zvyšují a proto slábnou disperzní síly. Důsledkem je pozvolný růst rozdílu entalpie AH (nebo vnitřní energie AU). Entropie se přitom příliš nemění, proto entropický příspěvek —TAS bude klesat přibližně lineárně s rostoucí teplotou. Pro jednoduchost si můžeme představit, že dva postranní řetězce uvnitř proteinu jsou do sebe zaklesnuté tak, že se nemohou volně otáčet a zůstávají v jednom rotamerním stavu. Možnost jejich rotace tedy k entropii nepřispívá, logaritmus jedničky (jeden rotamerní stav) je roven nule. V určitém okamžiku se ale protein rozvolní natolik, že naše dva postranní řetězce (a mnohé další) získají dost prostoru k rotaci. Řekněme, že se najednou každý může vyskytovat v jednom ze tří nezákrytových rotamerů. To okamžitě sníží volnou energii o —i?T(ln9 — lni) = —5,5kJmol_1. Podobně se v tu chvíli uvolní i další postranní řetězce a AG skokem klesne na zápornou hodnotu. V tomto okamžiku se zastoupení sbalené a rozbalené formy proteinu prudce změní ve prospěch rozbaleného proteinu. Další zvyšování teploty už nic zásadního nezmění, jen se bude dál snižovat už tak nepatrné zastoupení nativního proteinu. 6.14 Celková bilance Jednotlivé příspěvky k volné energii biomakromolekuly, které jsme diskutovali v této kapitole, jsou shrnuty v tabulce 6.2. Co nám tabulka říká? Kovalentní vazby, určující chemickou konfiguraci, jsou samozřejmě nejsilnější. Nekovalentní interakce jsou v buňce výrazně slabší, než ve vakuu. Výjimkou jsou iontové interakce uvnitř proteinu. Nesetkáváme se s nimi často, ale pokud se takový iontový můstek neboli solný můstek vytvoří, má na strukturu velmi výrazný vliv. Ostatní nekovalentní interakce za 6.14. CELKOVÁ BILANCE 79 V Obrázek 6.8: Změny volné energie během denaturace proteinu. Růst celkového objem molekuly V popisuje snižování kompaktnosti proteinu během zahřívání. Uvolnění postranních řetězců vedoucí k prudkému poklesu entropie je schematicky nakresleno nad grafem. 80 KAPITOLA 6. INTERAKCE URČUJÍCÍ STRUKTURU BIOMAKROMOLEKUL Tabulka 6.2: Srovnání energetických příspěvků určujících strukturu biomakromolekul k celkové volné energii. Typ kJ mol 1 podmínky RT 2,5 při 300 K (27 °C) kovalentní vazba 350 c-c ion-ion 460 vzdáleny 0,3 nm ve vakuu ion-ion 150 vzdáleny 0,3 nm uvnitř proteinu ion-ion 12 vzdáleny 0,3 nm na povrchu proteinu dipol-dipól 30 vzdáleny 0,3 nm ve vakuu dipol-dipól 10 vzdáleny 0,3 nm uvnitř proteinu ion-dipól 41 vzdáleny 0,5 nm ve vakuu ion-dipól 14 vzdáleny 0,5 nm uvnitř proteinu vodíková vazba 10 ve vakuu (AG « AH) vodíková vazba 6 ve vodě (AG « —TAS) karbonylová interakce 2 v proteinu hydrofobní efekt 8 na Leu hydrofobní efekt 12 na Phe běžných podmínek v cytoplasmě (v tabulce 6.2 zvýrazněné modře) přispívají k celkové volné energii méně a vzájemně srovnatelně. Příspěvek na jednu interakci není velký, většinou kolem lOkJmol-1. V biomakromolekule je ale takových interakcí velké množství a jejich součet může být významný. To platí zejména pro hydrofobní efekt, který stabilizuje kompaktní nativní strukturu proteinu nejvíce. Jaká je role ostatních interakcí, když hydrofobní efekt stabilizuje nativní struktury nejvíce? Hydrofobní efekt je sice nejdůležitější z pohledu volné energie, ale je strukturně nespecifický. Jde pouze o to, aby se postranní řetězce seskupily uvnitř proteinu, což, jak víme umožňují různé architektury proteinu (svazky šroubovic, a-šroubovice uspořádané do mnohostěnů, /3-soudky, TIM-soudky, atd.). To, jakou architekturu protein či jiná biomakromolekula vytvoří, určují ostatní interakce, specifické pro danou sekundární a terciární strukturu. Jejich příspěvek ke snížení volné energie je nižší, než příspěvek hydrofobního efektu, ale ne zanedbatelný. Skutečnost, že se celková volná energie biomakromolekuly skládá z mozaiky mnoha malých a vzájemně podobných příspěvků, vysvětluje, proč je obtížné nativní konformaci proteinu spočítat a proč nelze energetický popis biomakromolekul příliš zjednodušit. Určité obecné závěry ale dělat můžeme a v této kapitole jsme tak nejednou učinili. Můžeme si je shrnout takto: • Kovalentní vazby určují primární strukturu. • Iontové můstky v hydrofobním prostředí uvnitř proteinu představují interakci blížící se silou kovalentní vazbě. • Disulfidové můstky jsou důležité pro tvorbu terciární a kvartérní struktury proteinů, ale jen mimo buňku (v buňce jsou nahrazeny vazbou glutathionu). • Torzní úhly jsou limitovány sférickou (Pauliho) repulzí. • Voda jako rozpouštědlo má zásadní vliv. • Kompaktní nativní struktury jsou stabilizovány především hydrofobním efektem. • Konkrétní konformaci (sekundární a terciární strukturu) určují elektrostatické síly včetně vodíkových vazeb. 6.15. TERMODYNAMIKA A KINETIKA 81 6.15 Termodynamika a kinetika Dosud jsme se zabývali pouze energetickým popisem souborů molekul v rovnováze. Pro studium struktury není ale důležité jen energetické srovnání konformací, ale také znalost rychlosti, se kterou může jedna konformace přecházet v druhou. Popisem rychlostí takových změn konformace se zabývá kinetika. Rychlost přeměny konformací je opět dána energií, ne však energií nejvýhodnějších konformací, ale naopak energií nejméně výhodné konformace, kterou musí molekula projít na cestě od jedné výhodné konformace k jiné. Srovnání kinetického a termodynamického popisu je ukázáno na obrázku 6.9. Pro zjednodušení zde popisujeme konformační změnu spojenou pouze se změnou jednoho torzního úhlu. Během rotace kolem vazby 1 se mění energie molekuly v roztoku. Tenká čára ukazuje průběh vnitřní energie jedné konformace, zatímco tlustá čára popisuje volnou energii souboru molekul v různých konformacích ostatních vazeb3. Tlustá čára tedy zahrnuje i příspěvek entropie. Rozdíl mezi údolími na křivce energie určuje pravděpodobnost, že se bude molekula vyskytovat v první konformací, s postranním řetězcem mířícím do nitra makromolekuly, nebo v druhé konformací, s postranním řetězcem mířícím do vodného roztoku. Naproti tomu energetický rozdíl mezi údolím a vrcholem na křivce, takzvaná aktivační energie, určuje rychlost, se kterou bude přecházet konformace odpovídající danému údolí na konformací druhou. Čím je tato energetická hradba vyšší, tím bude změna pomalejší4. Zatímco u malých molekul a rotací postranních řetězců jsou aktivační energie zanedbatelné a konformační změny probíhají velmi rychle, u rotací kolem vazeb v páteři biomakromolekul se setkáváme s energetickými hradbami tak vysokými, že změny konformace jsou téměř nemožné. Tak se může stát, že molekula zůstane po celý svůj život uvězněna v jednom údolí, ačkoli jiné údolí by bylo energeticky ještě výhodnější. 3Vliv rozpouštědla tentokrát zanedbáváme, abychom výklad příliš nekomplikovali. Víme ale, že solvatace vodou hraje v interakcích mezi molekulami zásadní roli. 4Přesněji řečeno, tím bude menší pravděpodobnost, že ke změně dojde. 82 KAPITOLA 6. INTERAKCE URČUJÍCÍ STRUKTURU BIOMAKROMOLEKUL Torzní úhel Obrázek 6.9: Srovnání termodynamického a kinetického popisu konformační změny. Vlevo je schematicky znázorněna rotace kolem vazby 1. Z možných konformací lišících se rotací kolem vazby 2 jsou znázorněné tři. Vpravo je energetický popis děje. Tenkou čarou je znázorněna závislost vnitřní energie na rotaci kolem vazby 1, tlustou čarou je znázorněna závislost volné energie na rotaci kolem vazby 1. Energetický rozdíl znázorněný uprostřed grafu energie (černě) udává, jaké bude zastoupení jednotlivých konformací v rovnovážné směsi. Energetický rozdíl vyznačený vlevo (zeleně) udává rychlost přeměny levé konformace na pravou, energetický rozdíl vyznačený vpravo (červeně) udává rychlost zpětné konformační změny. Cäst II Lov struktur 83 Kapitola 7 Uvod do metod strukturní biochemie V této části skript si popíšeme metody, pomocí kterých můžeme struktury biologicky zajímavých makromolekul zkoumat. Nejdříve si ukážeme, jak můžeme získat vzorek molekuly pro experimentální metody studia struktur. Poté si představíme metody poskytující informaci o primární struktuře a o sekundární struktuře a celkovém tvaru molekuly. Nejvíce prostoru věnujeme zkoumání konformace, hlavnímu cíli strukturní biochemie. Zamyslíme se nad tím, co se o konformaci biomakromolekul můžeme dozvědět z výpočtu a pak se zaměříme na experimentální metody s atomovým rozlišením. Abychom se v různosti experimentálních přístupů zorientovali, věnujeme jim následující úvahu. V běžném životě získáváme informace o světě kolem nás pomocí našich pěti smyslů, čichu, chuti, zraku, hmatu a sluchu. Každý z těchto smyslů nám podává jinou informaci o okolí. Pokud nás zajímá sklenice na stole před námi, čich a chuť nám napoví, jaký nápoj obsahuje. K tomu, abychom se dozvěděli, jaký má sklenice tvar a jak je plná, musíme ale zapojit jiné smysly. Především zrak, pokud nevidíme, tak hmat. I sluch nám ledacos napoví, sklenice různých tvarů a různě plné také různě zní, když do nich ťukneme lžičkou, nebo přejedeme vlhkým prstem po jejich okraji. Netopýři či delfíni používají sluch místo zraku. Podobně je tomu s experimentálními metodami výzkumu biologicky zajímavých molekul. Optické metody, se kterými se seznámíme v kapitole 10, se podobají čichu a chuti, popisují složení molekul, ne jejich tvar. Tak jako ochutnáním můžeme odhadnout obsah cukru či alkoholu, cirkulární dichrois-mus nám řekne, kolik procent skládaného listu či a-šroubovice protein obsahuje, ale neposkytne nám trojrozměrný model molekuly. Pokud nás zajímá prostorové uspořádání, musíme použít jiné přístupy. Když vás bude zajímat tvar nějakého předmětu, nejspíš se na něj podíváte. Půjde-li o něco maličkého, použijete mikroskop. Tento přímočarý přístup má ale své hranice. Mikroskopem nemůžete pozorovat objekt menší, než je vlnová délka záření, které používáte. Vlnová délka viditelného světla se pohybuje ve stovkách nanometrů. Vzdálenosti mezi atomy jsou ale o málo větší, než desetina nanometru. Když se podíváte na spektrum elektromagnetického záření, zjistíte, že správnou vlnovou délku pro pozorování atomů v molekule mají rentgenové paprsky. Rentgenový mikroskop bohužel postavit neumíme, ze dvou důvodů. Za prvé nemáme rentgenové čočky. Za druhé, i kdybychom je měli, musely by ohýbat záření s chybou menší, než vzdálenost atomů. Přesto existuje způsob, jak „vidět" molekuly prostřednictvím rentgenových paprsků. Tuto metodu si popíšeme v kapitole 12. Při hledání záření s vhodnou vlnovou délkou se nemusíme omezovat na elektromagnetické vlny. Kvantová mechanika ukazuje, že kromě částic světla, fotonů, mají vlnovou povahu i jiné částice. Dva druhy částic mohou být dostatečně urychleny, aby jejich vlnová délka byla v řádu desetin nanometru. Jsou to neutrony a elektrony. Neutrony můžeme použít podobým způsobem jako fotony, elektrony mají 85 86 KAPITOLA 7. ÚVOD DO METOD STRUKTURNÍ BIOCHEMIE ale jednu výhodu. Protože jsou elektrony nabité, můžeme jejich paprsek ohýbat v magnetickém poli. Díky tomu můžeme postavit elektronový mikroskop. Rozlišení nejlepších elektronových mikroskopů se blíží atomovým vzdálenostem. Musíme přitom ale používat velmi nízké dávky elektronů, abychom nepoškodili vzorek. Při elektronové mikroskopii proto zápolíme s nízkým poměrem signálu k šumu. Proto se při elektronové mikroskopii vysokého rozlišení používá průměrování většího počtu obrazů. Elektronová mikroskopie je nej užitečnější pro studium největších molekul a molekulových komplexů, pro které je použití rentgenové difrakce značně náročné. Elektronová mikroskopie a rentgenová krystalografie se proto vzájemně doplňují. Tak, jak jsme si popsali metody založené na difrakci záření jako obdobu zraku, můžeme najít i metody představující analogii hmatu. Jde o skupinu metod označovanou jako atomová silová mikroskopie (atomic force microscopy, AFM). Při těchto metodách se používá sonda s velmi ostrým hrotem, která „osahává" zkoumaný vzorek podobně jako jehla gramofonu „ohmatává" povrch klasické vinylové desky. Posledním smyslem je sluch. I pro něj můžeme mezi metodami strukturní analýzy najít přibližnou analogii. Je jí nukleární magnetická rezonance (NMR), popsaná v kapitole 14. Podobně jako při ťukání na skleničku, NMR analýza poskytuje informaci o prostorovém uspořádání zakódovanou do detego-vaných frekvencí. Z tohoto pohledu jde o metodu nepřímou, podobně jako sluch: frekvence tónu odráží plnost a tvar sklenky, zpracování této informace do jasné představy sklenice je ale pro náš mozek dosti tvrdý oříšek. Kapitola 8 Příprava vzorku biomakromolekul 8.1 Izolace z přírodního materiálu Zpracování přírodního materiálu (rozbitých buněk, tělních tekutin a nejrůznějších produktů, které organismus vylučuje) je nejstarším způsobem získávání biomakromolekul. Výhodou tohoto postupu je snadná dostupnost větších množství takového materiálu. Nevýhodou je složitost směsi, ze které chceme naši biomakromolekulu získat. Přírodní vzorek, z kterého chceme získat jednu čistou látku, zpravidla obsahuje tisíce jiných látek. K získání té jediné požadované je nutno navrhnout vhodný postup postupného čištění (purifikační schéma). Takový postup zahrnuje vhodnou kombinaci různých separačních technik (metod dělení látek). V tomto krátkém přehledu není možné probírat detaily purifikačních postupů, které se případ od případu liší. Zmíníme tedy pouze obecné přístupy k purifikaci různých biologicky zajímavých molekul. Pro čištění složitých směsí biologických látek byla vyvinuta řada separačních metod. Tyto metody dělí látky na základě různé interakce molekul směsi s vnějším polem nebo s molekulami přítomnými v separačním zařízení. Volba metody závisí na množství látky, které chceme získat. K určení sekvence postačují nanogramová i menší množství, zatímco určení prostorové struktury vyžaduje několik miligramů čisté látky. Obecně lze říci, že v prvních krocích purifikačního postupu se používají metody, které sice nedělí látky příliš účinně, ale mohou zpracovat velké množství vzorku. V závěru naopak přicházejí ke slovu techniky s omezenou kapacitou (množstvím vzorku, které lze použít), ale vysokou účinností dělení. Navíc je třeba kombinovat metody, které dělí látky podle různých vlastností (například podle velikosti molekul, síly iontových interakcí a velikosti hydrofobního efektu), to se týká zejména proteinů. K nej hrubším dělícím technikám patří srážení a extrakce různými rozpouštědly. Lze jimi oddělit větší skupiny látek, například nukleové kyseliny od proteinů. Poměrně hrubé je také dělení na membránách, které umožňuje třídit molekuly podle velikosti. Centrifugační metody jsou vhodné pro dělení největších molekul. Jde o techniku šetrnou, její účinnost ale není příliš vysoká. Elektroforézu a příbuzné metody je možné použít pro dělení látek tvořící ionty. Elektroforetické dělení může být velmi účinné (zejména pokud provádíme elektroforézu v tenké kapiláře). Tímto způsobem lze ale většinou zpracovat jen malá množství látek. Nejrozumnější kompromis mezi účinností a kapacitou poskytují metody kapalinové chro-matografie. Velmi účinná je chromatografie na reverzní fázi, která dělí molekuly na základě hydrofobního efektu. Nevýhodou této metody je používání organických rozpouštědel, které často poruší přirozenou konformaci proteinů. Šetrnější obdobou je takzvaná hydrofobní chromatografie. Velmi oblíbená je ion-toměničová chromatografie, která je poměrně účinná, šetrná a dochází při ní k zakoncentrování vzorku. Vylučovací (gelová) chromatografie nemá příliš vysokou kapacitu ani účinnost, umožňuje ale šetrné dělení molekul podle velikosti. Nejúčinnější dělení poskytují různé varianty afinitní chromatografie, které jsou založeny na vysoce specifických interakcích (například antigénu s protilátkou nebo enzymu 87 88 KAPITOLA 8. PŘÍPRAVA VZORKU BIOMAKROMOLEKUL s inhibitorem). Jako příklad purifikačního schématu proteinu můžeme uvést postup zahrnující srážení síranem amonným, iontoměničovou, hydrofobní a vylučovací chromatografii (v tomto pořadí). Malá množství vysoce čistého proteinu pro určení sekvence můžeme získat elektroforézou nebo chromatografii na reverzní fázi1 v kapilárním provedení. Po určení částečné sekvence je pak možné vyhledat gen příslušného proteinu a větší množství vzorku připravit metodami molekulární biologie (viz sekci 8.2). Nukleové kyseliny se obvykle získávají iontoměničovou chromatografii nebo extrakcí do směsi chloroformu a fenolu a následným alkoholovým srážením. K dělení DNA podle velikosti molekul se používá elektroforéza v gelu. Díky párování bází lze izolovat nukleovou kyselinu, která obsahuje pouze určitou sekvenci nukleotidů. Takto izolovanou DNA obvykle vnášíme metodami molekulární genetiky (sekce 8.2) do jiného organismu, se kterým se snáze pracuje. Jinou možností je určit sekvenci z malého množství nukleové kyseliny a připravit větší množství chemicky (sekce 8.9). Srážení a extrakce slouží i k hrubému přečištění lipidů a polysacharidu. K jemnějšímu dělení slouží opět chromatografie na reverzní nebo normální fázi. Polysacharidy se často dělí pomocí iontoměničové chromatografie nebo podle velikosti vylučovací chromatografii. Protože stavba sacharidů a biomembrán není přímo geneticky kódována, jsme na studium přírodního materiálu odkázáni mnohem více, než v případě proteinů a oligonukleotidů. Lipidové dvojvrstvy můžeme připravit poměrně jednoduše smícháním příslušných lipidů. V takovém případě ale nejde o biomembrány v pravém slova smyslu, ale spíše o modelové útvary, které postrádají membránové proteiny a jiné složky. Studium procesů, které se na membránách odehrávají, proto vyžaduje přípravu dvojvrstvy obsahující potřebné membránové proteiny. Ty jsou obvykle izolovány z přírodního materiálu s použitím vhodného detergentu, který umožní jejich rozpuštění (solubi-lizaci). 8.2 Metody molekulární biologie V počátcích molekulární biologie se zájem badatelů soustředil na pochopení toho, jak buňka předává a zpracovává dědičnou informaci (na molekulární genetiku). Tento cíl vyžadoval nejprve zvládnutí experimentální práce s molekulou, která genetickou informaci nese, s DNA. Rozvoj metod práce s nukleovými kyselinami umožnil, že molekulárně biologické techniky jsou dnes využívány nejen k přípravě vzorků nukleových kyselin, ale i vzorků proteinů. Metody genového inženýrství umožňují přípravu velkého množství proteinu v cizím organismu (se kterým se snadněji pracuje), zavedení afinitní značky (která dramaticky zjednodušuje puriŕikaci) a určitou manipulaci s proteinem (jako záměnu isotopů pro potřeby nukleární magnetické rezonance nebo záměnu síry za selen využívaný v rentgenové strukturní analýze). Metody molekulární biologie vycházejí ze způsobu, jakým se předává genetická informace v buňce. Tento soubor složitých dějů si můžeme shrnout do několika bodů. Zaměříme se přitom na bakterie, se kterými se pracuje nejsnáze. • Nositelem genetické informace je molekula DNA. Většina dědičné informace je v buňce přítomna v jedné kopii ve formě jedné nebo více dlouhých dvojšroubovic, zvaných chromozomy. Chromozom bakterie Escherichia coli, se kterou molekulární biologové pracují nejčastěji, je kruhová molekula obsahující čtyři miliony nukleotidů. V bakteriálních buňkách je navíc malá část genetické informace přítomna ve formě krátkých kruhových molekul DNA, zvaných plasmidy. Obvyklá délka plasmidů je několik tisíc nukleotidů. • Molekula DNA je z chemického hlediska souvislý řetězec nukleotidů. Z biologického hlediska si ale tento řetězec můžeme rozdělit na kratší úseky, z nichž každý nese informaci o jedné vlastnosti K určení sekvence není třeba zachovat přirozenou konformaci. 8.3. EXPRESNÍ VEKTORY 89 buňky. Tyto úseky se nazývají geny. Geny jsou části informace, nikoli struktury, sekvence nukleotidů kódující jeden gen mohou být několikrát přerušené sekvencemi, které nesouvisí s informací daného genu (takové sekvence se nazývají introny), nebo může určitý úsek DNA kódovat dva různé překrývající se geny. • Během buněčného dělení se vytvoří kopie (replika) chromozomu, takže obě dceřinné buňky obsahují po jedné molekule chromozómové DNA. Tento proces se nazývá replikace. • Buňka si svou dědičnou informaci důsledně uchovává a předává následujícím generacím. Za určitých okolností si ale mohou buňky genetickou informaci vyměňovat. Je-li například život bakterie ohrožen nějakým antibiotikem, začne bakteriální buňka ochotně přijímat plasmidy v naději, že některý z plasmidů bude obsahovat gen, který ji před antibiotikem ochrání (gen rezistence). Popsaná změna genetické informace se nazývá transformace buňky. • Proces, kterým se určitá dědičná vlastnost projeví, se nazývá exprese genu. Nejběžnějším případem je syntéza proteinu kódovaného určitým genem (exprese proteinu). • Má-li dojít k expresi, musí být nejdříve příslušný gen „přepsán" do molekuly RNA. Tento proces se nazývá transkripce, vzniklá molekula RNA se označuje jako mediátorová RNA (mRNA). Vzniklá RNA je „odlitkem", nikoli kopií určitého úseku DNA, navíc jsou z ní odstraněny nekódující sekvence nukleotidů (introny) procesem zvaným sestřih. • Během exprese proteinů je genetická informace přeložena podle kódovací tabulky ze sekvence nukleotidů do sekvence aminokyselin. Tento proces interpretace genetického kódu se nazývá translace. K vlastnímu dekódování dochází během takzvané aktivace aminokyselin, kdy je každý aminokyselinový zbytek navázán na příslušnou krátkou molekulu RNA, zvanou transferová RNA (tRNA). Enzymy, které aktivaci řídí, musí rozpoznat, která tRNA patří ke které aminokyselině (musí „znát genetický kód"). Každá tRNA pak už rozpozná správné místo na molekule mRNA podle párování bází. Po navázání tRNA na mRNA dojde k přenosu zbytku aminokyseliny na konec rostoucího polypeptidového řetězce. Tato syntéza proteinů probíhá v útvarech zvaných ribozomy. 8.3 Expresní vektory Studium eukaryotních proteinů často probíhá podle naznačeného schématu „od genu k proteinu". Jak bude zmíněno v sekci 9.1, často se i u proteinu nejprve izolovaného z přirozeného zdroje postupuje „od proteinu přes gen k proteinu". Eukaryotní gen se (ve formě odpovídající již sestřihané mRNA) zavede do molekuly DNA schopné nezávislé replikace a exprese (takzvaného vektoru, nejčastěji bývá vektorem plasmid). Tím se vytvoří takzvaný expresní konstrukt, kterým se transformuje vhodný kmen Escherichia coli. Dnes jsou k dispozici kmeny, se kterými se pohodlně a bezpečně pracuje a které jsou ochotny podle dodané genetické informace vyrábět velká množství proteinů pro E. coli zcela cizích. K přesně definovanému vyjmutí úseku DNA se používají zvláštní enzymy zvané reštrikční endonuk-leasy, které specificky rozpoznávají krátké sekvence (nejčastěji šesti nukleotidů). Vektory, do kterých úsek DNA vkládáme jsou uměle připraveny tak, aby obsahovaly: 1. větší počet míst rozpoznávaných jednotlivými restrikčními endonukleasami, 2. sekvence nezbytné pro replikaci a expresi vektoru v bakterii (sekvence určující počátek replikace, bakteriální promotor, což je sekvence rozpoznávaná jako začátek transkripce, místo vazby na ribozomy), 90 KAPITOLA 8. PŘÍPRAVA VZORKU BIOMAKROMOLEKUL 3. sekvenci kódující takzvanou afinitní značku (několik aminokyselinových zbytků, obvykle histidi-nových, které se pevně váží k určitému chromatografickému nosiči), 4. selektivní značku, které umožní rozeznat buňky, do kterých opravdu pronikl použitý vektor. Nejčastěji se používá gen rezistence k vybranému antibiotiku. Bakterie se pak pěstují v prostředí obsahujícím toto antibiotikum, takže přežijí pouze ty buňky, které přijaly expresní vektor. 8.4 Molekulové klonování Pro úspěšnou expresi proteinu je nezbytné získat velké množství potomků jediné buňky, jejíž genetickou informaci jsme upravili zavedením genu pro náš protein. V takovém společenství, které se nazývá klon, nesou všechny buňky požadovanou genetickou informaci (gen našeho proteinu). Základní postup molekulového klonování zahrnuje tři kroky: Příprava genu, který chceme do bakterie vložit Předpokládejme, že máme k dispozici (například v jiném plasmidu) gen proteinu, odpovídající již sestřižené2 mRNA. Tento gen můžeme rozmnožit způsobem, který napodobuje replikaci v živé buňce. Dnes se nejčastěji používá takzvaná polymerasová řetězová reakce (PCR z anglického polymerase chain reaction), kde celý proces provádíme ve zkumavce a řídíme jej pouze změnami teploty reakční směsi. Využíváme přitom zvláštní vlastnosti enzymu, který replikaci provádí. Tento enzym neumí totiž syntézu nového vlákna zahájit, potřebuje již kousek dvojšroubovice, kterou dále umí prodlužovat. Proto musí být ve směsi kromě dlouhého vlákna DNA (obsahující gen) i takzvané primery - krátké úseky DNA, jejichž báze se párují s konci dlouhého vlákna a vytvářejí tak potřebné zárodky dvojšroubovice. V praxi tedy postupujeme tak, že chemicky nasyntetizujeme (nebo si necháme na objednávku vyrobit) dva krátké oligonukleotidy, které nám budou sloužit jako primery. Nesmí být příliš krátké, to by se nevytvořily stabilní zárodky dvojšroubovice, naopak syntéza dlouhých primerů by byla drahá. Vhodná délka je asi 18 nukleotidů. Primery nám umožňují nejen vybrat si, který úsek DNA chceme replikovat, ale také zavést několik koncových nukleotidů podle naší potřeby. Toho využíváme k zavedení sekvencí, které rozpoznají námi zvolené reštrikční endonukleasy. Připravíme reakční směs obsahující DNA s genem, primery, volnými nukleotidy (ve formě trifosfátů, které vyžaduje replikační enzym), enzymem a dalšími látkami potřebnými pro dobrý průběh reakce. Postupně měníme teplotu reakční směsi. Při ochlazení se spojí primery s dlouhým vláknem DNA, při optimální teplotě reakce dochází k syntéze nového vlákna DNA podle starého (obě vlákna vytvoří dvojšroubovici), při zahřátí se dvojšroubovice rozpadne na dvě vlákna. V dalším kroku tedy už začínáme se dvěma vlákny a po stejném teplotním cyklu dostaneme vlákna čtyři, v příštím kroku osm, pak šestnáct, a tak dále geometrickou řadou. Nakonec provedeme štěpení DNA, kterou chceme do vektoru vložit, restrikčními endonukleasami. Po štěpení restrikčními endonukleasami vznikají krátké přesahující jednovláknové sekvence, kterými se později dvě molekuly DNA spojí na základě párování bází. Vložení genu do vektoru Vektor (plasmid, do kterého chceme gen vložit) rozštěpíme stejnými restrikčními nukleasami, jakými jsme štěpili DNA obsahující náš gen. Vektory, které lze koupit, obsahují velké množství sekvencí rozpoznávaných různými restrikčními endonukleasami. Není proto obtížné vybrat si vhodné štěpící místo. Po smícháním vektoru s genem dojde k párování konců obou molekul DNA. Molekuly ovšem dosud nejsou kovalentně spojeny. Dalším krokem je proto vytvoření fosfodiesterových vazeb mezi genem a vektorem pomocí specifických enzymů. Tím vznikne expresní konstrukt, který můžeme vložit do bakterie. 2 Sekvence DNA odpovídající již sestřižené mRNA se označuje cDNA. 8.5. MÍSTNĚ ŘÍZENÁ MUTAGENEZE 91 Transformace K situaci, kdy je bakteriální buňka ochotna přijmout cizí DNA dochází jen výjimečně. Chceme-li vložit expresní konstrukt do bakterie, musíme buňky nejdříve připravit a pak vystavit krizovým podmínkám (například zvýšené teplotě). V té chvíli se budou buňky cítit ohroženy a budou ochotny přijmout expresní konstrukt - dojde k transformaci. Transformované buňky necháme množit na živné půdě (médiu) s antibiotikem, proti kterému jsou rezistentní jen buňky obsahující použitý vektor. Bakteriální kulturu potom rozetřeme na agarovou plotnu tak, aby vyrostly oddělené kolonie bakterií. Každá taková kolonie je tvořena potomky jedné buňky, jde tedy o jeden klon. Analýzou DNA jednotlivých klonů zjistíme, které opravdu obsahují vektor se začleněným genem. Kolonii pak pipetou nebo párátkem přeneseme do živné půdy a necháme rozmnožit. Následnou selekcí se vyberou klony buněk, které opravdu obsahují vektor se začleněným genem. 8.5 Místně řízená mutageneze V některých případech nechceme zkoumat pouze protein přítomný ve studovaném organismu, ale chceme jej nějakým způsobem pozměnit. Takových změn genetické informace, neboli mutací, lze dosáhnout pomocí metod řízené mutageneze. Genetickou informaci nakloňovanou do vhodného vektoru lze pozměnit zavedením mutací na přesně daném místě. Běžné strategie místně řízené mutageneze lze rozdělit na dva druhy. 1. První postup je založen na vyštípnutí dvoj řetězcového fragmentu DNA v místě, které má být mutováno (přesněji řečeno mezi nejbližšími místy rozpoznávanými restrikčními nukleasami) a na nahrazení tohoto fragmentu uměle připraveným fragmentem obsahujícím požadovanou mutaci. 2. Druhý postup využívá toho, že dostatečně dlouhý (asi 18 párů bází) úsek dvojšroubovice může být účinně párován i v případě, že jeden pár bází není komplementární (netvoří pár dle Watsona a Cricka). Vektor s nakloňovaným genem se rozdělí na jednotlivá vlákna a jedno z nich se nechá párovat s uměle připraveným oligonukleotidem obsahujícím jeden vyměněný (nepárující) nukleotid, takzvanou bodovou mutaci. Tento oligonukleotid pak slouží jako primer pro dosyntetizování druhého vlákna vektoru. Mutace je tak zavedena do jednoho vlákna výsledného vektoru, které je třeba izolovat. Tento druhý postup je sice složitější, ale je levnější, neboť nemusí být syntetizován celý dvojřetězcový úsek molekuly DNA. 8.6 Bakteriální exprese Před expresí se transformované buňky namnoží v potřebném objemu kultivačního media a vlastní exprese se zahájí přidáním látky, která je nezbytná pro transkripci genu v plasmidu3 - takzvanou indukcí. Nejčastěji používaným organismem je E. coli, která představuje dobře definovaný organismus s geneticky upravenými kmeny umožňujícími vysokou expresi cizích proteinů. Pro E. coli je také komerčně dostupný bohatý výběr vektorů. Bakteriální exprese má ale i své nevýhody. Bakterie neumožňují sestřih a posttranslační modifikace eukaryotních proteinů. Proteiny mohou být vylučovány ne jako rozpustné makromolekuly ve správné 3 Používané plasmidy jsou navrženy tak, že místo sloužící jako počátek transkripce, takzvaný promotor, je rozpoznáváno příslušným enzymem pouze tehdy, je-li přítomna určitá látka. Nejčastěji se používá promotor, který bakterie používají k zahájení transkripce genů pro odbourání laktosy. Tento promotor je běžně nefunkční, protože se v jeho blízkosti váže protein, který jej blokuje. Když ale přidáme látku, která je schopna vázat se na tento protein (používá se isopropylthioga-laktosid), protein se váže k přidané látce místo k DNA a uvolní tak promotor. Volný promotor je rozpoznán příslušným enzymem a exprese může začít. 92 KAPITOLA 8. PŘÍPRAVA VZORKU BIOMAKROMOLEKUL konformaci, ale v nerozpustných shlucích zvaných inkluzní tělíska a disulfidové můstky nemusí být správně vytvořeny. Posledně zmíněné překážky se dají částečně obejít vhodnou volbou podmínek exprese (například snížení teploty). 8.7 Purifikace exprimovaných proteinů Po sklizení buněk je třeba rozbít buněčnou stěnu a izolovat exprimovaný protein. Pro usnadnění poslední fáze se často připravuje protein ne ve své přirozené formě, ale spojený s jiným peptidem. Druhý peptid může být buď krátký (několik aminokyselin), nebo může jít o celý protein. Krátké peptidové afinitní značky umožňují snadnou purifikaci (přečištění) za vždy stejných podmínek, bez ohledu na vlastnosti exprimovaného proteinu4. Použití celého proteinu jako afinitní značky nejen umožňuje snadnou purifikaci, ale může i příznivě ovlivnit skládání proteinu (a tak omezit tvorbu in-kluzních tělísek). Mezi proteiny používané k tomuto účelu patří thioredoxin, glutathion-čř-transferasa, maltose-binding protein. Odštěpení proteinové značky je umožněno zavedením sekvence rozeznávané specifickou endopeptidasou jako faktor Xa. 8.8 Chemická syntéza peptidů Syntéza biomakromolekul s přesně daným pořadím monomerních jednotek je poměrně obtížný chemický úkol. Nejčastěji se používá syntéza na pevném nosiči, na který je navázána poslední jednotka rostoucího řetězce (obrázek 8.1). Vezměme si náš oblíbený příklad proteinu a zamysleme se, jak bychom jej mohli připravit chemicky. Každá aminokyselina obsahuje několik funkčních skupin, které spolu mohou reagovat. Chceme-li z aminokyselin syntetizovat peptid, musíme zařídit, aby • spolu reagovaly skupiny, které chceme spojit a • nereagovaly skupiny, které chceme zachovat nedotčeny. V sekci 2.2 jsme si popsali formální tvorbu peptidové vazby kondenzací amino- a karboxyskupiny dvou aminokyselin. Bez účinné katalýzy je ale tato reakce příliš pomalá, protože aminy a karboxylové kyseliny nejsou mimořádně reaktivní. K dosažení prvního cíle potřebujeme proto alespoň jednu funkční skupinu aktivovat. Z chemického pohledu je třeba nahradit OH-skupinu karboxylu lépe odstupující skupinou (na obrázku 8.1 je taková aktivující skupina znázorněna trojúhelníčkem). Funkční skupiny, které spolu reagovat nemají, potřebujeme naopak ochránit, neboli blokovat. Po skončení syntézy musíme samozřejmě peptid odblokovat (šetrně odstranit chrániči skupiny), abychom získali molekulu identickou s přirozeným peptidem. Chrániči skupiny jsou na obrázku 8.1 představovány kroužkem, plný a prázdný kroužek mají ukázat, že je často dobré mít různé blokující skupiny, které lze odštěpit nezávisle. Obecně si postup chemické syntézy můžeme rozdělit do několika kroků, které budeme číslovat podle obrázku 8.1. Nejprve musíme připravit jednotlivé stavební jednotky s vhodně aktivovanými a blokovanými funkčními skupinami (1). Potom navážeme první (nebo poslední) monomerní jednotku na pevný nosič (2). Z navázané jednotky selektivně odštěpíme chrániči skupinu, která až dosud blokovala 4Nejčastěji se používají sekvence šesti histidinů, které komplexují dvojmocné kationty nikelnaté, kobaltnaté, zinečnaté, meďnaté. Protein se izoluje metaloclielatační afinitní cliromatografií. Tato metoda využívá kolon s clielatovanými kationty. Při průchodu kolonou komplexuje kation histidiny. Síla vazby je mnohonásobně vyšší pro umělé afinitní značky obsahující několik histidinů za sebou. Afinitne vázaný protein je možno vymýt snížením pH (protonace histidinů), imidazolem (kompetice s histidinem), kyselinou ethylendiamintetraoctovou (komplexuje kationty lépe než kolona), nebo odštěpením afinitní značky od proteinu (pokud je afinitní značka oddělena sekvencí rozpoznávanou specifickou endopeptidasou). .8. CHEMICKÁ SYNTÉZA PEPTIDŮ > - > -A O -> -^ >i CH ^ O] BH m BH h> Obrázek 8.1: Obecný postup chemické synézy biopolymeru. Jednotlivé kroky jsou popsány 94 KAPITOLA 8. PŘÍPRAVA VZORKU BIOMAKROMOLEKUL konec rostoucího řetězce (3). Přidáme aktivovanou a blokovanou druhou (nebo předposlední) mono-merní jednotku (4) a prodloužíme rostoucí řetězec (5). Celý postup opakujeme tolikrát, kolik jednotek má syntetizovaný polymer obsahovat (6). Nakonec hotový biopolymer uvolníme z nosiče a odstraníme všechny chrániči skupiny (7). K chemické syntéze peptidů se obvykle používá takzvaná karbodiimidová metoda, která je popsaná v Dodatku B.l. Touto metodou je možno syntetizovat i delší peptidové řetězce. Tento postup je ale nákladný, proto se syntetizují většinou krátké peptidy, zatímco větší proteiny se připravují metodami molekulární biologie (sekce 8.2). 8.9 Chemická syntéza oligonukleotidů Postup chemické syntézy nukleových kyselin vychází ze stejných principů jako peptidová syntéza. Klíčem k úspěchu je zaručit, aby se vytvořil fosfodiester mezi 5' a 3' hydroxyly a poslední OH-skupina kyseliny fosforečné zůstala volná. Nejčastěji se používá takzvaná fosforamiditová metoda, která je popsána v Dodatku B.2. V této metodě je málo reaktivní ester kyseliny fosforečné nahrazen reaktivním diiso-propylamidem kyseliny fosforite, jejíž druhá OH skupina je chráněna /3-kyanoethylovou skupinou. Fosforamiditová syntéza se běžně používá k přípravě krátkých a středně dlouhých oligonukleotidů pro potřeby molekulového klonování. Pomocí metod molekulární genetiky můžeme oligonukleotidy spojovat do delších úseků DNA. Takto je možné uměle připravovat celé geny, nutná je pouze znalost sekvence. 8.10 Chemická syntéza oligosacharidů Princip syntézy oligosacharidů je podobný jako v případě peptidů a oligonukleotidů. Je nutné aktivovat uhlík, který má vytvořit glykosidickou vazbu a ochránit všechny OH-skupiny kromě jediné, která se má na aktivovaný uhlík glykosidicky vázat. K aktivaci se například používají thioglykosidy. Chrániči skupiny musí být různého druhu, aby bylo možné odblokovat jen vybranou OH- skupinu. Nejběžnějším chráněním je navázání benzylu nebo esterifikace kyselinou (octovou, benzoovou, pivalovou, levulovou). Chemickou syntézou je možné připravit krátké oligosacharidy včetně větvených, zdaleka však nejde o rutinně zavedené metody jako v případě peptidů a oligonukleotidů. 8.11 Enzymová syntéza nukleových kyselin V sekci 8.2 jsme popsali, jakým způsobem lze získat proteiny (a nukleové kyseliny) biosyntézou v živé buňce. V částech 8.8 a 8.9 jsme se zmínili o metodách přípravy biomakromolekul chemickou syntézou. Enzymová syntéza představuje jakýsi přechod mezi biologickou a chemickou přípravou. Stejně jako v bakteriální expresi využívá složitých biologických katalyzátorů - enzymů, syntéza však neprobíhá v živé buňce, ale „ve zkumavce" s použitím izolovaných enzymů. Nejčastějším případem enzymové syntézy je polymerázová řetězová reakce (PCR), již zmíněná v sekci 8.4. Tato metoda je poměrně jednoduchá, protože k syntéze DNA stačí jediný enzym (DNA-polymerasa). Dalšími složkami reakční směsi jsou templát (molekula DNA nesoucí genetickou informaci, podle které syntéza probíhá), primery (krátké oligonukleotidy vymezující tu část templátu, podle které syntéza opravdu proběhne), stavební jednotky (čtyři nukleosidtrifosfáty, které slouží jako aktivované nukleotidy) a několik málo pomocných látek. V praxi se používá enzym z bakterií žijících v horkých pramenech, takže chod reakce lze řídit pouhou změnou teploty5. Účinnost metody je mimořádná, z jediné molekuly templátu lze připravit dostatečné množství DNA, aby se s ní dalo pohodlně pracovat. Pomocí enzymové syntézy je možno připravit i molekuly RNA, je ale nutno použít jiný enzym (RNA-polymerasu). 5Enzym se neničí ani zahřátím téměř k bodu varu, takže jej není třeba během reakce přidávat. 8.12. ENZYMOVÁ SYNTÉZA PROTEINŮ 95 8.12 Enzymová syntéza proteinů V poslední době byla metoda podobná PCR zavedena i pro syntézu proteinů. Jde o takzvanou bez-buněčnou expresi proteinů (cell-free protein expression). Ve srovnání z PCR je bezbuněčná proteinová exprese mnohem náročnější, protože syntéza proteinů v buňkách je mnohem složitější, než replikace DNA. Exprese proteinů zahrnuje transkripci (syntézu mRNA podle templátu DNA) a translaci, která probíhá na složitých nadmolekulárních útvarech - ribozomech. Navíc nejsou aminokyseliny aktivované jednoduchým navázáním zbytků kyseliny fosforečné jako nukleotidy, nýbrž vazbou na relativně složité molekuly tRNA, které zaručují správné přeložení genetické informace do sekvence aminokyselin. Proto musí reakční směs pro bezbuněčnou expresi proteinu obsahovat množství enzymů včetně celých ribo-zomů, izolovaných z bakteriálních buněk. Templátem je opět DNA (ve formě vhodného vektoru), takže enzymy musí zajistit i transkripci do mRNA. Jako stavební bloky slouží obvykle volné aminokyseliny, které jsou aktivovány až v reakční směsi (ta musí obsahovat potřebné enzymy a tRNA izolované z buněk). Je ale možné použít aminokyseliny již vázané na tRNA. Výhodou této možnosti je, že nejsme omezeni na 20 geneticky kódovaných aminokyselin (synteticky můžeme připravit a do molekuly proteinu zařadit i aminokyseliny, které se v přírodě nevyskytují). V současné době nachází bezbuněčná syntéza uplatnění zejména ve dvou případech. První případ zahrnuje situace, kdy není možné protein v buňce připravit (protein je pro buňku toxický, nebo jej enzymy buňky štěpí). Druhým případem jsou situace, kdy chceme připravit protein, ve kterém jsou aminokyseliny jasně daným způsobem upraveny (začlenění nepřirozených nebo izotopově značených aminokyselin na určité místo proteinu). 8.13 Enzymová syntéza oligosacharidů Pomocí enzymů izolovaných z různých organismů je možné spojovat sacharidové stavební jednotky do oligosacharidů. Princip metody se liší od enzymové syntézy proteinů a DNA v tom, že nelze použít templát, který by definoval primární strukturu oligosacharidů. Důvod je prostý - sacharidy nejsou přímo geneticky kódovány. K určení pořadí sacharidových jednotek a způsobu jejich vazby se využívá speci-ficity jednotlivých enzymů. Každý enzym je schopen katalyzovat vznik jen určité vazby mezi určitými sacharidy. V syntéze oligosacharidů jsou proto používány v každém kroku různé enzymy, podle toho které sacharidy chceme spojit a jak. Metody enzymové syntézy oligosacharidů jsou pracné, ale vzhledem k obtížnosti chemické syntézy jsou s oblibou používány, zejména k přípravě větších množství oligosacharidů. KAPITOLA 8. PŘÍPRAVA VZORKU BIOMAKROMOLEKUL Kapitola 9 Metody určování sekvence 9.1 Sekvenace proteinů K určování sekvence proteinů je možno přistupovat dvěma způsoby. První přístup je založen na postupném odštěpování koncových aminokyselin a jejich analýze. Nejběžnějším příkladem je chemické odbourávání Edmanovou metodou. Druhý přístup je založen na částečném štěpení polypeptidového řetězce a analýze vzniklých štěpů (nejčastěji hmotnostní spektrometrií). Oba přístupy umožňují sek-venovat peptid pouze do určité délky (maximálně několik desítek aminokyselin). Pokud chceme znát úplnou sekvenci proteinu, můžeme použít jeden z následujících postupů. 1. Pomocí specifických enzymů1 můžeme připravit kratší peptidy, které je možno sekvenovat úplně. Máme-li alespoň dvě sady peptidů s vzájemně se překrývajícími sekvencemi, můžeme kombinací částečných sekvencí určit celkové pořadí aminokyselin proteinu. 2. V posledních letech je běžnější druhý postup, kdy určíme pouze částečnou sekvenci proteinu (například přibližně 15 aminokyselin ]V-konce proteinu). Z této informace je možné odvodit nukle-otidovou sekvenci kódující příslušný protein (přesněji řečeno sekvenci s několika nejednoznačnými nukleotidy v důsledku degenerace genetického kódu). Pomocí této sekvence identifikujeme gen studovaného proteinu a sekvenaci provádíme na úrovni nukleových kyselin (metody sekvenace nukleových kyselin jsou rychlejší méně pracné než metody sekvenace proteinů). 3. Nejjednodušší postup je obejít se bez sekvenace proteinů docela a změřit pouze hmotnosti peptidů vzniklých štěpením enzymy (viz postup 1) pomocí hmotnostní spektrometrie. Pokud je známa genetická informace studovaného organismu, je možné pomocí počítačové analýzy sekvence DNA vypočítat, jestli změřené hmotnosti peptidů neodpovídají nějakému proteinu kódovanému DNA. Nalezne-li se více takových peptidů odpovídajících jednomu proteinu, je velká pravděpodobnost, že skutečně studujeme tento protein. Tato metoda, zvaná peptidové mapování, je velmi rychlá. Lze ji samozřejmě použít pouze tehdy, je-li známá sekvence DNA daného organismu, nebo jde-li o protein již dříve zkoumaný a sekvenovaný. Je také možné, že analýza nalezne velmi podobný protein jiného organismu. -'-Jako příklad můžeme uvést trypsin štěpící na karboxylovém konci lysinu a argininu, nebo bakteriální endopeptidasy jako peptidasa V8 (z bakterie Staphylococcus aureus) štěpící na karboxylovém konci kyseliny glutamové. 97 98 KAPITOLA 9. METODY URČOVANÍ SEKVENCE 9.2 Edmanovo odbourávání Podstatou Edmanovy metody je adice fenylisothiokyanátu na koncovou aminoskupinu proteinu. Takto derivatizovanou aminokyselinu je možno selektivně hydrolyzovat a pomocí kapalinové chromatografie určit, které aminokyselině odštěpený fenylthiohydantoin odpovídal. Celý postup se provádí v automatických sekvenátorech. Úspěšnost Edmanova odbourávání vyžaduje, aby se v každém kroku odštěpila úplně právě jedna aminokyselina. Chyby způsobené nedokonalostí se hromadí a omezují délku peptidu, který je možné sekvenovat. Kdyby štěpení probíhalo z 90%, což je na první pohled slušná účinnost, druhý krok by proběhl pouze z 81 % (0,92) a při určování sedmé aminokyseliny už bychom správného produktu získali méně než polovinu (0,97 = 0,478). V praxi se většinou stanovuje sekvence zhruba patnácti aminokyselin. 9.3 Sekvenace hmotnostní spektrometrií Analýza derivatizovaných aminokyselin odštěpovaných v jednotlivých krocích Edmanova odbourávání vyžaduje spolehlivou chromatorgrafickou metodu. Existuje však jiná vlastnost, kterou se aminokyseliny liší a která je mnohem jednoznačněji definována, než chromatografické chování. Touto vlastností je hmotnost. Přesné měření tak malé hmotnosti, jako je hmotnost jednotlivých molekul, není samozřejmě jednoduché. Metody, které nám to umožňují, se souhrnně označují jako hmotnostní spektrometrie (mass spectrometry, zkratka MS) a byly vyvinuty už před mnoha lety2. Použití hmotnostní spektrometrie ke studiu proteinů a určování jejich sekvence si ale vyžádalo další technická vylepšení metody, která jsou stručně popsána níže. Obecně si postup sekvenace pomocí hmotnostní spektrometrie můžeme rozdělit do několika kroků: • Rozštěpení proteinu na kratší peptidy, nejčastěji pomocí enzymů • „Odpaření" a ionizace molekul peptidů • Vytvoření fragmentů peptidů • Určení hmostností fragmentů pomocí vhodného detektrou • Analýza hmotnosti fragmentů První krok, rozštěpení proteinu na kratší peptidy, byl již popsán v části 9.1. Proto se zaměříme přímo na druhý krok, vytvoření iontů peptidů. Největším problémem hmotnostní spektrometrie proteinů (a jiných biomakromolekul) nebylo po dlouhá léta vlastní měření hmotnosti, ale vytvoření iontu. Biomakromolekuly jsou sice v roztoku přítomny jako ionty, ale je velmi těžké tyto ionty z roztoku uvolnit a poslat do hmotnostního detektoru. Dnes známe dvě velmi účinná řešení tohoto problému. Prvním řešením je takzvaný elektrospray. Jde o zajímavý úkaz známý již dlouhá léta. Přivádíme-li do oblasti silného elektrického pole roztok iontů, kapičky roztoku se odpařují (ztrácejí molekuly vody), takže se zmenšuje jejich povrch a roste poměr náboje k povrchu, povrchové napětí nestačí udržet kapku pohromadě, takže se tříští na menší a menší kapičky, které se ještě rychleji odpařují a vše pokračuje tak dlouho, až se odpaří všechny molekuly vody a prostorem letí „nahý" iont makromolekuly. Jiným způsobem, jak získat ionty biomakromolekul, je odpařit roztok a vzniklý prášek ostřelovat záblesky laseru. V nejčastějším provedení jsou k biomakromolekule přidávány organické kyseliny (takzvaná matrice), které absorbují energii laseru, chrání makromolekulu a dodávají ji kladný náboj. Tato metoda se nazývá Matrix-Assisted Laser Desorption Ionization (MALDI). 2 Přesněji řečeno, hmotnostní spektrometrie měří poměr hmotnosti a náboje nabité molekuly. 9.3. SEKVENACE HMOTNOSTNÍ SPEKTROMETRIÍ 99 Třetím krokem postupu sekvenace hmotnostní spektrometrií je tvorba fragmentů peptidů. Tyto fragmenty se buď připraví před analýzou3, nebo, častěji, vznikají během vlastního měření rozpadem molekul excitovaných laserovou ionizací (takzvaný post-source decay) nebo srážkami s molekulami vhodného plynu (collision-induced dissociation). Čtvrtým krokem je samotné měření hmotnosti fragmentu. Podívejme se nejprve obecně na měření hmotnosti pomocí hmotnostní spektrometrie. Hmotnostní spektrometrie je založena na sledování pohybu iontů v elektromagnetickém poli. V principu nejjednodušší je urychlit iont v elektrickém poli a pak měřit dobu, za kterou proletí trubicí známé délky. Protože víme, jak silným polem jsme iont urychlili, známe jeho kinetickou energii. Z doby průletu umíme spočítat rychlost iontu, takže určení hmotnosti z kinetické energie E = |mi)2 již nic nebrání. Tato metoda se označuje zkratkou TOF-MS (Time-Of-Flight Mass Spectrometry). Jinou možností je sledovat, jak se zakřivuje dráha iontu v magnetickém poli. Zakřivení závisí na hmotnosti a náboji iontu, takže opět můžeme jednoduše spočítat hmotnost (známe-li náboj). Zvláštním způsobem měří hmotnost takzvaná iontová past (ion trap). Tato past je tvořena elektrodami, které vytvářejí kmitající elektrické pole. V tomto poli se udrží jen ionty určitého poměru hmotnosti k náboji. Během měření měníme pole tvořící past a sledujeme, které ionty se již v pasti neudrží a vyletí do detektoru. Vratme se teď k měření hmotnosti fragmentů peptidů. Z popsaného principu hmotnostní spektrometrie je zřejmé, že hmotnostní spektrometry detekují jen nabité částice (ionty). Platí to i o pro fragmenty vzniklé štěpením peptidů. Analyzovat proto můžeme pouze hmotnosti fragmentů, na kterých zůstal po rozštěpení peptidů elektrický náboj. Tím se dostáváme k poslednímu kroku, analýze naměřených hmotností. Získaná hmotnostní spektra mají vzhled žebříčků a z rozdílu hmotností jednotlivých fragmentů lze odvodit sekvenci původního peptidů. Abychom ale dokázali naměřené hmotnosti fragmentů interpretovat, musíme rozumět tomu, jak fragmenty peptidů vznikají. Dojde-li ke štěpení peptidového řetězce s nábojem +1, může kladný náboj zůstat buď na ]V-koncové části peptidů (takový štěp se označuje písmenem b), nebo na C-koncové části (štěp y). Analýza spekter je navíc komplikována tím, že ke štěpení hlavního řetězce může docházet nejen v místě peptidové vazby, ale i mezi uhlíky (vznikají štěpy a a x) nebo mezi dusíkem a a-uhlíkem (vznikají štěpy ca. z). Získaná hmotnostní spektra mají vzhled žebříčků a z rozdílu hmotností jednotlivých fragmentů lze odvodit sekvenci původního peptidů. Příklad sekvenace krátkého peptidů (Ala-Thr-Gly-Cys) je ukázán na obrázku 9.1. Skutečné fragmentační spektrum, získané metodou MALDI-TOF-MS, ukazuje obrázek 9.2. Určování sekvence proteinů je v praxi obvykle založeno na počítačovém vyhodnocení spekter, které může zahrnovat všechny uvedené komplikace. Analýza spekter závisí také na tom, s jakou přesností hmotnosti měříme. Rozlišení jedné hmotnostní jednotky stačí k určení většiny aminokyselin. Odlišení přibližně izobarických4 aminokyselin (lysin a glutamin) vyžaduje velmi vysoké rozlišení, zatímco izomerní aminokyseliny (leucin a isoleucin) není možné odlišit bez detailního studia fragmentace postranních řetězců. Sekvenace proteinů pomocí hmotnostní spektrometrie je užitečná i v případech, kdy je známá sekvence DNA (gen proteinu). Pokud totiž dochází k posttranslačním modifikacím proteinu (viz sekci 2.2), lze tyto modifikace z rozdílu hmotností odhalit. 3K tomu lze například použít enzymy, které nespecificky odštěpují aminokyseliny z jednoho konce, jako karboxypep-tidasa Y. 4Jako izobary se označují částice se stejnou hmotností. Pokud bychom předpokládali, že hmotnost atomu uhlíku je přesně dvanáctkrát větší než hmotnost atomu vodíku, hmotnost atomu dusíku je přesně čtrnáctkrát větší než hmotnost atomu vodíku a hmotnost atomu kyslíku je přesně šestnáctkrát větší než hmotnost atomu vodíku, byly by lysin a glutamin izobary. Protože se poměry hmotností atomů nepatrně liší od uvedených poměrů a protože lysin a glutamin obsahují různé počty atomů jednotlivých prvků, hmotnosti lysinu a glutaminu se mírně liší. I O O Cys + H (122.03) —NH=CH(R1) OC=NH-CH(R2)— —NH-CH(R1)-C=0 H3N-CH(R2)— —NH-CH(R1)-CO^JH CH(R2)— Gly - H;Q (57.02) y2 NH, CH-CHj COOH Thr-HgO (101.05) 351.14 a Ala -H2O(71.04) aiThr-H?O(10 Th -HpO (101.05) b2 05) 1_Gly TI r - HpO (101.05) l-bO (57.02) Gly - H2O (57.02) b3 c2 Gly-HpO (57102) Gly - h O (5 .02) Thr-H;0 (101.05) ily - H>q (57.( 2) =3 Thr HpO (1(1.05) 50 100 150 200 250 300 M/z Obrázek 9.1: Příklad sekvenace tetrapeptidu Ala-Thr-Gly-Cys pomocí hmotnostní spektrometrie. Vlevo nahoře je znázorněn vznik různých fragmentů s nábojem (+1), vpravo nahoře přehled fragmentů, které mohou vzniknout štěpením jedné vazby našeho tetrapeptidu. Dole je zjednodušené spektrum s vyhodnocením rozdílů hmotností. Signál celého peptidů je znázorněn černě, fragmenty jsou obarveny podle schématu vpravo nahoře. o o 9.4. SEKVENACE NUKLEOVÝCH KYSELIN 101 100 čň 80 g 60 CD > 40 CO CD QC 20 0 b2 a2 ^ cm i- y2 b3 y5 y4 b4 y3 co cm cm b6 co cm oj cd lo T Ö cm in TT TT in I b7 a7 3 y6 b8 820.48 y7 [M+Hf 200 400 600 Mass / charge 800 1000 Obrázek 9.2: Fragmentační spektrum peptidu získané pomocí MALDI-TOF hmotnostní spektrometrie. 9.4 Sekvenace nukleových kyselin Sekvenace nukleových kyselin je založena na přípravě vzorku obsahujícího směs oligonukleotidů s jedním koncem stejným ale lišící se délkou. Taková směs je pak analyzována elektroforeticky. Podmínky tvorby směsi oligonukleotidů musí být zvoleny tak, aby v nich byly zastoupeny všechny délky. Výsledné elek-troferogramy mají tvar žebříčků, ve kterých oligonukleotidy lišící se o délku jednoho rezidua mají dráhu, kterou urazí v gelu (nebo čas elektroforézy v kapiláře), odlišnou o dobře definovaný rozdíl. Vhodnou směs nukleotidů lze vytvořit buď částečným odbouráním nebo neúplnou syntézou. Obě možnosti budou popsány níže. V principu lze pro sekvenaci nukleových kyselin použít hmotnostní spektrometrii jako u proteinů. V současné době je ale toto použití spíše výjimkou (níže popsaná enzymová sekvenace umožňuje určit sekvenci délky několika stovek nukleotidů, zatímco hmotnostní spektrometrie je limitována několika desítkami). Pokud potřebujeme zkoumat delší úseky nukleových kyselin, připravíme kratší překrývající se štěpy pomocí specifických endonukleas, podobně jako u proteinů. 9.5 Chemická metoda Maxama a Gilberta Při sekvenaci nukleových kyselin chemickou (odbourávací) metodou je nejprve třeba označit jeden konec vlákna, například 5'-konec radioaktivním fosforem 32P. Poté potřebujeme čtyři chemické reakce, které přeruší vlákno v místech jednotlivých bází. Pro přerušení vlákna na pyrimidinech se používá štěpení pyrimidinového kruhu hydrazinem. Reaktivita bází klesá v pořadí uracil > cytosin > thymin, takže v případě sekvenování DNA lze zvolit podmínky, za kterých je štěpen cytosin i thymin nebo pouze cytosin (reakce thyminu je potlačena v přítomnosti 2MNaCl). V přítomnosti piperidinu pak dochází k selektivní hydrolýze fosfoesterové vazby nukleotidu s odbouraným pyrimidinovým kruhem. Při štěpení na purinech se nejprve báze methylují dimethylsulfátem. Guanin se methyluje na dusíku 7, zatímco adenin se methyluje na dusíku 3. Hydrolýzou v zásaditém prostředí se přednostně štěpí A^-glykosidická vazba s N7-methylguaninem, zatímco v kyselém prostředí se odštěpuje guanin i adenin. Fosfoesterová vazba se pak hydrolyzuje alkalicky při 90 °G Popsané reakce se provádějí za podmínek zvolených tak, aby se každé analyzované vlákno štěpilo v průměru pouze jednou (pochopitelně na různém místě). Vzniknou tak čtyři sady radioaktivně značených oligonukleotidů, které při elektroforéze vytvoří žebříčky (obrázek 9.3), jejichž porovnáním lze snadno odečíst sekvenci studovaného vlákna DNA. Popsaná metoda je vzhledem ke své pracnosti používána málo, lze ji však přizpůsobit například výskytu nestandardních bází, kde selhává níže popsaná dideoxymetoda. 102 KAPITOLA 9. METODY URČOVANÍ SEKVENCE 32 P -C AGGTACGCGAT hydrazin hydrazin dimethylsulfat dimethylsulfat piperidin + 2M NaCl piperidin I pH < 7 I 90°C, pH>7 I pH > 7 I 90°C, pH>7 32 P -CAGGTACGC P-CAGGTAC 32 P -CAGGTACGC P-CAGGTAC 32P-CAGGTACGCGA32P-CAGGTACGCG 32P-CAGGTACGCG 32P-CAGGTACG 32 P-CAGGT 2P-C 32 p-e 32 P-CAGGTACG 32 CAGG P-CAG Obrázek 9.3: Princip chemické metody Maxama a Gilberta. Ve spodní části obrázku je schematicky znázorněna poloha radioaktivních proužků na gelu, ve kterém byly elektroforézou rozděleny fragmenty vzniklé v jednotlivých reakcích. Šipka vlevo udává v jakém směru oligonukleotidy putovaly během elektroforézy. 9.6. ENZYMOVÁ NEBOLI DIDEOXYMETODA (SANGEROVA) 103 9.6 Enzymová neboli dideoxymetoda (Sangerova) V současnosti je nejběžnější metoda sekvenace kratších úseků DNA (několik stovek nukleotidů) založená na enzymové syntéze oligonukleotidů, ve které sekvenovaný oligonukleotid slouží jako templát. Přídavkem vhodného množství dideoxyanalogů trifosfátů, ze kterých je oligonukleotid sekvenován (ddATP, dd-GTP, ddTTP, ddCTP) je zajištěno náhodné předčasné ukončení syntézy oligonukleotidů5 (tedy tvorba žebříčku v elektoferogramu, jak je ukázáno na obrázku 9.4). Sekvence, kterou při dideoxymetodě čteme, není sekvencí vlákna DNA použité jako templát, ale sekvencí komplementárního vlákna. Čtená sekvence tedy odpovídá již sekvenci mRNA, podle které se syntetizuje protein. K dideoxyanalogům bývá navíc vázána nějaká fiuoreskující sloučenina, kterou lze při elektroforéze snadno a citlivě detekovat. Pokud použijeme různé fluorescenční značky pro ukončení na jednotlivých bázích (G, A, T, C), můžeme sekvenaci provádět v jedné zkumavce. Obrázek 9.5 ukazuje, jak vypadá výsledek sekvenace s použitím fluorescenčních značek a dělením pomocí elektroforézy v kapiláře. Sangerova metoda znamenala zásadní průlom v sekvenování nukleových kyselin a umožnila přečtení celého lidského genomu. Od 90. let 20. století byla vyvinuta celá řada metod, která sekvenování dlouhých úseků DNA, včetně celých genomů, výrazně urychlila. V našem základním textu se ale těmito metodami zabývat nebudeme. 9.7 Sekvenace oligosacharidů Sekvence oligosacharidů se většinou provádí pomocí hmotnostní spektrometrie. Často se kombinuje použití enzymů štěpících glykosidickou vazbu (glykosidas) specifických pro různé sacharidy a typy gly-kosidické vazby s fragmentací během měření. Analýza spekter je obdobná jako u proteinů, vzhledem ke složitosti primárních struktur sacharidů je ale sekvenace oligosacharidů mnohem obtížnější. 5 Dideoxyanalog postrádá hydroxyl v poloze 3'. Proto po jeho zabudování nemůže dojít k dalšímu prodlužování řetězce. 104 KAPITOLA 9. METODY URČOVANÍ SEKVENCE 3' 5' CAGGTACGCGAT dideoxy A dideoxy T dideoxy C dideoxy G y PCR V PCR y PCR y PCR GTCCA GT GTCCATGCGCT A GTCCAT GTCCATGCGC T GTC GTCC GTCCATG C GTCCATGCG C G GTCCATG GTCCATGC G Obrázek 9.4: Princip dideoxymetody. Ve spodní části je schematicky znázorněn obarvený gel po elektroforéze produktů jednotlivých reakcí. Šipka vlevo udává v jakém směru oligonukleotidy putovaly během elektroforézy. Všimněte si, že čtená sekvence (uprostřed gelu), neodpovídá vláknu DNA, které jsme použili jako templát pro sekvenaci, ale vláknu komplementárnímu. 9.7. SEKVENACE OLIGOSACHARIDŮ 105 COTCArTO'TQrOS^^ľTOATTITGGTTTTAt 10 30 »A "TAQAAA TľTTATIQATAÄAQIATr Tľ .)CAÄATACÄAATBkClkTľfcCr AA QGGTTTCT TA TA TGCTCAACACA TGAGľGAAACCC TA T, 40 so 60 70 30 90 100 110 120 ^AGAACCCTAA TTCC CT TA TC TQ QGAAC Tac tcacaca T TA T TC TGGA GAAAAA ta GAGA.91GAT aga T 130 140 150 160 170 180 190 ftJ l a Kfw^ -*A**si^-ér^nJ Ví \ - .A^.-^\-^- --^aAA-,' í U l W W w l A.-i l.--. TGTAGAGAGAGACTGG TGATTTTTGľGGACTCTAGAGGAXCCCGO 200 210 220 230 240 GTacgagc 250 I h TtGAATTCTPGAGGI 260 cca TG G T 270 XffTCCTCT 280 Í. Ä \GAAACCCC aacccgtgaaa 290 300 TCAAAAAAC 310 PCGACGC SCCTGTGQGľATTCAG 320 330 rcr g gatcgcga-aaactgtggaa.it c 340 350 HZ AG G""GGrGGÍ^V<3ľOľOrTACTiAGA/'.ŕí3ľ('GGGľAA 6C 370 380 390 400 ^.aL/AM AAA_ /i.a.M r TGCT gtgxag gcagt TTTAACGAT CASTTCQDľ GATQCAGAT at tc QTAATT ATGCGGCCAACGTCT GGT ATCAST gc 410 430 440 450 460 ■< 480 gaaoictttatax gaaagn q3qgt AGGCCAGľ GíA TC GTGľTGCGTľTÍ' g'1 g ggg 'Jt . 490 500 510 520 530 S40 ~i GG AAGG GGG v --A-.' GU " G g GGAKX :r;"GGa.'GNTATC»PJír"^3W 550 S60 570 5B0 590 600 Obrázek 9.5: Výstup automatického sekvenátoru využívajícího fluorescenční značky. Obrázek ukazuje záznam čtyř fluorescenčních detektorů, které snímají fluoreskující oligonukleotidy vycházející z elektroforetické kapiláry Červeně je značen signál fluoroforu navázaného na ddTTP, modře na ddCTP, zeleně na ddATP, černě na ddGTP (obrázek poskytla Laboratoř molekulární fyziologie rostlin Přírodovědecké fakulty MU v Brně). KAPITOLA 9. METODY URČOVANÍ SEKVENCE Kapitola 10 Optické metody 10.1 Elektromagnetické vlnění Cílem tohoto krátkého shrnutí principů optické spektroskopie je poskytnout základní přehled tomu, kdo zatím neměl příležitost do tajů světa molekul a elektromagnetických polí proniknout. Hned na začátku si musíme uvědomit, že vstupujeme do světa, kde se naplno projeví kvantové jevy, na které nejsme z běžného života zvyklí. Odpovídající fyzikální popis (kvantová elektrodynamika) by si vyžádal mnohem delší povídání. Zde se pokusíme získat alespoň hrubou představu, proč je možné dozvědět se něco o stavbě biomakromolekul z pozorování jejich interakcí s elektromagnetickým zářením. Pokusme se nejdříve trochu popsat základní pojmy. Tedy, co je to světlo? Jistě víte, že světlo je elektromagnetické vlnění1. Tedy oscilace pole elektrických a magnetických sil, které se šíří v prostoru. Elektrické a magnetické síly ovšem závisí nejen na tom, jak je silné pole, ale také na tom, na jak velký náboj, proud, případně elektrický nebo magnetický dipól pole působí. Proto je užitečné místo síly používat veličin vztažených na jednotku náboje či proudu. Elektromagnetické pole můžeme popsat čtyřmi takovými veličinami: elektrickou intenzitou E a indukcí D a magnetickou intenzitou H a indukcí B. Tyto veličiny nejsou nezávislé, ale musí splňovat takzvané Maxwellovy rovnice. Jedním z řešení Maxwellových rovnic je rovnice kulové vlny, tedy vlny, která se šíří do všech směrů v prostoru. Pokud nás zajímá šíření vln ve volném prostoru (vakuu) bez elektrických a magnetických dipólů, vystačíme si s veličinami E a B, protože ve vakuu D = eqE a B = /iqH (eg je elektrická permitivita vakua a /ig je magnetická permeabilita vakua). Co je zdrojem elektromagnetické vlny? Asi nejlépe si můžeme představit zdroj vln srovnatelných s tělesnými rozměry. Tak dlouhé jsou vlny radiové2. Jedním z nejjednodušších zdrojů radiových vln je dipólová anténa. V nej jednodušším provedení tvoří dipólovou anténu kus rovného drátu, uprostřed přerušený a připojený na zdroj střídavého napětí. Taková anténa je nakreslena na obrázku 10.1. Zdroj na obrázku ihned po zapnutí zdroje žene elektrony drátem směrem dolu. Pohybu elektronů se říká elektrický proud a ten vytváří magnetické pole. Na obrázku je nakresleno, jak vypadá takové magnetické pole v rovině kolmé na drát, přibližně v poloviční výšce. Vektory magnetické indukce v bezprostřední blízkosti drátu (modré šipky v zeleném čtverci) leží v rovině, míří podél tečen k drátu a jejich orientace se mění po směru hodinových ručiček. Za malý okamžik (za 5 nanosekund v případě typické frekvence FM vysílače 100 MHz) se polarita zdroje napětí otočí a elektrony budou proudit nahoru. Kolem drátu tak vznikne magnetické pole s vektory indukce měnícími se proti směru hodinových ručiček (červené šipky v zeleném čtverci na -'-Když budeme mluvit o světle, budeme popisovat obecné vlastnosti elektromagnetických vln. 2Radiové vlny nejsou chemii tak vzdálené, jak by se mohlo zdát. V kapitole 14 si vysvětlíme, jak se radiové vlny využívají pří zkoumání molekul pomocí nukleární magnetické rezonance. 107 108 KAPITOLA 10. OPTICKÉ METODY obrázku 10.1). Takové pole ale vznikne jen těsně kolem drátu. Změna pole se šíří prostorem rychlostí sice velkou, ale nikoli nekonečnou. Tato rychlost se nazývá rychlost světla ve vakuu a obvykle se značí písmenkem c. S konstantami eo a /iq souvisí rychlost c vztahem eq/iq = l/c2 a hodnota c je 3- 108ms_1. Touto rychlostí doputuje za 5ns změna pole do vzdálenosti 1,5 m od drátu. Proto mají vektory magnetické indukce 1,5m od drátu takový směr, jaký odpovídal toku elektronů před 5ns (modré šipky). Periodické změny napětí tak způsobují magnetické pole, které má každých 5ns opačný směr. Kolem antény nevzniká jen magnetické pole. Maxwellovy rovnice nám říkají, že kruhová magnetická indukce měnící se v čase vytváří elektrické pole mířící tak, jak je nakresleno na obrázku 10.1 v druhém čtverci pro jednotlivé časové okamžiky. Zdrojem elektrického pole jsou také elektrony, které se periodicky hromadí na jednotlivých koncích antény a chybí na koncích opačných. Takové rozložení náboje popisujeme elektrickým dipólovým momentem. Proto se také anténě říká dipól. Spočítat přesný tvar elektrického pole v prostoru kolem antény není vůbec jednoduché, jeden závěr ale udělat můžeme. V rovině kolmé na drát v polovině výšky míří elektrické pole (vektory elektrické indukce) rovnoběžně s drátem. Maxwellovy rovnice také říkají, že lineární elektrická intenzita měnící se v čase vytváří kruhové pole magnetické. Jak vidíme, magnetická indukce B a elektrická intenzita E jsou spolu těsně provázány a jejich vzájemné působení je původem tvorby vln, které se mohou šířit i vakuem. V našem případě magnetické a elektrické pole mění periodicky svůj směr v kruzích kolem antény. Magnetické pole osciluje mezi orientací proti směru a po směru hodinových ručiček, elektrické pole mezi orientací nahoru a dolu. Dostatečně daleko od drátu se zmíněné změny orientací šíří v naší rovině jako kruhová vlna, jejíž maxima a minima jsou nakreslena modře a červeně ve třetím sloupci čtverců na obrázku 10.1. Jde o vlnu polarizovanou, směry vektorů E a B jsou jasně dané orientací antény. Jestliže jsme si řekli, že oscilace elektrického pole způsobuje rotaci pole magnetického a naopak, tak je dobré si uvědomit, že v radiové vlně se vektory E a B stále mění v každém bodu. Mohli bychom tedy očekávat, že z každého bodu, kde se periodicky mění E a B, se bude tato změna šířit jako vlna ve všech směrech. To je představa blízká přístupu známému jako Huygensův princip: Tvar šířící se vlny určíme tak, že všechny body, do kterého vlna dorazí, považujeme za zdroje kulových vln, které sečteme. Po radiové anténě si uveďme ještě jeden zdroj elektromagnetických vln, mnohem složitější, ale bližší chemickému uvažování. Tímto zdrojem je Slunce. V obrovských teplotách, které na Slunci panují, se elektrony pohybují volně, nezávisle na jádrech atomů. Tento náhodný, tepelný pohyb představuje divoce se měnící elektrický proud a způsobuje nahodilé změny rozložení náboje. Stejně jako u pravidelných změn rozložení elektronů v anténě, náhodné přeskupování náboje na Slunci indukuje fluktuace magnetického a elektrického pole. Matematicky můžeme takové fluktuace popsat jako součet oscilací s mnoha různými frekvencemi a v různých směrech. Tyto oscilace se šíří prostorem jako nepolarizované vlny. Dost daleko od Slunce jde o vlny kulové. A v malých rozměrech naší Země jde o vlny s téměř rovinným čelem. 10.2 Popis elektromagnetického vlnění Přesný popis elektromagnetické vlny vyžaduje určení několika veličin, na které se teď podíváme blíže. Musíme si především uvědomit, které veličiny popisují změny elektromagnetického pole v čase a které v prostoru. K rozlišení časového a prostorového popisu poslouží představa vln na moři s bójkou upevněnou nad pevně daným místem mořského dna. Použijeme přitom pojmy vlnová délka a perioda, které si přesně definujeme níže. Pokud si vlny vyfotografujeme, bude získaný snímek dobře zachycovat tvar vlny v prostoru, ale neponese žádnou informaci o změnách v čase. Na fotografii můžeme dobře změřit vlnovou délku jako vzdálenost sousedních hřebenů vln. Z fotografie se ale nic nedozvíme o tom, jak dlouho trvá, než bójka poklesne a zase se vznese na hřeben vlny. Pokud umístíme na bójku zařízení průběžně zaznamenávající, jak se mění její výška od mořského dna, získáme přesný popis oscilací v čase. Nedozvíme se ale nic o šíření vln prostorem. Záznam průběhu 10.2. POPIS ELEKTROMAGNETICKÉHO VLNĚNÍ 109 Obrázek 10.1: Ilustrace vzniku radiové vlny. Zdroj střídavého napětí mění polaritu s frekvencí v = 100 MHz, jednotlivé obrázky ukazují elektromagnetické pole v intervalech 5 ns po zapnutí zdroje. V zelených rámečcích jsou (zprava doleva) nakresleny vektory B, E a hřebeny vzniklé kruhové vlny. Směr vzhůru (na levém náčrtku) kolmo k zelené rovině je znázorněn tečkou, směr dolů křížkem. Směr pohybu elektronů v kolmých řezech je znázorněn tečkou nebo křížkem uprostřed zeleného rámečku. 110 KAPITOLA 10. OPTICKÉ METODY výšky v čase bude mít podobný tvar, jako vlna na fotografii, tvar matematické funkce sinus nebo kosinus. Měření vzdálenosti dvou sousedních maxim na záznamu nám ale podá jinou informaci než změření vzdálenosti sousedních vrcholů na fotografii. Vzdálenost na záznamu odpovídá periodě vlny v čase. Po plážovém úvodu se vrátíme k vlnám elektromagnetickým. Od mořské vlny se elektromagnetické vlnění liší tím, že jde o vlnění pole popsaného vektorovými veličinami E a B. Oba tyto vektory kmitají kolmo ke směru šíření. Jde tedy o vlnění příčné. Dále platí, že E a B jsou také vždy vzájemně kolmé. V dostatečné vzdálenosti od zdroje oba vektory nabývají maximálních či minimálních hodnot zároveň. Proto stačí sledovat změny jednoho z těchto vektorů (například E). Okamžitou velikost a směr vektoru druhého (například B) můžeme vždy dopočítat. Nyní si probereme si charakteristiky elektromagnetických vln (jejich souhrn je uveden v tabulce 10.1). Soustředíme se přitom na vektor E. • Vektor E v každém místě prostoru kmitá v čase. Doba mezi okamžiky, ve kterých má vektor E v určitém směru maximální hodnotu, se nazývá perioda a obvykle značí T. Převrácenou hodnotou periody je frekvence, kterou si budeme značit v. Jednotkou frekvence je Hertz (počet kmitů za sekundu). Matematicky se kmitání v čase dá zapsat například pomocí funkce kosinus Ě(t) = Ě0 cos(2ttí/T) = Ě0 cos(2ttz/í), (10.1) kde E je magnetická indukce ve směru kolmém na směr šíření vlny a Eq je jeho maximum (\Eq\ je maximální velikost, neboli amplituda vektoru E). Faktor 2tt se někdy zahrnuje do hodnoty frekvence a vztah se pak zjednoduší na Ě(t) = £ľ0cos(wŕ), (10.2) kde uj = 2ttv je analogií úhlové rychlosti kruhového pohybu a její jednotka je radián za sekundu. • Změna vektoru E se šíří prostorem rychlostí c. Jestliže je velikost vektoru E v určitém místě a času maximální, pak je ve stejném čase maximální také ve vzdálenosti c • T od daného místa. Za dobu rovnou periodě do této vzdálenosti totiž stačí rychlostí c doputovat to, co určovalo velikost E v původním místě. Maxima vln jsou tedy vzdálena o hodnotu c • T, tato hodnota se nazývá vlnová délka a označuje A. Převrácené hodnotě vlnové délky se říká vlnočet v. V případě jedné rovinné vlny si můžeme vždycky zvolit souřadnou soustavu tak, aby se vlna šířila ve směru osy x, vektor E kmital ve směru osy z a vektor B kmital ve směru osy y. Takové vlně říkáme lineárně polarizovaná a matematicky pak můžeme její tvar v prostoru zapsat rovnicí Ez(x) = EqCos(2tyx/X) = EqCos(2tyvx). (10.3) Pokud se rovinná vlna skládá z mnoha vln o stejné frekvenci, ale s vektorem E kmitajícím různými směry, mluvíme o nepolarizované vlně. • Síření kulové vlny prostorem můžeme popsat tak, že polohu libovolného místa v prostoru zapíšeme pomocí směrového vektoru r (jeho složky jsou souřadnice daného bodu). Dále nadefinujeme vektor s tak, aby mířil ve směru šíření vlny, a aby jeho velikost byla |s| = l/A. Obdobou rovnice 10.3 je pak E(r) = Eq cos(27ts • r) = Eq cos(2ty(sxx + syy + szz)) = Eq cos(k ■ r) = Eq cos(kxx + kyy + kzz), (10.4) kde jsme si zavedli vektor k = 2ttŠ (obdoba vztahu uj & v). 10.2. POPIS ELEKTROMAGNETICKÉHO VLNĚNÍ 111 • Vztahy popisující kmitání v čase a vlnění v prostoru můžeme spojit do jedné vlnové rovnice E(r, i) = E0 cos(ujt — k ■ r) = E0 cos(0t — k ■ r) = E0 cos(ut — r). (10.5) Proč ve všech rovnicích používáme kosinus a ne třeba sinus? A jaký je význam písmenek (p v tomto vztahu? Pokud nás nezajímá kmitání v čase, ale jen vlnění v prostoru (což je případ difrakčních metod), můžeme časovou informaci zahrnout do nezajímavého korekčního faktoru (pt. Ten má význam posunutí vlny v prostoru v závislosti na tom, kolik času přesně uběhlo od zrození vlny. Pokud nás nezajímá vlnění v prostoru, ale jen kmitání v čase (což je případ nukleární magnetické rezonance), můžeme naopak prostorovou informaci zahrnout do nezajímavého korekčního faktoru (pr. Ten má význam časového posunu začátku sledování oscilací, který závisí na tom, jak jsme přesně daleko od zdroje vlny. Faktory cpt a cpr se nazývají fáze a vysvětlují, proč jsme všechny rovnice psali s funkcí kosinus. Mezi sinem a kosinem je rozdíl právě jen ve fázi. Všechny funkce kosinus bychom mohli v našich rovnicích přepsat na funkce sinus, kdybychom od argumentu kosinu odečetli fázi rovnou tt/2 = 90°. Pokud popisujeme jednu vlnu, + i sin ) = S0ei("*"£'ř) = £oei0. (10.7) Je třeba dodat, že kromě vln s E kmitajícím v jednom směru, také existují vlny, ve kterých se E skutečně otáčí v rovině y z. Jak vlna postupuje, šipka znázorňující E má konstantní délku a konec šipky se pohybuje po šroubovici kolem směru šíření vlny. Takové vlně říkáme kruhově (cirkulárně) polarizovaná a více si o ní řekneme v části 10.8. 10.3 Světlo a molekula V kapitolce 10.1 jsme si popsali elektromagnetickou vlnu v prostoru bez molekul, ve vakuu. Co se s touto vlnou stane, když vstoupí do prostředí tvořeného našimi molekulami? A co se stane s elektrony molekul ve vlnícím se elektromagnetickém moři? Elektrony jako elektricky nabité částice pocítí měnící se pole a rozkmitají se s přibližně stejnou frekvencí4, jak je schematicky ukázáno na obrázku 10.4A. Tyto přesuny náboje buzené vnějším polem můžeme popsat jako elektrické dipólové momenty. Měnící se dipóly jsou ovšem samy také zdroji elektromagnetických vln, jak jsme si ukázali na příkladu radiového vysílače. Přibližný průběh elektrických siločar a magnetických indukčních čar pole tvořeného dipólovým a imaginární složce y. Abychom reálnou a imaginární část odlišili, píšeme před imaginární část takzvanou imaginární jednotku i. Druhou mocninu komplexního čísla definujeme jako součin tohoto čísla s číslem s ním komplexně sdruženým (komplexně sdružená čísla se liší jen ve znaménku imaginární části): |C|2 = (Cfte + iCím)(CRe — iCím) = Cg. Tento vztah vyžaduje, aby platilo i2 = — 1. Z toho, že komplexní číslo připomíná dvojrozměrný vektor, vyplývá, že je můžeme také zapsat pomocí amplitudy (velikosti neboli absolutní hodnoty) Co a fáze (úhlu natočení) a: C = Co (cos a + i sin a). Navíc platí velmi užitečný Eulerův vztah, který nám umožňuje vyjádřit komplexní číslo jako C = C'oe'a = Co (cos a + i sin a) 4Pokud půjde o polární molekuly a frekvence vlnění nebude příliš vysoká, budou se celé molekuly otáčet tak, aby jejich stálé dipólové momenty měly vždy nižší energii v poli elektromagnetické vlny. Tak se chová molekula vody po dopadu mikrovlnného záření s frekvencí několika GHz. Molekula vody se přitom otočí několikrát za nanosekundu a vzorek se tím silně zahřeje, jak nám říká zkušenost s používáním mikrovlnné trouby. V případě miliónkrát vyšší frekvence ultrafialových vln se voda nestačí tak rychle otáčet. Proto dochází jen ke kmitání elektronů, popsanému v textu. 10.3. SVĚTLO A MOLEKULA 113 ABC Obrázek 10.2: Různá grafická znázornění elektromagnetického vlnění. A, kulová vlna. B, rovinná vlna. Směr šíření vlny (paprsek) je vyznačen světle zeleně, okamžité hodnoty E a, B popsané sinusovkou jsou nakresleny tmavě zeleně, směr vynášení kladné hodnoty E a, B ukazuje modrá šipka. Oblasti prostoru s maximem vlny jsou vyznačeny modře, oblasti s minimem vlny červeně. C, tvar vlny v prostoru (zeleně) a kmitání vlny v čase (hnědě). Obrázek 10.3: Fáze elektromagnetické vlny a jejich znázornění v Argandově diagramu. 114 KAPITOLA 10. OPTICKÉ METODY momentem kmitajícím ve svislém směru je zakreslen na obrázku 10.4B. V dostatečné vzdálenosti od dipólu má elektrické a magnetické pole stejnou fázi a šíří se prostorem jako kulová vlna, jak jsme ji popsali v části 10.1. Oproti dopadající vlně má vlna šířící se z rozkmitaných elektronů fázi opožděnou5 0 90°. Chceme-li tedy popsat celkové pole, musíme k oscilujícímu poli dopadající vlny přičíst oscilující pole vln tvořených vybuzenými dipólovými momenty. Když bude nakonec elektromagnetická vlna prostředí našich molekul opouštět, bude jím pozměněna. Pokud budeme rozumět tomu, jak mění molekuly procházející vlnu, budeme umět z porovnání světla, které do vzorku s molekulami vstupuje, se světlem, které ze vzorku s molekulami vychází, získat informaci o našich molekulách. Základem našich analýz bude sledování toho, jak se skládají vlny tvořené rozkmitanými elektrony různých atomů v různých molekulách. K tomu budeme potřebovat popsat šíření vln v různých směrech. Pokud dopadne na molekulu přibližně rovinná vlna, směr jejíhož šíření popisuje vektor k, tak nás budou zajímat vlny rozkmitaných elektronů, jejichž šíření v různých směrech musíme popsat mnoha různými vektory k'. Matematicky můžeme každý z těchto vektorů zapsat tak, že k původnímu vektoru k přičteme nějaký rozdílový vektor q (různý pro různé směry): k' = k +q, (10.8) kde velikost vektorů k a k' je l/A a velikost vektoru q závisí na odchylce směru k' od směru k. Síření vln v různých směrech si můžeme graficky popsat jako odraz původní vlny od pomyslné roviny, znázorněné čárkovaně na obrázku 10.4C. Jak obrázek ukazuje, hodnota úhlu tohoto pomyslného odrazu 6 souvisí s velikostí vektoru q vztahem 2tt q=\q\ = 2—smd. (10.9) A V našich úvahách budeme muset rozlišovat vliv molekul malých (mnohem menších, než vlnová délka dopadajícího vlnění) od vlivu molekul velkých (rozměry se vlnové délce alespoň blížících). V případě malých molekul budou elektrony všech atomů v molekule zdroji kulových vln, které se šíří přibližně z jednoho místa a mají tedy stejnou fázi. Při analýze vln šířících se z malých molekul stačí proto sledovat, jak se skládají vlny různých molekul. Proto se vlny jednotlivých elektronů budou vždycky sčítat. V případě velké molekuly budou elektrony atomů v různých místech molekuly tak daleko od sebe, že nemůžeme rozdíl jejich poloh vůči vlnové délce zanedbat. Z molekuly se tak budou šířit kulové vlny s různými středy. Vlny z různých míst molekuly tak do určitého bodu v prostoru dorazí s různou fází. Proto se vlny jednotlivých elektronů téže molekuly někdy sečtou (když budou posunuty přibližně o celé násobky vlnové délky) a někdy odečtou (když budou posunuty přibližně o násobky A/2). Při analýze vln šířících se z velkých molekul proto musíme sledovat nejen, jak se skládají vlny různých molekul, ale také jak se skládají vlny šířící se z různých míst téže molekuly. 10.4 Světlo a krystal Elektromagnetická vlna může dopadat na molekuly pravidelně rozmístěné a orientované (v krystalech), nebo na molekuly, jejichž polohy a orientace jsou náhodné (v plynech, kapalinách, či sklech). Nejprve se podíváme na první z uvedených případů, který si lze snáze představit. Jak jsme si uvedli výše, v případě krystalů tvořených molekulami mnohem menšími než vlnová délka dopadajícího záření stačí vzít do úvahy skládání vln šířících se z různých molekul. Pokud jsou 1 vzdálenosti mezi molekulami mnohem menší než vlnová délka záření, budou elektrony v sousedních 5Z fyzikálního pohledu představuje molekula oscilátor rozkmitaný vnější silou (dopadající vlnou). Pokud, jako v našem případě, frekvence dopadající vlny rezonuje s frekvencí oscilátoru, rozkmitá se oscilátor s fázovým opožděním 90°. 10.4. SVĚTLO A KRYSTAL 115 Obrázek 10.4: A, rozkmitání elektronů v molekule vody při průchodu světelné vlny. Pro přehlednost je molekula vody nakreslena větší, než by odpovídalo vlnové délce viditelného nebo ultrafialového záření. B, elektromagnetické pole tvořené oscilujícím dipólovým momentem rozkmitaných elektronů v molekule. Elektrické pole je zakresleno ve svislém řezu jasnějšími barvami, magnetické ve vodorovném řezu matnějšími barvami. Směry vektorů E a, B jsou vyznačeny šipkami. Modré čáry odpovídají maximům vln, červené minimům. C, směr šíření rozptýlené vlny popsaný pomocí vektoru q. Pomyslná rovina odrazu je vyznačena čárkovaně. 116 KAPITOLA 10. OPTICKÉ METODY vrstvách molekul vyzařovat jen nepatrně fázově posunuté vlny. Takto mírně posunuté vlny se budou vzájemně sčítat. Krom toho se sečtou i s dopadající vlnou. Výsledkem bude vlna na každé vrstvě molekul mírně fázově opožděná, tedy celkově se pohybující trochu pomaleji, než vlna původní. V části 10.5 zjistíme, že podobně dochází k opožďování vlny při průchodu prostředím náhodně orientovaných a rozmístěných molekul, s jednou výjimkou. V případě krystalu může být opožďování vln kmitajících se stejnou frekvencí v různých směrech různé, v závislosti na symetrii krystalu. Různá rychlost postupu vln kmitajících v různých směrech nám umožňuje připravit různě polarizované světlo, jak zmíníme v části 10.8. Pokud jsou vzdálenosti molekul v krystalu srovnatelné s vlnovou délkou dopadající vlny, mají pravidelné rozmístění a orientace molekul důležitý důsledek. Jestliže se v určitém směru sečtou vlny letící ze dvou molekul, musí se v tomto směru sečíst vlny šířící se ze všech stejně vzdálených a orientovaných dvojic molekul. Zjednodušeně je to znázorněno na obrázku 10.5A. Budeme sledovat vlny šířící se ve směru dlouhé tmavě zelené šipky. Pokud jsou molekuly (modré tečky) rozmístěny tak, že vlny letící z první a druhé molekuly mají ve zvoleném směru stejnou fázi, tak musí mít v tomto směru stejnou fázi také dvojice vln šířící se z první a třetí molekuly, stejně jako dvojice vln šířící se druhé a třetí molekuly. V krystalu je takových dvojic obrovské množství. Krystal proto mnohonásobně zesílí vlny šířící se v určitých směrech (ve kterých jsou fáze vln stejné). Při pohledu zvenčí tak máme dojem, že se v krystalu paprsek dopadajícího záření ohne do určitých směrů. Tomuto jevu se říká ohyb světla, neboli difrakce. V kapitole 12 stručně zmíníme, že ze směrů, do jakých se záření ohýbá, můžeme spočítat rozmístění molekul v krystalu. Analýza difrakce na krystalech velkých molekul je (bio)chemicky ještě zajímavější. Difrakce totiž závisí nejen na skládání vln z různých molekul, ale také z různých míst téže molekuly. Aby byla molekula z pohledu vln velká, musíme použít záření s dostatečně krátkou vlnovou délkou (rentgenové záření). Protože různé molekuly tvoří v krystalu pravidelnou mřížku, záření se zesílí v určitých směrech, tak jako na krystalech malých molekul. V těchto směrech se ale nešíří kulové vlny ze zdrojů ve stejných bodech krystalové mřížky. Do směrů daných krystalovou mřížkou molekul míří vlnění zrozené z kmitání elektronů v různých místech molekuly. Protože elektrony v molekulách netvoří pravidelnou mřížku, kulové vlny pocházející z elektronů v různých částech téže molekuly mají ve směrech daných krystalem obecně různé fáze. Elektrony se navíc nenacházejí v přesně daných místech v molekule. Kvantová mechanika nám říká, že můžeme pouze hovořit o pravděpodobnost výskytu elektronů, neboli o elektronové hustotě. Takže musíme očekávat, že s určitou pravděpodobností se může šířit vlna z každého místa molekuly. Síření vlny v jednom náhodně vybraném směru je zjednodušeně zachyceno na obrázku 10.5B. Hustota elektronů je na obrázku znázorněna růžovou barvou. Kde je pravděpodobnost výskytu elektronu vyšší, (kde je růžová sytější), tam také s větší pravděpodobností vznikne kulová vlna. Amplituda kulových vln je proto dána elektronovou hustotou v místě jejich zrodu. Fáze těchto vln je daná polohou místa zrodu v molekule. Jednotlivé kulové vlny se skládají do výsledné vlny (znázorněné tmavě zeleně na obrázku 10.5C), která je mohutně zesílena ve směrech daných uspořádáním celých molekul v krystalu. Protože amplituda a fáze složené vlny závisí na rozložení elektronů v molekule, tedy na struktuře molekuly, říká se této vlně strukturní faktor. Strukturní faktor má v různých směrech zesílených krystalem různou amplitudu, podle toho jak jsou v určitém směru fázově posunuty vlny šířící se z různých míst molekuly (obrázek 10.5D). Při pohledu zvenčí vidíme ohyb (difrakci) záření do určitých směrů s různou amplitudou (danou rozložením elektronů v molekule (obrázek 10.5E). Amplituda dopadajícího záření (přesněji její druhá mocnina) udává intenzitu6 záření v různých směrech (zelené tečky na obrázku 10.5F), kterou můžeme měřit použitím vhodného detektoru. V kapitole 12 si podrobně rozebereme, jak lze rozložení elektronů a tedy tvar molekuly ze strukturního faktoru spočítat. 6 Je poněkud nešťastné, že slůvkem intenzita se označují dvě různé veličiny, které se nám zde navíc setkávají v jednom vztahu. Na rozdíl od elektrické intenzity E, udává intenzita záření / energii záření (konkrétně plošnou hustotu zářivého výkonu, tedy změny energie za jednotku času). 10.4. SVĚTLO A KRYSTAL 117 A B C D Obrázek 10.5: Difrakce na krystalu. A, vlny zesílené v určitém směru (dlouhá tmavě zelená šipka) uspořádáním malých molekul (modré tečky) do pravidelné mřížky. B, vlny šířící se z různých míst molekuly, zesílené v určitém směru (dlouhá tmavě zelená šipka) uspořádáním velkých molekul (růžové tvary) do pravidelné mřížky. Sytost růžové barvy odpovídá rozložení elektronové hustoty v molekule. C, složená vlna (strukturní faktor) v daném směru. D, Strukturní faktor v různých směrech, daných uspořádáním molekul v krystalu. E, šíření vln v určitých směrech po dopadu záření na krystal. F, detekce intenzity záření (znázorněné velikostí zelené tečky) v různých směrech. Svislá čára představuje umístění detektoru. 118 KAPITOLA 10. OPTICKÉ METODY 10.5 Světlo a molekuly v roztoku či skle Poněkud složitější je analýza skládání vln vzniklých rozkmitáním elektronů v malých molekulách náhodně rozmístěných a orientovaných, tedy molekul v roztoku či ve skle. Proto si úkol nejdříve trochu zjednodušíme a prozkoumáme, jak se skládají vlny tvořené kmitajícími elektrony v molekulách, které se nacházejí v jediné rovině kolmé na postupující rovinnou vlnu (obrázek 10.6A). Budeme přitom předpokládat, že molekuly jsou ve vzorku rozmístěny sice nepravidelně (netvoří krystalovou mřížku), ale v průměru rovnoměrně (homogenně) vyplňují prostor. Světlo postupuje jako rovinná vlna vzorkem a v každém okamžiku rozechvívá novou rovinu elektrických dipólových momentů elektronů v molekulách. Jak ukazuje obrázek 10.6B, vlny tvořené rozkmitanými elektrony různých molekul v rovině mají stejnou fázi ve směru postupu dopadající vlny, ale různou fázi v jiných směrech. Takto vzniklé vlny se šíří z dipólů kmitajících elektronů všemi směry a ve všech směrech se vzájemně téměř vyruší, krom směrů rovnoběžných s původní (budící) vlnou. Výsledkem jsou tedy opět rovinné vlny. Tyto vlny se skládají s původní vlnou, oproti které jsou fázově opožděny o 90 ° (jak jsme zmínili v části 10.3) a mají mnohem menší amplitudu. Výsledná vlna bude nepatrně fázově posunuta (obrázek 10.6C). V případě chirálních molekul bude vektor E také kmitat v rovině trochu pootočené vzhledem k rovině, ve které kmital před dopadem. Je to proto, že na elektrony působí při dopadu elektromagnetického vlnění dva druhy sil. První jsou síly dopadajícího vlnění, které se snaží rozkmitat elektrony v rovině, ve které kmitá E vlny. Druhým typem sil jsou jeho interakce uvnitř molekuly. Tyto interakce omezují rozložení elektronů způsobem, který popisují molekulové orbitaly. Například elektrony v a vazbách mají větší volnost pohybu ve směru vazby, než kolmo na ni. Pokud vazba neleží v rovině dopadající vlny, směr kmitání elektronů není rovnoběžný se směrem kmitání vektoru E vlny, ale je ovlivněn i orientací vazby v molekule. Pokud má molekula rovinu symetrie (není chirální), tak stačí molekulu otočit o 180° a orientace vazby se změní na svůj zrcadlový obraz. Proto se v souboru volně rotujících molekul s rovinou symetrie vlivy směru vazby vyruší. Pokud je ale molekula chirální (nemá rovinu symetrie), tak žádná rotace nemůže otočit molekulu do polohy, ve které by byla zrcadlovým obrazem molekuly v poloze původní. Z tohoto důvodu se vliv směru vazby úplně vyrušit nemůže a elektrony budou zdroji vln polarizovaných v trochu jiné rovině, než rovina kmitání E dopadající vlny. Popsaný zrod kulových vln, které po složení s dopadající vlnou mírně posunou její fázi, se opakuje na každé rovině. V důsledku toho se za běžných okolností vlna procházející roztokem či sklem trochu opožďuje ve srovnání s vlnou šířící se vakuem7 (obrázek 10.6D). Protože frekvence vlny se při průchodu prostředím molekul nemění, musí snížení rychlosti postupu vlny znamenat také zkrácení vlnové délky. V prostředí molekul je tedy postupující vlna zhuštěna. Poměr rychlosti světla ve vakuu (c) k rychlosti šíření výsledné vlny roztokem molekul (c') se zpravidla označuje symbolem n. Toto číslo označujeme jako index lomu. Označení pochází z popisu situace, kdy světlo přechází z jednoho prostředí do druhého. Pokud dopadá rovinná vlna na rozhraní mezi prostředími šikmo, musí se šířit v jiném směru (láme se), aby zůstala spojitá (obrázek 10.6E). Uhel, pod kterým se vlna láme, můžeme spočítat právě z indexů lomu jednotlivých prostředí (Snellův zákon lomu). Lom světla (refrakce) je podstatou zvětšování obrazů pomocí čoček, kterému se budeme věnovat podrobněji v kapitole 13. 10.6 Maloúhlový rozptyl Rontgenova záření (SAXS) Až dosud popisovaný obraz skládání vln tvořených rozkmitáním elektronů náhodně rozmístěných a orientovaných molekul se dramaticky změní, jakmile se zaměříme na molekuly velké (srovnatelné s vlnovou délkou dopadajícího záření). V tomto případě totiž musíme vzít do úvahy i skládání vln elektronů v téže 7Opožd'ování vlny znamená, že elektrony jsou zdrojem vln s fází posunutou o 90°. V některých případech může být fáze posunutá o 270 ° a předbíhat fázi budící vlny. Je proto nutné rozlišovat fázovou rychlost (která může být vyšší než rychlost světla ve vakuu c, protože fáze nenese žádnou informaci) od rychlosti šíření signálu (která nemůže překročit rychlost světla ve vakuu c, protože důsledek nemůže být rychlejší než příčina). 10.6. MALOÚHLOVÝ ROZPTYL RÔNTGENOVA ZÁŘENÍ (SAXS) 119 Obrázek 10.6: Rozptyl světla na molekulách v roztoku. A, dopadající rovinná vlna (světle zelená) a molekuly nacházející se v rovině kolmé na postup vlny (černé tečky). B, šíření kulových vln způsobených rozkmitáním elektronů v molekulách v rovině kolmé na postup vlny. Vlnění v osmi vybraných směrech s barevně vyznačenou fází. Fáze ve směru šíření vlnové vlny je znázorněna modře, ostatní fáze jsou vyznačeny na barevné škále mezi modrou a červenou, kde červená odpovídá posunu o 180 ° (opačná fáze). C, výsledná vlna (tmavě zelená) složená z původní rovinné vlny (světle zelená) a vln tvořených elektrony rozkmitanými v rovině kolmé na postup rovinné vlny. D, výsledná vlna (tmavě zelená) složená z původní rovinné vlny (světle zelená) a vln tvořených elektrony rozkmitanými v celém objemu molekul roztoku (šedé tečky). E, lom šíření vlnění při šikmém dopadu rovinné vlny na roztok molekul či sklo. 120 KAPITOLA 10. OPTICKÉ METODY molekule. Rozmístění elektronů v molekule definuje tvar molekuly a zdaleka není homogenní. Jak jsme již viděli na obrázku 10.5, složená vlna šířící se z jedné molekuly určitým směrem odráží pravděpodobnost výskytu elektronů na různých místech molekuly a vzájemný fázový posun vln v různých místech zrozených. Na rozdíl od krystalu závisí v roztoku šíření vlny i na tom, jak jsou molekuly orientovány. Skládání vln je tak v roztoku komplikováno průměrováním přes všechny možné orientace molekuly (obrázek 10.7A). Nedochází přitom ani k extrémnímu zesílení vln v určitých směrech (jako v krystalu), ani k téměř dokonalému odečtení vln ve všech směrech krom směru dopadající vlny (jako v roztoku malých molekul). Záření se s různou intenzitou šíří různými směry (obrázek 10.7B), mluvíme o rozptylu (difúzi) záření (anglicky scattering). Jak již víme, k rozlišení jednotlivých atomů je třeba použít rentgenové záření, vlnovou délkou srovnatelné s velikostí atomů. Proto je rozptyl rentgenového záření zvlášť užitečný pro studium tvaru proteinu a jiných biomakromolekul v roztoku. Metoda zvaná SAXS (small angle X-ray scattering, česky maloúhlový rentgenový rozptyl) poskytuje poměrně detailní popis tvaru makromolekuly v roztoku, i když není schopna určit polohy jednotlivých atomů v molekule. Experiment se dosti podobá měření difrakce na krystalech (obrázek 10.7C), vyhodnocení výsledků se ale liší. Zaznamenáváme intenzitu záření rozptýleného pod různým úhlem 26 od směru dopadajícího paprsku. Obvykle sledujeme závislost intenzity (na logaritmické škále) na velikosti vektoru q = \q\ (definovaného v rovnici 10.8), kterou snadno spočítáme z úhlu 9 (obrázek 10.7D), jiné užitečné vynesení dat zavedl rakouský fyzik Otto Kratky (obrázek 10.7E). Pro velmi malé hodnoty q (malé úhly rozptylu) platí přibližně kvadratická závislost (Guinierův vztah) lnJ(g)«lnJ(g = 0)-^ 7Tg je intenzivnější než absorpce tryptofanu, její vlnová délka (kolem 220 nm) je na hranici použitelnosti běžných spektrofotometrů. Absorpce při přechodu Tľ2 —> 7Tg se obvykle nevyužívá, přestože je ještě silnější. Důvodem je krátká vlnová délka (190nm). Oligo- a polysacharidy většinou neabsorbují ve vhodné oblasti. Pokud sacharidy neobsahují například acetylovanou aminoskupinu (tedy systém podobný peptidové vazbě), nejbližší použitelná vlnová délka je 175nm (přechod n —> a* elektronů glykosidické vazby). Tak krátké vlnové délky vyžadují speciální zařízení (je například nutné odstranit kyslík rozpuštěný ve vodě) a využívají se málo. Nejčastějším využitím absorpce při elektronových přechodech (zejména aromatických skupin) je rychlé určení celkové koncentrace proteinu či nukleové kyseliny. Rozdíl mezi vlnovými délkami maximální absorpce je dostatečný k tomu, abychom odhadli i podíl proteinu a nukleové kyseliny ve směsi. Variací na toto téma je detekce biomakromolekul dělených elektroforézou nebo chromatografií. Peptidová vazba je zase výhodná proto, že je přítomna mezi každou dvojicí aminokyselin. Umožňuje nám pozorovat i krátké peptidy, které často neobsahují žádnou aromatickou aminokyselinu. Může nám ale absorpce viditelného nebo ultrafialového záření říci něco o struktuře? Na tuto otázku se pokusíme odpovědět v následujících sekcích. 10.8 Cirkulární dichroismus V sekundárních strukturách jsou jednotlivé peptidové vazby proteinů a báze nukleových kyselin přesným způsobem vzájemně uspořádány. Toho lze využít k získání informace o sekundární struktuře. V dodatku E je zmíněno, jak se tvorba šroubovic proteinů a dvojšroubovic DNA projeví na absorpci. Ještě více se o sekundární struktuře můžeme dozvědět, když využijeme toho, že sekundární struktury jsou chirální útvary. Chirální molekuly totiž různým způsobem interagují s pravotočivým a levotočivým kruhově polarizovaným světlem. Pokud chirální molekuly světlo absorbují, je pravděpodobnost absorpce jednotlivých složek různá. Tento jev se nazývá cirkulární dichroismus (CD). K pochopení cirkulárního dichroismu je užitečné si říci, jak můžeme kruhově polarizované světlo vyrobit (obrázek 10.8). Začneme se světlem lineárně polarizovaným. Vlnu kmitající v určitém směru (lineárně polarizovanou) můžeme z nepolarizovaného záření oddělit pomocí krystalu, ve kterém se vlny kmitající v různých směrech zpožďují různě (mají různý index lomu). Takovým materiálem je například křemen. Krystal (na obrázku 10.8 nakreslen bílou barvou) přitom orientujeme tak, aby vektor E kmital v šikmé rovině, svírající úhel 45 ° se svislou i vodorovnou rovinou kolmou na směr postupu vlny. Kmitání vektoru E v šikmé rovině znamená, že vodorovná i svislá složka vektoru kmitají se stejnou fází. Takto lineárně polarizované světlo necháme procházet takzvaným fotoelastickým modulátorem, nakresleným na obrázku 10.8 žlutě. Může jít o tenký hranolek oxidu křemičitého, který necháme účinkem elektrického pole vibrovat ve vodorovném směru (s frekvencí přibližně 50 Hz). V okamžiku, kdy je vibrující hranolek stlačen (obrázek 10.8A), zpomaluje11 více vlnu elektrické indukce kmitající ve vodorovném směru. V okamžiku, kdy je natažen (obrázek 10.8B), je naopak vlna kmitající ve vodorovném směru 11V části 10.5 jsme si vysvětlili, že kmitání E se na každé vrstvičce skla ve směru šíření původní vlny trochu fázově posune a tak se celá vlna postupující prostředím zpomalí. Podobně se zpomalí i vlny procházející hranolem křemenu s pravidelnou krystalovou mřížkou. Při stlačení se v krystalu křemene ocitnou atomy ve vodorovném směru blíže k sobě. Proto se šíření kmitání E ve vodorovném směru zpomalí více, než v nestlačeném hranolu (stlačený hranol je ve vodorovném směru „hustší"). Rozmístění („hustota") atomů ve svislém směru se při vodorovném stlačení nezmění. Proto se také nezmění rychlost šíření kmitání E ve svislém směru. 124 KAPITOLA 10. OPTICKÉ METODY O 0 0 0 0 0 G O 0 Obrázek 10.8: Princip a měření cirkulárnílio dicliroismu. A, průchod elektromagnetické vlny při stlačení foto-elastického modulátoru. Kmitání vektoru E je symbolicky znázorněno červeně pod nákresem. Červené elipsy znázorňuji pohled z boku na rovinu kolmou ke směru šíření vlny, černý kruh vpravo představuje pohled ve směru postupu vlny (směry vektoru E v rostoucí vzdálenosti od pozorovatele jsou odlišeny klesající intenzitou červené barvy). Polarizátor (bílá barva) mění nepolarizované záření na lineárně polarizovanou vlnu kmitající v šikmé rovině (svírající úhel 45 ° se svislou i vodorovnou rovinou). Vodorovná složka vektoru kmitajícího v šikmé rovině je nakreslena modře, svislá zeleně. Stlačený fotoelastický modulátor (žlutá barva) opožďuje vodorovně kmitající složku o čtvrtinu vlnové délky. Výsledná vlna (složená z vodorovné a svislé složky E) je tak pravotočivé kruhově polarizovaná. Ve vzorku (modrá barva) dochází k absorpci a opoždění pravotočivé polarizované vlny. B, průchod elektromagnetické vlny při natažení fotoelastického modulátoru. V tomto stavu vodorovná složka vektoru E předbíhá svislou složku a vzniká tak levotočivě kruhově polarizovaná vlna. C, součet vektorů E z obrázků A a B. Složením vektorů E vln po průchodu světlem nevznikne kruhově, ale elipticky polarizovaná vlna (černá elipsa vpravo). Natočení elipsy v rovině kolmé k šíření vlny závisí na rozdílu indexů lomu (způsobujícím rozdílné opoždění) levotočivě a pravotočivé polarizované složky. 04 10.9. VIBRACE JADER 125 zpomalena méně. Amplituda vibrací hranolku je přitom zvolena tak, aby po průchodu hranolem byla vodorovná vlna vůči svislé posunuta při stlačení o čtvrt vlnové délky zpátky a při natažení o čtvrt vlnové délky dopředu. Složením kolmých, vzájemně o A/4 posunutých vln vzniká kruhově polarizovaná vlna. V této vlně vektor E nemění velikost, ale rotuje kolem směru postupu vlny. Špička šipky popisující vektor E obíhá po šroubovici vinoucí se kolem směru postupující vlny. Při stlačení hranolku jde o vlnu pravotočivou, při natažení o vlnu levotočivou. V průmětu do roviny kolmé ke směru postupu vlny vidíme špičku šipky vektoru E obíhat po kružnici. Při stlačení hranolku po směru hodinových ručiček (obrázek 10.8A), při natažení proti směru hodinových ručiček (obrázek 10.8B). Takto připravené světlo oscilující mezi pravotočivou a levotočivou kruhovou polarizací necháme procházet vzorkem, nakresleným na obrázku 10.8 modře. Detektorem, který je časově synchronizován s vibracemi fotoelastického modulátoru, měříme absorpci pravotočivé a levotočivé vlny. Rozdíl mezi nimi vynášíme jako závislost na vlnové délce, tedy jako spektrum. Z historických důvodu se rozdílu absorpčních koeficientů pravotočivé a levotočivé vlny říká elipticita. Sečteme-li totiž různě pohlcenou pravotočivou a levotočivou vlnu, získáme místo kmitání po úsečce elipsu (obrázek 10.8C vpravo). Poměr dlouhé a krátké poloosy elipsy (elipticita) je přitom úměrný rozdílu zmíněných absorpčních koeficientů. Tento rozdíl je nulový vždy, když má molekula zrcadlovou rovinu symetrie (když není chirální). Elipsa je navíc otočena z důvodu rozdílného indexu lomu (rozdílné rychlosti šíření) pravotočivé a levotočivé vlny ve vzorku chirální molekuly. Protože CD závisí přímo na chiralitě, můžeme se z CD spekter dozvědět užitečné informace o pravidelných chirálních strukturách biomakromolekul. Například u neuspořádaných proteinů pozorujeme v CD spektrech záporné maximum při 200 nm. Struktury skládaného listu vykazují pozitivní maximum při 198 nm a méně intenzivní negativní maximum při 215 nm. Konečně a-šroubovice mají pozitivní maximum při 190 nm a dvě méně intenzivní negativní maxima při 208 nm a 222 nm (obrázek 10.9). Pokud protein obsahuje různé druhy sekundární struktury, výsledné spektrum si můžeme představit jako součet tří základních spekter (náhodná konformace, skládaný list, a-šroubovice) v poměru odpovídajícím zastoupení těchto tří konformací v proteinu.12 Zpětně můžeme ze spektra odhadnout, jak velká část proteinu je v jednotlivých konformacích. Mohli bychom to udělat ručně, kdybychom odečítali elipticitu při třech různých vlnových délkách a řešili pak soustavu tří rovnic o třech neznámých. V praxi většinou takovou analýzu svěříme počítači, který porovná naměřené spektrum se spektry známých proteinů a vyhodnotí zastoupení sekundárních struktur v našem vzorku. Podobné rozdíly v CD spektrech můžeme pozorovat i u nukleových kyselin. Analýza spekter nukleových kyselin je ale složitější, protože každý pár bází má jiné spektrum (spektra proteinů závisí na druhu aminokyseliny velmi málo). Jako příklad si můžeme ukázat spektra dvojšroubovic DNA tvořených opakující se sekvencí CG (obrázek 10.10). O této sekvenci je známé, že kromě běžné pravotočivé dvojšroubovice B a pravotočivé dvojšroubovice A může tvořit i levotočivou dvojšroubovici Z se zlomy v průběhu cukrfosfátové páteře. Na obrázku je vidět, že pravotočivé dvojšroubovice mají podobná (ale rozlišitelná) spektra, zatímco spektrum levotočivé šroubovice Z (tečkované spektrum) má přibližně opačný průběh. 10.9 Vibrace jader Zatím jsme při popisu průchodu světla prostředím molekul věnovali pozornost jen elektronům. Ani jádra atomů však neleží nehybně v určité poloze. Jádra se vůči sobě pohybují kmitavým pohybem. Polohu každého atomu můžeme popsat třemi nezávislými souřadnicemi, má tedy tři stupně volnosti. 12Zatímco a-šroubovice je definovaná úzkým rozmezím torzních úhlů ). V případě ethanu budou nejvýhodnější torzní úhly o- Odkud je ale vzít, když jsme molekulu popsali zcela uměle? Jak máme vědět, jakou musí mít tuhost fiktivní pružinka spojující atomy v našem modelu, když víme, že v přírodě atomy pružinkami spojeny nejsou? Máme dvě možnosti, jak tento problém vyřešit. Můžeme změřit energii odpovídající kmitání atomů a do rovnice 11.1 dosadit za Kr takové číslo, aby nám vyšla stejná energie jako změřená. Nebo můžeme energii kmitání atomů spočítat na základě kvantové mechaniky pro malou molekulu a získat Kr obdobným postupem. V obou případech musíme samozřejmě předpokládat, že v naší molekule kmitají atomy stejně jako v molekule, kde jsme kmitání měřili, nebo jako v malé molekule, pro kterou jsme prováděli kvantový výpočet. Optimální vzdálenosti atomů zase můžeme získat z rentgenové strukturní analýzy krystalů, jak o tom bude řeč v kapitole 12. Soubor rovnic 11.1 až 11.4 a číselné hodnoty parametrů K, V, A, B, C, í*o, 0q, (po pro seskupení atomů, která nacházíme v biomakromolekulách, se nazývají silové pole a představují srdce každé metody molekulové mechaniky. Postup, kterým se z experimentu nebo z kvantových výpočtů určují parametry K, V, A, B, C, r0, 60, 0, se označuje pojmem parametrizace silového pole. 11.6 Implicitní a explicitní solvent Konformace biomakromolekul je do značné míry určena prostředím, ve kterém se nachází. Zjednodušený popis energie umožňuje molekulové mechanice výpočty nejen pro celé biomakromolekuly, ale i pro nejbližší okolí těchto molekul. Tak je možno studovat biologicky zajímavé molekuly v jejich přirozeném 136 KAPITOLA 11. VÝPOČETNÍ METODY Obrázek 11.5: Periodické okrajové podmínky pro výpočet struktury proteinu s explicitním solventem (znázorněn červenými tečkami). prostředí, ve vodném roztoku. Tento přitažlivý úkol s sebou pochopitelně nese otázku, jakým způsobem vodu do výpočtu zahrnout. Vliv rozpouštědla se popisuje jednou ze dvou metod. První z nich, zvaná metoda implicitního solventu, je výpočetně velmi snadná. Využívá toho, že síla elektrických interakcí je nepřímo úměrná elektrické permitivitě prostředí. Nejjednoduššího přiblížení vodnému prostředí je tak možné dosáhnout vynásobením hodnoty elektrické permitivity vakua eo v Coulombově zákoně (rovnice 6.2) vhodnou konstantou, zvanou relativní permitivita er. Používá se buď hodnota er konstantní, všude stejná, nebo závislá na vzdálenosti atomů. Výhody i úskalí tohoto přístupu jsme už zmínili v části 6.10. Druhý způsob zahrnutí rozpouštědla je mnohem přímočařejší. K modelu biomakromolekuly se přímo přidají modely molekul vody. Tato metoda explicitního solventu je samozřejmě výpočetně náročná, počet atomů, se kterými se počítá, musí zahrnovat i atomy vody. Není možné obalit makromolekulu jen tenkou vrstvou molekul vody, vždyť v přírodě je voda v celém prostoru buňky. Jak ale takové prostředí namodelovat, aby se nám molekuly vody nerozprchly do prostoru, nebo aby se neprojevily vlivy stěn, do kterých bychom je uzavřeli? Elegantní řešení nabízejí takzvané periodické okrajové podmínky. Kolem makromolekuly naprogramujeme krabici, jejíž vnitřek pravé stěny se bude zároveň chovat jako vnější strana levé stěny. Molekula vody, která z krabice uteče pravou stěnou do ní zároveň levou stěnou znovu vstoupí. Totéž bude platit pro přední a zadní stěnu a pro dno a víko (obrázek 11.5). Takové zázračné chování lze matematicky jednoduše zařídit. Vlastně odpovídá tomu, jako kdybychom měli identické krabice s makromolekulou pravidelně poskládány vedle sebe ve všech směrech. 11.7. VÝPOČET ELEKTROSTATICKÝCH INTERAKCÍ 137 11.7 Výpočet elektrostatických interakcí Další komplikací, kterou je třeba vyřešit pro rychlý výpočet, je daleký dosah elektrostatických interakcí. V makromolekule interaguje každý atom s každým. Počet výpočtů elektrostatických interakcí by měl být tedy přibližně úměrný druhé mocnině počtu atomů, což je pro makromolekulu velké číslo. Výpočet se výrazně zrychlí, když zanedbáme interakce vzdálených atomů. To můžeme bez obav udělat pro van der Waalsovy síly, které se vzdáleností rychle klesají. Jak ukazuje rovnice 15.2 v Dodatku, elektrostatické interakce klesají se vzdáleností velmi pomalu. „Uříznutí" interakcí v určité vzdálenosti způsobí nepřirozený skok v hodnotách energie, který vede k výpočetním chybám. Pokud se budeme snažit posunout hranici zanedbání co nejdále a zároveň používáme metodu explicitního solventu, dostáváme se do dalších obtíží. Hranice zanedbání bude větší než rozměry krabice, takže budeme občas počítat interakce atomu vody se sebou samým. Rozumný kompromis mezi přesností a rychlostí výpočtu nabízí metoda PME (Particle Mesh Ewalď). Tato metoda je vhodná zejména pro výpočty nukleových kyselin, v nichž každý nukleotid obsahuje záporně nabitý fosfát a elektrostatické síly se proto projevují velmi výrazně. Metoda PME zjednodušuje výpočet tím, že elektrostatické interakce počítá pro jednotlivé molekuly vody jen do určité vzdálenosti od biomakromolekuly. Ve větších vzdálenostech využívá skutečnosti, že energie elektrostatické interakce je úměrná převrácené hodnotě vzdálenosti. Díky tomu, že naše molekuly jsou umístěny v periodicky se opakujících krabicích, můžeme pro výpočty veličin závisejících na převrácené hodnotě vzdálenosti použít velmi rychlou výpočetní metodu založenou na Fourierově transformaci5. 11.8 Hledání lokálního minima energie Základní myšlenkou molekulového modelování je hledání stavu molekuly s nejnižší energií. Energie molekuly závisí na množství proměnných, které popisují stav atomů v molekule. Proto s energií zacházíme jako s funkcí mnoha proměnných. Kdyby energie závisela jen na jedné proměnné, našli bychom minimum snadno podle následujících pouček: • Jestliže je první derivace funkce pro určitou hodnotu proměnné rovna nule, pak má funkce v daném bodě minimum, maximum, nebo infiexní bod. • Jestliže je druhá derivace funkce pro stejnou hodnotu proměnné větší než nula, má funkce v daném bodě minimum (záporná druhá derivace odpovídá maximu a nulová druhá derivace odpovídá inflexnímu bodu). Pokud jde o funkci více proměnných, nestačí k hledání minima jediné číslo. Musíme počítat derivace funkce podle všech proměnných. Průběh funkce v určitém bodě popisují vektory, které obsahují první a druhé derivace v daném bodě podle všech souřadnic. Matematicky se vektor prvních derivací označuje jako gradient a vektor druhých derivací jako hessián. Gradient je pro hledání minima užitečný, protože ukazuje směr nejprudšího růstu funkce. Minimum poznáme podle toho, že v daném bodě bude gradient nulový a ve všech okolních bodech bude gradient směřovat pryč od daného bodu6. Když se vydáme z různých bodů proti směru gradientu, měli bychom skončit ve stejném bodě, v minimu. Pokud tomu tak opravdu je, říkáme, že náš výpočet konvergoval. 5Fourierova transformace převádí pomocí sumace (součtu) periodickou funkci proměnné x na funkci proměnné 1/x. Pro tento výpočet existuje velmi rychlý algoritmus. S Fourierovou transformací se setkáme později při popisu zpracování difrakčních dat a signálu nukleární magnetické rezonance. 6Vedle metod založených na derivacích, jako je gradientova metoda, je možné použít i nederivační metody, jako je metoda simplexová (na počátku náhodně zvolíme proměnné, ty potom měníme a sledujeme, které změny vedou ke snížení energie). Volba nej vhodnější metody závisí na počtu proměnných, na tom jak jsme daleko od minima a na tom, jak citlivě závisí energie na jednotlivých proměnných. V průběhu minimalizace bývá užitečné metody střídat. 138 KAPITOLA 11. VÝPOČETNÍ METODY V praktickém výpočtu samozřejmě nedosáhneme naprostou shodu a neměnnost (nulovou derivaci). Proto musíme stanovit hranici, pod kterou už jsme ochotni odchylky zanedbat a říci, že jsme dostatečně blízko minima. Podmínky, které tuto hranici definují, se nazývají konvergenční kritéria. 11.9 Prohledávání plochy potenciální energie Hledání lokálního minima má jedno důležité omezení: „umí běhat jen z kopce". To znamená, že metoda dospěje vždy na dno toho údolíčka hyperplochy potenciální energie, ve kterém se už od začátku nachází. Nás ovšem zajímají všechna údolí, zejména to nejhlubší. Proto se minimalizace popsaná v části 11.8 často kombinuje s metodami, které nás umí přenést i přes pohoří potenciální energie. Tyto metody připomínají postup detektiva, který hledá ve městě podezřelé. Může k tomu přistupovat různým způsobem: 1. Detektiv může postupovat systematicky, dům od domu. Tomu odpovídá metoda systematického prohledávání (grid search). Jako příklad si můžeme vzít opět Ramachandranův diagram. Budeme systematicky zvyšovat úhly (p a ip po pěti stupních a pro každou dvojici úhlů vypočítáme energii. Abychom prohledali celý diagram, musíme takových výpočtů provést 72 krát 72, to je 5 184. 2. Detektiv může zcela náhodně brát za kliky různých domů. Podobně my můžeme volit hodnoty úhlů

a imaginární složka \Eq \ sinej) elektromagnetické vlny mohou být popsány v jedné rovnici s použitím komplexních čísel \Eq \ cos cj> + i|Eq | sin cj>. Imaginární jednotka i značí, že složka |i?o|sin je orientována kolmo ke směru reálné složky (obrázek 12.5). Pro další zjednodušení můžeme přepsat popis vlny do exponenciální formy \E0\cos + i\E0\sin = e~1(^ (rovnice 10.7). S použitím tohoto matematického aparátu můžeme popsat výslednou vlnu po rozptylu záření na krystalu ve směru definovaném indexy h,k,l. Komplexní číslo popisující amplitudu a fázi rozptýleného záření nazýváme strukturní faktor: lil F(hkl) = V j j j p{xyz)e27TÍ{hx+kv+lz)áxáyáz, (12.2) x=0 y=0 z=0 kde F(hkl) je komplexní číslo popisující reálnou a imaginární složku rozptýleného záření, h, k, l jsou Millerovy indexy a V je objem elementární buňky analyzovaného krystalu. Integraci provádíme 12.5. KRYSTALIZACE BIOMAKROMOLEKUL 147 Imaginární osa i A i Reálná osa Obrázek 12.5: Argandův diagram. přes celý objem elementární buňky ve všech třech rozměrech vyjádřených frakčními souřadnicemi x, y, z. Tyto souřadnice jsou definovány jako zlomky hran elementární buňky, například x = 0,25 znamená, že elektron se nachází v jedné čtvrtině elementární buňky ve směru hrany a. Hodnota p(x y z) je tedy elektronová hustota v bodě x,y, z v rámci elementární buňky. Při určování struktury molekul z rentgenové difrakce se ale nesnažíme spočítat hodnotu strukturního faktoru. Naopak chceme spočítat distribuci elektronové hustoty, která nám ukáže tvar molekuly. Rovnici 12.2 lze převést do formy vhodné pro výpočet elektronové hustoty pomocí Fourierovy transformace p(x y z) = 1 J2 E E F(h k l)e-2^hx+ky+1^. (12.3) h k l Jednotlivé členy rovnice jsou stejné, jako v rovnici 12.2. Integrace byla nahrazena sumací, protože k difrakci dochází pouze ve směrech definovaných parametry krystalu (podle orientace "zrcadel"určené Millerovými indexy (hkľj). Strukturní faktor je komplexní číslo, které se skládá z reálné a imaginární části, stejně jako světelná vlna má amplitudu a fázi. Rovnici 12.3 můžeme tedy přepsat jako p(xyz) = ^^^^\F(hkl)\e-2^hx+kv+lz)+ia^hkl). (12.4) h k l Oproti rovnici 12.3 jsme provedli nahrazení F(hkl) = \F(h k ľ)\ela(hkl\ kde \F(hkľ)\ -značí amplitudu a a(h k ľ) fázi strukturního faktoru. Elektronová hustota je vždy reálným číslem. 12.5 Krystalizace biomakromolekul Pustili jsme se do rentgenové krystalografie biologicky zajímavých makromolekul, aniž bychom si řekli, jak krystaly tak velkých molekul můžeme získat. Přitom úspěch v určování struktury biomakromolekul 148 KAPITOLA 12. RENTGENOVÁ KRYSTALOGRAFIE závisí hlavně na tom, jestli se nám podaří připravit dostatečně veliký a kvalitní krystal, abychom jej mohli použít jako mřížku pro difrakci rentgenového záření. Pojďme proto tuto chybu rychle napravit. Pro pochopení procesu krystalizace je nutné vědět něco o chování roztoků pevných látek. Nazveme-li nějakou chemikálii „pevnou látkou", znamená to, že za běžných podmínek jsou její molekuly natěsnány na sebe bez větší volnosti pohybu. Pokud jsou molekuly poskládány pravidelně, mluvíme o krystalu. Co se stane, když takovou pevnou látku vložíme do vody (nebo jiného rozpouštědla)? Bude-li takové látky málo, její molekuly se rozdělí a každá z nich se obalí poměrně pravidelnou konstrukcí z molekul rozpouštědla. Takovému stavu říkáme nenasycený roztok. Rozpustnost většiny látek je ale omezená. Když budeme pevnou látku do roztoku dále přidávat, dospějeme do stavu, kdy další rozpouštění nebude možné. Připravili jsme nasycený roztok. Koncentrace rozpuštěné látky se tedy nebude dále zvyšovat a přidaná látka se bude prostě hromadit v pevném stavu. Zvyšování koncentrace rozpuštěné látky můžeme dosáhnout nejen přidáváním pevné látky, ale také odebíráním molekul vody - odpařováním. Také tímto způsobem dojdeme do stavu, kdy nebude možné koncentracilátky dále zvyšovat, ale část se jí začne ukládat v pevném stavu, tedy budovat krystal nebo amorfní, neperiodickou strukturu. Pro stavbu krystalu je nejobtížnější položit základy pravidelného uspořádání molekul. Proto se bude zásadně lišit situace, kdy odpařujeme roztok látky, ve kterém již krystal přítomný je, od situace, kdy odpařujeme roztok bez přítomnosti krystalu. V prvním případě se po dosažení určité koncentrace budou další molekuly ochotně zařazovat do již přítomného pravidelného uspořádání krystalu a krystal poroste. V druhém případě molekuly po určitou dobu „nebudou umět" pravidelnou strukturu vytvořit, i když bude roztok nasycený. Koncentrace rozpuštěné látky tedy dál bude růst. V takovém případě mluvíme o přesyceném roztoku. Při určité koncentraci může být výhodnost pevného stavu tak výrazná, že se prakticky samovolně začnou tvořit zárodky krystalů, které ihned začnou rychle růst. Při rychlém odpařování dochází k tomu, že koncentrace roste prudce a brzy se začne tvořit velké množství zárodků krystalů. Ty sice porostou rychle, ale brzy vyčerpají rozpuštěnou látku, takže výsledkem bude obrovské množství mikroskopických krystalků, které nejsou pro přesné určování struktury použitelné. Při pomalém odpařování naopak vzniká nejprve přesycený roztok. Pokud vložíme do přesyceného roztoku jeden malý krystal, budou se k němu molekuly rozpuštěné látky připojovat a můžeme tak vypěstovat velký pravidelný krystal. Proto je přesycený roztok, jako stav, ve kterém krystal může růst, ale samovolně nevzniká, pro pěstování velkých krystalů velmi důležitý. Víme již, jak z malého krystalu vypěstovat velký. Kde ale vzít ten malý krystal, když určujeme strukturu zkoumané biomakromolekuly poprvé? Musíme najít takové podmínky krystalizace, kdy připravíme přesycený roztok a na okamžik zvýšíme koncentraci biomakromolekuly natolik, aby vznikl malý počet zárodků krystalů. Pak se vrátíme do přesyceného roztoku, ve kterém budou krystaly dále růst. Oblíbeným kryštalizační m postupem je metoda visící kapky, ilustrovaná vlevo na obrázku 12.6. Připravíme si asi mililitr roztoku látky, které krystalografové říkají srážedlo. Může to být organická nebo anorganická sůl, organické rozpouštědlo, nebo polyethylenglykol. Z roztoku srážedla odebereme několik mikrolitrů, smícháme se stejným objemem roztoku zkoumané biomakromolekuly a kápneme na vhodně upravené sklíčko. Koncentrace biomakromolekuly v kapce by měla být taková, aby za dané koncentrace srážedla byl její roztok téměř nasycený. Potom umístíme roztok srážedla do malé nádobky a sklíčkem nádobku přikryjeme tak, aby kapka visela nad hladinou srážedla. Nádobka se sklíčkem musí být dobře utěsněna, aby páry vody nemohly unikat ven. Co se v nádobce bude dít? Koncentrace srážedla v kapce je po smíchání s roztokem biomakromolekuly poloviční ve srovnání s roztokem srážedla v nádobce. Tento rozdíl koncentrací se bude během času vyrovnávat. Pokud je srážedlo netěkavé, bude k vyrovnávání docházet tak, že molekuly vody se budou vypařovat z visící kapky a koncentrovaný roztok srážedla je bude postupně absorbovat. Protože objem kapky je mnohem menší, než objem roztoku srážedla (obvykle zhruba tisíckrát), objem visící kapky se ztrátou vody zmenší přibližně na polovinu. Během zmenšování kapky poroste koncentrace biomakromolekuly, vznikne přesycený roztok a v určitém okamžiku může dojít k vytvoření zárodku krystalu (takzvaného nukleačního centra). Tento krystalek začne růst a během růstu se spotřebuje část 12.6. MĚŘENÍ DIFRAKCE 149 Obrázek 12.6: Kryštalizační metody visící kapky (vlevo), sedící kapky (uprostřed) a mikrodávek (vpravo). biomakromolekul, takže jejich koncentrace v roztoku poklesne na úroveň přesyceného roztoku, v níž jsou krystaly stabilní, ale nová nukleační centra nevznikají. V ideálním případě poklesne koncentrace dříve, než se stačí vytvořit více zárodků, a v kapce nám poroste jediný krystal. Takové ideální (nebo alespoň téměř ideální podmínky) není snadné nalézt, obvykle je nutné vyzkoušet různé koncentrace řady srážedel. Metoda visící kapky má různé alternativy. Pokud nám nestačí objem kapky, kterou kapilární síly udrží viset na víčku, můžeme použít metodu sedící kapky (obrázek 12.6 uprostřed). Moderní laboratoře svěřují zdlouhavé hledání vhodných podmínek automatickým robotům, pro které je výhodná metoda mikrodávek (microbatch method). Při ní je do parafinového oleje umístěno velké množství kapiček s roztokem obsahujícím srážedlo a biomakromolekulu (obrázek 12.6 vpravo). V oleji nedochází k odpařování vody, takže se musíme strefit do podmínek, kdy je již na začátku koncentrace biomakromolekul taková, aby vzniklo jen malé množství zárodků krystalů. Tyto větší nároky na počáteční složení jsou vyváženy tím, že automat může vyzkoušet mnohem více počátečních podmínek. Jak vidíme, pěstování krystalů biomakromolekul je spíše umění založené na pokusu a omylu, než vědecká disciplína. Jsme-li úspěšní, na konci našeho snažení nás čeká krásný pravidelný krystal o rozměrech desetin milimetru. Zajímavější než vnější vzhled je ale uspořádání molekul v takovém krystalu. Možná vás překvapí, jak výrazně se krystaly biomakromolekul liší od toho, co nám při slově krystal většinou vytane na mysli a co zpravidla odráží naše znalosti o obsahu slánky či cukřenky. Složité makromolekuly mají dosti nepravidelný tvar a je pro ně proto obtížné nalézt pravidelné krystalové uspořádání. Krystal proto obsahuje různé dutinky mezi jednotlivými makromolekulami, které jsou vyplněny krys-talizačním roztokem. Objem roztoku je často srovnatelný s objemem zkoumané molekuly (kolísá mezi 30% až 70% celkového objemu krystalu makromolekul). Dutinky mezi makromolekulami jsou dost velké na to, aby se v nich mohla voda poměrně volně pohybovat. Přítomnost dutinek má pro krystalografa příjemné i méně příjemné důsledky. Značná volnost molekul vody a některých částí makromolekul způsobuje, že se makromolekuly mohou v krystalu částečně pohybovat a přesnost určování struktury je proto horší, než v případě krystalů malých molekul, které bývají těsně uspořádané . Na druhou stranu voda v dutinkách zaručuje, že ani v krystalu není biomakromolekula přítomná v „suchém stavu". Prostředí, v kterém se molekula nachází, se spíše podobá velmi koncentrovanému roztoku a struktury biomakromolekul v krystalech se většinou velmi podobají strukturám v roztoku, o kterých bude řeč v kapitole 14. 12.6 Měření difrakce Od přípravy krystalu nyní postoupíme k vlastnímu měření. Přístroj pro měření difrakce (difraktometr) má tři hlavní části: zdroj rentgenového záření, zařízení pro uchycení krystalu v různých polohách (go-niostať) a detektor. 150 KAPITOLA 12. RENTGENOVÁ KRYSTALOGRAFIE Zdroj záření Rentgenové záření je elektromagnetické vlnění o velmi krátké vlnové délce, tedy vysoké energii. Obecně jsou zdrojem elektromagnetických vln nabité částice, které mění směr nebo rychlost pohybu. V klasické Roentgenově lampě dochází k vyzařování, když elektrony urychlené v silném elektrickém poli prudce brzdí při dopadu na kladnou elektrodu. Pro měření difrakce biomakromolekul se ale dnes již většinou používají jako zdroje záření synchrotrony. V tomto případě už lze těžko hovořit o přístroji, protože může jít o zařízení velikosti malého městečka. V synchrotronech jsou elektrony urychlené v lineárních a kruhových urychlovačích na rychlost blízkou rychlosti světla a přivedeny do takzvaného akumulačního prstence. V něm se pohybují po přibližně kruhové dráze, která se skládá z rovných úseků spojených ohybovými magnety. V každé zatáčce vyzařují elektrony úzký paprsek velmi intenzivního polarizovaného elektromagnetického záření. Protože pro většinu měření potřebujeme záření o jedné vlnové délce, je důležitou součástí zdroje monochromátor, zařízení, které nám umožní vybrat záření s přesně definovanou vlnovou délkou. Goniostat Během měření je krystal uchycen v takzvaném goniostatu, který umožňuje krystalem během měření otáčet. V některých experimentech se používá goniostat, který umožňuje krystal natočit podle více os a tak jej orientovat libovolným způsobem. Většinou ale vystačíme s jednoosým goniostatem, který otáčí krystalem tam a zpátky v rozsahu několika stupňů. Detektor Intenzitu paprsků difraktovaných na krystalech biomakromolekul v různých směrech měříme pomocí plošných detektorů2, zaznamenávajících intenzitu a polohu dopadajících paprsků. Příkladem může být film citlivý na rengenové paprsky, obrazová deska3 (image plate), nebo polovodičový detektor typu fotodiodových polí nebo CCD (chargé-coupled device, používá se v digitálních fotoaparátech). Výsledkem měření je difrakční snímek (obrázek 12.1B) 12.7 Vyhodnocení dat Zpracování naměřených dat můžeme rozdělit do tří kroků. Nejprve musíme určit mřížkové parametry a orientaci krystalu (vektory a, b, c). Známe-li mřížkové parametry a orientaci krystalu, známe „adresy" (indexy h, k, V) míst, kde můžeme reflexe pozorovat. Víme tedy, v kterém místě na detektoru máme měřit intenzitu i\ V dalším kroku musíme určit celkové intenzity jednotlivých reflexí, odečíst pozadí a stanovit chybu měření. Ve třetím kroku redukujeme naměřené intenzity na amplitudy strukturních fakorů. Intenzity naměřené detektorem jsou úměrné druhé mocnině absolutní hodnoty strukturního faktoru. Konstanty úměrnosti ale závisí na řadě dalších faktorů: na objemu krystalu, na rychlosti, se kterou krystalem otáčíme, na absorpci záření krystalem, na polarizaci záření, na postupném poškozování krystalu dopadajícím rentgenovým zářením. Tyto vlivy se mohou lišit pro jednotlivé reflexe, proto musí být provedeny různé opravy naměřených intenzit, abychom získali porovnatelné hodnoty. Tato část zpracování výsledků difrakčního pokusu, kdy určujeme velikost amplitudy strukturních faktorů, se nazývá redukce dat. Pro výpočet map 2V případě malých molekul lze měřit intenzitu záření v jednom směru pomocí fotonásobiče se scintilačním krystalem, který vyzařuje viditelné světlo po dopadu rentgenového záření. V tomto případě opakujeme měření s orientacemi krystalu a detektoru, které odpovídají jednotlivým reflexím. V případě makromolekul je ale reflexí tolik, že je není možné jednotlivě proměřovat. 3 Jde o moderní obdobu fotografické desky, která se nevyvolává ponořením do vývojky, ale čte pomocí laseru a fotonásobiče. 12.8. ŘEŠENÍ FÁZOVÉHO PROBLÉMU 151 Obrázek 12.7: Strukturní faktor trojice elektronů. Vlevo je znázorněna poloha tří elektronů mezi Braggovými rovinami, vpravo Argandův diagram ukazující sčítání strukturních faktorů jednotlivých elektronů (strukturní faktory a elektrony jsou nakresleny stejnými barvami). Černá šipka představuje výsledný strukturní faktor. elektronové hustoty potřebujeme ještě zjistit fázi jednotlivých strukturních faktorů. To je úkol natolik složitý, že mu věnujeme samostatnou diskusi. 12.8 Řešení fázového problému Výsledkem difrakčního experimentu jsou skvrny v difrakčním obrazci. Každá z těchto skvrn odpovídá vlně šířící se daným směrem, vlně s určitou amplitudou a fází. Vlnová rovnice v komplexním tvaru (rovnice 10.7) dokumentuje, že vlnu můžeme popsat pomocí komplexního čísla. Pro přehlednost je užitečné znázornit toto komplexní číslo graficky, jako vektor v rovině, kde vodorovná souřadnice udává reálnou složku a svislá imaginární složku. Amplituda pak odpovídá délce šipky znázorňující vektor a fázi popisuje úhel, o který je šipka otočena od reálného směru. Skládání rozptýlených vln lze graficky zobrazit jako součet vektorů popisujících jednotlivé vlny. Příklad pro tři elektrony je ukázán na obrázku 12.9. Rozptyl v určitém směru odpovídá odrazu na Braggových rovinách určité vzdálenosti. Fáze vln rozptýlených na jednotlivých elektronech závisí na tom, jak kde se daný elektron nachází mezi Braggovými rovinami: elektron přesně uprostřed mezi rovinami rozptyluje s opačnou fází, než elektron ležící přímo na Braggově rovině (na obrázku mají vektory popisující rozptyl na těchto elektronech opačný směr). Výsledný černý vektor odpovídá strukturnímu faktoru trojice elektronů, který popisuje výslednou vlnu rozptýlenou v daném směru. Rovnice 12.2 nám říká, že strukturní faktory pro rozptyl v různých směrech (tedy pro různé body reciproké mřížky popsané Millerovými indexy h, k, l odpovídající jednotlivým difrakčním skvrnám) jsou dány Fourierovou transformací rozložení elektronové hustoty v elementární buňce. Pro nás je zvlášť důležité to, že Fourierova transformace funguje i opačným směrem, takže ze strukturního faktoru bychom mohli přímo vypočítat rozložení elektronové hustoty. A struktura molekuly je dána právě výskytem elektronů. Opačnou Fourierovu transformaci můžeme matematicky popsat rovnicí 12.3. Ukázali jsme si, že rovnici 12.3 můžeme přepsat jako 152 KAPITOLA 12. RENTGENOVÁ KRYSTALOGRAFIE p(x y z) = - Y, Y. 12 \F(h k l)\e-2^hx+ky+lz^+ia(-hk') (12.5) h k l (rovnice 12.5), kde \F{hkV)\ značí amplitudu a a(hkl) fázi strukturního faktoru. Kdybychom uměli měřit amplitudu i fázi strukturního faktoru, stačilo by prostě nechat počítač zpracovat naměřená data podle rovnice 12.5. Získali bychom ihned rozložení pravděpodobnosti výskytu elektronů v elementární buňce (takzvanou mapu elektronové hustoty), což je vlastně tvar molekuly. Ve skutečnosti ale během experimentu pouze naměříme, kolik fotonů v daném směru dopadne na detektor, ne jakou mají fázi. Počet fotonů je úměrný druhé mocnině amplitudy vlny, informaci o fázi ztrácíme. Této komplikaci říkáme fázový problém a velká část krystalografie je věnována jeho řešení. 12.9 Pattersonova mapa Rovnice 12.3 nám říká, jak bychom získali elektronovou hustotu, kdybychom provedli Fourierovu transformaci strukturních faktorů. Patterson si položil otázku, co získáme, když místo toho spočítáme Fourierovu transformaci toho, co nám poskytne měření, tedy Fourierovu transformaci druhých mocnin amplitud strukturního faktoru. Takový výpočet je ekvivalentní rovnici 12.3, ve které použijeme pro všechny fázové úhly a hodnotu 0°. Místo mapy elektronové hustoty získáme jinou mapu, zvanou Pattersonova mapa. Tato mapa je v krystalografii velmi užitečná. Pattersonova mapa je mapou meziatomových vektorů. Jinými slovy, pokud bychom v mapě elektronové hustoty nalezli vysokou hustotu elektronů v místě popsaném vektorem ri a v místě popsaném vektorem r2, v Pattersonově mapě bychom viděli maxima v místech pospaných vektory ř1 — r2 a r2 — f\ ■ Výšky maxim by přitom odpovídaly součinu výšek maxim v místech ř*i a r*2 mapy elektronové hustoty. Na obrázku 12.8 je ukázka Pattersonovy mapy jednoduché molekuly. Pattersonova mapa je vlastně kombinace několika posunutých obrazů molekuly, s tím, že každý z obrazů je posunut tak, aby jeden atom ležel v počátku buňky. Protože mapa zobrazuje vektory typu r\ — r*2 i r*2 — najdeme v ní i převrácené obrazy molekuly. Pokud není atomů moc, můžeme z Pattersonovy mapy určit původní polohy atomů v elementární buňce. Pattersonova mapa nám tedy umožní získat tvar molekuly i bez znalosti fáze! S rostoucím počtem atomů takový postup ale brzy selhává. Z poloh N atomů v elementární buňce můžeme sestavit N2 — N nenulových rozdílových vektorů. Pro desetiatomovou molekulu tak získáme mapu s devadesáti maximy, kterou je možné rozumně analyzovat. Ale pro malý protein skládající se z tisíce atomů bude Pattersonova mapa obsahovat 999 000 maxim, která splynou v nerozlišitelnou směs. V kombinaci s dalšími triky je ale Pattersonovův přístup základem metod řešení fázového problému v krystalografii velkých molekul. 12.10 Metoda molekulárního přemístění Metoda molekulárního přemístění (molecular replacement) je dnes nejběžnějším způsobem řešení fázového problému. Tato metoda umožňuje vyřešit fázový problém v případě, že máme dobrý model molekuly, jejíž strukturu určujeme. Celkový postup si můžeme shrnout do čtyř kroků: • Nalezení vhodného modelu • Umístění modelu do souřadné soustavy popisující krystalovou mřížku skutečného krystalu, tak aby difrakční obrazce vypočítané z modelu umístěného do krystalové mřížky co nejlépe odpovídaly skutečně naměřeným difrakčním obrazcům • Výpočet amplitud a fází strukturního faktoru z modelu umístěného do krystalové mřížky 12.10. METODA MOLEKULÁRNÍHO PŘEMÍSTĚNÍ 153 B C o o o o o o o o o o o o O^O 0(ÉÉ° oo b o oo b o oo b o o cf oo o q oo o q oo oo b o oo b o oo b o O Q oo o q OO O Q oo olo olo olo o o^~ô čr^o o o o o o o o o o o o o Obrázek 12.8: Pattersonova mapa. Na obrázku A je černě zobrazena jednoduchá molekula v zelené elementárni buňce. Obrázek B ukazuje posunutí molekuly vedoucí k překryvu atomů. Obrázek C představuje několik buněk Pattersonovy mapy této molekuly. První krok (nalezení vhodného modelu) znamená, že již dříve někdo vyřešil strukturu dostatečně podobné molekuly, což je dnes již běžný případ, nebo že můžeme model molekuly spolehlivě předpovědět například metodami popsanými v části 15.13. Podobnost terciárních struktur dvou proteinů většinou odráží podobnost jejich primárních struktur, takže srovnáním sekvencí získáme dobrý odhad toho, zda bude molekulární přemístění úspěšné. Pokud je známá struktura dostatečně kompletní a sekvence obsahují alespoň 40% identických aminokyselin, je velká naděje, že metoda molekulárního přemístění nám umožní vypočítat fázové úhly strukturních faktorů. Druhý krok molekulového přemístění vyžaduje, abychom modelovou strukturu vložili ve správné orientaci a do správného místa v rámci elementární buňky našeho krystalu. Tuto orientaci a místo pochopitelně neznáme. Modelem jsou pouze souřadnice atomů, které mohou pocházet z predikce popsané v části 15.13, mohou být vypočítané v roztoku pomocí nukleární magnetické rezonance, nebo z difrakce na krystalu s úplně jinou krystalovou mřížkou. Správnou orientaci a správné místo musíme hledat tak, že pro různé orientace modelu v různých místech krystalové mřížky spočítáme, jak by vypadal difrakční obrazec. Pro správně umístěný model se musí vypočítaný obrazec shodovat se skutečně naměřeným. K tomu, abychom molekulu natočili, musíme určit tři rotační úhly, a k tomu, abychom ji umístili v elementární buňce, musíme zadat tři polohové parametry, popisující posunutí v prostoru. Obecně je molekulové přemístění šestirozměrný problém. Většinou lze ale úkol řešit ve dvou krocích, nejdříve spočítat orientaci a pak správně natočenou molekulu posunout do správného místa. K pochopení rotačních a translačních funkcí nám pomůže Pattersonova mapa. Ačkoli pro molekulu velikosti proteinu nezískáme rozlišené rozdílové vektory, způsob jejich akumulace je specifický pro strukturu a orientaci makromolekuly. Vektory v Pattersonově mapě můžeme rozdělit na dva druhy. Intramolekulární vektory (mezi atomy v téže molekule) závisí pouze na orientaci, ne na pozici molekuly v buňce. Intermolekulární vektory (mezi atomy různých molekul) závisí na natočení i na pozici, takže po určení správné orientace nám pomohou najít potřebné posunutí. Protože vzdálenosti v rámci molekuly 154 KAPITOLA 12. RENTGENOVÁ KRYSTALOGRAFIE jsou v průměru kratší, intramolekulární vektory jsou většinou kratší. Proto můžeme rotaci spočítat, když použijeme pouze část Pattersonovy mapy v okolí počátku. Třetím krokem je výpočet strukturního faktoru z modelu umístěného do skutečné krystalové mřížky podle rovnice 12.2. Využíváme přitom toho, že ze známé elektronové struktury (spočítané ze souřadnic modelu) molekuly umístěné ve známé krystalové mřížce (určené způsobem zmíněným v části 12.7) můžeme spočítat amplitudy i fáze strukturního faktoru ve všech směrech popsaných indexy h,k,l. Vypočítané amplitudy pro správnou orientaci a místo modelu musí odpovídat amplitudám naměřeným ve skutečném experimentu. Posledním krokem je nahrazení experimentálně nedostupných fází skutečné molekuly fázemi spočítanými z modelu v třetím kroku. Kombinací těchto vypočítaných fází se skutečně naměřenými amplitudami získáme celý strukturní faktor skutečné molekuly. Z tohoto strukturního faktoru pak můžeme podle rovnice 12.5 vypočítat elektronovou hustotu zkoumané molekuly. Ačkoli se vypočítaná elektronová hustota bude od skutečné trochu lišit (fáze pocházejí z modelu, který se od zkoumané molekuly trochu liší), při vhodné volbě modelu bude dobře odpovídat tvaru zkoumané molekuly. Metoda molekulového přemístění skrývá ale jedno úskalí. Fáze strukturního faktoru má na tvar elektronové hustoty mnohem větší vliv, než amplituda. Pokud nebude model zvolen správně (bude mít výrazně jinou strukturu, než zkoumaná molekula), bude se rozložení elektronové hustoty podobat více modelu, než struktuře zkoumané molekuly. 12.11 Přímé metody Pokud předpokládáme, že se molekuly skládají z atomů podobných tvarů s kladnou elektronovou hustotou, můžeme nalézt statistickou závislost mezi sadami strukturních faktorů. Tyto vztahy nám mohou pomoci najít hodnoty fází. Zmíněné statistické závislosti jsou dostatečně výrazné pouze pro krystaly s velmi vysokým rozlišením a nepříliš velkým počtem atomů v elementární buňce (v řádu stovek). Proto jsou přímé metody použitelné k určení struktur proteinů jen výjimečně. V rámci experimentálních přístupů k řešení fázového problému jsou ale přímé metody užitečné. 12.12 Metody izomorfního nahrazení Metody izomorfního nahrazení jsou založeny na předpokladu, že dokážeme krystal modifikovat tak, abychom ovlivnili strukturní faktor, ale ne strukturu a uspořádání makromolekul v krystalové mřížce. Ze způsobu, jakým změníme strukturní faktor, se pak snažíme odhadnout hodnoty fází. Důležité je, abychom zavedené změny dokázali popsat malým počtem parametrů. Proto se snažíme nahradit některé atomy makromolekuly (nebo na ni navázat) atomy s výrazně větším počtem elektronů. Takové atomy, běžně označované jako těžké atomy, významně ovlivní intenzity rozptýlených paprsků. Elektrony jednoho atomu jsou soustřeďeny do malého prostoru, nacházejí se tedy všechny přibližně ve stejné vzdálenosti od Braggových rovin a mají proto v podstatě stejnou fázi. Proto je příspěvek jednoho atomu ke strukturnímu faktoru úměrný počtu elektronů daného atomu. Na rozdíl od toho se elektrony různých atomů vyskytují v rozdílných polohách vzhledem k Braggovým rovinám a rozptylují tedy záření s rozdílnou fází. Jejich kombinovaný příspěvek ke strukturnímu faktoru je proto relativně malý. Když vezmeme do úvahy, že intenzita rozptýleného záření je úměrná druhé mocnině amplitudy strukturního faktoru (délky šipky), pochopíme, proč jeden atom uranu, který má patnáckrát víc elektronů než uhlík, přispěje k intenzitě rozptýlených paprsků přibližně stejně, jako 225 atomů uhlíku. Většina biomakromolekul se ovšem skládá pouze z „lehkých" prvků. Jak jsme si řekli v sekci 12.5, krystaly biologicky zajímavých makromolekul obsahují velké množství dutinek a kanálků. Ionty těžkých kovů mohou prostupovat těmito kanálky a dostanou se tak ke všem makromolekulám v krystalu. Většinou stačí přidat roztok soli těžkého kovu ke krystalu makromolekuly. Jinou možností je zavedení 12.12. METODY IZOMORFNÍHO NAHRAZENÍ 155 Obrázek 12.9: Ovlivnění celkového strukturního faktoru přítomností těžkého atomu. Vlevo je znázorněna poloha tří lehkých atomů (nakreslených červeně, zeleně a modře) a jednoho těžkého atomu (nakresleného azurovou barvou) mezi Braggovými rovinami, vpravo Argandův diagram ukazující sčítání strukturních faktorů jednotlivých atomů (strukturní faktory a atomy jsou nakresleny stejnými barvami). Černá šipka představuje výsledný strukturní faktor pro molekulu bez těžkého atomu (Fp) a s těžkým atomem (Fpo). 156 KAPITOLA 12. RENTGENOVÁ KRYSTALOGRAFIE těžkého atomu přímo do biomakromolekuly ještě před krystalizací. Například v proteinech je možné nahradit v cysteinu síru seleném, v DNA použít místo thyminu bromuracil a podobně. Všechny tyto metody vycházejí z předpokladu, že těžké atomy neovlivní konformaci biomakromolekuly ani tvar krystalové mřížky - odtud i název izomorfní nahrazení, tedy nahrazení biomakromolekuly jejím derivátem, který má stejný tvar. Aby isomorfní nahrazení bylo úspěšné mřížkové parametry krystalů makromolekuly s těžkým kovem a bez těžkého kovu se nesmí lišit o více než 1 %. Pokud se nám podaří připravit dva krystaly se stejnými mřížkovými parametry, jeden obsahující pouze nativní protein a druhý protein s navázanými těžkými atomy, můžeme naměřit difrakční data obou. Rozdíly v pozorovaných intenzitách rozptýleného záření odpovídajících reflexí z těchto dvou experimentů budou dány příspěvkem těžkých atomů. Z těchto rozdílů můžeme vypočítat Pattersonovu mapu, která bude zachycovat pouze rozložení těžkých atomů v elementární buňce. Pokud elementární buňka obsahuje malý počet těžkých atomů, je možné takovou Pattersonovu mapu analyzovat a určit, kde se těžké atomy v buňce nacházejí. Ze známého rozmístění těžkých atomů dokážeme Fourierovou transformací vypočítat jejich strukturní faktor včetně fáze. Jak nám to pomůže v hledání fáze strukturního faktoru proteinu samotného? Podstatou řešení je skutečnost, že strukturní faktor krystalu s těžkým atomem můžeme vyjádřit jako součet dvou komplexních čísel. Prvním z těchto komplexních čísel je strukturní faktor těžkých atomů získaný například z Pattersonovy mapy (pro něj známe amplitudu i fázi), druhým je strukturní faktor makromolekuly, který se rovná strukturnímu faktoru krystalu tvořeného biomakromolekulou bez těžkého atomu (pro ten známe amplitudu, ale ne fázi). Sčítání komplexních čísel je výhodné zobrazit v dvojrozměrném grafu, kde na vodorovnou osu vynášíme reálnou část a na svislou imaginární část (obrázek 12.10A). Náš případ je takto graficky znázorněn na obrázku 12.10B. Ve skutečnosti ovšem známe směr jen pro šipku frj, u ostatních šipek známe jen délku. Řešení tohoto problému je ukázáno na obrázku 12.10C. Nejdříve zakreslíme vektor fb, pro který známe velikost i směr. Do obrázku zakreslíme také vektor fpo, který popisuje strukturní faktor makromolekuly spolu s těžkým kovem. Pro tento vektor známe pouze amplitudu, ale ne fázi. Informaci o amplitudě nakreslíme jako kružnici se středem v počátku souřadnic a poloměrem odpovídajícím amplitudě |fpo|- Nakonec zakreslíme do obrázku to, co víme o vektoru f p, který odpovídá strukturnímu faktoru nativní makromolekuly. Opět známe pouze amplitudu, ale ne fázi. Také |fp| zakreslíme jako kružnici. Součet fp a f d musí odpovídat fpo- Střed kružnice znázorňující amplitudu |fp| proto umístíme na konec vektoru f> Kružnice znázorňující amplitudu |fp| a f p o se obvykle protnou ve dvou bodech. Jednoduché izomorfní nahrazení (SIR, Single Isomorphous Replacement) proto neumožňuje jednoznačné určení fází strukturních faktorů makromolekuly. Je třeba připravit alespoň dva krystaly s různými těžkými atomy. Graficky lze řešení znázornit opět v Argandově diagramu, do kterého v tomto případě zakreslíme dva známé vektory (strukturní faktory těžkých atomů ve dvou derivátech) a tři kružnice s poloměry odpovídajícími amplitudám strukturních faktorů nativní makromolekuly a jejich dvou derivátů. Jednoznačné řešení fázového problému je pak dáno průsečíkem všech tří kružnic. Toto je podstata metody vícenásobného izomorfního nahrazení (MIR, Multiple Isomorphous Replacement). Metoda MIR je základní metodou řešení fázového problému krystalů makromolekul neznámé struktury. 12.13 Metody využívající anomální rozptyl Až dosud jsme předpokládali, že při průchodu rentgenového záření krystalem se paprsek chová k elektronům zcela netečně, že nedochází k výměně energie mezi molekulou a zářením. V takovém případě interagují všechny elektrony se zářením stejně. Pro difrakci je důležitý jen rozdíl fází jednotlivých rozptýlených paprsků určený relativní polohou elektronů mezi Braggovými rovinami, ne absolutní hodnota fáze. Proto můžeme fázi záření rozptýleného na elektronu v počátku souřadné soustavy krystalu definovat jako nulovou. Ostatní elektrony budou rozptylovat s odlišnou fází. Elektrony, které leží na Braggových rovinách, budou rozptylovat se stejnou fází ve směru definovaném Braggovou rovinou, fáze Obrázek 12.10: Strukturní faktor v Argandově diagramu (A) a řešení fázového problému izomorfním nahrazením (B, C a D). Na obrázku B jsou nakresleny strukturní faktory nederivatizované biomakromolekuly (-Fp), biomakromolekuly derivatizované těžkým atomem (Fpu) a těžkých atomů (-Fb). Fázi známe pouze pro Fu, pro ostatní strukturní faktory známe jen amplitudy. Neznámé fáze můžeme určit způsobem ukázaným na obrázky C. Do Argandova diagramu zakreslíme známý vektor Fu- Dále zakreslíme čárkovanou kružnici o poloměru -Fpd|, která reprezentuje všechny možné vektory Fpu- Nakonec zakreslíme i plnou kružnici o poloměru \Fp\, znázorňující možné vektory Fp. Protože víme, že součet Fu a Fp je rovný Fpu, víme také, že počátek vektoru Fpu (a tedy střed čárkované kružnice) leží v počátku vektoru Fu, zatímco počátek vektoru Fp musíme umístit do konce vektoru Fu (aby na sebe šipky představující vektory navazovaly a znázorňovaly tak součet Fu + Fp = Fpu, jak ukazuje obrázek B). Proto musíme střed plné kružnice položit do konce vektoru Fu- Řešení ukazuje obrázek D. Místo, kam směřují vektory Fp i Fpu, musí ležet na obou kružnicích, průsečík kružnic nám tedy určuje konce obou hledaných vektorů. Obecně se ale plná a čárkovaná kružnice protnou ve dvou bodech, úloha má proto dvě možná řešení. Správné řešení je nakresleno černě, nesprávné červeně. 158 KAPITOLA 12. RENTGENOVÁ KRYSTALOGRAFIE Obrázek 12.11: Friedelův pár v nepřítomnosti těžkého atomu. Vlevo je znázorněna poloha lehkých atomů (nakreslených červeně, zeleně a modře) mezi Braggovými rovinami, vpravo Argandův diagram ukazující sčítání strukturních faktorů jednotlivých atomů (strukturní faktory a atomy jsou nakresleny stejnými barvami). Čárkovaně jsou nakresleny strukturní faktory pro odraz od spodní strany Braggových rovin. Černé šipky představují výsledné strukturní faktory Fp(hkl) a Fp(—h — k —l). Tyto vektory mají stejnou reálnou složku a opačné imaginární složky, jde tedy o komplexně sdružená čísla. záření rozptýleného na elektronech mezi Braggovými rovinami je posunutá úměrně kolmé vzdálenosti elektronu od Braggovy roviny (plné šipky na obrázku 12.11). Stejná sada Braggových rovin popisuje ale také odraz na opačné straně roviny, tedy pod přesně opačným úhlem (čárkované šipky na obrázku 12.11). Jestliže odraz paprsku znázorněného plnou čarou na obrázku 12.11 odpovídá rovině s Millerovými indexy (hkl), druhou stranu stejné roviny (od které se odráží čárkovaný paprsek) popisují Millerovy indexy {—h — k — ľ). Dvojice reflexí s indexy {hkľ) a {—h — k — l) se označuje jako Friedelův pár. Pokud nedochází k interakci záření s elektrony, mají strukturní faktory Friedelova páru fázi stejné velikosti, ale opačného znaménka. Matematicky řečeno, jde o komplexně sdružená čísla F(hkl) = F*(—h — k —l). Jinými slovy, čárkované šipky na obrázku 12.11 jsou zrcadlovým obrazem plných šipek. Pokud ale dochází k interakci mezi zářením a elektrony, jinými slovy, pokud se frekvence záření blíží rezonanční frekvenci4, situace se změní. Pohlcený foton vybudí přechod elektronu do jiného stavu a vyzářený foton bude mít jinou amplitudu i fázi. Tento rozdíl se nazývá anomální rozptyl. Proto strukturní faktory Friedlova páru nejsou v přítomnosti anomálnícho rozptylu komplexně sdružené. Rezonanční frekvence elektronů v atomech vodíku, uhlíku, dusíku, kyslíku a fosforu jsou příliš daleko vlnových délek rentgenového záření používaného pro analýzy makromolekul. Proto i metody využívající anomální rozptyl vyžadují přítomnost těžších atomů. Pokud určíme rozmístění atomů, pro které pozorujeme anomální rozptyl, v elementární buňce, můžeme vypočítat amplitudu i fázi strukturních faktorů Fpu(hkl) a Fpu(—h — k — l) a vyřešit tak fázový problém. Pokud jsme schopni rozlišit intenzity reflexí s opačnými hodnotami indexů h, k, l, můžeme tedy anomální rozptyl využít pro řešení fázového problému podobně jako v případě isomorfního nahrazení. Více informací o tomto přístupu můžete najít 4Rezonanční frekvence je daná rozdílem energií dvou stavů elektronů v ozařovaných atomech, vyděleným Planckovou konstantou, AE/h. V případě absorpce rengenových paprsků mluvíme často o absorpční hraně, protože od určité frekvence je k dispozici velké množství přechodů. 12.14. URČENÍ STRUKTURY Z DIFRAKČNÍCH DAT 159 v Dodatku F. K anoniálníniu rozptylu dochází, když se frekvence rentgenových paprsků blíží rezonanční frekvenci přechodu mezi stavy elektronů v daném atomu. Síla anomálního rozptylu proto silně závisí na vlnové délce použitého záření. Pokud můžeme naměřit difrakční data při několika vlnových délkách blízkých absorpční hraně, můžeme získat informaci o fázi podobným způsobem, jako z měření několika různých derivátů při použití metody MIR. Tato metoda se nazývá MAD (multi-wavelength anomalous disper-sion). V proteinové krystalografii se často měří MAD pro atom selenu, který se do molekuly zavede záměnou methioninu za selenomethionin při expresi rekombinantního proteinu. Selen, kterým v proteinu nahrazujeme síru, má silný anomální signál při vlnových délkách dostupných na synchrotronech. 12.14 Určení struktury z difrakčních dat Vysvětlili jsme si, jak můžeme z intenzity reflexí určit amplitudu strukturního faktoru. Ukázali jsme si také, jak vypočítat fázi strukturního faktoru. Nic nám tedy nebrání spočítat podle vztahu 12.5 mapu elektronové hustoty. Zdálo by se tedy, že jsme u cíle našeho snažení. Ve skutečnosti nás ještě ale pořádný kus práce čeká. Je třeba postavit atomární model studované makromolekuly. Stavba modelu není vždy jednoduchá. Počáteční fáze, které použijeme k výpočtu mapy elektronové hustoty, často obsahují chyby, které způsobí, že tvar molekuly je překryt šumem, nebo se jeví jako rozmazaný. Když postavíme počáteční model molekuly, můžeme z něj vypočítat fázové úhly pro jednotlivé strukturní faktory, zkombinovat je s naměřenými amplitudami strukturních faktorů a vypočítat novou mapu. Pokud jsme model postavili správně, bude nová mapa obsahovat mnohem méně šumu a tvar molekuly v ní bude zřetelnější. Proto je nutné postupně vypočítanou strukturu zpřesňovat. Zpřesňování struktury můžeme provádět nejen ručně, ale i s pomocí programů, které jsme si popsali v kapitole 11. Používají se přitom metody molekulové mechaniky (sekce 11.3), které jsou dostatečně rychlé i pro velké molekuly. Je zde ale důležitý rozdíl. Během výpočtu se kromě hledání konformace s nejmenší energií snažíme zároveň hledat konformaci nejlépe odpovídající experimentálně naměřeným amplitudám strukturních faktorů. Jakým způsobem najdeme struktury, které dobře odpovídají naměřeným amplitudám? Nejjed-nodušší by bylo prostě provádět matematickou minimalizaci. Funkcí, kterou bychom minimalizovali, by byl rozdíl mezi experimentálně zjištěným strukturním faktorem a strukturním faktorem vypočítaným z modelu struktury. Proměnnými by byly souřadnice, které popisují polohu atomů v molekule. Aby takový postup fungoval dostatečně přesně, mělo by být naměřených intenzit aspoň desetkrát více, než proměnných. Souřadnic atomů v nepříliš velkých biomakromolekulách jsou tisíce. To znamená, že bychom měli vyhodnotit desetitisíce reflexí. Tak velký počet reflexí vyžaduje vysoké rozlišení difrakčního experimentu. Máme-li štěstí a náš krystal takové rozlišení poskytuje, můžeme získat strukturu nepříliš velkých biomakromolekul velmi rychle. Pro větší molekuly je splnění přísných požadavků na dostatek dat obtížné. Musíme proto provádět opakované minimalizace, kdy vyjdeme z počátečního modelu struktury, provedeme minimalizaci, vypočítáme nové strukturní faktory a z nich novou mapu elektronové struktury. Na základě této vylepšené mapy upravíme náš model a celý postup opakujeme. Úpravy modelu se většinou dělají „ručně" na obrazovce počítače, s pomocí interaktivních programů (příkladem mohou být programy Coot, XtalView nebo O). Taková práce může trvat dny až několik týdnů. Ruční úpravy struktury lze do jisté míry nahradit metodami molekulové dynamiky (sekce 11.10) a celý postup je tak možno zautomatizovat (použití molekulové dynamiky umožňují například programy Refmac, Phenix, X-PLOR a CNS). Obrázek 12.12 ukazuje část modelu molekuly proteinu zabudovaný do získané mapy elektronové hustoty. Abychom vyhověli požadavku na dostatečný počet měřených reflexí vzhledem k počtu proměnných, je výhodné snížit počet proměnných. Můžeme předpokládat, že struktura aromatických kruhů v aminokyselinách nebo bázích nukleových kyselin není ovlivněna celkovou konformaci makromolekuly. Je proto zbytečné počítat se souřadnicemi všech atomů aromatických skupin, jako by byly nezávislé. Počet stupňů 160 KAPITOLA 12. RENTGENOVÁ KRYSTALOGRAFIE Obrázek 12.12: Mapa elektronové hustoty molekuly proteinu (modře) s vestavěným strukturním modelem. volnosti je proto možné snížit na jediný torzní úhel, který popisuje orientaci aromatického kruhu jako celku. Takové dosazení pevně daných souřadnic některých atomů je příkladem použití tvrdých vazebných podmínek (constrains). Můžeme použít i měkké vazebné podmínky (restrains) tím, že souřadnice atomů v aromatických kruzích pouze omezíme pomocí rovnic, které stabilizují jednotlivé atomy v polohách odpovídajících ideální konformaci molekuly, jak byla zjištěna při studiu struktury malých molekul, pro které jsou dostupná data s vysokým rozlišením). Výsledkem našeho snažení je být model struktury, ve kterém známe souřadnice všech atomů. Tak tomu bývá ale málokdy. Některé části molekul mohou zaujímat v krystalu různé konformace. Mapa elektronové hustoty pak ukazuje pouze rozmazaný tvar, podle kterého není možné postavit model. Proto je běžné, že z difračních měření nemůžeme určit polohu několika pohyblivých aminokyselin na koncích polypeptidového řetězce nebo v pohyblivých smyčkách, či polohu některých atomů v postranních řetězcích na povrchu biomakromolekuly. I poměrně dobře definované atomy v krystalu kmitají kolem svých středních poloh. Toto kmitání souvisí s teplotou. Kromě souřadnic atomů proto bývá ve strukturách atomů uveden také tento tepelný rozkmit. Zpravidla se uvádí jako takzvaný B-faktor, což je střední kvadratická odchylka od průměrné polohy5 atomu. 12.15 Kontrola správnosti Během určování struktury jsme mnohokrát použili různých odhadů, oprav, ručních zásahů a přibližných výpočtů. Je tu tedy nebezpečí, že se nám do modelu vloudily nejrůznější chyby. Proto musíme pečlivě zkontrolovat, jestli získaná struktura nevypadá podezřele. 5Tato odchylka může být různá v různých směrech, tato různost se ale u makromolekul obvykle zanedbává. 12.15. KONTROLA SPRÁVNOSTI 161 Nejpoužívanějším měřítkem přesnosti struktury je i?-faktor, definovaný jako y:iiKexpi-if:mod II R (12.6) kde |-F!jexp| jsou amplitudy strukturních faktorů určených z experimentálních dat a |-F1imod| jsou amplitudy strukturních faktorů vypočítaných z atomárního modelu. Čím je struktura přesnější, tím je R nižší. Během zpřesňování strukturního modelu by se tedy měl R snižovat. Nízkého R lze ovšem dosáhnout i uměle, když například doplníme molekuly vody tam, kde by měla být část proteinu. Abychom odhalili takováto zdánlivá „vylepšení", rozdělíme si intenzity na dvě části. Z větší části (90%) vypočítáme strukturu, z menší části (10%) počítáme R. Od okamžiku, kdy se takto vypočtený R již nesnižuje (i když R určený ze všech intenzit stále klesá), víme, že se nám nedaří model zpřesňovat. Kromě testování přesnosti je dobré se podívat, zda hodnoty vazebných délek, vazebných úhlů a torzních úhlů odpovídají hodnotám běžným pro organické molekuly. Jakékoli neobvyklé hodnoty jsou podezřelé - je větší pravděpodobnost, že jsme udělali chyby, než že jsme objevili něco dosud nevídaného. KAPITOLA 12. RENTGENOVÁ KRYSTALOGRAFIE Kapitola 13 Elektronová mikroskopie 13.1 Elektrony jako vlnění Biomakromolekuly jsou mikroskopické objekty a jejich zkoumání nelze uspokojivě popsat zákony klasické fyziky platícími v makrosvete. Již několikrát jsme narazili na to, že pochopení různých stránek strukturní biochemie vyžaduje kvantovou mechaniku. To platí zejména tehdy, když se zabýváme elektrony, jejichž kvantová povaha je velmi zřetelná. V části 10.4 a v celé kapitole 12 jsme vzali kvantové chování elektronů do úvahy tak, že jsme představu elektronu nacházejícího se v určitém místě nahradili popisem rozložení elektronové hustoty v prostoru. Rozložení elektronové hustoty v molekule přitom představovalo objekt, který zkoumáme pomocí elektromagnetických vln, k jejichž popisu nám stačila klasická fyzika. V této kapitole si ukážeme, že elektromagnetickou vlnu můžeme nahradit elektrony. To lze pochopit jen tehdy, když pomocí kvantové mechaniky popíšeme nejen elektrony ve studované biomakromolekule, ale i elektrony, které na ní dopadají. Kvantová mechanika nám říká, že světlo i elektrony se chovají zároveň jako částice i jako vlny. Proto můžeme to, co jsme se o vlnách naučili v kapitolách 10 a 12, použít i pro popis elektronů bombardujících zkoumané molekuly. Vlny popisující elektrony jsou ovšem podstatně tajemnější, než vlny světelné. Světelnou vlnu jsme si mohli představit jako vlnění elektrických a magnetických sil popsaných vektory E a B. Kvantová mechanika nám představu vlnící se klasické veličiny jako E a B neposkytuje. I když různé verze kvantové teorie popisují vlnění pomocí jasně definovaných matematických objektů, není snadné si tyto objekty spojit s něčím, co známe z každodenní zkušenosti. Protože korektní kvantová analýza elektronových vln je daleko za rámcem našich přednášek, budeme se často ve výkladu utíkat k analogiím se světelným vlněním. Jakkoli se elektronové vlny světelným podobají, liší se v jedné podstatné vlastnosti. Elektrony mají na rozdíl od světla (od fotonů) elektrický náboj. Elektronovou vlnu lze tedy ohýbat v magnetickém poli, což u světla není možné. Pomocí cívek, kterými protéká elektrický proud, tak můžeme sestrojit elektromagnetické čočky, které fungují podobně, jako čočky skleněné ve světelné mikroskopii. Elektromagnetické čočky mají přitom jednu ohromnou výhodu. Ohýbají i elektronové vlny velmi krátkých vlnových délek, zatímco pro světlo (přesněji pro rentgenové paprsky) krátkých vlnových délek vhodné čočky nemáme. Proto je možné z elektromagnetických čoček sestrojit elektronový mikroskop schopný rozlišit jednotlivé atomy v molekulách. Elektronová mikroskopie se v mnohém podobá mikroskopii využívající viditelné světlo. Proto při vysvětlování principů elektronové mikroskopie můžeme často využít zkoušenosti s mikroskopy, se kterými jsme se začali seznamovat možná již na základní škole. Z tohoto pohledu je elektronová mikroskopie technikou přístupnější a pochopitelnější, než rentgenová krystalografie. 163 164 KAPITOLA 13. ELEKTRONOVÁ MIKROSKOPIE Z mnoha variant elektronové mikroskopie se zaměříme pouze na transmisní elektronovou mikroskopii (TEM). TEM je totiž pro popis struktury biomakromolekul nejužitečnější. TEM nám poskytuje, stejně jako rentgenové krystalografie, mapu elektronové hustoty, která popisuje tvar zkoumané molekuly. 13.2 Konstrukce elektronového mikroskopu Konstrukce transmisního elektronového mikroskopu (obrázek 13.1) je velmi podobná konstrukci světelného mikroskopu. Zdrojem vlnění je takzvané elektronové dělo (anglicky electron gun, v nejjednodušším provedení ohnuté kovové vlákno zahřívané průchodem elektrického proudu, ze kterého vyletují elektrony a jsou urychlovány silným elektrickým polem). Optickou soustavu tvoří elektromagnetické ěoěky, které kontrolovaným způsobem ovlivňují šíření elektronových vln. Na rozdíl od čoček světelného mikroskopu jde o cívky, kterými protéká elektrický proud. Magnetické pole indukované elektrickým proudem působí silou na letící nabité částice, v našem případě elektrony, a mění jejich dráhu. Pod zdrojem jsou umístěny dvě nebo tři kondenzorové ěoěky, které zajišťují optimální „osvit" vzorku elektronovým vlněním. Objekt, který zkoumáme (vzorek našich biomakromolekul), umísťujeme na síťku (anglicky speciment grid) o průměru 3 mm. V elektronové mikroskopii pracujeme s velmi rozdílnými zvětšeními. Na začátku, když hledáme pozorovaný objekt, pozorujeme celou síťku, jejíž obraz zvětšujeme jen asi padesátkrát. Nakonec, když chceme rozlišit jednotlivé atomy, musíme použít zvětšení v řádu desítek tisíc (70 000 x až 100 000 x) a sledujeme jen velmi malou oblast síťky. Kondenzorové čočky nám umožňují soustředit elektronové vlny do oblasti, kterou při daném zvětšení právě sledujeme. Pod síťkou se vzorkem je objektivová ěoěka, která zásadním způsobem určuje rozlišení a kvalitu obrazu. Následuje série projektorových ěoěek, které vytvářejí zvětšený obraz na detektoru. Detektorem může být film, nebo stínítko pokryté vrstvou scintilátoru, ve které dopad elektronů způsobí emisi fotonů viditelného světla, které pozorujeme. V současnosti je detektorem často kamera přímo detekující dopadající elektrony. Celá optická soustava je umístěna v neprodyšném tubusu, ve kterém je udržováno velmi vysoké vakuum. Jinak by elektrony interagovaly s molekulami vzduchu, což by ovlivnilo elektronové vlny natolik, že by žádný obraz zkoumaného objektu nevytvořily. Nutnost práce ve vakuu nám neumožňuje pozorovat nefixované biologické vzorky. Při jejich umístění do vakua by se okamžitě odpařila voda a zničily všechny biologické struktury, včetně biomakromolekul. Proto musí být vzorky fixovány buď chemicky (zalitím do tenké vrstvy pryskyřice) nebo zamrazením v tenké vrstvičce amorfního ledu. V elektronové mikroskopii je také nutné zaručit, aby se mikroskopem v danou chvíli pohyboval jen jeden elektron. Protože mají elektrony elektrický náboj (na rozdíl od světla neboli fotonů), vzájemně se odpuzují. Přítomnost druhého elektronu by zcela změnila vlnu tvořenou prvním elektronem a k vytvoření obrazu by nedošlo. Všechny následující úvahy o skládání (interferenci) vln se budou týkat vlnění jediného elektronu. To je velmi pádným důkazem platnosti zákonů kvantové mechaniky, které říkají, že obraz, který jeden elektron na detektoru vytvoří, závisí na všech cestách, kterými tento jediný elektron mohl (s různou pravděpodobností) k detektoru doputovat. Požadavek, aby se mikroskopu nacházel vždy jen jeden elektron, lze splnit poměrně snadno. Elektrony se totiž v elektronovém mikroskopu pohybují velmi rychle (desítky procent rychlosti světla), takže jeden elektron prolétne optickou soustavou mnohem dříve, než ze zdroje vystřelí další. 13.3 Výhody a nevýhody elektronové mikroskopie Elektronová mikroskopie má ve srovnání s jinými metodami (mikroskopie ve viditelném světle, rentgenová krystalografie) některé důležité výhody: 13.3. VÝHODY A NEVÝHODY ELEKTRONOVÉ MIKROSKOPIE 165 zdroj kondenzor ^ vakuum — vzorek objektiv projektor detektor Obrázek 13.1: Zjednodušené schéma transmisního elektronového mikroskopu. Elektrony jsou znázorněny červeně. Čočky mikroskopu tvoří elektromagnetická cívka (znázorněné tečkami) s clonou (vodorovná čára s mezerou uprostřed) a korekčními cívkami (svislé čárky). Ve skutečném mikroskopu tvoří kondenzor a projektor soustavy více čoček. • Hlavní výhodou elektronové mikroskopie je, že používá elektrony s vysokou energií, odpovídající velmi krátké vlnové délce. Jak víme z kapitoly 12, krátká vlnová délka nám umožňuje rozlišit malé detaily, v případě biomakromolekul jednotlivé atomy. • Výhodou i nevýhodou elektronové mikroskopie je, že elektrony letící z elektronového děla velmi silně interagují s elektrony v atomech vzorku. To nám umožňuje dosáhnout vysokého kontrastu, zejména pro vzorky fixované chemicky a barvené atomy s velkým počtem elektronů (těžké atomy). Většina atomů biologicky zajímavých molekul (H, C, N, O, P, S) obsahuje málo elektronů. Přídavek atomů s mnoha elektrony (Os, Au, Pb, U) vytváří silný kontrast, protože tyto atomy interagují s elektronovou vlnou mnohem silněji, než atomy biogenních prvků. • Díky elektrickému náboji elektronů můžeme v elektronové mikroskopii použít elektromagnetické čočky, pro které platí standardní zákony optiky. Proto se elektronová mikroskopie podobá světelné mikroskopii mnohem více, než rentgenová krystalografie. • Existují velmi intenzivní zdroje elektronů, takže můžeme použít velmi krátké expozice. • TEM poskytuje informaci o vnitřní struktuře objektů, včetně biomakromolekul. Snímané obrázky jsou dvojrozměrné projekce trojrozměrných objektů a nesou informaci nejenom o povrchu objektů, ale i o rozložení elektronové hustoty uvnitř objektů. Elektronová mikroskopie ale má i své nevýhody: • Nevýhodou je nezbytnost použití vysokého vakua, což vyžaduje chemickou fixaci nebo zmrazení vzorku. Zmrazení musí být přitom provedeno tak, aby nedošlo k poškození vzorku a molekuly zůstaly ve stavu co nejbližším nativní konformaci. 166 KAPITOLA 13. ELEKTRONOVÁ MIKROSKOPIE • Vzorek musí být velmi tenký, abychom se vyhnuli 100% absorpci. Velmi silná interakce elektronových vln s elektrony vzorku, zmíněná výše jako výhoda, je z tohoto pohledu nevýhodou. Pokud není vzorek velmi tenký, elektronová vlna s ním interaguje natolik silně, že k detektoru vůbec nedorazí a my nepozorujeme žádný signál. Ideální tloušťka vzorkuje do 200 nm, limit je asi 500 nm. Ve zkoumání struktur purifikovaných biomakromolekul nás limit tloušťky vzorků příliš neomezuje, protože velikost průměrných proteinů je několik nanometrů. Pro sledování buněk je ale omezení tloušťky vážným problémem. I malá bakterie Escherichia coli má délku 3 jum a tloušťku 1 jum a eukaryotické buňky (například fibroblasty pěstované na povrchu podložky) mají tloušťku větší, než 10 jum. • Dalším důsledkem silné interakce elektronů je poškození biologického vzorku. Délka měření proto musí být krátká a množství elektronů, kterým můžeme vzorek vystavit, dříve než dojde k jeho zničení, je malé. Proto při studiu biomakromolekul získáváme data s velmi špatným poměrem mezi signálem a šumem (S/N). Zatímco pravidlem analytické chemie je nepoužívat výsledky měření se S/N < 2, obrazy nebarvených biomakromolekul mívají často S/N < 0,1. Získaný obraz tedy obsahuje mnohem více šumu než signálu a pouhým okem je obtížné rozpoznat, jestli na obrázku naše molekula je nebo není. 13.4 Optika a rozlišení mikroskopů Jak jsme zmínili v části 13.1, elektronové vlny se v klasické (nekvantové) fyzice nevyskytují a je proto obtížné je popsat jednoduchým a intuitivním způsobem. Proto využijeme obecné podobnosti světelných a elektronových vln a vysvětlíme si principy a omezení optiky mikroskopu na příkladu viditelného světla procházejícího skleněnou čočkou. Navážeme přitom na část 10.5, kde jsme si ukázali, že rozkmitání elektronů skla procházející světelnou vlnou vede k opoždění této vlny (zkrácení vlnové délky při zachování frekvence), případně ke změně směru jejího šíření, zvané lom světla. Princip jednoduché čočky je ukázán na obrázku 13.2. Podívejme se nejdříve na to, jak se chová světlo letící z jediného bodu pozorovaného objektu. Za takový bod můžeme považovat třeba velmi malou bublinku vzduchu ve skle přesně ve středu hlavičky zeleného špendlíku na obrázku 13.2. Kulová vlna šířící se ze středu hlavičky narazí na různá místa čočky s různou fází. Z míst na povrchu čočky, kam vlna dopadla, se šíří zpomalená (zhuštěná) kulová vlna všemi směry, dokud nedospěje k protějšímu povrchu čočky. Z míst dopadů na tento povrch se pak šíří původní rychlostí všemi směry kulové vlny, z nichž čtyři je zakresleny na obrázku 13.2A. Zaostřený obraz středu hlavičky špendlíku vznikne tam, kde budou mít tyto vlny stejnou fázi (detail na obrázku 13.2B). Stejnou fázi budou mít tehdy, když na své cestě ze středu hlavičky do místa obrazu budou mít stejný počet maxim. To platí pro bod uprostřed čárkované kružnice napravo od čočky. Všechny čtyři zakreslené vlny se tam mají čtyřicáté první maximum od středu hlavičky (ve skutečném případě viditelného světla by ovšem šlo o statisíce vlnových délek). Například vlna, která prošla spodní částí čočky, měla delší cestu, ale pomalý úsek vedoucí čočkou byl kratší, než v případě vlny, která narazila na čočku ve vodorovném směru. Cestám, po kterých dorazí světlo do stejného místa se stejným počtem maxim, říkáme stejně dlouhé optické dráhy. Skutečný světelný mikroskop se skládá z většího počtu čoček. Podobně jako v elektronovém mikroskopu popsaném v části , kondenzorové čočky směřují světlo na vzorek a projektorové čočky obraz, nakreslený na obrázku 13.2A čárkovaně, dále zvětšují a promítají na detektor (je-li detektorem oko, říkáme těmto čočkám okulár). Analýza vln ukázaná na obrázku 13.2A je poněkud nepřehledná. Proto se obvykle zakreslují jen směry šíření vln, jak je ukázáno na obrázku 13.2C. Těmto směrům říkáme paprsky. Na obrázku 13.2C jsou znázorněny paprsky šířící se jak z hlavičky, tak ze špičky zeleného špendlíku. Jasně ukazují, že modrý obraz špendlíku je zvětšený. Kreslení paprsků místo vln sice obrázek zjednoduší, ale může vést 13.4. OPTIKA A ROZLIŠENÍ MIKROSKOPŮ 167 k falešným představám. Mohlo by se zdát, že soustavou čoček můžeme dosáhnout libovolného zvětšení jakkoli malého objektu. Ve zkutečnosti ale brzy narazíme na limit daný difrakcí, kterou paprsky ignorují. Limit rozlišení je definován pro bodový zdroj vlnění, například maličkou dírku v neprůsvitné fólii. Paprsky předpovídají, že záření procházející sebemenším kruhovým otvorem vytvoří při dopadu na plochu za otvorem jasnou skvrnu ve tvaru otvoru a ostře ohraničený stín všude jinde (obrázek 13.2C vlevo). Poctivá analýza šíření vln nás ale vede k jinému závěru. Za otvorem se šíří kulové vlny všemi směry, i mimo směr šíření. Proto na ploše nevznikne ostrý stín, ale skvrna s rozmazanými okraji, obklopená dalšími světelnými kroužky (obrázek 13.2C vpravo), zvané Airyho disky1. Světlo se ohýbá, míří za roh. Proč jsme si toho nevšimli u světla postupujícího roztokem molekul v části 10.5? Protože jsme zkoumali skládání vln tvořených v celé rovině kolmé na směr dopadající vlny. Z takové roviny sledujeme u běžných chemických vzorků (kyveta ve spektrofotometru) obrovskou plochu, milimetry nebo centimetry čtverečné ve srovnání s vlnovou délkou několik desetin mikrometru. V takových obrovských rozměrech ve směrech odchylujících se od původního paprsku téměř každou vlnu vyruší fázově posunutá vlna vzniklá o kus dál. Hraniční oblast, kde už žádné „o kus dál" není (kde například končí vzorek) je u typických vzorků zanedbatelně malá. V případě maličké dírky ale začíná být hraniční oblast srovnatelná s osvícenou plochou těsně za otvorem. Leckterá vlna šířící se z roviny dírky se nepotká s fázově posunutou vlnou, která by ji vyrušila. Vznik rozmazaného obrazu omezuje naši schopnost rozlišit dva malé objekty blízko sebe (obrázek 13.2C vpravo). Když jejich obrazy zvětšíme, zvětšíme je rozmazané a naše schopnost je rozlišit se tím nezlepší. Rozlišení ale můžeme zlepšit tím, že zvětšíme světelný kužel, který na čočku dopadá. Můžeme si to ukázat opět na obrazu špendlíku zvětšeného jednoduchou čočkou. Informace o poloze zdroje (na obrázku 13.2A střed hlavičky zeleného špendlíku) je zakódovaná v celé kulové vlně, která se ze zdroje šíří. Jak jsme si vysvětlili, zaostřený obraz vzniká tak, že se v určitém místě se stejnou fází skládají, a tedy výrazně zesílí, vlny pocházející z různých oblastí původní kulové vlny. Pokud na čočku dopadá velká část původní kulové vlny, skládá se velké množství vln z velmi různých směrů šíření původní vlny. Složená vlna má velmi intenzivní a úzké hlavní maximum, které velmi přesně lokalizuje polohu zdroje. Takové maximum snadno odlišíme od podobně intenzivního maxima složené vlny pocházející z jiného zdroje (například jiné bublinky v hlavičce špendlíku). Pokud ale na čočku dopadá jen úzký kužel kulové vlny šířící se ze zdroje, v místě zaostřeného obrazu se potkává se stejnou fází jen málo vln pocházejících z velmi podobných směrů původní kulové vlny. Složením těchto vln vzniká vlna s nevýrazným hlavním maximem a množstvím dalších maxim. Taková maxima ze dvou blízkých zdrojů bude obtížné rozlišit, budou splývat. Zjednodušeně je vliv šíře světelného kuželu na rozlišení znázorněn na obrázku 13.2E-G. Signál, který detektor zachytí, je zde znázorněn v zeleném rámečku. Pro pochopení rozložení intenzity záření v rovině detektoru je dobré si připomenout, že se vlny sčítají (konstruktivně interferují) nejen přesně v průsečíku modrých kružnic, znázorňujících jejich maxima na obrázku 13.2A,B, ale i v blízkosti tohoto průsečíku. Tam, kde se například setká maximum jedné vlny (oblast s E mířícím kladným směrem) s nulou jiné vlny (oblast s E = 0), výsledkem jejich sečtení je stále kladná vlna (s E mířícím kladným směrem), byť ne zesílená. Proto obraz zachycený detektorem není v našem případě obrazem středu hlavičky bod uprostřed čárkované kružnice, ale trochu rozmazaná oblast v okolí. Signál na detektoru má stejný profil jako světlo z bodového zdroje na obrázku 13.2C vpravo, s minimem přibližně ve dvou třetinách poloměru obrazu hlavičky a sekundárním maximem (odpovídajícím prvnímu Airyho kroužku) poblíž povrchu hlavičky. Pokud na našem zjednodušeném obrázku zúžíme clonou kužel světla dopadající na čočku, k tvorbě obrazu přispějí jen dvě prostřední vlny (obrázek 13.2G). V důsledku toho bude oblast, ve které se vlny sečtou, výrazně širší a minimum na detektoru bude již mimo povrch hlavičky (obrázek 13.2H). Hodnotu rozlišení můžeme definovat i přesně matematicky. Jako rozlišení r se udává taková vzdálenost dvou zdrojů, pro kterou hlavní maximum prvního zdroje leží v prvním minimu druhého zdroje a naopak. George B. Airy byl britský astronom, který původ kroužků vysvětlil. 168 KAPITOLA 13. ELEKTRONOVÁ MIKROSKOPIE Pokud tedy budeme pozorovat v hlavičce špendlíku na obrázku 13.2 dvě bublinky, jednu ve středu a druhou u povrchu hlavičky, bez clony je rozlišíme (obrázek 13.2F), ale se clonou již ne (obrázek 13.2H). Závislost rozlišení na velikosti světelného kužele se popisuje pomocí úhlu a mezi osou a pláštěm kuželové plochy. Protože pozorovaný kužel porovnáváme s délkou vlny v daném prostředí, je rozlišení úměrné A/n, kde A je vlnová délka ve vakuu a n je index lomu. Po započítání závislosti intenzity složené vlny na vzdálenosti od hlavního maxima lze rozlišení vypočítat r ^0,61 A . (13.1) n srna Tento vzoreček vysvětluje, proč lze ve světelné mikroskopii zvýšit rozlišení (tedy snížit hodnotu r) tak, že co nejširší čočku objektivu přiblížíme těsně ke vzorku (zvýšíme a) a mezi vzorek a objektiv kápneme imerzní olej s vysokým indexem lomu. Rozlišení také můžeme zvýšit použitím modrého světla, které má kratší vlnovou délku. Jak ale víme z kapitoly 12, k rozlišení atomů v molekulách bychom potřebovali světlo s vlnovou délkou blízkou velikostem atomů (řádově 0,1 nm), což je daleko za hranicí viditelné oblasti. V případě elektromagnetického záření jde o rentgenové záření, v případě elektronového záření o vlny tvořené elektrony. Je také dobré si uvědomit, že číslo r popisuje, jak blízké zdroje lze rozlišit, ne jak přesně lze lokalizovat polohu jednoho zdroje. Polohu (těžiště) je možné určit s přesností mnohem lepší než r i z rozmazaného signálu s Airyho disky, pokud je tento signál dost daleko od signálů jiných zdrojů. Ve světelné mikroskopii se intenzivně rozvíjejí metody superrozlišovací mikroskopie (superresolution microscopy) umožňující přesnější měření polohy zdroje, než by odpovídalo číslu r. Například je možné označit molekuly v buňce fluorescenční látkou a aktivovat jen malý počet takových fluoreskujících značek. Jednotlivé fluorescenční zdroje tak budou od sebe dostatečně daleko, abychom analyzovali zvlášť jednotlivé rozmazané signály a spočítali jejich těžiště s přesností lepší, než odpovídá číslu r. V elektronové mikroskopii jsme ale odkázáni na rozložení elektronové hustoty, které nás zajímá, a nemůžeme zpřesňovat určování poloh atomů nějakými značkami. Stejně tak nemůžeme zvyšovat index lomu prostředí, protože musíme pracovat ve vakuu. Tvar magnetického pole cívek, které používáme místo čoček, nás navíc nutí používat elektronové vlny jen ve velmi úzkém kuželu2. Jediný parametr, kterým můžeme zlepšit rozlišení, je vlnová délka. Naštěstí je možné připravit elektrony s kinetickou energií odpovídající vlnovým délkám jednotek pikometrů (tisícin nanometrů). Takovéto vlny jsou schopny rozlišit jednotlivé atomy, i když je sledujeme jen ve velmi úzkém kuželu. Navíc elektrony s vysokou energií lépe procházejí materiálem a při jejich použití jsme méně omezeni tloušťkou vzorku. 13.5 Příprava vzorků pro elektronovou mikroskopii Klasická elektronová mikroskopie je založena na metodách „barvení" vzorků atomy, které obsahují výrazně více elektronů, než převažující biogenní prvky. K pozitivnímu barvení se používají acetát uranylu, citrát olovnatý, oxid osmičelý a jiné soli těžkých kovů. Buněčné struktury, na které se těžké atomy vážou (například hydrofobní OSO4 se hromadí v membránách, jiné kovy interagují s proteiny) výrazně více pohlcují elektrony a pozorujeme je jako tmavá místa. Jinou možností je negativní barvení, kdy se například virové částice zalijí do tenké vrstvy barviva. Tam, kde se nacházejí virové částice, potom pozorujeme jasnější místa chybějícího barviva. Ke studiu velkých proteinů a zejména jejich komplexů byla používána metoda zvaná stínování (anglicky shadowing), při které byl na vzorek studovaných částic pod ostrým úhlem (například 4°) naprášen těžký kov a na tvar molekul se usuzovalo ze stínů protažených ve směru naprašování. Zmíněné klasické metody poskytly zásadní informace o detailech 2 Jde o obdobu fotografování s méně kvalitním objektivem. I s takovou optikou můžeme získat pěkné fotografie za dobrého osvětlení, které nám umožní použít vysoké číslo clonky. V tomto případě clona propouští do objektivu světlo jen v úzké oblasti blízko středu čočky, kde má nedokonalost optiky nejmenší vliv. 13.5. PŘÍPRAVA VZORKŮ PRO ELEKTRONOVOU MIKROSKOPII 169 Obrázek 13.2: Princip zvětšování obrazů pomocí čoček. A, vysvětlení na základě šíření vlny z bodového zdroje ve středu hlavičky zeleného špendlíku. Barva vln udává hodnotu E kmitající kolmo k rovině nákresu, barevná škála je ukázána nad obrázkem. B, zvětšené okolí obrazu. C, popis pomocí paprsků. D, tvorba obrazu s ostrým stínem vyplývající z popisu záření pomocí paprsků (vlevo), tvorba obrazu s rozmazaným stínem v důsledku difrakce (ohybu) záření na hraně otvoru (vpravo). E, rozložení druhé mocniny amplitudy (intenzity) složené vlny na stínítku detektoru umístěného kolmo k rovině nákresu. Rez detektorem je ukázán v zeleném rámečku, škála intenzit je uvedena nad obrázkem. F, detailní pohled na rozložení intenzity snímané detektorem v okolí obrazu. G, vliv zúžení kuželu světla clonou na zobrazení předmětu. H, rozložení intenzity snímané detektorem pro zobrazení předmětu ukázané na obrázku G. 170 KAPITOLA 13. ELEKTRONOVÁ MIKROSKOPIE buněčných struktur a tvarech velkých komplexů biomakromolekul, nedokázaly však rozlišit jednotlivé atomy. Molekuly látek používaných k barvení totiž vytvářejí shluky (clustery) a rozlišení je omezeno velikostí těchto clusterů. Nejlepší rozlišení makromolekul barvených těžkými atomy je 2nm, tedy o řád horší, než vzdálenosti atomů. Navíc jsou soli těžkých kovů toxické a poškozují strukturu studovaných biomakromolekul. Alternativou k barvení je kryoelektronová mikroskopie. Místo barvení vzorek zmrazíme tak rychle, že se voda nestačí uspořádat do krystalové mřížky ledu, ale vytvoří se amorfní led, který se velmi podobá struktuře tekuté vody. Krystalizaci ledu se vyhýbáme hlavně ze dvou důvodů. Při tvorbě krystalků ledu spojené s velkými objemovými změnami dochází k poškození makromolekul a difrakce elektronů na krystalové mřížce ledu značně komplikuje zobrazování molekul. Příprava vzorku pro kryoelektronovou mikroskopii je poměrně složitá. Povrch dodávaných sítek je hydrofobní, proto je třeba síťku před použitím opracovat v plasmovém výboji. Poté roztok biomakromo-lekuly naneseme na síťku. Nadbytek roztoku odstraníme přitisknutím filtračního papíru (blotting), takže na síťce zůstanou jen tenké skvrny roztoku (s tloušťkou kolem 100nm). K vlastnímu mražení dochází rychlým ponořením síťky do kapalného ethanu, podchlazeného v lázni kapalného dusíku. Ponořením přímo do kapalného dusíku by amorfní led nevznikl, protože teplota kaplného dusíku odpovídá jeho bodu varu. Na povrchu předmětu ponořeného do kapalného dusíku dochází k rychlému vypařování a vrstvička dusíkové páry izoluje předmět od chladné kapaliny a zpomaluje jeho ochlazování. Naopak ethan je v dusíkové lázni zchlazen hluboko pod bod varu a velmi rychle odebírá teplo z ponořené síťky. K vlastnímu manipulaci se síťkou se používá zařízení zvané vitrobot, přesto je celý postup náročný na zručnost. Ochlazené síťky se vzorky jsou uchovány v kapalném dusíku až do chvíle měření. Zvýšení teploty by vedlo k nežádoucímu překrystalování amorfního ledu. Také tubus mikroskopu a zařízení, kterým se vzorek do evakuovaného mikroskopu vkládá, musí být při kryoelektronové mikroskopii stále udržovány při nízké teplotě. Velkou výhodou elektronové mikroskopie je, že během rychlého zmražení se nemění ani struktura studované molekuly, ani struktura okolní vody. Biomakromolekuly tak můžeme studovat v nativním stavu. Protože molekuly nebarvíme a používáme TEM, získáváme informaci i o vnitřní struktuře biomakromolekul: snímané obrazy jsou projekce celého objemu molekuly. 13.6 Typy vzorků v elektronovou mikroskopii V kryoelektronové mikroskopii se používají různé typy vzorků. V počátcích rozvoje metody hrály důležitou roli vzorky makromolekul, které tvoří dvojrozměrné krystaly. Typickým příkladem jsou trans-membránové proteiny, které netvoří vhodné krystaly pro rentgenovou difrakci, ale některé z nich je možné připravit v membránách v tak vysoké hustotě, že vytvoří dvojrozměrný krystal. Metoda je vhodná pro menší proteiny (do 200 kDa) a poskytuje rozlišení srovnatelné s rentgenovou krystalografií (0,25 nm). Pro určování konformace biomakromolekul je nej důležitějším přístupem rekonstrukce jedné částice (single particle reconstruction). Tato metoda využívá toho, že v mnoha případech dokážeme připravit vzorky rekombinantních proteinů, které obsahují mnoho miliard molekul ve stejné konformaci. V elek-tronovovém mikroskopu tak můžeme nasnímat obrázky desetitisíců až statisíců molekul, se kterými můžeme pracovat, jako by to byly obrazy jedné molekuly v různých orientacích. Informaci z jednotlivých snímků můžeme zkombinovat a spočítat z ní trojrozměrnou distribuci elektronové hustoty v molekule studovaného proteinu. Metoda poskytuje nejlepší výsledky pro velké proteiny a je možné dosáhnout atomového rozlišení (i pod 0,1 nm). Pomocí kryoelektronové mikroskopie můžeme zkoumat i pleiomorfní objekty, z nichž žádné dva nemají stejnou strukturu. Jde například o buněčné organely, které se vždy na molekulární úrovni poněkud liší. Obrazy takových molekul nemůžeme průměrovat, ale musíme použít přístupu tomografie. Obrazy 13.7. TVORBA A ZPRACOVÁNÍ DIGITÁLNÍHO OBRAZU 171 objektu v různých orientacích získáváme tak, že v mikroskopu vzorek různě otáčíme a nakláníme. Z obrazů v různých orientacích můžeme zpět spočítat trojrozměrnou strukturu studovaného objektu. Výsledná struktura bude mít nezbytně omezené rozlišení. Jednak proto, že nemůžeme získat obrazy objektu ve všech orientacích (protože objekt je fyzicky vždy umístěn v nějakém držáku), ale také proto, že každý elektron objekt poškodí, takže máme jen omezený počet obrazů, které můžeme pro daný objekt získat. Poměr S/N je proto ještě nižší, než u snímků biomakromolekul. Pokud ale studovaný objekt obsahuje více kopií téže molekuly, můžeme průměrovat obrazy takové molekuly z různých částí vzorku a lokálně zlepšit rozlišení. V nejlepších případech je možné dosáhnout rozlišení okolo 0,4 nm. 13.7 Tvorba a zpracování digitálního obrazu V elektronové mikroskopii získáváme digitální obraz. Tato skutečnost může znít triviálně, ale pro práci s mikroskopem a získanými snímky je velmi důležitá. Snímky musí být digitální proto, abychom s nimi mohli pracovat v počítači a vypočítat z nich trojrozměrnou strukturu molekuly. Digitální obrazy se vždy skládají z velkého množství políček zvaných pixely. Digitální černobílá fotografie s napohled plynulými přechody mezi odstíny šedi je ve skutečnosti mozaika pixelů s různou intenzitou signálu. Maximální a minimální intenzita odpovídá černé a bílé barvě (nebo naopak). Digitální povaha obrazu vysvětluje, proč je výhodné používat kamery přímo detekující dopad elektronů, jak jsme zmínili v části 13.4. Tradičně se v elektronové mikroskopii používaly fotografické filmy, které jsou citlivé na dopad světla i elektronů. Nevýhodou filmů je, že obraz z nich musíme do digitální formy převádět skenováním. Novějším typem detektorů byly kamery využívající technologie CCD (coupled chargé device, integrované obvody propojených kondenzátoru citlivých na světlo). Nevýhoda CCD zařízení je, že nejsou přímo citlivá na elektrony. Proto bylo nutné použít vrstvičky scintilátoru (například krystalického materiálu zvaného yttrito-hlinitý granát, YAG), který po dopadu elektronu emituje fotony, které CCD detekoval. Scintilátor ale emitoval fotony i v jiných směrech, než směr dopadu elektronu, a tyto fotony aktivovaly sousední pixely CCD kamery. Proto docházelo k lokálnímu rozmazávání signálu. Velký pokrok pro elektronovou mikroskopii znamenaly polovodičové kamery schopné detekovat elektrony přímo. Elektronová vlna tak aktivuje přímo pixel, na který dopadla. Díky tomu může být přesněji lokalizována a struktury biomakromolekul můžeme počítat s lepším rozlišením. V počítači ukládáme digitální obraz jako seznam čísel, která popisují intenzity signálů jednotlivých pixelů. Pokud by se náš detektor skládal jen z 25 pixelů, mohl by zápis snímku na obrázku 13.3A vypadat takto Obrazí = (0; 0; 0; 0; 0; 0; 10; 10; 0; 0; 10; 5; 5; 10; 0; 10; 5; 5; 10; 0; 0; 10; 10; 0; 0). (13.2) Správně můžeme číst tento záznam jenom tehdy, když víme, kterému pixelu které číslo patří. Zápis 13.2 můžeme také vyjádřit jako lineární kombinaci 25 základních stavů detektoru (13.3) kde například P\2 označuje stav s jednotkovou intenzitou pixelu v první řadě a druhém sloupci a nulovou intenzitou všech ostatních pixelů (obrázek 13.3B). Snímek na obrázku 13.3A můžeme ale také zapsat jako lineární kombinaci 25 hypotetických stavů detektoru uvedených na obrázku 13.3C. Tyto stavy neodpovídají aktivaci jednotlivých pixelů, ale periodickým vzorům, vlnícím se v různých směrech s různou vlnovou délkou. Jednotlivé stavy ^hk nedefinuje poloha na detektoru, ale parametry h a k popisující kolikrát se periodický vzor zavlní ve vodorovném a svislém směru. 0 Pii H h 0 P12 H h 0 P13 H - 0 Pl4 - h 0 Pl5 0 P21 H h 10 P22 H h 10 P23 H - 0 P24 - h 0 p25 10 P31 H h 5 P32 H h 5 P33 H - 10 P34 - h 0 P35 10 P41 H h 5 P42 H h 5 P43 H - 10 P44 - h 0 P45 0 P51 H h 10 P52 H h 10 P53 H - 0 P54 - h 0 P55 172 KAPITOLA 13. ELEKTRONOVÁ MIKROSKOPIE Periodicky se opakujícími strukturami jsme se zabývali detailně v kapitole o rentgenové krystalografii (kapitola 12). Víme, že na vzdálenosti atomů v pravidelných krystalových mřížkách závisí směr, ve kterém se dramaticky zesílí rozptýlené rentgenové záření a tedy i místo na detektoru, kde pozorujeme difrakční skvrnu. Difrakci na krystalech tedy můžeme matematicky interpretovat následujícím způsobem. Elektronovou hustotu v krystalu si můžeme rozložit na součet periodických funkcí s různou vlnovou délkou. Každá z těchto funkcí odpovídá pravidelnému vzoru, který zesiluje rozptýlené rentgenové záření v jiném směru. Intenzita difrakčních skvrn v jednotlivých směrech nám přímo říká, jak moc která periodická funkce přispívá k celkovému rozložení elektronové hustoty. Při rozptylu záření fyzicky dochází k tomu, čemu se v matematice říká Fourierova analýza, rozklad nějaké matematické funkce na součet funkcí sinus a kosinus. Proto také je matematickým základem výpočtu rozložení elektronové hustoty Fourierova transformace difrakčního obrazce. Proč ale rozkládat na periodické funkce obrazy molekul, které nejsou umístěny v pravidelných krystalových mřížkách? Každý detektor se skládá z konečného počtu N pixelů. Informace, kterou digitální obraz nese, je tedy vždy kombinací N stavů detektoru, ať už jde o jednopixelové stavy Pxy z obrázku 13.3B, nebo periodické stavy ^hk z obrázku 13.3C. I když je obraz na detektoru nepravidelný, lze jej beze zbytku převést na kombinaci pravidelných vzorů ^hk- Počítač přitom dělá to, k čemu fyzicky dochází v difrakčním experimentu, tedy Fourierovu analýzu. Parametry h a k přitom hrají stejnou roli, jako Millerovy indexy v rentgenové krystalografii. Stejně jako Millerovy indexy definují polohu skvrn v difrakčním obrazci rentgenového záření, můžeme periodické vzory ^hk graficky znázornit jako body o souřadnicích h, k. Matematický postup, kterým ze závislosti intenzity na souřadnicích x, y spočítáme závislost na souřadnicích h, k, není opět nic jiného, než Fourierova transformace. Intenzita v místě souřadnic h, k v grafu získaném Fourierovou transformací nám říká, jak moc přispívá k původnímu obrazu periodický tvar, který má ve vodorovném směru h maxim a minim a ve svislém směru k maxim a minim. Při zpracování obrazů je velkou výhodou, že můžeme ze závislosti na x,y spočítat závislost na h, k a naopak. Digitální povaha obrazu zaručuje, že veškerou informaci zachycenou v obraze můžeme vyjádřit pomocí konečného počtu periodických vzorů. Tento konečný počet ale zároveň omezuje rozlišení, kterého lze dosáhnout. Nejrychlejší změna periodického vzoru, kterou může detektor zachytit, je taková, kdy se maxima a minima střídají v sousedních pixelech (Nyquistův zákon). Maximální hodnota h a k je proto rovna polovině počtu pixelů ve vodorovném a svislém směru. Pokud obraz obsahuje vzor s vyšším počtem maxim, uvidíme v obraze zvlnění, které ve skutečnosti neexistuje. Zjednodušeně je to znázorněno na obrázku 13.3D, kde je znázorněn detektor s osmi pixely ve každém směru. Maximální (Nyquistova) frekvence, kterou takový detektor může rozlišit, je 8/2 = 4. Na tento detektor promítáme vzor, ve kterém se ve skutečnosti vystřídá šest tmavých a šest světlých proužků na šíři detektoru. Když si spočítáme, jakou průměrnou intenzitu detekují jednotlivé pixely, zjistíme, že místo vzoru se správným počtem maxim (šest ve vodorovném směru) vidí detektor fiktivní obrazec procházející dvěma maximy. V běžném životě můžeme vidět tento efekt v televizi, pokud v ní vystupuje osoba s jemnějším vzorem oděvu, než odpovídá rozlišení obrazovky. Popsané omezení digitálního rozlišení nás vede k tomu, abychom pečlivě zvážili, jaké zvětšení mikroskopu můžeme pro detektor s daným počtem pixelů použít. Pokud chceme například popsat strukturu s rozlišením 0,2 nm, musí jeden pixel dopadat vlna z oblasti maximálně 0,1 nm. 13.8 Amplitudový a fázový kontrast Poměr signálu a šumu (S/N) v obrazech získaných elektronovým, ale i světelným, mikroskopem závisí na kontrastu mezi vlnou dopadající na detektor přímo a vlnou ovlivněnou vzorkem. Vzorek ovlivňuje vlnu dvěma způsoby. Prvním z nich je amplitudový kontrast způsobený částečným pohlcením vlny vzorkem. Velký amplitudový kontrast mají vzorky „barvené" těžkými atomy. Druhým typem vlivu vzorku je fázový kontrast. Při průchodu vlny vzorkem dochází k jejímu opoždění, které popisujeme 13.8. AMPLITUDOVÝ A FAZOVY KONTRAST 173 B 1,2 1,3 1,4 1,5 2,3 2,4 2,5 3,1 3,2 3,3 3,4 3,5 5,1 5,2 5,3 D |.| ■ III ■ ■ ■■■■■ ir II11|■ ■ ■ II ■ ■ IL III I III 11 ii/ vr/* — T),-2 T),2 T),-2 T),2 %,2 %*2 ffli li/ ii/* _ li/ T),0 T),0 T),0 li/ _ii/ vrz* __ii/* T),-2 T),2 T),-2 T),2 Xs. ""l""Xv x xh.. x ^ v x 'lx x x x ■ x x k. x x " x x ■ x x 1,2 1,2 m i n ^,0 ^0 H M T M M s x ■ ✓ y vr/ vr/* vr/ vr/* 1,-2 1,-2 ^2,-2 ^2,-2 II Fourierova transformace ^ ,2 ^í*2 ^,2 ^*2 ^ Ti I ^ -2 ^*-2 \-2 ^-2 Obrázek 13.3: Vlastnosti digitálního obrazu. Na obrázku A je příklad obrazu na detektoru skládajícím se z 5 x 5 pixelů. Jakýkoli obraz na tomto detektoru je lineární kombinací 25 možných stavů detektoru znázorněných na obrázku B. Zároveň ale jakýkoli obraz na tomto detektoru je také lineární kombinací periodických vzorů na obrázku C. Podle Nyquistova zákona může mít periodický vzor nejvýš dvě minima a maxima v každém směru. Abychom byli schopni vyjádřit pomocí periodických vzorů každý digitální obraz, musíme vzít v potaz vlnění směřující vzhůru i dolů (směr rozlišujeme znaménkem indexu fc) a vlnění s různou fází (například kosinus a sinus, který od kosinu rozlišujeme hvězdičkou v označení vzoru). Kombinací 3 vodorovných frekvencí (h = 0; 1; 2), 5 svislých frekvencí (fc = —2;—1;0;1;2) a 2 fází bychom získali 30 vzorů, 5 se jich ale opakuje dvakrát (na obrázku C jsou vyznačeny červeně). Nezávislých vzorů je tedy 25, jak potřebujeme pro 25 pixelů. Zahrnutí záporných hodnot h (vlny postupující doleva) by vedlo jen k opakování již zahrnutých vzorů. V dolní části obrázku C je ukázáno, že Fourierovou transformací periodických vzorů získáme závislost na vlnočtech vzorů, která připomíná jednopixelové diagramy na obrázku B. V našem ilustrativním obrázku označuje červená barva zápornou hodnotu poskytnutou Fourierovou transformací. Při analýze obrazu ale většinou vynášíme absolutní hodnotu (nerozlišujeme fázi). Na obrázku D je ilustrován Nyquistův zákon (popsáno v textu). 174 KAPITOLA 13. ELEKTRONOVÁ MIKROSKOPIE hodnotou indexu lomu. Proto má vlna, která prošla vzorkem, posunutou fázi vůči vlně, která vzorkem neprošla. Rozdíl v intenzitě (amplitudě) vlny přitom může být nepatrný. Převážně fázový kontrast mají vzorky biomakromolekul, jejichž strukturu určujeme pomocí kryoelektronové mikroskopie. Příkladem ze světelné mikroskopie mohou být střípky skla ve vodě nebo průsvitné buňky neobsahující významné množství pigmentu. Pokud na takové vzorky zaostříme, jsou ve světelném mikroskopu velmi špatně viditelné. K zobrazování takových vzorků jsou používány speciální fázově kontrastní mikroskopy. Pokud takové zařízení nevlastníme, můžeme zlepšit kontrast tím, že zaostříme mírně pod sledovaný objekt. Okraje buněk či střípků, kde se setkávají prostředí s různým indexem lomu, jsou při podostření mnohem lépe viditelné. Princip podostření je zjednodušeně představen na obrázku 13.4. Obraz předmětu je zvětšen optickou soustavou (znázorněnou na obrázku jako jediná čočka). V místě zaostření obrazu se sčítají se stejnou fází vlny přicházející různými cestami z pozorovaného předmětu, jak jsme si ukázali na obrázku 13.2. Pokud vzorek absorbuje záření (případ a na obrázku 13.4), je amplituda vlny prošlé vzorkem (na obrázku 13.4 znázorněna tmavě zeleně) výrazně nižší, než vlna vzorkem neovlivněná. Amplitudový kontrast, symbolicky znázorněn rozdílnou velikostí zelených elips v horní části obrázku, je významný. Pokud ale vzorek neabsorbuje (případ b na obrázku 13.4), skládá se vlna prošlá vzorkem s původní vlnou tak, že se amplituda výsledné vlny liší od amplitudy původní vlny jen zanedbatelně a kontrast mezi nimi je zanedbatelný. Jak jsme vysvětlili v kapitole 10 (část 10.3 a 10.5), je tomu tak proto, že vlna vzniklá rozkmitáním molekul vzorku je oproti dopadající vlně fázově opožděna o 90 ° a má mnohem menší amplitudu. Situace se ale změní, pokud nebude obraz zaostřen v důsledku sférické aberace3 nebo proto, že detektor úmyslně posuneme z roviny zaostřeného obrazu (defocus). V tom případě se v určitém pixelu detektoru setkají vlny s rozdílnou fází, které se částečně odečtou. Tak vznikne fázový kontrast, ať už vzorek záření pohlcoval (případ c na obrázku 13.4), nebo ne (případ d). Podostření (underfocus) používáme i v kryoelektronové mikroskopii. Pokud je elektronový mikroskop zaostřen, vznikne v určité rovině pod objektivovou čočkou zaostřený obraz vzorku, který další soustava čoček zvětší a promítne na detektor. Jestliže není vlna vzorkem pohlcována více, než okolím (molekulami vody v amorfním ledu), nepozorujeme na detektoru žádný signál. Když ale mírně snížíme proud v objektivové čočce, zaostřený obraz vznikne v jiné rovině, dále od objektivové čočky. Na detektor bude ale stále promítána složená vlna z původní roviny, ve které není obraz zaostřený. Díky rozostření a značné sférické aberaci elektromagnetických čoček dochází k fázovému kontrastu mezi vlnou ovlivněnou a neovlivněnou vzorkem. Chceme-li získat kvalitní data pro výpočet struktur, musíme vzniku fázového kontrastu rozumět kvantitativně. Využijeme opět analogii se světelnou vlnou. V části 10.3 jsme zmínili, že světelná vlna rozptýlená molekulami bývá fázově opožděná o 90 ° oproti dopadající vlně. Jak víme z části 13.4, v místě zaostřeného obrazu má světelný vlna stejnou fázi, jako když opouští objekt. Mimo zaostřený obraz ale není vlna ovlivněná molekulami ve vzorku posunuta vůči vlně původní o 90 °. V závislosti na délce optické dráhy mají vlny rozptýlené vzorkem do různých směrů (a ohnuté čočkami zpět na detektor) fázové posuny v celém rozsahu 0°-360°. Vlny posunuté o 180° při skládání s neovlivněnou vlnou její amplitudu snižují a vytvářejí tak negativní fázový kontrast. Naopak vlny s nulovým fázovým rozdílem amplitudu původní vlny zvyšují a vedou k pozitivnímu fázovému kontrastu. Pro kvantitativní popis je výhodné využít toho, že díky Fourierově transformaci umíme obraz popsat pomocí souřadnic h a k. Na těchto souřadnicích závisí kontrast jednoduchým způsobem: v soustředných kruzích kolem počátku (h = k = 0) osciluje mezi hodnotami +1 a —1 (obrázek 13.5). Tato závislost se nazývá funkce přenosu kontrastu (contrast transfer function, CTF)4. Pro vyhodnocení vlivu podostření na získaný obraz stačí převést Fourierovou transformací obraz do souřadnic h, k, vynásobit funkcí přenosu 3Sférické aberace je optická vada, kdy se světelné paprsky na okraji čočky lámou víc, než poblíž optické osy. 4Matematicky lze popsat oscilace funkcí sin(-7rCsA3fc4/2 — TľAzXk2), kde Cs je koeficient popisující vliv sférické aberace a Az udává, o kolik mikrometrů je obraz podostřen (defocus). Amplituda oscilací navíc s rostoucím k klesá. 13.8. AMPLITUDOVÝ A FÁZOVÝ KONTRAST 175 Obrázek 13.4: Rozdíl mezi amplitudovým a fázovým kontrastem. Vlevo je znázorněna tvorba zaostřeného obraz, vpravo obrazu rozostřeného a ovlivněného sférickou aberací čočky. Na obrázcích a,c je srovnána intenzita světla letícího mimo objekt (světle zeleně vlevo) s intenzitou ovlivněnou průchodem objektem s amplitudovým kontrastem (tmavě zeleně vpravo). Na obrázcích b,d je srovnána intenzita světla letícího mimo objekt (světle zeleně vlevo) s intenzitou ovlivněnou průchodem objektem s amplitudovým kontrastem (tmavě zeleně vpravo). Intenzita záření dopadajícího na detektor je znázorněna velikostí zelené elipsy v horní části. 176 KAPITOLA 13. ELEKTRONOVÁ MIKROSKOPIE kontrastu, a výsledek převést Fourierovou transformací zpět do souřadnic x, y. Skutečnost, že funkce přenosu kontrastu osciluje mezi kladnými a zápornými hodnotami, má na výsledný obraz zásadní vliv. Tvar zobrazeného objektu je sice zachován, ale získaná intenzita neodpovídá elektronové hustotě. Tmavé oblasti obrazu jsou někde zobrazeny světle a naopak (obrázek 13.5A). Částečně lze tento nedostatek odstranit tak, že se obraz převede do souřadnic h, k, v oblastech, kde je násoben zápornou funkcí přenosu kontrastu, změníme znaménko (provedeme inverzi kontrastu) a po Fourierově transformaci zpět do souřadnic x,y získáme obraz podobnější skutečné elektronové hustotě (obrázek 13.5B). Neodstraníme tak ale zásadní problém, že CTF prochází nulou a pro určité hodnoty h, k tak ztratíme signál. Tento nedostatek řešíme tak, že snímáme obrazy studovaných biomakromolekul s různou hodnotou podostření (obrázek 13.5B,C). To vede k tomu, že v různých obrazech má CTF různé polohy bodů, kde prochází nulou. Jednotlivé obrazy pak zkombinujeme a tak doplníme oblasti nulového signálu signálem z jiných obrazů (obrázek 13.5D). Tímto způsobem získáme informaci v celém rozsahu h,k, abychom mohli provést rekonstrukci struktury studované biomakromolekuly. 13.9 Poškození vzorku Navzdory chlazení na velmi nízkou teplotu dochází při kryoelektronové mikroskopii k významnému poškození vzorku. Na 1 nm2 dopadají stovky až tisíce elektronu a ne všechny interagují se vzorkem elasticky (bez přenosu energie). Některé elektrony předávají vzorku energii, což vede k jeho poškození. Při delším osvitu se v ledu začínají tvořit bubliny, čemuž je třeba zabránit. Proto se snažíme dávku elektronů omezit na minimum. Například není možné zaostřit mikroskop na oblast našeho zájmu, protože již tím bychom vzorek zničili. Ostříme zpravidla na místa v okolí oblasti zájmu a předpokládáme, že průměr nastavených hodnot bude odpovídat zaostření na místo uprostřed. Naštěstí současné mikroskopy dokáží zaostřit a nasbírat data automaticky. Omezený počet elektronů, který může na vzorek dopadnout, je také hlavní příčinou nízkého poměru signálu k šumu. 13.10 Porovnávání dvojrozměrných obrazů Abychom vylepšili velmi nízký poměr signálu k šumu, snažíme se nasnímat velké množství obrazů s molekulami, jejichž strukturu chceme určit. Velmi zjednodušený příklad je ukázán na obrázku 13.6, kde se hypotetický detektor skládá jen z 1 280 pixelů (ve skutečnosti jde o miliony pixelů). Pro přehlednost je na obrázku velmi vysoký poměr signálu k šumu (přibližně 4), ve skutečnosti bývá poměr o jeden až dva řády horší. Ze snímků je třeba vyříznout obrázky jednotlivých molekul (modré rámečky v pravé polovině obrázku 13.6), jednotlivé obrázky mezi sebou porovnáváme, zjišťujeme, které jsou si nejvíce podobné, abychom je mohli zprůměrovat. Průměrováním snížíme náhodný šum a získáme obrázky, které mají lepší kontrast. K porovnávání obrázku můžeme použít analýzu hlavních komponent (principál component analy-sis, PC A). Jde o přístup, kterým je možné automaticky identifikovat skupiny obrázků, které jsou si podobné. Teoreticky bychom mohli porovnávat intenzitu každého pixelu v každém modrém rámečku na obrázku 13.6 se všemi pixely všech ostatních rámečků. Z matematického pohledu by to znamenalo vynést intenzitu každého pixelu na jinou osu mnohorozměrného grafu (pro rámečky na obrázku 13.6 bychom pracovali v 64-rozměrném prostoru, protože každý rámeček má pixelů 64). Každému rámečku by pak odpovídal jeden polohový vektor v 64-rozměrném prostoru a my bychom hledali, které vektory jsou si nejpodobnější (nacházejí se nejblíž sobě). Takové srovnání by ale bylo příliš výpočetně náročné. Metoda PCA vychází z předpokladu, že určité kombinace intenzit jsou pro jednotlivé tvary typické. Tyto kombinace pak hledá a použije je jako nové osy v jiném mnohorozměrném prostoru. Zjednodušení 13.10. POROVNÁVÁNÍ DVOJROZMĚRNÝCH OBRAZŮ 177 a b c d e Obrázek 13.5: Vliv funkce přenosu kontrastu na snímané obrazy. Pokud by měl pozorovaný objekt velký amplitudový kontrast, pozorovali bychom obraz ukázaný ve sloupci a. Protože ale musíme pracovat s fázovým kontrastem a použít podostření, získáváme obraz ukázaný ve sloupci e. Fourierova transformace toho obrazu (sloupec ď) je součinem Fourierovy transformace obrazu ze sloupce a, ukázané ve sloupci b a funkce přenosu kontrastu (CTF), ukázané ve sloupci c. Šipky na obrázku označují Fourierovu transformaci, tečka mezi sloupci 6 a c násobení. A, intenzita ovlivněna neupravenou CTF, oscilující mezi kladnými (modrá barva) a zápornými (červená barva) hodnotami, nulová hodnota Fourierovy transformace odpovídá šedé barvě. B, provedena inverze kontrastu. CTF nabývá jen kladných hodnot, znázorněných odstíny šedi. Nulová hodnota Fourierovy transformace odpovídá bílé barvě. C, jako B, ale obraz byl snímán s jiným podostřením. D, kombinace (průměr) předchozích dvou měření. CTF ve sloupci e je průměrem funkcí na předchozích dvou řádcích a neprochází (krom počátku) nulou. 178 KAPITOLA 13. ELEKTRONOVÁ MIKROSKOPIE ETIÖ m n Obrázek 13.6: Identifikace obrázků studované molekuly ve snímku elektronové mikroskopie. Vlevo zjednodušený příklad snímku, vpravo tentýž snímek s vyříznutými obrázky (modré rámečky) je v tom, že stačí porovnat menší počet skutečně nej typičtějších kombinací a nemusíme ztrácet čas porovnáváním každého pixelu s každým. Velmi jednoduchý příklad je ukázán na obrázku 13.7 pro kombinace pouhých dvou pixelů. 13.11 Rekonstrukce trojrozměrné struktury biomakromolekul Naším konečným cílem je určit trojrozměrnou strukturu. Základním problémem našeho úkolu je, že jednotlivé obrázky představují průměty molekul v různých orientacích, ve kterých se nacházely v roztoku těsně před rychlým zmrazením. Je na nás, abychom zjistili, jak jednotlivé projekce vůči sobě zorientovat, abychom z dvojrozměrných průmětů mohli rekonstruovat trojrozměrnou strukturu. Z matematického pohledu jde vlastně o hledání tří úhlů. Dva úhly určují směr, ze kterého se na molekulu (nebo přesněji skrz molekulu) díváme (směr, kterým míří červené, modré a tmavě zelené šipky na obrázku 13.8A). Dva průměty ze stejného směru mohou být vůči sobě pootočené v rovině snímku. Takové vzájemné pootočení popisuje třetí úhel. Tento třetí úhel odpovídá rotaci kolem směru červené, modré, nebo tmavě zelené šipky na obrázku 13.8A5 Rekonstrukce trojrozměrné struktury představuje sérii postupných kroků, ve kterých hledáme správné orientace projekcí. V počátcích jde o proces značně zatížený náhodnými chybami, kdy doufáme, že první odhady tvaru molekuly se alespoň trochu podobají skutečné struktuře a že postupné zpřesňování nás nakonec ke správné struktuře dovede. Obecný postup je shrnut na obrázku 13.9. Vycházíme z velkého počtu obrázků vyříznutých ze snímků vzorku (šipka a), pro něž hledáme správnou orientaci vůči molekule (šipky b-d). Obrázky, které jsou projekcemi molekuly ze stejného směru, vzájemně posuneme a natočíme v rovině snímku, abychom je mohli přeložit (alignment, šipka b). Potřebná posunutí (translace) a natočení (rotace) ukazují světle 5Když použijeme analogie s fotografováním, tak dva úhly určují směr, ze kterého nás fotograf fotil (směr přímky v prostoru je popsán dvěma úhly), a třetí úhel říká, jestli fotograf držel fotoaparát rovně, nebo šikmo (v druhém případě budeme na fotografii vidět svou postavu nakloněnou). 13.11. REKONSTRUKCE TROJROZMĚRNÉ STRUKTURY BIOMAKROMOLEKUL 179 F51 3 ô--... □ m □ cm cm ■ 1 o 0 / o 6> Obrázek 13.7: Princip analýzy hlavních komponent (PCA). Do grafu jsou vyneseny intenzity dvojic pixelů vyznačených na obrázku vlevo (purpurový a azurový rámeček spojený zelenou šipkou). Dvojice intenzit s 25% šumem vytvoří tři shluky bodů, které jsou rozlišeny barvou a odpovídají třem různým projekcím molekuly (projekce bez šumu jsou ukázány vpravo). Čárkované šipky představují kombinace intenzit {hlavní komponenty), které nejlépe rozliší shluky. Ukázaný příklad je zjednodušením, které lze ukázat na grafu. Ve skutečnosti bychom hledali hlavní komponenty v 64-rozměrném prostoru intenzit všech pixelů. zelené šipky uvnitř obrázků. Posunutí a natočení můžeme určovat vzhledem nějakému referenčnímu obrazu, nebo bez vnější reference (například vzhledem k prvnímu vyříznutému obrázku). Obrázky porovnáváme (2D classification, viz část 13.10) a z těch, které odpovídají stejným úhlům projekce (stejná barva rámečku) počítáme průměrný obraz s lepším poměrem signálu k šumu (class averaging, šipka c). Srovnání s referenčními obrazy se známými úhly projekce zvyšuje správnost třídění obrázků podle úhlů projekce. Zprůměrovaným obrázkům přiřadíme úhly projekce (angle assignment, šipka d). Jako úhly projekce (směry červených, zelených a modrých šipek pro jednotlivé zprůměrované obrazy) použijeme známé hodnoty pro referenční průměty. Pokud začínáme bez vnější reference, použijeme hodnoty náhodné. Z průmětů, které jsme orientovali v prostoru, zpětně vypočítáme tvar molekuly (3D reconstruction, šipka e). Zprůměrované a zorientované obrazy (na obrázku čtverečky orámované červeně, zeleně a modře) můžeme považovat za stíny molekuly (obrázek 13.8A). Tvar molekuly můžeme spočítat jako oblast v prostoru, kde se protínají směry, ve kterých jsou stíny vrhány (obrázek 13.8B). Často ale provádíme rekonstrukci v reciprokém prostoru (obrázek 13.8C). Získaný model molekuly použijeme k tomu, že vypočítáme jeho projekce do různých směrů (re-projection, šipka f). Takto získané projekce můžeme použít jako referenční obrazy v dalším kole výpočtů (šipka h). Do každého dalšího kola tak vstupují projekce z více a více zpřesněného modelu molekuly, které srovnáváme se stále stejnými nasnímanými obrázky. Celý postup opakujeme tak dlouho, dokud dochází k zpřesňování modelu. Výsledkem (šipka g) je mapa elektronové hustoty, velmi podobná výsledku rentgenové krystalografie. Do této mapy potom stavíme model molekuly a ověřujeme jeho správnost, tak jak jsme popsali v kapitole 12. V popsaném iterativním postupu je kritické první kolo, kdy zatím nemáme k dispozici žádné projekce z modelu vypočítaného v předchozím kole (šipka h). Kdyby měly nasnímané obrázky molekul vysoký poměr signálu k šumu, bylo by nejobjektivnější vypočítat počáteční model struktury na základě teorie Fourierovy transformace (šipka i). Základní myšlenka je následující. Fourierovou transformací jednot- 180 KAPITOLA 13. ELEKTRONOVÁ MIKROSKOPIE livých obrázků získáme řezy trojrozměrné Fourierovy transformace tvaru molekuly (obrázek C). Teorie Fourierovy transformace navíc říká, že jde o řezy procházející středem obrazu v reciprokém prostoru. To už je dost geometrických údajů na to, abychom dokázali spočítat, jak se různé řezy se v reciprokém prostoru protínají. Pak už stačí následovat postup ukázaný v dolní části obrázku 13.8C a spočítat tvar molekuly. Velký šum ve snímcích získaných kryoelektronovou mikroskopií bohužel zatěžuje tuto elegantní metodu velkou náhodnou chybou. Proto se v praxi používají a jsou dále intenzivně vyvíjeny výpočetní i experimentální postupy poskytující spolehlivější počáteční model pro rekonstrukci. Celý postup značně urychlí, když začínáme již s přibližnou znalostí tvaru molekuly (na základě dat s malým rozlišením, podobnosti s jinými molekulami a podobně, šipka j na obrázku 13.9). Rekonstrukci je možné zahájit dokonce i s obecným tvarem jako koule, válec, atd. Všechny tyto přístupy založené na subjektivní volbě startovního modelu ale nesou riziko, že nás naše volba zavede špatným směrem. Pokud budeme počítač nutit, aby ve snímcích nacházel rysy shodné s počátečním modelem, počítač je tam najde, i kdyby snímky obsahovaly čistý šum. Získaný počáteční model použijeme k tomu, že vypočítáme jeho projekce do různých směrů (šipka k), a použijeme je jako referenční obrazy v prvním kole (šipka k). 13.11. REKONSTRUKCE TROJROZMĚRNÉ STRUKTURY BIOMAKROMOLEKUL 181 Obrázek 13.8: Rekonstrukce trojrozměrné struktury z projekcí se známou orientací. A, jednotlivé projekce (barevně orámované čtverečky) si můžeme představit jako stíny molekuly vrhané do určitých směrů (barevné šipky). B, rekonstrukci tvaru molekuly můžeme provést tak, že každý 2D obraz (stín) zpětně promítneme do směru, odkud přichází. C, rekonstrukce v reciprokém prostoru. Pokud známe tvar objektu (například rozložení elektronové hustoty v molekule) ve skutečném trojrozměrném prostoru popsaném souřadnicemi x, y, z, můžeme vždy díky Fourierově transformaci popsat tento objekt v reciprokém prostoru, kde hrají roli souřadnic Mille-rových indexy h,k,l. Stejně dobře můžeme Fourierovou transformací popis objektu vyjádřený v souřadnicích h, k, l přepsat zpátky do reálného tvaru definovaného pomocí souřadnic x, y, z. Pokud navíc máme velký počet různých dvojrozměrných projekcí objektu, můžeme je také Fourierovou transformací přepočítat do obrazů popsaných souřadnicemi h, k a zase zpět. Přitom platí, že každý obraz projekce v souřadnicích h, k představuje jednu rovinu z popisu objektu v trojrozměrném reciprokém prostoru h, k, l. Navíc víme, že každá z těchto ploch prochází středem souřadné soustavy h, k, l. Proto je možné Fourierovy transformace jednotlivých průmětů použít jako řezy trojrozměrné Fourierovy transformace tvaru molekuly a chybějící body v prostoru souřadnic h, k, l odhadnout interpolací. Chyba interpolace bude tím menší, čím více různých průmětů použijeme. Ze získaného objektu v reciprokém prostoru pak tvar molekuly spočítáme zpětnou 3D Fourierovou transformací. 182 KAPITOLA 13. ELEKTRONOVÁ MIKROSKOPIE Obrázek 13.9: Obecný postup rekonstrukce trojrozměrné struktury z dvojrozměrných snímků. Kapitola 14 Nukleární magnetická rezonance 14.1 Jádra atomů jako strukturní sondy V předchozích dvou kapitolách jsme si popsali dvě základní metody strukturní analýzy biomakromo-lekul s atomovým rozlišením: rentgenovou krystalografii a elektronovou mikroskopii. Obě metody se musí v současné době vypořádat se skutečností, že stávající přístroje nemají dostatečnou citlivost pro pozorování jednotlivých molekul. V případě rentgenové krystalografie se dostatečné citlivosti dosahuje tím, že k difrakci dochází na obrovském množství molekul pravidelně uspořádaných v krystalové mřížce. Kryo-elektronová mikroskopie nevyžaduje uspořádání do pravidelných krystalových mřížek, ale pro rekonstrukci struktury průměrujeme obrazy velkého množství molekul zamrzlých v amorfním ledu. Oba přístupy jsou přitom založeny na předpokladu, že každá molekula zkoumané biomakromolekuly se vyskytuje ve stejné konformaci, nebo v malém počtu různých konformací. V této kapitole si popíšeme jiný přístup, umožňující popis (skoro) všech atomů v molekulách, které nejsou uspořádány do pravidelných krystalových mřížek a dokonce nemusí mít ani stejnou celkovou strukturu. Pokud chceme získat detailní informaci o struktuře takových molekul, je vhodné použít sondy (značky) umístěné poblíž atomů, které chceme sledovat. Příkladem takové značky může být fluorescenční molekula specificky navázaná na protein. Nevýhodou fluorescenční značky ale je, že její navázání je dosti velký zásah do struktury molekuly. Hrozí tak, že nebudeme zkoumat přirozenou konformaci biomakromolekuly, ale konformaci ovlivněnou přítomností značky. Navíc máme jen omezený počet míst v biomakromolekule, kam můžeme značku specificky navázat. Existují ale značky, které strukturu biomolekuly neovlivní vůbec, protože jsou v ní už přítomny. Jde o atomy vodíku (přesněji o jádra nejběžnějšího isotopu vodíku 1H neboli protony). Tyto atomy představují magnetické sondy, hustě rozmístěné v celé biomakromolekule. K tomu, abychom takovou sondu mohli využít ke studiu struktury biomakromolekuly, potřebujeme tři věci: 1. Něco, co se dá měřit. V případě magnetické sondy je to její magnetické pole. V části 14.3 uvidíme, že měříme frekvenci, se kterou se magnetické pole protonu mění uvnitř silného magnetu. Proto se metoda, o které mluvíme, nazývá nukleární magnetická rezonance (NMR): sledujeme rezonanci s frekvencí jaderných (nukleárních) magnetických polí. 2. Rozlišení. Měřená vlastnost sond musí mít v různých místech biomolekuly různou hodnotu, abychom rozeznali, kterou sondu sledujeme. Různou hodnotu měřené frekvence nám zajistí elektronové obaly, které v molekulách stíní (pozměňují) účinky silného magnetu, ve kterém je vzorek umístěn. V části 14.7 si ukážeme, že jádra vodíků v různých místech biomakromolekuly jsou obklopena jinak rozloženými elektrony. Stínění vnějšího silného magnetu se proto v okolí různých jader vodíku liší. V důsledku toho mají magnetická pole jednotlivých jader vodíku odlišné frekvence. 183 184 KAPITOLA 14. NUKLEÁRNÍ MAGNETICKÁ REZONANCE Obrázek 14.1: Námořník na neznámém ostrově s jeho obyvateli. 3. Vztah ke struktuře. Musíme být schopni měřit veličinu, která známým způsobem závisí na struktuře biomakromolekuly. Takových veličin je více, v této části si popíšeme využití vlivu vzájemného působeni magnetických polí různých vodíků, jehož důsledkem je takzvaný nukleární Ovehauserův jev. O tomto jevu si řekneme více v části 14.8. Aniž bychom se zatím snažili pochopit fyzikální podstatu vzájemného působení magnetických polí jader vodíku, zkusíme se zamyslet nad tím, jak lze tohoto působení využít. Jediné, co budeme potřebovat vědět, je skutečnost, že se vrůstající vzdáleností síla vzájemného působení klesá. Tak jako klesá síla signálu dvou krátkovlnných vysílaček s tím, jak se od sebe vzdalují osoby, které spolu pomocí vysílaček hovoří. Zkusme si nejdříve převést úkol určování struktury biomakromolekuly do lidsky představitelných rozměrů. Předpokládejme, že místo sestavení trojrozměrného modelu molekuly chceme nakreslit dvojrozměrnou mapu ostrova (jako námořník na obrázku 14.1). K tomu potřebujeme proměřit vzdálenosti jednotlivých významných bodů ostrova (vrcholků kopců, konců zálivů a mysů). Představme si, že máme k dispozici čtyři krátkovlnné vysílačky, odborně občanské radiostanice PMR446 (Personál Mobile Rádio 446 MHz). Jak odborný název napovídá, vysílačky lze naladit v pásmu 446 MHz, což je mimochodem blízko frekvencí magnetických polí jader vodíku v typických přístrojích pro zkoumání biomakromolekul. Každou z našich vysílaček můžeme naladit najeden ze čtyř kanálů, jejichž přesné frekvence jsou přibližně o 119 kHz, 131 kHz, 144 kHz a 156 kHz vyšší než základní frekvence 446 MHz. Jednu vysílačku si necháme a další tři rozdáme přátelům. Domluvíme se, kdo si naladí jaký kanál (jakou frekvenci) a postavíme se na čtyři různé významné body ostrova (obrázek 14.2). Nejprve si všichni naladí frekvenci naší vysílačky a zapíšou si, jak silný mají signál (obrázek 14.2A). Ze síly signálu mohou odhadnout vzdálenost od naší vysílačky (čím slabší signál, tím větší vzdálenost). Potom si všichni naladí frekvenci druhé vysílačky a opět zaznamenají sílu signálu (obrázek 14.2B). Stejným způsobem všichni změří sílu signálu třetí (obrázek 14.2C) a čtvrté (obrázek 14.2D) vysílačky. Protože máme jen čtyři vysílačky, museli bychom se pro měření dalších vzdáleností přemístit. V případě biomakromolekul máme ale k dispozici stovky jader vodíků s různými frekvencemi magnetických polí, takže v jednom experimentu můžeme změřit všechny vzájemné vzdálenosti. Když víme, jak klesá signál se vzdáleností, tak můžeme vzdálenost ze 14.1. JÁDRA ATOMŮ JAKO STRUKTURNÍ SONDY 185 Obrázek 14.2: Měření vzdáleností vysílačkami PMR 446. Frekvence vysílačky, která právě vysílá (rozdíl od 446 MHz), je ukázána na displayícli. Na displayícli vysílaček, které jsou na příjmu, je síla signálu znázorněna čárkovým indikátorem 186 KAPITOLA 14. NUKLEÁRNÍ MAGNETICKÁ REZONANCE síly signálu vypočítat. Na základě vzdáleností můžeme pak nakreslit mapu ostrova, tak, jako geodeti kreslí geometrické plány na základě vzdáleností, které proměří v terénu. Strukturní modely biomakromolekul počítáme velmi podobně. Místo signálu vysílaček sledujeme signál jader vodíků. Potřebné rozlišení nám místo čtyř frekvencí vysílaček poskytnou rozdílné frekvence magnetických polí jader vodíků v různých místech biomakromolekuly (s různým elektronovým okolím). A místo závislosti síly signálu na vzdálenosti vysílaček využíváme závislosti síly signálu na vzdálenosti jader vodíku. Aby se námořník na obrázku 14.2 vyznal v naměřených vzdálenostech, musel samozřejmě vědět, na jakou frekvenci má každý z jeho přátel naladěnou vysílačku. Stejně tak při určování struktury biomakromolekul musíme vědět, jakou frekvenci mají magnetická pole jednotlivých atomů vodíku v jednotlivých aminokyselinách (například jakou frekvenci má pole vodíku peptidové vazby v osmé aminokyselině). 14.2 Srovnání NMR a difrakčních metod Dříve, než se pustíme do podrobnějšího popisu nukleární magnetické rezonance, zkusme si shrnout, v čem se tato metoda liší od technik založených na difrakci (od rentgenové krystalografie a elektronové mikroskopie). V difrakčních metodách sledujeme, jak se použitá vlna ohýbá na elektronech molekul. To, jak se vlna interagující s molekulou skládá v prostoru (do difrakčního obrazce nebo mikroskopického obrazu) přímo odráží strukturu molekuly (přesněji prostorové rozložení elektronů v molekule). Nejmenší detaily v rozložení elektronů v molekule jsou přibližně tak velké, jako vlnová délka použité elektromagnetické nebo elektronové vlny. Citlivost difrakčních metod také souvisí s tím, jak se použitá vlna skládá v prostoru: je zvýšena tím, že pozorujeme difrakční obrazec složený z vln ohýbaných velkým množstvím pravidelně uspořádaných molekul, nebo obraz získaný přeložením velkého množství obrazů jednotlivých molekul. Nukleární magnetická rezonance není difrakční metoda. Sice také obvykle využívá elektromagnetické vlny, ale jiným způsobem. Volba použité vlny nijak nesouvisí se vzdálenostmi atomů v prostoru. Místo skládání vln v prostoru nás zajímá jejich kmitání v čase. Jak si ukážeme později, pro dosažení maximální citlivosti volíme takové vlny, aby frekvence jejich kmitání rezonovala s frekvencí časových změn magnetických polí atomových jader. Hodnoty těchto frekvencí nejsou jsou dány strukturou molekul, ale použitým magnetem v měřicím přístroji. V současných přístrojích této frekvenci odpovídají vlnové délky v řádu desítek centimetrů, zcela mimo rozměry molekul. Takové vlny nám samozřejmě o struktuře biomakromolekul nic neříkají. Informaci o struktuře musíme získat nepřímo, a to za cenu větších nepřesností a celkově složitějšího postupu. Příkladem je měření vzdáleností způsobem, který jsme si popsali v části 14.1. To, že vlny používané v NMR nemají přímý vztah ke struktuře, na druhou stranu vysvětluje, proč nukleární magnetická rezonance nevyžaduje pravidelné uspořádání molekul. Pokud například potřebujeme studovat nepříliš velké biomakromolekuly s atomovým rozlišením v roztoku za pokojové teploty, je nukleární magnetická rezonance vhodnou metodou. 14.3 Magnetické chování jader V úvodu kapitoly o využití magnetických vlastností jader atomů k určování struktury molekul je na místě otázka, odkud se magnetismus jader bere. Zdrojem magnetického pole je každý elektrický náboj, který se pohybuje. Pokud je zdrojem smyčka, kterou protéká elektrický proud, popisuje sílu takového magnetu magnetický moment ji. Magnetický moment je úměrný momentu hybnosti, který popisuje zakřivený pohyb náboje (elektronů) ve smyčce. Konstanta úměrnosti se nazývá magnetogyrický poměr a obvykle se označuje písmenem 7. K pochopení momentu hybnosti dobře poslouží příklad pohybu Země kolem Slunce. Naše planeta obíhá Slunce po oběžné dráze (po orbitě). Tento pohyb můžeme popsat orbitálním momentem hyb- 14.3. MAGNETICKÉ CHOVANÍ JADER 187 nosti, což je vektor, jehož směr určuje osu, kolem které Země obíhá, a velikost je součinem hybnosti a vzdálenosti od Slunce.1 Země se ale také zároveň otáčí kolem vlastní osy. Tento pohyb, anglicky označovaný slůvkem spin, popisuje vlastní moment hybnosti. Vyměňme teď v našem příkladě Zemi za elektron a Slunce za jádro atomu (obrázek 14.3 vlevo). Elektron se pohybuje kolem našeho jádra podobným způsobem, jako kdyby putoval kruhovou smyčkou z drátu. V elektrotechnice se velikost magnetického momentu takové smyčky definuje jako součin proudu a plochy smyčky. Směr vektoru tohoto orbitálního magnetického momentu je stejný jako směr orbitálního momentu hybnosti. Pokud bychom předpokládali, že elektron obíhá po kruhové dráze, nedalo by nám moc práce spočítat, že magnetogyrický poměr je roven jedné polovině poměru náboje k hmotnosti. Podobně bychom mohli popsat vlastní magnetický moment, spojený s otáčením elektronu kolem své vlastní osy (se spinem). Kdybychom zkoumali pohyb elektronu kolem jádra podle zákonů kvantové mechaniky a teorie relativity, došli bychom k trochu paradoxnímu závěru, že pohyb elektronů nemůžeme popsat jako otáčení Země kolem vlastní osy, ale že elektrony přesto mají jak orbitální moment hybnosti, tak vlastní moment hybnosti (často nazývaný jednoduše spin). Hodnota magnetogyrického poměru vlastního momentu hybnosti se ale liší od výsledku, který jsme si uvedli v předchozím odstavci. Správnou hodnotu velmi dobře předpovídá kvantová mechanika v kombinaci s teorií relativity. Kvantová mechanika nám také říká, že ze všech stavů, ve kterých se může magnetický moment osamoceného elektronu v magnetickém poli nacházet, jsou jenom dva stacionární (pokud je elektron ve stacionárním stavu, setrvá v něm tak dlouho, dokud jej vnější příčina nedonúti stav změnit). V chemii se tyto stacionární stavy popisují hodnotou spinového kvantového čísla +^ a — ^, nebo symbolicky šipkami | a j. Kdyby se elektron utrhl z atomu a letěl volně prostorem, ztratil by orbitální moment hybnosti, ale vlastní moment hybnosti by mu zůstal. Vlastní moment hybnosti mají i částice, ze kterých se skládá jádro. Vlastní moment hybnosti a magnetický moment jádra se skládají dosti složitým způsobem z příslušných momentů částic, které jádro tvoří a drží pohromadě. Proto se magnetogyrické poměry jader počítají velmi obtížně, dají se ale velmi přesně změřit. Pro zkoumání struktur biomakromolekul se téměř výhradně používají jádra, která se podobají elektronu tím, že jejich magnetické momenty mají dva stacionární stavy. Z jader, která potkáváme v makromolekulách, jde o již zmíněný proton (který tvoří naprostou většinu jader vodíku v přírodě) nebo jádro 31P (jediný stabilní izotop fosforu). Navíc k tomuto druhu jader patří 13C a 15N, ty však tvoří pouze 1,1 % jader uhlíku a 0,4% jader dusíku, takže často musíme biomakromolekuly těmito jádry obohacovat. Nukleární magnetická rezonance je založená na pozorování magnetických momentů jader uvnitř silných magnetů. Pro naši metodu je zásadní, že v přítomnosti vnějšího magnetického pole silného magnetu koná vektor magnetického momentu precesní pohyb kolem vektoru magnetické indukce tohoto pole.2 Měřenou veličinou ve spektroskopii nukleární magnetické rezonance je frekvence tohoto precesního pohybu v. Frekvenci i směr precesního pohybu můžeme elegantně popsat vektorem úhlové rychlosti uj, jehož velikost je rovna 2ttv a jehož směr určuje osu precese. Směr precesního pohybu nám udává pravidlo pravé ruky (vzhledem k uj, obrázek 14.3 vpravo). Uhlová rychlost závisí pouze na magnetogyrickém poměru 7 a na magnetické indukci pole B u = --yB. (14.1) Protože 7 je předem známá konstanta, měřením úhlové rychlosti uj nebo frekvence v vlastně měříme sílu (indukci) magnetického pole v místě jádra. -'-Matematicky definujeme moment hybnosti L jako vektorový součin L = rx p = m(rx v), kde v je rychlost a r vektor popisující polohu Země vzhledem k Slunci. 2 Jinými slovy, vektor magnetického momentu se otáčí pod určitým úhlem kolem vektoru magnetické indukce, tedy kolem vektoru, který popisuje směr a sílu magnetického pole. Obdobně koná precesní pohyb roztočený setrvačník v gravitačním poli, díky tomu se například udržíme v sedle jízdního kola. 188 KAPITOLA 14. NUKLEÁRNÍ MAGNETICKÁ REZONANCE Obrázek 14.3: Vlevo atom vodíku přirovnaný k Zemi obíhající kolem Slunce. Vpravo znázornění precesního pohybu magnetického momentu v magnetickém poli. 14.4 Ovlivnění souborů jader vnějším polem Kvantová mechanika je nezbytná pro správný popis magnetických momentů jednotlivých jader. Při měření spekter nukleární magnetické rezonance ale pracujeme s makroskopickými vzorky (většinou s necelým mililitrem roztoku molekul, které zkoumáme), které obsahují miliardy miliard jader (velmi zjednodušená ilustrace je ukázána na obrázku 14.4). Proto celkové magnetické vlastnosti takových vzorků popisuje dobře klasická, nekvantová fyzika. Popis obrovských množství jader s magnetickými momenty nutně vyžaduje statistický přístup. První otázka, kterou si položíme, bude proto ryze statistická. Jaká je pravděpodobnost, že magnetický moment zkoumaného jádra míří určitým směrem? V nepřítomnosti magnetického pole jsou všechny oritentace magnetického momentu stejně pravděpodobné. Výsledný magnetický moment celého vzorku je součet vektorů, které popisují magnetické momenty jednotlivých jader. Protože se stejnou pravděpodobností míří do všech možných směrů, vzájemně se vyruší a výsledný magnetický moment je nulový. Abychom získali navenek pozorovatelný celkový magnetický moment, musíme zajistit, aby jádra s různou orientací magnetického momentu měla různou energii a některé orientace byly tedy více pravděpodobné, než jiné. Nejjednodušší způsob, jak to zajistit, je umístit jádra do homogenního magnetického pole, tedy do pole, ve kterém má vektor magnetické indukce, zpravidla označovaný Bq, všude stejný směr. Směr Bq přitom použijeme jako definici osy z souřadné soustavy, která nám pomůže magnetické chování jader popsat konkrétními geometrickými pojmy. Po umístění vzorku do magnetického pole pomalu naroste počet magnetických momentů, které míří stejným směrem, jako B0 (tento směr je energeticky výhodnější). Nadbytek magnetických momentů orientovaných podél Bq se navenek projeví jako nenulový celkový magnetický moment (obrázek 14.5). Velikost celkového magnetického momentu dělená objemem vzorku se nazývá magnetizace a zpravidla označuje písmenkem M. V tepelné rovnováze je tento nadbytek malý i v nejsilnějších magnetech, protože magnetické momenty jader jsou velmi slabé a jen nepatrně přispívají k energii molekul. 14.5 Excitace Přítomnost vnějšího magnetického pole sice učiní vzorek navenek magnetickým, neumožní nám ale měřit frekvenci precese magnetických momentů (alespoň ne běžným způsobem). Ačkoli náš vzorek obsahuje miliardy miliard magnetických momentů, které konají precesní pohyb s (téměř) stejnou frekvencí, detektor tuto frekvenci neregistruje, protože celkový magnetický moment je orientován podél Bq (otáčením kolem svislého směru se azurová šipka na obrázku 14.5 nijak nemění). Abychom mohli frekvenci měřit, 14.5. EXCITACE 189 Obrázek 14.4: Vlevo zjednodušený obrázek vzorku proteinu studovaného pomocí NMR. Molekuly proteinu jsou znázorněny jako tečky. Pro každou molekulu je znározněn jeden magnetický moment jako šipka. Vpravo znázornění orientací magnetických momentů v nepřítomnosti vnějšího magnetického pole. Počátky všech šipek z obrázku vlevo jsou umístěny do stejného bodu. Obrázek ukazuje, že magnetické momenty (šipky) míří se stejnou pravděpodobností do všech směrů. Obrázek 14.5: Vlevo je ukázána distribuce magnetických momentů jader ve vnějším magnetickém poli o indukci So (fialová šipka). Celkový magnetický moment je znázorněn jako azurová šipka. Uprostřed je ukázána distribuce magnetických momentů odpovídající magnetizaci (azurová šipka) vychýlené mírně doprava dalším magnetickým polem o indukci Bi (tenká fialová šipka), které otáčí magnetické momenty po směru hodinových ručiček. Vpravo je ukázaná tatáž distribuce otočená o polovinu kruhu v důsledku precese kolem Bo- Slabší pole o indukci Bi, otáčející magnetické momenty po směru hodinových ručiček, v tento okamžik vrací vektor magnetizace (azurovou šipku) zpět do svislého směru. 190 KAPITOLA 14. NUKLEÁRNÍ MAGNETICKÁ REZONANCE Obrázek 14.6: Vlevo znázornění pohybu vektoru magnetizace (jako azurová dráha na povrchu koule o poloměru M|) v přítomnosti oscilujícího magnetického pole radiové vlny. Vpravo distribuce magnetických momentů jader po sklopení vektoru magnetizace do směru kolmého na Bq. musíme zajistit, aby azurová šipka (celkový magnetický moment) mířila jinam, než vektor B0, nejlépe kolmo k němu. Již víme, že vektor magnetického momentu se otáčí kolem vektoru magnetické indukce. To nám napovídá, že k otočení azurové šipky můžeme použit další magnetické pole, s indukcí B\ kolmou ke směru Bq.3 Pokud bude vektor indukce B\ mířit směrem k nám, bude otáčet azurovou šipku na obrázku 14.5 po směru hodinových ručiček. Ale pozor! Vektor B\ nemůže jednoduše mířit jedním směrem kolmým na B0. Jakmile bude azurová šipka nepatrně vychýlena po směru hodinových ručiček ze směru B0, tedy na našem obrázku doprava, začne kolem Bq konat precesní pohyb s frekvencí Po době odpovídající polovině periody tohoto precesního pohybu se azurová šipka otočí o půl otáčky kolem svislé osy, takže bude na obrázku mířit trochu doleva od svislého směru. To ale znamená, že v tomto okamžiku otáčení po směru hodinových ručiček (efekt B\ stále mířícího směrem k nám) bude azurovou šipku vracet zpátky do svislého směru. Vidíme, že vektor Bi mířící stále jedním směrem nezpůsobí celkovou rotaci azurové šipky ze svislého směru do směru vodorovného. Potřebujeme vektor B\, který osciluje mezi směrem k nám a od nás se stejnou frekvencí, s jakou se vektor magnetizace (azurová šipka) otáčí kolem Bq. V tom případě bude B\ stále více vychylovat azurovou šipku ze svislého směru. V okamžiku, kdy je azurová šipka vychýlená doleva, míří Bi k nám a otáčí magnetizaci po směru hodinových ručiček, tedy ještě více vlevo dolů. Ve chvíli, kdy je azurová šipka vychýlená doprava, míří B\ od nás a otáčí magnetizaci proti směru hodinových ručiček, tedy ještě více vpravo dolů. Vektor magnetizace se tak více a více vzdaluje od svislého směru po složité spirálové dráze, znázorněné na obrázku 14.6 vlevo. Po určité době bude azurová šipka vodorovná, což je náš cíl (obrázek 14.6 vpravo). Pokud v tomto okamžiku přestane pole s indukcí Bi působit, bude celkový magnetický moment (azurová šipka) rotovat ve vodorovné rovině kolem svislé osy. Protože magnetický moment je sám zdrojem magnetického pole, vznikne tak maličké magnetické pole otáčející se s frekvencí precese magnetických momentů pozorovaných jader. Pokud bude v blízkosti cívka nebo smyčka z vodivého drátu, bude otáčející se pole v drátu indukovat střídavé elektromotorické napětí, oscilující s frekvencí precese. Toto napětí představuje signál, který v experimentu NMR měříme. 'V našich úvahách i ve skutečném experimentu bude velikost B± vždy mnohem menší, než velikost Bq. 14.6. INTERAKCE JADER S NEJBLIŽŠÍM OKOLÍM 191 14.6 Interakce jader s nejbližším okolím Z popisu experimentu NMR v předchozí části nijak nevyplývá, proč by měla precese magnetického momentu některých jader zajímat chemika či biochemika. Praktické využití NMR v chemii a biochemii souvisí s tím, že vnější magnetické pole našeho magnetu není jediný vliv, kterému jsou magnetické momenty jader vystaveny. Kromě uměle vyvolaných polí interagují jádra s magnetickými poli v jejich bezprostředním (molekulárním) okolí. Tyto interakce jsou pro nás velmi zajímavé, protože nesou informaci o rozložení elektronů a jader atomů v nejbližším okolí jádra. Jenom díky těmto interakcím můžeme použít NMR ke zkoumání vlastností molekul. Ve všech biomakromolekulách se setkáváme se třemi typy interakcí, o kterých se zmíníme v následujících oddílech trochu podrobněji. 14.7 Interakce s magnetickými poli párovaných elektronů Silné magnetické pole spektrometru indukuje pohyb elektronů v molekulách. Důsledkem tohoto pohybu (pohyb nabitých částic je vlastně elektrický proud a kolem vodičů pod proudem se vytváří magnetické pole) je indukované magnetické pole, které působí proti směru vnějšího pole, které je vyvolalo. Vnější magnetické pole je proto v místě jádra částečně stíněno elektronovým obalem (obrázek 14.7A). Magnetické momenty jader jsou ale také ovlivněny poli, která vznikají v důsledku pohybu elektronů v sousedních atomech. Pokud provádíme měření v roztoku, směr a velikost těchto polí se velmi rychle mění, tak rychle, jak rychle se otáčejí molekuly v důsledku srážek s molekulami rozpouštědla.4 Velmi zjednodušeně je to ukázáno na obrázku 14.7B a 14.7C. Azurové jádro na obrázku 14.7B se nachází v takové poloze vůči šedému jádru, že pohyb elektronů šedého atomů zvyšuje magnetické pole v místě azurového jádra. Pokud ale srážka s rozpouštědlem pootočí pozorovanou molulu do orientace ukázané na obrázku 14.7C, octne se azurové jádro v poloze, ve které pohyb elektronů šedého atomů magnetické pole mírně snižuje. Ve skutečných molekulách jsou pozorované magnetické momenty ovlivněny elektrony několika sousedních atomů, takže je na místě mluvit o vlivu rozložení elektronové hustoty, které není v okolí pozorovaného jádra sféricky symetrické (snad s výjimkou atomů vzácných plynů). Zmíněné malé a rychlé změny magnetického pole v důsledku srážek s rozpouštědlem jsou jedinou příčinou toho, že po vložení vzorku do magnetu se zvýší počet magnetických momentů mířících podél vnějšího magnetického pole a dojde ke vzniku navenek pozorovatelné celkové magnetizace. Jak k tomu dochází? Zkusíme si to popsat opět s pomocí klasické fyziky. Není to sice korektní, ale umožní nám to získat intuitivní představu o hodně složitém, ale důležitém jevu. Magnetické momenty jsou absolutně netečné k mechanickému otočení molekuly. Ať molekulu natočíme jakkoli, magnetické momenty konají precesní pohyb kolem směru vnějšího magnetického pole. Magnetické momenty ale cítí změny magnetických polí. Pokud v určitém okamžiku srážka s rozpouštědlem roztočí pozorovanou molekulu náhodou právě takovou rychlostí, jako je rychlost precesního pohybu, dojde k tomu, co jsme si popsali pro radiové vlny. Spirála na obrázku 14.6 ukazuje schematicky pohyb vektoru celkové magnetizace, tedy průměru všech magnetických momentech ve vzorku. Abychom si o náhodných pohybech udělali trochu konkrétnější představu, vypůjčíme si obrázek 14.6 i pro popis toho, co se děje mezi srážkami molekul s jednotlivými magnetickými momenty. Nesmíme při tom ale zapomínat, že takový popis není fyzikálně korektní. Rozkmitání magnetického pole (v našem případě v důsledku nárazu molekuly rozpouštědla) ve směru kolmém na vnější pole s frekvencí rezonující s frekvencí precese určitého magnetického momentu začne otáčet magnetický moment přibližně po spirále ukázané na obrázku 14.6 vlevo. Po spirále se můžeme pohybovat nahoru nebo dolů, v průměru budou častější ty chvíle, kdy rotace molekul budou magnetický moment tlačit do energeticky výhodnějšího 4Jde o dobře známý Brownův pohyb, z něhož nás teď zajímá pouze náhodné pootáčení molekuly (rotace), nikoli posun v určitém směru (translace). Krom pohybu celých molekul přispívají ke kolísání magnetických polí také vnitřní pohyby molekul. Vliv vnitřních pohybů je sice menší, ale z chemického a biologického pohledu jsou vnitřní pohyby zajímavější. 192 KAPITOLA 14. NUKLEÁRNÍ MAGNETICKÁ REZONANCE směru (tedy do směru rovnoběžného s vnějším polem). Na rozdíl od radiových vln, které mají stále stejnou frekvenci, otáčení molekuly zasažené rozpouštědlem bude mít tu správnou rychlost a směr jen na okamžik, než přijde další náraz, který vzácnou souhru pokazí. Magnetický moment se proto posune po azurové spirále jen maličko a pak dlouho čeká, až zase přijde ta správná srážka, aby se posunul po spirále o kousek dál. Mezitím možná dojde ke srážce, která vrátí magnetický moment zpátky. Jak jsme si ale řekli, jde o náhodný jev, který nakonec v souboru všech magnetických momentů povede k takovému rozložení magnetických momentů, které bude odpovídat termodynamické rovnováze při dané teplotě. Tak jako kolísání magnetického pole kolmo na vnější pole vede k ustavení rovnovážného rozložení magnetických momentů a vzniku celkové magnetizace po vložení vzorku do magnetu, tak samozřejmě navrací magnetizaci zpět do rovnováhy poté, co jsme ji radiovými vlnami vychýlili do kolmého směru. Díky kolmým výchylkám tedy signál získáváme (kdyby nevznikla v rovnováze celková magnetizace, nebylo by co sklápět radiovými vlnami do měřitelného směru), ale i ztrácíme. Na ztrátu signálu má ale vliv i kolísání rovnoběžné s vnějším konstantním magnetickým polem B0, tedy v našem uspořádání svislé výchylky. Kolem svislého směru (směru Bq) totiž magnetické momenty konají precesní pohyb s frekvencí, kterou měříme. Pokud se všechny magnetické momenty pohybují se stejnou frekvencí, tedy koherentně, celková magnetizace během měření rotuje se stejnou, přesně danou, frekvencí kolem Bq. V důsledku pohybů molekul se ale každé jádro nachází v maličko jiném a stále se měnícím magnetickém poli. Protože frekvence precese je přímo úměrná magnetickému poli, tak se v každém okamžiku otáčí každý magnetický moment s nepatrně odlišnou frekvencí. Po delší době toto kolísání frekvencí vede k „rozostření" celkové magnetizace a tedy úbytku měřeného signálu. Tento efekt je zvlášť silný u velkých, pomalu se pohybujících molekul. To je jeden z důvodů, proč je velmi obtížné pomocí NMR zkoumat proteiny skládající se z více než 200 aminokyselin. Diskuse kolísání frekvencí přirozeně vede k otázce, jakou frekvenci v experimentu NMR vlastně měříme. Asi nepřekvapí, že jde o frekvenci průměrnou, tedy o průměr frekvencí magnetického momentu pozorovaného jádra ve všech různě natočených molekulách v roztoku. Rozdílné rozložení elektronové hustoty způsobuje, že různá jádra téhož izotopu (například proton v methylové skupině a proton v aromatickém systému) mají různou průměrnou precesní frekvenci. Ve spektrech pozorujeme takzvaný chemický posun, většinou označovaný S. Protože průměrné precesní frekvence umíme měřit velmi přesně, dokážeme dobře rozlišit chemický posun jader v různých skupinách. Chemický posun se obvykle vyjadřuje v milióntinách precesní frekvence (jednotka ppm) vůči dohodnuté srovnávací molekule5 a pro malé molekuly je nejčastěji využívanou informací o struktuře. Hodnoty chemického posunu protonů v různých funkčních skupinách jsou uvedeny na obrázku 14.8. Vidíme, že jde vždy o hodnoty nižší, než pro volný proton (H+). Rozložení elektronové hustoty samozřejmě obsahuje cennou informaci o struktuře (vzpomeňte na rentgenovou difrakci). V současné době ale nedokážeme vliv interakcí s elektrony na frekvence jader ve velkých molekulách dostatečně přesně předpovědět a hodnoty chemického posunu se využívají k určování struktur jen omezeně. 14.8 Přímá interakce s magnetickými dipóly sousedních jader Kromě elektronových oblaků se v sousedství pozorovaných magnetických momentů nacházejí také magnetické momenty okolních jader. Tyto magnetické momenty jsou zdroji malých lokálních polí, jejichž velikost a směr závisí na natočení celé molekuly (podobně jako velikost a směr polí způsobených orbitálními magnetickými momenty elektronů). Magnetický dipólový moment sousedního jádra může zvyšovat nebo snižovat magnetické pole v místě sledovaného jádra, v závislosti na tom, v jaké poloze se sousední jádro nachází vzhledem ke sledovanému jádru. Pokud je spojnice jader kolmá na směr indukce 5Fyzikálně nejpřirozenější by bylo srovnání s volným protonem. Volné protony ale nejsou chemikálie, kterou bychom si mohli objednat z katalogů chemických firem. Proto se používají jiné, stabilní látky: v organické chemii tetramethylsilan (TMS) a v biochemii 3-(trimethylsilyl)-propan-l-sulfonová kyselina, která je dobře rozpustná ve vodě. 14.8. PŘÍMÁ INTERAKCE S MAGNETICKÝMI DIPÓLY SOUSEDNÍCH JADER 193 Obrázek 14.7: A, Klasický popis interakce pozorovaného magnetického momentu s orbitálním magnetickým momentem elektronu téhož atomu. Pozorované jádro je znázorněno azurovou barvou, elektron červeně. Vnější homogenní magnetické pole je znázorněno tlustou fialovou šipkou, magnetické pole elektronu je znázorněno tenkými fialovými magnetickými indukčními čarami (jejich hustota a tečna v daném místě udávají velikost a směr vektoru magnetické indukce, malé šipky vyznačují směr). Elektron se v magnetickém poli pohybuje po kruhové dráze nakreslené červeně, směr pohybu elektronu je vyznačen červenou šipkou. Magnetické pole orbitálního magnetického momentu vlastního elektronu snižuje celkové magnetické pole v místě azurového jádra (malá fialová šipka v místě azurového jádra míří dolů). B, interakce pozorovaného magnetického momentu s orbitálním magnetickým momentem elektronu sousedního atomu. Sousední jádro je nakresleno šedě. V této orientaci molekuly magnetické pole orbitálního magnetického momentu elektronu sousedního atomu zvyšuje celkové magnetické pole v místě azurového jádra (indukční čáry v místě azurového jádra míří vzhůru, jak ukazují malé fialové šipky). C, při otáčení celé molekuly se azurové jádro dastane do pozice, ve které pole orbitálního magnetického momentu elektronu sousedního atomu začíná snižovat celkové magnetické pole v místě azurového jádra (indukční čáry v místě azurového jádra začínají mířit dolů). vnějšího pole, jako vlevo na obrázku 14.9, magnetické pole sousedního jádra má v místě pozorovaného jádra opačný směr a vnější pole proto snižuje (malé zelené šipečky, označující směr magnetického pole sousedního jádra v daném místě, míří na obrázku 14.9 dolů, opačně než velká fialová šipka vnějšího pole přístroje). Pokud ale otočíme molekulu o 60° nebo o 90° (obrázek 14.9 vpravo), míří pole sousedního jádra v místě pozorovaného jádra (šikmo) vzhůru a vnější pole tak zesiluje. Pokud je magnetická indukce sousedního jádra přesně kolmá na indukci vnějšího pole (obrázek 14.9 uprostřed), nemá magnetický moment sousedního jádra na pole v místě pozorovaného jádra žádný vliv. Uhel mezi spojnicí jader a indukcí vnějšího pole, pro který toto nastane, se nazývá magický úhel. Protože precesní frekvence jádra závisí na magnetickém poli, nese spektrum molekuly v pevném stavu (například v krystalu) informaci o vzájemné orientaci jader. V roztoku se ovšem tato vzájemná orientace stále mění v důsledku Brownova pohybu molekul. Pole sousedních jader se tedy neustále náhodně mění (fluktuují). Pokud se molekula nachází ve zcela neuspořádaném (izotropním) prostředí, například ve vodném roztoku, průměrná hodnota polí sousedních jader je nulová. Přesto mají tato pole vliv na stav sledovaného jádra. Kolísání okamžitých polí sousedních jader působí na rozložení magnetických momentů zcela stejným způsobem, jak jsme si popsali pro pole tvořená orbitálními momenty elektronů. Dalším důsledkem interakcí s magnetickým dipólovým momentem sousedního jádra je takzvaný nukleární Overhauserův jev (NOE, Nuclear Overhauser Effect): pokud selektivně ozařujeme radiovými vlnami jen sledované jádro6 a ponecháme sousední jádro v rovnováze,7 interakce mezi magnetickými 6Selektivní ozařování znamená, že použijeme velmi slabé radiové vlny s frekvencí přesně rovnou průměrné rezonanční frekvenci jednoho jádra. Magnetické pole těchto vln bude sice pomalu, ale se správnou frekvencí, vychylovat magnetické momenty prvního jádra z rovnováhy. Magnetické momenty druhého jádra mají frekvenci trochu odlišnou, takže je slabé pole radiových vln nebude vychylovat do potřebného směru a k celkovému sklopení magnetizace druhého jádra proto nedojde. 7 V praxi se, zvlášť pro velké molekuly, používá většinou trochu jiné uspořádání. Průběžně se z rovnováhy vychylují obě 194 KAPITOLA 14. NUKLEÁRNÍ MAGNETICKÁ REZONANCE CH=0 H C=CH CH2-0 ô 8Hz < 5Hz nové hustoty, kterou získáme z rentgenové difrakce nebo elektronové mikroskopie, z výsledků NMR měření není na první pohled patrný tvar molekuly. Jsme v podobné situaci, jako když chceme nakreslit plán domu a k dispozici máme jen tabulku číselných hodnot různých vzdáleností. Musíme proto výsledky měření zpracovat do grafické formy. Výpočetní metody, které umožňují ze vzdáleností vytvořit trojrozměrný model, jsou označovány jako distanční geometrie. Pokud bychom znali přesně hodnoty všech vzdáleností mezi jádry, poskytla by nám distanční geometrie věrný tvar molekuly.19 Naměřené hodnoty jsou ale zatíženy experimentální chybou, takže určený tvar molekuly se od skutečnosti dost liší. To si můžeme sami ověřit, když se na molekulu pořádně podíváme. Víme, že konformace makromolekuly je dána hlavně torzními úhly. Vazebné délky a úhly by měly být v proteinu stejné jako ve volných aminokyselinách. Rozdíly nás varují, že navržená struktura není chemicky v pořádku. Abychom získali chemicky rozumný model proteinu, používáme pro výpočet konformace metod molekulového modelování, které „vědí", jak mají aminokyseliny vypadat. Nejčastěji se používá molekulová dynamika, ve které jako startovní konformaci můžeme použít třeba výsledek distanční geometrie. Mezi výpočtem struktury, jak jsme jej popisovali v kapitole 11, a využitím molekulové dynamiky v rámci určování struktury z výsledků NMR je ale důležitý rozdíl. Pokud vycházíme z výsledků NMR experimentů, používáme naměřené hodnoty (vzdálenosti atomů, torzní úhly, zbytkové dipólové interakce) jako dodatečné vazné podmínky. Molekulová dynamika se tedy nesnaží najít celkově nejvýhodnější konformaci, ale vybrat chemicky nej přijatelnější strukturu v rámci možností, kterým odpovídají experimentální data. Jinými slovy, NMR vymezí na hyperploše potenciální energie menší území a cílem molekulové dynamiky je najít v tomto území nejhlubší údolí (obrázek 14.20). Při opakovaném výpočtu získáme trochu odlišnou strukturu. Zpravidla proto provádíme výpočtů několik a výsledné modely struktury přes sebe přeložíme (obrázek 14.21). V místech, která jsou experimentem nejlépe popsána, jsou jednotlivé modely téměř nerozlišitelné. Naopak v místech, pro která máme málo experimentálních údajů, nebo v pohyblivých částech molekuly, kde nám experiment poskytne jen 19Výjimkou je chiralita. Ze vzdáleností nejsme schopni určit, který z vzájemných zrcadlových obrazů je ten pravý. Naštěstí víme, že proteiny jsou stavěny z L-aminokyselin, takže nás tato nedokonalost nijak neomezuje. 210 KAPITOLA 14. NUKLEÁRNÍ MAGNETICKÁ REZONANCE Obrázek 14.20: Příklad hyperplocliy potenciální energie v MD simulaci (vlevo), umělé energie přiřazené odchylce od experimentálně určených vzdáleností (uprostřed), a součtu obou energií (vpravo). Oblast strukturních souřadnic (označených x\,x2), která odpovídá výsledkům měření NMR, je vyznačena modře. průměr geometrických údajů, se modely liší. 14.18 Struktura nukleových kyselin pomocí NMR Při určování struktur nukleových kyselin využívají stejné principy jako v případě proteinů. Postup práce je však v mnohém odlišný. Důvodem je nákladnost izotopového značení nukleových kyselin a odlišnost struktury, která činí NMR nukleových kyselin experimentálně obtížnější. Ve srovnání s proteiny se NOESY experimenty často používají nejen v druhé fázi řešení struktury, ale i k přiřazení frekvencí. Techniky frekvenčního přiřazení můžeme u nukleových kyselin dělit na experimenty využívající interakce zprostředkované elektrony kovalentních vazeb a na experimenty využívající NOE (dipolární interakce prostorem). Oba přístupy mají své výhody a nevýhody a v praxi se často kombinují. Zde si uvedeme jen příklady postupů založených na využití NOE. Metody využívající NOE k frekvenčnímu přiřazení jsou založeny na korelacích protonů nacházejících se blízko sebe v prostoru. V principu tedy nevyžadují izotopové značení vzorku. V jednodušších případech lze tedy tímto způsobem studovat snadno dostupné vzorky nukleových kyselin v přirozeném zastoupení. Pokud je již k dispozici značený vzorek, kombinují se tyto metody často s heteronukleární korelací s uhlíky a protony, protože takto lze zvýšit rozlišení rozšířením spektra do další dimenze. Nevýhodou tohoto přístupu je, že vzdálenosti mezi protony a tedy i pozorované korelace závisí na konformaci dané molekuly nukleové kyseliny. • Korelace mezi imino (a amino) protony. V dvoušroubovicových strukturách jsou snadno pozorovatelné korelace mezi protony vodíkových můstků, které párují báze. Zpravidla jde o imino-protony, ale i protony aminoskupin jsou často pozorovatelné, zejména za nízkých teplot (vodíková vazba výrazně zpomalí výměnu protonu s protonem vody, která ve volných aminoskupinách způsobuje, že signály protonů nejsou pozorovatelné). Takto lze získat sekvenční přiřazení imino-protonů. Je nutno si uvědomit, že pouze guanin a thymin/uracil je donorem vodíku, takže korelace je patrná pouze mezi těmito bázemi (korelace „přeskakuje" mezi jednotlivými vlákny šroubovice). Příklady spekter jsou uvedeny na obrázku 14.22. Všimněte si, že v případě symetrických dvojšroubovic jsou signály obou vláken identické. • Korelace báze-cukr. Pro přiřazení frekvencí jsou cenné korelace H6/H8 protonů s protony Hľ, H2' (silnější u dvojšroubovice A), H2"(silnější u dvojšroubovice B) pentosového kruhu. Protože lze pozorovat korelace s vlastní (deoxy)ribosou a s cukrem předchozího nukleotidu, poskytují zmíněné korelace údaje pro sekvenční přiřazení (obrázek 14.23). Zároveň získáváme informaci o přiřazení cukru a báze v rámci jednoho rezidua. 14.18. STRUKTURA NUKLEOVÝCH KYSELIN POMOCÍ NMR 211 Obrázek 14.21: Peptidová páteř deseti struktur N-terminální domény podjednotky delta RNA polymerasy bakterie Bacillus subtilis vypočtených na základě dat (vlevo) a model struktury s nejnižší energií (vpravo). • Korelace protonů cukru. Korelací mezi protony v rámci (deoxy)ribosového kruhu lze využít k přiřazení frekvencí protonů spinovým systémům jednotlivých bází. Navíc lze pozorovat korelace mezi protony cukrů sousedících nukleotidů. Nejsilnější bývají korelace H5"(z)-H2"(z —1) v dvojšroubovicích B a H5"(z)-Hl'(z — 1) v dvojšroubovicích A. Využití NOE k určování vzdáleností mezi protony je u nukleových kyselin stejné jako u proteinů. Vzhledem k nižšímu počtu protonů v nukleových kyselinách bývá ale počet získaných meziatomových vzdáleností u nukleových kyselin nižší ve srovnání s proteiny. Při určování struktury závisí proto výsledná konformace více na závěrečném výpočtu molekulovou dynamikou, než tomu je v případě proteinů. Torzní úhly v molekulách nukleových kyselin se také obvykle určují z hodnot třívazebných interakčních konstant. Relativně velké množství třívazebných interakcí je dostupné pro určování kon-formací cukrů. Při interpretaci těchto dat ale můžeme narazit na komplikace způsobené přítomností více konformací ve vzorku. Torzi kolem glykosidické vazby (x) určujeme z třívazebných interakcí mezi atomy Hl'-C2 a Hl'-C6 u pyrimidinů a Hl'-C4 a Hl'-C8 u purinů. Z torzních úhlů páteře lze poměrně přesně určit j3 (z třívazebných interakcí mezi atomy H5"-P5', H5'-P5', C4'-P5'), e (z třívazebných interakcí mezi atomy H3'-P3', C2'-P5', C4'-P3') a 7 (z třívazebných interakcí mezi atomy H5"-H4', H5'-H4', H5"-C3', H5'-C3'). Výpočet struktury nukleové kyseliny na základě výsledků NMR se v principu neliší od výpočtu proteinů. Konkrétní postup výpočtu se ale odlišuje. Odlišná struktura monomerních jednotek vyžaduje jiné silové pole než proteiny. Geometrických údajů z experimentu je obvykle méně, než v případě proteinů. Je tomu tak proto, že nejvíce informací poskytují atomy vodíku. Nukleové kyseliny obsahují relativně méně vodíků než proteiny. Zvláštní obtíž představuje tvar dvojšroubovice. Pokud vycházíme pouze ze vzdáleností, získáme údaje jen mezi sousedními páry nukleotidů. Tyto údaje obsahují experimentální chybu a tato chyba se postupně sčítá, takže máme velmi zkreslenou představu o tom, jestli je dvojšroubovice ohnutá. Tento nedostatek odstraňují údaje získané v anizotropním prostředí, například zbytkové dipólové interakce (viz sekci 14.8). Tyto údaje totiž odrážejí polohu vektorů mezi jádry vzhledem k vnějšímu magnetickému poli. Takto zprostředkovaně, přes vnější pole (které určuje anizotropní 212 KAPITOLA 14. NUKLEÁRNÍ MAGNETICKÁ REZONANCE 2 3 4 5 T G A T [—H 6 7 8 C A G H H H—H GACTAGTC 87654321 1 2 3 4 5 6 C T G A A T /A / H H—H G A C T T A 6' 5' 4' 3' 2' ľ G8 G3 T5 T2 G6' G3 T3' T2 T2' T6 H T2 T5 G3 G8 H T6 T2' T2 T3' G3 G6' Obrázek 14.22: Příklady NOESY spekter oblasti imino-protonů bází. Červeně je znázorněna korelace mezi protony v sekvencích (tečkované je označena nepozorovatelná korelace mezi protony s identickou rezonanční frekvencí) a sekvenční informace ve spektrech. Vzhledem k tomu, že jde o diagonálně symetrická spektra, sekvenční informaci lze sledovat dvěma způsoby (plná a přerušovaná červená čára). 14.18. STRUKTURA NUKLEOVÝCH KYSELIN POMOCÍ NMR 213 Obrázek 14.23: Vlevo schéma korelací mezi protony Hl' (v pentose) a H6 nebo H8 (v bázi), vpravo výsek oblasti NOESY spektra, která obsahuje tyto korelace. Červeně je znázorněna sekvenční informace. Protože je na obrázku ukázána pouze část spektra, sekvenční informaci můžeme sledovat jen jedním způsobem. Všimněte si, že proton první báze je korelován pouze s Hl' vlastní pentosy a proton Hl' poslední báze je korelován pouze s H6 nebo H8 protonem vlastní báze (v těchto případech chybí korelace se sousedem) - na základě toho je možné určit směr sekvence. 214 KAPITOLA 14. NUKLEÁRNÍ MAGNETICKÁ REZONANCE charakter prostředí) můžeme určit polohu skupin, které jsou v sekvenci libovolně vzdálené. 14.19 Struktura oligosacharidů pomocí NMR Určování struktury (nederivatizovaných) sacharidů pomocí NMR je komplikováno nedostupností izotopově značených vzorků a špatným rozlišením protonových spekter (ze struktury vyplývá, že většina protonů má velmi podobné okolí). Sekvenční přiřazení se provádí pomocí NOE, přiřazení v rámci sacharidových jednotek je založeno na NOESY a TOCSY experimentech. Počet NOE korelací pro určování struktury mezi různými jednotkami sacharidů je většinou malý. K určování torzních úhlů v rámci jednoho cukerného kruhu lze využít třívazebné interakce mezi protony. K určování torzí kolem glyko-sidických vazeb je nutno měřit třívazebné interakce mezi protony a uhlíky (v přirozeném zastoupení 13C). K odstranění některých ze zmíněných problémů lze použít chemickou derivatizaci (například me-thylaci). 14.20 Pohyby molekul v NMR Během měření NMR sledujeme nejen amplitudu a frekvenci záření jednotlivých jader, ale také postupné slábnutí tohoto záření, relaxaci. Signál během měření slábne protože se postupně ztrácí koherence pohybů jader a protože se orientace těchto magnetických momentů v souboru molekulách vracejí do termodynamicky nej výhodnějšího uspořádání.20 Hlavní příčinou relaxace jsou změny interakcí jader s okolím (viz sekci 14.6), ke kterým dochází v důsledku pohybu molekul. Proto můžeme NMR využít nejen k popisu struktury molekuly, ale také k popisu pohybů jednotlivých atomů (dynamiky molekuly). Při sledování dynamiky proteinů většinou měříme tři relaxační údaje pro jádro 15N v páteři proteinu (rychlost ztráty koherence, rychlost návratu do rovnováhy a nukleární Overhauserův efekt mezi 15N a 'Hve skupině NH). Analýza těchto údajů je poměrně jednoduchá za dvou předpokladů Za prvé, pohyb proteinu popisujeme jako kombinaci náhodné rotace (rotační difúze) celého proteinu a na ní nezávislého vnitřního pohybu. Za druhé, předpokládáme, že rotace celého proteinu je ve všech směrech stejná (což by platilo přesně, kdyby měla molekula proteinu tvar koule). Za těchto podmínek můžeme ze tří relaxačních údajů vypočítat tři údaje o rychlých pohybech páteře proteinu (v řádu 1CP12 až lCP9s). Získanými parametry jsou rychlost, s kterou se v roztoku otáčí celá molekula (taje pochopitelně stejná pro všechna jádra), rychlost (frekvenci) a rozsah (amplitudu) vnitřních pohybů. Pokud jsou jádra ovlivněna více než jedním vnitřním pohybem, nebo pokud je tvar molekuly výrazně jiný, než kulový, potřebujeme k popisu více údajů. Proto často opakujeme měření za různých podmínek (například v různém magnetickém poli). Omezením tohoto přístupu je, že od celkové rotace rozlišíme jen pohyby rychlejší. Pohyby, ke kterým dochází v řádu mikrosekund až milisekund, můžeme popsat také, pokud přitom dochází ke změnám chemického posunu. V tomto případě mluvíme o konformaění výměně (chemický posun se mění v důsledku změny konformace) nebo o chemické výměně (chemický posun se mění v důsledku změny chemické struktury, například disociace protonu, nebo interakce s jinou molekulou). Pomocí speciálních experimentů lze určit zastoupení jednotlivých forem proteinu (například konfor-merů) a někdy i rychlost výměny. Studium ještě pomalejších pohybů je snadné. Protože doba měření je přibližně jedna sekunda, můžeme pomalejší pohyby sledovat pohodlně opakovaným měřením. Spektroskopie NMR nám tedy umožňuje získat nejen trojrozměrný obraz molekuly, ale dokonce popis ve čtyřech dimenzích (třech prostorových a jedné časové). To znamená, že určíme nejen celkovou strukturu, ale také to, které části molekuly jsou pohyblivější a jaký je rozsah a rychlost těchto pohybů. 20Jde o dva různé děje, které probíhají různě rychle. U velkých molekul dochází ke ztrátě koherence během desetin sekundy, ale k rovnováze se systém přiblíží až po několika sekundách. Proto signál přestáváme pozorovat již v desetinách sekundy po excitaci, ale měření můžeme opakovat nejdříve po jedné sekundě. 14.21. OMEZENÍ METODY A POKROČILÉ APLIKACE 215 Informace o pohyblivosti může být důležitá pro pochopení funkce studované molekuly. Ačkoli se v našem povídání zaměřeném na určování struktur zmiňujeme o studiu pohybů pouze okrajově, tato aplikace je jednou z nejsilnějších stránek NMR. 14.21 Omezení metody a pokročilé aplikace Použitelnost NMR pro studium biomakromolekul má v současnosti různá omezení. Některá z nich vyplývají z citlivosti metody. Uspořádání magnetických momentů jader se v dostupných magnetických polích za laboratorní teploty jen nepatrně liší od zcela náhodné orientace. Celková magnetizace jader v souboru molekul tvořícím vzorek tak odpovídá pouze tisícinám procenta magnetizace, kterou by měly zcela uspořádané magnetické momenty těchto jader. „Aktivní koncentrace" jader ve vzorku je tak o několik řádů nižší, než celková koncentrace biomakromolekuly. To vyžaduje poměrně vysoké koncentrace vzorku (řádově milimolární) a obohacení molekul vzácnějšími izotopy 13C a 15N. S tímto omezením se snaží výrobci spektrometrů bojovat na dvou frontách: zvyšováním magnetického pole (tím se zvýhodňuje jedna orientace magnetických momentů a tak se zvyšuje celková magnetizace) a konstrukcí citlivějších detekčních zařízení.21 Zvýšení citlivosti v principu umožňuje buď práci s méně koncentrovanými vzorky, nebo vynechání izotopového značení.22 Další omezení souvisí s relaxací. Obecně lze říci, že čím je větší molekula, tím pomaleji se pohybuje v roztoku, tím více času mají jádra interagovat a tím rychlejší je relaxace. Například u proteinů obsahujících více než 200 aminokyselin je relaxace tak rychlá, že začínáme mít málo času na některé důležité experimenty. Toto úskalí je naštěstí možné elegantně obeplout. Byly navrženy experimenty, ve kterých působí relaxace v důsledku interakcí s indukovaným polem elektronů proti relaxacím v důsledku interakcí se sousedním jádrem. Při určitém magnetickém poli tak téměř nedochází ke ztrátě koherence. Příspěvky k relaxaci v důsledku interakcí se vzdálenějšími protony lze potlačit přípravou vzorku proteinu značeného deuteriem (2H), v případě proteinů expresí v mediu připraveném z těžké vody (2H20). Tímto způsobem lze studovat i velké biomakromolekuly, například proteiny složené z tisíců aminokyselin. Zvláštním případem molekul jsou přirozeně neuspořádané proteiny, jejichž konformace se stále mění a nedají se tedy popsat jedním strukturním modelem. Relaxace takových molekul je většinou pomalá bez ohledu na počet aminokyselin. Není proto těžké naměřit spektra s vysokou intenzitou signálu. Je ale důležité dosáhnout dostatečného rozlišení, protože pohyby molekuly průměrují chemické posuny různých aminokyselin k téměř stejným hodnotám. V současné době jsou k dispozici experimenty, které potřebné rozlišení poskytují. Pro neuspořádané proteiny nemá cenu hledat definovanou strukturu. Pomocí analýzy chemických posunů můžeme ale spočítat zastoupení jednotlivých konformací. Pomocí metod citlivějších, než je měření NOE,23 můžeme sledovat i krátkodobou tvorbu kompaktních trojrozměrných struktur. Dosud jsme mluvili jen o rozpustných proteinech. Velké úsilí je také vynakládáno na studium membránových proteinů. Membránové proteiny můžeme například zkoumat v roztoku, když je zabudujeme do malých lipidových micel. Strukturu proteinů nerozpustných ve vodě lze studovat v pevné fázi, nejlépe v mikrokrystalických vzorcích. Měření v pevné fázi jsou technicky náročnější, než měření v roztoku, a je obtížnější určit přesnou konformaci větších molekul. Rozdíly použitelnosti metody pro kapalné a pevné vzorky se ale snižují a struktury některých důležitých proteinů již byly určeny pomocí NMR v pevné fázi. Citlivost detekce je dána poměrem signálu k šumu. Pro lepší potlačení šumu jsou v poslední době detekční zařízení chlazena plynným heliem na teplotu blízkou absolutní nule. 22Značení 15N je několikrát levnější než značení 13C. Proto je výhodné značení 13C vynechat a využít pouze přirozeného zastoupení izotopů uhlíku. 23Krátkodobé kontakty nebo delší vzdálenosti můžeme studovat pomocí nepárových elektronů (volných radikálů). Když takovou funkční skupinu vneseme do molekuly proteinu, urychlí ve svém okolí výrazně relaxaci. Můžeme buď pozorovat pokles intenzity signálu, nebo přímo měřit rychlosti relaxace. KAPITOLA 14. NUKLEÁRNÍ MAGNETICKÁ REZONANCE Kapitola 15 Bioinformatika 15.1 Co to je bioinformatika V předchozích kapitolách jsme si popsali metody, pomocí kterých můžeme zkoumat strukturu velkých biologicky zajímavých molekul. Za poměrně krátkou dobu používání těchto metod se biochemici a biologové dozvěděli o struktuře biomakromolekul velmi mnoho. Dokonce tolik, že je již téměř nemožné se v záplavě zveřejněných struktur vyznat. Navíc předpovídání struktur ze sekvence dosáhla úrovně takové spolehlivosti, že má smysl struktury předpovězené z pořadí aminokyselin brát vážně. Protože takové množství strukturních dat nelze zvládnout lidskou silou, posedáváním v knihovně s tužkou v ruce, vznikl nový vědní obor, který se snaží vnést do záplavy informací řád s pomocí počítačů. Pro tento obor se ujal název bioinformatika. Bioinformatika se narodila v osmdesátých létech dvacátého století. Matkou jí byla čile se vyvíjející počítačová technologie, otcem záměr sekvenovat co nejvíce DNA. Přečtené úseky DNA bylo nutno vzájemně srovnávat a analyzovat. Úroveň výpočetní techniky byla schopná množství dat zvládnout. O několik let později začal rychle růst počet biomakromolekul, u kterých se podařilo určit prostorovou strukturu. Také strukturní informace bylo třeba třídit. Dnes je bioinformatika nejdůležitější aplikací počítačů v biologických vědách. Chceme-li tento nový obor definovat, můžeme říci, že bioinformatika je informační technologie sloužící k uchování, zpracování a analýze biologických dat. 15.2 Genomové projekty V sekci 9.4 jsme si ukázali, že určit sekvenci úseku DNA je poměrně snadné. To přivedlo molekulární biology na myšlenku přečíst celou genetickou informaci některých organismů. Již v roce 1977 byl sekvenován genom viru 0X174, obsahující 5 000 nukleotidů a 11 genů. V roce 1995 byla určena první úplná sekvence genomu skutečného organismu, bakterie Haemophilus influenzae, s 1,8 miliony nukleotidů a 1 700 genů. Cílem genomového projektu bylo získat úplné sekvence DNA modelových organismů: střevní bakterie Escherichia coli, kvasinky Saccharomyces cerevisiae, červa Cenorhabditis elegans, húseničku rolního (Arabidopsis thaliana), mušky Drosophila melanogaster, myšky Mus musculus, psa (Canis familiaris) a autora celého projektu {Horno sapiens). Genomový projekt se podobá postupu člověka neznalého arabštiny, který si pořídí Korán. Bude potřebovat několik dnů na to, aby se naučil arabská písmena. V tom okamžiku bude schopen celý Korán „přečíst", tak jak my umíme „přečíst" genom. Bude ale trvat měsíce, než náš čtenář Koránu začne rozumět tomu, co čte. Stejně tak je velký rozdíl mezi samotnou genetickou informací a funkcemi buňky, které kóduje. 217 218 KAPITOLA 15. BIOINFORMATIKA Zmínili jsme se již v sekci 8.2, že vyjádření (exprese) informace uložené v DNA je složitý proces. Je proto dobré si uvědomit jednotlivé úrovně genetické informace: 1. Genom je informace zapsaná v DNA tvořící chromosomy, je společná všem buňkám organismu. 2. Transkritpom je část genomu, která je exprimována v buňce v dané fázi jejího vývoje. 3. Proteom je sada vzájemně interagujících molekul geneticky kódovaných proteinů, která dává buňkám její individuální charakter. Jistě vás nepřekvapí, že ze všech modelových genomů se největšímu zájmu těší genom člověka. Sekvenace lidského genomu zahájená v polovině 80. let dvacátého století představuje dvacetileté úsilí mnoha laboratoří. Mimořádná popularita lidského genomového projektu vyprovokovala technický vývoj sekvenovacích automatů a potřebných výpočetních metod. Roku 2000 byla představena předběžná verze, lidský genom „nanečisto" (first draft). K této předběžné verzi se dopracovaly nezávisle dva velké týmy: sdružení akademických laboratoří International Consortium Human Genome Project a komerční firma Celera Genomics. Dalších dvacet let trvalo dokončení četby zvlášť obtížných částí genomu. Již předběžné výsledky sekvenace ukázaly, že lidský genom obsahuje asi třicet tisíc genů, které ovšem kódují mnohem více proteinů. Stovky genů získal člověk z bakterií. Zajímavé jsou také poznatky o samovolných změnách genetické informace, o mutacích. Genetická informace se mění dvakrát rychleji u mužů než u žen. Celkem bylo odhaleno 1,4 milionu jednobodových polymorfismů (rozdílů genomů v jednom nukleotidu). Dnes je již kompletně přečtena genová informace mnoha organismů. 15.3 Biologické databáze Biologické databáze jsou vlastně elektronické kartotéky biologicky zajímavých údajů. Díky své elektronické formě jsou mnohem pružnější než to, čemu se obvykle říkalo „kartotéka" ve 20. století (plechové skříně plné kartiček z tvrdého papíru). Údaje v elektronických databázích můžeme mnohem snadněji třídit, analyzovat, porovnávat s jinými daty. Biologických databází je mnoho druhů. Databáze můžeme třídit podle různých měřítek, například podle obsahu. Nás budou nejvíce zajímat databáze sekvencí a prostorových struktur proteinů a nukleových kyselin. Jiným měřítkem je způsob uložení dat. Databáze může obsahovat jednotlivé položky jako jednoduché textové soubory (fiat files, obrázek 15.1). Data mohou být ale také uspořádána jako v tabulkách, mluvíme pak o relačních databázích. Řádky takových tabulek tvoří jednotlivé položky, zatímco sloupce odpovídají základním charakteristikám položek (obrázek 15.2). Třetí možností je ukládání dat ve formě abstraktních objektů, takovým databázím říkáme objektově orientované. Jednotlivé objekty můžeme spojovat do vyšších objektů a zacházet s nimi jako s celky, což umožňuje velmi efektivní analýzu dat. Ještě jiný způsob třídění rozlišuje tři druhy databází sekvencí podle způsobu jejich vzniku. Prvním druhem jsou databáze primární, které obsahují vlastní sekvence. Druhým typem jsou databáze sekundární, které obsahují další údaje odvozené ze sekvencí. Třetím druhem jsou databáze složené, které slučují několik primárních databází. Je nutné také upozornit na to, že databáze se stále vyvíjejí. Nové vznikají a staré se slučují. Organizace, které databáze spravují se transformují nebo dokonce zanikají. A i u navenek nezměněných databází probíhá stálý a rychlý vývoj výpočetních prostředků, pomocí kterých se databáze prohledávají a analyzují. Informace o databázích proto rychle zastarává a místo konkrétních fakt je lépe pamatovat si, kde nalezneme odkazy na aktuální stav. Takový zdroj informací poskytuje Swiss Institute of Bioin-formatics již od roku 1993 pod názvem Expasy. Na sklonku roku 2013 vznikla evropská „střecha" nad databázemi a výpočetními zdroji zvaná ELIXÍR. Internetové stránky těchto platform jsou vhodným začátkem hledání současných databází a prostředků jejich analýz. 15.3. BIOLOGICKÉ DATABÁZE 219 DT 01-OCT-1989 (Rel. 12, Last sequence update] DT 10-OCT-2003 (Rel. 42, Last annotation update] DE Major urinary protein 1 precursor (MUP 1]. GN MUP1. OS Mus musculus (Mouse]. OC Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; OC Mammalia; Eutheria; Rodentia; Sciurognathi; Muridae; Murinae; Mus. OX NCBI TaxID=10090; RN [1] RP SEQUENCE FROM N.A. RC STRAIN=BALB/c; TISSUE=Liver; RX MEDLINE=872578 97; PubMed=3600652; RA Shahan K., Gilmartin M., Derman E.; RT "Nucleotide sequences of liver, lachrymal, and submaxillary gland RT mouse major urinary protein mRNAs: mosaic structure and construction RT of panels of gene-specific synthetic oligonucleotide probes."; RL Mol. Cell. Biol. 7:1938-1946(1987]. RN [2] RP SEQUENCE FROM N.A. RC TISSUE=Liver; RX MEDLINE=88007832; PubMed=2888770; RA Bennett A.L., Paulson K.E., Miller R.E., Darnell J.E. Jr.; RT "Acquisition of antigens characteristic of adult pericentral RT hepatocytes by differentiating fetal hepatoblasts in vitro."; RL J. Cell Biol. 105:1073-1085(1987]. RN [3] RP SEQUENCE FROM N.A. RC TISSUE=Liver; RX MEDLINE=22388257; PubMed=12477932; RA Strausberg R.L., Feingold E.A., Grouse L.H., Derge J.G., RA Klausner R.D., Collins F.S., Wagner L., Shenmen CM., Schuler G.D., RA Altschul S.F., Zeeberg B., Buetow K.H., Schaefer C.F., Bhat N.K., RA Hopkins R.F., Jordan H., Moore T., Max S.I., Wang J., Hsieh F., RA Diatchenko L., Marusina K., Farmer A.A., Rubin G.M., Hong L., RA Stapleton M., Soares M.B., Bonaldo M.F., Casavant T.L., Scheetz T.E., RA Brownstein M.J., Usdin T.B., Toshiyuki S., Carninci P., Prange C, RA Raha S.S., Loquellano N.A., Peters G.J., Abramson R.D., Mullahy S.J., RA Bosak S.A., McEwan P.J., McKernan K.J., Malek J.A., Gunaratne P.H., RA Richards S., Worley K.C., Hale S., Garcia A.M., Gay L.J., Hulyk S.W., RA Villalon D.K., Muzny D.M., Sodergren E.J., Lu X., Gibbs R.A., RA Fahey J., Helton E., Ketteman M., Madan A., Rodrigues S., Sanchez A., RA Whiting M., Madan A., Young A.C., Shevchenko Y., Bouffard G.G., RA Blakesley R.W., Touchman J.W., Green E.D., Dickson M.C., RA Rodriguez A.C., Grimwood J., Schmutz J., Myers R.M., RA Butterfield Y.S.N., Krzywinski M.I., Skalska U., Smailus D.E., RA Schnerch A., Schein J.E., Jones S.J.M., Marra M.A.; RT "Generation and initial analysis of more than 15,000 full-length RT human and mouse cDNA sequences."; RL Proc. Natl. Acad. Sei. U.S.A. 9 9:16899-16903(2002]. RN [4] RP SEQUENCE OF 20-41 FROM N.A. RX MEDLINE=822 65 923; PubMed=7107707; RA Krauter K., Leinwand L., D'Eustachio P., Ruddle F., RA Darnell J.E. Jr.; RT "Structural genes of the mouse major urinary protein are on RT chromosome 4 . " ; RL J. Cell Biol. 94:414-417(1982]. CC -!- FUNCTION: Binds pheromones, the pheromones are released from CC drying urine of males and affect the sexual behavior of females. CC -!- SUBCELLULAR LOCATION: Secreted. CC -!- TISSUE SPECIFICITY: Abundant in the urine of adult male rats but CC absent from that of females. CC CC CC -!- SIMILARITY: Belongs to the lipocalin family. This SWISS-PROT entry is copyright. It is produced through a collabor ation CC between the Swiss Institute of Bioinformatics and the EMBL outstat ion - CC the European Bioinformatics Institute. There are no restrictions on its CC use by non-profit institutions as long as its content is in no way CC modified and this statement is not removed. Usage by and for comme rcial CC entities requires a license agreement (See http://www.isb-sib.ch/anno unce/ CC CC DR or send an email to licensesisb-sib.ch]. EMBL; Ml 6355; AAA3 97 67.1; -. DR EMBL; M28 64 9; AAA3 97 64.1; ALT_INIT. DR EMBL; BC012221; AAH12221.1; -. DR EMBL; J00 607; AAA3 97 60.1; -. DR HSSP; P02762; 1MUP. DR MGD; MGI:97233; Mupl. DR InterPro; IPR002345; Lipocalin. DR InterPro; IPR000566; Lipocln_cytFABP. DR Pfam; PF00061; lipocalin; 1. DR PRINTS; PR0017 9; LIPOCALIN. DR PROSITE; PS00213; LIPOCALIN; 1. KW Glycoprotein; Signal; Pheromone-binding; Transport; Lipocalin; KW Multigene family. FT SIGNAL 1 18 FT CHAIN 19 180 MAJOR URINARY PROTEIN 1. FT DISULFID 82 175 BY SIMILARITY. FT CONFLICT 44 44 S —> F (IN REF. 2). FT CONFLICT 127 127 K —> N (IN REF. 2). SQ SEQUENCE 180 AA; 20648 MW; 5AA429BDA0700347 CRC64; MKMLLLLCLG LTLVCVHAEE ASSTGRNFNV EKINGEWHTI ILASDKREKI EDNGNFRLFL EQIHVLENSL VLKFHTVRDE ECSELSMVAD KTEKAGEYSV TYDGFNTFTI PKTDYDNFLM AHLINEKDGE TFQLMGLYGR EPDLSSDIKE RFAQLCEKHG ILRENIIDLS NANRCLQARE // Obrázek 15.1: Příklad jednoduchého textového souboru. 220 KAPITOLA 15. BIOINFORMATIKA Article ID Journal Volume Pages Year 001 Dev. Psychobiol. 19 155-161 1986 002 J. Exp. Zool. 265 558-586 1993 003 Behav. Genet. 23 51-58 1993 004 Biochem. J. 315 461-466 1995 Article ID Author number Author name 001 1 Drickamer, L. C. 002 1 Barkley, M. 002 2 DelgadoDeLeon, D. 002 3 Weste, R. 003 1 Williams, J. R. 003 2 Lenington , S. 004 1 Beynon, R. J. 004 2 Oliver, S. 004 3 Robertson, D. H. L. Obrázek 15.2: Databáze odkazů na odborné články jako příklad relační databáze. 15.4 Databáze sekvencí proteinů Známé sekvence proteinů jsou uchovávány v různých primárních databázích. Nej důležitější a nejužitečnější jsou následující dvě • SWISS-PROT je nejpoužívanější databází proteinových sekvencí. Tato databáze vznikla na ženevské univerzitě, později ji převzal European Bioinformatics Institute (EBI), nyní o ni pečuje Swiss Institute of Bioinformatics (SIB). SWISS-PROT je zaměřen na vysokou kvalitu položek. Každou sekvenci provází podrobná anotace, tedy popis funkce, struktury, domén, posttranslačních modifikací atd. Tyto popisy jsou psány lidskou rukou, což zaručuje jejich vysokou kvalitu. SWISS-PROT obsahuje minimální počet opakujících se (a proto zbytečných, redundantních) položek, umožňuje účinné prohledávání a je propojen s mnoha dalšími databázemi. Příklad položky databáze SWISS-PROT je uveden na obrázku 15.1 • TrEMBL obsahuje všechny sekvence proteinů odvozené z databáze sekvencí DNA, která bude zmíněna v sekci 15.5. Anotace jsou tvořeny automaticky počítačem, což umožňuje velmi rychlý, ale méně kvalitní popis sekvence. Zkontrolované položky jsou potom ručně anotovány a přesouvány do databáze SWISS-PROT. Obě zmíněné databáze byly integrovány do UniProt KnowleddgeBase (pod názvy UniProt/Swiss-prot a UniProt/TrEMBL). UniProt KB tak můžeme považovat za příklad složené databáze sekvencí proteinů. Zatím jsme hovořili pouze o databázích, které obsahují jednotlivé sekvence proteinů s příslušným popisem. Podívejme se nyní na databáze sekundární, které obsahují již výsledky analýz sekvencí. Nejdříve si ale musíme vysvětlit, co takovým výsledkem analýzy sekvence vlastně je. Každá sekvence uložená v primární databázi je konkrétní údaj, jeden kamínek v mozaice. Když se nám podaří takových kamínků odkrýt více, začínáme vidět obraz, který mozaika znázorňuje. Několika sekvencím je společný určitý obecný rys, nějaké pravidlo, podle kterého je daný druh molekuly postaven. Například první aminokyselina musí být methionin, druhá a třetí glycin, čtvrtá nějaká aromatická, pátá cystein, šestá a sedmá mohou být libovolné, osmá musí být kyselina glutamová nebo asparagová, devátá alifatická hydrofobní, atd. Tvorba sekundární databáze je tedy proces abstrakce. Zatímco v primárních databázích jsou uloženy konkrétní sekvence, sekundární databáze obsahují abstraktní principy. 15.5. DATABÁZE SEKVENCÍ DNA 221 Nejjednodušším příkladem abstrakce je sekvenční motiv. Sekvence proteinů obsahuje obvykle úseky, které jsou velmi podobné částem sekvencí jiných proteinů a úseky, které se naopak ostatním sekvencím podobají málo. Úseky sekvencí, které se s drobnými obměnami objevují v různých proteinech, se nazývají motivy. Podle zacházení s motivy můžeme sekundární databáze dělit na následující tři skupiny: 1. Databáze obsahující jednotlivé motivy. Příkladem může být nejstarší sekundární databáze PROSÍTE, která využívá především primární databázi SWISS-PROT a je udržována stejnou institucí (SIB). Motivy jsou v ní uloženy ve formě regulárních výrazů1. Záznamy v databázi PROSÍTE jsou uloženy ve dvou oddělených souborech, první obsahuje vlastní data a druhý podrobnou dokumentaci. Data jsou získávána automatickým vícenásobným přiložením sekvencí (viz sekci 15.8) a ručním výběrem úseků, které jsou konzervované (nacházejí se s malými obměnami v různých proteinech). Dokumentace je zpracována ručně. Cílem databáze PROSÍTE je umožnit identifikaci skupin příbuzných proteinů (proteinových rodin). 2. Databáze obsahující soubor všech motivů v sekvenci (takzvaný fingerprint, česky otisk prstu sekvence). Fingerprinty mohou být definovány na základě frekvenčních matic (tabulek udávajících, jak často se která aminokyselina nachází na daném místě; příkladem je databáze PRINTS). 3. Databáze obsahující nejen motivy, ale výsledky analýz celých sekvencí. Použitou abstrakcí v těchto databázích jsou profily (tabulky udávající, jak často se na daném místě nachází určitá aminokyselina nebo jak často na tomto místě dochází k inzerci nebo deleci2; příkladem je databáze PROFILES) nebo skryté Markovovy modely (matematické statistické algoritmy, které popisují výstavbu sekvence jako sled inzercí, delecí, nebo shod v aminokyselině na každém místě sekvence; příkladem je databáze Pfam). Uvedené sekundární databáze (a některé další) jsou sdruženy pod návem InterPro. Každá sekundární databáze má své výhody a nevýhody. Je na nás, abychom se rozhodli, který přístup je nejlepší pro řešení problému, kterým se zabýváme. Také si musíme uvědomit, že sekundární databáze obsahují i chyby vyplývající z analýzy sekvencí. Každý postup vyhledávání společných rysů nese riziko, že vidíme příbuznost tam, kde ve skutečnosti není, nebo naopak příbuznost přehlédneme. Různé databáze analyzují stejné sekvence různě a mohou v nich tedy vidět různé (skutečné i jen zdánlivé) abstraktní principy. K údajům, které ze sekundárních databází získáme, je proto nutno přistupovat kriticky. Je vhodné analyzovat sekvenci s využitím různých metod a hledat, v čem se výsledky shodují (consensus). Zvýšíme tak pravděpodobnost správného závěru analýzy. 15.5 Databáze sekvencí DNA V sekci 15.4 jsme si popsali databáze, které uchovávají sekvence proteinů. V databázích jsou proteinové sekvence uloženy jako pořadí aminokyselin pomocí nám dobře známé abecedy, která se skládá z dvaceti písmen. Ve skutečnosti je ovšem většina sekvencí proteinů určena na základě sekvenace DNA a z abecedy DNA do abecedy proteinů přeložena pomocí genetické kódovací tabulky (takzvaná koncepční translace). Známých sekvencí úseků DNA je ale více než těch, které tvoří geny určitého proteinu. Během desetiletí byla v laboratořích přečtena spousta úseků DNA, které nekódují žádný protein, nebo krátkých úseků, ze kterých nemůžeme určit úplnou sekvenci proteinu. Aby byl vnesen jakýsi řád i do těchto dat, -•-Zápis konkrétní sekvence je nepřetržitá řada znaků, každým znakem je jedno z dvaceti písmen symbolizující určitou aminokyselinu. Zápis motivu je obecnější. Jednotlivým znakem může být opět jedno písmeno (to znamená, že na daném místě je vždy určitá aminokyselina), nebo volba z více písmen (to znamená, že na daném místě je vždy jedna z uvedených aminokyselin), nebo speciální znak, zvaný divoká karta či žolík, za který můžeme dosadit jakoukoli aminokyselinu. Motiv, který jsme si jako příklad popsali slovně, můžeme zapsat pomocí následujícího regulárního výrazu: M-G-G-[FYW]-C-x2-[DE]-[IVL]. 2Delece je vypuštění aminokyseliny ze sekvence, inzerce je zařazení další aminokyseliny. 222 KAPITOLA 15. BIOINFORMATIKA bylo založeno několik databází, které ukládají sekvence úseků DNA. Nej důležitější jsou následující tři databáze EN A (European Nucleotide Archive) je evropská databáze vyvinutá v (European Molecular Biology Laboratory). GenBank je obdobná americká databáze vyvinutá v National Center for Biotechnology Information (NCBI) při National Institute of Health (NIH) v Bethesdě. DNA Data Bank of Japan (DDBJ) je třetí důležitou databází, vyvinutou japonským Národním ústavem genetiky. Všechny tři databáze úzce spolupracují a vyměňují si nové položky. Obsahem by se proto neměly lišit, takže rozhodnutí, kterou databázi využít, vyplývá hlavně z toho, který vyhledávací systém nám více vyhovuje. Vedle zmíněné trojice databází, která uchovává všechny DNA sekvence s anotací, existují i databáze specializované. Jako příklad můžeme uvést databázi GSDB, která uchovává sekvence určené v rámci genomových projektů, nebo databázi dbEST, která obsahuje takzvané exprimované sekvenční značky (EST3). 15.6 Databáze struktur biomakromolekul Přesná prostorová struktura byla určena jen pro malou část proteinů, jejichž sekvenci známe. I tak se známé struktury počítají na tisíce. Nepřekvapí proto, že byly vytvořeny databáze, ve kterých jsou struktury proteinů (a nejen proteinů) uloženy. Nejdůležitější databází struktur je Protein Data Bank (PDB) která byla vyvinuta v Brookhaven National Laboratory a od roku 1998 je udržována v rámci Research Collaboratory for Structural Bioin-formatics (RCSB). Od roku 2003 je spolu s obdobnou evropskou (PDBe) a japonskou (PDBj) databází součástí Worldwide Protein Data Bank (wwPDB), která od roku 2006 zahrnuje i databázi NMR dat (BioMagResBank). PDB uchovává struktury všech proteinů (ale i jiných biomakromolekul), které byly určeny rentgenovou difrakcí, nukleární magnetickou rezonancí a kryo-elektronovou mikroskopií. Struktury jsou uloženy v textových souborech, které obsahují informace o proteinu a souřadnice jeho atomů. Každá struktura je označena jedinečným identifikačním kódem, složeným ze čtyř znaků (číslic a písmen), například „1DUF". Struktury je možné hledat také podle klíčových slov. Souřadnice atomů můžete uložit ve svém počítači, nebo si můžete trojrozměrný model molekuly prohlédnout na internetových stránkách PDB. Kromě PDB existují i databáze obsahující analýzy struktur, podobně jako sekundární databáze obsahují analýzy sekvencí. Databáze PDBSum obsahuje shrnutí informací z PDB a přehledem analýzy struktury. Další databáze analyzující struktury slouží klasifikaci proteinů. Nejstaršími takovými databázemi jsou SCOP a CATH. Databáze SCOP (Structural Classification of Proteins) byla vyvinuta v MRC Laboratory of Molecular Biology ve Velké Británii. Struktury jsou porovnávány kombinací automatických a ručních metod a tříděny na třech úrovních. Nejvýše stojí v hierarchii fold. Do stejného foldu patří proteiny se stejnými elementy sekundární struktury, ale bez známky příbuznosti. Další úrovní je superrodina (superfamily), sdružující proteiny s podobnou strukturou i funkcí (což svědčí pro jejich společný původ), ale s velmi rozdílnými sekvencemi. Konečně do stejné rodiny (family) patří proteiny, které se podobají strukturou i sekvencí (více než 30 % aminokyselin shodných). Odlišnou strukturní hierarchii, obsaženou přímo v názvu, používá databáze CATH (Class-Architecture-Topology-Homology), vyvinutá na University College London. Nejvýše v hierarchii stojí třída (class). Každý protein je zařazen do jedné ze čtyř tříd: a-proteiny, /3-proteiny, a-j3-proteiny (obsahují proteiny a/j3 i a+f3) a proteiny s nízkým obsahem sekundární struktury. Další úrovní je architektura (architecture), která popisuje vzájemné prostorové uspořádání prvků sekundární struktury, aniž by se zabývala tím, jak jsou tyto prvky propojeny. Na třetí úrovni, topology, jsou pak proteiny dále tříděny podle topologie spojení prvků sekundární struktury. Čtvrtou úrovní je homology. Do skupiny se stejnou SEST (Expressed Sequence Tag) je krátký náhodně zvolený úsek sequence cDNA (viz sekci 8.4), pomocí kterého můžeme sledovat, jestli dochází k expresi daného genu v určité tkáni. 15.7. PÁROVÉ PŘILOŽENÍ SEKVENCÍ (PAIRWISE SEQUENCE ALIGNMENT) 223 homologií patří proteiny, které mají více než 35 % sekvence shodné (předpokládá se, že mají společného předchůdce). 15.7 Párové přiložení sekvencí (pairwise sequence alignment) Chceme-li porovnat dvě sekvence, hledáme způsob, jak je přiložit vedle sebe tak, aby proti sobě bylo co nejvíce stejných aminokyselin (obrázek 15.3). Takový způsob se nazývá anglicky pairwise alignment, což můžeme do češtiny přeložit jako párové přiložení Náš úkol je komplikován tím, že u jedné sekvence mohlo dojít k vyřazení (deleci) některé aminokyseliny, nebo naopak k zařazení (inzerci) aminokyseliny nové. Proto lze lepšího přiložení dosáhnout tehdy, když máme možnost do sekvence vkládat i mezery (anglicky gap). Tohoto prostředku musí být ale užíváno s mírou. Neomezeným vkládáním mezer můžeme samozřejmě dosáhnout toho, že i úplně odlišné sekvence přiložíme tak, aby proti sobě vždycky ležely stejné aminokyseliny. Ještě složitějším úkolem je přiložit vedle sebe nejen stejné aminokyseliny, ale také aminokyseliny podobné. Podobnost aminokyselin je třeba nějakým způsobem definovat. Jednou možností je sestavit tabulku (matici) pravděpodobností, se kterou dochází k záměně (mutaci) aminokyselin příbuzných proteinů v přírodě. Příkladem takové tabulky je matice zvaná BLOSUM62 (BLock SUbstitution Matrix, spočítaná pro proteiny s alespoň 62 % identických aminokyselin). Již z tohoto jednoduchého úvodu je zřejmé, že párové přiložení je poměrně složitý úkol. Řešíme jej pomocí matematických modelů, jejichž vlastnosti měníme nastavením různých parametrů. ulimit -t 30; /usr/molbio/bin/lalign -f -14 -g -4 -K 3 ./wwwtmp/.7897.1.seq ./wwwtmp/.7897.2.seq > ./wwwtmp/.7897.out LALIGN finds the best local alignments between two sequences version 2.1u09 December 2006 Please cite: X. Huang and W. Miller (1991) Adv. Appl. Math. 12:373-381 alignments < E( 0.05):score: 42 (3 max) Comparison of: (A) ./wwwtmp/.7897.1.seq unknown 121 bp - 121 aa (B) ./wwwtmp/.7897.2.seq unknown 121 bp - 121 aa using matrix file: BL50 (15/-5), gap-open/ext: -14/-4 E(limit) 0.05 61.2% identity in 121 aa overlap (1-121:1-121); score: 579 E(10000): 4.3e-52 10 20 30 40 50 60 unknow DHHAAECKNEWFEYNGKCYFFETTTKTWALAQKECEEDDATLAVIDEEKDMAFLKRYAGG unknow DEHVEECEEDWVGYQRKCYFIETVKREWTEAQNACEEHGATLAVIDEEKDMNFLKRYAGR 10 20 30 40 50 60 70 80 90 100 110 120 unknow LKHWIGLRNEAEQTWKWANGKEFNEWFNVTGEKKCVELNHTDVAEVDCEANLHWICEKPE unknow EEHWVGLKKEPGHPWKWENGKEFNNWFNVTGEEKCVFLKNTEVEEMECEKNLYWICNKPY 70 80 90 100 110 120 unknow R 44.4% identity in 18 aa overlap (9-24:84-101); score: 48 E(10000): 1.4e+02 10 20 unknow NEWFSYNG—KCYFFETT unknow NNWFNVTGSEKCVFLKNT 90 100 Obrázek 15.3: Příklad párového přiložení (výstup programu LALIGN). Nalézt párové přiložení celé dlouhé sekvence (globální přiložení) je výpočetně velmi náročné. Algoritmy párového přiložení se proto často opírají o hledání podobností v rámci krátkých úseků sekvence 224 KAPITOLA 15. BIOINFORMATIKA (lokální přiložení). Tak pracují nejběžnější algoritmy FastA a BLAST (Basic Local Alignment Search Tool). Vylepšená verze algoritmu BLAST, která umožňuje vložení mezer, je dnes nej používanější metodou prohledávání databází. Algoritmus nejprve vyhledává přiložení krátkých úseků sekvence bez mezer, pak se snaží rozšířit přiložení tak, aby proti sobě leželo co nejvíc shodných aminokyselin. Pro měření shody se počítá určité skóre, takže hledáme páry s vysokým skóre (high-scoring pairs). Nakonec se přiložení vylepší vložením mezer. Abychom mohli odhadnout, nakolik přiložení odhaluje skutečnou příbuznost sekvencí, výsledky algoritmů obsahují i údaj o pravděpodobnosti, že přiložení je dílem náhody (hodnota p v algoritmu BLAST), nebo očekávaný počet úseků dané délky, které jsou náhodou shodné v prohledávané databázi (hodnota E). Máme-li přiložení věřit, musí být hodnoty p i E co nejmenší. Pod zkratkou BLAST se ve skutečnosti skrývá celou rodinu programů. Jedním z nich je PSI-BLAST (Position-Specific Iterated BLAST), který kombinuje metody párového a vícenásobného přiložení, o kterém bude řeč v části 15.8. V první fázi hledá nejlepší párové přiřazení. V rámci nejlepších výsledků tohoto kroku provede vícenásobné přiložení a vytvoří profil, o kterém jsme mluvili při diskusi sekundárních databází v sekci 15.4. Na základě profilu znovu prohledává databáze a snaží se najít vzdáleně příbuzné sekvence, které v minulém kroku přehlédl. Takovýmto opakovaným prohledáváním umí PSI-BLAST odhalit i velmi slabou podobnost. PSI-BLAST je proto jednou z nej citlivějších metod detekce vzdálených příbuzných. Tato výhoda ale může být i nevýhodou. Do profilu se nám mohou vloudit sekvence tvořené kratičkými stále se opakujícími úseky (takzvané oblasti s nízkou komplexitou). Příkladem může být kolagen, v němž se pravidelně opakuje trojice aminokyselin Gly-Pro-Pro. V takovém případě prohledávání selže a snaží se nám vnutit zdánlivou podobnost se zcela odlišnými proteiny. 15.8 Vícenásobné přiložení (multiple sequence alignment) Často chceme vědět nejen to, jak se sobě navzájem podobají dvě sekvence. Chceme zkoumat vzájemnou podobnost v rámci celé skupiny sekvencí, která například patří do stejné proteinové rodiny. Snažíme se proto přiložit k sobě více sekvencí tak, abychom vytvořili tabulku, ve které bude na každém řádku jedna sekvence a ve sloupcích pod sebou budou co nejpodobnější aminokyseliny. Tato metoda, zvaná multiple sequence alignment (MSA, vícenásobné přiložení sekvencí), je nepostradatelná při analýze genových rodin a tvorbě sekundárních databází. Nejlepší způsob přiložení je poskládat sekvence tak, aby každý sloupeček tabulky tvořily aminokyseliny, které jsou na stejném místě ve struktuře proteinu. Protože prostorovou strukturu známe jen pro omezený počet proteinů, musíme často skládat tabulky vícenásobného přiložení jen na základě sekvencí, podle podobnosti aminokyselin. Například kyselina asparagová by se měla nejlépe ocitnout ve sloupečku tvořeném kyselinou asparagovou. Pokud to nejde, tak by měla být ve sloupečku tvořeném zejména kyselinou glutamovou (té se nejvíc podobá nábojem) nebo asparaginem (tomu se podobá velikostí a tvarem postranního řetězce). Již méně je kyselina asparagová podobná krátkým polárním aminokyselinám a velmi se liší od aminokyselin s dlouhými nepolárními postranními řetězci. Je možné hledat najednou nejlepší přiložení celé skupiny sekvencí. Takovým způsobem pracují simultánní metody, které jsou však výpočetně náročné. Častější je postupné budování tabulky přiložení pomocí progresivních (postupných) metod. Oblíbeným programem založeným na postupném přístupu je CLUSTAL. Tento program k sobě postupně přikládá dvojice sekvencí, třídí je podle vzájemné podobnosti a vytváří strom příbuznosti, jaký znáte ze šlechtických rodokmenů. Nejpodobnější sekvence odpovídají sousedním větvím stromu, zatímco málo podobné sekvence představují vzdálené větve. Rozšířenou verzí tohoto programu je CLUSTAL W, který se na základě mezer již vložených do sekvencí snaží vkládat mezery další a tak hledat způsoby přiložení velmi málo podobných sekvencí (obrázek 15.4). Od roku 2011 vyvíjená verze CLUSTAL Omega znamená výrazné zlepšení v analýze velkého množství frekvencí. 15.8. VÍCENÁSOBNÉ PŘILOŽENÍ (MULTIPLE SEQUENCE ALIGNMENT) 225 CLUSTAL W (1.83) multiple sequence alignment lcl|39479 ------------------------------------------------------------ gi 114643484 --------------------------------------------------------MEEE gi 4502681 --------------------------------------------------------MEEE gi 109095584 --------------------------------------------------------MEED gi 297691098 --------------------------------------------------------MMIR gi 281307080 ------------------------------------------------------------ gi 296211377 --------------------------------------------------------MEEE gi 10835551 ------------------------------------------------------------ gi 291392855 --------------------------------------------------------MDSE gi 73997679 MAEEAARGQIMDLLNYQKVEGFYDIDAEDEGKIQLVEEFYMYECEKAHFRQQGKPAAYHN lcl|39479 ------------------------------------------------------------ gi 114643484 NC----FVAENSSLHPESGQENDATSPHFSTRHEGSFQVPVLCAVMNVVFITILIIALIA gi 4 5 02 6 81 NC----FVAENSSLHPESGQENDATSPHFSTRHEGSFQVPVLCAVMNVVFITILIIALIA gi 10 90 95584 HC----YVTENSSLHPESGQENDATSPRFSTHREGSFQVPVLCAVMNVVFITILIIALIA gi 2 97 6 910 98 HNGREDMVLRTFFLYTLFRILLFEFYPLLYHHLAQHEILRLVLHAVGIWFLLLLKQEIFL gi 281307080 ------------------------------------------------------------ gi 29 6211377 NC----FITENEELHPKEKQEEDANEPHFETQREGFFQVPVLCAWNVVFITILIITLIA gi 10835551 ------------------------------------------------------------ gi 2 913 92855 DCS----ITENEELHLEEDQKDVAAEYRFAAEHEGELQVPVPCAVMYVVFTTILVIALIA gi 73997679 NTFRLEFIINFLS-------SDQAASPHFATQHEGSLQVPIPCAWNVVLITVLII ALIA lcl I 3 9479 -----------MENLEEFDHHAAECKNEWFEYNGKCYFFETTTKTWALAQKECEEDDATL gi 114 64 34 84 LEVGQYNCPGQYTFEMPEDEHVEECEEDWVGYQRKCYFIETVKREWTEAQNACEEHGATL gi 4502 681 LEVGQYNCPGQYTFEMPEDEHVEECEEDWVGYQRKCYFIETVKREWTEAQNACEEHGATL gi 10 90 95584 LEVGQYNCPGQYTFEMPEDEHVEECEDDWVEYQRKCYFIETVKREWTEAQEACEEHGATL gi 2 97 6 910 98 FTVGQYNCPGQYTFEMPEDEHVEECEEDWVGYQRKCYFIETVKREWTEAQNACEEHGATL gi 281307080 ---------GQYTFEMPEDEHVEECEEDWVGYQRKCYFIETVKREWTEAQNACEEHGATL gi 2 9 6211377 LEVGKYNCPGQYTFEVPEDEDVEECLDDWVGYQRKCYFIETVKKEWTEAQNACEEHGATL gi 10835551 ---------------------VEECEEDWVGYQRKCYFIETVKREWTEAQNACEEHGATL gi 2 913 92855 LEVGRYNCPEQCEFEAPAEEHVEECEDDWIGYQRKCYYIETTTYNWTLAQNFCEKLGATL gi 73997679 LEVGQYNCPDPDIELVPENERVEECEDDWIGYQRKCYFIETETKNWTLAQKFCYKQGATL lcl I 39479 AVIDEEKDMAFLKRYAGGLKHWIGLRNEAEQTWKWANGKEFNEWFNVTGEKKCVELNHTD gi 114 64 34 84 AVIDEEKDMNFLKRYAGREEHWVGLKKEPGHPWKWENGKEFNNWFNVTGEEKCVFLKNTE gi 4502 681 AVIDEEKDMNFLKRYAGREEHWVGLKKEPGHPWKWENGKEFNNWFNVTGEDKCVFLKNTE gi 10 90 95584 AVIDEVKDMNFLKRYAGGDEHWVGLKKEPGHPWKWENGKEFNNWFNLTGEEKCAFLKNTE gi 2 97 6 910 98 AVIDEEKDMNFLKRYTGREEHWVGLKKEPGHPWKWENGKEFNNWFNVTGEEKCVFLKNTE gi 281307080 AVIDEEKDMNFLKRYAGREEHWVGLKKEPGHPWKWENGKEFNNWFNVTGEDKCVFLKNTE gi 2 9 6211377 WIDEEKDMNFLKRYAGRGEHWVGLKKEPGQTWKWEDGKEFNNWFNFTGEEKCVFLNNTE gi 10835551 AVIDEEKDMNFLKRYAGREEHWVGLKKEPGHPWKWENGKEFNNWFNVTGEDKCVFLKNTE gi 2 913 92855 AVIDPAKDMEFLQRYAGGAGHWIGLRNEAGQTWKWENGKDLENRFNITEEEECAYLNETG gi 73997679 AFIDEEKDMIFLKRYVGRVKHWIALKNEDGQTWKWENGREFENWLNLTGFENCTFMNETE lcl I 39479 VASVDCEANLHWICSKPSR- gi 114643484 VSSMECEKNLYWICNKPYK- gi 4502 681 VSSMECEKNLYWICNKPYK- gi 109095584 VSSMECEKNLYWICNKPYKS gi 297691098 VSSMECEKNLYWICNKPYK- gi 281307080 VSSMECEKNLYWICNKPYK- gi 296211377 VSSMECEKNLHWICNKPYK- gi 10835551 VSSMECEKNLYWICNKPYK- gi 291392855 IGSTGCDKSLHWICSKPSK- gi 73997679 VSSTACENNLHWICSKSSK- Obrázek 15.4: Příklad vícenásobného přiložení (výstup programu CLUSTAL W). 226 KAPITOLA 15. BIOINFORMATIKA 15.9 Předpovídání struktury ze sekvence Když jsme si popisovali architekturu proteinů v kapitole 2, zdůrazňovali jsme, že plán struktury je obsažen již v genu, v jeho sekvenci. Celou kapitolu 11 jsme věnovali otázce, jestli umíme plán struktury bez experimentálních údajů spočítat. Odpověď byla spíše rozpačitá. Chápeme sice základní fyzikální principy, které určují, jaká konformace je nejvýhodnější. Neumíme ale příslušné rovnice přesně řešit. Výpočetní metody, které se pokoušejí co nejvěrněji popsat přírodní zákony, jsou příliš výpočetně náročné, než aby mohly být použity pro biomakromolekuly složené z tisíců atomů. Metody molekulové mechaniky, využívající místo zákonů kvantové mechaniky zjednodušující popis, jsou značně nespolehlivé, mají-li najít nejvhodnější konformaci pouze na základě sekvence. V této části si položíme otázku, jestli nám v předpovídání struktury nemůže pomoci bioinformatika. Jestli není možné pečlivou analýzou ohromného množství údajů v databázích odhalit nějakou jednoduchou souvislost mezi sekvencí a strukturou. Nemusíme rozumět fyzikálním příčinám, stačilo by jen zjistit, že jisté pořadí aminokyselin vždycky znamená určitou strukturu. 15.10 Předpověď sekundární struktury Pokusme se nejprve předpovědět sekundární strukturu na základě sekvence (primární struktury). To, co o sekundárních strukturách víme z části 2.5, zchladí náš optimismus hned na začátku. Již podle definice jsou sekundární struktury pravidelná prostorová uspořádání, která by neměla záviset na postranních řetězcích aminokyselin (a tedy ani na sekvenci). Ve skutečnosti tato nezávislost není úplná. Statistická analýza ukazuje, že určité sekundární struktury jsou pro určité aminokyseliny o něco výhodnější a pro jiné aminokyseliny naopak méně výhodné. Byly vyvinuty algoritmy, které předpovídají, s jakou pravděpodobností bude aminokyselina v určitém místě sekvence součástí a-šroubovice, /3-listu, pravidelného ohybu, nebo nepravidelné smyčky. Tyto algoritmy mohou být založeny na statistickém vyhodnocení, analýze tvaru postranních řetězců, nebo na analýze příbuznosti (homologie). Všechny metody ale vycházejí z pravidel, která byla formulována na základě sekvencí těch proteinů, jejichž prostorová struktura byla určena experimentálně. Příklad předpovědi sekundární struktury je ukázán na obrázku 15.5. 15.11 Předpověď terciární struktury Posuňme se nyní v hierarchii struktur výše a zkusme ze sekvence předpovědět, jaká bude terciární struktura proteinu. Náš úkol bude snazší, pokud je již známá prostorová struktura proteinu s podobnou sekvencí. Takové proteiny mohou posloužit jako výchozí formy (templáty) pro přístup zvaný homologní modelování. Obecně můžeme postupovat takto: 1. Ze struktury templátu vezmeme polohy uhlíků peptidové páteře a postranních řetězců. Pravidelné strukturní motivy použijeme jako základ modelu naší molekuly. 2. Snažíme se namodelovat méně pravidelné části struktury: ohyby a smyčky. 3. Navržený model dále upřesňujeme a ověřujeme jeho správnost. Tímto postupem můžeme velmi rychle určit strukturu proteinu, aniž bychom museli provádět složitý experiment. Nezbytnou podmínkou aleje, že již známe strukturu příbuzného proteinu. Co když příbuzný protein s experimentálně určenou strukturou zatím k dispozici není? Můžeme předpovědět prostorovou strukturu přímo ze sekvence aminokyselin? Od roku 2020 to možné je. První program schopný spolehlivě předpovědět terciární strukturu ze struktury primární (ze sekvence), byl AlphaFold2 společnosti DeepMind, využívající zejména znalosti sekvencí evolučně příbuzných pořadí aminokyselin zkoumaného 15.11. PREDPOVEĎ TERCIÁRNÍ STRUKTURY 227 Conf : Pred: Pred: CCCCCCCCCCCCCCCCCCEEECCEEEEEECCCCCHHHHHH AA: MENLESFDHHAASCKNEWFSYNGKCYFFSTTTKTWALAQK 10 20 30 40 Conf : Pred: f: ]|iiiIII]:^iiiiiiiiii:^iiiid:]:]:dIIIIE -g Pred: HHHHCCCEEEEECCHHHHHHHHHHCCCCCEEEEEECCCCC AA: SCSEDDATLAVIDSEKDMAFLKRYAGGLKHWIGLRNEASQ 50 60 70 iO Conf: ] Pred: . Pred: CEEECCCCCCCCCCCCCCCCCCEEEECCCEEECCCCCCEE AA: TWKWANGKEFNSWFNVTGSKKCVSLNHTDVASVDCEANLH 90 100 110 120 Conf: bXllIILlIlE Pred: 1 ,_ Pred: EEEECCCC AA: WICSKPSR Legend: = helix Conf: ]3]]]]E = confidence of prediction - + = strand Pred: predicted secondary structure = coil AA: target sequence Obrázek 15.5: Příklad předpovědi sekundární struktury (výstup programu PSIPRED). 228 KAPITOLA 15. BIOINFORMATIKA A B C D SRC VKLGQGCFGEV HCK KKLGAGQFGEV ABL HKLGGGQYGEV LCK ERLGAGQFGEV SLK GELGDGAFGKV SBK RELGKGTYGKV Obrázek 15.6: Informace o struktuře získané srovnáním sekvencí různých lidských proteinkinas. A, Srovnání sekvencí šesti proteinkinas. B, přeložené struktury proteinkinas SRC (šedá) a SLK (šedomodrá). C, obarvené aminokyseliny z panelu A ukázané ve struktuře proteinkinasy SRC. Atomy kyslíku jsou znázorněny červeně, dusíku modře a uhlíků v glycinech zeleně. D, obarvené aminokyseliny s panelu A ukázané ve struktuře proteinkinasy SLK. Barvy jsou použity jako na panelu C. proteinu. Zkusme se tedy zamyslet nad tím, co nám říká srovnání sekvencí o prostorovém uspořádání molekul proteinu. 15.12 Srovnání sekvencí a předpověď terciární struktury To, že informace o struktuře terciární je skryta ve struktuře primární, by nás nemělo překvapit. Genetická informace je přece kódována a předávána na úrovni sekvence. Pořadí aminokyselin tedy jednoznačně udává, jak se má hlavní řetězec proteinu ve svém přirozeném prostředí sbalit. Potíž je, že my dosud nerozumíme vztahu mezi sekvencí a strukturou natolik, abychom terciární strukturu dokázali ze sekvence vypočítat. Souvislosti mezi primární a terciární strukturou ale můžeme odhalit, když si srovnáme sekvencí více. Ukážeme si to na příkladech dvou proteinových rodin. Důležitými regulačními enzymy jsou proteinkinasy. Lidský genom kóduje celou řadu proteinkinas, které jsou zapojeny na různých úrovních různých signálních drah, ale které mají velmi podobnou strukturu i sekvenci. Srovnání sekvencí různých proteinkinas ukazuje, že ve všech kinasách je zachována sekvence GXGXXG, kde G je glycin a X nějaká jiná aminokyselina (obrázek 15.6A). Kdybychom nevěděli nic o vlastnostech aminokyselin, dovedlo by nás srovnání sekvencí k obecnému závěru, že motiv GXGXXG je asi z nějakého důvodu důležitý. Protože ale známe vlastnosti postranních řetězců různých aminokyselin, víme ledacos o Ramachandranově diagramu, a protože víme, jak se glyciny chovají ve stovkách známých struktur, můžeme jít o krok dál. Můžeme předpovědět, že ve struktuře proteinkinas se sekvence GXGXXG neskládá do pravidelné sekundární struktury, ale tvoří ohyb, pro který je výhodná přítomnost glycinů s méně omezenými hodnotami torzních úhlů, než mají jiné aminokyseliny. Pravděpodobná přítomnost ohybu je první důležitá strukturní informace, kterou jsme ze srovnání sekvencí získali. Pokročme se srovnáním sekvencí dál a podívejme se na aminokyseliny těsně před a za sekvencí GXGXXG. Aminokyselina s pořadovým číslem o čtyři nižším, než prostřední glycin smyčky (pozice —4), je u většiny proteinkinas arginin nebo lysin. Naopak aminokyselina s pořadovým číslem o čtyři vyšším, než prostřední glycin (pozice +4), je v těchto proteinkinasách kyselina glutamová nebo aspa-ragová. Zachování kladně nabitého lysinu či argininu v pozici —4 a kyselé aminokyseliny v pozici +4 naznačuje, že kladný a záporný náboj těchto postranních řetězců je pro strukturu důležitý. Z tohoto srovnání bychom ale nedokázali říci, zda náboje interagují mezi sebou, nebo s jinými aminokyslinami. Pokud by neexistovala rodina proteinkinas, která má naopak v pozici —4 kyselý zbytek a v pozici +4 kladně nabitou aminokyselinu. To, že změna náboje v jedné pozici vyžaduje také opačný náboj 15.12. SROVNÁNÍ SEKVENCÍ A PŘEDPOVĚĎ TERCIÁRNÍ STRUKTURY 229 v pozici druhé, nás vede k domněnce, že mezi pozicemi —4 a +4 existuje přímá, strukturně důležitá, elektrostatická interakce. Kdyby nebyla struktura žádného proteinu ještě vyřešena, byl by tento závěr pouze teoretickou hypotézou. Protože ale takové elektrostatické interakce byly pozorovány v mnoha známých strukturách, jde o další informaci o terciární struktuře proteinkinas, která je nepřímo experimentálně podložená. A skutečně. Řada terciárních struktur proteinkinas byla vyřešena a ohyb s glyciny stabilizovaný elektrostatickou interakcí se ve všech skutečně vyskytuje (obrázek 15.6B,C). Jako druhý příklad získání strukturní informace ze srovnání sekvencí si popíšeme analýzu sekvence stejného proteinu z mnoha různých organismů. Tím proteinem bude přenašeč kyslíku ve svalech, myoglo-bin. Podobně jako v proteinkinasách, jsou i v myoglobinu glyciny, které nacházíme ve všech sekvencích (obrázek 15.7A). Například 65. aminokyselina je vždy glycin, zatímco následující aminokyseliny jsou v různých organismech různé. Předpověď sekundárních struktur ze sekvence (viz část 15.10) přitom ukazuje, že na rozdíl od sekvence GXGXXG proteinkinas je v myoglobinu Gly 65 uprostřed šroubovice. Totéž platí pro Gly 25 v myoglobinu. Glycin přitom není typickou aminokyselinou a-šroubovic. V sekvenci myoglobinu je několik glycinů zachovaných na koncích a-šroubovic, ale pouze Gly 25 a Gly 65 jsou uprostřed šroubovic. Můžeme se tedy domnívat, že pro přítomnost těchto glycinů v prostředku dvou různých šroubovic je nějaký strukturní důvod. Glycin je nejmenší aminokyselina, vlastně bez postranního řetězce. Jednou z možností je, že jsou si ty dvě šroubovice s glyciny ve struktuře tak blízko, že na postranní řetězec aminokyselin 25 a 65 už prostě není místo. Tuto hypotézu si můžeme snadno ověřit, protože myoglobin je prvním proteinem, jehož struktura byla experimentálně popsána. Pohled na krystalovou strukturu ukazuje, že se a-šroubovice s Gly 25 a Gly 65 uprostřed téměř dotýkají a v místě dotyku se opravdu nacházejí naše dva glyciny (obrázek 15.7B). Dvacátá sedmá aminokyselina myoglobinu většiny organismů je kyselina glutamová. Můžeme očekávat, že tato kyselina bude důležitá pro elektrostatickou interakci s nějakou kladně nabitou aminokyselinou, tak jako kyseliny proteinkinas. Bez znalosti struktury by ale bylo obtížné říci, se kterým lysinem nebo ar-gininem glutamát číslo 27 interaguje. Naštěstí mají některé organismy, například velryby, místo Glu 27 o něco kratší kyselinu asparagovou. Pečlivá analýza mnoha sekvencí ukazuje, že organismy s delším Glu 27 mají jako 118. v pořadí vždy kratší z kladně nabitých aminokyselin, lysin (obrázek 15.7A). Naopak velrybí myoglobin s kratším Asp 27 má jako 118. aminokyselinu delší arginin. Srovnání velkého množství sekvencí nám tedy napovídá, že mezi aminokyselinami číslo 27 a 118 by mohla být strukturně důležitá elektrostatická interakce, která vyžaduje, aby vzdálenost mezi páteří (uhlíky a) byla zachována. Delší záporná aminokyselina se proto páruje s kratší kladnou a naopak. Tuto hypotézu si můžeme snadno ověřit pohledem na krystalovou strukturu (obrázek 15.7C). Uvidíme, že postranní řetězce aminokyselin číslo 27 a 118 skutečně elektrostatickou interakci tvoří. Podobných příkladů bychom mohli uvést víc. V sekvencích se také odrazí pravidelné střídání hydro-fobních a hydrofilních aminokyselin ve svazku šroubovic nebo /3-soudku, zachování hydrofobních řetězců u aminokyselin tvořících jádro proteinu a podobně. Vidíme, že existuje souvislost mezi zachováním typu aminokyselin na určitých pozicích v sekvenci a prostorovým uspořádáním aminokyselin na těchto pozicích v trojrozměrné struktuře. Tuto souvislost bychom mohli zkusit popsat pomocí konkrétních pravidel (například „zachování opačného náboje znamená blízkost v prostoru a otočení postranních řetězců k sobě") a tato pravidla definovat srozumitelně pro počítač (tedy matematicky). Když bychom pak poskytli počítače údaje o zachování aminokyselin v mnoha sekvencích, měl by počítač umět spočítat trojrozměrný model proteinu. AlphaFold2 ale postupuje jinak. Využívá přístup umělé inteligence zvaný strojové učení (machine learning), v konkrétní variantě hloubkového učení (deep learning). Úkolem počítače není jen na základě naprogramovaných pravidel vypočítat ze srovnání sekvencí prostorovou strukturu. Počítač sám hledá pravidla popisující souvislost mezi srovnáním sekvencí a prostorovou strukturou. Metody strojového učení se stále vyvíjejí a zlepšují. Protože ale program publikovaný roku 2021 představoval revoluci v předpovídání terciárních struktur, zaslouží si, abychom si jej popsali v následující kapitolce konkrétněji. 230 KAPITOLA 15. BIOINFORMATIKA A 24 64 116 Horno sapiens člověk Sus scrofa prase Equus caballus kůň Dugong dugon moroň indický Balaena mysticetus velryba grónská Physeter macrocephalus vorvaň obrovský HGQEV HGQEV HGQEV HGLEV HGQDV HGQDI HGAT HGNT HGTV HGTT HGNT HGVT QSKH QSKH HSKH QSKH HSRH HSRH d 1 on h á 0 ■■ ■ ffi krátká krátká 9 ■ ■■ (B d 1 on h á B C Obrázek 15.7: Informace o struktuře myoglobinu získané srovnáním sekvencí různých organismů. A. Srovnání sekvencí myoglobinu šesti organismů. B. Struktura myoglobinu vorvaně. Atomy kyslíku jsou znázorněny červeně, dusíku modře a uhlíků v glycinech zeleně. C. Srovnání struktur myoglobinu vorvaně (šedá barva) a koně (azurová barva). Vyznačeny jsou postranní řetězce aminokyselin 27 a 118. Práci s programem AlphaFold2 můžeme rozdělit do dvou fází. V první, učící fázi (training) nechali autoři program najít parametry, se kterými co nejvěrněji předpovídá struktury ze srovnání sekvence. Tato fáze probíhala tak, že AlphaFold2 opakovaně předpovídal z vícenásobného přiložení sekvencí známé struktury proteinů, srovnával je se strukturami získanými předtím experimentálně, a měnil parametry predikčního algoritmu tak, aby se předpověď co nejvíce blížila skutečnosti. V druhé fázi program použil parametry nalezené během první fáze k tomu, aby ze srovnání sekvencí předpověděl struktury, které autoři dosud neznali. Toto nejprve probíhalo v rámci soutěže, ve které struktury některých proteinů byly experimentálně vyřešeny, ale dočasně utajeny. Soutěžícím tvůrcům predikčních programů byly poskytnuty sekvence těchto proteinů. Na základě nich měli předpovědět struktury soutěžních proteinů. Předpovědi pak organizátoři srovnali s experimentálně získanými strukturami. Poté, co AlphaFold2 v soutěži drtivě zvítězil, s přesností předpovědí blízkou přesnosti samotných experimentálních metod, byl program poskytnut uživatelům. Ti si mohou zopakovat druhou fázi sami pro sekvenci jejich zájmu. Zároveň bylo zahájeno systematické předpovídání neznámých struktur ze známých sekvencí uložených v databázích. Dnes už proto většinou ani není třeba, aby uživatel program sám spouštěl, stačí mu pouze nahlédnout do databází, kde předpovězenou strukturu najde. Popíšeme si teď stručně predikční algoritmus, použitý v obou fázích. Nejprve provedeme vícenásobné přiložení sekvence proteinu, jehož strukturu předpovídáme, s ostatními sekvencemi v databázích. Získaný výsledek obvykle trochu zjednodušíme, abychom snížili počet sekvencí, se kterými počítač dále pracuje.4 Vícenásobné přiložení převede počítač na tabulku (označíme si ji M), kde počet sloupečků je počet aminokyselin v sekvenci a počet řádků je počet přiložených sekvencí. Takové tabulky se nazývají 4Sekvence setřídíme a z každé skupiny podobných sekvencí vybereme jen jednu. Navíc je spočítán statistický údaj popisující rozložení aminokyselin v této skupině. 15.13 AlphaFold2 15.13. ALPHAF0LD2 231 reprezentace. V programu AlphaFold2 převádí sekvence na reprezentace modul Embedder. Položkami v tabulce M nejsou jednotlivá písmena nebo čísla, ale celé skupiny čísel (matematicky vektory), které popisují vlastnosti aminokyseliny. Z řádku tabulky M, který popisuje sekvenci proteinu, jehož strukturu má počítač předpovědět (tento řádek si označíme S), si vytvoří další tabulku (reprezentaci) popisující vzájemné vztahy mezi jednotlivými aminokyselinami sekvence. Tato tabulka (označme ji Z) má stejně sloupců i řádků (podle počtu aminokyselin). Každé políčko tabulky Z je opět vektor, který popisuje jak spolu každá dvojice aminokyselin v sekvenci souvisí z pohledu struktury. Pokud je k dispozici protein s podobnu sekvencí a známou strukturou (templáť), je možné informace o známé struktuře (vzdálenosti, torzní úhly) zapracovat do tabulky. AlphaFold2 ale funguje i bez templátu, jen na základě vícenásobného přiložení. Jak si máme představit převedení sekvencí na reprezentace? Pokud například vlastnosti každé aminokyseliny v tabulce M chceme popsat 256 čísly, musí být v počítači uloženo 20-256 = 5120 parametrů.5 Právě hodnoty těchto 5120 parametrů AlphaFold2 hledá během učící fáze. Další zpočátku neznámé parametry je třeba najít pro převod sekvence na vektory v tabulce Z a pro dva kroky předpovídání, které si popíšeme níže. První krok v předpovědi provádí modul zvaný Evoformer. Tento modul upravuje tabulky M a Z a vyměňuje informaci mezi nimi. Z porovnání sloupců v tabulce M upravuje informace o strukturní blízkosti aminokyselin v tabulce Z.e Naopak na základě vztahů mezi aminokyselinami v tabulce Z přidává váhu těm aminokyselinám (zapsaným jako položky na řádcích tabulky M), které by měl výpočet zohlednit nejvíc (jsou pro strukturu důležitější, protože například odpovídají aminokyselinám, které jsou podle tabulky Z blízko sebe v prostoru). Evoformer upravuje navíc tabulku M tím, že hledá vztahy mezi sekvencemi, které si zasluhují větší pozornost. V tabulce Z zase provádí úpravy, které zajistí zachování správné geometrie.7 Druhým krokem v předpovědi je samotný výpočet trojrozměrného modelu Strukturním modulem. Tento modul nejprve s využitím tabulky Z upraví hodnoty (váhy) v jednořádkové tabulce S (tedy v reprezentaci sekvence proteinu, jehož strukturu předpovídáme), tak aby co nejlépe odpovídaly důležitosti pro strukturu. Z hodnot tabulky S vypočítá hodnoty vzájemného posunutí a natočení jednotlivých aminokyselin. Teprve potom spojí aminokyseliny do polypeptidového řetězce, dopočítá torzní úhly a tak určí polohy jednotlivých atomů. Nakonec se provádí krátká simulace molekulové dynamiky s optimalizací energie. Pouze v tomto kroku se používá silové pole postavené na základě chemických znalostí. Oba kroky se několikrát opakují. V učící fázi se předpovězená struktura se porovná se strukturou získanou z experimentálních dat. Učení znamená, že se celý postup mnohokrát opakuje. Počítač přitom mění číselné parametry, které definují jednotlivé výpočetní kroky. Změny, které předpověď struktury zlepšují, zachovává a snaží se tak nalézt parametry, které vedou k předpovědi blízké experimentálně určené struktuře. Když takové parametry nalezne pro celou skupinu struktur vybraných k učení, považuje program za „vyučený." Program AlphaFold2 naučený na strukturách uložených v databázi PDB předpovídá nové struktury (neznámé v době předpovědi, ale experimentálně určené později) se správností blížící se chybě experimentálních metod samotných. Z tohoto pohledu můžeme i bioinformatiku považovat za metodu určování struktury biologicky zajímavých molekul. Příklad předpovědi je ukázán na obrázku 15.8. 5AlphaFold2 ve skutečnosti používá více než dvakrát větší počty parametrů, aby mohl vzít do úvahy například inzerce v přiložených sekvencích a statistiku spojenou s výběrem jedné sekvence ze skupin podobných sekvencí. 6Takto by AlphaFold2 vyhodnotil náš příklad zachování aminokyselin s opačnými náboji, protože ve sloupcích tabulky M je uložena informace o zachování aminokyselin na stejné pozici. 7Pokud jsou například aminokyseliny 75 a 237 vzdáleny lnm a aminokyseliny 237 a 541 0,5 nm, nemohou být aminokyseliny 75 a 541 od sebe dál, než 1,5 nm. 232 KAPITOLA 15. BIOINFORMATIKA SRC |K|L|G|Q|G|C|F|G|E reprezentace M SRC HCK ABL LCK SLK SRC HCK ABL LCK SLK 1 reprezentace S Embedder v Evoformer Structure Module UniProt KB reprezentace Z 190 198 ■ ■ ■ ■ ■ —i — —i- .í ■ ■ ■ ■ ■ 1 ■ ~1- -1 ■ 1 ■ ■ ■ 1 i ■ ■ ■ ■ i ■ ■ —i - Obrázek 15.8: Příklad předpovědi terciární struktury pomocí programu AlphaFoldž. Jako vstup slouží vícenásobné přiložení sekvence znázorněné červeně vlevo nahoře se sekvencemi z databáze (na obrázku Uni-prot KB). Reprezentace sekvencí M (přiložené sekvence) a S (sekvence hledaného proteinu) jsou znázorněny červeně, párové reprezentace Z modře. Položky matic M, S a, Z nejsou ukázány jako číselné vektory, ale pomocí barevných pixelů. Pro jednoduchost obrázky ukazují jen malý počet aminokyselin v sekvencích a malý počet přiložených sekvencí. Využití již známých struktur (templátů) není v obrázku zahrnuto. Část III Dodatky A. ENERGIE RŮZNÝCH INTERAKCÍ 235 A Energie různých interakcí V jednoduchých případech lze elektrostatické působení mezi molekulami a jejich částmi popsat nepříliš složitými rovnicemi. V této části se podíváme na několik důležitých příkladů. Jde o různé varianty Coulombova zákona. Odvození uvedených rovnic často jednoduché není, v učebnicích většinou chybí a v literatuře se hledá obtížně. Zde si uvedeme i poměrně zdlouhavá odvození, aby čtenář nemusel zdlouhavě pátrat, odkud se vzaly různé mocniny vzdálenosti mezi interagujícími náboji a dipólovými momenty a závislosti na teplotě. A.l Energie dvou nábojů Energii U elektrostatické interakce mezi náboji Q\ a Q2, které se nacházejí ve vakuu ve vzájemné vzdálenosti r, vypočítáme ze síly F, kterou se opačné náboje přitahují a stejné náboje odpuzují. Velikost této síly je F=-*-GiQ2, (15.1) 47reo rz kde 6q je elektrická permitivita vakua (8,854.10-12 F m-1). Energie je rovná práci, která by se vykonala (nebo kterou bychom museli vynaložit) při přemístění nábojů ze vzdálenosti, kde na sebe náboje již nepůsobí (což by musela být nekonečná vzdálenost), do vzdálenosti r. Tuto práci spočítáme tak, že posčítáme všechny maličké práce dU spojené s posunutím náboje o nepatrný kousek dr'. Matematicky to lze napsat jako integrál r r r U = f Fdr' = í Fdr' = 9l9l f J_d/ = J_9l9l. (15.2) J J 4-7re0 J r2 4iľe0 r 00 Pokud budeme chtít uvádět energii nábojů v jednom molu molekul, musíme výsledek vynásobit Avogadrovým číslem: u=I±9iQi. (15.3) Atteo r Je také dobré si uvědomit, že zatímco energie je veličina skalární, síla je vektor, má směr. Směr síly můžeme do Coulombova zákona zahrnout pomocí jednotkového vektoru mířícího ve směru síly. Takový jednotkový vektor můžeme zapsat jako f/r, kde r je vektor udávající vzájemnou polohu interagujících nábojů v dané souřadné soustavě a r je velikost tohoto vektoru, tedy vzdálenost nábojů: ~ 1 QxQ2f 1 Q,Q2 ^ F=~A--2--= ~A--~T- (15'4) 47reo r2 r 47reo ra Další užitečnou veličinou je elektrická intenzita, tedy elektrická síla působící na jednotkový náboj v elektrickém poli jiného náboje o velikosti Q: E =----- =---- r. (15.5) 47TÉQ rz r 47TÉQ ra A.2 Energie náboje a elektrického dipólu v jedné molekule Energie U interakce mezi nábojem Q a trvalým elektrickým dipólovým momentem o velikosti qd, který odpovídá dvojici nábojů +q a — q ve vzájemné vzdálenosti d, je rovná práci spojené s otočením dipólu v poli náboje Q. Dle dohody začínáme dipól otáčet z polohy znázorněné na obrázku 15.9 vlevo. Jak je ukázáno na obrázku 15.9, na každý náboj Q působí síla směřující od nebo k náboji Q (na obrázku 236 eh 1 -q Q 0 2 Ar =-cŕcos (7t-G) 2Ar = cŕcose F= F d « r Obrázek 15.9: Interakce elektrického dipólového momentu s nábojem. červeně). Pokud je vzdálenost dipólu od náboje Q mnohem větší, než vzájemná vzdálenost nábojů +q a —q, lze síly považovat za téměř rovnoběžné (na obrázku znázorněno černě). Posunutí +q a — q vůči Q lze pak vyjádřit pomocí úhlu 6, definovaného na obrázku 15.9 vpravo. Celkovou práci na posunutí obou nábojů o hodnotu Ar -1 kde J ue~uwdu jsme spočítali integrací per partes. Ačkoli jsme získali přesný výsledek, můžeme i jej ještě zjednodušit. Můžeme využít toho, že exponenciální funkci lze vyjádřit jako nekonečnu řady rostoucích mocnin = ^(±w)° + ^(±wÝ + ^{±wf + ^w3 + ■ ■ ■ = 1 ± w + l-w2 ± l-w3 + ■ ■ ■ (15.17) Protože jsme předpokládali, že d i, di sin 6i sin cpi, di cos 0i (15.21) (15.22) (15.23) d2x = d2 sin 02 cos 2, (15.25) d2z = d2cos02 (15.26) Souřadnou soustavu můžeme přitom vždy zvolit tak, aby cpi = 0 (aby d\ leželo v rovině x z), jak je ukázáno na obrázku 15.10. Analýza vzájemné interakce čtyř nábojů nebo dvou dipólů je poměrně náročná, ale značně nám ji zjednoduší vztah 15.8. Stačí nám určit, jakou intenzitu E (tedy sílu působící na jednotkový náboj) má elektrické pole prvního dipólu v místě, kde se nachází druhý dipól. Energii pak snadno spočítáme pomocí skalárního součinu podle rovnice 15.8: U = NAq2Ě ■ di. (15.27) Kde ale vzít intenzitu El Obecně to je dosti složitý úkol. Intenzita E v místě určeném polohovým vektorem r je vektorovým součtem sil, kterými na jednotkový náboj v daném místě působí oba náboje prvního dipólu. Na obrázku 15.10 jsou intenzity odpovídající těmto silám znázorněny červenou šipkou E_ (intenzita záporného náboje) a modrou šipkou E+ (intenzita záporného náboje). V souřadné soustavě, použité na obrázku 15.10, mají obě intenzity nulovou složku ve směru y. Složky ve všech směrech můžeme vyjádřit A. ENERGIE RŮZNÝCH INTERAKCÍ 239 E-E- E_ sin a, O, E- cos a (15.28) (15.29) (15.30) E+,x = E+smP, (15.31) E+,y = 0, (15.32) f+jZ = f+cos/3, (15.33) kde E— a f + jsou velikosti (absolutní hodnoty) intenzit a úhly a, j3 jsou vyznačeny na obrázku 15.10. Absolutní hodnoty E— a E+ jsou nepřímo úměrné druhé mocnině vzdálenosti od příslušného náboje (červená úsečka délky a a modrá úsečka délky b na obrázku 15.10): E. E4 gi 1 Atteq a2' gl 1 4-7re0 Ď2 ' (15.34) (15.35) Siny úhlů a,j3 můžeme vyjádřit pomocí sinové věty 240 siná = — sin 0i, (15.36) 2a sin/3 = ^sin(7r-0i) = ^sinfli. (15.37) K vyjádření kosinů zase použijeme větu kosinovou — = a + r — 2ar cos a => = cosa =-—, (15.38) 4 2ar — = b2 -\- r2 — 2brcosj3 =>■ = cos/? =-T ~ ~. (15.39) 4 2or Jak ukazuje obrázek 15.10, celková intenzita ve směru x je součtem složek intenzit E— a £ľ+ v tomto směru: ^ „ „ „ „ „ Qi di sin 6*i / 1 1 \ oi a3 + !i3(ii sin ř?i ^ = ^ + = + — = U + ^) = 4^^^' (15'40) Celková intenzita ve směru z je naopak rozdílem svislých složek intenzit E— a _B+: 1 fb2+r2-^. a2 + r2-^\ £z = +£_,z =£+coscos a =—---á_----M . (15.41) 47Te0 2r \ tr ad I Vzdálenosti a a b nám poskytne opět kosinová věta d2 a2 = -± +r2 - d1rcos91, (15.42) d2 d2 b2 = -± + r2 - d±r cos(tt - 6{) = -± + r2 + d1rcos91. (15.43) Po dosazení do čitatele rovnice 15.41 ^ q1 1 / 2r2 — d\r cos 6\ 2r2 + dxr cos #i \ 9i / / 1 1 \ ^ 1 i 1 N di cos 6\ 4iľe02r \ b3 a3 J 47re0 \\b3 a3 J \b3 a3 J 2 <7i fa3 — b3 a3 + b3 dx cos 6X ATľe0 \ a3b3 a3b3 2 Výrazy a3 + b3 a a3 — b3 můžeme převést na součiny (15.44) a3 + b3 = (a + b)(a2 + b2 - ab) (15.45) a3-b3 = (a-b)(a2 + b2 + ab). (15.46) Součet a2 + b2 můžeme snadno převést na 2r2 + íi2/2, ale snaha vyjádřit ab, a + b&a — b pomocí r a di vede k nepřehledným odmocninám A. ENERGIE RŮZNÝCH INTERAKCI 241 ab (dir cos 9iY ^-(dircosöi)2 = r2Wl+(^ di ■ cos Oi (15.47) a + b = yj(a + b)2 = V a2 + b2 + 2ab = \ 2r2 d\ 2r2\\\ 1 id -2\ l ■ cos Oi di ■ cos Oi (15.48) a — b 2di cos 0i a + b ^2 + H^)2 + Vi + (^)4-( (15.49) dl cos Oi I Pro di 2 cos2 - 2 008 01008 02), 47reo r r r kde červená barva zvýrazňuje, čím se vztah liší od energie dvou nábojů. (15.57) 242 A.5 Energie dvou elektrických dipólů v různých molekulách Výpočet průměrné energie interakce elektrických dipólů ve dvou molekulách, které se mohou vůči sobě volně otáčet, jak ukazuje obrázek 15.10, je dosti zdlouhavý. Při počítání průměrů musíme integrovat přes všechny tři úhly 6\, 62, 4>2■ Exponenciální člen Boltzmannova zákona můžeme opět psát jako e-U/RT _ euw (15.58) kde qxq2 dí d2 w = —---- (15.59) 47reo r r r podobně jako ve vztahu pro náboj a dipól, ale u = sin 0i sin 62 cos 2 — 2cos 6\ cos 62. (15.60) Průměrnou energii pak počítáme jako 2lT 7T 7T 2lT 7T 7T / d2 J J Ueuw sin 0id0i sin 92d92 —RTw f dfa f f ueuw sin 0id#i sin 92d92 (U) = 2-- -=-^-O-. (15.6I) J d2 J Jeuw sin6»id6»i sm92d92 o 00 Vztah se velmi zjednoduší, když si uvědomíme, že J „lito ueuw =-. (15.62) w Protože w nezávisí na úhlech 0i,02, 02, můžeme podle w derivovat celý integrál. Integrál v čitateli je tak vlastně derivací partiční funkce Z podle w: , , -RTw^- (U) = -(15.63) Když si uvědomíme, že můžeme psát (2tt f 1 \ J dh J J euwsm91d91sm92d92 \ . (15.65) 000 / Při výpočtu integrálu Z můžeme opět exponenciální závislost vyjádřit jako mocninnou řadu euw = -^(uw)0 + -^(uw)1 + —Auw)2 + -^(uw)3 H----= 1 + uw + -(uw)2 + -(uw)3 H---- (15.66) 0! 1! 2! 3! 2 6 a předpokládat, že w 2 Integrály výrazů obsahujících cos (p2 musí být rovné nule, protože integrujeme přes celou periodu (přes všechna (p2 od nuly do 2tt) a integrály funkcí sinus a kosinus přes celou periodu (úměrné průměrným hodnotám těchto funkcí) jsou nulové. Ze stejného důvodu je nulový integrál výrazu 2sin 0i cos 0i sin92 cos 92 = ^ sin(20i) sin(202), (15.68) 'i a 02 integrujeme od nuly do tt, což odpovídá celé periodě pro 261 a 202 (od nuly n tedy spočítat integrály třech výrazů. Výpočet usnadní substituce u\ = cos 6\ a teré platí dwi = sin0id0i a du2 = sin09d09. (15.67) protože úhly 6\ a 02 integrujeme od nuly do tt, což odp do 2tt). Stačí nám tedy spočítat integrály třech výrazů. \ u2 = cos02, pro které platí dui = sin0id0i a du2 = sin02d0; První integrál je 2tt tt tt 2tt -1 -1 J d(f>2 J J sin91d91 sin02d02 = J d(f>2 J j duxdu2 = [4>2f^ [u1]1 1 [u2]1 1 = 8tt. (15.69) 0 0 0 Druhý integrál je 2tt tt tt 2tt -1-1 2w2 J d(f>2 J J cos2 0i cos2 02sin0id0i sin 02d02 = 2w2 J d2]f r 3i -i r 3i u{ u2 y i 3 16 (15.70) Při řešení třetího integrálu navíc využijeme toho, že cos2 2). Integrál členu cos(22) přes dvě celé periody (pro (p2 od nuly do 2tt, tedy pro 2(p2 od nuly do Att) je nula. Stačí tedy spočítat 27T 7T 7T 27T 7T 7T ^- J d(f>2 J J sin3 0i sin3 02d0id02 = ^- J d(f>2 J J(í - cos2 0i)(l - cos2 02) sin0id0i sin02d02 0 0 0 0 0 0 2?r -1-1 _ __ i _ 1 =^ |d02 y y a - - ^m«^=^ [02] Ml — U'i U2 - -ttw2. (15.71) 9 o 11 Sečtením integrálů získáme Z = 8tt(Í + w2/3). Podle rovnice 15.65 musíme ln Z zderivovat podle w. d(lnZ) d(ln(87r(l +w2/3))) d(ln 8tt + ln(l + w2/3)) 2w/3 2w dw dw dw l+w2/3 3 (15.72) kde jsme v posledním kroku předpokládali, že w dlx = —-j=—, d2x = —-j=—, (15.86) y+ = d-^±fiy, y_ = ^L_fiy dly = y±±^, d2v = v-±^, (15.87) V2 ' U V2 LV~ V2 ' V2 j + d2z _ (iiz - d2z _ z+ + z- _ z+- z Po dosazení do vztahu pro energii získal vztah 246 (15.89) který je formálně součtem energií šesti kmitání s výchylkami x+, x_, y+, y_, z+, z_ a tuhostmi ? ? ? ki = ^— 1 + , k2 = 1 + , k3 = 1 - 2aeo V 47rr3 / 2aeo V 47rr3 / 2aeg V 47rr3 , _JÍ_(i__ u __ u q2 íi i a 4 2ae0 V 4^' 5 2ae0 V 2^r3) ' 6 2ae0 V 27rr3 Tuhost pružiny obecně souvisí s vlastní frekvencí kmitání v vztahem k = ArK2v2m, kde m je hmotnost. Z toho vyplývá, že vlastní frekvencí kmitání pro naši šestici můžeme spočítat 1 / kj _ 1 q yr+a~ _ v0 n ,, n n n ,_ 7T\/l + ä~ (15.90) 2tt V 2to 2tt 2 y/äeäm 2 v 3' v ; kde 1 + Oj jsou výrazy v závorkách v seznamu tuhostí, uvedeném výše. Když vynásobíme tyto frekvence Planckovou konstantou h (6,626.10-34 J s), získáme podle zákonů kvantové mechaniky energie. Výrazy ^/l + a,j můžeme zapsat jako mocninnou řadu y/T+^=l + ^-f + ... (15.91) Pro dostatečně velké vzdálenosti dipólů, kdy a i2 =--— ,, xt k-■ (15.93) 2 (47r)2r6 z/0jl + z/0j2 B. METODY CHEMICKÉ SYNTÉZY NA PEVNÉM NOSIČI 247 B Metody chemické syntézy na pevném nosiči B.l Karbodiimidová metoda syntézy peptidů 1. Zablokujeme všechny a-aminoskupiny a všechny reaktivní skupiny postranních řetězců. Jako blokující skupina a-aminoskupiny se používá 9-fiuorenylmethyloxykarbonyl (Fmoc) nebo terc-butyloxykarbonyl (tBoc). 2. C-koncovou aminokyselinu karboxyskupinou navážeme na pevný nosič. Výhoda použití pevného nosiče je v tom, že rostoucí peptid zůstává připojený k nosiči, takže po každém kroku můžeme snadno vyměnit reakční roztok. 3. Odblokujeme a-aminoskupinu C-koncovou aminokyseliny vázané na nosič8. 4. Přidáme předposlední aminokyselinu a aktivujeme její karboxylovou skupinu. Z praktických důvodů se používá dvoustupňová aktivace dicyklohexylkarbodiimidem a ./V-hydroxybenzotriazolem9, která výrazně omezí nežádoucí reakce. V prvním kroku dochází k adici karboxylové kyseliny na dicyklo-hexylkarbodiimid a meziprodukt je převeden na ester benzotriazolu. Tento ester reaguje s volnou aminoskupinou poslední aminokyseliny za vzniku peptidové vazby. 5. Předchozí dva kroky opakujeme tolikrát, kolik aminokyselin má obsahovat vzniklý peptid. Pochopitelně přidáváme vždy příslušnou blokovanou aminokyselinu podle sekvence. 6. Nakonec odblokujeme všechny funkční skupiny, uvolníme peptid z nosiče a vyčistíme jej. B.2 Fosforamiditová metoda syntézy nukleotidů 1. Zablokujeme všechny aminoskupiny a hydroxyly. Po celou dobu syntézy je třeba chránit ami-noskupiny bází a v případě RNA 2'-hydroxyl. Jako blokující skupina 5'-hydroxylu se používá dimethoxytrityl. 2. 3'-koncový nukleotid navážeme přes 3'-hydroxyl na pevný nosič. 3. Kyselinou trichloroctovou odblokujeme 5'-hydroxyl koncového nukleotidu vázaného na nosič. 4. Přidáme předposlední nukleotid s 3'-hydroxylem esterifikovaným Af-diisopropyl-/3-kyanoethylfosforamiditem. Tato skupina reaguje v přítomnosti tetrazolu s volným 5'-hydroxylem posledního nukleotidu za vzniku triesteru kyseliny fosforite. Nezreagovaný 5'-hydroxyl nevratně zablokujeme acetylací. 5. Jodem zoxidujeme triester kyseliny fosforite na triester kyseliny fosforečné. 6. Předchozí tři kroky opakujeme tolikrát s příslušným aktivovaným nukleotidem, kolik nukleotidů má obsahovat vzniklý produkt. 7. Nakonec odblokujeme 5'-hydroxyl prvního nukleotidu, amoniakem odštěpíme poslední nukleotid z nosiče a kyanoethyl z fosfátů, zahřátím uvolníme ostatní chráněné funkční skupiny a oligonuk-leotid přečistíme. 8Použití různých blokujících skupin umožňuje selektivní odblokování jedné funkční skupiny. Například v amoniaku dochází k odštěpení Fmoc, ale ne tBoc, který se naopak odštěpuje v kyselině trifiuoroctové. 9nebo Af-hydroxysukcinimidem. 248 ls 2s 2pz 2px 2py Obrázek 15.11: Schematické znázornění prvních pěti orbitalů atomu vodíku. Modré šrafovaní odpovídá kladnému znaménku vlnové funkce, červené šrafovaní odpovídá zápornému znaménku vlnové funkce. C Kvantové metody Cl Kvantová mechanika atomů I ty největší biomakroniolekuly se skládají z atomů. Atomy jsou tvořeny jádrem a elektrony. Jak postupujeme k menším a menším částicím, přestávají platit fyzikální zákony tak, jak jsme na ně zvyklí. Pro popis malých částic musíme místo naší klasické mechaniky použít obecnější metodu - kvantovou mechaniku. V případě elektronů je kvantové chování již tak výrazné, že nám neumožňuje říci přesně, kde se elektrony v daný okamžik nacházejí. To ale neznamená, že místo výskytu elektronů je zcela náhodné. Pro popis elektronů se používá komplexní matematická funkce (jako proměnné v ní vystupují souřadnice a čas), které fyzici říkají vlnová funkce. Místo toho, abychom sledovali, jak se působením vnějších sil mění polohy a rychlosti elektronů, sledujeme jak se mění vlnová funkce10. Kvantová mechanika nám pak poskytuje předpisy, jak z vlnové funkce získat informace o fyzikálních veličinách elektronů. Jednou takovou užitečnou informací je pravděpodobnost, že se v daný okamžik elektron vyskytuje v určitém místě. Tuto pravděpodobnost můžeme spočítat jako druhou mocninu (absolutní hodnoty) vlnové funkce ip, tedy jako součin vlnové funkce a funkce s ní komplexně sdružené (tedy s opačným znaménkem imaginární části, označuje se hvězdičkou): ipíp*. V atomech se elektrony vyskytují jen v určitých stavech. Každý stav má určitou energii (energie se tedy nemění spojitě, ale poskakuje od stavu ke stavu) a je popsán určitou vlnovou funkcí. Vlnová funkce elektronu v atomu nebo molekule se nazývá orbital. Nemůžeme tedy říci, že se v určitém stavu nachází elektron v určitém místě, ale můžeme říci, že každý stav má určitou pravděpodobnost výskytu elektronů a že tuto pravděpodobnost můžeme spočítat pomocí uvedeného předpisu ipíp*. Nejjednodušším atomem je atom vodíku. Jeho jádro je tvořeno jediným protonem, v jehož okolí se vyskytuje jediný elektron. Mezi kvantovými chemiky se atom vodíku těší zvláštní oblibě. Vzájemné působení částic lze přesně analyzovat pouze pro dvojici částic11 a atom vodíku je jedním ze vzácných případů dvojčásticové soustavy, která má nějaký chemický význam. Vlnové funkce atomu vodíku jsou natolik populární, že pronikly až do středoškolských učebnic v grafickém znázornění, uvedeném na obrázku 15.11. Ostatní atomy mají více než jeden elektron a přesné řešení kvantových rovnic, které poskytují jejich vlnových funkce, není možné. Často se proto používá zjednodušené řešení, nazývané Hartreeho-Fockova metoda. Zjednodušením je zde předpoklad, že jednotlivý elektron nevidí své kolegy jako jednotlivé 10Tyto změny vlnové funkce popisuje obecný předpis známý pod jménem Schrôdingerova rovnice. 1:LToto platí nejen pro kvantovou mechaniku, ale i pro mechaniku klasickou. Problém tří těles je v astronomii stejně neřešitelný jako problém tří částic v kvantové fyzice. C. KVANTOVÉ METODY 249 částice, ale jako jakýsi rozmazaný průměrný záporný náboj12. Slůvko „nevidí" zde označuje elektrostatické odpuzování mezi stejně nabitými částicemi. Z fyzikálního pohledu potom řešíme pohyb jediného elektronu v elektrickém poli tvořeném kladně nabitým jádrem a rozptýleným záporným nábojem13. Pokud předpokládáme, že obláček ostatních elektronů kolem jádra má pěkně kulový tvar, dostaneme stejné tvary atomových orbitalů jako v případě atomů vodíku. Chemici se proto neostýchají používat tyto orbitaly, které jsou odvozeny z vodíkových, i pro ostatní atomy. C.2 Molekulové orbitaly Když sestavíme z atomů molekulu, změníme prostředí, ve kterém se elektrony pohybují. Nepřekvapí proto, že musíme hledat nové stavy elektronů. Tyto nové stavy budou popsány novými vlnovými funkcemi (novými orbitaly). Je tedy nutno rozlišovat atomové orbitaly elektronů v izolovaných atomech a molekulové orbitaly elektronů v molekulách, jinak bychom nemohli popsat vznik chemických vazeb. Při hledání molekulových orbitalů pochopitelně narážíme na stejnou překážku, se kterou jsme se setkali u atomů s více elektrony: kvantové rovnice nelze přesně řešit. Můžeme opět použít starý trik a hledat řešení pro jediný elektron, zatímco ostatní elektrony nahradíme jejich elektrickým polem (Hartreeho-Fockova metoda). Molekuly jsou ale složitější než atomy tím, že neobsahují jen více elektronů, ale i více jader. Naštěstí jsou jádra mnohem těžší než elektrony a pohybují se daleko pomaleji. Tyto pomalé pohyby lze bez větších chyb zanedbat, když popisujeme rychlé hemžení elektronů14. Abychom mohli tento postup použít, musíme samozřejmě vědět, kde se nacházejí jádra všech atomů v molekule. Jakmile známe polohy jader, můžeme vypočítat tvar elektrického pole, ve kterém se nacházejí elektrony a počítat jejich orbitaly. Pokud chceme spočítat neznámou strukturu, polohy jader atomů pochopitelně neznáme. V tom případě postupujeme tak, že provádíme kvantový výpočet opakovaně s různým rozmístěním jader atomů a hledáme, které rozmístění atomů je nejvýhodnější. Tento postup se nazývá optimalizace geometrie, jde vlastně o minimalizaci energie molekuly. O takovýchto minimalizacích budeme hovořit v sekci C.3, takže řešení problému polohy jader zatím odložíme. V následujících řádcích budeme pro jednoduchost předpokládat, že polohy jader známe. Vraťme se teď k hledání molekulových orbitalů (jak jsme si řekli, předpokládáme že polohy jader známe). Pokud se nám nechce hledat vhodný tvar pole ostatních elektronů pro Hartreeho-Fockovu metodu, můžeme využít toho, co už známe. Kvantová mechanika nás učí, že z určitého počtu atomových orbitalů můžeme získat stejný počet molekulových orbitalů lineární kombinací. Srozumitelněji řečeno, jednotlivé vlnové funkce (atomové orbitaly) vynásobíme vhodným koeficientem a pak je všechny sečteme. Abychom získali tolik molekulových orbitalů, kolik bylo atomových, musíme sčítání opakovat s různými koeficienty tolikrát, z kolika atomových orbitalů vycházíme. Tato metoda, srdci obyčejného chemika blízká, bývá nazývána metodou molekulových orbitalů jako lineárních kombinací atomových orbitalů (metodou MO-LCAO). Důvod její obliby je jednoduchý, můžeme použít dobře známé atomové orbitaly a bez velkého počítání kvalitativně popsat chemické vlastnosti molekuly. Chceme-li použít metodu MO-LCAO, musíme vědět, jakým způsobem orbitaly sčítat a odčítat. Jako vodítko slouží tato obecná pravidla: • Výsledný molekulový orbital musí odpovídat symetrii (tvaru) molekuly. • Zpravidla stačí použít valenční atomové orbitaly (atomové orbitaly popisující elektrony, které mají v daném atomu nejvyšší energii, jsou tedy nejvolněji vázány k jádru a nejochotněji mění svůj 12Zjednodušení víceelektronového problému na jednoelektronový znamená, že se elektrony budou chovat, jako by o sobě navzájem „nevěděli". Ve skutečnosti ovšem elektrony nejsou nezávislé, jejich výskyt v atomu je korelován. Chyba, které se dopouštíme tím, že tuto korelaci zanedbáme, se projeví zvýšením energie o příspěvek zvaný korelační energie. 13V literatuře se můžete setkat také s názvem metoda konzistentního pole neboli metoda SCF (z anglického self-consistent field). Toto označení vychází ze způsobu, jakým se hledá popis zprůměrovaného působení ostatních elektronů. 14Toto zjednodušení se nazývá Bornova-Oppenheimerova aproximace. 250 Obrázek 15.12: Osa symetrie a roviny symetrie molekuly vody. Vpravo je schematicky znázorněno šest molekulových orbitalů, které vyhovují symetrii molekuly vody. Orbital s nejnižší energií je nakreslen dole, orbital s nejvyšší energií nahoře. Barevné šrafovaní ukazuje znaménko vlnové funkce. stav za tvorby chemické vazby). • Atomové orbitaly, které sčítáme, musí mít vhodný tvar a vzájemnou orientaci, musí se co nejvíce překrývat. • Sčítáme anebo odečítáme orbitaly, které popisují elektrony s přibližně stejnou energií. Jako příklad si můžeme uvést hledání molekulových orbitalů vody (obrázek 15.12). Chceme získat orbitaly, které věrně zobrazí tvar molekuly vody. Molekula vody je symetrická vzhledem k otočení o 180° kolem osy, která půlí úhel Z H-O-H. Navíc má dvě zrcadlové roviny symetrie které se protínají ve zmíněné ose: v jedné leží všechny tři atomy a druhá je na ni kolmá. Valenční atomové orbitaly, které máme k dispozici, jsou dva orbitaly ls atomů vodíku, jeden orbital 2s atomu kyslíku a tři orbitaly 2p atomu kyslíku. Když tyto orbitaly přeložíme přes sebe tak, aby odpovídaly tvaru molekuly vody a aby se co nejvíce překrývaly, získáme šest molekulových orbitalů. Atomové orbitaly nemívají pro sestavování molekulových orbitalů nejvýhodnější symetrii. Proto chemici s oblibou používají jinou sadu orbitalů, než poskytuje atom vodíku. Tyto orbitaly, zvané hybridní, lze opět získat lineární kombinací. Tentokrát ovšem sčítáme atomové orbitaly téhož atomu mezi sebou. Jestliže vodíkové atomové orbitaly dobře odrážely kulovou symetrii jádra vodíku, hybridní orbitaly slouží jako polotovary, které jsou již konstruovány tak, aby odpovídaly okolí atomu v typických sloučeninách. Například atom uhlíku, který se ocitne v alifatické sloučenině, bývá symetricky obklopen čtyřmi sousedními atomy, které leží ve vrcholech pomyslného čtyřstěnu. Pro vytvoření molekulových orbitalů alifatických sloučenin si proto chemik přichystá vhodný hybridní orbital. Vezme jeden orbital 2s a tři orbitaly 2p uhlíku a posčítá je tak, aby získal čtyři navlas stejné orbitaly, které budou mít C. KVANTOVÉ METODY 251 stejnou symetrii jako čtyřstěn. Pro látky jako karboxylové kyseliny nebo alkeny, ve kterých je uhlík obklopen jen třemi atomy v rozích pomyslného trojúhelníka, si připraví jinou sadu tří orbitalů, které mají požadovanou symetrii. Podrobnější popis postupu tvorby molekulových orbitalů pro biologicky zajímavý příklad peptidové vazby můžete najít v dodatku D. C.3 Metody ab initio Po kvalitativním popisu molekulových orbitalů přistupme k vlastnímu kvantitativnímu výpočtu orbitalů, které popisují biologicky zajímavé molekuly. Nejserióznější způsob, jakým lze tyto výpočty provádět, je odmítnout všechny nápovědy, které nám nabízí experiment a zkušenosti popsané v literatuře. Takový výpočet se hrdě opírá jen o obecné zákony kvantové mechaniky a základní fyzikální konstanty a označuje se jako přístup ab initio15. Jak jsme si již řekli, přesný výpočet je možný jen pro nejjednodušší případy. Proto metody ab initio používají nejrůznějších zjednodušení a přibližná řešení hledají pomocí výkonných počítačů. Metody ab initio můžeme použít k výpočtu energie molekuly v určité konformaci (takzvaný single-point výpočet), nebo k hledání energeticky nej výhodnější konformace, případně k výpočtu jiných vlastností molekuly. Hledání stavu molekuly s nejnižší energií (minimalizace energie), které nás zajímá především, probíhá podle zásad uvedených v sekci 11.8. 1. Vypočteme energii v určité konformaci16. 2. Vypočteme síly, které působí na atomy v dané konformaci. Sílu lze spočítat jako derivaci energie v daném bodě v různých směrech, tedy gradient. 3. Necháme působit vypočtené síly na atomy a vypočteme, jak tyto síly změní konformaci. 4. Znovu vypočteme energii a síly, teď již pro pozměněnou konformaci. 5. Srovnáme výsledky kroku 1 s výsledky kroku 4. Pokud jsou splněna konvergenční kritéria, počítání končí. Pokud nalezneme ve výsledcích rozdíl, opakujeme kroky 2 až 4. Během výpočtu ab initio je nutné počítat vlnové funkce (orbitaly), které popisují chování elektronů v molekule. V sekci C.2 jsme si ukázali, že molekulové orbitaly lze získat lineární kombinací atomových orbitalů. Nemusíme ovšem vycházet z orbitalů atomu vodíku, molekulové orbitaly můžeme vypočítat lineární kombinací nejrůznějších sad orbitalů. Taková sada funkcí, jejíž kombinací lze získat požadovaný orbital, se matematicky nazývá báze. Volba vhodné báze funkcí je pro výpočet velmi důležitá. Nejpřirozenější bází funkcí pro výpočty ab initio jsou staré dobré atomové orbitaly. Jde o vlnové funkce, které exponenciálně klesají se vzdáleností od jádra17. Funkce vycházející ze zjednodušeného popisu atomových orbitalů se nazývají orbitaly Slaterova typu (STO, Slater type orbitals). Jak vidíme na obrázku 15.13, exponenciální křivka je pro nulovou vzdálenost od jádra „špičatá" (má nespojitou první derivaci). Počítání s orbitaly STO je ale poměrně složité. Z praktických důvodů se proto jako báze používají vlnové funkce, které mají v exponentu druhou mocninu vzdálenosti. Exponenciální křivku tak nahrazujeme Gaussovou křivkou. Samozřejmě tak získáme vlnové funkce na hony vzdálené atomovým orbitalům a nemůžeme očekávat, že tyto funkce budou dobře popisovat naši molekulu. Když ale sečteme několik Gaussových křivek, získáme křivku, která má tvar velmi podobný exponenciále. Takto dospějeme k popisu molekul, který je vhodný pro výpočty, za cenu, že báze obsahuje větší počet funkcí zvaných 15 Od začátku. 16Metody ab initio ovšem nejsou omezeny na konformační změny, můžeme pomocí nich popsat i chemické reakce. 17Přesněji řečeno, u funkcí vypočítaných z rovnic kvantové mechaniky jde o exponenciální závislost na vzdálenosti r vynásobenou mnohočlenem, který obsahuje celočíselné mocniny vzdálenosti (například (ao + a±r + a2r2)e~br, kde ao, ai, íi2, b jsou konstanty). Pro vytvoření báze se mnohočleny nahrazují zjednodušeným výrazem rae~br. Nám bude stačit, když se zaměříme na exponenciální část zjednodušených funkcí. 252 orbitaly Gaussova typu (GTO, Gauss type orbitals). Obrázek 15.13 ukazuje jednoduchý příklad upravené báze pro atom vodíku, bázi označovanou STO-3G. V ní je jeden orbital Slaterova typu (ls) nahrazen třemi orbitaly Gaussova typu. Jiným příkladem je báze 6-31G. Označení ukazuje, že orbital ls (STO) je třeba nahradit jedním GTO, který vytvoříme součtem šesti Gaussových křivek. Každý ze čtyř orbitalů STO, které odpovídají 2s a 2p orbitalům, je třeba nahradit dvěma GTO, z nichž jeden je složen ze tří Gaussových křivek a druhý je tvořen jedinou Gaussovou křivkou. Popsané báze sice dobře odrážejí nejvýhodnější rozložení elektronů, nepopisují ale polarizaci (přesuny elektronů v elektromagnetickém poli). Proto se k bázi přidávají ještě takzvané polarizační funkce, které odpovídají vyšším atomovým orbitalům18. Mluvíme pak o rozšířených bázích, jejichž „nadstandardní vybavení" se v označení báze projeví jako hvězdička. Například báze 6-31G* přidává sadu orbitalů d jako polarizační funkci uhlíků, zatímco báze 6-31G** přidává navíc orbitaly p jako polarizační funkce vodíku. Až dosud jsme zmiňovali pouze výpočty založené na Hartreeho-Fockově metodě, založené na zjednodušujícím popisu jednoho elektronu v poli nahrazujícím ostatní elektrony. Takové zjednodušení vnáší do výpočtu chyby, protože každý elektron ve skutečnosti „cítí" nejen průměrný náboj ostatních elektronů, ale také to, kde se ostatní elektrony nacházejí. Tyto chyby je třeba opravovat složitými výpočty. V současné době lze tento poměrně přímočarý postup použít jen pro soubory několika málo atomů. Musíme totiž opravovat zanedbání toho, že „každý ví o každém", takže počet opravných výpočtů prudce roste pro větší molekuly (téměř s druhou mocninou počtu atomů). Existují ale metody založené na zcela odlišném principu, který je označován jako teorie funkcionálu hustoty (DFT, density functional theory). Tato teorie říká, že popis elektronů, které na sebe v molekule vzájemně působí, lze nahradit výhodnějším popisem. Elektrony můžeme popsat jako částice bez náboje, které na sebe nepůsobí. Toho, aby se takové neutrální částice chovaly stejně jako elektrony v molekule, dosáhneme tím, že je umístíme do zvláštního elektrického pole. Teorie DFT dokazuje, že vždycky existuje pole, kterým lze vzájemné působení elektronů popsat. Toto pole ovšem neznáme, musíme je hledat pomocí složitých výpočtů. Na první pohled se zdá, že jsme si moc nepomohli. Stejně jako v Hartreeho-Fockově metodě musíme složitě dodatečně zahrnovat to, že elektrony o sobě „vědí". Je tu ale zásadní rozdíl. Ono tajemné elektrické pole metody DFT je jen jedno pro celou molekulu, stejné pro všechny elektrony. Opravy tedy nemusíme provádět způsobem „každý s každým", jako v Hartreeho-Fockově metodě, ale jenom jednou pro každý elektron. Pomocí metod DFT lze proto dnes provádět ab-initio kvantové výpočty i s několika desítkami atomů. Dalším důležitým rozdílem mezi Hartreeho-Fockovou metodou a metodou DFT je způsob, jakým získáme kýžený výsledek - energeticky výhodné rozložení elektronů v prostoru, které udává tvar molekuly. Hartreeho-Fockova metoda je založena na tom, že z vlnových funkcí můžeme spočítat energii i rozložení elektronů v prostoru. Hledáme proto takovou vlnovou funkci, která odpovídá nejnižší energii. Z této vlnové funkce pak můžeme vypočítat rozložení elektronů (elektronovou hustotu) v základním stavu molekuly a jiné užitečné veličiny. Metoda DFT postupuje opačně. Hledáme přímo takové rozložení elektronů v prostoru (takovou funkci elektronové hustoty), která odpovídá nejnižší energii elektronů v tom tajemném elektrickém poli, které teorie DFT zavádí. Pokud chceme získat i vlnovou funkci, můžeme ji vypočítat zpětně z elektronové hustoty. Tím se dostáváme i k názvu metody. Mluvíme o funkcionálu hustoty, protože energii vyjadřujeme jako funkcionál funkce elektronové hustoty19. 18Orbitaly, které odpovídají polarizačním funkcím, mají vyšší vedlejší kvantové číslo Z, než odpovídá zaplněným orbitalům daného atomu. 19Funkce je matematický předpis, jak přiřadit hodnotu nějaké veličiny (v našem případě energie) určitým hodnotám proměnných (v našem případě souřadnic). Funkcionál je matematický předpis, jak přiřadit hodnotu nějaké veličiny (v našem případě energie) určité funkci jako celku (v našem případě funkci elektronové hustoty). C. KVANTOVÉ METODY 253 y / / / \ N \ \ / / / / / / / / / / / / / / / / / / / / \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ / / / / / / / / i S /y \ \ \ \ \ \ j// *— / ^— / ^— / ____ / —— ✓ \ ^^^^ N. 2** ____ Vzdálenost od jádra r \ 9i + 92 + 53 / ----- ^^^^ ' /' s 1 s' 1 \Si = cie "^-^ Vzdálenost od jádra r Obrázek 15.13: Graf vlevo ukazuje srovnání tvaru exponenciály (plná čára) a Gaussovy funkce (čerchovaná čára). Graf vpravo ilustruje, jak lze přibližně nahradit exponenciálu součtem tří Gaussových funkcí. 254 C.4 Semiempirické metody Náročnost metod ab initio vedla k mnoha snahám o zjednodušení výpočtu. Při použití těchto metod se vzdáváme snahy o fyzikálně přesný popis molekuly a raději hledáme cestičky, jak některou část výpočtu nahradit dosazením nějakého experimentálního údaje, nebo jak se určitému výpočtu zcela vyhnout. Prvním zjednodušením semiemprirických metod je, že výpočet omezují jen na elektrony s nejvyšší energií, které se podílejí na tvorbě chemických vazeb (valenční elektrony). Druhým zjednodušením je, že omezíme počet funkcí, ze kterých orbitaly skládáme (zjednodušíme bázi). Obvykle se jako báze používají orbitaly s a p Slaterova typu. Další zjednodušení se týká překryvů atomových orbitalů, ze kterých vyrábíme orbitaly molekulové. V sekci C.2 jsme si říkali, že pro tvorbu molekulových orbitalů (pro tvorbu chemické vazby) je nutný co nejlepší překryv atomových orbitalů. V semiempirických metodách se některé méně významné překryvy zanedbávají. Podle toho, co všechno zanedbáme, mluvíme o metodách20 NDDO, INDO, CNDO. Nejo-patrnější je metoda NDDO, naopak nej drastičtější je metoda CNDO. Zanedbáním překryvů se dopouštíme chyby ve výpočtu. Tuto chybu můžeme trochu napravit tím, že nahradíme číselné hodnoty překryvů nějakým opravným parametrem. Tento opravný parametr můžeme buď odhadnout z tvaru atomových orbitalů, nebo vypočítat z výsledků různých experimentů21. Zvláštní rodinu metod tvoří takzvané Húckelovy metody, které zavádějí opravné parametry ne místo vypočítaných překryvů, ale přímo místo hodnot potenciální energie v rovnicích kvantové mechaniky. Parametry v Hůckelových metodách vlastně odpovídají ionizačním energiím atomů (energiím, které jsou potřeba k odtržení elektronu z atomu). Proto je hledání parametrů v tomto případě velmi snadné a takzvaná rozšířená Húckelova metoda (EHM, Extended Húckel Method) poskytuje parametry pro všechny prvky periodické tabulky. EHM jsou nejlepší pro výpočty vlastností molekul obsahující atomy přechodných prvků, naopak se nepříliš hodí pro optimalizaci tvaru molekuly. Semiempirické metody umožňují kvantové výpočty pro molekuly skládající se ze stovek atomů. Je možné vypočítat molekulové orbitaly, energie jednotlivých stavů, rozložení náboje v molekule, řády vazeb a spektrální vlastnosti molekul, které zmíníme v kapitole 10. Semiemprické metody mohou zahrnovat i vliv rozpouštědla na chování molekuly. Daň za zjednodušení výpočtů ale může být velká. Zahrnutí překryvů orbitalů do empirických parametrů a úplné zanedbání vnitřních orbitalů mohou vést k závažným chybám ve výpočtu některých veličin. 20Názvy metod jsou anglické zkratky, které popisují, jak daleko jde která metoda v zanedbání překryvů: neglect of diatomic differential overlaps, intermediate neglect of differential overlaps, complete neglect of differential overlaps. 21Zavedením opravných parametrů vznikla modifikovaná metoda NDDO (označovaná MNDO). MNDO byla dále vylepšena a nazvána Austin Model 1 (podle University of Austin). Některé hodnoty parametrů v těchto metodách bylo možné vypočítat z různých experimentů. Za zbývající byla zkusmo dosazována různá čísla. Čísla, se kterými metoda poskytovala nejlepší výsledky, byla použita jako parametry, pro které neexistovaly experimentální údaje. Později byl postup hledání zbývajících parametrů zopakován automaticky s použitím počítačové optimalizace. Metoda, která používá tyto parametry nalezené počítačem, se nazývá MNDO-PM3 (parametrická metoda číslo tři). D. PEPTIDOVÁ VAZBA JAKO PŘÍKLAD CHROMOFORU 255 ls 2s 2pz 2px 2py Obrázek 15.14: Schematické znázornění atomových orbitalů. D Peptidová vazba jako příklad chromoforu Pokusme se podívat podrobněji na to, jak se interakce se světlem projeví na malé části molekuly proteinu, na peptidové vazbě. Začneme tím, že si popíšeme jednotlivé stavy elektronů této skupiny. Víme, že tyto stavy popisujeme pomocí vlnových funkcí. Abychom takovému popisu porozuměli, zkusíme si (dosti zjednodušeně) odvodit vlnové funkce peptidové vazby. D.l Atomové orbitaly Ze střední školy jistě dobře znáte schematické znázornění vlnových funkcí elektronů atomu vodíku v prostoru22 (Obrázek 15.14). Tyto obrázky jsou vlastně prostorovou obdobou izobar na meteorologických mapách. Vyznačují místa v prostoru, kde má vlnová funkce stejnou hodnotu. Obvykle se pro každý orbital znázorňují jen dvě,,izobary", pro jednu kladnou (zde znázorněna modře) a jednu zápornou (zde znázorněna červeně) hodnotu vlnové funkce. V peptidové vazbě máme jeden vodík, pro který nám bude stačit nejnižší orbital ls. Dále máme v peptidové vazbě po jednom atomu uhlíku, kyslíku a dusíku. Když budeme předpokládat, že s dvojicí elektronů v nejnižším stavu ls se nic neděje, stačí nám pro každý z těchto atomů čtyři orbitaly (jeden 2s a tři 2p). To je dohromady třináct orbitalů. Pokud budeme chtít popsat vazby k sousedním a-uhlíkům, budeme od každého z těchto a-uhlíků potřebovat ještě jeden orbital, tedy celkem 15 atomových orbitalů. D.2 Hybridní orbitaly Z popsaných 15 atomových orbitalů chceme sestavit molekulové orbitaly, kterých musí být také patnáct. Nové orbitaly můžeme spočítat jako lineární kombinaci atomových orbitalů. To znamená, že každý atomový orbital vynásobíme určitým koeficientem a tyto příspěvky sečteme. Je výhodné tento výpočet dělat nadvakrát, nejprve sestrojit takzvané hybridní orbitaly, ze kterých se nám výsledné molekulové orbitaly už budou dobře počítat. Začněme s karbonylovým uhlíkem. Budeme předpokládat, že peptidová vazba leží v rovině xy. V této rovině tvoří uhlík tři a-vazby s okolními atomy. Pro jejich popis si připravíme tři hybridní orbitaly, které 22Není důvod, proč bychom si nemohli uvést definice těchto orbitalů (bez zahrnutí relativistických vlivů) jako funkcí souřadnic x,y,z: ls = 4= (^) 3/2 e"^, 2s = -f= (^Ý'2 Í2 - ^) , 2px = -3= (Z) 5/2 ie-fř, 2py = ("f re~^°"' ^Pz = 4^/2 (í)5^2 fe~^°"' kde r2 = x2 + y2 + z2, Z je počet protonů v jádře a a je poloměr dráhy elektronu nejbližšího jádru v klasickém Bohrově popisu. 256 budeme označovat sp2. Vypočítáme je ze tří atomových orbitalů 2s, 2p.j,, 2py: spi = yJÍ2s+yJ^2px (15.94) SP2 = ^128 - y|2Pa; + y|2Py (15.95) SPÍ = \j\2s-^-2px-\j\2py (15.96) Graficky si výpočet23 orbitalů sp2 můžeme znázornit tak, jak ukazuje obrázek 15.15. V horní části obrázku jsou znázorněny orbitalů při pohledu shora na rovinu xy, v dolní části při stejném úhlu pohledu jako na předchozím obrázku. Podobným způsobem můžeme vytvořit i tři sp2 orbitaly dusíku. Trochu jiné orbitaly vypočítáme pro kyslík. Spolu s orbitalem 2s vezmeme pouze jeden orbital 2p (2p.j,), ze kterých sestrojíme dva orbitaly: sp2 a s2p. 23Pokud vám není jasné, proč jsme za koeficienty zvolili právě ty podivné odmocniny, vzpomeňte, jak jsme definovali pravděpodobnost elektronu v určitém místě v prostoru: ipíp* (pro naše orbitaly zvolené jako reálné funkce můžeme psát jednoduše tf>2). Pokud bude elektron ve stavu popsaném orbitalem tf>, musí platit, že součet pravděpodobností výskytu ve všech místech prostoru dá jedničku (někde elektron být musí). Matematicky řečeno, J ip2dV = 1 (V značí, že integrujeme přes celý objem). Zkusme si to třeba pro orbital sp2 áV=\j (2s)2dy+f / (2p*)2dy+^r j 2s2p^ = 5 + 5 + 0 (15.97) Protože poslední integrál je nulový (2s2pa; je lichá funkce, to je dáno symetrií orbitalů), můžeme říci, že pravděpodobnost výskytu v sp2 je dána z jedné třetiny pravděpodobností výskytu v 2s a ze dvou třetin pravděpodobností výskytu v 2px. D. PEPTIDOVÁ VAZBA JAKO PŘÍKLAD CHROMOFORU 257 + 2s 2Px sp' + + + sp' 2s 2Px Obrázek 15.16: Orbitaly s2p sp = s p = 2s- 2s- 2p, 2p, (15.98) (15.99) (15.100) Grafické znázornění je obdobné předchozímu (obrázek 15.16). A nakonec budeme potřebovat jeden sp3 orbital od každého a-uhlíku, který vypočteme z orbitalu 2s a ze tří orbitalů 2p (takto získáme čtyři orbitaly sp3, zbývající tři bychom mohli použít na popis dalších tří a-vazeb a-uhlíku) sp? SP2 SPÍ -2s- -2s- -2s- 2p2 1 2Px - ž2py ;2Px - l2Py 2Pz 2pz ;2Pz (15.101) (15.102) (15.103) 258 sp3 = l-2s - l-2vx + l-2vy - Í2Pz (15.104) D.3 Molekulové orbitaly Konečně jsme připraveni vypočítat molekulové orbitaly peptidové vazby. Podívejme se nejprve na orbitaly a. V peptidové skupině máme 5 er-vazeb, budeme tedy počítat 10 u orbitalů (5 vazebných a 5 antivazebných). K výpočtu použijeme jeden ls orbital vodíku, sedm sp2 orbitalů (po třech z uhlíku a dusíku a jeden kyslíkový) a dva sp3 orbitaly sousedních a-uhlíků. 7ľg je kolmý k ose z a směřuje od dusíku ke kyslíku. Naopak analýza orbitalů n a 7Tg ukazuje, že všechny složky tranzitního elektrického dipólového momentu jsou nulové. Přechod 7T2 —> 7Tg je tedy elektricky povolený, zatímco přechod n —> 7Tg je elektricky zakázaný. Tranzitní elektrický dipólový moment popisuje přesun pravděpodobnosti výskytu elektronu (a tedy i přesun náboje) určitým směrem. Jde tedy o popis jakési translační změny během přechodu. Kromě toho dochází při přechodu i k rotačním změnám pravděpodobnosti výskytu elektronu a tedy ke kruhovému toku náboje. Jak víte z fyziky, kruhový tok náboje vyvolá vznik magnetického pole. Kromě tranzitního elektrického dipólového momentu je tedy přechod mezi stavy popsán i tranzitním magnetickým dipólovým momentem. Analýza znaménka a tvaru orbitalů by nám například ukázala, že přechod n —> 7Tg má nenulový tranzitní magnetický dipólový moment, je tedy magneticky povolený. Vzájemné interakce elektrických a dipólových momentů způsobují rozdílnost v absorpci levotočivě a pravotočivé polarizovaného světla (cirkulární dichroismus). Zatímco zrcadlově symetrické molekuly mají elektrické a magnetické momenty navzájem kolmé a tedy neinteragující, v chirálních molekulách k interakci dochází. Peptidová vazba, která nás především zajímá, je ovšem rovinný útvar a sama o sobě je tedy zrcadlově symetrická. V proteinech však dochází k interakcím mezi tranzitními momenty různých 262 vazeb. Rozdíly mezi absorpcí kolem 220 nm souvisí především s interakcemi elektrického tranzitního momentu jedné vazby s magnetickým tranzitním momentem jiné vazby. Naopak rozdíly absorpcí kolem 195 nm jsou dány vzájemným působením elektrických dipólů různých vazeb. To, že cirkulární dichro-ismus závisí na interakcích dipólů jednotlivých vazeb vysvětluje, proč je tato technika tak užitečná ke zkoumání sekundárních struktur, které se liší právě vzájemnou orientací peptidových vazeb. E. SVĚTLO A SEKUNDÁRNÍ STRUKTURA 263 E Světlo a sekundární struktura Jakým způsobem odráží schopnost absorbovat světlo sekundární strukturu (pravidelné uspořádání mo-nomerních jednotek biopolymeru)? Představme si monomerní jednotku, jejíž elektrony mohou přecházet z jednoho stavu do druhého. Elektrony v těchto dvou stavech budou popisovat dvě vlnové funkce a přechod mezi těmito stavy bude popsán jedním tranzitním elektrickým dipólovým momentem. Utvořme z takových monomerních jednotek dimer. Každá jednotka bude moci přecházet z jednoho stavu do druhého, celkem máme čtyři stavy a dva tranzitní dipóly. Kdyby byly tyto dvě monomerní jednotky od sebe izolovány, měly by dva stavy stejnou energii (stav s první jednotkou v nižším stavu a druhou ve vyšším a stav s druhou jednotkou v nižším stavu a první ve vyšším). V dimeru jsou ale tranzitní dipóly blízko sebe a navzájem interagují (první leží v elektrickém poli druhého a naopak). Proto nezískáme výše zmíněné stavy se stejnou energií, ale stavy jiné. Stav, odpovídající energeticky výhodnějšímu uspořádání dipólů (s energií o něco sníženou) a stav odpovídající energeticky nevýhodnému uspořádání dipólů (s energií o něco zvýšenou). Proto bude dimer absorbovat světlo při dvou vlnových délkách. Popsaným stavům budou samozřejmě odpovídat i nové vlnové funkce a z těchto vlnových funkcí budeme moci spočítat výsledné tranzitní elektronové dipólové momenty dimeru (budou úměrné součtu a rozdílu jednotlivých tranzitních dipólových momentů). Rozdíly energií nám budou udávat vlnové délky absorpce dimeru a výsledné tranzitní dipólové momenty budou udávat pravděpodobnost absorpce při jednotlivých vlnových délkách (absorpční koeficienty). Pokud budeme ve výstavbě makromolekuly pokračovat, můžeme z monomerních jednotek vybudovat například pravidelnou šroubovici. Získáme tedy sekundární strukturu. Z tranzitních dipólů monomerních jednotek získáme tři výsledné tranzitní dipólové momenty. Jeden bude rovnoběžný s osou šroubovice a dva budou na ni kolmé. Energie přechodů popsaných dvěma tranzitním dipóly kolmými na osu šroubovice bude ale téměř stejná, takže ve spektru uvidíme dva absorpční pásy. Tvorba pravidelných šroubovic (a-šroubovic proteinů či dvojšroubovic DNA) se v absorpčních spektrech projeví rozštěpením do několika pásů a poklesem absorbance ve srovnání s neuspořádanou strukturou24. Ačkoli se mnoho nedovíme o strukturních detailech pravidelně uspořádaných makromolekul, můžeme pomocí poklesu absorbance sledovat tvorbu sekundárních struktur kvantitativně. Obvykle sledujeme pokles absorbace. 264 F Anomální rozptyl V kapitole 12.13 jsme si představili anomální rozptyl jako jev, který nám může pomoci vyřešit fázový problém. Následující text nabízí poněkud konkrétnější popis. Zopakujme si nejdříve, co jsme si řekli o intenzitě reflexí s opačnými Millerovými indexy v nepřítomnosti těžkých atomů. Elektrony, které leží na Braggových rovinách, budou rozptylovat se stejnou fází ve směru definovaném Braggovou rovinou, fáze záření rozptýleného na elektronech mezi Braggovými rovinami je posunutá úměrně kolmé vzdálenosti elektronu od Braggovy roviny (plné šipky na obrázku 15.20A). Stejná sada Braggových rovin popisuje ale také odraz na opačné straně roviny, tedy pod přesně opačným úhlem (čárkované šipky na obrázku 15.20A). Jestliže odraz paprsku znázorněného plnou čarou na obrázku 15.20A odpovídá rovině s Millerovými indexy (hkl), druhou stranu stejné roviny (od které se odráží čárkovaný paprsek) popisují Millerovy indexy (—h — k — ľ). Dvojice reflexí s indexy (hkl) a (—h — k — ľ) se označuje jako Friedelův pár. Pokud nedochází k interakci záření s elektrony, mají strukturní faktory Friedelova páru fázi stejné velikosti, ale opačného znaménka. Matematicky řečeno, jde o komplexně sdružená čísla F (hkl) = F*(—h —k — l). Jinými slovy, čárkované šipky na obrázku 15.20A jsou zrcadlovým obrazem plných šipek. Pokud se ale frekvence záření blíží rezonanční frekvenci, pohlcený foton vybudí přechod elektronu do jiného stavu a vyzářený foton bude mít jinou amplitudu i fázi25. Tento rozdíl je znázorněn krátkou tučnou šipkou na obrázku 12.11B a nazývá se anomální rozptyl. Všimněte si, že tato šipka pootočí vektory Fp,(h k l) i Fp,(h k l) ve stejném směru (změní fázi obou strukturních faktorů o stejnou hodnotu). Po přičtení příspěvků těžkého atomu (včetně anomálního rozptylu) k Fp(hkl) a Fp(—h — k — l) získáme výsledné strukturní faktory Fpu(hkl) a Fpp>(—h — k — l), které mají různou amplitudu - plná a čárkovaná kružnice na obrázku 15.20B mají různý poloměr. Strukturní faktory Friedlova páru nejsou v přítomnosti anomálnícho rozptylu komplexně sdružené F (hkl) =/= F*(—h — k — ľ). Tento rozdíl vynikne lépe, když si místo černé čárkované šipky Fpp,(—h —k—l) nakreslíme její zrcadlový obraz (což není nic jiného, než komplexně sdružený vektor FpU(—h — k — l)). Obrázek 15.20C ukazuje, že vektor FpU(—h — k — l) se nepřekrývá s plnou šipkou Fpp,(hkľ) a má i jinou amplitudu (různé poloměry kružnic). Rozdílná amplituda se projeví v difrakčním obrazci jako různá intenzita reflexí s indexy (h k ľ) a (—h — k — ľ). Pokud jsme schopni rozlišit intenzity reflexí s opačnými hodnotami indexů h, k, l, můžeme anomální rozptyl využít pro řešení fázového problému podobně jako v případě isomorfního nahrazení. Graficky je takový postup ukázán na obrázku 15.21. Pokud budou všechny rozptylovat stejně, nebude ovlivněna amplituda, ale jen fáze F. ANOMÁLNÍ ROZPTYL 265 A Obrázek 15.20: Friedelův pár a anomální rozptyl. Obrázek A zachycuje situaci v nepřítomnosti těžkého atomu, obrázky B a C v případě, že je přítomen těžký atom vykazující anomální rozptyl. Vlevo je znázorněna poloha lehkých atomů (nakreslených červeně, zeleně a modře) a jednoho těžkého atomu (nakresleného azurovou barvou) mezi Braggovými rovinami, vpravo Argandův diagram ukazující sčítání strukturních faktorů jednotlivých atomů (strukturní faktory a atomy jsou nakresleny stejnými barvami). Čárkovaně jsou nakresleny strukturní faktory pro odraz od spodní strany Braggových rovin. Černé šipky představují výsledné strukturní faktory pro molekulu bez těžkého atomu (Fp) a s těžkým atomem (Fpo)- Obrázek C zachycuje srovnání strukturního faktoru Fpo(hkl) s hodnotou komplexně sdruženou se strukturním fatorem Fpp>(—h — k — l) (vektor i?pD(—h — k — Z)). Tučné azurové šipky znázorňují fázový rozdíl v důsledku anomálního rozptylu. 266 Obrázek 15.21: Využití anomálního rozptylu k řešení fázového problému. Na obrázku A jsou zakresleny strukturní faktory. Fp značí strukturní faktor nativní biomakromolekuly (stejný pro (hkľ) a (—h — k —l)), který není ovlivněn anomálním rozptylem. Vektory Fp, (různé pro (hkľ) a (—h — k — l)) jsou strukturní faktory těžkých atomů, které vykazují anomální rozptyl. Vektory Fpp, jsou výsledné strukturní faktory derivátu s těžkými atomy. Ve skutečnosti známe pouze vektory Fp>(h k ľ) a, Fp>(—h —k—l) a amplitudy \Fp , \Fpp> \(hkl) a \FpD\(—h —k—l). Obrázky B až C ukazují princip řešení. Nejprve si nakreslíme plnou kružnici o poloměru \Fp\, která zachycuje veškerou informaci o strukturním faktoru nativní molekuly (obrázek B). Potom zaneseme do diagramu údaje o derivátech. Vektory Fu(hkl) a Fp>(—h — k — ľ) můžeme zakreslit přímo. Jak jsme si vysvětlili v popisu obrázku 12.10, musí střed plné kružnice, znázorňující amplitudu \Fp\, ležet v konci vektoru Fp,. To platí pro (hkľ) i (—h — k — l), proto zakreslíme vektory Fp>(hkľ) a Fp>(—h — k — ľ) tak, aby směřovaly do středu plné kružnice, jak je ukázáno na obrázku C. Nakonec zakreslíme tečkovanou a čárkovanou kružnici odpovídající strukturním faktorům Fpp,, které jsou ovlivněny anomálním rozptylem a liší se znaménkem indexů h, k, l. Tyto kružnice mají proto různé poloměry. Jejich posunutí vzhledem k plné kružnici, odpovídající strukturnímu faktoru nativní bimakromolekuly neovlivněné anomálním rozptylem, je dáno směry Fp, (středy kružnic leží v počátcích Fu(hkl) a Fp>(—h — k — l)). Podobně jako při použití isomorfního nahrazení nám řešení udávají průsečíky kružnic. Tam, kde se všechny kružnice protnou, leží konce hledaných vektorů (obrázek D). G. SKALÁRNÍ INTERAKCE A PŘIŘAZENÍ SPEKTER NMR NUKLEOVÝCH KYSELIN 267 G Skalární interakce a přiřazení spekter NMR nukleových kyselin Jak bylo zmíněno v kapitole 14.12, frekvenční přiřazení proteinů je založeno na jednovazebných skalárních interakcích. Výhodou tohoto přístupu je nezávislost na konkrétní konformaci. Frekvenční přiřazení nukleových kyselin pomocí skalárních interakcí naráží na to, že jednovazebné interakce často nejsou k dispozici a je nutno využívat dvou- i třívazebných interakcí. V důsledku toho je tento přístup u nukleových kyselin komplikován nízkou citlivostí a závislostí na konformaci u některých experimentů (jak dobře víme, tří vazebné interakce závisí na torzních úhlech). Přiřazení páteře (sekvenční přiřazení) Fosfátové skupiny páteře nukleových kyselin obsahují kyslík, který nemá vhodné izotopy pro NMR. Sekvenční přiřazení je proto založeno především na třívazebných interakčních konstantách 3 J (PC) a 3 J(PH). První interakce využívá například HCP experiment, který poskytuje korelace H4'(z)-C4'(z)-P(z) a H4'(í-1)-C4'(í-1)-P(í) (obdoba HNCA a HN(CO)CA u proteinů). Druhou interakci využívá HPHCH experiment, který poskytuje korelace R5'(i)-C5'(i)-P(i), R5"(i)-C5'(i)-P(i) a H3'(í - Í)-C3'(i - 1)-P(i). Třetí možností je PCCH-TOCSY experiment (varianta HCCH-TOCSY experimentu popsaného pro proteiny), který využívá 3J(PC) interakce ke korelaci fosforu s pentosovým kruhem, následuje homonukleární TOCSY korelace cukerných uhlíků a heteronukleární korelace s navázaným protonem. Tak je možné korelovat fosfor s různými atomy (deoxy)ribosy. Přiřazení v cukrech K přiřazení protonů a uhlíků v (deoxy)ribose se používá HCCH-TOCSY experiment, který byl popsán pro proteiny. Korelace báze-cukr Ke korelaci H6 (pyrimidinů) a H8 (purinů) s Hl' cukru se používá dvojice HCN experimentů, z nichž jeden excituje uhlíky alifatické a druhý aromatické. Získáme tak korelace H6-C6-N1 (pyrimidinů), H8-C8-N9 (purinů) a H1'-C1'-N1 (pyrimidinů) a H1'-C1'-N9 (purinů). Opět jde o obdobu HNCA a HN(CO)CA u proteinů. Zmíněných korelací lze dosáhnout i použitím jednoho experimentu (HCNCH), jehož citlivost je ale nižší. Přiřazení v bázích Základním úkolem přiřazení v bázích nukleových kyselin je přiřazení jednotlivých protonů. Ke korelaci protonů v polohách 5 a 6 pyrimidinů lze využít jednovazebných interakcí 1 J(CH) a 1 J(CC). Korelace vzdálenějších protonů využívá často vícevazebných skalárních interakcí, které bývají v aromatických heterocyklických spinových systémech bází poměrně intenzivní (naopak některé jednovazebné skalární interakce jsou velmi slabé). Často se používá princip TOCSY. Jako příklad můžeme uvést opět HCCH-TOCSY experiment, používaný ke korelaci H2 a H8 u adeninu, nebo HNC-TOCSY-CH experiment (na rozdíl od předchozího koreluje v prvním kroku imino-protony s uhlíky přes imino-dusík, tedy obdobně jako v HNCA experimentu), používaný ke korelaci Hl a H8 u guaninu.