Proteinová krystalografie Jaromír Marek, Laboratoř funkční genomiky proteinů, MU Brno Historický úvod •Monokrystalová strukturní analýza - studium 3-D struktur „molekul“ difrakčními technikami •Potřeba vhodné „sondy“ – například rentgenového záření (1895, N.c. za fyziku 1901 – W. C. Röntgen) •1912 - průkaz vlnové povahy rentgenového záření jeho difrakcí na krystalu (N.c. za fyziku 1914 – M. von Laue) •1913-14 - První analýzy struktur krystalů (N.c. za fyziku 1915 –W.H. Bragg & W.L. Bragg) • Další strukturní krystalografové -nositelé Nobelovy ceny •1954 - chemie - L. Pauling - „The nature of the chemical bond and the structure of molecules and crystals“ •1962 - chemie - M.F.Perutz & J. C. Kendrew – první proteiny •1962 - medicína - F.H.C.Crick, J.D.Watson, M.H.F.Wilkins-DNA •1964 - chemie - D. Crowfood-Hodgkin - biochemické molekuly •1988 - chemie - J.Deisenhofer, R.Huber & H. Michel - membránové proteiny •2003 - chemie (1/2) - R. MacKinnon - „structural and mechanistic studies of ion channels" •2006 - chemie - R. D. Kornberg - „molecular basis of eukaryotic transcription“ (= struktura RNA polymerázy) •2009 - chemie - V. Ramakrishnan, T.A. Steitz, A.E. Yonath - „structure and function of the ribosome • Nárůst užití difrakčních metodik pro určování 3-D struktur krystalů v čase biologické makromolekuly (databáze PDB) 90. léta - PCR [objev 1983, (1/2) N.C. za chemii 1993 - Kary B. Mullis],plošné detektory, synchrotronové záření pdb-počet1 Postgenomická éra biologie ? •J.C. Venter et al.: The Sequence of the Human Genome, Science 2001 February 16; 291: 1304-1351. •The genome international sequencing consortium: Initial sequencing and analysis of the human genome, Nature 409, 860-921; 15 February 2001. •The Arabidopsis genome initiative: Analysis of the genome sequence of the flowering plant Arabidopsis thaliana. Nature 408, 796-815; 14 December 2000. Studium genetických informací •Prohledávání velkých databází a hledání jednotlivých genů (lidský genom: 25000Þ 28000 Þ ±23500 genů/2011) •Určování funkce jednotlivých genů •Struktury všech proteinů:Human proteome project Techniky studia 3D struktur proteinů Z roztoků PDB NMR 2001 : 2 a ¼ tisíce 2008 : 7 a ½ tisíce Krystaly Difrakční techniky Přes 12 tisíc 44 a ½ tisíce Očekává se, že převážná většina struktur globulárních proteinů (proteinů s dobře určenou terciární strukturou) bude určována difrakcí rtg. (resp. synchrotronového) záření i v budoucnu. Teoretické základy difrakčního studia 3-D struktur •„sonda“ vhodné velikosti pro studium atomů – rentgenové záření o vlnové délce v oboru standardních meziatomových vzdáleností (~ 1 Å) •Foton s látkou interaguje rozptylem nebo absorbcí •Rozptyl - s energetickými ztrátami – Comptonovský • - beze ztrát energie - Thompsonův Teoretické základy difrakčního studia 3-D struktur: Thompsonův rozptyl rentgenového záření •Nabitá částice je v poli rovinného monochromatického záření sekundárním zdrojem elektromagnetického pole Rozptyl na protonech je nevýznamný (je 18372x slabší), difrakcí RTG záření studujeme elektronovou strukturu látky Určování struktur enzymů 1.Určení genu 2.Příprava rekombinantního proteinu, čištění, zahušťování… 3.Krystalizace 4.Difrakční experiment 5.Fázový problém, příprava modelu 6.Zpřesňování modelu 7. 373px-X_ray_diffraction Studium genetické informace •Není dosud přesně známo, kolik genů v lidské DNA je. •Zatím jen u cca 1/10 lidských enzymů je známa jejich funkce •Zpracování genetických informací není možná bez počítačů • •Problematické místo - formulace hypotéz o polohách genů • a funkcích jejich produktů Příprava biologického materiálu •Naprostá většina v současnosti studovaných proteinů se připravuje biotechnologickými metodami (rekobinantní DNA, nadprodukce v modelovém systému, …) •Výhody – „snadnost“ provádění genetických modifikací • •Kritická místa : funkčnost u rekombinantních proteinů • protein musí být rozpustný • čištění • Krystalizace •Až doposud nejkritičtější a časově nejnáročnější část určování 3-D struktur •Využívání již existujících zkušeností o krystalování jiných proteinů (statistické zpracovávání „řídkých“ mnoharozměr. množin empirických dat => krystalizační sety pokrývající širokou škálu chemických podmínek) •Proteomický projekt - první testy s robotem na automatickou krystalizaci (automatické míchání a pipetování roztoků, nanolitrové objemy, strojem řízené mikroskopování a na FT založené vyhodnocování výsledků ) . Zpracování až desítek proteinů (desítky tisíc testovacích krystalizací) týdně. kryst kryst1 Difrakční experiment pro určení 3-D struktury: Generování rentgenového záření •Konvenční laboratorní zdroje charakteristického rentgenového záření – rentgenová lampa a rotační anoda •Limitace – „bodový“ zdroj kulových vln s omezenými možnostmi zvyšování vyzářeného výkonu • •Synchrotrony – zdroje vysoce intenzivního spojitého spektra – řádově kratší experiment (řádově hodiny) f47 Difrakční experiment : nekonvenční zdroje RTG záření 3D_model_of_the_machine Corel-Capt Difrakční experiment pro určení 3-D struktury: Plošný detektor s polovodičovým CCD prvkem •Detektor pracuje s podobnými polovodičovými prvky jako digitální fotoaparát. •Scintilační krystal převádí rentgenové záření do pásma viditelného světla •Klady: - rychlost •+-: - velikost CCD prvku – osvětluje se zužovacím segmentem ze světlovodivých vláken •Zápor:- vlastní teplotní šum polovodičů • light_budget ADSC-Quantum-315r-inside Difrakční experiment •Naprostá většina proteinových struktur je nyní určována ze synchrotron. difrakčních dat (hlavní klady: intenzita záření, rychlost experimentu, možnost optimalizace vlnové délky) a za kryopodmínek (dlouhodobá stabilita krystalu, lepší difrakční schopnosti). • •„Domácí“ laboratoře – testování difrakční kvality krystalů, „ladění“ kryoexperimentů, předzmražování krystalů. •Sběr úplných difrakčních synchrotron. dat – řádově desítky minut, často i výrazně méně •Automatizovaná výměna a měření zmražených (kryo)vzorků • •Obrovský „boom“ Se-proteinů & MAD/SAD experimentů Difrakční experiment: automatický difraktometr-schéma sch_ma_diffraction__M Experiment: omezené množství dat •Geometrická limitace počtu měřitelných dat – Braggova rovnice • • •Difrakční experiment a jeho rozlišení (Resolution) • • Teoretické základy difrakčního studia 3-D struktur: Strukturní faktor, elektronová hustota a fázový problém •Strukturní faktor – popisuje amplitudu difraktované vlny Krystalová elektronová hustota je obráceným Fourierovým obrazem strukturních amplitud Fázový problém – neměříme strukturní amplitudy, ale intenzity difrakcí Fázový problém •cíl – zjistit 3-D model studované (makro)molekuly •prostředek – určit při difrakčním experimentu ztracenou informaci o fázích strukturních amplitud a FT poté získat mapy elektronových hustot • •nejjednodušší metoda – fázový problém vůbec neřešit, využít podobnost studovaného sytému se systémem s již známou 3-D strukturou (MR, molecular replacement). •nutná je poměrně velmi vysoká podobnost mezi modelem a studovaným systémem (AA identita cca 30% a lépe, AA podobnost 50% a lépe) Deriváty proteinů •kanály rozpouštědla (krystalograficky neuspořádané vody) •relativní stabilita terciální struktury globulárních proteinů při interakci jejich interakci s „malými“ molekulami • •nutnost opakovaných měření s různými dobře difraktujícími izomorfními deriváty • •podobnost struktur proteinů s jejich Se-Met analogy •disperzní závislost reálné i imginární složky fSe • IR1 mir Zpřesňování proteinů: omezené množství dat •Rozlišení Počet nezáv. Poměr počtů • reflexí reflexí a proměnných • [ Å ] {x,y,z} {x,y,z,B} •40.0-3.0 3500 0.8 - •40.0-2.5 6800 1.6 1.2 •40.0-1.9 13500 3.1 2.3 •40.0-1.5 29800 6.8 5.1 •40.0-1.2 58800 13.3 10.0 •40.0-1.0 81300 18.5 13.8 •Protein s 182 AA, 40% solventu a 1468 atomy •+/- 4500 souřadnic, 6000 proměnných včetně B • •Teplotní kmity • Zpřesňování proteinových struktur: možné problémy •Experimentální proměnné – difrakce •Modelová funkce – strukturní amplituda •Startovní strukturní model – MR, fáz. problém + mapa el. hustoty •Kritérium správnosti – R faktory • •Limitovaný počet pozorování daný rozlišením experimentu •Nelineární problém – iterativnost, konvergence •Lokální vs. globální minima •„Přefitování“ Limit. počet dat: snížení počtu proměnných •„constrained“ minimalizace: •„Tvrdé“ vazební podmínky •Triviální aplikace – operace symetrie pro S.G. vyšší než P1 •„rigid body refinement“ + volné proměnné popisující AA • •příklad: 17 atomový fragment fenylalanin-alanin •51 vs 11 parametrů • •aplikace – zpřesňování el. hustoty • • Limit. počet dat: zvýšení počtu „pozorování“ •„měkké“ vazební podmínky •„restrained“ minimalizace – využití nekrystalografických dat •popis pomocí „tolerancí“ • • •chemická „energie“ popisující vzdálenosti, úhly, planarity, … • • •dodatečné údaje – strukturní databáze, spektrální data, QM výpočty •váhové koeficienty •2 stupňové zpřesňování – generování chem. informace + minimalizace • • • • Zpřesňování proteinových struktur: minimalizace • Krystalografie malých molekul – metoda nejmenších čtverců • • • • Taylorův rozvoj kolem minima se členy 1. řádu vede na soustavu k rovnic • • • • • • Proteiny – jde doopravdy o rozvoj kolem globálního minima? •Špatně určená fáze – pomalá konvergence (minimalizace rozdílů mezi mapami elektron. hustoty) • • • Iterativní zpřesňování proteinů Iterativní zpřesňování proteinů xk xk+2 sk+1 xk+1 sk phe23-0 „Reciproký“ prostor „Přímý“ prostor Elektronová hustota vs 3-D model coot-substrat-a