Struktura proteinů
primární (sekvence)
sekundární
terciární
kvartérní
ADSQTSSNRAGEFSIPPNTDFRAIFFANAAEQQHIKLFIGDSQEPAAYHKLTTRDGPREATLNSGNGKIRFEVSVNGKPSATDARLAPINGKKSDGSPF
TVNFGIVVSEDGHDSDYNDGIVVLQWPIG
PAIIL monomer PAIIL tetramer 5de36d73376b8521

Aminokyseliny
amino acids amino acids
glycin
alanin
valin
leucin
izoleucin
asparagová kys.
asparagin
glutamová kys.
glutamin
arginin
lysin
histidin
fenylalanin
serin
threonin
tyrozin
tryptofan
methionin
cystein
prolin
selenocystein
Gly
Ala
Val
Leu
Ile
Asp
Asn
Glu
Gln
Arg
Lys
His
Phe
Ser
Thr
Tyr
Trp
Met
Cys
Pro
Sec
G
A
V
L
I
D
N
E
Q
R
K
H
F
S
T
Y
W
M
C
P
U

Třídění aminokyselin
•Aminokyseliny
s podobnými vlastnostmi mohou plnit v proteinu stejné funkce – bývají vzájemně zastupitelné
Courtesy of http://prowl.rockefeller.edu

Vazby zprostředkovávající vyšší struktury
•Vodíková vazba (H-můstek)
•
•Nabité AK
•Kontakty polárních AK
•Nepolární / hydrofobní AK
•Stacking – aromatické AK
•Cystein / cystin – vazba S-S
•Vazba iontů kovů

Kostra polypeptidového řetězce
–Peptidová vazba – planární
phipsi

–Konformaci kostry určují dva torzní úhly φ a ψ (úhel ω je 180°)
•
Image:torsionangles.jpg

2-D struktury
•Stabilní konformace polypeptidového řetězce
•Důležité pro udržení proteinové 3-D struktury
•Cca 50 % aa residuí je součástí a-helixů nebo b-skládaných listů
•Predikce sekundárních struktur znamená předpověď zda residuum spadá mezi H (helix), E (list) nebo
C (smyčka)

•Důležité pro klasifikaci proteinů
•Separace domén a funkčních motivů
•SS jsou mnohem konzervovanější než aminokyselinová sekvence
•Předpověď SS předchází obvykle jako mezikrok při předpovědi terciární struktury při threadingových
metodách.
Predikce 2D struktury

Predikce 2D struktury
•Rozlišujeme tři základní typy
–H – helix
–E – β-list
–C/(-) – smyčka/náhodné klubko (coil) – někdy jsou rozlišovány tyto dvě varianty
–
•S dobrou přesností lze určit helix (jejich tvorba je je určena interakcemi „krátkého“ dosahu), u β
-listu (interakce „dlouhého“ dosahu) úspěšnost určení 2D struktury klesá
•
•Některé programy přidávají i číslo vyjadřující pravděpodobnost pro daný AK zbytek (např. H 60% -
znamená, že s 60% pravděpodobností se jedná o helix)

α-helix
stabilizace mezi rezidui i+4 a i-4 H-vazbami
•
f2,2up
5.4 Å
Vzestup 1.5 Å
per residuum

Jiné helixové struktury
•310 helix – obvykle na začátku nebo konci a-helixu
•p-helix – zřídka, považován za málo stabilní
–
•
•kolagen – levotočivá šroubovice
99px-Collagentriplehelix

Porovnání 16 aa v typických helixech
a-helix
310-helix
p-helix
Vodíkové můstky
0i k Ni+4
0i k Ni+3
0i k Ni+5
Počet residuí na otáčku
3.6
3
4.4
Počet atomů na otočku
13
10
16
Vinutí (na 1 aa)
1.5
2.0
1.15

β-list
•
ecb4x10b

Výskyt b-listů v proteinech
•


Otáčky (turns)
•větší množství otáček (obrácení směru polypeptidového řetězce), různé počty AK


Coils – smyčky, neuspořádané klubko
•Vše ostatní, co nespadá mezi a-helix,
b-list či otočky
•

Typické znaky α -helix
•Často je helix částečně exponovaný – tj. jedna strana je otočena dovnitř proteinu (hydrofobní),
druhá ven (hydrofilní)
•
•Potom pro 3.6 helix (α-helix) platí, že i, i+3, i+4 & i+7 -té reziduum míří na tutéž stranu.
Jsou-li všechna hydrofobní či naopak hydrofilní = zřejmě α -helix
helix

Typické znaky β -list
•U β -listu se střídají rezidua po 180° a pro částečně zanořený β -list platí analogicky:
•i, i+2, i+4, i+8 –té reziduum je polární a zároveň
•i+1, i+3, i+5 –té je
nepolární
amph_strand

Typické znaky β -list
•Zcela zanořený β -list (typicky u α / β barelu) je tvořen řadou nepolárník AK
bur_strand

Predikční algoritmy
•1. generace: ab-initio, vycházela z fyzikálně-chemických vlastností a ze statistiky pro jednotlivá
rezidua
•
•2. generace: plus incorporation of more local residue interactions, zahrnovala i vliv nejbližších
AK na zkoumané reziduum – předpověď max. 60% správnost, u β -listu do 40%
•
•3. generace: homology-base models, zahrnuje navíc multiple sequence alignment a využívá
skutečnosti, že 2D struktura se zachovává déle než sekvenční podobnost – až 80% spolehlivost
(závisí na metodě)

3. Generace - Homology-based methods
Predikce sekundárních struktur pro každou sekvenci
HHHCHCCEEEECCHH
HHHHHCCEEEECCHH
ECCHHCEEEECCCEE
HHHHHCCCCEEECCH
HHHHCCCEEEECHHC
HHHHHCCEEEECCHH
MSA
fitování předpovězené
sekundární struktury
do AA přiložení
Konečná předpověď
Založená na konsensuální
sekvenci

3. Generace – neuronové sítě
Sekvence se známou
sek. strukturou
Trénink, přiřazování
Váh jednotlivým funkcím
Aplikace nalezených
algoritmů na neznámou sekvenci

Hydrophobic cluster analysis


Jednoduché motivy
• helix-otáčka-helix β -vlásenka
•
hth beta_hairpin

Jednoduché motivy
• Řecký klíč (greek key) β-α–β motiv
•
•
2875003373_a17fdac764_m 100px-Anthrax_toxin_protein_key_motif 2875830928_5049ee0cec

Motivy - Domény
•Kombinací jednoduchých motivů jsou tvořeny motivy
•Motivy vytvářejí proteinové domény
•Dle zastoupení 2D struktur dělíme proteiny na:
–α -proteiny
–β-proteiny
–α / β proteiny – kombinace β-α–β motivů
–minoritní skupiny – oddělené domény tvořené jen α či jen β strukturami, domény bohaté na kovy,…

β -struktury
• β –barel propeller blade
f5,2 f5,7

•Greek key barel
•Jelly roll barel
•β -helix
•
β -struktury
f5,16 f5,10opr f5,28

α -proteiny/motivy
•Globinový fold
•
•
•Membránové proteiny
•
f2,9d f12,3b

•Strukturní proteiny – keratiny, cytoskelet,…
–coiled-coil
–čtyřhelixový svazek
(Four-Helix Bundle)
•
α -proteiny/motivy
f3,3

α / β motivy
•Centrální jádro tvořené β -listy obklopené α -helixy
•
•TIM barrel
•
•Rossmanův fold
•
•Horseshoe fold – leucin-rich motivy
f4,11

•


•
APSSP
Většina programů má uživatelsky jednoduché rozhraní

Rozšíření možností 2D predikce
•Vedle předpovědi 2D struktury je rovněž analyzována
–Přístupnost pro solvent
–Předpověď transmembránového helixu
•Určení zda je/není transmembránový
•Podíl hydrofobních řetězců (AK zbytků) na povrchu – umožňuje postihnout i částečně zanořené
membrány

Benchmark – porovnání algoritmů
•Porovnání výsledků predikce se skutečně zjištěnou strukturou.
•
•Benchmark EVA (http://cubic.bioc.columbia.edu/eva/)
–průběžné testování existujících serverů
–v současnosti v provozu přes 300 týdnů…
–testování 2D i 3D predikce

Benchmark
•Dle benchmarku EVA v současnosti na předních místech:
•
–PROFsec (http://cubic.bioc.columbia.edu/predictprotein )
–
–PSIpred (http://insulin.brunel.ac.uk/psiform.html )
–
–SABLE
(http://sable.cchmc.org/ )