Algebraický přístup k modelování biochemických reakcí
PA054-' Formální modely v systémové biologii
David Šafránek
2.5.2012
Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky, NVESTICE DO ROZVOJE VZDĚLÁVÁNÍ
Algebraický přístup k modelování biochemických reakcí
Obsah
Algebraický přístup k modelování biochemických reakcí
Algebraický přístup k modelování biochemických reakcí
Princip modelování
Substráty - molekuly
populace interagujících molekul
každou molekulu (proteinu) lze popsat stavově
• stav zachycuje konfiguraci vazebných míst
• volná vazebná místa
• vazebná místa obsazena jinou molekulou (dimenzující stavy)
ľ 1 n » 1 .-i k 1
HEK L_n mek: 1 mek
formalizace prostřednictvím sekvenčního procesu:
Algebraický přístup k modelování biochemických reakcí
Princip modelování
Substráty - molekuly
• populace interagujících molekul
• každou molekulu (proteinu) lze popsat stavově
• stav zachycuje konfiguraci vazebných míst
• volná vazebná místa
• vazebná místa obsazena jinou molekulou (dimenzující stavy)
f 1 -i k' i .-. p. 1
mek L_i HEK
formalizace prostřednictvím sekvenčního procesu:
| MEKp _J\ MEKpp
?d2
Algebraický přístup k modelování biochemických reakcí
Princip modelování
Substráty - molekuly
• populace interagujících molekul
• každou molekulu (proteinu) lze popsat stavově
• stav zachycuje konfiguraci vazebných míst
• volná vazebná místa
• vazebná místa obsazena jinou molekulou (dimenzující stavy)
f 1 -i k' i .-. p. 1
mek L_i HEK
formalizace prostřednictvím sekvenčního procesu:
requires phosporylating enzyme
requires dephosporylating enzyme
Algebraický přístup k modelování biochemických reakcí
Princip modelováni
Interakce
procE procMEK procPP
Ef A MEK PPf
Eb | | MEKpj^^^fMEKpp | | PPb
?d2
• paralelní chování procesů (molekul)
• binární synchronizace
• roztok lze modelovat jako populaci procesů:
proč mek | P^oc mek | procE \ procE | procE | procpp \ procpp
Algebraický přístup k modelování biochemických reakcí
Princip modelováni
Interakce
procE procMEK procPP
Ef A MEK PPf
?Pi
;
Eb MEKp MEKpp PPb
• paralelní chování procesů (molekul)
• binární synchronizace
• roztok lze modelovat jako populaci procesů:
proč mek | P^oc mek | procE \ procE | procE | procpp \ procpp
Algebraický přístup k modelování biochemických reakcí
Molekuly jako komunikující automaty
individuální přechody a synchronizace lze modelovat stochasticky (provedení přechodu v čase t ~ Exp(r,-))
Algebraický přístup k modelování biochemických reakcí
Molekuly jako komunikující automaty
Algebraický přístup k modelování biochemických reakcí
Elementární reakce jako komunikující automaty
Algebraický přístup k modelování biochemických reakcí
Elementární kalkulus pro popis (bio) chemických systémů
Syntax
E ::= 0 : X=M,E Reagents
M ::= 0 : tc;P © M Molecule
P ::= 0 i X I P Solution
71 ::= T(r) : ?n(r) : !n(r) Interaction prefix
CGF ::= E/P Chemical Ground Form
Andrew Phillips, Luca Cardelli, and Giuseppe Castagna, A Graphical Representation for Biological Processes in the Stochastic Pi-calculus, in Transactions in Computational Systems Biology, vol. 4230, pp. 123-152, Springer, November 2006
Algebraický přístup k modelování biochemických reakcí
Příklad
X = !a(r);X ® ?b(s);Y Y = !b(s);Y©?a(r);X X I X I X I Y I Y
Algebraický přístup k modelování biochemických reakcí
Elementární kalkulus pro popis (bio) chemických systémů
Sémantika
\x.P + M -A P Ix.P + M P
^Tr.P -A p P P> Q -í> Qi P\Q -1+ P'\Q>
MP' ^TT.P + M-^P'
P^ ^P\Q^P'\Q X = P P P' ^xAp'
SOS pravidla definují fragment stochastického 7r-kalkulu
Algebraický přístup k modelování biochemických reakcí
Rozšíření o předávání hodnot
Syntax
E ::= 0 : X(p)=M, E Reagents
M ::= 0 : Jt;P©M Molecule
P ::= 0 i X(p) I P Solution
7i ::= T(r) : ?n(p) : !n(p) Interaction prefix
CPF ::= E,P Chemical Parametric Form
Andrew Phillips, Luca Cardelli, and Giuseppe Castagna, A Graphical Representation for Biological Processes in the Stochastic Pi-calculus, in Transactions in Computational Systems Biology, vol. 4230, pp. 123-152, Springer, November 2006
Algebraický přístup k modelování biochemických reakcí
Rozšíření o předávání hodnot
Sémantika
M^P' P^
X(m) = P P{n/m}-
P'
!x(n).P + M ^ P lx{m).P + Mlx-H] I
Tr.P -A P
P\Q -A P'\Q' TT.P + M P'
P\Q P'\Q X(n) -A P'
{n/m}
SOS pravidla definují fragment stochastického 7r-kalkulu
Algebraický přístup k modelování biochemických reakcí
Příklad modelování genetické regulační sítě
ir
Gene(a, b) = Tt.(Gene(a, b)\Protein(b))+?a.Blocked(a, b) Blocked(a, b) = ru.Gene(a, b) Protein(b) =\b.Protein(b) + rd.o
Ralf Blossey, Luca Cardelli, and Andrew Phillips, A Compositional Approach to the Stochastic Dynamics of Gene Networks, in Transactions in Computational Systems Biology, vol. 3939, no. 3939, pp. 99-122, Springer, January 2006
Algebraický přístup k modelování biochemických reakcí
Příklad modelování genetické regulační sítě
a c
lni
Gene(c, a)\ Gene(a, b)\Gene(b, c)
Algebraický přístup k modelování biochemických reakcí
High-level modelování
C. elegance
proximal gonad
IntroFIgl
Algebraický přístup k modelování biochemických reakcí
High-level modelování
C. elegance: vývoj vulvy
Algebraický přístup k modelování biochemických reakcí
High-level modelování
C. elegance: vývoj vulvy
prístup k modelovaní biochemických reakci
High-level modelování
C. elegance: možné varianty signálních drah
UN 3
J I_J L
LIN-3
J l_J L
LIN-i
J l_J L
LIN3 ... signál od řídící buňky (anchor cell, AC) LIN12 ... laterální mezibuněčný signál
Algebraický přístup k modelování biochemických reakcí
High-level modelování - interagující buňky
Vývoj vulvy C. elegána
Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010.
Algebraický přístup k modelování biochemických reakcí
High-level modelování - interagující buňky
AC - W-AC
V(v,l,r, k) = qc- k.Vl(x,l,r) + LV2(x) + r.V2(x) + w.V3(x) Vl(x,l,r) = I.Vl(x,l,r) +ř.Vl(x,l,r)
x ... č. buňky, /, r ... kanály laterálního signálu, k ... vzdálenost od AC (frekvence interakce s AC)
Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010.
Vývoj vulvy C. elegans
Algebraický přístup k modelování biochemických reakcí
High-level modelování - interagující buňky
Vývoj vulvy C. elegána
AC I V(3, s3, «4, tow) I V(4,s4,s5,iotu) | V(5, s5, s6, msti) V(6, s6, s7, Í1Í3Í1) I V(7,s7,sS,m&J) | V(S,sS,s9,!ow)
Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010.
Algebraický přístup k modelování biochemických reakcí
High-level modelování - interagující buňky
Vývoj vulvy C. elegána - podrobný model
Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010.
Algebraický přístup k modelování biochemických reakcí
High-level modelování - interagující buňky
Vývoj vulvy C. elegána - podrobný model V(x,l,r, k) — (íjííÍ,w1,w3,^3,2**112, tmi*)
( gVul{x, !,r, uul,jnutK k) | gLin\2{x ,Un\2,v \ ,vZ,l ,r) gVl(z,vl,v2,vtd) | gV2(x,v2Jinl2) \ gV3{x,v3,vul) | M-iív(x,mw)) gVul{xJ,r,viil,muv,k) — oc- k,{gVul(xíl,rívul,miíVík) \ Vtil(x,2,r,-uííí,mííw)) gLinl2(x,lml2,vl,v3,l,r) = l(gLinl2(x,Íínl2,til,ti3,í,r) | Linl2(i,liiil2,ul,-u3) + z..(gLinl2(3S,Unl2,vl,v3,l,r) | Linl2(i,Íinl2,ul,u3) gVl(x,vl,v2,vul) = md.(gVl(x,vl,v2,wl) | Vl(x,vl,v2)) gV2(x,v2,linl2) = Unl2.(gV2(x,f2,imi2) | V2(x,v2)) gV3(x,ví,vid) = in.(gV3(x,v3,vul) | V3(x,v3,vtd)) Vvl(x,l, r, vul,muv) — l.Viil{x,l,r,vul,mui}) + r.Vrwi(í!í,r)^tíí,fttw) + vtA + mni} Linl2{x,Unl2, vl,v3) - iinl2.Lml2(a;,íml2,Dl,u3) + v& + ííl Muv(x,muv) = muU.Muv(x,muv) Vl(x,vl,v2) = íT.Vl(i,ul,«2) +«2 +dVl
V2{x,v2) = v2.V2(x1v2) +dV2 V3(x, v3, vul) = v3.V3(x,v3,vnt) + vul + dV3
Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010.
Algebraický přístup k modelování biochemických reakcí
High-level modelování - simulace
Vývoj vulvy C. elegána
Algebraický přístup k modelování biochemických reakcí
Kalkuly pro biologické systémy
• Stochastic 7r-calculus (SPÍM, BioSPI)
• BioPEPA
• K-calculus
• Brane-Calculus, BetaBinders, BlenX
Algebraický přístup k modelování biochemických reakcí
BioPEPA
• na rozdíl od 7r-based kalkulů je BioPEPA orientovaný blíže SBML
• rozlišení není až na úroveň molekul, ale na úroveň substrátů a reakcí
=4> proces není molekula, ale substrát
• výhodou je kompatibilita sémantik s SBML (srovnej s Petriho sítěmi)
• možnost plného modelování netriviální kinetiky (např. regulace, enzymová kinetika)
Algebraický přístup k modelování biochemických reakcí
BioPEPA - příklad
2S -+ P; E
S = (a, 2) i S E = (a, 1) © E P = {a,l)tP
(S(/So) xa (E(/£o)) Na P(/Po)) Sémantika dynamiky je definována pravidlem fa =
Algebraický přístup k modelování biochemických reakcí
Bio PEPA - syntax
Algebra modelových komponent S ::= (a, k) op S | S + S | C
op =11 í | © | e I©
P :;= P kc P I S(/)
L je množina reakcí • / je iniciální podmínka
Algebraický přístup k modelování biochemických reakcí
Bio PEPA - syntax
Definice elementárních komponent - substráty
Každá komponenta C je charakterizována 5-ticí (H, N, Mq, M, V), kde:
• H e M+ je rozlišení kvantity (velikost jedné "úrovně" koncentrace),
• N g n je maximální hodnota kvantity,
• Mo £ M+ u {_} je iniciální koncentrace,
• Mg M+ u {_} je maximální koncentrace,
• V označuje kompartment do něhož je komponenta přiřazena.
Pozn. (1): _ značí "nedefinovanou hodnotu"
Pozn. (2): M, Mq jsou uvedeny pro kalibraci se spojitým modelem.
Algebraický přístup k modelování biochemických reakcí
Bio PEPA - syntax
Definice elementárních komponent - substráty
• diskretizace koncentrace pomocí úrovní stejné délky (v počtu molekul)
• diskrétní sémantika tedy umožňuje kalibraci se spojitou (aproximace)
• počet úrovní pro komponentu C; je N-, + 1, kde N; je max. úroveň
. platí: Nj = r$l kde Mj < M, 0 < j < N, reprezentuje hraniční koncentraci mezi levely Nj, Nj+\
• pro aktuální úroveň 0 < lj < Nj je koncentrace definována vztahem x,- = /,- • H
Algebraický přístup k modelování biochemických reakcí
BioPEPA - definice biologického procesu
BioPEPA systém je šestice (V,M,IC,Tr, Comp, P) kde:
• V ... množina kompartmentů,
• M ... množina kvantit popisujících substráty,
• K, ... množina definic parametrů,
• Fr ... množina definic dynamiky, Comp ...definice komponent,
• P ... komponenta popisující systém.
Algebraický přístup k modelování biochemických reakcí
BioPEPA - sémantika
• každá akce a má přiřazenu kinetickou funkci fa nad kvantitami substrátů
• kvantity substrátů jsou určeny z kontextu akce a
• kinetické funkce mohou obsahovat kinetické parametry, které musí být asociovány v K,
• příklady typů kinetických funkcí:
• fMA(k) — k ■ n"=i(^-')K' nj Je počet reaktantů reakce aj a n; je příslušný stechiometrický koeficient reaktantů C;
• fH(v, K,n) = v- Cn/{K + C") je Hillova kinetika
Algebraický přístup k modelování biochemických reakcí
BioPEPA - operační sémantika
Předpokládáme C spočetná množina zahrnující všechny možné modelové komponenty.
BioPEPA systém má asociovánu stochastickou sémantiku, která je definována prostřednictvím odvozující relace —>CC C x Q. x C, kde 9 G Q. vyjadřuje kvantitativní informaci potřebnou k vyhodnocení kinetické funkce,
6 := (a, w)
kde w := [S : op(/, re)] | w@w, S G C, I hodnota kvantity komponenty S, re stechiometrický koeficient komponenty S v a.
Relace —>c je definována jako minimální relace splňující pravidla na násl. slidu.
Algebraický přístup k modelování biochemických reakcí
BioPEPA - odvozující relace
prefixReac prefixProd prefixMod
(a,[S:lft*)])
(a,[S:í(U)D
(a,[S ;op(W])
((a,K)opS)(l)-»c5(0 with op = ©,©,© and 0<1, twp, i_4t. />, wp;
tp; päp;
- with a e .£
Algebraický přístup k modelování biochemických reakcí
BioPEPA - stochastická sémantika
Stochastická sémantika BioPEPA systému je určena relací:
-^SC V x ľ x V
kde 7 £ ľ, 7 := (a, ra), ra g m+ určuje parametr exponenciální
distribuce události v čase (rate).
Relace —>s je definována pomocí pravidla:
Finál -
(•V, N, K, T, Comp, P)—->A(V, N, 3Z. Kinetika je definována funkcí v = k ■ X2 ■ Y. Definujeme komponenty BioPEPA:
X = (a,2)iX Y=(a,\)iY Z=(a,3)U
Reakční systém je definován:
X{'xo) xw Y{lYo) nw Z(/Zo)
kde Ix0Jy0Jz0 značí iniciální úrovně koncentrace, kin. funkce je definována fa = fMA(k).
Pro reakci bude odvozením stochastické sémantiky vypočítán rate
_ k • (/x • H)2(/y • H) H
Reakce bude provedena pouze v situaci: A/x je nejméně 3, Nz je nejméně 4.
Algebraický přístup k modelování biochemických reakcí
Laneve, C. and Tarissan, F. 2007. A Simple Calculus for Proteins and Cells. Electron. Notes Theor. Comput. Sci. 171, 2 (Jul. 2007), 139-154.
Algebraický přístup k modelování biochemických reakcí
hv-calculus - vazebná místa
• 1,2 - navázaná vazebná místa
• 3 - skrytá vazebná místa
• 4 - viditelná vazebná místa
Algebraický přístup k modelování biochemických reakcí
K-calculus - interakce proteinů
»--■ ■--^ B 2 1
t-4 3 1 c 2
• proteiny mohou vytvářet komplexy spojováním na vazebných místech
• kolekce proteinů a jejich komplexů tvoří roztok (solution)
Algebraický přístup k modelování biochemických reakcí
k-calculus - příklady spojení
a self-complexation
3 K 2 »-■ 3 b 2
a ring-complex
c 2 A 1 3 4
1 3
double-contact
Algebraický přístup k modelování biochemických reakcí
K-calculus - komplexace
Algebraický přístup k modelování biochemických reakcí
K-calculus - požadavek monotonicity
Algebraický přístup k modelování biochemických reakcí
k- calculus - syntax
• spočetná množina jmen proteinů V, zn. A, B,... g V
• spočetná množina jmen hran £, zn. x, y,... g £
• signatura, / : V —> n
• J (A) zn. počet vazeb proteinu A
• (A, i) značí i-té vazebné místo na A
Algebraický přístup k modelování biochemických reakcí
k-calculus - rozhraní
• lib. paricální zobrazení n —> 8 u {h, v} nazýváme rozhraní, zn. p,a,...
• vazebné místo (A, i) nazýváme:
• viditelné, pokud p(i) — v
• skryté, pokud p(i) — h
• vázané, pokud p(i) e £
• rozhraní reprezentuje stav roztoku
Algebraický přístup k modelování biochemických reakcí
k-calculus - příklad rozhraní
Předpokládejme A t.ž. J(A) = 3, pak p(l) = v, p(2) = h, p(3) = x je rozhraní proteinu A, v němž místo 1 je viditelné, místo 2 skryté, a místo 3 vázané na jméno hrany x £ 8. Symbolicky píšeme:
p = 1 + 2 + 3X
Algebraický přístup k modelování biochemických reakcí
k- calculus - syntax roztoku
S ■=
0 prázdný roztok
A(p) protein S,S skupina (ux)(S) vazba
Pro množinu jmen xi,X2,x„ používáme notaci x a vazbu rozšíříme na (ux)(S).
Algebraický přístup k modelování biochemických reakcí
k-calculus - syntax roztoku
induktivně definujeme množinu volných jmen v roztoku S, zn. fn(«S):
fn(0) = 0
fn(A(p)) = HP) fn(S,S') = fn(5) U fn( £.
Algebraický přístup k modelování biochemických reakcí
k-calculus - propojenost
Definujeme propojený roztok strukturní indukcí:
• A(p) je propojený,
• je-li S propojený, pak i (ux)(S) je propojený,
• jsou-li S, S' propojené a fn(5 n S') ^ 0, pak S, S' je propojený,
• je-li S propojený a S = T, pak Tje propojený.
Algebraický přístup k modelování biochemických reakcí
K-calculus - vizuální omezenost
Roztok je vizuálně omezený, pokud:
• výskyt lib. volného jména v S je max. dvojnásobný
• vazba (vx)(S) váže buď 0 nebo 2 výskyty x
Algebraický přístup k modelování biochemických reakcí
k-calculus - příklad
[yx){A(l* + 2X +3 + 4))
Algebraický přístup k modelování biochemických reakcí
hv-calculus - přiklad
2
1 o
(vwxyz)(A(lx+2x+3), e(lz+2+3'), C(l+2+¥+Aw), D{1W+2X))
prístup k modelovaní biochemických reakci
k-calculus - příklad
í>xy)04(l + 2 + 3X + 4y), 6(1 + 2 + V + 4*))
Algebraický přístup k modelování biochemických reakcí
n-calculus - relace růstu
• cílem je omezit prostor možných interakcí (reakcí)
• nástrojem bude monotonost updatů vazeb
• formálně zachycena relací růstu < definovanou na parciálních rozhraních
• idea: p < p' odpovídá situaci p' obsahuje více vazeb než p
• relace je parametrizována danou množinou jmen x reprezentující právě nové (přidané) hrany
Algebraický přístup k modelování biochemických reakcí
n-calculus - relace růstu
(create): (mv-switch): (VH-SWITCH):
(reflex): (sum):
x e x
x h i < ix X h i < i
xhí)
, x\-S < S' fn(p) C "x áom(p) = síA) (synth): -—-—-—l-
xh5 < S',A{p)
interpretace x h S < S': nové vazby přidány (S' zahrnuje více spojení)
(SYNTH) povoluje vytváření nových proteinů s plnými rozhraními
Algebraický přístup k modelování biochemických reakcí
K-calculus - reakce
Necht S, S' jsou preroztoky.
monotónní reakce
r\ : S —> (ux)S' je monotónní reakce pokud:
• x h S < S'
• Sa (ux)S' jsou vizuálně omezené
• S' je propojený
antimonotonní reakce
i~2 ■ {vx)S —> S' je antimonotonní reakce pokud:
• reakce S' —> {vx)S je monotónní.