Algebraický přístup k modelování biochemických reakcí PA054-' Formální modely v systémové biologii David Šafránek 2.5.2012 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky, NVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Algebraický přístup k modelování biochemických reakcí Obsah Algebraický přístup k modelování biochemických reakcí Algebraický přístup k modelování biochemických reakcí Princip modelování Substráty - molekuly populace interagujících molekul každou molekulu (proteinu) lze popsat stavově • stav zachycuje konfiguraci vazebných míst • volná vazebná místa • vazebná místa obsazena jinou molekulou (dimenzující stavy) ľ 1 n » 1 .-i k 1 HEK L_n mek: 1 mek formalizace prostřednictvím sekvenčního procesu: Algebraický přístup k modelování biochemických reakcí Princip modelování Substráty - molekuly • populace interagujících molekul • každou molekulu (proteinu) lze popsat stavově • stav zachycuje konfiguraci vazebných míst • volná vazebná místa • vazebná místa obsazena jinou molekulou (dimenzující stavy) f 1 -i k' i .-. p. 1 mek L_i HEK formalizace prostřednictvím sekvenčního procesu: | MEKp _J\ MEKpp ?d2 Algebraický přístup k modelování biochemických reakcí Princip modelování Substráty - molekuly • populace interagujících molekul • každou molekulu (proteinu) lze popsat stavově • stav zachycuje konfiguraci vazebných míst • volná vazebná místa • vazebná místa obsazena jinou molekulou (dimenzující stavy) f 1 -i k' i .-. p. 1 mek L_i HEK formalizace prostřednictvím sekvenčního procesu: requires phosporylating enzyme requires dephosporylating enzyme Algebraický přístup k modelování biochemických reakcí Princip modelováni Interakce procE procMEK procPP Ef A MEK PPf Eb | | MEKpj^^^fMEKpp | | PPb ?d2 • paralelní chování procesů (molekul) • binární synchronizace • roztok lze modelovat jako populaci procesů: proč mek | P^oc mek | procE \ procE | procE | procpp \ procpp Algebraický přístup k modelování biochemických reakcí Princip modelováni Interakce procE procMEK procPP Ef A MEK PPf ?Pi ; Eb MEKp MEKpp PPb • paralelní chování procesů (molekul) • binární synchronizace • roztok lze modelovat jako populaci procesů: proč mek | P^oc mek | procE \ procE | procE | procpp \ procpp Algebraický přístup k modelování biochemických reakcí Molekuly jako komunikující automaty individuální přechody a synchronizace lze modelovat stochasticky (provedení přechodu v čase t ~ Exp(r,-)) Algebraický přístup k modelování biochemických reakcí Molekuly jako komunikující automaty Algebraický přístup k modelování biochemických reakcí Elementární reakce jako komunikující automaty Algebraický přístup k modelování biochemických reakcí Elementární kalkulus pro popis (bio) chemických systémů Syntax E ::= 0 : X=M,E Reagents M ::= 0 : tc;P © M Molecule P ::= 0 i X I P Solution 71 ::= T(r) : ?n(r) : !n(r) Interaction prefix CGF ::= E/P Chemical Ground Form Andrew Phillips, Luca Cardelli, and Giuseppe Castagna, A Graphical Representation for Biological Processes in the Stochastic Pi-calculus, in Transactions in Computational Systems Biology, vol. 4230, pp. 123-152, Springer, November 2006 Algebraický přístup k modelování biochemických reakcí Příklad X = !a(r);X ® ?b(s);Y Y = !b(s);Y©?a(r);X X I X I X I Y I Y Algebraický přístup k modelování biochemických reakcí Elementární kalkulus pro popis (bio) chemických systémů Sémantika \x.P + M -A P Ix.P + M P ^Tr.P -A p P P> Q -í> Qi P\Q -1+ P'\Q> MP' ^TT.P + M-^P' P^ ^P\Q^P'\Q X = P P P' ^xAp' SOS pravidla definují fragment stochastického 7r-kalkulu Algebraický přístup k modelování biochemických reakcí Rozšíření o předávání hodnot Syntax E ::= 0 : X(p)=M, E Reagents M ::= 0 : Jt;P©M Molecule P ::= 0 i X(p) I P Solution 7i ::= T(r) : ?n(p) : !n(p) Interaction prefix CPF ::= E,P Chemical Parametric Form Andrew Phillips, Luca Cardelli, and Giuseppe Castagna, A Graphical Representation for Biological Processes in the Stochastic Pi-calculus, in Transactions in Computational Systems Biology, vol. 4230, pp. 123-152, Springer, November 2006 Algebraický přístup k modelování biochemických reakcí Rozšíření o předávání hodnot Sémantika M^P' P^ X(m) = P P{n/m}- P' !x(n).P + M ^ P lx{m).P + Mlx-H] I Tr.P -A P P\Q -A P'\Q' TT.P + M P' P\Q P'\Q X(n) -A P' {n/m} SOS pravidla definují fragment stochastického 7r-kalkulu Algebraický přístup k modelování biochemických reakcí Příklad modelování genetické regulační sítě ir Gene(a, b) = Tt.(Gene(a, b)\Protein(b))+?a.Blocked(a, b) Blocked(a, b) = ru.Gene(a, b) Protein(b) =\b.Protein(b) + rd.o Ralf Blossey, Luca Cardelli, and Andrew Phillips, A Compositional Approach to the Stochastic Dynamics of Gene Networks, in Transactions in Computational Systems Biology, vol. 3939, no. 3939, pp. 99-122, Springer, January 2006 Algebraický přístup k modelování biochemických reakcí Příklad modelování genetické regulační sítě a c lni Gene(c, a)\ Gene(a, b)\Gene(b, c) Algebraický přístup k modelování biochemických reakcí High-level modelování C. elegance proximal gonad IntroFIgl Algebraický přístup k modelování biochemických reakcí High-level modelování C. elegance: vývoj vulvy Algebraický přístup k modelování biochemických reakcí High-level modelování C. elegance: vývoj vulvy prístup k modelovaní biochemických reakci High-level modelování C. elegance: možné varianty signálních drah UN 3 J I_J L LIN-3 J l_J L LIN-i J l_J L LIN3 ... signál od řídící buňky (anchor cell, AC) LIN12 ... laterální mezibuněčný signál Algebraický přístup k modelování biochemických reakcí High-level modelování - interagující buňky Vývoj vulvy C. elegána Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010. Algebraický přístup k modelování biochemických reakcí High-level modelování - interagující buňky AC - W-AC V(v,l,r, k) = qc- k.Vl(x,l,r) + LV2(x) + r.V2(x) + w.V3(x) Vl(x,l,r) = I.Vl(x,l,r) +ř.Vl(x,l,r) x ... č. buňky, /, r ... kanály laterálního signálu, k ... vzdálenost od AC (frekvence interakce s AC) Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010. Vývoj vulvy C. elegans Algebraický přístup k modelování biochemických reakcí High-level modelování - interagující buňky Vývoj vulvy C. elegána AC I V(3, s3, «4, tow) I V(4,s4,s5,iotu) | V(5, s5, s6, msti) V(6, s6, s7, Í1Í3Í1) I V(7,s7,sS,m&J) | V(S,sS,s9,!ow) Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010. Algebraický přístup k modelování biochemických reakcí High-level modelování - interagující buňky Vývoj vulvy C. elegána - podrobný model Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010. Algebraický přístup k modelování biochemických reakcí High-level modelování - interagující buňky Vývoj vulvy C. elegána - podrobný model V(x,l,r, k) — (íjííÍ,w1,w3,^3,2**112, tmi*) ( gVul{x, !,r, uul,jnutK k) | gLin\2{x ,Un\2,v \ ,vZ,l ,r) gVl(z,vl,v2,vtd) | gV2(x,v2Jinl2) \ gV3{x,v3,vul) | M-iív(x,mw)) gVul{xJ,r,viil,muv,k) — oc- k,{gVul(xíl,rívul,miíVík) \ Vtil(x,2,r,-uííí,mííw)) gLinl2(x,lml2,vl,v3,l,r) = l(gLinl2(x,Íínl2,til,ti3,í,r) | Linl2(i,liiil2,ul,-u3) + z..(gLinl2(3S,Unl2,vl,v3,l,r) | Linl2(i,Íinl2,ul,u3) gVl(x,vl,v2,vul) = md.(gVl(x,vl,v2,wl) | Vl(x,vl,v2)) gV2(x,v2,linl2) = Unl2.(gV2(x,f2,imi2) | V2(x,v2)) gV3(x,ví,vid) = in.(gV3(x,v3,vul) | V3(x,v3,vtd)) Vvl(x,l, r, vul,muv) — l.Viil{x,l,r,vul,mui}) + r.Vrwi(í!í,r)^tíí,fttw) + vtA + mni} Linl2{x,Unl2, vl,v3) - iinl2.Lml2(a;,íml2,Dl,u3) + v& + ííl Muv(x,muv) = muU.Muv(x,muv) Vl(x,vl,v2) = íT.Vl(i,ul,«2) +«2 +dVl V2{x,v2) = v2.V2(x1v2) +dV2 V3(x, v3, vul) = v3.V3(x,v3,vnt) + vul + dV3 Andrew Phillips, A Visual Process Calculus for Biology, in Symbolic Systems Biology: Theory and Methods, Jones and Bartlett Publishers, 2010. Algebraický přístup k modelování biochemických reakcí High-level modelování - simulace Vývoj vulvy C. elegána Algebraický přístup k modelování biochemických reakcí Kalkuly pro biologické systémy • Stochastic 7r-calculus (SPÍM, BioSPI) • BioPEPA • K-calculus • Brane-Calculus, BetaBinders, BlenX Algebraický přístup k modelování biochemických reakcí BioPEPA • na rozdíl od 7r-based kalkulů je BioPEPA orientovaný blíže SBML • rozlišení není až na úroveň molekul, ale na úroveň substrátů a reakcí =4> proces není molekula, ale substrát • výhodou je kompatibilita sémantik s SBML (srovnej s Petriho sítěmi) • možnost plného modelování netriviální kinetiky (např. regulace, enzymová kinetika) Algebraický přístup k modelování biochemických reakcí BioPEPA - příklad 2S -+ P; E S = (a, 2) i S E = (a, 1) © E P = {a,l)tP (S(/So) xa (E(/£o)) Na P(/Po)) Sémantika dynamiky je definována pravidlem fa = Algebraický přístup k modelování biochemických reakcí Bio PEPA - syntax Algebra modelových komponent S ::= (a, k) op S | S + S | C op =11 í | © | e I© P :;= P kc P I S(/) L je množina reakcí • / je iniciální podmínka Algebraický přístup k modelování biochemických reakcí Bio PEPA - syntax Definice elementárních komponent - substráty Každá komponenta C je charakterizována 5-ticí (H, N, Mq, M, V), kde: • H e M+ je rozlišení kvantity (velikost jedné "úrovně" koncentrace), • N g n je maximální hodnota kvantity, • Mo £ M+ u {_} je iniciální koncentrace, • Mg M+ u {_} je maximální koncentrace, • V označuje kompartment do něhož je komponenta přiřazena. Pozn. (1): _ značí "nedefinovanou hodnotu" Pozn. (2): M, Mq jsou uvedeny pro kalibraci se spojitým modelem. Algebraický přístup k modelování biochemických reakcí Bio PEPA - syntax Definice elementárních komponent - substráty • diskretizace koncentrace pomocí úrovní stejné délky (v počtu molekul) • diskrétní sémantika tedy umožňuje kalibraci se spojitou (aproximace) • počet úrovní pro komponentu C; je N-, + 1, kde N; je max. úroveň . platí: Nj = r$l kde Mj < M, 0 < j < N, reprezentuje hraniční koncentraci mezi levely Nj, Nj+\ • pro aktuální úroveň 0 < lj < Nj je koncentrace definována vztahem x,- = /,- • H Algebraický přístup k modelování biochemických reakcí BioPEPA - definice biologického procesu BioPEPA systém je šestice (V,M,IC,Tr, Comp, P) kde: • V ... množina kompartmentů, • M ... množina kvantit popisujících substráty, • K, ... množina definic parametrů, • Fr ... množina definic dynamiky, Comp ...definice komponent, • P ... komponenta popisující systém. Algebraický přístup k modelování biochemických reakcí BioPEPA - sémantika • každá akce a má přiřazenu kinetickou funkci fa nad kvantitami substrátů • kvantity substrátů jsou určeny z kontextu akce a • kinetické funkce mohou obsahovat kinetické parametry, které musí být asociovány v K, • příklady typů kinetických funkcí: • fMA(k) — k ■ n"=i(^-')K' nj Je počet reaktantů reakce aj a n; je příslušný stechiometrický koeficient reaktantů C; • fH(v, K,n) = v- Cn/{K + C") je Hillova kinetika Algebraický přístup k modelování biochemických reakcí BioPEPA - operační sémantika Předpokládáme C spočetná množina zahrnující všechny možné modelové komponenty. BioPEPA systém má asociovánu stochastickou sémantiku, která je definována prostřednictvím odvozující relace —>CC C x Q. x C, kde 9 G Q. vyjadřuje kvantitativní informaci potřebnou k vyhodnocení kinetické funkce, 6 := (a, w) kde w := [S : op(/, re)] | w@w, S G C, I hodnota kvantity komponenty S, re stechiometrický koeficient komponenty S v a. Relace —>c je definována jako minimální relace splňující pravidla na násl. slidu. Algebraický přístup k modelování biochemických reakcí BioPEPA - odvozující relace prefixReac prefixProd prefixMod (a,[S:lft*)]) (a,[S:í(U)D (a,[S ;op(W]) ((a,K)opS)(l)-»c5(0 with op = ©,©,© and 0<1, twp, i_4t. />, wp; tp; päp; - with a e .£ Algebraický přístup k modelování biochemických reakcí BioPEPA - stochastická sémantika Stochastická sémantika BioPEPA systému je určena relací: -^SC V x ľ x V kde 7 £ ľ, 7 := (a, ra), ra g m+ určuje parametr exponenciální distribuce události v čase (rate). Relace —>s je definována pomocí pravidla: Finál - (•V, N, K, T, Comp, P)—->A(V, N, 3Z. Kinetika je definována funkcí v = k ■ X2 ■ Y. Definujeme komponenty BioPEPA: X = (a,2)iX Y=(a,\)iY Z=(a,3)U Reakční systém je definován: X{'xo) xw Y{lYo) nw Z(/Zo) kde Ix0Jy0Jz0 značí iniciální úrovně koncentrace, kin. funkce je definována fa = fMA(k). Pro reakci bude odvozením stochastické sémantiky vypočítán rate _ k • (/x • H)2(/y • H) H Reakce bude provedena pouze v situaci: A/x je nejméně 3, Nz je nejméně 4. Algebraický přístup k modelování biochemických reakcí Laneve, C. and Tarissan, F. 2007. A Simple Calculus for Proteins and Cells. Electron. Notes Theor. Comput. Sci. 171, 2 (Jul. 2007), 139-154. Algebraický přístup k modelování biochemických reakcí hv-calculus - vazebná místa • 1,2 - navázaná vazebná místa • 3 - skrytá vazebná místa • 4 - viditelná vazebná místa Algebraický přístup k modelování biochemických reakcí K-calculus - interakce proteinů »--■ ■--^ B 2 1 t-4 3 1 c 2 • proteiny mohou vytvářet komplexy spojováním na vazebných místech • kolekce proteinů a jejich komplexů tvoří roztok (solution) Algebraický přístup k modelování biochemických reakcí k-calculus - příklady spojení a self-complexation 3 K 2 »-■ 3 b 2 a ring-complex c 2 A 1 3 4 1 3 double-contact Algebraický přístup k modelování biochemických reakcí K-calculus - komplexace Algebraický přístup k modelování biochemických reakcí K-calculus - požadavek monotonicity Algebraický přístup k modelování biochemických reakcí k- calculus - syntax • spočetná množina jmen proteinů V, zn. A, B,... g V • spočetná množina jmen hran £, zn. x, y,... g £ • signatura, / : V —> n • J (A) zn. počet vazeb proteinu A • (A, i) značí i-té vazebné místo na A Algebraický přístup k modelování biochemických reakcí k-calculus - rozhraní • lib. paricální zobrazení n —> 8 u {h, v} nazýváme rozhraní, zn. p,a,... • vazebné místo (A, i) nazýváme: • viditelné, pokud p(i) — v • skryté, pokud p(i) — h • vázané, pokud p(i) e £ • rozhraní reprezentuje stav roztoku Algebraický přístup k modelování biochemických reakcí k-calculus - příklad rozhraní Předpokládejme A t.ž. J(A) = 3, pak p(l) = v, p(2) = h, p(3) = x je rozhraní proteinu A, v němž místo 1 je viditelné, místo 2 skryté, a místo 3 vázané na jméno hrany x £ 8. Symbolicky píšeme: p = 1 + 2 + 3X Algebraický přístup k modelování biochemických reakcí k- calculus - syntax roztoku S ■= 0 prázdný roztok A(p) protein S,S skupina (ux)(S) vazba Pro množinu jmen xi,X2,x„ používáme notaci x a vazbu rozšíříme na (ux)(S). Algebraický přístup k modelování biochemických reakcí k-calculus - syntax roztoku induktivně definujeme množinu volných jmen v roztoku S, zn. fn(«S): fn(0) = 0 fn(A(p)) = HP) fn(S,S') = fn(5) U fn( £. Algebraický přístup k modelování biochemických reakcí k-calculus - propojenost Definujeme propojený roztok strukturní indukcí: • A(p) je propojený, • je-li S propojený, pak i (ux)(S) je propojený, • jsou-li S, S' propojené a fn(5 n S') ^ 0, pak S, S' je propojený, • je-li S propojený a S = T, pak Tje propojený. Algebraický přístup k modelování biochemických reakcí K-calculus - vizuální omezenost Roztok je vizuálně omezený, pokud: • výskyt lib. volného jména v S je max. dvojnásobný • vazba (vx)(S) váže buď 0 nebo 2 výskyty x Algebraický přístup k modelování biochemických reakcí k-calculus - příklad [yx){A(l* + 2X +3 + 4)) Algebraický přístup k modelování biochemických reakcí hv-calculus - přiklad 2 1 o (vwxyz)(A(lx+2x+3), e(lz+2+3'), C(l+2+¥+Aw), D{1W+2X)) prístup k modelovaní biochemických reakci k-calculus - příklad í>xy)04(l + 2 + 3X + 4y), 6(1 + 2 + V + 4*)) Algebraický přístup k modelování biochemických reakcí n-calculus - relace růstu • cílem je omezit prostor možných interakcí (reakcí) • nástrojem bude monotonost updatů vazeb • formálně zachycena relací růstu < definovanou na parciálních rozhraních • idea: p < p' odpovídá situaci p' obsahuje více vazeb než p • relace je parametrizována danou množinou jmen x reprezentující právě nové (přidané) hrany Algebraický přístup k modelování biochemických reakcí n-calculus - relace růstu (create): (mv-switch): (VH-SWITCH): (reflex): (sum): x e x x h i < ix X h i < i xhí) , x\-S < S' fn(p) C "x áom(p) = síA) (synth): -—-—-—l- xh5 < S',A{p) interpretace x h S < S': nové vazby přidány (S' zahrnuje více spojení) (SYNTH) povoluje vytváření nových proteinů s plnými rozhraními Algebraický přístup k modelování biochemických reakcí K-calculus - reakce Necht S, S' jsou preroztoky. monotónní reakce r\ : S —> (ux)S' je monotónní reakce pokud: • x h S < S' • Sa (ux)S' jsou vizuálně omezené • S' je propojený antimonotonní reakce i~2 ■ {vx)S —> S' je antimonotonní reakce pokud: • reakce S' —> {vx)S je monotónní.