Kvalitativní analýza stavového prostoru Stochastická sémantika modelu PA054-' Formální modely v systémové biologii David Šafránek 22.3.2013 Tento projekt je spolufinancován Evropským sociálním fondem a státním rozpočtem České republiky, INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Kvalitativní analýza stavového prostoru Obsah Stochastická sémantika modelu Kvalitativní analýza stavového prostoru Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Analýza Petriho sítí Dynamická analýza Graf dosažitelnosti Necht M = (P, N, f, mo) je Petriho sít. Graf dosažitelnosti reach(M) je difinován jako graf reach(M) = (V, E), kde: v =K>, - E = {(m, t, m')\m, m' e[m0), t G T. m[t)m'}. • k rozhodnutí behaviorálních vlastností, které nelze rozhodnout staticky, je nutné zkonstruovat graf dosažitelnosti • pro neohraničnou sít může být nekonečný • ohraničenost lze vždy rozhodnout konstrukcí stromu pokrytelnosti (viz IA023) Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Analýza Petriho sítí Dynamická analýza Necht M = (P, N, f, rno) je Petriho sít t.ž. reach(M) je konečný. Pak platí: • M je /c-ohraničená, pokud Vm £ Vj\f,p £ P.m(p) < k • M je reversibilní, pokud reach(M) je silně souvislý • M je slabě živá, pokud Vm 6 Vj\f, 3m' £ V^. (m,m'} 6 E/v" Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Analýza Petriho sítí Dynamická analýza - živost sítě Necht M = (P, N, f, mo) je Petriho sít t.ž. reach(M) je konečný. 1. najdi všechny silně souvislé komponenty (SCC) grafu reach(J\í) (maximální silně souvislé podgrafy) 2. označ všechny terminálni SCC (t.ž. nelze dosáhnout další SCC) 3. if 3t £ T t.ž. není zahrnut v nějaké terminálni SCC then Aí není živá else Aí je živá Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Analýza Petriho sítí Dynamická analýza - specifické vlastnosti dynamiky • místo E nikdy nezůstane trvale vyprázdněno enzym E je nevyčerpatelný • iniciální obsah místa S je trvale přesunut do P všechny molekuly substrátu S jsou přeměněny v produkt P Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Analýza Petriho sítí Dynamická analýza - specifické vlastnosti dynamiky • místo E nikdy nezůstane trvale vyprázdněno enzym E je nevyčerpatelný GF(E > 0) • iniciální obsah místa S je trvale přesunut do P všechny molekuly substrátu S jsou přeměněny v produkt P S == 5 => FG(P == 5 A S == 0) Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Kripkeho struktura Necht AP je množina atomických propozic (obecně boolovské výrazy nad proměnnými, konstantami a predikátovými symboly). Kripkeho strukturou nazýváme čtveřici K = (S, So, T, L) kde: • S je konečná množina stavů • So C S je množina počátečních stavů • T C S x S t.ž. Vs G S, 3s' G S : (s, s') G 7 • Z. je prirazení propozic (tzv. interpretační funkce) L : S —> 2 Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Kripkeho struktura - vlastnosti • stav s je cfeadlockovaný pokud z něj existuje pouze přechod s —> s • pro daný stav s G S je L(s) množina všech atomických propozic platných v s • rozbalením Kripkeho struktury z množiny iniciálních stavuje vždy nekonečný strom • cesty v tomto stromu představují individuální simulace (běhy) modelovaného systému Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Lineární temporální logika - syntax Necht AP je množina atomických propozic. Formule ip je formulí lineární temporální logiky (LTL) pokud splňuje následující: • ip = p pro libovolné p G AP • Jsou-li ipi a ip>2 formule LTL, pak: • —upi, ifi A ip>2 a ipi V ip>2 jsou formule LTL • Xipi, Fipi a Gipi jsou formule LTL • ipiUip2 a <í£'iR<í£'2 jsou formule LTL Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Lineární temporální logika - sémantika Necht -k = sq, si, s,-,... je nekonečná posloupnost stavů (běh) v Kripkeho struktuře K. Pro j > 0 označme ir-i sufix Sj, S j +1 ,s,,.... Definujeme induktivně relaci splnitelnosti =: • 7T = p, pokud p G /.(so) • 7T = —lif, pokud 7T (f • 7T = A 52. pokud 7T = a 7T = (/?2 • 7T = V if2, pokud 7T = nebo tv = ?2 • 7T = X(/5, pokud 7T1 = 5 • 7T = F5, pokud 3/ > 0.7r' = ? • 7T = G5, pokud V/ > 0.7r' = ip • 7T = 5lU(/52. pokud 3/ > 0. 7T^ = if2 3 V/ < _/'. 7r' = ?i • 7T = (/5iR(/52, pokud V/ > 0, V0 < / < _/'. 71"' ^ ?i \= Íf2 Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Lineární temporální logika - sémantika Xa Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Lineární temporální logika - sémantika Pro libovolné formule tpi, if2 platí: —iFip = G—np -i((/5lU(/52) = -^(flR^(f2 K plné expresivite LTL stačí operátory -i, A, X, U. Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Lineární temporální logika - sémantika Pro libovolné formule tpi, if2 platí: —iFip = G—np -i((/5lU(/52) = -^(flR^(f2 K plné expresivite LTL stačí operátory -i, A, X, U. Formule LTL logiky jsou typicky univerzálně interpretovány na Kripkeho struktuře: Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Lineární temporální logika - sémantika Pro libovolné formule p>\, p>2 platí: —iFip = G—np -i((/5lU(/52) = -^(flR^(f2 K plné expresivite LTL stačí operátory -i, A, X, U. Formule LTL logiky jsou typicky univerzálně interpretovány na Kripkeho struktuře: Necht K Kripkeho struktura. Řekneme, že formule tp je splněna v K, K |= ip, pokud pro každý běh tt = sq, ... t.ž. sq g So platí 7T |= ip. Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Model checking Algoritmus, který pro danou Kripkeho strukturu K a temporální vlastnost <í> rozhodne zda-li K |= í>. V negativním případě vrátí příklad běhu tt t.ž. tt í>. Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Logika větvícího se času - CTL • temporální operátory nahrazeny kvantifikacemi přes nekonečné podstromy • z hlediska expresivity nesrovnatelná s LTL • umožňuje zachytit vlastnosti nedeterminismu • neumožňuje vyjádřit některé temporální vlastnosti Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Logika větvícího se času - syntax Necht AP je množina atomických propozic. Formule ip je formulí logiky větvícího se času (CTL) pokud splňuje následující: • ip = p pro libovolné p G AP • Jsou-li ipi a ip>2 formule CTL, pak: • —upi, ifi A ip>2 a ipi V ip>2 jsou formule CTL AXipi, AFipi a AGipi jsou formule CTL • EXipi, EFipi a EGipi jsou formule CTL • A(<£>iUy>2) a E(yiUy2) jsou formule CTL Pozn.: K plné expresivite CTL stačí operátory -i, A, AX, AU, EU. Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Logika větvícího se času - sémantika AG
2) A EFAG(X < 2) Clarke,E.M. and DraghicescuJ.A. (1988) Expressibility results for linear-time and branching-time logics. In Proceedings of REX Workshop, Lecture Notes in Computer Science Vol. 354, Springer, pp. 428-437. Kvalitativní analýza stavového prostoru Obsah Stochastická sémantika modelu Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Stochastická sémantika modelu Uvažujme model M. — (S, R, reanet, 0, map). Označme n — \S\. • SVal — N ... množství (počet molekul) Vektor [s\m <= SVal" reprezentuje stav modelu (ohodnocení proměnných) v daném okamžiku. Ohodnocení vektoru proměnných s lze samplovat prostřednictvím vektorové náhodné proměnné Xm, X-m — ...,X„), kde X; : SVal" —>• N charakterizuje počet molekul substance s,- e 5 v daném okamžiku. Stochastickou (pravděpodobnostní) sémantiku modelu M. definujeme jako stochastický proces [M] — {X^(ŕ)|ŕ e Kj}. Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Pravděpodobnostní funkce označkovaní [Š\m Xm Sl s2 Xi X2 2 0 2 0 1 1 1 1 0 2 0 2 0 1 0 1 • Pr{X.m = (2, 0)} = Pr{X.m = (1,1)} = Pi{XM = (0, 2)} = Pi{XM = (0,1)} = \ • Pr{Xj = 1} = Pr{Xj = 2} = Pr{X2 = 0} = Pr{X2 = 2} = | • Pr{X! = 0} = Pr{X2 = 1} = | = | • pravděpodobnostní funkce: P((xi,x2)) = Pr{X.m = (xi,x2)} = Pr{X! = xj n X2 = x2} = = Pr{X! = xi} • Pr{X2 = x2|Xi = xj} Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Diskrétni Markovův řetězec a Markovův proces .7 • sledujeme časovou progresi náhodné proměnné Xj^(t) • čas uvažujeme jako spočetnou veličinu • vývoj X^j v čase lze popsat grafem MC = (V,E,p): stavy V reprezentují prvky jevového pole • přechody £ jsou ohodnoceny pravděpodobností p : £ —>• (0,1) t.ž. W g V.Y,v>evP((v> v')) = 1 Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Diskrétni Markovův řetězec a Markovův proces sledujeme časovou progresi náhodné proměnné Xj^(t) čas uvažujeme jako spočetnou veličinu vývoj Xjí4 v čase lze popsat grafem MC = (V,E,p): stavy V reprezentují prvky jevového pole • přechody £ jsou ohodnoceny pravděpodobností p : £ - t.ž. W g V.Y,v'eVP((v> v')) = 1 • ekvivalentně lze reprezentovat přechodovou maticí: (.2 .3 0 .5\ 0 .7 .3 0 0 0 10 \0 0 0 1/ (o, i) Py = Pr{X^(ř+l) =;|X.M(r) = /} Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Diskrétni Markovův řetězec a Markovův proces .7 Pravděpodobnost stavu / v čase t budeme značit Pi(t) — Pr{Xjvi(t) — i}. Pro okamžik t máme vektorové rozložení p(í) = (Pí(t),P2(t),P3(t),p*(t)). Iniciálně předpokládejme pi(0) — P2(0) — P3(0) — P4(0) — j. Vývoj pravděpodobnostního rozložení proměnné Xm v čase: p(l) = p(0)P p(2) = p(l)P p{k) = p(0)P* Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Diskrétni Markovův řetězec a Markovův proces .7 Stochastický proces {X_\4(t)\t £ N} rozvíjený dle Markovova řetězce z předchozího slidu se nazývá Markovův proces. Klíčovou vlastností Markovova procesu je nezávislost na historii (tzv. "memoryless"): Pravděpodobnostní rozložení proměnné Xji4(t + 1) závisí pouze na bezprostředně (v čase) předchozím rozložení Xj^it). k Pj{t + i) = YJPijPi{t) Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Diskrétni Markovův řetězec a Markovův proces Příklad .7 1 2 3 4 P(0) 1 4 1 4 l 4 l 4 p(l) 0 0500 0 2500 0 3250 0 3750 P(2) 0 0100 0 1900 0 4000 0 4000 P(3) 0 0020 0 1360 0 4570 0 4050 P(4) 0 0004 0 0958 0 4978 0 4060 P(5) 0 0001 0 0672 0 5265 0 4062 P(6) 0 0000 0 0470 0 5467 0 4062 P(7) 0 0000 0 0329 0 5608 0 4062 P(8) 0 0000 0 0231 0 5707 0 4062 p(26) 0 0000 0 0000 0 5937 0 4062 P(27) 0 0000 0 0000 0 5937 0 4062 Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Diskrétni Markovův řetězec a Markovův proces Příklad Sémantikou Markovova procesu je (nekonečná) množina všech trajektorií samplujících stavový prostor v (diskrétním) čase. Každá trajektorie poskytuje možnou dynamiku systému (s ohledem na pravděpodobnostní rozložení). Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Markovův proces a stabilita Mějme markovův proces charakterizovaný přechodovou maticí P. Rozložení p je stabilní, pokud platí p = pP. Stabilní rozložení je pevným bodem lineárního zobrazení určeného maticí P. Lze získat řešením homogení lineární soustavy: p = pP^p-pP = 0 p(E - P) = 0 kde E je jednotková matice příslušného rozměru. Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Markovův proces a biologické modely • interpretace modelu vycházíme z daného stavu (označkovaní) • v diskrétním časové kroku se projeví právě jedna (uschopněná) reakce r,- (s danou pravděpodobností) nebo stav zůstane nezměněn • každý přechod je vážen pravděpodobnostním rozložením závislým na konstantních pravděpodobnostech - při jeho respektování lze provádět Monte Carlo simulaci • analyzační techniky • transientní analýza • výpočet distribuce p(ř) pro libovolné ř • p(ř) = p(0)Pf • stacionární analýza • analýza distribuce ve stabilním stavu Kvalitativní analýza stavového prostoru Stochastická sémantika modelu Stochastická sémantika modelu • nedostatky Markovova procesu pro biologický model • jak nastavit pravděpodobnosti k hranám v reach(M)l • diskrétní samplovaní času neumožňuje dostatečně přesně vyjádřit rychlost reakce (četnost projevu reakce v čase) • co chceme modelovat? • dynamika biologického systému při nízkých koncentracích • projev náhodných vlivů ovlivňujících provedení reakce • respektovat časo-prostorové jevy uvnitř buňky