Stochastické procesy ve finanční matematice Doc. RNDr. Martin Kolář, Ph.D. 1 Tento učební text vznikl za přispění Evropského sociálního fondu a státního rozpočtu ČR prostřednictvím Operačního programu Vzdělávání pro konkurenceschopnost v rámci projektu Univerzitní výuka matematiky v měnícím se světě (CZ.1.07/2.2.00/15.0203). 2 Obsah 1 Základy teorie pravděpodobnosti 6 1.1 Motivace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.2 Pravděpodobnost . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.3 Opakování základních pojmů teorie pravděpodobnosti . . . . . 7 1.4 Diskrétní náhodné proměnné . . . . . . . . . . . . . . . . . . . 8 1.5 Závislost a nezávislost náhodných veličin . . . . . . . . . . . . 10 1.6 Podmíněná pravděpodobnost a podmíněné očekávání . . . . . 13 1.7 Součty náhodných veličin . . . . . . . . . . . . . . . . . . . . . 15 1.8 Příklady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2 Náhodná procházka 18 2.1 Jednoduchá náhodná procházka . . . . . . . . . . . . . . . . . 18 2.2 Základní vlastnosti náhodné procházky . . . . . . . . . . . . . 19 2.3 Základní techniky pro počítání s náhodnou procházkou . . . . 21 2.3.1 Technika podmínění 1. krokem . . . . . . . . . . . . . . 21 2.3.2 Technika počítání trajektorií . . . . . . . . . . . . . . . 22 2.3.3 Princip reflexe . . . . . . . . . . . . . . . . . . . . . . . 23 2.3.4 Generující funkce . . . . . . . . . . . . . . . . . . . . . 26 2.3.5 Charakteristiky náhodných veličin a jejich generující funkce . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.3.6 Součty náhodných veličin a konvoluce . . . . . . . . . . 29 2.3.7 Generující funkce a náhodná procházka . . . . . . . . . 30 2.3.8 Časy navštívení bodu r . . . . . . . . . . . . . . . . . . 34 2.3.9 Maxima . . . . . . . . . . . . . . . . . . . . . . . . . . 36 2.4 Příklady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 3 3 Zákony arcsinu a Pólyova věta 41 3.1 Zákony arcsinu pro symetrickou náhodnou procházku . . . . . 41 3.1.1 1. zákon arcsinu . . . . . . . . . . . . . . . . . . . . . . 41 3.1.2 Stirlingova formule . . . . . . . . . . . . . . . . . . . . 43 3.1.3 2. zákon arcsinu . . . . . . . . . . . . . . . . . . . . . . 45 3.2 Pólyova věta v Rn . . . . . . . . . . . . . . . . . . . . . . . . . 45 3.3 Příklady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 4 Markovské řetězce 49 4.1 Diskrétní Markovské řetězce . . . . . . . . . . . . . . . . . . . 49 4.2 Klasifikace stavů . . . . . . . . . . . . . . . . . . . . . . . . . 51 4.3 Příklady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 5 Markovské řetězce ve spojitém čase 54 5.1 Základní vlastnosti . . . . . . . . . . . . . . . . . . . . . . . . 54 5.2 Procesy zrodu a zániku . . . . . . . . . . . . . . . . . . . . . . 55 5.3 Kolmogorovova rovnice . . . . . . . . . . . . . . . . . . . . . . 57 6 Poissonův proces 59 6.1 Základní vlastnosti Poissonova procesu . . . . . . . . . . . . . 59 6.2 Cramér - Lundbergův model . . . . . . . . . . . . . . . . . . . 62 6.3 Inspekční paradox . . . . . . . . . . . . . . . . . . . . . . . . . 63 7 Složený Poissonův proces 64 7.1 Moment generující funkce . . . . . . . . . . . . . . . . . . . . 64 7.2 Vlastnosti exponenciálního rozdělení . . . . . . . . . . . . . . 65 7.3 Vlastnost absence paměti . . . . . . . . . . . . . . . . . . . . . 66 7.4 Míra rizika . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 7.5 Příklady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 8 Procesy obnovy 71 8.1 Rozdělení počtu příchodů . . . . . . . . . . . . . . . . . . . . 71 9 Diskrétní modely ve finanční matematice 74 9.1 1-krokový model . . . . . . . . . . . . . . . . . . . . . . . . . 74 4 9.2 Základní věta APT . . . . . . . . . . . . . . . . . . . . . . . . 78 9.2.1 Jištění (Hedging) . . . . . . . . . . . . . . . . . . . . . 82 9.3 Model s více periodami . . . . . . . . . . . . . . . . . . . . . . 83 9.3.1 Trh se dvěma periodami . . . . . . . . . . . . . . . . . 83 9.3.2 Vícekrokový model s T kroky . . . . . . . . . . . . . . 84 9.4 Příklady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 10 Martingaly 87 10.1 Férová hra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 10.2 Přirozená filtrace . . . . . . . . . . . . . . . . . . . . . . . . . 88 10.3 Martingal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 10.4 Samofinancující portfolia . . . . . . . . . . . . . . . . . . . . . 90 10.4.1 Dynamické portfolio . . . . . . . . . . . . . . . . . . . 90 10.4.2 Samofinancující portfolio . . . . . . . . . . . . . . . . . 91 10.5 Martingalová transformace . . . . . . . . . . . . . . . . . . . . 91 10.5.1 Podmíněná očekávání a martingalová transformace . . 92 10.6 Příklady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 11 Úplnost trhu 96 11.1 Věta o úplnosti trhu . . . . . . . . . . . . . . . . . . . . . . . 96 12 Wienerův proces 100 12.1 Limita náhodné procházky . . . . . . . . . . . . . . . . . . . . 100 12.2 Wienerův proces pro cenu akcie . . . . . . . . . . . . . . . . . 103 12.2.1 Itôovo lemma . . . . . . . . . . . . . . . . . . . . . . . 104 12.2.2 Odvození Black-Scholesovy rovnice . . . . . . . . . . . 105 12.3 Příklady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 5 Kapitola 1 Základy teorie pravděpodobnosti Matematické modely ve financích jsou z velké většiny stochastické. Základním nástrojem, který využívají, je teorie pravděpodobnosti. V této kapitole připomeneme některé základní pojmy a techniky z teorie pravděpodobnosti, tak jak je budeme v dalších kapitolách potřebovat. 1.1 Motivace Uvažujme jako příklad cenu jedné akcie firmy Apple příští pondělí na konci obchodování. Dnes je pro nás tato cena neznámá a modelujeme ji tedy jako náhodnou veličinu. Ovšem příští týden v úterý již bude známou hodnotou (konstantou). Pro matematické modelování ve financích je typická tato interakce náhodných a známých veličin. Vzájemnému působení náhodnosti a plynutí času se věnuje teorie stochastických procesů. Připomeňme, že posloupnost náhodných veličin Xt, t ∈ I, kde I je indexová množina, se nazývá stochastický proces. Je-li Xt cena zvolené akcie v budoucím čase t, pak zřejmě Xt, Xt+1 nejsou nezávislé náhodné veličiny. Hodnota Xt něco říká o pravděpodobnostním rozdělení náhodné veličiny Xt+1. Na druhé straně, přírustky Xt+2 − Xt+1 a Xt+1 − Xt budou ve většině našich modelů nezávislé. To úzce souvisí s tzv. hypotézou efektivního trhu. Podle ní všechny informace dostupné v čase t jsou již obsaženy v ceně Xt. Jak uvidíme, je to také jedním z hlavních argumentů, proč je geometrický Brownův pohyb “přirozeným ” modelem vývoje 6 cen akcií. 1.2 Pravděpodobnost Teorie pravděpodobnosti je hlavním nástrojem modelování ve finanční matematice. Je dobré si uvědomit hned na začátku, že pojem pravděpodobnost má více možných interpretací. 1. Frekventistický přístup: Pravděpodobnost jevu je limita jeho relativní četnosti při velkém počtu opakování téhož experimentu. Nevýhodou této definice je omezení na opakovatelné jevy. Předpoklad opakovatelnosti konkrétní situace na trhu není ve financích úplně reálný. 2. Bayesovský přístup: Pravděpodobnost vyjadřuje míru naší nejistoty o pravdivosti nějakého tvrzení, založenou na informacích, které v danou chvíli máme. V tomto pojetí je každá pravděpodobnost ve skutečnosti podmíněná (informacemi, které právě máme). Například pravděpodobnost padnutí šestky na kostce je P(X = 6) = 1 6 , pokud nemáme žádnou informaci o tom, jak je kostka vyrobena. Budeme-li znát například přesné složení materiálu (nehomogennost dřeva), může se tato pravděpodobnost změnit. Matematická technika výpočtů nicméně na interpretaci ve většině případů nezávisí a je stejná pro obě pojetí. 1.3 Opakování základních pojmů teorie prav- děpodobnosti Pravděpodobnostní prostor (model) obvykle označujeme (Ω, A, P), kde – Ω je prostor elementárních jevů, t.j. všech možných stavů modelovaného systému, které chceme rozlišovat (např. {1, 2, 3, 4, 5, 6} u hodu kostkou). – A je množina všech pozorovatelných jevů. PrvkyA jsou podmnožiny Ω. Jev je tedy formálně vzato množina elementárních jevů, které jsou s ním slučitelné. (Například jev “padne sudé číslo” je množina {2, 4, 6}) 7 Je-li Ω konečná nebo spočetná (tak tomu bude u všech diskrétních modelů), je A v definici pravděpodobnostního prostoru nadbytečné, neboť automaticky A je rovno exp Ω, množině všech podmnožin Ω. – P : A → 0, 1 je pravděpodobnostní míra. V diskrétním případě stačí znát hodnoty této míry na elementárních jevech, tedy P : Ω → 0, 1 . P(ω) je pak pravděpodobnost elementárního jevu ω a pro obecný jev A ∈ A platí P(A) = ω∈A P(ω). Pokud je ale Ω nespočetná, pak exp Ω má příliš velkou mohutnost, aby se na ní dala definovat pravděpodobnostní míra. Musíme se pak omezit na menší σ-algebru. S tím se setkáme až u spojitých modelů. 1.4 Diskrétní náhodné proměnné Diskrétní náhodná proměnná (náhodná veličina) je funkce X : Ω → {x1, x2, ...} ⊆ R, kde {x1, x2, ...} je diskrétní podmnožina R. Definice 1.4.1. Pravděpodobnostní funkce náhodné veličiny X je definována jako f(x) = P(X = x). Definice 1.4.2. Distribuční funkce náhodné veličiny X je F(x) = P(X ≤ x). Připomeňme si ještě definici nezávislosti dvou jevů. Definice 1.4.3. Jevy A, B ⊆ Ω jsou nezávislé, jestliže P(A) = P(A ∩ B) P(B) , tedy P(A ∩ B) = P(A)P(B). 8 Jinak řečeno (podle prvního vztahu), víme-li, že nastal jev B, nezmění to pravděpodobnost jevu A. Definice 1.4.4. Diskrétní náhodné veličiny X a Y jsou nezávislé, jestliže jevy {X = x} a {Y = y} jsou nezávislé pro všechna x a y. Jinými slovy, znalost hodnoty X nedává žádnou informaci o hodnotě Y . Pravděpodobnostní funkce obsahuje všechny informace o uvažované náhodné veličině. Často nám ale stačí její číselné charakteristiky. Definice 1.4.5. Očekávání (střední hodnota) náhodné veličiny X s pravděpodobnostní funkcí f(x) je definována jako E(X) = x: f(x)>0 xf(x), je-li řada absolutně konvergentní. Očekávání můžeme vypočítat také pomocí vztahu E(X) = ω∈Ω X(ω)P(ω). Definice 1.4.6. Je-li k přirozené číslo, k-tý moment mk náhodné veličiny X je definován jako mk = E(Xk ). Definice 1.4.7. k-tý centrální moment σk je definován jako σk = E((X − m1)k ). Speciálně, m1 = E(X) je střední hodnota a σ2 = E((X − E(X))2 ) 9 je rozptyl (variance). Tedy σ2 = σ2 , kde σ = √ σ2 je střední směrodatná odchylka. Definice 1.4.8. Nechť A je jev, tj. A ⊆ Ω, a nechť IA : Ω → R je náhodná veličina definovaná vztahem IA(ω) = 1 pro ω ∈ A 0 pro ω /∈ A . Pak IA se nazývá indikátorová funkce jevu A. Libovolnou náhodnou veličinu můžeme zapsat pomocí indikátorových funkcí jevů Ai = {X = xi}. Máme X = i xiIAi . IA je příkladem Bernoulliovské náhodné veličiny. Nabývá pouze hodnot 0 a 1. 1.5 Závislost a nezávislost náhodných veličin Lemma 1.5.1. Nechť X a Y jsou nezávislé náhodné veličiny. Potom E(XY ) = E(X)E(Y ). Důkaz: Označme Ax = {X = x} a By = {Y = y}. Pak XY = x,y xyIAx∩By , tedy E(XY ) = x,y xyE(IAx∩By ) = x,y xyP(Ax ∩ By) = x,y xyP(Ax)P(By) = ( x xP(Ax))( y yP(By)) = E(X)E(Y ). 10 Opak obecně neplatí. Definice 1.5.2. Říkáme, že náhodné veličiny X a Y jsou nekorelované, jestliže platí: E(XY ) = E(X)E(Y ). Věta 1.5.3. Nechť X a Y jsou náhodné veličiny. Pak 1. V ar(aX) = a2 V ar(X) pro a ∈ R. 2. Jsou-li X a Y nekorelované (speciálně nezávislé) náhodné veličiny, pak V ar(X + Y ) = V ar(X) + V ar(Y ). Důkaz: První tvrzení plyne ihned z definice. Dokážeme druhé tvrzení. V ar(X + Y ) = E [(X + Y ) − E(X + Y )]2 = E (X + Y )2 − 2(X + Y )E(X + Y ) + (E(X + Y ))2 = E((X + Y )2 ) − 2E(X + Y )E(X + Y ) + E((X + Y )2 ) = = E(X2 ) + 2E(XY ) + E(Y 2 ) − 2 (E(X))2 + 2E(X)E(Y ) + (E(Y ))2 +E(X)2 + 2E(X)E(Y ) + E(Y )2 = E(X2 ) + E(Y 2 ) + 2E(XY ) − (E(X))2 − 2E(X)E(Y ) − (E(Y ))2 = = E(X2 ) − (E(X))2 + E(Y 2 ) − (E(Y ))2 = V ar(X) + V ar(Y ), kde předposlední rovnost plyne z předpokladu, který implikuje E(XY ) = E(X)E(Y ). Definice 1.5.4. Kovariance náhodných veličin X a Y je definována jako cov(X, Y ) = E [(X − E(X))(Y − E(Y ))] . Korelační koeficient X a Y je ρ(X, Y ) = cov(X, Y ) V ar(X)V ar(Y ) . 11 Platí: ρ(X, Y ) = 0 ⇔ E(XY ) = E(X)E(Y ) ⇔ cov(X, Y ) = 0 a cov(X, Y ) = E(XY ) − E(X)E(Y ). Dále je |ρ(X, Y )| ≤ 1. Klíčová otázka z praktického hlediska je, jak ověřit nezávislost dvou daných náhodných veličin. Definice k tomu většinou vhodná není. Definice 1.5.5. Nechť X a Y jsou diskrétní náhodné veličiny (na stejném pravděpodobnostním prostoru). Sdružená distribuční funkce X a Y je definovaná vztahem FX,Y (x, y) = P(X ≤ x ∧ Y ≤ y). Definice 1.5.6. Sdružená pravděpodobnostní funkce: fX,Y : R2 → [0, 1] je definovaná vztahem fX,Y (x, y) = P(X = x ∧ Y = y). Analogicky se definuje sdružená pravděpodobnostní funkce pro více náhodných veličin. Následující lemma dává dobře ověřitelné kriterium nezávislosti. Lemma 1.5.7. Diskrétní náhodné veličiny X a Y jsou nezávislé právě tehdy, když fX,Y (x, y) = fX(x)fY (y) pro všechna x, y ∈ R. Důkaz: cvičení. Ze znalosti sdružené pravděpodobnostní funkce fX,Y můžeme vypočítat marginální pravděpodobnostní funkce fX a fY . Máme 12 fX(x) = P(X = x) = P( y ({X = x} ∩ {Y = y})) = y P(X = x ∧ Y = y) = y fX,Y (x, y). Příklad 1.5.8. Nechť X : Ω → {1, 2, 3}a Y : Ω → {−1, 0, 2} jsou náhodné veličiny a sdružená pravděpodobnostní funkce je dána tabulkou: y = −1 y = 0 y = 2 fX x = 1 1 18 3 18 2 18 6 18 x = 2 2 18 0 3 18 5 18 x = 3 0 4 18 3 18 7 18 fY 3 18 7 18 8 18 18 18 Jsou X a Y nezávislé? Zřejmě ne, v tom případě by řádky tabulky musely být násobkem jeden druhého. Vypočteme kovarianci těchto dvou náhodných veličin. Máme XY : Ω → {−1, 0, −2, −3, 2, 4, 6} . Dále E(X) = 6 18 + 10 18 + 21 18 = 37 18 , E(Y ) = 13 18 a E(XY ) = −1 1 18 + 2 2 18 − 2 2 18 + 4 3 18 + 6 3 18 = 29 18 Celkem tedy cov(X, Y ) = E(XY ) − E(X)E(Y ) = 29 18 − 481 324 = 522 − 481 324 = 41 324 . 1.6 Podmíněná pravděpodobnost a podmíněné očekávání Připoměňme definici podmíněné pravděpodobnosti pro jevy, P(A | B) = P(A ∩ B) P(B) . 13 Ve finančních modelech je obvykle pravděpodobnost podmíněná informací, kterou máme v danou chvíli. Formálně to zachycuje následující defi- nice. Definice 1.6.1. Podmíněná pravděpodobnostní funkce náhodné veličiny Y za podmínky X = x, kterou budeme označovat fY |X(. | x), je definována jako fY |X(y | x) = P(Y = y | X = x), pro každé x takové, že P(X = x) > 0. Z definice máme P(Y = y | X = x) = P(Y = y ∧ X = x) P(X = x) = fX,Y (x, y) fX(x) , tedy fY |X(y | x) = fX,Y (x, y) fX(x) , což je analogický vztah jako platí pro podmíněné pravděpodobnosti jevů. V předchozím příkladu máme pro x = 1 fY |X(y | 1) ∼ 1 6 , 3 6 , 2 6 = fX,Y fX . Víme-li, že X = x, pak Y má novou pravděpodobnostní funkci fY |X(y | x) jakožto funkci y (x je pevné). Očekávání vůči této funkci je podmíněné očekávání Y za podmínky X = x, které označíme Ψ(x) = E(Y | X = x). Definice 1.6.2. Funkce Ψ(x) = E(Y | X = x) se nazývá podmíněné očekávání Y při znalosti X. V minulém příkladu je: Ψ(1) = 1 6 (−1) + 3 6 0 + 2 6 2 = 1 2 , 14 Ψ(2) = −2 5 + 6 5 = 4 5 a Ψ(3) = 6 7 . Věta 1.6.3. (O celkovém očekávání) Pro podmíněné očekávání Ψ(x) = E(Y | X = x) platí E(Ψ(x)) = E(Y ), tedy E(Y ) = E(E(Y |X)). Důkaz: cvičení. 1.7 Součty náhodných veličin Lemma 1.7.1. Nechť X a Y jsou dvě náhodné veličiny na (Ω, A,P) a f(x, y) je jejich sdružená pravděpodobnostní funkce. Pak pro jejich součet Z = X+Y platí P(X + Y = z) = x f(x, z − x). Důkaz: Máme {X + Y = z} = x ({X = x ∧ Y = z − x}) tedy P(X + Y = z) = x P({X = x} ∧ {Y = z − x}) = x f(x, z − x). 15 Pokud X, Y jsou navíc nezávislé, pak fX,Y (x, z − x) = fX(x)fY (z − x), tedy fX+Y (z) = x fX(x)fY (z − x), což je konvoluce funkcí fX a fY . Označuje se fX fY . 16 1.8 Příklady Příklad 1.8.1. Nechť A a B jsou jevy s pravděpodobnostmi P(A) = 3 4 a P(B) = 1 3 . Dokažte, že platí 1 12 ≤ P(A ∩ B) ≤ 1 3 a najděte příklady v nichž nastává rovnost. Příklad 1.8.2. Hana má tři děti, každé z nich má stejnou pravděpodobnost být kluk i holka. Uvažujme následující jevy: A = { všechny děti mají stejné pohlaví} B = { nejvýše jedno z nich je kluk} A = {v rodině je jak kluk tak holka} –Ukažte, že A je nezávislé na B a B je nezávislé na C. – Je A nezávislé na C? Příklad 1.8.3. Vypočtěte střední hodnotu a rozptyl a) Bernoulliho rozdělení b) Geometrického rozdělení c) Poissonova rozdělení Příklad 1.8.4. Najděte příklad dvou náhodných veličin, které jsou nekorelované, ale nejsou nezávislé 17 Kapitola 2 Náhodná procházka 2.1 Jednoduchá náhodná procházka Jednoduchá náhodná procházka je základem diskrétních modelů pro pohyb cen aktiv. Je to “diskrétní verze” Brownova pohybu. Uvažujme následující hru: Hází se opakovaně mincí (ne nutně férovou). Padne-li hlava (H), získáme 1 Kč. Padne-li orel (O), prohrajeme 1 Kč. Označme S0 sumu, kterou máme na začátku, a Sn sumu, kterou máme po n hrách. Je tedy Sn = S0 + n i=1 Xi, kde Xi je náhodná veličina popisující výsledek i-té hry. Předpokládáme, že pravděpodobnostní funkce Xi je P(Xi = 1) = p, P(Xi = −1) = 1 − p = q pro všechna i a navíc Xi jsou nezávislé. Xi jsou tedy analogií Bernoulliho náhodné veličiny, kde místo hodnot {1, 0} máme {1, −1} . Pro každé pevné n je Sn náhodná veličina, tedy {Sn}∞ n=0 je stochastický proces. Definice 2.1.1. Stochastický proces {Sn}∞ n=0 se nazývá jednoduchá náhodná procházka. Je-li p = q = 1 2 , nazývá se symetrická jednoduchá náhodná procházka. 18 Někdy je vhodnější uvažovat jinou interpretaci – náhodný pohyb částice po přímce: V každém kroku t = 0, 1, 2, ... se částice posune buď o 1 doprava s pravděpodobností p, nebo o 1 doleva s pravděpodobností q = 1 − p. Velmi užitečné je grafické znázornění jednoduché náhodné procházky. Body o souřadnicích (n, Sn) spojíme úsečkami. Vzniklá lomená čára se nazývá trajektorie (cesta) náhodné procházky. Trajektorie je grafické znázornění realizace náhodného procesu {Sn}∞ n=0. -2 -1 0 1 2 0 1 2 3 4 5 čas Varianty náhodné procházky: • jiné rozdělení Xi (např. normální) • hodnoty Xi ne v R, ale v Rd (vícerozměrná náhodná procházka). 2.2 Základní vlastnosti náhodné procházky Lemma 2.2.1. Jednoduchá náhodná procházka je prostorově homogenní, tedy platí P(Sn = j | S0 = a) = P(Sn = j + b | S0 = a + b). 19 Důkaz: Obě strany rovnosti jsou rovny P( n i=1 Xi = j − a). Podobně je náhodná procházka homogenní i v čase. Lemma 2.2.2. Jednoduchá náhodná procházka je časově homogenní, neboli platí P(Sn = j | S0 = a) = P(Sn+m = j | Sm = a). Důkaz: Levá strana je rovna P( n i=1 Xi = j − a), pravá strana je rovna P( n+m i=m+1 Xi = j − a). Rovnost tedy plyne z nezávislosti a stejného rozdělení Xi. Lemma 2.2.3. Jednoduchá náhodná procházka má Markovovu vlastnost, tedy P(Sm+n = j | S0, S1, ..., Sm) = P(Sm+n = j | Sm). Důkaz: Známe-li hodnotu Sm, pak rozdělení pravděpodobnosti Sn+m závisí jen na krocích Xm+1, Xm+2, ..., Xm+n, tedy je nezávislé na S0, S1, ..., Sm−1. Markovovu vlastnost lze intuitivně popsat slovy: “náhodná procházka nemá paměť ”, “minulost ovlivňuje budoucnost jen skrze současnost”. 20 2.3 Základní techniky pro počítání s náhodnou procházkou Tato sekce se věnuje základním technikám počítání s náhodnou procházkou: • podmínění 1. krokem • počítání trajektorií • generující funkci 2.3.1 Technika podmínění 1. krokem Příklad 2.3.1. (zruinování hráče): Uvažujme předchozí hru s férovou mincí (p = 1 2 ). Padne-li hlava (H), hráč získá 1 Kč, padne-li orel (O), hráč prohraje 1 Kč. Nechť S0 = k je jeho počáteční jmění. Hráč si chce koupit auto v ceně N. Bude hrát tak dlouho, dokud Sn = N (koupí auto) nebo Sn = 0 (bankrot). Jaká je pravděpodobnost, že hráč zbankrotuje? Uvažujme jevy: A ... hráč nakonec zbankrotuje; H ... první hod je hlava (P(H) = p); O ... první hod je orel (P(O) = q). Podle věty o úplné pravděpodobnosti platí P(A) = P(H)P(A | H) + P(O)P(A | O). Označme Pk(A) hledanou pravděpodobnost bankrotu pro dané počáteční jmění k, tedy Pk(A) = P(H)Pk(A | H) + P(O)Pk(A | O). Pk(A | H) je ale pravděpodobnost bankrotu v situaci, kdy hráč po 1. kroku má k+1 (a hra začíná z hlediska pravděpodobnosti znovu, z nezávislosti Xi). Tedy Pk(A | H) = Pk+1(A) a podobně Pk(A | O) = Pk−1(A). 21 Označme pk = Pk(A). Dosazením dostaneme pk = ppk+1 + qpk−1 = 1 2 pk+1 + 1 2 pk−1, což je diferenční rovnice 2. řádu. Máme 1 2 (pk+1 − pk) = 1 2 (pk − pk−1), tedy přírůstky pravděpodobnosti jsou konstantní. Označme přírůstky b = pk − pk−1, tedy pk = p0 + kb. Okrajové podmínky pro diferenční rovnici jsou: p0 = 1 (okamžitý bankrot) pN = 0 (okamžitá koupě auta) Odtud dostaneme 1 + Nb = 0, tedy b = − 1 N a pk = 1 − k N . 2.3.2 Technika počítání trajektorií Uvažujme náhodnou procházku vycházející z bodu a. Máme tedy S0 = a, P(Xi = 1) = p, P(Xi = −1) = q a Sn = a + n i=1 Xi. Pro pevně danou cestu je pravděpodobnost, že prvních n kroků bude sledovat právě tuto cestu, rovna pr ql , kde r je počet kroků doprava (nahoru) a l je počet kroků doleva (dolů), tedy r =| {i : Si+1 − Si = 1, i ≤ n − 1} |, kde | . | značí velikost množiny. 22 Každý jev můžeme vyjádřit pomocí vhodné množiny trajektorií (které jsou s ním v souladu), a jeho pravděpodobnost je součet pravděpodobností těchto trajektorií. Máme P(Sn = b|S0 = a) = r Mr n(a, b)pr qn−r , kde Mr n(a, b) je počet cest (S0, S1, ..., Sn) takových, že S0 = a, Sn = b, a majících přesně r kroků doprava. Víme, že r + l = n a r − l = b − a. Odtud 2r = n + b − a, čili r = n + b − a 2 a l = n − b + a 2 . Tedy P(Sn = b|S0 = a) = n r p n+b−a 2 q n−b+a 2 = n 1 2 (n + b − a) p n+b−a 2 q n−b+a 2 , pokud 1 2 (n + b − a) ∈ N (jinak je pravděpodobnost rovna 0). 2.3.3 Princip reflexe Označme Nn(a, b) počet všech cest z bodu (0, a) do bodu (n, b). Víme, že Nn(a, b) = Mr n(a, b) = n 1 2 (n + b − a) . Dále nechť N0 n(a, b) je počet všech cest z bodu (0, a) do bodu (n, b), které obsahují nějaký bod (k, 0) na ose x, tedy navštíví bod 0. Věta 2.3.2. (princip reflexe): Je-li a, b > 0, pak platí N0 n(a, b) = Nn(−a, b). Důkaz: Každá cesta z bodu (0, −a) do (n, b) protne osu x poprvé v nějakém bodě (k, 0). Reflexí této cesty okolo osy x dostaneme cestu z bodu (0, a) 23 do (n, b), která navštíví osu x. Tato operace dává vzájemně jednoznačnou korespondenci mezi cestami z (0, −a) do (n, b) a cestami (0, a) do (n, b), které navštíví osu x. Tedy N0 n(a, b) = Nn(−a, b). Věta 2.3.3. (o volbách): Je-li b > 0, pak počet cest z bodu (0, 0) do bodu (n, b), které se nevrátí do bodu 0, je b n Nn (0, b) , kde Nn (0, b) je počet všech cest z bodu (0, 0) do bodu (n, b). Důkaz: Pro všechny takové cesty je první krok bod (1, 1) (jinak se nutně dostaneme do nuly), tedy jejich počet je roven (z časové homogenity): Nn−1 (1, b) − N0 n−1 (1, b) = Nn−1 (1, b) − Nn−1 (−1, b) = = n − 1 1 2 (n − 1 + b − 1) − n − 1 1 2 (n + b) = n − 1 m − 1 − n − 1 m = b n n m = b n Nn (0, b) , kde jsme označili m = 1 2 (n + b). Příklad 2.3.4. (Úloha o volbách) Kandidát A má α hlasů; kandidát B dostal β hlasů, kde α > β, tj. kandidát A zvítězil. Jaká je pravděpodobnost, že během voleb byl A celou dobu před B? Označme Xi = 1, je-li i-tý hlas pro A, Xi = −1, je-li i-tý hlas pro kandidáta B. Je tedy n = α + β. Součet Sk = k i=1 Xi popisuje, o kolik vede A nad B v čase k (případně prohrává, je-li Sk < 0). Podle věty o volbách je trajektorií z bodu (0, 0) do bodu (α + β, α − β), které se nedostanou do 0, přesně α − β α + β Nα+β (0, α − β) . 24 Hledaná pravděpodobnost je tedy α−β α+β Nα+β (0, α − β) Nα+β (0, α − β) = α − β α + β . Nyní se budeme zajímat o to, jaká je pravděpodobnost, že se náhodná procházka nevrátí do 0. Máme S0 = 0 a chceme S1 = 0, ..., Sn = 0, jinak řečeno S1S2...Sn = 0. Věta 2.3.5. Je-li S0 = 0, pak pro n ≥ 1 platí P(S1S2...Sn = 0 ∧ Sn = b) = | b | n P(Sn = b), tedy P(S1S2...Sn = 0) = 1 n E(|Sn|). Důkaz: cvičení 25 2.3.4 Generující funkce Uvažujeme posloupnost reálných čísel a = {ai; i = 0, 1, 2, ..} . Taková posloupnost obsahuje velké množství informace, kterou můžeme výhodně “zakódovat” do jediného objektu (funkce), s nímž budeme moci lépe pracovat. Mimo jiné získáme možnost použít operace (např. derivaci), které pro posloupnosti nemají smysl. Definice 2.3.6. Generující funkce posloupnosti a je funkce daná součtem mocninné řady Ga(s) = ∞ i=0 aisi pro s ∈ R, pro která řada konverguje. Posloupnost a dostaneme z generující funkce Ga zpět vztahem ai = G (i) a (0) i! , kde G (i) a (0) je i-tá derivace Ga v bodě 0. Příklad 2.3.7. Nechť a = {0, 1, 0, −1, 0, 1, 0, ...} . Pak Ga = s − s3 + s5 − s7 + ... , což je geometrická řada s prvním členem s a s kvocientem q = −s2 . Tedy Ga(s) = s 1 + s2 pro | s |< 1 (obor konvergence). Dále budeme definovat generující funkci diskrétní náhodné veličiny. Definice 2.3.8. Nechť X je diskrétní náhodná veličina, která nabývá hodnoty v množině {0, 1, 2, ...} , s pravděpodobnostní funkcí f(i) = P(X = i). 26 Generující funkce této náhodné veličiny je definovaná jako generující funkce její pravděpodobnostní funkce, tedy GX(s) = ∞ i=0 f(i)si = ∞ i=0 P(X = i)si . Platí zřejmě GX(s) = E(sX ). Základní vlastnosti generujících funkcí: 1. Existuje nezáporné číslo R (poloměr konvergence) takové, že G(s) konverguje pro | s |< R a diverguje pro | s |> R. 2. G(s) můžeme derivovat nebo integrovat člen po členu, libovolně mnohokrát, pro | s |< R. 3. Jednoznačnost: Je-li Ga(s) = Gb(s) pro | s |< R , kde 0 < R ≤ R, pak an = bn pro všechna n. Příklady generujících funkcí náhodných veličin: 1. Konstantní náhodná veličina. P(X = c) = 1, kde c ∈ N ∪ {0}. Máme GX(s) = 1sc = sc . 2. Bernoulliho náhodná veličina. P(X = 1) = p a P(X = 0) = 1 − p. Tedy GX(s) = ps1 + (1 − p)s0 = 1 − p + ps. 3. Geometrické rozdělení. P(X = n) = p(1−p)n−1 pro n ∈ N. Dostaneme GX(s) = ∞ i=0 f(i)si = ∞ n=1 p(1 − p)n−1 sn = ∞ n=1 ps [(1 − p)s]n−1 = = ps ∞ n=0 [(1 − p)s]n = sp 1 − (1 − p)s = sp 1 − s + sp . 27 4. Poissonovo rozdělení s parametrem λ. P(X = k) = λk k! e−λ . Tedy GX(s) = ∞ i=0 λi i! e−λ si = e−λ ∞ i=0 (λs)i i! = e−λ eλs = eλs−λ = eλ(s−1) , s využitím n xn n! = ex . 2.3.5 Charakteristiky náhodných veličin a jejich generující funkce Základní charakteristiky náhodných veličin, E(X) a V ar(X), lze jednoduše spočítat pomocí GX(s). Věta 2.3.9. Nechť X je náhodná veličina s generující funkcí GX(s). Pak platí: 1. E(X) = GX(1). 2. Obecně, E(X(X − 1)...(X − k + 1)) = G (k) X (1) (tzv. k-tý faktoriální moment). Důkaz: První tvrzení je speciální případ druhého. Máme G (k) X (s) = i si−k i(i − 1)...(i − k + 1)f(i) = = E(sX−k X(X − 1)...(X − k + 1)). Pro s → 1− dostaneme G (k) X (1) = E(X(X − 1)...(X − k + 1)). Pro rozptyl dostaneme speciálně vztah V ar(X) = E(X2 ) − E(X)2 = E(X(X − 1) + X) − E(X)2 = = E(X(X − 1)) + E(X) − E(X)2 = GX(1) + GX(1) − [GX(1)] 2 . 28 2.3.6 Součty náhodných veličin a konvoluce Něchť a = {ai, i ≥ 0} a b = {bi, i ≥ 0} jsou dvě posloupnosti, pak konvoluce c = a b je posloupnost definovaná vztahem cn = a0bn + a1bn−1 + ... + anb0. Jsou-li Ga, Gb generující funkce posloupností a a b, pak generující funkce posloupnosti c je Gc(s) = ∞ n=0 cnsn = ∞ n=0 n i=0 aibn−i sn = = ∞ i=0 aisi ∞ n=i bn−isn−i = ∞ i=0 aisi ∞ n=0 bnsn = Ga(s)Gb(s). Tím jsme dokázali následující tvrzení. Věta 2.3.10. Generující funkce konvoluce dvou posloupností je součinem generujících funkcí těchto posloupností. Věta 2.3.11. Nechť X a Y jsou nezávislé náhodné veličiny. Pak GX+Y (s) = GX(s)GY (s). Důkaz: Víme, že pro pravděpodobnostní funkci X +Y platí fX+Y = fX fY (z nezávislosti), a podle předchozí věty víme, že generující funkce konvoluce je součin generujících funkcí. Tedy GX+Y = GXGY . Je-li S = X1 + X2 + ... + Xn, kde Xi jsou nezávislé, pak z předchozí věty plyne GS = GX1 GX2 ...GXn . 29 Definice 2.3.12. Sdružená pravděpodobnostní generující funkce náhodných veličin, nabývajících hodnot v N ∪ {0}, je definovaná jako GX1,X2 (s1, s2) = P (X1 = i ∧ X2 = j) si 1sj 2 = E(sX1 1 sX2 2 ) Analogicky je možné definovat sdruženou pravděpodobnostní generující funkci pro více náhodných veličin. 2.3.7 Generující funkce a náhodná procházka Uvažujme opět náhodnou procházku Sn = n i=1 Xi, kde P(Xi = 1) = p a P(Xi = −1) = q = 1 − p. Přitom Xi jsou nezávislé a S0 = 0. Jak často se náhodná procházka vrací do počátku? Jaké je pravděpodobnostní rozdělení prvního návratu do počátku? (Pro další návraty je to opět totéž, z nezávislosti Xi.) K zodpovězení těchto otázek využijeme generující funkce. Označme p0(n) = P(Sn = 0) pravděpodobnost, že náhodná procházka je v 0 v čase n, a f0(n) = P(S1 = 0, S2 = 0, ..., Sn−1 = 0, Sn = 0) pravděpodobnost, že první návrat do počátku nastal v čase n. Uvažujme generující funkce těchto dvou posloupností, P0(s) = ∞ n=0 p0(n)sn 30 a F0(s) = ∞ n=0 f0(n)sn . Máme p0(0) = 1 (neboť S0 = 0) a f0(0) = 0. Lemma 2.3.13. Platí P0(s) = 1 − 4pqs2 −1 2 . Důkaz: Víme, že Sn = 0 ⇔ počet kroků doprava = počet kroků doleva, tedy r = n 2 = l. Počet takových cest je n n 2 pro n sudé a 0 pro n liché. Označme k = n 2 , tj. n = 2k. Máme p0(2k) = 2k k pk qk a P0(s) = ∞ k=0 2k k (pqs2 )k . (2.1) Tvrdíme, že P0(s) = 1√ 1−4pqs2 . Využijeme obecného binomického rozvoje (1 + x)a = ∞ n=0 a n xn , kde a n = a (a − 1) ... (a − n + 1) n! . Pro a ∈ N je rozvoj konečný, pro a ∈ R ∧ a /∈ N je rozvoj nekonečný. Dosazením a = −1 2 a x = −4pqs2 dostaneme 1 − 4pqs2 −1 2 = ∞ k=0 −1 2 k −4pqs2 k = (2.2) ∞ k=0 −1 2 k (−4)k pqs2 k . 31 Porovnáním 2.1 a 2.2 tedy stačí dokázat, že −1 2 k (−4)k = 2k k . Pro levou stranu dostaneme −1 2 −3 2 −5 2 ... −2k−1 2 k! (−1)k 22k = 2k (−1)2k 1 3 5 ...(2k − 1) k! = 2k 1 3 5 ... (2k − 1) k! . Pro pravou stranu 2k k = 2k (2k − 1) (2k − 2) ...1 k!k! = 2k k! (2k − 1) (2k − 3) ...3 1 k!k! = 2k (2k − 1) (2k − 3) ...3 1 k! . Tedy obě strany se rovnají. Tím je lemma dokázáno. Věta 2.3.14. Platí 1) P0(s) = 1 + P0(s)F0(s) a 2) F0(s) = 1 − 1 − 4pqs2 1 2 . Důkaz: Označme A jev, že Sn = 0 a nechť Bk jsou jevy “první návrat do počátku nastal v k-tém kroku” (k = 1, 2, ..., n). 1) Bk jsou disjunktní a dávají rozklad, tedy P(A) = n k=1 P(A | Bk)P(Bk). Máme P(Bk) = f0(k) a P(A | Bk) = p0(n − k), z časové homogenity. Tedy p0(n) = n k=1 p0(n − k)f0(k). 32 Vynásobíme sn a sečteme, ∞ n=1 p0(n)sn = ∞ n=1 n k=1 p0(n − k)f0(k)sn = ∞ k=1 f0(k)sk ∞ n=k p0(n − k)sn−k = P0(s)F0(s). Protože ∞ n=1 p0(n)sn = P0 − 1, dostáváme P0 − 1 = P0F0, tedy P0 = 1 + P0F0. Pro důkaz 2) dostáváme z 1) F0 = P0 − 1 P0 = 1 − 1 P0 = 1 − 1 − 4pqs2. Důsledek 2.3.15. Pravděpodobnost toho, že se částice někdy vrátí do počátku, je rovna ∞ n=1 f0(n) = F0(1) = 1− | p − q | . Speciálně, pro symetrickou náhodnou procházku (p = q) je návrat jistý. Důsledek 2.3.16. (Pólyova věta v dimenzi 1) Symetrická náhodná procházka se s pravděpodobností 1 vrátí do počátku. Důsledek 2.3.17. Je-li p = q = 1 2 , tedy návrat je jistý, pak očekávání času T0 prvního návratu do počátku je E(T0) = ∞ n=1 nf0(n) = F0(1) = ∞. Důkaz: 33 1. Máme F0(1) = 1 − 1 − 4pq = 1 − 1 − 4p(1 − p) = 1 − 1 − 4p + 4p2 = = 1 − (1 − 2p)2 = 1− | 1 − 2p |= 1− | 1 − p − p |= 1− | q − p | . Pro q = p = 1 2 je F0(1) = 1 − 0 = 1. 2. Je-li návrat jistý, tedy p = 1 2 , pak P(T0 = ∞) = 0, a tedy E(T0) = F0(1), kde F0 = 1 − 1 − 4pqs2. Máme F0 = − 1 2 1 1 − 4pqs2 (−4pq2s) = 4pqs 1 − 4pqs2 , tedy lim s→1− F0(s) = +∞. 2.3.8 Časy navštívení bodu r Označme fr(n) = P(S1 = r, S2 = r, ..., Sn−1 = r, Sn = r) pravděpodobnost, že se náhodná procházka dostane poprvé do bodu r v čase n, s generující funkcí Fr(s) = ∞ n=0 fr(n)sn . Věta 2.3.18. Platí 1. Fr(s) = [F1(s)]r pro r ≥ 1, 2. F1(s) = 1−(1−4pqs2 ) 1 2 2qs . Důkaz: Označme Tr = min {n; Sn = r} počet kroků potřebných k dosažení hodnoty r poprvé. Nechť r > 0. Abychom dosáhli r, musíme se dostat nejdříve do bodu 1, a potom z bodu 1 do bodu r. To je z prostorové homogenity totéž jako dostat se z 0 do r − 1. Odtud plyne Tr = T1 + Tr−1. Z nezávislosti tedy dostaneme Fr = F1Fr−1. Máme pro n > 1 f1(n) = P(S1 = 1, S2 = 1, ..., Sn−1 = 1, Sn = 1) =: P(A) = 34 = P(A | S1 = 1)P(S1 = 1) + P(A | S1 = −1)P(S1 = −1) = = P(A | S1 = 1)p + P(A | S1 = −1)q = 0p + f2(n − 1)q. Odtud f1(n) = f2(n − 1)q. Vynásobíme sn f1(n)sn = qf2(n − 1)sn a sečteme přes n > 1. Tedy n=2 f1(n)sn = n=2 qf2(n − 1)sn = n=2 sqf2(n − 1)sn−1 = sq n=1 f2(n)sn . Odtud dostáváme F1 − ps = F2qs. Víme, že F2 = F2 1 , tedy F1 − ps = F2 1 qs, což vede ke kvadratické rovnici qsF2 1 − F1 + ps = 0. Řešením dostaneme dva kořeny F1 =    1− √ 1−4qps2 2qs 1+ √ 1−4qps2 2qs . Kořen 1+ √ 1−4qps2 2qs ale nevyhovuje zadání, protože má v bodě 0 limitu ∞. Tím je tvrzení dokázáno. Důsledek 2.3.19. Pravděpodobnost, že náhodná procházka někdy navštíví kladnou část reálné osy, je rovna min 1, p q . 35 Důkaz: Hledaná pravděpodobnost je rovna pravděpodobnosti, že náhodná procházka navštíví bod 1. Ta je rovna ∞ n=1 f1(n), součtu pravděpodobností, že se dostaneme do bodu 1 v nějakém čase n. Víme, že F1(s) = ∞ n=0 f1(n)sn . Dosazením s = 1 dostaneme ∞ n=1 f1(n) = F1(1) = 1 − (1 − 4pq) 1 2 2q = 1 − 1 − 4p(1 − p) 2(1 − p) = 1 − (1 − 2p)2 2(1 − p) = 1− | 1 − 2p | 2(1 − p) = 1− | q − p | 2q = = 1−(−(q−p)) 2q = 1−p+q 2q = 2q 2q = 1 pro q < p 1−q+p 2q = 2p 2q = p q pro q > p . Příklad 2.3.20. Ruleta má 37 čísel (včetně 0). Budeme sázet stále na lichá čísla, tedy p = 18 37 a q = 19 37 . Pravděpodobnost, že budeme někdy vyhrávat je p q = 18 19 . 2.3.9 Maxima Věta 2.3.21. Nechť S0 = 0. Pro n ≥ 1 platí P(Sn = b & S1 S2 . . . Sn = 0) = |b| n P(Sn = b) a tedy P(S1 S2 . . . Sn = 0) = 1 n E(|Sn|). Důkaz: Nechť Sn = b > 0. Podle věty o volbách je počet cest z bodu (0, 0) 36 do bodu (n, b), které nenavštíví počátek celkem b n Nn(0, b). Tedy P(Sn = b & S1 S2 . . . Sn = 0) = b n Nn(0, b) p n+b 2 q n−b 2 = b n P(Sn = b). Podobně pro b < 0. Jakou maximální hodnotu nabývá náhodná procházka do času n? Označme Mn = max{Si; 0 ≤ i ≤ n} a opět S0 = 0, tedy Mn ≥ 0. Věta 2.3.22. Nechť S0 = 0. Pak pro n ≥ 1 platí P(Mn ≥ r & Sn = b) = P(Sn = b) pro b ≥ r (g p )r−b P(Sn = 2r − b) pro b < r Důkaz: Zřejmě Mn ≥ Sn, tedy 1. část je jasná. Dále máme pro b < r: Nechť Nr n(0, b) je počet cest z (0, 0) do (n, b), které obsahují nějaký bod s hodnotou r, t.j. (i, r) pro 0 < i < n a nechť pro takovou cestu c je (ic, r) první takový bod. Uvažujme reflexi takové cesty pro ic ≤ k ≤ n okolo přímky y = r. Tak dostaneme cestu c z (0, 0) do (n, 2r −b). Každá taková cesta c vznikne z jednoznačně určené cesty c. Tedy Nr n(0, b) = Nn(0, 2r − b). Dále (Mn ≥ r & Sn = b) = Nr n(0, b) p n+b 2 q n−b 2 = = g p r−b Nr n(0, b) p n+2r−b 2 q n−2r+b 2 = = g p r−b P(Sn = 2r − b). 37 Jaká je pravděpodobnost, že náhodná procházka dosáhne nového maxima v daném čase? Věta 2.3.23. Nechť b = 0. Pravděpodobnost fb(n), že náhodná procházka se poprvé dostane do bodu b v čase n je fb(n) = |b| n P(Sn = b). Důkaz: Plyne z předminulé věty a principu reverze (obrácení). Nechť pro původní trajektorii náhodné procházky je (0, S1, . . . , Sn) = (0, X1, X1 + X2, . . . , n i=1 Xi). Uvažujme obrácenou trajektorii (0, T1, . . . , Tn), kde (0, T1, . . . , Tn) = (0, Xn, Xn + Xn−1, . . . , n i=1 Xi). Xi jsou IID, tedy obě mají stejné rozložení (pro libovolné p). Původní náhodná procházka splňuje Sn = b > 0 & S1, . . . , Sn = 0 (podmínky předminulé věty) právě tehdy když obrácenná náhodná procházka splňuje Tn = b a Tn − Tn−i = (Xn + · · · + X1) − (Xn + · · · + Xn−i+1) = X1 + · · · + Xi > 0 pro každé i, tedy první dosažení bodu b nastane v čase n. Odtud fb(n) = P(Sn = b & S1 S2 . . . Sn = 0) = b n P(Sn = b). 38 Pro b < 0 je důkaz zcela analogický. Označme dále µb je očekávaný počet návštěv bodu b před prvním návratem do počátku (předpokládáme stále S0 = 0). Pak µb = ∞ n=1 P(Sn = b & S1 S2 . . . Sn = 0) = ∞ n=1 fb(n) = P(Sn = b pro nějaké n). Tedy pro p = 1 2 platí následující věta: Věta 2.3.24. Nechť p = 1 2 a S0 = 0. Pak pro libovolné b = 0 je očekávaný počet návštěv bodu b před návratem do 0 roven 1. Důkaz: Nechť fb = P(Sn = b pro nějaké n > 0). Podmíněno hodnotou S1 máme fb = 1 2 (fb+1 + fb−1) pro b > 0, s okrajovou podmínkou f0 = 1. Navíc je fb = Ab + B pro nějaké konstanty A, B. Jediné řešení ležící v intervalu [0, 1) je tedy fb = 1 pro ∀b > 0. Ale fb = µb, odkud plyne dokazované tvrzení. 39 2.4 Příklady Příklad 2.4.1. Najděte počet cest z bodu (0, 0) do bodu (3, 7). Příklad 2.4.2. Najděte počet cest z bodu (1, 2) do bodu (7, 4) které nenavštíví počatek. Příklad 2.4.3. Najděte generující funkce posloupností a) {0, 1, 0 − 1, 0, 1, . . . } b) {1, 2, 3, 4, 5 . . . } c) {1, −1 2 , 1 3 , −1 4 , 1 5 , . . . }. Příklad 2.4.4. Pomocí generující funkce najděte střední hodnotu a rozptyl náhodné veličiny s geometrickým rozdělením. 40 Kapitola 3 Zákony arcsinu a Pólyova věta 3.1 Zákony arcsinu pro symetrickou náhodnou procházku V této podkapitole uvedeme dva zákony arcsinu, pro časy pobytu napravo od počátku (tj. v kladných hodnotách) a pro poslední navštívení počátku. 3.1.1 1. zákon arcsinu Věta 3.1.1. (1. zákon arcsinu pro poslední návštěvu počátku) Uvažujme symetrickou náhodnou procházku, t.j. p = 1 2 , a nechť S0 = 0. Pravděpodobnost, že poslední návštěva počátku do času 2n nastane v čase 2k, je rovna P (S2k = 0) P (S2n−2k = 0) . Důkaz: Označme α2n(2k) pravděpodobnost, že poslední návštěva počátku do času 2n nastane v čase 2k. Máme α2n(2k) = P (S2k = 0) P (S2k+1S2k+2...S2n = 0 | S2k = 0) . Z časové homogenity plyne α2n(2k) = P (S2k = 0) P (S1S2...S2n−2k = 0 | S0 = 0) . Tvrzení tedy plyne z následujícího lemmatu. 41 Lemma 3.1.2. Pro symetrickou náhodnou procházku platí: P(S1...S2m = 0) = P(S2m = 0), kde P(S2m = 0) = 2m m 1 2 2m . Důkaz: Využijeme důsledek věty o volbách: Je-li S0 = 0, pak pro n ≥ 1 platí P (S1S2...Sn = 0) = 1 n E (| Sn |) . Dále ze symetrie plyne P(S1...S2m = 0) = 1 2m E(| S2m |) = 2 1 2m m k=1 2kP(S2m = 2k) = 2 m k=1 2k 2m P(S2m = 2k) = 2 m k=1 2k 2m 2m m + k 1 2 2m = 2 1 2 2m m k=1 2m − 1 m + k − 1 − 2m − 1 m + k . neboť platí 2m − 1 m + k − 1 − 2m − 1 m + k = 2k 2m 2m m + k . Opravdu, máme (2m − 1) ... (m − k + 1) (m + k − 1)! − (2m − 1) ... (m − k) (m + k)! = = (m + k) (2m − 1) ... (m − k + 1) − (2m − 1) ... (m − k + 1) (m − k) (m + k)! = (2m − 1) ... (m − k + 1) [(m + k) − (m − k)] (m + k)! = 2k 2m 2m (2m − 1) ... (m − k + 1) (m + k)! = = 2k 2m 2m m + k . V posledním členu výraz se sumou je tzv. teleskopický součet. Z takového součtu nám zůstane jen první a poslední člen, ostatní se vyruší. Odtud plyne, že 2 1 2 2m m k=1 2m − 1 m + k − 1 − 2m − 1 m + k = 2 1 2 2m 2m − 1 m − 2m − 1 2m 42 = 2 1 2 2m 2m − 1 m = 1 2 2m (2m − 1) ...m · 2 m! = 1 2 2m 2m (2m − 1) ... (m + 1) m! = 1 2 2m 2m m = P (S2m = 0) a odtud plyne tvrzení věty. V následující podkapitole uvidíme, proč se těmto tvrzením říká zákon arcsinu. 3.1.2 Stirlingova formule Chceme porovnat hodnotu n! (která se v různých formách vyskytuje v kombinačních číslech pro počty trajektorií) s mocninnými funkcemi. Víme, že nn n (n − 1) ...2 · 1 2n , tedy nn n! 2n . Jak rychle jde ale posloupnost an = n! nn k nule? Lze ji srovnat s geometrickou posloupností? Pro n → ∞ dostaneme an+1 an = (n+1)! (n+1)n+1 n! nn = n! (n+1)n n! nn = n n + 1 n = 1 e . Tedy (zatím jen hodně přibližně) můžeme psát n! nn ∼ 1 en , neboli n! ∼ nn en . Stirlingova formule dává přesnější odhad. Platí n! ≈ nn en √ 2πn v tom smyslu, že limn→∞ n! nn en √ 2πn = 1. Ze Stirlingovy formule dostaneme odhad na hodnotu u2k = P (S2k = 0) . Lemma 3.1.3. Platí u2k ≈ 1√ πk pro k → ∞, tedy lim k→∞ u2k 1√ πk = 1. 43 Důkaz: Máme u2k = P (S2k = 0) = 2k k 1 2 2k = (2k)! k! (2k − k)! 1 2 2k = (2k)! (k!)2 1 2 2k ≈ (2k)2k e2k √ 2π2k kk ek √ 2πk 2 1 2 2k = 22k k2k √ 2π2k kk √ 2πk 2 1 22k = √ 2 √ 2πk = 1 √ πk . Tím je lemma dokázáno. Podle zákonu arcsinu je α2n(2k) = u2ku2n−2k, tedy P (S2k = 0 ∧ S2k+1...S2n = 0) = P (S2k = 0) P (S2n−2k = 0) . Ze Stirlingova vzorce máme α2n(2k) ≈ 1 √ πk 1 π (n − k) = 1 π k (n − k) . Hodnota k (n − k) je maximální pro k = n 2 , tedy α2n(2k) je minimální pro k = n 2 . Označme T2n čas posledního navštívení bodu 0 do času 2n. Pak pro x ∈ (0, 1) máme P (T2n ≤ 2xn) . = k≤xn 1 π k (n − k) . = xn 0 1 π u (n − u) du = 2 π arcsin x n , neboť 44 2 arcsin x n = 2 1 1 − x n 1 2 1 x n 1 n = 1 1 − x n x n n = 1 (n−x)x n2 n = 1 (n − x) x . 3.1.3 2. zákon arcsinu 2. zákon arcsinu se týká časů pobytu na jedné straně od počátku (tj. doby, kdy jeden z hráčů byl ve vedení). Věta 3.1.4. Nechť p = 1 2 a S0 = 0. Pravděpodobnost, že náhodná procházka stráví přesně 2k časových intervalů napravo od počátku, je (opět) rovna P (S2k = 0) P (S2n−2k = 0) . Důkaz: učebnice Grimmett, Stirzaker. 3.2 Pólyova věta v Rn Definice 3.2.1. Mějme posloupnost náhodných vektorů X1, X2, ..., Xn, ..., kde Xi = X (1) i , X (2) i , ..., X (m) i je m-rozměrný vektor. Nechť platí P X (j) i = 1 = 1 2 a P X (j) i = −1 = 1 2 pro všechna i ∈ N a pro všechna j ∈ {1, 2, ..., m} a všechna X (j) i jsou navzájem nezávislé náhodné veličiny. m-rozměrná náhodná procházka je definována vztahem S(j) n = S (j) 0 + n k=1 X (j) k , 45 tedy vektorově Sn = S0 + n k=1 Xk. Pro m = 2 uvažujme množinu mřížových bodů Z2 = {(i, j) | i, j ∈ Z} = Z ⊕ Z. Nechť S0 = (0, 0), pak P [S1 = [1, 1]] = P [S1 = [−1, −1]] = = P [S1 = [−1, 1]] = P [S1 = [1, −1]] = 1 4 . Věta 3.2.2. (Pólyova věta): Pravděpodobnost, že se náhodná procházka vrátí nekonečněkrát zpět do počátku, je rovna 1 pro m = 1 a m = 2 a je rovna 0 pro m > 2. Poznamenejme, že pro m = 3 je pravděpodobnost alespoň jednoho návratu do počátku . = 0, 35. Důkaz: Jako u jednorozměrné procházky označme p0 (n) = P (Sn = 0) pravděpodobnost návratu v čase n a f0 (n) = P (Sn = 0 ∧ S1S2...Sn−1 = 0) pravděpodobnost prvního návratu v čase n. Nechť P0 a F0 jsou generující funkce těchto posloupností. Víme, že platí F0 = 1 − 1 P0 . Máme P (částice se někdy vrátí do počátku) = ∞ n=1 f0 (n) = F0 (1) = 1 − 1 P0 (1) , 46 kde ale P0 (1) = ∞ n=1 p0 (n) + 1. Odtud dostáváme, že P (částice se někdy vrátí do počátku) =    1 pokud ∞ n=1 p0 (n) diverguje < 1 pokud ∞ n=1 p0 (n) konverguje Podle Stirlingovy formule víme, že u2k ≈ 1√ πk . Pro m = 1 je z nezávislosti komponent p0 (n) = P (Sn = 0) ≈ 1 πn 2 = 2 π 1 √ n . Víme, že ∞ n=1 1 √ n diverguje, protože ∞ n=1 1 ns konverguje pro s > 1 (z integrálního kriteria). Pro m > 1 je P (Sn = 0) = P S(1) n = S(2) n = ... = S(m) n = 0 = P S(1) n = 0 m , tedy p0 (n) = P (Sn = 0) ≈ 2 π 1 √ n m = 2 π m 2 1 n m 2 . Dále ∞ n=1 p0 (n) ≈ ∞ n=1 1 n m 2 konverguje pro m 2 > 1, tj. m > 2. Tedy pro m > 2 je hledaná pravděpodobnost alespoň jednoho návratu do počátku menší než 1, pro m = 1 a m = 2 je tato pravděpodobnost 1. Pravděpodobnost nekonečně monoha návratů je tedy rovna 0 pro m > 2 a rovna 1 pro m ≤ 2. 47 3.3 Příklady Příklad 3.3.1. Uvažujme symetrickou jednoduchou náhodnou procházku. Nechť T je čas prvního návratu do počátku. Dokažte, že P(T = 2n) = 1 2n − 1 2n n 2−2n . Příklad 3.3.2. Ukažte, že pro jednoduchou náhodnou procházku pravděpodobnostní funkce maxima splňuje P(Mn = r) = P(Sn = r) + P(Sn = r + 1) pro r ≥ 0. 48 Kapitola 4 Markovské řetězce 4.1 Diskrétní Markovské řetězce Uvažujme posloupnost náhodných veličin X0, X1, . . . , Xn, . . . , (4.1) které nabývají hodnoty ve spočetném nebo konečném stavovém prostoru S. Pro každé n je tedy Xn náhodná veličina, nabývající N různých hodnot, kde N je velikost množiny S (N může být rovno nekonečnu). Definice 4.1.1. Stochastický proces X = {Xn}∞ n=0 se nazývá Markovský řetězec, pokud splňuje Markovovu podmínku P(Xn = s | X0 = x0, . . . , Xn−1 = xn−1) = P(Xn = s | Xn−1 = xn−1) (4.2) pro každé n ∈ N a s, x0, . . . xn−1 ∈ S. Množina S je nejvýše spočetná, tedy bez újmy na obecnosti můžemem předpokládat, že S ⊆ N. Pak Xn = i znamená, že proces je v i-tém stavu v čase n. Vývoj systému je popsán pravděpodobnostmi přechodu P(Xn+1 = j | Xn = i) (4.3) které obecně závisí na n, i, j. Pokud pravděpodobnosti nezávisí na n, je proces homogenní. Definice 4.1.2. Markovský řetezec je homogenní, jestliže platí P(Xn+1 = j | Xn = i) = P(X1 = j | X0 = i) (4.4) 49 pro každé n, i, j. Přechodová matice P = (pij) je |S| × |S| matice přechodových pravděpodobností pij = P(Xn+1 = j | Xn = i). (4.5) Dále budeme předpokládat, že X = {Xn}∞ n=0 je homogenní Markovský řetězec s přechodovou maticí P = (pij). Věta 4.1.3. Přechodová matice P je stochastická matice, tedy platí 1. P má nezáporné členy, 2. součty prvků v každém řádku jsou rovny jedné, tedy j pij = 1, (4.6) pro každé i. První tvrzení je zřejmé, druhé plyne z faktu že řeťezec musí ze stavu i přejít do nějakého stavu (případně i stejného). Naopak, každá matice s vlastnostmi z předchozí věty může být přechodovou maticí nějakého procesu, věta tedy dává úplnou charakterizaci takových matic. Krátkodobý vývoj procesu je určen maticí P. Abychom mohli zkoumat dlouhodobý vývoj, budeme uvažovat matici přechodu za časový interval délky n. Definice 4.1.4. n kroková přechodová matice je matice P(m, n + m) = (pij(m, m + n)) , (4.7) kde pij(m, m + n) = P(Xn+m = j | Xm = i). (4.8) Z homogenity zřejmě máme P(m, m + 1) = P. (4.9) Věta 4.1.5. Platí 50 P(m, n + m) = Pn . (4.10) Nechť µn i = P(Xn = i) (4.11) je pravděpodobnostní funkce pro Xn a µn je řádkový vektor se složkami µn i , i ∈ S. (4.12) Pak platí µn = µ0 Pn . (4.13) Vývoj procesu tedy záleží na počátečním rozdělení a na iteracích matice P. Příklad 4.1.6. Uvažujme jednoduchou náhodnou procházku. Stavový prostor je v tomto případě S = Z a platí pij =    p pro j = i + 1 q pro j = i − 1 0 jinak . (4.14) 4.2 Klasifikace stavů Definice 4.2.1. Stav i se nazývá rekurentní (trvalý), pokud P(Xn = i pro nějaké n | X0 = i) = 1 (4.15) Pokud P(Xn = i pro nějaké n | X0 = i) < 1, (4.16) pak se stav nazývá tranzientní (přechodný). Definice 4.2.2. Střední čas rekurence stavu je dán vztahem µi = E(Ti | X0 = i), (4.17) kde Tj = min(n ≥ 1 : Xn = j). (4.18) 51 Stav i je nulový, pokud µi = ∞ (4.19) a je nenulový, pokud µi < ∞. (4.20) Definice 4.2.3. Perioda d(i) stavu i je definovaná jako gcd(n : pii(n) > 0). (4.21) Stav se nazývá periodický, pokud d(i) > 1. Nazývá se aperiodický, pokud d(i) = 1. Platí tedy pii(n) = 0, (4.22) pokud n nedělí d(i). Definice 4.2.4. Stav se nazývá ergodický, pokud je rekurentní, nenulový a aperiodický. Příklad 4.2.5. Pro náhodnou procházku jsou všechny stavy periodické s periodou 2. V případě p = 1 2 jsou tranzientní. Pro p = 1 2 jsou nulové rekurentní. 52 4.3 Příklady Příklad 4.3.1. Házíme opakovaně kostkou. Které z následujících procesů jsou Markovské řetězce? 1. Největší číslo Mn, které padlo do n-tého hodu. 2. Počet šestek které padly v n hodech. 3. V čase r čas Cr od posledni šestky. 4. V čase r čas Br do příští šestky. Příklad 4.3.2. Ukažte, že libovolná posloupnost nezávislých náhodných veličin s hodnotami ve spočetné množině je Markovský řetězec. Kdy bude takový řetězec homogenní? 53 Kapitola 5 Markovské řetězce ve spojitém čase 5.1 Základní vlastnosti Uvažujme stochastický proces X(t), t ≥ 0, ve spojitém čase, který nabývá hodnoty v nezáporných celých číslech. Definice 5.1.1. Proces X(t), t ≥ 0 je Markovský řetězec ve spojitém čase, jestliže pro všechna s, t ≥ 0 a nezáporná celá čísla i, j, x(u) platí Markovská vlastnost P(X(t + s) = j|X(s) = i, X(u) = x(u), 0 ≤ u < s) = P(X(t + s) = j|X(s) = i). Markovská vlastnost tedy říká, analogicky jako v diskrétním případě, že pravděpodobnostní rozdělení budoucích stavů, podmíněné současným a všemi minulými stavy, závisí jen na současném stavu a je nezávislé na minulosti. Definice 5.1.2. Pokud navíc pravděpodobnost P(X(t + s) = j|X(s) = i) nezávisí na t, pak se Markovský řetězec ve spojitém čase nazývá stacionární. Označme jako τi čas který stráví proces ve stavu než se přesune do dalšího stavu. Pak z markovské vlastnosti plyne P(τi > s + t|τi > s) = P(τi > t), 54 tedy tato náhodná veličina nemá pamět a musí mít exponenciální rozdělení. Tímto způsobem můžeme popsat Markovský řetězec ve spojitém čase. Je to proces, který kdykoliv vstoupí do stavu i, pak – čas který stráví v tomto stavu má exponenciální rozdělení, s intenzitou, kterou označíme vi – pokud proces opustí stav i, pak vstoupí do jiného stavu j s pravděpodobností Pij, kde i=j Pij = 1. V principu je možná situace, kdy stav má nekonečnou hodnotu vi. Takový stav se nazývá okamžitý, a proces jej okamžitě opustí. V dalším ale takové stavy uvažovat nebudeme. Markovský řetězec ve spojitém čase se nazývá regulární, pokud s pravděpodobností jedna je počet přechodů v libovolném konečném intervalu ko- nečný. Definujme qij = viPij. Víme, že vi je intenzita s jakou proces opouští stav i a Pij je pravděpodobnost že pak přejde do stavu j. Celkem tedy qij je intenzita s jakou proces přechází ze stavu i do stavu j. Dále označíme Pij(t) = P(X(t + s) = j|X(s) = i) pravděpodobnost, že řetězec, který je momentálně ve stavu i, se za čas t bude nacházet ve stavu j. 5.2 Procesy zrodu a zániku Definice 5.2.1. Markovský řetězec ve spojitém čase, pro který platí qij = 0 jakmile |i − j| > 1, se nazývá proces zrodu a zániku. 55 Jinak řečeno, proces zrodu a zániku může ze stavu i přejít pouze do stavu i + 1 nebo i − 1. Pokud hodnota procesu reprezentuje velikost populace, pak přechod do stavu i+1 chápeme jako zrození nového jedince, přechod do stavu i − 1 pak znamená zánik jedince. Označme příslušné přechodové pravděpodobnosti jako λi = qi,i+1, µi = qi,i−1. Máme zřejmě vi = λi + µi, a j qij = vi. Platí tedy Pi,i+1 = λi λi + µi = 1 − Pi,i−1. Jako příklad uvažujme proces patřící mezi takzvané fronty. Konkrétně půjde o frontu typu M/M/s. V tomto případě máme µn = nµ pro 1 ≤ n ≤ s sµ pro n > s . Možná interpretace tohoto procesu je následující. Předpokládejme, že zákazníci přijíždí k benzinové pumpě s s stojany podle Poissonova procesu s intenzitou λ. Každý zákazník jede ihned ke stojanu, pokud je některý volný. Pokud ne, postaví se do fronty. Když zákazník ukončí čerpání, opustí systém a první zákazník v řadě, pokud nějaký je, přijede ke stojanu. Předpokládejme, že časy obsluhy jsou exponenciální se střední hodnotou 1 µ . Pokud je X(t) počet zákazníku v systému, pak jde o proces zrodu a zániku s uvedenými parametry. 56 Lineární model růstu s migrací odpovídá procesu, pro který platí µn = nµ, λn = nλ + θ. Každý jednotlivec rodí s intenzitou λ. Migraci popisuje parametr θ, zánik probíhá s intenzitou µ. 5.3 Kolmogorovova rovnice Našim základním objektem jsou přechodové pravděpodobnosti Pij(t) = P(X(t + s) = j|X(s) = i). Lemma 5.3.1. Platí lim t→0 1 − Pii(t) t = vi a lim t→0 Pij(t) t = qij. Dále máme Pij(t + s) = ∞ k=0 Pik(t)Pkj(s). Odtud plyne Pij(t + h) = ∞ k=0 Pik(h)Pkj(t), neboli Pij(t + h) − Pij(t) = k=i Pik(h)Pkj(t) − (1 − Pii(h))Pij(t). Vydělením h a limitním přechodem pro h → 0 dostaneme s využitím předchozího lemmatu lim h→0 Pij(t + h) − Pij(t) h = lim h→0 k=i Pij(h) h Pkj(t) − viPij(t). 57 Tak dostáváme následující tvrzení. Věta 5.3.2. (Kolmogorovova zpětná rovnice) Pro všechna i, j, a t ≥ 0 platí Pij(t) = k=i qikPkj(t) − viPij(t). 58 Kapitola 6 Poissonův proces 6.1 Základní vlastnosti Poissonova procesu Definice 6.1.1. Poissonův proces s intenzitou λ je proces N = {N(t) : t ≥ 0} nabývající hodnoty v S = {0, 1, 2, . . . } takový, že 1. N(0) = 0 a pro s < t je N(s) ≤ N(t). 2. P(N(t + h) = n + m|N(t) = n) =    λh + o(h) pro m = 1 o(h) pro m > 1 1 − λh + o(h) pro m = 0 . 3. Je-li s < t, pak počet N(t)−N(s) událostí v intervalech [s, t] je nezávislý na N(s), tedy počtu událostí v [0, s]. N(t) . . . počet příchodů, událostí, emisí, do času t. N je takzvaný čítací proces. Je také příkladem Markovského řetězce ve spojitém čase. Zajímá nás rozložení N(t). Věta 6.1.2. N(t) má Poissonovo rozdělení s parametrem λt, tedy P(N(t) = j) = (λt)j j! e−λt , j = 0, 1, 2, . . . 59 Důkaz. Podmíníme N(t + h) hodnotou N(t): P(N(t + h) = j) = i P(N(t) = i) P(N(t + h) = j|N(t) = i) = i P(N(t) = i) P((j − i) příchodů v čase (t, t + h)) = P(N(t) = j − 1) P(1 příchod) + P(N(t) = j) P(žádný příchod) + o(h). Tedy pj(t) = P(N(t) = j) splňuje pj(t + h) = λhpj−1(t) + (1 − λh) pj(t) + o(h) pro j = 0 p0(t + h) = (1 − λh) p0(t) + o(h). V první rovnici odečteme pj(t), vydělíme h a necháme h → 0. Pak pj(t) = λpj−1(t) − λpj(t) pro j = 0 (6.1) a podobně z 2.rovnice p0(t) = −λp0(t). Okrajové podmínky jsou pj(0) = δj0 = 1 pro j = 0 0 pro j = 0. To je systém diferenčně-diferenciálních rovnic pro pj(t). Řešení najdeme pomocí generujících funkcí (v proměnné s a s parametrem t). Definujeme G(s, t) = ∞ 0 pj(t)sj = E(sN(t) ). Rovnici (6.1) vynásobíme sj a sečteme přes j. Dostaneme ∂G ∂t = λ(s − 1)G, s okrajovou podmínkou G(s, 0) = 1. Řešení je zřejmě G(s, t) = eλ(s−1)t = e−λt ∞ 0 (λt)j j! sj . 60 Uvedeme si ještě důležitou alternativní definici. Definice 6.1.3. Nechť T0, T1, . . . jsou dány vztahem T0 = 0, Tn = inf{t : N(t) = n}. Pak Tn se nazývá čas n-tého příchodu. Definice 6.1.4. Definujeme časy mezi příchody (inter-arrival times), jako náhodné veličiny Xn = Tn − Tn−1. Ze znalosti N(t) umíme najít hodnoty Xn. Naopak, z Xn lze zrekonstruovat N(t) pomocí Tn = n 1 Xi; N(t) = max{n; Tn ≤ t}. Věta 6.1.5. Náhodné veličiny X1, X2, . . . jsou nezávislé a mají exponenciální rozdělení s parametrem λ. Připomenutí: Náhodná veličina X má exponenciální rozdělení s parametrem λ > 0, jestliže její distribuční funkce je F(x) = 1 − e−λx x ≥ 0. (6.2) Uvažujme Bernoulliho pokusy v časech δ, 2δ, 3δ, . . . a nechť W je čas čekání na první úspěch. Pak P(W > kδ) = (1 − p)k a EW = δ p . Zvolme t pevně. Do času t jsme udělali přibližně k = t δ pokusů. Nechť δ → 0. Abychom dostali netriviální limitu, musí také p → 0. Nechť p δ → λ. Pak P(W > t) = P W > t δ δ ∼= (1 − λδ) t δ → e−λt . Důkaz. Nejdříve uvažujeme X1: P(X1 > t) = P(N(t) = 0) = e−λt . 61 Dále podmíníme X2 hodnotou X1, P(X2 > t|X1 = t1) = P(žádný příchod v [t1, t1 + t]|X1 = t1). Událost {X1 = t1} se vztahuje k intervalu [0, t1], zatímco událost "žádný příchod v [t1, t1 + t]"k času většímu než t1. Z definice Poissonova procesu jsou nezávislé, tedy P(X2 > t|X1 = t1) = P(žádný příchod v [t1, t1 + t]) = e−λt . Tedy X2 je nezávislá na X1 a má stejné rozdělení. Tvrzení dále plyne indukcí přes n. 6.2 Cramér - Lundbergův model Cramér - Lundbergův model je základním modelem v matematické teorii neživotního pojištění. Předpoklady Cramér - Lundbergova modelu: 1. Pojistné nároky nastávají v časech 0 ≤ T1 ≤ T2 ≤ . . . , což jsou časy příchodu homogenního Poissonova procesu N(t). 2. Pojistný nárok přicházející v i-tém čase Ti má velikost Xi. Posloupnost Xi tvoří nezávislé stejně rozdělené nezáporné náhodné veličiny. 3. Posloupnosti Ti a Xi jsou navzájem nezávislé. Tedy i N(t) a Xi jsou nezávislé. Proces S(t) = N(t) i=1 Xi, který popisuje celkový pojistný nárok do času t, se nazývá složený Poissonův proces. 62 6.3 Inspekční paradox Uvažujme homogenní Poissonův proces s intenzitou λ a předpokládejme, že se právě nacházíme v pevně daném čase t. Přirozená otázka je, jaké má rozdělení doba od posledního příchodu a naopak doba do nejbližšího následujícího příchodu. Označme B(t) = t − TN(t) čas od posledního příchodu a F(t) = TN(t)+1 − t čas do následujícího příchodu. Zajímá nás sdružené rozdělení náhodných veličin B(t) a F(t). Speciálně, co můžeme na základě znalosti B(t) řici o F(t)? Intuitivně by se mohlo zdát, že čím delší je B(t), tím kratší by mělo být čekání na další příchod. Přesto výpočet sdruženého rozdělení ukazuje, že B(t) a F(t) jsou nezávislé. Tento výsledek se obvykle nazývá inspekční paradox. 63 Kapitola 7 Složený Poissonův proces 7.1 Moment generující funkce Definice 7.1.1. Stochastický proces S(t) se nazývá složený Poissonův proces, jestliže jej lze zapsat ve tvaru S(t) = N(t) i=1 Xi, (7.1) kde N(t) je Poissonův proces a Xi jsou IID náhodné veličiny, nezávislé na procesu N(t). Definice 7.1.2. Moment generující funkce náhodné veličiny X je definována vztahem M (t) = E etX pro t ≥ 0. Je-li X spojitá náhodná veličina s hustotou f, pak M (t) = ∞ −∞ etx f (x) dx. Pro každé k ∈ N je E Xk = M(k) (0) . Opravdu, derivujme integrál podle parametru, M (t) = ∞ −∞ xetx f (x) dx, 64 tedy M (0) = ∞ −∞ xf (x) dx = E (X) . Analogicky, k-násobným derivováním dostaneme M(k) (t) = ∞ −∞ xk etx f (x) dx. Tedy M(k) (0) = E Xk . Chceme spočítat moment generující funkci složeného Poissonova procesu. Z věty o celkovém očekávání dostaneme E etX = exp(λt(ψX(t) − 1)). (7.2) Derivováním moment generující funkce získáme pro momenty následující vztahy. Věta 7.1.3. Pro očekávání složeného Poissonova procesu platí E(S(t)) = λtE(X1) (7.3) a pro jeho rozptyl V ar(S(t)) = λtE(X2 1 ). (7.4) 7.2 Vlastnosti exponenciálního rozdělení Definice 7.2.1. Spojitá náhodná veličina má exponenciální rozdělení, jestliže její hustota je dána vztahem f(x) = λe−λx . (7.5) pro x ≥ 0 a je rovna nule jinak. Distribuční funkce exponenciálního rozdělení je tedy 65 F(x) = 1 − e−λx (7.6) pro x ≥ 0, a rovna nule jinak. Moment generující funkce exponenciálního rozdělení je dána vztahem E[etX ] = ∞ 0 eλt λe−λx dx = λ λ − t . (7.7) Momenty náhodné veličiny X můžeme získat derivováním moment generující funkce. Tím dostaneme E[X] = 1 λ (7.8) a V ar[X] = 1 λ2 . (7.9) Jednou z hlavních vlastností exponenciálního rozdělení je to, že nemá pamět. Platí totiž P{X > s + t|X > t} = P{X > s}. (7.10) Je-li například X životnost dané součástky, pak předchozí vztah říká, že pravděpodobnost, že součástka bude fungovat alespoň s + t hodin, za podmínky že již funguje t hodin, je stejná jako počáteční pravděpodobnost že bude fungovat alespoň s hodin. 7.3 Vlastnost absence paměti Exponenciální rozdělení je jediné rozdělení které nemá pamět. Dokážeme to následovně. Nechť ˜F = P{X > x}. (7.11) Pak platí ˜F(s + t) = ˜F(s) ˜F(t). (7.12) Jinak řečeno, ˜F splňuje funkcionální rovnici h(s + t) = h(s)h(t). (7.13) 66 Dokážeme teď, že jediná zprava spojitá řešení této rovnice mají tvar odpovídající exponenciálnímu rozdělení. Ze vztahu h(s + t) = h(s)h(t) (7.14) máme h( 2 n ) = h( 1 n + 1 n ) = h2 ( 1 n ). (7.15) Opakováním stejného argumentu dostaneme h( m n ) = hm ( 1 n ). (7.16) Dále platí h(1) = h( 1 n + · · · + 1 n ) = hn ( 1 n ). (7.17) Odtud h( m n ) = h(1) m n (7.18) a dále h(x) = h(1)x , (7.19) protože h je pospojitá zprava. Platí h(1) = h2 ( 1 2 ) ≥ 0, (7.20) a tedy h(x) = e−λx , (7.21) kde λ = − ln g(1). Musí tedy platit ˜F(x) = eλx , (7.22) protože distribuční funkce je zprava polospojitá. 67 7.4 Míra rizika Mějme spojitou náhodnou veličinu X s distribuční funkcí F a hustotou f. Definice 7.4.1. Funkce míry rizika je definována jako λ(t) = f(t) ˜F(t) . (7.23) Představme si, že sledujeme životnost nějaké součástky, a předpokládejme, že součástka již funguje t hodin. Chceme spočítat pravděpodobnost, že nevydrží další časový úsek dt, tedy P{X ∈ (t, t + dt)|X > t}. (7.24) Máme P{X ∈ (t, t + dt)|X > t} = X ∈ (t, t + dt), X > t P(X > t) , (7.25) což je rovno X ∈ (t, t + dt) P(X > t) f(t)dt ˜F(t) (7.26) = λ(t)dt. (7.27) Tedy λ(t) reprezentuje intenzitu pravděpodobnosti, že t-letá součástka přestane fungovat. Je-li rozdělení exponenciální, pak z vlastnosti absence paměti je rozdělení stejné jako počáteční, tedy λ je konstantní. To můžeme ověřit i přímým výpočtem, λ(t) = λe−λt e−λt = λ. (7.28) Míra rizika pro exponenciální rozdělení je tedy konstantní. Ukážeme ješte, že míra rizika naopak jednoznačně určuje pravděpodobnostní rozdělení. Opravdu, máme λ(t) = − d dt ˜F(t) ˜F(t) . (7.29) 68 Integrováním dostaneme ln ˜F(t) = − t 0 λ(s)ds + k, (7.30) tedy ˜F(t) = ce t 0 λ(s)ds . (7.31) Pro t = 0 dostaneme c = 1. Celkem tedy ˜F(t) = e t 0 λ(s)ds . (7.32) 69 7.5 Příklady Příklad 7.5.1. Mouchy a vosy přilétají na talíř jako nezávislé Poissonovy procesy s intenzitou λ a µ. Ukažte, že přílet hmyzu na talíř je dán Poissonovým procesem s intenzitou λ + µ. Příklad 7.5.2. Hmyz přilétá na talíř jako Poissonův proces s intenzitou λ a má zelenou barvu s pravděpodobností p, nezávisle na barvě ostatního hmyzu. Ukažte, že přílety zeleného hmyzu se řídí Poissonovým procesem s intenzitou pλ. 70 Kapitola 8 Procesy obnovy 8.1 Rozdělení počtu příchodů Jak jsme viděli v předchozí kapitole, časy mezi příchody pro Poissonův proces tvoří nezávislé stejně rozdělené náhodné veličiny s exponenciálním rozdělením. Přirozené zobecnění Poissonova procesu dostaneme tak, že budeme uvažovat namísto exponenciálního libovolné rozdělení. Definice 8.1.1. Nechť X1, X2, . . . je posloupnost nezáporných nezávislých náhodných veličin se stejnou distribuční funkcí F. Hodnoty X1, X2, . . . reprezentují časy mezi jednotlivými událostmi. Označme µ = E[Xj] střední hodnotu času mezi jednotlivými událostmi. Položme S0 = 0 a Sn = n i=1 Xi. Tedy Sn je čas n-té události. Zajímá nás počet událostí, které nastaly do času t. Ten se rovná největší hodnotě n takové, že n-tá událost nastala před nebo přesně v čase t, tedy N(t) = sup{n|Sn ≤ t}. 71 Protože časy mezi příchody jsou nezávislé a stejně rozdělené, při každém příchodu začíná z pravděpodobnostního hlediska proces znovu. Základní vztah pro odvození pravděpodobnosti rozdělení počtu příchodů vychází z následujícího faktu: Počet událostí které nastaly do času t je větší nebo roven n právě tehdy, když n-tý příchod nastal do času t. Tedy N(t) ≥ n ≡ Sn ≤ t. Odtud dostaneme P(N(t) = n) = P(N(t) ≥ n) − P(N(t) ≥ n + 1) = P(Sn ≤ t) − P(Sn+1 ≤ t). Protože náhodné veličiny Xn jsou nezávislé a stejně rozdělené s distribuční funkcí F, má Sn rozdělení dané n-násobnou konvolucí F samo se sebou, Fn = F ∗ F ∗ · · · ∗ F. Dostaneme tedy P(N(t) = n) = Fn(t) − Fn+1(t). Nechť m(t) = E[N(t)]. Pak m(t) se nazývá funkce obnovy. Zajímají nás její vlastnosti. Věta 8.1.2. Platí m(t) = ∞ n=1 Fn(t). Důkaz: Máme N(t) = ∞ n=1 In, kde In = 1 pokud n-tá událost nastala do času t 0 jinak . 72 Tedy E(N(t)) = E[ ∞ n=1 In] a z linearity E[ ∞ n=1 In] = ∞ n=1 E[In]. Dále z vlastnosti indikátorové funkce máme ∞ n=1 E[In] = ∞ n=1 P(In = 1). To je rovno ∞ n=1 P(Sn ≤ t) = ∞ n=1 Fn(t), což jsme chtěli dokázat. 73 Kapitola 9 Diskrétní modely ve finanční matematice V této kapitole se budeme věnovat 1-krokovým a vícekrokovým diskrétním modelům finančního trhu. Jak uvidíme, vícekrokový (binomický) model je založen na jednoduché náhodné procházce. 9.1 1-krokový model Uvažujeme jednu pevně zvolenou akcii a předpokládejme, že – v čase t = 0 je cena akcie S0 známá hodnota, – v čase t = 1 je cena akcie S1 náhodná veličina (neznámá hodnota). Hodnota S1(ω) je funkcí tržního scénáře ω ∈ Ω, kde Ω = {ω1, ..., ωk} je prostor tržních scénářů. Dále předpokládejme, že existuje bezrizikové aktivum, jehož hodnota v čase t = 0 je rovna 1 a v čase t = 1 je rovna er za všech tržních scénářů. Hodnota r se nazývá bezriziková úroková míra. Předpokládáme, že úroková míra je stejná jak pro půjčování, tak pro ukládání peněz. Příklad 9.1.1. Forwardová smlouva (uzavřená v čase t = 0) je následující závazný kontrakt: V čase t = 1 koupí X od Y jednu akcii za cenu F. Za uzavření smlouvy se neplatí. Jaká je “správná” cena F? 74 Věta 9.1.2. Jestliže neexistuje arbitráž, pak jediná možná cena ve forwardové smlouvě je F = S0er . Arbitráží je míněna možnost, jak si bez rizika zajistit zisk “z ničeho”. Přesnou definici si uvedeme za chvilku. Důkaz: Dokážeme, že jak F > S0er , tak F < S0er vede k arbitráži. 1) Nechť F > S0er (výhodné pro Y ). Uvažujme následující strategii: t = 0 ... Y si vypůjčí v bance S0, koupí akcii a uzavře forwardovou smlouvu na prodej akcie. t = 1 ... Y prodá akcii za F, do banky vrátí S0er . Zůstane mu bezrizikový zisk F − S0er > 0, strategie tedy dává arbitráž. 2) Nechť F < S0er (výhodné pro X). Uvažujme teď tuto strategii: t = 0 ... X prodá akcii na krátko (tedy vypůjčí si akcii – tzv. short-selling) za S0, uloží výnos do banky a uzavře forwardovou smlouvu na koupi akcie. t = 1 ... X dostane z banky S0er , koupí akcii za F a vrátí ji (tj. uzavře krátkou pozici). Zůstane mu S0er − F > 0, tj. bezrizikový zisk. Opět je to arbitráž. Tedy pokud neexistuje arbitráž, pak F = S0er . Příklad 9.1.3. Evropská call opce dává držiteli právo koupit akcii v čase t = 1 za cenu K (tzv. realizační cena opce). Kupec opce zaplatí v čase t = 0 za toto právo prodejci cenu V0. Jaká je férová cena V0? V čase t = 0 neznáme S1. Držitel opce ji v čase t = 1 uplatní, je-li K < S1 (jinak koupí akcii levněji na trhu). Tedy hodnota v čase t = 1 je V1 = (S1 − K)+ = S1 − K pokud S1 > K 0 pokud S1 ≤ K . 75 Výplatní funkce Evropské call opce K S1 V1 Jaká je hodnota V0? Předpokládejme, že existují dva možné tržní scénáře (ω1, ω2) a nechť pro t = 1 máme S1(ω1) = d1 a S1(ω2) = d2. S0 S1 = d2 … ω2 S1 = d1 … ω1 Chceme určit V0 za předpokladů 76 1. d1 < K < d2 2. d1 ≤ S0er ≤ d2 (pro S0er < d1 ≤ d2 dostaneme arbitráž a stejně tak v opačném případě). Uvažujme portfolio (x1, x2, x3) ∈ R3 , kde x1 je počet aktiv peněžního trhu (bezrizikových), x2 je počet akcií a x3 počet opcí. Hodnota portfolia v čase t = 1 za scénáře ω1 je y1 = x1er + x2d1 + 0x3 Hodnota portfolia v čase t = 1 za scénáře ω2 je y2 = x1er + x2d2 + (d2 − K)x3 Zobrazení T : (x1, x2, x3) → (y1, y2) je lineární zobrazení z R3 → R2 , které má nenulové jádro dimenze 1. Tedy pro portfolio (0, 0, 1) existuje jednoznačné portfolio (x1, x2, 0), které má stejnou hodnotu jako (0, 0, 1) v obou scénářích (tzv. replikující portfolio). Hodnoty x1 a x2 najdeme řešením rovnic x1er + x2d1 = 0 pro V1 (ω1) a x1er + x2d2 = d2 − K pro V1 (ω2). Řešením dostaneme x1 = −d1e−r (d2 − K) d2 − d1 a x2 = d2 − K d2 − d1 . Portfolio (x1, x2, 0) má stejnou hodnotu jako (0, 0, 1) v každém scénáři. Musí mít tedy stejnou hodnotu i v čase t = 0 (jinak by existovala arbitráž). 77 Tedy V0 = −e−r d1(d2 − K) d2 − d1 1 + d2 − K d2 − d1 S0 = (d2 − K) er S0 − d1 d2 − d1 e−r + 0 = e−r (V1 (ω2) p + V1 (ω1) (1 − p)), kde V1 (ω1) = 0, e−r je diskontní faktor a p = er S0 − d1 d2 − d1 se nazývá “tržní” (risk-neutrální, rovnovážná) pravděpodobnost scénáře ω2. Tedy V0 je diskontované očekávání hodnoty opce v čase t = 1 vzhledem k tržní pravděpodobnostní míře. 9.2 Základní věta APT APT označuje arbitrážní teorii oceňování (Arbitrage Pricing Theory). Uvažujme trh s K aktivy A1 , ..., AK volně obchodovatelnými, kde A1 je bezrizikové aktivum. Cena podílu aktiva Aj v čase t = 0 je Sj 0 (známá hodnota). Dále máme tržní scénáře Ω = {ω1, ..., ωN }. Předpokládejme, že A1 je bezrizikové, tj. S1 1(ωj) = er pro všechna j = 1, ..., N, kde r je úroková míra. Sj 1 (ωi) bude označovat hodnotu aktiva Aj v čase t = 1 za scénáře ωi. Jsou to tedy náhodné veličiny, neboli funkce na prostoru tržních scénářů Ω. Celkem dostáváme matici N × K s prvky Sj 1 (ωi). Definice 9.2.1. Portfolio je vektor Θ = (θ1, θ2, ..., θK) ∈ RK , 78 kde θj je počet podílů aktiva Aj v portfoliu. Pro θj < 0 je majitel v krátké pozici v aktivu Aj (o velikosti | θj |). V čase t = 0 je hodnota Θ rovna V0 (Θ) = K j=1 θjSj 0. Pro t = 1 závisí hodnota Θ na ωi, V1 (Θ, ωi) = K j=1 θjSj 1 (ωi) . Definice 9.2.2. Arbitráž je portfolio, které “získává peníze z ničeho”, tj. formálně buď V0 (Θ) ≤ 0 a V1 (Θ, ωj) > 0 pro všechna ωj ∈ Ω, nebo V0 (Θ) < 0 a V1 (Θ, ωj) ≥ 0 pro všechna ωj ∈ Ω. Definice 9.2.3. Pravděpodobnostní míra πi = π(ωi) na množině Ω všech scénářů je rovnovážná pravděpodobnostní míra (neboli risk-neutrální míra), jestliže pro všechna Aj je hodnota podílu v čase t = 0 rovna diskontovanému očekávání vzhledem k pravděpodobnostní míře π hodnoty podílu v čase t = 1. Tedy Sj 0 = e−r N i=1 π(ωi)Sj 1(ωi) pro všechna j = 1, ..., K, kde e−r je diskontní faktor. Věta 9.2.4. (Základní věta APT): Rovnovážná pravěpodobnostní míra existuje právě tehdy, když neexistuje arbitráž. Důkaz: Implikace ⇒ je snadná. Jestliže existuje rovnovážná pravděpodobnostní míra π a Θ je portfolio, jehož hodnota v čase t = 1 je ≥ 0 za všech scénářů, pak V0(Θ) = e−r N i=1 π(ωi)V1(Θ, ωi) ≥ 0, 79 odkud plyne že Θ není arbitráž (a arbitráž tedy neexistuje). Nyní chceme dokázat opačnou implikaci: Neexistuje-li arbitráž, pak existuje rovnovážná pravděpodobnostní míra taková, že Sj 0 = e−r N i=1 π(ωi)Sj 1(ωi). Pro j = 1 platí tento vztah automaticky, 1 = S1 0 = e−r N i=1 π(ωi)er = e−r N i=1 π(ωi)S1 1(ωi). Uvažujme nyní 2 ≤ j ≤ K. Označme ε množinu všech vektorů tvaru y = (y2, ..., yK), kde yj = e−r N i=1 π(ωi)Sj 1(ωi) pro všechna j = 2, 3, ..., K, pro nějakou pravděpodobnostní míru π. ε ⊆ RK−1 je uzavřený konvexní polyedr. Je konvexním obalem svých extrémních bodů, které odpovídají pravděpodobnostem π (ωi) = 1, π (ωj) = 0 pro j = 0. Chceme dokázat, že neexistuje-li arbitráž, pak S = S2 0, ..., SK 0 ∈ ε. Jinak řečeno, pokud S /∈ ε, pak existuje arbitráž. Využijeme větu o oddělující nadrovině. Věta 9.2.5. (Věta o oddělující nadrovině:) Nechť F ⊆ Rn je uzavřená konvexní množina a x /∈ F. Pak existuje v ∈ Rn tak, že v · x < v · y pro všechna y ∈ F, kde · je skalární součin. Důkaz: Nechť a je nejbližší bod v F k bodu x, pak vektor a−x má hledané vlastnosti. 80 Podle této věty máme S /∈ ε ⇒ ∃Θ = (θ2, ..., θK) = 0 tak, že pro všechna y ∈ ε platí: y · Θ > S · Θ . ε obsahuje extrémní body, tedy pro všechna i platí: e−r K j=2 θj · Sj 1(ωi) > K j=2 θj · Sj 0. Levou stranu nerovnosti označme Ci, pravou stranu D. Ukážeme, že existuje arbitráž. Zvolme θ1 tak, aby Ci > θ1 > D pro všechna i. Pak portfolio (−θ1, θ2, ..., θK) je arbitráž. Jeho hodnota v čase t = 0 je < 0 a hodnota v čase t = 1 je > 0 pro všechna ωi. Uvažujeme evropskou call opci, jejíž výplatní funkce je V1 = (S1 − K)+. Dále S1(ωi) = di pro i = 1, 2 a d1 < d2. Pokud neexistuje arbitráž, pak existuje π taková, že cena akcie v t = 0 je diskontované očekávání S0 = e−r · (π(ω1) · d1 + π(ω2) · d2) , a navíc víme, že π(ω1) + π(ω2) = 1. Speciálně tedy platí d1 < S0er < d2 (v předchozím to byl předpoklad, teď to platí automaticky). Dostaneme π(ω1) = d2 − S0er d2 − d1 a π(ω2) = S0er − d1 d2 − d1 . Je-li opce volně obchodovatelná a má-li zůstat trh bez arbitráže, musí totéž platit i pro opci, tedy: V0 = π(ω2)(d2 − K) + π(ω1)0 = π(ω2)(d2 − K) = S0er − d1 d2 − d1 (d2 − K). 81 9.2.1 Jištění (Hedging) Uvažujme aktiva A1 , A2 , ..., AK , B. Nechť Sj t (ωi) a SB t (ωi) jsou ceny Aj , resp. B, v čase t a scénáři ωi, kde t = 0, 1. Definice 9.2.6. Portfolio Θ = (θ1, θ2, ..., θK) je replikující portfolio pro B, jestliže SB 1 (ωi) = K j=1 θjSj 1(ωi) pro všechna i = 1, ..., N. Věta 9.2.7. Nechť Θ = (θ1, θ2, ..., θK) je replikující portfolio pro B. Neexistujeli arbitráž, pak v čase t = 0 platí: SB 0 = K j=1 θjSj 0. Důkaz: Nechť tvrzení neplatí. Je-li SB 0 > K j=1 θjSj 0, pak portfolio (−1, θ1, θ2, ..., θK) v aktivech B, A1 , A2 , ..., AK je arbitráž, protože K j=1 θjSj 0 − SB 0 < 0 a SB 1 (ωi) − K j=1 θjSj 1(ωi) = 0 pro všechna ωi ∈ Ω. Analogicky, pro SB 0 < K j=1 θjSj 0 vezmeme opačné portfolio. 82 9.3 Model s více periodami 9.3.1 Trh se dvěma periodami Uvažujme jedno bezrizikové aktivum a jednu rizikovou akcii. Tržní scénáře jsou nyní Ω = {(++) , (+−) , (−+) , (−−)} . t = 0 t = 1 t = 2 + + - - + + + - Předpokládejme, že 83 S1(+) = uS0 S1(−) = dS0 S2(++) = uS1(+) = u2 S0 S2(+−) = dS1(+) = udS0 S2(−+) = uS1(−) = duS0 S2(−−) = dS1(−) = d2 S0 (u jako up a d jako down). Máme tři částečné trhy. V každém uděláme stejný výpočet jako v jednokrokovém modelu. Dostaneme rovnovážné pravděpodobnosti (pro jednoduchost předpokládejme, že r = 0), pu = 1 − d u − d (S0 se vykrátí) a pd = u − 1 u − d . Celkem rovnovážná pravděpodobnostní míra bude: P(++) = p2 u, P(−−) = p2 d, P(+−) = P(−+) = pupd. 9.3.2 Vícekrokový model s T kroky Množina všech možných scénářů je v tomto případě Ω = {(+, +, +, ..., +) , (+, +, ..., +, −) , ..., (−, −, ..., −)} . Má 2T prvků, je tedy 2T možných scénářů. Pro scénář ω ∈ Ω je jeho rovnovážná pravděpodobnost P(ω) = pK u pT−K d , kde K je počet + ve scénáři ω. 84 Chceme-li ocenit opci, její cena bude diskontované očekávání její hodnoty v čase T VT = (ST − K)+ vůči rovnovážné pravděpodobnostní míře. Pro jednoduchost uvažujme r = 0. Nechť m je nejmenší přirozené číslo takové, že S0um dT−m ≥ K. Máme tedy V0 = T n=m pn upT−n d T n S0un dT−n − K = T n=m (1 − d)n (u − 1)T−n (u − d)T T n S0un dT−n − K , kde T n je počet trajektorií s celkem n plusy. Poznámka. Položíme-li d = 1 u , pak v limitě pro T → ∞ a u = e σ√ T dostaneme Black-Scholesův spojitý model pro oceňování opcí. σ je parametr nazývaný volatilita. Model, který jsme uvažovali v této podkapitole, se také často nazývá binomický. Jeho autory jsou Cox, Ross a Rubinstein. 85 9.4 Příklady Příklad 9.4.1. Najděte cenu evropské call opce při daných hodnotách S0 = 100, r = 0, S1(ω1) = 110, S1(ω2) = 95, K = 105 Příklad 9.4.2. Najděte cenu evropské put opce při daných hodnotách S0 = 40, r = 0, S1(ω1) = 50, S1(ω2) = 35, K = 45 Příklad 9.4.3. Najděte horní a dolní odhad pro cenu evropské call opce v neúplném trhu se třemi scénáři, při daných hodnotách S0 = 10, r = 0, S1(ω1) = 12, S1(ω2) = 11, S1(ω3) = 9, K = 10 86 Kapitola 10 Martingaly 10.1 Férová hra Martingal je matematickým vyjádřením myšlenky “férové hry”. Implicitně jsme se s tímto pojmem již setkali, v kapitole o diskrétních modelech trhu. Připomeňme, že v jednokrokovém modelu trhu se dvěma scénáři existuje rovnovážná pravděpodobnostní míra P a platí S0 = e−r EP (S1) = EP e−r S1 . Tedy cena v čase t = 0 je diskontované očekávání vzhledem k pravděpodobnosti P ceny v čase t = 1. Obecně, pro T-krokový model máme analogicky S0 = EP ST e−rT . Navíc, pro libovolný čas t ≤ T platí St = EP ST e−r(T−t) | S0, S1, ..., St , tedy St je podmíněné očekávání diskontované hodnoty ST , podmíněné informacemi o tržním scénáři, které máme v čase t. Jak uvidíme za chvilku, tato vlastnost znamená, že diskontovaný proces St je martingal. 87 Připomeňme si ještě formální definici stochastického procesu. Definice 10.1.1. Mějme měřitelný prostor (Ω, A), množinu reálných čísel R a indexovou množinu T = ∅ (která hraje roli času). Dále mějme zobrazení X : Ω × T → R, takové, že pro všechna t ∈ T je X (•, t) náhodná veličina (kterou značíme Xt). Pak takové zobrazení nazýváme stochastický proces definovaný na množině T. Značíme {Xt; t ∈ T}. Stochastické procesy dělíme na 4 základní typy: • diskrétní proces s diskrétním časem (např. náhodná procházka) • diskrétní proces se spojitým časem (např. Poissonův proces) • spojitý proces s diskrétním časem (např. Markovovy řetězce) • spojitý proces se spojitým časem (např. Wienerův proces) 10.2 Přirozená filtrace Definice 10.2.1. Ve vícekrokovém trhu se informace o tržním scénáři odhaduje krok po kroku. Pro t ≤ T definujeme Ft = {všechny jevy určené během prvních t period} . Zřejmě Ft je σ-algebra. Konečná posloupnost (Ft)0≤t≤T se nazývá přirozená filtrace prostoru tržních scénářů Ω. Obecně, systém σ-algeber (Ft)0≤t≤T se nazývá filtrace, jestliže platí Ft ⊆ Fs kdykoliv je t ≤ s. To znamená, že s rostoucím časem neztrácíme informace, σ-algebra se s rostoucím časem nezmenšuje, typicky se naopak zvětšuje. Příklad 10.2.2. 2-krokový model trhu. Množina tržních scénářů v tomto modelu je Ω = {(++) , (+−) , (−+) , (−−)} . 88 V čase t = 0 jsou určeny pouze jevy Ω a ∅, tedy F0 = {∅, Ω} . V čase t = 1 jsou určeny jevy: F+ = {(++) , (+−)} a F− = {(−+) , (−−)}. Tedy F1 = {∅, Ω, F+, F−} . V čase t = 2 jsou určeny všechny jevy (každá podmnožina Ω), tedy F2 = exp Ω = { všechny podmnožiny Ω} . Příklad 10.2.3. T- krokový model. Množina ΩT tržních scénářů je množina posloupností délky T se složkami + nebo -. Celkem je takových scénářů 2T . Částečný scénář je posloupnost ξ = (ξ1, ξ2, ..., ξt) délky t ≤ T, kde ξj = + nebo ξj = − pro j = 1, 2, ..., t. Množinu těchto scénářů označme Ωt. Pro každý částečný scénář ξ = (ξ1, ..., ξt) definujeme jev F (ξ) jako množinu všech úplných scénářů, jejichž prvních t složek jsou právě ξ1, ..., ξt. Tedy F (ξ) = {ω ∈ Ω : ωj = ξj pro všechna j = 1, 2, ..., t} . Úplné scénáře odpovídají koncovým uzlům stromu, částečné pak nekoncovým. σ-algebry Ft definujeme pak takto: Ft = {všechna konečná sjednocení jevů F (ξ) , kde ξ=(ξ1, ξ2, ..., ξt) ∈ Ωt} Cena akcie v čase t závisí na tržním scénáři, ale jen na jeho složkách do času t, nezávisí na složkách scénáře v časech > t. Tedy proces ceny je adaptovaný přirozené filtraci, ve smyslu následující definice. Definice 10.2.4. Posloupnost náhodných veličin Xt je adaptovaná přirozené filtraci, jestliže pro každé t a pro každý tržní scénář ω = ξ1, ..., ξT hodnota Xt (ω) závisí jen na částečném scénáři ξ1, ξ2, ..., ξt. 89 10.3 Martingal Definice 10.3.1. Nechť F je přirozená filtrace prostoru tržních scénářů Ω = {ω1, ω2, ..., ωN } a P je pravděpodobnostní míra na Ω. Adaptovaná posloupnost náhodných veličin Xt se nazývá martingal, jestliže platí E (Xt+1 | Ft) = Xt pro všechna t ∈ {0, 1, ..., T − 1}. Pokud E (Xt+1 | Ft) ≥ Xt, mluvíme o submartingalu, pokud E (Xt+1 | Ft) ≤ Xt, mluvíme o supermartingalu. Ft obsahuje veškeré informace dostupné v čase t. Často je tato informace obsažena v hodnotách X1, X2, ..., Xt. Pak máme E (Xt+1 | Ft) = E (Xt+1 | X1, X2, ..., Xt) . Příklad 10.3.2. (Symetrická jednoduchá náhodná procházka). Nechť P (Xi = 1) = 1 2 = P (Xi = −1) a Sn = X1 + ... + Xn. Pak Sn je martingal. 10.4 Samofinancující portfolia 10.4.1 Dynamické portfolio Uvažujme T-krokový model trhu s aktivy A1 , A2 , ..., AK . Označme SA t (ω) cenu podílu aktiva A v čase t ve scénáři ω a ΘA t (ω) počet podílů aktiva A, které držíme v portfoliu Θ v čase t za scénáře ω. Posloupnost ΘA t musí být adaptovaná přirozené filtraci. Dynamické portfolio je omezené, jestliže náhodné veličiny ΘA t jsou všechny omezené. 90 10.4.2 Samofinancující portfolio Hodnota portfolia Θ po rebalancování (upravení) v čase t za scénáře ω je V Θ t = V Θ t (ω) = A ΘA t (ω) SA t (ω) , kde sčítáme přes všechna aktiva A = A1 , A2 , ..., AK . Hodnota V Θ t+1 po proběhnutí obchodování v čase t bude obecně jiná, než V Θ t . Pokud do portfolia nepřidáváme ani neodebíráme prostředky, musí být jeho hodnota těsně po rebalancování stejná jako před rebalancováním. Tedy platí ΘA t SA t+1 (ω) = ΘA t+1SA t+1 (ω) , kde SA t+1 jsou nové ceny a ΘA t+1 jsou nové podíly v portfoliu. Úpravou pak dostaneme V Θ t+1 (ω) − V Θ t (ω) = A ΘA t SA t+1 (ω) − SA t (ω) . To je podmínka pro samofinancující portfolio. Věta 10.4.1. Nechť v T-periodickém trhu M neexistuje arbitráž a nechť existuje bezrizikové aktivum s úrokovou mírou r = 0. Pak vzhledem k rovnovážné pravděpodobnostní míře je proces cen (St) libovolného obchodovatelného aktiva martingalem vzhledem k přirozené filtraci Definice 10.4.2. Nechť Ft je přirozená filtrace a Yt je posloupnost náhodných veličin adaptovaných Ft. Yt se nazývá předvídatelná posloupnost, jestliže pro všechna t ≥ 1 je Yt Ft−1 - měřitelná. (tedy hodnota Yt je určena již v čase t − 1). 10.5 Martingalová transformace Definice 10.5.1. Nechť posloupnost náhodných veličin {Xt} pro 0 ≤ t ≤ T je martingal a nechť {Yt} pro 0 ≤ t ≤ T je předvídatelná posloupnost. Pak 91 martingalová transformace {(Y • X)t}0≤t≤T je posloupnost náhodných veličin definovaná jako (Y • X)t = X0 + t−1 j=0 Yj (∆X)j+1 , kde (∆X)t+1 = Xt+1 − Xt. Věta 10.5.2. Martingalová transformace je martingalem vzhledem k Ft. Důkaz: Cvičení. Důsledek 10.5.3. Nechť M je T-periodický trh bez arbitráže obsahující bezrizikové aktivum s úrokovou mírou r = 0 a nechť M má rovnovážnou pravděpodobnostní míru P. Pak pro každé samofinancující portfolio je proces jeho ceny V Θ t 0≤t≤T martingalem. Důkaz: Z podmínky pro samofinancující portfolio plyne, že proces ceny je martingalová transformace, a tedy martingal. 10.5.1 Podmíněná očekávání a martingalová transfor- mace Vlastnost martingalu znamená, že “očekávaná budoucí hodnota = současná hodnota”. Následující obrázky mají ilustrovat graficky pojem martingalu. Do grafu zaneseme příslušné hodnoty a očekávání: t = 0 : S0 E(S1|S0) t = 1 : S1 E(S2|S1) t = 2 : S2 E(S2|S2) 92 t = 0 t = 1 t = 2 92 80 130 120 54 60 36 36 72 72 80 80 180 180 p=1/2 p=1/2 p=1/2 p=1/2 p=1/2 p=1/2 Předchozí obrázek není martingal - u martingalu jsou nahoře i dole stejné hodnoty, viz následující obrázek: 93 t = 0 t = 1 t = 2 100 100 120 120 80 80 70 70 90 90 100 100 140 140 p=1/2 p=1/2 p=1/2 p=1/2 p=1/2 p=1/2 94 10.6 Příklady Příklad 10.6.1. Nechť Xn jsou nezávislé náhodné proměnné splňující E(Xn) = 0 pro všechna n . Dokažte, že posloupnost částečných součtů S0 = 0 a Sn = X1 + X2 + +Xn pro n ≥ 1, je martingalem vzhledem k Xn. Příklad 10.6.2. Nechť Xn jsou nezávislé náhodné proměnné splňující E(Xn) = 0 a V ar(Xn) = σ2 pro všechna n. Uvažujme posloupnost částečných součtů Sn z předchozího příkladu. Dokažte, že vztahy M0 = 0 a Mn = S2 n − nσ2 pro n ≥ 1 definují martingal vzhledem k posloupnosti Xn. 95 Kapitola 11 Úplnost trhu 11.1 Věta o úplnosti trhu Uvažujeme trh M s aktivy A1 , ..., Ak . Podle základní věty arbitrážní teorie (APT) plyne z neexistence arbitráže existence rovnovážné pravděpodobnostní míry (může jich být i více). Definice 11.1.1. Trh bez arbitráže se nazývá úplný, jestliže existuje právě jedna rovnovážná pravděpodobnostní míra. Trh je neúplný, pokud existuje více rovnovážných pravděpodobnostních měr. Definice 11.1.2. Derivát je obchodovatelné aktivum, jehož hodnota V1 v čase t = 1 je funkcí V1 (ωi) tržního scénáře. Tedy V1 je náhodná veličina na Ω = {ω1, ..., ωN }. Definice 11.1.3. Replikující portfolio pro daný derivát V , jehož hodnoty v čase t = 1 za scénáře ωi jsou rovny V1 (ωi), je portfolio Θ = (θ1, ..., θk) v aktivech A1 , ..., Ak takové, že: V1 (ωi) = k j=1 θjSj 1 (ωi) , kde Sj 1 (ωi) je cena j-tého aktiva Aj za scénáře ωi. 96 Z neexistence arbitráže plyne, že V0 = k j=1 θjSj 0, tedy pokud existuje replikující portfolio, derivát má jednoznačně určenou cenu v čase t = 0. Věta 11.1.4. (o úplnosti trhu): Nechť M je trh bez arbitráže s bezrizikovým aktivem. Existuje-li pro každý derivát replikující portfolio v A1 , ..., Ak , pak je trh úplný. Naopak je-li M úplný a rovnovážná pravděpodobnostní míra dává kladnou pravděpodobnost každému scénáři (tj. π (ωi) > 0 pro ∀i), pak pro každý derivát existuje replikující portfolio (a tedy derivát má jednoznačně určenou cenu). Důkaz je založen na jednoduchých myšlenkách z lineární algebry. Deriváty tvoří vektorový prostor (izomorfní RN ). Trh je úplný právě tehdy, když vektory hodnot aktiv A1 , A2 , ..., Ak v jednotlivých scénářích generují RN . Tedy vektory Sj 1 (ωi), j = 1, ..., k generují RN . Speciálně platí k ≥ N. Důkaz: Chceme nejdříve dokázat, že pokud existuje replikujcí portfolio, pak M je úplný. Uvažujme pro pevně zvolený scénář ωl ∈ Ω následující derivát Dl, jehož hodnota v čase t = 1 je rovna V1 (ωi) = 0 pro i = l 1 pro i = l . Podle předpokladu existuje replikující portfolio pro Dl, označme ho Θ = (θ1, ..., θk), v aktivech A1 , ..., Ak . Tedy V0 = θjSj 0. Je-li π rovnovážná pravděpodobnostní míra, pak také V0 = e−r N i=1 V1 (ωi) πi = e−r π (ωl) . 97 Odtud plyne π (ωl) = er k j=1 θjSj 0 a tedy π je jednoznačně určena. Zbývá nám dokázat opačnou implikaci. Označíme aj = Sj 1 (ω1) , Sj 1 (ω2) , ..., Sj 1 (ωN ) vektor v RN pro každou hodnotu j (tedy každé aktivum Aj). Derivát je vektor v RN , který se dá replikovat právě tehdy, když vektor jeho hodnot v jednotlivých scénářích patří do lineárního obalu vektorů aj. Nechť existuje π (ωi) jednoznačně určená, taková, že π (ωi) > 0 pro všechna i. Budeme postupovat sporem: Nechť existuje derivát D, který nemá replikující portfolio. Tedy jsou-li jeho hodnoty ve scénářích ωi rovny f (ωi) a označíme-li f = (f (ω1) , ..., f (ωN )) , pak f není lineární kombinací aj a tedy aj negeneruje RN . Existuje tedy vektor v = (v1, ..., vN ), který je kolmý na vektory aj pro všechna j, tedy platí N i=1 viSj 1 (ωi) = 0 pro j = 1, ..., k. Aktivum A1 je bezrizikové, tedy A1 1 (ωi) = er pro všechna i. Speciálně tedy v⊥ (1, ..., 1) a N i=1 vi = 0. Pro dostatečně malé ε > 0 označme π∗ (ωi) = π (ωi) + εvi. Máme N i=1 π∗ (ωi) = N i=1 π (ωi) + N i=1 vi = 1 + 0 = 1. 98 Navíc, je-li ε dostatečně malé, pak π∗ (ωi) > 0, neboť π (ωi) > 0, a platí N i=1 π∗ (ωi) Sj 1 (ωi) = N i=1 π (ωi) Sj 1 (ωi) + ε N i=1 viSj 1 (ωi) = N i=1 π (ωi) Sj 1 (ωi) . Tedy π∗ je další rovnovážná pravděpodobnostní míra, což je spor. Tím je tvrzení dokázáno. 99 Kapitola 12 Wienerův proces 12.1 Limita náhodné procházky Wienerův proces je stochastický proces ve spojitém čase se spojitými hodnotami, který můžeme intuitivně chápat jako limitu náhodné procházky při zmenšování časového a prostorového kroku ∆x a ∆t (tedy pro ∆x → 0 a ∆t → 0). Nechť P {Xi = 1} = P {Xi = −1} = 1 2 , kde Xi, ..., Xn, ... jsou stejně rozdělené nezávislé náhodné veličiny s E (Xi) = 0 a V ar (Xi) = 1. Potom Sn = S0 + X1 + X2 + ... + Xn, kde S0 = 0, je standardní symetrická náhodná procházka. Zvolme délku časového kroku ∆t a velikost prostorového kroku ∆x. Pro t = n∆t, tedy n = t ∆t , definujeme proces St = Sn∆t = (X1 + X2 + ... + Xn) ∆x. Z nezávislosti přírůstků Xj plyne, že E (St) = 0 a V ar (St) = (∆x)2 n = (∆x)2 t ∆t . Zajímá nás chování tohoto procesu v limitním přechodu ∆x → 0 a ∆t → 0. Uvažujeme mocninnou závislost mezi ∆x a ∆t. Položme ∆t = (∆x)p , kde 100 p > 0. Pro ∆t → 0 pak dostáváme V ar (St) = (∆x)2 ∆t t    → 0 pro p < 2 = t pro p = 2 → ∞ pro p > 2 . Konečný nenulový rozptyl tedy dostaneme jen pro volbu p = 2. Pro ∆t = (∆x)2 dostaneme v limitě pro ∆t → 0 standardní Wienerův proces. Z Centrální limitní věty plyne, že St má v limitě pro ∆t → 0 a (∆x)2 = ∆t normální rozdělení N (0, t). Věta 12.1.1. (Lindebergova centrální limitní věta) Nechť X1, X2, ... jsou nezávislé náhodné veličiny se stejným rozdělením, které mají střední hodnotu µ a konečný rozptyl σ2 . Označme Yn = (X1 + X2 + ... + Xn − µn) √ n pro n = 1, 2, .... Pak Yn konverguje v distribuci k rozdělení N (0, σ2 ). Definice 12.1.2. Stochastický proces Wt, kde t ∈ [0, ∞), se nazývá standardní Wienerův proces, jestliže platí: 1. W0 = 0 2. (spojitost) S pravděpodobností 1 je trajektorie Wienerova procesu spo- jitá. 3. (nezávislost) PřírůstkyWienerova procesu jsou nezávislé, tj. pro 0 ≤ t1 < s1 ≤ t2 < s2 ≤ ... ≤ tn < sn jsou přírůstky Ws1 − Wt1 , Ws2 − Wt2 , ..., Wsn − Wtn navzájem nezávislé. 4. (normalita přírůstků) Přírůstky Ws − Wt pro s > t mají rozdělení N (0, s − t). Speciálně z vlastností 1 a 4 máme Wt ∼ N (0, t) ∼ √ tN (0, 1) . 101 Označme ∆W přírůstek Wienerova procesu za čas ∆t. Máme ∆W = √ ∆tε, kde ε má standardní normální rozdělení N (0, 1). Pro očekávání a rozptyl ∆W dostaneme E (∆W) = √ ∆tE (ε) = 0 a V ar (∆W) = E (∆W)2 = ∆t. Zobecněný Wienerův proces můžeme definovat pomocí infinitezimálního přírůstku dX = adt + bdW, kde a, b jsou konstanty a W je standardní Wienerův proces. Koeficient a je koeficient driftu a b je koeficient volatility. Opět máme ∆X = a∆t + bε √ ∆t, tedy E (∆X) = a∆t a V ar (∆X) = b2 ∆t. Pro b = 0 máme dX = adt, tedy Xt = at je deterministický proces. Další možné zobecnění: koeficienty a, b se mohou měnit a mohou záviset na t a případně i na hodnotách X. 102 12.2 Wienerův proces pro cenu akcie Wienerův proces není vhodný pro popis vývoje ceny akcie z několika důvodů: • Ceny akcie nemohou nabývat záporné hodnoty, zatímco Wienerův proces ano. • Při Wienerově procesu je pravděpodobnost, že se cena zvýší o 1 Kč, stejná, je-li S = 1 Kč nebo S = 100 000 Kč. To, co je ve skutečnosti důležité, není absolutní změna (ta závisí mimo jiné také na jednotkách, v nichž cenu vyjadřujeme), ale relativní změna vůči ceně akcie. Je-li volatilita nulová, máme ∆S = µS∆t. Z tohoto vztahu můžeme vyjádřit relativní přírůstek ∆S S = µ∆t, kde µ je konstanta (drift). Odtud dostáváme dS S = µdt a řešením diferenciální rovnice se separovanými proměnnými St = S0eµt . Obecně dS = µSdt + σSdW, kde µ je drift a σ je volatilita. Tak je definován geometrický Wienerův proces. Máme dS S = µdt + σdW a diskretizací dostaneme: ∆S = µS∆t + σSε √ ∆t, 103 kde ε ∼ N (0, 1). Tedy ∆S S = µ∆t + σε √ ∆t, odkud ∆S S ∼ N µ∆t, σ2 ∆t . Jinak řečeno, E ∆S S = µ∆t a V ar ∆S S = σ2 ∆t. K vyřešení rovnice, t.j. odvození explicitního vztahu pro S, potřebujeme Itôovo lemma. 12.2.1 Itôovo lemma Pro porovnání připomeňme nejdříve diferenciál deterministické funkce. • 1 proměnná: dG = ∂G ∂x dx • funkce 2 deterministických proměnných x, t: ∆G ≈ ∂G ∂t ∆t + ∂G ∂x ∆x, neboli dG = ∂G ∂t dt + ∂G ∂x dx. V případě Wienerova procesu platí heuristický vztah (dW)2 = dt, proto budeme mít navíc člen 1 2 ∂2 G ∂x2 (dX)2 . Itôovo lemma je analogií pravidla pro diferenciál složené funkce a slouží k výpočtu přírůstků funkce stochastického procesu. 104 Nechť hodnota stochastického procesu X splňuje rovnici dX = a (X, t) dt + b (X, t) dW, kde W je standardní Wienerův proces a a, b jsou funkce X a t. Nechť G (x, t) je dvakrát spojitě diferencovatelná funkce dvou proměnných x, t. Jakou rovnici splňuje přírůstek procesu G (X, t)? Itôovo lemma říká, že pro G platí dG = ∂G ∂t dt + ∂G ∂x dX + 1 2 ∂2 G ∂x2 (dX)2 , kde za dX dosadíme a (dX)2 počítáme podle pravidel dtdt = 0, dtdW = 0, (dW)2 = dt. Tak dostaneme celkem dG = ∂G ∂t + 1 2 ∂2 G ∂x2 b2 + a ∂G ∂x dt + ∂G ∂x bdW. 12.2.2 Odvození Black-Scholesovy rovnice Black-Scholesova rovnice popisuje vývoj hodnoty evropské opce v BlackScholesově modelu. Předpokládejme, že pohyb ceny akcie je popsán geometrickým Wienerovým procesem dS = µSdt + σSdW, neboli dS S = µdt + σdW. Použijeme Itôovo lemma na funkci G (S, t) = lnS . Máme ∂G ∂t = 0, ∂G ∂S = 1 S , ∂2 G ∂S2 = −1 S2 . Tedy z Itôova lemmatu 105 dG = µ − σ2 2 dt + σdW a d (ln S) = µ − σ2 2 dt + σdW. Odtud plyne, že ln ST − ln S0 má normální rozdělení se střední hodnotou µ − σ2 2 T a rozptylem σ2 T. Tedy ln ST ∼ N ln S0 + µ − σ2 2 T; σ2 T . ST má tedy lognormální rozdělení, tj. ln ST má normální rozdělení. Máme rovnici pro cenu akcie, která sleduje geometrický Wienerův proces dS = µSdt + σSdW. (12.1) Nechť f je cena evropské call opce s danou realizační cenou K a časem expirace T. Zisk z takové opce v čase T je (ST − K)+ . f závisí na S a t a je tedy funkcí dvou proměnných, f (S, t). Hodnota f (S, t) je cena opce v čase t v situaci, kdy cena akcie je rovna S. Podle Itôova lemmatu platí pro změnu ceny opce df = ∂f ∂t dt + ∂f ∂S dS + 1 2 ∂2 f ∂S2 (dS)2 . Za dS dosadíme z 12.1, tedy df = ∂f ∂t dt + ∂f ∂S (µSdt + σSdW) + 1 2 ∂2 f ∂S2 (µSdt + σSdW)2 . Jelikož (dt)2 a dtdW jsou členy vyššího řádu a víme, že (dW)2 = dt, dostá- váme: df = ∂f ∂t + ∂f ∂S µS + 1 2 ∂2 f ∂S2 σ2 S2 dt + ∂f ∂S σSdW. (12.2) 106 Vhodnou kombinací 12.1 a 12.2 můžeme sestavit portfolio z akcií a opcí, jehož výnos je deterministický. Jinak řečeno, můžeme eliminovat stochastický člen dW. Označme Π hodnotu portfolia složeného z 1 opce a −∂f ∂S akcie, tedy Π = − ∂f ∂S S + 1f Pro přírůstek hodnoty portfolia za čas dt máme: dΠ = − ∂f ∂S dS + 1df. Po dosazení z 12.1 a 12.2 dostaneme dΠ = − ∂f ∂S µS + ∂f ∂t + ∂f ∂S µS + 1 2 ∂2 f ∂S2 σ2 S2 dt, stochastický člen se vyruší. Přírůstek hodnoty portfolia dΠ se musí (z neexistence arbitráže) rovnat zisku z bezrizikového aktiva s úrokovou mírou r, tj. dΠ = rΠdt. Celkem dostaneme ∂f ∂t + 1 2 ∂2 f ∂S2 σ2 S2 dt = r − ∂f ∂S S + f dt a ∂f ∂t + 1 2 ∂2 f ∂S2 σ2 S2 + ∂f ∂S Sr = rf. To je Black-Scholesova parciální diferenciální rovnice. Po transformaci (substitucích) dostaneme rovnici difuze (rovnici vedení tepla) ∂f ∂t = ∂2 f ∂S2 . Řešením společně s transformovanou koncovou podmínkou (známe hodnotu f (T) = (ST − K)+) dostaneme Black-Scholesův vzorec. 107 12.3 Příklady Příklad 12.3.1. Vypočítejte diferenciály následujících procesů X(t) = 3t + eW(t) X(t) = t + W(t)2 X(t) = 5 + sin W(t) Příklad 12.3.2. Nechť X je zobecněný Wienerův proces s parametry µ a σ. Najděte stochastickou diferenciální rovnici pro následující funkce proměnných X a t: f(x, t) = x3 f(x, t) = ln(3 + x) f(x, t) = et+xt 108 Literatura [1] Grimmett G., Stirzaker D.: Probability and Random Processes, Oxford University Press 2001 [2] Ross S.: Stochastic Processes, Wiley 1996 [3] Hull J. C.: Options, Futures and Other Derivatives, Prentice Hall 2012 [4] Willmott P., Howison S., Dewynne, J.: The Mathematics of Financial derivatives, A Student Introduction, Cambridge University Press 1996 [5] Ševčovič D., Stehlíková B., Mikula K.: Analytické a numerické metódy oceňovania finančných derivátov, Slovenská technická univerzita 2009 [6] Etheridge A.: A Course in Financial Calculus, Cambridge University Press 2002 [7] Baxter M., Rennie A.: Financial Calculus: An Introduction to Derivative Pricing, Cambridge University Press 1996 [8] Wilmott P.: Paul Wilmott on Quantitative Finance, 3 Volume Set, Wiley 2006 [9] Wilmott P.: Frequently Asked Questions in Quantitative Finance, Wiley 2007 109