Obsah 1 Základy teorie pravděpodobnosti 3 1.1 Motivace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2 Pravděpodobnost . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.3 Opakování základních pojmů teorie pravděpodobnosti . . . . . 4 1.4 Diskrétní náhodné proměnné . . . . . . . . . . . . . . . . . . . 5 1.5 Závislost a nezávislost náhodných veličin . . . . . . . . . . . . 7 1.6 Podmíněná pravděpodobnost a podmíněné očekávání . . . . . 10 1.7 Součty náhodných veličin . . . . . . . . . . . . . . . . . . . . . 11 2 Náhodná procházka 13 2.1 Jednoduchá náhodná procházka . . . . . . . . . . . . . . . . . 13 2.2 Základní vlastnosti náhodné procházky . . . . . . . . . . . . . 14 2.3 Základní techniky pro počítání s náhodnou procházkou . . . . 15 2.3.1 Technika podmínění 1. krokem . . . . . . . . . . . . . . 16 2.3.2 Technika počítání trajektorií . . . . . . . . . . . . . . . 17 2.3.3 Princip reflexe . . . . . . . . . . . . . . . . . . . . . . . 18 2.3.4 Generující funkce . . . . . . . . . . . . . . . . . . . . . 19 2.3.5 Charakteristiky náhodných veličin a jejich generující funkce . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.3.6 Součty náhodných veličin a konvoluce . . . . . . . . . . 22 2.3.7 Generující funkce a náhodná procházka . . . . . . . . . 23 2.3.8 Časy navštívení bodu r . . . . . . . . . . . . . . . . . . 27 3 Zákony arcsinu a Pólyova věta 30 3.1 Zákony arcsinu pro symetrickou náhodnou procházku . . . . . 30 3.1.1 1. zákon arcsinu . . . . . . . . . . . . . . . . . . . . . . 30 3.1.2 Stirlingova formule . . . . . . . . . . . . . . . . . . . . 32 3.1.3 2. zákon arcsinu . . . . . . . . . . . . . . . . . . . . . . 34 3.2 Pólyova věta v Rn . . . . . . . . . . . . . . . . . . . . . . . . . 34 1 4 Poissonův proces 37 4.1 Základní vlastnosti Poissonova procesu . . . . . . . . . . . . . 37 4.2 Cramér - Lundbergův model . . . . . . . . . . . . . . . . . . . 40 4.3 Inspekční paradox . . . . . . . . . . . . . . . . . . . . . . . . . 40 5 Diskrétní modely ve finanční matematice 42 5.1 1-krokový model . . . . . . . . . . . . . . . . . . . . . . . . . 42 5.2 Základní věta APT . . . . . . . . . . . . . . . . . . . . . . . . 46 5.2.1 Jištění (Hedging) . . . . . . . . . . . . . . . . . . . . . 49 5.3 Model s více periodami . . . . . . . . . . . . . . . . . . . . . . 50 5.3.1 Trh se dvěma periodami . . . . . . . . . . . . . . . . . 50 5.3.2 Vícekrokový model s T kroky . . . . . . . . . . . . . . 52 6 Martingaly 53 6.1 Férová hra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 6.2 Přirozená filtrace . . . . . . . . . . . . . . . . . . . . . . . . . 54 6.3 Martingal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 6.4 Samofinancující portfolia . . . . . . . . . . . . . . . . . . . . . 56 6.4.1 Dynamické portfolio . . . . . . . . . . . . . . . . . . . 56 6.4.2 Samofinancující portfolio . . . . . . . . . . . . . . . . . 56 6.5 Martingalová transformace . . . . . . . . . . . . . . . . . . . . 57 6.5.1 Podmíněná očekávání a martingalová transformace . . 58 7 Úplnost trhu 60 7.1 Věta o úplnosti trhu . . . . . . . . . . . . . . . . . . . . . . . 60 8 Wienerův proces (Brownův pohyb) 63 8.1 Limita náhodné procházky . . . . . . . . . . . . . . . . . . . . 63 8.2 Wienerův proces pro cenu akcie . . . . . . . . . . . . . . . . . 65 8.2.1 Itôovo lemma . . . . . . . . . . . . . . . . . . . . . . . 66 8.2.2 Odvození Black-Scholesovy rovnice . . . . . . . . . . . 68 2 Kapitola 1 Základy teorie pravděpodobnosti Matematické modely ve financích jsou z velké většiny stochastické. Základním nástrojem který využívají je teorie pravděpodobnosti. V této kapitole připomeneme některé základní pojmy a techniky z teorie pravděpodobnosti, tak jak je budeme v dalších kapitolách potřebovat. 1.1 Motivace Uvažujme jako příklad cenu jedné akcie firmy Apple příští pondělí na konci obchodování. Dnes je pro nás tato cena neznámá, a modelujeme ji tedy jako náhodnou veličinu. Ovšem příští týden v úterý již bude známou hodnotou (konstantou). Pro matematické modelování ve financích je typická tato interakce náhodných a známých veličin. Vzájemnému působení náhodnosti a plynutí času se věnuje teorie stochastických procesů. Připomeňme, že posloupnost náhodných veličin Xt, t ∈ I, kde I je indexová množina, se nazývá stochastický proces. Je-li Xt cena zvolené akcie v budoucím čase t, pak zřejmě Xt, Xt+1 nejsou nezávislé náhodné veličiny. Hodnota Xt něco říká o pravděpodobnostním rozdělení náhodné veličiny Xt+1. Na druhé straně, přírustky Xt+2 − Xt+1 a Xt+1 − Xt budou ve většině našich modelů nezávislé. To úzce souvisí s tzv. hypotézou efektivního trhu. Podle ní všechny informace dostupné v čase t jsou již obsaženy v ceně Xt. Jak uvidíme, je to také jedním z hlavních argumentů proč je geometrický Brownův pohyb “přirozeným ” modelem vývoje cen akcií. 3 1.2 Pravděpodobnost Teorie pravděpodobnosti je hlavním nástrojem modelování ve finanční matematice. Je dobré si uvědomit hned na začátku že pojem pravděpodobnost má více možných interpretací. 1. Frekventistický přístup: Pravděpodobnost jevu je limita jeho relativní četnosti při velkém počtu opakování téhož experimentu. Nevýhodou této definice je omezení na opakovatelné jevy. Předpoklad opakovatelnosti konkrétní situace na trhu není ve financích úplně reálný. 2. Bayesovský přístup: Pravděpodobnost vyjadřuje míru naší nejistoty o pravdivosti nějakého tvrzení, založenou na informacích, které v danou chvíli máme. V tomto pojetí je každá pravděpodobnost ve skutečnosti podmíněná (informacemi které právě máme). Například pravděpodobnost padnutí šestky na kostce je P(X = 6) = 1 6 , pokud nemáme žádnou informaci o tom jak je kostka vyrobena. Budeme-li znát například přesné složení materiálu (nehomogenost dřeva), může se tato pravděpodobnost změnit. Matematická technika výpočtů nicméně na interpretaci ve většině případů nezávisí a je stejná pro obě pojetí. 1.3 Opakování základních pojmů teorie prav- děpodobnosti Pravděpodobnostní prostor (model) obvykle označujeme (Ω, A, P), kde – Ω je prostor elementárních jevů, t.j. všech možných stavů modelovaného systému které chceme rozlišovat (např. {1, 2, 3, 4, 5, 6} u hodu kostkou). – A je množina všech pozorovatelných jevů. PrvkyA jsou podmnožiny Ω. Jev je tedy formálně vzato množina elementárních jevů, které jsou s ním slučitelné. (Například jev padne sudé číslo je množina {2, 4, 6}) Je-li Ω konečná nebo spočetná (tak tomu bude u všech diskrétních modelů), je A v definici pravděpodobnostního prostoru nadbytečné, neboť automaticky A je rovno exp Ω, množině všech podmnožin Ω. – P : A → 0, 1 je pravděpodobnostní míra. V diskrétním případě stačí znát hodnoty této míry na elementárních jevech, tedy P : Ω → 0, 1 . P(ω) je pak pravděpodobnost elementárního jevu ω, a pro obecný jev A ∈ A platí P(A) = ω∈A P(ω). 4 Pokud je ale Ω nespočetná, pak exp Ω má příliš velkou mohutnost, aby se na ní dala definovat pravděpodobnostní míra. Musíme se pak omezit na menší σ-algebru. S tím se setkáme až u spojitých modelů. 1.4 Diskrétní náhodné proměnné Diskrétní náhodná proměnná (náhodná veličina) je funkce X : Ω → {x1, x2, ...} ⊆ R, kde {x1, x2, ...} je diskrétní podmnožina R. Definice 1.4.1. Pravděpodobnostní funkce náhodné veličiny X je definována jako f(x) = P(X = x). Definice 1.4.2. Distribuční funkce náhodné veličiny X je F(x) = P(X ≤ x). Připomeňme si ještě definici nezávislosti dvou jevů. Definice 1.4.3. Jevy A, B ⊆ Ω jsou nezávislé, jestliže P(A) = P(A ∩ B) P(B) , tedy P(A ∩ B) = P(A)P(B). Jinak řečeno (podle prvního vztahu), víme-li že nastal jev B, nezmění to pravděpodobnost jevu A. Definice 1.4.4. Diskrétní náhodné veličiny X a Y jsou nezávislé, jestliže jevy {X = x} a {Y = y} jsou nezávislé pro všechna x a y. Jinými slovy, znalost hodnoty X nedává žádnou informaci o hodnotě Y . Pravděpodobnostní funkce obsahuje všechny informace o uvažované náhodné veličině. Často nám ale stačí její číselné charakteristiky. Definice 1.4.5. Očekávání (střední hodnota) náhodné veličiny X s pravděpodobnostní funkcí f(x) je definována jako E(X) = x: f(x)>0 xf(x), 5 je-li řada absolutně konvergentní. Očekávání můžeme vypočítat také pomocí vztahu E(X) = ω∈Ω X(ω)P(ω). Definice 1.4.6. Je-li k přirozené číslo, k-tý moment mk náhodné veličiny X je definován jako mk = E(Xk ). Definice 1.4.7. k-tý centrální moment σk je definován jako σk = E((X − m1)k ). Speciálně, m1 = E(X) je střední hodnota a σ2 = E((X − E(X))2 ) je rozptyl (variance) Tedy σ2 = σ2 , kde σ = √ σ2 je střední směrodatná odchylka. Definice 1.4.8. Nechť A je jev, tj. A ⊆ Ω, a nechť IA : Ω → R je náhodná veličina definovaná vztahem IA(ω) = 1 pro ω ∈ A 0 pro ω /∈ A . Pak IA se nazývá indikátorová funkce jevu A. Libovolnou náhodnou veličinu můžeme zapsat pomocí indikátorových funkcí jevů Ai = {X = xi}. Máme X = i xiIAi . IA je příkladem Bernoulliovské náhodné veličiny. Nabývá pouze hodnot 0 a 1. 6 1.5 Závislost a nezávislost náhodných veličin Lemma 1.5.1. Nechť X a Y jsou nezávislé náhodné veličiny. Potom E(XY ) = E(X)E(Y ). Důkaz: Označme Ax = {X = x} a By = {Y = y}. Pak XY = x,y xyIAx∩By , tedy E(XY ) = x,y xyE(IAx∩By ) = x,y xyP(Ax ∩ By) = x,y xyP(Ax)P(By) = ( x xP(Ax))( y yP(By)) = E(X)E(Y ). Opak obecně neplatí. Definice 1.5.2. Říkáme, že náhodné veličiny X a Y jsou nekorelované, jestliže platí: E(XY ) = E(X)E(Y ). Věta 1.5.3. Nechť X a Y jsou náhodné veličiny. Pak 1. V ar(aX) = a2 V ar(X) pro a ∈ R. 2. Jsou-li X a Y nekorelované (speciálně nezávislé) náhodné veličiny, pak V ar(X + Y ) = V ar(X) + V ar(Y ). Důkaz: První tvrzení plyne ihned z definice. Dokážeme druhé tvrzení. V ar(X + Y ) = E [(X + Y ) − E(X + Y )]2 = E (X + Y )2 − 2(X + Y )E(X + Y ) + (E(X + Y ))2 = E((X + Y )2 ) − 2E(X + Y )E(X + Y ) + E((X + Y )2 ) = = E(X2 ) + 2E(XY ) + E(Y 2 ) − 2 (E(X))2 + 2E(X)E(Y ) + (E(Y ))2 +E(X)2 + 2E(X)E(Y ) + E(Y )2 7 = E(X2 ) + E(Y 2 ) + 2E(XY ) − (E(X))2 − 2E(X)E(Y ) − (E(Y ))2 = = E(X2 ) − (E(X))2 + E(Y 2 ) − (E(Y ))2 = V ar(X) + V ar(Y ) kde předposlední rovnost plyne z předpokladu, který implikuje E(XY ) = E(X)E(Y ). Definice 1.5.4. Kovariance náhodných veličin X a Y je definována jako cov(X, Y ) = E [(X − E(X))(Y − E(Y ))] . Korelační koeficient X a Y je ρ(X, Y ) = cov(X, Y ) V ar(X)V ar(Y ) . Platí: ρ(X, Y ) = 0 ⇔ E(XY ) = E(X)E(Y ) ⇔ cov(X, Y ) = 0 a cov(X, Y ) = E(XY ) − E(X)E(Y ). Dále je |ρ(X, Y )| ≤ 1. Klíčová otázka z praktického hlediska je jak ověřit nezávislost dvou daných náhodných veličin. Definice k tomu většinou vhodná není. Definice 1.5.5. Nechť X a Y jsou diskrétní náhodné veličiny (na stejném pravděpodobnostním prostoru). Sdružená distribuční funkce X a Y je definovaná vztahem FX,Y (x, y) = P(X ≤ x ∧ Y ≤ y). Definice 1.5.6. Sdružená pravděpodobnostní funkce: fX,Y : R2 → [0, 1] je definovaná vztahem fX,Y (x, y) = P(X = x ∧ Y = y). Analogicky se definuje sdružená pravděpodobnostní funkce pro více náhodných veličin. Následující lemma dává dobře ověřitelné kriterium nezávislosti. Lemma 1.5.7. Diskrétní náhodné veličiny X a Y jsou nezávislé právě tehdy 8 když fX,Y (x, y) = fX(x)fY (y) pro všechna x, y ∈ R. Důkaz: cvičení. Ze znalosti sdružené pravděpodobnostní funkce fX,Y můžeme vypočítat marginální pravděpodobnostní funkce fX a fY . Máme fX(x) = P(X = x) = P( y ({X = x} ∩ {Y = y})) = y P(X = x ∧ Y = y) = y fX,Y (x, y). Příklad 1.5.8. Nechť X : Ω → {1, 2, 3}a Y : Ω → {−1, 0, 2} jsou náhodné veličiny, a sdružená pravděpodobnostní funkce je dána tabulkou: y = −1 y = 0 y = 2 fX x = 1 1 18 3 18 2 18 6 18 x = 2 2 18 0 3 18 5 18 x = 3 0 4 18 3 18 7 18 fY 3 18 7 18 8 18 18 18 Jsou X a Y nezávislé? Zřejmě ne, v tom případě by řádky tabulky musely být násobkem jeden druhého. Vypočteme kovarianci těchto dvou náhodných veličin. Máme XY : Ω → {−1, 0, −2, −3, 2, 4, 6} . Dále E(X) = 1 18 + 10 18 + 21 18 = 37 18 , E(Y ) = 13 18 a E(XY ) = −1 1 18 + 2 2 18 − 2 2 18 + 4 3 18 + 6 3 18 = 29 18 Celkem tedy cov(X, Y ) = E(XY ) − E(X)E(Y ) = 29 18 − 481 324 = 522 − 481 324 = 41 324 . 9 1.6 Podmíněná pravděpodobnost a podmíněné očekávání Připoměňme definici podmíněné pravděpodobnosti pro jevy, P(A | B) = P(A ∩ B) P(B) . Ve finančních modelech je obvykle pravděpodobnost podmíněná informací, kterou máme v danou chvíli. Formálně to zachycuje následující defi- nice. Definice 1.6.1. Podmíněná pravděpodobnostní funkce náhodné veličiny Y za podmínky X = x, kterou budeme označovat fY |X(. | x), je definována jako fY |X(y | x) = P(Y = y | X = x), pro každé x takové, že P(X = x) > 0. Z definice máme P(Y = y | X = x) = P(Y = y ∧ X = x) P(X = x) = fX,Y (x, y) fX(x) , tedy fY |X(y | x) = fX,Y (x, y) fX(x) , což je analogický vztah jako platí pro podmíněné pravděpodobnosti jevů V předchozím příkladu máme pro x = 1 fY |X(y | 1) ∼ 1 6 , 3 6 , 2 6 = fX,Y fX . Víme-li, že X = x, pak Y má novou pravděpodobnostní funkci fY |X(y | x) jakožto funkci y (x je pevné). Očekávání vůči této funkci je podmíněné očekávání Y za podmínky X = x, které označíme Ψ(x) = E(Y | X = x). Definice 1.6.2. Funkce (tj. náhodná veličina) Ψ(x) = E(Y | X = x) se nazývá podmíněné očekávání Y při znalosti X. 10 V minulém příkladu je: Ψ(1) = 1 6 (−1) + 3 6 0 + 2 6 2 = 1 2 , Ψ(2) = −2 5 + 6 5 = 4 5 a Ψ(3) = 6 7 . Věta 1.6.3. (O celkovém očekávání) Pro podmíněné očekávání Ψ(x) = E(Y | X = x) platí E(Ψ(x)) = E(Y ), tedy E(Y ) = E(E(Y |X)) Důkaz: cvičení. 1.7 Součty náhodných veličin Lemma 1.7.1. Nechť X a Y jsou dvě náhodné veličiny na (Ω, A,P) a f(x, y) je jejich sdružená pravděpodobnostní funkce. Pak pro jejich součet Z = X + Y platí P(X + Y = z) = x f(x, z − x). Důkaz: Máme {X + Y = z} = x ({X = x ∧ Y = z − x}) tedy P(X + Y = z) = x P({X = x} ∧ {Y = z − x}) = x f(x, z − x). 11 Pokud X, Y jsou navíc nezávislé, pak fX,Y (x, z − x) = fX(x)fY (z − x), tedy fX+Y (z) = x fX(x)fY (z − x), což je konvoluce funkcí fX a fY . Označuje se fX fY . 12 Kapitola 2 Náhodná procházka 2.1 Jednoduchá náhodná procházka Jednoduchá náhodná procházka je základem diskrétních modelů pro pohyb cen aktiv. Je to “diskrétní verze” Brownova pohybu. Uvažujme následující hru: Hází se opakovaně mincí (ne nutně férovou). Padne-li hlava (H), získáme 1 Kč. Padne-li orel (O), prohrajeme 1 Kč. Označme S0 sumu, kterou máme na začátku a Sn sumu, kterou máme po n hrách. Je tedy Sn = S0 + n i=1 Xi, kde Xi je náhodná veličina popisující výsledek i-té hry. Předpokládáme, že pravděpodobnostní funkce Xi je P(Xi = 1) = p, P(Xi = −1) = 1 − p = q pro všechna i a navíc Xi jsou nezávislé. Xi jsou tedy analogií Bernoulliho náhodné veličiny, kde místo hodnot {1, 0} máme {1, −1} . Pro každé pevné n je Sn náhodná veličina, tedy {Sn}∞ n=0 je stochastický proces. Definice 2.1.1. Stochastický proces {Sn}∞ n=0 se nazývá jednoduchá náhodná procházka. Je-li p = q = 1 2 , nazývá se symetrická jednoduchá náhodná procházka. Někdy je vhodnější uvažovat jinou interpretaci – náhodný pohyb částice po přímce: V každém kroku t = 0, 1, 2, ... se částice posune buď o 1 doprava s pravděpodobností p nebo o 1 doleva s pravděpodobností q = 1 − p. 13 Velmi užitečné je grafické znázornění jednoduché náhodné procházky. Body o souřadnicích (n, Sn) spojíme úsečkami. Vzniklá lomená čára se nazývá trajektorie (cesta) náhodné procházky. Trajektorie je grafické znázornění realizace náhodného procesu {Sn}∞ n=0. -2 -1 0 1 2 0 1 2 3 4 5 čas Varianty náhodné procházky: • jiné rozdělení Xi (např. normální) • hodnoty Xi ne v R ale v Rd (vícerozměrná náhodná procházka). 2.2 Základní vlastnosti náhodné procházky Lemma 2.2.1. Jednoduchá náhodná procházka je prostorově homogenní, tedy platí P(Sn = j | S0 = a) = P(Sn = j + b | S0 = a + b). Důkaz: Obě strany rovnosti jsou rovny P( n i=1 Xi = j − a) 14 . Podobně je náhodná procházka homogenní i v čase. Lemma 2.2.2. Jednoduchá náhodná procházka je časově homogenní, neboli platí P(Sn = j | S0 = a) = P(Sn+m = j | Sm = a). Důkaz: Levá strana je rovna P( n i=1 Xi = j − a), pravá strana je rovna P( n+m i=m Xi = j − a). Rovnost tedy plyne z nezávislosti a stejného rozdělení Xi. Lemma 2.2.3. Jednoduchá náhodná procházka má Markovovu vlastnost, tedy P(Sm+n = j | S0, S1, ..., Sm) = P(Sm+n = j | Sm). Důkaz: Známe-li hodnotu Sm, pak rozdělení pravděpodobnosti Sn+m závisí jen na krocích Xm+1, Xm+2, ..., Xm+n, tedy je nezávislé na S0, S1, ..., Sm−1. Markovovu vlastnost lze intuitivně popsat slovy: “náhodná procházka nemá paměť, ” “minulost ovlivňuje budoucnost jen skrze současnost” 2.3 Základní techniky pro počítání s náhodnou procházkou Tato sekce se věnuje základním technikám počítání s náhodnou procházkou: • podmínění 1. krokem • počítání trajektorií • generující funkci 15 2.3.1 Technika podmínění 1. krokem Příklad 2.3.1. (zruinování hráče): Uvažujme předchozí hru s férovou mincí (p = 1 2 ). Padne-li hlava (H), hráč získá 1 Kč, padne-li orel (O), hráč prohraje 1 Kč. Nechť S0 = k je jeho počáteční jmění. Hráč si chce koupit auto v ceně N. Bude hrát tak dlouho, dokud Sn = N (koupí auto) nebo Sn = 0 (bankrot). Jaká je pravděpodobnost, že si hráč koupí auto? Uvažujme jevy: A ... hráč nakonec zbankrotuje; H ... první hod je hlava (P(H) = p); O ... první hod je orel (P(O) = q). Podle věty o úplné pravděpodobnosti platí P(A) = P(H)P(A | H) + P(O)P(A | O). Označme Pk(A) hledanou pravděpodobnost bankrotu pro dané počáteční jmění k, tedy Pk(A) = P(H)Pk(A | H) + P(O)Pk(A | O). Pk(A | H) je ale pravděpodobnost bankrotu v situaci, kdy hráč po 1. kroku má k+1 (a hra začíná z hlediska pravděpodobnosti znovu, z nezávislosti Xi). Tedy Pk(A | H) = Pk+1(A) a podobně Pk(A | O) = Pk−1(A). Označme pk = Pk(A). Dosazením dostaneme pk = ppk+1 + qpk−1 = 1 2 pk+1 + 1 2 pk−1, což je diferenční rovnice 2. řádu. Máme 1 2 (pk+1 − pk) = 1 2 (pk − pk−1), tedy přírůstky pravděpodobnosti jsou konstantní. Označme přírůstky b = pk − pk−1, tedy pk = p0 + kb. Okrajové podmínky pro diferenční rovnici jsou: p0 = 1 (okamžitý bankrot) pN = 0 (okamžitá koupě auta) Odtud dostaneme 1 + Nb = 0, tedy b = − 1 N a pk = 1 − k N . 16 2.3.2 Technika počítání trajektorií Uvažujme náhodnou procházku vycházející z bodu a. Máme tedy S0 = a, P(Xi = 1) = p, P(Xi = −1) = q, a Sn = a + n i=1 Xi. Pro pevně danou cestu je pravděpodobnost, že prvních n kroků bude sledovat právě tuto cestu, rovna pr ql , kde r je počet kroků doprava (nahoru) a l je počet kroků doleva (dolů), tedy r =| {i : Si+1 − Si = 1, i ≤ n} |, kde | . | značí velikost množiny. Každý jev můžeme vyjádřit pomocí vhodné množiny trajektorií (které jsou s ním v souladu), a jeho pravděpodobnost je součet pravděpodobností těchto trajektorií. Máme P(Sn = b) = r Mr n(a, b)pr qn−r , kde Mr n(a, b) je počet cest (S0, S1, ..., Sn) takových, že S0 = a, Sn = b, a majících přesně r kroků doprava. Víme, že r + l = n a r − l = b − a. Odtud 2r = n + b − a, čili r = n + b − a 2 a l = n − b + a 2 . Tedy P(Sn = b) = n r p n+b−a 2 q n−b+a 2 = n 1 2 (n + b − a) p n+b−a 2 q n−b+a 2 , pokud 1 2 (n + b − a) ∈ N (jinak je pravděpodobnost rovna 0). 17 2.3.3 Princip reflexe Označme Nn(a, b) počet všech cest z bodu (0, a) do bodu (n, b). Víme, že Nn(a, b) = Mr n(a, b) = n 1 2 (n + b − a) . Dále nechť N0 n(a, b) je počet všech cest z bodu (0, a) do bodu (n, b), které obsahují nějaký bod (k, 0) na ose x, tedy navštíví bod 0. Věta 2.3.2. (princip reflexe): Je-li a, b > 0 pak platí N0 n(a, b) = Nn(−a, b). Důkaz: Každá cesta z bodu (0, −a) do (n, b) protne osu x poprvé v nějakém bodě (k, 0). Reflexí této cesty okolo osy x dostaneme cestu z bodu (0, a) do (n, b), která navštíví osu x. Tato operace dává vzájemně jednoznačnou korespondenci mezi cestami z (0, −a) do (n, b) a cestami (0, a) do (n, b), které navštíví osu x. Tedy N0 n(a, b) = Nn(−a, b). Věta 2.3.3. (o volbách): Je-li b > 0, pak počet cest z bodu (0, 0) do bodu (n, b), které se nevrátí do bodu 0 je b n Nn (0, b) , kde Nn (0, b) je počet všech cest z bodu (0, 0) do bodu (n, b). Důkaz: Pro všechny takové cesty je první krok bod (1, 1) (jinak se nutně dostaneme do nuly), tedy jejich počet je roven (z časové homogenity): Nn−1 (1, b) − N0 n−1 (1, b) = Nn−1 (1, b) − Nn−1 (−1, b) = = n − 1 1 2 (n − 1 + b − 1) − n − 1 1 2 (n + b) = n − 1 m − 1 − n − 1 m = b n n m = b n Nn (0, b) , kde jsme označili m = 1 2 (n + b). Příklad 2.3.4. (Úloha o volbách) Kandidát A má α hlasů; kandidát B dostal β hlasů, kde α > β, tj. kandidát A zvítězil. Jaká je pravděpodobnost, že během voleb byl A celou dobu před B? 18 Označme Xi = 1 je-li i-tý hlas pro A, Xi = −1 je-li i-tý hlas pro kandidáta B. Je tedy n = α + β. Součet Sk = k i=1 Xi popisuje o kolik vede A nad B v čase k (případně prohrává je-li Sk < 0). Podle věty o volbách je trajektorií z bodu (0, 0) do bodu (α + β, α − β), které se nedostanou do 0 přesně α − β α + β Nα+β (0, α − β) . Hledaná pravděpodobnost je tedy α−β α+β Nα+β (0, α − β) Nα+β (0, α − β) = α − β α + β . Nyní se budeme zajímat o to, jaká je pravděpodobnost, že se náhodná procházka nevrátí do 0. Máme S0 = 0 a chceme S1 = 0, ..., Sn = 0, jinak řečeno S1S2...Sn = 0. Věta 2.3.5. Je-li S0 = 0, pak pro n ≥ 1 platí P(S1S2...Sn = 0 | Sn = b) = | b | n P(Sn = b), tedy P(S1S2...Sn = 0) = 1 n E(|Sn|). Důkaz: cvičení 2.3.4 Generující funkce Uvažujeme posloupnost reálných čísel a = {ai; i = 0, 1, 2, ..} . Taková posloupnost obsahuje velké množství informace, kterou můžeme výhodně “zakódovat” do jediného objektu (funkce), s nímž budeme moci lépe pracovat. Mimo jiné získáme možnost použít operace (např. derivaci) které pro posloupnosti nemají smysl. 19 Definice 2.3.6. Generující funkce posloupnosti a je funkce daná součtem mocninné řady Ga(s) = ∞ i=0 aisi pro s ∈ R, pro která řada konverguje. Posloupnost a dostaneme z generující funkce Ga zpět vztahem ai = G (i) a (0) i! , kde G (i) a (0) je i-tá derivace Ga v bodě 0. Příklad 2.3.7. Nechť a = {0, 1, 0, −1, 0, 1, 0, ...} . Pak Ga = s − s3 + s5 − s7 + ... , což je geometrická řada s prvním členem s a s kvocientem q = −s2 . Tedy Ga(s) = s 1 + s2 pro | s |< 1 (obor konvergence). Dále budeme definovat generující funkci diskrétní náhodné veličiny. Definice 2.3.8. Nechť X je diskrétní náhodná veličina, která nabývá hodnoty v množině {0, 1, 2, ...} , s pravděpodobnostní funkcí f(i) = P(X = i). Generující funkce této náhodné veličiny je definovaná jako generující funkce její pravděpodobnostní funkce, tedy GX(s) = ∞ i=0 f(i)si = ∞ i=0 P(X = i)si . Platí zřejmě GX(s) = E(sX ). Základní vlastnosti generujících funkcí: 1. Existuje nezáporné číslo R (poloměr konvergence) takové, že G(s) konverguje pro | s |< R a diverguje pro | s |> R. 20 2. G(s) můžeme derivovat nebo integrovat člen po členu, libovolně mnohokrát, pro | s |< R. 3. Jednoznačnost: Je-li Ga(s) = Gb(s) pro | s |< R , kde 0 < R ≤ R, pak an = bn pro všechna n. Příklady generujících funkcí náhodných veličin: 1. Konstantní náhodná veličina. P(X = c) = 1, kde c ∈ N ∪ {0}. Máme GX(s) = 1sc = sc . 2. Bernoulliho náhodná veličina. P(X = 1) = p a P(X = 0) = 1 − p. Tedy GX(s) = ps1 + (1 − p)s0 = 1 − p + ps. 3. Geometrické rozdělení. P(X = n) = p(1−p)n−1 pro n ∈ N. Dostaneme GX(s) = ∞ i=0 f(i)si = ∞ n=1 p(1 − p)n−1 sn = ∞ n=1 ps [(1 − p)s]n−1 = = ps ∞ n=0 [(1 − p)s]n = sp 1 − (1 − p)s = sp 1 − s + sp . 4. Poissonovo rozdělení s parametrem λ. P(X = k) = λk k! e−λ . Tedy GX(s) = ∞ i=0 λi i! e−λ si = e−λ ∞ i=0 (λs)i i! = e−λ eλs = eλs−λ = eλ(s−1) , s využitím n xn n! = ex . 2.3.5 Charakteristiky náhodných veličin a jejich generující funkce Základní charakteristiky náhodných veličin, E(X) a V ar(X), lze jednoduše spočítat pomocí GX(s). Věta 2.3.9. Nechť X je náhodná veličina s generující funkcí G(s). Pak platí: 1. E(X) = GX(1). 21 2. Obecně, E(X(X − 1)...(X − k + 1)) = G(k) (1) (tzv. k-tý faktoriální moment). Důkaz: První tvrzení je speciální případ druhého. Máme G(k) (s) = i si−k i(i − 1)...(i − k + 1)f(i) = = E(sX−k X(X − 1)...(X − k + 1)). Pro s → 1− dostaneme GX(1) = E(X(X − 1)...(X − k + 1)). Pro rozptyl dostaneme speciálně vztah V ar(X) = E(X2 ) − E(X)2 = E(X(X − 1) + X) − E(X)2 = = E(X(X − 1)) + E(X) − E(X)2 = GX(1) + GX(1) − [GX(1)] 2 . 2.3.6 Součty náhodných veličin a konvoluce Něchť a = {ai, i ≥ 0} a b = {bi, i ≥ 0} jsou dvě posloupnosti, pak konvoluce c = a b je posloupnost definovaná vztahem cn = a0bn + a1bn−1 + ... + anb0. Jsou-li Ga, Gb generující funkce posloupností a a b, pak generující funkce posloupnosti c je Gc(s) = ∞ n=0 cnsn = ∞ n=0 n i=0 aibn−i sn = = ∞ i=0 aisi ∞ n=i bn−isn−i = ∞ i=0 aisi ∞ n=0 bnsn = Ga(s)Gb(s). Tím jsme dokázali následující tvrzení. Věta 2.3.10. Generující funkce konvoluce dvou posloupností je součinem 22 generujících funkcí těchto posloupností. Věta 2.3.11. Nechť X a Y jsou nezávislé náhodné veličiny. Pak GX+Y (s) = GX(s)GY (s). Důkaz: Víme, že pro pravděpodobnostní funkci X +Y platí fX+Y = fX fY (z nezávislosti) a podle předchozí věty víme, že generující funkce konvoluce je součin generujících funkcí. Tedy GX+Y = GXGY . Je-li S = X1 + X2 + ... + Xn, kde Xi jsou nezávislé, pak z předchozí věty plyne GS = GX1 GX2 ...GXn . Definice 2.3.12. Sdružená pravděpodobnostní generující funkce náhodných veličin, nabývajících hodnot v N ∪ {0}, je definovaná jako GX1,X2 (s1, s2) = P (X1 = i ∧ X2 = j) si 1sJ 2 = E(sX1 1 sX2 2 ) Analogicky je možné definovat sdruženou pravděpodobnostní generující funkci pro více náhodných veličin. 2.3.7 Generující funkce a náhodná procházka Uvažujme opět náhodnou procházku Sn = n i=1 Xi, kde P(Xi = 1) = p a P(Xi = −1) = q = 1 − p. Přitom Xi jsou nezávislé a S0 = 0. Jak často se náhodná procházka vrací do počátku? Jaké je pravděpodobnostní rozdělení prvního návratu do počátku? (Pro další návraty je to opět 23 totéž, z nezávislosti Xi.) K zodpovězení těchto otázek využijeme generující funkce. Označme p0(n) = P(Sn = 0) pravděpodobnost, že náhodná procházka je v 0 v čase n a f0(n) = P(S1 = 0, S2 = 0, ..., Sn−1 = 0, Sn = 0) pravděpodobnost, že první návrat do počátku nastal v čase n. Uvažujme generující funkce těchto dvou posloupností, P0(s) = ∞ n=0 p0(n)sn a F0(s) = ∞ n=0 f0(n)sn . Máme p0(0) = 1 (neboť S0 = 0) a f0(0) = 0. Lemma 2.3.13. Platí P0(s) = 1 − 4pqs2 −1 2 . Důkaz: Víme, že Sn = 0 ⇔ počet kroků doprava = počet kroků doleva, tedy r = n 2 = l. Počet takových cest je n n 2 pro n sudé a 0 pro n liché. Označme k = n 2 , tj. n = 2k. Máme p0(2k) = 2k k pk qk a P0(s) = ∞ k=0 2k k (pqs2 )k . (2.1) Tvrdíme, že P0(s) = 1√ 1−4pqs2 . Využijeme obecného binomického rozvoje (1 + x)a = ∞ n=0 a n xa , 24 kde a n = a (a − 1) ... (a − n + 1) n! . Pro a ∈ N je rozvoj konečný, pro a ∈ R ∧ a /∈ N je rozvoj nekonečný. Dosazením a = −1 2 a x = −4pqs2 dostaneme 1 − 4pqs2 −1 2 = ∞ k=0 −1 2 k −4pqs2 k = (2.2) ∞ k=0 −1 2 k (−4)k pqs2 k . Porovnáním 2.1 a 2.2 tedy stačí dokázat, že −1 2 k (−4)k = 2k k . Pro levou stranu dostaneme −1 2 −3 2 −5 2 ... −2k−1 2 k! (−1)k 22k = 2k (−1)2k 1 · 3 · 5 · ...(2k − 1) k! = 2k 1 · 3 · 5 · ... · (2k − 1) k! . Pro pravou stranu 2k k = 2k (2k − 1) (2k − 2) ...1 k!k! = 2k k! (2k − 1) (2k − 3) ...3 · 1 k!k! = 2k (2k − 1) (2k − 3) ...3 · 1 k! . Tedy obě strany se rovnají. Tím je lemma dokázáno. Věta 2.3.14. Platí 1) P0(s) = 1 + P0(s)F0(s) a 2) F0(s) = 1 − 1 − 4pqs2 1 2 . Důkaz: Označme A jev, že Sn = 0 a nechť Bk jsou jevy první návrat do počátku nastal v k-tém kroku (k = 1, 2, ..., n). 25 1) Bk jsou disjunktní a dávají rozklad, tedy P(A) = n k=1 P(A | Bk)P(Bk). Máme P(Bk) = f0(k) a P(A | Bk) = p0(n − k). Tedy p0(n) = n k=1 p0(n − k)f0(k). Vynásobíme sn a sečteme, ∞ n=1 p0(n)sn = ∞ n=1 n k=1 p0(n − k)f0(k)sn = ∞ k=1 f0(k)sk ∞ n=k p0(n − k)sn−k = P0(s)F0(s). Protože ∞ n=1 p0(n)sn = P0 − 1, dostáváme P0 − 1 = P0F0, tedy P0 = 1 + P0F0. Pro důkaz 2) dostáváme z 1) F0 = P0 − 1 P0 = 1 − 1 P0 = 1 − 1 − 4pqs2. Důsledek 2.3.15. Pravděpodobnost toho, že se částice někdy vrátí do počátku je rovna ∞ n=1 f0(n) = F0(1) = 1− | p − q | . Speciálně, pro symetrickou náhodnou procházku (p = q) je návrat jistý. Důsledek 2.3.16. (Pólyova věta v dimenzi 1) Symetrická náhodná procházka se s pravděpodobností 1 vrátí do počátku. Důsledek 2.3.17. Je-li p = q = 1 2 , tedy návrat je jistý, pak očekávání času T0 prvního návratu do počátku je E(T0) = ∞ n=1 nF0(n) = F0(1) = ∞. Důkaz: 26 1. Máme F0(1) = 1 − 1 − 4pq = 1 − 1 − 4p(1 − p) = 1 − 1 − 4p + 4p2 = = 1 − (1 − 2p)2 = 1− | 1 − 2p |= 1− | 1 − p − p |= 1− | q − p | . Pro q = p = 1 2 je F0(1) = 1 − 0 = 1. 2. Je-li návrat jistý, tedy p = 1 2 , pak P(T0 = ∞) = 0, a tedy E(T0) = F0(1), kde F0 = 1 − 1 − 4pqs2. Máme F0 = − 1 2 1 1 − 4pqs2 (−4pq2s) = 4pqs 1 − 4pqs2 , tedy lim s→1− F (s) = +∞. 2.3.8 Časy navštívení bodu r Označme fr(n) = P(S1 = r, S2 = r, ..., Sn−1 = r, Sn = r) pravděpodobnost, že se náhodná procházka dostane poprvé do bodu r v čase n, s generující funkcí Fr(s) = ∞ n=0 fr(n)sn . Věta 2.3.18. Platí 1. Fr(s) = [F1(s)]r pro r ≥ 1, 2. F1(s) = 1−(1−4pqs2 ) 1 2 2qs . Důkaz: Označme Tr = min {n; Sn = r} počet kroků potřebných k dosažení hodnoty r poprvé. Nechť r > 0. Abychom dosáhli r, musíme se dostat nejdříve do bodu 1, a potom z bodu 1 do bodu r. To je z prostorové homogenity totéž jako dostat se z 0 do r − 1. Odtud plyne Tr = T1 + Tr−1. Z nezávislosti tedy dostaneme Fr = F1Fr−1. Máme f1(n) = P(S1 = 1, S2 = 1, ..., Sn−1 = 1, Sn = 1) =: P(A) = = P(A | S1 = 1)P(S1 = 1) + P(A | S1 = −1)P(S1 = −1) = = P(A | S1 = 1)p + P(A | S1 = −1)q = 0p + f2(n − 1)q. 27 Odtud f1(n) = f2(n − 1)q. Vynásobíme sn f1(n)sn = qf2(n − 1)sn a sečteme přes n > 1. Tedy n=2 f1(n)sn = n=2 qf2(n − 1)sn = n=2 sqf2(n − 1)sn−1 = sq n=1 f2(n)sn . Odtud dostáváme F1 − ps = F2qs. Víme, že F2 = F2 1 , tedy F1 − ps = F2 1 qs což vede ke kvadratické rovnici qsF2 1 − F1 + ps = 0. Řešením dostaneme dva kořeny F1 =    1− √ 4qps2 2qs 1+ √ 4qps2 2qs . Kořen 1+ √ 4qps2 2qs ale nevyhovuje zadání, protože má v bodě 0 limitu ∞. Tím je tvrzení dokázáno. Důsledek 2.3.19. Pravděpodobnost, že náhodná procházka někdy navštíví kladnou část reálné osy, je rovna min 1, p q . Důkaz: Hledaná pravděpodobnost je rovna pravděpodobnosti že náhodná procházka navštíví bod 1. Ta je rovna ∞ n=1 f1(n), součtu pravděpodobností, že se dostaneme do bodu 1 v nějakém čase n. Víme, že F1(s) = ∞ n=0 f1(n)sn . 28 Dosazením s = 1 dostaneme ∞ n=1 f1(n) = F1(1) = 1 − (1 − 4pq) 1 2 2q = 1 − 1 − 4p(1 − p) 2(1 − p) = 1 − (1 − 2p)2 2(1 − p) = 1− | 1 − 2p | 2(1 − p) = 1− | q − p | 2q = = 1−(−(q−p)) 2q = 1−p+q 2q = 2q 2q = 1 pro q < p 1−q+p 2q = 2p 2q = p q pro q > p . Příklad 2.3.20. Ruleta má 37 čísel (včetně 0). Budeme sázet stále na lichá čísla, tedy p = 18 37 a q = 19 37 . Pravděpodobnost, že budeme někdy vyhrávat je p q = 18 19 . 29 Kapitola 3 Zákony arcsinu a Pólyova věta 3.1 Zákony arcsinu pro symetrickou náhodnou procházku V této podkapitole uvedeme dva zákony arcsinu, pro časy pobytu napravo od počátku (tj. v kladných hodnotách) a pro poslední navštívení počátku. 3.1.1 1. zákon arcsinu Věta 3.1.1. (1. zákon arcsinu pro poslední návštěvu počátku) Uvažujme symetrickou náhodnou procházku, t.j. p = 1 2 , a nechť S0 = 0. Pravděpodobnost, že poslední návštěva počátku do času 2n nastane v čase 2k, je rovna P (S2k = 0) P (S2n−2k = 0) . Důkaz: Označme α2n(2k) pravděpodobnost, že poslední návštěva počátku do času 2n nastane v čase 2k. Máme α2n(2k) = P (S2k = 0) P (S2k+1S2k+2...S2n = 0 | S2k = 0) . Z časové homogenity plyne α2n(2k) = P (S2k = 0) P (S1S2...S2n−2k = 0 | S0 = 0) . Tvrzení tedy plyne z následujícího lemmatu. Lemma 3.1.2. Pro symetrickou náhodnou procházku platí: P(S1...S2m = 0) = P(S2m = 0), 30 kde P(S2m = 0) = 2m m 1 2 2m . Důkaz: Využijeme důsledek věty o volbách: Je-li S0 = 0, pak pro n ≥ 1 platí P (S1S2...Sn = 0) = 1 n E (| Sn |) . Dále ze symetrie plyne P(S1...S2m = 0) = 1 2m E(| S2m |) = 2 1 2m m k=1 2kP(S2m = 2k) = 2 m k=1 2k 2m P(S2m = 2k) = 2 m k=1 2k 2m 2m m + k 1 2 2m = 2 1 2 2m m k=1 2m − 1 m + k − 1 − 2m − 1 m + k . neboť platí 2m − 1 m + k − 1 − 2m − 1 m + k = 2k 2m 2m m + k . Opravdu, máme (2m − 1) ... (m − k + 1) (m + k − 1)! − (2m − 1) ... (m − k) (m + k)! = = (m + k) (2m − 1) ... (m − k + 1) − (2m − 1) ... (m − k + 1) (m − k) (m + k)! = (2m − 1) ... (m − k + 1) [(m + k) − (m − k)] (m + k)! = 2k 2m 2m (2m − 1) ... (m − k + 1) (m + k)! = = 2k 2m 2m m + k . V posledním členu výraz se sumou je tzv. teleskopický součet. Z takovéhoto součtu nám zůstane jen první a poslední člen, ostatní se vyruší. Odtud plyne, že 2 1 2 2m m k=1 2m − 1 m + k − 1 − 2m − 1 m + k = 2 1 2 2m 2m − 1 m − 2m − 1 2m = 2 1 2 2m 2m − 1 m = 1 2 2m (2m − 1) ...m2 m! 31 = 1 2 2m 2m (2m − 1) ... (m + 1) m! = 1 2 2m 2m m = P (S2m = 0) , a odtud plyne tvrzení věty. V následující podkapitole uvidíme proč se těmto tvrzením říká zákon arcsinu. 3.1.2 Stirlingova formule Chceme porovnat hodnotu n! (která se v různých formách vyskytuje v kombinačních číslech pro počty trajektorií) s mocninnými funkcemi. Víme, že nn n (n − 1) ...21 2n , tedy nn n! 2n . Jak rychle jde ale posloupnost an = n! nn k nule? Lze ji srovnat s geometrickou posloupností? Pro n → ∞ dostaneme an+1 an = (n+1)! (n+1)n+1 n! nn = n! (n+1)n n! nn = n n + 1 n = 1 e . Tedy (zatím jen hodně přibližně) můžeme psát n! nn ∼ 1 en , neboli n! ∼ nn en . Stirlingova formule dává přesnější odhad. Platí n! ≈ nn en √ 2πn v tom smyslu, že limn→∞ n! nn en √ 2πn = 1. Ze Stirlingovy formule dostaneme odhad na hodnotu u2k = P (S2k = 0) . Lemma 3.1.3. Platí u2k ≈ 1√ πk pro k → ∞, tedy lim k→∞ u2k 1√ πk = 1. Důkaz: Máme u2k = P (S2k = 0) = 2k k 1 2 2k 32 = (2k)! k! (2k − k)! 1 2 2k = (2k)! (k!)2 1 2 2k ≈ (2k)2k e2k √ 2π2k kk ek √ 2πk 2 1 2 2k = 22k k2k √ 2π2k kk √ 2πk 2 1 22k = √ 2 √ 2πk = 1 √ πk . Tím je lemma dokázáno. Podle zákonu arcsinu je α2n(2k) = u2ku2n−2k, tedy P (S2k = 0 ∧ S2k+1...S2n = 0) = P (S2k = 0) P (S2n−2k = 0) . Ze Stirlingova vzorce máme α2n(2k) ≈ 1 √ πk 1 π (n − k) = 1 π k (n − k) . Hodnota k (n − k) je maximální pro k = n 2 , tedy α2n(2k) je minimální pro k = n 2 . Označme T2n čas posledního navštívení bodu 0 do času 2n. Pak pro x ∈ (0, 1) máme P (T2n ≤ 2xn) = k≤xn 1 π k (n − k) . = xn 0 1 π u (n − u) du = 2 π arcsin x n , neboť 2 arcsin x n = 2 1 1 − x n 1 2 1 x n 1 n = 1 1 − x n x n n = 1 (n−x)x n2 n = 1 (n − x) x . 33 3.1.3 2. zákon arcsinu 2. zákon arcsinu se týká časů pobytu na jedné straně od počátku (tj. doby, kdy jeden z hráčů byl ve vedení). Věta 3.1.4. Nechť p = 1 2 a S0 = 0. Pravděpodobnost, že náhodná procházka stráví přesně 2k časových intervalů napravo od počátku je (opět) rovna P (S2k = 0) P (S2n−2k = 0) . Důkaz: učebnice Grimmett, Stirzaker. 3.2 Pólyova věta v Rn Definice 3.2.1. Mějme posloupnost náhodných vektorů X1, X2, ..., Xn, ..., kde Xi = X (1) i , X (2) i , ..., X (m) i je m-rozměrný vektor. Nechť platí P X (j) i = 1 = 1 2 a P X (j) i = −1 = 1 2 pro všechna i ∈ N a pro všechna j ∈ {1, 2, ..., m}, a všechna X (j) i jsou navzájem nezávislé náhodné veličiny. m-rozměrná náhodná procházka je definována vztahem S(j) n = S (j) 0 + n k=1 X (j) k , tedy vektorově Sn = S0 + n k=1 Xk. Pro m = 2 uvažujme množinu mřížových bodů Z2 = {(i, j) | i, j ∈ Z} = Z ⊕ Z. Nechť S0 = (0, 0), pak P [S1 = [1, 1]] = P [S1 = [−1, −1]] = 34 = P [S1 = [−1, 1]] = P [S1 = [1, −1]] = 1 4 Věta 3.2.2. (Pólyova věta): Pravděpodobnost, že se náhodná procházka vrátí nekonečněkrát zpět do počátku je rovna 1 pro m = 1 a m = 2 a je rovna 0 pro m > 2. Poznamenejme, že pro m = 3 je pravděpodobnost alespoň jednoho návratu do počátku . = 0, 35. Důkaz: Jako u jednorozměrné procházky označme p0 (n) = P (Sn = 0) pravděpodobnost návratu v čase n, a f0 (n) = P (Sn = 0 ∧ S1S2...Sn−1 = 0) pravděpodobnost prvního návratu v čase n. Nechť P0 a F0 jsou generující funkce těchto posloupností. Víme, že platí F0 = 1 − 1 P0 . Máme P (částice se někdy vrátí do počátku) = ∞ n=1 f0 (n) = F0 (1) = 1 − 1 P0 (1) , kde ale P0 (1) = ∞ n=1 p0 (n) . Odtud dostáváme, že P (částice se někdy vrátí do počátku) =    1 pokud ∞ n=1 p0 (n) diverguje < 1 pokud ∞ n=1 p0 (n) konverguje Podle Stirlingovy formule víme, že u2k ≈ 1√ πk . Pro m = 1 je z nezávislosti komponent p0 (n) = P (Sn = 0) ≈ 1 πn 2 = 2 π 1 √ n . 35 Víme, že ∞ n=1 1 √ n diverguje, protože ∞ n=1 1 ns konverguje pro s > 1 (z integrálního kriteria). Pro m > 1 je P (Sn = 0) = P S(1) n = S(2) n = ... = S(m) n = 0 = P S(1) n = 0 m , tedy p0 (n) = P (Sn = 0) ≈ 2 π 1 √ n m = 2 π m 2 1 n m 2 . Dále ∞ n=1 p0 (n) ≈ ∞ n=1 1 n m 2 konverguje pro m 2 > 1, tj. m > 2. Tedy pro m > 2 je hledaná pravděpodobnost alespoň jednoho návratu do počátku menší než 1, pro m = 1 a m = 2 je tato pravděpodobnost 1. Pravděpodobnost nekonečně monoha návratů je tedy rovna 0 pro m > 2 a rovna 1 pro m ≤ 2. 36 Kapitola 4 Poissonův proces 4.1 Základní vlastnosti Poissonova procesu Definice 4.1.1. Poissonův proces s intenzitou λ je proces N = {N(t) : t ≥ 0} nabývající hodnoty v S = {0, 1, 2, . . . } takový, že 1. N(0) = 0 a pro s < t je N(s) < N(t). 2. P(N(t + h) = n + m|N(t) = n) =    λh + o(h) pro m = 1 o(h) pro m > 1 1 − λh + o(h) pro m = 0 . 3. Je-li s < t, pak počet N(t) − N(s) událostí v intervalech [s, t] je nezávislý na N(s), t.j. počtu událostí v [0, s]. N(t) . . . počet příchodů, událostí, emisí do času t. N je tzv. čítací proces. Je také příkladem Markovovského řetězce ve spojitém čase. Zajímá nás rozložení N(t). Věta 4.1.2. N(t) má Poissonovo rozdělení s parametrem λt, tedy P(N(t) = j) = (λt)j j! e−λt , j = 0, 1, 2, . . . Důkaz. Podmíníme N(t + h) hodnotou N(t): 37 P(N(t + h) = j) = i P(N(t) = i) P(N(t + h) = j|N(t) = i) = i P(N(t) = i) P((j − i) příchodů v čase (t, t + h)) = P(N(t) = j − 1) P(1 příchod) + P(N(t) = j) P(žádný příchod) + o(h). Tedy pj(t) = P(N(t) = j) splňuje pj(t + h) = λhpj−1(t) + (1 − λh) · pj(t) + o(h) pro j = 0 p0(t + h) = (1 − λh) · p0(t) + o(h). V první rovnici odečteme pj(t), vydělíme h a necháme h → 0. Pak pj(t) = λpj−1(t) − λpj(t) pro j = 0 (4.1) a podobně z 2.rovnice p0(t) = −λp0(t). Okrajové podmínky jsou pj(0) = δj0 = 1 pro j = 0 0 pro j = 0. To je systém diferenčně-diferenciálních rovnic pro pj(t). Řešení najdeme pomocí generujících funkcí (v proměnné s a s parametrem t). Definujeme G(s, t) = ∞ 0 pj(t)sj = E(sN(t) ). Rovnici 4.1 vynásobíme sj a sečteme přes j. Dostaneme ∂G ∂t = λ(s − 1)G s okrajovou podmínkou G(s, 0) = 1. Řešení je zřejmě G(s, t) = eλ(s−1)t = e−λt ∞ 0 (λt)j j! sj 38 Uvedeme si ještě důležitou alternativní definici. Definice 4.1.3. Nechť T0, T1, . . . jsou dány vztahem T0 = 0, Tn = inf{t : N(t) = n}. Pak Tn se nazývá čas n-tého příchodu. Definice 4.1.4. Definujeme časy mezi příchody (Inter-arrival times) jako náhodné veličiny Xn = Tn − Tn−1. Ze znalosti N(t) umíme najít hodnoty Xn. Naopak z Xn lze zrekonstruovat N(t) pomocí Tn = n 1 Xi; N(t) = max{n; Tn ≤ t}. Věta 4.1.5. Náhodné veličiny X1, X2, . . . jsou nezávislé a mají exponenciální rozdělení s parametrem λ. Připomenutí: Náhodná veličina X má exponenciální rozdělení s parametrem λ > 0, jestliže její distribuční funkce je F(x) = 1 − e−λx x ≥ 0 (4.2) Uvažujme Bernoulliho pokusy v časech δ, 2δ, 3δ, . . . a nechť W je čas čekání na 1.úspěch. Pak P(W > kδ) = (1 − p)k a EW = δ p . Zvolme t pevně. Do času t jsme udělali přibližně k = t δ pokusů. Nechť δ → 0. Abychom dostali netriviální limitu, musí také p → 0. Nechť p δ → λ. Pak P(W > t) = P W > t δ · δ ∼= (1 − λδ) t δ → e−λt Důkaz. Nejdřív uvažujeme X1: P(X1 > t) = P(N(t) = 0) = e−λt . Dále podmíníme X2 hodnotou X1, P(X2 > t|X1 = t1) = P(žádný příchod v [t1, t1 + t]|X1 = t1). 39 Událost {X1 = t1} se vztahuje k intervalu [0, t1], zatímco událost ”žádný příchod v [t1, t1+t]” k času > t1. Z definice Poissonova procesu jsou nezávislé, tedy P(X2 > t|X1 = t1) = P(žádný příchod v [t1, t1 + t]) = e−λt . Tedy X2 je nezávislá na X1 a má stejné rozdělení. Tvrzení dále plyne analogicky, indukcí přes n. 4.2 Cramér - Lundbergův model Cramér - Lundbergův model je základním modelem v matematické teorii neživotního pojištění. Předpoklady Cramér - Lundbergova modelu: 1. Pojistné nároky nastávají v časech 0 ≤ T1 ≤ T2 ≤ . . . , což jsou časy příchodu homogenního Poissonova procesu N(t) 2. Pojistný nárok přicházející v i-tém čase Ti má velikost Xi. Posloupnost Xi tvoří nezávislé stejně rozdělené nezáporné náhodné veličiny 3. Posloupnosti Ti a Xi jsou navzájem nezávislé. Tedy i N(t) a Xi jsou nezávislé. Definice 4.2.1. Proces S(t) = N(t) i=1 Xi, který popisuje celkový pojistný nárok do času t se nazývá složený Poissonův proces 4.3 Inspekční paradox Uvažujme homogenní Poissonův proces s intenzitou λ a předpokládejme, že se právě nacházíme v pevně danném čase t. Přirozená otázka je jaké má rozdělení doba od posledního příchodu, a naopak doba do nejbližšího následujícího příchodu. Označme B(t) = t − TN(t) 40 čas od posledního příchodu a F(t) = TN(t)+1 − t čas do následujícího příchodu. Zajímá nás sdružené rozdělení náhodných veličin B(t) a F(t). Speciálně, co můžeme na základě znalosti B(t) řici o F(t)? Intuitivně by se mohlo zdát, že čím delší je B(t), tím kratší by mělo být čekání na další příchod. Přesto výpočet sdruženého rozdělení ukazuje že B(t) a F(t) jsou nezávislé. Tento výsledek se obvykle nazývá inspekční paradox. 41 Kapitola 5 Diskrétní modely ve finanční matematice V této kapitole se budeme věnovat 1-krokovým a vícekrokovým diskrétním modelům finančního trhu. Jak uvidíme, vícekrokový (binomický) model je založen na jednoduché náhodné procházce. 5.1 1-krokový model Uvažujeme jednu pevně zvolenou akcii, a předpokládejme, že – v čase t = 0 je cena akcie S0 známá hodnota, – v čase t = 1 je cena akcie S1 náhodná veličina (neznámá hodnota). Hodnota S1(ω) je funkcí tržního scénáře ω ∈ Ω, kde Ω = {ω1, ..., ωk} je prostor tržních scénářů Dále předpokládejme, že existuje bezrizikové aktivum, jehož hodnota v čase t = 0 je rovna 1 a v čase t = 1 je rovna er za všech tržních scénářů. Hodnota r se nazývá bezriziková úroková míra. Předpokládáme, že úroková míra je stejná jak pro půjčování, tak pro ukládání peněz. Příklad 5.1.1. Forwardová smlouva (uzavřená v čase t = 0) je následující závazný kontrakt: V čase t = 1 koupí X od Y jednu akcii za cenu F. Za uzavření smlouvy se neplatí. Jaká je “správná” cena F? Věta 5.1.2. Jestliže neexistuje arbitráž, pak jediná možná cena ve forwardové smlouvě je F = S0er . 42 Arbitráží je míněna možnost jak si bez rizika zajistit zisk “z ničeho”. Přesnou definici si uvedeme za chvilku. Důkaz: Dokážeme, že jak F > S0er , tak F < S0er vede k arbitráži. 1) Nechť F > S0er (výhodné pro Y ). Uvažujme následující strategii: t = 0 ... Y si vypůjčí v bance S0, koupí akcii a uzavře forwardovou smlouvu na prodej akcie. t = 1 ... Y prodá akcii za F, do banky vrátí S0er . Zůstane mu bezrizikový zisk F − S0er > 0, strategie tedy dává arbitráž. 2) Nechť F < S0er (výhodné pro X) Uvažujme teď tuto strategii: t = 0 ... X prodá akcii na krátko (tedy vypůjčí si akcii – tzv. short-selling) za S0, uloží výnos do banky a uzavře forwardovou smlouvu na koupi akcie. t = 1 ... X dostane z banky S0er , koupí akcii za F a vrátí ji (tj. uzavře krátkou pozici). Zůstane mu S0er − F > 0, tj. bezrizikový zisk. Opět je to arbitráž. Tedy pokud neexistuje arbitráž, pak F = S0er . Příklad 5.1.3. Evropská call opce dává držiteli právo koupit akcii v čase t = 1 za cenu K (tzv. realizační cena opce). Kupec opce zaplatí v čase t = 0 za toto právo prodejci cenu V0. Jaká je férová cena V0? V čase t = 0 neznáme S1. Držitel opce ji v čase t = 1 uplatní, je-li K < S1 (jinak koupí akcii levněji na trhu). Tedy hodnota v čase t = 1 je V1 = (S1 − K)+ = S1 − K pokud S1 > K 0 pokud S1 ≤ K . 43 Výplatní funkce Evropské call opce K S1 V1 Jaká je hodnota V0? Předpokládejme, že existují dva možné tržní scénáře (ω1, ω2) a nechť pro t = 1 máme S1(ω1) = d1 a S1(ω2) = d2. S0 S1 = d2 … ω2 S1 = d1 … ω1 Chceme určit V0, za předpokladů 1. d1 < K < d2 44 2. d1 ≤ S0er ≤ d2 (pro S0er < d1 ≤ d2 dostaneme arbitráž a stejně tak v opačném případě). Uvažujme portfolio (x1, x2, x3) ∈ R3 , kde x1 je počet aktiv peněžního trhu (bezrizikových), x2 je počet akcií a x3 počet opcí. Hodnota portfolia v čase t = 1 za scénáře ω1 je y1 = x1er + x2d1 + 0x3 Hodnota portfolia v čase t = 1 za scénáře ω2 je y2 = x1er + x2d2 + (d2 − K)x3 Zobrazení T : (x1, x2, x3) → (y1, y2) je lineární zobrazení z R3 → R2 , které má nenulové jádro dimenze 1. Tedy pro portfolio (0, 0, 1) existuje jednoznačné portfolio (x1, x2, 0), které má stejnou hodnotu jako (0, 0, 1) v obou scénářích (tzv. replikující portfolio). Hodnoty x1 a x2 najdeme řešením rovnic x1er + x2d1 = 0 pro V1 (ω1) a x1er + x2d2 = d2 − K pro V1 (ω2). Řešením dostaneme: x1 = −d1e−r (d2 − K) d2 − d1 a x2 = d2 − K d2 − d1 . Portfolio (x1, x2, 0) má stejnou hodnotu jako (0, 0, 1) v každém scénáři. Musí mít tedy stejnou hodnotu i v čase t = 0 (jinak by existovala arbitráž). Tedy V0 = −e−r d1(d2 − K) d2 − d1 1 + d2 − K d2 − d1 S0 = (d2 − K) er S0 − d1 d2 − d1 e−r + 0 = e−r V1 (ω2) p + V1 (ω1) (1 − p) , 45 kde V1 (ω1) = 0, e−r je diskontní faktor a p = er S0 − d1 d2 − d1 se nazývá “tržní” (risk-neutrální, rovnovážná) pravděpodobnost scénáře ω2. Tedy V0 je diskontované očekávání hodnoty opce v čase t = 1 vzhledem k tržní pravděpodobnostní míře. 5.2 Základní věta APT APT označuje arbitrážní teorii oceňování (Arbitrage Pricing Theory). Uvažujme trh s K aktivy A1 , ..., AK volně obchodovatelnými, kde A1 je bezrizikové aktivum. Cena podílu aktiva Aj v čase t = 0 je Sj 0 (známá hodnota). Dále máme tržní scénáře Ω = {ω1, ..., ωN }. Předpokládejme, že A1 je bezrizikové, tj. S1 1(ωj) = er pro všechna j = 1, ..., N, kde r je úroková míra. Sj 1 (ωi) bude označovat hodnotu aktiva Aj v čase t = 1 za scénáře ωi. Jsou to tedy náhodné veličiny, neboli funkce na prostoru tržních scénářů Ω. Celkem dostáváme matici N × K s prvky Sj 1 (ωi). Definice 5.2.1. Portfolio je vektor Θ = (θ1, θ2, ..., θK) ∈ RK , kde θj je počet podílů aktiva Aj v portfoliu. Pro θj < 0 je majitel v krátké pozici v aktivu Aj (o velikosti | θj |). V čase t = 0 je hodnota Θ rovna V0 (Θ) = K j=1 θjSj 0. Pro t = 1 závisí hodnota Θ na ωi, V1 (Θ, ωi) = K j=1 θjSj 1 (ωi) . 46 Definice 5.2.2. Arbitráž je portfolio, které “získává peníze z ničeho”, tj. formálně buď V0 (Θ) ≤ 0 a V1 (Θ, ωj) > 0 pro všechna ωj ∈ Ω, nebo V0 (Θ) < 0 a V1 (Θ, ωj) ≥ 0 pro všechna ωj ∈ Ω. Definice 5.2.3. Pravděpodobnostní míra πi = π(ωi) na množině Ω všech scénářů je rovnovážná pravděpodobnostní míra (neboli risk-neutrální míra), jestliže pro všechna Aj je hodnota podílu v čase t = 0 rovna diskontovanému očekávání vzhledem k pravděpodobnostní míře π hodnoty podílu v čase t = 1. Tedy Sj 0 = e−r N i=1 π(ωi)Sj 1(ωi) pro všechna j = 1, ..., K, kde e−r je diskontní faktor. Věta 5.2.4. (Základní věta APT): Rovnovážná pravěpodobnostní míra existuje právě tehdy, když neexistuje arbitráž. Důkaz: Implikace ⇐ je snadná. Jestliže existuje rovnovážná pravděpodobnostní míra π a Θ je portfolio, jehož hodnota v čase t = 1 je ≥ 0 za všech scénářů, pak V0(Θ) = e−r N i=1 π(ωi)V1(Θ, ωi) ≥ 0, odkud plyne že Θ není arbitráž (a arbitráž tedy neexistuje). Nyní chceme dokázat opačnou implikaci: Neexistuje-li arbitráž, pak existuje rovnovážná pravděpodobnostní míra taková, že Sj 0 = e−r N i=1 π(ωi)Sj 1(ωi). Pro j = 1 platí tento vztah automaticky, 1 = S1 0 = e−r N i=1 π(ωi)er 47 = e−r N i=1 π(ωi)S1 1(ωi). Uvažujme nyní 2 ≤ j ≤ K. Označme ε množinu všech vektorů tvaru y = (y2, ..., yK), kde yj = e−r N i=1 π(ωi)Sj 1(ωi) pro všechna j = 2, 3, ..., K, pro nějakou pravděpodobnostní míru π. ε ⊆ RK−1 je uzavřený konvexní polyedr. Je konvexním obalem svých extrémních bodů, které odpovídají pravděpodobnostem π (ωi) = 1, π (ωj) = 0 pro j = 0. Chceme dokázat, že neexistuje-li arbitráž, pak S = S2 0, ..., SK 0 ∈ ε. Jinak řečeno, pokud S /∈ ε, pak existuje arbitráž. Využijeme větu o oddělující nadrovině. Věta 5.2.5. (Věta o oddělující nadrovině:) Nechť F ⊆ Rn je uzavřená konvexní množina a x /∈ F. Pak existuje v ∈ Rn tak, že v · x < v · y pro všechna y · F, kde · je skalární součin. Důkaz: Nechť a je nejbližší bod v F k bodu x, pak vektor a−x má hledané vlastnosti. Podle této věty máme S ∈ ε ⇒ ∃Θ = (θ2, ..., θK) = 0 tak, že pro všechna y ∈ ε platí: y · Θ > S · Θ . ε obsahuje extrémní body, tedy pro všechna i platí: e−r K j=2 θj · Sj 1(ωi) > K j=2 θj · Sj 0. Levou stranu nerovnosti označme Ci, pravou stranu D. Ukážeme, že existuje arbitráž. Zvolme θ1 tak aby Ci > θ1 > D pro všechna i. Pak portfolio (−θ1, θ2, ..., θK) je arbitráž. Jeho hodnota v čase t = 0 je < 0 a hodnota v čase t = 1 je > 0 pro všechna ωi. Uvažujeme evropskou call opci, jejíž výplatní funkce je 48 V1 = (S1 − K)+. Dále S1(ωi) = di pro i = 1, 2 a d1 < d2. Pokud neexistuje arbitráž, pak existuje π taková, že cena akcie v t = 0 je diskontované očekávání S0 = e−r · (π(ω1) · d1 + π(ω2) · d2) , a navíc víme, že π(ω1) + π(ω2) = 1. Speciálně tedy platí d1 < S0er < d2 (v předchozím to byl předpoklad, teď to platí automaticky). Dostaneme π(ω1) = d2 − S0er d2 − d1 a π(ω2) = S0er − d1 d2 − d1 . Je-li opce volně obchodovatelná, a má-li zůstat trh bez arbitráže, musí totéž platit i pro opci, tedy: V0 = π(ω2)(d2 − K) + π(ω1)0 = π(ω2)(d2 − K) = S0er − d1 d2 − d1 (d2 − K). 5.2.1 Jištění (Hedging) Uvažujme aktiva A1 , A2 , ..., AK , B. Nechť Sj t (ωi) a SB t (ωi) jsou ceny Aj , resp. B, v čase t a scénáři ωi, kde t = 0, 1. Definice 5.2.6. Portfolio Θ = (θ1, θ2, ..., θK) je replikující portfolio pro B, jestliže SB 1 (ωi) = K j=1 θjSj 1(ωi) pro všechna i = 1, ..., N. Věta 5.2.7. Nechť Θ = (θ1, θ2, ..., θK) je replikující portfolio pro B. Neexistujeli arbitráž, pak v čase t = 0 platí: SB 0 = K j=1 θjSj 0. Důkaz: Nechť tvrzení neplatí. Je-li SB 0 > K j=1 θjSj 0, pak portfolio (−1, θ1, θ2, ..., θK) 49 v aktivech B, A1 , A2 , ..., AK je arbitráž, protože K j=1 θjSj 0 − SB 0 < 0 a SB 1 (ωi) − K j=1 θjSj 1(ωi) = 0 pro všechna ωi ∈ Ω. Analogicky, pro SB 0 < K j=1 θjSj 0 vezmeme opačné portfolio. 5.3 Model s více periodami 5.3.1 Trh se dvěma periodami Uvažujme jedno bezrizikové aktivum a 1 rizikovou akcii. Tržní scénáře jsou nyní Ω = {(++) , (+−) , (−+) , (−−)} . 50 t = 0 t = 1 t = 2 + + - - + + + - Předpokládejme, že S1(+) = uS0 S1(−) = dS0 S2(++) = uS1(+) = u2 S0 S2(+−) = dS1(+) = udS0 S2(−+) = uS1(−) = duS0 S2(−−) = dS1(−) = d2 S0 (u jako up a d jako down.) Máme tři částečné trhy. V každém uděláme stejný výpočet jako v jednokrokovém modelu. Dostaneme rovnovážné pravděpodobnosti (pro jednoduchost předpokládejme, že r = 0) pu = 1 − d u − d 51 (S0 se vykrátí) a pd = u − 1 u − d . Celkem rovnovážná pravděpodobnostní míra bude: P(++) = p2 u, P(−−) = p2 d, P(+−) = P(−+) = pupd. 5.3.2 Vícekrokový model s T kroky Množina všech možných scénářů je v tomto případě Ω = {(+, +, +, ..., +) , (+, +, ..., +, −) , ..., (−, −, ..., −)} . Má 2T prvků, je tedy 2T možných scénářů. Pro scénář ω ∈ Ω je jeho rovnovážná pravděpodobnost P(ω) = pK u pT−K d , kde K je počet + ve scénáři ω. Chceme-li ocenit opci, její cena bude diskontované očekávání její hodnoty v čase T VT = (ST − K)+ vůči rovnovážné pravděpodobnostní míře. Pro jednoduchost uvažujme r = 0. Nechť m je nejmenší přirozené číslo takové, že S0um dT−m ≥ K. Máme tedy V0 = T n=m pn upT−n d T n S0un dT−n − K = T n=m (1 − d)n (u − 1)T−n (u − d)T T n S0un dT−n − K , kde T n je počet trajektorií s celkem n plusy. Poznámka. Položíme-li d = 1 u , pak v limitě pro T → ∞ a u = e σ√ T dostaneme Black-Scholesův spojitý model pro oceňování opcí. σ je parametr nazývaný volatilita. Model který jsme uvažovali v této podkapitole se také často nazývá binomický. Jeho autory jsou Cox, Ross a Rubinstein. 52 Kapitola 6 Martingaly 6.1 Férová hra Martingal je matematickým vyjádřením myšlenky “férové hry” Implicitně jsme se s tímto pojmem již setkali, v kapitole o diskrétních modelech trhu. Připomeňme, že v jednokrokovém modelu trhu se dvěma scénáři existuje rovnovážná pravděpodobnostní a platí S0 = e−r EP (S1) = E e−r S1 , Tedy cena v čase t = 0 je diskontované očekávání vzhledem k pravděpodobnosti P ceny v čase t = 1. Obecně, pro T-krokový model máme analogicky S0 = EP ST e−rT . Navíc, pro libovolný čas t ≤ T platí St = EP ST e−r(T−t) | S0, S1, ..., St , tedy St je podmíněné očekávání diskontované hodnoty ST , podmíněné informacemi o tržním scénáři, které máme v čase t. Jak uvidíme za chvilku, tato vlastnost znamená, že diskontovaný proces St je martingal. Připomeňme si ještě formální definici stochastického procesu. Definice 6.1.1. Mějme měřitelný prostor (Ω, A), množinu reálných čísel R a indexovou množinu T = ∅ (která hraje roli času). Dále mějme zobrazení X : 53 Ω×T → R, takové, že pro všechna t ∈ T je X (•, t) náhodná veličina (kterou značíme Xt). Pak takové zobrazení nazýváme stochastický proces definovaný na množině T. Značíme {Xt; t ∈ T}. Stochastické procesy dělíme na 4 základní typy: • diskrétní proces s diskrétním časem (např. náhodná procházka) • diskrétní proces se spojitým časem (např. Poissonův proces) • spojitý proces s diskrétním časem (např. Markovovy řetězce) • spojitý proces se spojitým časem (např. Wienerův proces) 6.2 Přirozená filtrace Definice 6.2.1. Ve vícekrokovém trhu se informace o tržním scénáři odhaduje krok po kroku. Pro t ≤ T definujeme Ft = {všechny jevy určené během prvních t period} . Zřejmě Ft je σ-algebra. Konečná posloupnost (Ft)0≤t≤T se nazývá přirozená filtrace prostoru tržních scénářů Ω. Obecně, systém σ-algeber (Ft)0≤t≤T se nazývá filtrace, jestliže platí Ft ⊆ Fs kdykoliv je t ≤ s. To znamená, že s rostoucím časem neztrácíme informace, σ-algebra se s rostoucím časem nezmenšuje, typicky se naopak zvětšuje. Příklad 6.2.2. 2-krokový model trhu. Množina tržních scénářů v tomto modelu je Ω = {(++) , (+−) , (−+) , (−−)} . V čase t = 0 jsou určeny pouze jevy Ω a ∅, tedy F0 = {∅, Ω} . V čase t = 1 jsou určeny jevy: F+ = {(++) , (+−)} a F− = {(−+) , (−−)}. Tedy F1 = {∅, Ω, F+, F−} . 54 V čase t = 2 jsou určeny všechny jevy (každá podmnožina Ω), tedy F2 = exp Ω = { všechny podmnožiny Ω} . Příklad 6.2.3. T- krokový model. Množina ΩT tržních scénářů je množina posloupností délky T se složkami + nebo -. Celkem je takových scénářů 2T . Částečný scénář je posloupnost ξ = (ξ1, ξ2, ..., ξt) délky t ≤ T, kde ξj = + nebo ξj = − pro j = 1, 2, ..., t. Množinu těchto scénářů označme Ωt. Pro každý částečný scénář ξ = (ξ1, ..., ξt) definujeme jev F (ξ) jako množinu všech úplných scénářů, jejichž prvních t složek jsou právě ξ1, ..., ξt. Tedy F (ξ) = {ω ∈ Ω : ωj = ξj pro všechna j = 1, 2, ..., t} . Úplné scénáře odpovídají koncovým uzlům stromu, částečné pak nekoncovým. σ-algebry Ft definujeme pak takto Ft = {všechna konečná sjednocení jevů F (ξ) , kde ξ=(ξ1, ξ2, ..., ξt) ∈ Ωt} Cena akcie v čase t závisí na tržním scénáři, ale jen na jeho složkách do času t, nezávisí na složkách scénáře v časech > t. Tedy proces ceny je adaptovaný přirozené filtraci, ve smyslu následující definice. Definice 6.2.4. Posloupnost náhodných veličin Xt je adaptovaná přirozené filtraci, jestliže pro každé t a pro každý tržní scénář ω = ξ1, ..., ξT hodnota Xt (ω) závisí jen na částečném scénáři ω1, ω2, ..., ωt. 6.3 Martingal Definice 6.3.1. Nechť F je přirozená filtrace prostoru tržních scénářů Ω = {ω1, ω2, ..., ωN } a P je pravděpodobnostní míra na Ω. Adaptovaná posloupnost náhodných veličin Xt se nazývá martingal, jestliže platí E (Xt+1 | Ft) = Xt pro všechna t ∈ {0, 1, ..., T − 1}. 55 Pokud E (Xt+1 | Ft) ≥ Xt mluvíme o submartingalu, pokud E (Xt+1 | Ft) ≤ Xt mluvíme o supermartingalu. Ft obsahuje veškeré informace dostupné v čase t. Často je tato informace obsažena v hodnotách X1, X2, ..., Xt. Pak máme E (Xt+1 | Ft) = E (Xt+1 | X1, X2, ..., Xt) Příklad 6.3.2. (Symetrická jednoduchá náhodná procházka). Nechť P (Xi = 1) = 1 2 = P (Xi = −1) a Sn = X1 + ... + Xn. Pak Sn je martingal. 6.4 Samofinancující portfolia 6.4.1 Dynamické portfolio Uvažujme T-krokový model trhu s aktivy A1 , A2 , ..., AK . Označme SA t (ω) cenu podílu aktiva A v čase t ve scénáři ω a ΘA t (ω) počet podílů aktiva A, které držíme v portfoliu Θ v čase t za scénáře ω. Posloupnost ΘA t musí být adaptovaná přirozené filtraci. Dynamické portfolio je omezené, jestliže náhodné veličiny ΘA t jsou všechny omezené. 6.4.2 Samofinancující portfolio Hodnota portfolia Θ po rebalancování (upravení) v čase t za scénáře ω je V Θ t = V Θ t (ω) = A ΘA t (ω) SA t (ω) , kde sčítáme přes všechna aktiva A = A1 , A2 , ..., AK . Hodnota V Θ t+1 po proběhnutí obchodování v čase t bude obecně jiná, než V Θ t . Pokud do portfolia nepřidáváme ani neodebíráme prostředky, musí být jeho hodnota těsně po rebalancování stejná jako před rebalancováním. Tedy platí ΘA t SA t+1 (ω) = ΘA t+1SA t+1 (ω) , 56 kde SA t+1 jsou nové ceny a ΘA t+1 jsou nové podíly v portfoliu. Úpravou pak dostaneme V Θ t+1 (ω) − V Θ t (ω) = A ΘA t SA t+1 (ω) − SA t (ω) . To je podmínka pro samofinancující portfolio. Věta 6.4.1. Nechť v T-periodickém trhu M neexistuje arbitráž a nechť existuje bezrizikové aktivum s úrokovou mírou r = 0. Pak vzhledem k rovnovážné pravděpodobnostní míře je proces cen (St) libovolného obchodovatelného aktiva martingalem vzhledem k přirozené filtraci Definice 6.4.2. Nechť Ft je přirozená filtrace a Yt je posloupnost náhodných veličin adaptovaných Ft. Yt se nazývá předvídatelná posloupnost, jestliže pro všechna t ≥ 1 je Yt Ft−1 - měřitelná. (tedy hodnota Yt je určena již v čase t − 1). 6.5 Martingalová transformace Definice 6.5.1. Nechť posloupnost náhodných veličin {Xt} pro 0 ≤ t ≤ T je martingal a nechť {Yt} pro 0 ≤ t ≤ T je předvídatelná posloupnost. Pak martingalová transformace {(Y • X)t}0≤t≤T je posloupnost náhodných veličin definovaná jako (Y • X)t = X0 + t−1 j=0 Yj (∆X)j+1 , kde (∆X)t+1 = Xt+1 − Xt. Věta 6.5.2. Martingalová transformace je martingalem vzhledem k Ft. Důkaz: Cvičení. Důsledek 6.5.3. Nechť M je T-periodický trh bez arbitráže, obsahující bezrizikové aktivum s úrokovou mírou r = 0 a nechť M má rovnovážnou pravděpodobnostní míru P. Pak pro každé samofinancující portfolio je proces jeho ceny V Θ t 0≤t≤T martingalem. Důkaz: Z podmínky pro samofinancující portfolio plyne, že proces ceny je martingalová transformace, a tedy martingal. 57 6.5.1 Podmíněná očekávání a martingalová transfor- mace Vlastnost martingalu znamená, že “očekávaná budoucí hodnota = současná hodnota”. Následující obrázky mají ilustrovat graficky pojem martingalu. Do grafu zaneseme příslušné hodnoty a očekávání‘: t = 0 : S0 E(S1|S0) t = 1 : S1 E(S2|S1) t = 2 : S2 E(S2|S2) t = 0 t = 1 t = 2 92 80 130 120 54 60 36 36 72 72 80 80 180 180 p=1/2 p=1/2 p=1/2 p=1/2 p=1/2 p=1/2 Předchozí obrázek není martingal - u martingalu jsou nahoře i dole stejné 58 hodnoty, viz následující obrázek: t = 0 t = 1 t = 2 100 100 120 120 80 80 70 70 90 90 100 100 140 140 p=1/2 p=1/2 p=1/2 p=1/2 p=1/2 p=1/2 59 Kapitola 7 Úplnost trhu 7.1 Věta o úplnosti trhu Uvažujeme trh M s aktivy A1 , ..., Ak . Podle základní věty arbitrážní teorie (APT) plyne z neexistence arbitráže existence rovnovážné pravděpodobnostní míry (může jich být i více). Definice 7.1.1. Trh bez arbitráže se nazývá úplný, jestliže existuje právě jedna rovnovážná pravděpodobnostní míra. Trh je neúplný, pokud existuje více rovnovážných pravděpodobnostních měr. Definice 7.1.2. Derivát je obchodovatelné aktivum, jehož hodnota V1 v čase t = 1 je funkcí V1 (ωi) tržního scénáře. Tedy V1 je náhodná veličina na Ω = {ω1, ..., ωN }. Definice 7.1.3. Replikující portfolio pro daný derivát V , jehož hodnoty v čase t = 1 za scénáře ωi jsou rovny V1 (ωi) je portfolio Θ = (θ1, ..., θk) v aktivech A1 , ..., Ak takové, že: V1 (ωi) = k j=1 θjSj 1 (ωi) , kde Sj 1 (ωi) je cena j-tého aktiva Aj za scénáře ωi. Z neexistence arbitráže plyne, že V0 = k j=1 θjSj 0, tedy pokud existuje replikující portfolio, derivát má jednoznačně určenou cenu v čase t = 0. 60 Věta 7.1.4. (o úplnosti trhu): Nechť M je trh bez arbitráže s bezrizikovým aktivem. Existuje-li pro každý derivát replikující portfolio v A1 , ..., Ak , pak je trh úplný. Naopak je-li M úplný a rovnovážná pravděpodobnostní míra dává kladnou pravděpodobnost každému scénáři (tj. π (ωi) > 0 pro ∀i), pak pro každý derivát existuje replikující portfolio (a tedy derivát má jednoznačně určenou cenu). Důkaz je založen na jednoduchých myšlenkách z lineární algebry. Deriváty tvoří vektorový prostor (izomorfní RN ). Trh je úplný, právě tehdy když vektory hodnot aktiv A1 , A2 , ..., Ak v jednotlivých scénářích generují RN . Tedy vektory Sj 1 (ωi), j = 1, ..., k generují RN . Speciálně platí k ≥ N. Důkaz: Chceme nejdříve dokázat, že pokud existuje replikujcí portfolio, pak M je úplný. Uvažujme pro pevně zvolený scénář ωl ∈ Ω následující derivát Dl, jehož hodnota v čase t = 1 je rovna V1 (ωi) = 0 pro i = l 1 pro i = l . Podle předpokladu existuje replikující portfolio pro Dl, označme ho Θ = (θ1, ..., θk), v aktivech A1 , ..., Ak . Tedy V0 = θjSj 0. Je-li π rovnovážná pravděpodobnostní míra, pak také V0 = e−r N i=1 V1 (ωi) πi = e−r π (ωl) . Odtud plyne π (ωl) = er k j=1 θjSj 0 a tedy π je jednoznačně určena. Zbývá nám dokázat opačnou implikaci. Označíme aj = Sj 1 (ω1) , Sj 1 (ω2) , ..., Sj 1 (ωN ) vektor v RN pro každou hodnotu j (tedy každé aktivum Aj). Derivát je vektor v RN , který dá se replikovat právě tehdy, když vektor jeho hodnot v jednotlivých scénářích patří do lineárního obalu vektorů aj. 61 Nechť existuje π (ωi) jednoznačně určená, taková, že π (ωi) > 0 pro všechna i. Budeme postupovat sporem: Nechť existuje derivát D, který nemá replikující portfolio. Tedy jsou-li jeho hodnoty ve scénářích ωi rovny f (ωi) a označíme-li f = (f (ω1) , ..., f (ωN )) , pak f není lineární kombinací aj, a tedy aj negeneruje RN . Existuje tedy vektor v = (v1, ..., vN ), který je kolmý na vektory aj pro všechna j, tedy platí N i=1 viSj 1 (ωi) = 0 pro j = 1, ..., k. Aktivum A1 je bezrizikové, tedy A1 1 (ωi) = er pro všechna i. Speciálně tedy v⊥ (1, ..., 1) a N i=1 vi = 0. Pro dostatečně malé ε > 0 označme π∗ (ωi) = π (ωi) + εvi. Máme N i=1 π∗ (ωi) = N i=1 π (ωi) + N i=1 vi = 1 + 0 = 1. Navíc, je-li ε dostatečně malé, pak π∗ (ωi) > 0, neboť π (ωi) > 0, a platí N i=1 π∗ (ωi) Sj 1 (ωi) = N i=1 π (ωi) Sj 1 (ωi) + ε N i=1 viSj 1 (ωi) = N i=1 π (ωi) Sj 1 (ωi) . Tedy π∗ je další rovnovážná pravděpodobnostní míra, což je spor. Tím je tvrzení dokázáno. 62 Kapitola 8 Wienerův proces (Brownův pohyb) 8.1 Limita náhodné procházky Wienerův proces je stochastický proces ve spojitém čase se spojitými hodnotami, který můžeme intuitivně chápat jako limitu náhodné procházky při zmenšování časového a prostorového kroku ∆x ∆t (tedy pro ∆x → 0 a ∆t → 0). Nechť P {Xi = 1} = P {Xi = −1} = 1 2 , kde Xi, ..., Xn, ... jsou stejně rozdělené nezávislé náhodné veličiny s E (Xi) = 0 a V ar (Xi) = 1. Potom Sn = S0 + X1 + X2 + ... + Xn, kde S0 = 0 je standardní symetrická náhodná procházka. Zvolme délku časového kroku ∆t a velikost prostorového kroku ∆x. Pro t = n∆t, tedy n = t ∆t , definujeme proces St = Sn∆t = (X1 + X2 + ... + Xn) ∆x. Z nezávislosti přírůstků Xj plyne, že E (St) = 0 a V ar (St) = (∆x)2 n = (∆x)2 t ∆t . Zajímá nás chování tohoto procesu v limitním přechodu ∆x → 0 a ∆t → 0. Uvažujeme mocninnou závislost mezi ∆x a ∆t. Položme ∆t = (∆x)p , kde p > 0. Pro ∆t → 0 pak dostáváme V ar (St) = (∆x)2 ∆t t    → 0 pro p < 2 = t pro p = 2 → ∞ pro p > 2 . 63 Konečný nenulový rozptyl tedy dostaneme jen pro volbu p = 2. Pro ∆t = (∆x)2 dostaneme v limitě pro ∆t → 0 standardní Wienerův proces. Z Centrální limitní věty plyne, že St má v limitě pro ∆t → 0 a (∆x)2 = ∆t normální rozdělení N (0, t). Věta 8.1.1. (Lindenbergova centrální limitní věta) Nechť X1, X2, ... jsou nezávislé náhodné veličiny se stejným rozdělením, které mají střední hodnotu µ a konečný rozptyl σ2 . Označme Yn = (X1 + X2 + ... + Xn − µn) √ n pro n = 1, 2, .... Pak Yn konverguje v distribuci k rozdělení N (0, σ2 ). Definice 8.1.2. Stochastický proces Wt, kde t ∈ [0, ∞), se nazývá standardní Wienerův proces, jestliže platí: 1. W0 = 0 2. (spojitost) S pravděpodobností 1 je trajektorie Wienerova procesu spo- jitá. 3. (nezávislost) PřírůstkyWienerova procesu jsou nezávislé, tj. pro 0 ≤ t1 < s1 ≤ t2 < s2 ≤ ... ≤ tn < sn jsou přírůstky Ws1 − Wt1 , Ws2 − Wt2 , ..., Wsn − Wtn navzájem nezávislé. 4. (normalita přírůstků) Přírůstky Ws − Wt pro s > t mají rozdělení N (0, s − t). Speciálně z vlastností 1 a 4 máme Wt ∼ N (0, t) ∼ √ tN (0, 1) . Označme ∆W přírůstek Wienerova procesu za čas ∆t. Máme ∆W = √ ∆tε, kde ε má standardní normální rozdělení N (0, 1). Pro očekávání a rozptyl ∆W dostaneme E (∆W) = √ ∆tE (ε) = 0 64 a V ar (∆W) = E (∆W)2 = ∆t. Zobecněný Wienerův proces můžeme definovat pomocí infinitezimálního přírůstku dX = adt + bdW, kde a, b jsou konstanty a W je standardní Wienerův proces. Koeficient a je koeficient driftu a b je koeficient volatility. Opět máme ∆X = a∆t + bε √ ∆t, tedy E (∆X) = a∆t a V ar (∆X) = b2 ∆t. Pro b = 0 máme dX = adt, tedy Xt = at je deterministický proces. Další možné zobecnění: koeficienty a, b se mohou měnit a mohou záviset na t a případně i na hodnotách X. 8.2 Wienerův proces pro cenu akcie Wienerův proces není vhodný pro popis vývoje ceny akcie z několika důvodů: • Ceny akcie mohou nabývat i záporné hodnoty. • Při Wienerově procesu je pravděpodobnost, že se cena zvýší o 1 Kč stejná je-li S = 1 Kč, nebo S = 100 000 Kč. To co je ve skutečnosti důležité není absolutní změna (ta závisí mimo jiné také na jednotkách v nichž cenu vyjadřujeme), ale relativní změna vůči ceně akcie. Je-li volatilita nulová, máme ∆S = µS∆t. Z tohoto vztahu můžeme vyjádřit relativní přírůstek ∆S S = µ∆t, 65 kde µ je konstanta (drift). Odtud dostáváme dS S = µdt a řešením diferenciální rovnice se separovanými proměnnými St = S0eµT . Obecně dS = µSdt + σSdW, kde µ je drift a σ je volatilita. Tak je definován geometrický Wienerův proces. Máme dS S = µdt + σdW a diskretizací dostaneme: ∆S = µS∆t + σSε √ ∆t, kde ε ∼ N (0, 1). Tedy ∆S S = µ∆t + σε √ ∆t, odkud ∆S S ∼ N µ∆t, σ2 ∆t . Jinak řečeno, E ∆S S = µ∆t a V ar ∆S S = σ2 ∆t. K vyřešení rovnice, t.j. odvození explicitního vztahu pro S potřebujeme Itôovo lemma. 8.2.1 Itôovo lemma Pro porovnání připomeňme nejdříve diferenciál deterministické funkce. • 1 proměnná: dG = ∂G ∂x dx 66 • funkce 2 deterministických proměnných x, t: ∆ ≈ ∂G ∂t ∆t + ∂G ∂x ∆x, neboli dG = ∂G ∂t dt + ∂G ∂x dx. V případě Wienorova procesu platí heuristický vztah (dW)2 = dt proto budeme mít navíc člen 1 2 ∂2 G ∂x2 (dX)2 . Itôovo lemma je analogií pravidla pro diferenciál složené funkce a slouží k výpočtu přírůstků funkce stochastického procesu. Nechť hodnota stochastického procesu X splňuje rovnici dX = a (X, t) dt + b (X, t) dW, kde W je standardní Wienerův proces a a, b jsou funkce X a t. Nechť G (x, t) je dvakrát spojitě diferencovatelná funkce dvou proměnných x, t. Jakou rovnici splňuje přírůstek procesu G (X, t)? Itôovo lemma říká, že pro G platí dG = ∂G ∂t dt + ∂G ∂x dX + 1 2 ∂2 G ∂x2 (dX)2 kde za dX dosadíme a (dX)2 počítáme podle pravidel dtdt = 0, dtdW = 0, (dW)2 = dt. Tak dostaneme celkem dG = ∂G ∂t + 1 2 ∂2 G ∂x2 + a ∂G ∂x dt + ∂G ∂x bdW. 67 8.2.2 Odvození Black-Scholesovy rovnice Black-Scholesova rovnice popisuje vývoj hodnoty evropské opce v BlackScholesově modelu. Předpokládejme, že pohyb ceny akcie je popsán geometrickým Wienerovým procesem dS = µSdt + σSdW, neboli dS S = µdt + σdW. Použijeme Itôovo lemma na funkci G (S, t) = lnS . Máme ∂G ∂t = 0, ∂G ∂S = 1 S , ∂2 G ∂S2 = 1 S2 . Tedy z Itôova lemmatu dG = µ − σ2 2 dt + σdW a d (ln S) = µ − σ2 2 dt + σdW. Odtud plyne, že ln ST − ln S0 má normální rozdělení se střední hodnotou µ − σ2 2 T a rozptylem σ2 T. Tedy ln ST ∼ N ln S0 + µ − σ2 2 T; σ2 T . ST má tedy lognormální rozdělení, tj. ln ST má normální rozdělení. Máme rovnici pro cenu akcie, která sleduje geometrický Wienerův proces dS = µSdt + σSdW (8.1) Nechť f je cena evropské call opce s danou realizační cenou K a časem expirace T. Zisk z takové opce v čase T je (ST − K)+ . f závisí na S a t a je tedy funkcí dvou proměnných, f (S, t). Hodnota f (S, t) je cena opce v čase t v situaci, kdy cena akcie je rovna S. Podle Itôova lemmatu platí pro změnu ceny opce 68 df = ∂f ∂t dt + ∂f ∂S dS + 1 2 ∂2 f ∂S2 (dS)2 . za dS dosadíme z 8.1, tedy df = ∂f ∂t dt + ∂f ∂S (µSdt + σSdW) + 1 2 ∂2 f ∂S2 (µSdt + σSdW)2 . Jelikož (dt)2 a dtdW jsou členy vyššího řádu a víme, že (dW)2 = dt, dostá- váme: df = ∂f ∂t + ∂f ∂S µS + 1 2 ∂2 f ∂S2 σ2 S2 dt + ∂f ∂S σSdW (8.2) Vhodnou kombinací 8.1 a 8.2 můžeme sestavit portfolio z akcií a opcí, jehož výnos je deterministický. Jinak řečeno, můžeme eliminovat stochastický člen dW. Označme Π hodnotu portfolia složeného z 1 opce a −∂f ∂S akcie, tedy Π = − ∂f ∂S S + 1f Pro přírůstek hodnoty portfolia za čas dt máme: dΠ = − ∂f ∂S dS + 1df. Po dosazení z 8.1 dostaneme dΠ = − ∂f ∂S µS + ∂f ∂t + ∂f ∂S µS + 1 2 ∂2 f ∂S2 σ2 S2 dt, stochastický člen se vyruší. Přírůstek hodnoty portfolia dΠ se musí (z neexistence arbitráže) rovnat zisku z bezrizikového aktiva s úrokovou mírou r, tj. dΠ = rΠdt. Celkem dostaneme ∂f ∂t + 1 2 ∂2 f ∂S2 σ2 S2 dt = r − ∂f ∂S S + f dt a ∂f ∂t + 1 2 ∂2 f ∂S2 σ2 S2 + ∂f ∂S Sr = rf 69 To je Black-Scholesova parciální diferenciální rovnice. Po transformaci (substitucích) dostaneme rovnici difuze (rovnici vedení tepla) ∂f ∂t = · ∂2 f ∂S2 Řešením společně s transformovanou koncovou podmínkou (známe hodnotu f (T) = (ST − K)+) dostaneme Black-Scholesův vzorec. 70