Zákony arcsinu Kdy navštívila N.P. naposledy počátek? Jak často se hráči střidají ve vedení? Hra je férová (p = 1 2 ), přesto je nejvíce pravděpodobné, že jeden z hráčů stále vedl a nejméně pravděpodobné že každý vedl v polovině kroků Uvedeme dva zákony arcsinu: – pro časy pobytu napravo od počátku (tj. v kladných hodnotách) – pro poslední navštívení počátku. 1. zákon arcsinu Věta 6.1. (1. zákon arcsinu pro poslední návštěvu počátku) Uvažujme symetrickou náhodnou procházku, t.j. p = 1 2, a nechť S0 = 0. Pravděpodobnost, že poslední návštěva počátku do času 2n nastane v čase 2k, je rovna P (S2k = 0) P (S2n−2k = 0) . Důkaz: Označme α2n(2k) pravděpodobnost, že poslední návštěva počátku do času 2n nastane v čase 2k. Máme α2n(2k) = P (S2k = 0) P (S2k+1S2k+2...S2n = 0 | S2k = 0) . Z časové homogenity plyne α2n(2k) = P (S2k = 0) P (S1S2...S2n−2k = 0 | S0 = 0) . Tvrzení tedy plyne z následujícího lemmatu. Lemma 6.2. Pro symetrickou náhodnou procházku platí: P(S1...S2m = 0) = P(S2m = 0), kde P(S2m = 0) = 2m m 1 2 2m . Důkaz: Využijeme důsledek věty o volbách: Je-li S0 = 0, pak pro n ≥ 1 platí P (S1S2...Sn = 0) = 1 n E (| Sn |) . Dále ze symetrie plyne P(S1...S2m = 0) = 1 2m E(| S2m |) = 2 1 2m m k=1 2kP(S2m = 2k) = 2 m k=1 2k 2m P(S2m = 2k) = 2 m k=1 2k 2m 2m m + k 1 2 2m = 2 1 2 2m m k=1 2m − 1 m + k − 1 − 2m − 1 m + k . neboť platí 2m − 1 m + k − 1 − 2m − 1 m + k = 2k 2m 2m m + k . Opravdu, máme (2m − 1) ... (m − k + 1) (m + k − 1)! − (2m − 1) ... (m − k) (m + k)! = = (m + k) (2m − 1) ... (m − k + 1) − (2m − 1) ... (m − k + 1) (m − k) (m + k)! = (2m − 1) ... (m − k + 1) [(m + k) − (m − k)] (m + k)! = 2k 2m 2m (2m − 1) ... (m − k + 1) (m + k)! = 2k 2m 2m m + k . V posledním členu výraz se sumou je tzv. teleskopický součet. Z takového součtu nám zůstane jen první a poslední člen, ostatní se vyruší. Odtud plyne, že 2 1 2 2m m k=1 2m − 1 m + k − 1 − 2m − 1 m + k = 2 1 2 2m 2m − 1 m − 2m − 1 2m = 2 1 2 2m 2m − 1 m = 1 2 2m (2m − 1) ...m2 m! = 1 2 2m 2m (2m − 1) ... (m + 1) m! = 1 2 2m 2m m = P (S2m = 0) , Stirlingova formule Platí n! ≈ nn en √ 2πn v tom smyslu, že limn→∞ n! nn en √ 2πn = 1. Ze Stirlingovy formule dostaneme odhad na hodnotu u2k = P (S2k = 0) . Lemma 6.3. Platí u2k ≈ 1√ πk pro k → ∞, tedy lim k→∞ u2k 1√ πk = 1. Podle zákonu arcsinu je α2n(2k) = u2ku2n−2k, tedy P (S2k = 0 ∧ S2k+1...S2n = 0) = P (S2k = 0) P (S2n−2k = 0) . Ze Stirlingova vzorce máme α2n(2k) ≈ 1 √ πk 1 π (n − k) = 1 π k (n − k) . Hodnota k (n − k) je maximální pro k = n 2 , tedy α2n(2k) je minimální pro k = n 2 . Označme T2n čas posledního navštívení bodu 0 do času 2n. Pak pro x ∈ (0, 1) máme P (T2n ≤ 2xn) = k≤xn 1 π k (n − k) . = xn 0 1 π u (n − u) du = 2 π arcsin √ x, s použitím substituce u = nv a 2 arcsin √ x = 2 1 √ 1 − x 1 2 1 √ x = = 1 (1 − x) x . 2. zákon arcsinu 2. zákon arcsinu se týká časů pobytu na jedné straně od počátku (tj. doby, kdy jeden z hráčů byl ve vedení). Věta 6.4. Nechť p = 1 2 a S0 = 0. Pravděpodobnost, že náhodná procházka stráví přesně 2k časových intervalů napravo od počátku je (opět) rovna P (S2k = 0) P (S2n−2k = 0) . Důkaz: učebnice Grimmett, Stirzaker. Exponenciální rozdělení a jeho vlastnosti Spojitá náhodná veličina má exponenciální rozdělení, jestliže jeho hustota je dána vztahem f (x) = λe−λx (1) pro x ≥ 0 a je rovna nule jinak. Distribuční funkce exponenciálního rozdělení je tedy F(x) = 1 − e−λx (2) pro x ≥ 0, a rovna nule jinak. Moment generující funkce exponenciálního rozdělení je dána vztahem E[etX ] = ∞ 0 etx λe−λx dx = λ λ − t = 1 1 − θt (3) kde θ = 1 λ . Momenty náhodné veličiny X můžeme získat derivováním moment generující funkce. Tím dostaneme E[X] = 1 λ = θ (4) a Var[X] = 1 λ2 = θ2 (5) Jednou z hlavních vlastností exponenciálního rozdělení je že nemá pamět. Platí totiž P{X > s + t|X > t} = P{X > s}. (6) Je-li například X životnost daného stroje, pak pravděpodobnost že stroj bude fungovat alespoň s + t hodin, za podmínky že již funguje t hodin, je stejná jako počáteční pravděpodobnost že bude fungovat alespoň s hodin. Stroj si “nepamatuje” svoji minulost. – Opačná situace: efekt opotřebení nebo zahoření. Vlastnost absence paměti Exponenciální rozdělení je jediné rozdělení které nemá pamět. Dokážeme to následovně. Nechť ˜F = P{X > x} (7) je funkce přežití. Pak z předchozího vztahu platí ˜F(s + t) = ˜F(s) ˜F(t) (8) Jinak řečeno, ˜F splňuje funkcionální rovnici h(s + t) = h(s)h(t). (9) Dokážeme teď že jediná zprava polospojitá řešení této rovnice mají tvar exponenciály. Ze vztahu h(s + t) = h(s)h(t). (10) máme h( 2 n ) = h( 1 n + 1 n ) = h2 ( 1 n ). (11) Opakováním stejného argumentu dostaneme h( m n ) = hm ( 1 n ). (12) Dále platí h(1) = h( 1 n + · · · + 1 n ) = hn ( 1 n ). (13) Tedy h( m n ) = h(1) m n . (14) a tedy h(x) = h(1)x , (15) protože h je pospojitá zprava. Platí h(1) = h2 ( 1 2 ) ≥ 0, (16) a tedy h(x) = e−λx , (17) kde λ = − ln h(1). Musí tedy platit ˜F = eλx , (18) protože distribuční funkce je zprava polospojitá, což je funkce přežití exponenciálního rozdělení. Míra rizika – V životním pojištění se používá termín intenzita úmrtnosti Uvažujme spojitou náhodnou veličinu X a distribuční funkcí F a hustotou f . Definice: Funkce míry rizika je definována jako λ(t) = f (t) ˜F(t) (19) Představme si, že skoumáme životnost nějakého stroje (součástky), a předpokládejme, že stroj již funguje t hodin. Chceme spočítat pravděpodobnost, že nevydrží další časový úsek dt, tedy P{X ∈ (t, t + dt)|X > t}, (20) kde n.v. X modeluje čas poruchy stroje. Máme P{X ∈ (t, t + dt)|X > t} = P(X ∈ (t, t + dt) ∧ X > t) P(X > t) (21) což je rovno X ∈ (t, t + dt) P(X > t) f (t)dt ˜F(t) (22) = λ(t)dt. (23) Tedy λ(t) reprezentuje intenzitu pravděpodobnosti, že t-letý stroj přestane fungovat v čase t. Je-li rozdělení exponenciální, pak z vlastnosti absence paměti je podmíněné rozdělení stejné jako počáteční, tedy λ je konstantní, λ(t) = λe−λt e−λt = λ. (24) Tedy míra rizika pro exponenciální rozdělení je konstantní. Ukážeme ješte že míra rizika naopak jednoznačně určuje pravděpodobnostní rozdělení. Opravdu, máme λ(t) = − d dt ˜F(t) ˜F(t) = λ (25) Integrováním dostaneme ln ˜F(t) = − t 0 λ(s)ds + k (26) tedy ˜F(t) = ce t 0 λ(s)ds (27) kde pro t = 0 dosteneme c = 1. Celkem ˜F(t) = e t 0 λ(s)ds (28) Odtud plyne že exponenciální rozdělení je jediné rozdělení s konstantní funkcí rizika. Zobecnění – Sčítáním IID náhodných veličin s exponenciálním rozdělením dostaneme Gamma rozdělení Jsou-li X1, ..., Xn nezávislé a všechny mají Exp(λ). Pak jejich součet má rozdělení Gamma(n, λ). Hustota Gamma rozdělení je f (x) = λne−λx xn−1 Γ(n) (29) kde Γ(n) je Gamma funkce, Γ(n) = ∞ 0 xn−1 e−x dx. (30) Pro celočíselné hodnoty platí Γ(n) = (n − 1)! (31)