Zákon velkých čísel, centrální limitní věta David Hampel 12235@mail.muni.cz Přednáška Statistika I (BKMSTAI) 12. listopad 2011, Brno Motivace Při velkém počtu pozorování se ukazuje, že ► empirické charakteristiky se blíží teoretickým charakteristikám, ► odhad sledovaných veličin se zpřesňuje přímo úměrně velikosti výběru, ► určité transformované veličiny mají téměř normální rozdělení, ► je možno použít přibližných vzorců pro pozorování, jehož rozdělení není tabelováno. David Hampel Zákon velkých čísel, centrální limitní věta Konvergence náhodných veličin Nechť Xi,X2,... je posloupnost náhodných veličin s distribučními funkcemi i(xi), $2(^2),... a X náhodná veličina s distribuční funkcí í>(x). Řekneme, že posloupnost X±,X2, ■ ■ ■ konverguje k X ► jistě, právě když pro všechna lo g íž platí lim Xn(u)) = X(u)), ► podle pravděpodobnosti, právě když pro všechna e > 0 platí lim P(\Xn-X\ >e)=0, ► v distribuci, právě když pro všechna x g i? platí lim $>n(x) = $(x). n—>oo David Hampel Zákon velkých čísel, centrální limitní věta Cebyševova věta Nechť Xi,... ,Xn jsou nekorelované náhodné veličiny, jejichž střední hodnoty splňují vztah 1 n lim - Y^E{Xi)=li i=l a rozptyly jsou shora ohraničené týmž číslem ô. Pak posloupnost aritmetických průměrů í 1 2 1 n \ \ t=l t=l ) konverguje podle pravděpodobnosti k číslu fi. David Hampel Zákon velkých čísel, centrální limitní věta Bernoulliova věta Nechť náhodná veličina Yn udává počet úspěchů v posloupnosti n nezávislých opakovaných pokusů, přičemž úspěch nastává v každém pokusu s pravděpodobností 9, 0 < 9 < 1. Pak posloupnost relativních četností {Y1,Y2/2,...,Yn/n,...} konverguje podle pravděpodobnosti k pravděpodobnosti úspěchu 6. David Hampel Zákon velkých čísel, centrální limitní věta Cebyševova nerovnost Pro jakoukoliv náhodnou veličinu X, která má střední hodnotu E(X) a rozptyl D(X), je pravděpodobnost toho, že absolutní odchylka \X — E(X)\ nabude hodnoty menší než libovolné e > 0 P(\X-E(X)\l-^l. Této nerovnosti můžeme využít pro odhad uvedené pravděpodobnosti, neznáme-li rozdělení dané náhodné veličiny. David Hampel Zákon velkých čísel, centrální limitní věta Čebyševova nerovnost - příklad Víme, že náhodná veličina X má střední hodnotu 3 a rozptyl 4. Máme odhadnout pravděpodobnost, že veličina X nabude hodnoty z intervalu [—2, 8]. Hledáme tedy pravděpodobnost P{-2 < X < 8) = P(\X - E(X)\ < 5), která je dle Čebyševovy nerovnosti P(|X-£(X)|<5)>l-4 = 0.84. David Hampel Zákon velkých čísel, centrální limitní věta Lindberg-Lévyova centrální limitní věta Nechť Xi,X2,... je posloupnost stochasticky nezávislých náhodných veličin se stejným rozdělením, E(Xi) =/ia D(Xi) = a2 pro i = 1,2,.... Pak posloupnost standardizovaných součtů l °Vň Jn=i konverguje v distribuci ke standardizované normální náhodné veličině, tj. pro každé x G i? platí < = f 1 e-^dt. cry/n ) J-oo V2tt lim P n—>oo David Hampel Zákon velkých čísel, centrální limitní věta Moivre-Laplaceova integrální věta Nechť Yi,Y2,... je posloupnost stochasticky nezávislých náhodných veličin, Yj ~ Bi(n, 9) pro i = 1, 2,.... Pak posloupnost standardizovaných náhodných veličin i konverguje v distribuci k náhodné veličině U ~ ÍV(0,1), tj. pro každé x (z R platí lim P ( ^~n9 9 a n + 1 < 0 < n n+1' David Hampel Zákon velkých čísel, centrální limitní věta Moivre-Laplaceova integrální věta - příklad 1 Pravděpodobnost, že určitý typ výrobku má výrobní vadu, je 0.05. Jaká je pravděpodobnost, že ze série 1000 výrobků bude mít výrobní vadu nejvýše 70? Označíme Yn náhodnou veličinu, která udává počet vadných výrobků ze série n výrobků. Zřejmě je Yn ~ Bi(n, 0.05), n0(l - 0) = 1000 • 0.05 • 0.95 = 47.5 > 9 1 1 _ n 1000 n + 1 1001 < 0.05 < n+1 1001' Spočteme P(YW00 < 70) = P Y, 1000 1000 • 0.05 < 70 - 1000 • 0.05 ^1000-0.05(1 - 0.05) ^1000-0.05(1 - 0.05) 70 - 1000 ■ 0.05 ^1000-0.05(1 - 0.05) 20 VV47ľ5 = $(2.90) = 0.99813. 4 □ ► 4 fiP ► 4 m -00,0 David Hampel Zákon velkých čísel, centrální limitní věta Moivre-Laplaceova integrální věta - příklad 2 Pravděpodobnost, že výrobek má 1. jakost, je 9 = 0.9. Kolik výrobků je třeba zkontrolovat, aby s pravděpodobností aspoň 0.99 bylo zaručeno, že rozdíl relativní četnosti počtu výrobků 1. jakosti a pravděpodobnosti 9 = 0.9 byl v absolutní hodnotě menší než 0.03? Hledáme pravděpodobnost X \ --0.9 < 0.03 v n ) Výpočet: P 0.99 < P(0.87n < X < 0.93n) „,0.8771-0.9™ X P(-^— < --P(-0.íy/ň< 0.9n 0.93n-0.9n, < -^— ) X -0.9n < 0.íy/n) « $(0.1 v«) - $(-0.1v«) = 2$(0.1v«) - 1 David Hampel Zákon velkých čísel, centrální limitní věta i -00.0 Moivre-Laplaceova integrální věta - příklad 2 První a poslední člen této nerovnosti je 0.99 < 2$(0.1>/ň) - 1 0.995 < $(0.1y/n) /$~ 2.57583 < 0.1y/ň 664.76 < n Abychom dosáhli požadované pravděpodobnosti, musíme zkontrolovat alespoň 665 výrobků. David Hampel Zákon velkých čísel, centrální limitní věta