V dalším nás budou zajímat vlastnosti této transformované náhodné veličiny při $n\to\infty$.
Proto počítejme
$ \begin{array}[t]{@{}lcl@{}} {EY_n} &=& E\left[\frac{1}{n}\sum\limits_{i=1}^n(X_i-EX_i) \right] =\frac{1}{n}\sum\limits_{i=1}^n\underbrace{E(X_i-EX_i)}_{=0}={0}\\[1ex] {DY_n} &=& D\left[\frac{1}{n}\sum\limits_{i=1}^n(X_i-EX_i) \right] =\frac{1}{n^2} D\left[\sum\limits_{i=1}^n(X_i-EX_i) \right]\\& \stackrel{nez.}{=}& \frac{1}{n^2} \sum\limits_{i=1}^nD(X_i-EX_i)=\frac{1}{n^2} \sum\limits_{i=1}^nDX_i \end{array} $a dosadíme–li do Čebyševovy nerovnosti, dostaneme
$$ P\left(\left|\frac{1}{n}\sum\limits_{i=1}^n(X_i-EX_i)-0\right|\gt \varepsilon\right) \leq \frac{DY_n}{\varepsilon^2} =\frac{1}{\varepsilon^2}\frac{1}{n^2}\sum\limits_{i=1}^nDX_i \xrightarrow [n\to\infty]{\text{podle předp.}} 0, $$takže $\{X_n\}_{n=1}^\infty \kern 1ex$ splňuje slabý zákon velkých čísel.
jsou splněny předpoklady předchozí věty a $\{X_n\}_{n=1}^\infty \kern 1ex$ splňuje slabý zákon velkých čísel.
konverguje podle pravděpodobnosti k $\theta$, tj.
$$ Z_n=\frac{1}{n}Y_n \;\;\xrightarrow [n\to\infty]{P}\;\; \theta. $$Pak $\{X_n\}_{n=1}^\infty$ splňuje slabý zákon velkých čísel.
Označme $\{F_n\}_{n=1}^\infty \kern 1ex$ posloupnost distribučních funkcí náhodných veličin $\{X_n\}_{n=1}^\infty.$ Definujme další typ konvergence náhodných veličin.
Tuto skutečnost značíme
$$X_n\xrightarrow [n\to\infty]{\mathcal{L}} X.$$Distribuční funkce $F$ se nazývá limitní nebo asymptotická distribuční funkce.
Mějme posloupnost náhodných veličin $\{X_n\}_{n=1}^\infty$, které jsou | – | definované na ($\Omega,\mathcal{A},P$), |
– | nezávislé, | |
– | $EX_i=\mu_i$, | |
– | $DX_i=\sigma_i^2$. |
Řekneme, že náhodná veličina
$C_i=X_i-\mu_i$ | je | centrovaná | $\Rightarrow$ | $EC_i=0$ a $DC_i=\sigma_i^2$ |
$U_i=\frac{C_i}{\sigma_i}=\frac{X_i-\mu_i}{\sigma_i}$ | je | standardizovaná | $\Rightarrow$ | $EU_i=0$ a $DU_i=1$ |
Označme náhodnou veličinu
$$\begin{array}{lclclcl} {\overline{X}_n=\frac{1}{n}\sum\limits_{i=1}^nX_i} & \Rightarrow & {E\overline{X}_n}=\frac{1}{n}\sum\limits_{i=1}^n EX_i= {\frac{1}{n}(\mu_1+\cdots+\mu_n)}\\[1ex] & & {D\overline{X}_n}\stackrel{nez.}{=}\frac{1}{n^2}\sum\limits_{i=1}^n DX_i= {\frac{1}{n^2}(\sigma_1^2+\cdots+\sigma_n^2)} \end{array}$$Standardizujme průměr $\overline{X}_n:$ | $U_{\overline{X}_n}$ $=\frac{\overline{X}_n-E\overline{X}_n}{\sqrt{D\overline{X}_n}}= \frac{\frac{1}{n}\sum\limits_{i=1}^nX_i-\frac{1}{n}\sum\limits_{i=1}^n\mu_i} {\sqrt{\frac{\sigma_1^2+\cdots+\sigma_n^2}{n^2}}}=$ $\frac{\sum\limits_{i=1}^n(X_i-\mu_i)} {\sqrt{\sigma_1^2+\cdots+\sigma_n^2}}$ |
Pokud $EX_i=\mu$ a $DX_i=\sigma^2$ | $U_{\overline{X}_n}$ $=\frac{\sum\limits_{i=1}^n(X_i-\mu_i)} {\sqrt{n\sigma^2}}=$ $\frac{\sum\limits_{i=1}^n(X_i-\mu_i)} {\sigma\sqrt{n}}$. |
Nyní vyslovíme několik modifikací centrálních limitních vět (CLV). Jejich význam spočívá v tom, že za velmi všeobecných podmínek ukazují, že standardizované průměry $U_{\overline{X}_n}$ z nezávislých náhodných veličin konvergují k normálnímu rozdělení.
mají asymptoticky standardizované normální rozdělení $N(0,1)$, což budeme značit
$$U_{\overline{X}_n}\;\stackrel{A}{\sim}\; N(0,1).$$V tomto případě platí
$$EC_k=0 \text{ a } DC_k=EC_k^2=\sigma^2.$$Rozviňme charakteristickou funkci $\psi_{C_k}(t)$ pomocí Taylorova rozvoje
Protože máme zaručenu existenci prvních dvou momentů, pak pro $n=2$
Položme
$$Z_k=\frac{C_k}{\sigma\sqrt{n}}=\frac{X_k-\mu}{\sigma\sqrt{n}}.$$Protože
$$\psi_{a+bX}(t)=e^{ita}\psi_X(tb),$$pak položíme–li $a=0$ a $b=\frac{1}{\sigma\sqrt{n}}$, můžeme psát:
$$\psi_{Z_k}(t)=\psi_{C_k}\left(\frac{t}{\sigma\sqrt{n}}\right) =1-\frac{\sigma^2t^2}{2\sigma^2n} +R_2\left(\frac{t}{\sigma\sqrt{n}}\right) =1-\frac{t^2}{2n} +R_2\left(\frac{t}{\sigma\sqrt{n}}\right)$$a přitom
$$\lim\limits_{t\to 0} \frac{R_2\left(\frac{t}{\sigma\sqrt{n}}\right)}{\frac{t^2}{\sigma^2 n}}=0 \quad\Leftrightarrow\quad \text{ pro pevné } t\in\mathbb{R}\quad\frac{\sigma^2}{t^2}\lim\limits_{n\to \infty} n R_2\left(\frac{t}{\sigma\sqrt{n}}\right)=0.$$Nakonec položme
$$U_{\overline{X}_n}=Z_1+\cdots+Z_n=\frac{C_1}{\sigma\sqrt{n}} +\cdots+\frac{C_n}{\sigma\sqrt{n}}.$$Protože jde o součet nezávislých náhodných veličin, pak pro jejich charakteristické funkce platí
$$\begin{array}{@{}l@{\;}c@{\;}l@{}} \psi_{U_{\overline{X}_n}}(t)=\psi_{Z_1+\cdots+Z_n}(t) &\stackrel{nez.}{=}&\prod\limits_{k=1}^n\psi_{Z_k}(t)= \prod\limits_{k=1}^n\psi_{C_k}\left(\frac{t}{\sigma\sqrt{n}}\right) =\left[\psi_{C_k}\left(\frac{t}{\sigma\sqrt{n}}\right)\right]^n\\[1em] &=& \left[1-\frac{t^2}{2n} +R_2\left(\frac{t}{\sigma\sqrt{n}}\right) \right]^n \end{array}$$Počítejme limitu
$$\begin{array}{@{}l@{\;}c@{\;}l@{}} {\lim\limits_{n\to\infty} \psi_{U_{\overline{X}_n}}(t)}&=&\lim\limits_{n\to\infty} \left[1-\frac{t^2}{2n} +R_2\left(\frac{t}{\sigma\sqrt{n}}\right) \right]^n =\lim\limits_{n\to\infty}\left[1-\frac{\frac{t^2}{2} +nR_2\left(\tfrac{t}{\sigma\sqrt{n}}\right)}{n} \right]^n\\[1ex] &=&\lim\limits_{n\to\infty}\left[1-\frac{\frac{t^2}{2}}{n}\right]^n ={e^{-\frac{t^2}{2}}} \end{array}$$což je charakteristická funkce $N(0,1)$ a platí tvrzení věty.
Řešení: Označme
$X_i$ | $\ldots$ | doba čekání na $i$-té cestě (i=1,$\ldots$,40) |
$B$ | $\ldots$ | náhodný jev, že během 20 pracovních dnů, tj. během 40 cest pročeká zaměstnanec méně než 120 minut |
Naším úkolem bude spočítat přibližnou pravděpodobnost
$$ P(X_1+\cdots +X_{40}\in B)=P(n\overline{X}_n\leq 120),\text{ kde } n=40.$$s využitím Lindebergovy–Lévyho CLV věty, která tvrdí, že při velkém počtu nezávislých pokusů konverguje standardizovaný průměr k rozdělení normálnímu.
Náhodná veličina $X_i\sim Ro\left(0,5\right)$ s hustotou $f(x)= \begin{cases} \frac{1}{5} & x\in\langle 0,5\rangle, \\ 0 & \text{jinak}. \end{cases} $
Nejprve spočítejme střední hodnotu a rozptyl:
$$\begin{array}[t]{@{}l@{\;}c@{\;}l@{}} {EX_i}&=&\int\limits_0^5\frac{1}{5}xdx= \frac{1}{5}\left[\frac{x^2}{2} \right]_0^5=\frac{25}{10} =\frac{5}{2}={2.5}\\[1ex] {EX_i^2}&=&\int\limits_0^5\frac{1}{5}x^2dx= \frac{1}{5}\left[\frac{x^3}{3} \right]_0^5=\frac{125}{15} ={\frac{25}{3}}\\[1ex] {DX_i}&=&EX^2-(EX)^2=\frac{25}{3}-\frac{25}{4}= {\frac{25}{12}} \end{array}$$Nyní můžeme již po několika úpravách vypočítat žádanou pravděpodobnost:
$$\begin{array}{@{}l@{\;}c@{\;}l@{}} {P(X_1+\cdots +X_{40}\in B)}&=&P(40\overline{X}_n\leq 120)=P(\overline{X}_n\leq 3)\\[1ex] &=&P\left(\frac{\overline{X}_n-E\overline{X}_n}{\sqrt{D\overline{X}_n}}\leq \frac{3-E\overline{X}_n}{\sqrt{D\overline{X}_n}}\right) =P\left(U_{\overline{X}_n}\leq \frac{1}{2\sqrt{\frac{5}{96}}} \right)\\[1.5em] &=& P(U_{\overline{X}_n}\leq 2.1909)\approx \Phi(2.1909)={\boxed{0.9858}}. \end{array}$$Tedy náhodný jev, že během 20 pracovních dnů, tj. během 40 cest, pročeká méně než 120 minut nastane přibližně s pravděpodobností 0.9858.
Další verze centrální limitní věty, tzv. věta Ljapunovova, je nejobecnějším vyjádřením této věty pro součet nezávislých náhodných veličin a říká, že rozdělení součtu vzájemně nezávislých veličin konverguje k normálnímu rozdělení i v případě, že veličiny nemají stejné rozdělení pravděpodobnosti.
Položme
$$\begin{array}[t]{@{}l@{\;}c@{\;}l@{}} S_n&=&\sqrt{\sigma_1^2+\cdots+\sigma_n^2}\\[1ex] K_n&=&\sqrt[3]{H_1^3+\cdots+H_n^3} \end{array}.$$Potom Ljapunovova podmínka
$$ \lim\limits_{n\to \infty}\frac{K_n}{S_n}=0 $$je postačující k tomu, aby
$$U_{\overline{X}_n}\;\stackrel{A}{\sim}\; N(0,1).$$Protože binomická náhodná veličina je součtem nezávislých alternativních náhodných veličin
nejprve vyjádřeme
$$\begin{array}[t]{@{}l@{\;}c@{\;}l@{}} E\overline{X}_n &=& E\left(\frac{1}{n}\sum\limits_{i=1}^nX_i\right)=\frac{1}{n}\sum\limits_{i=1}^nEX_i =\frac{1}{n} n\theta=\theta\\[1ex] D\overline{X}_n &=& D\left(\frac{1}{n}\sum\limits_{i=1}^nX_i\right)\stackrel{nez.}{=} \frac{1}{n^2}\sum\limits_{i=1}^nDX_i=\frac{1}{n^2} n\theta(1-\theta) =\frac{\theta(1-\theta)}{n} \end{array}$$a pak upravujme
$$U_{\overline{X}_n}=\frac{\overline{X}_n-E\overline{X}_n}{\sqrt{D\overline{X}_n}}= \frac{n\overline{X}_n-nE\overline{X}_n}{\sqrt{n^2D\overline{X}_n}} =\frac{Y_n-n\theta}{\sqrt{n^2\frac{\theta(1-\theta)}{n}}}= \frac{Y_n-n\theta}{\sqrt{n\theta(1-\theta)}}\stackrel{A}{\sim} N(0,1).$$Tím je věta dokázána.
Řešení: Označme
$Y_n$ | $\ldots$ | počet šestek, které padnou v $n=12~000$ hodech |
$B$ | $\ldots$ | náhodný jev, že ve 12 000 hodech homogenní hrací kostkou bude počet padnutých šestek mezi 1 900 a 2 100 |
Náhodná veličina $Y_n\sim Bi\left(n,\frac{1}{6}\right)$, přičemž $n=12~000$.
Naším úkolem bude spočítat přibližnou pravděpodobnost
$$ P(Y_n\in B)=P(1\,900\lt Y_n\leq 2\,100) $$s využitím Moivreovy-Laplaceovy (čti: moávr laplasovy) věty, která tvrdí, že při velkém počtu nezávislých pokusů konverguje binomické rozdělení k rozdělení normálnímu.
Nejprve spočítejme střední hodnotu a rozptyl:
$$\begin{array}[t]{@{}l@{\;}c@{\;}l@{}} {EY_n}&=&n\theta=12\,000\frac{1}{6}= {2\,000}\\[1ex] {DY_n}&=&n\theta(1-\theta)= 12\,000\frac{1}{6}\frac{5}{6}=2\,000\frac{5}{6}= {\frac{10\,000}{6}}. \end{array}$$Nyní můžeme již upravovat:
Tedy náhodný jev, že ve 12 000 hodech homogenní hrací kostkou bude počet padnutých šestek mezi 1 900 a 2 100, nastane přibližně s pravděpodobností 0.9857.
Centrum interaktivních a multimediálních studijních opor pro inovaci výuky a efektivní učení | CZ.1.07/2.2.00/28.0041