Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooooooo ooooooooo ooooooooooo ooooo Matematika IV - 10. přednáška Číselné charakteristiky náhodných veličin, normální rozdělení, limitní věty Michal Bulant Masarykova univerzita Fakulta informatiky 24. 4. 2013 Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooooooo ooooooooo ooooooooooo ooooc Obsah predná Q| Číselné charakteristiky náhodných veličin Q Normální rozdělení a rozdělení odvezená Q Limitní věty a odhady Q Náhodný vektor Q Náhodný výběr Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooooooo ooooooooo ooooooooooo ooooc Doporučené zdroje • Martin Panák, Jan Slovák, Drsná matematika, e-text. » Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická statistika, Matfyzpress, 4. vydání, 2006, 230 stran, ISBN 80-867-3271-1. • Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80-210-3313-4. » Marie Budíková, Statistika, Masarykova univerzita, 2004, distanční studijní opora ESF, http: //www.math.muni.cz/~budikova/esf/Statistika.zip. • Marie Budíková, Tomáš Lerch, Štěpán Mikoláš, Základní statistické metody, Masarykova univerzita, 2005, 170 stran, ISBN 80-210-3886-1. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr •ooooooooooooooooo oooooooo ooooooooo ooooooooooo ooooo Střední hodnota Při statistickém zkoumání hodnot náhodných veličin (např. zpracování výsledků nějakého měření) hledáme výpovědi o náhodné veličině pomocí různých z ní odvozených čísel. Jako nejjednodušší příklad může sloužit střední hodnota1 E(X) náhodné veličiny X, která je definována Obecně střední hodnota náhodných veličin nemusí existovat, protože příslušné sumy či integrály nemusí konvergovat. ^2ixi • 6((*/) Pro diskrétní veličinu f^^x • fx{x) dx pro spojitou veličinu. 1Často se místo E(X) píše EX. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr o»oooooooooooooooo oooooooo ooooooooo ooooooooooo ooooo Střední hodnota transformované náhodné veličiny Střední hodnotu můžeme přímo vyjádřit také pro funkce Y = ip(X) náhodné veličiny X. V diskrétním případě můžeme přímo spočíst E(Y) = Y,yjP(Y = yj) j = ^ v(*,-)P(x = */) = X>(*/)6f(x,-). / i Je tedy E(tp(X)) přímo spočítatelná pomocí pravděpodobnostní funkce fx- Podobně vyjadřujeme střední hodnotu funkce ze spojité náhodné veličiny: /oo V>(x)fx(x) dx, -oo pokud tento integrál absolutně konverguje. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oo»ooooooooooooooo oooooooo ooooooooo ooooooooooo ooooc Príklad Spočtěme střední hodnotu binomického rozdělení. Pro X ~ Bi(n, p) je E{x) = J2k.(n\pk{i-Py- k=0 np (n-1)! ^(n-/c)!(/c-l)! n-1 np y (" 1); p/(i _ p)n-i-j np(p + (1 - p))""1 = np. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr ooo»oooooooooooooo oooooooo ooooooooo ooooooooooo ooooo Základní vlastnosti středn Věta Nechť a, b G M a X, Y jsou náhodné veličina s existující střední hodnotou. Pak 9 E (a) = a, • E(a + bX) = a + bE(X), » E(X + Y) = E{X) + E{Y), » jsou-li X a Y nezávislé, pak E(XY) = E (X) ■ E(Y). Důkazy těchto tvrzení jsou přímočaré, zkuste si je udělat! Analogická tvrzení platí i pro náhodné vektory. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooo^ooooooooooooo oooooooo ooooooooo ooooooooooo ooooc Príklad Spočtěme ještě jednou střední hodnotu binomického rozdělení, tentokrát s využitím vlastností střední hodnoty. Řešení Vyjádříme počet zdarů v n pokusech jako počet zdarů v jednotlivých pokusech *=x> k=l přičemž náhodné veličiny mají všechny alternativní rozdělení A(p). Snadno spočítáme E(Y/<) = 1 • p + 0 • (1 — p) = p. Dále víme, že střední hodnota součtu je součtem středních hodnot, proto n E(X) = J2E(Yk) = np. k=l Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr ooooo»oooooooooooo oooooooo ooooooooo ooooooooooo ooooo Kvantily Dalšími užitečnými charakteristikami jsou tzv. kvantily. Pro ryze monotónní distribuční funkci Fx (tj. spojitou náhodnou veličinu X s všude nenulovou hustotou, jako je tomu např. u normálního rozdělení) jde prostě o inverzní funkci F^1 : (0,1) —> M. To znamená, že hodnota y = F-1 (a) je taková, že P[X < y) = a. Obecněji, je-li Fx(x) distribuční funkce náhodné veličiny X, pak definujeme kvantilovou funkci2 F'1(a) = inf{x G R; F (x) >a}, a G (0,1). Zřejmě jde o zobecnění předchozí definice. Nejčastěji jsou používané kvantily s a = 0.5, tzv. medián, s a = 0.25, tzv. první kvartil, a = 0.75, tzv. třetí kvartil, a podobně pro decily a percentily (kdy je a rovno násobkům desetin a setin). K těmto hodnotám se vrátíme v popisné statistice později. 2Uvědomte si, že jsme se již s kvantily setkali, jen jsme jím tak zatím neříkali. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooo^ooooooooooo oooooooo ooooooooo ooooooooooo ooooc Rozptyl a směrodatná od Tyto číselné charakteristiky rozdělení náhodné veličiny nepopisují nějakou střední či typickou hodnotu (jako střední hodnota či medián), ale míru „kolísání" náhodné veličiny kolem střední hodnoty. Rozptylem (variancí) náhodné veličiny X, která má konečnou střední hodnotu, nazýváme číslo D(X) = varX = E ([X - E(X)]2), odmocnina z rozptylu y/D(x) se pak nazývá směrodatná odchylka. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr OOOOOOO0OOOOOOOOOO oooooooo ooooooooo ooooooooooo ooooo Základní vlastnosti rozpt; Pro náhodnou veličinu X a reálna čísla a, b platí: O D(X) = E(X2) - E(X)2, O D(a + bX) = b2D(X), 0 ^/D(a + bX) = \b\y/D{X). Důkaz. Důkaz je přímočarý. Poznamenejme, že tvrzení 1 se často používá k výpočtům D{X). □ Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooo»ooooooooo oooooooo ooooooooo ooooooooooo ooooo Kovariance O závislosti dvou náhodných veličin do jisté míry vypovídá tzv. kovariance, definovaná předpisem C(X, Y) = cov(X, Y) = E([X - E(X)][Y - E {Y)]). Veličinám X, Y, pro něž je C(X, Y) = 0, říkáme nekorelované . Věta Pro náhodné veličiny s existujícími rozptyly platí: O C(X,Y) = C(Y,X), e c(x,x) = d(x), O c(x, Y) = E{XY) - E{X)E{Y), O C(a + bX,c + dY) = bd ■ c(x, Y), O d(x +Y) = D(X) + D(Y) + 2C(x, Y), speciálně, jsou-li X, Y nezávislé, je D(X + Y) = D(X) + D(Y), tj. c(x, Y) = 0 a x, Y jsou nekorelované. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr OOOOOOOOO0OOOOOOOO oooooooo ooooooooo ooooooooooo ooooo Koeficient korelace Koeficient korelace3 je jen speciální název pro kovarianci dvou normovaných náhodných veličin: R(x,y)=pxv=cf*-fg>/-fwy ' Věta O R{X,X) = 1, 9 R(a + bX,c + dY) = sgn(bd)R(X, Y), Q jsou-li X, Y nezávislé, je R(X, Y) = 0, O (Cauchyova nerovnost) \R(X, Y)\ < 1. 3Viz např. http://upload.wikimedia.Org/wikipedia/commons/0/02/ Correlation_examples.png Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooo«ooooooo oooooooo ooooooooo ooooooooooo ooooc Príklad Spočtěme rozptyl binomického rozdělení. Řešení Stejně jako dříve lze psát X = Yll-i ^k, kde Y\,...,Yn jsou nezávislé náhodné veličiny vyjadřující úspěch v /c-tém pokusu. Snadno vypočteme E(Y%) = l2 • p + O2 • (1 — p) = p, proto D{Yk) = E(y2) - E{Yk)2 = p - p2 = p(l - p). Protože pro nezávislé Yk platí D(£ Yk) = E D{Yk), je D(X) = np(l - p). Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr ooooooooooo»oooooo oooooooo ooooooooo ooooooooooo ooooo Normovaná náhodná veličina a limitní věty Připomenutí: Věta (de Moivre-Laplaceova) Pro náhodné veličiny Xn s rozdělením Bi (n, p) platí = *(/))-*(a), kde je distribuční funkce normovaného normálního rozdělení. Všimněme si, že výraz ,x"~"p vystupující v Moivre-Laplaceově y/np(l-p) větě je totéž, co " , v "; a jde tedy o tzv. normovanou vD(x) náhodnou veličinu (tj. veličinu lineárně transformovanou tak, aby měla střední hodnotu 0 a rozptyl 1). Moivre-Laplaceova věta pak říká, že pro n —> oo se rozložení této náhodné veličiny blíži normovanému normálnímu rozdělení A/(0,1). lim P n—>oo a < np VnP0- - p) < b Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooo»ooooo oooooooo ooooooooo ooooooooooo ooooo Další momenty Někdy je užitečné studovat řadu dalších charakteristik rozdělení náhodných veličin. Za rozumných předpokladů jsou definovány k-té obecné momenty Á = E(Xk) a k-té centrální momenty pk = E{[X-E{X)]k). Pomocí momentů pak definujeme např. šikmost (asymetrii) náhodné veličiny X jako nebo špičatost (exces) jako -íí* 3. d(x)2 Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr ooooooooooooo»oooo oooooooo ooooooooo ooooooooooo ooooc 30 20 10 Kladná šikmost distribuce (více vysokých kladných hodnot než odpovídá normálnímu rozdělení s nulovou šikmostí). Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooo»ooo oooooooo ooooooooo ooooooooooo ooooo Momentová vytvořující fu ^^^^^^^^^^^^^^^^^^^ Reálnou funkci proměnné ŕ G M Mx(t) = E(e ) nazveme momentovou vytvořující funkcí náhodné veličiny X. Poznámka Je-1i X např. spojitá, platí /oo etxf(x) dx = -oo ľ°° t2X2 = / (l + íx+_ + ...)f(x)dx = J — oo = 1 + t/ii + -^p + • • • a jde vlastně o exponenciální vytvořující funkci posloupnosti /c-tých obecných momentů p!k. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr ooooooooooooooo»oo oooooooo ooooooooo ooooooooooo ooooc Pro momentovou vytvořující funkci platí: « Pro nezávislé náhodné veličiny platí Mx+Y{t) = M x (t) M y (t). * r-tý obecný moment fi'r náhodné veličiny X je koeficient u v rozvoji Mx do exponenciální mocninné řady. Tedy např. EX = li'1,DX = ^2-(^)2. » Je-li Y = a + bX, pak My (t) = eař Mx{bt). « Platí-li Mx{t) = My(ŕ) pro všechna t G (-b, b), mají náhodné veličiny stejné rozdělení, tj. Fx(x) = Fy(x) (b > 0 libovolné). Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooo»o oooooooo ooooooooo ooooooooooo ooooc Príklad Určete momentovou vytvořující funkci binomického rozdělení. Řešení M(t) = E(etx) = £ ^("V(1 - p)"^ = = É (£W)*(i - p)"-* = k=Q ^ ' = (peř + (l-p))" = (p(eř-l) + l)". Snáze jsme mohli funkci určit s využitím předchozích vět a momentové vytvořující funkce alternativního rozdělení, neboť pro Y ~ A{p) je E(etY) = eřl • p + eř0(l - p) = p(eř - 1) + 1. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr ooooooooooooooooo* oooooooo ooooooooo ooooooooooo ooooc Príklad Naposled spočtěme střední hodnotu a rozptyl binomického rozdělení, tentokrát s využitím vytvořující funkce. Řešení M(t) = (p(eř - 1) + 1)", proto je ftM(t) = n(p(eř - -i) + i)"-VP, což pro t = 0 dá E(X) = fi^ = np Podobně spočítáme i D(x) = //2 — Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo •ooooooo ooooooooo ooooooooooo ooooc Přímý výpočet střední hodnoty a rozptylu normovaného normálního rozdělení není triviální. S využitím momentové vytvořující funkce je ale poměrně jednoduchý. Nechť Z~ N(0,1). Pak Poslední integrál je roven 1 díky tomu, že na místě integrované funkce je funkce s vlastnostmi hustoty. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr OOOOOOOOOOOOOOOOOO O0OOOOOO ooooooooo ooooooooooo ooooo >třední hodnota a rozptyl normálního rozděle S využitím předchozího výpočtu Mz(t) spočítame, že M'z(t) exp(-y ) snadno ŕexp( — Mz(t) = ťexp{—) +exp Dosazením t = 0 pak dostaneme E(Z) = 0,D(Z) = 1. Pro transformovanou náhodnou veličinu Y = fi + aZ ~ A/(/x, a2) pak snadno odvodíme z vlastností střední hodnoty, resp. rozptylu, že E(Y) = fi, D(Y) = a2 (což zpětně zdůvodňuje zápis A/(/x, a2)). Momentová vytvořující funkce pro Y má tvar MY{t) exp[fit + a — Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oo«ooooo ooooooooo ooooooooooo ooooc Príklad Určete rozdělení součtu nezávislých náhodných veličin X~/V(/iX,<72), Y~N(vy,v2y)- Řešení Z vlastností momentové vytvořující funkce dostáváme t2 t2 Mx+v{t) = exp(/xxŕ + ct2x—) exp(/xyŕ + o2Y—) = ŕ2 = exp((/iX + /iy)t + {a2x + a2Y) — ). Proto X + V ~ A/(/iX + Aty, 0 a nulová jinde (a, b > 0 jsou parametry) byla hustotou náhodné veličiny. Hustota musí splňovat 1 = 00 -t\a-i _řl cl - e -ř"dř ba Jo ba K h proto c = TK- Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooo»ooo ooooooooo ooooooooooo ooooo Poznámka Funkce ľ je zobecnění faktoriálu (ľ(n) = (n — 1)! pro n G N), definované předpisem ľ(a) = xa~1e~x dx. Často počítáme hodnoty této funkce s využitím vlastností r(l/2) = r(a + l) = a-r(a). Definice Rozdělení náhodné veličiny s hustotou spočítanou v předchozím příkladu nazýváme gamma rozdělení s parametry a, b a značíme l~(a, b). Momentová vytvořující funkce je pak M(t) = {^-t)a, střední hodnota E(X) = a/b a rozptyl D(X) = a/b2. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo ooooo»oo ooooooooo ooooooooooo ooooo Příklad (rozdělení \2 podruhé) Nechť Z má normované normální rozdělení. Určete hustotu transformované náhodné veličiny X = Z2. Již dříve jsme vypočetli přímým výpočtem přes distribuční funkci, že hustota fx{x) = ^=x 2 e 2tt a řekli jsme si, že jde o (Pearsonovo) \2 rozdělení s jedním stupněm volnosti, které značíme X ~ X2(l)- Nyní vidíme, že jde o speciální případ T-rozdělení, totiž l~(l/2,l/2). Obecně pro součet Y čtverců n nezávislých náhodných veličin s rozdělením A/(0,1) obdobně odvodíme, že má rozdělení T(n/2,1/2) a říkáme, že Y má rozdělení x2{n) (chíkvadrát s n stupni volnosti). Toto rozdělení se ve statistice používá velmi často. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooooo»o ooooooooo ooooooooooo ooooo Další důležitá rozdělení F-rozdělení Jsou-li X, Y nezávislé náhodné veličiny s rozděleními X ~ X2(^)) Y ~ x2{m)> Pa^ má transformovaná náhodná veličina U X/k Y/m takzvané Fisher-Snedecorovo F-rozdělení F(k,m) s k a m stupni volnosti. Studentovo t-rozdělení Jsou-li Z ~ A/(0,1) a X ~ x2{n) nezávislé náhodné veličiny, pak má veličina 7 T yfxfn tzv. Studentovo t-rozdělení t(n) s n stupni volnosti. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr OOOOOOOOOOOOOOOOOO 0000000» ooooooooo ooooooooooo ooooo Přehled rozdělení odvozených od normálního Zi,..., Zk ~ A/(0,1) .....nezávislá normovaná normálni i Zf ~ x2(^) ■ ■ ■ ■ chĺ-kvadrát o k stupních volnosti X21 k Fk m = v21 ~ F(k, m) . . F-rozdělení s k a m stupni volnosti Ti, = ~ tik)......t-rozdělení s k stupni volnosti Odtud zejména Z2 ~ x2(l) a T% ~ F(l, k). rozdělení střední hodnota rozptyl X2(k) t(k) F(k,m) y-k 0 m/(m - 2) a2 2k k/(k - 2) 2m2(k + m - 2)/k(m - 2)2(m - 4) Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr OOOOOOOOOOOOOOOOOO OOOOOOOO »00000000 ooooooooooo ooooo Motivace S jedním případem limitní věty jsme se již setkali - de Moivre-Laplaceova věta říká, že binomické rozdělení Bi(n,p) lze za určitých podmínek aproximovat normovaným normálním rozdělením. Obvykle se k aproximaci přistupuje při splnění podmínek np(l -p)>9a^ 0 platí DX P{\X-EX\>e)<—. Důkaz. Budeme odhadovat rozptyl DX ve spojitém případě (diskrétní analogicky): /OO f (X - EX)2f(x) dx> (X - EX)2f(x) dx > -oo J\x-EX\>e > / e2f(x) dx = e2P(\X - EX\ > e). J\x-EX\>e _□ Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooooooo oo»oooooo ooooooooooo ooooc Pomoci Čebyševovy nerovnosti můžeme odhadovat pravděpodobnost, s jakou se náhodná veličina s neznámým rozdělením odchýlí od své střední hodnoty o více než /c-násobek směrodatné odchylky (zřejmě je totiž P(\X — E(X)\ > ka) < p). ' Příklad * Nechť je E(X) = fi, D{X) = a2. 9 Odhadněte P(\X -y, > 3 3a), jestliže navíc víte, že X ~ N(0,1). Řešení O 1/9, @ 0,0027. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooooooo ooo»ooooo ooooooooooo ooooo Zákon velkých čísel Věta (Čebyševova - slabý zákon velkých čísel) Necht jsou Xi, X2,... po dvou nezávislé náhodné veličiny, které mají všechny stejnou střední hodnotu p a rozptyl shora ohraničený stejnou hodnotou a2. Pak pro libovolné e > 0 platí lim P n—>oo 1 " n ±—' i=l < e Říkáme, že posloupnost aritmetických průměrů konverguje podle pravděpodobnosti ke střední hodnotě p,. Speciálním případem této věty je Bernoulliova věta, která říká, že je-li Yn ~ Bi(n, p), pak posloupnost relativních četností Yn/n konverguje podle pravděpodobnosti k p. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooooooo oooo»oooo ooooooooooo ooooc Věta (Bernoulliova) Pro náhodnou veličim pro libovolné e > 0 pl / s binon 3tí Yn --P n niekým rozdělením Yn ~ Bi (n, p) a J nez Důkaz. ^ Plyne snadno z Čebyševovy nerovnosti, neboť E(Yn/n) = np/n = p a D(Yn/n) = np(l - p)/n2 = p(l - p)/n. □ Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooooooo ooooo»ooo ooooooooooo ooooc Príklad Při zkoušce bylo zjištěno, že mezi 600 kontrolovanými studenty je 5 studentů, kteří neumí ani malou násobilku. Odhadněte pravděpodobnost, že relativní četnost takových studentů se od jejich pravděpodobnosti výskytu liší o více než 0,01? (Můžete předpokládat, že pravděpodobnost výskytu studenta bez znalosti násobilky je menší než 0,02). Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooooooo oooooo^oo ooooooooooo ooooc Centrálni limitní věta dá odpověď na otázku, proč je normálni rozdělení nejdůležitějším rozdělením. Ukazuje totiž, že rozdělení součtu dostatečně velkého počtu nezávislých a stejně rozdělených náhodných veličin lze aproximovat normálním rozdělením. Necht je Y\, Y2,... posloupnost nezávislých stejně rozdělených náhodných veličin se střední hodnotou fi a rozptylem a2. Pak pro normované náhodné veličiny platí lim P(S„ < x) = 0(x), kde je distribuční funkce rozdělení N'(0,1). Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooooooo ooooooo»o ooooooooooo ooooc Príklad Mezi učiteli matematiky v ČR je jich 10% s příjmem přesahujícím celostátní průměr. Kolik matematiků je třeba pozvat na konferenci, aby s pravděpodobností aspoň 0,95 mezi nimi bylo 8 až 12 procent s nadprůměrným příjmem? Yn ~ Bi(n; 0,1), E(Yn) = 0,1 • n, D(Yn) = 0,1 • 0,9 • n. Pak 0,95 < P(0,08n (^ ) > 0,975, což je ekvivalentní y/ň/15 > 1,96, tj. n > 865. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr OOOOOOOOOOOOOOOOOO OOOOOOOO 00000000» ooooooooooo ooooo Řešení (Pomocí Bernoulliovy nerovnosti) Nyní využijme Bernoulliovu nerovnost - ta dává Y -^-0,1 n < 0,02 ) > 1 0,1-0,9 n-0,022' což má být alespoň 0,95. Odtud 0,09 n > 0,05 • 0,022 4500. Vidíme, že odhad prostřednictvím Bernoulliovy nerovnosti je podstatně slabší než odhad s využitím centrálni limitní věty (resp. de Moivre-Laplaceovy věty). Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr OOOOOOOOOOOOOOOOOO OOOOOOOO OOOOOOOOO »0000000000 ooooo Náhodný vektor - pripomenutí Je-1i (Q, A, P) pravděpodobnostní prostor a Xi,..., X„ na něm definované náhodné veličiny s distribučními funkcemi F\,..., Fn, pak náhodným vektorem je n-tice X = (Xi,... ,X„) s distribučn funkcí definovanou vztahem Fx(xi,...,x„) = P(Xi < xi,..., X„ < xn). V tomto kontextu nazýváme F simultánni distribuční funkcí náhodného vektoru X a F; marginálni distribuční funkcí náhodné veličiny X-,. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooooooo ooooooooo o»ooooooooo ooooc Podobně jako v případě diskrétní náhodné veličiny označuje p(xi,... , x„) pravděpodobnostní funkci diskrétního náhodného vektoru X, je-li Fx(xi,... ,x„) = ^2 • • • ^2 p(ŕi,..., ŕ„). tl Y = Yj), kde yi,... tvoří úplný systém jevů. Vztah pro spojitě rozdělený náhodný vektor je analogický. 4Obvykle zapisujeme ve statistice vektory do sloupců, proto bychom spise měli psát (X, Y)T. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooooooo ooooooooo ooo»ooooooo ooooo (stochastická) Nezávislost náhodných veličin Dříve uvedenou defi nici nezávislosti náhodných veličin X\,..., Xn pomocí vztahu P{XÍ = Xi, ... ,Xn = xn) = P{XÍ = Xi) • • • P{Xn = xn) pro libovolné xi,xn, tak můžeme nyní přepsat pomocí vztahu mezi sdruženou distribuční funkcí náhodného vektoru X = (Xi,..., X„) a marginálních distribučních funkcí náhodných veličin Xl, ..., X„: Fx(xi,... ,xn) = FXl(xi) • • • FXn{xn). Příklad Házíme dvěma běžnými kostkami, jako náhodnou veličinu X označme součet bodů na obou kostkách, jako náhodnou veličinu Y absolutní hodnotu rozdílu. Určete sdružené rozdělení náhodného vektoru (X, Y), obě marginální rozdělení a odvoďte, jsou-li X a Y nezávislé. Číselné charakteristiky náhodných velič oooooooooooooooooo Normální rozde oooooooo iíselné charakteristiky ná e(X) = (e(Xi),..., e(X„)) se nazýva vektor středních hodnot, d(Xi) C(Xi,X2) ••• C(Xi,Xn)^ • D{Xn) var(X) vC(X„,Xi) C(X„,X2) varianční (rozptylová) matice a 1 tf(Xi,X2) ,/?(X„,Xi) /?(X„,X2) corX /?(Xi,X„)N 1 je korelační matice. Snadno je po rozepsání po jednotlivých složkách vidět, že var(X) = e((X - e(X)) • (X - e(X)H Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooooooo ooooooooo ooooo»ooooo ooooc Ukážeme na příkladech, že pravděpodobnostní struktura náhodného vektoru (X, Y) není určena pouze marginálními rozděleními veličin X a Y. Podstatný je rovněž pravděpodobnostní vztah mezi X a Y, který je částečně popsán např. prostřednictvím korelačního koeficientu. Příklad Jsou-li X a y náhodné veličiny, nabývající hodnot 0 a 1, pak P(X = 1, Y = 1) - P(X = 1)P{Y = 1) = E(XY)-E(X)E(Y) = = cov(X, Y). Odtud je snadno vidět, že pokud jsou X a Y nekorelované, jsou i nezávislé (což obecně neplatí). Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooooooo ooooooooo oooooo»oooo ooooc Uveďme ještě příklad, ilustrující, že nekorelovanost nemusí implikovat nezávislost: Příklad Buďte A a X nezávislé náhodné veličiny, splňující X ~ A/(0,1) a P (A = 1) = P{A = -1) = 1/2. Položíme-li Y = AX, pak P(Y < y) = \P{X < y) + l-P{-X < y) = = ^(X, Y) polární souřadnice náhodného vektoru (X, Y) a určíme rozdělení vektoru (/?, í>). Pro 0 < ri < 1 a 0 < (^i < 2?r je Hustota je tedy rovna f(r, tp) = - pro 0 < r < 1, 0 < tp < 2tt a rovna 0 všude jinde. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooooooo ooooooooo oooooooo»oo ooooo Příklad (pokr.) Marginálni hustoty g(r) a h(ip) veličin R a <í> se nyní snadno dopočtou: g(r) 2tt -dtp = 2r f00 ľ1 r 1 / f(r,lp)dr= / -dr=—. J-oo JO 71 Z7V Veličina <í> má rovnoměrné rozdělení na (0, 2ir), odkud E(í>) = tt a D(í>) = 7r2/3, snadno rovněž odvodíme E(R) = 2/3, D{R) = 1/18. Všimněme si ale zejména, že f (r, ip) = g(r)h(ip), což znamená nezávislost veličin R a í>. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooooooo ooooooooo ooooooooo»o ooooo Vlastnosti charakteristik náhodného vektoru Věta Pro náhodné vektory X, Y stejné dimenze, konstantní matici B a konstantní vektor a (odpovídajících dimenzí) platí • e(X + Y) = E{X) + E{Y), 9 E(a + BX) = a + B-E(X), » var(a + B ■ X) = Bvar(X)BT . Důkaz. Důkaz vyplýva z vlastností náhodných veličin a ze vztahu var(X) = E((X-E(X))(X-E(X))T). □ ^-s Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr OOOOOOOOOOOOOOOOOO OOOOOOOO OOOOOOOOO 0000000000» ooooc Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooooooo ooooooooo ooooooooooo »oooo Definice Náhodným výběrem rozsahu n rozumíme n-tici nezávislých a stejně rozdělených náhodných veličin Xi,... ,X„ ~ Fx{x) (někdy také hovoříme o n nezávislých kopiích náhodné veličiny X). Náhodným výběrem rozsahu n z p-rozměrného rozdělení rozumíme n-tici nezávislých a stejně rozdělených p-rozměrných náhodných vektoru. V matematické statistice často pracujeme s transformacemi náhodného výběru, takovým náhodným veličinám (příp. vektorům) říkáme statistiky. V následujícím zavedeme několik důležitých statistik a ukážeme jejich souvislost s číselnými charakteristikami náhodných veličin. Definice Nechť Xl,... ,X„ je náhodný výběr. Statistiku 1 " M = ~yx, n t—' nazýváme výběrový průměr, statistiku i=l výběrový rozptyl a statistiku S = VŠ2 výběrová směrodatná odchylka. Analogicky se definují i výběrová kovariance, příp. výběrový korelační koeficient pro dvourozměrný náhodný výběr. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooooooo ooooooooo ooooooooooo oo»oo IH1 Protože jsou uvedené statistiky náhodnými veličinami, lze se přirozeně ptát po jejich číselných charakteristikách. Věta _' Nechť X1,.. ., Xn je náhodný výběr rozsahu n z rozdělení se střední hodnotou fi a rozptylem a2 . Pak platí: « E(M) = = V-, « D(M) -. = var(M) = o2jn, • E(S2) - = a2. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooooooo ooooooooo ooooooooooo ooo»o Důkaz. Ukážeme jen (nejsložitější) 3. tvrzení. Snadno se odvodí, že platí £(X, - pf = £(X, ~ Mf + n(M - /x) Proto je Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooooooo ooooooooo ooooooooooo oooo* V předchozí větě jsme ukázali, že výběrový průměr M splňuje E(M) = /x, jeho střední hodnota je tedy rovna odhadovanému parametru fi. V takovém případě říkáme, že statistika M je nestranným odhadem parametru fi. Podobně jsme viděli, že S2 je nestranným odhadem parametru a2. Všimněme si rovněž, že „přirozeněji" definovaná statistika - ^2(Xj — M)2 není nestranným odhadem u2, její střední hodnota je totiž rL^ 2. Označme M\, M2 jejich výběrové průměry a S2, S| výběrové rozptyly. Dále necht je s2=(m-l)S2 + (n-l)S2 m + n - 2 vážený průměr výběrových rozptylů. Pak platí: • Mi — M2 a S2 jsou stochasticky nezávislé, • Mi - M2 ~ - /i2, ^ + f) , • _/e-// u2 = aj pa/c • F : (m + n-2)S2/a2 ~x2(m + n-2) 5£M F(m- 1). Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooooooo ooooooooo ooooooooooo ooooo • Statistika U, vzniklá normováním M\ — M2, se používá pro odhad rozdílu \i\ — [12, známe-li rozptyly a2, a2. • Je-1i a\ = a\ = a2, pak statistika T (vzniklá z U nahrazením teoretického společného rozptylu a2 váženým průměrem výběrových rozptylů S2) slouží pro odhad rozdílu \i\ — [12, neznáme-li rozptyl a2. • Statistika K = (m + n — 2)S2/a2 slouží k odhadu společného rozptylu a2. • Statistika F = \. \ slouží k odhadu podílu rozptylů o\ja\. Číselné charakteristiky náhodných veličin Normální rozdělení a rozdělení odvezená Limitní věty a odhady Náhodný vektor Náhodr oooooooooooooooooo oooooooo ooooooooo ooooooooooo ooooo Príklad Mějme dva nezávislé náhodné výběry; první rozsahu 10 z rozdělení A/(2; 1,5) a druhý rozsahu 5 z rozdělení A/(3, 4). Určete pravděpodobnost, že výběrový průměr prvního výběru bude menší než výběrový průměr druhého výběru. P(Mi < M2) = P(Mi - M2 < 0) p - (Mi - M2) - (/ii - /i2) < 0 - (/ii - /i2) 2 2 Zl + ^2. 2 2 íl _L 2i m ' n p\u<-HL hl _L 1 10 t 5 . *(1,05) = 0,853. P{U < 1,05)