Matematika IV - 10. přednáška Transformace a číselné charakteristiky náhodných veličin Michal Bulant Masarykova univerzita Fakulta informatiky 21. 4. 2008 * S ooooooooooooooooooo Obsah přednášky Transformace náhodných veličin Q Číselné charakteristiky náhodných veličin n S - = -E - 0 0 * 0 ooooooooooooooooooo Doporučene zdroje * Martin Panák, Jan Slovák, Drsná matematika, e-text. * Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická statistika, Matfyzpress, 4. vydání, 2006, 230 stran, ISBN 80-867-3271-1. * Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80-210-3313-4. * Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Popisná statistika, Masarykova univerzita, 3. vydání, 2002, 48 stran, ISBN 80-210-1831-3. * Marie Budíková, Tomáš Lerch, Štěpán Mikoláš, Základní statistické metody, Masarykova univerzita, 2005, 170 stran, ISBN 80-210-3886-1. Číselne charakteristiky nahodr ooooooooooooooooooo Pian přednášky Transformace náhodných veličin ,isel :h veličin n S - = -E - 0 0 * 0 Číselne charakteristiky nahodr ooooooooooooooooooo Příklad (rozdelení x 2 ( l ) ) Nechť Z má normované normální rozdělení. Určete hustotu transforomované náhodné veličiny X = Z2 . * s Číselne charakteristiky nahodr ooooooooooooooooooo Příklad (rozdelení x 2 ( l ) ) Nechť Z má normované normální rozdělení. Určete hustotu transforomované náhodné veličiny X = Z2 . Řešení Zřejmě je pro x < 0 distribuční funkce nulová, pro x > 0 dostáváme: F*(x) = P[Z2 < x] = P[-y/x < Z < y/x\ = 1 -*-Ae 2 dz fi. \/2Ťr 7o V27T a derivací podle x dostaneme hustotu 1 1 - i - í j t 2 e 2 dŕ 6c(x) _ 1 _ x x 2 e 2 . Rozdělení náhodné veličiny s touto hustotou se nazývá (Pearsonovo) %2 rozdělení s jedním stupněm volnosti a značí se x - Y2 m. Číselne charakteristiky nahodr ooooooooooooooooooo Transformace náhodných veličin Místo náhodné veličiny X, např. ,,roční plat zaměstnance", budeme vyčíslovat jinou závislou hodnotu ip(X), např. ,,roční čistý příjem zaměstnance po zdanění a včetně sociálních dávek". V systému se značnou sociální solidaritou je první veličina hodně variabilní, zatímco druhá může být skoro konstantní. Statisticky se proto budou značně odlišovat. Číselne charakteristiky nahodr ooooooooooooooooooo Transformace náhodných veličin Místo náhodné veličiny X, např. ,,roční plat zaměstnance", budeme vyčíslovat jinou závislou hodnotu ip(X), např. ,,roční čistý příjem zaměstnance po zdanění a včetně sociálních dávek". V systému se značnou sociální solidaritou je první veličina hodně variabilní, zatímco druhá může být skoro konstantní. Statisticky se proto budou značně odlišovat. Připomeňme si přechod od binomického k Poissonovu rozdělení z minulé přednášky: Věta (Poissonova) Je-li Xn ~ Bi(n,p,,) taková, že lim,,_-+00 npn = X a X - Po(A), pak lim P[Xn = k] -- n-->oo = P[X == k] pro k = 0,1,.... Číselne charakteristiky nahodr ooooooooooooooooooo Binomické rozdělení Bi(n,p) odpovídá n-krát nezávisle opakovanému pokusu popsanému alternativním rozdělením, přičemž naše náhodná veličina měří počet zdarů. Je tedy fx(t) (Va-p)1 " f ŕ e { 0 , 1 , . . . , n} jinak * s Číselne charakteristiky nahodr ooooooooooooooooooo Binomické rozdělení Bi(n,p) odpovídá n-krát nezávisle opakovanému pokusu popsanému alternativním rozdělením, přičemž naše náhodná veličina měří počet zdarů. Je tedy fx(t) Dťil-p)1 -' t G { 0 , 1 , . . . , n} jinak lim P(Xn = k)= lim ír ") ( n 1)r " k .. rn(rn-l)...(rn-k + l) 1 / l V " h m 1 7Ü 77 I ! - - I n->oo ( n -- 1)K k\ \k / _ a \r " \k lim 1 + k\ n->oo \ r, k\ * S Číselne charakteristiky nahodr ooooooooooooooooooo Binomické rozdělení Bi(n,p) odpovídá n-krát nezávisle opakovanému pokusu popsanému alternativním rozdělením, přičemž naše náhodná veličina měří počet zdarů. Je tedy fx(t) Dťil-p)1 -' t G { 0 , 1 , . . . , n} jinak lim P(Xn = k)= lim ír ") ( n 1)r " k Poissonovo rozdělení popisuje náhodné veličiny s pravděpodobnostní funkcí fx (ŕ) = ^ e " A p r o ř G N .. rn(rn-l)...(rn-k + l) 1 / l V " h m 1 7Ü 77 I ! - - I n->oo ( n -- 1)K k\ ^ , (, " T T Y " A* A -- hm 1 + -- M = T T e K\ n->oo \ rn I K\ * s Číselne charakteristiky nahodr ooooooooooooooooooo Nejjednodušší funkcí, po konstantách, je afinní závislost ip(x) = a + bx. V případě afinní závislosti x = \{y -- a) je proto pravděpodobnostní funkce nenulová právě v bodech y, = ax; + b. * s Číselne charakteristiky nahodr ooooooooooooooooooo Nejjednodušší funkcí, po konstantách, je afinní závislost ip(x) = a + bx. V případě afinní závislosti x = \{y -- a) je proto pravděpodobnostní funkce nenulová právě v bodech y, = ax; + b.\l případě rozdělení Xn typu Bi(n, p) převádí transformace x = y^Jnp(l -- p) + np náhodnou veličinu Xn na rozdělení Yn s distribuční funkcí blízkou distribuční funkci spojitého rozdělení A/(0,1). * s Číselne charakteristiky nahodr ooooooooooooooooooo Nejjednodušší funkcí, po konstantách, je afinní závislost ip(x) = a + bx. V případě afinní závislosti x = \{y -- a) je proto pravděpodobnostní funkce nenulová právě v bodech y, = ax; + b.\l případě rozdělení Xn typu Bi(n, p) převádí transformace x = y^np(l -- p) + np náhodnou veličinu Xn na rozdělení Yn s distribuční funkcí blízkou distribuční funkci spojitého rozdělení A/(0,1). Dříve uvedená Poissonova věta popisuje asymptotické chování binomického rozdělení pří n --> oo a p --> 0, následující věta pak chování v případě konstantní pravděpodobnosti zdaru p. * s Číselne charakteristiky nahodr ooooooooooooooooooo Nejjednodušší funkcí, po konstantách, je afinní závislost ip(x) = a + bx. V případě afinní závislosti x = \{y -- a) je proto pravděpodobnostní funkce nenulová právě v bodech y, = ax; + b.\l případě rozdělení Xn typu Bi(n, p) převádí transformace x = y^np(l -- p) + np náhodnou veličinu Xn na rozdělení Yn s distribuční funkcí blízkou distribuční funkci spojitého rozdělení A/(0,1). Dříve uvedená Poissonova věta popisuje asymptotické chování binomického rozdělení pří n --> oo a p --> 0, následující věta pak chování v případě konstantní pravděpodobnosti zdaru p. Věta (de Moivre-Laplaceova) Pro náhodné veličiny Xn s rozdělením Bi(n,p) platí Xn - np lim P n-->oo a < je distribuční funkce normovaného normálního rozdělení. Příklad Hodíme kostkou celkem 12 000 krát. Určete pravděpodobnost toho, I že počet hozených šestek je mezi 1800 a 2 100. * s Příklad Hodíme kostkou celkem 12 000 krát. Určete pravděpodobnost toho, I že počet hozených šestek je mezi 1800 a 2 100. Řešení Přesná pravděpodobnost je dána výrazem 2100 A2000^1^5U2000-^ Qof j f i o b t í ž n ě v y c T s | i t e | n e .Y^iuu /12000\/1>>/(/5>I12000 2^k=1800 \ k / V 6 ^ V 6 ^ * s Příklad Hodíme kostkou celkem 12 000 krát. Určete pravděpodobnost toho, I že počet hozených šestek je mezi 1800 a 2 100. Řešení Přesná pravděpodobnost je dána výrazem Z S o C T K ^ a ) 1 2 0 0 0 ^ což je obtížně vyčíslitelné. Využijeme tvrzení Moivre-Laplaceovy věty, přepsaného do tvaru P[A( B ~np ) - * ( A ~np ) ) pro n --> 0. * s Příklad Hodíme kostkou celkem 12 000 krát. Určete pravděpodobnost toho, I že počet hozených šestek je mezi 1800 a 2 100. Řešení Přesná pravděpodobnost je dána výrazem Z S o C T K ^ a ) 1 2 0 0 0 ^ což je obtížně vyčíslitelné. Využijeme tvrzení Moivre-Laplaceovy věty, přepsaného do tvaru P[A( B ~np ) - * ( A ~np ) ) pro n --> 0. * s Řešení (pokr.) Volbou p = 1/6, A = 1800, B = 2100, n = 12000 dostáváme odhad P^

1800 - 2000 12000-if. (V6) - *(-2\/6) ^0,992. * g - = Řešení (pokr.) Volbou p = 1/6, A = 1800, B = 2100, n = 12000 dostáváme odhad 2100 - 2000 '12000 - i f 1800 - 2000 '12000 - i f (Vö) - (-2^6) -0,992. Poznámka Statistické tabulky - viz např. h t t p s : / / i s . m u n i . c z / a u t h / e l / 1433/jaro2008/MB104/um/StatTab.pdf nebo sbírka příkladů [BMO]. Osecký. * S Řešení (pokr.) Volbou p = 1/6, A = 1800, B = 2100, n = 12000 dostáváme odhad 2100 - 2000 '12000 - i f 1800 - 2000 '12000 - i f <Í>(V6) - (-2^6) -0,992. Poznámka Statistické tabulky - viz např. h t t p s : / / i s . m u n i . c z / a u t h / e l / 1433/jaro2008/MB104/um/StatTab.pdf nebo sbírka příkladů [BMO]. Osecký. Příklad Pravděpodobnost narození chlapce je 0,515. Jaká je pravděpodobnost, že mezi tisíci novorozenci bude alespoň tolik děvčat jako chlapců? Příklad Nezávisle opakujeme pokus s výsledky 1 a 0, které mají neznámé pravděpodobnosti p a 1 -- p. Parametr p chceme odhadnout pomocí relativních četnostíXn/n (Xn je počet jedniček při n pokusech). Víme, zeje Xn ~ Bi(n,p), proto nám Moivre-Laplaceova věta umožní určit počet pokusů n potřebný k zajištění požadované přesnosti odhadu ö se spolehlivostí 1 -- ß. * s Příklad Nezávisle opakujeme pokus s výsledky 1 a 0, které mají neznámé pravděpodobnosti p a 1 -- p. Parametr p chceme odhadnout pomocí relativních četnostíXn/n (Xn je počet jedniček při n pokusech). Víme, zeje Xn ~ Bi(n,p), proto nám Moivre-Laplaceova věta umožní určit počet pokusů n potřebný k zajištění požadované přesnosti odhadu ö se spolehlivostí 1 -- ß. Využijeme Moivre-Laplaceovu větu zapsanou ve tvaru Xn 0 = lim n-->oo 1 -- ß, kterou můžeme podle věty aproximovat nerovností (. nö \^np{l-p) ^ ( nö 2 nö y/np(l - p) y/np(l-p)t ß.1 > 1 Řešení Hledáme nejmenší n, splňující nerovnost P[\Xn/n -- p\ < ö] > 1 -- ß, kterou můžeme podle věty aproximovat nerovností Ta je ekvivalentní s podmín kou nS/y/np{l-p) > z(ß/2), kde z{p) je řešení rovnice (z(p)) = 1 -- p (tzv. kritická hodnota normovaného normálního rozdělení). Řešení Hledáme nejmenší n, splňující nerovnost P[\Xn/n -- p\ < ö] > 1 -- ß, kterou můžeme podle věty aproximovat nerovností Ta je ekvivalentní s podmínkou nö/\Jnp{l z{p) je řešení rovnice (z(p)) -p)>z(ß/2), kde 1 -- p (tzv. kritická hodnota normovaného normálního rozdělení). Pro ö = 0, 05 a 1 -- ß = 0, 9 máme z tabulek z(/3/2) w 1, 645 a s využitím zřejmého odhadu p ( l - p) < 1/4 dostáváme n > (z(ß/2)/25)2 w 270,6. Podobně zkusme opačnou transformaci provést na veličinu Y s normálním rozdělením A/(0,1). Pro pevně zvolená čísla /x, a G M, a > 0 spočtěme rozdělení náhodné veličiny Z = ß + a Y. ooooooooooooooooooo Transformace normálně rozložené veličiny Podobně zkusme opačnou transformaci provést na veličinu Y s normálním rozdělením A/(0,1). Pro pevně zvolená čísla /x, a G M, a > 0 spočtěme rozdělení náhodné veličiny Z = ß + a Y. Dostáváme distribuční funkci Fz(z) = P(Z < z) = P{ß + uY < z) O" J-oo V27T (*-M)2 e 2T2 d x , 2-7T(T kde poslední úprava vychází ze substituce x = /x + at. Hustota naší nové náhodné veličiny Z j e proto 1 (*-M)2 * e 2<72 2-7T(T a takovému rozdělení se říká normální typu N(/j,<7^, Číselne charakteristiky nahodr ooooooooooooooooooo Plán přednášky O Tra Q Číselné charakteristiky náhodných veličin n S - = -E - 0 0 * 0 Při statistickém zkoumání hodnot náhodných veličin (např. zpracování výsledků nějakého měření) hledáme výpovědi o náhodné veličině pomocí různých z ní odvozených čísel. Jako nejjednodušší příklad může sloužit střední hodnota1 E{X) náhodné veličiny X, která je definována P(Y\ J 5 ľ / X / ' ^ ( x ' ) Pro diskrétní veličinu [ X ľ ^ o x ' 6c(x )dx pro spojitou veličinu. Obecně střední hodnota náhodných veličin nemusí existovat, protože příslušné sumy či integrály nemusí konvergovat. Často se místo E(X) pise EX. oooooooooooooooooo Střední hodnota transforomováné náhodné veličiny Střední hodnotu můžeme přímo vyjádřit také pro funkce Y = ip(X) náhodné veličiny X. V diskrétním případě můžeme přímo spočíst j j í/,(X;)=yi = X>(x,)P(X = x,). i Je tedy E(ip(X)) přímo spočítatelná pomocí pravděpodobnostní funkce 5c- oooooooooooooooooo Střední hodnota transforomováné náhodné veličiny Střední hodnotu můžeme přímo vyjádřit také pro funkce Y = ip(X) náhodné veličiny X. V diskrétním případě můžeme přímo spočíst j j í/,(X;)=yi = X>(x,)P(X = x,). i Je tedy E(ip(X)) přímo spočítatelná pomocí pravděpodobnostní funkce 5cPodobně vyjadřujeme střední hodnotu funkce ze spojité náhodné veličiny: / oo V(x)fx(x)dx, -oo pokud tento integrál absolutně konverguje. ooooooooo oooooooooooooooooo Příklad Spočtěme střední hodnotu binomického rozdělení. * s - = ˇ. -o<\(y Transformace náhodných veličin Číselne charakteristiky náhodných ve ooooooooo oooooooooooooooooo icm Příklad Spočtěme střední hodnotu binomického rozdělení. Pro X ~ Bi(n,p) je E{x) = Yjk-(n \pk {i-PyI,--n \ /k=0 *T^i^^->r> n-l j=0 v JJJ np. * S Číselne charakteristiky nahodr oooooooooooooooooo Základní vlastnosti střední hodnoty roffii Necht a, b G M a X, Y jsou náhodné veličina .; existující střední hodnotou. Pak * E(a) = a, * s Číselne charakteristiky nahodr oooooooooooooooooo Základní vlastnosti střední hodnoty roffii Necht a, b e R a x, Y jsou nahodné veličina .; existující střední hodnotou. Pak * E(a) -= a, * E(a +bX) == a + bE(X), * s Číselne charakteristiky nahodr oooooooooooooooooo Základní vlastnosti střední hodnoty roffii Necht a, b e R a X, Y jsou náhodné veličina .s existující střední hodnotou. Pak * E(a) -= a, * E(a + bX)-- = a + bE(X), * E(X + Y) =--E(X) + E(Y), * s Číselne charakteristiky nahodr oooooooooooooooooo Základní vlastnosti střední hodnoty roffii Necht a, b e R 3 X, Y jsou náhodné veličina s existující střední hodnotou. Pak * E(a) = a, * E(a + bX) = a + bE(X), * E(X + Y) = E(X) + E(Y), * jsou-li X a Y nezávislé, pak E(XY) = E{X) E (Y). Číselne charakteristiky nahodr oooooooooooooooooo Základní vlastnosti střední hodnoty roffii Necht a, b e R 3 X, Y jsou náhodné veličina s existující střední hodnotou. Pak * E(a) = a, * E(a + bX) = a + bE(X), * E(X + Y) = E(X) + E(Y), * jsou-li X a Y nezávislé, pak E(XY) = E{X) E (Y). Číselne charakteristiky nahodr oooooooooooooooooo Základní vlastnosti střední hodnoty roffii Necht a, b e R 3 X, Y jsou náhodné veličina s existující střední hodnotou. Pak * E(a) = a, * E(a + bX) = a + bE(X), * E(X + Y) = E(X) + E(Y), * jsou-li X a Y nezávislé, pak E(XY) = E{X) E (Y). Důkazy těchto tvrzení jsou přímočaré, zkuste si je udělat! Analogická tvrzení platí i pro náhodné vektory. Příklad Spočtěme ještě jednou střední hodnotu binomického rozdělení, tentokrát s využitím vlastností střední hodnoty. * s Příklad Spočtěme ještě jednou střední hodnotu binomického rozdělení, tentokrát s využitím vlastností střední hodnoty. Řešení Vyjádříme počet zdarů v n pokusech jako počet zdarů v jednotlivých pokusech X k=\ přičemž náhodné veličiny Yk mají všechny alternativní rozdělení A{p). Snadno spočítáme E{Yk) = 1 p + 0 ( l -- p) = p. Dále víme, že střední hodnota součtu je součtem středních hodnot, proto E(X) = Y,E(Yk) = np. k=\ Číselne charakteristiky nahodr oooooooooooooooooo Kvantily Dalšími užitečnými charakteristikami jsou tzv. kvantily. Pro ryze monotóní distribuční funkci Fx (tj. spojitou náhodnou veličinu X s všude nenulovou hustotou, jako je tomu např. u normálního rozdělení) jde prostě o inverzní funkci F^1 : (0,1) --> R. To znamená, že hodnota y = F~1 {a) je taková, že P(X < y) = a. Obecněji, je-li fx(x) distribuční funkce náhodné veličiny X, pak definujeme kvantilovou funkci2 F-1 {a) = inf{x G M; F(x) >a}, a e (0,1). Zřejmě jde o zobecnění předchozí definice. Uvědomte si, že jsme se již s kvantily setkali, jen jsme jím tak zatím neříkali. Dalšími užitečnými charakteristikami jsou tzv. kvantily. Pro ryze monotóní distribuční funkci Fx (tj. spojitou náhodnou veličinu X s všude nenulovou hustotou, jako je tomu např. u normálního rozdělení) jde prostě o inverzní funkci F^1 : (0,1) --> R. To znamená, že hodnota y = F~1 {a) je taková, že P(X < y) = a. Obecněji, je-li fx(x) distribuční funkce náhodné veličiny X, pak definujeme kvantilovou funkci2 F-1 {a) = inf{x G R; F(x) >a}, a e (0,1). Zřejmě jde o zobecnění předchozí definice. Nejčastěji jsou používané kvantily s a = 0.5, tzv. medián, s a = 0.25, tzv. první kvartil, a = 0.75, tzv. třetí kvartil, a podobně pro decily a percentily (kdy je a rovno násobkům desetin a setin). K těmto hodnotám se vrátíme v popisné statistice později. 2 Uvědomte si, že jsme se již s kvantily setkali, jen jsme jím tak zatím neříkali. oooooooooooooooooo Rozptyl a směrodatná odchylka Tyto číselné charakteristiky rozdělení náhodné veličiny nepopisují nějakou střední či typickou hodnotu (jako střední hodnota či medián), ale míru ,,kolísání' náhodné veličiny kolem střední hodnoty. * s oooooooooooooooooo Rozptyl a směrodatná odchylka Tyto číselné charakteristiky rozdělení náhodné veličiny nepopisují nějakou střední či typickou hodnotu (jako střední hodnota či medián), ale míru ,,kolísání' náhodné veličiny kolem střední hodnoty. Rozptylem (variancí) náhodné veličiny X, která má konečnou střední hodnotu, nazýváme číslo D(X) = varX = E([X - E(X)]2 ), odmocnina z rozptylu \JD(x) se pak nazývá směrodatná odchylka. * s - Základní vlastnosti rozptylu Pro náhodnou veličinu X a reálna čísla a, b platí: O D{X) = E(X2 ) - E{Xf, * s - = ˇ. -o<\(y Číselne charakteristiky nahodr oooooooooooooooooo Základní vlastnosti rozptylu G B Pro náhodnou veličinu X a reí O D{X) = E(X2 ) - E{Xf, O D(a + bX) = b2 D(X), ílná čísla a b platí: * s - = ˇ. -o<\(y Základní vlastnosti rozptylu Pro náhodnou veličinu X a reálna čísla a, b platí: O D{X) = E(X2 ) - E{Xf, O D(a + bX) = b2 D(X), O ^D(a + bX) = \b\^/Ď(XJ. * s - = ˇ. -o<\(y Základní vlastnosti rozptylu Pro náhodnou veličinu X a reálna čísla a, b platí: O D{X) = E(X2 ) - E{Xf, O D(a + bX) = b2 D(X), O ^D(a + bX) = \b\^/Ď(XJ. * s - = ˇ. -o<\(y Základní vlastnosti rozptylu Pro náhodnou veličinu X a reálna čísla a, b platí: O D{X) = E(X2 ) - E{Xf, O D(a + bX) = b2 D(X), O ^D(a + bX) = \b\^/Ď(XJ. Důkaz. Důkaz je přímočarý - nejprve se dokáže 2. tvrzení, pak se z něj tvrzení první. Poznamenejme, že tvrzení 1 se často používá k výpočtům D{X). D O závislosti dvou náhodných veličin do jisté míry vypovídá tzv. kovariance, definovaná předpisem C(X, Y) = cov(X, Y) = E([X - E(X)][Y - E(Y)]). Veličinám X, Y, pro něž je C(X, Y) = 0, říkáme nekorelované . oooooooooooooooooo Kovariance O závislosti dvou náhodných veličin do jisté míry vypovídá tzv. kovariance, definovaná předpisem C(X, Y) = cov(X, Y) = E([X - E(X)][Y - E(Y)]). Veličinám X, Y, pro něž je C(X, Y) = 0, říkáme nekorelované Pro náhodné veličiny s existujícími rozptyly platí: O (X,Y) = C(Y,X), oooooooooooooooooo Kovariance O závislosti dvou náhodných veličin do jisté míry vypovídá tzv. kovariance, definovaná předpisem C(X, Y) = cov(X, Y) = E([X - E(X)][Y - E(Y)]). Veličinám X, Y, pro něž je C(X, Y) = 0, říkáme nekorelované E li Pro náhodné veličiny s existujícími rozptyly platí: O (X, Y) = C(Y,X), 9 C(X,X) = D[X), oooooooooooooooooo Kovariance O závislosti dvou náhodných veličin do jisté míry vypovídá tzv. kovariance, definovaná předpisem C(X, Y) = cov(X, Y) = E([X - E(X)][Y - E(Y)]). Veličinám X, Y, pro něž je C(X, Y) = 0, říkáme nekorelované Pro náhodné veličiny s existujícími rozptyly platí: O (X,Y) = C(Y,X), 9 C(X,X) = D(X), O C(X, Y) = E(XY) - E(X)E(Y), oooooooooooooooooo Kovariance O závislosti dvou náhodných veličin do jisté míry vypovídá tzv. kovariance, definovaná předpisem C(X, Y) = cov(X, Y) = E([X - E(X)][Y - E(Y)]). Veličinám X, Y, pro něž je C(X, Y) = 0, říkáme nekorelované E 1 Pro náhodné veličiny s existujícími rozptyly platí: O (X,Y) = C(Y,X), 9 C(X,X) = D(X), O C(X, Y) = E(XY) - E(X)E(Y), O C(a + bX,c + dY) = bdC(X, Y), oooooooooooooooooo Kovariance O závislosti dvou náhodných veličin do jisté míry vypovídá tzv. kovariance, definovaná předpisem C(X, Y) = cov(X, Y) = E([X - E(X)][Y - E(Y)]). Veličinám X, Y, pro něž je C(X, Y) = 0, říkáme nekorelované Pro náhodné veličiny s existujícími rozptyly platí: O (X,Y) = C(Y,X), 9 C(X,X) = D(X), O C(X, Y) = E(XY) - E(X)E(Y), O C(a + bX,c + dY) = bdC(X, Y), Q D(X + Y) = D(X) + D(Y) + 2C(X, Y), speciálně, jsou-li X, Y nezávislé, je D(X + Y) = D(X) + D{Y), tj. C(X, Y) = 0 a X, Y jsou nekorelované. Číselne charakteristiky nahodr oooooooooooooooooo Koeficient korelace Koeficient korelace je jen speciální název pro kovarianci dvou normovaných náhodných veličin: R(X, Y) = px>Y = C X-E(X) Y-E(Y) * S Číselne charakteristiky nahodr oooooooooooooooooo Koeficient korelace Koeficient korelace je jen speciální název pro kovarianci dvou normovaných náhodných veličin: R(X, Y) = px>Y = C X-E(X) Y-E(Y) O R(X,X) = 1, * s - = ˇ. -o<\(y Číselne charakteristiky nahodr oooooooooooooooooo Koeficient korelace Koeficient korelace je jen speciální název pro kovarianci dvou normovaných náhodných veličin: R(X, Y) = px>Y = C X-E(X) Y-E(Y) O R(X,X) = 1, Q R{a + bX,c + dY) = sgn(bd)R(X, Y), * s - = ˇ. -o<\(y Číselne charakteristiky nahodr oooooooooooooooooo Koeficient korelace Koeficient korelace je jen speciální název pro kovarianci dvou normovaných náhodných veličin: R(X, Y) = px>Y = C X-E(X) Y-E(Y) B O R{X,X)-- Q R(a + bX Q jsou-li X, = 1, ,c + dY) = Y nezávislé, sgn(bd)R(X, Y), je R(X, Y) = 0, ' Číselne charakteristiky nahodr oooooooooooooooooo Koeficient korelace Koeficient korelace je jen speciální název pro kovarianci dvou normovaných náhodných veličin: R(X, Y) = px>Y = C X-E(X) Y-E(Y) ooooooooo oooooooooooooooooo Příklad Spočtěme rozptyl binomického rozdělení. * s - = ˇ. -o<\(y Transformace náhodných veličin ooooooooo Číselne charakteristiky náhodných v oooooooooooooooooo li cm Příklad ^ Spočtěme rozptyl binomického rozdělení. Řešení Stejně jako dříve lze psát X = J2"k=i Yk, kde Y\,... ,Yn jsou nezávislé náhodné veličiny vyjadřující úspěch v k-tém pokusu. I2 * p + O2 * (1 - p) = p, proto : p -- p2 = p(l -- p). Protože pro ED(Yfc),je Snadno vypočteme E(Y%) D{Yk) = E(V2 ) - E{Ykf nezávislé Yk platí D(Y^ Yk) D(X) = np(l-p). * s Transformace náhodných veličin ooooooooo Číselne charakteristiky náhodných v oooooooooooooooooo li cm Příklad ^ Spočtěme rozptyl binomického rozdělení. Řešení Stejně jako dříve lze psát X = J2"k=i Yk, kde Y\,... ,Yn jsou nezávislé náhodné veličiny vyjadřující úspěch v k-tém pokusu. I2 * p + O2 * (1 - p) = p, proto : p -- p2 = p(l -- p). Protože pro ED(Yfc),je Snadno vypočteme E(Y%) D{Yk) = E(V2 ) - E{Ykf nezávislé Yk platí D(Y^ Yk) D(X) = np(l-p). Všimněme si, že výraz Xn -- np/\/np(l -- p) vystupující v Moivre-Laplaceově větě je totéž, co Xn -- E(Xn)/\jD(x) a jde tedy o tzv. normovanou náhodnou veličinu (tj. veličinu lineárně transforomovanou tak, aby měla střední hodnotu 0 a rozptyl 1). Moivre-Laplaceova věta pak říká, že pro n --> oo se rozložení této náhodné veličiny blíží normovanému normálnímu rozdělení A/(0,1). Někdy je užitečné studovat řadu dalších charakteristik rozdělení náhodných veličin. Za rozumných předpokladů jsou definovány k-té obecné momenty A = E(Xk ) a k-té centrální momenty /xk = E([X-E(X)]k ). OOOOOOOOOOO0OOOOOOO Další momenty Někdy je užitečné studovat řadu dalších charakteristik rozdělení náhodných veličin. Za rozumných předpokladů jsou definovány k-té obecné momenty ß'k E(Xk ) a k-té centrální momenty ßk = E([X-E(X)]k ). Pomocí momentů pak definujeme např. šikmost (asymetrii) náhodné veličiny X jako M3 vwr nebo špičatost (exces) jako _JM_ D(x)2 3. Kladná šikmost distribuce (více vysokých kladných hodnot než odpovídá normálnímu rozdělení s nulovou šikmostí). Momentová vytvořující funkce Definice Reálnou funkci proměnné t G M Mx(t) = E(etX ) nazveme momentovou vytvořující funkcí náhodné veličiny X. * s Momentová vytvořující funkce Definice Reálnou funkci proměnné t G M Mx(t) = E(etX ) nazveme momentovou vytvořující funkcí náhodné veličiny X. Poznámka Je-li X např. spojitá, platí / oo etx f(x)dx = -oo f°° t2 X2 = / (1 + t x + i -- + ...)f(x)dx a ,,iI t Ví = i +1A + -^ +''' a jde vlastně o exponenciální vytvořující funkci posloupnosti /c-tých obecných momentů //fc. ˇ s Pro momentovou vytvořující funkci platí dtk A \t=0-Mx(t) Platí-li Mx{t) = MY{ť) pro všechna t e (-b, b), mají náhodné veličiny stejné rozdělení, tj. fx(x) = Fy (x). * s BSH Pro momentovou vytvořující funkci platí: * A = ŮM x{t) |t=0. * Platí-li Mx{t) = MY{ť) pro všechna t{- b,b), mají náhodné veličiny stejné rozdělení, tj. Fx(x) = Fy (x). * Ma+bX(t) = eat Mx{bt). * s BSH Pro momentovou vytvořující funkci platí: * A = ŮM x{t) |t=0. * Platí-li Mx{t) = MY{ť) pro všechna t e (-b, b), mají náhodné veličiny stejné rozdělení, tj. Fx(x) = FY{x). * Ma+bX(t) = eat Mx{bt). * Jsou-li X, Y nezávislé, je Mx+y{t) == Mx(t)MY(t). * s ooooooooo oooooooooooooooooo Příklad Určete momentovou vytvořující fuiikci binomického rozdělení. * s - = ˇ. -o<\(y Transformace náhodných veličin Číselne charakteristiky náhodných ve ooooooooo oooooooooooooooooo icm I Příklad 1 Určete momentovou vytvořující funkci binomického rozdělení. Řešení M(t) = E(eíX ) = Y, e** (ľ) P^1 " P)"~k = = (ľW)k (i - p)n_k = k=0 \ ' = (pet + (l-p))" = (p(et -l) + i r . * Qľ Transformace náhodných veličin Číselne charakteristiky náhodných ve ooooooooo oooooooooooooooooo icm I Příklad 1 Určete momentovou vytvořující funkci binomického rozdělení. Řešení M(ř) = E(etX ) =í>"(k=0 v n ^pk {i-Py-k = k 0 ) ( p e ř ) k ( l --pf-k = = ( p e ' + ( 1 - P ) ) " =-- (p(ef - 1 ) + 1 ) " . Snáze jsme mohli funkci u momentové vytvořující fun E(etX ) = e t l - p + e t 0 ( l rčit s využitím předchozích vět a kce alternativního rozdělení, neboť - p) = p(ef - 1) + 1. Příklad Naposled spočtěme střední hodnotu a rozptyl binomického rozdělení, tentokrát s využitím vytvořující funkce. * s Příklad Naposled spočtěme střední hodnotu a rozptyl binomického rozdělení, tentokrát s využitím vytvořující funkce. Řešení M(t) = (P(é -1) +1)" proto je m- = "(P(ef --1) + iy- "Vp, což pro ř = 0 dá E(X) = //x = np. Podobně spočítáme i D{x) = //2 --(ß'i)2 * s oooooooooooooooooo Momenty normálního rozděleni Přímý výpočet střední hodnoty a rozptylu normovaného normálního rozdělení není triviální. S využitím momentové vytvořující funkce je ale poměrně jednoduchý. Nechť Z > Mz(t) A/(0,1). Pak 1-,tz -oo oo 2vr exp exp áz 2tz + t2 exp exp (z - tf áz áz = e x p ( Poslední integrál je roven 1 díky tomu, že na místě integrované funkce je funkce s vlastnostmi hustoty. S využitím předchozího výpočtu Mz(t) = exp í y j snadno spočítame, že A4(ŕ) = ŕ e x p ( | ) , A^(ŕ) = ŕ 2 e x p ( ^ ) + e x p ( ^ ) . Dosazením ŕ = 0 pak dostaneme E(Z) = 0,D(Z) = 1. S využitím předchozího výpočtu Mz(t) = exp í y j snadno spočítáme, že A4(ŕ) = ŕ e x p ( | ) , A^(ŕ) = ŕ 2 e x p ( ^ ) + e x p ( ^ ) . Dosazením ŕ = 0 pak dostaneme E(Z) = 0,D(Z) = 1. Pro transformovanou náhodnou veličinu Y = ß + aZ ~ A/(/x,