Náhodný vektor oooooooooooooo Náhodný výběr oooooooooooo Matematika IV - 12. přednáška Náhodný vektor, náhodný výběr Michal Bulant Masarykova univerzita Fakulta informatiky 10. 5. 2010 Náhodný vektor Náhodný výběr oooooooooooooo oooooooooooo Obsah přednášky Q Náhodný vektor Q Náhodný výběr Náhodný vektor oooooooooooooo Náhodný výběr oooooooooooo Doporučené zdroje • Martin Panák, Jan Slovák, Drsná matematika, e-text. • Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická statistika, Matfyzpress, 4. vydání, 2006, 230 stran, ISBN 80-867-3271-1. • Marie Budíková, Statistika, Masarykova univerzita, 2004, distanční studijní opora ESF, http: //www.math.muni.cz/~budikova/esf/Statistika.zip. • Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80-210-3313-4. Náhodný vektor Náhodný výběr oooooooooooooo oooooooooooo Plán přednášky Q Náhodný vektor Náhodný vektor •ooooooooooooo Náhodný vektor - pripomenutí Náhodný výběr oooooooooooo Je-li (Q, A, P) pravděpodobnostní prostr a X\,...,Xn na něm definované náhodné veličiny s distribučními funkcemi F\,..., F„, pak náhodným vektorem je n-tice X = (Xi,... ,X„) s distribuční funkcí definovanou vztahem Fx(xi,..., x„) = P(Xi < xi,..., X„ < x„). V tomto kontextu nazývame F simultánni distribuční funkcí náhodného vektoru X a F; marginálni distribuční funkcí náhodné veličiny X/. Náhodný vektor o«oooooooooooo Náhodný výběr oooooooooooo Podobně jako v případě diskrétní náhodné veličiny označuje p(xi,...,x„) pravděpodobnostní funkci diskrétního náhodného vektoru X, je-li Fx(xi,... ,x„) = ■■■ Yl PÍ*1' • • •' ŕ")- tl ^ = Yj)i kde yi,... tvoří úplný systém jevů. 'Obvykle zapisujeme ve statistice vektory do sloupců, proto bychom spise měli psát (X, Y)T. Náhodný vektor oo«ooooooooooo Náhodný výběr oooooooooooo Uvážíme-li diskrétni náhodný vektor 1 (X, Y), pak je vztah mezi sdruženým rozdělením vektoru (X, Y) a marginálním rozdělením proměnné X určen rovností P(X = xf) = YljZi P{X = x/> ^ = Yj)i kde yi,... tvoří úplný systém jevů. Vztah pro spojitě rozdělený náhodný vektor je analogický. 'Obvykle zapisujeme ve statistice vektory do sloupců, proto bychom spise měli psát (X, Y)T. Náhodný vektor Náhodný výběr ooo«oooooooooo oooooooooooo (stochastická) Nezávislost náhodných veličin Dříve uvedenou definici nezávislosti náhodných veličin Xi,... ,Xn pomocí vztahu P(Xi =Xl,...,Xn = xn) = P(Xi = xi) • • • P(Xn = xn) pro libovolné x\,... ,xn, tak můžeme nyní přepsat pomocí vztahu mezi sdruženou distribuční funkcí náhodného vektoru X = (Xi,..., X„) a marginálních distribučních funkcí náhodných veličin Xi,..., X„: Fx(*i, • • •, xn) = FXl(xi) • • • Fx„(xn). Náhodný vektor Náhodný výběr ooo«oooooooooo oooooooooooo (stochastická) Nezávislost náhodných veličin Dříve uvedenou definici nezávislosti náhodných veličin Xi,... ,Xn pomocí vztahu P(Xi =Xl,...,Xn = xn) = P(Xi = xi) • • • P(Xn = xn) pro libovolné x\,... ,xn, tak můžeme nyní přepsat pomocí vztahu mezi sdruženou distribuční funkcí náhodného vektoru X = (Xi,..., X„) a marginálních distribučních funkcí náhodných veličin Xi,..., X„: Fx(*i, • • •, xn) = FXl(xi) • • • Fx„(xn). Příklad Házíme dvěma běžnými kostkami, jako náhodnou veličinu X označme součet bodů na obou kostkách, jako náhodnou veličinu Y absolutní hodnotu rozdílu. Určete sdružené rozdělení náhodného vektoru (X, Y), obě marginální rozdělení a odvoďte, jsou-li X a Y nezávislé. Náhodný vektor Náhodný výběr oooo»ooooooooo oooooooooooo Číselné charakteristiky náhodných vektorů E(X) = (E(Xi),..., E(Xn)) se nazýva vektor středních hodnot, Náhodný vektor oooo»ooooooooo Číselné charakteristiky náhodných vektorů E(X) = (E(Xi),..., E(X„)) se nazýva vektor středních hodnot, D(Xi) C(Xi,X2) ••• C(Xi,X„^ • D(X„) var(X) ,C(Xn,Xi) C(X„,X2) varianční (rozptylová) matice a Náhodný vektor oooo»ooooooooo Číselné charakteristiky náhodných vektorů E(X) = (E(Xi),..., E(X„)) se nazýva vektor středních hodnot, D(Xi) C(X1,X2) ... C(Xi,X„^ • D(X„) var(X) ,C(Xn,Xi) C(X„,X2) varianční (rozptylová) matice a 1 /?(Xi,X2) corX ,/?(Xn,Xi) R(Xn,X2) R(X1}Xn^ 1 je korelační matice. Náhodný vektor oooo»ooooooooo Číselné charakteristiky náhodných vektorů E(X) = (E(Xi),..., E(X„)) se nazýva vektor středních hodnot, D(Xi) C(Xi,X2) ••• C(Xi,X„^ • D(X„) var(X) ,C(Xn,Xi) C(X„,X2) varianční (rozptylová) matice a 1 /?(Xi,X2) corX ,/?(Xn,Xi) R(Xn,X2) R(X1}Xn^ 1 je korelační matice. Snadno je po rozepsání po jednotlivých složkách vidět, že var(X) = E((X - E(X)) ■ (X - E(X)D Náhodný vektor ooooo«oooooooo Náhodný výběr oooooooooooo Ukážeme na příkladech, že pravděpodobnostní struktura náhodného vektoru (X, Y) není určena pouze marginálními rozděleními veličin X a Y. Podstatný je rovněž pravděpodobnostní vztah mezi X a Y, který je částečně popsán např. prostřednictvím korelačního koeficientu. Náhodný vektor ooooo«oooooooo Náhodný výběr oooooooooooo Ukážeme na příkladech, že pravděpodobnostní struktura náhodného vektoru (X, Y) není určena pouze marginálními rozděleními veličin X a Y. Podstatný je rovněž pravděpodobnostní vztah mezi X a Y, který je částečně popsán např. prostřednictvím korelačního koeficientu. ' Příklad ^ Jsou-li X a Y náhodné veličiny, nabývající hodnot 0 a 1, pak P(X = 1, Y = 1) - P(X = l)P{Y = 1) = E{XY) - E(X)E(Y) = = cov(X, Y). □ s Náhodný vektor ooooo«oooooooo Náhodný výběr oooooooooooo Ukážeme na příkladech, že pravděpodobnostní struktura náhodného vektoru (X, Y) není určena pouze marginálními rozděleními veličin X a Y. Podstatný je rovněž pravděpodobnostní vztah mezi X a Y, který je částečně popsán např. prostřednictvím korelačního koeficientu. Příklad Jsou-li X a Y náhodné veličiny, nabývající hodnot 0 a 1, pak P(X = 1, Y = 1) - P{X = l)P{Y = 1) = E{XY)-E{X)E{Y) = = cov(X, Y). Odtud je snadno vidět, že pokud jsou X a Y nekorelované, jsou i nezávislé (což obecně neplatí). Náhodný vektor Náhodný výběr oooooo»ooooooo oooooooooooo Uveďme ještě příklad, ilustrující, že nekorelovanost nemusí implikovat nezávislost: Náhodný vektor oooooo»ooooooo Náhodný výběr oooooooooooo Uveďme ještě příklad, ilustrující, že nekorelovanost nemusí implikovat nezávislost: Příklad Buďte A a X nezávislé náhodné veličiny, splňující X ~ A/(0,1) a P(A = 1) = P(A = -1) = 1/2. Položíme-li Y = AX, pak P{Y = ^(X, Y) polární souřadnice náhodného vektoru (X, Y) a určíme rozdělení vektoru (/?, ). Náhodný vektor ooooooo«oooooo Náhodný výběr oooooooooooo Nechť (X, Y) je náhodný vektor, který má rovnoměrné rozdělení na jednotkovém kruhu K = {(x, y) : x2 + y2 < 1}. Zřejmě je hustota tohoto rozdělení rovna 1/tt pro (x, y) G K a 0 jinde a je rovněž vidět, že X, Y nejsou nezávislé. Označme R = R{X, Y) a = ^(X, Y) polární souřadnice náhodného vektoru (X, Y) a určíme rozdělení vektoru (/?, ). Pro 0 < fi < 1 a 0 < (f! < 2ir je Hustota je tedy rovna f{r, ip) = ^ pro 0 < r < 1, 0 < tp <2tt a rovna 0 všude jinde. P(R < ri, se nyní snadno dopočtou: g(r) oo ŕ2iľ ^ f(r, se nyní snadno dopočtou: g(r) 2?r f(r, má rovnoměrné rozdělení na (0, 2ir), odkud E() = 7r a D() = 7r2/3, snadno rovněž odvodíme E(R) = 2/3, D(R) = 1/18. Náhodný vektor Náhodný výběr OOOOOOOO0OOOOO oooooooooooo Příklad (pokr.) Marginální hustoty g{r) a h(ip) veličin R a se nyní snadno dopočtou: g(r) f (ľ, má rovnoměrné rozdělení na (0, 2ir), odkud E() = 7r a D(í>) = 7r2/3, snadno rovněž odvodíme E(R) = 2/3, D(/?) = 1/18. Všimněme si ale zejména, že f(r,ip) = g(r)h(ip), což znamená nezávislost veličin R a . □ s - ■ * ■O O. o- Náhodný vektor ooooooooo«oooo Vlastnosti charakteristik náhodného vektoru Náhodný výběr oooooooooooo Věta Pro náhodné vektory X, Y stejné dimenze, konstantní matici B konstantní vektor a (odpovídajících dimenzí) platí • E(X + Y) = E(X) + E(Y), Náhodný vektor ooooooooo«oooo Vlastnosti charakteristik náhodného vektoru Náhodný výběr oooooooooooo Pro náhodné vektory X, Y stejné dimenze, konstantní matici B konstantní vektor a (odpovídajících dimenzí) platí • E(X + Y) = E(X) + E(Y), • E(a + BX) = a+ B ■ E (X), Náhodný vektor ooooooooo«oooo Vlastnosti charakteristik náhodného vektoru Náhodný výběr oooooooooooo Věta Pro náhodné vektory X, Y stejné dimenze, konstantní matici B a konstantní vektor a (odpovídajících dimenzí) platí • E(X + Y) = E(X) + E(Y), • E(a + BX) = a+ B ■ E (X), • var(a + B • X) = Bvar(X)Br . Náhodný vektor ooooooooo«oooo Vlastnosti charakteristik náhodného vektoru Náhodný výběr oooooooooooo Věta Pro náhodné vektory X, Y stejné dimenze, konstantní matici B a konstantní vektor a (odpovídajících dimenzí) platí • E(X + Y) = E(X) + E(Y), • E(a + BX) = a+ B ■ E (X), • var(a + B • X) = Bvar(X)Br . Náhodný vektor ooooooooo«oooo Vlastnosti charakteristik náhodného vektoru Náhodný výběr oooooooooooo Věta Pro náhodné vektory X, Y stejné dimenze, konstantní matici B a konstantní vektor a (odpovídajících dimenzí) platí • E(X + Y) = E(X) + E(Y), • E(a + BX) = a+ B ■ E (X), • var(a + B • X) = Bvar(X)Br . [ Důkaz. Důkaz vyplýva z vlastností náhodných veličin a ze vztahu var(X) = E((X - - E(X))(X - E(X))T). □ Náhodný vektor OOOOOOOOOO0OOO Mnohorozměrné normální rozdělení Náhodný výběr oooooooooooo Věta Necht jsou složky náhodného vektoru Z = (Zi,..., Zn) nezávislé a mají rozdělení Z; ~ A/(0,1), dále necht Q je ortonormální matice řádu n. Pak jsou rovněž složky náhodného vektoru U = QTZ nezávislé a každá má rozdělení N(0,1). Má tedy U (stejně jako Z) nulovou střední hodnotu a jednotkovou varianční matici a oba vektory jsou zobecněním normovaného normálního rozdělení. Náhodný vektor Náhodný výběr ooooooooooo«oo oooooooooooo (obecné) Mnohorozměrné normální rozdělení V následující definici zavedeme zobecnění normálního rozdělení s obecnými parametry: Náhodný vektor Náhodný výběr ooooooooooo«oo oooooooooooo (obecné) Mnohorozměrné normální rozdělení V následující definici zavedeme zobecnění normálního rozdělení s obecnými parametry: Definice Nechť jsou složky náhodného vektoru Z = (Zi,..., Z„) nezávislé a mají rozdělení Z,- ~ A/(0,1) a nechť a G Mm je vektor konstant a B konstantní matice typu m x n. Označme dále V = B ■ BT. Pak řekneme, že náhodný vektor U = a + B ■ Z má m-rozměrné normální rozdělení Nm(a, V). Náhodný vektor Náhodný výběr ooooooooooo«oo oooooooooooo (obecné) Mnohorozměrné normální rozdělení V následující definici zavedeme zobecnění normálního rozdělení s obecnými parametry: Definice Nechť jsou složky náhodného vektoru Z = (Zi,..., Z„) nezávislé a mají rozdělení Z,- ~ A/(0,1) a nechť a G Mm je vektor konstant a B konstantní matice typu m x n. Označme dále V = B ■ BT. Pak řekneme, že náhodný vektor U = a + B ■ Z má m-rozměrné normální rozdělení Nm(a, V). Pomocí vlastností charakteristik snadno spočítáme, že E(U) = a,var(Ľ) = V = BBT. Pokud je matice V regulární, pak existuje hustota náhodného vektoru a je tvaru f(Ul, ...,um) = (2vr)-m/2| V]-1/2 exp í-±(u - á)T V~\u - a) Náhodný vektor OOOOOOOOOOOO0O Náhodný výběr oooooooooooo Pro úvahy ve statistice je důležitá následující věta. Věta Nechi má vektor U rozdelení Nm(a, V), necht cGl'a matice konštánt D je typu k x m. Pak má c + D ■ U k-rozmérné normálni rozdelení Nk{c + Da, DVDT). Náhodný vektor Náhodný výběr OOOOOOOOOOOO0O oooooooooooo Pro úvahy ve statistice je důležitá následující věta. Věta Nechi má vektor U rozdelení Nm(a, V), necht cGl'a matice konštánt D je typu k x m. Pak má c + D ■ íl k-rozmérné normálni rozdelení Nk{c + Da, DVDT). Důkaz. Vyjádříme-li matici V = BBT, dostáváme c + DU = c + D(a + BZ) = (c + Da) + (DB)Z ~ Nk(c + Da, DBBTDT). EJ Náhodný vektor OOOOOOOOOOOOO* Náhodný výběr oooooooooooo Speciálně je tedy marginální rozdělení podvektoru vektoru s mnohorozměrným normálním rozdělením opět mnohorozměrné normální a je-li navíc D jednořádková matice, dostáváme, že libovolná lineární funkce takového vektoru má normální rozdělení. Náhodný vektor OOOOOOOOOOOOO* Náhodný výběr oooooooooooo Speciálně je tedy marginální rozdělení podvektoru vektoru s mnohorozměrným normálním rozdělením opět mnohorozměrné normální a je-li navíc D jednořádková matice, dostáváme, že libovolná lineární funkce takového vektoru má normální rozdělení. Připomeňme ještě jednou rozdělení odvozená od normálního: rozdělení transformace střední hodnota rozptyl x2(k) m F(k, m) fj, + aZ (i k 0 m/(m-2) a2 2k k/{k - 2) 2m2(k+m-2) XI/m k(m-2)2(m-4) □ rgi - ■ * -r)c^(y Náhodný vektor Náhodný výběr oooooooooooooo oooooooooooo Plán přednášky Q Náhodný výběr Náhodný vektor oooooooooooooo Náhodný výběr •ooooooooooo Definice Náhodným výběrem rozsahu n rozumíme n-tici nezávislých a stejně rozdělených náhodných veličin X\,... ,Xn ~ Fx(x) (někdy také hovoříme o n nezávislých kopiích náhodné veličiny X). Náhodný vektor Náhodný výběr oooooooooooooo •ooooooooooo Definice Náhodným výběrem rozsahu n rozumíme n-tici nezávislých a stejně rozdělených náhodných veličin X\,... ,Xn ~ Fx(x) (někdy také hovoříme o n nezávislých kopiích náhodné veličiny X). Náhodným výběrem rozsahu n z p-rozměrného rozdělení rozumíme n-tici nezávislých a stejně rozdělených p-rozměrných náhodných vektorů. Náhodný vektor oooooooooooooo Náhodný výběr •ooooooooooo Definice Náhodným výběrem rozsahu n rozumíme n-tici nezávislých a stejně rozdělených náhodných veličin X\,... ,Xn ~ /~x(x) (někdy také hovoříme o n nezávislých kopiích náhodné veličiny X). Náhodným výběrem rozsahu n z p-rozměrného rozdělení rozumíme n-tici nezávislých a stejně rozdělených p-rozměrných náhodných vektorů. V matematické statistice často pracujeme s transformacemi náhodného výběru, takovým náhodným veličinám (příp. vektorům) říkáme statistiky. V následujícím zavedeme několik důležitých statistik a ukážeme jejich souvislost s číselnými charakteristikami náhodných veličin. Náhodný vektor Náhodný výběr oooooooooooooo o»oooooooooo Základní statistiky Definice Nechť Xl,..., Xn je náhodný výběr. Statistiku 1 " n ^ ;=i nazýváme výběrový průměr, statistiku i=l výběrový rozptyl a statistiku S = VŠ^ výběrová směrodatná odchylka. Analogicky se definují i výběrová kovariance, příp. výběrový korelační koeficient pro dvourozměrný náhodný výběr. Náhodný vektor oooooooooooooo Vlastnosti statistik Náhodný výběr oo«ooooooooo Protože jsou uvedené statistiky náhodnými veličinami, lze se přirozeně ptát po jejich číselných charakteristikách. Věta Necht X\,... ,Xn je náhodný výběr rozsahu n z rozdělení se střední hodnotou [i a rozptylem a2 . Pak platí: 9 E(M) = n, Náhodný vektor oooooooooooooo Vlastnosti statistik Náhodný výběr oo«ooooooooo Protože jsou uvedené statistiky náhodnými veličinami, lze se přirozeně ptát po jejich číselných charakteristikách. Věta Necht X\,... ,Xn je náhodný výběr rozsahu n z rozdělení se středn hodnotou [i a rozptylem a2 . Pak platí: 9 E(M) = n, • D(M) = var(M) = a2/n, Náhodný vektor oooooooooooooo Vlastnosti statistik Náhodný výběr oo«ooooooooo Protože jsou uvedené statistiky náhodnými veličinami, lze se přirozeně ptát po jejich číselných charakteristikách. Věta Necht Xi,.. ., Xn je náhodný výběr rozsahu n z rozdělení se střední hodnotou [i a rozptylem a2 . Pak platí: • E(M) -- = li, • D(M) -. = var(M) = a2/n, • E(S2) - = a2. Náhodný vektor oooooooooooooo Náhodný výběr OOO0OOOOOOOO Důkaz. Ukážeme jen (nejsložitější) 3. tvrzení. Snadno se odvodí, že platí £(X; - /x)2 = £(X; - M)2 + n(M - /x)2. Náhodný vektor Náhodný výběr oooooooooooooo OOO0OOOOOOOO Důkaz. Ukážeme jen (nejsložitější) 3. tvrzení. Snadno se odvodí, že platí Proto je n — 1 1 n — 1 n n — 1 ^2 JI -a = a . □ Náhodný vektor oooooooooooooo Náhodný výběr 0000*0000000 V předchozí větě jsme ukázali, že výběrový průměr M splňuje E(M) = [i, jeho střední hodnota je tedy rovna odhadovanému parametru /x. V takovém případě říkáme, že statistika M je nestranným odhadem parametru jjl. □ g - ■ m -o^O Náhodný vektor oooooooooooooo Náhodný výběr 0000*0000000 V předchozí větě jsme ukázali, že výběrový průměr M splňuje E(M) = /x, jeho střední hodnota je tedy rovna odhadovanému parametru /x. V takovém případě říkáme, že statistika M je nestranným odhadem parametru /x. Podobně jsme viděli, že S2 je nestranným odhadem parametru a2. □ g - ■ m -o^O Náhodný vektor oooooooooooooo Náhodný výběr 0000*0000000 V předchozí větě jsme ukázali, že výběrový průměr M splňuje E(M) = /x, jeho střední hodnota je tedy rovna odhadovanému parametru /x. V takovém případě říkáme, že statistika M je nestranným odhadem parametru /x. Podobně jsme viděli, že S2 je nestranným odhadem parametru a2. Všimněme si rovněž, že „přirozeněji" definovaná statistika — M)2 není nestranným odhadem a2, její střední hodnota je totiž ^o2. Náhodný vektor oooooooooooooo Náhodný výběr 0000*0000000 V předchozí větě jsme ukázali, že výběrový průměr M splňuje E(M) = /x, jeho střední hodnota je tedy rovna odhadovanému parametru /x. V takovém případě říkáme, že statistika M je nestranným odhadem parametru /x. Podobně jsme viděli, že S2 je nestranným odhadem parametru a2. Všimněme si rovněž, že „přirozeněji" definovaná statistika — M)2 není nestranným odhadem a2, její střední hodnota je totiž ^o2. Rozmyslete si, je-li S nestranným odhadem směrodatné odchylky a. Náhodný vektor Náhodný výběr OOOOOOOOOOOOOO OOOOO0OOOOOO Náhodný výběr z normálního rozdělení Uvažme nyní speciální případ, kdy je Xl,..., X„ náhodný výběr z normálního rozdělení A/(/x, a2). Věta • M a S2 jsou nezávislé náhodné veličiny. Náhodný vektor Náhodný výběr OOOOOOOOOOOOOO OOOOO0OOOOOO Náhodný výběr z normálního rozdělení Uvažme nyní speciální případ, kdy je Xi,..., X„ náhodný výběr z normálního rozdělení A/(/x, a2). Věta • M a S2 jsou nezávislé náhodné veličiny. • M ~ N(n, a2/n), a tedy U = (M - n)/{o/^~h) ~ N(0,1). Náhodný vektor Náhodný výběr OOOOOOOOOOOOOO OOOOO0OOOOOO Náhodný výběr z normálního rozdělení Uvažme nyní speciální případ, kdy je Xl,..., X„ náhodný výběr z normálního rozdělení A/(/x, a2). Věta • M a S2 jsou nezávislé náhodné veličiny. • M ~ N(n, a2/n), a tedy U = (M - n)/{o/^~h) ~ N(0,1). • K = (n- l)S2/a2 ~ x2(n - 1). Náhodný vektor Náhodný výběr OOOOOOOOOOOOOO OOOOO0OOOOOO Náhodný výběr z normálního rozdělení Uvažme nyní speciální případ, kdy je Xl,..., X„ náhodný výběr z normálního rozdělení A/(/x, a2). Věta • M a S2 jsou nezávislé náhodné veličiny. • M ~ N(n, a2/n), a tedy U = (M - n)/{o/^~h) ~ N(0,1). • K = (n- l)S2/a2 ~ x2(n - 1). • E(X/-Aí)2A72~X2(n)- Náhodný vektor Náhodný výběr OOOOOOOOOOOOOO OOOOO0OOOOOO Náhodný výběr z normálního rozdělení Uvažme nyní speciální případ, kdy je Xl,..., X„ náhodný výběr z normálního rozdělení A/(/x, a2). Věta • M a S2 jsou nezávislé náhodné veličiny. • M ~ A/(/j, a2/n), a tedy U = (M - n)/{o/^~h) ~ N(0,1). • K = (n- l)S2/a2 ~ x2(n - 1). • £(X-/x)>2~x2(")- . T = (M-ii)/(S/^)^t(n-l). Náhodný vektor Náhodný výběr OOOOOOOOOOOOOO OOOOO0OOOOOO Náhodný výběr z normálního rozdělení Uvažme nyní speciální případ, kdy je Xl,..., X„ náhodný výběr z normálního rozdělení A/(/x, a2). Věta • M a S2 jsou nezávislé náhodné veličiny. • M ~ N(n, a2/n), a tedy U = (M - n)/{o/^~h) ~ N(0,1). • K = (n- l)S2/a2 ~ x2(n - 1). • E(X/-Aí)2A72~X2(n)- . T = {M-fi,)/{S/y/?i)~t{n-l). Náhodný vektor Náhodný výběr OOOOOOOOOOOOOO OOOOO0OOOOOO Náhodný výběr z normálního rozdělení Uvažme nyní speciální případ, kdy je Xl,..., X„ náhodný výběr z normálního rozdělení A/(/x, a2). Věta • M a S2 jsou nezávislé náhodné veličiny. • M ~ A/(/j, a2/n), a tedy U = (M - n)/{o/^~h) ~ N(0,1). • K = (n- l)S2/a2 ~ x2(n - 1). • E(X/-Aí)2A72~X2(n)- . 7 = (M-/i)/(S/^)-ř(n-l). Poznámka K odhadu /x, známe-li a2, slouží Ľ, v opačném případě T. Náhodný vektor Náhodný výběr OOOOOOOOOOOOOO OOOOO0OOOOOO Náhodný výběr z normálního rozdělení Uvažme nyní speciální případ, kdy je Xl,..., X„ náhodný výběr z normálního rozdělení A/(/x, a2). Věta • M a S2 jsou nezávislé náhodné veličiny. • M ~ A/(/j, a2/n), a tedy U = (M - n)/{o/^~h) ~ N(0,1). • K = (n- l)S2/a2 ~ x2(n - 1). • E(X/-Aí)2A72~X2(n)- . 7 = (M-/i)/(S/^)-ř(n-l). Poznámka K odhadu /x, známe-li a2, slouží Ľ, v opačném případě T. K odhadu a2, neznáme-li /x, slouží K", v opačném případě následující (bezejmenná?) statistika, která je vlastně statistikou K, v níž místo odhadu M použijeme přímo jjl. Náhodný vektor oooooooooooooo Náhodný výběr oooooo«ooooo Důkaz. Položme Z; = (X; — /j)/a, což jsou zrejme nezávislé náhodné veličiny s normovaným normálním rozdělením. Zřejmě je X = a + aEnZ, kde a je vektor samých /x, a proto má podle předchozího X mnohorozměrné normální rozdělení a je-li dále d vektor ze samých 1/n, pak má náhodná veličina M = dTX (jednorozměrné) normální rozdělení se střední hodnotou dTa = [i a rozptylem dTa2End = a2/n. Náhodný vektor oooooooooooooo Náhodný výběr oooooo«ooooo Důkaz. Položme Z; = (X; — /j)/a, což jsou zrejme nezávislé náhodné veličiny s normovaným normálním rozdělením. Zřejmě je X = a + aEnZ, kde a je vektor samých /x, a proto má podle předchozího X mnohorozměrné normální rozdělení a je-li dále d vektor ze samých 1/n, pak má náhodná veličina M = dTX (jednorozměrné) normální rozdělení se střední hodnotou dTa = [i a rozptylem dTa2End = a2/n. Ostatní tvrzení se dokážou obdobně. □ Náhodný vektor oooooooooooooo Náhodný výběr ooooooo»oooo V roce 1951 bylo rozsáhlým statistickým průzkumem zjištěno, že střední hodnota výšky desetiletých chlapců je 136,1 cm se směrodatnou odchylkou a = 6,4 cm. Náhodný vektor oooooooooooooo Náhodný výběr ooooooo»oooo V roce 1951 bylo rozsáhlým statistickým průzkumem zjištěno, že střední hodnota výšky desetiletých chlapců je 136,1 cm se směrodatnou odchylkou a = 6,4 cm. V roce 1961 byla zjištěna výška pouze u 15 náhodně vybraných chlapců: 130 140 136 141 139 133 149 151 139 136 138 142 127 139 147 Otázkou je, zda se v porovnání s rokem 1951 změnila střední výška chlapců, pokud předpokládáme, že variabilita výšek se v různých generacích příliš nemění. Náhodný vektor Náhodný výběr oooooooooooooo oooooooo«ooo Řešení Vzhledem k tomu, že základní soubor všech desetiletých chlapců je rozsáhlý, lze zmíněná data považovat za náhodný výběr3. Zjistíme, že M = 139,133, n = 15 a s využitím statistiky U dostáváme, že s 95% pravděpodobností leží hodnota /x v intervalu (M - 1,96(j/\fh; M + 1,96a/y/ň) = (135,9; 142,4). Protože i střední hodnota výšek z roku 1951 leží v tomto intervalu, nemá vážný důvod tvrdit, že se střední výška změnila. 90.0 Náhodný vektor Náhodný výběr oooooooooooooo oooooooo«ooo Řešení Vzhledem k tomu, že základní soubor všech desetiletých chlapců je rozsáhlý, lze zmíněná data považovat za náhodný výběr3. Zjistíme, že M = 139,133, n = 15 a s využitím statistiky U dostáváme, že s 95% pravděpodobností leží hodnota /x v intervalu (M - 1,96(j/V"; M + 1,96(j/y/ň) = (135,9; 142,4). Protože i střední hodnota výšek z roku 1951 leží v tomto intervalu, nemá vážný důvod tvrdit, že se střední výška změnila. Pokud bychom ovšem připustili vyšší možnost omylu a stanovili interval se spolehlivostí pouze 90%, pak bychom na této hladině hypotézu, že střední výška se změnila, přijali - interval je nyní (136,41;141,85). 90.0- Náhodný vektor oooooooooooooo Náhodný výběr oooooooo«ooo Řešení Vzhledem k tomu, že základní soubor všech desetiletých chlapců je rozsáhlý, lze zmíněná data považovat za náhodný výběr3. Zjistíme, že M = 139,133, n = 15 a s využitím statistiky U dostáváme, že s 95% pravděpodobností leží hodnota /x v intervalu (M - 1, 96(7/V"; M + 1, 96 2. Označme M\, M2 jejich výběrové průměry a S2, Sf výběrové rozptyly. Dále necht je s2_(m-l)S2 + (n-l)S2 * m+n-2 vážený průměr výběrových rozptylů. Pak platí: 00. o- Náhodný vektor Náhodný výběr oooooooooooooo ooooooooo«oo Dva nezávislé výběry z normálního rozdělení Věta Necht je X\\,..., Xm\ náhodný výběr rozsahu m z rozdělení A/(/x, a2) a X\2,..., Xn2 je na něm nezávislý náhodný výběr rozsahu n z rozdělení N (/i, u2), přičemž m, n > 2. Označme M\, M2 jejich výběrové průměry a S2, Sf výběrové rozptyly. Dále necht je s2_(m-l)S2 + (n-l)S2 * m+n-2 vážený průměr výběrových rozptylů. Pak platí: • M\ — M2 a S2 jsou stochasticky nezávislé, 00. o Náhodný vektor Náhodný výběr oooooooooooooo ooooooooo«oo Dva nezávislé výběry z normálního rozdělení Věta Necht je X\\,..., Xm\ náhodný výběr rozsahu m z rozdělení A/(/x, a2) a X\2,..., Xni je na něm nezávislý náhodný výběr rozsahu n z rozdělení N (/i, u2), přičemž m, n > 2. Označme M\, M2 jejich výběrové průměry a S2, S| výběrové rozptyly. Dále necht je s2_(m-l)S2 + (n-l)S2 * m+n-2 vážený průměr výběrových rozptylů. Pak platí: • M\ — M2 a S2 jsou stochasticky nezávislé, • Mi - M2 ~ A/(/xi - H2, ^ + 4) , 00. o- Náhodný vektor Náhodný výběr oooooooooooooo ooooooooo«oo Dva nezávislé výběry z normálního rozdělení Věta Necht je X\\,..., Xm\ náhodný výběr rozsahu m z rozdělení A/(/x, a2) a X\2,..., Xn2 je na něm nezávislý náhodný výběr rozsahu n z rozdělení N (/i, u2), přičemž m, n > 2. Označme M\, M2 jejich výběrové průměry a S2, Sf výběrové rozptyly. Dále necht je s2_(m-l)S2 + (n-l)S2 * m+n-2 vážený průměr výběrových rozptylů. Pak platí: • M\ — M2 a S2 jsou stochasticky nezávislé, • Mi - M2 ~ A/(/íi - H2, ^ + 4) , • je-li g\ = g\ = a2, pak K = {m + n- 2)S2/a2 ~ x2(m + n - 2) , 00. o- Náhodný vektor Náhodný výběr oooooooooooooo ooooooooo«oo Dva nezávislé výběry z normálního rozdělení Necht je X\\,..., Xm\ náhodný výběr rozsahu m z rozdělení A/(/x, a2) a X\2,..., Xn2 je na něm nezávislý náhodný výběr rozsahu n z rozdělení N (/i, u2), přičemž m, n > 2. Označme M\, M2 jejich výběrové průměry a S2, Sf výběrové rozptyly. Dále necht je (m - 1)S2 + (n 1)S2 m + n-2 vážený průměr výběrových rozptylů. Pak platí: • Mi — M2 a S2 jsou stochasticky nezávislé, r2 • je-li af = 02 pak K • F (m + n- 2)S2/a< o\lo\ F{m — 1, n X2{m + n 2) 190,0. Náhodný vektor Náhodný výběr oooooooooooooo oooooooooo«o Užití statistik dvou nezávislých výběrů • Statistika U, vzniklá normováním M\ — M2, se používá pro odhad rozdílu [i\ — [12, známe-li rozptyly