Parametrické úlohy o jednom a dvou výběrech z alternativního rozložení Osnova: Případ jednoho náhodného výběru - asymptotické rozložení statistiky odvozené z výběrového průměru alternativního rozložení - vzorec pro meze intervalu spolehlivosti pro parametr alternativního rozložení - testování hypotézy o parametru alternativního rozložení Případ dvou nezávislých náhodných výběrů - asymptotické rozložení statistiky odvozené z výběrových průměrů dvou nezávislých alternativních rozložení - vzorec pro meze intervalu spolehlivosti pro rozdíl parametrů dvou alternativních rouložení - testování hypotézy o rozdílu parametrů dvou alternativních rozložení Případ jednoho náhodného výběru: S náhodným výběrem rozsahu n z alternativního rozložení se setkáváme v situaci, kdy provádíme n opakovaných nezávislých pokusů a v každém z těchto pokusů sledujeme nastoupení úspěchu. Pravděpodobnost úspěchu je pro všechny pokusy stejná. Náhodná veličina Xi nabude hodnoty 1, pokud v i-tém pokusu nastal úspěch a hodnoty 0, pokud v i-tém pokusu úspěch nenastal, i = 1, 2, …, n. Realizací náhodného výběru X1, …, Xn je tedy posloupnost 0 a 1. Opakování: Alternativní rozložení: Náhodná veličina X udává počet úspěchů v jednom pokusu, přičemž pravděpodobnost úspěchu je ϑ. Píšeme X ~ A(ϑ). ( )      =ϑ =ϑ− =π jinak0 1xpro 0xpro1 x neboli ( ) ( )    =ϑ−ϑ =π − jinak0 10,xpro1 x x1x Binomické rozložení: Náhodná veličina X udává počet úspěchů v posloupnosti n nezávislých opakovaných pokusů, přičemž pravděpodobnost úspěchu je v každém pokusu ϑ . Píšeme X ~ Bi(n,ϑ). π(x) = ( )      =ϑ−ϑ      =π − jinak0 n,0,xpro)1( x n x xnx K E(X) = nϑ , D(X) = nϑ (1-ϑ ) (Alternativní rozložení je speciálním případem binomického rozložení pro n = 1. Jsou-li X1, ..., Xn stochasticky nezávislé náhodné veličiny, Xi ~ A(ϑ ), i = 1, ..., n, pak X = ∑ = n 1i iX ~ Bi(n, ϑ ).) Centrální limitní věta: Jsou-li náhodné veličiny X1, …, Xn stochasticky nezávislé a všechny mají stejné rozložení se střední hodnotou µ a rozptylem σ2 , pak pro velká n (n ≥ 30) lze rozložení součtu ∑= n 1i iX aproximovat normálním rozložením N(nµ, nσ2 ). Zkráceně píšeme ( )2 n 1i i n,nNX σµ≈∑= . Pokud součet ∑= n 1i iX standardizujeme, tj. vytvoříme náhodnou veličinu n nX U n 1i i n σ µ− = ∑= , pak rozložení této náhodné veličiny lze aproximovat standardizovaným normálním rozložením. Zkráceně píšeme Un ≈ N(0,1) Asymptotické rozložení statistiky odvozené z výběrového průměru. Nechť X1, ..., Xn je náhodný výběr z rozložení A(ϑ) a nechť je splněna podmínka ( ) 91n >ϑ−ϑ . Pak statistika ( ) n 1 M U ϑ−ϑ ϑ− = konverguje v distribuci k náhodné veličině se standardizovaným normálním rozložením. (Říkáme, že U má asymptoticky rozložení N(0,1) a píšeme U ≈ N(0,1).) Vysvětlení: Protože X1, ..., Xn je náhodný výběr z rozložení A(ϑ), bude mít statistika Yn = ∑ = n 1i iX (výběrový úhrn) rozložení Bi(n, ϑ ). Yn má střední hodnotu E(Yn) = nϑ a rozptyl D(Yn) = ( )ϑ−ϑ 1n . Podle centrální limitní věty se standardizovaná statistika ( )ϑ−ϑ ϑ− = 1n nY U n asymptoticky řídí standardizovaným normálním rozložením N(0,1). Pokud čitatele i jmenovatele podělíme n, dostaneme vyjádření: ( ) ( ) ( ) ( )1,0N n 1 M n 1 X n 1 n 1n n Y U n 1i i 2 n ≈ ϑ−ϑ ϑ− = ϑ−ϑ ϑ− = ϑ−ϑ ϑ− = ∑= Vzorec pro meze 100(1-α)% asymptotického empirického intervalu spolehlivosti pro parametr ϑ . Meze 100(1-α)% asymptotického empirického intervalu spolehlivosti pro parametr ϑ jsou: 2/12/1 u n )m1(m mh,u n )m1(m md α−α− − += − −= . Vysvětlení: Pokud rozptyl ( ) ( ) n 1 MD ϑ−ϑ = nahradíme odhadem ( ) n M1M − , konvergence náhodné veličiny U k veličině s rozložením N(0,1) se neporuší. Tedy       − +<ϑ< − −= =             < − ϑ− <−≤α−Ξ∈ϑ∀ α−α− α−α− 2/12/1 2/12/1 u n )M1(M Mu n )M1(M MP u n )M1(M M uP1: Příklad: Náhodně bylo vybráno 100 osob a zjištěno, že 34 z nich nakupuje v internetových obchodech. Najděte 95% asymptotický interval spolehlivosti pro pravděpodobnost, že náhodně vybraná osoba nakupuje v internetových obchodech. Řešení: Zavedeme náhodné veličiny X1, ..., X100, přičemž Xi = 1, když i-tá osoba nakupuje v internetových obchodech a Xi = 0 jinak, i = 1, ..., 100. Tyto náhodné veličiny tvoří náhodný výběr z rozložení A(ϑ ). n = 100, m = 34/100, α = 0,05, u1-α/2 = u0,975 = 1,96. Ověření podmínky nϑ (1- ϑ ) > 9: parametr ϑ neznáme, musíme ho nahradit výběrovým průměrem. Pak 100.0,34.0,66 = 22,44 > 9. 4328,096,1 100 )34,01(34,0 34,0h,2472,096,1 100 )34,01(34,0 34,0d = − +== − −= . S pravděpodobností přibližně 0,95 tedy 0,2472 < ϑ < 0,4328. Znamená to, že s pravděpodobností přibližně 95% je v uvažované populaci nejméně 24,7% a nejvíce 43,3% osob, které nakupují v internetových obchodech. Výpočet pomocí systému STATISTICA: Statistiky – Analýza síly testu – Odhad intervalu – Jeden podíl, Z, Chí-kvadrát test – OK – Pozorovaný podíl p: 0,34, Velikost vzorku: 100, Spolehlivost: 0,95 – Vypočítat. Dostaneme tabulku: Hodnota Podíl vzorku p Velikost vz. ve skup. (N) Interval spolehlivosti Meze spolehlivosti: Pí (přesně): Dolní mez Horní mez Pí (přibližně): Dolní mez Horní mez Pí (původ.): Dolní mez Horní mez 0,3400 100,0000 0,9500 0,2482 0,4415 0,2501 0,4423 0,2472 0,4328 Zajímá nás výsledek uvedený v dolní části tabulky, tj. Pí (původ.). Zjišťujeme, že s pravděpodobností aspoň 0,95 se pravděpodobnost nákupu v internetových obchodech bude pohybovat v mezích 0,2472 až 0,4328. Příklad: Kolik osob musíme vybrat, abychom podíl modrookých osob v populaci odhadli se spolehlivostí 90% a šířka intervalu spolehlivosti byla nanejvýš a) 0,06, b) 0,01? Řešení: Šířka 100(1-α)% asymptotického empirického intervalu spolehlivosti pro parametr ϑ: 2/12/12/1 u n )m1(m 2u n )m1(m mu n )m1(m mdh α−α−α− − =      − −− − +=− Požadujeme, aby h – d ≤ ∆, tedy ∆≤ − α− 2/1 u n )m1(m 2 . Odtud vyjádříme ( ) 2 2 2/1um1m4 n ∆ − ≥ α− . Předpokládejme, že nemáme žádné předběžné informace o podílu modrookých osob v populaci. Musíme tedy zvolit takové m, aby šířka intervalu spolehlivosti byla maximální. Maximalizujeme výraz ( ) 2 mmm1m −=− . Derivujeme podle m a položíme rovno 0: 2 1 m0m21 =⇒=− .V tomto případě volíme relativní četnost m = 0,5. ad a) ( ) 67,751 06,0 645,15,05,04 06,0 u5,05,04um1m4 n 2 2 2 2 95,0 2 2 2/1 = ⋅⋅⋅ = ⋅⋅⋅ = ∆ − ≥ α− Uvedenou podmínku tedy splníme, když vybereme aspoň 752 osob. ad b) ( ) 25,27060 01,0 645,15,05,04 01,0 u5,05,04um1m4 n 2 2 2 2 95,0 2 2 2/1 = ⋅⋅⋅ = ⋅⋅⋅ = ∆ − ≥ α− Chceme-li dosáhnout podstatně užšího intervalu spolehlivosti, musíme vybrat aspoň 27 061 osob. Modifikace: Předpokládejme, že v populaci je nanejvýš 30% modrookých osob. Pak relativní četnost m = 0,3. ad a) ( ) 41,631 06,0 645,17,03,04 06,0 u7,03,04um1m4 n 2 2 2 2 95,0 2 2 2/1 = ⋅⋅⋅ = ⋅⋅⋅ = ∆ − ≥ α− V tomto případě stačí vybrat 632 osob. Ve srovnání s předešlým případem vidíme, že rozsah výběru skutečně klesl. ad b) ( ) 61,22730 01,0 645,17,03,04 01,0 u7,03,04um1m4 n 2 2 2 2 95,0 2 2 2/1 = ⋅⋅⋅ = ⋅⋅⋅ = ∆ − ≥ α− V tomto případě musíme vybrat aspoň 22 731 osob. Testování hypotézy o parametru ϑ Nechť X1, ..., Xn je náhodný výběr z rozložení A(ϑ) a nechť je splněna podmínka ( ) 91n >ϑ−ϑ . Na asymptotické hladině významnosti α testujeme hypotézu H0: ϑ = c proti alternativě H1: ϑ ≠ c (resp. H1: ϑ < c resp. H1: ϑ > c). Testovým kritériem je statistika n )c1(c cM T0 − − = , která v případě platnosti nulové hypotézy má asymptoticky rozložení N(0,1). Kritický obor má tvar ( )∞∪−∞−= α−α− ,uu,W 2/12/1 (resp. ( α−−∞−= 1u,W resp. )∞= α− ,uW 1 ). (Testování hypotézy o parametru ϑ lze samozřejmě provést i pomocí 100(1-α)% asymptotického intervalu spolehlivosti nebo pomocí p-hodnoty.) Příklad: Podíl zmetků při výrobě určité součástky činí ϑ = 0,01. Bylo náhodně vybráno 1000 výrobků a zjistilo se, že mezi nimi je 16 zmetků. Na asymptotické hladině významnosti 0,05 testujte hypotézu H0: ϑ = 0,01 proti oboustranné alternativě H1: ϑ ≠ 0,01. Řešení: Zavedeme náhodné veličiny X1, ..., X1000, přičemž Xi = 1, když i-tý výrobek byl zmetek a Xi = 0 jinak, i = 1, ..., 1000. Tyto náhodné veličiny tvoří náhodný výběr z rozložení A(ϑ). Testujeme hypotézu H0: ϑ = 0,01 proti alternativě H1: ϑ ≠ 0,01. Známe: n = 1000, 016,0 1000 16 m == , c = 0,01, α = 0,05, u1-α/2 = u0,975 = 1,96 Ověření podmínky ( ) 91n >ϑ−ϑ : 1000.0,01.0,99 = 9,9 > 9. a) Testování pomocí kritického oboru: Realizace testového kritéria: ( ) 907,1 1000 99,001,0 01,0016,0 n c1c cm t0 = ⋅ − = −⋅ − = . Kritický obor: ( )=∞∪−∞−= ,uu,W 975,0975,0 ( )∞∪−∞− ,96,196,1, . Protože 1,907 ∉ W, H0 nezamítáme na asymptotické hladině významnosti 0,05. b) Testování pomocí intervalu spolehlivosti 0082,096,1 1000 984,0016,0 016,0u n )m1(m md 2/1 = ⋅ −= − −= −α 0238,096,1 1000 984,0016,0 016,0u n )m1(m mh 2/1 = ⋅ += − += −α Protože číslo c = 0,01 leží v intervalu 0,0082 až 0,0238, H0 nezamítáme na asymptotické hladině významnosti 0,05. c) Testování pomocí p-hodnoty Protože testujeme nulovou hypotézu proti oboustranné alternativě, vypočteme p-hodnotu podle vzorce: p = 2 min{ Φ(1,907), 1–Φ(1,907) } = 2 min { 0,97104, 1 – 0,97104 } = 0,05792. Protože vypočtená p-hodnota je větší než hladina významnosti 0,05, H0 nezamítáme na asymptotické hladině významnosti 0,05. Výpočet pomocí systému STATISTICA (pouze přibližný): Statistiky – Základní statistiky a tabulky – Testy rozdílů: r, %, průměry – OK – vybereme Rozdíl mezi dvěma poměry – do políčka P 1 napíšeme 0,016, do políčka N1 napíšeme 1000, do políčka P 2 napíšeme 0,01, do políčka N2 napíšeme 32767 (větší hodnotu systém neumožní) - Výpočet. Dostaneme p-hodnotu 0,0626, tedy nezamítáme nulovou hypotézu na hladině významnosti 0,05. Příklad: Nový léčebný postup považujeme za úspěšný, pokud po jeho ukončení bude dosaženo zlepšení zdravotního stavu u alespoň 50% zúčastněných pacientů. Nová terapie byla vyzkoušena u 40 pacientů a ke zlepšení došlo u 24 osob, tj. u 60%. Je možné na asymptotické hladině významnosti 0,05 zamítnout hypotézu, že tato terapie nedosahuje úspěšnosti aspoň 50%? Řešení: Zavedeme náhodné veličiny X1, ..., X40, přičemž Xi = 1, když terapie u i-tého pacienta byl úspěšná a Xi = 0 jinak, i = 1, ..., 40. Tyto náhodné veličiny tvoří náhodný výběr z rozložení A(ϑ). Testujeme hypotézu H0: ϑ ≤ 0,5 proti pravostranné alternativě H1: ϑ > 0,5. Známe: n = 40, 6,0 40 24 m == , c = 0,5, α = 0,05, u1-α = u0,95 = 1,645 Ověření podmínky ( ) 91n >ϑ−ϑ : 40.0,6.0,4 = 9,6 > 9. Realizace testového kritéria: ( ) 2649,1 40 5,05,0 5,06,0 n c1c cm t0 = ⋅ − = −⋅ − = . Kritický obor: ) ) )∞=∞=∞= α− ,645,1,u,uW 95,01 . Protože 1,2649 ∉ W, H0 nezamítáme na asymptotické hladině významnosti 0,05. Výpočet pomocí systému STATISTICA: Vypočtená p-hodnota jednostranného testu je 0,1031, tedy větší než asymptotická hladina významnosti 0,05. H0 nezamítáme na asymptotické hladině významnosti 0,05. Případ dvou nezávislých výběrů z alternativních rozložení: Provádíme opakovaně nezávisle n1-krát jeden náhodný pokus a nezávisle na tom n2-krát druhý náhodný pokus. V první sérii pokusů sledujeme nějaký jev, který v každém pokusu může nastat s pravděpodobností 1ϑ a ve druhé sérii pokusů sledujeme nějaký jiný jev, jehož pravděpodobnost nastoupení je 2ϑ . Parametry 1ϑ , 2ϑ neznáme. Naším úkolem bude konstruovat interval spolehlivosti pro parametrickou funkci 21 ϑ−ϑ nebo testovat hypotézu o této parametrické funkci, a to pomocí dvou nezávislých náhodných výběrů z alternativních rozložení ( )1A ϑ , ( )2A ϑ . Asymptotické rozložení statistiky odvozené ze dvou výběrových průměrů alternativních rozložení Nechť 1n111 X,,X K je náhodný výběr z alternativního rozložení A( 1ϑ ) a 2n221 X,,X K je na něm nezávislý náhodný výběr alternativního rozložení A( 2ϑ ) a nechť jsou splněny podmínky n1 1ϑ (1- 1ϑ ) > 9 a n2 2ϑ (1- 2ϑ ) > 9. Označme M1, M2 výběrové průměry. Pak statistika ( ) ( ) ( ) ( )1,0N n 1 n 1 MM U 2 22 1 11 2121 ≈ ϑ−ϑ + ϑ−ϑ ϑ−ϑ−− = . Vysvětlení: Analogicky jako v případě jednoho náhodného výběru z alternativního rozložení. Vzorec pro meze 100(1-α)% asymptotického empirického intervalu spolehlivosti pro parametrickou funkci 21 ϑ−ϑ . Meze 100(1-α)% asymptotického empirického intervalu spolehlivosti pro 21 ϑ−ϑ jsou: 2/1 2 22 1 11 21 u n )m1(m n )m1(m mmd α− − + − −−= , 2/1 2 22 1 11 21 u n )m1(m n )m1(m mmh α− − + − +−= Vysvětlení: Pokud rozptyl ( ) ( ) i ii i n 1 MD ϑ−ϑ = nahradíme odhadem ( ) i ii n M1M − , i = 1, 2, konvergence náhodné veličiny U k veličině s rozložením N(0,1) se neporuší. Tedy ( ) ( ) ( ) ( ) ( ) ( ) ( ) )u n M1M n M1M MMu n M1M n M1M MM(P u n M1M n M1M MM uP1: 2/1 2 22 1 11 21212/1 2 22 1 11 21 2/1 2 22 1 11 2121 2/121 α−α− α−α− − + − +−<ϑ−ϑ< − + − −− =             < − + − ϑ−ϑ−− <−≤α−Ξ∈ϑ−ϑ∀ Příklad: Management supermarketu vyhlásil týden slev a sledoval, zda toto vyhlášení má vliv na podíl větších nákupů (nad 500 Kč). Na základě náhodného výběru 200 zákazníků v týdnu bez slev bylo zjištěno 97 velkých nákupů, zatímco v týdnu se slevou z 300 náhodně vybraných zákazníků učinilo velký nákup 162 zákazníků. Sestrojte 95% asymptotický interval spolehlivosti pro rozdíl pravděpodobností uskutečnění většího nákupu v týdnu bez slevy a v týdnu se slevou. Řešení: Zavedeme náhodnou veličinu X1i, která bude nabývat hodnoty 1, když v týdnu bez slevy i-tý náhodně vybraný zákazník uskuteční větší nákup a hodnoty 0 jinak, i = 1, …, 200. Náhodné veličiny X1,1, …, X1,200 tvoří náhodný výběr z rozložení ( )1A ϑ . Dále zavedeme náhodnou veličinu X2i, která bude nabývat hodnoty 1, když v týdnu se slevou i-tý náhodně vybraný zákazník uskuteční větší nákup a hodnoty 0 jinak, i = 1, …, 300. Náhodné veličiny X2,1, …, X2,300 tvoří náhodný výběr z rozložení ( )2A ϑ . n1 = 200, n2 = 300, m1 = 97/200 = 0,485, m2 = 162/300 = 0,54. Ověření podmínek n1 1ϑ (1- 1ϑ ) > 9 a n2 2ϑ (1- 2ϑ ) > 9: Parametry 1ϑ a 2ϑ neznáme, nahradíme je odhady m1 a m2, tedy 97.(1-97/200) = 49,955 > 9, 162.(1-162/300) = 74,52 > 9. Meze 100(1-α)% asymptotického empirického intervalu spolehlivosti pro parametrickou funkci 21 ϑ−ϑ jsou: 0343,096,1 300 )1( 200 )1( 300 162 200 97 u n )m1(m n )m1(m mmh 1443,096,1 300 )1( 200 )1( 300 162 200 97 u n )m1(m n )m1(m mmd 300 162 300 162 200 97 200 97 2/1 2 22 1 11 21 300 162 300 162 200 97 200 97 2/1 2 22 1 11 21 = − + − +−= − + − +−= −= − + − −−= − + − −−= α− α− Zjistili jsme tedy, že s pravděpodobností přibližně 0,95: –0,1443 < 21 ϑ−ϑ < 0,0343. Testování hypotézy o parametrické funkci 21 ϑ−ϑ Nechť 1n111 X,,X K je náhodný výběr z alternativního rozložení A( 1ϑ ) a 2n221 X,,X K je na něm nezávislý náhodný výběr alternativního rozložení A( 2ϑ ) a nechť jsou splněny podmínky n1 1ϑ (1- 1ϑ ) > 9 a n2 2ϑ (1- 2ϑ ) > 9. Na asymptotické hladině významnosti α testujeme nulovou hypotézu H0: 21 ϑ−ϑ = c proti alternativě H1: 21 ϑ−ϑ ≠ c (resp. H1: 21 ϑ−ϑ < c resp. H1: 21 ϑ−ϑ > c). Testovým kritériem je statistika ( ) ( ) 2 22 1 11 21 0 n M1M n M1M cMM T − + − −− = , která v případě platnosti H0 má asymptoticky rozložení N(0,1). Kritický obor má tvar ( )∞∪−∞−= α−α− ,uu,W 2/12/1 (resp. ( α− −∞−= 1 u,W resp. )∞= α− ,uW 1 ). (Testování hypotézy o parametrické funkci 21 ϑ−ϑ lze provést též pomocí 100(1-α)% asymptotického intervalu spolehlivosti nebo pomocí p-hodnoty.) Poznámka: Postup při testování hypotézy 021 =ϑ−ϑ Je-li c = 0, pak označme 21 2211 * nn MnMn M + + = vážený průměr výběrových průměrů. Jako testová statistika slouží ( )       +− − = 21 ** 21 0 n 1 n 1 M1M MM T , která v případě platnosti nulové hypotézy má asymptoticky rozložení N(0,1). Kritický obor má tvar ( )∞∪−∞−= α−α− ,uu,W 2/12/1 (resp. ( α− −∞−= 1 u,W resp. )∞= α− ,uW 1 ). Testová statistika T0 vznikne standardizací statistiky M1 – M2, kde neznámé parametry 1ϑ , 2ϑ nahradíme společným odhadem M*. Příklad: Pro údaje z příkladu o slevách v supermarketu testujte na asymptotické hladině významnosti 0,05 hypotézu, že týden se slevami nezvýší pravděpodobnost uskutečnění většího nákupu. Řešení: Testujeme hypotézu H0: 21 ϑ−ϑ = 0 proti levostranné alternativě H1: 21 ϑ−ϑ < 0 na asymptotické hladině významnosti 0,05. n1 = 200, n2 = 300, m1 = 97/200, m2 = 162/300, m* = (97 + 162)/500 = 0,518. Podmínky dobré aproximace byly ověřeny v předešlém příkladu. Testování pomocí intervalu spolehlivosti: Pro levostrannou alternativu používáme pravostranný interval spolehlivosti: 02,0645,1 300 )1( 200 )1( 300 162 200 97 u n )m1(m n )m1(m mmh 300 162 300 162 200 97 200 97 1 2 22 1 11 21 = − + − +−= − + − +−= α− Protože číslo c = 0 je obsaženo v intervalu ( 02,0;∞− , H0 nezamítáme na asymptotické hladině významnosti 0,05. Testování pomocí kritického oboru: Realizace testového kritéria: ( )( ) ( )( ) 2058,1 518,01518,0m1m mm t 300 1 200 1 300 162 200 97 n 1 n 1 ** 21 0 21 −= +− − = +− − = . Kritický obor je ( ( ( 645,1,u,u,W 95,01 −∞−=−∞−=−∞−= α− . Protože testové kritérium nepatří do kritického oboru, H0 nezamítáme na asymptotické hladině významnosti 0,05. Testování pomocí p-hodnoty: Pro levostrannou alternativu se p-hodnota počítá podle vzorce p = P(T0 ≤ t0): ( ) ( ) ( ) 1139,08861,012058,112058,12058,1TPp 0 =−=Φ−=−Φ=−≤= Protože p-hodnota je větší než 0,05, H0 nezamítáme na asymptotické hladině významnosti 0,05. Výpočet pomocí systému STATISTICA: Statistiky – Základní statistiky a tabulky – Testy rozdílů: r, %, průměry – OK – vybereme Rozdíl mezi dvěma poměry – do políčka P 1 napíšeme 0,485, do políčka N1 napíšeme 200, do políčka P 2 napíšeme 0,54, do políčka N2 napíšeme 300 – zaškrtneme Jednostr. - Výpočet. Dostaneme p-hodnotu 0,1142, tedy nezamítáme nulovou hypotézu na hladině významnosti 0,05.