8. Parametrické úlohy o jednom náhodném výběru a dvou nezávislých náhodných výběrech z alternativních rozložení 8.1. Věta: Asymptotické rozložení statistiky odvozené z výběrového průměru. 8.2. Věta: Vzorec pro meze 100(1-α)% asymptotického empirického intervalu spolehlivosti pro parametr . 8.3. Příklad: Náhodně bylo vybráno 100 osob a zjištěno, že 34 z nich používá zubní kartáček zahraniční výroby. Najděte 95% asymptotický interval spolehlivosti pro pravděpodobnost, že náhodně vybraná osoba používá zubní kartáček zahraniční výroby. Řešení: Zavedeme náhodné veličiny X[1], ..., X[100], přičemž X[i] = 1, když i-tá osoba používá zahraniční zubní kartáček a X[i] = 0 jinak, i = 1, ..., 100. Tyto náhodné veličiny tvoří náhodný výběr z rozložení A( ). n = 100, m = 34/100, α = 0,05, u[1-α/2] = u[0,975] = 1,96. Ověření podmínky n (1- ) > 9: parametr neznáme, musíme ho nahradit výběrovým průměrem. Pak 100.0,34.0,66 = 22,44 > 9. . S pravděpodobností přibližně 0,95 tedy 0,2472 < < 0,4328. 8.4. Příklad: Kolik osob musíme vybrat, abychom podíl modrookých osob v populaci odhadli se spolehlivostí 90% a šířka intervalu spolehlivosti byla nanejvýš a) 0,06, b) 0,01? Řešení: Šířka 100(1-α)% asymptotického empirického intervalu spolehlivosti pro parametr : Požadujeme, aby h – d ≤ Δ, tedy . Odtud vyjádříme . Předpokládejme, že nemáme žádné předběžné informace o podílu modrookých osob v populaci. Musíme tedy zvolit takové m, aby šířka intervalu spolehlivosti byla maximální. Maximalizujeme výraz . Derivujeme podle m a položíme rovno 0: .V tomto případě volíme relativní četnost m = 0,5. ad a) Uvedenou podmínku tedy splníme, když vybereme aspoň 752 osob. ad b) Chceme-li dosáhnout podstatně užšího intervalu spolehlivosti, musíme vybrat aspoň 27 061 osob. Modifikace: Předpokládejme, že v populaci je nanejvýš 30% modrookých osob. Pak relativní četnost m = 0,3. ad a) V tomto případě stačí vybrat 632 osob. Ve srovnání s předešlým případem vidíme, že rozsah výběru skutečně klesl. ad b) V tomto případě musíme vybrat aspoň 22 731 osob. 8.5. Věta: Testování hypotézy o parametru . 8.6. Příklad: Pravděpodobnost vyrobení zmetku při výrobě určité součástky činí = 0,01. Bylo náhodně vybráno 1000 výrobků a zjistilo se, že mezi nimi je 16 zmetků. Na asymptotické hladině významnosti 0,05 testujte hypotézu H[0]: = 0,01 proti oboustranné alternativě H[1]: ≠ 0,01. Řešení: Ověření podmínky n (1- ) > 9: 1000.0,01.0,99 = 9,9 > 9. Realizace testového kritéria: . Kritický obor: = . Protože 1,907 W, H[0] nezamítáme na asymptotické hladině významnosti 0,05. 8.7. Příklad: Nový léčebný postup považujeme za úspěšný, pokud po jeho ukončení bude dosaženo zlepšení zdravotního stavu u alespoň 50% zúčastněných pacientů. Nová terapie byla vyzkoušena u 40 pacientů a ke zlepšení došlo u 24 osob. Je možné na asymptotické hladině významnosti zamítnout 0,05 hypotézu, že tato terapie nedosahuje úspěšnosti aspoň 50%? Řešení: Zavedeme náhodné veličiny X[1], ..., X[40], přičemž X[i] = 1, když terapie u i-tého pacienta byl úspěšná a X[i] = 0 jinak, i = 1, ..., 40. Tyto náhodné veličiny tvoří náhodný výběr z rozložení A( ). Testujeme hypotézu H[0]: ≤ 0,5 proti pravostranné alternativě H[1]: > 0,5. Známe: n = 40, , c = 0,5, α = 0,05, u[1-α/2] = u[0,95] = 1,645 Ověření podmínky : 40.0,6.0,4 = 9,6 > 9. Realizace testového kritéria: . Kritický obor: . Protože 1,2649 W, H[0] nezamítáme na asymptotické hladině významnosti 0,05. 8.8. Věta: Asymptotické rozložení statistiky odvozené ze dvou výběrových průměrů. 8.9. Věta: Vzorec pro meze 100(1-α)% asymptotického empirického intervalu spolehlivosti pro parametrickou funkci . 8.10. Příklad: Management supermarketu vyhlásil týden slev a sledoval, zda toto vyhlášení má vliv na podíl větších nákupů (nad 500 Kč). Na základě náhodného výběru 200 zákazníků v týdnu bez slev bylo zjištěno 97 velkých nákupů, zatímco v týdnu se slevou z 300 náhodně vybraných zákazníků učinilo velký nákup 162 zákazníků. Sestrojte 95% asymptotický interval spolehlivosti pro rozdíl pravděpodobností uskutečnění většího nákupu v týdnu se slevou a v týdnu bez slevy. Řešení: Zavedeme náhodnou veličinu X[1i], která bude nabývat hodnoty 1, když v týdnu bez slevy i-tý náhodně vybraný zákazník uskuteční větší nákup a hodnoty 0 jinak, i = 1, …, 200. Náhodné veličiny X[1,1], …, X[1,200] tvoří náhodný výběr z rozložení . Dále zavedeme náhodnou veličinu X[2i], která bude nabývat hodnoty 1, když v týdnu se slevou i-tý náhodně vybraný zákazník uskuteční větší nákup a hodnoty 0 jinak, i = 1, …, 300. Náhodné veličiny X[2,1], …, X[2,300] tvoří náhodný výběr z rozložení . n[1] = 200, n[2] = 300, m[1] = 97/200, m[2] = 162/300. Ověření podmínek n[1] (1- ) > 9 a n[2] (1- ) > 9: Parametry a neznáme, nahradíme je odhady m[1]a m[2]. 97.(1-97/200) = 49,955 > 9, 162.(1-162/300) = 74,52 > 9. Meze 100(1-α)% asymptotického empirického intervalu spolehlivosti pro parametrickou funkci jsou: Zjistili jsme tedy, že s pravděpodobností přibližně 0,95 –0,1443 < < 0,0343. 8.11. Věta: Testování hypotézy o parametrické funkci 8.12. Poznámka: Postup při testování hypotézy 8.13. Příklad: Pro údaje z příkladu 8.10. testujte na asymptotické hladině významnosti 0,05 hypotézu, že týden se slevami nezvýší pravděpodobnost uskutečnění většího nákupu. Řešení: Testujeme hypotézu = 0 proti levostranné alternativě H[1]: < 0 na asymptotické hladině významnosti 0,05. n[1] = 200, n[2] = 300, m[1] = 97/200, m[2] = 162/300, m[*] = (97 + 162)/500 = 0,518. Podmínky dobré aproximace byly ověřeny v příkladu 8.8. Testování pomocí intervalu spolehlivosti: Pro levostrannou alternativu používáme pravostranný interval spolehlivosti: Protože číslo c = 0 je obsaženo v intervalu , H[0] nezamítáme na asymptotické hladině významnosti 0,05. Testování pomocí kritického oboru: Realizace testového kritéria: . Kritický obor je . Protože testové kritérium nepatří do kritického oboru, H[0] nezamítáme na asymptotické hladině významnosti 0,05. Testování pomocí p-hodnoty: Pro levostrannou alternativu se p-hodnota počítá podle vzorce p = P(T[0] ≤ t[0]): Protože p-hodnota je větší než 0,05, H[0] nezamítáme na asymptotické hladině významnosti 0,05.