7. Parametrické úlohy o dvou nezávislých náhodných výběrech 7.1. Dva nezávislé náhodné výběry z normálních rozložení 7.1.1. Rozložení statistik odvozených z výběrových průměrů a výběrových rozptylů Nechť je náhodný výběr z rozložení N(ě1, ó12) a je na něm nezávislý náhodný výběr z rozložení N(ě2, ó22), přičemž n1 ? 2 a n2 ? 2. Označme M1, M2 výběrové průměry a S12, S22 výběrové rozptyly. Pak platí: a) Statistiky M1 -- M2 a = jsou stochasticky nezávislé. b) M1 -- M2 ~ N(ě1 -- ě2, ), tedy U = ~ N(0, 1). (Pivotová statistika U slouží k řešení úloh o ě1- ě2, když ó12 a ó22známe.) c) Jestliže ó12 = ó22 =: ó2, pak K = ~ ÷2(n1 + n2 - 2). (Pivotová statistika K slouží k řešení úloh o neznámém společném rozptylu ó2.) d) Jestliže ó12 = ó22 =: ó2, pak T = ~ t(n1 + n2 -- 2). (Pivotová statistika T slouží k řešení úloh o ě1- ě2, když ó12 a ó22 neznáme, ale víme, že jsou shodné.) e) F = ~ F(n1 -- 1, n2 -- 1). (Pivotová statistika F slouží k řešení úloh o ó12/ ó22.) Důkaz: ad a) Nebudeme provádět. ad b) M1-M2 je lineární kombinace náhodných veličin s normálním rozložením, má tedy normální rozložení s parametry E(M1-M2) = ě1- ě2, D(M1-M2) = ó1 2/n1+ ó2 2/n2. U se získá standardizací M1-M2. ad c) K1 = ~ ÷2(n1-1) a K2 = ~ ÷2(n2-1) jsou stochasticky nezávislé náhodné veličiny, tedy K = K1+K2 ~ ÷2(n1 + n2 - 2). ad d) U = ~ N(0, 1), K = ~ ÷2(n1 + n2 - 2) jsou stochasticky nezávislé, protože M1 -- M2 a jsou stochasticky nezávislé. =~ t(n1 + n2 -- 2). ad e) K1 = ~ ÷2(n1-1) a K2 = ~ ÷2(n2-1) jsou stochasticky nezávislé náhodné veličiny, tedy =~ F(n1 -- 1, n2 -- 1). Příklad: Nechť jsou dány dva nezávislé náhodné výběry, první pochází z rozložení N(2, 1,5) a má rozsah 10, druhý pochází z rozložení N(3, 4) a má rozsah 5. Jaká je pravděpodobnost, že výběrový průměr 1. výběru bude menší než výběrový průměr 2. výběru? Řešení: P(M1 < M2) = P(M1 - M2 < 0) = S pravděpodobností přibližně 84,8% je výběrový průměr 1. výběru menší než výběrový průměr 2. výběru. 7.1.2. Intervaly spolehlivosti pro parametrické funkce ě1-ě2, ó12/ó2 2 Uvedeme přehled vzorců pro meze 100(1-á)% empirických intervalů spolehlivosti pro parametrické funkce ě1- ě2, ó1 2/ ó2 2 a) Interval spolehlivosti pro ě1-ě2, když ó12, ó22známe Oboustranný: (d, h) = (m1 -- m2 -- u1-á/2, m1 -- m2 + u1-á/2) Levostranný: (d, ?) = (m1 -- m2 --u1-á, ?) Pravostranný: (-?, h) = (-?,m1 -- m2 + u1-á) b) Interval spolehlivosti pro ě1-ě2, když ó12, ó22 neznáme, ale víme, že jsou shodné Oboustranný: (d, h) = (m1 -- m2 --t1-á/2(n1+n2-2), m1 -- m2 +t1-á/2(n1+n2-2)) Levostranný: (d, ?) = (m1 -- m2 --t1-á(n1+n2-2), ?) Pravostranný: (-?, h) = (-?, m1 -- m2 + t1-á(n1+n2-2)) c) Interval spolehlivosti pro společný neznámý rozptyl ó2 Oboustranný: (d, h) = Levostranný: (d, ?) = Pravostranný: (-?, h) = d) Interval spolehlivosti pro podíl rozptylů Oboustranný: (d, h) = Levostranný: (d, ?) = Pravostranný: (-?, h) = Upozornění: Není-li v 7.1.2. (b) splněn předpoklad o shodě rozptylů, lze sestrojit aspoň přibližný 100(1-á)% interval spolehlivosti pro ě1-ě2. V tomto případě má statistika T přibližně rozložení t(), kde počet stupňů volnosti = . Není-li í celé číslo, použijeme v tabulkách kvantilů Studentova rozložení lineární interpolaci. Příklad: Ve dvou nádržích se zkoumal obsah chlóru (v g/l). Z první nádrže bylo odebráno 25 vzorků, z druhé nádrže 10 vzorků. Byly vypočteny realizace výběrových průměrů a rozptylů: m1 = 34,48, m2 = 35,59, s12 = 1,7482, s22 = 1,7121. Hodnoty zjištěné z odebraných vzorků považujeme za realizace dvou nezávislých náhodných výběrů z rozložení N(ě1, ó2) a N(ě2, ó2). Sestrojte 95% empirický interval spolehlivosti pro rozdíl středních hodnot ě1 - ě2. Řešení: = , t0,975(33) = 2,035 d = m1--m2--t1-á/2(n1+n2-2) = 34,48--35,59 - = -2,114 h = m1--m2+t1-á/2(n1+n2-2) = 34,48--35,59 + = -0,106 -2,114 g/l < ě1 - ě2 < -0,106 g/l s pravděpodobností aspoň 0,95. Příklad: V předešlém příkladě nyní předpokládáme, že dané dva náhodné výběry pocházejí z rozložení N(ě1, ó12) a N(ě2, ó22). Sestrojte 95% empirický interval spolehlivosti pro podíl rozptylů. Řešení: d = h = 0,28 < < 2,76 s pravděpodobností aspoň 0,95. 7.1.3. Testování hypotéz o parametrických funkcích ě1-ě2, ó12/ó2 2 a) Nechť je náhodný výběr z rozložení N(ě1, ó12) a je na něm nezávislý náhodný výběr z rozložení N(ě2, ó22), přičemž n1 ? 2, n2 ? 2 a ó12, ó22 známe. Nechť c je konstanta. Test H0: ě1 -- ě2 = c proti H1: ě1 -- ě2 c se nazývá dvouvýběrový z-test. b) Nechť je náhodný výběr z rozložení N(ě1, ó2) a je na něm nezávislý náhodný výběr rozložení N(ě2, ó2), přičemž n1 ? 2 a n2 ? 2 a ó2 neznáme. Nechť c je konstanta. Test H0: ě1 -- ě2 = c proti H1: ě1 -- ě2 c se nazývá dvouvýběrový t-test. c) Nechť je náhodný výběr z rozložení N(ě1, ó12) a je na něm nezávislý náhodný výběr rozložení N(ě2, ó22), přičemž n1 ? 2 a n2 ? 2. Test H0: = 1 proti H1: 1 se nazývá F-test. 7.1.4. Provedení testů o parametrických funkcích ě1-ě2, ó12/ó2 2 pomocí kritického oboru a) Provedení dvouvýběrového z-testu Hypotézu H0: ě1 -- ě2 = c proti H1: ě1 -- ě2 c (resp. H1: ě1 -- ě2 < c resp. H1: ě1 -- ě2 > c ) zamítáme na hladině významnosti á, jestliže (resp. resp. ). b) Provedení dvouvýběrového t-testu Hypotézu H0: ě1 -- ě2 = c proti H1: ě1 -- ě2 c (resp. H1: ě1 -- ě2 < c resp. H1: ě1 -- ě2 > c ) zamítáme na hladině významnosti á, jestliže (resp. resp. ) . c) Provedení F-testu Hypotézu H0: = 1 proti H1: 1 (resp. H1: < 1 resp. H1: > 1) zamítáme na hladině významnosti á, jestliže Fá/2(n1+n2-2) nebo F1-á/2(n1+n2-2) (resp. Fá(n1+n2-2) resp. F1-á(n1+n2-2)). Příklad: Výrobce limonád chtěl zjistit, zda změna technologie výroby se projeví v prodeji limonád. Proto sledoval po 14 náhodně vybraných dnů před zavedením nových limonád tržby v určitém regionu a zjistil, že za den utržil v průměru 39 600 Kč se směrodatnou odchylkou 5 060 Kč. Po zavedení nových limonád prověřil stejným způsobem tržby v 11 náhodně vybraných dnech v témž regionu a zjistil průměrný příjem 41 200 Kč se směrodatnou odchylkou 4 310 Kč. Předpokládejte, že tržby za starý typ limonád se řídí rozložením N(ě1, ó12) a tržby za nový typ limonád se řídí rozložením N(ě2, ó22). a) Na hladině významnosti 0,05 testujte hypotézu H0: = 1 proti H1: 1. b) Na hladině významnosti 0,05 testujte hypotézu H0: ě1 -- ě2 = 0 proti H1: ě1 -- ě2 0. Řešení: ad a) Protože testové kritérium = 1,3783 se nerealizuje v kritickém oboru W = , nelze na hladině významnosti 0,05 zamítnout hypotézu o shodě rozptylů. ad b) Protože jsme na hladině významnosti 0,05 nezamítli hypotézu o shodě rozptylů, můžeme rozptyly ó12, ó22 považovat za shodné a za jejich odhad vezmeme vážený průměr výběrových rozptylů . Protože testové kritérium -0,8363 se nerealizuje v kritickém oboru W = , na hladině významnosti 0,05 nelze zamítnout hypotézu o shodě středních hodnot. 7.2. Dva nezávislé náhodné výběry z alternativních rozložení 7.2.1. Rozložení statistiky odvozené z výběrových průměrů Nechť je náhodný výběr z rozložení A() a je na něm nezávislý náhodný výběr rozložení A() a nechť jsou splněny podmínky n1 (1-) > 9 a n2 (1-) > 9. Označme M1, M2 výběrové průměry. Pak statistika konverguje v distribuci k náhodné veličině se standardizovaným normálním rozložením. Důkaz: Analogicky jako v 6.3.1. 7.2.2. Asymptotický interval spolehlivosti pro parametrickou funkci Pokud rozptyl D(Mi) = (1-)/ni nahradíme odhadem Mi(1- Mi)/ni, i = 1, 2, konvergence náhodné veličiny U k veličině s rozložením N(0,1) se neporuší. Tedy Meze 100(1-á)% asymptotického empirického intervalu spolehlivosti pro jsou: 7.2.3. Testování hypotézy o parametrické funkci Nechť je náhodný výběr z rozložení A() a je na něm nezávislý náhodný výběr rozložení A() a nechť jsou splněny podmínky n1 (1- ) > 9 a n2 (1-) > 9. Na asymptotické hladině významnosti á testujeme nulovou hypotézu H0: = c proti alternativě H1: ? c (resp. H1: < c resp. H1: > c). Testovým kritériem je statistika , která v případě platnosti nulové hypotézy má asymptoticky rozložení N(0,1). Kritický obor má tvar (resp. resp. ). Testování hypotézy o parametrické funkci lze samozřejmě provést i pomocí 100(1-á)% asymptotického intervalu spolehlivosti nebo pomocí p-hodnoty. Upozornění: Je-li c = 0, pak označme vážený průměr výběrových rozptylů. Jako testová statistika slouží , která v případě platnosti nulové hypotézy má asymptoticky rozložení N(0,1). Kritický obor má tvar (resp. resp. ). Testová statistika T0 vznikne standardizací statistiky M1 -- M2, kde neznámé parametry , nahradíme společným odhadem M*. Příklad: Management supermarketu chce se spolehlivostí 95% zjistit, zda týden slev má vliv na podíl větších nákupů (nad 500 Kč). Na základě náhodného výběru 200 zákazníků v týdnu bez slev bylo zjištěno 97 velkých nákupů, zatímco v týdnu se slevou z 300 náhodně vybraných zákazníků učinilo velký nákup 162 zákazníků. Řešení: Testujeme hypotézu = 0 proti levostranné alternativě H1: < 0 na asymptotické hladině významnosti 0,05. n1 = 200, n2 = 300, m1 = 97/200, m2 = 162/300, m* = (97 + 162)/500 = 0,518, u0,95 = 1,645. Ověření podmínek n1 (1-) > 9 a n2 (1-) > 9: Parametry a neznáme, nahradíme je odhady m1 a m2. 97.(1-97/200) = 49,955 > 9, 162.(1-162/300) = 74,52 > 9. Realizace testového kritéria: . Kritický obor je =. Protože testové kritérium nepatří do kritického oboru, nelze na asymptotické hladině významnosti 0,05 zamítnout hypotézu, že slevy nemají vliv na podíl velkých nákupů v daném supermarketu. Příklady k 7. kapitole Příklad 1: Bylo vylosováno 11 stejně starých selat téhož plemene. Šesti z nich byla předepsána výkrmná dieta č. 1 a zbylým pěti výkrmná dieta č. 2. Průměrné denní přírůstky v Dg za dobu půl roku jsou následující: dieta č. 1: 62, 54, 55, 60, 53, 58 dieta č. 2: 52, 56, 49, 50, 51. Zjištěné hodnoty považujeme za realizace dvou nezávislých náhodných výběrů pocházejících z rozložení N(ě1, ó12) a N(ě2, ó22). Sestrojte 95% empirický interval spolehlivosti pro podíl rozptylů a 95% empirický interval spolehlivosti pro rozdíl středních hodnot ě1 - ě2. (0,1872 Dg2 < < 12,9541 Dg2 s pravděpodobností aspoň 0,95. 0,99 Dg < ě1 - ě2 < 9,81 Dg s pravděpodobností aspoň 0,95.) Příklad 2.: Pro údaje z příkladu 1. testujte na hladině významnosti 0,05 hypotézu, že obě výkrmné diety mají stejný vliv na hmotnostní přírůstky selat. (1. způsob -- pomocí intervalu spolehlivosti. 95% empirický interval spolehlivosti pro ě1-ě2 je interval (0,99; 9,81). Neobsahuje nulu, proto H0 zamítáme na hladině významnosti 0,05. 2. způsob -- pomocí kritického oboru. Protože testové kritérium se realizuje hodnotou 2,771, která patří do kritického oboru , H0 zamítáme na hladině významnosti 0,05.) Příklad 3.: Při výstupní kontrole bylo náhodně vybráno 150 výrobků vyrobených na ranní směně a rovněž 150 výrobků vyrobených na odpolední směně. U ranní směny bylo zjištěno 16 zmetků a u odpolední 12 zmetků. Sestrojte 95% asymptotického interval spolehlivosti pro rozdíl podílu zmetků v obou směnách. (-0,039 < < 0,092 s pravděpodobností přibližně 0,95.) Příklad 4.: Pro údaje z příkladu 3. testujte na asymptotické hladině významnosti 0,05 hypotézu, že podíl zmetků v obou směnách je týž. (1. způsob -- pomocí intervalu spolehlivosti. 95% empirický asymptotický interval spolehlivosti pro je interval (-0,039; 0,092). Obsahuje nulu, proto H0 nezamítáme na asymptotické hladině významnosti 0,05. 2. způsob: pomocí kritického oboru. Protože testové kritérium se realizuje hodnotou 0,794, která nepatří do kritického oboru , H0 nezamítáme na asymptotické hladině významnosti 0,05.) Práce se systémem STATISTICA Téma: Parametrické úlohy o dvou nezávislých náhodných výběrech Do programu STATISTICA načtěte ASCII soubor studentky.dat, který obsahuje údaje o 48 náhodně vybraných studentkách VŠE v Praze. 1. sloupec -- výška, 2. sloupec -- známka z matematiky v 1. semestru, 3. sloupec -- obor studia (1 -- národní hospodářství, 2 -- informatika). Tyto tři proměnné nazvěte X,Y,Z a vytvořte jim návěští. Úkoly: 1. Sestrojte 95% interval spolehlivosti pro střední hodnotu výšky a) studentek oboru nh (167,3 < ě < 172,3) b) studentek oboru inf (164,8 < ě < 169,0). (Pro výběr případů splňujících danou podmínku použijte postup z úkolu č. 8 cvičení č. 1.) Návod: Meze 95% intervalu spolehlivosti pro střední hodnotu proměnné X zjistíme pomocí Descriptive Statistics, kde zaškrtneme Conf. limits for mean. 2. Sestrojte 95% interval spolehlivosti pro podíl rozptylů výšek studentek oboru nh a inf. (0,821 < ó12/ ó22 < 4,513) Návod: K datovému souboru přidáme další dvě proměnné DM a HM pro výpočet dolní a horní meze intervalu spolehlivosti. Do LongName těchto proměnných zapíšeme vzorce pro dolní a horní mez intervalu spolehlivosti pro podíl rozptylů (viz 7.1.2. (d)). Výběrové rozptyly pro 1. a 2. výběr zjistíme pomocí Descriptive Statistics. 3. Na hladině významnosti 0,05 testujte hypotézu, že rozptyly výšek studentek oboru nh a inf jsou shodné. Návod: lze využít výsledku 2. úkolu. 95% interval spolehlivosti pro podíl rozptylů obsahuje číslo 1, tedy hypotézu o shodě rozptylů nezamítáme na hladině významnosti 0,05. 4. Sestrojte 95% interval spolehlivosti pro rozdíl středních hodnot výšek studentek oboru nh a inf. (-0,452 < ě1 -- ě2 < 6,292) Návod: K datovému souboru přidáme další dvě proměnné DM a HM pro výpočet dolní a horní meze intervalu spolehlivosti. Do LongName těchto proměnných zapíšeme vzorce pro dolní a horní mez intervalu spolehlivosti pro rozdíl středních hodnot (viz 7.1.2. (b)). Výběrové průměry a výběrové rozptyly pro 1. a 2. výběr zjistíme pomocí Descriptive Statistics. 5. Na hladině významnosti 0,05 testujte hypotézu, že střední hodnoty výšek studentek oboru nh a inf jsou shodné. Návod: 1. způsob: lze využít výsledku 4. úkolu. 95% interval spolehlivosti pro rozdíl středních hodnot obsahuje číslo 0, tedy hypotézu o shodě středních hodnot nezamítáme na hladině významnosti 0,05. 2. způsob: úloha vede na dvouvýběrový t-test. Statistics -- Basic Statistics -- t-test, independent, by groups -- OK, Variables -- Dependent X, grouping Z -- OK -- Summary. Ve výstupní tabulce najdeme hodnotu testového kritéria a p- hodnotu. Protože p-hodnota = 0,087837 je větší než hladina významnosti 0,05, nulovou hypotézu nezamítáme na hladině významnosti 0,05. Před prováděním těchto úkolů pomocí diagnostických grafů orientačně ověřte normalitu dat. 6. Sestrojte 95% asymptotický interval spolehlivosti pro podíl studentek, které mají z matematiky trojku, a to a) pro studentky oboru nh (0,423 < < 0,791), b) pro studentky oboru inf (0,094 < < 0,506). Návod: K datovému souboru přidáme další dvě proměnné DM a HM pro výpočet dolní a horní meze intervalu spolehlivosti. Do LongName těchto proměnných zapíšeme vzorce pro dolní a horní mez intervalu spolehlivosti pro parametr alternativního rozložení (viz 6.3.2.). Výběrové průměry pro 1. a 2. výběr zjistíme pomocí Descriptive Statistics. 7. Sestrojte 95% asymptotický interval spolehlivosti pro rozdíl podílu studentek, které mají z matematiky trojku, a to pro studentky oboru nh a inf (0,038 < < 0,584). Návod: K datovému souboru přidáme další dvě proměnné DM a HM pro výpočet dolní a horní meze intervalu spolehlivosti. Do LongName těchto proměnných zapíšeme vzorce pro dolní a horní mez intervalu spolehlivosti pro parametrickou funkci (viz 7.2.2.). Výběrové průměry pro 1. a 2. výběr zjistíme pomocí Descriptive Statistics. 8. Na asymptotické hladině významnosti 0,05 testujte hypotézu, že podíl studentek, které mají z matematiky trojku, je stejný pro studentky oboru nh a inf. Návod: lze využít výsledku 7. úkolu. 95% asymptotický interval spolehlivosti pro rozdíl parametrů neobsahuje číslo 0, tedy hypotézu o shodě parametrů zamítáme na asymptotické hladině významnosti 0,05.