6. Parametrické úlohy o jednom náhodném výběru 6.1. Náhodný výběr z normálního rozložení Mnoho náhodných veličin, s nimiž se setkáváme ve výzkumu i praxi, se řídí normálním rozložením. Za jistých předpokladů obsažených v centrální limitní větě se dá rozložení jiných náhodných veličin aproximovat normálním rozložením. Proto je zapotřebí věnovat velkou pozornost právě náhodným výběrům z normálního rozložení. 6.1.1. Rozložení statistik odvozených z výběrového průměru a výběrového rozptylu Nechť X1, ..., Xn je náhodný výběr z rozložení N(ě, ó2). Pak platí a) Výběrový průměr M a výběrový rozptyl S2 jsou stochasticky nezávislé. b) M ~ N(ě, ), tedy U = ~ N(0, 1). (Pivotová statistika U slouží k řešení úloh o ě, když ó2 známe.) c) K = ~ ÷2(n-1). (Pivotová statistika K slouží k řešení úloh o ó2, když ě neznáme.) d) ~ ÷2(n). (Tato pivotová statistika slouží k řešení úloh o ó2, když ě známe.) e) T = ~ t(n-1). (Pivotová statistika T slouží k řešení úloh o ě, když ó2 neznáme.) Důkaz: ad a) Nebudeme provádět. ad b) M je lineární kombinace náhodných veličin s normálním rozložením, má tedy normální rozložení s parametry E(M) = ě, D(M) = ó2/n. U se získá standardizací M. ad c) Vhodnou úpravou S2, kde použijeme obrat Xi-M = (Xi-ě) -- (M-ě), lze statistiku K vyjádřit jako součet kvadrátů n-1 stochasticky nezávislých náhodných veličin se standardizovaným normálním rozložením. Tento součet se řídí rozložením ÷2(n-1). ad d) Tato statistika je součet kvadrátů n stochasticky nezávislých náhodných veličin se standardizovaným normálním rozložením, řídí se tedy rozložením ÷2(n). ad e) U ~ N(0, 1), K ~ ÷2(n-1) jsou stochasticky nezávislé, protože M a S2 jsou stochasticky nezávislé, tudíž statistika ~ t(n-1). Příklad: Hmotnost jedné porce kávy považujeme za náhodnou veličinu X ~ N(7g, 0,25g2). Jaká je pravděpodobnost, že k přípravě 28 porcí kávy postačí dva 100 g balíčky? Řešení: X1, ..., X28 je náhodný výběr z N(7; 0,25). Počítáme S pravděpodobností 93,45% můžeme předpokládat, že k přípravě 28 porcí kávy postačí dva 100 g balíčky. Příklad: Odběratel provede kontrolu stejnorodosti dodávky výrobků tak, že změří sledovaný rozměr u 25 náhodně vybraných výrobků. Dodávku přijme, jestliže výběrová směrodatná odchylka se bude realizovat hodnotou menší nebo rovnou 0,2 mm. Je známo, že sledovaný rozměr výrobku má rozložení N(50 mm; 0,2632mm2). Jaká je pravděpodobnost přijetí dodávky? Řešení: X1, ..., X25 je náhodný výběr z N(50; 0,2632). Počítáme P(S ? 0,2) = P(S2 ? 0,04) = , tedy číslo 13,879 je á- kvantil Pearsonova rozložení ÷2(24). V tabulkách kvantilů Pearsonova rozložení najdeme, že á =0,05. S pravděpodobností pouhých 5% lze očekávat, že odběratel přijme dodávku. 6.1.2. Intervaly spolehlivosti pro parametry ě, ó2 Uvedeme přehled vzorců pro meze 100(1-á)% empirických intervalů spolehlivosti pro parametry jednoho normálního rozložení a) Interval spolehlivosti pro ě, když ó2 známe Oboustranný: (d, h) = (m - u1-á/2, m + u1-á/2) Levostranný: (d, ?) = (m - u1-á, ?) Pravostranný: (-?, h) = (-?, m + u1-á) b) Interval spolehlivosti pro ě, když ó2 neznáme Oboustranný: (d, h) = (m - t1-á/2(n-1), m + t1-á/2(n-1)) Levostranný: (d, ?) = (m - t1-á(n-1), ?) Pravostranný: (-?, h) = (-?, m + t1-á(n-1)) c) Interval spolehlivosti pro ó2, když ě neznáme Oboustranný: (d, h) = Levostranný: (d, ?) = Pravostranný: (-?, h) = d) Interval spolehlivosti pro ó2, když ě známe Oboustranný: (d, h) = Levostranný: (d, ?) = Pravostranný: (-?, h) = Příklad: 10 krát nezávisle na sobě byla změřena jistá konstanta ě. Výsledky měření byly: 2 1,8 2,1 2,4 1,9 2,1 2 1,8 2,3 2,2. Tyto výsledky považujeme za číselné realizace náhodného výběru X1, ..., X10 z rozložení N(ě, ó2), kde parametry ě, ó2 neznáme. Najděte 95% empirický interval spolehlivosti pro ě, a to a) oboustranný, b) levostranný, c) pravostranný. Řešení: m = 2,06, s2 = 0,0404, s = 0,2011, á = 0,05, t0,975(9) = 2,2622, t0,95(9) = 1,8331. ad a) d = m - t1-á/2(n-1) = 2,06 - 2,2622 = 1,92 h = m + t1-á/2(n-1) = 2,06 + 2,2622 = 2,20 1,92 < ě < 2,20 s pravděpodobností aspoň 0,95. ad b) d = m - t1-á(n-1) = 2,06 - 1,8331 = 1,94 1,94 < ě s pravděpodobností aspoň 0,95. ad c) h = m + t1-á(n-1) = 2,06 + 1,8331 = 2,18 ě < 2,18 s pravděpodobností aspoň 0,95. 6.1.3. Testování hypotéz o parametrech ě, ó2 a) Nechť X1, ..., Xn je náhodný výběr N(ě, ó2), kde ó2 známe. Nechť n ? 2 a c je konstanta. Test H0: ě = c proti H1: ě c se nazývá z-test. b) Nechť X1, ..., Xn je náhodný výběr N(ě, ó2), kde ó2 neznáme. Nechť n ? 2 a c je konstanta. Test H0: ě = c proti H1: ě c se nazývá jednovýběrový t-test. c) Nechť X1, ..., Xn je náhodný výběr N(ě, ó2), kde ě neznáme. Nechť n ? 2 a c je konstanta. Test H0: ó2 = c proti H1: ó2 c se nazývá test o rozptylu. 6.1.4. Provedení testů o parametrech ě, ó2 pomocí kritického oboru a) Provedení z-testu H0: ě = c proti H1: ě c (resp. H1: ě < c resp. H1: ě > c) zamítáme na hladině významnosti á, jestliže (resp. resp. ). b) Provedení jednovýběrového t-testu H0: ě = c proti H1: ě c (resp. H1: ě < c resp. H1: ě > c) zamítáme na hladině významnosti á, jestliže (resp. resp. ). c) Provedení testu o rozptylu H0: ó2 = c proti H1: ó2 c (resp. H1: ó2 < c resp. H1: ó2 > c) zamítáme na hladině významnosti á, jestliže ÷2á/2(n-1) nebo ÷21-á/2(n-1) (resp. ÷2á(n-1) nebo ÷21-á(n-1)). Příklad: Podle údajů na obalu čokolády by její čistá hmotnost měla být 125g. Výrobce dostal několik stížností od kupujících, ve kterých tvrdili, že hmotnost čokolád je nižší než deklarovaných 125g. Z tohoto důvodu oddělení kontroly náhodně vybralo 50 čokolád a zjistilo, že jejich průměrná hmotnost je 122g a směrodatná odchylka 8,6g. Za předpokladu, že hmotnost čokolád se řídí normálním rozložením, můžeme na hladině významnosti 0,01 považovat stížnosti kupujících za oprávněné? Řešení: X1, ..., X50 je náhodný výběr z N(ě, ó2). Testujeme hypotézu H0: ě = 125 proti levostranné alternativě H1: ě < 125. Protože neznáme rozptyl ó2, použijeme jednovýběrový t-test. Testové kritérium . Absolutní hodnotu testového kritéria porovnáme s kvantilem t0,99(49) = 2,4049. Jelikož 2,4667 ? 2,4049, zamítáme nulovou hypotézu na hladině významnosti 0,01. Stížnosti kupujících tedy lze považovat za oprávněné. 6.2. Náhodný výběr z dvourozměrného normálního rozložení Nechť je náhodný výběr z rozložení N2, přičemž n?2. Označíme ě = ě1-ě2 a zavedeme rozdílový náhodný výběr Z1 = X1- Y1, ..., Zn = Xn-Yn. Vypočteme , . 6.2.1. Interval spolehlivosti pro parametr ě Viz 6.1.2.(b) 6.2.2. Párový t-test Testujeme H0: ě1-ě2 = 0 (tj. ě = 0) proti H1: ě1-ě2 ? 0 (tj ě ? 0). Viz 7.1.3.(b) Příklad: Na 10 automobilech stejného typu se testovaly dva druhy benzínu lišící se oktanovým číslem. U každého automobilu se při průměrné rychlosti 90 km/h měřil dojezd (tj. dráha, kterou ujede na dané množství benzínu) při použití každého z obou druhů benzínu. Výsledky: Číslo 1 2 3 4 5 6 7 8 9 10 auta benzín A 17, 20, 18, 17, 16, 18, 17, 17 18 18, 5 0 9 9 4 9 2 ,5 ,5 2 benzín B 17, 20, 19, 18, 16, 19, 17, 17 19 18, 8 8 5 3 6 5 5 ,9 ,1 6 Za předpokladu, že dojezd se řídí normálním rozložením, testujte na hladině významnosti 0,05 hypotézu, že rozdíl středních hodnot dojezdu při dvou druzích benzínu se neliší. Řešení: Přejdeme k rozdílovému náhodnému výběru. Označíme ě = ě1 - ě2. Testujeme hypotézu H0: ě = 0 proti H1: ě ? 0 na hladině významnosti 0,05. Vypočteme m = -0,46, s = 0,1838 a testové kritérium t0 = -7,9148. Absolutní hodnotu testového kritéria porovnáme s kvantilem t0,975(9) = 2,2622. Protože 7,9148 ? 2,2622, zamítáme nulovou hypotézu na hladině významnosti 0,05. 6.3. Náhodný výběr z alternativního rozložení 6.3.1. Rozložení statistiky odvozené z výběrového průměru Nechť X1, ..., Xn je náhodný výběr z rozložení A() a nechť je splněna podmínka n (1- ) > 9. Pak statistika konverguje v distribuci k náhodné veličině se standardizovaným normálním rozložením. (Říkáme, že U má asymptoticky rozložení N(0,1) a píšeme U ? N(0,1).) Důkaz: Protože X1, ..., Xn je náhodný výběr z rozložení A(), bude mít statistika Yn = rozložení Bi(n, ). Podle Moivre- Laplaceovy věty má standardizovaná náhodná veličina asymptoticky rozložení N(0,1). Výběrový průměr M = má střední hodnotu a rozptyl (1-)/n. Jelikož M je lineární kombinací statistiky Yn, bude standardizovaná veličina ? N(0,1). 6.3.2. Asymptotický interval spolehlivosti pro parametr Pokud rozptyl D(M) = (1- )/n nahradíme odhadem M(1-M)/n, konvergence náhodné veličiny U k veličině s rozložením N(0,1) se neporuší. Tedy Meze 100(1-á)% asymptotického empirického intervalu spolehlivosti pro parametr jsou: . Příklad: Náhodně bylo vybráno 100 osob a zjištěno, že 34 z nich používá zubní kartáček zahraniční výroby. Najděte 95% asymptotický interval spolehlivosti pro podíl osob používajících zahraniční zubní kartáčky. Řešení: Zavedeme náhodné veličiny X1, ..., X100, přičemž Xi = 1, když i-tá osoba používá zahraniční zubní kartáček a Xi = 0 jinak, i = 1, ..., 100. Tyto náhodné veličiny tvoří náhodný výběr z rozložení A(). n = 100, m = 34/100, á = 0,05, u1-á/2 = u0,975 = 1,96. Ověření podmínky n (1- ) > 9: parametr neznáme, musíme ho nahradit výběrovým průměrem. Pak 100.0,34.0,66 = 22,44 > 9. . S pravděpodobností přibližně 0,95 tedy 0,2472 < < 0,4328. 6.3.3. Testování hypotézy o parametru Nechť X1, ..., Xn je náhodný výběr z rozložení A() a nechť je splněna podmínka n (1- ) > 9. Na asymptotické hladině významnosti á testujeme hypotézu H0: = c proti alternativě H1: ? c (resp. H1: < c resp. H1: > c). Testovým kritériem je statistika , která v případě platnosti nulové hypotézy má asymptoticky rozložení N(0,1). Kritický obor má tvar (resp. resp. ). Testování hypotézy o parametru lze samozřejmě provést i pomocí 100(1-á)% asymptotického intervalu spolehlivosti nebo pomocí p-hodnoty. Příklad: Podíl zmetků při výrobě určité součástky činí = 0,01. Bylo náhodně vybráno 1000 výrobků a zjistilo se, že mezi nimi je 16 zmetků. Na asymptotické hladině významnosti 0,05 testujte hypotézu H0: = 0,01 proti oboustranné alternativě H1: ? 0,01. Řešení: Ověření podmínky n (1- ) > 9: 1000.0,01.0,99 = 9,9 > 9. Realizace testového kritéria: . Kritický obor: =. Protože 1,907 W, H0 nezamítáme na asymptotické hladině významnosti 0,05. Příklady k 6. kapitole Příklad 1.: Lze předpokládat, že hmotnost pomerančů dodávaných do obchodní sítě se řídí normálním rozložením se střední hodnotou 170 g a směrodatnou odchylkou 12 g. Jaká je pravděpodobnost, že celková hmotnost 9 náhodně vybraných pomerančů balených do síťky překročí 1,5 kg? (Hledaná pravděpodobnost je 0,797.) Příklad 2.: Počet bodů v testu inteligence je náhodná veličina, která se řídí rozložením N(100,225). Jaká je pravděpodobnost, že průměr v náhodně vybrané skupině 20 osob bude větší než 105 bodů? (Hledaná pravděpodobnost je 0,06811.) Příklad 3.: V prodejně mají zjištěno, že 25% nákupů přesahuje 300 Kč. Při nákupu nad 300 Kč obdrží zákazník slosovatelný kupón. Jaká je pravděpodobnost, že mezi 100 zákazníků bude rozdáno 20 až 25 kupónů? Výpočet proveďte jak přesně, tak pomocí aproximace normálním rozložením. (Přesný výpočet: 0,4539, aproximativní výpočet: 0,4171.) Příklad 4.: Při provádění určitého pokusu bylo zapotřebí udržovat v laboratoři konstantní teplotu 26,5°C. Teplota byla v jednom pracovním týdnu 46x namátkově kontrolována v různých denních a nočních hodinách. Z výsledků měření byly vypočteny realizace výběrového průměru a výběrové směrodatné odchylky: m = 26,33°C, s = 0,748°C. Za předpokladu, že výsledky měření teploty se řídí rozložením N(ě,ó2), vypočtěte 95% empirický interval spolehlivosti pro střední hodnotu ě i pro směrodatnou odchylku ó. (26,11°C < ě < 26,55°C s pravděpodobností aspoň 0,95, 0,62°C < ó < 0,94°C s pravděpodobností aspoň 0,95.) Příklad 5.: U elektrického spotřebiče jisté značky byl sledován počet reklamací během záruční doby. Z 500 prodaných spotřebičů jich bylo reklamováno 25. Najděte 95% asymptotický interval spolehlivosti pro podíl reklamovaných spotřebičů. (0,0309 < < 0,0691 s pravděpodobností přibližně 0,95.) Příklad 6.: U 25 náhodně vybraných dvoulitrových lahví s nealkoholickým nápojem byl zjištěn přesný objem nápoje. Výběrový průměr činil m = 1,99 l a výběrová směrodatná odchylka s = 0,1 l. Předpokládejme, že objem nápoje v láhvi je náhodná veličina s normálním rozložením. a) Na hladině významnosti 0,05 ověřte tvrzení výrobce, že zákazník není znevýhodněn. b) Na hladině významnosti 0,05 ověřte tvrzení výrobce, že směrodatná odchylka je 0,08 l. (ad a) Jelikož hodnota testového kritéria -0,5 neleží v kritickém oboru , nezamítáme nulovou hypotézu na hladině významnosti 0,05. ad b) Jelikož hodnota testového kritéria 37,5 neleží v kritickém oboru , nejsme oprávněni na hladině významnosti 0,05 zamítnout tvrzení výrobce.) Příklad 7.: Bylo vybráno šest nových vozů téže značky a po určité době bylo zjištěno, o kolik mm se sjely jejich levé a pravé přední pneumatiky. Výsledky: (1,8; 1,5), (1,0; 1,1), (2,2; 2,0), (0,9; 1,1), (1,5; 1,4), (1,6; 1,4). Za předpokladu, že uvedené dvojice tvoří náhodný výběr z dvourozměrného normálního rozložení s vektorem středních hodnot (ě1, ě2), testujte na hladině významnosti 0,05 hypotézu, že obě pneumatiky se sjíždějí stejně rychle. (Jelikož 1,0512 < 2,571, nelze na hladině významnosti 0,05 zamítnout nulovou hypotézu.) Příklad 8.: Při zavádění kabelové televize na jednom velkém sídlišti se předpokládá zájem 40% domácností. Ze 70 náhodně vybraných domácností projevilo o kabelovou televizi zájem 25 domácností. Na 5% hladině významnosti ověřte hypotézu, že odchylka zjištěného zájmu od předpokládaného je způsobena jenom náhodnými vlivy. (Testové kritérium -0,734 nepatří do kritického oboru , H0 nezamítáme na asymptotické hladině významnosti 0,05.) Práce se systémem STATISTICA Téma: Parametrické úlohy o jednom náhodném výběru Příklad 1.: Vlastnosti výběrového průměru z normálního rozložení Předpokládejme, že velký ročník na vysoké škole má výsledky ze statistiky normálně rozloženy kolem střední hodnoty 72 bodů se směrodatnou odchylkou 9 bodů. Najděte pravděpodobnost, že průměr výsledků náhodného výběru 10 studentů bude větší než 80 bodů. Návod: X1, ..., X10 je náhodný výběr z N(72, 81). Počítáme P(M > 80), přičemž výběrový průměr M má normální rozložení se střední hodnotou 72 a rozptylem 81/10. Tedy P(M > 80) = 1 - P(M ? 80) = 1 -- Ö(80), kde Ö(80) je hodnota distribuční funkce rozložení N(72; 8,1) v bodě 80. Vytvoříme datový soubor o jedné proměnné a o jednom případu. Do Long Name této proměnné napíšeme =1 -- INormal(80;72;sqrt(8,1)). Zjistíme, že 1 - Ö(80) = 0,00248. Funkce INormal(x;ě;ó) počítá hodnotu distribuční funkce rozložení N(ě,ó2) v bodě x. Příklad 2.: Vlastnosti výběrového průměru z alternativního rozložení Mezi americkými voliči 60% osob volí republikány a 40% demokraty. Jaká je pravděpodobnost, že v náhodném výběru 100 amerických voličů budou voliči republikánů v menšině? Výpočet proveďte jak přesně, tak pomocí aproximace normálním rozložením. Návod: X1, ..., X100 je náhodný výběr z A(0,6), Xi = 1, když i- tá osoba volí republikány, Xi = 0 jinak, i = 1, ..., 100. Zavedeme statistiku Y100 = X1 + ... + X100, Y100 ~ Bi(100; 0,6), E(Y100) = 60, D(Y100) = 24. Označme Ö100(y) distribuční funkci náhodné veličiny Y100, . Přesný výpočet: P(Y100 < 50) = P(Y100 ? 49) = Ö100(49) = 0,0168. Vytvoříme datový soubor o jedné proměnné a o jednom případu. Do Long Name této proměnné napíšeme =IBinom(49;0,6;100). Funkce IBinom(x;p;n) počítá hodnotu distribuční funkce rozložení Bi(n,p) v bodě x. Přibližný výpočet: nejdříve ověříme splnění podmínky dobré aproximace. n (1- ) = = 100.0,6.0,4 = 24 > 9. Podmínka je splněna. P(Y100 < 50) = P(Y100?49) = Ö(49), kde Ö(49) je hodnota distribuční funkce rozložení N(60; 24) v bodě 80. Vytvoříme datový soubor o jedné proměnné a o jednom případu. Do Long Name této proměnné napíšeme =INormal(49;60;sqrt(24)). Zjistíme, že Ö(49) = 0,0124. Příklad 3.: Intervaly spolehlivosti pro parametry ě,ó2 normálního rozložení Z populace stejně starých selat téhož plemene bylo vylosováno 6 selat a po dobu půl roku jim byla podávána táž výkrmná dieta. Byly zaznamenávány průměrné denní přírůstky hmotnosti v Dg. Z dřívějších pokusů je známo , že v populaci mívají takové přírůstky normální rozložení, avšak střední hodnota i rozptyl se měnívají. Přírůstky v Dg: 62, 54, 55, 60, 53, 58. Při riziku á = 0,05 odvoďte: a) levostranný interval spolehlivosti pro neznámou střední hodnotu ě při neznámé směrodatné odchylce ó. b) interval spolehlivosti pro směrodatnou odchylku ó. Návod: Vytvoříme datový soubor o 5 proměnných a 6 případech. První proměnnou nazveme hmotnost, druhou dm1, třetí dm2 a čtvrtou hm2. Do proměnné hmotnost zapíšeme zjištěné údaje. Pomocí Descriptive Statistics zjistíme výběrový průměr a výběrovou směrodatnou odchylku. Do LongName proměnné dm1 zapíšeme výraz = m -- s* VStudent(0,95;5)/?6, kde za m a s dosadíme vypočtené hodnoty. Funkce VStudent(x;df) počítá x- kvantil rozložení t(df). Dostaneme výsledek 54,06, tedy ě > 54,06 Dg s pravděpodobností aspoň 0,95. Do Long Name proměnné dm2 zapíšeme výraz =s*sqrt(5)/sqrt(VChi2(0,975;5)), kde za s dosadíme vypočtenou směrodatnou odchylku. Podobně do LongName proměnné hm2 zapíšeme výraz =s*sqrt(5)/sqrt(VChi2(0,025;5)), kde za s dosadíme vypočtenou směrodatnou odchylku. Funkce VChi2(x;nu) počítá x-kvantil rozložení ÷2(nu). Výsledek: 2,23 g < ó < 8,77 g s pravděpodobností aspoň 0,95. Příklad 4.: Interval spolehlivosti pro rozdíl parametrů ě1-ě2 dvourozměrného normálního rozložení Bylo vylosováno 6 vrhů selat a z nich vždy dva sourozenci. Jeden z nich vždy dostal náhodně dietu č. 1 a druhý dietu č. 2. Přírůstky v Dg jsou následující: (62,52), (54,56), (55,49), (60,50), (53,51), (58,50). Za předpokladu, že uvedené dvojice tvoří náhodný výběr z dvourozměrného normálního rozložení s vektorem středních hodnot (ě1, ě2), sestrojte 95% interval spolehlivosti pro rozdíl středních hodnot. Návod: Vytvoříme datový soubor o třech proměnných a 6 případech. Do proměnných v1 a v21 zapíšeme naměřené přírůstky, do proměnné v3 uložíme rozdíly v1-v2.Pomocí Descriptive Statistics zjistíme meze 95% intervalu spolehlivosti pro střední hodnotu proměnné v3 tak, že zaškrtneme Conf. limits for mean. Dostaneme výsledek: 0,63 Dg < ě < 10,71 Dg s pravděpodobností aspoň 0,95. Příklad 5.: Asymptotický interval spolehlivosti pro parametr alternativního rozložení Může politická strana, pro niž se v předvolebním průzkumu vyslovilo 60 z 1000 dotázaných osob, očekávat se spolehlivostí 0,95, že by v této době ve volbách překročila 5% hranici pro vstup do parlamentu? Návod: Zavedeme náhodné veličiny X1, ..., X1000, přičemž Xi = 1, když i-tá osoba se vysloví pro danou politickou stranu a Xi = 0 jinak, i = 1, ..., 1000. Tyto náhodné veličiny tvoří náhodný výběr z rozložení A(). V tomto případě n = 1000, m = 60/1000 = 0,06, á = 0,05, u1-á = u0,95 = 1,645. Ověření podmínky n (1- ) > 9: parametr neznáme, musíme ho nahradit výběrovým průměrem. Pak 1000.0,06.0,94 = 56,4 > 9. Zajímá nás 95% levostranný interval spolehlivosti pro . Použijeme vzorec . S pravděpodobností přibližně 0,95 tedy > 0,048. Protože tento interval zahrnuje i hodnoty nižší než 0,05, nelze vyloučit, že strana získá méně než 5% hlasů. Vytvoříme datový soubor o jedné proměnné a o jednom případu. Do Long Name této proměnné napíšeme =0,06- sqrt(0,06*0,94/1000)*VNormal(0,95;0;1). Příklad 6.: Testování hypotézy o parametru ě normálního rozložení Systematická chyba měřicího přístroje se eliminuje nastavením přístroje a měřením etalonu, jehož správná hodnota je ě = 10,00. Nezávislými měřeními za stejných podmínek byly získány hodnoty: 10,24 10,12 9,91 10,19 9,78 10,14 9,86 10,17 10,05, které považujeme za realizace náhodného výběru rozsahu 9 z rozložení N(ě, ó2). Je možné při riziku 0,05 vysvětlit odchylky od hodnoty 10,00 působením náhodných vlivů? Návod: Jde o úlohu na jednovýběrový t-test. Vytvoříme datový soubor o jedné proměnné a 9 případech, kam zapíšeme naměřené hodnoty. V Descriptive Statistics vybereme t-test, single sample. Do Reference values zapíšeme 10. Ve výstupu se podíváme na hodnotu testového kritéria a na p-hodnotu. Pokud p-hodnota bude menší nebo rovna 0,05, zamítneme hypotézu H0: ě = 0 ve prospěch alternativní hypotézy H1: ě ? 0 na hladině významnosti 0,05. V opačném případě H0 nezamítáme. V našem případě nulovou hypotézu nezamítáme na hladině významnosti 0,05. Pvý pýznamnosti 0,05 se tedykritického oboru říklad 7.: Testování hypotézy o rozdíl parametrů ě1-ě2 dvourozměrného normálního rozložení Pro data z příkladu 4. testujte na hladině významnosti 0,05 hypotézu, že obě výkrmné diety mají stejný vliv. Návod: Jde o úlohu na párový t-test. Vytvoříme datový soubor o dvou proměnných a šesti případech. V Descriptive Statistics vybereme t-test, dependent samples. Zadáme názvy obou proměnných a ve výstupu se podíváme na hodnotu testového kritéria a na p-hodnotu. Pokud p-hodnota bude menší nebo rovna 0,05, zamítneme hypotézu H0: ě = 0 ve prospěch alternativní hypotézy H1: ě ? 0 na hladině významnosti 0,05. V opačném případě H0 nezamítáme. V našem případě nulovou hypotézu zamítáme na hladině významnosti 0,05. Příklad 8: Testování hypotézy o parametru alternativního rozložení Určitá cestovní kancelář organizuje zahraniční zájezdy podle individuálních přání zákazníků. Z několika minulých let ví, že 30% všech takto organizovaných zájezdů má za cíl zemi X. Po zhoršení politických podmínek v této zemi se cestovní kancelář obává, že se zájem o tuto zemi mezi zákazníky sníží. Ze 150 náhodně vybraných zákazníků v tomto roce má 38 za cíl právě zemi X. Potvrzují nejnovější data pokles zájmu o tuto zemi? Volte hladinu významnosti 0,05. Návod: Máme náhodný výběr X1, ..., X150 z rozložení A(0,3). Testujeme H0: = 0,3 proti levostranné alternativě H1: < 0,3. V tomto případě je testovým kritériem statistika , která v případě platnosti nulové hypotézy má asymptoticky rozložení N(0,1). Musíme ověřit splnění podmínky n (1- ) > 9: 150.0,3.0,7 = 31,5 > 9 Vypočteme realizaci testového kritéria: . Kritický obor: = . Protože testové kritérium nepatří do kritického oboru, H0 nezamítáme na asymptotické hladině významnosti 0,05. Vytvoříme datový soubor o dvou proměnných a jednom případu. Vypočteme realizaci testového kritéria tak, že do LongName první proměnné zapíšeme odpovídající vzorec. Do LongName druhé proměnné napíšeme =VNormal(0,95;0;1), čímž získáme kvantil u0,95 a testové kritérium porovnáme s opačnou hodnotou tohoto kvantilu.