Příklad 7.4. Jednovýběrový párový test Načtěte datový soubor 03-paired-means-clavicle.txt a odstraňte z načtených dat NA hodnoty. Na hladině významnosti a = 0.05 testujte, zda je u mužů délka klíční kosti na levé straně statisticky významně větší než na straně pravé. Řešení příkladu 7.4 Nejprve stanovíme nulovou a alternativní hypotézu. • //• : ...................................... -> ....................................... • //. : ...................................... -> ............. • Hladina významnosti a = ................ • ..............................test o ....................... ................... (.................................................. alternativa). když .............................. známe / neznáme. Nutným předpokladem umožňujícím použití parametrického párového testu na otestování H0 je normalita rozdílů mezi naměřenými hodnotami na levé a pravé straně. Test normality rozdílů na levé a pravé straně • H0 : Rozdíly mezi levou a pravou stranou ...................................... z normálního rozdělení. • H\ : Rozdíly mezi levou a pravou stranou ...................................... z normálního rozdělení. Hladina významnosti a =................ Nyní zjistíme rozsah náhodného výběru. [1] 50 Protože náhodný výběr rozdílu naměřených délek klíčních kostí na levé a pravé straně u mužů má rozsah............., což je..................................než 30, použijeme na testování hypotézy o normalitě dat.......................................test. [1] 0.1776153 P-hodnota vyšla ............................................ Protože p-hodnota .................. a, Hq ... na hladině významnosti a = 0.05. Grafická vizualizace normality rozdílů délek pravých a levých klíčních kostí 0.10 - to o 0.08 - 0 O 0.06 - 'E > 0.04 - JO CD 0.02 - 0.00 - -1 0 1 teoretický kvantil rozdil délek leve a pravé klicni kosti - muzi Interpretace výsledku testu normality: Data.............................................z normálního rozdělení. 1 Párový test o střední hodnotě V úvodu příkladu jsme si uvedli, že test o statisticky významném rozdílu mezi středními hodnotami dvou párových znaků můžeme převést na test o statisticky významném rozdílu mezi rozdílem hodnot obou párových znaků a nuly. Nulovou hypotézu Hq : < 0 oproti alternativní hypotéze H\ : > 0 testujeme nyní pomocí jednovýběrového testu o...................................když ...................................neznáme. a) Testování pomocí kritického oboru [1] 3.41212 [1] 1.676551 Hodnota testovací statistiky ío je...........................................Kritický obor má tvar . Protože.............................., Hq.................................. na hladině významnosti a =.. b) Test pomocí intervalu spolehlivosti Proti .................................... alternativě postavíme IS. [1] 0.9460859 Interval spolehlivosti má tvar...........................................Protože.............................., H0. na hladině významnosti a =.............................. c) Test pomocí p-hodnoty [1] 0.0006503568 p-hodnota vyšla. Protože p-hodnota....................., Hq na hladině významnosti Interpretace výsledků: Délka levé klíční kosti u mužů je / není statisticky významně vyšší než délka pravé lícní kosti. Příklad 7.5. Vizualizace statisticky významného rozdílu dvou náhodných výběrů V rámci příkladu 7.4 jsme zjistili, že délka levé klíční kosti u mužů je statisticky významně vyšší než délka pravé klíční kosti u mužů. Získaný výsledek podpořte vykreslením krabicového diagramu. Řešení příkladu 7.5 180 - -g- 170 -E r 160 w o ~ 150 o a 140 H CD 130 -120 - median • prumer —I-1- leva pravá strana 10 - to 5 -5 - -10 2 Příklad 7.6. Jednovýběrový test o parametru 9 alternativního rozdělení Určitá cestovní kancelář organizuje zahraniční zájezdy podle individuálních přání zákazníků. Z několika minulých let ví, že 30 % všech takto organizovaných zájezdů má za cíl zemi X. Po zhoršení politických podmínek v této zemi se cestovní kancelář obává, že se zájem o tuto zemi mezi zákazníky sníží. Ze 150 náhodně vybraných zákazníků v tomto roce má 38 za cíl právě zemi X. Potvrzují nejnovější data pokles zájmu o tuto zemi? Volte hladinu významnosti a = 0.05. Máme náhodný výběr X\,..., X150 z rozdělení......................................... • //• : .............................................................................. • //. : .............................................................................. Na testování hypotézy Hq použijeme jednovýběrový test o pravděpodobnosti také nazývaný jako test o parametru 9 alternativního rozdělení, který je asymptotickým testem. Před samotným testování je tedy nutné ověřit podmínku dobré aproximace n9(l — 9) > 9. Protože n9(l — 9) = .....................což je ....................... než 9, podmínka dobré aproximace je / není splněna. a) Testování pomocí kritického oboru [1] -1.247219 [1] -1.644854 Testovací statistika ío nabývá hodnoty............................, kritický obor má tvar.......... Protože ío............W, Hq ............................na asymptotické hladině významnosti a b) Testování pomocí intervalu spolehlivosti [1] 0.3117439 Interval spolehlivosti má tvar .................................................................................... Protože............................, Hq............................na asymptotické hladině významnosti a ■■ c) Testování pomocí p-hodnoty [1] 0.1061586 10 Protože p-hodnota = ............................, Hq ............................ na asymptotické hladině významnosti a 1.0 -1 0.9 -0.8 0.7 -0.6 -0.5 0.4 0.3 -0.2 -0.1 0.0 112; 74.67% 38; 25.33% jina zeme zeme X preferovaná zeme Interpretace výsledků testování: Nejnovější data potvrzují / nepotvrzují pokles zájmu zákazníků o zemi X. 3 8 Dvouvýběrové parametrické testy Příklad 8.1. Dvouvýběrový tets o rozdílu středních hodnot Načtěte datový soubor 01-one-sample-mean-skull-mf.txt a odstraňte z načtených dat NA hodnoty. Na hladině významnosti a = 0.05 otestujte nulovou hypotézu o shodě střední hodnoty největší šířky mozkovny mužů se střední hodnotou největší šířky mozkovny u žen starověké egyptské populace. Řešení příkladu 8.1 V rámci tohoto příkladu pracujeme se...........................náhodnými výběry. První výběr obsahuje naměřené údaje o největší šířce mozkovny u starověké egyptské..............................populace, druhý výběr obsahuje naměřené údaje o největší šířce mozkovny u starověké egyptské..............................populace. Nejprve stanovíme nulovou a alternativní hypotézu. • //• : ....................................... • Hi : ...................................... (.................................................. alternativa). • Hladina významnosti a = ................ • Test o .............................. když .............................. známe / neznáme. Nutnými předpoklady umožňujícími použití parametrického testu na otestování nulové hypotézy je 1....................................... naměřených hodnot (zvlášť v každém výběru); 2. shoda................................obou náhodných výběrů. Test normality naměřených hodnot pro muže Protože máme dva výběry, musíme provést test normality dat pro každý výběr zvlášť. • Hq : Naměřené hodnoty největší šířky mozkovny pro muže...................................... z normálního rozdělení. • Hi : Naměřené hodnoty největší šířky mozkovny pro muže...................................... z normálního rozdělení. Hladina významnosti a =................ Nyní zjistíme rozsah náhodného výběru pro muže. [i] 216 11 12 Protože náhodný výběr rozdílu naměřených šířek mozkovny u mužů má rozsah............., což je . než 30, použijeme na testování hypotézy o normalitě dat .......................................test. [1] 0.07662229 P-hodnota vyšla ............................................ Protože p-hodnota .................. a, Hq ........................................... na hladině významnosti a = 0.05. Test normality naměřených hodnot pro ženy • Hq : Naměřené hodnoty největší šířky mozkovny pro ženy ......................................z normálního rozdělení. • Hi : Naměřené hodnoty největší šířky mozkovny pro ženy ......................................z normálního rozdělení. Hladina významnosti a =................ Nyní zjistíme rozsahy náhodného výběru pro ženy. [i] 109 13 14 Protože náhodný výběr rozdílu naměřených šířek mozkovny u žen má rozsah............., což je než 30, použijeme na testování hypotézy o normalitě dat .......................................test. [1] 0.06380994 P-hodnota vyšla ............................................ Protože p-hodnota .................. a, Hq ......... na hladině významnosti a = 0.05. Interpretace výsledků: Naměřené hodnoty největší šířky mozkovny pro muže i pro ženy normálního rozdělení. 4 124.5 133.5 142.5 nejvetsi sirka mozkovny muzu (v mm) -3-2-10 1 2 3 teoreticky kvantil Lillieforsuv test: p-hodnota =0.0766 145 - 1 140 -Á 135 ť 130 - f, 125 -\ > 120 i—i—i—i—i—i—i—r 118 126 134 142 nejvetsi sirka mozkovny zen (v mm) -2-10 1 2 teoreticky kvantil Lillieforsuv test: p-hodnota =0.0638 Test o podílu rozptylů První předpoklad o normalitě obou výběrů je / není splněn. Nyní ještě musíme ověřit předpoklad o shodě rozptylů obou náhodných výběrů. Nejprve stanovíme nulovou a alternativní hypotézu. • //• : ................................ • //. : ................................ • Hladina významnosti a = .......... • Test o ......................................... a) Testování pomocí kritického oboru alternativa). [1] 1.055543 15 16 17 [1] 0.7266694 [1] 1.401231 Hodnota testovací statistiky íg je...........................................Kritický obor má tvar . Protože.............................., Hq.................................. na hladině významnosti a =.. b) Test pomocí intervalu spolehlivosti Proti .................................... alternativě postavíme IS. [1] 0.7532968 18 19 [1] 1.452576 Interval spolehlivosti má tvar...........................................Protože.............................., Hq. na hladině významnosti a =.............................. c) Test pomocí p-hodnoty [1] 0.761025 20 5 P-hodnota vyšla ......................... Protože p-hodnota znamnosti a =.............................. Hq .................................. na hladině vý- Interpretace výsledků: Mezi rozptylem největší šířky mozkovny u mužů a rozptylem největší šířky mozkovny u žen starověké egyptské populace existuje / neexistuje statisticky významný rozdíl. Test o rozdílu středních hodnot Protože (1) předpoklad normality obou náhodných výběrů i (2) předpoklad shody rozptylů obou náhodných výběrů jsou / nejsou splněny, můžeme provést parametrický test o .............................. středních hodnot když rozptyly a\ a a^ .............................., ale víme, že jsou shodné. a) Testování pomocí kritického oboru [1] 5.407945 21 22 23 [1] -1.967336 [1] 1.967336 Hodnota testovací statistiky t0 je...........................................Kritický obor má tvar . Protože.............................., Hq.................................. na hladině významnosti a =.. b) Test pomocí intervalu spolehlivosti Proti .................................... alternativě postavíme IS. [1] 1.93307 24 25 [1] 4.143723 Interval spolehlivosti má tvar...........................................Protože.............................., Hq. na hladině významnosti a =.............................. c) Test pomocí p-hodnoty [1] 1.242523e-07 26 P-hodnota vyšla ......................... Protože p-hodnota znamnosti a =.............................. Hq .................................. na hladině vý- Vizualizace statisticky významného rozdílu dvou náhodných výběrů 155 -~ |^ 150 f, 145 C I 140 H o nj 135 ä 130 CD w 125 H c 120 zeny pohlaví Interpretace výsledků: Mezi největší šířkou mozkovny u mužů starověké egyptské populace a u žen starověké egyptské populace existuje / neexistuje statisticky významný rozdíl. 6 Příklad 8.2. Test o rozdílu středních hodnot Mějme datový soubor 19-more-samples-correlations-skull.txt a proměnnou nose.B popisující šířku nosu v mm. Předpokládejme, že náhodná veličina X, popisující šířku nosu bantuské populace, pochází z normálního rozdělení N(fii,a'f), a že náhodná veličina Y, popisující šířku nosu čínské populace, pochází z normálního rozdělení JV(/Lt2, 02). hladině významnosti a = 0.05 testujte nulovou hypotézu o tom, že šířka nosu mužů čínské populace je menší nebo rovna šířce nosu mužů bantuské populace. Řešení příkladu 8.2 V rámci tohoto příkladu pracujeme se...........................náhodnými výběry. První výběr obsahuje naměřené údaje o šířce nosu mužů..............................populace, druhý výběr obsahuje naměřené údaje o šířce nosu mužů.............................. populace. Nejprve stanovíme nulovou a alternativní hypotézu. • //• : ....................................... • Hi : ...................................... (.................................................. alternativa). • Hladina významnosti a = ................ • Test o .............................. když .............................. známe / neznáme. Nutnými předpoklady umožňujícími použití parametrického testu na otestování nulové hypotézy je 1....................................... naměřených hodnot (zvlášť v každém výběru); 2. shoda................................obou náhodných výběrů. Test normality naměřených hodnot pro muže čínské populace Protože máme dva výběry, musíme provést test normality dat pro každý výběr zvlášť. • Hq : Naměřené hodnoty šířky nosu mužů čínské populace...................................... z normálního rozdělení. • Hi : Naměřené hodnoty šířky nosu mužů čínské populace...................................... z normálního rozdělení. Hladina významnosti a =................ Nyní zjistíme rozsah náhodného výběru pro muže čínské populace. [1] 19 27 Protože náhodný výběr rozdílu naměřených šířek nosu mužů čínské populace má rozsah............., což je . než 30, použijeme na testování hypotézy o normalitě dat .......................................test. [1] 0.1173442 28 P-hodnota vyšla ............................................ Protože p-hodnota .................. a, Hq ............................................. na hladině významnosti a = 0.05. Test normality naměřených hodnot pro muže bantuské populace • Hq : Naměřené hodnoty šířky nosu u mužů bantuské populace......................................z normálního rozdělení. • Hi : Naměřené hodnoty šířky nosu u mužů bantuské populace......................................z normálního rozdělení. Hladina významnosti a =................ Nyní zjistíme rozsahy náhodného výběru pro muže bantuské populace. [1] 14 29 Protože náhodný výběr rozdílu naměřených šířek nosu mužů bantuské populace má rozsah............., což je . než 30, použijeme na testování hypotézy o normalitě dat .......................................test. [1] 0.1511379 30 P-hodnota vyšla ............................................ Protože p-hodnota .................. a, Hq ............................................. na hladině významnosti a = 0.05. Interpretace výsledků: Naměřené hodnoty šířky nosu mužů čínské i bantuské populace ................................ z normálního rozdělení. 7 23.5 24.5 25.5 26.5 27.5 sirka nosu cinske populace (v mm) -2-10 1 2 teoreticky kvantil Shapiro-Wilkuv test: p-hodnota =0.1173 -C sirka nosu bantuske populace (v mm) -i o i teoreticky kvantil Shapiro-Wilkuv test: p-hodnota =0.1511 Test o podílu rozptylů První předpoklad o normalitě obou výběrů je / není splněn. Nyní ještě musíme ověřit předpoklad o shodě rozptylů obou náhodných výběrů. Nejprve stanovíme nulovou a alternativní hypotézu. • H0 : ................................ • //• : ................................ • Hladina významnosti a = .......... • Test o ......................................... a) Testování pomocí funkce var.testQ alternativa). F test to compare two variances data: nose.Be and nose.Bb F = 0.27537, num df = 18, denom df = 13, p-value = 0.01258 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.09230537 0.75180759 sample estimates: ratio of variances 0.2753689 31 32 33 34 35 36 37 38 39 40 41 42 43 [1] 0.3662758 [1] 2.983239 Hodnota testovací statistiky t0 je...........................................Kritický obor má tvar Protože.............................., Hq.................................. na hladině významnosti a =.. Interval spolehlivosti má tvar...........................................Protože.............................., Hq.................................. na hladině významnosti a =.............................. P-hodnota vyšla ......................... Protože p-hodnota ....................., Hq .................................. na hladině významnosti a =.............................. Interpretace výsledků: Mezi rozptylem šířky nosu mužů čínské populace a rozptylem šířky nosu mužů bantuské populace existuje / neexistuje statisticky významný rozdíl. Test o rozdílu středních hodnot Náhodné výběry pochází z normálních rozdělení s vzájemně shodnými / odlišnými rozptyly, proto na otestování hypotézy ze zadání použijeme klasický / Welchův dvouvýběrový í-test o rozdílu středních hodnot yui — /j-2, tj. parametrický test o ..............................středních hodnot když neznámé rozptyly a'f a