9 Analýza rozptylu jednoduchého třídění Příklad 9.1. V jisté továrně se měřil čas, který potřeboval každý ze tří dělníků k uskutečnění téhož pracovního úkonu. Cas v minutách: 1.dělník: 3.6 3.8 3.7 3.5 2.dělník: 4.3 3.9 4.2 3.9 4.4 4.7 3.dělník: 4.2 4.5 4.0 4.1 4.5 4.4 Na hladině významnosti a = 0.05 testujte hypotézu, že výkony těchto tří dělníků jsou stejné. Zamítnete-li nulovou hypotézu, určete, výkony kterých dělníků se liší na dané hladině významnosti a = 0.05. Testování normality 1. //• : ................................................................................................... 2. Hi : ................................................................................................... Na testování normality všech tří výběrů použijeme kvůli jejich malým rozsahům ............................................ test. ## [1] "Delnik 1: 0.9719" ## [1] "Delnik 2: 0.5819" ## [1] "Delnik 3: 0.3313" Q-Q graf Q-Q graf Q-Q graf Cas pracovního úkonu — delnik 1 Cas pracovního úkonu — delnik 2 Cas pracovního úkonu — delnik 3 -1.0 -0.5 0.0 0.5 1.0 -1.0 -0.5 0.0 0.5 1.0 -1.0 -0.5 0.0 0.5 1.0 teoreticky kvantil teoreticky kvantil teoreticky kvantil Protože ve všech třech případech je p-hodnota testu ........................ než a = ................., nulovou hypotézu o normalitě časů všech tří dělníků ................................ na hladině významnosti ................................. Všechny tři výběry tedy .................................z normálního rozdělení. Test homogenity rozptylů 1. //• : ................................................................................................... 2. Hi : ................................................................................................... Jelikož náhodné výběry pochází z normálního rozdělení, na testování hypotézy o shodě rozptylů všech tří výběrů použijeme................................. test. ## Test Statistic ## 1.514205 ## [1] 0.2563563 Testovací statistika ................................. testu nabývá hodnoty ................................., odpovídající p-hodnota = ........................ je ........................ než a = ...................., tedy na hladině významnosti ................................. hypotézu o shodě rozptylů a'f, a\ a cr| .................................. 1 Test o shodě středních hodnot: 1. //• : ........................................ 2. Hi : ........................................ ## Df Sum Sq Mean Sq F value Pr(>F) ## factor(ID) 2 1.1177 0.5589 9.665 0.00268 ** ## Residuals 13 0.7517 0.0578 ##--- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## [1] 3.805565 Skupinový součet čtverců Sa = ................................., počet stupňů volnosti f a = ..............., reziduálni součet čtverců Se =................................., počet stupňů volnosti f e =..............., testovací statistika Fa =.......................... . p-hodnota =................................., nulovou hypotézu o shodě středních hodnot tedy.................................na hladině významnosti .................................................... Kritický obor má tvar W=........................................................... Protože ......................., hypotézu Hq o shodě středních hodnot ............................................na hladině významnosti............................. Metoda mnohonásobného porovnávání Jelikož jsme nulovou hypotézu o shodě středních hodnot ................................., chceme nyní zjistit, které dvojice středních hodnot se od sebe významně liší. Stanovíme nulové a alternativní hypotézy pro dvojice středních hodnot • Hqi : ..................................................................oproti Hn : .................................................................. • H02 : ..................................................................oproti H12 : .................................................................. • Hqs : ..................................................................oproti His : .................................................................. Protože v každé skupině máme různý počet pozorování, použujeme na mnohonásobné porovnávání............................ metodu. ## $L ## delnik 1 delnik 2 delnik 3 ## delnik 1 0.0000000 0.5833333 0.6333333 ## delnik 2 0.5833333 0.0000000 0.0500000 ## delnik 3 0.6333333 0.0500000 0.0000000 ## ## $R ## delnik 1 delnik 2 delnik 3 ## delnik 1 0.4690839 0.4282131 0.4282131 ## delnik 2 0.4282131 0.3830054 0.3830054 ## delnik 3 0.4282131 0.3830054 0.3830054 Porovnáním pravé a levé strany ................................. metody vidíme, že na hladině významnosti .................... zamítáme nulovou hypotézu o shodě středních hodnot jj,........ a jj,........ a středních hodnot jj,........ a jj,......... Výsledek testování tedy ukazuje, že na hladině významnosti ................................. se liší výkony dělníků ........................... a ..........................., naopak výkony dělníků................................. se neliší. 2 Krabicový graf Doba provedeni úkonu Krabicový graf o CO "1-1-T delnik 1 delnik 2 delnik 3 delnik Příklad 9.2. Z archivních materiálů (Schmidt, 1888) máme k dispozici původní kraniometrické údaje o výšce horní části tváře mužů z pěti populací: bantuské (13 jedinců), čínské (18 jedinců), malajské (69 jedinců), německé (19 jedinců) a peruánské (44 jedinců). Na hladině významnosti a = 0.05 otestujte nulovou hypotézu Hq, že výška horní části tváře je stejná pro všechny populace. V případě zamítnutí nulové hypotézy zjistěte, které populace se významně liší ve výšce horní části tváře. Testování normality 1. //• : ..................... 2. Hi : ..................... Rozsah náhodných výběrů pro bantuskou, čínskou a německou populaci je ....... 30, proto normalitu otestujeme ........................................................ testem. Rozsah náhodného výběru pro malajskou a peruánskou populaci je ....... 30, proto normalitu otestujeme ........................................................ testem. ## [1] "Bantuska p. ## [1] "Cinska p.: ## [1] "Malajska p. ## [1] "Nemecka p.: 0.4321" 0.0513" 0.2703" 0.0419" ## [1] "Peruánská p.: 0.6447" Q-Q graf Vyska tvare — bantuska p. Q-Q graf Vyska tvare — cincka p. Q-Q graf Vyska tvare — malajska p. teoreticky kvantil teoreticky kvantil -2-10 1 2 teoreticky kvantil 3 Q-Q graf Výska tvare — nemecká p. Q-Q graf Výska tvare — peruánská.p -1 O 1 teoreticky kvantil -2-10 1 2 teoreticky kvantil V případě bantuské, čínské, malajské a peruánské populace je p-hodnota testu normality ........................ než a = ................., nulovou hypotézu o normalitě tedy................................na hladině významnosti...................V případě německé populace je p-hodnota......................než a. Porušení normality je však mírné, proto i zde předpokládáme, že data pochází z normálního rozdělení. Test homogenity rozptylů 1. //• : ................................................................................................... 2. Hx : ................................................................................................... Jelikož náhodné výběry pochází z normálního rozdělení, na testování hypotézy o shodě rozptylů všech pěti populací použijeme................................. test. ## Test Statistic ## 0.966642 ## [1] 0.4275202 Testovací statistika ................................. testu nabývá hodnoty ................................., odpovídající p-hodnota = ........................ je ........................ než a = ...................., tedy na hladině významnosti ................................. hypotézu o shodě rozptylů u všech pěti populací.................................. Test o shodě středních hodnot: 1. //• : ........................................ 2. Hi : ........................................ ## Df Sum Sq Mean Sq F value Pr(>F) ## factor(ID) 4 80 20.05 0.943 0.441 ## Residuals 158 3361 21.27 ## [1] 1.278004 Skupinový součet čtverců S a = ................................., počet stupňů volnosti f a = ..............., reziduálni součet čtverců Se =................................., počet stupňů volnosti f e =..............., testovací statistika Fa =........................... . p-hodnota =................................., nulovou hypotézu o shodě středních hodnot tedy.................................na hladině významnosti .................................................... Kritický obor má tvar W=........................................................... Protože středních hodnot ............................................na hladině významnosti....... ., hypotézu Hq o shodě V délce horní části tváře tedy významný rozdíl. 4 Krabicový graf "O o -q LO CD O CD LO LO Výska hôrni časti tvare Krabicový graf bantuska cinska malajska populace 1-T nemecká peruánská Příklad 9.3. Je dána neúplná tabulka analýzy rozptylu jednoduchého třídění. Na volná místa doplňte chybějící hodnoty a na hladině významnosti 0.05 testujte hypotézu o shodě středních hodnot. Stanovte, jaký je celkový počet pozorování n a kolik úrovní r má faktor A? zdroj variability součet čtverců stupně volnosti podíl statistika F skupinový 2 reziduálni 172 - celkový 326 17 - - ## [1] 154 ## [1] 15 ## [1] 77 ## [1] 11.467 ## [1] 6.715 ## [1] 3.68232 ## [1] 0.008267191 Testovací statistika F nabývá hodnoty ............................... Kritický obor má tvar W=....................................... Protože..............................., hypotézu Hq o shodě středních hodnot........................................na hladině významnosti Testovací statistika F nabývá hodnoty..............................., p-hodnota =................................Protože p-hodnota= ......................je......................než a =......................, hypotézu Hq o shodě středních hodnot ............................... na hladině významnosti .................. Celkový počet pozorování je.......................; faktor A má celkem....................... úrovní. 5 Příklad 9.4. V rámci studie byly získány čtyři nezávislé náhodné výběry o rozsazích 15, 11, 6, 6 přičemž i-tý výběr pochází z rozdělení N(/j,i,af), i = 1,2,3,4. Byl vypočten celkový součet čtverců St = 7606 a reziduálni součet čtverců Se = 3881. Na hladině významnosti a = 0.05 testujte hypotézu Hq o shodě středních hodnot. Testování proveďte pomocí kriického oboru a pomocí p-hodnoty. ## [1] 10.87778 ## [1] 2.882604 ## [1] 3.685735e-05 zdroj variability součet čtverců stupně volnosti podíl statistika F skupinový reziduálni - celkový - - Testovací statistika F nabývá hodnoty ............................... Kritický obor má tvar W=....................................... Protože..............................., hypotézu Hq o shodě středních hodnot........................................na hladině významnosti Testovací statistika F nabývá hodnoty..............................., p-hodnota =................................Protože p-hodnota= ......................je......................než a =......................, hypotézu Hq o shodě středních hodnot ............................... na hladině významnosti .................. 6