Úkoly k datovému souboru IQ: Ve všech úkolech budeme předpokládat, že hladina významnosti je 0,05, hypotézy testujte proti oboustranné alternativě, popřípadě testujte jednostrannou alternativu, které se bude zdát vhodná z grafického znázornění dat. 1) Testuje hypotézu, že performační, verbální a celkové IQ dětí se neliší. Grafické znázornění: Histogram z IQ; kategorizovaný kategorie IQ-3 2v*2577c kategorie: 1 IQ = 856*10*normal(x; 100,3925; 12,8067) kategorie: 2 IQ = 856*10*normal(x; 100,6519; 13,617) kategorie: 3 IQ = 856*10*normal(x; 100,4498; 12,9641) IQ Početpozorování kategorie: 1 50 60 70 80 90 100 110 120 130 140 150 160 0 40 80 120 160 200 240 280 kategorie: 2 50 60 70 80 90 100 110 120 130 140 150 160 kategorie: 3 50 60 70 80 90 100 110 120 130 140 150 160 0 40 80 120 160 200 240 280 kategorie: 1 IQ: D = 0,0451; p < 0,1000; Lilliefors-p < 0,01; SW-W = 0,9967; p = 0,0763 kategorie: 2 IQ: D = 0,0448; p < 0,1000; Lilliefors-p < 0,01; SW-W = 0,9976; p = 0,2615 kategorie: 3 IQ: D = 0,0376; p < 0,2000; Lilliefors-p < 0,01; SW-W = 0,9976; p = 0,2423 Kategoriz. krabicový graf: IQ Průměr Průměr±SmCh Průměr±1,96*SmCh verbalni performacni celkove kategorie 99,4 99,6 99,8 100,0 100,2 100,4 100,6 100,8 101,0 101,2 101,4 101,6 101,8 IQ Neparametrický přístup pomocí Kruskal-Walisova testu: Kruskal-Wallisova ANOVA založ. na poř.; IQ (IQ-3) Nezávislá (grupovací) proměnná :kategorie Kruskal-Wallisův test: H ( 2, N= 2568) =,1317151 p =,9363 Závislá: IQ Kód Počet platných Součet pořadí Prům. Pořadí verbalni performacni celkove 1 856 1095812 1280,154 2 856 1105930 1291,974 3 856 1096855 1281,372 Nezamítáme nulovou hypotézu na hladině významnosti 0,05. Neprokázali jsme tedy, že performační, verbální a celkové IQ se lišíi. Protože máme velký rozsah souboru, můžeme předpokládat vícerozměrnou normalitu a použíit parametrický příistup. Leveneův test homogenity rozpylů (IQ-3) Označ. efekty jsou význ. na hlad. p < ,05000 Proměnná SČ efekt SV efekt PČ efekt SČ chyba SV chyba PČ chyba F p IQ 166,7978 2 83,39888 153292,8 2565 59,76327 1,395487 0,247900 Analýza rozptylu (IQ-3) Označ. efekty jsou význ. na hlad. p < ,05000 Proměnná SČ efekt SV efekt PČ efekt SČ chyba SV chyba PČ chyba F p IQ 31,78115 2 15,89058 442464,2 2565 172,5007 0,092119 0,912000 Nezamítáme nulovou hypotézu na hladině významnosti 0,05. Neprokázali jsme tedy, že střední hodnoty performačního, verbálního a celkového IQ se lišíi. 2) Testuje hypotézu, že performační a verbální IQ chlapců se neliší. Budeme postupovat obdobně jako v prvním příkladu Histogram z IQ_VERB IQ-tabulka 9v*856c Zahrnout jestliže: v1=1 IQ_VERB = 426*10*normal(x; 102,2559; 13,4165) 60 70 80 90 100 110 120 130 140 150 IQ_VERB 0 20 40 60 80 100 120 140 Početpozorování IQ_VERB: D = 0,0511; p < n.s.; Lilliefors-p < 0,01; SW-W = 0,9933; p = 0,0545 Histogram z IQ_PERF IQ-tabulka 9v*856c Zahrnout jestliže: v1=1 IQ_PERF = 426*10*normal(x; 101,4437; 13,7898) 50 60 70 80 90 100 110 120 130 140 150 160 IQ_PERF 0 20 40 60 80 100 120 140 Početpozorování IQ_PERF: D = 0,0534; p < 0,2000; Lilliefors-p < 0,01; SW-W = 0,9969; p = 0,5889 Krabicový graf Zhrnout podmínku: v1=1 Medián 25%-75% Min-MaxIQ_VERB IQ_PERF 50 60 70 80 90 100 110 120 130 140 150 Znaménkový test (IQ-tabulka) Označené testy jsou významné na hladině p <,05000 Zhrnout podmínku: v1=1 Dvojice proměnných Počet různých procent v < V Z p-hodn. IQ_VERB & IQ_PERF 416 45,67308 1,716016 0,086159 Wilcoxonův párový test (IQ-tabulka) Označené testy jsou významné na hladině p <,05000 Zhrnout podmínku: v1=1 Dvojice proměnných Počet platných T Z p-hodn. IQ_VERB & IQ_PERF 416 39405,00 1,615074 0,106296 Krabicový graf IQ_VERB vs. IQ_PERF Zhrnout podmínku: v1=1 Průměr Průměr±SmCh Průměr±1,96*SmChIQ_VERB IQ_PERF 99,5 100,0 100,5 101,0 101,5 102,0 102,5 103,0 103,5 104,0 t-test pro závislé vzorky (IQ-tabulka) Označ. rozdíly jsou významné na hlad. p < ,05000 Zhrnout podmínku: v1=1 Proměnná Průměr Sm.odch. N Rozdíl Sm.odch. rozdílu t sv p IQ_VERB IQ_PERF 102,2559 13,41651 101,4437 13,78978 426 0,812207 12,12202 1,382917 425 0,167416 Žádný z testů nezamítá nulovou hypotézu na hladině významnosti 0,05. Z krabicových grafů vidíme, že bychom mohli otestovat nulovou hypotézu proti pravostranné alternativě. Známe hodnotu testového kritéria, pomocí pravděpodobnostního kalkulátoru dopočítáme p-hodnotu = 0,083708. 3) Testujte hypotézu, že preformační IQ dětí na venkově a ve městě se neliší. Histogram z IQ_PERF; kategorizovaný SIDLO IQ-tabulka 9v*856c SIDLO: MESTO IQ_PERF = 473*10*normal(x; 101,778; 14,1813) SIDLO: VENKOV IQ_PERF = 383*10*normal(x; 99,2611; 12,7677) IQ_PERF Početpozorování SIDLO: MESTO 50 60 70 80 90 100 110 120 130 140 150 160 0 20 40 60 80 100 120 140 SIDLO: VENKOV 50 60 70 80 90 100 110 120 130 140 150 160SIDLO: MESTO IQ_PERF: D = 0,0399; p < n.s.; Lilliefors-p < 0,1; SW-W = 0,9962; p = 0,3262 SIDLO: VENKOV IQ_PERF: D = 0,0672; p < 0,1000; Lilliefors-p < 0,01; SW-W = 0,9908; p = 0,0173 Krabicový graf : IQ_PERF Průměr Průměr±SmCh Průměr±1,96*SmCh MESTO VENKOV SIDLO 97 98 99 100 101 102 103 104 IQ_PERF Zamítáme hypotézu o shodě rozptylů, nemůžeme použít implementovaný t-test Neparametrický přístup: Krabicový graf dle skupin Proměnná: IQ_PERF Medián 25%-75% Min-Max MESTO VENKOV SIDLO 50 60 70 80 90 100 110 120 130 140 150 IQ_PERF Za předpokladu, že hustoty se liší pouze posunutím, můžeme použít Wilcoxonův dvouvýběrový test. (Ověříme z histogramu.) Mann-Whitneyův U Test (w/ oprava na spojitost) (IQ-tabulka) Dle proměn. SIDLO Označené testy jsou významné na hladině p <,05000 Proměnná Sčt poř. MESTO Sčt poř. VENKOV U Z p-hodn. Z upravené p-hodn. N platn. MESTO IQ_PERF 214001,0 152795,0 79259,00 3,147144 0,001649 3,148827 0,001639 47 Kolmogorův Smirovův test Kolmogorov-Smirnovův test (IQ-tabulka) Dle proměn. SIDLO Označené testy jsou významné na hladině p <,05000 Proměnná Max záp rozdíl Max klad rozdíl p-hodn. Průměr MESTO Průměr VENKOV Sm.odch. MESTO Sm.odch. VENKOV N pla MEST IQ_PERF -0,024260 0,122086 p < .005 101,7780 99,26110 14,18131 12,76775 Oba testy zamítají nulovou hypotézu na hladině významnosti 0,05. Můžeme navíc otestovat, že performační IQ dětí ve městě je větší, než performační IQ dětí na vesnici. Hodnotu testového kritéria známe, pomocí pravděpodobnostního kalkulátoru dopočítáme p-hodnou= 0,000824. 4) Testujte hypotézu, že na IQ dětí nemá vliv na vzdělání otců. Histogram z IQ_CELK; kategorizovaný VZDEL_O IQ-tabulka 9v*856c VZDEL_O: Z IQ_CELK = 438*10*normal(x; 96,0525; 12,0379) VZDEL_O: S IQ_CELK = 291*10*normal(x; 102,8385; 11,2776) VZDEL_O: V IQ_CELK = 127*10*normal(x; 110,1417; 13,0413) IQ_CELK Početpozorování VZDEL_O: Z 50 60 70 80 90 100 110 120 130 140 150 0 20 40 60 80 100 120 140 VZDEL_O: S 50 60 70 80 90 100 110 120 130 140 150 VZDEL_O: V 50 60 70 80 90 100 110 120 130 140 150 0 20 40 60 80 100 120 140 VZDEL_O: Z IQ_CELK: D = 0,0362; p < n.s.; Lilliefors-p < 0,2; SW-W = 0,9966; p = 0,4760 VZDEL_O: S IQ_CELK: D = 0,0441; p < n.s.; Lilliefors-p < 0,2; SW-W = 0,9926; p = 0,1565 VZDEL_O: V IQ_CELK: D = 0,0494; p < n.s.; Lilliefors-p < 1; SW-W = 0,991; p = 0,5857 Kategoriz. krabicový graf: IQ_CELK Průměr Průměr±SmCh Průměr±1,96*SmCh Z S V VZDEL_O 94 96 98 100 102 104 106 108 110 112 114 IQ_CELK Rozkladová tabulka popisných statistik (IQ-tabulka) N=856 (V seznamu záv. prom. nejsou ChD) VZDEL_O IQ_CELK průměr IQ_CELK N IQ_CELK Sm.odch. Z 96,0525 438 12,03787 S 102,8385 291 11,27760 V 110,1417 127 13,04128 Vš.skup. 100,4498 856 12,96409 Leveneův test homogenity rozpylů (IQ-tabulka) Označ. efekty jsou význ. na hlad. p < ,05000 Proměnná SČ efekt SV efekt PČ efekt SČ chyba SV chyba PČ chyba F p IQ_CELK 146,2338 2 73,11688 41883,35 853 49,10123 1,489105 0,226160 Analýza rozptylu (IQ-tabulka) Označ. efekty jsou význ. na hlad. p < ,05000 Proměnná SČ efekt SV efekt PČ efekt SČ chyba SV chyba PČ chyba F p IQ_CELK 22059,19 2 11029,59 121638,6 853 142,6010 77,34585 0,00 Scheffeho test; proměn.:IQ_CELK (IQ-tabulka) Označ. rozdíly jsou významné na hlad. p < ,05000 VZDEL_O {1} M=96,053 {2} M=102,84 {3} M=110,14 Z {1} S {2} V {3} 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 Na hladině významnosti 0,05 zamítáme nulovou hypotézu, že vzdělání otců nemá vliv na IQ dětí. Pomocí Sheffeho metody jsme prokázali s rizikem omylu nejvýše 0,05, že IQ dětí, jejichž otcové měli různé vzdělání, se liší. 5) Testujte hypotézu, že to zda IQ dítěte je vyšší než 110 nebo nižší nezávisí na vzdělání otců. Kontingenční tabulka (IQ-tabulka) Četnost označených buněk > 5 (Marginální součty nejsou označeny) VZDEL_O vděláni >110 1 vděláni >110 2 Řádk. součty Z 377 61 438 S 209 82 291 V 61 66 127 Vš.skup. 647 209 856 Souhrnná tab.: Očekávané četnosti (IQ-tabulka) Četnost označených buněk > 5 Pearsonův chí-kv. : 80,5871, sv=2, p=0,00000 VZDEL_O vděláni >110 1 vděláni >110 2 Řádk. součty Z 331,0584 106,9416 438,0000 S 219,9498 71,0502 291,0000 V 95,9918 31,0082 127,0000 Vš.skup. 647,0000 209,0000 856,0000 Statist. : VZDEL_O(3) x vděláni >110(2) (IQ-tabulka) Statist. Chí-kvadr. sv p Fí Kontingenční koeficient Cramér. V ,3068286 ,2933315 ,3068286 Podmínka dobré aproximace je splněna. Zamítáme nulovou hypotézu, že vzdělání otců a to zda má dítě vyšší inteligenci než 110, spolu nesouvisí. Závislost je střední. 6) Testujte hypotézu, zda vzdělání rodičů nezávisí na pohlaví. Kontingenční tabulka (Tabulka90) Četnost označených buněk > 5 (Marginální součty nejsou označeny) vzdělání pohlaví muž pohlaví žena Řádk. součty Z 438 361 799 S 291 386 677 V 127 109 236 Vš.skup. 856 856 1712 Souhrnná tab.: Očekávané četnosti (Tabulka90) Četnost označených buněk > 5 Pearsonův chí-kv. : 22,1243, sv=2, p=,000016 vzdělání pohlaví muž pohlaví žena Řádk. součty Z 399,5000 399,5000 799,000 S 338,5000 338,5000 677,000 V 118,0000 118,0000 236,000 Vš.skup. 856,0000 856,0000 1712,000 Dvourozměrné rozdělení: vzdělání x pohlaví m už žena pohlaví Z S V vzdělání 50 100 150 200 250 300 350 400 450 500 Početpozorování Statist. : vzdělání(3) x pohlaví(2) (Tabulka90) Statist. Chí-kvadr. sv p Fí Kontingenční koeficient Cramér. V ,1136796 ,1129521 ,1136796 7) Testujte hypotézu, že vzdělání matky a otce jsou nezávislé. 2-rozměrná tabulka: Pozorované četnosti (IQ-tabulka) Četnost označených buněk > 5 VZDEL_M VZDEL_O Z VZDEL_O S VZDEL_O V Řádk. součty Z S V Celk. 296 60 5 361 136 203 47 386 6 28 75 109 438 291 127 856 2-r. tabulka (shr.): Očekávané četnosti (IQ-tabulka) Četnost označených buněk > 5 VZDEL_M VZDEL_O Z VZDEL_O S VZDEL_O V Řádk. součty Z S V Celk. 184,7173 122,7231 53,5596 361,0000 197,5093 131,2220 57,2687 386,0000 55,7734 37,0549 16,1717 109,0000 438,0000 291,0000 127,0000 856,0000 Statist. : VZDEL_M(3) x VZDEL_O(3) (IQ-tabulka) Statist. Chí-kvadr. sv p Fí Kontingenční koeficient Cramér. V ,7362586 ,5928944 ,5206134 8) Testujte hypotézu, že vzdělání matek nezávisí na pohlaví dítěte. Kontingenční tabulka (IQ-tabulka) Četnost označených buněk > 5 (Marginální součty nejsou označeny) VZDEL_M SEX CHLAPCI SEX DIVKY Řádk. součty Z 176 185 361 S 200 186 386 V 50 59 109 Vš.skup. 426 430 856 Souhrnná tab.: Očekávané četnosti (IQ-tabulka) Četnost označených buněk > 5 Pearsonův chí-kv. : 1,45661, sv=2, p=,482727 VZDEL_M SEX CHLAPCI SEX DIVKY Řádk. součty Z 179,6565 181,3435 361,0000 S 192,0981 193,9019 386,0000 V 54,2453 54,7547 109,0000 Vš.skup. 426,0000 430,0000 856,0000 Statist. : VZDEL_M(3) x SEX(2) (IQ-tabulka) Statist. Chí-kvadr. sv p Fí Kontingenční koeficient Cramér. V ,0412510 ,0412159 ,0412510 Nezamítáme hypotézu, že vzdělání matek nezávisí na pohlaví dítěte na hladině významnosti 0,05. Závislost mezi vzděláním dítěte a pohlavím matky je zanedbatelná. 9) Testujte hypotézu, o nezávislosti performačního a verbálního IQ. Histogram z IQ_VERB IQ-tabulka 12v*856c IQ_VERB = 856*10*normal(x; 100,3925; 12,8067) 50 60 70 80 90 100 110 120 130 140 150 IQ_VERB 0 20 40 60 80 100 120 140 160 180 200 220 240 260 280Početpozorování IQ_VERB: D = 0,0451; p < 0,1000; Lilliefors-p < 0,01; SW-W = 0,9967; p = 0,0763 Histogram z IQ_PERF IQ-tabulka 12v*856c IQ_PERF = 856*10*normal(x; 100,6519; 13,617) 50 60 70 80 90 100 110 120 130 140 150 160 IQ_PERF 0 20 40 60 80 100 120 140 160 180 200 220 240 260 Početpozorování IQ_PERF: D = 0,0448; p < 0,1000; Lilliefors-p < 0,01; SW-W = 0,9976; p = 0,2615 Bodový graf z IQ_PERF proti IQ_VERB IQ-tabulka 12v*856c IQ_PERF = 37,192+0,6321*x 50 60 70 80 90 100 110 120 130 140 150 IQ_VERB 50 60 70 80 90 100 110 120 130 140 150 IQ_PERF Spearmanovy korelace (IQ-tabulka) ChD vynechány párově Označ. korelace jsou významné na hl. p <,05000 Dvojice proměnných Počet plat. Spearman R t(N-2) p-hodn. IQ_VERB & IQ_PERF 856 0,585564 21,10972 0,00 Korelace (IQ-tabulka) Označ. korelace jsou významné na hlad. p < ,05000 (Celé případy vynechány u ChD) Prom. X & prom. Y Průměr Sm.Odch. r(X,Y) r2 t p N Konst. záv.: Y Smě záv: IQ_PERF IQ_CELK 100,6519 13,61699 100,4498 12,96409 0,883951 0,781370 55,24620 0,00 856 15,74438 0,84 10) Testujte hypotézu, že stření hodnota celkového IQ dívek je 105. Histogram z IQ_CELK IQ-tabulka 12v*856c Zahrnout jestliže: v1=2 IQ_CELK = 430*10*normal(x; 98,9256; 12,2472) 50 60 70 80 90 100 110 120 130 140 150 IQ_CELK 0 20 40 60 80 100 120 140 Početpozorování IQ_CELK: D = 0,035; p < n.s.; Lilliefors-p < 1; SW-W = 0,9978; p = 0,8564 Krabicový graf Průměr = 100,4498 Průměr±SmOdch = (87,4857, 113,4139) Průměr±1,96*SmOdch = (75,0401, 125,8594)70 80 90 100 110 120 130 Test průměrů vůči referenční konstantě (hodnotě) (IQ-tabulka) Proměnná Průměr Sm.odch. N Sm.chyba Referenční konstanta t SV p IQ_CELK 100,4498 12,96409 856 0,443103 105,0000 -10,2690 855 0,000000