Porovnávání středních hodnot 1. Které z uvedených jsou statistické hypotézy? a) H[0]: m = 100 b) H[0]: m[1] – m[2] = 0 c) H[0]: `X [1] – `X [2] = 0 2. Jsou výrazy m[1] – m[2] = 0 a m[1] = m[2] identické? 3. Lze hypotézu (b) z první otázky nazvat nulovou hypotézou? 4. Když budeme porovnávat pretestovou průměrnou hmotnost skupiny 100 dospělých v zeštíhlovacím programu s jejich posttestovou průměrnou hmotností, budou tyto dva průměry nezávislé? 5. Které z následujících požadavků nejsou teoreticky požadovány pro provádění t-testů s nezávislými výběry? a) proměnná normálně rozložená v obou populacích b) s[1]^2 = s[2]^2 c) velmi vysoké n 6. Když testujeme H[0]: m[1] = m[2] a n[1],n[2] jsou velmi malé, tvar t-rozložení je a) normální b) uniformní c) bimodální d) leptokurtický 7. Pokud jsou všechny předpoklady splněny, ve které z následujících situací se bude t-rozložení nejméně lišit od normálního? a) n[1]=10, n[2]=10 b) n[1]=50, n[2]=20 c) n[1]=20, n[2]=20 8. Je t-rozložení s libovolným počtem stupňů volnosti symetrické se středem v 0? 9. Který z následujících symbolů označuje odhad směrodatné chyby rozdílu mezi dvěma průměry? a) s[`X1 –`X2 ] b) s[`X1 –`X2 ] c) s[`X ] d) s^2[`] [X1 –`X2 ] 10. Je pravda, že [0,10]t[60] = – [0,90]t[60] ? (lze psát též [0,10]t (60)) 11. Je-li n = 60, jaké jsou kritické hodnoty pro t při a = 0,10, a = 0,05 a a = 0,01? (použijte Excel, OO.o Calc…) 12. Na které z uvedených hladin významnosti je nejmenší pravděpodobnost chyby I. typu? a) a = 0,10 b) a = 0,05 c) a = 0,001 d) a = 0,01 13. Kdy je nejmenší pravděpodobnost chyby II. typu, pokud jsou situace identické až na zvolenu a? a) při a = 0,10 b) při a = 0,05 c) při a = 0,001 14. Při a = 0,05, budou s rostoucím n kritické hodnoty t klesat? 15. Při n = 60, a = 0,05 a s[`X1 –`X2] = 2,0, jak velký musí být rozdíl`X[1] –`X[2] , aby mohla být H[0] zamítnuta? 16. Pokud s[1]^2 = 50 a s[2]^2=100., za jakých podmínek bude s^2[pooled] = 75? 19. Pokud získáme hodnotu t = 2,0 při n[1]=11 a n[2]=11, která z následujcích tvrzení jsou při a=0,05 pravdivá? a) n = 20 b) kritická hodnota t je 2,09 c) p > 0,05 d) 0,10 > p > 0,05 e) p < 0,05 f) p < 0,10 20. Znamená větší velikost vzorku menší pravděpodobnost chyby I. typu? 21. Při konstantní hodnotě a, znamená větší velikost vzorku menší pravděpodobnost chyby II. typu? 28. Je-li nulová hypotéza pravdivá, lze se dopustit chyby II. typu? 29. Je-li nulová hypotéza pravdivá, jaká je nejpravděpodobnější hodnota t? a) 0 b) 1 31. Ve které z následujících situací je třeba ověřovat předpoklad normality před provedením t-testu? a) n[1]=5, n[2]=5 b) n[1]=10, n[2]=50 32. Za jakých okolností můžeme ignorovat předpoklad homogenity rozptylů? 33. Které z následujících výroků o předpokladech t-testu byly empiricky potvrzeny? a) t-test je robustní vzhledem k předpokladu normality. b) t-test je robustní vzhledem k předpokladu homogenity rozptylů jsou-li velikosti skupin stejné. c) t-test je robustní vzhledem k předpokladu nezávislosti pozorování. 36. Ve kterých z uvedených případů jde o korelovaná (závislá, párová) data? a) Síla měřená ve věku 10 a 12 u týchž 21 dětí. b) Ve věku 6 let jsou porovnávány průměrné skóry ve čtení 50 děvčat a 50 chlapců. c) Jsou porovnávány IQ skóry před terapií a po terapii u jedné skupiny pacientů. d) 40 studentů obecné psychologie je náhodně rozděleno do dvou skupin s různým seminárním programem. Jsou srovnávány průměrné výkony těchto dvou skupin v závěrečné písemce. e) Byl srovnáván výkon účastníků výzkumu ihned po experimentu a s několikatýdenním odstupem. f) Porovnávaly se relativní výkony 100 dětí v matematice a v češtině. 37. Předpokládejme, že badatel nerozpoznal v případě (a) z předchozí otázky, že jde o korelované skupiny. a provedl t-test pro nezávislé skupiny. V čem by byly výsledky testu jiné? (ano-ne) a) Rozdíl `X[1] –`X[2] by byl jiný. b) Vypočtená hodnota s[`X1 –`X2] by byla příliš velká. c) Zjištěná testová statistika t by byla příliš nízká. 42. Pokud zjistíme u Wechslerova IQ v experimentální skupině průměr 109 a v kontrolní skupině průměr 100, jaká je velikost účinku? P1. Byl uspořádán experiment na zjištění efektu poskytnutí osnovy látky, která má být naučena. Padesát vysokoškolských studentů matematiky bylo rozděleno na 2 skupiny. První skupině byla ještě před studiem 10stránkového materiálu o topologii promítnuta osnova látky, kterou tento materiál pokrýval. Druhá skupina si místo osnovy před studiem přečetla desetistránkový životopis Eulera a Riemanna. Na konci experimentu dostaly obě skupiny test z topologie. Počet správně zodpovězených otázek je naší závislou proměnnou. Skupina 1 (osnova) n[1] = 25 m[1] = 7,65 s[1]^2 = 6,50 Skupina 2 (životopisy) n[2] = 25 m[2] = 6,00 s[2]^2 = 5,90 a) Formulujte H[0]. b) Jaká je hodnota odhadu rozptylu z obou skupin s^2[pooled] ? c) Spočítejte s[`X1 –`X2 ]d) Spočítejte t. e) Jaká je kritická hodnota t pro a = 0,05? f) Je H[0] zamítnuta? g) Závěr tedy je… h) Sestrojte 90% interval spolehlivosti pro rozdíl průměrů. i) Vyjádřete rozdíl průměrů jako velikost účinku. P2. V okresním [state] testu čtení bylo zahrnuto 14 úkolů. V celostátním [nation] šetření bylo použito stejných 14 položek. V tabulce níže jsou uvedeny percentuální úspěšnosti v okresním a celostátním šetření. Ověřte, zda hypotéza H[0]: m[o] = m[cs], je udržitelná na 5% hladině statistické významnosti. (Úkoly považujte za vzorek populace možných úkolů ze čtení.) a) Jaký je rozptyl rozdílových skórů? b) Jaká je směrodatná chyba průměru rozdílových skórů? c) t = ? d) Zamítáme H[0]? e) Jaký je 95% CI pro m[d] ? f) Jsou statistickou jednotkou osoby nebo úkoly? g) Která z následujících interpretací intervalu spolehlivosti je v tomto případě správná? i) Kdybychom těchto 14 úkolů zadali všem žákům v obou populacích, máme 95% jistotu, že hodnota m[d] je někde mezi -0,86% a 4,72%. ii) Kdybychom zadali velké množství takových úkolů stejnému vzorku žáků, máme 95% jistotu, že okresní průměr m[o] není o více než 0,86% nižší a o 4,72% vyšší než státní průměr m[s]. P3. Chceme zjistit, jestli má určitá redukční dieta dlouhodobý efekt. Deset dospělých bylo zváženo před držením diety a pak ještě jednou o rok později. Rozdíl mezi prvním a druhým vážením má průměr 3,11 a směrodatnou odchylku 5,62. a) Je H[0]: m=0 platná na 10% hladině statistické významnosti? b) Sestrojte 90% interval spolehlivosti pro m. P4. 125 dětí se špatnými výsledky ve čtení bylo zařazeno do nápravného programu. Výsledky po 8 měsících účasti v programu jsou uvedeny v následující tabulce. a) Bylo by vhodné použít jednostranný test? Jaké je kritické t pro a = 0,01 (jednostranně)? b) Zvýšil se průměrný výkon ve čtení statisticky významně? c) Bylo by možné zamítnout H[0]: m[pre] = m[post] i na hladině a = 0,001 (jednostranně)? d) Byl nárůst výkonu statisticky významně vyšší o více než 0,8 bodu na hladině významnosti a = 0,0005 (jednostranně)? e) Dokazují tyto výsledky, že nápravný program je velmi efektivní? P5. Byl zjišťován efekt celodenního (E) navštěvování školky s efektem půldenního (C) navštěvování školky na dovednost ve čtení na konci druhé třídy. Srovnával se průměrný skór ve čtení 41 (E)-žáků se průměrným skórem 35 (C)-žáků. Výsledky shrnuje následující tabulka: a) Proveďte t-test k vyhodnocení H[0]: m[E] = m[C] při a = 0,1. b) Sestrojte 90% interval spolehlivosti pro rozdíl průměrů. c) Odhadněte velikost účinku (Cohenovo d) d) Dokazuje studie, že mezi absolventy E a C není žádný rozdíl ve čtení? P6. Autoři učebnice Glass a Hopkins provedli anonymní šetření mezi svými studenty a zeptali se jich , jak moc se jim líbí statistika. Výsledkem odpovědí 12 studentů byl průměr m[M]= 5,25 a rozptyl s[M]^2=6,57 a výsledkem odpovědí 31 studentek byl průměr m[Ž]= 4,37 a s[Ž]^2=7,55. a) Existuje statisticky významný rozdíl mezi studenty a studentkami na 10% hladině? b) Vytvořte 90% interval spolehlivosti pro každý průměr (ne pro rozdíl průměrů). c) Vyjádřete rozdíl mezi průměry jako velikost účinku (Cohenovo d). d) Kdyby uvedené popisné statistiky zůstaly stejné, ale velikost vzorku by se zečtveronásobila, zůstala by H[0] v platnosti? Srovnejte získané t s tím, které jste získali v otázce (a). Dobrým cvičením jsou také úlohy v kapitolách 9 a 10 studijní příručky manželů Aronových (zejm. str. 190, 191, 215-217). Odpovědi 1. (a) a (b) 2. ano 3. ano 4. ne 5. c 6. d 7. b (n =68) 8. ano 9. a 10. ano 11. TINV(a;60); 1,67; 2,00; 2,66 12. c 13. a 14. ano (Platí to při jakékoli hladině a) 15. d = t . s[`X1 –`X2] a kritické t je při n = 60, a = 0,05 rovno 2,00. Rozdíl d tedy musí být větší než 2,0.2,00= 4 body. 16. Pokud n[1]=n[2]. s^2[pooled] je vlastně takový vážený průměr rozptylů obou skupin. 19. a, b, c, d, f 20. Ne, pravděpodobnost chyby I. typu si volíme. 21. ano 28. ne 29. a 31. ani (a) ani (b) 32. n[1]=n[2 ]33. a, b 36. a, c, e, f 37. ne, ano, ano 42. Cohenovo d (d’) = 9/15=0,6. P1. a) H[0]: m[1] – m[2] = 0 b) 6,20 c) 0,70 d) 2,34 e) n = 48, [0,975]t(48) = 2,01 f) ano g) m[1] > m[2], osnova, zdá se, má pozitivnější efekt na učení než čtení životopisů matematiků h) 90%CI = 1,65 ± 1,68(0,70) = (0,47; 2,83) i) d‘ = 1,65/2,49 = 0,66 P2. a) 23,5 b) 1,29 c) 1,50 d) ne e) (-0,86% ; 4,72%) f) úkoly g) ii P3. a) Ano, t = 1,75. b) (-0,15; 6,37) P4. a) ano; [0,99]t(124)=2,36 (tinv(0,02;124)) b) ano; t= 13,3 c) ano d) ano; t = 5,71 e) Ne, posttestové skóry jsou ovlivněny efektem regrese do průměru. Fakt, že můžeme s vysokou jistotou zamítnout H[0], vypovídá pouze o tom, že skóry ovlivňuje něco více než jen náhoda. Zjištění příčiny je na designu studie. P5. a) t = 0,39; H[0] ponecháváme v platnosti. b) (-3,17; 5,11) c) d = 0,09 d) Ne, nedostatek empirických dokladů pro vyvrácení H[0] ještě H[0] nedokazuje. P6. a) t = 0,96; H[0] zůstává v platnosti. b) 90%CI pro m[M]: (3,92; 6,58) a pro m[Ž]: (3,53; 5,21) c) 0,88/2.70 = 0,33 d) t = 1,93; [0,90]t(174) =1,65; H[0] na 10% hladině zamítnuta; t se zdvojnásobilo.