Odpovědi (téma 10) 1.1 (a) a (b) 1.2 ano 1.3 ano 1.4 ne 1.5 a 2.1 c 2.2 d 2.3 b (ν =68) 2.4 ano 2.5 a 2.6 ani (a) ani (b) 2.7 jde o předpoklad homogenity rozptylů; modifikací t-testu pro nestejné rozptyly; lze jej ignorovat, když n[1]=n[2] 2.8 a, b 2.9 ano 2.10 ano (platí to při jakékoli hladině α) 2.11 Standardní chyba rozdílu je standardní odchylka distribuce rozdílů mezi průměry ve vzorcích. 2.12 Jak vzrůstá velikost vzorku, df se zvyšuje a kritické t se snižuje. Jak vzrůstá velikost vzorku, t distribuce se přibližuje normální standardní křivce. Jak se strany t distribuce zmenšují, pravděpodobnost extrémních hodnot t se snižuje. Z čehož vyplývá, nemusíte jít daleko za hranice průměru t distribuce, abyste označili krajní meze, za kterými 2,5 procenta distribuce leží. 2.13 Závislý t-test zvyšuje sílu experimentu, což znamená, že zvyšuje pravděpodobnost správného zamítnutí chybné nulové hypotézy, a to na základě statistického odstranění variability způsobené individuálními rozdíly. 2.14 normální rozložení proměnné v populaci (lze ignorovat u větších skupin); homogenita rozptylů (lze ignorovat u stejně velkých skupin); nezávislost pozorování (nelze ignorovat – je třeba použít adekvátní t-test) 3.1 c 3.2 a 3.3 ne, pravděpodobnost chyby I. typu si volíme. 3.4 ano 3.5 ne 3.6 Zvyšování velikosti vzorku bude snižovat velikost jmenovatele poměru t (tj, směrodatnou chybu), což vyústí ve větší získané t. 4.1 d = t . s[m][1 – ][m][2] a kritické t je při ν = 60, α = 0,05 rovno 2,00. Rozdíl d tedy musí být větší než 2,0.2,00= 4 body. 4.2 TINV(α;60); 1,67; 2,00; 2,66 4.3 pokud n[1]=n[2]. s^2[pooled] je vlastně takový vážený průměr rozptylů obou skupin. 4.4 a, b, c, d, f 4.5 Cohenovo d (d’) = 9/15=0,6 5. a, c, e, f 6. ne, ano, ano 7.1 b – u více nezávislých srovnání platí, že pravděpodobnost výskytu alespoň jedné chyby I. typu p = 1 – (1 – α)^K, kde K odpovídá počtu srovnání; pokud jsme tedy provedli 10 srovnání, p = 1 – (1 – 0,05)^10 = 0,40 7.2 výskytu alespoň jedné chyby I. typu (tj. neoprávněného zamítnutí nulové hypotézy) 8.1 23,5 8.2 1,29 8.3 1,50 8.4 ne 8.5 (-0,86% ; 4,72%) 8.6 úkoly 8.7 b 9.1 Ano, t = 1,75. 9.2 (-0,15; 6,37) 10.1 ano; [0,99]t(124)=2,36 (tinv(0,02;124)). I když to „ano“ je trochu s otazníkem. Jednostranný test můžeme použít pouze tehdy, když opak toho, co předpokládáme (zde: žáci se ve čtení zhoršili) je zcela nemožný a i kdyby to tak vyšlo, nijak bychom to neinterpretovali. Zde to není tak jisté, protože nápravný program se může zvrtnout, pokud by opravdu ke zhoršení došlo, určitě bychom to chtěli vědět. V reálu by tedy odpověď zněla spíše „ne“. 10.2 ano; t= 13,3 10.3 ano 10.4 ano; t = 5,71 10.5 Ne, posttestové skóry jsou ovlivněny efektem regrese do průměru. Fakt, že můžeme s vysokou jistotou zamítnout H[0], vypovídá pouze o tom, že skóry ovlivňuje něco více než jen náhoda. Zjištění příčiny je na designu studie. 11.1 t = 0,39; H[0] ponecháváme v platnosti. 11.2 (-3,17; 5,11) 11.3 d = 0,09 11.4 Ne, nedostatek empirických dokladů pro vyvrácení H[0] ještě H[0] nedokazuje. 12.1 t = 0,96; H[0] zůstává v platnosti. 12.2 90%CI pro μ[M]: (3,92; 6,58) a pro μ[Ž]: (3,53; 5,21) 12.3 0,88/2.70 = 0,33 12.4 t = 1,93; [0,90]t(174) =1,65; H[0] na 10% hladině zamítnuta; t se zdvojnásobilo. 13.1 – 13.3 Výpočet: 13.4 Zamítněte nulovou hypotézu. Dvouleté děti se sourozenci mají signifikantně menší strach než dvouletí, kteří nemají sourozence, t(10) = 3,33, p < 0,05. 14.1 – 14.3 14.4 Zamítněte nulovou hypotézu. Mezi muži, vyšší úzkostnost vede k větší atrakci/příklonu k ženám než nízká úroveň úzkosti, t(18) = 5,71, p < 0,05. 15.1 15.2 S kritickým t = 2,101 a obdrženým t = 1, 94, výsledky nevedou k zamítnutí nulové hypotézy. 15.3 Zvyšování variability skórů zvýšilo velikost jmenovatele poměru t a redukovalo velikost získaného t. 16.1 16.2 viz 14.4 16.3 Zvyšování velikosti vzorku zvyšuje získané t snižováním velikosti jmenovatele. 17.1 t-test pro nezávislé výběry; H[0]: μ[1]-μ[2 ]= 0; d = 6,33; s[d] = (výpočet podle vzorečku) = 2,06; t = d/s[d ]= 3,07; ν = n[1] + n[2] – 2 = 10; p = TDIST(3,07;10;2) = 0,012; alternativní hypotéza byla na 5% hladině potvrzena 17.2 TINV(0,05;10) = 2,23; 95% CI = (6,33 – (2,23*2,06); 6,33 + (2,23*2,06) = (1,74; 10,93) 17.3 d' = 1,8 17.4 Studenti mužského pohlaví referovali signifikantně o více zlostných reakcích než studentky na 5% hladině. 18.1 H[0]: μ[1]-μ[2 ]= 0; H: μ[1]-μ[2] ≠ 0 18.2 t-test pro nezávislé výběry;; d = 8,83; s[d] = (výpočet podle vzorečku) = 3,36; t = d/s[d ]= 2,63; ν = n[1] + n[2] – 2 = 10; p = TDIST(2,63;10;2) = 0,025; alternativní hypotéza byla na 5% hladině potvrzena 18.3 TINV(0,05;10) = 2,23; 95% CI = (8,83 – (2,23*3,36); 8,83 + (2,23*3,36)) = (1,34; 16,32) 18.4 d' = 1,5 18.5 Učitelé zakoušeli signifikantně více burnout symptomatiky než ředitelé na 5% hladině. 19. Studenti při podmínce nízkého arousalu vykazovali větší přibližující chování než studenti při podmínce vysokého arousalu, t(58) = 2, 77, p < 0,05. 20.1 – 20.3 Tohle jsou párová data. Můžeme spočítat párový t-test, jak je uveden v Hendlovi. Protože máme hrubá data, můžeme taky pro každý pár spočítat rozdíl (d) a jednovýběrovým t-testem testovat H[0]: M[d]=0 (vyhnems e tak počítání korelace). 20.4 Zamítněte nulovou hypotézu a uzavřete s tím, že existuje průkazný rozdíl ve vnímání vousatých a bezvousých mužů, t(7) = 2,74, p < 0,05. Vousatí mužové jsou signifikantně více vnímání jako maskulinní. 21.1 – 21.3 21.4 Zamítněte nulovou hypotézu s tím, že existuje významný rozdíl v preferenci pro produkty, které doprovází reklama se sexuální symbolikou oproti reklamě bez ní. Lidé jsou více ochotni koupit lihoviny, které jsou v reklamě doprovázeny sexuální symbolikou, t(5) = 4,52, p < 0,05. 22.1 – 22.3 22.4 Podržte nulovou hypotézu, neboť zde není průkazný rozdíl v preferenci goudy nebo švýcarského sýru, t(4) = 1,25, nesignifikantní. 23.1 párový t-test; H[0]: μ[pretest] - μ[posttest] = 0; H[0]: μ[1]-μ[2 ]= 0; d = 27,27; s[d] = (výpočet podle vzorečku) = 8,43; t = d/s[d ]= 3,23; ν = n – 1 = 10; p = TDIST(3,23;10;2) = 0,009; alternativní hypotéza byla na 5% hladině potvrzena 23.2 TINV(0,05;10) = 2,23; 95% CI = (27,27 – (2,23*8,43); 27,27 + (2,23*8,43) = (8,47; 46,07) 23.3 d' = 1,1 24.1 – 24.3 Použijte nezávislý t-test: 24.4 Zamítněte nulovou hypotézu s tím, že existuje průkazný rozdíl mezi průměry. Anabolické steroidy vedou k signifikantně většímu nárůstu váhy než růstový stimulant, t(14) = 2,31, p < 0,05. 25.1 – 25.3 25.4 Anabolické steroidy vedou k většímu přírůstku váhy než růstový stimulant, t(7) = 2,73, p < 0,05. 26. Studenti napsali kvalitnější práce, když použili IBM počítač oproti Macintosh, t(19) = 3,05, p < 0,05. 27.1 t-test pro nezávislé výběry; H[0]: μ[1]-μ[2 ]= 0; d = 4; s[d] = (výpočet podle vzorečku) = 1,65; t = d/s[d ]= 2,42; ν = n[1] + n[2] – 2 = 10; p = TDIST(2,42;10;2) = 0,036; alternativní hypotéza byla na 5% hladině potvrzena 27.2 TINV(0,05;10) = 2,23; 95% CI = (4 – (2,23*1,65); 4 + (2,23*1,65) = (0,32; 7,68) 27.3 d' = 1,4 27. Není žádná evidence, že by bylo vidění ovlivňováno barvou čoček, t(15) = 0,17, nesignifikantní. 28.1 Párový t-test. H[0]: μ[1]-μ[2]=0. d=2,5 s[d]=√((1/n)*(s[1]^2+s[2]^2-2s[1]s[2]r))=1. t=d/s[d]=2,5. p=TDIST(2,5;15;2) = 0,025 což < 0,05 . H[0] na 5% hladině zamítáme. 28.2 (2,5-1*TINV(0,05;15); 2,5+1*TINV(0,05;15)) = (0,37; 4,63) 28.3 d=2,5/4=0,6 28. 4 Jednovýběrový z-test. H[0]: μ=10. d=2,5 s[d]=s/√n=1. z=d/s[d]=2,5. p = 2*(1-NORMSDIST(2,5)) = 0,012 což je > 0,01. H[0] na 1% hladině nemůžeme zamítnout. 29.1 t-test pro nezávislé výběry se stejnými rozptyly. H[0]: μ[1]-μ[2]=0. d=2,8 s[d]=“ten dlouhý vzoreček“ =√(2)=1,4. t=d/s[d]=2. p=TDIST(2;30;2) = 0,055 což > 0,05 . H[0] na 5% hladině nemůžeme zamítnout. Výpočet toho dlouhého vzorečku nebylo z poloviny nutné dělat, protože jeho první část pouze váženě průměruje rozptyly. Jsou-li stejné, pak to bylo √(16(1/16+1/16)) 29.2 hledáme kritické t pro df=30, a=0,05: TINV(0,05;30)=2,04 střed intervalu bude v d = 2,8 a s[d]=1,4 (už víme) 95% CI = (2,8-2,04.1,4; 2,8+2,04.1,4) = (0; 5,6) 29.3 Cohenovo d = d/s[pooled] = 2,8/4 = 0,7 30.1 Studentovo t-rozložení s 21 stupni volnosti a průměrem 0 30.2 μ[1] – μ[2] = 0 30.3 ano; setkáváme se zde se situací, kdy každé pozorování z první skupiny (nadání studenta v 1. ročníku) můžeme spojit s pozorování ve druhé skupině (nadání téhož studenta ve 4. ročníku); vzorky tedy nejsou nezávislé a je třeba použít párový t-test 30.4 d' = 0,5 30.5 r = 0,24 30.6 s[d] = 0,25 30.7 rozdíl není statisticky významný (p > 0,05), pokrok v rozvoji hudebního nadání tedy není z tohoto hlediska prokazatelný 31.1H[0]: μ[1] – μ[2] = 0 31.2 6,20 31.3 0,70 31.4 2,34 31.5 ν = 48, [0,975]t(48) = 2,01 31.6 ano 31.7 μ[1] > μ[2], osnova, zdá se, má pozitivnější efekt na učení než čtení životopisů matematiků 31.8 90%CI = 1,65 +/- 1,68(0,70) = (0,47; 2,83) 31.9 d‘ = 1,65/2,49 = 0,66 32.1 párový t-test; H[0]: μ[1 ]- μ[2] = 0; d = 1; s[d] = (výpočet podle vzorečku) = 1; t = d/s[d ]= 1; ν = n – 1 = 8; p = TDIST(1;8;2) = 0,347; alternativní hypotéza byla na 5% hladině vyvrácena – sázku nevyhrál nikdo 32.2 TINV(0,05;8) = 2,31; 95% CI = (1 – (2,31*1); 1 + (2,31*1) = (-1,31; 3,31) 32.3 d' = 0,38 32.4 přítomnost korelace znamená, že výběry nejsou nezávislé – v různých fázích plesu má patrně chuť tančit různé množství tanečních párů bez ohledu na hrající kapelu 33. Štandardná chyba priemeru je 2,5. Potom nájdete pravdepodobnosť výberového priemeru viac ako 5 (25-20) od populačného priemeru 20. Pravdepodobnosť je 0,0455. 34. a) 2,6693 b) 0,9437 c) t=1,72; p=0,1288 35. odpoveď e; aj napriek tomu, že názov napovedá že by malo ísť o rozptyly, je to o porovnaní priemerov 3 a viac skupín. 36. pri uvedených dátach je potrebné na začiatku si ich vybrať zo všetkých dát a spočítť potrebné štatistiky a potom už klasicky počítať a dosadiť do vzorcov. V SPSS vyšli výsledky nasledovne: Group Statistics VAR00001 N Mean Std. Deviation Std. Error Mean VAR00002 muži 6 5.0000 2.36643 .96609 ženy 6 8.0000 1.78885 .73030 Na základe výsledkov nulovú hypotézu podržíme, t(5)=2,09; p=0,09, Cohenovo d = 0,68 (standardizujeme s[pooled]). I když je rozdíl poměrně velký, mohl vzniknout čistě náhodně. Důvodem je to, že kvůli záporné korelaci mezi muži a ženami jsou párové rozdíly mezi muži a ženami velmi heterogenní SD[(muž-žena)]=3,5. 37. Chí kvadrátom testom nezávislosti 38. a) v prvom rade ide o to, aby išlo o intervalovú premennú a aby daná premenná bola normálne rozložená (nerieši sa to aj je N väčšie ako 30). Tiež je potrebné pozerať na to, že párový t test je možné použiť, ak sú dve skupiny meraní založené na tej istej vzorke respondentov. Tu máme len 10 hodnotení, čiže by sme potrebovalu overiť normálnosť rozloženia. Otázne tiež môže byť, či je daná škála od 1 do 10 naozaj intervalová, teda či porota správne rozumie zadávaným bodom. b, c) výsledy vidíme z tabuliek z SPSS Paired Samples Statistics Mean N Std. Deviation Std. Error Mean Pair 1 rumba 7.2727 11 2.32770 .70183 valčík 5.9091 11 2.46798 .74412 Paired Differences t df Sig. (2-tailed) Mean Std. Deviation Std. Error Mean 95% Confidence Interval of the Difference Lower Upper 1.36364 2.20330 .66432 -.11656 2.84384 2.053 10 .067 39. Ak si určíme, že ide vždy o jednu rodinu, v ktorej je mladší a starší súrodenec, čiže by šlo o závislý výber, použijeme Wilcoxonov test.