Otázky k tématu 10 – porovnávání středních hodnot 1. Uveďte správné odpovědi 1.1 Které z uvedených jsou statistické hypotézy? a) H[0]: μ = 100 b) H[0]: μ[1] – μ[2] = 0 c) H[0]: m[1] – m[2] = 0 1.2 Jsou výrazy μ[1] – μ[2] = 0 a μ[1] = μ[2] identické? 1.3 Lze hypotézu (b) z první otázky nazvat nulovou hypotézou? 1.4 Když budeme porovnávat pretestovou průměrnou hmotnost skupiny 100 dospělých v zeštíhlovacím programu s jejich posttestovou průměrnou hmotností, budou tyto dva průměry nezávislé? 1.5 Který z následujících symbolů označuje odhad směrodatné chyby rozdílu mezi dvěma průměry? a) s[m][1 ][ ][– ][m][2] b) σ[ m][1 ][ ][– ][m][2 ] c) s[m][ ] d) s^2[ m][1 ][ ][– ][m][2] 2. Následující otázky se týkají t-rozložení a t-testu: 2.1 Které z následujících požadavků nejsou teoreticky požadovány pro provádění t-testů s nezávislými výběry? a) proměnná normálně rozložená v obou populacích b) σ[1]^2 = σ[2]^2 c) velmi vysoké n 2.2 Když testujeme H[0]: μ[1] = μ[2] a n[1],n[2] jsou velmi malé, tvar t-rozložení je a) normální b) uniformní c) bimodální d) platykurtický 2.3 Pokud jsou všechny předpoklady splněny, ve které z následujících situací se bude t-rozložení nejméně lišit od normálního? a) n[1]=10, n[2]=10 b) n[1]=50, n[2]=20 c) n[1]=20, n[2]=20 2.4 Je t-rozložení s libovolným počtem stupňů volnosti symetrické se středem v 0? 2.5 Je-li nulová hypotéza pravdivá, jaká je nejpravděpodobnější hodnota t? a) 0 b) 1 2.6 Ve které z následujících situací je třeba ověřovat předpoklad normality před provedením t-testu? a) n[1]=5, n[2]=5 b) n[1]=10, n[2]=50 2.7 Co znamená předpoklad homoskedascity u t-testu pro nezávislé skupiny? Jak řešíme porušení tohoto předpokladu? Za jakých okolností můžeme tento předpoklad ignorovat? 2.8 Které z následujících výroků o předpokladech t-testu byly empiricky potvrzeny? a) t-test je robustní vzhledem k předpokladu normality. b) t-test je robustní vzhledem k předpokladu homogenity rozptylů jsou-li velikosti skupin stejné. c) t-test je robustní vzhledem k předpokladu nezávislosti pozorování 2.9 Je pravda, že [0,10]t[60] = –[ 0,90]t[60] ? (lze psát též [0,10]t (60)) 2.10 Budou při α = 0,05 s rostoucím n kritické hodnoty t klesat? 2.11 Co znamená standardní chyba rozdílu u t-testů pro nezávislé skupiny? 2.12 Jak ovlivňuje velikost vzorku t[krit ]a proč? 2.13 Jaká je výhoda možnosti použít závislý t-test oproti nezávislému? (Rada: Odpověď není, že by závislý test byl rychlejší pro výpočet.) 2.14 Pro shrnutí: vyjmenujte předpoklady použití t-testu a uveďte, které z nich a za jakých podmínek můžeme ignorovat. 3. Odpovězte na následující otázky: 3.1 Na které z uvedených hladin významnosti je nejmenší pravděpodobnost chyby I. typu? a) α = 0,10 b) α = 0,05 c) α = 0,001 d) α = 0,01 3.2 Kdy je nejmenší pravděpodobnost chyby II. typu, pokud jsou situace identické až na zvolenu α? a) při α = 0,10 b) při α = 0,05 c) při α = 0,001 3.3 Znamená větší velikost vzorku menší pravděpodobnost chyby I. typu? 3.4 Při konstantní hodnotě α, znamená větší velikost vzorku menší pravděpodobnost chyby II. typu? 3.5 Je-li nulová hypotéza pravdivá, lze se dopustit chyby II. typu? 3.6 Jakým způsobem ovlivňuje velikost vzorku pravděpodobnost zamítnutí nulové hypotézy? 4. Jaké jsou správné odpovědi? 4.1 Při ν = 60, α = 0,05 a s[m][1 – ][m][2] = 2,0, jak velký musí být rozdíl m[1] –m[2 ], aby mohla být H[0] zamítnuta? 4.2 Je-li ν = 60, jaké jsou kritické hodnoty pro t při α = 0,10, α = 0,05 a α = 0,01? 4.3 Pokud s[1]^2 = 50 a s[2]^2=100, za jakých podmínek bude s^2[pooled] = 75? 4.4 Pokud získáme hodnotu t = 2,0 při n[1]=11 a n[2]=11, která z následujících tvrzení jsou při α = 0,05 pravdivá? a) ν = 20 b) kritická hodnota t je 2,09 c) p > 0,05 d) 0,10 > p > 0,05 e) p < 0,05 f) p < 0,10 4.5 Pokud zjistíme u Wechslerova IQ v experimentální skupině průměr 109 a v kontrolní skupině průměr 100, jaká je velikost účinku? 5. Ve kterých z uvedených případů jde o korelovaná (závislá, párová) data? a) Síla měřená ve věku 10 a 12 u týchž 21 dětí. b) Ve věku 6 let jsou porovnávány průměrné skóry ve čtení 50 děvčat a 50 chlapců. c) Jsou porovnávány IQ skóry před terapií a po terapii u jedné skupiny pacientů. d) 5.440 studentů obecné psychologie je náhodně rozděleno do dvou skupin s různým seminárním programem. Jsou srovnávány průměrné výkony těchto dvou skupin v závěrečné písemce. e) Byl srovnáván výkon účastníků výzkumu ihned po experimentu a s několikatýdenním odstupem. f) Porovnávaly se relativní výkony 100 dětí v matematice a v češtině. 6. Předpokládejme, že badatel nerozpoznal v případě (a) z předchozí otázky, že jde o korelované skupiny a provedl t-test pro nezávislé skupiny. V čem by byly výsledky testu jiné? (ano-ne) a) Rozdíl m[1] – m[2] by byl jiný. b) Vypočtená hodnota s[m][1 – ][m][2 ]by byla příliš velká. c) Zjištěná testová statistika t by byla příliš nízká. 7. V nějakém výzkumu testujeme předpokládaný vliv proměnné „pohlaví“ na deset závislých proměnných. Provedli jsme tedy 10 t-testů pro nezávislé skupiny na 5% hladině statistické významnosti. U pěti z nich jsme zamítli nulovou hypotézu. 7.1 Jaká je pravděpodobnost, že nám alespoň jeden test (rozdíl) vyjde statisticky významný pouhou náhodou (tedy aniž by mezi muži a ženami existoval nějaký rozdíl)? a) p = 0,05 b) p > 0,05 c) p < 0,05 d) p = 0,95 e) p > 0,95 f) nelze odhadnout 7.2 Čeho jste v předchozí otázce určovali pravděpodobnost? 8. V okresním testu čtení bylo zahrnuto 14 úkolů. V celostátním šetření bylo použito stejných 14 položek. V tabulce níže jsou uvedeny percentuální úspěšnosti v okresním a celostátním šetření. Ověřte, zda hypotéza H[0]: μ[o] = μ[cs], je udržitelná na 5% hladině statistické významnosti. (Úkoly považujte za vzorek populace možných úkolů ze čtení.) 8.1 Jaký je rozptyl rozdílových skórů? 8.2 Jaká je směrodatná chyba průměru rozdílových skórů? 8.3 t = ? 8.4 Zamítáme H[0]? 8.5 Jaký je 95% CI pro μ[d] ? 8.6 Jsou statistickou jednotkou osoby nebo úkoly? 8.7 Která z následujících interpretací intervalu spolehlivosti je v tomto případě správná? a) Kdybychom těchto 14 úkolů zadali všem žákům v obou populacích, máme 95% jistotu, že hodnota μ[d ] je někde mezi -0,86% a 4,72%. b) Kdybychom zadali velké množství takových úkolů stejnému vzorku žáků, máme 95% jistotu, že okresní průměr μ[o] není o více než 0,86% nižší a o 4,72% vyšší než státní průměr μ[s]. 9. Chceme zjistit, jestli má určitá redukční dieta dlouhodobý efekt. Deset dospělých bylo zváženo před držením diety a pak ještě jednou o rok později. Rozdíl mezi prvním a druhým vážením má průměr 3,11 a směrodatnou odchylku 5,62. 9.1 Je H[0]: μ=0 platná na 10% hladině statistické významnosti? 9.2 Sestrojte 90% interval spolehlivosti pro μ. 10. 125 dětí se špatnými výsledky ve čtení bylo zařazeno do nápravného programu. Výsledky po 8 měsících účasti v programu jsou uvedeny v následující tabulce. 10.1 Bylo by vhodné použít jednostranný test? Jaké je kritické t pro α = 0,01 (jednostranně)? 10.2 Zvýšil se průměrný výkon ve čtení statisticky významně? 10.3 Bylo by možné zamítnout H[0]: μ[pre ]=μ[post] i na hladině α = 0,001 (jednostranně)? 10.4 Byl nárůst výkonu statisticky významně vyšší o více než 0,8 bodu na hladině významnosti α = 0,0005 (jednostranně)? 10.5 Dokazují tyto výsledky, že nápravný program je velmi efektivní? 11. Byl zjišťován efekt celodenního (E) navštěvování školky s efektem půldenního (C) navštěvování školky na dovednost ve čtení na konci druhé třídy. Srovnával se průměrný skór ve čtení 41 (E)-žáků se průměrným skórem 35 (C)-žáků. Výsledky shrnuje následující tabulka: 11.1 Proveďte t-test k vyhodnocení H[0]: μ[E] = μ[C] při α = 0,1. 11.2 Sestrojte 90% interval spolehlivosti pro rozdíl průměrů. 11.3 Odhadněte velikost účinku (Cohenovo d) 11.4 Dokazuje studie, že mezi absolventy E a C není žádný rozdíl ve čtení? 12. Autoři učebnice Glass a Hopkins provedli anonymní šetření mezi svými studenty a zeptali se jich, jak moc se jim líbí statistika. Výsledkem odpovědí 12 studentů byl průměr m[M]= 5,25 a rozptyl s[M]^2=6,57 a výsledkem odpovědí 31 studentek byl průměr m[Ž]= 4,37 a s[Ž]^2=7,55. 12.1 Existuje statisticky významný rozdíl mezi studenty a studentkami na 10% hladině? 12.2 Vytvořte 90% interval spolehlivosti pro každý průměr (ne pro rozdíl průměrů). 12.3 Vyjádřete rozdíl mezi průměry jako velikost účinku (Cohenovo d). 12.4 Kdyby uvedené popisné statistiky zůstaly stejné, ale velikost vzorku by se zečtveronásobila, zůstala by H[0] v platnosti? Srovnejte získané t s tím, které jste získali v první podotázce. 13.[1] Studie zkoumá hypotézu, zda dvouleté děti, které nemají sourozence, budou vykazovat větší strach v kontaktu s neznámými dětmi než dvouleté děti, které mají jednoho nebo více sourozenců. Každé dítě je umístěno do místnosti, kde si hraje s neznámým dítětem. Měření strachu je prováděno na základě pozorování chování, a to na škále od 1-žádný strach po 10-velká míra strachu. Pro následující data: 13.1 Specifikujte nulové a alternativní hypotézy. 13.2 Identifikujte t[krit ]pro α = 0,05, oboustranný test[2]. 13.3 Proveďte t-test. 13.4 Interpretujte výsledky s ohledem na kauzální předpoklady, které byly vzneseny o dítěti v kontaktu s cizími vrstevníky. 14. Sociální psycholog se zajímá o hypotézu, která říká, že úzkost zvyšuje mužskou náklonnost/příklon k ženám (Dunton and Aron, 1974). Všem subjektům je řečeno, že uslyší několik nepravidelných dávek intenzivního zvuku během experimentu na učení. Polovina subjektů má očekávat hlasitý zvuk (podmínka vysoké úzkosti) a druhá polovina příjemný zvuk (podmínka nízké úzkosti). Během čekání, než experiment začne, jsou subjekty umístěny do místnosti s ženou spojenkyní. Později jsou subjekty požádány o hodnocení atraktivity ženy na škále od 1-neatraktivní po 5-velmi atraktivní. Souhrn hypotetických statistik je uveden v tabulce: 14.1 Specifikujte nulové a alternativní hypotézy. 14.2 Testujte nulovou hypotézu na α = 0,05. Jaké je t[crit ]pro α = 0,05, oboustranný test? 14.3 Udělejte t-test. 14.4 Interpretujte výsledky. 15. U předchozí otázky předpokládejte, že rozptyly náklonnosti jsou vyšší: s^2[1 ]= 5,2 a s^2[2] = 5,4. 15.1 Proveďte t-test s α = 0,05. 15.2 Interpretujte nálezy. 15.3 Jaký efekt má vzrůstající variabilita na výsledné t[ ]a na závěr o nulové hypotéze? 16. Za použití rozptylů z předchozí otázky předpokládejte, že se počet subjektů v každé skupině zvýší na 30. 16.1 Proveďte t-test s α = 0,05. 16.2 Interpretujte výsledky. 16.3 Jaký efekt má zvýšení velikostí vzorku na výsledné t[ ]a na závěr o nulové hypotéze? 17. Badatel požádal náhodný vzorek 12 vysokoškolských studentů a studentek, aby si týden zaznamenávali, kdykoli je popadne zlost. Domnívá se totiž, že muži a ženy se liší v četnosti výskytu zlosti. Četnost zlostných reakcí za týden Pohlaví 16 M 18 M 15 M 20 M 9 M 13 M 9 Z 10 Z 8 Z 4 Z 14 Z 8 Z 17.1 Ověřte badatelovu hypotézu na 5% hladině statistické významnosti. Můžete počítat s tím, že proměnná „četnost zlostných reakcí za týden má přibližně normální rozložení. 17.2 Vytvořte 95% interval spolehlivosti pro rozdíl průměrů mezi muži a ženami? 17.3 Spočítejte velikost účinku. 17.4 Interpretujte výsledky. 18. Burke a Greenglass (1989) došli k závěru, že „být osamocený na vrcholu znamená být méně stresován.“ Autoři zjistili významný rozdíl mezi učiteli a řediteli při měření burnout syndromu, neboť učitelé vykazovali vyšší míru stresu. Následující data jsou hypotetická, ale konzistentní s jejich zjištěními: Učitelé Ředitelé 42 28 38 35 44 40 33 38 49 30 42 24 18.1 Specifikujte nulovou a alternativní hypotézu. 18.2 Ověřte na uvedených datech jejich hypotézu na 5% hladině statistické významnosti. Můžete předpokládat, že vyhoření je měřeno na intervalové škále a má v populaci přibližně normální rozložení. 18.3 Vytvořte 95% interval spolehlivosti na rozdíl mezi učiteli a řediteli. 18.4 Jaká je velikost účinku? 18.5 Interpretujte výsledky. 19. Sociální psycholog předpokládá, že lidé, kteří mají fobii z hadů, jsou schopni se k nim přiblížit, když věří, že neprožívají úzkost (Valins and Ray, 1967). Šedesát univerzitních studentů, kteří v dotazníku na konkrétní strachy uváděli děs z hadů, sloužili jako participující. Když studenti dorazili do laboratoře, byli vyzváni, aby se prošli kolem velkého nejedovatého hada a uchopili jej. Subjektům byl umístěn přístroj na měření srdeční frekvence, jehož součástí byl mikrofon, který vydával zvuky srdečního rytmu, takže studenti věřili tomu, že to byly nahrávky jejich vlastního rytmu. Situace byla sledována za dvou podmínek. Při podmínce vysokého arousalu, studenti slyšeli srdeční rytmus 120 úderů za minutu. Při podmínce nízkého arousalu, studenti slyšeli rytmus 75 úderů za minutu. Ve skutečnosti byly nahrávky pořízeny dopředu a neodpovídaly skutečným frekvencím u jednotlivých studentů. Hypotéza zněla, že studenti při podmínce nízkého arousalu věřící, že nezažívají úzkost, půjdou kolem hada mnohem blížeji než studenti z druhé skupiny. Studentům bylo řečeno, že mohou kdykoliv ukončit přibližování k hadovi, pokud se začnou cítit natolik nepříjemně, že by nemohli pokračovat. Značka na podlaze umožnila zjistit, jak blízko se zkoumané osoby přiblížili k hadovi. Následující hypotetická data prezentují výsledky. Nižší čísla znamenají větší přiblížení. Proveďte nezávislý t-test a interpretujte výsledky. α = 0,05. 20. Addison (1980) zjistil, že vnímáme odlišně vousaté muže a muže bez vousů. Ve srovnání s muži bez vousů, vousatí jsou častěji hodnoceni jako maskulinnější, více agresivní, silnější a více dominantní. Nejsou nicméně nahlíženi jako více inteligentní. Výzkumník použil opakované měření, ve které skupina subjektů posuzovala obrázky vousatých mužů a týchž mužů bez vousů. Následující data jsou hypotetická, ale reflektují výsledky Addisonovy studie týkající se vousatosti a maskulinity. Skór má rozsah od 1-feminní po 10-maskulinní. 20.1 Vyjádřete nulovou a alternativní hypotézu 20.2 Specifikujte t[krit ]pro α = 0,05, oboustranný test. 20.3 Proveďte t-test. 20.4 Interpretujte výsledky. 21. Ruth a kol. (1989) testovala hypotézu, že lidé budou preferovat nákup lihovin, pokud bude reklama na něj provázena sexuální symbolikou. Jedné skupině subjektů byla prezentována reklama se sexuálním obsahem a bez něj. Během každé podmínky měli subjekty vyjádřit pravděpodobnost koupě produktu. Sexuální symbolismus byl definovaný psychoanalyticky jako symbolické zobrazení genitálií a sexuálního styku, např. jako láhev umístěná do vánoční punčochy s hrdlem, které trčelo dopředu. Asexuální scénu demonstroval např. pohled do krajiny na pasoucí se krávy. Data jsou hypotetická, reflektující ale zjištěné výsledky. Vyšší skóry indikují větší ochotu koupit lihový produkt. 21.1 Uveďte nulovou a alternativní hypotézu 21.2 Specifikujte t[krit ]pro α = 0,05, oboustranný test. 21.3 Proveďte t-test. 21.4 Interpretujte výsledky. 22. Průmyslový psycholog pracující pro marketingovou firmu chce vědět, který ze dvou sýrů preferují univerzitní studenti. První chutnají goudu, potom švýcarský sýr. Chuťové posouzení je vyjádřeno na škále od 1-hnusný po 7-fantastický. (Bonusová otázka: Jak byste upravili design této studie, abyste odstranili zřejmou experimentální „marnost“?) 22.1 Vyjádřete nulovou a alternativní hypotézu 22.2 Jaké je t[krit ]pro α = 0,05, oboustranný test? 22.3 Proveďte t-test. 22.4 Interpretujte výsledky. 23. Psycholožka testuje nový lék na nespavost. Čas potřebný pro usnutí (v minutách) je hodnocen před užíváním léku během jednoho týdne - pretest. Skóry posttestu reprezentují čas potřebný k usnutí v týdnu následujícím po administraci léku. Ověřte, zda došlo po užití léku ke zlepšení. Subjekt pretest posttest 1 120 30 2 60 40 3 90 30 4 100 80 5 110 70 6 50 30 7 70 40 8 80 60 9 100 100 10 90 100 11 100 90 23.1 Zvolte test, formulujte hypotézu a ověřte ji na 5% hladině statistické významnosti. 23.2 Vytvořte 95% interval spolehlivosti pro rozdíl průměrů. 23.3 Spočítejte velikost účinku léku na čas potřebný na usnutí (stačí odhad) 24.[3] Lékař se zajímá o srovnání relativních účinků syntetického anabolického steroidu a nedávno vyrobeného přírodního růstového stimulantu pro přírůstek na váze. Šestnácti pacientům v sanatoriu jsou náhodně určeny dvojí podmínky léčby. Jedna skupina (N = 8) přijímá steroidy v následujících 30 dnech a druhá skupina (N = 8) naopak konzumuje růstový stimulant. Závislou proměnnou je množství přírůstku na váze po 30 dnech. 24.1 Vyjádřete nulovou a alternativní hypotézu 24.2 Jaké je t[krit]? 24.3 Jaké je naměřené t? 24.4 Interpretujte zjištění. 25. Jiný výzkumník se zajímá o stejný problém jako v otázce 7. Čtyři subjekty dostávají po 30 dnů steroidy, po nichž následuje 30denní perioda kdy berou růstový stimulant. Odlišná skupina 4 pacientů přijímá obě látky v obráceném pořadí. Použijte minulá data a proveďte vhodný t-test. 25.1 Vyjádřete nulovou a alternativní hypotézu 25.2 Jaké je t[krit]? 25.3 Jaké je naměřené t? 25.4 Interpretujte zjištění. 26. Studie v časopise Chronicle of Higher Education (1990) ukázala, že studenti napsali kvalitnější práci, když použili IBM-kompatibilní počítač oproti počítači Macintosh. Jedno z vysvětlení je, že Macintosh je tak „přátelský k uživateli“, že studenti měli tendenci psát velmi nedbale. Následující hypotetická data jsou založena na opakovaném měření. Každý ze subjektů psal práci na obou počítačích. Interpretace výsledků závislého testu je konzistentní s výsledky originální studie. Každý hrubý skór v tabulce reprezentuje složený index délky práce a její kvality. Vyšší čísla reflektují větší kvantitu a kvalitu. α = 0,05. 27. Výrobce slunečních brýlí chce vědět, zda je schopnost prostorového vidění ovlivňována barvou čoček. Provedl experiment, v němž první polovina účastníků (SK=1) absolvovala test prostorového vidění (TPV) s modrými čočkami v brýlích a druhá polovina (SK=2) se žlutými čočkami v brýlích. Výsledky experimentu jsou uvedeny v tabulce níže. Vyšší skór v testu znamená lepší prostorové vidění. SK TPV 1 12 1 14 1 17 1 16 1 14 1 11 2 15 2 5 2 9 2 12 2 10 2 9 27.1 Zvolte test, formulujte hypotézu a ověřte ji na 5% hladině statistické významnosti. 27.2 Vytvořte 95% interval spolehlivosti pro rozdíl průměrů. 27.3 Spočítejte velikost účinku barvy čočky na prostorové vidění. 28. Badatel se zabývá sourozeneckými konstelacemi. Konkrétně ho zajímá, zda starší bratři bratrů se v dominanci liší od mladších bratrů bratrů. Získal 16 dvojic takovýchto sourozenců – 16 mladších bratrů bratrů a 16 starších bratrů bratrů a měřil jejich dominanci. Výsledky byly následující: Starší: m[1] = 12,5 s[1] = 4 Mladší: m[2] = 10 s[2] = 4 Korelace mezi staršími a mladšími sourozenci byla 0,5. 28. 1 Zvolte test, formulujte hypotézu a ověřte ji na 5% hladině statistické významnosti. 28.2 Vytvořte 95% interval spolehlivosti pro rozdíl průměrů. 28.3 Vypočítejte velikost účinku. 28.4 Předpokládejme, že badatele zajímá trochu jiná hypotéza: zda se starší bratři bratrů v dominanci liší od všech ostatních sourozeneckých konstelací. Použil data od 16 starších bratrů bratrů z původního výzkumu (tzn. s průměrnou dominancí 12,5 a směrodatnou odchylkou 4). Je známo, že standardizovaný test, kterým jejich dominanci měřil, má v běžné populaci μ = 10 a σ = 4. Formulujte hypotézu a ověřte ji na 1% hladině statistické významnosti. 29. Ve svém dalším výzkumu se tentýž badatel zabývá sourozeneckými konstelacemi a přenosem jejich vlivu mezi generacemi. Zajímá ho, zda starší bratři bratrů, kteří mají otce staršího bratra bratrů, se v dominanci liší od starších bratrů bratrů, kteří nemají otce staršího bratra bratrů. Získal 32 respondentů – starších bratrů bratrů, z nichž 16 mělo otce staršího bratra bratrů a 16 mělo otce pocházejícího z jiných sourozeneckých konstelací, a měřil jejich dominanci. Výsledky byly následující: S otcem starším bratrem bratrů: m[1 ]= 12,8 s[1 ]= 4 S otcem z jiné souroz. konstelace: m[2 ]= 10 s[2 ]= 4 29.1 Formulujte hypotézu a ověřte ji na 5% hladině statistické významnosti. 29.2 Vytvořte (1-α) interval spolehlivosti pro rozdíl průměrů. 29.3 Vypočítejte velikost účinku. 30. Vyšetřili jsme třídu 22 dětí testem hudebního nadání v 1. a 4. ročníku. Třída se učí podle osnov, které mají podporovat rozvoj této oblasti nadání. Ředitel chce vědět, zda program vede k prokazatelným pokrokům v rozvoji hudebního nadání. Od své školní psycholožky dostal ředitel následující výpočty (ze SPSS), avšak bez komentáře: T-Test Paired Samples Statistics Mean N Std. Deviation Std. Error Mean Pair 1 hud_dovednost_1.rocnik (z-skor) [H1] 1,0000 22 1,21499 ,25904 hud_dovednost_4.rocnik (z-skor) [H4] 1,6000 22 1,19523 ,25482 Paired Samples Correlations N Correlation Sig. Pair 1 H1 & H4 22 0,525 0,012 Paired Samples Test Paired Differences t df Sig. (2-tailed) Mean Std. Deviation Std. Error Mean 95% CI of the Difference Lower Upper Pair 1 H1 – H4 -0,600 1,17514 0,25054 -1,02103 0,02103 1,99 21 0,059 30.1 Popište výběrové rozložení průměrného rozdílu mezi 1. a 4. třídou, platí-li H[0.] 30.2 Jakou statistickou hypotézu paní psycholožka testovala? 30.3 Použila vzhledem k doposud uvedeným informacím adekvátní test pro svou hypotézu? (zdůvodněte odpověď) 30.4 Dopočítejte za paní psycholožku zjištěnou velikost účinku (stačí odhadnout). 30.5 Ředitel nerozumí ukazateli, který jste právě spočítal(a), ale pamatuje si ze školy něco o korelacích. Převeďte mu jej na r. 30.6 Jak velká je směrodatná chyba průměrného rozdílu mezi prvním a čtvrtým ročníkem? 30.7 Co byste na základě uvedených dat a úvah, k nimž vám dovedly předchozí otázky, doporučili panu řediteli? 31. Byl uspořádán experiment na zjištění efektu poskytnutí osnovy látky, která má být naučena. Padesát vysokoškolských studentů matematiky bylo rozděleno na 2 skupiny. První skupině byla ještě před studiem 10stránkového materiálu o topologii promítnuta osnova látky, kterou tento materiál pokrýval. Druhá skupina si místo osnovy před studiem přečetla desetistránkový životopis Eulera a Riemanna. Na konci experimentu dostaly obě skupiny test z topologie. Počet správně zodpovězených otázek je naší závislou proměnnou. Skupina 1 (osnova) n[1] = 25 m[1] = 7,65 s[1]^2 = 6,50 Skupina 2 (životopisy) n[2] = 25 m[2] = 6,00 s[2]^2 = 5,90 31.1 Formulujte H[0]. 31.2 Jaká je hodnota odhadu rozptylu z obou skupin s^2[pooled] ? 31.3 Spočítejte s[m][1 – ][m][2] 31.4 Spočítejte t. 31.5 Jaká je kritická hodnota t pro α = 0,05? 31.6 Je H[0] zamítnuta? 31.7 Závěr tedy je… 31.8 Sestrojte 90% interval spolehlivosti pro rozdíl průměrů. 31.9 Vyjádřete rozdíl průměrů jako velikost účinku. 32. Dvě dechové kapely – Božejáci a Vlkošáci – se přou, kdo lépe hraje do tance. Svou sázku se dohodnou rozhodnout tak, že se na jednom společném plese budou ve hraní střídat (B-V-pauza-B-V-pauza...) a arbitr bude z balkónu zaznamenávat počet tančících párů. Na koho budou lidé víc tancovat, vyhrál. Na průkazné vítězství je potřeba statisticky významný rozdíl na 5% hladině významnosti. Arbitrova data jsou uvedena níže v tabulce. (Předpokládejme, že počet tanečníků je přibližně normálně rozložen. Je možné, že někteří z vás zvolí cestu řešení, při které budou potřebovat korelaci mezi hodnotami Božejáků a Vlkošáků. Činí 0,333. Aby vám výpočty nepřerostly přes hlavu, zaokrouhlete směrodatné odchylky na celé číslo.) Božejáci Vlkošáci 1. píseň 6 5 2. píseň 4 8 3. píseň 5 6 4. píseň 8 2 5. píseň 12 11 6. píseň 5 6 7. píseň 10 7 8. píseň 8 4 9. píseň 5 5 32.1 Vyhrál někdo sázku a pokud ano, kdo? 32.2 Vytvořte 95% interval spolehlivosti pro rozdíl mezi Božejáky a Vlkošáky z předchozí úlohy. 32.3 Jaká je velikost účinku (rozdílnosti kapel na tančení)? Je to hodně, středně, málo? 32.4 Korelace mezi Božejáky a Vlkošáky byla 0,333. Popište vlastními slovy, co to v tomto konkrétním případě znamená. Čím by mohla být způsobena? Pozn.: Dobrým cvičením jsou také úlohy v kapitolách 9 a 10 studijní příručky manželů Aronových (zejm. str. 190, 191, 215-217). ________________________________ [1] Při provádění t-testu u následujících otázek předpokládejte oboustranný test (two-tailed), pokud není specifikováno jinak. [2] Pokud budete postupovat podle přednášek, stanovíte si v tomto kroku pouze hladinu statistické významnosti. Autor otázek zde předpokládá alternativní postup, kdy si nejdříve stanovíme tzv. kritickou hodnotu, pro kterou platí, že pravděpodobnost získání této hodnoty nebo vyšší je přesně α. Extrémnější hodnoty jsou pak méně pravděpodobné a vedou tedy zamítnutí nulové hypotézy. [3] Následující dvě otázky od Vás vyžadují rozhodnout, který t test je pro design studie vhodný.