Otázky k tématu 11 – neparametrické testy 1. Odpovězte na následující otázky: 1.1 Jakou nulovou hypotézu testuje test Mann-Whitney? 1.2 Jakou nulovou hypotézu testuje znaménkový test pro jeden výběr? 2. Následující otázky se týkají chí-kvadrátu: 2.1 Pro které z následujících účelů můžeme použít chí-kvadrát? a) srovnání relativních četností, H[0]: π[1] = π[2] b) určení, zda jsou dvě kategoriální proměnné nezávislé c) porovnat mediány ve dvou skupinách d) porovnat mediány ve třech a více skupinách 2.2 Který z c^2 testů je třeba použít, chceme-li zjistit, jestli je mezi 116 kluky a 78 holkami statisticky významný rozdíl v procentu leváků? a) c^2 test dobré shody b) c^2 test nezávislosti 2.3 Který z následujících symbolů reprezentuje kritickou hodnotu chí-kvadrátu se dvěma stupni volnosti při α = 0,05? a) [0,90]c[2]^2 b) [0,95]c[2]^2 c) [0,95]c^2 2.4 Která z následujících hodnot je nejvyšší? a) [0,90]c[1]^2 b) [0,95]c[1]^2 c) [0,99]c[1]^2 2.5 Která z následujících hodnot je nejvyšší? a) [0,95]c[1]^2 b) [0,95]c[2]^2 c) [0,95]c[3]^2 2.6 Známe při c^2 testu dobré shody očekávané relativní četnosti ještě dříve než začneme sbírat data? 2.7 Při c^2 testu nezávislosti kategoriálních proměnných (2x5 kategorií), který z následujících symbolů odpovídá kritické hodnotě chí-kvadrátu při α = 0,01? a) [0,99]c[1]^2 b) [0,99]c[4]^2 c) [0,99]c[5]^2 d) [0,01]c[4]^2 2.8 Když použijeme c^2 test dobré shody na rozložení proměnné o 8 kategoriích, jaká je kritická hodnota chí-kvadrátu při α = 0,05? 2.9 Když nám na 3x3 kontingenční tabulce vyjde hodnota c^2 = 9, je vztah mezi proměnnými významný na 5% hladině statistické významnosti? 3. Jaké jsou správné odpovědi? 3.1. Při n = 100, při jaké hodnotě π (relativní četnost) je směrodatná chyba σ[p] nejvyšší? (σ[p] = √(π(1-π)/n); zkuste to metodou pokus omyl). 3.2 Při n = 100 a π = 0,5, jaká je směrodatná chyba σ[p] ? 3.3 Kdybychom dělali opakovaně předvolební průzkum na 100hlavých vzorcích populace, v níž 50% lidí (π = 0,5) preferuje kandidáta A (i B), v kolika procentech průzkumů by nám vyšla nejméně 60% podpora kandidáta (p = 0,6)? 3.4 Pokud 80% populace souhlasí s určitým tématem, jaká je hodnota směrodatné chyby σ[p][ ]pro následující velikosti vzorků n = 25, n = 100 a n = 400 3.5 Jak byste zobecnili výsledky předchozí otázky: vztah mezi n a σ[p] ? 4. Odpovězte na následující otázky: 4.1 Ve vzorku 100 učitelů 50 preferovalo úkolovou mzdu. Vytvořte 95% interval spolehlivosti okolo p = 0,5. Použijte p ± 2σ[p]. 4.2 Pokud jsou všechny ostatní podmínky stejné, který z následujících intervalů spolehlivosti je nejširší? a) 90% interval spolehlivosti b) 95% interval spolehlivosti c) 99% interval spolehlivosti 5. Vyberte adekvátní statistický test: 5.1 Jaký statistický test či metodu je třeba k otestování hypotézy „Mezi počtem sourozenců (0,1,2,3,4 a více) a vlastnictvím magisterského či vyššího akademického titulu (má/nemá) není žádný vztah“. Své rozhodnutí zdůvodněte. 5.2 Jaký statistický test či metodu je třeba k otestování hypotézy „Muži a ženy se liší v úrovni dosaženého vzdělání“? Své rozhodnutí zdůvodněte. 6. V ročníku je 120 studentů, kteří se mohou rozhodnout mezi čtyřmi cvičícími seminářů ze statistiky. Použili jsme chí-kvadrát, abychom zjistili, jestli se volba cvičících statisticky významně liší od náhodné volby. 6.1 Jaká je očekávaná relativní četnost, π, pro každého cvičícího? 6.2 Jaká je kritická hodnota chí-kvadrátu při α = 0,05? 6.3 Pokud vypočítáme c^2 = 15,4, můžeme zamítnout H[0] na 5% hladině statistické významnosti? Na 1% hladině? A na 0,1% hladině? 7. Freud postuloval, že ženy mají nevědomou závist mužského penisu. Johnson (1966) testoval tuto hypotézu následovně. Studentům a studentkám byla zapůjčena tužka, s kterou měli vyplnit předložený test. Krabice s názvem „tužky“ byla umístěna vedle stolu, kam měli umísťovat vyplněné testy. Vyšetřující počítal, kolik mužů nebo žen vrátí tužku do krabice. Hypotéza zněla, že ženy si pravděpodobně častěji ponechají objekt podobný falu. Data byla konzistentní s hypotézou. Následující data jsou hypotetická, ale konzistentní s nálezy Johnsona. Proveďte test chí-kvadrát (Můžete uvést nějakou interpretaci, která by neměla co dělat se záviděním penisu?) 8. Specifikujte správné df pro každý z designů: 8.1 2 x 2 8.2 3 x 4 8.3 4 x 5 8.4 1 x 3 9. Diskutujete s kamarádem o tom, jak se policisté rozhodují zastavit řidiče za porušení dopravních předpisů. Trváte na tom, že policisté pravděpodobněji zastaví někoho, když existuje nějaká evidence o tom, že řidič nemá policisty rád. Získáte pomoc od 50 řidičů. Dvacet pět z nich požádáte, aby si dali na nárazník vozu nálepku se slovy „Stop policejní brutalitě!“ Ostatních 25 dostanou nálepku se slovy „Usmívejte se!“. Předpokládejte, že ve skutečnosti není žádný rozdíl v tom, jak jednotliví řidiči řídí. Za šest měsíců je zjištěno, kolikrát jednotlivé řidiče policisté zastavili. Řidiči, kteří vyjadřovali brutalitu, byli zastavení 18krát, ti s úsměvem pouze 5krát. Žádný z řidičů nebyl zastaven více než jednou. 9.1 Vyjádřete nulovou hypotézu 9.2 Specifikujte f[0 ] pro každou buňku. 9.3 Vypočtěte chí-kvadrát a test signifikance na hladině α = 0,05 9.4 Interpretujte výsledky. 10. Pro každou oblast, doplňte chybějící pozorované a marginální četnosti. Dále, vypočtěte f[e][ ] pro každé políčko. 11. Frank a Lester (1988) zjistili, že dospívající ve věku 15-24 let, častěji páchají sebevraždu v neděli. Následující hypotetická data jsou konzistentní s jejich výsledky. Proveďte výpočet chí-kvadrátu z těchto dat. 12. V padesátých letech, Samuel Steward opustil pozici univerzitního profesora a stal se tetovacím umělcem v Chicagu. Alfred Kinsey, proslulý výzkumník sexu, požádal Stewarda, aby si vedl deník jeho zkušeností a věnoval specifickou pozornost možným sexuálním motivacím, které vedou osobu k rozhodnutí, nechat si udělat tetování. Steward uváděl následující data: * 1724 chlapců po tom, co si nechalo udělat tetování, měli sex s dívkou. * 635 se porvalo. * 1031 se jich opilo (více než 800, kteří odpověděli, že měli sex, uváděli i toto) * 879 přiznalo, že masturbovali nad obdivem ze svého nového tetování. Hodí se tato data sama o sobě pro test chí-kvadrát? Jaké předpoklady pro tuto metodu jsou porušena, na základě způsobu vypovídání o jednotlivých zkušenostech? (Ignorujte fakt, že subjekty nejsou náhodný vzorek, ze všech, kteří si nechali udělat tetování.) 13. Výzkumník se zabývá vztahem mezi diabetem a protrahovaným hojením ran. Výzkumná otázka zní, jestli se u diabetiků častěji objevuje protrahované hojení. Otestujte hypotézu o nezávislosti diabetes a hojení na hladině α = 0,05. [c^2 =∑(f[o]-f[e])^2/f[e]] Hojení normální Hojení protrahované Celkem Diabetikové 125 329 454 Bez diabetes 245 111 356 Celkem 370 440 810 14. Dermatolog se zajímá o srovnání čtyř odlišných způsobů léčby lupů. Po šesti týdnech léčby kolega ohodnotí, zda se každý pacient zlepšil či ne. Existuje nějaký důvod usuzovat, že druhy léčby měly odlišný efekt na lupy? Stanovte alfa = 0,05. 15. Postgraduální studijní program v klinické psychologii má 2 výcvikové skupiny – kognitivně-behaviorální a psychoanalytickou. V prvním roce studia jsou studenti náhodně rozděleni do těchto dvou skupin. Profesora zajímá, zda se absolventi různých výcvikových skupin liší v základních dovednostech dělání rozhovoru. Proto po roce běhu obou výcvikových skupin analyzuje profesor videozáznamy zkušebního rozhovoru s klientem všech studentů a seřadí všech 12 studentů od nejhoršího po nejlepšího. Zde jsou výsledky: KBT Psychoanalýza 12 10 9 2 11 3 8 1 4 5 7 6 15.1 Formulujte nulovou a alternativní hypotézu a zvolte si 5% hladinu významnosti. 15.2 Zvolte test a nechte si ho spočítat (nebo to zkuste ručně podle Hendla) 15.3 Interpretujte výsledek. 16. Srovnáváme 3 postupy terapie panické úzkosti – hypnóza (treatment I), farmakoterapie (treatment II), gestalt terapie (treatment III). Po roce terapie jsou klienti klasifikováni podle míry ústupu symptomů oproti původnímu stavu do 2 kategorií – zlepšení (favorable) a nezlepšení (unfavorable). Počítejte s α = 0,05 a zjistěte, zda se na této hladině statistické významnosti liší léky ve svém účinku. Použijte standardizované reziduály R k určení, které buňky (pole tabulky) přispívají k signifikantnímu c^ 2 (R=(f[o]-f[e])/√f[e]). Interpretujte výsledky. 17. Jedna politická strana si udělala drobný předvolební průzkum. 17.1 Ze 100 náhodně vybraných respondentů by svůj hlas této straně dalo 10 %. Vytvořte 95% interval spolehlivosti pro procento příznivců strany v populaci. (p [relativní četnost; v procentech] má přibližně normální rozložení se směrodatnou chybou odhadu √[p(100-p)/n]) 17.2 Jaký by byl 95% interval spolehlivosti pro procento příznivců strany v populaci, kdyby jí svůj hlas dalo 90 % respondentů? 18. Máme 3 kandidáty na post v akademickém senátu: Adalberta, Beatrix a Ceslava. Studenti udělali malý předvolební průzkum na 100hlavém náhodném vzorku, v němž vyšlo, že Adalberta by volilo 40 lidí, Beatrix 32 a Ceslavovi by dalo svůj hlas 28 lidí. 18.1. Jaký test byste zvolili, abyste zjistili, zda má některý z kandidátů navrch (tj. zda p[A] p[B] ≠ p[C])? 18.2 Otestujte na 5% hladině statistické významnosti, zda má některý z kandidátů navrch (tj. zda p[A] = p[B] = p[C]). [c^2=∑(f[o]-f[e])^2/f[e])] 19. Terapeut po letech praxe formuluje domněnku, že mladší a starší sourozenci se od sebe v období adolescence odlišují co do úrovně pocitu důvěry ve vztahu s rodiči. Tuto hypotézu chce ověřit způsobem nezávislým na svém úsudku, a proto použije diagnostickou dotazníkovou metodu na měření pocitu důvěry ve vztahu s rodiči, kterou administruje padesátce dvojic sourozenců. Dotazníky pošle svému známému, který zrovna absolvoval kurz statistiky, a obdrží od něj následující výsledek: 19.1 Formulujte terapeutovu věcnou hypotézu a statistikovu nulovou hypotézu. 19.2 Proč asi zvolil statistik mezi jinými možnostmi právě tento test? 19.3 Zformulujte závěr této studie o rozdílu mezi mladšími a staršími sourozenci. 19.4 Co lze na základě prezentovaných statistik říci o velikosti případného rozdílu mezi mladšími a staršími sourozenci? 19.5 Jakým jiným testem by bylo možno terapeutovu hypotézu ověřit?