Otázky k lineární korelaci 1. Jaká je odlišnost mezi korelačním a experimentálním designem? Proč nabízí experimentální design možnost formulace kauzálních tvrzení o vztahu mezi dvěma proměnnými? 2. Uveďte příklad proměnných, které korelují pozitivně a proměnných korelujících negativně. 3. Jaké informace můžeme shromáždit na základě bodového grafu (scatter plot)? 4. Je dán soubor z-skórů, jaká je korelace mezi X a Y? 5. Odhadněte r pro každý z těchto bodových grafů: 6. Jsou dány následující korelace a stupně volnosti. Jaké jsou kritické/mezní r pro 5 procentní a 1 procentní hladinu významnosti? V každém z případů rozhodněte, zda byste přijali nebo zamítli nulovou hypotézu, a to na 5 i 1 procentní hladině (zkuste to v excelu, ať to nemusíte počítat 8x) : 7. Pro následující soubor dat: a. Spočítejte r (funkcí v excelu) a proveďte oboustranný test významnosti na hladině a = 0,05. b. Specifikujte nulovou a alternativní hypotézu. c. Jaké je kritické r? d. Přijímáte nebo zamítáte nulovou hypotézu? e. Jaké procento rozptylu Y je vysvětleno rozptylem X? 8. Pro následující soubor dat: a. Spočítejte r (funkcí v excelu) a proveďte oboustranný test významnosti na hladině a = 0,05. b. Specifikujte nulové a alternativní hypotézy. c. Jaké je kritické r? d. Přijímáte nebo zamítáte nulovou hypotézu? e. Jaké procento rozptylu Y je vysvětleno rozptylem X? 9. Pro následující soubor dat: a. Spočítejte r (funkcí v excelu) a proveďte oboustranný test významnosti na hladině a = 0,05. b. Specifikujte nulové a alternativní hypotézy. c. Jaké je kritické r? d. Přijímáte nebo zamítáte nulovou hypotézu? e. Jaké procento rozptylu Y je vysvětleno rozptylem X? 10. Pro následující soubor dat: a. Spočítejte r (funkcí v excelu) a proveďte oboustranný test významnosti na hladině a = 0,05. b. Specifikujte nulové a alternativní hypotézy. c. Jaké je kritické r? d. Přijímáte nebo zamítáte nulovou hypotézu? e. Jaké procento rozptylu Y je vysvětleno rozptylem X? 12. Zodpovězte následující otázky, je-li dán soubor dat: a. Spočítejte r (funkcí v excelu) a proveďte oboustranný test významnosti na hladině a = 0,05. b. Specifikujte nulové a alternativní hypotézy. c. Jaké je kritické r? d. Přijímáte nebo zamítáte nulovou hypotézu? e. Jaké procento rozptylu Y je vysvětleno rozptylem X? 13. Nakreslete bodové grafy pro data z otázek č. 7, 8, 9 a 12 (zkuste si to i v Excelu, SPSS, či Statistice). 14. Pro skupinu 75 subjektů se ∑(z[x] z[y] ) = 64. Jaké je ρ? 15. Jakým způsobem ovlivňuje variablita výběrových skórů velikost korelace? 16. Jakým způsobem ovlivňuje korelaci použití extrémních skupin? 17. Jestliže použijete Pearsonův korelační koeficient na spočítání korelace v případě, kdy je vztah mezi X a Y nelineární, jaký to má vliv na r? 18. Sportovní psycholog se zajímá o vztah mezi počtem týdnů cvičení a klidovým srdečním tepem. Na základě dat určete: a. Jaké je r (Excel :-)? b. Jaké jsou nulové a alternativní hypotézy? c. Jaké je kritické r pro nepřímý test na 5 procentní hladině významnosti? d. Jaké procento rozptylu klidového srdečního tepu je vysvětleno počtem týdnů cvičení? e. Měli byste akceptovat nebo zamítnout nulovou hypotézu? 19. Školní psycholog předpokládá vztah mezi IQ a počtem sourozenců. Z uvedených dat odpovězte na otázky: a. Jaké je r (Excel :-)? b. Jaké jsou nulové a alternativní hypotézy? c. Jaké je kritické r pro nepřímý test na 5 procentní hladině významnosti? d. Jaké procento rozptylu klidového srdečního tepu je vysvětleno počtem týdnů cvičení? e. Měli byste akceptovat nebo zamítnout nulovou hypotézu? 20. Psycholog se zajímá o sílu asociace mezi věkem a vykonáním určitých úkolů, které vyžadují motorické dovednosti. Načrtněte scatter pro následující data a rozhodněte o nejvhodnějším postupu pro testování hypotézy: Otázky pro počítačové zpracování: 21. Baron, Logan a Kao (1990) studovali vztah mezi nepohodlím pacientů, které bylo posuzováno studenty stomatologie a samotnými pacienty. Nepohodlí bylo definováno jako kombinace úzkosti, bolesti a distresu (nižší hodnoty/čísla indikují nižší nepohodlí). Jednotlivé hodnoty byly získány za dvou podmínek: během vrtání a během umístění pryžové hráze kolem zubu. (Pryžová hráz je gumová pochva okolo zubu, která je připojena na kovový rámec, izoluje zub a tím brání tomu, aby byly úlomky spolknuty. Umístění této hráze vyžaduje zvýšenou pozornost ze strany zubaře než jednoduchá výplň zubu). Korelace mezi nepohodlím posuzovaným studenty stomatologie a samotnými pacienty byly spočítány za obou podmínek. Korelace mezi hodnoceními během vrtání byly významné: r(41) = +0,52, p < 0,05. Korelace během umístění hráze mezi hodnocením studenty stomatologie a pacienty byly také významné, ale o hodně menší: r(41) = +0,21, p < 0,05. Autoři spekulují, že schopnost postihnout distres pacientů závisí na tom, co dělají… „a že být senzitivní vůči stresu vyžaduje značnou kapacitu pozornosti (s. 151).“ Následující soubor dat je hypotetický. Hodnoty jsou vybrány, takže vaše korelace povedou k závěrům, které jsou konzistentní s autory. Nezapomeňte prověřit scattery dat. 22. Carrie (1981) zkoumala vztah mezi podáváním zpráv o symptomech během těhotenství a během menstruace a asociací těchto zpráv s obecnou tendencí podávat zprávy/vypovídat o psychologických a fyzikálních symptomech. Kromě jiného zjistila významnou korelaci mezi počtem symptomů zažívaných během menstruace a počtem symptomů, o kterých podávaly zprávy během těhotenství. Následující data jsou hypotetická a povedou vás ke korelacím, které jsou konzistentní s hladinou významnosti, jak ji lze nalézt ve studii Carrie. Odpovědi 1. V korelačním designu je studie vedena bez možnosti kontroly nad studovaným fenoménem. V experimentálním designu některé procedurální proměnné zůstávají konstantní a jinými se účelově manipuluje. Manipulací NP v experimentálním designu existuje větší pravděpodobnost, že budete schopni ukázat kauzální vztah, který má efekt NP na ZP. 3. Odhad výšky korelace, směr korelace (pozitivní/negativní apod.), lineárnost a přítomnost odlehlých hodnot. (Kritické hodnoty pro h jsou přibližné, založené na df = 100) 13. Grafy: 15. Omezený rozsah skórů může podhodnotit velikost korelace v populaci. 16. Použití extrémních skupin může zvýšit velikost korelace. 17. r bude podhodnocovat ρ. 20. Graf: Otázky k lineární regresi 1. Jaké jsou dvě důležitá použití regresní analýzy? 2. Co znamená, že regresní přímka je založená na metodě nejmenších čtverců? 3. Proč nemůže být ∑( Y – Y’) použita jako ukazatel chyby odhadu? 4. Jestliže r = 0, čemu musí být b rovno? 5. Popište, jakým způsobem se r vztahuje k predikci/odhadu chyby. 6. Když použijete směrodatnou odchylku reziduálních hodnot jako ukazatel chyby predikce, proč je důležitý předpoklad homoskedascity? 7. Proč musí být výzkumník opatrný, použije-li rovnici predikce u jedince, které má odlišné charakteristiky od lidí, kteří byli zahrnuti v originálním vzorku, z kterého byla rovnice regrese odvozena? 8. Ve studiu tolerance k bolesti se výzkumník zajímá o predikci/odhad doby, během které jsou subjekty schopni udržet ruce ve velmi ledové vodě. Z dřívějšího výzkumu ví, že příjem vitamínu E během minulých 12 hodin koreluje s tolerancí bolestivého stimulu, přinejmenším, pokud je jím zmrzlá voda. Následující tabulka ukazuje páry skórů pro studovaný vzorek: a. Jaká je směrnice b (potřebné statistiky si nechte spočítat v excelu)? b. Jaký je průsečík a? c. Jaké je směrodatná odchylka chyb odhadu s[e] ? d. Jaký čas tolerance byste predikovali někomu, kdo si vzal ráno při studii 16 jednotek vitamínu E? 9. Sociolog se zajímá o predikci ročního platu (Y) založenou na dřívější úrovni vzdělání (X). Úroveň vzdělání je definována jako počet let školní docházky. Následující data byla získána od 6 subjektů: a. Jaká je směrnice b (potřebné statistiky si nechte spočítat v excelu)? b. Jaký je průsečík a? c. Jaké je směrodatná odchylka chyb odhadu s[e] ? d. Jaký příjem byste odhadovali pro někoho s desetiletou docházkou? 10. Vstupní komise potřebuje odhadnout, zda určitý student bude schopný získat potřebné známky během prvního roku na vysoké škole. Aby prošel prvním rokem, musí dosáhnout 3,00 GPA (průměrný prospěch, vyšší čísla lepší) v prvním semestru na univerzitě. Vstupní komise má data z dřívějších let, a to GPA ze střední školy a GPA z prvního roku na univerzitě. Data jsou následující: a. Jaké je b? b. Můžete přijmout studenta se středoškolským GPA = 3,00? c. Mezi jakými hodnotami výsledků GPA v prvním roce na univerzitě by se mělo ocitnout 68% studentů, kteří vstupovali do studia se středoškolským GPA = 3,67- Otázky pro počítačové zpracování 11. Na základě otázky č. 21 k lineární korelaci, vypočítejte rovnici regrese a s[e] pro obě podmínky. Jestliže během vrtání student stomatologie ohodnotí pacientovo nepohodlí 7, jak byste odhadli/predikovali hodnocení nepohodlí samotným pacientem? Odpovězte na stejné otázky i pro druhou podmínku a určete standardní chybu odhadu. 12. Na základě otázky č. 22 k lineární korelaci, pro ženu, která vypovídá o 54 menstruačních symptomech, určete, o kolika symptomech bude vypovídat během těhotenství? Identifikujte dvě hodnoty těhotenských symptomů, mezi kterými se nachází 68 procent žen, které vypovídají o 54 menstruačních symptomech. Odpovědi 1. Regresní analýza je důležitá pro predikce týkající se praktických problémů a při budování a testování teorií. 2. Regresní přímka je k bodovému grafu v takovém vztahu, že suma druhých mocnin odchylek jednotlivých bodů od regresní přímky (∑e^2 ) je minimalizována. 3. ∑( Y – Y‘) = 0. 4. Jestliže r = 0, pak b = 0. 5. Se vzrůstající korelací, chyba odhadu klesá. 6. Předpoklad homoskedascity nám umožňuje předpokládat, že s[e] je stejné pro každou hodnotu X. Jestliže by bylo každá úroveň X spojena s jinak distribuovanými chybami, musela by být pro každý skór X odlišná chyba odhadu. 7. Generalizace na populaci odlišné od té, z které jsme získali regresní rovnici, může vést k neplatným predikcím..