PSY252 - Statistická analýza dat II. podzim 2017 Kurz Katedry psychologie, Fakulta sociálních studií, Masarykova univerzita, Brno. Vyučující Mgr. Stanislav Ježek, PhD. – garance kurzu, přednášky, semináře jezek@fss.muni.cz, 549494616, konzultační hodiny: středa 10 – 12, FSS 2.47 Mgr. Vít Gabrhel – semináře Mgr. Petra Daňsová – semináře Charakteristika kurzu Cílem kurzu je rozšířit znalosti základů statistiky o statistické modely s více než dvěma proměnnými používané v psychologickém výzkumu a prohloubit porozumění základním principům statistiky. Studenti získají dovednost posoudit vhodnost dat pro multivariační zpracování a hypotetizovat a ověřovat běžné vícerozměrné modely dat s pomocí statistického software. Proto je explicitním cílem také seznámení se s programy SPSS (popř. Statistica, R), a osvojení si základních návyků jejich užívání. Kurz klade důraz i na komunikaci, tj. slovní popis výsledků i schopnost porozumět takto popsaným výsledkům v empirických kvantitativních studiích. V rámci kurzu jsou studenti seznamováni paralelně s českou i anglickou terminologií, aby byli po skončení kurzu schopni dále studovat, používat internetové zdroje a používat statistický software. Návaznosti kurzu Kurz navazuje na PSY117 – Statistická analýza dat. Oba kurzy úzce souvisí s výukou metodologie. Mnoho problémů v metodologii má statistický základ a naopak mnohé problémy či omezení statistiky je potřeba zohledňovat v metodologii. Doporučené pořadí absolvování kurzů je PSY117 v jarním semestru a PSY252 + PSY112 v podzimním semestru. Toto propojení je nezbytné pro vypracování diplomové práce a je součástí požadavků při státní bakalářské zkoušce. Vhodným doplněním je volitelný kurz PSY232, který je úvodem do analýzy dat pomocí R. Na statistice stojí také značná část psychometriky a tvoří tak přirozený základ pro studium psychodiagnostiky na magisterském stupni. Předpokladem pro studium základů statistiky je běžné středoškolské matematické vzdělání. Organizace kurzu Počet kreditů: 5 Ukončení kurzu: zkouška Přednášky: 2 hodiny jednou za 2 týdny Semináře: 2 hodiny jednou za 2 týdny Do seminárních skupin se studenti zapisují prostřednictvím informačního systému MU. InformaČní systém MU V informačním systému MU části Studijní materiály k předmětu PSY252 umisťujeme podklady k tématům uvedeným v sylabu především v podobě prezentací, odkazů na další zdroje informací a seminárních materiálů. Na stejném místě jsou též k dispozici pokyny nezbytné k plnění písemných úkolů, popř. doplňky k tomuto sylabu. KOMUNIKACE S VYUČUJÍCMI Preferovaným komunikačním kanálem pro osobní komunikaci týkající se kurzu je email. Používejte prosím „PSY252“ v předmětu svých emailů. Urychlíte tím jejich vyřízení. Emaily adresujte dr. Ježkovi. Pouze v případě záležitostí, které se týkají specificky seminářů ostatních vyučujících, pište jim. V případě dotazů týkajících se látky kurzu, využívejte prosím v maximální možné míře Facebookovou diskuzní skupinu „Statistika, metodologie, psychometrika“ http://goo.gl/Mt95eT. Je pravděpodobné, že odpověď na Váš dotaz by mohl zajímat i Vaše spolužáky, a byla by proto škoda uzavřít takovou komunikaci do soukromí emailů. Všichni vyučující kurzu skupinu pravidelně sledují a přispívají do ní. Požadavky na ukonČení kurzu Seminární práce V průběhu semestru mají studenti v malých týmech (2-3 lidé) za úkol zpracovat řadu (5-6) analýz, které pak budou prezentovány v seminářích. Analýzy zpracovávají do krátké zprávy ve formátu APA, zejména co se týká prezentace výsledků analýz v textové, tabulkové a grafické podobě. Jejich 100% realizace a přijetí je předpokladem k tomu, aby se student mohl přihlásit ke zkoušce. Úkoly jsou zadávány na přednáškách a v případě potřeby doplňovány informacemi v IS MU. Práce lze odevzdávat pouze elektronicky v odevzdávárně ve studijních materiálech předmětu. Práce vkládejte do odevzdávány nejpozději v pondělí předcházejícím semináři, na kterém budou analýzy prezentovány. Jméno vkládaného souboru s prvním seminárním úkolem musí být S1.doc, S2.doc pro druhý atd.[1] a nic víc; IS k němu automaticky přidá jméno vkládajícího studenta. Komentář/popisek nechejte nevyplněný. Seminární úkoly budou týmy prezentovat na seminářích. Kvalita jejich zpracování bude hodnocena pouze na škále: přijat - nepřijat. „Nepřijetím“ je míněno vrácení k přepracování. Na přepracování má tým týden od semináře, na němž jsou analýzy prezentovány. Opravené práce vkládejte do ISu do stejné odevzdávárny jako práce původní. Jako jméno vkládaného souboru nyní použijte S1o.doc. Komentář/popisek opět nechejte nevyplněný. Průběžný test Průběžný test ověřuje teoretické znalosti z okruhu 1, který je opakováním a rozšířením základů statistické analýzy. Je možné v něm získat 15 bodů. Zápočtový test Zápočtový test ověřuje základní teoretické znalosti z obsahu PSY252. Je možné v něm získat 25 bodů. Zápočet je udělen při zisku alespoň 15b. Zkouška Kurz je zakončen zkouškou. Přihlášení ke zkoušce je podmíněno splněním všech seminárních úkolů a udělením zápočtu. Zkouška je individuální a má podobu zpracování zadané analýzy s využitím statistického software a rozpravy nad touto analýzou. Je možné za ni získat 25b. K úspěšnému složení zkoušky je nutné získat minimálně 15b. Písemná část zkoušky je časově omezená a je při ní možné využívat vlastní studijní materiály (učebnice, poznámky). Zkouší se v rozsahu látky, který je vymezen v tomto sylabu k předmětu PSY252. Celkové hodnocení Celkové hodnocení bude používat následující stupnici součtu zápočtových a zkouškových bodů: A: 65 - 60b B: 59 – 54b C: 53 – 48b D: 47 – 42b E: 41 – 37b F: 36 a méně bodů. Uznávání dříve absolvovaných kurzů statistiky Žádosti o uznání v tomto případě zasílejte na mail jezek@fss.muni.cz. V předmětu zprávy použijte „uznani PSY252“ (bez diakritiky). V případě žádosti o uznání kurzů z jiné fakulty či univerzity, uveďte též odkaz na sylaby absolvovaných kurzů, popř. sylaby přímo přiložte. Žádosti zasílejte do konce 2. týdne semestru. Později zaslaným žádostem nebude vyhověno. Omluvy Omluvy jsou přijímány pouze předem. Pozdější omluvy budou akceptovány, pouze pokud šlo o nepředvídatelné případy. Víte-li o tom, že budete mít ze závažných důvodů problémy s dodržením některého z termínů, informujte nás o tom co nejdříve. ÚČAST NA VÝZKUMU V RÁMCI KURZU V rámci účasti kurzu mohou být studenti požádáni o účast na výzkumech jak pro zlepšení kvality kurzu samotného, tak i pro další účely spojené s výzkumným zaměřením katedry. Účast v těchto výzkumech je ryze dobrovolná a nemá vliv na úspěšné ukončení kurzu či získané hodnocení. LITERATURA Základní zdroje Field, A.: Discovering statistics using SPSS, 4^th Ed. Sage, 2013. [F] Morgan, S. E., Reichert, T., Harrison, T. R.: From numbers to words. Reporting statistical results for the social sciences. Allyn & Bacon, 2002. [MRH[SJ1] ] American Psychological Association. (2001). Publication manual of the American Psychological Association (6th ed.). Washington, DC: Author. [APA[SJ2] ] Hendl, J.: Přehled statistických metod zpracování dat. Analýza a metaanalýza dat. 4. vydání. Brno: Portál 2012. [H] Urbánek, T.: K prezentaci výsledků statistických analýz, 1. část. ČsPsych, 2007 (51), 6, 601-609. Urbánek, T.: K prezentaci výsledků statistických analýz, 2. část. ČsPsych, 2008 (52), 1, 70-79. Cohen, J.: The Earth is round (p<.05). American psychologist, 1994 (49), 12, 997-1003.^3 Cohen, J.: A Power primer. Psychological Bulletin, 1992 (112), 1, 155-159.^3 Utts, J.: What educated citizens should know about statistics and probability. American Statistician, 2003 (57), 2, 74-79. ROZŠIŘUJÍCÍ literatura Howitt D., Cramer, D.: Introduction to statistics in psychology, 5th. Pearson, 2011. [HC] Grotenhuis, M., & Chris, V.: How to use SPSS syntax: an overview of common commands. Sage, 2014. Urbánek, T., Denglerová D., Širůček, J. Psychometrika. Měření v psychologii. Portál, 2011. [UDŠ] Good, P. I., Hardin, J. W.: Common errors in statistics (and how to avoid them). Wiley-Interscience 2003. de Vaus, D.: Analyzing social science data: 50 key problems in data analysis. Sage, 2002[2]. Hoyle, R.: Structural equation modeling for social and personality psychology. SAGE, 2011. Raykov, T., & Marcoulides, G. (2011). Introduction to psychometric theory. New York: Routledge. Glass, G. V., Hopkins, K. D.: Statistical methods in education and psychology, 3rd Ed. Allyn and Bacon, 1996. Problémové okruhy 1. Základy analýzy dat v kontextu výzkumu, Statistický software a práce s ním Role analýzy dat v kontextu výzkumného projektu. Statistický model, statistické usuzování. Explorace dat. Zdroje zkreslení výpovědní hodnoty statistik (bias). Porovnávání průměrů. Chíkvadrát testy a další neparametrické testy. Korelace. Tvorba a práce s datovou maticí v SPSS. Ovládání SPSS dialogovými okny a prostřednictvím syntaxu. Literatura: [F] kap. 1 – 7, 9, 18 (720-746) ; [MRH] kap. 2,3,5,6,7 (po s. 55),8 ; [APA] 116 – 167 (kap. 2 pro širší obrázek) . Rozšiřující čtení: Grotenhuis & Chris (2014) 2. LINeárně regresní model - základy Opakování: Korelace, parciální korelace, lineární regrese. Mnohonásobná regrese, pojmy model a parametr, regresní koeficienty b,b, směrodatná chyba regresního koeficientu, mnohonásobný korelační koeficient R, koeficient determinace R^2, postupná (stepwise) regrese, hierarchická (blockwise) regrese, multikolinearita, supresory, problémy spojené s množstvím prediktorů, grafická kontrola splnění předpokladů regrese, rezidua, odlehlé a vlivné případy. Literatura: [F] kap. 8 a 10; [MRH] 69 – 73; [H] kap. 10 s. 383 – 398 (opakování 277 – 306). Příklady studií: McGill, R. J. (2015[SJ3] ). Interpretation of KABC-II Scores: An Evaluation of the Incremental Validity of Cattell-Horn-Carroll (CHC) Factor Scores in Predicting Achievement. Psychological Assessment, 27(4), 1417–1426. http://doi.org/10.1037/pas0000127 Zechner, M. R., & Gill, K. J. (2016[SJ4] ). Predictors of Physical Activity in Persons With Mental Illness: Testing a Social Cognitive Model. Psychiatric Rehabilitation Journal, 39(4), 321–327. http://doi.org/10.1037/prj0000191 Open science: Příklad celé analýzy v SPSS - https://osf.io/npxag/ i v R – open science - https://osf.io/3kxja/ 3. LINeárně regresní model – pokročilé aplikace Kategorické prediktory v regresi. Interakce a moderace, mediace a Sobelův test. Nelineární regrese. Literatura: [F] kap. 10; [MRH] 69 – 73; [H] kap. 10 s. 383 – 398 (opakování 277 – 306). Rozšiřující čtení: http://davidakenny.net/ Příklady studií: Muenks, K., Wigfield, A., Yang, J. S., & O’Neal, C. R. (2017). How true is grit? Assessing its relations to high school and college students’ personality characteristics, self-regulation, engagement, and achievement. Journal of Educational Psychology, 109(5), 599–620. http://doi.org/10.1037/edu0000153[SJ5] Kondric[SJ6] , M., Kondri, M., Trajkovski, B., Strbad, M., Foreti, N., & Zeni, N. (2013). Anthropometric influence on physical fitness among preschool children : Gender-specific linear and curvilinear regression models Anthropometric Influence on Physical Fitness among Preschool Children : Gender-Specific Linear and Curvilinear Regression Mode. Coll. Antropol., 4, 1245–1252. 4. Logistická regrese Model a parametry logistické regrese, interpretace regresního koeficientu exp(B), log-likelihood (-2LL), vyjádření shody modelu s daty pomocí R^2 Coxe & Snella a Nagelkerka, ověření předpokladů, analýza reziduí a vlivných pozorování. Literatura: [F] kap. Logistic Regression s. 760 – 797; [H] kap. 13.2 s. 455 – 459; [MRH] 73 – 76 Příklady studií: Farrer, L. M., Gulliver, A., Bennet, K., Fassnacht, D. B., & Griffiths, K. M. (2016). Demographic and psychosocial predictors of major depression and generalised anxiety disorder in Australian university students. BMC Psychiatry, 16(1), 241. http://doi.org/10.1186/s12888-016-0961-z[SJ7] Sznitman, S. R., Zlotnick, C., & Harel-Fisch, Y. (2016). Normalisation theory: Does it accurately describe temporal changes in adolescent drunkenness and smoking? Drug and Alcohol Review, 35(4), 424–432. http://doi.org/10.1111/dar.12351 5. Analýza rozptylu, analýza kovariance Faktoriální analýza rozptylu, model a parametry, fixované a náhodné faktory, hlavní efekty a interakce faktorů, výhody vyváženého designu, kontrasty a post-hoc testy, analýza kovariance, MANOVA. Literatura: [H] kap. 9 s. 347 – 366 a kap. 10.7 s. 399 – 410; [F] kap. 11, 13, 12, s. 429 – 542; [MRH] 55 – 68 Rozšiřující čtení: [F] kap. 14, 15 – anova pro opakovaná měření 6. Víceúrovňový lineární model Široká a dlouhá data. Vnitrotřídní korelační koeficient. Víceúrovňová (hierarchická, vnořená, clus) data .Víceúrovňový normální lineární model pro průřezová a longitudinání data (model růstových křivek). Literatura: [H] kap. 13.4 s.464– 474; [F] kap. 20 – multilevel linear models ČASOvÁ OSNOVA Datum Téma 20.9. Přednáška: Téma 1 27.9. Seminář: Téma 1 – diskuze týmových analýz 4.10 Přednáška: Téma 2 11.10. Seminář: Průběžný test, Téma 2 – diskuze týmových analýz 18.10. Přednáška: Téma 3 25.10. Seminář: Téma 3 – diskuze týmových analýz 1.11. Přednáška: Téma 4 8.11. Seminář: Téma 4 – diskuze týmových analýz 15.11. Přednáška: Téma 5 22.11. Seminář: Téma 5 – diskuze týmových analýz 29.11. Přednáška: Téma 6 6.12. Seminář: Téma 6 – diskuze týmových analýz 13.12. ________________________________ [1] Práce lze odevzdávat ve všech běžných editovatelných formátech textových dokumentů – doc, rtf, odt apod. Prosím, neodevzdávejte práce v obtížně editovatelných formátech, jako je např. pdf, djvu. Jde nám o možnost vkládání komentářů a čitelnost i na mobilních zařízeních. [2] Výtečný zdroj pro lidi, co absolvovali kurz statistiky, právě pracují na diplomce a potřebují poradit s některými praktickými problémy analýzy. Vhodné i jako doplňující zdroj při studiu. Zahrnuje všechny aspekty kvantitativního výzkumu. V každé kapitole popisuje jeden problém (vč. vysvětlení, v čem je vlastně problém) a jeho řešení. ________________________________ [SJ1]D3-91 [SJ2]B2-1537 [SJ3]Inkrementální validita [SJ4]Klasicky až starosvětsky střižená hierarchická regrese, [SJ5]Regrese jako závěrečný analytický krok psychometricky orientované studie. Kvalitní. I kategorické prediktory. Příklad studie s online suplementy. [SJ6]Trochu divoká nelineární regrese. Mnoho modelů, málo detailů.. [SJ7]Pěkně univariačně i vše dohromady.