PSY252 - Statistická analýza dat II. podzim 2013 Kurz Katedry psychologie, Fakulta sociálních studií, Masarykova univerzita, Brno. Vyučující Mgr. Stanislav Ježek, PhD. – garance kurzu, přednášky, semináře jezek@fss.muni.cz, 549494616, konzultační hodiny: středa 10 – 12, FSS 2.47 Mgr. Věra Kontríková – přednášky, semináře 179491@mail.muni.cz, konzultace po dohodě emailem, FSS 2.52 Mgr. Jan Širůček. PhD – přednášky, semináře sirucek@fss.muni.cz, 549498263, konzultace po dohodě emailem, FSS 2.47 Mgr. et Mgr. Alena Robotková chani@mail.muni.cz, konzultace po dohodě emailem, FSS 2.47 Charakteristika kurzu Cílem kurzu je rozšířit znalosti základů statistiky o statistické modely s více než dvěma proměnnými používané v psychologickém výzkumu a prohloubit porozumění základním principům statistiky. Studenti získají dovednost posoudit vhodnost dat pro multivariační zpracování a hypotetizovat a ověřovat běžné vícerozměrné modely dat s pomocí statistického software. Proto je explicitním cílem také seznámení se s programy SPSS (popř. Statistica), a osvojení si základních návyků jejich užívání. Kurz klade důraz i na komunikaci, tj. slovní popis výsledků i schopnost porozumět takto popsaným výsledkům v empirických kvantitativních studiích. V rámci kurzu jsou studenti seznamováni paralelně s českou i anglickou terminologií, aby byli po skončení kurzu schopni dále studovat, používat internetové zdroje a používat statistický software. Návaznosti kurzu Kurz navazuje na PSY117 – Statistická analýza dat. Oba kurzy úzce souvisí s výukou metodologie. Mnoho problémů v metodologii má statistický základ a naopak mnohé problémy či omezení statistiky je potřeba zohledňovat v metodologii. Doporučené pořadí absolvování kurzů je PSY117 v jarním semestru a PSY252 + PSY112 v podzimním semestru. Toto propojení je nezbytné pro vypracování diplomové práce a je součástí požadavků při státní bakalářské zkoušce. Na statistice stojí také značná část psychometriky a tvoří tak přirozený základ pro studium psychodiagnostiky na magisterském stupni. Předpokladem pro studium základů statistiky je běžné středoškolské matematické vzdělání. Organizace kurzu Počet kreditů: 5 Ukončení kurzu: zkouška Přednášky: 2 hodiny jednou za 2 týdny Semináře: 2 hodiny jednou za 2 týdny Do seminárních skupin se studenti zapisují prostřednictvím informačního systému MU. InformaČní systém MU V informačním systému MU části Studijní materiály k předmětu PSY252 umisťujeme podklady k tématům uvedeným v sylabu především v podobě prezentací, odkazů na další zdroje informací a seminárních materiálů. Na stejném místě jsou též k dispozici pokyny nezbytné k plnění písemných úkolů, popř. doplňky k tomuto sylabu. KOMUNIKACE S VYUČUJÍCMI Preferovaným komunikačním kanálem pro osobní komunikaci týkající se kurzu je email. Používejte prosím „PSY252“ v předmětu svých emailů. Urychlíte tím jejich vyřízení. Emaily adresujte dr. Ježkovi. Pouze v případě záležitostí, které se týkají specificky seminářů Mgr. Širůčka, pište jemu. V případě dotazů týkajících se látky kurzu, využívejte prosím v maximální možné míře předmětové diskuzní fórum. Je pravděpodobné, že odpověď na Váš dotaz by mohl zajímat i Vaše spolužáky, a byla by proto škoda uzavřít takovou komunikaci do soukromí emailů. Všichni vyučující kurzu diskuzní fóra pravidelně sledují a přispívají do nich. K důležitým ohlášením používáme hromadný email studentům. Požadavky na ukonČení kurzu Seminární práce V průběhu semestru mají studenti v malých týmech (2-3 lidé) za úkol zpracovat řadu (5-6) analýz, které pak budou prezentovány v seminářích. Analýzy zpracovávají do krátké zprávy ve formátu APA, zejména co se týká prezentace výsledků analýz v textové, tabulkové a grafické podobě. Jejich 100% realizace a přijetí je předpokladem k tomu, aby se student mohl přihlásit ke zkoušce. Úkoly jsou zadávány na seminářích a v případě potřeby doplňovány informacemi v IS MU. Práce lze odevzdávat pouze elektronicky v odevzdávárně ve studijních materiálech předmětu. Semestrální analýzy vkládejte do odevzdávány nejpozději v pondělí předcházejícím semináři, na kterém budou analýzy prezentovány. Jméno vkládaného souboru s prvním seminárním úkolem musí být S1.doc, S2.doc pro druhý atd.[1] a nic víc; IS k němu automaticky přidá jméno vkládajícího studenta. Komentář/popisek nechejte nevyplněný. Seminární úkoly budou týmy prezentovat na seminářích. Kvalita jejich zpracování bude hodnocena pouze na škále: přijat - nepřijat. „Nepřijetím“ je míněno vrácení k přepracování. Na přepracování má tým týden od semináře, na němž jsou analýzy prezentovány Opravené práce vkládejte do ISu do stejné odevzdávárny jako práce původní. Jako jméno vkládaného souboru nyní použijte S1o.doc. Komentář/popisek opět nechejte nevyplněný. Zkouška Kurz je zakončen zkouškou. Přihlášení ke zkoušce je podmíněno splněním všech seminárních úkolů a udělením zápočtu. Zkouška je individuální a má podobu zpracování zadané analýzy s využitím statistického software a rozpravy nad touto analýzou. Je možné za ni získat 50b. K úspěšnému složení zkoušky je nutné získat minimálně 25b. Písemná část zkoušky je časově omezená a je při ní možné využívat vlastní studijní materiály (učebnice, poznámky). Zkouší se v rozsahu látky, který je vymezen v tomto sylabu k předmětu PSY252. Celkové hodnocení Celkové hodnocení bude používat následující stupnici A: 50 - 46b B: 45 – 41b C: 40 – 36b D: 35 – 31b E: 30 – 25b F: 24 a méně bodů. Uznávání dříve absolvovaných kurzů statistiky Žádosti o uznání v tomto případě zasílejte na mail jezek@fss.muni.cz. V předmětu zprávy použijte „uznani PSY252“ (bez diakritiky). V případě žádosti o uznání kurzů z jiné fakulty či univerzity, uveďte též odkaz na sylaby absolvovaných kurzů, popř. sylaby přímo přiložte. Žádosti zasílejte do konce 2. týdne semestru. Později zaslaným žádostem nebude vyhověno. Omluvy Omluvy jsou přijímány pouze předem. Pozdější omluvy budou akceptovány, pouze pokud šlo o nepředvídatelné případy. Víte-li o tom, že budete mít ze závažných důvodů problémy s dodržením některého z termínů, informujte nás o tom co nejdříve. ÚČAST NA VÝZKUMU V RÁMCI KURZU V rámci účasti kurzu mohou být studenti požádáni o účast na výzkumech jak pro zlepšení kvality kurzu samotného, tak i pro další účely spojené s výzkumným zaměřením katedry. Účast v těchto výzkumech je ryze dobrovolná a nemá vliv na úspěšné ukončení kurzu či získané hodnocení. LITERATURA Základní zdroje Field, A.: Discovering statistics using SPSS, 3^nd Ed. Sage, 2009. [F] Morgan, S. E., Reichert, T., Harrison, T. R.: From numbers to words. Reporting statistical results for the social sciences. Allyn & Bacon, 2002. [MRH] American Psychological Association. (2001). Publication manual of the American Psychological Association (6th ed.). Washington, DC: Author. [APA] Hendl, J.: Přehled statistických metod zpracování dat. Analýza a metaanalýza dat. 3. vydání. Brno: Portál 2009. [H] Howitt D., Cramer, D.: Introduction to statistics in psychology, 5th. Pearson, 2011. [HC] Urbánek, T., Denglerová D., Širůček, J. Psychometrika. Měření v psychologii. Portál, 2011. [UDŠ] Urbánek, T.: K prezentaci výsledků statistických analýz, 1. část. ČsPsych, 2007 (51), 6, 601-609. Urbánek, T.: K prezentaci výsledků statistických analýz, 2. část. ČsPsych, 2008 (52), 1, 70-79. Cohen, J.: The Earth is round (p<.05). American psychologist, 1994 (49), 12, 997-1003.^3 Cohen, J.: A Power primer. Psychological Bulletin, 1992 (112), 1, 155-159.^3 Utts, J.: What educated citizens should know about statistics and probability. American Statistician, 2003 (57), 2, 74-79. Doplňková literatura Hair J. F. et al.: Multivariate data analysis, 6th ed.. Prentice Hall. Harlow: Prentice Hall, 2005 (nebo 5 či aktuální 7. vydání).[2] Good, P. I., Hardin, J. W.: Common errors in statistics (and how to avoid them). Wiley-Interscience 2003. de Vaus, D.: Analyzing social science data: 50 key problems in data analysis. Sage, 2002[3]. Abelson, R. P.: Statistics as principled argument. Lawrence Erlbaum Associates, 1995. Dvě na sebe navazující učebnice statistiky se SPSS: Morgan, G. A. et al: SPSS for introductory statistics. Use and interpretation, 2^nd ed. LEA, 2004. Leech, N.L., Barrett, K. C., Morgan, G. A.: SPSS for intermediate statistics. Use and interpretation, 2^nd ed. LEA, 2005. Glass, G. V., Hopkins, K. D.: Statistical methods in education and psychology, 3rd Ed. Allyn and Bacon, 1996. Moore, D. S.: The basic practice of statistics, 4^th Ed., Freeman, 2006[4]. Moore, D. S., McCabe, G. P., Craig, B.: Introduction to the Practice of Statistics. 6^th Ed., Freeman, 2007. Velmi užitečným a přístupným slovníkem statistických a příbuzných termínů v anglickém jazyce je Everitt, B. E., Wykes, T.: A dictionary of statistics for psychologists. Arnold, 1999. Internetové zdroje Vynikající zdroj od tvůrců programu Statistica. http://www.statsoft.com/textbook/stathome.html Zdroj o zdrojích: http://en.wikipedia.org/wiki/Statistics Online učebnice: http://en.wikibooks.org/wiki/Statistics Moderace a mediace: http://davidakenny.net Problémové okruhy 1. Statistický software a práce s ním Tvorba a práce s datovou maticí v SPSS. Zobrazení dat a jednoduché analýzy probírané v PSY117 v těchto programech. Literatura: [F] kap. 1 – 4 s. 1 – 142. 2. Mnohonásobná lineární regrese Opakování: Korelace, parciální korelace, lineární regrese. Mnohonásobná regrese, pojmy model a parametr, regresní koeficienty b,b, směrodatná chyba regresního koeficientu, mnohonásobný korelační koeficient R, koeficient determinace R^2, postupná (stepwise) regrese, hierarchická (blockwise) regrese, indikátorové (dummy) proměnné, multikolinearita, supresory, problémy spojené s množstvím prediktorů, grafická kontrola splnění předpokladů regrese, rezidua, odlehlé a vlivné případy. Moderace, mediace a Sobelův test. Literatura: opakování [HC] kap. 8 s. 86 – 96, kap. 29 s. 351 – 361; [H] kap. 10 s. 383 – 398; [F] kap. Regression s. 143 – 217; [HC] kap. 31, s. 381 – 392; http://davidakenny.net/ 3. Logistická regrese Model a parametry logistické regrese, interpretace regresního koeficientu exp(B), log-likelihood (-2LL), vyjádření shody modelu s daty pomocí R^2 Coxe & Snella a Nagelkerka, ověření předpokladů, analýza reziduí a vlivných pozorování. Literatura: [H] kap. 13.2 s. 455 – 459; [F] kap. Logistic Regression s.218 – 268 4. Analýza rozptylu, analýza kovariance Faktoriální analýza rozptylu, model a parametry, fixované a náhodné faktory, hlavní efekty a interakce faktorů, výhody vyváženého designu, kontrasty a post-hoc testy, analýza kovariance, MANOVA. Literatura: [H] kap. 9 s. 347 – 366 a kap. 10.7 s. 399 – 410; [F] kap. 8-10, s. 309 – 426 5. Analýza hlavních komponent, faktorová analýza Analýza hlavních komponent, explorační faktorová analýza, konfirmační faktorová analýza. Pravidla pro určení počtu faktorů. Rotace ortogonální a šikmé. Ověření předpokladů FA. Interpretace faktorových matic. Literatura: [H] kap. 13.7 a 13.8 s. 499 – 511; [F]kap. Exploratory Factor Analysis s. 619 – 670. 6. Reliabilita Analýza reliability, položková analýza. Shoda posuzovatelů. Literatura: [F] 673 – 685, [UDŠ] 217 – 230, [HC] 443 – 454 + volitelně http://tx.liberal.ntu.edu.tw/~purplewoo/Literature/!DataAnalysis/Reliability%20Analysis.htm ČASOvÁ OSNOVA Středy v liché týdny (25.9., 9.10….) budou přednášky v P25. Středy v sudé týdny (18.9., 2.10….) budou semináře paralelně ve dvou seminárních skupinách v P25 a P26. Výjimku tvoří první středa 18.9., která je sice sudá, ale sejdeme se na ní všichni jako na přednášce. Datum Téma 18.9. Přednáška: Seznámení se SPSS, opakování 25.9. Přednáška: Téma 1 2.10. Seminář: Téma 1 – diskuze týmových analýz 9.10. Přednáška: Téma 2 16.10. Seminář: Téma 2 – diskuze týmových analýz 23.10. Přednáška: Téma 3 30.10. Seminář: Téma 3 – diskuze týmových analýz 6.11. Přednáška: Téma 4 13.11. Seminář: Téma 4 – diskuze týmových analýz 20.11. Přednáška: Téma 5 27.11. Seminář: Téma 5 – diskuze týmových analýz 4.12. Přednáška: Téma 6 11.12. Seminář: Téma 6 – diskuze týmových analýz ________________________________ [1] Práce lze odevzdávat ve všech běžných editovatelných formátech textových dokumentů – doc, rtf, odt apod. Prosím, neodevzdávejte práce v obtížně editovatelných formátech, jako je např. pdf, djvu. Jde nám o možnost vkládání komentářů a čitelnost i na mobilních zařízeních. [2] Dobře a velmi prakticky/návodně sestavená učebnice multivariačních metod. [3] Výtečný zdroj pro lidi, co absolvovali kurz statistiky, právě pracují na diplomce a potřebují poradit s některými praktickými problémy analýzy. Vhodné i jako doplňující zdroj při studiu. Zahrnuje všechny aspekty kvantitativního výzkumu. V každé kapitole popisuje jeden problém (vč. vysvětlení, v čem je vlastně problém) a jeho řešení. [4] Profesor David Moore je velmi oceňovaným autorem statistických učebnic. Jako jeden z mála dokáže zjednodušovat a zároveň se vyhnout zavádějícím zjednodušením. Díky tomu ho oceňují nejen studenti, ale i statistikové.