PSY252 Statistická analýza dat II PSY252 - 1 PSY252 - Statistická analýza dat II. podzim 2009 VYUČUJÍCÍ Mgr. Stanislav Ježek, PhD. ­ garance kurzu, přednášky, semináře jezek@fss.muni.cz, 549494616, konzultační hodiny: středa 14 ­ 16, FSS 2.53 Mgr. Jan Širůček ­ přednášky, semináře sirucek@fss.muni.cz, 549498263, konzultace po dohodě emailem, FSS 2.45 CHARAKTERISTIKA KURZU Cílem kurzu je seznámit studenty se základy multivariační statistiky používané v psychologickém výzkumu a prohloubit porozumění základním principům statistiky. Studenti získají dovednost posoudit vhodnost dat pro multivariační zpracování a hypotetizovat a ověřovat běžné vícerozměrné modely dat s pomocí statistického software. Proto je explicitním cílem také seznámení se s programy SPSS a Statistica, a osvojení si základních návyků jejich užívání. Kurz klade důraz i na komunikaci, tj. slovní popis výsledků i schopnost porozumět takto popsaným výsledkům v empirických kvantitativních studiích. V rámci kurzu jsou studenti seznamováni paralelně s českou i anglickou terminologií, aby byli po skončení kurzu schopni dále studovat, používat internetové zdroje a používat statistický software. Návaznosti kurzu Kurz navazuje na PSY117 ­ Statistická analýza dat. Oba kurzy úzce souvisí s výukou metodologie. Mnoho problémů v metodologii má statistický základ a naopak mnohé problémy či omezení statistiky je potřeba zohledňovat v metodologii. Doporučené pořadí absolvování kurzů je PSY117 v jarním semestru a PSY252 + PSY112 v podzimním semestru. Toto propojení je nezbytné pro vypracování diplomové práce a je součástí požadavků při státní bakalářské zkoušce. Na statistice stojí také značná část psychometriky a tvoří tak přirozený základ pro studium psychodiagnostiky na magisterském stupni. Předpokladem pro studium základů statistiky je běžné středoškolské matematické vzdělání. ORGANIZACE KURZU Počet kreditů: 5 Ukončení kurzu: zkouška Přednášky: žádné Semináře: 2 hodiny týdně Do seminárních skupin se studenti zapisují prostřednictvím informačního systému MU. INFORMAČNÍ SYSTÉM MU V informačním systému MU části Studijní materiály k předmětu PSY252 umisťujeme podklady k tématům uvedeným v sylabu především v podobě prezentací, odkazů na další zdroje informací a seminárních materiálů. Na stejném místě jsou též k dispozici pokyny nezbytné k plnění písemných úkolů, popř. doplňky k tomuto sylabu. V informačním systému naleznou studenti také interaktivní osnovu k předmětu. Tato osnova obsahuje pouze informace uvedené také v tomto sylabu. V případě nekonzistencí jsou směrodatné informace uvedené v tomto sylabu. KOMUNIKACE S VYUČUJÍCMI Preferovaným komunikačním kanálem pro osobní komunikaci týkající se kurzu je email. Používejte prosím ,,PSY252" v předmětu svých emailů. Urychlíte tím jejich vyřízení. Emaily adresujte dr. Ježkovi. Pouze v případě záležitostí, které se týkají specificky seminářů Mgr. Širůčka, pište jemu. V případě dotazů týkajících se látky kurzu, využívejte prosím v maximální možné míře předmětové diskuzní fórum. Je pravděpodobné, že odpověď na Váš dotaz by mohl zajímat i Vaše spolužáky, a byla by proto škoda uzavřít takovou komunikaci do soukromí emailů. Všichni vyučující kurzu diskuzní fóra pravidelně sledují a přispívají do nich. K důležitým ohlášením používáme hromadný email studentům. PSY252 Statistická analýza dat II PSY252 - 2 POŽADAVKY NA UKONČENÍ KURZU Seminární práce V průběhu semestru mají studenti v malých týmech (3-4 lidé) za úkol zpracovat řadu (6-7) analýz, které pak budou prezentovány v seminářích. Jejich 100% realizace a přijetí je předpokladem k tomu, aby se student mohl přihlásit ke zkoušce. Úkoly jsou zadávány na seminářích a v případě potřeby doplňovány informacemi na IS MU. Práce lze odevzdávat pouze elektronicky v odevzdávárně ve studijních materiálech předmětu. Jméno vkládaného souboru s prvním seminárním úkolem musí být S1.doc, S2.doc pro druhý atd.1 a nic víc; IS k němu automaticky přidá jméno vkládajícího studenta. Komentář/popisek nechejte nevyplněný. Seminární úkoly budou týmy prezentovat na seminářích. Kvalita jejich zpracování bude hodnocena pouze na škále: přijat - nepřijat. ,,Nepřijetím" je míněno vrácení k přepracování. Na přepracování má tým týden od semináře, na němž jsou analýzy prezentovány Opravené práce vkládejte do ISu do stejné odevzdávárny jako práce původní. Jako jméno vkládaného souboru nyní použijte S1o.doc. Komentář/popisek opět nechejte nevyplněný. Zkouška Zápočtová písemka testuje znalost základních pojmů. K udělení zápočtu je potřeba 80% úspěšnost v zápočtové písemce. Zkouška Kurz je zakončen zkouškou. Přihlášení ke zkoušce je podmíněno splněním všech seminárních úkolů a udělením zápočtu. Zkouška je individuální a má podobu zpracování zadané analýzy s využitím statistického software. Je možné za ni získat 50b. K úspěšnému složení zkoušky je nutné získat minimálně 25b. Zkouška je časově omezená a je při ní možné využívat vlastní studijní materiály (učebnice, poznámky). Zkouší se v rozsahu látky, který je vymezen v tomto sylabu k předmětu PSY252. Celkové hodnocení Celkové hodnocení bude používat následující stupnici A: 50 - 46b B: 45 ­ 41b C: 40 ­ 36b D: 35 ­ 31b E: 30 ­ 25b F: 24 a méně bodů. Uznávání dříve absolvovaných kurzů statistiky Žádosti o uznání v tomto případě zasílejte na mail jezek@fss.muni.cz. V předmětu zprávy použijte ,,uznani PSY252" (bez diakritiky). V případě žádosti o uznání kurzů z jiné fakulty či univerzity, uveďte též odkaz na sylaby absolvovaných kurzů, popř. sylaby přímo přiložte. Žádosti zasílejte do konce 2. týdne semestru. Později zaslaným žádostem nebude vyhověno. Omluvy Omluvy jsou přijímány pouze předem. Pozdější omluvy budou akceptovány, pouze pokud šlo o nepředvídatelné případy. Víte-li o tom, že budete mít ze závažných důvodů problémy s dodržením některého z termínů, informujte nás o tom co nejdříve. ÚČAST NA VÝZKUMU V RÁMCI KURZU V rámci účasti kurzu mohou být studenti požádáni o účast na výzkumech jak pro zlepšení kvality kurzu samotného, tak i pro další účely spojené s výzkumným zaměřením katedry. Účast v těchto výzkumech je ryze dobrovolná a nemá vliv na úspěšné ukončení kurzu či získané hodnocení. LITERATURA Základní zdroje Hendl, J.: Přehled statistických metod zpracování dat. Analýza a metaanalýza dat. 3. vydání Brno: Portál 2009. 1 Práce lze odevzdávat ve všech běžných editovatelných formátech textových dokumentů ­ doc, rtf, odt apod. Prosím, neodevzdávejte práce v obtížně editovatelných formátech, jako je např. pdf, djvu. Jde nám o možnost vkládání komentářů a čitelnost i na mobilních zařízeních. PSY252 Statistická analýza dat II PSY252 - 3 Field, A.: Discovering statistics using SPSS, 2nd Ed. Sage, 2005. (nebo 1. vydání z r. 2000, nebo aktuální 3. vydán z r. 2009) Mareš. P., Rabušic, L.: Materiály ke kurzu SOC108. Online manuál programu Statistica. http://www.statsoft.com/textbook/stathome.html Urbánek, T.: K prezentaci výsledků statistických analýz, 1. část. ČsPsych, 2007 (51), 6, 601-609. Urbánek, T.: K prezentaci výsledků statistických analýz, 2. část. ČsPsych, 2008 (52), 1, 70-79. Cohen, J.: The Earth is round (p<.05). American psychologist, 1994 (49), 12, 997-1003.3 Cohen, J.: A Power primer. Psychological Bulletin, 1992 (112), 1, 155-159.3 Utts, J.: What educated citizens should know about statistics and probability. American Statistician, 2003 (57), 2, 74-79. Morgan, S. E., Reichert, T., Harrison, T. R.: From numbers to words. Reporting statistical results for the social sciences. Allyn & Bacon, 2002. Abelson, R. P.: Statistics as principled argument. Lawrence Erlbaum Associates, 1995. de Vaus, D.: Analyzing social science data: 50 key problems in data analysis. Sage, 20022. Doplňková literatura Hair J. F. et al.: Multivariate data analysis, 6th ed.. Prentice Hall. Harlow: Prentice Hall, 2005 (nebo 5 či aktuální 7. vydání).3 Good, P. I., Hardin, J. W.: Common errors in statistics (and how to avoid them). Wiley-Interscience 2003. Dvě na sebe navazující učebnice statistiky se SPSS: Morgan, G. A. et al: SPSS for introductory statistics. Use and interpretation, 2nd ed. LEA, 2004. Leech, N.L., Barrett, K. C., Morgan, G. A.: SPSS for intermediate statistics. Use and interpretation, 2nd ed. LEA, 2005. Glass, G. V., Hopkins, K. D.: Statistical methods in education and psychology, 3rd Ed. Allyn and Bacon, 1996. Moore, D. S.: The basic practice of statistics, 4th Ed., Freeman, 20064. Moore, D. S., McCabe, G. P., Craig, B.: Introduction to the Practice of Statistics. 6th Ed., Freeman, 2007. Blaikie, N. : Analyzing quantitative data. Sage, 20035. Velmi užitečným a přístupným slovníkem statistických a příbuzných termínů v anglickém jazyce je Everitt, B. E., Wykes, T.: A dictionary of statistics for psychologists. Arnold, 1999. Internetové zdroje Vynikající zdroj od tvůrců programu Statistica. http://www.statsoft.com/textbook/stathome.html Zdroj o zdrojích: http://en.wikipedia.org/wiki/Statistics Online učebnice: http://en.wikibooks.org/wiki/Statistics 2 Výtečný zdroj pro lidi, co absolvovali kurz statistiky, právě pracují na diplomce a potřebují poradit s některými praktickými problémy analýzy. Vhodné i jako doplňující zdroj při studiu. Zahrnuje všechny aspekty kvantitativního výzkumu. V každé kapitole popisuje jeden problém (vč. vysvětlení, v čem je vlastně problém) a jeho řešení. 3 Dobře a velmi prakticky/návodně sestavená učebnice multivariačních metod. 4 Profesor David Moore je velmi oceňovaným autorem statistických učebnic. Jako jeden z mála dokáže zjednodušovat a zároveň se vyhnout zavádějícím zjednodušením. Díky tomu ho oceňují nejen studenti, ale i statistikové. 5 Učebnice pro odvážné. Pokud máte tendenci se hodně zamýšlet nad tím, co jsou data, proměnné a proč "tu statistiku děláme", je to dobrý zdroj. PSY252 Statistická analýza dat II PSY252 - 4 PROBLÉMOVÉ OKRUHY 1. Statistický software a práce s ním Tvorba a práce s datovou maticí v SPSS a Statistica. Zobrazení dat a jednoduché analýzy v těchto programech. Literatura: Loňské znalosti, Field kap. 1 ­ 4 s. 1 ­ 142. 2. Mnohonásobná lineární regrese Mnohonásobná regrese, pojmy model a parametr, regresní koeficienty b,, směrodatná chyba regresního koeficientu, mnohonásobný korelační koeficient R, koeficient determinace R2, postupná (stepwise) regrese, hierarchická (blockwise) regrese, indikátorové (dummy) proměnné, multikolinearita, supresory, problémy spojené s množstvím prediktorů, grafická kontrola splnění předpokladů regrese, rezidua, odlehlé a vlivné případy. Literatura: Hendl kap. 10 s.383 ­ 398; Field kap. Regression s. 143 ­ 217 3. Logistická regrese Model a parametry logistické regrese, interpretace regresního koeficentu exp(B), log-likelihood (-2LL), vyjádření shody modelu s daty pomocí R2 Coxe & Snella a Nagelkerka, ověření předpokladů, analýza reuiduí a vlivných pozorování Literatura: Hendl kap. 13.2 s.455 ­ 459; Field kap. Logistic Regression s.218 ­ 268 4. Analýza rozptylu, analýza kovariance faktoriální analýza rozptylu, model a parametry, fixované a náhodné faktory, hlavní efekty a interakce faktorů, výhody vyváženého designu, kontrasty a post-hoc testy, analýza kovariance, MANOVA Literatura: Hendl kap. 9 s.347 ­ 366 a kap. 10.7 s. 399 ­ 410; Field kap. 8-10, s.309 ­ 426 5. Analýza rozptylu s opakovaným měřením Literatura: Hendl kap. 9.3 s.367 ­ 377; Field kap. Repeated-Measures Designs s.427 ­ 482 6. Analýza hlavních komponent, Faktorová analýza Analýza hlavních komponent, explorační faktorová analýza, konfirmační faktorová analýza. Pravidla pro určení počtu faktorů. Rotace ortogonální a šikmé. Ověření předpokladů FA. Interpretace faktorových matic. Literatura: Hendl kap. 13.7 a 13.8 s. 499 ­ 511; Field kap. Exploratory Factor Analysis s. 619 ­ 680. 7. Shluková analýza Hierarachická shluková analýza: distanční funkce (míry nepodobnosti), agregační funkce, dendrogram. K-means shlukování. Literatura: Hendl kap. 13.6 s. 491 ­ 498; ČASOVÁ OSNOVA Datum Téma přednášky 23.9. Téma 1 - předvedení 30.9. Téma 1 ­ diskuze týmových analýz 7.10 Téma 2 - předvedení PSY252 Statistická analýza dat II PSY252 - 5 14.10. Téma 2 ­ diskuze týmových analýz 21.10. Téma 3 - předvedení 28.10. Téma 3 ­ diskuze týmových analýz 4.11. Téma 4 - předvedení 11.11. Téma 4 ­ diskuze týmových analýz 18.11. Téma 5 - předvedení 25.11. Téma 5 ­ diskuze týmových analýz 2.12. Téma 6 - předvedení 9.12. Téma 6 ­ diskuze týmových analýz 16.12. Téma 7 - předvedení