Statistická analýza dat II.

Týden 11 - Přednáška 6 - Víceúrovňový lineární model

6. Víceúrovňový lineární model

Široká a dlouhá data. Vnitrotřídní korelační koeficient. Víceúrovňová (hierarchická, vnořená, clustered) data . Pevné (fixed) a náhodné (random) koeficienty (efekty). Víceúrovňové (mixed, smíšené) normální lineární modely pro průřezová data - model s náhodným průsečíkem, model s náhodným  průsečíkem i směrnicemi. Longitudinální data - model růstových křivek. Výhody multilevel modelů. Ukazatele shody modelu s daty založené na -2LL. Centrování v multilevel modelu. Rozdílná užití ML a REML odhadu parametrů modelu.

Literatura: [F] kap. 21 – Multilevel linear models

Příklady studií:

Rammstedt, B., Mutz, M., & Farmer, R. F. (2015). The answer is blowing in the wind: Weather effects on personality ratings. European Journal of Psychological Assessment, 31(4), 287–293. http://doi.org/10.1027/1015-5759/a000236

Jang, H., Reeve, J., & Deci, E. L. (2010). Engaging students in learning activities: It is not autonomy support or structure but autonomy support and structure. Journal of Educational Psychology, 102(3), 588–600. http://doi.org/10.1037/a0019682

Sneed, J. R., Whitbourne, S. K., & Culang, M. E. (2006). Trust, identity, and ego integrity: Modeling Erikson’s core stages over 34 years. Journal of Adult Development, 13(3–4), 148–157. http://doi.org/10.1007/s10804-007-9026-3


Komentář ke čtení Fielda.

Kapitola začíná představením hierarchických (multilevel, vnořených) datových struktur. Věnuje tomu hodně prostoru, ale neměli byste v tom hledat nějakou složitost. Nepřeskočte pasáž o vnitrotřídním korelačním koeficientu (ICC). 

Co se týká benefitů multilevel modelu, jsou předloženy trochu parodicky. Ne, že bychom mohli úplně zapomenout na předpoklad nezávislosti reziduí. ML modely nám pouze mohou vyřešit závislost způsobenou členstvím ve skupinách - tedy závislost v důsledku hierarchické struktury dat. Jiné důvody závislosti, popř. členství v neznámých skupinách, nevyřeší. Podobně chybějící data jsou snáze zohlednitelná, ale neznamená to to, že bychom se jimi vůbec nemuseli zabývat. 

Myšlenka náhodných (a pevných) koeficientů (21.3.2) je zde centrální. Nepouštějte se dál, než pochopíte, oč jde. 

Pasáž 21.4.2 přeskočte. Vše, co nyní potřebujete vědět, je, že když máte v modelu více než jeden náhodný koeficient (INTERCEPT a ještě něco dalšího na řádku /RANDOM před | (btw napsáno na české klávesnici pomocí RightAlt+W)) pak VC znamená, že vaše náhodné koeficienty mezi sebou nebudou korelovat a UN znamená, že ano.  

Předpoklady ML modelu a úvahy statistické síle bych si nechal, až budete mít pocit, že v základu chápete, jak model funguje. Potom stojí za to si nechat rozšířit myšlenku centrování i o centrování kolem skupinových průměrů.

V případě ML modelu nesou pasáže o klikání v SPSS hodně informací o tom, jak modely vlastně fungují. Zatímco my jsme začínali modelem bez zohlednění hierarchické struktury dat spočítaným pomocí REGRESSION, ve Fieldovi je obyčejný regresní model spočítaný přímo v MIXED tím, že není vůbec použitá volba /RANDOM. Nezapomeňte si všímat počtu počítaných parametrů,

I když jsme se k tomu moc nedostali (až na konci semináře), pokud máme data zahrnující opakovaná měření, pak je první úrovní měření, druhou člověk a pak mohou být ještě nějaké vyšší úrovně. Pokud je mezi prediktory nějaká proměnná vyjadřující čas, jak šla jednotlivá měření po sobě (kategorická či spojitá), mluvíme o těchto ML modelech jako o modelech růstových křivek. Není zde ale nic konceptuálně nového. Prakticky je zde potřeba zvládnout převádění dat mezi širokým a dlouhým formátem. ML modely v SPSS vyžadují dlouhý formát, ale jiné procedury, třeba pro grafy a popisné statistiky, vyžadují široký formát. 

Reportování je ve Fieldovi podáno chudě. Spíše se podívejte na příklady studií výše.