Psychometrika: měření v psychologii

Týden 7-8: Teorie odpovědi na položku | 24. a 31. 10. 2022

Přednáška na téma teorie odpovědi na položku (IRT, Item Response Theory) bude rozdělena do dvou setkání. Cílem je představit konceptuální základy IRT, popsat její vztah s faktorovou analýzou i klasickou testovou teorií, a zakotvit celé téma do epistemologického rámce (podrobněji iz poslední dvě přednášky kurzu). Důraz bude kladen na možnosti využití IRT v diagnostické i výzkumné praxi. Předpokládány jsou teoretické znalosti fungování IRT a její východiska, různé druhy modelů a možnosti aplikace.

Epistemologické základy IRT. Rozdíl oproti CTT, podobnost faktorové analýze.
Předpoklady IRT, vlastnosti IRT modelů, velikost vzorku.
Stručný přehled IRT modelů dle počtu parametrů: Raschovy modely (RM) a 1PL, 2PL, 3PL
Rozdílná východiska Raschova modelu a ostatních IRT modelů.
Polytomické IRT modely: RSM, PCM, GPCM, GRM, NRM a další.
Tutzův sekvenční model, IRTree, LLTM modely; IRT jako generalizovaný smíšený lineární model (GLMM).
Informační funkce položky a testu. Charakteristická funkce položky a testu. Vztah informační funkce a chyby měření.
Shoda modelu s daty na úrovni položky i celého testu.
Výhody a nevýhody využití IRT při konstrukci testu.
Matematická ekvivalence IRT a ordinální faktorové analýzy.
Rozdíl měřené „veličiny“: vztah hrubého skóre, odhadu faktorového skóru ve FA a v IRT.
Typické raschovské skóry: W-škála, index relativní výkonnosti (RPI), vývojové skóry (věkové a ročníkové ekvivalenty), zóna proximálního vývoje.
Multidimenzionální IRT; intercept-slope parametrizace, kompenzatorní a non-kompenzatorní modely.
Aplikace IRT: Adaptivní testování.
Aplikace IRT: Škálování založené na IRT.
Aplikace IRT: Linking a equating.

IRT: Skript a data

Příklad odhadu různých IRT modelů nad binárními daty Testu intelektového potenciálu. Pokud vás zajímá, jak odhadnout IRT model v R, můžete mrknout sem.

Přednáška 07: Teorie odpovědi na položku

Prezentace k první i druhé přednášce o IRT.

Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.

https://is.muni.cz/el/fss/podzim2022/PSYn4790/um/videa2020/PSYn4790_2022_P07.video5

Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.

https://is.muni.cz/el/fss/podzim2022/PSYn4790/um/videa2020/PSYn4790_2022_P08.video5

Průběžná příprava (26.-30. 10.)

Průběžná příprava je společná pro obě části přednášky, a to po prvním setkání. Po druhém setkání je termín druhého písemného testu a průběžná příprava je proto vynechaná.

Literatura

Povinná literatura je rozdělena do dvou částí podle dvou setkání. K prvnímu setkání je zadaná povinná literatura v podobě krátkého učebnicového textu. Ke druhému setkání je zadaná pouze rozšiřující literatura. Pokud však máte pocit, že se v úplných základech IRT orientujete (například díky svému bakalářskému studiu), doporučuji zcela přeskočit základní literaturu a pustit se rovnou do rozšiřující.

V každém případě předpokládáme, že povinnou literaturu projdete před druhým setkáním k IRT a druhý týden budete mít k dispozici pro přípravu na písemný test (opakování témat CTT, GT a IRT).

Povinný zdroj (k 1. setkání):

Furr, R. M., & Bacharach, V. R. (2018). Psychometrics : An Introduction. Sage. Kapitola 14, strany 609–652.

Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.

https://is.muni.cz/el/fss/podzim2022/PSYn4790/um/literatura/furr.pdf

Znáte základy a FURR by pro vás byl ztrátou času?

Pokud máte pocit, že základy IRT popisované Furrem (2014) již znáte, nečtěte jej znova, a zaměřte se na cokoli z doporučené literatury uvedené níže. Ušetříte svůj čas a dozvíte se něco nového ;-)

Rozšiřující zdroje k 2. setkání:

Dle svých znalostí a toho, na kolik si troufáte, si vyberte libovolný z doporučených a rozšiřujících zdrojů a přečtěte si jej. Volte uvážlivě téma, autora i rozsah; volte přiměřeně svým schopnostem a možnostem :-) Každopádně si vyberte něco, co vám dá něco nového. Několik tipů:

Začátečníci: Pokud máte pocit, že se v IRT neorientujete vůbec, doporučuji celou DeMars (2010). Dočtete se znovu to, co ve Furrovi a Bacharachovi, a třeba se vám to bude napodruhé lépe chápat. Jde skutečně jen o 100 stran a celý text je velmi stravitelný.
Kdokoli: Kdokoli může zvolit Bonda a Foxovou (2015). V takovém případě si projděte cca prvních pět kapitol, můžete ale zabrousit i do některých z pozdějších pasáží dle svého výběru. Nečtěte celou knihu, pokud skutečně nechcete! :-) Mimochodem: předmluva k prvnímu vydání byla z následujících vydání vynechána, ale opravdu stojí za to. Popisují důvody, jak se oba autoři dostali k Raschovu modelu a proč mu "uvěřili". Je to docela zajímavé čtení!
Středně pokročilí: Pokud ovládáte základy a chcete se zaměřit na detaily, vyberte si dle své úvahy pasáž (jednu až dvě kapitoly) z De Ayaly (2009). Vybírejte uvážlivě, aby nešlo o opakování toho, co znáte, a abyste se dozvěděli něco nového. Osobně doporučuji multidimenzionální modely.
Středně pokročilí s experimentálním zaměřením: Pokud se chcete zaměřovat na experimentální výzkum, jednoznačně doporučuji IRTree modely od De Boecka a Partcheva (2012), případně explanační a LLTM modely od De Boecka a kol. (2012). Obojí je fakt super, naznačí to flexibilitu IRT přístupu! Mně osobně oba tyto zdroje otevřely oči; vyberte si, který vám přijde zajímavější, oba ale spolu úzce souvisejí.
Pokročilí: Ukradněte si první díl sborníku od van der Lindena (2016), nebo si knihu půjčte od nás (kanc. 2.47) a vyberte si jednu až dvě z pokročilejších kapitol. Doporučuji zejména modely pro odhad času, výběr ale záleží na vás a vašich preferencích. Jde o nejlepší zdroj k IRT obecně, který je k dispozici, popisuje prakticky "vše".
Pokročilí se zkušeností s ordinální CFA: Pokud máte už nějaké zkušenosti s ordinální CFA a chcete se dozvědět nějaká konceptuální východiska, doporučuji Wirtha a Edwardse (2007). Jde sice o starší a poněkud překonaný zdroj, koncept se ale nemění :) Jen pozor na terminologii, dnes se používá mírně odlišná.
Pokročilí, kteří se zajímají o adaptivní testování: Sice poněkud postarší, ale stále aktuální přehled adaptivního testování je van der Linden a Glas (2010). Může se hodit těm, kteří se z jakéhokoli důvodu chtějí specializovat na tvorbu adaptivních testů (nejen v rámci projektu Invenio ;) .

Nevyhovuje vám žádný z následujících zdrojů?

Pokud vám nevyhovuje žádný z doporučených zdrojů a máte nějaký jiný zdroj o IRT, který byste si chtěli přečíst, nenechte se svazovat a směle do toho!

Užitečné odkazy

Simulace ICC křivky

Binární, 1PL-4PL položka.

Simulace ICC křivek

Záložka IRT models -> Training. Na výběr máte z binárních 1PL-4PL položek, případně tří různých polytomních modelů.

Doporučené a rozšiřující zdroje

Z těchto zdrojů si vybírejte povinnou literaturu ke druhému setkání.

Velmi stručný 100stránkový přehled IRT:
DeMars, C. (2010). Item Response Theory. Oxford University Press.
Komeplexní přehled o Raschovu modelu:
Bond, T. G., & Fox, C. M. (2015). Applying the Rasch Model : Fundamental Measurement in the Human Sciences. Lawrence Erlbaum Associates.
Podrobná a rozsáhlá učebnice IRT:
De Ayala, R. J. (2009). The theory and practice of item response theory. Guilford Press.
Popis a možnosti odhadu 1PL explanačního modelu (například pro využití v experimentálních studiích):
De Boeck, P., Bakker, M., Zwitser, R., Nivard, M., Hofman, A., Tuerlinckx, F., & Partchev, I. (2012). The Estimation of Item Response Models with the lmer Function from the lme4 Package in R. Journal of Statistical Software, 39(12), 1–28. https://www.jstatsoft.org/article/view/v039i12/v39i12.pdf
Popis tzv. IRTree modelů pro výzkumné účely:
De Boeck, P., & Partchev, I. (2012). IRTrees: Tree-Based Item Response Models of the GLMM Family. Journal of Statistical Software, 48(Code Snippet 1), 1–18. https://doi.org/10.18637/jss.v048.c01
Úvod do ordinální faktorové analýzy (item-factor analysis):
Wirth, R. J., & Edwards, M. C. (2007). Item Factor Analysis: Current Approaches and Future Directions. Psychological Methods 12(1), 58–79. https://doi.org/10.1037/1082-989X.12.1.58
Kompendium stávající teorie odpovědi na položku.
Pokud byste v blízké budoucnosti potřebovali velmi pokročilé informace, jde o v současnosti nejlepší a nejkomplexnější zdroj. Doporučuji zejména první svazek (modely), případně pak třetí (aplikace). Druhý svazek (statistické nástroje) není pro psychology příliš užitečný, nicméně i zde se najdou skvělé pasáže (např. přehled užitečných distribucí v kap. 2).
van der Linden [eds.] (2016–2018). Handbook of Item Response Theory, vol. 1–3. New York: Taylor & Francis.
Adaptivní testování.
Přehled a principy používané při vývoji adaptivních testů:
Linden, W. J. van der, & Glas, C. A. W. (Eds.). (2010). Elements of adaptive testing. Springer.
Představení Raschova modelu v češtině.
Nejde o nic převratného, ale jsou zde popsány hlavní principy, které jsme využili při tvorbě testu TIM^3–5, a které se mohou hodit i v jiných kontextech
Cígler, H. (2018). Matematické schopnosti: Teoretický přehled a jejich měření, kap. Studie 2: Raschův model, strany 129-161. Masarykova univerzita.

Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.

https://is.muni.cz/el/fss/podzim2022/PSYn4790/um/literatura/bond2015.pdf

Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.

https://is.muni.cz/el/fss/podzim2022/PSYn4790/um/literatura/demars2010.pdf

Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.

https://is.muni.cz/el/fss/podzim2022/PSYn4790/um/literatura/wirth2007.pdf

Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.

https://is.muni.cz/el/fss/podzim2022/PSYn4790/um/literatura/deboeck2012b.pdf

Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.

https://is.muni.cz/el/fss/podzim2022/PSYn4790/um/literatura/deboeck2012.pdf

Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.

https://is.muni.cz/el/fss/podzim2022/PSYn4790/um/literatura/cigler2018.pdf

Další doplňující zdroje

Jde o zdroje, které vysvětlují specifické dílčí aspekty, o kterých jsme mluvili na přednášce. Pomohou vám vysvětlit dílčí témata, jsou však "nad rámec" a nevybírejte si z nich povinnou četbu na druhé setkání.

Interpretace raschovských IRT skórů:
Jaffe, L. E. (2009). Development, interpretation, and application of the W score and the relative proficiency index (Woodcock-Johnson III Assessment Service Bulletin No. 11). Rolling Meadows, IL: Riverside Publishing.
Implementace IRT do Mplus (včetně rovnice; je využitelné i při práci v R s lavaanem a podobně):
Asparouhov, T., & Muthén, B. (2020). IRT in Mplus. Version 3. Technical report. www.statmodel.com.
Srovnání IRT estimátorů (WLSMV v ordinální CFA, ML a Bayesovský odhad):
Muthén, B., Muthén, L., & Asparouhov, T. (2015). Estimator choices with categorical outcomes. Technical report. www.statmodel.com.