Psychometrika: měření v psychologii

Týden 7-8: Teorie odpovědi na položku | 24. a 31. 10. 2022

Přednáška na téma teorie odpovědi na položku (IRT, Item Response Theory) bude rozdělena do dvou setkání. Cílem je představit konceptuální základy IRT, popsat její vztah s faktorovou analýzou i klasickou testovou teorií, a zakotvit celé téma do epistemologického rámce (podrobněji iz poslední dvě přednášky kurzu). Důraz bude kladen na možnosti využití IRT v diagnostické i výzkumné praxi. Předpokládány jsou teoretické znalosti fungování IRT a její východiska, různé druhy modelů a možnosti aplikace. 

  • Epistemologické základy IRT. Rozdíl oproti CTT, podobnost faktorové analýze.
  • Předpoklady IRT, vlastnosti IRT modelů, velikost vzorku.
  • Stručný přehled IRT modelů dle počtu parametrů: Raschovy modely (RM) a 1PL, 2PL, 3PL
  • Rozdílná východiska Raschova modelu a ostatních IRT modelů.
  • Polytomické IRT modely: RSM, PCM, GPCM, GRM, NRM a další.
  • Tutzův sekvenční model, IRTree, LLTM modely; IRT jako generalizovaný smíšený lineární model (GLMM).
  • Informační funkce položky a testu. Charakteristická funkce položky a testu. Vztah informační funkce a chyby měření.
  • Shoda modelu s daty na úrovni položky i celého testu.
  • Výhody a nevýhody využití IRT při konstrukci testu. 
  • Matematická ekvivalence IRT a ordinální faktorové analýzy.
  • Rozdíl měřené „veličiny“: vztah hrubého skóre, odhadu faktorového skóru ve FA a v IRT.
  • Typické raschovské skóry: W-škála, index relativní výkonnosti (RPI), vývojové skóry (věkové a ročníkové ekvivalenty), zóna proximálního vývoje.
  • Multidimenzionální IRT; intercept-slope parametrizace, kompenzatorní a non-kompenzatorní modely.
  • Aplikace IRT: Adaptivní testování.
  • Aplikace IRT: Škálování založené na IRT.
  • Aplikace IRT: Linking a equating.


IRT: Skript a data
Příklad odhadu různých IRT modelů nad binárními daty Testu intelektového potenciálu. Pokud vás zajímá, jak odhadnout IRT model v R, můžete mrknout sem.


Přednáška 07: Teorie odpovědi na položku
Prezentace k první i druhé přednášce o IRT.
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fss/podzim2022/PSYn4790/um/videa2020/PSYn4790_2022_P07.video5
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fss/podzim2022/PSYn4790/um/videa2020/PSYn4790_2022_P08.video5


Průběžná příprava (26.-30. 10.)

Průběžná příprava je společná pro obě části přednášky, a to po prvním setkání. Po druhém setkání je termín druhého písemného testu a průběžná příprava je proto vynechaná.


Literatura

Povinná literatura je rozdělena do dvou částí podle dvou setkání. K prvnímu setkání je zadaná povinná literatura v podobě krátkého učebnicového textu. Ke druhému setkání je zadaná pouze rozšiřující literatura. Pokud však máte pocit, že se v úplných základech IRT orientujete (například díky svému bakalářskému studiu), doporučuji zcela přeskočit základní literaturu a pustit se rovnou do rozšiřující. 

V každém případě předpokládáme, že povinnou literaturu projdete před druhým setkáním k IRT a druhý týden budete mít k dispozici pro přípravu na písemný test (opakování témat CTT, GT a IRT). 

Povinný zdroj (k 1. setkání):

  1. Furr, R. M., & Bacharach, V. R. (2018). Psychometrics : An Introduction. Sage. Kapitola 14, strany 609652.
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fss/podzim2022/PSYn4790/um/literatura/furr.pdf
Znáte základy a FURR by pro vás byl ztrátou času?

Pokud máte pocit, že základy IRT popisované Furrem (2014) již znáte, nečtěte jej znova, a zaměřte se na cokoli z doporučené literatury uvedené níže. Ušetříte svůj čas a dozvíte se něco nového ;-)

Rozšiřující zdroje k 2. setkání:

Dle svých znalostí a toho, na kolik si troufáte, si vyberte libovolný z doporučených a rozšiřujících zdrojů a přečtěte si jej. Volte uvážlivě téma, autora i rozsah; volte přiměřeně svým schopnostem a možnostem :-) Každopádně si vyberte něco, co vám dá něco nového. Několik tipů:

  • Začátečníci: Pokud máte pocit, že se v IRT neorientujete vůbec, doporučuji celou DeMars (2010). Dočtete se znovu to, co ve Furrovi a Bacharachovi, a třeba se vám to bude napodruhé lépe chápat. Jde skutečně jen o 100 stran a celý text je velmi stravitelný.
  • Kdokoli: Kdokoli může zvolit Bonda a Foxovou (2015). V takovém případě si projděte cca prvních pět kapitol, můžete ale zabrousit i do některých z pozdějších pasáží dle svého výběru. Nečtěte celou knihu, pokud skutečně nechcete! :-) Mimochodem: předmluva k prvnímu vydání byla z následujících vydání vynechána, ale opravdu stojí za to. Popisují důvody, jak se oba autoři dostali k Raschovu modelu a proč mu "uvěřili". Je to docela zajímavé čtení!
  • Středně pokročilí: Pokud ovládáte základy a chcete se zaměřit na detaily, vyberte si dle své úvahy pasáž (jednu až dvě kapitoly) z De Ayaly (2009). Vybírejte uvážlivě, aby nešlo o opakování toho, co znáte, a abyste se dozvěděli něco nového. Osobně doporučuji multidimenzionální modely.
  • Středně pokročilí s experimentálním zaměřením: Pokud se chcete zaměřovat na experimentální výzkum, jednoznačně doporučuji IRTree modely od De Boecka a Partcheva (2012), případně explanační a LLTM modely od De Boecka a kol. (2012). Obojí je fakt super, naznačí to flexibilitu IRT přístupu! Mně osobně oba tyto zdroje otevřely oči; vyberte si, který vám přijde zajímavější, oba ale spolu úzce souvisejí. 
  • Pokročilí: Ukradněte si první díl sborníku od van der Lindena (2016), nebo si knihu půjčte od nás (kanc. 2.47) a vyberte si jednu až dvě z pokročilejších kapitol. Doporučuji zejména modely pro odhad času, výběr ale záleží na vás a vašich preferencích. Jde o nejlepší zdroj k IRT obecně, který je k dispozici, popisuje prakticky "vše". 
  • Pokročilí se zkušeností s ordinální CFA: Pokud máte už nějaké zkušenosti s ordinální CFA a chcete se dozvědět nějaká konceptuální východiska, doporučuji Wirtha a Edwardse (2007). Jde sice o starší a poněkud překonaný zdroj, koncept se ale nemění :) Jen pozor na terminologii, dnes se používá mírně odlišná.
  • Pokročilí, kteří se zajímají o adaptivní testování: Sice poněkud postarší, ale stále aktuální přehled adaptivního testování je van der Linden a Glas (2010). Může se hodit těm, kteří se z jakéhokoli důvodu chtějí specializovat na tvorbu adaptivních testů (nejen v rámci projektu Invenio ;) . 
Nevyhovuje vám žádný z následujících zdrojů?

Pokud vám nevyhovuje žádný z doporučených zdrojů a máte nějaký jiný zdroj o IRT, který byste si chtěli přečíst, nenechte se svazovat a směle do toho! 

Užitečné odkazy

Simulace ICC křivky
Binární, 1PL-4PL položka.
Simulace ICC křivek
Záložka IRT models -> Training. Na výběr máte z binárních 1PL-4PL položek, případně tří různých polytomních modelů.

Doporučené a rozšiřující zdroje

Z těchto zdrojů si vybírejte povinnou literaturu ke druhému setkání.

  1. Velmi stručný 100stránkový přehled IRT:
    DeMars, C. (2010). Item Response Theory. Oxford University Press.
  2. Komeplexní přehled o Raschovu modelu:
    Bond, T. G., & Fox, C. M. (2015). Applying the Rasch Model : Fundamental Measurement in the Human Sciences. Lawrence Erlbaum Associates.
  3. Podrobná a rozsáhlá učebnice IRT:
    De Ayala, R. J. (2009). The theory and practice of item response theory. Guilford Press.
  4. Popis a možnosti odhadu 1PL explanačního modelu (například pro využití v experimentálních studiích):
    De Boeck, P., Bakker, M., Zwitser, R., Nivard, M., Hofman, A., Tuerlinckx, F., & Partchev, I. (2012). The Estimation of Item Response Models with the lmer Function from the lme4 Package in R. Journal of Statistical Software, 39(12), 1–28.  https://www.jstatsoft.org/article/view/v039i12/v39i12.pdf
  5. Popis tzv. IRTree modelů pro výzkumné účely:
    De Boeck, P., & Partchev, I. (2012). IRTrees: Tree-Based Item Response Models of the GLMM Family. Journal of Statistical Software, 48(Code Snippet 1), 1–18. https://doi.org/10.18637/jss.v048.c01
  6. Úvod do ordinální faktorové analýzy (item-factor analysis):
    Wirth, R. J., & Edwards, M. C. (2007). Item Factor Analysis: Current Approaches and Future Directions. Psychological Methods 12(1), 58–79.
  7. Kompendium stávající teorie odpovědi na položku.
    Pokud byste v blízké budoucnosti potřebovali velmi pokročilé informace, jde o v současnosti nejlepší a nejkomplexnější zdroj. Doporučuji zejména první svazek (modely), případně pak třetí (aplikace). Druhý svazek (statistické nástroje) není pro psychology příliš užitečný, nicméně i zde se najdou skvělé pasáže (např. přehled užitečných distribucí v kap. 2).
    van der Linden [eds.] (2016–2018). Handbook of Item Response Theory, vol. 1–3. New York: Taylor & Francis.
  8. Adaptivní testování.
    Přehled a principy používané při vývoji adaptivních testů:
    Linden, W. J. van der, & Glas, C. A. W. (Eds.). (2010). Elements of adaptive testing. Springer.
  9. Představení Raschova modelu v češtině.
    Nejde o nic převratného, ale jsou zde popsány hlavní principy, které jsme využili při tvorbě testu TIM3–5, a které se mohou hodit i v jiných kontextech
    Cígler, H. (2018). Matematické schopnosti: Teoretický přehled a jejich měření, kap. Studie 2: Raschův model, strany 129-161. Masarykova univerzita.
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fss/podzim2022/PSYn4790/um/literatura/bond2015.pdf
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fss/podzim2022/PSYn4790/um/literatura/demars2010.pdf
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fss/podzim2022/PSYn4790/um/literatura/wirth2007.pdf
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fss/podzim2022/PSYn4790/um/literatura/deboeck2012b.pdf
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fss/podzim2022/PSYn4790/um/literatura/deboeck2012.pdf
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fss/podzim2022/PSYn4790/um/literatura/cigler2018.pdf

Další doplňující zdroje

Jde o zdroje, které vysvětlují specifické dílčí aspekty, o kterých jsme mluvili na přednášce. Pomohou vám vysvětlit dílčí témata, jsou však "nad rámec" a nevybírejte si z nich povinnou četbu na druhé setkání.

  1. Interpretace raschovských IRT skórů:
    Jaffe, L. E. (2009). Development, interpretation, and application of the W score and the relative proficiency index (Woodcock-Johnson III Assessment Service Bulletin No. 11). Rolling Meadows, IL: Riverside Publishing.  
  2. Implementace IRT do Mplus (včetně rovnice; je využitelné i při práci v R s lavaanem a podobně):
    Asparouhov, T., & Muthén, B. (2020). . Version 3. Technical report. www.statmodel.com. 
  3. Srovnání IRT estimátorů (WLSMV v ordinální CFA, ML a Bayesovský odhad):
    Muthén, B., Muthén, L., &  Asparouhov, T. (2015). Estimator choices with categorical outcomes. Technical report. www.statmodel.com. 
Chyba: Odkazovaný objekt neexistuje nebo nemáte právo jej číst.
https://is.muni.cz/el/fss/podzim2022/PSYn4790/um/literatura/jaffe2009.pdf
Modifikovaný RPI index (kalkulačka)
http://fssvm6.fss.muni.cz/TIM/