Problematika měření v psychologii MĚŘENÍ CO MĚŘÍME MĚŘENÍ CO MĚŘÍME JAK MĚŘÍME operacionalizace MĚŘENÍ CO MĚŘÍME JAK MĚŘÍME operacionalizace měříme správně? MĚŘENÍ CO MĚŘÍME JAK MĚŘÍME operacionalizace měříme správně? na jaké škále? MĚŘENÍ CO MĚŘÍME JAK MĚŘÍME operacionalizace měříme správně? koho měříme? na jaké škále? CO měříme CO měříme CO budeme měřit je dáno cílem výzkumu CO měříme CO budeme měřit je dáno cílem výzkumu konstrukty - co vše můžeme měřit? CO měříme CO budeme měřit je dáno cílem výzkumu konstrukty - co vše můžeme měřit? co bylo např. měřeno v Milgramově výzkumu? JAK měříme JAK měříme konstrukty nejsou přímo pozorovatelné JAK měříme konstrukty nejsou přímo pozorovatelné proces operacionalizace = vymezení postupů zkoumání konstruktu Operacionalizace Operacionalizace často založen na předchozích výzkumech Operacionalizace často založen na předchozích výzkumech postupně vyvinuty standardizované nástroje Operacionalizace příklad operacionalizace konstruktu výzkumná otázka: chápou kojenci gravitaci? Operacionalizace příklad operacionalizace konstruktu výzkumná otázka: chápou kojenci gravitaci? nemůžeme se jich přímo zeptat můžeme ale měřit, jak dlouho se dítě dívá na určitý podnět Operacionalizace z předchozích výzkumů víme, že děti preferují nové podněty: pokud jim ukážeme něco nového a neobvyklého, věnují tomu delší pozornost. studie Kima a Spelkeové - jak se v raném věku vyvíjí chápání gravitace - porovnání kojenců ve věku 5 a 7 měsíců Kim I. K., Spelke E. S. (1992). Infants' sensitivity to effects of gravity on visible object motion. Journal of Experimental Psychology: Human Perception and Performance, 18, 385–393. 1. fáze - habituace 2. fáze - změna směru pohybu míče přirozeně (mění se i rychlost) nepřirozeně (rychlost stejná) Operacionalizace děti ve věku 5 měsíců věnovaly větší pozornost přirozené změně (směru i rychlosti) zatímco děti ve věku 7 měsíců se déle dívaly na nepřirozeně změněné podmínky (směr, ale rychlost zůstala) - výzkumníci to chápali tak, že to děti vnímají jako porušení zákona gravitace NA JAKÝCH ŠKÁLÁCH MĚŘÍME? NA JAKÝCH ŠKÁLÁCH MĚŘÍME? kvalitativní vs kvantitativní data NA JAKÝCH ŠKÁLÁCH MĚŘÍME? kvalitativní vs kvantitativní data nominální, ordinální, intervalové a poměrové škály Kvalitativní a kvantitativní data kvalitativní (kategoriální) – zjišťujeme hodnotu znaku – kategorii (např. pohlaví, náboženské vyznání, rodinný stav, barva očí, vzdělání); často fungují jako nezávislé proměnné (faktory); (categorial data) kvantitativní (metrická) data – zjištěná měřením pomocí nějakého nástroje 
 (v širším smyslu); skór v testu, tělesná váha…; obvykle závislé proměnné (measurement data) Nominální škály kategoriální proměnné jsou měřeny buď na nominální nebo pořadové úrovni nominální – čísla jsou hodnotám proměnné přiřazena náhodně; pouze hodnoty označují, ale nelze s nimi jako s čísly zacházet (jediné operace jsou = a ≠) (nominal scales) Pořadové škály pořadová (ordinální) – hodnoty je možno uspořádat podle velikosti (např. pořadí v závodu, postojové škály), ale není možno stanovit, o kolik se liší (ordinal scales) možné početní operace jsou stále = a ≠, ale také < a > Intervalové škály intervalová – hodnoty je možno uspořádat a vzdálenosti mezi nimi (intervaly) jsou shodné (např. rok narození, teplota) (interval scales) možné početní operace: = a ≠, < a >, + a - Poměrové škály poměrová – stejné vlastnosti jako intervalová a navíc se mezi hodnotami vyskytuje přirozená 0 (indikující absenci znaku) – tj. má smysl se ptát, kolikrát je hodnota větší než jiná hodnota (ratio scales) např. věk, reakční čas, počet dětí kromě předchozích početních operací je možné také násobení a dělení Měříme správně? validita a reliabilita validita a reliabilita Vyvolala nezávisle proměnná (terapie) skutečně změnu v proměnné závislé (snížení depresivity)? validita a reliabilita Vyvolala nezávisle proměnná (terapie) skutečně změnu v proměnné závislé (snížení depresivity)? Měří psychology navržená Škála empatie ve skutečnosti vlastnost empatie? validita a reliabilita Vyvolala nezávisle proměnná (terapie) skutečně změnu v proměnné závislé (snížení depresivity)? Měří psychology navržená Škála empatie ve skutečnosti vlastnost empatie? Jak moc je výsledek v testu inteligence zatížen chybovou složkou? validita validita koncept vztahující se k posouzení výzkumu (experimentu) jako celku nebo posouzení nástroje/testu validita koncept vztahující se k posouzení výzkumu (experimentu) jako celku nebo posouzení nástroje/testu posouzení výzkumu přináší výzkum relevantní závěry o zkoumaném jevu? validita koncept vztahující se k posouzení výzkumu (experimentu) jako celku nebo posouzení nástroje/testu posouzení výzkumu přináší výzkum relevantní závěry o zkoumaném jevu? posouzení nástroje měří test to, k čemu byl navržen? reliabilita reliabilita spolehlivost měření relativní nepřítomnost chyb měření soulad mezi výsledky při opakovaném měření téže vlastnosti validita výzkumu validita výzkumu jedná se o posouzení potenciálu výzkumných závěrů je výzkum naplánován tak, aby mohl přinést relevantní poznatky? přináší výzkum relevantní poznatky o zkoumaném fenoménu tak, jak bylo zamýšleno? validita výzkumu jedná se o posouzení potenciálu výzkumných závěrů je výzkum naplánován tak, aby mohl přinést relevantní poznatky? přináší výzkum relevantní poznatky o zkoumaném fenoménu tak, jak bylo zamýšleno? validitu nástroje je možno chápat jako nutnou podmínku validity výzkumu pokud nemáme validní nástroje, výzkum jako celek nemůže být validní validita výzkumu validita výzkumu validita statistických postupů konstruktová validita vnější validita vnitřní validita validita statistických postupů validita statistických postupů posuzujeme adekvátnost výběru a použití statistických postupů validita statistických postupů posuzujeme adekvátnost výběru a použití statistických postupů kde může být problém? špatný výběr analýzy, porušení předpokladů testu uvedení pouze těch výsledků, které se mi hodí nedostatečná reliabilita nástrojů - vysoká chyba měření zvyšuje pravděpodobnost chyby II. druhu validita statistických postupů posuzujeme adekvátnost výběru a použití statistických postupů kde může být problém? špatný výběr analýzy, porušení předpokladů testu uvedení pouze těch výsledků, které se mi hodí nedostatečná reliabilita nástrojů - vysoká chyba měření zvyšuje pravděpodobnost chyby II. druhu způsob analýzy musí být naplánován již v projektu konstruktová validita výzkumu konstruktová validita výzkumu posouzení adekvátnosti operacionálních definic proměnných konstruktová validita výzkumu posouzení adekvátnosti operacionálních definic proměnných příklad z minulé přednášky: je operacionální definice vyvolání anxiety adekvátní (doplnění instrukce k testu o informaci o 25% vs. 90% úspěšnosti)? je lepší agresivitu osob ve výzkumu měřit objetivně či subjektivně? externí validita výzkumu externí validita výzkumu psychologie jako věda o krysách a studentech kritika nedostatku externí validity ve výzkumu externí validita výzkumu psychologie jako věda o krysách a studentech kritika nedostatku externí validity ve výzkumu zobecnitelnost závěrů za kontext dané studie na jiné populace (osoby) na jiná prostředí na jiná časová období externí validita výzkumu externí validita výzkumu populace - studenti, muži x ženy, kultura externí validita výzkumu populace - studenti, muži x ženy, kultura prostředí ekologická validita (Neisser): důležitá je (mimo jiné) relevance výzkumu a jeho závěrů pro běžné činnosti externí validita výzkumu populace - studenti, muži x ženy, kultura prostředí ekologická validita (Neisser): důležitá je (mimo jiné) relevance výzkumu a jeho závěrů pro běžné činnosti čas - historické vlivy, zastarávání závěrů externí validita výzkumu populace - studenti, muži x ženy, kultura prostředí ekologická validita (Neisser): důležitá je (mimo jiné) relevance výzkumu a jeho závěrů pro běžné činnosti čas - historické vlivy, zastarávání závěrů externí validita závěrů je budována postupně různými studiemi provedenými na dané téma v různých kontextech... interní validita výzkumu interní validita výzkumu důležitější než externí validita interní validita výzkumu důležitější než externí validita vnitřně validní experiment kvalitní operacionalizace (konstruktová validita) NP a ZP absence confounding efektu - neexistence alternativního vysvětlení mimo působení NP tzn. kontrola intervenujících proměnných interní validita výzkumu důležitější než externí validita vnitřně validní experiment kvalitní operacionalizace (konstruktová validita) NP a ZP absence confounding efektu - neexistence alternativního vysvětlení mimo působení NP tzn. kontrola intervenujících proměnných zdroje ohrožení historie a zrání, samovýběr, opotřebení vzorku atd. validita nástrojů validita nástrojů obsahová validita kriteriální validita konstruktová validita obsahová validita obsahová validita reprezentují položky testu projevy předpokládané charakteristiky? reprezentují celé uvažované spektrum atributů? posouzení reprezentativnosti položek vzhledem k danému fenoménu jedním či více experty něco jiného než zdánlivá (face) validita - míra toho, nakolik je účel testu zjevný respondentům kriteriální validita kriteriální validita založena na korelaci nástroje a kritéria prediktivní validita - předpověď budoucího chování souběžná validita - kritériem jiná (ověřená) metoda měřící danou charakteristiku, expertní posouzení apod. konstruktová validita konstruktová validita ověřuje, zda nástroj reprezentuje přepokládaný teoretický konstrukt konstruktová validita ověřuje, zda nástroj reprezentuje přepokládaný teoretický konstrukt z teorie vyvodíme hypotézy o vztahu výsledků testu k jiným proměnným konvergentní validita - empatie bude spojena spíše s verbální než performační inteligencí diskriminační validita - důležitá pro diferenciaci konstruktů (self-efficacy vs. self-esteem) reliabilita reliabilita X=T+E X - pozorovaný skór, T - skutečný skór, E chyba měření pokud jedince změříme 1000x testem inteligence, čemu bude rovna hodnota skutečné inteligence? reliabilita X=T+E X - pozorovaný skór, T - skutečný skór, E chyba měření pokud jedince změříme 1000x testem inteligence, čemu bude rovna hodnota skutečné inteligence? průměru z 1000 měření za určitých předpokladů (absence systematických chyb apod.) reliabilita X=T+E X - pozorovaný skór, T - skutečný skór, E chyba měření pokud jedince změříme 1000x testem inteligence, čemu bude rovna hodnota skutečné inteligence? průměru z 1000 měření za určitých předpokladů (absence systematických chyb apod.) vyšší nesystematická chyba měření - vyšší kolísání pozorovaných hodnot kolem skutečných skórů - nižší reliabilita reliabilita X=T+E X - pozorovaný skór, T - skutečný skór, E chyba měření pokud jedince změříme 1000x testem inteligence, čemu bude rovna hodnota skutečné inteligence? průměru z 1000 měření za určitých předpokladů (absence systematických chyb apod.) vyšší nesystematická chyba měření - vyšší kolísání pozorovaných hodnot kolem skutečných skórů - nižší reliabilita v případě vysoké chyby měření může být individuální skór značně vzdálen od skóru skutečného reliabilita reliabilita způsoby zjišťování test-retest reliabilita paralelních forem vnitřní konzistence testu shoda posuzovatelů reliabilita způsoby zjišťování test-retest reliabilita paralelních forem vnitřní konzistence testu shoda posuzovatelů za minimální úroveň je považována hodnota 0,7 či 0,8 (tzn. korelace 0,7 mezi dvěma měřeními stejným testem) reliabilita a validita nástroje reliabilita a validita nástroje předpokladem validity nástroje je jeho reliabilita, platí to i naopak? reliabilita a validita nástroje předpokladem validity nástroje je jeho reliabilita, platí to i naopak? vysvětlete proč může mít metoda současně vysokou reliabilitu a nízkou validitu na příkladu frenologie reliabilita a validita nástroje předpokladem validity nástroje je jeho reliabilita, platí to i naopak? vysvětlete proč může mít metoda současně vysokou reliabilitu a nízkou validitu na příkladu frenologie vysvětlete, proč je důležité z etického hlediska zkoumat úroveň validity a reliability psychodiagnostických metod