Problematika
měření v psychologii
MĚŘENÍ
CO
MĚŘÍME
MĚŘENÍ
CO
MĚŘÍME
JAK
MĚŘÍME
operacionalizace
MĚŘENÍ
CO
MĚŘÍME
JAK
MĚŘÍME
operacionalizace
měříme
správně?
MĚŘENÍ
CO
MĚŘÍME
JAK
MĚŘÍME
operacionalizace
měříme
správně?
na jaké
škále?
MĚŘENÍ
CO
MĚŘÍME
JAK
MĚŘÍME
operacionalizace
měříme
správně?
koho
měříme?
na jaké
škále?
CO měříme
CO měříme
CO budeme měřit je dáno cílem výzkumu
CO měříme
CO budeme měřit je dáno cílem výzkumu
konstrukty - co vše můžeme měřit?
CO měříme
CO budeme měřit je dáno cílem výzkumu
konstrukty - co vše můžeme měřit?
co bylo např. měřeno v Milgramově
výzkumu?
JAK měříme
JAK měříme
konstrukty nejsou přímo pozorovatelné
JAK měříme
konstrukty nejsou přímo pozorovatelné
proces operacionalizace = vymezení
postupů zkoumání konstruktu
Operacionalizace
Operacionalizace
často založen na předchozích výzkumech
Operacionalizace
často založen na předchozích výzkumech
postupně vyvinuty standardizované
nástroje
Operacionalizace
příklad operacionalizace konstruktu
výzkumná otázka: chápou kojenci gravitaci?
Operacionalizace
příklad operacionalizace konstruktu
výzkumná otázka: chápou kojenci gravitaci?
nemůžeme se jich přímo zeptat
můžeme ale měřit, jak dlouho se dítě dívá na
určitý podnět
Operacionalizace
z předchozích výzkumů víme, že děti preferují
nové podněty: pokud jim ukážeme něco nového
a neobvyklého, věnují tomu delší pozornost.
studie Kima a Spelkeové - jak se v raném věku
vyvíjí chápání gravitace - porovnání kojenců ve
věku 5 a 7 měsíců
Kim I. K., Spelke E. S. (1992). Infants' sensitivity to effects of gravity on visible object motion.
Journal of Experimental Psychology: Human Perception and Performance, 18, 385–393.
1. fáze - habituace
2. fáze - změna
směru pohybu
míče
přirozeně
(mění se i
rychlost)
nepřirozeně
(rychlost
stejná)
Operacionalizace
děti ve věku 5 měsíců věnovaly větší
pozornost přirozené změně (směru i
rychlosti)
zatímco děti ve věku 7 měsíců se déle dívaly
na nepřirozeně změněné podmínky (směr, ale
rychlost zůstala) - výzkumníci to chápali tak,
že to děti vnímají jako porušení zákona
gravitace
NA JAKÝCH
ŠKÁLÁCH MĚŘÍME?
NA JAKÝCH
ŠKÁLÁCH MĚŘÍME?
kvalitativní vs kvantitativní data
NA JAKÝCH
ŠKÁLÁCH MĚŘÍME?
kvalitativní vs kvantitativní data
nominální, ordinální, intervalové a
poměrové škály
Kvalitativní a kvantitativní data
kvalitativní (kategoriální) – zjišťujeme
hodnotu znaku – kategorii (např. pohlaví,
náboženské vyznání, rodinný stav, barva
očí, vzdělání); často fungují jako nezávislé
proměnné (faktory); (categorial data)
kvantitativní (metrická) data – zjištěná
měřením pomocí nějakého nástroje  
(v širším smyslu); skór v testu, tělesná
váha…; obvykle závislé proměnné
(measurement data)
Nominální škály
kategoriální proměnné jsou měřeny buď
na nominální nebo pořadové úrovni
nominální – čísla jsou hodnotám
proměnné přiřazena náhodně; pouze
hodnoty označují, ale nelze s nimi jako
s čísly zacházet (jediné operace jsou = a
≠) (nominal scales)
Pořadové škály
pořadová (ordinální) – hodnoty je možno
uspořádat podle velikosti (např. pořadí v
závodu, postojové škály), ale není možno
stanovit, o kolik se liší (ordinal scales)
možné početní operace jsou stále = a ≠, ale
také < a >
Intervalové škály
intervalová – hodnoty je možno
uspořádat a vzdálenosti mezi nimi
(intervaly) jsou shodné (např. rok
narození, teplota) (interval scales)
možné početní operace: = a ≠, < a >, + a -
Poměrové škály
poměrová – stejné vlastnosti jako
intervalová a navíc se mezi hodnotami
vyskytuje přirozená 0 (indikující absenci
znaku) – tj. má smysl se ptát, kolikrát je
hodnota větší než jiná hodnota (ratio scales)
např. věk, reakční čas, počet dětí
kromě předchozích početních operací je
možné také násobení a dělení
Měříme správně?
validita a reliabilita
validita a reliabilita
Vyvolala nezávisle proměnná (terapie)
skutečně změnu v proměnné závislé (snížení
depresivity)?
validita a reliabilita
Vyvolala nezávisle proměnná (terapie)
skutečně změnu v proměnné závislé (snížení
depresivity)?
Měří psychology navržená Škála empatie ve
skutečnosti vlastnost empatie?
validita a reliabilita
Vyvolala nezávisle proměnná (terapie)
skutečně změnu v proměnné závislé (snížení
depresivity)?
Měří psychology navržená Škála empatie ve
skutečnosti vlastnost empatie?
Jak moc je výsledek v testu inteligence zatížen
chybovou složkou?
validita
validita
koncept vztahující se k posouzení výzkumu
(experimentu) jako celku nebo posouzení
nástroje/testu
validita
koncept vztahující se k posouzení výzkumu
(experimentu) jako celku nebo posouzení
nástroje/testu
posouzení výzkumu
přináší výzkum relevantní závěry o zkoumaném
jevu?
validita
koncept vztahující se k posouzení výzkumu
(experimentu) jako celku nebo posouzení
nástroje/testu
posouzení výzkumu
přináší výzkum relevantní závěry o zkoumaném
jevu?
posouzení nástroje
měří test to, k čemu byl navržen?
reliabilita
reliabilita
spolehlivost měření
relativní nepřítomnost chyb měření
soulad mezi výsledky při opakovaném měření
téže vlastnosti
validita výzkumu
validita výzkumu
jedná se o posouzení potenciálu výzkumných závěrů
je výzkum naplánován tak, aby mohl přinést
relevantní poznatky?
přináší výzkum relevantní poznatky o zkoumaném
fenoménu tak, jak bylo zamýšleno?
validita výzkumu
jedná se o posouzení potenciálu výzkumných závěrů
je výzkum naplánován tak, aby mohl přinést
relevantní poznatky?
přináší výzkum relevantní poznatky o zkoumaném
fenoménu tak, jak bylo zamýšleno?
validitu nástroje je možno chápat jako nutnou
podmínku validity výzkumu
pokud nemáme validní nástroje, výzkum jako celek
nemůže být validní
validita výzkumu
validita výzkumu
validita statistických postupů
konstruktová validita
vnější validita
vnitřní validita
validita statistických postupů
validita statistických postupů
posuzujeme adekvátnost výběru a použití
statistických postupů
validita statistických postupů
posuzujeme adekvátnost výběru a použití
statistických postupů
kde může být problém?
špatný výběr analýzy, porušení předpokladů testu
uvedení pouze těch výsledků, které se mi hodí
nedostatečná reliabilita nástrojů - vysoká chyba měření
zvyšuje pravděpodobnost chyby II. druhu
validita statistických postupů
posuzujeme adekvátnost výběru a použití
statistických postupů
kde může být problém?
špatný výběr analýzy, porušení předpokladů testu
uvedení pouze těch výsledků, které se mi hodí
nedostatečná reliabilita nástrojů - vysoká chyba měření
zvyšuje pravděpodobnost chyby II. druhu
způsob analýzy musí být naplánován již v projektu
konstruktová validita výzkumu
konstruktová validita výzkumu
posouzení adekvátnosti operacionálních deﬁnic
proměnných
konstruktová validita výzkumu
posouzení adekvátnosti operacionálních deﬁnic
proměnných
příklad z minulé přednášky:
je operacionální deﬁnice vyvolání anxiety
adekvátní (doplnění instrukce k testu o informaci o
25% vs. 90% úspěšnosti)?
je lepší agresivitu osob ve výzkumu měřit objetivně
či subjektivně?
externí validita výzkumu
externí validita výzkumu
psychologie jako věda o krysách a studentech
kritika nedostatku externí validity ve výzkumu
externí validita výzkumu
psychologie jako věda o krysách a studentech
kritika nedostatku externí validity ve výzkumu
zobecnitelnost závěrů za kontext dané studie
na jiné populace (osoby)
na jiná prostředí
na jiná časová období
externí validita výzkumu
externí validita výzkumu
populace - studenti, muži x ženy, kultura
externí validita výzkumu
populace - studenti, muži x ženy, kultura
prostředí
ekologická validita (Neisser):
důležitá je (mimo jiné) relevance výzkumu a jeho
závěrů pro běžné činnosti
externí validita výzkumu
populace - studenti, muži x ženy, kultura
prostředí
ekologická validita (Neisser):
důležitá je (mimo jiné) relevance výzkumu a jeho
závěrů pro běžné činnosti
čas - historické vlivy, zastarávání závěrů
externí validita výzkumu
populace - studenti, muži x ženy, kultura
prostředí
ekologická validita (Neisser):
důležitá je (mimo jiné) relevance výzkumu a jeho
závěrů pro běžné činnosti
čas - historické vlivy, zastarávání závěrů
externí validita závěrů je budována postupně různými
studiemi provedenými na dané téma v různých
kontextech...
interní validita výzkumu
interní validita výzkumu
důležitější než externí validita
interní validita výzkumu
důležitější než externí validita
vnitřně validní experiment
kvalitní operacionalizace (konstruktová validita) NP a
ZP
absence confounding efektu - neexistence alternativního
vysvětlení mimo působení NP
tzn. kontrola intervenujících proměnných
interní validita výzkumu
důležitější než externí validita
vnitřně validní experiment
kvalitní operacionalizace (konstruktová validita) NP a
ZP
absence confounding efektu - neexistence alternativního
vysvětlení mimo působení NP
tzn. kontrola intervenujících proměnných
zdroje ohrožení
historie a zrání, samovýběr, opotřebení vzorku atd.
validita nástrojů
validita nástrojů
obsahová validita
kriteriální validita
konstruktová validita
obsahová validita
obsahová validita
reprezentují položky testu projevy
předpokládané charakteristiky?
reprezentují celé uvažované spektrum atributů?
posouzení reprezentativnosti položek vzhledem
k danému fenoménu jedním či více experty
něco jiného než zdánlivá (face) validita - míra
toho, nakolik je účel testu zjevný respondentům
kriteriální validita
kriteriální validita
založena na korelaci nástroje a kritéria
prediktivní validita - předpověď budoucího
chování
souběžná validita - kritériem jiná (ověřená) metoda
měřící danou charakteristiku, expertní posouzení
apod.
konstruktová validita
konstruktová validita
ověřuje, zda nástroj reprezentuje přepokládaný
teoretický konstrukt
konstruktová validita
ověřuje, zda nástroj reprezentuje přepokládaný
teoretický konstrukt
z teorie vyvodíme hypotézy o vztahu výsledků
testu k jiným proměnným
konvergentní validita - empatie bude spojena spíše
s verbální než performační inteligencí
diskriminační validita - důležitá pro diferenciaci
konstruktů (self-efﬁcacy vs. self-esteem)
reliabilita
reliabilita
X=T+E
X - pozorovaný skór, T - skutečný skór, E chyba měření
pokud jedince změříme 1000x testem inteligence, čemu bude
rovna hodnota skutečné inteligence?
reliabilita
X=T+E
X - pozorovaný skór, T - skutečný skór, E chyba měření
pokud jedince změříme 1000x testem inteligence, čemu bude
rovna hodnota skutečné inteligence?
průměru z 1000 měření za určitých předpokladů (absence
systematických chyb apod.)
reliabilita
X=T+E
X - pozorovaný skór, T - skutečný skór, E chyba měření
pokud jedince změříme 1000x testem inteligence, čemu bude
rovna hodnota skutečné inteligence?
průměru z 1000 měření za určitých předpokladů (absence
systematických chyb apod.)
vyšší nesystematická chyba měření - vyšší kolísání
pozorovaných hodnot kolem skutečných skórů - nižší reliabilita
reliabilita
X=T+E
X - pozorovaný skór, T - skutečný skór, E chyba měření
pokud jedince změříme 1000x testem inteligence, čemu bude
rovna hodnota skutečné inteligence?
průměru z 1000 měření za určitých předpokladů (absence
systematických chyb apod.)
vyšší nesystematická chyba měření - vyšší kolísání
pozorovaných hodnot kolem skutečných skórů - nižší reliabilita
v případě vysoké chyby měření může být individuální skór
značně vzdálen od skóru skutečného
reliabilita
reliabilita
způsoby zjišťování
test-retest
reliabilita paralelních forem
vnitřní konzistence testu
shoda posuzovatelů
reliabilita
způsoby zjišťování
test-retest
reliabilita paralelních forem
vnitřní konzistence testu
shoda posuzovatelů
za minimální úroveň je považována hodnota 0,7 či
0,8 (tzn. korelace 0,7 mezi dvěma měřeními
stejným testem)
reliabilita a validita nástroje
reliabilita a validita nástroje
předpokladem validity nástroje je jeho reliabilita,
platí to i naopak?
reliabilita a validita nástroje
předpokladem validity nástroje je jeho reliabilita,
platí to i naopak?
vysvětlete proč může mít metoda současně
vysokou reliabilitu a nízkou validitu na
příkladu frenologie
reliabilita a validita nástroje
předpokladem validity nástroje je jeho reliabilita,
platí to i naopak?
vysvětlete proč může mít metoda současně
vysokou reliabilitu a nízkou validitu na
příkladu frenologie
vysvětlete, proč je důležité z etického hlediska
zkoumat úroveň validity a reliability
psychodiagnostických metod