PSY117/454 Statistická analýza dat v psychologii MÍRY CENTRÁLNÍ TENDENCE a VARIABILITY Centrální tendence (=střední hodnoty) CT je údaj, jímž se snažíme popsat rozložení jedné proměnné Jeho kouzlo i zrádnost je právě v tom, že je to právě jeden údaj. CT udává průměrnou, typickou, reprezentativní hodnotu Co se těmito slovy míníme, záleží na tom, jakou míru CT se rozhodneme použít AJ: measures of central tendency Modus, medián a průměr Modus - kategoriální typická hodnota nejčastější hodnota, h. s nejvyšší četností jediná možnost u nominálních dat, u vyšších úrovní často užitečnou volbou Medián ­ pořadová střední hodnota hodnota prvku uprostřed uspořádaného souboru při sudém počtu prvků je mediánem kterékoli číslo z intervalu mezi nejbližší vyšší a nejbližší nižší hodnotou (konsensuálně střed intervalu) pořadová data a výše Aritmetický průměr ­ deviační střední hodnota jak ho znáte ze školy pouze intervalová a poměrová data velmi citlivý na extrémní hodnoty AJ: mode, median, mean MoX ,^ MdX , ~ mMX ,, Střední hodnoty - poznámky je třeba je umět spočítat ručně (a zopakovat si práci se sumačním symbolem ) i vážený průměr jak je ovlivní datové transformace přičtení konstanty a násobení konstantou vhodnost použití 3M (Hendl s.95) AJ: weighted mean, add, multiply Míry variability (rozptýlenosti) nominální ­ entropie ­ nepoužívá se pořadové (variační) rozpětí = Xmax ­ Xmin (extrémně kolísá s velikostí vzorku) kvartilové rozpětí = Q3 ­ Q1 odchylkové (deviační, momentové) ukazatele průměrná absolutní odchylka (|x| / n) ­ nepoužívá se průměrná odchylka na druhou ­ rozptyl populační (x2 / n) vs. výběrový (x2 / (n ­ 1)) součet odchylek na druhou = suma čtverců směrodatná odchylka (standardní odchylka) odmocnina rozptylu - návrat k původní jednotce AJ: measures of variability, entropy, rank-order, range, interquartile range, variance, standard deviation, sum of squares, square, square root Souhrn Kategoriální deskriptivy modus, (entropie) Pořadové deskriptivy medián, kvartily, percentily (a jiné kvantily) kvartilové rozpětí Odchylkové, momentové deskriptivy aritmetický průměr rozptyl, směrodatná odchylka (k=2) zešikmení (k=3) = xk / n špičatost (strmost) (k=4) z-skóry, standardizované s. transformace sady skórů na m=0, s=1 ­ jednotkou měření se stává s zi = (xi ­ m) / s u dat o lidech je většina (přes 90%) lidí mezi -3 a 3 ze z-skórů pak např. T (50,10), IQ (100, 15) apod. AJ: data transformations, standard scores, z-scores Oblasti pod křivkou normálního rozložení upraveno dle Glass, Hopkins, s. 88 Statistické zkratky a značky různé systémy, je třeba dobře popisovat N, n = velikost vzorku (podvzorku) Xi = skór i-té osoby u proměnné X xi = deviační skór, odchylka od průměru M, m,x = průměr SD, s = směrodatná odchylka s2 = rozptyl AJ: statistical notation, sample size, subsample, score, deviation score