PSY117/454 Statistická analýza dat v psychologii Přednáška 4 KVALITY STATISTIK (+NORMÁLNÍ ROZLOŽENÍ) Statistics are like bikinis. What they reveal is suggestive, but what they conceal is vital. Aaron Levenstein Srovnání ukazatelů střední hodnoty Mo ­ nejčastější hodnota Md ­ střed setříděného souboru, min součet abs. odchylek M ­ těžiště, min součet umocněných odchylek (nejmenší čtverce) Výpovědní hodnota - závislost na tvaru rozložení - robustnost výskytu extrémních hodnot - rezistence ... úrovni měření ROBUSTNOST a REZISTENCE jsou žádoucími vlastnostmi statistik AJ: measures of central tendency, least squares, resistance, robustness, Srovnání ukazatelů rozptýlenosti VR ­ empirický rozsah (podle úrovně měření v měřítku či v počtu bodů na teoretické škále) IQR ­ pásmo 50% prostředních s, s2 ­ průměrná mocnina odchylky, s v jednotce měření Na rozdíl od středních hodnot nejsou ukazatele rozptýlenosti navzájem numericky srovnatelné. např. výška: VR=38, IQR=12, s=8, s2=64 Sdílí R a R s odpovídajícími ukazateli střední hodnoty. Kromě zešikmení a extrémních hodnot je u variability dobré ještě dávat pozor na empirické meze měření (strop/podlaha). Popisné statistiky - mezishrnutí Pokud nejsou data na intervalové úrovni měření a nejsou pěkně symetricky normálně rozložená, jsou lepšími popisnými statistikami POŘADOVÉ statistiky. Hmmm .... a proč jsou tedy všude, kam se podívám průměry a směrodatné odchylky? Estimační kvality statistik I Kvality statistiky jako prostředku odhadu ,,skutečné" hodnoty v populaci AJ: statistics as estimators, estimation upraveno dle Glass, Hopkins Estimační kvality statistik II Nezkreslenost tj. že systematicky nenad(pod)hodnocuje např. s podhodnocuje Konzistence s velikostí vzorku roste přesnost odhadu Relativní účinnost jak rychle roste přesnost se vzorkem zde vítězí M nad Md a strhává s sebou i další momentové statistiky jejich výhodou je i snadné počítání s nimi AJ: unbiasedness, consistency, relative efficiency Popisné statistiky - shrnutí Zvažujeme úroveň měření tvar rozložení ­ symetrie, normalita cíl studie ­ pouze popis X usuzování, porovnávání Tedy... Je-li cílem především deskripce dat, pak použijeme POŘADOVÉ ukazatele. Připojíme-li i odchylkové, nic nezkazíme. N, min, Q1, Md, Q3, max boxplot pro individuální skóry percentily Je-li cílem další usuzování, porovnávání apod., používáme ODCHYLKOVÉ ukazatele N, m, s (N, M, SD) popis rozložení pro individuální skóry z-skóry Normální rozložení podruhé I. upraveno dle Glass, Hopkins, s. 88 Ze z-skórů na percentily a zase zpět aneb area under the curve. Normální rozložení.xls v ISu Obrázek je z WIkipedie.