Testování hypotéz o rozdílu průměrů: Analýza rozptylu ologika analýzy rozptylu ovýpočetní postup omnohonásobná porovnávání o Porovnávání průměrů ot-testy jsou určeny pouze pro porovnávání dvojice průměrů ov mnoha výzkumných plánech je však více skupin než dvě nnapř. v příkladu s testováním účinnosti nového léku může být kromě skupin s testovaným lékem a placebem ještě skupina se starým lékem Porovnávání průměrů orozdíly mezi více skupinami by sice bylo možné otestovat po dvojicích pomocí t-testu, ale… npravděpodobnosti v tabulce t-rozdělení jsou spočítány za předpokladu, že je prováděno pouze jediné srovnání nčím více testů, tím vyšší pravděpodobnost chyby I. druhu (např. pro 3 srovnání je 5% alfa ve skutečnosti 10%, pro 10 srovnání 30% atd.) Analýza rozptylu oproto je vhodnější místo mnoha t-testů použít jinou statistickou techniku – analýzu rozptylu oanalysis of variance –ANOVA oumožňuje otestovat rozdíly mezi průměry více skupin najednou Logika analýzy rozptylu oanalýza rozptylu nevyužívá pro testování rozdílu mezi průměry samotné průměry, ale rozptyly opočítají se dva odhady: nrozptyl uvnitř skupin (within-groups variance) nrozptyl mezi skupinami (between-groups variance) Příklad: ověřování účinnosti léku na bolest hlavy (délka trvání bolesti hlavy po aplikaci přípravku) nový lék m = 15 min sd = 5 min starý lék m = 19 min sd = 5,5 min placebo m = 35 min sd = 6,5 min Logika analýzy rozptylu orozptyl uvnitř skupin je ukazatel celkové variability uvnitř skupin – tj. jak se od sebe vzájemně liší osoby v rámci jednotlivých skupin orozptyl mezi skupinami je měřítkem variability mezi skupinami – tj. jak se od sebe liší skupiny osob Logika analýzy rozptylu opoměr těchto dvou rozptylů je statistika F o o rozptyl mezi skupinami o F = rozptyl uvnitř skupin o Logika analýzy rozptylu opokud nejsou mezi skupinami rozdíly, pak by měl být rozptyl mezi skupinami a uvnitř skupin velmi podobný (teoreticky shodný - F=1) opokud jsou mezi skupinami rozdíly, pak budou tyto rozdíly (between)větší než vzájemné rozdíly mezi osobami uvnitř skupin (within) Logika analýzy rozptylu oje-li F>1, pak kromě F musíme ještě spočítat pravděpodobnost, že bychom takto vysoké získali náhodou (tj. statistickou významnost) otabulka F rozdělení je vždy pro konkrétní hodnotu alfa; má v řádcích počet stupňů volnosti pro rozptyl uvnitř skupin a ve sloupcích pro rozptyl mezi skupinami Analýza rozptylu - příklad ov klasickém experimentu testujícím tzv. efekt přihlížejících (bystander effect) zjišťovali Darley a Latane, zda má přítomnost dalších lidí vliv na naši ochotu pomoci někomu v nouzi oZO čekala v místnosti s dalšími 0, 2 nebo 4 osobami Analýza rozptylu - příklad oexperimentátorka odešla něco připravit do vedlejší místnosti a bylo slyšet, že upadla a vykřikla něco o bolesti v kotníku ozávislou proměnnou byla doba, která uplynula do nabídnutí pomoci experimentátorce (v sekundách) ZO sama 2 další osoby 4 další osoby 27 30 29 20 35 20 22 20 34 21 31 38 19 29 29 20 30 36 30 20 30 31 22 35 22 21 28 25 38 33 27 33 21 Analýza rozptylu - příklad 0 osob 2 osoby 4 osoby průměr 23,75 27,60 31,36 směrodatná odchylka 4,11 6,48 4,94 SX 285 276 345 S X2 6955 7996 11065 n 12 10 11 Analýza rozptylu o1. krok – výpočet celkového rozptylu (součtu čtverců – sum of squares) SST (SStotal) = SSB + SSW n oSST = S(X-X)2 ovýpočetní rovnice SST = SX2 –[(SX)2/n] o Analýza rozptylu - příklad oSST = SX2 –[(SX)2/n] o SST = (272+202+222+…+332)–[(906)2/33] o SST = 26016 – 24873,818 o SST = 1142,182 o o Analýza rozptylu o2. krok – výpočet rozptylu mezi skupinami SSB (SSbetween) o oSSB = Snk(Xk-X)2 n nnk je počet osob ve skupině nXk je průměr skupiny o Analýza rozptylu - příklad oSSB = Snk(Xk-X)2 o SSB = 12*(23,75-27,45)2 + 10*(27,60- 27,45)2 + 11*(31,36-27,45)2 o SSB = 12*(-3,7)2+10*(0,15)2+(11*3,91)2 o SSB = 332,968 o o Analýza rozptylu o3. krok – výpočet rozptylu uvnitř skupin SSW (SSwithin) o oSSW = S(X-Xk)2 nXk je průměr skupiny o ovýpočetní rovnice o SSW = SST - SSB o Analýza rozptylu - příklad oSSW = SST – SSB o SSW = 1142,182 – 332,986 o SSW = 809,196 o o Analýza rozptylu - příklad o4. krok – výpočet stupňů volnosti o opro SST: dft = n-1 (n je celkový počet osob) ndft = 33-1 = 32 o opro SSB: dfb = k-1 (k je počet skupin) ndfb = 3-1 = 2 o opro SSW: dfw = n-k n ndfw = 33-3 = 30 o o Analýza rozptylu - příklad Sum of Squares df Mean Square F between 332,986 2 166,493 6,173 within 809,196 30 26,973 total 1142,182 32 rozptyl mezi skupinami rozptyl uvnitř skupin Analýza rozptylu - příklad oF = rozptyl mezi / rozptyl uvnitř o F = MSB / MSW o F = 166,493 / 26,973 o F = 6,17 oF je větší než 1, ale jak je pravděpodobné, že by tento výsledek byl náhodný? tj., je F statisticky významné? Analýza rozptylu - příklad oF (2, 30) = 6,17 o 332 Analýza rozptylu - příklad oF (2, 30) = 6,17 okritická hodnota F pro 5% hladinu významnosti o F = 3,32 okritická hodnota F pro 1% hladinu významnosti o F = 5,39 oF (2, 30) = 6,17 p < 0.01 o orozdíl mezi průměry je statisticky významný na 1% hladině významnosti o o o o o Výstup v SPSS o C:\Users\hp\Documents\fakulta\výuka\!Statistika 1 (podzim 2010)\doc2_soubory\image001.png Předpoklady analýzy rozptylu oměřený znak by měl mít normální rozdělení ohomogenita rozptylů skupin- zda se rozptyly liší, je možno otestovat některým testem pro rozdíl rozptylů, např. Leveneovy testy npokud nevyjde stat. významný, pak rozptyly pokládáme za shodné o Mnohonásobná porovnávání oprůkaznost F nám řekne, zda existují průkazné rozdíly mezi průměry oale nedozvíme se tak, mezi kterými skupinami je průkazný rozdíl (která skupina se liší od které) oje třeba provést tzv. mnohonásobná porovnání (multiple comparisons nebo post-hoc comparisons) o Mnohonásobná porovnávání o Mnohonásobná porovnávání ojde v podstatě o upravené t-testy nupravené vzhledem k počtu porovnávání oexistuje více různých typů mnohonásobných porovnávání, např. Fisherův LSD test, Bonferroniho test, Tukeyho test, Scheffeho test atd. Mnohonásobná porovnávání otyto testy jsou si hodně podobné vzorcem pro jejich výpočet oliší se však ve způsobu, jak se u nich stanovuje hladina významnosti (Fisherův LSD test je liberálnější, zatímco ostatní uvedené přísnější) Mnohonásobná porovnávání opokud bychom tyto testy spočítali u předchozího příkladu, zjistili bychom, že průkazný rozdíl je mezi skupinou osob, které byly v místnosti samy, a skupinou se 4 dalšími lidmi Mnohonásobná porovnávání C:\Users\hp\Documents\fakulta\výuka\!Statistika 1 (podzim 2010)\doc3_soubory\image001.png Literatura oHendl, kapitola 9 oDarley, J. M. & Latané, B. (1968). Bystander intervention in emergencies: Diffusion of responsibility. Journal of Personality and Social Psychology, 8, 377-383.