9 Jednofaktorová analýza rozptylu — ANOVA 9.1 Testování normality • Shapirův-Wilkův test ... shapiro.test() • Lillie-Forsův test ... Iillie.test() • Anderson-Darlingův test ... ad.test(), 9.2 Testování homogenity rozptylů u r náhodných výběrů • máme r > 2 náhodných výběrů • H0 : o\ = of = • • • = of = a2 • Hi : alespoň jedna dvojice rozptylů se liší 1. Levenův test — testovací statistika založena na odhadech středních hodnot — Ievene.test(y, group, location='mean') knihovna lawstat 2. Brownův-Forsytův test — testovací statistika založena na mediánech — používáme, když výběry nejsou normálně rozdělené, ale rozsahy výběrů rii > 20 — Ievene.test(y, group, location='median') z knihovny lawstat 3. Bartlettův test — bartlett.test(y, g) knihovna stat — používáme, pokud jsou rozsahy všech výběrů > 6 ANOVA funguje dobře i při mírném porušení předpokladu normality nebo shody rozptylů. 9.3 ANOVA - Jednofaktorová analýza rozptylu • zkoumá závislost intervalové proměnné X na nominální proměnné A • A ... faktor; varianty A ... úrovně faktoru A • Má typ potravy pračlověka (A) vliv na šířku stoliček (X)? • Faktor A má r > 2 úrovní A1}... Ar, přičemž i-té úrovni odpovídá n,i pozorování Xil}... Xi: Každý výběr Ai ~ N(fii,a2). • důležité pojmy — n = Y^í=i ni ■ ■ ■ celkový počet pozorování, r... počet úrovní faktoru A — celkový součet čtverců St * charakterizuje variabilitu jednotlivých pozorování kolem celkového průměru * počet stupňů volnosti: fT = n — 1 1 — skupinový součet čtverců Sa * charakterizuje variabilitu mezi jednotlivými náhodnými výběry * počet stupňů volnosti: f a = r — 1 — reziduálni součet čtverců Se * charakterizuje variabilitu uvnitř jednotlivých výběrů * počet stupňů volnosti: Íe = n — r — St = Sa + Se- — fT = fa + ?e- Testování hypotézy o shodě středních hodnot • Hq : fiľ = ■ ■ ■ = fir; střední hodnoty všech výběrů jsou stejné • Hi : fii ý ftj Pro nějaké alespoň jedna dvojice středních hodnot se liší. • Testovací statistika T0 = FA = ^^^F(r-l,n-r). se/ je • kritický obor W = (Fi_a(r — l,n — r), oo) • p-hodnota = Pr(T0 > t0) =l-pf(FA, r-1, n-r)=l-pf(FA, f A, fE) • přehledná tabulka výpočtů: Zdroj variability součet čtverců stupně volnosti průměrný čtverec FA skupinový SA f a = r - 1 Sa/Ía Sa/Ía Se/f e reziduálni Se fE = n-r Se/ f e - celkový St fT = n-l - - 9.4 Post-hoc metody mnohonásobného porovnávání • zamítneme-li nulovou hypotézu o shodě středních hodnot, chceme zjistit, která dvojice středních hodnot se od sebe významně liší • Scheffého metoda — vhodná i v případě, že rozsahy všech výběrů nejsou stejné — hypotézu Hq : fík = fi>i o rovnosti středních hodnot zamítneme na hl. významnosti a, když \Mk. -ML\>^J(r- 1) (— + -) Fx_a(r - l,n - r). Je y \nk rtij — funkce Scheffe(X, group, names, alpha) z RSkriptu AS-funkce.R. — metody mnohonásobného porovnávání jsou slabší než ANOVA. Může se stát, že ANOVA zamítne Hq o shodě středních hodnot ale Scheffého metoda u žádné dvojice významný rozdíl nenajde. 2