11. Analýza rozptylu dvojného třídění Motivace Zkoumáme vliv dvou faktorů A a B na závisle proměnnou veličinu X. Např. zjišťujeme, zda výnosy určité plodiny (náhodná veličina X) jsou ovlivněny typem půdy (faktor A) a způsobem hnojení (faktor B). Předpokládáme, že faktor A má a úrovní (tj. počet typů půdy) a faktor B má b úrovní (tj. počet způsobů hnojení). Přitom máme n[ij] pokusů takových, že na i-tém typu půdy byl použit j-tý způsob hnojení. Výsledky (tzn. výnosy dané plodiny) těchto n[ij] pokusů označíme . Omezíme se na případy, kdy počet pozorování n[ij] = c ≥ 1 (jde o tzv. vyvážené třídění). Výsledky lze zapsat do tabulky: faktor B 1 2 ... b faktor A 1 X[111], …, X[11c] X[121], …, X[12c] … X[1b1], …, X[1bc] 2 X[211], …, X[21c] X[221], …, [ ]X[22c] … X[2b1], …, X[2bc] … a X[a11], …, X[a1c] X[a21], …, [ ]X[a2c] … X[ab1], …, [ ]X[abc] Analogicky jako u analýzy rozptylu jednoduchého třídění předpokládáme, že data se řídí normálním rozložením, tj. ~ N(μ[ij],σ^2), i = 1, …, a, j = 1, …, b a jednotlivé náhodné výběry jsou stochasticky nezávislé, tedy X[ijk] = μ[ij] + ε[ijk], kde ε[ijk] jsou stochasticky nezávislé náhodné veličiny s rozložením N(0, σ^2). Zajímá nás, zda všechny střední hodnoty jsou stejné. Přístup k problému se liší podle toho, zda faktory A, B jsou nezávislé (pak se jedná o analýzu rozptylu dvojného třídění bez interakcí) nebo se mohou nějakým způsobem ovlivňovat (jde o analýzu rozptylu dvojného třídění s interakcemi). Označení V analýze rozptylu dvojného třídění se používá následující označení. Analogické označení zavedeme i pro jiné kombinace indexů. Dvojné třídění bez interakcí Předpokládáme, že řádkový faktor A a sloupcový faktor B se neovlivňují (např. to znamená, že každý ze čtyř způsobů hnojení působí stejně na každém ze tří druhů půdy). Náhodné veličiny X[ijk] se řídí modelem M0: X[ijk] = μ + α[i] + β[j] + ε[ijk] pro i = 1, …, a, j = 1, …, b, k = 1, …, c, přičemž ε[ijk] jsou stochasticky nezávislé náhodné veličiny s rozložením N(0, σ^2), μ je společná část střední hodnoty závisle proměnné veličiny, α[i] je efekt faktoru A na úrovni i, β[j] je efekt faktoru B na úrovni j. Parametry μ, α[i], β[j] neznáme. Požadujeme, aby platily tzv. reparametrizační rovnice: . Podobně jako v analýze rozptylu jednoduchého třídění se počítají součty čtverců. … celkový součet čtverců, počet stupňů volnosti f[T] = n – 1, … součet čtverců pro řádkový faktor A, počet stupňů volnosti f[A] = a – 1, … součet čtverců pro sloupcový faktor B, počet stupňů volnosti f[B] = b – 1, … reziduální součet čtverců, počet stupňů volnosti f[E] = n – a – b + 1. Lze dokázat, že S[T] = S[A] + S[B] + S[E]. Sčítanci a představují bodové odhady efektů α[i] a β[j]. Pokud by nezáleželo na sloupcovém faktoru B, platila by hypotéza β[1] = … = β[b] = 0 a dostali bychom model M1: X[ijk] = μ + α[i] + ε[ijk] Platnost uvedené hypotézy ověřujeme pomocí testové statistiky , která se řídí rozložením F(b-1,n-a-b+1), je-li model M1 správný. Hypotézu o nevýznamnosti sloupcového faktoru tedy zamítneme na hladině významnosti α, když platí: F[B ]≥ F[1-α](b-1,n-a-b+1). Kdyby nezáleželo ani na řádkovém faktoru, platila by hypotéza α[1] = … = α[a] = 0 a dostali bychom model M2: X[ijk] = μ + ε[ijk] Rozdíl mezi modely M1 a M2 ověřujeme pomocí testové statistiky , která se řídí rozložením F(a-1,n-a-b+1), je-li model M2 správný. Hypotézu o nevýznamnosti řádkového faktoru tedy zamítneme na hladině významnosti α, když platí: F[B ]≥ F[1-α](a-1,n-a-b+1). Při uvedeném postupu tedy zjišťujeme, zda záleží na sloupcovém efektu B. Pokud ne, platí model M1 a ptáme se, zda záleží na řádkovém efektu A, tj. zda platí model M2. Postup lze samozřejmě provést i v jiném pořadí – nejdřív zkoumáme řádkový efekt A (tj. ověřujeme platnost modelu M1’: X[ijk] = μ + β[j] + ε[ijk]) a poté sloupcový efekt B. Lze ukázat, že oba řetězce M0 → M1 → M2 a M0 → M1’→ M2 dají stejné výsledky. (To platí pouze za předpokladu, že n[ij] = c pro všechna i, j.) Výsledky výpočtů zapisujeme do tabulky analýzy rozptylu dvojného třídění bez interakcí. Zdroj variability součet čtverců st. vol. podíl S/f řádkový efekt A S[A] f[A] = a-1 S[A]/f[A] sloupcový efekt B S[B] f[B] = b-1 S[B]/f[B] reziduální S[E] f[E] = n-a-b+1 S[E]/f[E] - celkem S[T] f[T] = n-1 - - Scheffého a Tukeyova metoda mnohonásobného porovnávání Zjistíme-li, že existují významné rozdíly mezi řádky, můžeme pomocí Scheffého nebo Tukeyovy metody zjistit, které dvojice řádků se významně liší. Určíme tedy, které rozdíly α[i] - α[t] jsou nenulové (na dané hladině významnosti). Podle Scheffého metody zamítneme rovnost α[i] = α[t], když a podle Tukeyovy metody, když , kde q[1-α](a,n-a-b+1) najdeme v tabulkách kvantilů studentizovaného rozpětí. Jestliže zjistíme významný rozdíl mezi sloupci, určujeme podobně, které dvojice sloupců se mezi sebou liší, tj. které rozdíly β[j] – β[t] jsou nenulové. Podle Scheffého metody zamítneme rovnost β[j] = β[t], když a podle Tukeyovy metody, když . Příklad: Byl zaznamenán prodej určitého zboží (v kusech) během tří stejně dlouhých časových období. Přitom byl sledován jednak vliv balení zboží (řádkový faktor A, úroveň 1 – balení v sáčku, úroveň 2 – balení v krabičce) a jednak vliv druhu reklamy (sloupcový faktor B, úroveň 1 – bez reklamy, úroveň 2 – reklama v novinách, úroveň 3 – reklama v TV a novinách). Výsledky prodeje jsou zaznamenány v tabulce: B 1 2 3 A 1 1 1 6 2 3 4 9 Na hladině významnosti 0,05 je třeba posoudit vliv reklamy a i vliv balení zboží na jeho prodej. Řešení: Data zpracujeme pomocí analýzy rozptylu dvojného třídění bez interakcí. Přitom a = 2, b = 3, c = 1, n = 6. Nejprve provedeme pomocné výpočty: X[1..] = 8, X[2..] = 16, M[1..] = 8/3, M[2..] = 16/3, X[…] = 24, M[…] = 24/6 = 4, X[.1.] = 4, X[.2.]= 5, X[.3.] = 15, M[.1.] = 4/2 = 2, M[.2.] = 5/2, M[.3.] = 15/2 , , , . Výsledky zapíšeme do tabulky analýzy rozptylu dvojného třídění bez interakcí. Zdroj variability součet čtverců st. vol. podíl S/f způsob balení 1 [] 63,99 druh reklamy 37 2 18,5 110,98 reziduální 2 - celkem 48 5 - - Odpovídající kvantily: pro řádkový efekt F[0,95](1,2) = 18,1, pro sloupcový efekt F[0,95](2,2) = 19. Protože F[A] = 63,99 ≥ 18,1, zamítáme na hladině významnosti 0,05 hypotézu, že způsob balení nemá vliv na prodej zboží. Podobně F[B] = 110,98 ≥ 19, tedy na hladině významnosti 0,05 zamítáme hypotézu, že druh reklamy nemá vliv na prodej zboží. V tomto druhém případě lze pomocí Scheffého nebo Tukeyovy metody zjistit, které druhy reklamy se od sebe liší na hladině významnosti 0,05. Nejprve vypočítáme absolutní hodnoty rozdílů sloupcových průměrů: Pravá strana Scheffého vzorce je . Vidíme, že podle Scheffého metody se na hladině významnosti 0,05 liší sloupce 1, 3 (tj. bez reklamy a s reklamou v TV a novinách) a sloupce 2, 3 (tj. s reklamou jen v novinách a reklamou v TV a novinách). Pravá strana Tukeyova vzorce je . Podle Tukeyovy metody se na hladině významnosti 0,05 také liší sloupce 1, 3 a sloupce 2, 3. Výhodnější je hodnota získaná Tukeyovou metodou, protože je menší. Výpočet pomocí systému STATISTICA: Načteme datový soubor baleni_a_reklama.sta o třech proměnných X, A, B a 6 případech, kde X – prodej, A – typ balení (1 – sáček, 2 – krabička), B – druh reklamy (1 – bez reklamy, 2 – reklama v novinách, 3 – reklama v TV a novinách). Statistiky – ANOVA – ANOVA hlavních efektů – Rychlé nastavení – OK – Závisle proměnná X, Kategor. nezáv. prom. A, B – OK – Možnosti – Parametrizace – odškrtneme Sigma-omezená, zaškrtneme Bez abs. členu – OK. Dostaneme tabulku analýzy rozptylu dvojného třídění bez interakcí. Vidíme, že p-hodnota pro testovou statistiku F[A] je 0,015268, tedy na hladině významnosti 0,05 zamítáme hypotézu, že typ balení nemá vliv na prodej zboží. Podobně p-hodnota pro testovou statistiku F[B] je 0,008929, což znamená, že na hladině významnosti 0,05 zamítáme hypotézu, že druh reklamy nemá vliv na prodej zboží. Abychom zjistili, které dvojice druhů reklamy se liší na hladině významnosti 0,05, použijeme Scheffého (resp. Tukeyovu) metodu mnohonásobného porovnávání. Návrat do ANOVA Výsledky – Více výsledků – Post-hoc – Efekt B –Tukeyův HSD. Vidíme, že na hladině významnosti 0,05 se liší dvojice (1,3) a (2,3). Výpočet pomocí systému SPSS: Analyze – General Linear Model – Univariate – Dependent Variable X, Fixed Factor(s) A, B – Model – zaškrtneme cystom – vybereme Main effects – Model A, B – odškrtneme Include intercept in model – Continue – Post Hoc – Post hoc Tests for B – zaškrtneme Tukey – Continue – OK Tabulka analýzy rozptylu dvojného třídění bez interakcí: Testová statistika F[A] pro test významnosti způsobu balení se realizuje hodnotou 64, p-hodnota 0,015, tedy na hladině významnosti 0,05 zamítáme hypotézu, že způsob balení neovlivňuje prodej. Testová statistika F[B] nabývá hodnoty 111, p-hodnota je 0,009, tedy na hladině významnosti 0,05 zamítáme hypotézu, že způsob reklamy neovlivňuje prodej. Výsledky Tukeyovy metody mnohonásobného porovnávání pro faktor B (způsob reklamy): Podle p-hodnot uvedených ve sloupci Sig. vidíme, že na hladině významnosti 0,05 se liší dvojice (bez reklamy, reklama v TV a novinách) a (reklamy, reklama v TV a novinách). Dvojné třídění s interakcemi Nyní předpokládáme, že faktory A a B se mohou ovlivňovat (např. některý způsob hnojení má zcela specifický vliv na určitý typ půdy). Náhodné veličiny X[ijk] se řídí modelem M0: X[ijk] = μ + α[i] + β[j] + γ[ij] + ε[ijk] pro i = 1, …, a, j = 1, …, b, k = 1, …, c, přičemž γ[ij] je interakce mezi faktorem A na úrovni i a faktorem B na úrovni j. V této situaci předpokládáme, že c ≥ 2. Parametry μ, α[i], β[j] neznáme. Požadujeme, aby platily tzv. reparametrizační rovnice: . Nyní můžeme utvořit modely M1: X[ijk] = μ + α[i] + β[j] + ε[ijk] M2: X[ijk] = μ + α[i] + ε[ijk] M3: X[ijk] = μ + ε[ijk] (Lze samozřejmě použít i jiný řetězec modelů, kdy postupně klademe rovny nule parametry α[i], β[j], γ[ij] v jiném pořadí.) Vypočítáme součty čtverců S[T], S[A], S[B], S[AB], S[E], přičemž je součet čtverců pro interakce, počet stupňů volnosti f[AB] = (a-1)(b-1). Vliv interakcí je prokázán na hladině významnosti α, když . Výsledky zapisujeme do tabulky analýzy rozptylu dvojného třídění s interakcemi: Zdroj variability součet čtverců st. vol. podíl S/f řádkový faktor A S[A] f[A] = a-1 S[A]/f[A] sloupcový faktor B S[B] f[B] = b-1 S[B]/f[B] interakce A,B S[AB] f[AB] = (a-1)(b-1) S[AB]/f[AB] reziduální S[E] f[E] = n-a-b+1 S[E]/f[E] - celkem S[T] f[T] = n-1 - - Je třeba si povšimnout, že součet S[AB] + S[E] resp. f[AB] + f[E] dá hodnotu S[E] resp. f[E] v tabulce bez interakcí. Možné problémy v analýze rozptylu dvojného třídění s interakcemi a) Ukáže-li se vliv interakcí významný, vzniká otázka, zda testovat vliv řádků resp. sloupců pomocí tabulky s interakcemi nebo provést novou analýzu rozptylu, ale tentokrát bez interakcí. Převládá názor, že je zapotřebí dokončit analýzu rozptylu s interakcemi. b) Pokud interakce vyjdou významné a řádky a sloupce rovněž, zpravidla se nedoporučuje provádět mnohonásobné porovnávání, protože by se mohlo stát, že některá interakce by byla mnohem výraznější než příslušný řádkový resp. sloupcový efekt. c) Nejsou-li interakce významné a řádky resp. sloupce ano, pak lze provést mnohonásobné porovnávání zcela analogicky jako v případě třídění bez interakcí, avšak je jiný počet stupňů volnosti f[E]. Tabulka odhadů různých parametrů a rozptylů těchto odhadů parametr odhad rozptyl odhadu μ M σ^2/n μ + α[i][] M[i..] σ^2/bc μ + β[j][] M[.j.] σ^2/ac μ + α[i] + β[j] + γ[ij][] M[ij][.] σ^2/c α[i] M[i..] - M σ^2(a-1)/n β[j] M[.j.] - M[] σ^2(b-1)/n γ[ij] (M[ij][.] - M[i..]) – (M[.j.] – M) σ^2(a-1)(b-1)/n Neznámý rozptyl σ^2 nahradíme jeho odhadem . Příklad: Byly zkoumány výnosy sena (v q/ha) v závislosti na typu půdy (řádkový faktor A, úroveň 1 – normální půda, úroveň 2 – kyselá půda) a na způsobu hnojení (sloupcový faktor B, úroveň 1 – bez hnojení, úroveň 2 – hnojení chlévskou mrvou, úroveň 3 – hnojení vápenatým hnojivem). Každá kombinace faktorů A a B byla realizována čtyřikrát nezávisle na sobě. Výnosy sena jsou uvedeny v tabulce: B 1 2 3 A 1 28 32 30 30 37 36 39 36 34 38 37 36 2 31 27 30 29 34 34 30 38 42 40 41 39 Na hladině významnosti 0,05 máme posoudit vliv typu půdy a způsobu hnojení (včetně případných interakcí) na výnosy sena. Řešení: Data zpracujeme pomocí analýzy rozptylu dvojného třídění s interakcemi. Přitom a = 2, b = 3, c = 4, n = abc = 24. Nebudeme provádět pomocné výpočty, ale rovnou uvedeme tabulku výsledků. Zdroj variability součet čtverců st. vol. podíl S/f typ půdy 0,166 1 0,166 0,04 způsob hnojení 318,25 2 159,125 41,81 interakce 55,084[] 2 27,542 7,24 reziduální 68,5 18 3,8056 - celkem 442 23 - - Odpovídající kvantily: pro řádkový efekt F[0,95](1,18) = 4,41, pro sloupcový efekt F[0,95](2,18) = 3,55, pro interakce F[0,95](1,18) = 4,41. Protože F[A] = 0,04 < 4,41, nezamítáme na hladině významnosti 0,05 hypotézu, že typ půdy neovlivňuje výnos sena. Dále F[B] = 41,81 ≥ 3,55, tedy na hladině významnosti 0,05 se prokázal rozdíl mezi použitými způsoby hnojení. Jelikož F[AB] = 7,24 ≥ 4,41, zamítáme na hladině významnosti 0,05 hypotézu o nevýznamnosti interakcí (tj. aspoň jeden způsob hnojení působí jinak na půdu normální než kyselou). Výpočet pomocí systému STATISTICA: Načteme datový soubor seno.sta se třemi proměnnými A, B, X a 24 případy, kde X – výnos sena, A – typ půdy, B – způsob hnojení. Jednotlivé varianty proměnných A a B mají tento význam: u proměnné A je 1 – normální půda, 2 – kyselá půda, u proměnné B je 1 – bez hnojení, 2 – chlévská mrva, 3 – vápenaté hnojivo. Nejprve spočítáme průměry ve všech 6 skupinách: Statistiky – ANOVA – Typ analýzy Vícefaktorová ANOVA. Metoda specifikace: Rychlé nastavení – OK, Proměnné – Seznam závislých proměnných X, Kategor. nezáv, prom. (faktory( A, B – OK – Možnosti – Parametrizace – zaškrtneme Bez absolutního členu – OK – Průměry – Pozorované, nevážené. Nyní provedeme testování hypotéz o vlivu faktorů: Statistiky – ANOVA – Typ analýzy Vícefaktorová ANOVA. Metoda specifikace: Rychlé nastavení – OK, Proměnné – Seznam závislých proměnných X, Kategor. nezáv. prom. (faktory) A, B – OK – Možnosti – Parametrizace – zaškrtneme Bez absolutního členu – OK – Všechny efekty. Dostaneme tabulku analýzy rozptylu dvojného třídění s interakcemi. Vidíme, že p-hodnota pro testovou statistiku F[B] je velmi blízká 0, tedy na hladině významnosti 0,05 zamítáme hypotézu, že způsob hnojení nemá vliv na výnosy sena. Podobně p-hodnota pro testovou statistiku F[AB] je 0,004938, což znamená, že na hladině významnosti 0,05 zamítáme hypotézu, že způsob hnojení působí na oba typy půd stejně. Vzhledem k tomu, že rozsahy výběrů v daných šesti skupinách jsou větší než 1 (c = 4), lze ověřit předpoklad o homogenitě rozptylů. Vrátíme se do ANOVA Výsledky a zvolíme Více výsledků – Předpoklady – Levenův test. Zjistíme, že p-hodnota je 0,852058, tudíž tedy na hladině významnosti 0,05 nezamítáme hypotézu o homogenitě rozptylů. Normalitu všech šesti výběrů můžeme orientačně posoudit rovněž v Předpokladech pomocí N-P plotu. Ve všech šesti případech lze konstatovat vcelku dobrou shodu s normálním rozložením. Průměrné výnosy sena (spolu s 95% intervaly spolehlivosti) na normální a kyselé půdě při daných třech způsobech hnojení lze znázornit graficky. V ANOVA Výsledky zvolíme Průměry – Pozorované, nevážené – Graf. Lze vykreslit graf závislosti průměrného výnosu sena na typu půdy: nebo graf závislosti průměrného výnosu sena na způsobu hnojení: V grafu se objevuje křížení, které je typické pro případ, kdy působí interakce mezi faktory A, B. Nyní pomocí Tukeyovy metody mnohonásobného porovnávání zjistíme, které dvojice výběrů se liší na hladině významnosti 0,05. Vrátíme se do Anova: Výsledky – klikneme na Více výsledků – Post hoc – Efekt B - Tukeyův HSD. Vidíme, že na hladině významnosti 0,05 se liší všechny tři dvojice skupin: Výpočet pomocí systému SPSS: Načteme datový soubor seno.sav. Analyze – General Linear Model – Univariate – Dependent variable X, Fixed Factor(s) A, B – Model – odškrtneme Include intercept in model – Continue – Options – zaškrtneme Descriptive Statistics a Homogeneity tests – Continue – Plots – Horizontal Axis A, Separate Lines B – Add, Horizontal Axis B, Separate Lines A – Add – Post Hoc – Post Hoc Tests for A, B – zaškrtneme Tukey – Continue – OK. Tabulka průměrů a směrodatných odchylek ve zkoumaných šesti skupinách: Výsledky Levenova testu homogenity rozptylů: Na hladině významnosti 0,05 nelze zamítnout hypotézu o shodě rozptylů v daných šesti skupinách, protože p-hodnota je 0,852, což je větší než 0,05. Tabulka analýzy rozptylu dvojného třídění s interakcemi: Na hladině významnosti 0,05 se neprokázal vliv typu půdy (p-hodnota = 0,837), avšak prokázal se vliv způsobu hnojení (p-hodnota = 0,000) a vliv interakcí (p-hodnota = 0,005). Tukeyova metoda mnohonásobného porovnávání pro způsob hnojení: Na hladině významnosti 0,05 se liší všechny tři dvojice způsobu hnojení. Graf závislosti průměrného výnosu sena na typu půdy: Graf závislosti průměrného výnosu sena na způsobu hnojení: