Přednáška IX. Analýza rozptylu (ANOVA) Princip a metodika výpočtu Předpoklady analýzy rozptylu a jejich ověření Rozbor rozdílů jednotlivých skupin - násobné testování hypotéz Analýza rozptylu jako lineární model INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Opakování - parametrické a neparametrické testy " Jmenujte příklad parametrického a neparametrického testu. ■ Znáte jejich předpoklady? Tomáš Pavlík JUL f J^J J Biostatistika Opakování - neparametrické testy ■*Jaká je nevýhoda Mannova-Whitneyho testu? i-; Jaký je předpoklad permutačních testů? Tomáš Pavlík Biostatistika Příklad-CHOPN Sledujeme plicní funkce u pacientů s chronickou obštrukční plieni nemocí (CHOPN) ve stadiu II, III a IV. Zajímá nás, jestli se u pacientů v jednotlivých stadiích liší maximální inspirační tlak (Plmax). ~r CHOPN ~r CHOPN III Stadium CHOPN ~r CHOPN IV Tomáš Pavlík IBA Biostatistika Příklad-CHOPN ■s Jak můžeme pro CHOPN stadia II, III a IV ověřit rozdíl (resp. rovnost) v maximálním inspiračním tlaku (Plmax)? A. Můžeme použít vhodný test pro dva výběry (např. ŕ-test) a otestovat, jak se liší stadium II od III, II od IV a III od IV - tedy provést 3 testy. B. Musíme použít vhodný test pro více než dvě srovnávané skupiny. * V čem je zásadní rozdíl mezi A a B? Tomáš Pavlík Biostatistika Problém násobného testování hypotéz Problém s možností A je v násobném testování hypotéz - pro připomenutí: S narůstajícím počtem testovaných hypotéz nám roste také pravděpodobnost získání falešně pozitivního výsledku, tedy pravděpodobnost toho, že se při našem testování zmýlíme a ukážeme na statisticky významný rozdíl tam, kde ve skutečnosti žádný neexistuje (chyba I. druhu). Máme tři testy, v každém 95% pravděpodobnost, že neuděláme chybu I. druhu. * Pro všechny tři testy to tedy znamená: 0,95 x 0,95 x 0,95 = 0,857. ■* Pravděpodobnost, že neuděláme chybu I. druhu nám celkově klesla na 0,857. * Pravděpodobnost, že uděláme chybu I. druhu nám celkově stoupla na 0,143. Tomáš Pavlík Biostatistika Analýza rozptylu Lepší volbou je: B. Musíme použít vhodný test pro více než dvě srovnávané skupiny. ^Analýza rozptylu (ANOVA = „ANalysis Of VAriance") je statistickou metodou, která umožňuje testovat rozdíl v průměrech více než dvou skupin. Přitom se jedná o jeden test. •^Více než dvě skupiny mohou být dány přirozeně (např. sledujeme rozdíl mezi věkovými kategoriemi) nebo uměle (např. sledujeme rozdíl v účinnosti několika typů léčby). Tomáš Pavlík Biostatistika 2. Princip výpočtu Náhodné výběry a hypotéza Máme k nezávislých realizací náhodného výběru rozsahu: np n2,..., ni Předpoklady: YXj ~ Nip^a1) Y2J ~ N(v2,a2) Normalita hodnot všech k výběrů Homogenita rozptylů všech k výběrů Ykj~N(pk,a2) Hypotézy: Hl: nejméně jedno ju{ je odlišné od ostatních Tomáš Pavlík Biostatistika Příklady - hypotézy Liší se účinnost dvou různých dávek léčiva XYZ od placeba? Střední hodnota účinnosti placeba, XYZ v dávce 1 a XYZ v dávce 2: Mp^ Mxyz^ Juxyz2 hx: nejméně jedno ju]q odlišné od ostatních Liší se A ML, ALL, CML a CLL v aktivitě vybraných genů? Střední hodnota exprese genu g u AML, ALL, CML, CLL: 0^ml,Oall^cml^cll m • 6g =6g =6g =6g 11q'uaml all ucml ucll hx: nejméně jedno 6g je odlišné od ostatních Tomáš Pavlík Biostatistika Pozorované hodnoty Výběr 2 1 Výběr 3 i n3 2 Skupinový průměr („population mean") Rozsah výběru Výběr k n, Výběrový průměr yk 2 Výběrový rozptyl Sk Všechny výběry Celkový průměr („grand mean") Tomáš Pavlík IBA Biostatistika Příklad-CHOPN IV nx =9 y, = 8,9 kPa sl = 3,5 kPa «2 =12 Celkový průměr („grand mean") n = 4S y = 6,4 kPa s = 3,0kPa n3 = 27 y2 = 6,6 kPa y3 = 5,4 kPa s, =2,9kPa ä, =2,5kPa Stadium Tomáš Pavlík IBA IM) 5* Biostatistika Značení '; Součty: Yi. - X;=i Yu Y X=i 2,=i Yv i- Průměry: Jř, = /«,. J.. = YJn Skupinový průměr Celkový průměr („population mean") („grand mean") ,; Celková variabilita v souboru: M / (%y - J..) Stupně volnosti: ^ = n -1 1 ■ Variabilita v rámci skupin (reziduálni součet čtverců): Se = Ztl Zy=l " ^ )2 StUPPě VOln°StÍ: dfe=n~k ^Variabilita mezi skupinami (příslušná sledovanému vlivu = proměnné): SA=^=1ni(yi--y-)2 Stupně volnosti: dfA=k-l mu /'""'y Tomáš Pavlík JUL_ | IUI | Biostatistika IBA Vztahy mezi odhady variability • Platí: Yti-y.=(YH-y,)+ (?,-?..) '; Dále se dá ukázat, že platí: S T - $ e + $ A ,; Tedy platí, že celková variabilita se dá rozložit na variabilitu v rámci skupin a variabilitu mezi skupinami: l;,r,<>; y~f= Stadium Tomáš Pavlík IBA IM Biostatistika Umělý příklad Léčba Pozorovaná hodnota Skupinový průměr Skupinový průměr - celkový průměr Pozorovaná hodnota - skupinový průměr Pozorovaná hodnota - celkový průměr 12 12 -4 0 -4 20 3 14 16 0 -2 -2 3 16 16 0 0 0 3 18 16 0 2 2 Celkový průměr = 16 Součet čtverců = 96 Součet čtverců = 18 Součet čtverců = 114 Stupně volnosti = 2 Stupně volnosti = 6 Stupně volnosti = 8 Tomáš Pavlík 4jJa" lIMIl Biostatistika IBA X,, ^ Jak testuje t-test pro dva výběry? Nulová hypotéza: ■*Testová statistika: T = Rozdíl (variabilita) mezi výběry t(nl +n2-2) Variabilita uvnitř výběrů * T = Rozdíl (variabilita) mezi výběry Variabilita uvnitř výběrů Tomáš Pavlík Biostatistika Princip analýzy rozptylu Princip analýzy rozptylu je stejný, tedy ANOVA srovnává pozorovanou variabilitu mezi výběry s pozorovanou variabilitou uvnitř výběrů. Na rozdíl od f-testu však pracuje s výběrovými rozptyly. * Testová statistika analýzy rozptylu: Odhad rozptylu založený na výběrových průměrech F=- Odhad rozptylu založený pozorovaných hodnotách k_i _ SAldfA Za Platnosti H0platí: = ZtlZ"Ll^-^)2 = ^/^ F~F{k-\,n-k) n-k Tomáš Pavlík Biostatistika Výsledek dle platnosti nulové hypotézy •^Za předpokladu rovnosti rozptylů jednotlivých výběrů představuje člen ve jmenovateli statistiky F výběrový odhad o2. *Za platnosti H0 představuje i člen v čitateli statistiky F výběrový odhad o2. PI a t í-1 i nulová hypotéza, čitatel statistiky F (počítaný na základě výběrových průměrů) bude zhruba stejný jako její jmenovatel (počítaný na základě pozorovaných hodnot). Neplatí-li nulová hypotéza, čitatel statistiky F bude větší než jmenovatel. Samotné rozhodnutí o platnosti H0 je tak založeno na srovnání průměrných čtverců SAIdfA a Se/dfe. Tomáš Pavlík Biostatistika Výsledek analýzy rozptylu Výsledné počty se standardně zaznamenávají do tzv. tabulky analýzy rozptylu: Variabilita Součet čtverců Počet stupňů volnosti Průměrný čtverec F statistika p-hodnota Mezi skupinami SA = 96 dfA = k-l = 2 MSA = 48 F= 16 0,004 Uvnitř skupin Se= 18 dfe = n - k = 6 MSe = 3 Celkem ST=114 dfT=n-l = B u; Nulovou hypotézu zamítneme/nezamítneme buď na základě srovnání výsledné p-hodnoty se zvolenou hladinou významnosti testu a, nebo srovnáním výsledné F statistiky s kritickou hodnotou (kvantilem) rozdělení F(k - 1, n - k) příslušnou zvolené hladině významnosti testu a. Tomáš Pavlík Biostatistika Výsledek umělého příkladu (k-\,n-k) _ p(2,6) _ l-a 0,95 = 5,14 fi F{k-\,n-k) F = 16 Na hladině významnosti a =0,05 zamítáme H0 o rovnosti středních hodnot. 10 15 20 Tomáš Pavlík IBA Biostatistika 3. Předpoklady analýzy rozptylu a jejich ověření Předpoklady analýzy rozptylu * Nezávislost jednotlivých pozorování-sice téměř automatický předpoklad, nicméně je třeba se nad ním alespoň zamyslet. Normalita pozorovaných hodnot obou náhodných výběrů - velmi silný předpoklad. Nutno otestovat nebo alespoň graficky ověřit (histogram, box plot). * Stejný rozptyl náhodné veličiny v obou srovnávaných skupinách - také silný předpoklad. Opět nutno otestovat nebo alespoň graficky ověřit (histogram, box plot). Tomáš Pavlík Biostatistika Testování shody rozptylů > Grafické ověření - histogram, box plot. Levenův test - často používaný, nevyžaduje předpoklad normality původních hodnot. - Bartlettův test - velkou nevýhodou je předpoklad normality původních hodnot. o CM Tomáš Pavlík Biostatistika Levenův test Jeho výhoda je, že nevyžaduje předpoklad normality původních hodnot. ^Jedná se o analýzu rozptylu na hodnotách Z.. =| Yi} -yh \ ^Označme z. = -LV"' z a z = ^k V"' Z. Při rovnosti rozptylů opět platí: F~F(k-l,n-k) ■ Používá se také jeho robustní varianta s použitím absolutních odchylek od mediánu místo od průměru: Z. =1 K - v Tomáš Pavlík Biostatistika • Testová statistika: = n-k Příklad - Levenův test u CHOPN dat * Sledujeme plicní funkce u pacientů s chronickou obštrukční plieni nemocí (CHOPN) ve stadiu II, lila IV. Levenův test probíhá stejně jako jednoduchá ANOVA - opět srovnáváme průměrné čtverce - reziduálni a příslušné sledovaným faktorům. Variabilita Součet čtverců Počet stupňů volnosti Průměrný čtverec F statistika p-hodnota Mezi skupinami SA = 5,30 dfA = k-l = 2 MSA = 2,65 F= 1,13 0,331 Uvnitř skupin Se = 105,35 dfe = n - k = 45 MSe = 2,34 Celkem ST = 110,65 dfT = n - 1 = 47 Na hladině významnosti a =0,05 nezamítáme H0 o rovnosti rozptylů. Tomáš Pavlík Biostatistika Hodnocení normality dat Hodnocení normality je klíčovým postupem v biostatistice. Testy nejsou vždy nejlepším nástrojem! Vždy je důležité se podívat i očima! Zamítnutí normality rozdělení neznamená jenom výběr příslušného testu, ALE může indikovat odlehlé a nelogické hodnoty v souboru dat. - Pokud o sledované veličině prokazatelně víme, že v cílové populaci nabývá normální rozdělení (např. výška lidské postavy), ale v daném souboru normální rozdělení nepotvrdíme, pak s naším náhodným výběrem není něco v pořádku - např. není reprezentativní. Tomáš Pavlík Biostatistika Grafické metody - box plot a histogram Normální rozdělení Log-normální rozdělení Tomáš Pavlík IBA W imi: 200 400 SOC 800 1000 Biostatistika Grafické metody - box plot a histogram * Normální rozdělení s odlehlými hodnotami - Rovnoměrně spojité rozdělení 10 15 20 25 30 35 40 0.0 0.2 0.4 0.5 0.8 1.0 Tomáš Pavlík *mm v IBA \^ Grafické metody - Q-Q plot 1 • Q-Q plot proti sobě zobrazuje kvantily pozorovaných hodnot a kvantily teoretického rozdělení pravděpodobnosti (zde normálního rozdělení). " V případě shody leží všechny body na přímce. * Normální rozdělení: Normal Q-Q Plot Tomáš Pavlík -1 o 1 Theoretical Quantiles MU Biostatistika Grafické metody - Q-Q plot Log-normální rozdělení: Normální rozdělení s odlehlými hodnotami: Rovnoměrně spojité rozdělení Normal Q-Q Plot Normal Q-Q Plot Normal Q-Q Plot Testy pro ověření normality dat - Shapirův-Wilkůvtest - v podstatě se jedná o proložení seřazených hodnot regresní přímkou vzhledem k očekávaným hodnotám normálního rozdělení. Má tedy přímý vztah k Q-Q. plotu - vyhodnocuje, jak moc se Q-Q plot liší od ideální přímky. Doporučován pro menší vzorky, může být „moc" přísný pro velké vzorky. " Kolmogorovův-Smirnovovův test - založen na srovnání výběrové distribuční funkce s teoretickou distribuční funkcí odpovídající normálnímu rozdělení. K-S test hodnotí maximální vzdálenost mezi těmito dvěma distribučními funkcemi. V praxi se používá korekce dle Lillieforse. Tomáš Pavlík Biostatistika Příklad - Shapirův-Wilkův test u CHOPN dat Sledujeme plicní funkce u pacientů s chronickou obštrukční plieni nemocí (CHOPN) ve stadiu II, III a IV. ■ Test pro všechna stadia: p = 0,073 (to nás nezajímá) Stadium II: <*Stadium III: * Stadium IV: p = 0,090 p = 0,247 p = 0,815 *H0 o normalitě dat nezamítáme na hladině a =0,05. Tomáš Pavlík IBA \^ M n = 9 n = 12 CHOPNI Biostatistika CHOPN III Stadium CHOPN n = 27 CHOPN IV Příklad - Shapirův-Wilkův test u CHOPN dat 1; Srovnáme výsledky S-W testu s Q-Q. ploty pro jednotlivé kategorie. - Vzhledem k malým velikostem souborů lze odchylky od normality dat tolerovat. Stadium II (n = 9) p = 0,090 Stadium III (n = 12) p = 0,247 Stadium IV (n = 27) p = 0,815 Normal Q-Q Plot Normal Q-Q Plot Normal Q-Q Plot -0.5 0 0 0.5 Theoretical QuantileE -0 5 0.0 0 5 Theoretical Quantlies il Quantlies Tomáš Pavlík Biostatistika Příklad - analýza rozptylu u CHOPN dat Liší se pacienti s CHOPN (stadium II, III, IV) v maximálním inspiračním tlaku (Plmax)? *Máme ověřenu homogenitu rozptylů i přibližnou normalitu dat -> ANOVA. Variabilita Součet čtverců Počet stupňů volnosti Průměrný čtverec F statistika p-hodnota Mezi skupinami SA = 80,54 dfA = k-l = 2 MSA = 40,27 F = 5,10 0,010 Uvnitř skupin Se = 355,50 dfe = n - k = 45 MSe = 7,90 Celkem ST = 436,04 dfT = n - 1 = 47 Kritická hodnota pro a =0,05 F(k_ln_k) = 3,20. * Na hladině významnosti a =0,05 zamítáme H0 o rovnosti středních hodnot. Tomáš Pavlík Biostatistika Co dělat, když nejsou splněny předpoklady? " Máme dvě možnosti: 1. Zkusit data transformovat - např. logaritmická transformace by měla pomoci s normalizací rozdělení a stabilizací rozptylu u log-normálních dat. 2. Použít neparametrické testy - např. Kruskalův-Wallisův test nevyžaduje předpoklad normality, pracuje stejně jako neparametrický Mannův-Whitneyův test. Tomáš Pavlík Biostatistika Kruskalův - Wallisův test ^Jedná se o zobecnění neparametrického Mannová - Whitneyho testu. " Netestuje shodu parametrů, ale stejné distribuční funkce srovnávaných souborů (klíčový je zde předpoklad nezávislosti pozorovaných dat). H0:F(x) = F(y) = F(z) = ... Pro výpočet opět seřadíme všechna pozorování podle velikosti (jako by byly z jednoho vzorku) a přiřadíme jednotlivým hodnotám jejich pořadí. ■* Pointa Kruskalova - Wallisova testu: za platnosti H0 jsou spojená data dobře promíchaná a průměrná pořadí v jednotlivých souborech jsou podobná. Tomáš Pavlík Biostatistika Kruskalův - Wallisův test * Označme 7", součet pořadí v /-té skupině: Tt = / j Rj} 7=1 iA Počet skupin: k, Celkem pozorování: n = n1 + n2 + ... + nk. 12 k T2 * Testová statistika: Q =-Y - 3(« +1) n(n +1) ti nt - Nulovou hypotézu H0 zamítáme na hladině významnosti, když je testová statistika větší nebo rovna kritické hodnotě chí-kvadrát rozdělení: Q> %k * Pro malé velikosti souboru je třeba srovnat statistiku Q s tabulkami pro Kruskalův-Wallisův test. Tomáš Pavlík Biostatistika 4. Násobné testování podskupin Korekce na násobné srovnání výběrů Zamítneme-li analýzou rozptylu nulovou hypotézu o celkové rovnosti středních hodnot, má smysl se ptát, jaké skupiny se od sebe nejvíce liší. ■*Toto srovnání lze provést pomocí testů pro dva výběry, aleje nutné korigovat výslednou hladinu významnosti testu, abychom se vyhnuli chybě I. druhu. 1 ■ Nejjednodušší metoda: Bonferroniho procedura - korekce hladiny významnosti: ď = a/m, kde m je počet provedených testů. Ekvivalentně lze vynásobit p-hodnotu počtem provedených testů. Nevýhodou je, zeje konzervativní pro velké m, tedy počet provedených testů. Pro analýzu rozptylu: Tukeyho a Scheffého post hoc testy. u; Pro neparametrický K-W test: metoda dle Steela a Dwasse. Tomáš Pavlík Biostatistika Příklad - korekce u CHOPN dat • ANOVA na hladině významnosti a =0,05 zamítla H0 o rovnosti středních hodnot Plmax. Jaké skupiny se od sebe nejvíce liší? Bonferroniho procedura Tukeyho post hoc test Scheffého post hoc test Stadium m IV 0,398 0,009 III - 0,571 Stadium III IV 0,186 0,008 III - 0,433 Stadium III IV 0,214 0,011 m - 0,466 1 • Zde nám všechny tři analýzy vyšly stejně, ale obecně to neplatí! Tomáš Pavlík IBA W BiOStatiStika 5. Analýza rozptylu jako lineární model Analýza rozptylu jako lineární model ■* Analýza rozptylu pro jednu vysvětlující proměnnou (jednoduché třídění) lze zapsat jako lineární model: Yu = = // + <*,-+ el7^ Reziduum Populační průměr1 x /-tý efekt faktoru A 1; Nulovou hypotézu pak lze vyjádřit jako: H0 :al = a2 = ... = ak * Rozšířením tohoto zápisu můžeme definovat další modely ANOVA: více faktorů, hodnocení interakcí, opakovaná měření na jednom subjektu. Tomáš Pavlík Biostatistika Analýza rozptylu dvojného třídění Uvažujeme dvě vysvětlující proměnné zároveň. Zápis modelu: Populační průměr Reziduum y-tý efekt faktoru B /-tý efekt faktoru A Ji Nulové hypotézy pak máme dvě: H0l \al = a2 = ... = ak , H02 \ß = ß = ... = ß Variabilita Součet čtverců Počet stupňů volnosti Průměrný čtverec F statistika p-hodnota Faktor A 5A dfA = k-l MSA = SA/dfA Faktor B dfA = r-l MSB = SB1 dfB P Rezidua dfe = n-k-r+l MSe= Se / dfe Celkem St dfT = n-l Tomáš Pavlík IBA Analýza rozptylu dvojného třídění s interakcí Uvažujeme dvě vysvětlující proměnné a zároveň i jejich společné působení. ■ Zápis modelu: Y9=/t + a,+ pj + r,j + ev *-Reziduum Interakce y-tý efekt faktoru B í-tý efekt faktoru A Nulové hypotézy pak máme tři: ^01 '-Y\\~ Y n — • • • — Ykr H02 •Oí1 = a 2 — • • • — ock HQ3 . py = p2 — • • • — pr Populační průměr Variabilita Součet čtverců Počet stupňů volnosti Průměrný čtverec F statistika p-hodnota Faktor A dfA = k-l MSA = SA/dfA Faktor B dfA = r-l MSB = SB1 dfB P Interakce AxB ■^AB dfAB=(k-l)(r-l) MS AB = SAB / dÍAB Rezidua se dfe = n- kr MSe= Se 1 dfe Celkem dfT = n-l Tomáš Pavlík Biostatistika Poděkování... Rozvoj studijního oboru „Matematická biologie'' PřF MU Brno je finančně podporován prostředky projektu ESF č. CZ.1.07/2.2.00/07.0318 „Víceoborová inovace studia Matematické biologie" a státním rozpočtem České republiky 18f k BH pnSt t^í čími ^^^^fc I soclalnL ^^^^^^^ MINISTERSTVO ŠKOLSTVÍ. OP Vzdělávání 'j-^iJr^ ^0 m fondvCR EVROPSKÁ UNIE mládeže a tělovýchovy pro konkurenceschopnost 4ííA p*" INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ Tomáš Pavlík Biostatistika