logo-IBA logomuni
Přednáška IX.
 Analýza rozptylu (ANOVA)
* Princip a metodika výpočtu
* Předpoklady analýzy rozptylu a jejich ověření
* Rozbor rozdílů jednotlivých skupin – násobné testování hypotéz
* Analýza rozptylu jako lineární model
esf-komplet-barva.jpg

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Opakování – parametrické a neparametrické testy
* Jmenujte příklad parametrického a neparametrického testu.
* Znáte jejich předpoklady?

logo-IBA logomuni
1. Motivace


logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Příklad – CHOPN
* Sledujeme plicní funkce u pacientů s chronickou obstrukční plicní nemocí (CHOPN) ve stadiu II,
III a IV. Zajímá nás, jestli se u pacientů v jednotlivých stadiích liší maximální inspirační tlak
(PImax).
Boxplot.P Imax (kPa) - stadium.CHOPN.png

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Příklad – CHOPN
* Jak můžeme pro CHOPN stadia II, III a IV ověřit rozdíl (resp. rovnost) v maximálním inspiračním
tlaku (PImax)?
*
A.Můžeme použít vhodný test pro dva výběry (např. t-test) a otestovat, jak se liší stadium II od
III, II od IV a III od IV – tedy provést 3 testy.
B.Musíme použít vhodný test pro více než dvě srovnávané skupiny.
*
* V čem je zásadní rozdíl mezi A a B?

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Problém násobného testování hypotéz
* Problém s možností A je v násobném testování hypotéz – pro připomenutí: S narůstajícím počtem
testovaných hypotéz nám roste také pravděpodobnost získání falešně pozitivního výsledku, tedy
pravděpodobnost toho, že se při našem testování zmýlíme a ukážeme na statisticky významný rozdíl
tam, kde ve skutečnosti žádný neexistuje (chyba I. druhu).
*
* Máme tři testy, v každém 95% pravděpodobnost, že neuděláme chybu I. druhu.
* Pro všechny tři testy to tedy znamená: 0,95 × 0,95 × 0,95 = 0,857.
* Pravděpodobnost, že neuděláme chybu I. druhu nám celkově klesla na 0,857.
* Pravděpodobnost, že uděláme chybu I. druhu nám celkově stoupla na 0,143.

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Analýza rozptylu
* Lepší volbou je:
B.   Musíme použít vhodný test pro více než dvě srovnávané skupiny.
*
* Analýza rozptylu (ANOVA  = „ANalysis Of VAriance“) je statistickou metodou, která umožňuje
testovat rozdíl v průměrech více než dvou skupin. Přitom se jedná o jeden test.
*
* Více než dvě skupiny mohou být dány přirozeně (např. sledujeme rozdíl mezi věkovými kategoriemi)
nebo uměle (např. sledujeme rozdíl v účinnosti několika typů léčby).

logo-IBA logomuni
2. Princip výpočtu


logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Náhodné výběry a hypotéza
* Máme k nezávislých realizací náhodného výběru rozsahu: n1, n2, … , nk.
*
* Předpoklady:
*
*
*
*
*
* Hypotézy:
Normalita hodnot všech k výběrů
Homogenita rozptylů všech k výběrů

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Příklady – hypotézy
1.Liší se účinnost dvou různých dávek léčiva XYZ od placeba?
Střední hodnota účinnosti placeba, XYZ v dávce 1 a XYZ v dávce 2:
2.
2.
2.Liší se AML, ALL, CML a CLL v aktivitě vybraných genů?
Střední hodnota exprese genu g u AML, ALL, CML, CLL:

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Pozorované hodnoty
Výběr 1
…
Výběr 2
Výběr 3
Výběr k
Všechny výběry
Výběrový průměr
Rozsah výběru
Výběrový rozptyl
Skupinový průměr
(„population mean“)
Celkový průměr
(„grand mean“)

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Příklad – CHOPN
Stadium
III
IV
II
Celkový průměr („grand mean“)

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Značení
* Součty:
* Průměry:
*
*
* Celková variabilita v souboru:
*
*
* Variabilita v rámci skupin (reziduální součet čtverců):
*
*
* Variabilita mezi skupinami (příslušná sledovanému vlivu = proměnné):
Skupinový průměr
(„population mean“)
Celkový průměr
(„grand mean“)
Stupně volnosti:
Stupně volnosti:
Stupně volnosti:

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Vztahy mezi odhady variability
* Platí:
*
*
* Dále se dá ukázat, že platí:
*
*
* Tedy platí, že celková variabilita se dá rozložit na variabilitu v rámci skupin a variabilitu
mezi skupinami:
Stadium
III
IV
II

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Umělý příklad
Léčba
Pozorovaná
hodnota
Skupinový
průměr
Skupinový průměr
– celkový průměr
Pozorovaná hodnota – skupinový průměr
Pozorovaná hodnota – celkový průměr
1
10
12
-4
-2
-6
1
12
12
-4
0
-4
1
14
12
-4
2
-2
2
19
20
4
-1
3
2
20
20
4
0
4
2
21
20
4
1
5
3
14
16
0
-2
-2
3
16
16
0
0
0
3
18
16
0
2
2
Celkový průměr = 16
Součet čtverců = 96
Součet čtverců = 18
Součet čtverců = 114
Stupně volnosti = 2
Stupně volnosti = 6
Stupně volnosti = 8

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Jak testuje t-test pro dva výběry?
* Nulová hypotéza:
* Testová statistika:
Rozdíl (variabilita) mezi výběry
Variabilita uvnitř výběrů
Rozdíl (variabilita) mezi výběry
Variabilita uvnitř výběrů

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Princip analýzy rozptylu
* Princip analýzy rozptylu je stejný, tedy ANOVA srovnává pozorovanou variabilitu mezi výběry s
pozorovanou variabilitou uvnitř výběrů. Na rozdíl od t-testu však pracuje s výběrovými rozptyly.
*
* Testová statistika analýzy rozptylu:
*
Odhad rozptylu založený na výběrových průměrech
Odhad rozptylu založený pozorovaných hodnotách
Za platnosti H0 platí:

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Výsledek dle platnosti nulové hypotézy
* Za předpokladu rovnosti rozptylů jednotlivých výběrů představuje člen ve jmenovateli statistiky F
výběrový odhad σ2.
* Za platnosti H0 představuje i člen v čitateli statistiky F výběrový odhad σ2.
*
* Platí-li nulová hypotéza, čitatel statistiky F (počítaný na základě výběrových průměrů) bude
zhruba stejný jako její jmenovatel (počítaný na základě pozorovaných hodnot).
* Neplatí-li nulová hypotéza, čitatel statistiky F bude větší než jmenovatel.
*
* Samotné rozhodnutí o platnosti H0 je tak založeno na srovnání průměrných čtverců a .

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Výsledek analýzy rozptylu
* Výsledné počty se standardně zaznamenávají do tzv. tabulky analýzy rozptylu:
*
*
*
*
*
*
* Nulovou hypotézu zamítneme/nezamítneme buď na základě srovnání výsledné p-hodnoty se zvolenou
hladinou významnosti testu α, nebo srovnáním výsledné F statistiky s kritickou hodnotou (kvantilem)
rozdělení F(k – 1, n – k) příslušnou zvolené hladině významnosti testu α.
Variabilita
Součet čtverců
Počet stupňů volnosti
Průměrný čtverec
F statistika
p-hodnota
Mezi skupinami
SA = 96
dfA = k – 1 = 2
MSA = 48
F = 16
0,004
Uvnitř skupin
Se = 18
dfe = n – k = 6
MSe = 3
Celkem
ST = 114
dfT = n – 1 = 8

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Výsledek umělého příkladu
priklad_anova_Fdist.jpeg
Na hladině významnosti α =0,05 zamítáme H0 o rovnosti středních hodnot.

logo-IBA logomuni
3. Předpoklady analýzy rozptylu a jejich ověření


logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Předpoklady analýzy rozptylu
* Nezávislost jednotlivých pozorování – sice téměř automatický předpoklad, nicméně je třeba se nad
ním alespoň zamyslet.
*
* Normalita pozorovaných hodnot obou náhodných výběrů – velmi silný předpoklad. Nutno otestovat
nebo alespoň graficky ověřit (histogram, box plot).
*
* Stejný rozptyl náhodné veličiny v obou srovnávaných skupinách – také silný předpoklad. Opět nutno
otestovat nebo alespoň graficky ověřit (histogram, box plot).
*

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Testování shody rozptylů
* Grafické ověření – histogram, box plot.
* Levenův test – často používaný, nevyžaduje předpoklad normality původních hodnot.
* Bartlettův test – velkou nevýhodou je předpoklad normality původních hodnot.
anova_srovnani_rozptylu.jpeg

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Levenův test
* Jeho výhoda je, že nevyžaduje předpoklad normality původních hodnot.
* Jedná se o analýzu rozptylu na hodnotách
* Označme a
*
*
*
* Testová statistika:
*
*
* Používá se také jeho robustní varianta s použitím absolutních odchylek od mediánu místo od
průměru:
Při rovnosti rozptylů opět platí:

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Příklad – Levenův test u CHOPN dat
* Sledujeme plicní funkce u pacientů s chronickou obstrukční plicní nemocí (CHOPN) ve stadiu II,
III a IV.
* Levenův test probíhá stejně jako jednoduchá ANOVA – opět srovnáváme průměrné čtverce – reziduální
a příslušné sledovaným faktorům.
*
*
*
*
*
*
*
* Na hladině významnosti α =0,05 nezamítáme H0 o rovnosti rozptylů.
Variabilita
Součet čtverců
Počet stupňů volnosti
Průměrný čtverec
F statistika
p-hodnota
Mezi skupinami
SA = 5,30
dfA = k – 1 = 2
MSA = 2,65
F = 1,13
0,331
Uvnitř skupin
Se = 105,35
dfe = n – k = 45
MSe = 2,34
Celkem
ST = 110,65
dfT = n – 1 = 47

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Hodnocení normality dat
* Hodnocení normality je klíčovým postupem v biostatistice. Testy nejsou vždy nejlepším nástrojem!
Vždy je důležité se podívat i očima!
*
* Zamítnutí normality rozdělení neznamená jenom výběr příslušného testu, ALE může indikovat odlehlé
a nelogické hodnoty v souboru dat.
*
* Pokud o sledované veličině prokazatelně víme, že v cílové populaci nabývá normální rozdělení
(např. výška lidské postavy), ale v daném souboru normální rozdělení nepotvrdíme, pak s naším
náhodným výběrem není něco v pořádku – např. není reprezentativní.

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Grafické metody – box plot a histogram
* Normální
rozdělení
*
*
*
*
* Log-normální
rozdělení
hist_normal.jpeg boxplot_lognormal.jpeg boxplot_normal.jpeg hist_lognormal.jpeg

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Grafické metody – box plot a histogram
* Normální
rozdělení
s odlehlými
hodnotami
*
*
* Rovnoměrně
spojité
rozdělení
hist_uniform.jpeg boxplot_outlier.jpeg boxplot_uniform.jpeg hist_outlier.jpeg

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Grafické metody – Q-Q plot
qq_plot_normal.jpeg
* Q-Q plot proti sobě zobrazuje kvantily pozorovaných hodnot a kvantily teoretického rozdělení
pravděpodobnosti (zde normálního rozdělení).
* V případě shody leží všechny body na přímce.
* Normální rozdělení:

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Grafické metody – Q-Q plot
1.Log-normální rozdělení:
2.Normální rozdělení s odlehlými hodnotami:
3.Rovnoměrně spojité rozdělení
1.
2.
3.

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Testy pro ověření normality dat
* Shapirův-Wilkův test – v podstatě se jedná o proložení seřazených hodnot regresní přímkou
vzhledem k očekávaným hodnotám normálního rozdělení. Má tedy přímý vztah k Q-Q plotu – vyhodnocuje,
jak moc se Q-Q plot liší od ideální přímky. Doporučován pro menší vzorky, může být „moc“ přísný pro
velké vzorky.
*
* Kolmogorovův-Smirnovovův test – založen na srovnání výběrové distribuční funkce s teoretickou
distribuční funkcí odpovídající normálnímu rozdělení. K-S test hodnotí maximální vzdálenost mezi
těmito dvěma distribučními funkcemi. V praxi se používá korekce dle Lillieforse.

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Příklad – Shapirův-Wilkův test u CHOPN dat
* Sledujeme plicní funkce u pacientů s chronickou obstrukční plicní nemocí (CHOPN) ve stadiu II,
III a IV.
*
* Test pro všechna stadia:
p = 0,073  (to nás nezajímá)
*
* Stadium II: p = 0,090
* Stadium III: p = 0,247
* Stadium IV: p = 0,815
*
* H0 o normalitě dat nezamítáme
na hladině α =0,05.
Boxplot.P Imax (kPa) - stadium.CHOPN.png
n = 9
n = 12
n = 27

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Příklad – Shapirův-Wilkův test u CHOPN dat
* Srovnáme výsledky S-W testu s Q-Q ploty pro jednotlivé kategorie.
* Vzhledem k malým velikostem souborů lze odchylky od normality dat tolerovat.
qq_chopn_stadium4.jpeg qq_chopn_stadium2.jpeg qq_chopn_stadium3.jpeg
Stadium II (n = 9)
p = 0,090
Stadium III (n = 12)
p = 0,247
Stadium IV (n = 27)
p = 0,815

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Příklad – analýza rozptylu u CHOPN dat
* Liší se pacienti s CHOPN (stadium II, III, IV) v maximálním inspiračním tlaku (PImax)?
* Máme ověřenu homogenitu rozptylů i přibližnou normalitu dat → ANOVA.
*
*
*
*
*
*
*
* Kritická hodnota pro α =0,05 F(k – 1, n – k) = 3,20.
* Na hladině významnosti α =0,05 zamítáme H0 o rovnosti středních hodnot.
Variabilita
Součet čtverců
Počet stupňů volnosti
Průměrný čtverec
F statistika
p-hodnota
Mezi skupinami
SA = 80,54
dfA = k – 1 = 2
MSA = 40,27
F = 5,10
0,010
Uvnitř skupin
Se = 355,50
dfe = n – k = 45
MSe = 7,90
Celkem
ST = 436,04
dfT = n – 1 = 47

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Co dělat, když nejsou splněny předpoklady?
* Máme dvě možnosti:
*
1.Zkusit data transformovat – např. logaritmická transformace by měla pomoci s normalizací
rozdělení a stabilizací rozptylu u log-normálních dat.
2.Použít neparametrické testy – např. Kruskalův-Wallisův test nevyžaduje předpoklad normality,
pracuje stejně jako neparametrický Mannův-Whitneyův test.

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Kruskalův – Wallisův test
* Jedná se o zobecnění neparametrického Mannova – Whitneyho testu.
* Netestuje shodu parametrů, ale stejné distribuční funkce srovnávaných souborů (klíčový je zde
předpoklad nezávislosti pozorovaných dat).
*
*
* Pro výpočet opět seřadíme všechna pozorování podle velikosti (jako by byly z jednoho vzorku) a
přiřadíme jednotlivým hodnotám jejich pořadí.
*
* Pointa Kruskalova – Wallisova testu: za platnosti H0 jsou spojená data dobře promíchaná a
průměrná pořadí v jednotlivých souborech jsou podobná.

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Kruskalův – Wallisův test
* Označme Ti součet pořadí v i-té skupině:
*
* Počet skupin: k, Celkem pozorování: n = n1 + n2 + … + nk.
*
* Testová statistika:
*
* Nulovou hypotézu H0 zamítáme na hladině významnosti, když je testová statistika větší nebo rovna
kritické hodnotě chí-kvadrát rozdělení:
* Pro malé velikosti souboru je třeba srovnat statistiku Q s tabulkami pro Kruskalův-Wallisův test.
*

logo-IBA logomuni
4. Násobné testování podskupin


logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Korekce na násobné srovnání výběrů
* Zamítneme-li analýzou rozptylu nulovou hypotézu o celkové rovnosti středních hodnot, má smysl se
ptát, jaké skupiny se od sebe nejvíce liší.
*
* Toto srovnání lze provést pomocí testů pro dva výběry, ale je nutné korigovat výslednou hladinu
významnosti testu, abychom se vyhnuli chybě I. druhu.
*
* Nejjednodušší metoda: Bonferroniho procedura - korekce hladiny významnosti: α* = α/m, kde m je
počet provedených testů. Ekvivalentně lze vynásobit p-hodnotu počtem provedených testů. Nevýhodou
je, že je konzervativní pro velké m, tedy počet provedených testů.
* Pro analýzu rozptylu: Tukeyho a Scheffého post hoc testy.
* Pro neparametrický K-W test: metoda dle Steela a Dwasse.

logo-IBA logomuni logo-IBA logomuni
Tomáš Pavlík
Biostatistika
Příklad – korekce u CHOPN dat
* ANOVA na hladině významnosti α =0,05 zamítla H0 o rovnosti středních hodnot PImax. Jaké skupiny
se od sebe nejvíce liší?
*
* Bonferroniho procedura
*
* Tukeyho post hoc test
*
* Scheffého post hoc test
*
*
* Zde nám všechny tři analýzy vyšly stejně, ale obecně to neplatí!
Stadium
III
IV
II
0,398
0,009
III
-
0,571
Stadium
III
IV
II
0,186
0,008
III
-
0,433
Stadium
III
IV
II
0,214
0,011
III
-
0,466