logo-IBA
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Znaménkový test a χ2 test
Shrnutí statistických testů
Kontingenční tabulky
8. Kontingenční tabulky a χ2 test

logo-IBA logomuni
Shrnutí statistických testů
Typ srovnání
Nulová hypotéza
Parametrický test
Neparametrický test
1 skupina dat vs. etalon
Střední hodnota je rovna hodnotě etalonu.
jednovýběrový t-test
Wilcoxonův test;
znaménkový test
2 skupiny dat nepárově
Obě skupiny hodnot pochází ze stejného rozdělení.
nepárový t-test
Mann-Whitneyův test
2 skupiny dat párově
Zkoumaný efekt mezi páry hodnot je nulový.
Párový t-test
Wilcoxonův test;
znaménkový test
shoda rozdělení
rozdělení dat ve skupině odpovídá teoretickému (vybranému) rozdělení.
Shapiro-Wilkův test;
Kolmogorovův-Smirnovův test;
Lilieforsův test
χ2 test,
test dobré shody
homoskedasticita
(shoda rozptylů)
rozptyl obou (všech) skupin je shodný.
Levenův test
více skupin nepárově
Zkoumaný efekt mezi skupinami hodnot je nulový.
ANOVA
Kruskal- Wallisův test
korelace
Neexistuje (příčinná, důsledková) vazba mezi skupinami hodnot.
Pearsonův koeficient
Spearmanův koeficient;
Kendallův koeficient

logo-IBA logomuni
Shrnutí statistických testů
Jsou data normálně rozdělená?
Lze použít transformaci?
Kolik je skupin?
Jsou data párová?
Co chci spočítat?
Mají sku- piny stejný rozptyl?
Nelze spočítat
NE
ANO
ANO
Co chci spočítat?
Co chci spočítat?
Jedno-výběro-vý t-test
Párový t-test
Nelze spočítat
Dvouvý
běrový
t-test
Mann-
Whitney
U-test
Sada Pears.
kor. koef.
ANOVA
Kruskal-Wallisův
test
Nelze spočítat
Wilco-xonův
test
Spear-manův/
Kendallův
k. k.
Wilco-xonův test
Nelze spočítat
Nelze spočítat
Kuskal-Wallisův test
Pearso-nův kor. koef.
ANO
NE
ANO
NE
Jsou data párová?
ANO
NE
Mají sku- piny stejný rozptyl?
ANO
NE
Co chci spočítat?
Co chci spočítat?
Kolik je skupin?
Co chci spočítat?
Jsou data párová?
ANO
NE
Jsou data párová?
Nelze spočítat
Mann-Whitney
U-test
Co chci spočítat?
Co chci spočítat?
Co chci spočítat?
ANO
NE
Parametrické testy
Kolomogorovův-Smirnovův test
Shapiro-Wilkův test
F test
Levenův test
Co chci spočítat?
log
arcsin

logo-IBA
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Statistické testování – základní pojmy
Nulová hypotéza H0
Alternativní hypotéza HA
Testová statistika
Kritický obor testové statistiky
0
T
Pozorovaná hodnota – Očekávaná hodnota
Variabilita dat
Testová statistika =
H0: sledovaný efekt je nulový
HA: sledovaný efekt je různý mezi skupinami
*   Velikost vzorku
Statistické testování odpovídá na otázku zda je pozorovaný rozdíl náhodný či nikoliv. K odpovědi na
otázku je využit statistický model – testová statistika.

logo-IBA logomuni
P-hodnota
—Významnost hypotézy hodnotíme dle získané tzv.  p-hodnoty, která vyjadřuje pravděpodobnost, s
jakou číselné realizace výběru podporují H0, je-li pravdivá.
—P-hodnotu porovnáme s α (hladina významnosti, stanovujeme ji na 0,05, tzn., že připouštíme 5 %
chybu testu, tedy, že zamítneme H0, ačkoliv ve skutečnosti platí).
—P-hodnotu získáme při testování hypotéz ve statistickém softwaru.
—
—Je-li p-hodnota  ≤ α, pak  H0 zamítáme na hladině významnosti α a přijímáme HA
—Je-li p-hodnota > α, pak H0 nezamítáme na hladině významnosti α
—
—P-hodnota vyjadřuje pravděpodobnost za platnosti H0, s níž bychom získali stejnou nebo extrémnější
hodnotu testové statistiky.
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
M. Cvanová

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Test dobré shody - základní teorie
Testuje shodu reálné distribuce hodnot do n skupin s teoretickou distribucí.
Předpokladem je, že velikost rozdílu mezi očekávaným a skutečným počtem hodnot v každé skupině je
náhodně rozdělená → multinomické rozdělení.
Součet druhých mocnin relativních rozdílů očekávaného a skutečného počtu hodnot  má přibližně
χ2 rozdělení.
chi.jpg
χ2 rozdělení pro kladné hodnoty (suma čtverců) se liší podle počtu stupňů volnosti k (počtu skupin)
- se zvyšujícím se k přechází v normální rozdělení.
pozorovaná
četnost
očekávaná
četnost
očekávaná četnost
=
2
-
∑

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Test dobré shody - základní teorie
pozorovaná
četnost
očekávaná
četnost
očekávaná četnost
=
+
2
pozorovaná
četnost
očekávaná
četnost
očekávaná četnost
1. jev
2. jev
-
2
-
+
…
chi2.jpg chi2b.jpg chi2c.jpg chi2d.jpg

logo-IBA logomuni
Očekávané četnosti
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
M. Cvanová
V případě platnosti nulové hypotézy je poměr mezi buňkami jednoho sloupce v různých řádcích
nezávislý na výběru tohoto sloupce.
V případě platnosti nulové hypotézy je poměr mezi buňkami jednoho řádku v různých sloupcích
nezávislý na výběru tohoto řádku.
Pokud tyto poměry normalizujeme, získáváme tabulku očekávaných četností.
Řádkové a sloupcové součty se touto operací nemění.
Ano
Ne
S
Ano
20
82
102
Ne
10
54
64
S
30
136
166
Ano
Ne
S
Ano
18,4
83,6
102
Ne
11,6
52,4
64
S
30
136
166
Pozorované četnosti
Očekávané četnosti
102 × 30 / 166

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Test dobré shody - základní teorie
Binomické jevy (1/0)
pozorovaná
četnost
očekávaná
četnost
očekávaná četnost
=
+
2
pozorovaná
četnost
očekávaná
četnost
očekávaná četnost
I. jev 1
II. jev 2
-
2
-
Příklad
10 000 lidí hází mincí           rub: 4 000 případů (R)
                                            líc: 6 000 případů (L)
Lze výsledek považovat za statisticky významně odlišný
(nebo neodlišný) od očekávaného poměru R : L = 1 : 1 ?
 Rozdíl je vysoce statisticky významný (p << 0,001]
Tabulková hodnota:

logo-IBA logomuni
Znaménkový test
Zjednodušení neparametrického párového Wilcoxonova testu.
Namísto velikosti rozdílů se počítá pouze jejich orientace (signum).
Případy, kde sgn(d) = 0 se z analýzy vylučují.
Sečtou se kladné a záporné rozdíly a menší ze součtů je hledaná statistika m.
Statistika m se porovná s tabulkovou hodnotou pro danou hladinu pravděpodobnosti:
znamenkovy_test.jpg

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Kontingenční tabulky
 H0 :Nezávislost dvou jevů A a B
Kontingenční tabulka
2 x 2
+
-
S
+
a
b
-
c
d
S
suma sum
B
A

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Kontingenční tabulky: příklad
Ano
Ne
S
Ano
20
82
102
Ne
10
54
64
S
30
136
166
gen
…
Kontingenční tabulka v obrázku
Gen: ANO
Gen: NE

logo-IBA logomuni
Příklad – závislost pohlaví na onemocnění
Zdraví
Nemocní
Celkem
Muži
50
50
100
Ženy
50
50
100
Celkem
100
100
200
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
M. Cvanová
Zdraví
Nemocní
Celkem
Muži
45
55
100
Ženy
55
45
100
Celkem
100
100
200
Zdraví
Nemocní
Celkem
Muži
35
65
100
Ženy
65
35
100
Celkem
100
100
200
Zdraví
Nemocní
Celkem
Muži
5
95
100
Ženy
95
5
100
Celkem
100
100
200

logo-IBA logomuni
Příklad – závislost pohlaví na onemocnění
Zdraví
Nemocní
Celkem
Muži
50
50
100
Ženy
50
50
100
Celkem
100
100
200
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
M. Cvanová
Zdraví
Nemocní
Celkem
Muži
45
55
100
Ženy
55
45
100
Celkem
100
100
200
Zdraví
Nemocní
Celkem
Muži
35
65
100
Ženy
65
35
100
Celkem
100
100
200
Zdraví
Nemocní
Celkem
Muži
5
95
100
Ženy
95
5
100
Celkem
100
100
200
Zdraví
Nemocní
Celkem
Muži
50
50
100
Ženy
50
50
100
Celkem
100
100
200
Očekávané hodnoty pro všechny tabulky vlevo
Pozorované hodnoty
pozorovaná
četnost
očekávaná
četnost
očekávaná četnost
=
2
-

logo-IBA logomuni
Příklad – závislost pohlaví na onemocnění
Zdraví
Nemocní
Celkem
Muži
50
50
100
Ženy
50
50
100
Celkem
100
100
200
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
M. Cvanová
Zdraví
Nemocní
Celkem
Muži
45
55
100
Ženy
55
45
100
Celkem
100
100
200
Zdraví
Nemocní
Celkem
Muži
35
65
100
Ženy
65
35
100
Celkem
100
100
200
Zdraví
Nemocní
Celkem
Muži
5
95
100
Ženy
95
5
100
Celkem
100
100
200
Χ2 = 0,0
p = 1,000
Χ2 =2,0
p = 0,157
Χ2 = 18,0
p < 0,0001
Χ2 = 162,0
p < 0,0001

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Parametrická analýza rozptylu
Post hoc testy
Kruskal-Wallisův test
Korelace
Lineární regrese
9. Analýza rozptylu a korelace

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Anotace
—t-test slouží pro porovnání průměrů spojité proměnné ve dvou (diskrétních) skupinách.
—Analýza rozptylu (ANOVA) umožňuje totéž porovnání provést pro větší počet (diskrétních) skupin.
—Korelační analýza je využívána pro vyhodnocení míry vztahu dvou spojitých proměnných.
—Regresní analýza vytváří model vztahu dvou nebo více proměnných, tedy jakým způsobem jedna
proměnná (vysvětlovaná) závisí na jiných proměnných (prediktorech).
—Regresní analýza je obdobně jako ANOVA nástrojem pro vysvětlení variability hodnocené proměnné.
—Existují rovněž neparametrické varianty t-testu a ANOVy.
—

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Analýza rozptylu - ANOVA
—Zobecnění dvouvýběrového t-testu
—ANOVA je základním nástrojem pro analýzu rozdílů mezi průměry v několika skupinách
—H0: všechny střední hodnoty jsou stejné
HA: alespoň jedna dvojice středních hodnot se liší
—Předpoklady: normální rozložení ve skupinách, nezávislost skupin, shoda rozptylů (Levenův či
Bartlettův test)
—Pokud H0 zamítáme na hl. význ. α → nás zajímá, která dvojice středních hodnot se od sebe liší
¡metody mnohonásobného testování (tzv. post hoc testy), např. Scheffého, Tukeyova metoda

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Anotace
—Základní myšlenka, na níž je ANOVA založena, je rozdělení celkové variability v datech (neznámé,
dané pouze náhodným rozložením) na část systematickou (spjatou s kategoriemi pacientů, vysvětlená
variabilita) a část náhodnou. Pokud systematická, tedy nenáhodná a vysvětlitelná část variability
převažuje, považujeme daný kategoriální faktor za významný pro vysvětlení variability dat.
—Analýza rozptylu vyhodnocuje pouze celkový vliv faktoru na variabilitu, v případě analýzy
jednotlivých kategorií je třeba využít tzv. post-hoc testy

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Analýza rozptylu - ANOVA
Základní technika sloužící
k posouzení rozdílů mezi více úrovněmi pokusného zásahu
..............
Rostoucí koncentrace testované látky / látek
Celkově významné změny v reakci biologického systému
Vzájemné rozdíly účinku jednotlivých dávek
Rozdíly účinku dávek od kontroly

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Analýza rozptylu - ANOVA
Významné kroky analýzy, vedoucí k efektivnímu srovnání variant
..............
Rostoucí koncentrace testované látky / látek
Splnění předpokladů analýzy
 Transformace dat
Relevantnost kontroly
(vliv vlastní aplikace látek)
Vhodnost modelu ANOVA pro účely testu
Vlastní srovnání variant
Minimalizace chyb při ověřování hypotéz

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Analýza rozptylu - ANOVA
ANOVA
= parametrická analýza dat
Předpoklad nezávislosti
opakování experimentu
Normalita rozložení
v rámci pokusných variant
Homogenita rozptylu v rámci pokusných variant
SPLNĚNÍ PŘEDPOKLADŮ ANOVA JE NEZBYTNOU PODMÍNKOU
POUŽITÍ TÉTO TECHNIKY
ALTERNATIVOU JSOU NEPARAMETRICKÉ METODY
1.
3.
2.

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Analýza rozptylu - ANOVA
Předpoklady analýzy rozptylu jsou nezbytné pro dosažení síly testu
• Symetrické rozložení hodnot a normalita odchylek od hodnoceného modelu ANOVA. Velkou část dat lze
adekvátně normalizovat použitím logaritmické transformace. Předpoklad lognormální transformace může
pochopitelně být teoreticky vyloučen u mnoha datových souborů obsahujících diskrétní parametry, kde
je indikována vhodnost jiného typu transformace. U asymetricky  rozložených a u diskrétních dat je
nutné využít neparametrické alternativy analýzy rozptylu.
• Homogenita rozptylu je nutným předpokladem pro smysluplnost vzájemných srovnání pokusných
variant. U testů toxicity by splnění tohoto předpokladu mělo být ověřováno (Bartlettův test), neboť
vážné rozdíly (až řádové) v jednotkách testovaného parametru mohou nastat v důsledku inhibice
dávkami látky. Nehomogenita rozptylu je často ve vztahu k nenormalitě (asymetrii) dat a lze ji
odstranit vhodnou normalizující transformací.
• Statistická nezávislost reziduí  vyhodnocovaného modelu ANOVA. Pokud odhad a posouzení
korelačních vztahů mezi pokusnými variantami není přímo předmětem výzkumu, lze jejich vliv na
vyhodnocení odstranit znáhodněním dat v rámci pokusných variant -  tedy změnou pořadí v náhodné.
Rozsah vlivu těchto autokorelačních vztahů musí být ovšem primárně omezen správností
experimentálního uspořádání.
• Aditivita jako předpoklad týkající se složitějších experimentálních uspořádání. Exaktní
otestování aditivity více pokusných faktorů je procedura poměrně náročná na experimentální design
vyvážený co do počtu opakování. Je rovněž obtížné testovat interakci na nestandardních datech,
neboť případná transformace může změnit charakter odchylek původních dat od hodnoceného modelu
ANOVA.

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Analýza rozptylu - ANOVA
Omezení aplikace ANOVA lze řešit
• Chybějící data. Vážným problémem jsou chybějící údaje o celé skupině kombinací testovaných látek,
například u faktoriálních pokusů, kdy je znemožněno hodnocení experimentu jako celku.
• Různé počty opakování Jde o typický jev pro experimentální datové soubory. Při různých počtech
opakování v experimentálních variantách jsou testy ANOVA citlivější na nenormalitu dat. Pokud jsou
počty opakování zcela odlišné (až řádové rozdíly), je nutno použít neparametrické techniky nebo
analýzu rozptylu nevyvážených pokusů.
• Nehomogenita rozptylu. Velmi častý nedostatek experimentálních dat, často související s
nenormalitou rozložení nebo s odlehlými hodnotami.
• Odlehlé hodnoty. Ojedinělé odlehlé hodnoty musí být před parametrickou analýzou rozptylu
vyloučeny.
• Nedostatek nezávislosti mezi rezidui modelu. Jde o závažný nedostatek, zkreslující výsledek
F-testu. Velmi často je tato skutečnost důsledkem špatného provedení nebo naplánování experimentu.
• Nenormalita dat. I v tomto případě lz situaci upravit vyloučením odlehlých hodnot nebo
normalizující transformací.
• Neaditivita kombinovaného vlivu více pokusných zásahů. Tuto situaci lze testovat jednak
speciálními testy aditivity nebo přímo F testem kontrolujícím významnost vlivu interakce pokusných
zásahů. Při významné interakci je nutné prozkoumat především její charakter ve vhodném
experimentálním uspořádání.

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Modely analýzy rozptylu
Model I. Pevný model
Model II. Náhodný model
X0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
X2
.
.
.
.
.
.
.
.
.
.
X3
.
.
.
.
.
.
.
.
.
.
X4
.
.
.
.
.
.
.
.
.
.
A
B
C
D
E
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
X1
X0
X1
X2
X3
X4
Y
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
A
B
C
D
E
Y
Tmavý šikmo nahoru

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
ANOVA – základní výpočet
—Základním principem ANOVY je porovnání rozptylu připadajícího na:
¡Rozdělení dat do skupin (tzv. effect, variance between groups)
¡Variabilitu objektů uvnitř skupin (tzv. error, variance within groups), předpokládá se, že jde o
náhodnou variabilitu (=error)
1.Variabilita mezi skupinami
Rozptyl je počítán pro celkový průměr (tzv. grand mean) a průměry v jednotlivých skupinách dat
Stupně volnosti jsou odvozeny od počtu skupin (= počet skupin -1)
2.Variabilita uvnitř skupin
Rozptyl je počítán pro průměry jednotlivých skupin a objekty uvnitř příslušných, celková
variabilita je pak sečtena pro všechny skupiny
Stupně volnosti jsou odvozeny od počtu hodnot (= počet hodnot - počet skupin)
ANOVA
Výsledný poměr (F) porovnáme s tabulkami F rozložení pro v1 a v2 stupňů volnosti
SS=sum of squares

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Jednoduchý ANOVA design
Nejjednodušším případem ANOVA designu je rozdělení na skupiny podle jednoho parametru.

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Nested ANOVA
•Rozdělení skupin na náhodné podskupiny (např. opakování experimentu), podskupiny jsou vždy v jedné
skupině (ne kartézský součin).
• Cílem je zjistit, zda data v jedné skupině nejsou pouhou náhodou
• Nejprve je testována shoda podskupin v hlavních skupinách,
• pokud jsou shodné, je vše v pořádku
• pokud nejsou, stále lze zjišťovat, zda se variabilita uvnitř hlavních skupin liší od celkové
variability

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Two way ANOVA
Pro rozdělení do kategorií je zde více parametrů (možné jsou všechny varianty kartézského součinu).
Na rozdíl od nested ANOVY nejde o náhodná opakování experimentu, ale o řízené zásahy (např.vliv pH
a koncentrace O2)
Kromě vlivu hlavních faktorů se uplatňuje i jejich interakce

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Modely analýzy rozptylu -  základní výstup
Základním výstupem analýzy rozptylu je
Tabulka ANOVA - frakcionace komponent rozptylu
Zdroj rozptylu
Pok. zásah
(mezi skupinami)
Uvnitř skupin
Celkem
SSB/SST
MSB/MST
St. v.
a -1                        SSB          SSB/(a -1)        MSB/MSE
N - a                       SSE          SSE/(N - a)
N -1                        SST
SS
MS
F
Kvantifikovaný podíl rozdílu mezi pokusnými zásahy na celkovém rozptylu
Statistická významnost rozdílu

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Analýza rozptylu -  obecný F test
 obecný F test
H0: m1 = m2 = m3 = .... = mp
..............
F test: H0
Látka nepůsobí
H0 neplatí
Látka působí
Další analýzy
H0 platí

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Analýza rozptylu -  Testy kontrastů
ANOVA:H0 zamítnuta
Testy kontrastů
..........
Rozdíly v smysluplných kombinacích ?
Testování kontrastů
"Multiple range testy"
Parametrické
Neparametrické
Plánované
Neplánované
Pro srovnání variant s kontrolou

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Příklad: Anova - One way
Dávka rostlinného stimulátoru  (0, 4, 8, 12  mg/l)
A = 4 ; n = 8
I.      ANOVA
Bartlett's test:        P = 0,9847
K-S test:                P = 0,482 - 0,6525  pro jednotlivé kategorie
Source                          D. f.               SS             MS            F
Between Groups          3                305,8         101,9       8,56
Within Groups             28               322,2           11,9
Total (corr.)                31               638,0
II.     Multiple Range Test
NKS -test
Level           Average         Homogenous Groups
  0                  34,8                     x
  4                  41,4                    x
 12                41,8                   x
  8                  52,6                    x

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Srovnání variant v testech
Srovnáváni variant po celkovém testu ANOVA
Mnoho existujících algoritmů není vhodných
pro konkrétní případ
Day and Quin
Ecological Monographs,1989
Test
Využití
Poznámka
Dunnett
Williams
Srovnání s kontrolou
Ex. i modifikace pro různá n.
ANOVA
testy (F)
Orthogonální kontrasty
Plánovaná srovnání
Ryan Q test
Jednoduché kontrasty
Vyhodnocen jako nejlepší test
Testy pro jednoduché kontrasty
Scheffe
Tukey
LSD
Bonferroni
Dunn-Sidák
Kramer
Duncan
Student - Newmann-Keuls
Waller-Duncan k ratio
Testy nevhodné

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Řada post-hoc testů v různých SW
logo statsoft

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
ANCOVA
—Rozšíření ANOVA
—Současná analýza kategoriálních a spojitých prediktorů
—Testování hypotézy paralelismu regresních vztahů
Spojitý prediktor
kategorie
Spojitý prediktor
kategorie
Kategorie pacientů (pokusný zásah) neovlivňuje vztah proměnných
Kategorie pacientů (pokusný zásah) ovlivňuje vztah proměnných

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Korelace a regrese
—Korelační analýza je využívána pro vyhodnocení míry vztahu dvou spojitých proměnných. Obdobně jako
jiné statistické metody, i korelace mohou být parametrické nebo neparametrické
—Regresní analýza vytváří model vztahu dvou nebo více proměnných, tedy jakým způsobem jedna
proměnná (vysvětlovaná) závisí na jiných proměnných (prediktorech). Regresní analýza je obdobně
jako ANOVA nástrojem pro vysvětlení variability hodnocené proměnné

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Korelace
—K měření těsnosti lineárního vztahu 2 spojitých proměnných
r = 0 → nekorelované
r > 0 → kladně korelované
r < 0 → záporně korelované
—H0: proměnné X, Y jsou stochasticky nezávislé náhodné veličiny
(r = 0)
HA: proměnné X, Y nejsou stochasticky nezávislé náhodné veličiny (r ≠ 0)
—Parametrický korelační koeficient:
Pearsonův kor. koef. (dvourozměrné normální rozložení)
—Neparametrické korelační koeficienty:
Spearmanův (pořadový) kor. koef., Kendallovo tau.

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Jednoduchá lineární regrese
—V případě existence vzájemného vztahu (korelace) lze tento vztah podrobněji popsat.
—Cíl regresní analýzy: popsat závislost hodnot proměnné Y na hodnotách proměnné X.
—V případě lineární regrese je tento popis dán lineárním modelem tvaru y = ax + b.
—Existují i techniky nelineární regrese.
—Nemáme-li dostatek informací k teoretickému souboru, snažíme se odhadnout typ funkce pomocí
dvourozměrného diagramu.

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Základy korelační analýzy - I.
Korelace – vztah (závislost) dvou znaků (parametrů)
Y2
X1
Y
2
X
1
Y2
X1
ANO
NE
ANO
a
b
NE
c
d
X1
X2

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Základy korelační analýzy - II.
Parametrické míry korelace
Kovariance
Pearsonův koeficient korelace
0
0
0
--  x
--  y
Y2
X1
r = 1
r = -1

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Základy korelační analýzy - III.
PI (zem)
10
14
15
32
40
20
16
50
PI (rostl.)
19
22
26
41
35
32
25
40
I.
II.

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Základy korelační analýzy - IV.
Srovnání dvou korelačních koeficientů (r)
1.
2.
Krevní tlak x koncentrace kysl. radikálů
7,461 >> 1,96  =>  P << 0,01

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Základy korelační analýzy - V.
Neparametrická korelace (rs)
PI v půdě
1
2
3
6
7
5
4
8
PI v rostl.
1
2
4
8
6
5
3
7
dI
0
0
1
2
-1
0
-1
-1
i = 1, ….. n;   n = 8  => v = 6
P = 0,358
Pacient č.
1
2
3
4
5
6
7
Lékař 1
4
1
6
5
3
2
7
Lékař 2
4
2
5
6
1
3
7
dI
0
-1
1
-1
2
-1
0

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Korelace v grafech I.
Y
X
Y
X
Vztahy velmi často implikují funkční vztah mezi Y a X.
Y = a + b . X
Y = a + b1 . X1 + b2 . X2 + b3 . X3
Y = a + b1 . X1 + b2 . X2
Y = a + b1 . X1 + b2 . X2 + b3 . X1 . X2

logo-IBA logomuni
Vytvořil Institut biostatistiky a analýz, Masarykova univerzita
J. Jarkovský, L. Dušek
Korelace v grafech II.
Problém rozložení hodnot
Problém typu modelu
X
Y
X
r = 0,981
(p < 0,001)
r = 0,761
(p < 0,032)
Y
Problém velikosti vzorku
Y
X
Y
X
r = 0,891
(p < 0,214)
r = 0,212
(p < 0,008)