Přednáška VIII. Testování hypotéz o kvantitativních proměnných
3 Úvodní poznámky ^ Testy o parametrech 1 rozdělení ^ Testy o parametrech 2 rozdělení ^ Permutační testy
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ
Opakování - hypotézy
Co jsou to hypotézy a jak je stanovujeme'
Nulová hypotéza Alternativní hypotéza
mu jť"m\
Tomáš Pavlík      JU— | IUI | Biostatistika IBA 'vij?,/
Opakování - co se při rozhodování může stát
Popište možné výsledky testování hypotéz a uveďte, jak označujeme jejich pravděpodobnosti.
Rozhodnutí	Skutečnost	
	H0 platí	H0 neplatí
H0 nezamítneme	A	B
H0 zamítneme	C	D
Tomáš Pavlík
Biostatistika
Opakování - z-test pro jeden výběr
u; Při populačním epidemiologickém průzkumu se zjistilo, že průměrný objem prostaty u mužů je 32,73 m\((SD~=~18,l^Tmj}) Na hladině významnosti testu a = 0,05 chceme ověřit, jestli se muži nad 70 let liší od celé populace. Máme náhodný výběr o velikosti n = 100 a výběrový průměr 36,60 ml.
Chceme ověřit platnost     H0: jU = 32,73     proti      Hl: ju^ 32,73
■* Platí-li H0, pak X ~ N(p = 32,73^^8^)) (předpokládáme, že známe o)
* Z CLV víme, že by mělo platit:   X^ ~ #(0,1)
Pokud tedy výběrový průměr patří do rozdělení 7V(// = 32,73,^ = 1,812) neměla by jeho hodnota být vzhledem k tomuto rozdělení nijak extrémní.
Tomáš Pavlík
Biostatistika
1. Úvodní poznámky
Spojité x diskrétní náhodné veličiny
■* Budeme se zabývat hodnocením spojitých náhodných veličin (mohou nabývat jakýchkoliv hodnot v určitém rozmezí).
Příklady: výška, váha, vzdálenost, čas, teplota.
Uvedené testy lze ale použít i pro hodnocení diskrétních náhodných veličin -ale musí to být odůvodnitelné (např. velký počet možných hodnot).
* Příklady: počet krevních buněk, počet hospitalizací, počet krvácivých epizod za rok.
Tomáš Pavlík
Biostatistika
Parametrické a neparametrické testy
Parametrické testy - zabývají se testováním tvrzení o neznámých parametrech rozdělení pravděpodobnosti, kterým se řídí uvažovaná náhodná veličina . Vyžadují různé předpoklady, minimálně specifikaci rozdělení.
Neparametrické testy-tyto procedury jsou nezávislé (nebo téměř nezávislé) na konkrétním rozdělení pravděpodobnosti náhodné veličiny. Vyžadují méně předpokladů - např. symetrii rozdělení. Na druhou stranu mají menší sílu („no free lunch").
Testování v případě chybně určeného rozdělení pravděpodobnosti testové statistiky může vést k mylným závěrům z důvodu nerelevantní p-hodnoty, respektive p-hodnoty stanovené chybnou úvahou.
Tomáš Pavlík
Biostatistika
Postup při statistickém testování
1. Formulujeme nulovou hypotézu H0.
2. Formulujeme alternativní hypotézu Hr Alternativní hypotéza u parametrických testů může být oboustranná nebo jednostranná.
3. Zvolíme testovou statistiku jako kritérium pro rozhodnutí o nulové hypotéze (statistiku volíme tak, abychom byli schopni odvodit rozdělení pravděpodobnosti této statistiky při platnosti nulové hypotézy).
4. Hodnotu testové statistiky vypočítáme na základě pozorovaných hodnot:
5. Na základě rozdělení testové statistiky určíme kritický obor (obor hodnot, kdy zamítáme H0).
6. Zjistíme, zda hodnota testové statistiky leží v oboru kritických hodnot:
pokud ano, zamítáme nulovou hypotézu, pokud ne, nezamítáme nulovou hypotézu. Alternativně můžeme zjistit p-hodnotu výsledku.
Tomáš Pavlík
Biostatistika
2. Testy o parametrech 1 rozdělení
O co jde?
■* Chceme srovnat sledovanou charakteristiku náhodné veličiny s předem danou hodnotou (konstantou, předpokladem).
* Test o průměru při známém rozptylu-z-test •*Test o průměru při neznámém rozptylu - f-test
Neparametrický test pro 1 výběr - Wilcoxonův test •^Test o rozdílu párových (závislých) pozorování - párový f-test
* Test o rozptylu normálního rozdělení
; Spolu s výsledkem testu by měly být reportovány i intervaly spolehlivosti pro sledovanou charakteristiku (průměr/rozptyl).
Tomáš Pavlík
Biostatistika
Test o průměru při známém rozptylu -z-test
Předpokládáme realizaci náhodného výběru o rozsahu n: xv x2,..., xn.
; Předpokládáme normalitu dat:Xj ~ N{ju,g2) - velmi silný předpoklad
(silnější než CLV, neřeší totiž n jdoucí do nekonečna).
H q '. ju = jlíq Hy \ ju ^ jlíq Hy '. ju > juq Hy \ ju < ju0
" Testujeme, zda data náhodného výběru pochází z rozdělení se stejnou střední hodnotou jako je předpokládaná hodnota )U0 (konstanta).
Předpokládáme, že známe parametr o.
■i Víme, že za platnosti H0 platí: X ~ N(/uQ,aYn) + Testová statistika:  z = X^ ~ N'(0,1)
Tomáš Pavlík
Biostatistika
Test o průměru při známém rozptylu -z-test
* Nulovou hypotézu zamítáme na hladině významnosti a, když výsledná hodnota Z statistiky je větší (nebo menší) než kritická hodnota (příslušný kvantil) rozdělení N[0,1).
„Větší nebo menší" závisí na předem zvolené alternativě.
^Alternativa Hl: ju^ jU0 Zamítáme HQ když | z | > zx_al2
i- Alternativa Hl:ju>ju0 ■ Zamítáme H0 když z > zh
a
* Alternativa Hl\ju< ju0 Zamítáme H0 když Z < z
'0,005
L0,025
= -1,96
'0,050
Tomáš Pavlík
/BA ^
1
Test o průměru při neznámém rozptylu - ř-test
Předpokládáme realizaci náhodného výběru o rozsahu n: xv x2,..., xn.
; Předpokládáme normalitu dat: Xí ~ N(jU, a) - velmi silný předpoklad
(silnější než CLV, neřeší totiž n jdoucí do nekonečna).
H q '. ju = jlíq Hy \ ju ^ jlíq Hy '. ju > juq Hy \ ju < ju0
" Testujeme, zda data náhodného výběru pochází z rozdělení se stejnou střední hodnotou jako je předpokládaná hodnota )U0 (konstanta).
* Neznáme hodnotu parametru o - musíme ho odhadnout pomocí výběrové směrodatné odchylky (s).
- Víme, že za platnosti H0 platí: X ~ N(ju^2/n) Z =        ~ N(0,1)
* Dále využijeme statistiku K:    K = ("'/^s2 ~ j2(«-l)
i-; Testová statistika: 7 y - u
T =  . =^-p- ~t(n-l)
K/(n-\) s/4ň
Tomáš Pavlík      iaX i IM) i Biostatistika * BA \í,„a ^
Test o průměru při neznámém rozptylu - ŕ-test
^ Nulovou hypotézu zamítáme na hladině významnosti a, když výsledná hodnota 7 statistiky je větší (nebo menší) než kritická hodnota (příslušný kvantil) rozdělení t(n -1).
„Větší nebo menší" závisí na předem zvolené alternativě.
'; Alternativa Hx\ ju^ ju0 ' ■ Zamítáme HQ když \T >t\
-a/2
' Alternativa Hl: ju> ju0 ■* Za m ítá m e H0 když T > t^~l)
•^Alternativa Hx\ju<ju0 ■ Zamítáme H0 když T <t(an~l)
Tomáš Pavlík
IBA \^
Kvantily t rozdělení závisí kromě a i na velikosti vzorku (n-1).
(Ml *
Příklad - ř-test pro jeden výběr
- Chceme srovnat průměrný energetický příjem skupiny 11 žen ve věku 22 -30 let s doporučenou hodnotou (7725 kJ). Průměrný energetický příjem skupiny žen byl 6753,6 kJ se směrodatnou odchylkou s = 1142,1 kJ.
" Přibližná normalita dat byla ověřena graficky
- Nulovou a alternativní hypotézu vyjádříme jako:
1; Testová statistika:    T = (X - ju0) /(s IVn) ~ t(n -1)
-Její realizace:        t = (6753,6- 7725) /(l 142,1 / Vil) = -2,821
1; Absolutní hodnotu f srovnáme s kvantilem f rozdělení s 10 stupni volnosti.
o
o
t
= 2,821 > 2,228 = t{
.10
0,975
= /
l-a/2
^    Zamítáme H,
o
Tomáš Pavlík
imi Biostatistika
Příklad - interpretace výsledku
t1 - 2,821 > 2,228 -ŕj°   -1"_*/2
Zamítáme Hr
i; Na hladině významnosti a = 0,05 můžeme říci, že sledovaná skupina žen měla statisticky významně nižší energetický příjem než je doporučená denní hodnota 7725 kJ.
Tomáš Pavlík
Biostatistika
Neparametrický test pro 1 výběr - Wilcoxonův test
Předpokládáme realizaci náhodného výběru o rozsahu n: xv x2,..., xn. Předpokládáme symetrii dat (daleko slabší předpoklad než normalita dat) -> nulová hypotéza se týká mediánu
Princip Wilcoxonova testu je takový, že spočítáme diference xv x2,..., xn od x0 a podíváme se, jestli je zhruba Ví diferencí kladných a Ví záporných.
-^To je ekvivalentní s tím, že zhruba polovina hodnot x1,x2,... ,xnje menších než x0 a polovina hodnot xv x2,..., xn je větších než x0.
^Spočítáme diference (nulové vyhodíme): y. = jt - jt0
Diference seřadíme podle velikosti absolutních hodnot: | y(l) \ < \ y(2) | <... < | y(n)
mu
Tomáš Pavlík      irK        ^ Biostatistika
Neparametrický test pro 1 výběr - Wilcoxonův test
■*Spočítáme diference (nulové vyhodíme):
y i = *i - x,
o
Diference seřadíme podle velikosti absolutních hodnot: | y{l) \ < \ y{2) I < • • • < I }>( Jako /?, označíme pořadí diference y,.
Testovací statistika: min(S+,S~)
•*Pro malá n (cca do 30) lze kritickou hodnotu pro statistiku min(5+,5~) odpovídající zvolenému a najít v tabulkách - je-li výsledná hodnota min(5+,5~) menší nebo rovna kritické hodnotě, zamítáme HQ.
•*Pro větší/? lze rozdělení testové statistiky min(5+,5~) aproximovat normálním rozdělením s parametry: E(min(S+ ,S~)) = «(« + !)/4
kde
Tomáš Pavlík
Příklad - Wilcoxonův test pro jeden výběr
- Chceme srovnat průměrný energetický příjem skupiny 11 žen ve věku 22 -30 let s doporučenou hodnotou (7725 kJ).
Nulovou a alternativní hypotézu vyjádříme jako:   H0:
Žena	Denní energetický příjem v kJ	Diference od hodnoty 7725 kJ	Pořadí absolutní hodnoty diference
1	5260	-2465	11
2	5470	-2255	10
3	5640	-2085	
4	6180	-1545	8
5	6390	-1335	>
6	6515	-1210	6
7	6805	-920	4
8	7515	-210	1,5
9	7515	-210	1,5
10	8230	505	3
	8770	1045	
Tomáš Pavlík
Biostatistika
Příklad - Wilcoxonův test pro jeden výběr
* Výpočet testové statistiky: S+ =        = 8 a S~ =      , = 58
min(S+,S~) = 8
Kritická hodnota z tabulek pro n = 11: = wu(0,05) = 10
■i Výsledná hodnota statistiky min(S+,S~) je menší než 10: '      ^    Zamítáme H0
Tomáš Pavlík
Biostatistika
Poznámka
Parametrické a neparametrické testy nemusí vycházet stejně. Důvody:
1. Nesplněné předpoklady parametrického testu.
2. Malá síla neparametrického testu.
■*Je-li však dobře specifikován pravděpodobnostní model a je-li dostatek dat, bude to vycházet stejně.
^Měli bychom preferovat parametrické testy, ALE pouze po důkladném ověření jejich předpokladů!
Tomáš Pavlík
Biostatistika
Párový t-test
Předpokládáme realizaci dvourozměrného náhodného vektoru o rozsahu n:
x2
^2 y
(máme dvojice hodnot, které patří k sobě)
Předpokládáme dvourozměrné normální rozdělení: Nulovou a alternativní hypotézu vyjádříme jako:
U J
^2 y
v
i
Párový problém převedeme na případ jednoho výběru - nebudeme počítat s dvojicemi hodnot, ale s rozdíly: ^ = jt,. -_y.
Následně testujeme, zda je průměr hodnot cfl7 cf2/..., c(n různý od předpokládané hodnoty cf0.
Tomáš Pavlík
Biostatistika
Párový ŕ-test
Dále postupujeme jako při f-testu projeden výběr. Testová statistika má tvar:
T = ^^~t{n-\)
sdNn
Nulovou hypotézu zamítáme na hladině významnosti a, když výsledná hodnota T statistiky je větší (nebo menší) než kritická hodnota (příslušný kvantil) rozdělení t(n -1).
Alternativa Hl: jjlx- ju2^ d0  ^H-t Hx: jud * dQ
»7-1)
-a 12
Zamítáme H0 když \T\> t[n
Alternativa H1: //: - ju2 > d0 Hl: jud > d0
Zamítáme H0 když T > t{"^
Alternativa h1: jáx - ju2 < dQ hl:jud< d0
Zamítáme HQ když T < t^~]
Tomáš Pavlík      JUL_||^Jj Biostatistika
Příklad - párový ř-test
■i Wiebe a Bortolotti (2002) zkoumali žluté zbarvení ocasního peří datlů zlatých.
Všimli si, že někteří ptáci mají jedno ocasní pero jinak zbarvené než ta ostatní -> chtěli vědět, jestli je odchylka ve žlutém zbarvení statisticky významná.
Měřenou veličinou byl yellowness index („index žlutosti")
Pták	Index pro typické pero	Index pro atypické pero	Rozdíl (c/)
A	-0.255	-0.324	0.069
B	-0.213	-0.185	-0.028
c	-0.19	-0.299	0.109
D	-0.185	-0.144	-0.041
E	-0.045	-0.027	-0.018
F	-0.025	-0.039	0.014
G	-0.015	-0.264	0.249
H	0.003	-0.077	0.080
1	0.015	-0.017	0.032
J	0.020	-0.169	0.189
K	0.023	-0.096	0.119
L	0.040	-0.330	0.370
M	0.040	-0.346	0.386
N	0.050	-0.191	0.241
0	0.055	-0.128	0.183
P	0.058	-0.182	0.240
Tomáš Pavlík
Biostatistika
Příklad - párový f-test
Pracovní hypotéza: „Je odchylka ve žlutém zbarvení statisticky významná?". Nulová hypotéza a alternativa:        H0\ju = 0 Hl:Ju>0 Za platnosti H0 předpokládáme: d ~ jv(0,ct%) Vypočtené statistiky: d = 0,137 a s3 =0,135
. .. d-dn 0,137-0
Testová statistika: t =-A = —      ^ = 4,06
sl-Jn    0,135/ 16
Absolutní hodnotu f srovnáme s kvantilem f rozdělení s 15 stupni volnosti.
11 = 4,06 > 1,75 = ŕ0595 = t"_* Zamítáme H0
Tomáš Pavlík
Biostatistika
3. Testy o parametrech 2 rozdělení
Testy pro dva výběry
* Chceme srovnat sledovanou charakteristiku náhodné veličiny ve dvou nezávislých skupinách.
Test o rozdílu průměru dvou nezávislých výběrů - f-test pro dva výběry (při stejných rozptylech)
^Test o shodnosti rozptylů dvou nezávislých výběrů - F-test
Welchova korekce pro f-test při nestejných rozptylech
1 ■ Neparametrický test pro 2 výběry - Mann-Whitneyho test
; Spolu s výsledkem testu by měly být reportovány i intervaly spolehlivosti pro pozorované rozdíly v průměrech/mediánech či podíl rozptylů.
Tomáš Pavlík
Biostatistika
7-test pro dva výběry při stejných rozptylech
" Máme realizaci 1. náhodného výběru o rozsahu n{. xv x2,..., x  a na ní nezávislou realizaci 2. náhodného výběru o rozsahu n2: yv y2,..., yn .
... a stejný rozptyl (i když neznámý)    Yt ~ N(ju2,cr2)
Testujeme, zda náhodné výběry pochází z rozdělení se středními hodnotami, které se liší o předpokládanou hodnotu c (konstanta).
H0:fdx-ju2= c     Hl\jul-ju2^c     Hl:jul-ju2 <c     Hl:jul-ju2>c
* Neznáme hodnotu parametru o2, ale předpokládáme, že je stejný pro oba výběry - parametr musíme odhadnout pomocí váženého průměru odhadů
Předpokládáme normalitu dat:
rozptylu v jednotlivých výběrech:
(nx - \)sl + (n2 - \)s22 nY + n2-2
Tomáš Pavlík
imi Biostatistika
7"-test pro dva výběry při stejných rozptylech
■* Víme, že za platnosti H0 platí: X - Y ~ N(c, a1    + ^))
„Větší nebo menší" závisí na předem zvolené alternativě. ■Alternativa  Hl\nx-ju2*c
* Za m ítá me H0 když \T\> t^Jf 1 • Alternativa Hl:{i1-fi2>c
< • Zamítáme H0 když 7 > &+"2_2) '• Alternativa Hl:{i1-fi2<c
- Zamítáme tf0 když 7 < ^1+?72"2)
Testová statistika: T =
X-Y-c
Tomáš Pavlík
Příklad - ř-test pro dva výběry
1 ■ Máme pacienty se špatně kontrolovanou hypertenzí - sledujeme účinek ACE inhibitoru (ACE-I) a antagonisty pro angiotensin II receptor (ANA) na snížení diastolického tlaku (TKd) těchto pacientů po 6 měsících od zahájení léčby
■i Nulová a alternativní hypotéza:   H0: jul- ju2 =0       Hl: jux- ju2^0 i-; Nulová hypotéza vyjadřuje stejný účinek obou léků na snížení TKd.
*Pacienti léčení ACE-I:   nx = 1926      x = 12,7mmHg      sx = 9,96mmHg Pacienti léčení AHA:    n2 =1887      y = 12,8 mmHg      s2 =9,79 mmHg
-Vážený odhad parametru <* ,,2 = = ^g*™™1* = 97,54
s, = 9,88
mu
Tomáš Pavlík      irK ilMJ ^ Biostatistika IBA X,, ^
Příklad - ř-test pro dva výběry
Víme, že za platnosti H0 platí: X - Y ~ 7V(0, a2(j^ě +
. .,          x-j-c 12,7-12,8-0 ' Testová statistika: t = - —j= = =--; - = -U,J 1
*^ «!  1 «2       ^j""^/ 1926 1 1887
^Absolutní hodnotu t srovnáme s kvantilem f rozdělení s 3811 stupni volnosti (zde již klidně můžeme použít kvantil rozdělení A/(0,1)).
11 = 0,31 < 1,96 = z0 975 = zx   n Nezamítáme H0
* Na hladině významnosti a = 0,05 nelze prokázat rozdíl mezi ACE-I a AHA ve snížení diastolického tlaku u pacientů se špatně kontrolovanou hypertenzí.
Tomáš Pavlík
Biostatistika
Předpoklady t-testu pro dva výběry
* Normalita pozorovaných hodnot obou náhodných výběrů - velmi silný předpoklad.
Nutno otestovat nebo alespoň graficky ověřit (histogram, box plot).
"^Stejný rozptyl náhodné veličiny v obou srovnávaných skupinách - také silný předpoklad.
* Opět nutno otestovat nebo alespoň graficky ověřit (histogram, box plot).
Tomáš Pavlík
Biostatistika
Ověření předpokladu o stejných rozptylech - F-test
" Máme realizaci 1. náhodného výběru o rozsahu n{. xv x2,..., x  a na ní nezávislou realizaci 2. náhodného výběru o rozsahu n2: yv y2,..., y^-
Předpokládáme normalitu dat:        Xj ~ N{fil9(Jl )
(střední hodnoty neznáme) Yt ~ N(ju2,<j22)
* Testujeme, zda náhodné výběry pochází z rozdělení se stejným rozptylem.
2
i-; Testová statistika:    f =
1; Za platnosti H0 má F statistika Fisherovo rozdělení se stupni volnosti (n1 - 1) a(/?2-l).
Tomáš Pavlík
Biostatistika
Ověření předpokladu o stejných rozptylech - F-test
^Víme, že za platnosti H0 platí: f ~ f(nx -l,w2 -1) •^Hodnotu F statistiky tedy srovnáváme s kvantily f^2~l,n2~l) a
,; „Větší nebo menší" závisí na předem zvolené alternativě. ' ■ Alternativa hl: of * g\
* Zamítáme H0 když f < f^"2^ nebo f > f^j^ '; Alternativa hl: o\ > g\
* Zamítáme H0 když f > f&1*2~1) ' ■ Alternativa hl: o\ < o\
* Zamítáme H0 když f < f£ni~l,rt2~l)
Tomáš Pavlík
Biostatistika
Příklad - F-test
'; Máme dvě skupiny dětí s hypotyreózou: první skupina jsou děti s mírnými symptomy, druhá skupina jsou děti s výraznými symptomy.
Chceme srovnat hladinu tyroxinu v séru.
Můžeme si dovolit použít f-test pro dva výběry?
h0: g\ = cj\
Hladina tyroxinu v séru (nmol/l)	Mírné symptomy K = 9)	Výrazné symptomy (n2 = 7)
	34	5
	45	8
	49	18
	55	24
	58	60
	59	84
	60	96
	62	
	86	
Průměr	56,4	42,1
SD	14,22	37,48
mu
Tomáš Pavlík lIMl ^ Biostatistika
* BA ^
Příklad - F-test
Hladina tyroxinu v séru (nmol/l)	Mírné symptomy ("i = 9)	Výrazné symptomy (n2 = 7)
Průměr	56,4	42,1
SD	14,22	37,48
; Testová statistika:
F = 4 = í14^24 = 0,144 s\ (37,48)2
i-; Hodnotu F srovnáme s a kvantilem F rozdělení s 8 a 6 stupni volnosti.
F = 0,144 < 0,279 = f0(80f = F^'1^ Zamítáme H0
*      mm *
Tomáš Pavlík ll^Jj Biostatistika
Stejné rozptyly?
Myslíte si, že jsou stejné rozptyly obou souborů v praxi časté? Pokud ne, zkuste vymyslet příklad...
Tomáš Pavlík
Biostatistika
Welchova korekce pro nestejné rozptyly
* Welch (1937) navrhl korekci pro výpočet T statistiky se zohledněním nestejných rozptylů.
- ■ Víme, že za platnosti H0 platí: X - 7 ~ N(c, °^ + ^)
X — Y — c
■» Testová statistika: T =   , ~ t (v)
V »1 n2
Počet stupňů volnosti NENÍ roven ale třeba ho stanovit následovně:
Kritické hodnoty pro zamítnutí H0 lze odvodit stejně, jako v případě f-testu pro dva výběry se stejným rozptylem.
v =
[(s'/ni) + (s22/n2)ý (s21nxf + {s221n2ý
nx-\
«2-l
Tomáš Pavlík
Biostatistika
Neparametrický test pro 2 výběry - Mann-Whitneyho test
1 ■ Máme realizaci 1. náhodného výběru o rozsahu n{. xv x2,..., x  a na ní nezávislou realizaci 2. náhodného výběru o rozsahu n2: yv y2,..., y^-
X, ~ F(x) Y, - F(y)
Předpokládáme stejné rozdělení dat v obou souborech (slabší předpoklad než normalita dat) -> nulová hypotéza se týká distribučních funkcí.
h0: F(x) = F(y)      hx: F(x) * F(y)
* Pointa Mann-Whitneyho testu: pokud x, a y- pochází ze stejného rozdělení, pak by pravděpodobnost P(x] > y-) měla být zhruba 50 %.
•^To je ekvivalentní tomu, že při srovnání všech dvojic x, a y- bude v případě cca 50 % dvojic menší x, a naopak.
Tomáš Pavlík
Biostatistika
Neparametrický test pro 2 výběry - Mann-Whitneyho test
1 ■ Pro výpočet nejprve seřadíme všechna pozorování podle velikosti (jako by byly z jednoho vzorku) a přiřadíme jednotlivým hodnotám jejich pořadí.
i-; Statistikou T1 označíme součet poradiv 1. skupině.
* Testové statistiky: U = nxn2 + n^+V}   Tx       U'= nxn2 - U
Větší z hodnot U a W následně srovnáme s kritickou hodnotou z tabulek (v případě oboustranného testu). Je-li kritická hodnota menší, H0 zamítáme. Pro jednostranný test uvažujeme dle nulové hypotézy pouze buď statistiku L/nebo U'.
Pro vzorky s n1 > 10 a n2 > 10 lze rozdělení statistiky U aproximovat normálním rozdělením s charakteristikami: E{U) = nxn2/2
D(U) = nxn2(nx + n2 +1)/12
mu
Tomáš Pavlík      irK        ^ Biostatistika IBA X,, ^
Příklad - Mann-Whitneyho test
'; Máme dvě skupiny dětí s hypotyreózou: první skupina jsou děti s mírnými symptomy, druhá skupina jsou děti s výraznými symptomy.
,; Chceme srovnat hladinu tyroxinu v séru (f-test pro dva výběry není vhodný)
h0: F(x) = F(y))     hx: F(x) * F(y)
Hladina tyroxinu v séru (nmol/l)	Mírné symptomy K = 9)	Výrazné symptomy (n2 = 7)
	34	5
	45	8
	49	18
	55	24
	58	60
	59	84
	60	96
	62	
	86	
Průměr	56,4	42,1
SD	14,22	37,48
Tomáš Pavlík
Biostatistika
Příklad - Mann-Whitneyho test
i-; Seřadíme všechna pozorování podle velikosti a přiřadíme jednotlivým hodnotám jejich pořadí. Součet pořadí v 1. skupině: T1 = 84,5.
Skupina n1 = 9	Skupina n2 = 7	Pořadí
	5	1
	8	2
	18	3
	24	4
34		5
45		6
49		
55		8
58		9
59		10
	60	11,5
60		11,5
62		13
	84	14
86		15
	96	16
U = 9 * 7 + 9(9 + ^ - 84,5 = 63 + 45 - 84,5 = 23,5 2
£7 = 9*7-23,5 = 39,5
*max(l/,ir) = 39,5.
•^Srovnáme s kritickou hodnotou z tabulek (pozor na správné tabulky):
— TTÍ9>7) -TT(nuni) ~ U a(\/2)
m3x(U,U') = 39,5<51 = U
0,05(2)
Nezamítáme H0
Tomáš Pavlík
Biostatistika
Příklad - Mann-Whitneyho test
Zdá se vám ten výsledek správný? Pokud ne, čemu to lze přisoudit?
Tomáš Pavlík
Biostatistika
4. Permutační testy
Princip permutačních testů
Permutační testy jsou neparametrickými testy, ale místo pořadí pracují s pozorovanými hodnotami.
Principem permutačního testování je srovnání pozorované testové statistiky s testovými statistikami, které by bylo možno teoreticky získat ze stejného datového souboru, když by přiřazení jednotlivých pozorovaných hodnot do sledovaných skupin bylo náhodné.
Permutační test je tedy založen na výpočtu všech možných hodnot testové statistiky, které lze získat opakovaným přeskupením původního souboru dat tak, že v rámci každého opakování zůstane zachován jak celkový počet pozorování (celkové n), tak počet pozorování náležících do jednotlivých skupin (např. n1 a n2).
Tomáš Pavlík
Biostatistika
Výpočet permutačních testů
■* Výslednou p-hodnotu pak odhadneme jako podíl počtu testových statistik, které byly v absolutní hodnotě větší než původní pozorovaná testová statistika (tedy představují extrémnější výsledky experimentu), k celkovému počtu provedených permutací.
*Tedy odhad p-hodnoty lze vyjádřit následovně:
#t :t >t
m
P
M'
i = l
M
M
* Permutační testy jsou velmi oblíbené v hodnocení genomických a proteomických dat.
Tomáš Pavlík
imi Biostatistika
Příklad - permutační test pro dva výběry
Srovnání hmotnosti dvou skupin pacientů.
n, = 7     xA= 74,5 kg     sA = 9,49 kg
«2=8     xB = 87,1 kg     sB = 6,95 kg
H0: juY- ju2= c     Hl\ jul- ju2^ c
- Pro permutační test použijeme T statistiku pro dva výběry.
1 * Zvolíme hladinu významnosti testu: a = 0,05.
* Pro nr - 7 a n2 = 8 je možnost provést celkem 6435 jedinečných permutací.
Kategorie pacienta	Hmotnost pacienta (kg)
A	91,5
A	79,8
A	66,2
A	70,7
A	63,4
A	77,7
A	71,9
B	83,9
B	92,2
B	85,4
B	99,2
B	77,5
B	80,8
B	91,6
B	86,2
Tomáš Pavlík
IBA
mu     v" ""'V
m
Biostatistika
Příklad - permutační test pro dva výběry
Kategorie pacienta	Hmotnost pacienta (kg)	1	2	Pořadí permutace 3	6435
A	91,5	A	B	B	B
A	79,8	B	B	B	B
A	66,2	A	A	A	A
A	70,7	A	B	A	B
A	63,4	B	B	A	A
A	77,7	B	B	B	A
A	71,9	B	A	A	B
B	83,9	A	B	A	A
B	92,2	B	B	A	A
B	85,4	A	A	B	A
B	99,2	A	A	B	A
B	77,5	A	A	A	B
B	80,8	B	A	B	B
B	91,6	B	B	B	B
B	86,2	B	A	B	B
Testová statistika	2,900	0,429	0,341	3,106	0,798
Tomáš Pavlík
Biostatistika
Příklad - permutační test pro dva výběry
■*Srovnání hmotnosti dvou skupin pacientů: A a B. Pro výpočet p-hodnoty permutačního testu je potřeba následující:
1. Hodnota původní testové statistiky: t = 2,900
2. Celkový počet provedených permutací: M = 6435
3. Počet permutací, kdy je absolutní hodnota testové statistiky tu / = 1, M, větší nebo rovna původní testové statistice f = 2,900. Zde je m = 59.
- Pak p-hodnotu můžeme odhadnout následovně:
m 59
0,009
P
M 6435
Výsledná p-hodnota je menší než zvolená hladina významnosti testu a = 0,05.
Zamítáme H,
o
Tomáš Pavlík
imi Biostatistika
Permutační test pro dva výběry
Interpretace výsledné p-hodnoty je zde stejná jako pro klasický f-test.
* Velkou výhodou permutačního testování je fakt, že jej lze použít pro jakoukoliv testovou statistiku.
■* Klíčovým předpokladem je zaměnitelnosti pozorovaných hodnot v obou srovnávaných skupinách - oba soubory by neměly mít výrazně odlišnou variabilitu (proto bychom neměli permutační test použít na příklad s hypotyreózou).
Při malém n (cca 10 - 20) je poměrně malý také počet dostupných permutací, což může vést k nepřesnému odhadu p-hodnoty.
""^ Při 1000 permutacích je nejmenší dosažitelná p-hodnota 0,001,100 000 permutací umožňuje dosáhnout p-hodnoty až 0,00001.
Tomáš Pavlík
Biostatistika
Poděkování...
Rozvoj studijního oboru „Matematická biologie'' PřF MU Brno je finančně podporován prostředky projektu ESF č. CZ.1.07/2.2.00/07.0318 „Víceoborová inovace studia Matematické biologie" a státním rozpočtem České republiky
18f k BH pnSt  t^í čími
^^^^fc I    soclalnL      ^^^^^^^ MINISTERSTVO ŠKOLSTVÍ. OP Vzdělávání 'J-^iJr^
^0 M   fondvCR EVROPSKÁ UNIE     mládeže a tělovýchovy     pro konkurenceschopnost        4ííA p*"
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ
Tomáš Pavlík
Biostatistika