-35- KAPITOLA 3. Testy hypotézy o shodnosti dvou populaci V této kapitole budeme uvažovat problém srovnání dvou populací s distribučními funkcemi K a U na základě dřou nezávislých náhodných výběrů, X1>...,Xm z první populace a I,,... • ..,Y z druhé populace« Experimentální pozadí problému se diskutovalo v příkladu 2 kapitoly 1. V celé kapitole budeme uvažovat základní hypotézu H :F=G. Chceme-li nalézt vhodné testy této hypotézy, nemůžeme uvažovat hypotézu samostatně, ale vždy jen ve spojení a příslušnou alternativou- Volba testu pak úzce závisí na příslušné alternativě a volba alternativy závisí na tom, co chceme a můžeme o rozděleních F a G předpokládat. Jednotlivé části této kapitoly budou věnovány jednotlivým alternativám; budeme podle možnosti postupovat od speciálnějších Cužších) k obecnějším (širším) alternativám. Během celé kapitoly budeme předpokládat, že F a G jsou absolutně spojité s hustotami f a g. 3«1. Dvouvýběrový t-test Nechí F a G jsou distribuční funkce normálního rozdělení K(ř,a2) a N(^,a2), kde f ,V a o2 jsou neznámé. Uvažujme hypotézu HQ , kterou lze v tomto případě psát ve tvaru <3.D H0 : ( = V -3-6- proti tzv. .jednostranné alternative Kx : í < V . Jak je znáno ze základního kursu matematické statistiky, v tomto případě existuje stejnoměrně nejsilnější nestranný AÍ-test Ho proti K, a je jím dvouvýběrový t-test s kritickou funkcí i 1 ... t(£,Y) * C — t(x,r) kde •<&!> .-JgkJ 2 (Y.-?)2 / (n-l) Je Z (X.-3)2 / (m-1) i=l x ' stliže platí a\ = a| , aé aíJ.J) rozdělení F o n-l a m-1 stupních volnosti. Konstanta C je pak určena vzta- hem kde F značí hustotu F-rozdělení. -38- 3.3. Permutačni t-test Chcené testovat hypotézu H proti alternativě (3.2) K3 : G(x) = F(x-A) ; X6R1 , A>0, a přitom máme podezřeni, že F je distribuční funkce normálního rozdělení, ale nejene si tím stoprocentně jisti. Je zřej mé, že taková situace se často vyskytuje. Kdybychom použili t-test a skutečné rozdělení by nebylo normální, byla by pravděpodobnost chyby I.druhu obecně odlišná od 06 , a tedy mohla by být i větaí než oC . Abychom stabilizovali velikost testu, je vhodné použít tzv. permutač-ního testu, který nyní odvodíme. Předpokládejme, že X^»..«,XL je náhodný výběr z rozdělení a hustotou f(x) a *!»•••»*n náhodný výběr z rozdělení s hustotou r(y-A) a předpokládejme, že hustota f je skoro všude spojitá, ale jinak neznámá. Označme systém váech takových hustot. Sdružená hustota náhodného vektoru (X1,...,Xffi, Y1,..., ...,1^) = (Z19...,ZK>), N=m+n, pak je (3.3) q^(z) » f(xj^) ... f(xB)f(y1-A) ... f(yQ-A). Chceme, aby použitý test 0 (z) byl nestranný (viz def. 1 kap.l); odtud plyne, že musí platit (3.4) j ...já» (»!,...,%> f(z1)...f(ajr)dz1 ... ôz^ *oC pro všecka f € $* • Následující věta dává jednoduchou charakteristiku testů, splňujících (3-4). -39- VČTA 1* Nechí W je systVflfsk.vš. spojitých hustot f . Nechí CZ* 't...tz'N') je vektor pořádkových statistik odpovídající Z^,...,!^. Pak (3.4) platí pro vš. ŕ £ správě tehdy, když 1 1 (rl> (lV C3.5) Ít I (DU x !•..,! fl ) = 06 platí s pravděpodobností 1, kde Ä> je množina všech permutací s čísel (1,...,N). Důkaz. Podle věty 2 kapitoly 1 je vektor Z*** pořádko- vých statistik úplnou postačující statistikou pro fi • Rosa?' lení náhodného vektoru Z podmíněné Z*-) = z**' je tedy z\ platnosti H0 stejné pro vš. t € 9* a tudíž i s£g> CjJ)/X*'" ; ■ »**J j« za H stejná pro vš. f £ 5^ a sk.vš. z(#* . Má-li platit (3.4), musí být i e[(Í(Z)/ Zí#) = b(*M =06 pro sk.vš. z(#) a ze tvaru podmíněného rozdělení Z při daném Z » z ^ (viz(2.4)) vyplývá ^=e[^(^)|z{') = z(^=^r £^(»ÍPl ,..., Testy splňující (3.5) se nazývají permutační testy. Stanovme sílu permutaOního testu (Ď nejprve proti jednoduché alternativě, že sdružená hustota vektoru Z je rovna q^». • .Mz«). Dostaneme ... dzu - J..Jf(z)q(z;dz:L ...a% = ^ J—/J fcMjW» C3.6) =2 j ...J .„«.« , kde q je hustota (Z^ ,...,Z>*') příslušné hustotě q vektoru (Z^...^) (viz kap.2, věta 2). Mó-li test maximalizovat silofunkci (3*6) za podmínky, že splňuje (3.5) pro sk.vš. -41- nabývé velkých hodnot; nejsilnější test mé tedy testovou funkci (3.9) ,>'>■/; (r, ) (rM) r , 1 .,. q(z x ,...,z " )>C(z^,;) r (r,) (r„) I (p.) (p„) , , £)C* ,•••#■ )*'(?*' -.. q(z * ,...,z N)*C(zU}) (r,) (tn) , x v-0 ... q(z L ,...,z M ) 0. Uvidíme, že nejsilnější permutační test proti těmto alternativám nezávisí na Ms, a a A - Tento test je vhodný zvláště tehdy, když Dr,edpokládéme, Že náhodné výběry pocházejí z normálního rozdělení, ale nejsme si tím zcela jisti; použitím permutaoního testu máme zaručeno, že velikost nepřekročí předepsané cC při žádné alternativě tvaru (3*3). Při normální hustotě f nabývá alternativa (3.3) tvaru (3.10) qU^^^) * « -42- ( 1 S z\ Protože faktor exp j-------j Z CZi~ ui) ) i*e*.ávisi na uspořádání (z-,.,.,2^), test (3.9) zamítá K ve prospěch alter- nativy G3.10), jestliže expU-2 z, >C(zL*'). tedy ti=m+l XJ 3.U)^(zlf...,zH) n íl , , 1 ... Z y. = 2 z->C '(z1 ') j=l J i=m+l x n N f . > ... £ y. = I z- » C'(z^*;) j=l J i=m+l x n N , , v O ... I y. = £ z- < C(z**>). 0=1 J ism+1 1 H Z hodnot , kterých testová statistika Z z- nabývá na množině i =m+lx N! permutací hodnot (z(1),... ,1^), je zřejmě jen (J) různých a stačí mezi sebou porovnat jen tyto různé hodnoty; N hypotézu H zamítneme pro k největších hodnot I z- i«m+l a s pravděpodobností V pro (k+l)-ní hodnotu, kde Shrneme postup, jak provádíme permutační test (3.11) proti alternativě 2 normálních výběrů lišíoích se posunutím: Ci) pozorujeme hodnoty (x^,.«.,*^, yi»-"»yn) ■ = (Z^, . • . >Zjj' » (ii) stanovíme k=0, celé a V , Q^>*< 1 tak, že k+^=o6(*). K Cr.) (iii) vypočteme hodnoty Z z. pro všecky permutace ß i=m+l „ r € %\ mezi těmito hodnotami je (" ) různých. Z těchto hodnot najdeme (( He+l)-ní podle velikosti. -43- n (iv) Zamítneme Hrt, jestliže Z y . je alespoň rovno této(( )-k+l)-ní hodnotě a zamítneme H s pravděpodobnosti n jj ľ, jestliže Z y. je rovno ((„HO- té hodnotě« j-1 J n Nakonec uvedeme jinou formu permutačního testu (3,11), která ukáže souvislost tohoto testu s klasickým t-testeau Vynásobíme-li nerovnost Z y.>GU(í)) i-1 ° T J Ix .a.* — _ 1 m n výrazem (jr + —) a odečteme — C Z x- + S v.), dostaneme m n m i=i x j=i J y - x > c'(zU))(i + i) - | Z zL = C* (zC-}) a další úpravou dostaneme jinou ekvivalentní nerovnost Í312)jr}^*nn-----------------------------U>C" (.1-)). (í Z Cx--i)2+ I Cyry)2]/ (m+n-2)f |.Li=l x j=l J J J Kritický obor permutačního testu má tedy tvar t-testu, ve kterém konstantní mez C0 je nahrazena náhodnou mezí C (z ) 3*4. Pořadové testy rozdílu v poloze <3vou populací Uvažujeme nejprve problém testu hypotézy H proti obecné alternativě (2*13) K4 : G(x) ^ F(x) pro vš. iÔB1, G f F, G,P spojité,jinak neznámé. tj» proti jednostranné alternativě, která tvrdí, že náhodná veličina s rozdělením G je stochasticky větěí než náhodné veličina s rozdělením F. -44- Problém testu H proti alternativě K. je invariantní vzhledem ke grupě Qr zobrazení tvaru z^ = f(zi), i=l,...,N kde f je libovolná spojitá rostoucí funkce * (z1,...,z»)= = (x,.....x , yi»***»^!!^' N= m+n. Z příkladu 1, část 4, kapitola 1 vyplývá, že maximální invariantou vzhledem ke G je vektor pořadí (R,,...,R„) náhodných veličin ^Zi»*"»^n^ = = (X^. • • •, X^, X^,.••,XQ). Protože problém testu H proti K. je invariantní vzhledem ke U- , bude vhodné omezit své úvahy na testy, které jsou také invariantní vzhledem ke (X .Z věty 2 kapitoly 1 víme, že každý invariantní test je funkcí maximální invarianty. V našem případě bude každý invariantní test funkcí pouze pořadí (R-, ,... ,R„), tedy bude pořadovým testem. Vzhledem k invarianci omezujeme tedy své úvahy na pořadové testy. Třídu testů však můžeme omezit ještě déle. Najde-me-li vhodné zobrazení vektoru (R^,...,Rjt), které je postačující statistikou pro (R,, •■•)R|j)za hypotézy i za alternativy, stačí hledat vhodný test mezi testy, závislými jen na této postačující statistice. Protože rozdělení náhodného vektoru (Rx> •*•»**£» Rm+1''*',RN^ **e svmetricicé v prvních m a posledních n proměnných při všech rozděleních F a G , vidíme, že postačující statistikou jsou pořadí K<~-rn) muze být roven všem kombinacím n-té třídy z Čísel 1,.«-,N; může tedy nabývat celkem (JJ) různých hodnot. Za platnosti H0 jsou všecky tyto hodnoty stejně pravděpodobné a kritický obor libovolného pořadového testu velikosti se skládá z právfi k bodů (s-,,.-, • •.,sn), kde 1 ^ 3^< ... 0. Kdybychom věděli, že rozdělení F je normální, použili bychom t-testu uvedeného v 3»1« Nyní zkonstruujeme jinou testovou statistiku tak, že dosadíme do výrazu pro t-statistiku t(£t%) místo hodnot xl»###»xm' rl»#"'Yn Příslušnó Pořadí R1»-"tRmi Rm+i»'**>RN Dostaneme výraz (3.14) (jp>^(1 jm+iRr i U±) [fcj j^Bi-SřJ "1/2 1 N kde S = 1.^1-Tento výraz lze dále zjednodušit: z toho, že (R,,...,R„) je -46- vlastně permutací (1,...,N), plynou jednoduché identity: m N N NÍN+1) N Z R, = Z B- - Z R; = rc^T1/ - z B- i=l * i=l 1 j=m+l j=n+Ti £ (R.-Ř)2 * ? U-W =í^6^. i=l .1=1 TS Využijeme-li těchto identit, vidíme, že statistika (3-14) je,až na lineární transformaci, ekvivalentní statistice (3.15) N W = Z R. , i=m+l která je rovna součtu pořadí druhého výběru. Příslušné testové funkce má tvar 3.16) ^(R-l»...^) 1 ... W > GÄ f ••• » = C«J + ^"P(W=C* ) = <£ . Test daný vztahy (3.15) a (3.16) se nazývá Y/ilcoxonův test. Patří do množiny invariantních testů, kterou jsme výše vymezili, tj. testů, závislých jen na uspořádaných pořadích druhého výběru. Později uvidíme, Že Wilcoxonův test je lokálně nejsilnějším pořadovým testem proti alternativám posunutí K-, kde F je distribuční f?inkce logistického rozdělení s hustotou -x f(x) (IV*)2 xäR1. -47- Vektor uspořádaných pořadí Rm+i>***íRM nabývá za H každé kombinace n prvků z čísel 1,...,N s pravděpodobností -jľ ' Při malých hodnotách N můžeme stanovit rozdělení praven' děpodobností W tak, že pro každou možnou hodnotu W = w stanovíme počet kombinací (řekněme k, ) k ní vedoucích: pak k ^ P(W=w/H ) = -S-. Odtud můžeme stanovit kritickou hodnotu C^ . ^n' Tento systematický způsob se však stává velmi pracný při větších Nan. Naštěstí existuje řada tabulek kritických hodnot Wilcoxonova testu (malou tabulku viz též na konci skript); dále napr. Likeš-Laga:Základní statistické tabulky,SNTL 1978. Rozdělení Wilcoxonovy statistiky bývá tabelovánojrůzným způsobem: bud jsou tabelovány přímo kritické hodnoty nebo distribuční funkce W„ za platnosti H pro různá man. Ôasto bývá tabelováno rozdělení statistiky ff m O, = Z Z u(£. - £•) ^ i-m+1 j=l * J kde u(t) * 1 pro t^O a uCt)=0 pro t< 0. Statistiky U^ a Wj. jsou ve vzájemném vztahu WK « % + | n(n+l). Pro výpočet Wilcoxonovy statistiky bývá vhodné její duální vyjádření: nechí Z '<^ . .. 4 - ESN " ESK - S» a důkaz dokončíme podobně jako v případě (a), n 3.4°2. Van der Waerdenův test Obecnou třídu testových statistik pro testování H proti K. : G(x) = F(x-A), A>0, tvoří statistiky tvaru o MP M (3-23) ^ =i=m+l h(R^) = i=l hl^T> Vi ' kde h je vhodné neklesající funkce definovaná na (0,1). Tato třída v sobě zahrnuje i Wilcoxonův test (h(t) = t, 0 oo je rozdělení S„ přibližně normální s parametry ESH, var S^. Podle věty 2 dostaneme ESH = O, var ífc = jjf^y jjtj) "X (^-)J ' . Z věty 3 dále plyne, že rozdělení van der »Vaerdenovy statistiky je symetrické kolem nuly« 3»4*3. Mediánový test Položíme-li ve (3-23) h(t) = O 1 2 0< t<£ t-i dostaneme testovou statistiku tzv. mediánového testu. Testová statistika má jednoduchou interpretaci: nechí M* je medián spojeného výběru xi»"->^m» ^,•••>£_• Mediánová statistika je rovna počtu pozorování 2.výběru, které leží nad /W , zvětš nó o j v případě, že N je liché. e- Jestliže N je sudé a N = 2 mé mediánová statistika za platnosti H hypergeometrické rozdělení pravděpodobností: (3.25) P(S3=k) = ••• max(o,n-M) ^ k * *= min; M,n) -.. jinak« Skutečně, vektor uspořádaných pořadí Há+i < • • • ^HjJ veličin Y-,,...,:rn nabývá (_) možných kombinací, všech se -53- stejnou pravděpodobností. Jestliže S^ = k, je k prvků příslušné kombinace větších než /Us a (n-k) prvků je menších než Ať -takových kombinací je cá\kem ^Hn-lc). Kritické hodnoty mediánového testu tedy můžeme získat z tabulek hypergeometrického roadělení (např. G.J.Lieberman, D.B.Owen (1961): "Tables of the Hypergeometric Probability Distribution"a D<,B.Owen:"Handbook of Statistical Tables" -ruský překlad 1966)• Pro »fn->oo má mediánová statistika $„ přibližně normální rozdělení s parametry To _ n _„ o _ 1 mn BSS-?' var % - 4 H=T" • Při velkých počtech pozorování tedy používáme kritických hodnot založených na normální aproximaci. Mediánový test používáme zvláště tehdy, má-li hustota' příslušná distribuční funkci F protáhlé konce, tj. jestliže lim+ f(x) = O, ale konvergence je mnohem pomalejší než u x* - oo normálního rozdělení. Např. pro Cauchyho rozdělení je mediánový test lepší než Wilcoxonův i van der Waerdenův test. 3.5. Pořadové testy.rozdílu v rozptýlenosti_dvou populasl Nechí Xt,...,3C je náhodný výběr z rozdělení se spojitou distribuční funkcí FCx-ä*) s I^,...,X náhodný výběr z rozdělení G(x-yW'), přičemž platí (3.26) K5 : GU-AC) s p(S^fe) pro Vš. xfiR1, a>l; chceme testovat hypotézu o parametru a t zatímco/^ je nezná- -54- mý (rušivý) parametr. Hypotéza HQ , že oba výběry pocházejí ze stejného rozdělení, v tomto případě říká, že o* = 1. Hledejme vhodný test HQ proti alternativem K,-. Alternativa Kr je speciální případ následující obecnější alternativy: je-li F(x) distribuční funkce X-......X . x m' G(x) distribuční funkce Y-,,...,Y , pak platí pro nějaký bod AA/ ; (3.27) Kg : F(x) £ G(x) ... -00 G(x) ... (W & xyn)) N = m+n. Invariance a postačitel-nost opět redukují množinu testů na ty, které jsou funkcí uspořádaných pořadí Rffl+i»•••>Rw druhého výběru. Mezi těmito testy neexistuje oC -test, stejnoměrně nejsilnější proti alternativě Kg. Obvykle opět volíme testové statistiky tvaru MR. »í (3'28) S "i^i""^ ^ii^1 vi' ale s jinou funkcí h než u testů rozdílu v poloze. Z úvah o lokálně nejsilnějších testech vyplývá, že vhodné jsou funk» ce h konvexní (nebo konkávni) na (o,l) a dosahující minima (nebo maxima) v ^ . Pořadové testy rozptylu lze vytvořit z pořadových testů polohy vhodnou transformací, která spočívá v tom,že pořadí pozorování definujeme odlišným způsobem« Výhodou takto získa- -55- ných testů je, že rozdělení testových statistik je za platnosti HQ stejné jako rozdělení příslušných testů polohy (a tedy kritické hodnoty najdeme v tabulkách kritických hoa-not příslušného testu polohy). Jako příklad uveSme Siegel-Tukevho test» který je analogií Vrilcoxonova testu. Vektor pořádkových statistik Z^ x , příslušný náhodnému vektoru \>>">\- y1>.,.,Zn> přeuspořádáme takto; (3.29) Z(1), s<«,a»-M,zC2)|at3)z(M)tZÜI-3>faU>z(5)| "(1) ^(25 ^N) a tuto novou posloupnost označme Z ,Z ',..*,Z ; tedy ^(1)=2;(1). ^(4j-2)=z(N+2-2j); ^(4j-l)=2(N+l-2j) ; ,*(«>■*««, ?Uj+D=zC2j+l) pro j = 1>2t... . Nyní přiřadíme poradí 1,2,...,K posloupnosti (3.29) v toa> sledu, jak je napsána. Označíme-li "nové pořadí" Z^ jako R. f dostaneme následující vzájemně jednoznačné zobrazení stffei /v f* vektory (H^, • • • |ß^j) a (R-j_i • • * *^H * A/ R. =1 % = 4j - 2 R. =1 i^ = N+2-2J % = 4j - 1 ■R± = N+1-2J »i = 4j Ri = 2j »i = 4j + 1 R£ = 2J+1, j = 1,2, ... Kritický obor Siegel-Tukeyho testu pak je R. >0 i: i=m+l -56- kde kritickou hodnotu C najdeme v tabulkách '.Yilcoxonova testu- Nevýhodou tohoto testu je jeho nízká asymptotická vydat- 6 nost vzhledem k F-testu proti normálním alternativám (—5- « = 0,608). tía druhé straně; pokud máme pochybnosti o tom, že základní rozdělení je normální, není vhodné používat F-testu; rozdělení jeho testové statistiky je velmi citlivé na odchylky od normality. Místo üiegel-Tukeyho testu se v praxi Častěji používají jiné pořadové testy rozptylu typu (3.28), z nichž dva zde uvedeme. 3.5.1. Klotzův test Ve (3.28) položme h(t) =fó _1(t)J 2 , 0^tJ - nrfny ^ Klotzův test je zvláště vhodný v případě, že F je distribuční funkce přibližně normálního typu. -57- 3»5.2. Kvartilový test Jestliže ve (3.28) položíme h(t) dostaneme i ... o stejně rychle jako -*y . x* Poznámka* Alternativy K- a Kg předpokládají, Se rozdělení obou výběrů se liší jen rozptýleností, nikoli polohou. Tento případ nastane např. tehdy, jsou-li ^»...»X^ a Y1,...,X výsledky měření nějaké kvantity M* různými metodami nebo v různých laboratořích. Jestliže se měří 2 kvantity, -58- řekněme \ a 7 j dvěma různými metodami, pak obvyklý postup J C A, ř * je, že nahradíme s a ^ vhodnými odhady fa?? založenými na xi>-*»»xm resp. Y^,...,^ a pak aplikujeme pořadové 1 '*"» %n " í » *l~?ľ »•••> • •o,X -17 • Obecně se rozdělení pravděpodobností testové statistiky za HQ touto úpravou mění, ale asymptotické rozdělení zůstane zachováno, pokud je F symetrické. 3*6. Testy založené na empirických distribučních funkcích Nechí X^»• * •, X^j a X* ,•••,? jsou 2 nezávislé náhodné výběry ze dvou populací se spojitými distribučními funkcemi F a G. Chceme testovat hypotézu H : F = G proti obecné alternativě K? ; F í G . Tato alternativa znamená, že dvě ošetření, postupy apod. se liší, ale nelze přijmout žádné zvláštní předpoklady o způsobu, jakým se odlišují. Problém testu HQ proti K« je invariantní vzhledem ké všem zobrazením tvaru x-' = f (x. ), y'. ~ f(y-), i=l,...,m; i i j j j=l,...,a, kde f je libovolné spojitá funkce. Protože neexistuje statistika, invariantní vzhledem k této grupě, je jediným invariantním testem velikosti oO test d) (^»y) -& • Tento test však není přípustný, protože lze najít testy velikosti cO , které mají sílu >cO proti všem alternativám G jř? Cviz cvič.O) ) . Pro testování HQ proti obecné alternativě K„, jakož i proti jednostranným alternativám typu £ G(x) ^ F(x) x, -59- G(x) Y f (x) J , u kterých senejednáani o rozdíl v poloze, ani v měřítku, často užíváme testy, založené na empirických distribučních funkcích. Definice. Nechí *i,'**,Xm Jsou náhodné veličiny. Empirickou distribuční funkci náhodného vektoru (X~,..«,X_) nazve^ me funkci Pffl : R —> ^0,1> definovanou vztahem (3.30) Fm(x) »I .T aU-X^), X6R1 kde u(t) = 1 pro t ^ 0 a u(t) = 0 pro t<0. Hodnota mF (x) je rovna počtu veličin X-, které jsou nejvýše rovny x. Jestliže ^»"•»X_ je nahodiv výběr z rozdělení s distribuční funkcí F , má n^m(x) binomické rozdělení B(m;p), kde p » F(x); tedy Fm(x) je nestrerttfm odhadem F(x) s rozptylem ~ F(x)(l-F(x)). Ze zákona velkých A p čísel plyne, že tento odhad je konzistentní, tj. Fm(x) —^ —i F(x) pro m—) oo , což je tvrzení Cantelli-Glivenkovy vety. Dá se dokázat řada dalších a silnějších limitních vlastností empirických distribučních funkcí; ale i ty, které jsíwp ^de vyjmenovali, ukazují, že empirické distribuční funkce je dobrou aproximací skutečné distribuční funkce náhodného výběru. Proto byla na* vržena řada testů hypotézy H , které měří odchylky distribučních funkcí pomocí odchylek empirických distribučních funkcí. Popíšeme zde dva z těchto testů. -60- Vztah mezi pořadími, pořádkovými statistikami a empirie kou distribuční funkci veličin xi»,*'*xm ihned vyplyne z následujících rovností (které platí, jsou-li X^,-«.,X^ různá) (3-31) m.Fm(.Xi) = R. m.Fm(X(i)) = i 1,... ,m 3o6*1* . Kolmogorov-Smirnovův test Nechí F (x) je empirické distribuční funkce výběru X. ,...,X a Gn(x) empirická distribuční funkce výběru X,,...,Y . Kolmogorov-Smirnovúv test má tvar r 1 $<&jp - i ľ ••• (3.32) D__ = C«, na •- Dmn< C* kde (3-33) »mn = ffiaxJ Vx) "V*) J x€RX a Cgi, je kritické hodnota. Nejprve musíme zodpovědět otázku, zda kritické hodnoty Cov závisí na základním rozdělení F a zda Kolmogorov-Smirnovúv test patří k pořadovým testům. Z tvrzení následující věty vyplývá, že kritické hodnoty jsou společné pro celou hypotézu K a že test je skutečně pořadovým testem. VLTA 4. Nechí *i»»#-»Xm a *i»»»»i*n jsou 2 nezávislé náhodné výběry a rozdělení se spojitou distribuční funkci F(x). Pak statistika D^ závisí jen na pořadích R,,...^. Rm+ľ*'*'^U (N=m+n) pozorování a rozdělení statistiky D -61- nezávisí na p. Důkaz. Označme Zj,...,Z» spojený náhodný výběr a Z X Rn «3e vektor Pořadí pozorování Z^,...,Z,t. Náhodné veličiny V\,...,V*« lze ekvivalentním způsobem vyjádřit takto: [vi = lj 4=$ [právě jedno z pořadí H^,...,!^ je rovno LVi = °J ^^ [právě jedno z pořadí R^,...,^ je rovno ij - tedy závisí jen na pořadích, a z vyjédře ní Že i D__ je ~ řadí. Protože roz i jořsdl za H_, aezévísí na F} plyne i nezávislost kritických hodnot na -62- Poznámka. Vztahu (3.35) lze s výhodou použít ke stanovení hodnoty testové statistiky. Kolmogorov-Smirnova testu se užívá i proti jednostrannýn alternativám, že druhý výběr je stochasticky větší než první výběr. Pak zamítneme H ve prospěch alternativy při velkých Hodnotách testové statistiky, která je v tomto případě rovna L = max (í^U) - G„(x) xCR1 'au IP D mn x>*x Íj üb? - vi - ••• - v,- • láíÉN *• m+n X jJ Tetalky kritických hodnot Kolmogorov-Smirnovova testu najdeme např. v pracech: P.J.Kim a fi.I.Jennrich (1970): "Tables of the Exact Sampling Distribution of Two-Saiaple Kolmogorov-Smirnov Criterion D^i m=n" C v serii Selected Tables in Mathematical Statistics, editoři narter a Owen); °aroslav Janko: Statistické tabulky. Pro velké hodnoty man lze použít limitních kritických hodnot, avšak aproximace rozdělení statistiky D při m,n-* Oo není dána normálním rozdělením, jak je vidět z následující věty, kterou uvedeme bez důkazu« yČTA 5. Becht F = G je libovolná spojitá distribuční funkce. Pak pro libovolné A) O platí B/(Sr->x/*iU» (3.37) li, P{(^j-)1/2 B^A] = B (3.36) li. p{<&r>1/2 D^ A) . t.n-fce -63- k=l Půkaa; viz Héjelc-Šidák (1967), kapitola V, důsledek věty 3.6. Limitní hodnoty (3.37) jsou tabelovány v knize Lehmann (1975). 3.6*2. Gramér-~'on Misesův teat uvažujme stejnou situaci jako v 3«6*1« Testová štatisti Jca Crsmér-von Misesova testu má tvar n f«» A A í * (Fm(V-VXi i — j. A 2 £ (F„(Xi)-Gr( CY.) - } J • Tsst je určen pro testování H proti oboustranným alternativám L : F f G a zamítá H pro velké hodnoty statistiky (3.39). S použitím vztahu (3.34) můžeme testovou statistiku vyjádřit v jednodušším tvaru <3-*°> Mmn ' ST J,. < J SS - Vl----------V/ a odtud stejně jako v důkazu věty 4 vyplývá, že Cramér-von íčisesův test je poradovým testem. Tabulky kritických hodnot lze nalézt v pracech : ToW.Anderson (1962) "On the distribution of the two-sample Cramér-von Mises criterion", Ann.J»ath.Statist.33, 1143-59; E-J.Burr(1963)."Distribution of the two-sample Cramér-von Mises criterion for smell equal samples" ,Ar*n.Math.Statist.34, 95-101. -64- Pro velké hodnoty man můžeme použít limitních kritických hodnot, které vyplývají v následující věty.. VČTA 6. Nechí F * G je libovolná spojité distribuční funkce. Pak pro libovoné A > 0 platí (3.41) lim pí m <á\ « pÍe -4-tt**( m,n4*> l "* J íj=l j2*2 3 fcde W^jW^,.». jsou nezávislé náhodné veličiny s normálním rozdělením N(0,1). Důkaz, viz Hájek-Šidák (1967), kap.V, věta 3*8. Limitní kritické hodnoty testu tabelovali T.W.Anderson a D.A.Darling (1952) : "Asymptotic theory of certain "goodness of fit" criteria based on stochastic processes". Ann.Math»Statist. 23, 193-212. 3.7. Pořadové testy při výskytu shodných pozorování Dosud jsme předpokládali, že distribuční funkce F a O jsou spojité. Za tohoto předpokladu nastane shoda dvou pozorování s pravděpodobností O a pořadí pozorování jsou s pravděpodobností 1 dobře definována. Přesto však v praxi Často narazíme na shodu dvou nebo více pozorování i když se jedná o měření spojitého typu; data totiž aaznamenáváme na konečný počet desetinných míst a hodnoty zaokrouhlujeme- takže váecka data vlastně vyjadřujeme pomocí spočetná sítě. Možnost shody dvou nebo ?íce pozorování nelze tedy ignorovat a ja třeba modifikovat pro tento případ i pořadové testy» -65- Existuje několik metod úpravy pořadových testů při výskytu shodných pozorování. Zde stručně popíšeme dvě z nich; metoda znéhodnění a metoda průměrných poradí, a to s ohledem na použití v testech hypotézy o shodnosti dvou populací. Nejprve však uvedme několik obecných poznámek« Jestliže shodné pozorovaní patří ke stejnému výběru, můžeme je mezi sebou uspořádat jakkoli, aniž by to mělo vliv na hodnotu testové statistiky. Proto si všímáme shodných pozorování hlavně tehdy, patří-li k různým výběrům. Jestliie je počet shodných pozorování malý, můžeme je z výběru zcela vypustit, ovšem za cenu určité ztráty informace Testové statistika některých testů je dobře definována i při výskytu shod; pouze se jejich vlivem mohou měnit pravděpodobnosti chyby 1. a 2. druhu. Jako příklad uvažujme Kol-mogorov-Smirnovův test: definici empirické distribuční funkce i vztahu (3.33) lze beze změny použít i při výskytu shod. Po-užijeme-li kritických hodnot Kolmogorov-Smirnovovs testu, dostaneme kritický obor, jehož velikost je o něco nižší než nominální hladina významnosti.Tento fakt dokážeme např. tak, že chápeme pozorování X,,...^, Y^. ..,IQ (mezi nimiž mo-hou být shody) jako data vzniklé zaokrouhlením dat X^,...,!^, T*...,X* se spojitým rozdělením. Pak možné hodnoty rozdílu F (x)-G (x), xť=Rx, tvoří podmnožinu hodnot í^W-G^x) » A- A- * * kde T* a G* jsou empirické distribuční funkce ^ a xj» tedy [A AI rA* A» 1 V*» - Gn(x>J * ■» [VX) - Ga(x)l xéH* X6RX a podobně pro maxima absolutních hodnota 29043 P5 -66- -.1, Metoda znáhodnění Nech? Z,, '1'**mZ1í **e spojený náhodný výbor. Nechí U^.,*.,^ jsou náhodné veličiny s rovnoměrným rozdělením na vO^l^jvzájemně nezávislé a nezávislé na Z^, •••,&•• uvažujme dvojice (ZlíU1),.-.f(Zji,l^ř) a uspořádejme je podle pravidla (3-42) (Z. .U. X (Z..U.) £=* bu3 Z.< Z 'i»wi J' J nebo Z, = Z u,< U Pořadí Bj^ dvojice (Z^,!^) v tomto uspořádání prohlásíme za pořadí Z*« Řekn m Zjj splňují hypotézu 3 , jestliže jsou nezávislé a mají stejné rozdělení (nikoli nutně spojité) Za platnosti H má vektor R * (R^,...^«) rovnoměrné rozdelení na (Ks • Pro jednoduchost to dokážeme na důležitém speciálním případě, kdy Z^,...,Z« mohou nabývat spočetně mnoha ekrldistantních hodnot (což pokrývá případ, Že zaznamenáváme d»-.s na k desetinných míst, kde k je celé konečné číslo). • 7. Nechí Z^,.«.,^ jsou náhodné veličiny splňující hypotézu H , které mohou s kladnou pravděpodobností nabývat jen aodnot z množiny a + kd; k = 0, -1, ±2,... , a€RX, d > 0. vektor (R, ,.. .fEÍ,) má rozdělení pravdepodobností r ^.flt) í: *3) HR* = r) = Ir c-3« OL je množina viech permutací (1,...,N). L:':;3ä. Bez újmy obecnosti můžeme předpokládat, Že Z,,...,^ 29043 Z5 -67- nabývají celočíselných hodnot (jinak můžeme místo Z. uvsžo-vat Z^ »^(Z-^-a), i=l,...,N, čímž se B^,...,^ nemění). Pak nehodné veličina T* * Z^ + U^ je ekvivalentní dvojici (Z^jO^), protože s pravděpodobností 1 je Z^ = [tJ , 0\ » = Ti -LTi] i *d« [*] označuje největší celé číslo * T; i=l,...,N. T^ mé spojitou distribuční funkci, neboí ^(T^a »t) » O pro lib. teR1. Déle platí (Z.,U.)< *=> f. (vektor ani obecně nenabývá hodnot z vt ), nelze použít standardních tabulek kritických hodnot- Obvykle používáme kritických hodnot založených na normální aproximaci, což je oprávněné pro dostatečně velké m,n a není-li rozsah žádné skupiny shodných pozorování blízký N . Abychom mohli použít normální aproximace, musíme stanovit střední hodnotu a rozptyl W* (R^,.-.,RjJ) je závislý na náhodných veličinách d,,..M .•.,d . Budeme hledat střední hodnotu a rozptyl WM podmíně- e i« né d, ,...,č za předpokladu platnosti H . x e E(W*|d ,...,d ) = Z B(H.'|dx,...,d ) i=m+l 7 Z st^. |(d1+X)+d2(d1+ |(d2+l)) + ...+de£d1+...de_1+|de)] i=m+l i Z (1+ ...+N) = n ^ l w i=m+l a tedy -69- . (3.44) E(w£ |d1,...,de) = n^ aEWN. podmíněná střední hodnota WjJ je shodná se střední hod- notou standardní Wilcoxonovy statistiky. Rozptyl Wj, je roven e -\ mn Z (d£ -d^ (3.4„ var^=SniN^li m __& 12N(N-1) (vztah (3.45) je dokázán v knize Lehmann (1975), příklad 1 a 3 dodatku). První člen v (3*45) j« rozptyl standardní Wilcoxonovy statistiky, druhý člen je korekcí vzhledem ke shodám, který vymizí, nejsou-li žádné shodné pozorování. 3.8. Problémy a cvičení (1) (Dixon a tóassey(1969): Introduction to Statistical Analysis, Mc Graw Hill). Následující data udávají hladinu cholesterolu v krvi mužů dvou různých věkových skupin (20-30 letých a 40-50 letých). Uži jete-li Wilcoxonův test na hladině =0,05, můžete prohlásit, Že hladin« cholesterolu v krvi starěích mužů je významně (stochasticky) větéí, než v krvi mladáích mužů? Užijte normální aproximace kritických hodnot. x(20-30 let) 135 222 251 260 269 235 386 252 352 173 156 y(40-50 let) 294 311 286 264 277 336 208 346 239 172 254 (2) Nechí X,,...,X a *i>•••»*£ Jsou nezávislé náhodné výběry z rozdělení se spojitými rostoucími distribučními funk- cemi F a G; nechí W = W(X,Y) je Wilcoxonova statistika.