OBSAH Str. Předaluva ........... 3 Obsah...........3 Kapitola 1. Systéay rozdělaní. Postačující statistiky. ... 7 1.1. Doainovaný systéa rozdělaní......• . . . .7 1.2. Postačující statistiky ............10 1.2.1. Charakterizace postačítelnosti statistiky ... .11 1.2.2. Exponenciálni sy$téa rozdělením ....... . .16 1.2.3. Ůplné postačující statistiky...........24 Kapitola 2. Stejnoaěrně najsilnejší tasty..........26 2.1. Foraulace probléau ........... .26 2.2. Neyaan-Pearsonovo fundaaantAlni leaaa • • • . • .30 2.3. Testy jednostranné hypotézy proti jednostranné alternativě ...... .33 2.4. Zobecněni Neyaan-Pearsonova leaaatu ...... .38 2.5. Testy oboustranných hypotéz .43 2.6. Nejaéně příznivá rozděleni ....... ... .47 2.7. Aplikace na testováni hypotéz o rozptylu noraálniho rozděleni .50 2.8. Doplňky a cvičeni......... . .55 Kapitola 3. Stejnoaěrně najsilnejší nestranné testy • • • • .57 3.1. Nestranné testy a podobné testy .........57 3.2. Testy hypotézy H3 a v jednopara-aetrickéa exponenciální systému........ .60 "5- 3.3. Testy hypotéz v exponenciálni* systéau za prítomnosti rušivého parametru. ....... 66 3.4. Testy hypotéz o rozptylu normálního rozděleni. • 71 3.5. Testy hypotéz o průměru normálního rozděleni • • 73 3.6. Srovnáni rozptylu dvou no reálni ch rozděleni. . . 75 3.7. Srovnáni průměrů dvou normálních rozděleni ... 78 3.8. Testy nezávislosti ve dvourozměrném normál- ni* rozděleni ........... 80 3.9. Srovnáni dvou binomických populaci ....... 82 3.10. Srovnáni dvou Polssonových populaci* • ..... 84 3.11. Test nezávislosti ve Ctyřpolnl IcontingenČni tabulce .......•••• 86 3.12. Doplňky a cvičení ............ 89 Kapitola 4. Testy dobré shody ............91 4.1. Pearsonův *y^2-test dobré shody........92 4.2. KoImogorov-Smirnovův test...........94 4.3. Doplňky a cvičeni ...........97 Literatura ...........100 -6 UNIVERZITA KARLOVA V PRAZE Fakulta matematlcko-fyzikální TESTY PARAMETRICKÝCH HYPOTÉZ RNDr. Jana Jurečková, CSc. Státní pedagogické nakladatelství Praha Kapitola 2 5ÍÄÍ02!ŽIDÍ-2£Í5ÍiDšiži-Í2SÍZ 2.1^Foraulace^probléau Necht X je pozorovateLná náhodná veličina nebo náhodný vektor; vine. Se rozděleni pravděpodobnosti X tvoři sys~ těm (P " {p9' *€©J Pravděpodobnostních aěr na (3C,<5) -Necht H a K jsou dva disjunktní podsystémy (P takové, ie KuK ■

pft(X€AK) nazýváae velikosti testu (nebo vtU- kosti kritického oboru ar). Pravděpodobnost chyby II.druhu při 9£©K jt rovna (2.2) Pg(xe ah) - 1 - p8(xt ar), e s (2> K. Hodnotu pravděpodobnosti (2.3) (5(9) - P^(xe ak), 9«©K nazýváae sflou testu proti alternativě PQ (nebo stručně 0), et©K. Funkci (5(9) :@—» (o,l) nazýváae sUofunkcI příslušného tastu. jestliže Je pevně stanoven počet pozorováni, nenůžeae současně alninalizovat pravděpodobnosti obou druhů chyb. Test,který by Bět ainiaálni pravděpodobnost chyby I.druhu, by odpovídat prázdnéau kritickému oboru, a jeho chyba II.druhu by aěla pravděpodobnost 1. Proto obvykle oaazujeae pravděpodobnost chyby I.druhu pevně zvolený* aalýa čislea ^ , 0(X). Optimální volba testu je pak ekvivalentní následující maxima* Hzačnl úloze : mezi všemi testy 5 splňujícími nalézt takový, pro který (2.«) ř>|(®> * Ee ?(x> * stejnoměrně pro Test, který splňuje (2.7) a (2.8), se nazývá stejnoměrně nejsilněji test velikosti £ d (stejnoměrně nejsllnějil » (1) Pak pro lib. C P0(x)}; tato funkce je nerostoucí, zprava spojitá a taková, Že 11a oL(c) « 1 a Ui oUO 3 0. Pak k Hbovolněau «Lé ( 0,1) existuje k^O tak,že (2.11) kde jsae označili d(k-0) = 11a k- Uvažujne test 2.12) £(x 1 cl-.l(k) «L(k-0)-i( k) když Pl(x) > k po(x) když Pl(x) - k p0(x) když Pl(x) < k p0(x) Středni výraz na (2.12) není definován, pokud jt k bodea spojitosti oL(e) ; pak Je vlak p0{p.|(X) " « p0(x)3 * °* Velikost testu (2.12) je (2.13) E„I(X) - P, p«(X) * «v( k-ay-A k) Po P,(X) = kt- a tedy test i splňuje (2.9) a (2.10). Zbývá dokázat, že test £ je nejs1lnějS1. Nechl i* libovolný jiný test takový, že E0$"(X) 6 . Nechl S* » - (x4Jt: l(x) - £"(x) > 0 J a S* • jxfcll&«)-§*(»)< 31 jestliže x€S*, Jt $(x) > O, a tedy p1( x) * k P0(x); podobně je p1(x) * k pQ( x) pro x€ s" ; odtud plyne a tady a taat 5 ja najvýla stejně aUný jako $ . 0. Protože je ($(x)- $*(x)). . (p1(x)-k p0(x))> 0 pro xé S, platí [ ("$ - pxp^k p0)d^ -5°' $*uS- S a tedy e - > k E0[$(X) - $*(X)] ■ 0 • tedy £ *• •Unéjil než $ * proti alternativě K. To je vlak spor, a tedy ^C(S) ■ 0, což bylo třeba dokázat. Kdyby velikost £ * byla ^ nebo Po = Pr Důkaz : Test a <^ má velikost ol i silu c*. ; test £ je alespoň stejně silný jako j> v a tedy (5 ■ " E1 í§(x> 4 ^ • Jestliže Je «1 = |3 < 1, je t«tt$1(x)5 S cC nejs1lnějS1 a podle věty 2.1, část (2),mus1 vyhovovat (2.9). Odtud plyne, že pQ( x) * P^x) s.v.[^U/], a tedy 2-3- Jesty^ Íednostranné_bj;potéz^ E^otl jednostranné_ alternativě. Jestliže (P "{p9/ »£©^ j« systém rozděleni závislý na reálném nebo vektorové* parametru a (h) je Interval/ má test jednoduché hypotézy proti jedooduché alternativě splle teoretický význam. První krok k obecnějšímu modelu je případ systému závislého na jediném reálném parametru $ , ve kterém chceme testovat tzv. jednostrannou hypotézu : Ô * 90 proti jednostranné alternativě : 0>8o- Ani v tomto jednoduchém případě nemusí obecně existovat stejnoměrně nejsil-nějS1 test. Ukážeme, že SN test existuje, pokud je (P dominovaný systém, jehož věrobodnostnl poměr je monotónní funkci vhodné statistiky T(x). Tuto vlastnost má např. expoenclál-n1 systém s jediným reálným parametrem. Definice 2.1. Necht (P » -[p^, 8«s(h)} je systém dominovaný 6* -konečnou mírou , kde © je podmnožina R1. ftekneme, že (P má monotónní poměr věrohodnosti, jestliže existuje reálná statistika T( x) taková, že pro Ub. 9 různá a poměr p^(x)/pfl(x) jejich -33- hustot je neklesající funkci T(x). VÍTA 2.2. Wechl systéa rozděleni (P «= \ Pfl, Q€@| náhodné veličiny nebo náhodného vektoru^má aonotonnl poaěr věrohod-nostl vzhledea ke statistice T(x). (1) Pak existuje stejnoaérně ne j silné j ŽU-test : 8 ^ 8 proti : 9 > 8Q, který aé tvar f 1 když T(x) > C (2.15) <£(x) y když T(x) « C 0 když T(x) < C kde konstanty C a ^ jsou určeny tak, aby platilo (2.16) EÄ (X) «et . O (2) Sllofunkce ^(8) » Eg^(x) testu ^ je rostoucí n ■nožlně ^8 :^(«)< i] Důkaz : Uvažujae nejprve hypotézu Ho : 8 = 8Q a nijakou jednoduchou alternativu ei^e0- Podle věty 2.1 existuje nej silnější test takový, ie Pg (*) (x) - ■1 když ■ 1txj > C1 ( neboli T( x) > C o ^ když T( x) ■ C 0 když T(x)< C kde C a V jsou určena tak, aby platilo Eg ^(X) - JL • Podle věty 2.1, část (1) dále platí, že test $ je také najsilnejší pro hypotézu pqi proti alternativě Pg* na hladině -34- X= |S(3) pro všecka 9 , 9" ; 9< e'1 . Z důsledku věty 2.1 dále plyne, že silofunkce |3 (9) testu g> *e rostoucí v 9 . Z této nonotoníe dále plyne (2.17) E05(X)^ d pro 0 ^ 80. TMda A testů splňujících (2.17) je Části třídy 8 testů splňujících E& j£(X) £ * který Maximalizuje 0(9^ na třídě B, tim spiše maximalizuje (Ž>(Bt) na třídě A. Tist je žati* dokázáno, že <£ je nejsi lněj šíb oL -testem hypotézy H : 9 9o proti jednoduché alternativě 9^ . Protože však test ^ ve skutečnosti nezávisí na špeciálni alternativě 9^ je stejnoměrně nejsltnljšl pro 0<9Q. O.E.D. Přiklad 1. Mechí partie N výrobků obsahuje H zmetků. Z partie vybereme náhodně n výrobků, které zkontrolujeme. Nechí X je počet zmetků zjištěných ve výběru. Chceme testovat hypotézu H : H ^ nQ proti K : «>«0- X stá hyper-geometrlcké rozděleni MM (2.18) PjX-x) « PM(x) » x; , x celé, ***** o = 0 jinak kde aBaax( M+n-N,Q) a b-«in(M,n). Interpretujeme jako hustotu vzhledem k citaci miře, která přiřazuje libovolné podmnožině počet nezáporných celých čísel v ni obsažených. Pak platí PM+1(x) B "+1 N-H-n+x pM( x) n^n " H + 1-X 35 a systém mé monotónni poměr věrohodnosti vzhledem k T(x) = x. Stejnoměrně nejsilnějši test H proti K zemité H , když X >C. Poznámka. Uvažujme duální problém h : 6 - 8Q proti X : 8 < 6Q. Pak SN test dostaneme převrácením nerovnosti ve (2.15). VETA 2.3. Necht systém rozděleni náhodného vektoru X je jednoparametrlcký exponenciálni systém s reálným parametrem 9 a hustotami (vzhledem k nějaké míře ) tvaru (2.19) pe(x) h exp^c(8)T(x) + A( 0) ♦ B(x)j kde c(0) je ryze monotónní funkce. Pak existuje stejnoměrně nejsilněji test $ hypotézy H : 0 * %Q proti K : 8 >eQ. Jestliže je c(0) rostoucí, má test tvar 1 když T(x) < C (2.20) $(x) - \ J když T(x) « C 3 když T(x) > C kde C a_ ^ jsou určena tak, že Ee tj?(x) = . jestliže je c(9) klesající, je nejsilnéjii test analogický (2.20) ; přisluiné nerovnosti jsou převrácené. Důkaz. Snadno vidíme, že systém (2.19) má morotonnl poměr věrohodnosti vzhledem k T(x). Věta pak plyne z věty 2.2. Přiklad 2. Systém binomických rozděleni £b(p,n), 0pQ zamitá H, jestliže počet úspěchů X překročí vhodnou konstantu C. Podobnou hypotézu můžeme také testovat na základě jinak uspořádaného pokusu. Opakovaně provádíme alternativní pokus s pravděpodobnosti úspěchu p , dokud nedosáhneme celkového počtu m úspěchů. Necht Yj je počet pokusů, které provedeme mezi (1-1)-n1m a 1-tým úspěchem. Pak P(Y.my)«m(1-p)y, y-0,1,..., a tedy sdružené rozděleni Y.,...,V je Ppír,,...,ya) » p'(i-p) ^ , rk-o,i,... ; k-i. To je exponenciální systém s T( y) - > v* * c( P) "tog(1-p) 1-1 1 Protože c( p) je klesající v p, SN test pro H : P PQ proti K : P>PQ zamítá, když T je při liš malé. T(y) má negativně binomické rozděleni Pít) ("** *j P- O-P)*, t-0,1,... . Přiklad 3. Nechf X1,...,Xfl je nezávislý náhodný výběr z Poissonova rozděleni s EX1 Pak sdružené rozděleni X1.....Xn *« Ix1 !*) p(x.......-Ja? Xl'---Xn! a tvoři tedy exponenciální sjetém, ve kterém je T( x) a x4, 1-1 1 :. a) ■ log A • Např. A může označovat hustotu provozu telefónni centrály a Xf jsou počty signálů, které dojdou do centrály během n stejně dlouhých nepřekrývajících se Časových Intervalů délky . SN test hypotézy H : X * X zaaité H při velkých hodnotách T(x) = £~ x^. Statistika 37 T(x) ná rovněž Poissonovo rozděleni s parametren Hypotézu núžeme také testovat na základě inverzně uspořádaného pokusu: sledujeme centrálu tak dlouho, dokud nedojde ■ signálů. Nech! Y1/Y2'-*'/Ya Jsou délky Intervalů do prvního signálu, od prvního do druhého signálu, atd. Pak Y.,..., ...,Y(| jsou nezávislé a Y^ aá exponenciální hustotu Xe ^y y*0, 1-1,...,». Sdružená hustota Y1,...,Y|| je p (y1/.../y||) - X" exp{f"^12!yi} ' y1/-«-^yB * °/ a tvoři exponenciálni systéa, kde T(y-/«..,y_) =2T y* • c(X) B - X • SN test pro H : \ * \Q zaaitá H při stalých hodnotách T *^ y^m Protože Z\ Y1 aá hustotu 0- u/2 ppo gig, což Je ^*-rozdělen1 o 2 stupních volnosti, aá 2\T rozděleni o 2a stupních vo Inostl .Kr111 c kou hodnotu testu tedy aúžeae najit v tabulkách \2 rozděleni. i-í^Zobecněni_Neyaan-Pearsonova^leaaatu_ Následující věta je zobecněnla Neyaan-Pearsonova leaaatu; podle této věty existuje test hypotézy, složené z konečně ano-ha rozdftenl, proti jednoduché alternativě. Věta rovněž udává explicitní tvar testu. VĚTA 2.4. Necht P^,...,PB+1 jsou rozděleni pravděpodobnosti na eukUdovskéa výběrovéa prostoru s hustota-a1_ vzhledea k a1ře (U> . Necht oL^,..s, oL m jsou dané konstanty, 0<^oi.,<1, 1*1,necht existuje ~3 alespoň jedna tesťova funkce vyhovující (2,21) j^(x)fi(x)d^/ = d^, 1-1,...,*. Označee £. *nožinu viech testových funkci splňujících (2.21) . Pak (I) existuje JlJ k1fl(«) (2.23) $(x)W kde k.,,...,^ jsou konstanty, pak ^ *axi*al1zuje (2.22) na ^ ■ Jestliže kro*ě toho platí k<1/.../k|| * 0, pak ^ *ax1*al1zujo (2.22) na *nož1ně viech testových funkci splňujících (2.24) ^jF(x) *4(x)d^ 4 Aa/ 1-1,...,«. (111) Množina NCR1, dané výraze* (2.25) N «^( ^J(x)f1(x)d^ J(x)fB(x)d^}:?62^ kde 2) je množina viech testových funkci, je konvexní a uzavřená. Jestliže (ol1#..., o^) je vnitřní bod množiny M , pak existuje optiaálni test p vyhovující vztahů* (2.21), (2.23), který *ax1*al1zuje (2.22). Důkaz; (1) Nechí j^f> nj Je posloupnost testových funkci 39- taková, že Protože anožlna testových funkci je koapaktni vzhledea ke slabé konvergenci, existuje podposloupnost J a testová funkce 5 tak' že Z (2.21) plyne, že £ ^ £ a že 5 aaxlaallzuje Integrál (2.22) na L . (11) Nechl test je tvaru (2.23) ánechí je li- bovolný jiný test. Nechl a S" » |x 6. £ : £ " 5* < °} • Pro xéS + je fa + 1(x)* k,f.(x) a pro xés' je f-.-U) k4*«(*)j tedy 1 1 B+1 1«1 1 1 P a_ s u s odkud vyplývá (2.26) ^ £" £">f-1 "f* k^(5"F)f BaxiaaUzuje (2.22) na £, . Jestliže kroaě toho k^-., ...,kfl - 0, ja pravá strana (2.26) nezáporná pro libovolný test * splňující (2.24). T1a ja dokázána část (11). -40 (111) Konvexita množiny M je zřejmá a uzavřenost N plyne z toho, že množina 3) viech testových funkci je kompaktní vzhledem ke slabé konvergenci. Necht NCR**1 , kde ■ ■{ «I*2)}. Pak N je také konvexní a uzavřená a množina jt uzavřený Interval <^ot*, ot**^ . Uvažujae zvtéll případ +1ÍO. Bez újay obecnosti aůžeae položit kB+1" ~1 • D«* Pr« *«*dý bod množiny H platí (2.27) u.+1 - J k, *i Necht J* *•»* takový, te j 5** fi <*(^ 0 1-1,a ^<£*HI f d^ ■ cL**. Pak pro libovolný Jiný test vzhledea ke (2.27) platí (2.2») iicwzlsvV 5í""(w|\^ ' 41 a tady ^** ■•xlaaHzuje Integrál na levé straně (2.2$) přes vlečky testové funkce. Tento Integrál je vlak aaxiaálnl, jt-U ».v. [aJ] rovno f 1 kdyÍ fB*1 £""(x) « j . 0 když f|#1(l)<í kafa(«) což je shodné s (2.23). b) Mecht ol* ■ +1 « 2^ ktfj s.v.C^; necht 0 < oL < 1. Pak existuje test ^ tak,že Ei (£(X)».L (1-1,...,■) _•_ E-+1 ^>(X)>«^. Důkaz provedeme Indukci podle a. Pro m-1 plyne tvrzeni v důsledku věty 2.1. Předpokládejme, že tvrzeni plati pro Lib.systém ■ rozděleni a necht jsou dány lineárně nezávislé hustoty f.,..«,f_..« Pak jsou 1 lineárně ne- závislé a pro každé jB1,...,m podle indukčního předpokladu existuji testy J j ■ £j tak,že E1 £j(X) « E^^X)-* oL J»ro 1-1,2,..., a Ej j(X) < ^ < < Ej É j(x>- odtud vyPl*v*/ *• D0d (ct. oL ) € «B je vnitřním bodem množiny M definován* v části (111) věty (2.4), a platí tvrzeni (111) věty 2.4, Protože temt ~§_(x) * cL splňuje podmínku E^ ^(X) - oL * 1"1,..»,»+1/ existuje alespoň jedeni test, pro který je EH+i £(X) * ct . Kdyby tato nerovnost platila pouze jako rovnost pro vlečky testy, byl by test ( x) ■ oL optimálni a vyhovoval by (2.23). Protože 0<.L<1, dostáváme, že musi platí f|B+1 ■ ■ ^ k^f^ s.v.[^uT| , což je spor. fl.E.D. 2.5 _Tes ty_obou8tranných_hy_potéz Jestliže 9 je reálný parametr, pak kromě jednostranné hypotézy uvažované ve 2.3 přicházejí v úvahu dalěi přirozené hypotézy a alternativy: -43- H2 : 9 4 91 nebo 9 > 92 (61 < 9g) proti K2 : 91< ©<ô2 ; H3 : 91 * 0 ^ 82 proti K3 : 9<91 nebo 9> 92 H4 : 9 = 9Q proti K4 : 9 / 9Q • Jestliže uvažovaný systém rozděleni je jednoparaaetrlcký exponenciální systém, dovedeae nalézt stejnoaěrně nejsilnějěl test hypotézy H2 proti alternativě K2; k toau použijeme větu 2.4. Bohužel neexistuji stejnoměrně nejsílnějěi testy H3 proti K3 ani H4 proti *4. Z věty 2.2 vyplývá, že testy , nesilnějěi proti alternativám 9>92 maji rostoucí silofukci, zatímco testy nejsilnějil proti alternativám 9<9<] maji klesající silofunkci; neexistuji tedy testy stejnoaěrně nejsilnějěi proti věea alternativám 9<9^ nebo 9>92. Chceme-li nalézt vhodné testy hypotéz H? a H4, musíme omezit třídu testů, mezi kterými hledáme optimum, např. na třídu nestranných testů. 0 tomto problému bude pojednávat aásledujlci kapitola. V této kapitole zkonstruujeme stejnoaěrně nejsilnějSi test Hg proti K2 v jednoparaaetrickéa exponenciálním systému. VETA 2.5. Hecht rozděleni pravděpodobnosti náhodného vektoru X tvoři jednoparaaetrický exponenciálni systém s reálným paraaetrea 9 a a hustotami (vzhledea k nějaké aiře ^xs ) (2.29) pft(x) » exp£c(9)T(x) ♦ A(8) + B(x)j kde c(9) je ryze rostoucí funkce. 44 ( i) Pak existuje stejnoaěrně nejs1lnějS1 test hypotézy H2 : «ťfl1 nebo 0 * 92 (S1 < 92) proti alternativě K. : 91<9<8- daný vztahea (2.30) C2 kde C^Cg,^ a jsou určeny tak, aby platilo (2.31) Ee {(X) » EB £(X)»JL, 0e2. Důkaz, Protože T je postačující statistika, stačí hledat nejs1lnějS1 test mezi testy, které jsou funkceai \p(T) postačující statistiky, 0 * y( T) * 1. Hustotu (2.29) aúžeae psát jako hustotu vzhledea k aíře eB^x^d^_(x) ve tvaru exp -[c(e)T(x) + *(©)} . Přenosea Integrace odtud dostávané, že statistika T : (£,(&) hustotu (2.32) pe(t) * exp|c(9)t + A( B)j vzhledea k nějaké ailře * na & . Zvolae pevně nějakou alternativu e' € (O^,^) a hle-dejae test který aaxlaallzuje E^l^?) "ez< vSe" ■1 testy vyhovuj1c1a1 E^tj^1) * E9 ^ T* * °^ * Nech* n je anožina všech bodů (E^t), E^yd)), kde y probíhá 45- viecky testové funkce. Podle tvrzeni věty 2.4 ausiae ověřit, zda (oL,«L) je vnitřní bod N. Podle důsledku věty 2.4 viak existuji u./U- ; 0 < u. «£ «L < u,< 1, tak, žeW^u,)**. a 'í>-/U2)fcM; kroaě tono Xu,u)£ H pro vS. u€.(0,1) =^ (d/oC) je skutečně vnitrnia bodem M• Podle čisti (iii) věty 2.4 pak existuji konstanty k^fcj a test Yo(t) tak' žt ?0(x) " Yo(TÍX)) vyhovuje (2.31) a (t) = 1 když k, «xp t + + k2 exp(c(e2)t + A(82)} < < exp {c(e')t ♦ A(B*)} neboli b.t b.t (2.33) a1 e 1 + a2 e 2 < 1 (b1<0 1. Dokážeae sporea, že a1 > 0 1 a2>0 : kdyby «1/«2 - 0, test by pořád zaaital; kdyby a1 * 0<>2 nebo a2 4 0 0 a b1<082 , což je tvrzeni(H). Srovnáni* s testea t) s oL pak dostáváee E^^CT) £ oU pro e á e1 a 9 * 82. Tli je dokázáno (1). Q.E.D. K toau, abychoa určili C,,C2, ausime oviem sta- novit rozděleni testové statistiky T. Ale ani pak neni volba c<|*c2* Y^' jfz "ela průhledná. Podainky (2.31) aůžeae pak přepsat ve tvaru p<*1> " S *»a(t) + V'"'1' V™2' * ^' C1 1*1,2. V praxi aůžeae postupovat tak, že vyjdeme z nějakých počátečních hodnot cf, a k nia určiae C*,^-* *• (?>*(^) " oL • Pak vypočteae (J*(82) a porovnáme s • Jestliže je (3 *(82) < ct , «usi bu5 platit C, > C* nebo C1 s Cí a ^1 < ľ*" ' C0Í znaB,n*' že skutéin* *""tt*cký obor leží zprávo od předpokládaného. Jestliže je (5*(82>> / ausi platit opačné nerovnosti. 2.6._ .Nejaéně_př1zn1vé rozděleni Podle věty 2.1 aůžeae zkonstruovat test jednoduché hypotézy proti jednoduché alternativě. Věta 2.4 rozšiřuje tuto konstrukci na testy hypotézy složené z konečně mnoha hodnot proti jednoduché alternativě. Necht (P = : Bé©} je dominovaný systém rozděleni a uvažujae probléa testu složené hypotézy H : BéQ, proti -47 jednoduché alternativě K : 8 * 9^. Ptáme se, za jakých okol nosti aůžeae složenou hypotézu H nahradit jednoduchou tak,že nejsilnější test nové hypotézy proti K poskytuje zároveň nejsilnější test H proti K. Očekávané, Že jednoduchá hypotéza, která nahrazuje H, bude váženýa průměrem všech rozděleni z H. OznaČiae-Li fQ( x) hustotou Pg, Se©, pak nová hypotéza bude nit tvar (2.34) HA : h^(x) = ^ fe(x)d A(8) ©o kde X je vhodné rozděleni pravděpodobnosti na (£) . Jestliže jsme stanovili X a tia 1 ,dovedené pomoci věty 2.1 nalézt nejsilnější test proti K• Otevřenou zbývá otázka, jak vhodně stanovit X / což je vlastně Lagrangeův ■ultiptikátor. Protože H mezi sebou nerozlišuje hodnoty 9é@Q/ aá 1 být stejně vhodné pro všecka 8 6 ©0/ i pro hodnoty nejbližii alternativě Bj . Intuitivně je zřejné, že rozděleni \ ausi být nejaéné příznivé, tj. pro libovolné jiné rozděleni ausi platit * č>^' , kde (3X ^i] je sila nejsilnějšiho testu [ H^' ] proti K. Tuto doaněn- ku potvrzuje 1 následující věta. VĚTA 2.6. Necht dominovaný systém rozděleni s hustotaal ffi(x) vzhledea k <Ó -konečné niře (Uy - Uvažujme probléa testováni hypotézy H : 8fc(5)0 proti K : 8 » 8.J ^ ©0* -48- Nechí existuje € -algebra 3) podmnožin © taková,že hustoty fg(x) jsou zároveň měřitelné v 9 i v_x. Předpokládejme, že existuje rozděleni pravděpodobnosti X na 23 takové, že nejsilnéjži -test íJST^ pro testováni proti K má velikost £ oO také jako test H proti K. Pak (a) Test 1[ je nejsilnějSi oC -test H frroti K. A (b) Jestliže je jediným nejsilnéjSim <£, -testem pro proti K, je 1 jediným nejsllnějiim oL -testem H proti K. (c) Rozděleni A je nejméně příznivé. Důkaz. 2 Fubiniho věty plyne, že h^ je hustotou vzhle- dem k ^/ , tj. J h^(x)d^.(x) •= 1. Nechí 5^ má velikost £ oU i pro H proti K a nechí ^> * je libovolný jiný ot -test H proti K. Pak ^$" k j fe(x)d ^(«) Jestliže fe(x) < k (j fg(x)d ^(8). Jestliže test %^ splňuje (2.36) E'<£,(X) - sup EeI.(X) = cL © pak je nejsilnějslm oL -testem H proti K. Poznámka. Věty 2.3 a 2.5 jsou jednoduchými aplikacemi věty 2.6. Množina na které je soustředěno nejméně příznivé rozděleni, je v prvním případě složena z jediného bodu 8Q a ve druhém případě ze dvou bodů 8^ a B2- 2.7. _ _Ag M kace na^t es to váni j;po téz_o_rozgt^ lu normálního^ rozděleni Mechl X1#...,Xn je náhodný výběr z normálního rozděleni N( J , £*), n > 3 . Uvažujme hypotézy -50 H, «{( j ,*■>•€ a 60} Proti k4 i{(^C)i G< (fj a H2 : {( 6 6 (J o] proti k2 : {(^g): G >Go} . Hypotézy se týkají pouze parametru £ , zatímco £ je rušivým parametrem. Obvykle píšeme hypotézy a alternatív' ve zkrácenéa tvaru : € ä &Q apod. S použitia teorie dosud odvozené v této kapitole můžeme odvodit stejnoměrně nejsilnějSi test hypotézy proti a ukázat, že neexistuje stejnoaěrně nejsilnějii test h^ proti • Uvažujae nejprve hypotézu proti jednoduché alterna- tivo : ^ * §1*^*^1 (^1<^* Bude"e nl*d«t nejméně příznivé rozděleni pro hypotézu vzhledea ke . očekáváme, že rozděleni v rovině (^/^) , nejaéně příznivé vzhle ke K^, bude soustředěno na přiace ^ 0 ^ - Nejaéně příznivé rozděleni A aá být takové, že rozděleni (X1,-.«,Xn) za hypotézy H^ je co nejbliže rozděleni (X1,...,Xn) za alternativy kJ, které aá hustotu (2.37) rj'*(2lf )"B/2 exp - J-^ xr í= ,) 2 Poaoci důsledku věty 2.6 dokážeae. Že nejaéně příznivé rozděleni X přiřazuje pravděpodobnost 1 bodu ( jjľ^0)* Skutečně, dosadine-li takové % do (2.35), dostaneme -51- (2.38) (x) r 1 jestliže (2irrJ2)"n/2 exp 26, i=1 O jestliže platí opačná nerovnost. Test BŮže»e přepsat ve tvaru M je.tUíe A_(xi- \J* " c (2.39) lX(x) - ^0 jestliže )2>c Podle důsledku věty 2.6 ]e rozděleni \ nejaéně příznivé, jestliže platí Př1 libovolnéa pevnéa 6 je P_g| 5^ (X|- ^)2 é C j rovna pravděpodobnosti, že nehodný výběr z N(^u, 6f2) padne do koule se středea ^ a poloaěrea VT . Naxiaua této pravděpodobnosti při pevnéa £ nastane pro íj = a je rovno 0,1 kde X°,...,X° jsou nezávislé náhodné veličiny s rozdelenia 1(0,1). Pravá strana (2.42) je klesající v éf a tedy nabývá aaxiaa pro konstanta C je dána vztahea 52 C = ^Í-Xft1-*)) kdt Xnt1'^ *e 100(1-oL)-ppocentn1 kritická hodnota rozděleni o n stupních volnosti. Ze (2.40) a z důsledku věty (2.6) vyplývá, že test $^(2.39) je nejsilnějšin testem hypotézy H1 : ■> £ proti alternativě : ^= ťT = 6'1(<60). Protože 5^ nezávisí na zvoleném 6" 1 | je i stejnoměrně nej silněj 51 a testem hypotézy : (T * £To proti alternativě K.J' : j * j,, €"<(T0» Na druhé straně, protože "5^ závisí na zvolené hodnotě ^ ^ neexistuje stejnoměrně nejsilnějěl test proti K|• Nyni uvažujme hypotézu H2 : ^©** ste^ní í*k0 v Pevním případě očekáváme, že nejméně příznivé rozděleni bude soustře děno na přímce 6 u n Z faktorizačnl věty plyne, že statistiky Y » iy x,« = X a Z =2_.(x^"x) jsou postačující pro parametr ,£) « Stačí tedy omezit své úvahy na tyto postačující statistiky. Jak je známo (viz např. Anděl [i ] „kap.V,věta 18), jsou Y a Z nezávislé, Y má rozděleni N( íj , §-) a má rozděleni ^ (n-1). Jestliže ^(^) je rozděleni v rovině (^,6*), soustředěné na přímce Š = 6^, pak sdružené rozděleni Y,Z za platnosti hypotézy má hustotu (2.42) (^,1/2 (^.)C--1)/2p(«-l, _zl 0 l 2G?J exp o y"5} d*<§> zatímco za platnosti xJ Ba hustotu -53- 2.43) USr)1'2 2(°-1)/2 r(itl) (i-)íB-«/2«p - m exp Ukážeae, že nejméně příznivé rozděleni X( ^) hypotézy vzhledeei ke *2 je noraálM N( J ff2)/n) . Dc*ad1ae-U toto X do (2.42), dostanea-e za integrálem konvolucl dvou nor ■élnich rozděleni (až na noraallzačni konstantu) N(0, G2/n) • N( " ^o/^' což je N( ^S^/n). Sdružené roz- děleni (V,Z) za aá pak hustotu (^n_)1/2 2(n-1)/2 p(n^l)(Z_^n-3)/2 e-Z /2GQ2 J_ exp Test * vyjádřený v závislosti na postačujících statistikách 1,1, Bá pak tvar Ž&(y#«) ■ 1 Jestliže z * c. nebo 11 (2.44) £-(x) = 1 jestliže Í (x.-x)2 * C. 1-1 1 Pr.vcepodoono.t ^(X,-!)' > c}- P^j^C X^X) nezávisí na J i je rostoucí v 5 . Jsou tedy splněny předpoklady důsledku věty (2.6) a test (2.44) je stejnoměrné nejsUnějěia) testem H2 : £f * fJo proti K? : 6>6>0; pM-to. C = 6*. Vn-1(cU' kd# ^n-1^> *e 100cL-procentn1 54 kritická hodnota rozdělení \^ o (n-1) stupních volnosti. £•§•- _Doplňky_a^cvi čen1^ (1) Necht X1,...#X(| a f1#...#Yn jsou nezávislé výběry z N( ^,1) a N(^,1). Uvažujme hypotézu H : ^ * j proti alternativě K : *j > ^ • Pak existuje stejnoměrně nejsilnějSi test, který zamitá H při velkých hodnotách Y - í". [_Návod : Zvolime-li pevnou alternatívu k': ^6*. (a) Jestliže jsou známy hodnoty ^ 1 a existuje stejnoměrně nejsilnějSi test s kritickým oborem n 0 c \ 2 ) — - c ) 1=1 1 J (b) Jestliže hodnoty ^ a í2 nejsou známy, neexis- tuje stejnoměrně nejsilnějSi test. (3) Stanovte sllofunkd testu (2.45) hypotézy N^ : CáG^ proti K.: G" >0f o rozptylu normálního rozděleni. z o (4) Necht X,/.../Xn je náhodný výběr z rozděleni gama s hustotou 55- ■p,i ía) * -=- ' x>0, ^>0, p>0 I (p) O jinde. Předpokládejme, že p je známo a 1 je neznámý parametr měřítka. Ukažte, že stejnoměrně nejsilněji* test H tle J proti K i ^>J^ ■* kritický obor V" X1 > C, kde c ■ "t"™ 9n (1-cC) a g (1-oC) je 1Q0( 1-«L)-procentni kri tická hodnota rozděleni gama s parametry np,1. 56