OBSAH
Str.
Předaluva ........... 3
Obsah...........3
Kapitola 1.
Systéay rozdělaní. Postačující statistiky. ... 7
1.1. Doainovaný systéa rozdělaní......• . . . .7
1.2. Postačující statistiky ............10
1.2.1. Charakterizace postačítelnosti statistiky ... .11
1.2.2. Exponenciálni sy$téa rozdělením ....... . .16
1.2.3. Ůplné postačující statistiky...........24
Kapitola 2.
Stejnoaěrně najsilnejší tasty..........26
2.1. Foraulace probléau ........... .26
2.2. Neyaan-Pearsonovo fundaaantAlni leaaa • • • . • .30
2.3. Testy jednostranné hypotézy proti
jednostranné alternativě ...... .33
2.4. Zobecněni Neyaan-Pearsonova leaaatu ...... .38
2.5. Testy oboustranných hypotéz .43
2.6. Nejaéně příznivá rozděleni ....... ... .47
2.7. Aplikace na testováni hypotéz o rozptylu noraálniho rozděleni .50
2.8. Doplňky a cvičeni......... . .55
Kapitola 3.
Stejnoaěrně najsilnejší nestranné testy • • • • .57
3.1. Nestranné testy a podobné testy .........57
3.2. Testy hypotézy H3 a v jednopara-aetrickéa exponenciální systému........ .60
"5-
3.3. Testy hypotéz v exponenciálni* systéau
za prítomnosti rušivého parametru. ....... 66
3.4. Testy hypotéz o rozptylu normálního rozděleni. • 71
3.5. Testy hypotéz o průměru normálního rozděleni • • 73
3.6. Srovnáni rozptylu dvou no reálni ch rozděleni. . . 75
3.7. Srovnáni průměrů dvou normálních rozděleni ... 78
3.8. Testy nezávislosti ve dvourozměrném normál-
ni* rozděleni ........... 80
3.9. Srovnáni dvou binomických populaci ....... 82
3.10. Srovnáni dvou Polssonových populaci* • ..... 84
3.11. Test nezávislosti ve Ctyřpolnl
IcontingenČni tabulce .......•••• 86
3.12. Doplňky a cvičení ............ 89
Kapitola 4.
Testy dobré shody ............91
4.1. Pearsonův *y^2-test dobré shody........92
4.2. KoImogorov-Smirnovův test...........94
4.3. Doplňky a cvičeni ...........97
Literatura ...........100
-6
UNIVERZITA KARLOVA V PRAZE
Fakulta matematlcko-fyzikální
TESTY PARAMETRICKÝCH HYPOTÉZ
RNDr. Jana Jurečková, CSc.
Státní pedagogické nakladatelství
Praha
Kapitola 2
5ÍÄÍ02!ŽIDÍ-2£Í5ÍiDšiži-Í2SÍZ
2.1^Foraulace^probléau
Necht X je pozorovateLná náhodná veličina nebo náhodný vektor; vine. Se rozděleni pravděpodobnosti X tvoři sys~ těm (P " {p9' *€©J Pravděpodobnostních aěr na (3C,<5) -Necht H a K jsou dva disjunktní podsystémy (P takové, ie KuK ■
pft(X€AK) nazýváae velikosti testu (nebo vtU-
kosti kritického oboru ar). Pravděpodobnost chyby II.druhu při 9£©K jt rovna
(2.2) Pg(xe ah) - 1 - p8(xt ar), e s (2> K. Hodnotu pravděpodobnosti
(2.3) (5(9) - P^(xe ak), 9«©K
nazýváae sflou testu proti alternativě PQ (nebo stručně 0), et©K. Funkci (5(9) :@—» (o,l) nazýváae sUofunkcI příslušného tastu.
jestliže Je pevně stanoven počet pozorováni, nenůžeae současně alninalizovat pravděpodobnosti obou druhů chyb. Test,který by Bět ainiaálni pravděpodobnost chyby I.druhu, by odpovídat prázdnéau kritickému oboru, a jeho chyba II.druhu by aěla pravděpodobnost 1. Proto obvykle oaazujeae pravděpodobnost chyby I.druhu pevně zvolený* aalýa čislea ^ , 0(X).
Optimální volba testu je pak ekvivalentní následující maxima* Hzačnl úloze : mezi všemi testy 5 splňujícími
nalézt takový, pro který
(2.«) ř>|(®> * Ee ?(x> * stejnoměrně pro
Test, který splňuje (2.7) a (2.8), se nazývá stejnoměrně nejsilněji test velikosti £ d (stejnoměrně nejsllnějil »
(1) Pak pro lib. C P0(x)}; tato funkce je nerostoucí, zprava spojitá a taková, Že 11a oL(c) « 1 a Ui oUO 3 0. Pak k Hbovolněau «Lé ( 0,1) existuje k^O tak,že
(2.11)
kde jsae označili d(k-0) = 11a k-
Uvažujne test
2.12) £(x
1
cl-.l(k)
«L(k-0)-i( k)
když Pl(x) > k po(x)
když Pl(x) - k p0(x)
když Pl(x) < k p0(x)
Středni výraz na (2.12) není definován, pokud jt k bodea spojitosti oL(e) ; pak Je vlak p0{p.|(X) " « p0(x)3 * °* Velikost testu (2.12) je
(2.13) E„I(X) - P,
p«(X)
* «v( k-ay-A k) Po
P,(X)
= kt-
a tedy test i splňuje (2.9) a (2.10).
Zbývá dokázat, že test £ je nejs1lnějS1. Nechl i* libovolný jiný test takový, že E0$"(X) 6 . Nechl S* » - (x4Jt: l(x) - £"(x) > 0 J a S* • jxfcll&«)-§*(»)<
31
jestliže x€S*, Jt $(x) > O, a tedy p1( x) * k P0(x); podobně je p1(x) * k pQ( x) pro x€ s" ; odtud plyne
a tady
a taat 5 ja najvýla stejně aUný jako $ .
0. Protože je ($(x)- $*(x)). . (p1(x)-k p0(x))> 0 pro xé S, platí
[ ("$ - pxp^k p0)d^ -5°'
$*uS- S
a tedy
e
- > k E0[$(X) - $*(X)] ■ 0
• tedy £ *• •Unéjil než $ * proti alternativě K. To je vlak spor, a tedy ^C(S) ■ 0, což bylo třeba dokázat.
Kdyby velikost £ * byla ^ nebo Po = Pr
Důkaz : Test a <^ má velikost ol i silu c*. ;
test £ je alespoň stejně silný jako j> v a tedy (5 ■ " E1 í§(x> 4 ^ • Jestliže Je «1 = |3 < 1, je t«tt$1(x)5 S cC nejs1lnějS1 a podle věty 2.1, část (2),mus1 vyhovovat (2.9). Odtud plyne, že pQ( x) * P^x) s.v.[^U/], a tedy
2-3- Jesty^ Íednostranné_bj;potéz^ E^otl jednostranné_ alternativě.
Jestliže (P "{p9/ »£©^ j« systém rozděleni závislý na reálném nebo vektorové* parametru a (h) je Interval/ má test jednoduché hypotézy proti jedooduché alternativě splle teoretický význam. První krok k obecnějšímu modelu je případ systému závislého na jediném reálném parametru $ , ve kterém chceme testovat tzv. jednostrannou hypotézu : Ô * 90
proti jednostranné alternativě : 0>8o- Ani v tomto jednoduchém případě nemusí obecně existovat stejnoměrně nejsil-nějS1 test. Ukážeme, že SN test existuje, pokud je (P dominovaný systém, jehož věrobodnostnl poměr je monotónní funkci vhodné statistiky T(x). Tuto vlastnost má např. expoenclál-n1 systém s jediným reálným parametrem.
Definice 2.1. Necht (P » -[p^, 8«s(h)} je systém dominovaný 6* -konečnou mírou , kde © je podmnožina R1. ftekneme, že (P má monotónní poměr věrohodnosti, jestliže existuje reálná statistika T( x) taková, že pro Ub. 9 různá a poměr p^(x)/pfl(x) jejich
-33-
hustot je neklesající funkci T(x).
VÍTA 2.2. Wechl systéa rozděleni (P «= \ Pfl, Q€@| náhodné veličiny nebo náhodného vektoru^má aonotonnl poaěr věrohod-nostl vzhledea ke statistice T(x).
(1) Pak existuje stejnoaérně ne j silné j ŽU-test : 8 ^ 8
proti : 9 > 8Q, který aé tvar
f 1 když T(x) > C
(2.15) <£(x)
y když T(x) « C
0 když T(x) < C
kde konstanty C a ^ jsou určeny tak, aby platilo
(2.16) EÄ (X) «et .
O
(2) Sllofunkce ^(8) » Eg^(x) testu ^ je rostoucí n ■nožlně ^8 :^(«)< i]
Důkaz : Uvažujae nejprve hypotézu Ho : 8 = 8Q a nijakou
jednoduchou alternativu ei^e0- Podle věty 2.1 existuje nej silnější test takový, ie
Pg (*)
(x) -
■1 když ■ 1txj > C1 ( neboli T( x) > C
o
^ když T( x) ■ C
0 když T(x)< C
kde C a V jsou určena tak, aby platilo Eg ^(X) - JL • Podle věty 2.1, část (1) dále platí, že test $ je také najsilnejší pro hypotézu pqi proti alternativě Pg* na hladině
-34-
X= |S(3) pro všecka 9 , 9" ; 9< e'1 . Z důsledku věty 2.1 dále plyne, že silofunkce |3 (9) testu g> *e rostoucí v 9 . Z této nonotoníe dále plyne
(2.17) E05(X)^ d pro 0 ^ 80.
TMda A testů splňujících (2.17) je Části třídy 8 testů splňujících E& j£(X) £ * který Maximalizuje 0(9^ na třídě B, tim spiše maximalizuje (Ž>(Bt) na třídě A. Tist je žati* dokázáno, že <£ je nejsi lněj šíb oL -testem hypotézy H : 9 9o proti jednoduché alternativě 9^ . Protože však test ^ ve skutečnosti nezávisí na špeciálni alternativě 9^ je stejnoměrně nejsltnljšl pro
0<9Q. O.E.D.
Přiklad 1. Mechí partie N výrobků obsahuje H zmetků. Z partie vybereme náhodně n výrobků, které zkontrolujeme. Nechí X je počet zmetků zjištěných ve výběru. Chceme testovat hypotézu H : H ^ nQ proti K : «>«0- X stá hyper-geometrlcké rozděleni
MM
(2.18) PjX-x) « PM(x) » x; , x celé, *****
o
= 0 jinak
kde aBaax( M+n-N,Q) a b-«in(M,n).
Interpretujeme jako hustotu vzhledem k citaci miře,
která přiřazuje libovolné podmnožině počet nezáporných
celých čísel v ni obsažených. Pak platí PM+1(x) B "+1 N-H-n+x
pM( x) n^n " H + 1-X
35
a systém mé monotónni poměr věrohodnosti vzhledem k T(x) = x. Stejnoměrně nejsilnějši test H proti K zemité H , když X >C.
Poznámka. Uvažujme duální problém h : 6 - 8Q proti
X : 8 < 6Q. Pak SN test dostaneme převrácením nerovnosti ve
(2.15).
VETA 2.3. Necht systém rozděleni náhodného vektoru X je jednoparametrlcký exponenciálni systém s reálným parametrem 9 a hustotami (vzhledem k nějaké míře ) tvaru
(2.19) pe(x) h exp^c(8)T(x) + A( 0) ♦ B(x)j
kde c(0) je ryze monotónní funkce. Pak existuje stejnoměrně nejsilněji test $ hypotézy H : 0 * %Q proti K : 8 >eQ. Jestliže je c(0) rostoucí, má test tvar
1 když T(x) < C
(2.20) $(x) - \ J když T(x) « C
3 když T(x) > C
kde C a_ ^ jsou určena tak, že Ee tj?(x) = .
jestliže je c(9) klesající, je nejsilnéjii test analogický
(2.20) ; přisluiné nerovnosti jsou převrácené.
Důkaz. Snadno vidíme, že systém (2.19) má morotonnl poměr věrohodnosti vzhledem k T(x). Věta pak plyne z věty 2.2.
Přiklad 2. Systém binomických rozděleni £b(p,n), 0pQ zamitá H, jestliže počet úspěchů X překročí vhodnou konstantu C.
Podobnou hypotézu můžeme také testovat na základě jinak uspořádaného pokusu. Opakovaně provádíme alternativní pokus s pravděpodobnosti úspěchu p , dokud nedosáhneme celkového počtu m úspěchů. Necht Yj je počet pokusů, které provedeme mezi (1-1)-n1m a 1-tým úspěchem. Pak P(Y.my)«m(1-p)y, y-0,1,..., a tedy sdružené rozděleni Y.,...,V je
Ppír,,...,ya) » p'(i-p) ^ , rk-o,i,... ; k-i.
To je exponenciální systém s T( y) - > v* * c( P) "tog(1-p)
1-1 1
Protože c( p) je klesající v p, SN test pro H : P PQ proti K : P>PQ zamítá, když T je při liš malé. T(y) má negativně binomické rozděleni
Pít)
("** *j P- O-P)*, t-0,1,... .
Přiklad 3. Nechf X1,...,Xfl je nezávislý náhodný výběr z Poissonova rozděleni s EX1 Pak sdružené rozděleni
X1.....Xn *«
Ix1 !*)
p(x.......-Ja?
Xl'---Xn!
a tvoři tedy exponenciální sjetém, ve kterém je T( x) a x4,
1-1 1
:. a) ■ log A • Např. A může označovat hustotu provozu telefónni centrály a Xf jsou počty signálů, které dojdou do centrály během n stejně dlouhých nepřekrývajících se Časových Intervalů délky . SN test hypotézy H : X * X zaaité H při velkých hodnotách T(x) = £~ x^. Statistika
37
T(x) ná rovněž Poissonovo rozděleni s parametren
Hypotézu núžeme také testovat na základě inverzně uspořádaného pokusu: sledujeme centrálu tak dlouho, dokud nedojde ■ signálů. Nech! Y1/Y2'-*'/Ya Jsou délky Intervalů do prvního signálu, od prvního do druhého signálu, atd. Pak Y.,..., ...,Y(| jsou nezávislé a Y^ aá exponenciální hustotu Xe ^y y*0, 1-1,...,». Sdružená hustota Y1,...,Y|| je
p (y1/.../y||) - X" exp{f"^12!yi} ' y1/-«-^yB * °/
a tvoři exponenciálni systéa, kde T(y-/«..,y_) =2T y* • c(X) B - X • SN test pro H : \ * \Q zaaitá H při stalých hodnotách T *^ y^m Protože Z\ Y1 aá hustotu
0- u/2 ppo gig, což Je ^*-rozdělen1 o 2 stupních volnosti, aá 2\T rozděleni o 2a stupních vo Inostl .Kr111 c kou hodnotu testu tedy aúžeae najit v tabulkách \2 rozděleni.
i-í^Zobecněni_Neyaan-Pearsonova^leaaatu_
Následující věta je zobecněnla Neyaan-Pearsonova leaaatu; podle této věty existuje test hypotézy, složené z konečně ano-ha rozdftenl, proti jednoduché alternativě. Věta rovněž udává explicitní tvar testu.
VĚTA 2.4. Necht P^,...,PB+1 jsou rozděleni pravděpodobnosti na eukUdovskéa výběrovéa prostoru s hustota-a1_ vzhledea k a1ře (U> . Necht oL^,..s, oL m jsou dané konstanty, 0<^oi.,<1, 1*1,necht existuje
~3
alespoň jedna tesťova funkce vyhovující
(2,21) j^(x)fi(x)d^/ = d^, 1-1,...,*.
Označee £. *nožinu viech testových funkci splňujících
(2.21) . Pak
(I) existuje JlJ k1fl(«)
(2.23) $(x)W
kde k.,,...,^ jsou konstanty, pak ^ *axi*al1zuje (2.22)
na ^ ■ Jestliže kro*ě toho platí k<1/.../k|| * 0, pak
^ *ax1*al1zujo (2.22) na *nož1ně viech testových funkci splňujících
(2.24) ^jF(x) *4(x)d^ 4 Aa/ 1-1,...,«. (111) Množina NCR1, dané výraze*
(2.25) N «^( ^J(x)f1(x)d^ J(x)fB(x)d^}:?62^
kde 2) je množina viech testových funkci, je konvexní a uzavřená. Jestliže (ol1#..., o^) je vnitřní bod množiny M , pak existuje optiaálni test p vyhovující vztahů* (2.21), (2.23), který *ax1*al1zuje (2.22).
Důkaz; (1) Nechí j^f> nj Je posloupnost testových funkci
39-
taková, že
Protože anožlna testových funkci je koapaktni vzhledea ke slabé konvergenci, existuje podposloupnost J a testová funkce 5 tak' že
Z (2.21) plyne, že £ ^ £ a že 5 aaxlaallzuje Integrál (2.22) na L .
(11) Nechl test je tvaru (2.23) ánechí je li-
bovolný jiný test. Nechl
a S" » |x 6. £ : £ " 5* < °} • Pro xéS + je fa + 1(x)*
k,f.(x) a pro xés' je f-.-U) k4*«(*)j tedy
1 1 B+1 1«1 1 1
P a_
s u s
odkud vyplývá
(2.26) ^ £" £">f-1 "f* k^(5"F)f BaxiaaUzuje (2.22) na £, . Jestliže kroaě toho k^-., ...,kfl - 0, ja pravá strana (2.26) nezáporná pro libovolný test * splňující (2.24). T1a ja dokázána část (11).
-40
(111) Konvexita množiny M je zřejmá a uzavřenost N plyne z toho, že množina 3) viech testových funkci je kompaktní vzhledem ke slabé konvergenci. Necht NCR**1 , kde
■ ■{ «I*2)}.
Pak N je také konvexní a uzavřená a množina
jt uzavřený Interval <^ot*, ot**^ . Uvažujae zvtéll případ +1ÍO. Bez újay obecnosti aůžeae položit kB+1" ~1 • D«* Pr« *«*dý bod množiny H platí
(2.27) u.+1 - J k, *i
Necht J* *•»* takový, te j 5** fi <*(^ 0
1-1,a ^<£*HI f d^ ■ cL**. Pak pro libovolný Jiný
test vzhledea ke (2.27) platí
(2.2») iicwzlsvV 5í""(w|\^ '
41
a tady ^** ■•xlaaHzuje Integrál na levé straně (2.2$) přes vlečky testové funkce. Tento Integrál je vlak aaxiaálnl, jt-U ».v. [aJ] rovno
f 1 kdyÍ fB*1
£""(x) « j
. 0 když f|#1(l)<í kafa(«)
což je shodné s (2.23).
b) Mecht ol* ■ +1 « 2^ ktfj s.v.C^; necht 0 < oL < 1. Pak existuje test ^ tak,že Ei (£(X)».L (1-1,...,■) _•_ E-+1 ^>(X)>«^.
Důkaz provedeme Indukci podle a. Pro m-1 plyne tvrzeni v důsledku věty 2.1. Předpokládejme, že tvrzeni plati pro Lib.systém ■ rozděleni a necht jsou dány lineárně nezávislé hustoty f.,..«,f_..« Pak jsou 1 lineárně ne-
závislé a pro každé jB1,...,m podle indukčního předpokladu existuji testy J j ■ £j tak,že E1 £j(X) « E^^X)-* oL J»ro 1-1,2,..., a Ej j(X) < ^ <
< Ej É j(x>- odtud vyPl*v*/ *• D0d (ct. oL ) € «B je
vnitřním bodem množiny M definován* v části (111) věty (2.4), a platí tvrzeni (111) věty 2.4, Protože temt ~§_(x) * cL splňuje podmínku E^ ^(X) - oL * 1"1,..»,»+1/ existuje alespoň jedeni test, pro který je EH+i £(X) * ct . Kdyby tato nerovnost platila pouze jako rovnost pro vlečky testy, byl by test ( x) ■ oL optimálni a vyhovoval by (2.23). Protože 0<.L<1, dostáváme, že musi platí f|B+1 ■ ■ ^ k^f^ s.v.[^uT| , což je spor. fl.E.D.
2.5 _Tes ty_obou8tranných_hy_potéz
Jestliže 9 je reálný parametr, pak kromě jednostranné hypotézy uvažované ve 2.3 přicházejí v úvahu dalěi přirozené hypotézy a alternativy:
-43-
H2 : 9 4 91 nebo 9 > 92 (61 < 9g) proti K2 : 91< ©<ô2 ;
H3 : 91 * 0 ^ 82 proti K3 : 9<91 nebo 9> 92 H4 : 9 = 9Q proti K4 : 9 / 9Q •
Jestliže uvažovaný systém rozděleni je jednoparaaetrlcký exponenciální systém, dovedeae nalézt stejnoaěrně nejsilnějěl test hypotézy H2 proti alternativě K2; k toau použijeme větu 2.4. Bohužel neexistuji stejnoměrně nejsílnějěi testy H3 proti K3 ani H4 proti *4. Z věty 2.2 vyplývá, že testy , nesilnějěi proti alternativám 9>92 maji rostoucí silofukci, zatímco testy nejsilnějil proti alternativám 9<9<] maji klesající silofunkci; neexistuji tedy testy stejnoaěrně nejsilnějěi proti věea alternativám 9<9^ nebo 9>92. Chceme-li nalézt vhodné testy hypotéz H? a H4, musíme omezit třídu testů, mezi kterými hledáme optimum, např. na třídu nestranných testů. 0 tomto problému bude pojednávat aásledujlci kapitola.
V této kapitole zkonstruujeme stejnoaěrně nejsilnějSi test Hg proti K2 v jednoparaaetrickéa exponenciálním systému.
VETA 2.5. Hecht rozděleni pravděpodobnosti náhodného vektoru X tvoři jednoparaaetrický exponenciálni systém s reálným paraaetrea 9 a a hustotami (vzhledea k nějaké aiře ^xs )
(2.29) pft(x) » exp£c(9)T(x) ♦ A(8) + B(x)j kde c(9) je ryze rostoucí funkce.
44
( i) Pak existuje stejnoaěrně nejs1lnějS1 test hypotézy H2 : «ťfl1 nebo 0 * 92 (S1 < 92) proti alternativě K. : 91<9<8- daný vztahea
(2.30) C2
kde C^Cg,^ a jsou určeny tak, aby platilo
(2.31) Ee {(X) » EB £(X)»JL, 0e2.
Důkaz, Protože T je postačující statistika, stačí hledat nejs1lnějS1 test mezi testy, které jsou funkceai \p(T) postačující statistiky, 0 * y( T) * 1. Hustotu (2.29) aúžeae psát jako hustotu vzhledea k aíře eB^x^d^_(x) ve tvaru exp -[c(e)T(x) + *(©)} . Přenosea Integrace odtud dostávané, že statistika T : (£,(&) hustotu
(2.32) pe(t) * exp|c(9)t + A( B)j
vzhledea k nějaké ailře * na & .
Zvolae pevně nějakou alternativu e' € (O^,^) a hle-dejae test který aaxlaallzuje E^l^?) "ez< vSe"
■1 testy vyhovuj1c1a1 E^tj^1) * E9 ^ T* * °^ * Nech* n je anožina všech bodů (E^t), E^yd)), kde y probíhá
45-
viecky testové funkce. Podle tvrzeni věty 2.4 ausiae
ověřit, zda (oL,«L) je vnitřní bod N. Podle důsledku věty
2.4 viak existuji u./U- ; 0 < u. «£ «L < u,< 1, tak, žeW^u,)**. a 'í>-/U2)fcM; kroaě tono Xu,u)£ H pro vS.
u€.(0,1) =^ (d/oC) je skutečně vnitrnia bodem M• Podle čisti (iii) věty 2.4 pak existuji konstanty k^fcj a test Yo(t) tak' žt ?0(x) " Yo(TÍX)) vyhovuje (2.31) a
(t) = 1 když
k, «xp t + + k2 exp(c(e2)t + A(82)} <
< exp {c(e')t ♦ A(B*)}
neboli
b.t b.t (2.33) a1 e 1 + a2 e 2 < 1 (b1<0 1.
Dokážeae sporea, že a1 > 0 1 a2>0 : kdyby «1/«2 - 0,
test by pořád zaaital; kdyby a1 * 0<>2 nebo a2 4 0 0 a b1<082 , což je tvrzeni(H). Srovnáni* s testea t) s oL pak dostáváee E^^CT) £ oU
pro e á e1 a 9 * 82. Tli je dokázáno (1). Q.E.D.
K toau, abychoa určili C,,C2, ausime oviem sta-
novit rozděleni testové statistiky T. Ale ani pak neni volba c<|*c2* Y^' jfz "ela průhledná. Podainky (2.31) aůžeae pak přepsat ve tvaru
p<*1> " S *»a(t) + V'"'1' V™2' * ^'
C1 1*1,2.
V praxi aůžeae postupovat tak, že vyjdeme z nějakých počátečních hodnot cf, a k nia určiae C*,^-* *•
(?>*(^) " oL • Pak vypočteae (J*(82) a porovnáme s • Jestliže je (3 *(82) < ct , «usi bu5 platit C, > C* nebo
C1 s Cí a ^1 < ľ*" ' C0Í znaB,n*' že skutéin* *""tt*cký obor leží zprávo od předpokládaného. Jestliže je (5*(82>> / ausi platit opačné nerovnosti.
2.6._ .Nejaéně_př1zn1vé rozděleni
Podle věty 2.1 aůžeae zkonstruovat test jednoduché hypotézy proti jednoduché alternativě. Věta 2.4 rozšiřuje tuto konstrukci na testy hypotézy složené z konečně mnoha hodnot proti jednoduché alternativě.
Necht (P = : Bé©} je dominovaný systém rozděleni
a uvažujae probléa testu složené hypotézy H : BéQ, proti
-47
jednoduché alternativě K : 8 * 9^. Ptáme se, za jakých okol nosti aůžeae složenou hypotézu H nahradit jednoduchou tak,že nejsilnější test nové hypotézy proti K poskytuje zároveň nejsilnější test H proti K.
Očekávané, Že jednoduchá hypotéza, která nahrazuje H, bude váženýa průměrem všech rozděleni z H. OznaČiae-Li fQ( x) hustotou Pg, Se©, pak nová hypotéza bude nit tvar
(2.34) HA : h^(x) = ^ fe(x)d A(8)
©o
kde X je vhodné rozděleni pravděpodobnosti na (£) . Jestliže jsme stanovili X a tia 1 ,dovedené pomoci věty 2.1 nalézt nejsilnější test proti K• Otevřenou zbývá otázka, jak vhodně stanovit X / což je vlastně Lagrangeův ■ultiptikátor.
Protože H mezi sebou nerozlišuje hodnoty 9é@Q/ aá 1 být stejně vhodné pro všecka 8 6 ©0/ i pro
hodnoty nejbližii alternativě Bj . Intuitivně je zřejné, že rozděleni \ ausi být nejaéné příznivé, tj. pro libovolné jiné rozděleni ausi platit * č>^' , kde (3X ^i] je sila nejsilnějšiho testu [ H^' ] proti K. Tuto doaněn-
ku potvrzuje 1 následující věta.
VĚTA 2.6. Necht dominovaný systém
rozděleni s hustotaal ffi(x) vzhledea k <Ó -konečné niře
(Uy - Uvažujme probléa testováni hypotézy H : 8fc(5)0 proti K : 8 » 8.J ^ ©0*
-48-
Nechí existuje € -algebra 3) podmnožin © taková,že
hustoty fg(x) jsou zároveň měřitelné v 9 i v_x. Předpokládejme, že existuje rozděleni pravděpodobnosti X na 23 takové, že nejsilnéjži -test íJST^ pro testováni proti K má velikost £ oO také jako test H proti K. Pak
(a) Test 1[ je nejsilnějSi oC -test H frroti K.
A
(b) Jestliže je jediným nejsilnéjSim <£, -testem pro
proti K, je 1 jediným nejsllnějiim oL -testem H proti K.
(c) Rozděleni A je nejméně příznivé.
Důkaz. 2 Fubiniho věty plyne, že h^ je hustotou vzhle-
dem k ^/ , tj. J h^(x)d^.(x) •= 1.
Nechí 5^ má velikost £ oU i pro H proti K a nechí ^> * je libovolný jiný ot -test H proti K. Pak
^$" k j fe(x)d ^(«)
Jestliže fe(x) < k (j fg(x)d ^(8).
Jestliže test %^ splňuje
(2.36) E'<£,(X) - sup EeI.(X) = cL ©
pak je nejsilnějslm oL -testem H proti K.
Poznámka. Věty 2.3 a 2.5 jsou jednoduchými aplikacemi věty
2.6. Množina na které je soustředěno nejméně příznivé rozděleni, je v prvním případě složena z jediného bodu 8Q a ve druhém případě ze dvou bodů 8^ a B2-
2.7. _ _Ag M kace na^t es to váni j;po téz_o_rozgt^ lu normálního^
rozděleni
Mechl X1#...,Xn je náhodný výběr z normálního rozděleni N( J , £*), n > 3 . Uvažujme hypotézy
-50
H, «{( j ,*■>•€ a 60} Proti k4 i{(^C)i G< (fj
a
H2 : {( 6 6 (J o] proti k2 : {(^g): G >Go} .
Hypotézy se týkají pouze parametru £ , zatímco £ je rušivým parametrem. Obvykle píšeme hypotézy a alternatív' ve zkrácenéa tvaru : € ä &Q apod.
S použitia teorie dosud odvozené v této kapitole můžeme odvodit stejnoměrně nejsilnějSi test hypotézy proti a ukázat, že neexistuje stejnoaěrně nejsilnějii test h^ proti •
Uvažujae nejprve hypotézu proti jednoduché alterna-
tivo : ^ * §1*^*^1 (^1<^* Bude"e nl*d«t
nejméně příznivé rozděleni pro hypotézu vzhledea ke .
očekáváme, že rozděleni v rovině (^/^) , nejaéně příznivé vzhle ke K^, bude soustředěno na přiace ^ 0 ^ -
Nejaéně příznivé rozděleni A aá být takové, že rozděleni (X1,-.«,Xn) za hypotézy H^ je co nejbliže rozděleni (X1,...,Xn) za alternativy kJ, které aá hustotu
(2.37) rj'*(2lf )"B/2 exp - J-^ xr í= ,) 2
Poaoci důsledku věty 2.6 dokážeae. Že nejaéně příznivé rozděleni X přiřazuje pravděpodobnost 1 bodu ( jjľ^0)* Skutečně, dosadine-li takové % do (2.35), dostaneme
-51-
(2.38) (x)
r 1 jestliže (2irrJ2)"n/2 exp
26, i=1
O jestliže platí opačná nerovnost.
Test BŮže»e přepsat ve tvaru
M je.tUíe A_(xi- \J* " c
(2.39)
lX(x) -
^0 jestliže
)2>c
Podle důsledku věty 2.6 ]e rozděleni \ nejaéně příznivé, jestliže platí
Př1 libovolnéa pevnéa 6 je P_g| 5^ (X|- ^)2 é C j rovna pravděpodobnosti, že nehodný výběr z N(^u, 6f2) padne do koule se středea ^ a poloaěrea VT . Naxiaua této pravděpodobnosti při pevnéa £ nastane pro íj = a je
rovno
0,1
kde X°,...,X° jsou nezávislé náhodné veličiny s rozdelenia 1(0,1). Pravá strana (2.42) je klesající v éf a tedy nabývá aaxiaa pro konstanta C je dána vztahea
52
C = ^Í-Xft1-*)) kdt Xnt1'^ *e 100(1-oL)-ppocentn1 kritická hodnota rozděleni o n stupních volnosti.
Ze (2.40) a z důsledku věty (2.6) vyplývá, že test $^(2.39) je nejsilnějšin testem hypotézy H1 : ■> £ proti alternativě : ^= ťT = 6'1(<60). Protože 5^ nezávisí na zvoleném 6" 1 | je i stejnoměrně nej silněj 51 a testem hypotézy : (T * £To proti alternativě K.J' : j * j,, €"<(T0» Na druhé straně, protože "5^ závisí na zvolené hodnotě ^ ^ neexistuje stejnoměrně nejsilnějěl test proti K|•
Nyni uvažujme hypotézu H2 : ^©** ste^ní í*k0 v Pevním případě očekáváme, že nejméně příznivé rozděleni bude soustře
děno na přímce 6 u
n
Z faktorizačnl věty plyne, že statistiky Y » iy x,« = X a Z =2_.(x^"x) jsou postačující pro parametr ,£) « Stačí tedy omezit své úvahy na tyto postačující statistiky. Jak je známo (viz např. Anděl [i ] „kap.V,věta 18), jsou Y a Z nezávislé, Y má rozděleni N( íj , §-) a má
rozděleni ^ (n-1). Jestliže ^(^) je rozděleni v rovině (^,6*), soustředěné na přímce Š = 6^, pak sdružené rozděleni Y,Z za platnosti hypotézy má hustotu
(2.42) (^,1/2 (^.)C--1)/2p(«-l, _zl
0 l 2G?J
exp
o
y"5} d*<§>
zatímco za platnosti xJ Ba hustotu
-53-
2.43) USr)1'2 2(°-1)/2 r(itl) (i-)íB-«/2«p
- m
exp
Ukážeae, že nejméně příznivé rozděleni X( ^) hypotézy vzhledeei ke *2 je noraálM N( J ff2)/n) . Dc*ad1ae-U
toto X do (2.42), dostanea-e za integrálem konvolucl dvou nor ■élnich rozděleni (až na noraallzačni konstantu) N(0, G2/n)
• N( " ^o/^' což je N( ^S^/n). Sdružené roz-
děleni (V,Z) za aá pak hustotu
(^n_)1/2 2(n-1)/2 p(n^l)(Z_^n-3)/2 e-Z /2GQ2 J_
exp
Test * vyjádřený v závislosti na postačujících statistikách 1,1, Bá pak tvar
Ž&(y#«) ■ 1 Jestliže z * c.
nebo 11
(2.44) £-(x) = 1 jestliže Í (x.-x)2 * C.
1-1 1
Pr.vcepodoono.t ^(X,-!)' > c}- P^j^C X^X)
nezávisí na J i je rostoucí v 5 . Jsou tedy splněny předpoklady důsledku věty (2.6) a test (2.44) je stejnoměrné nejsUnějěia) testem H2 : £f * fJo proti K? : 6>6>0; pM-to. C = 6*. Vn-1(cU' kd# ^n-1^> *e 100cL-procentn1
54
kritická hodnota rozdělení \^ o (n-1) stupních volnosti. £•§•- _Doplňky_a^cvi čen1^
(1) Necht X1,...#X(| a f1#...#Yn jsou nezávislé výběry z N( ^,1) a N(^,1). Uvažujme hypotézu H : ^ * j proti alternativě K : *j > ^ • Pak existuje stejnoměrně nejsilnějSi test, který zamitá H při velkých hodnotách Y - í".
[_Návod : Zvolime-li pevnou alternatívu k': ^6*.
(a) Jestliže jsou známy hodnoty ^ 1 a existuje
stejnoměrně nejsilnějSi test s kritickým oborem
n 0
c \ 2
)
— - c
)
1=1 1 J
(b) Jestliže hodnoty ^ a í2 nejsou známy, neexis-
tuje stejnoměrně nejsilnějSi test.
(3) Stanovte sllofunkd testu (2.45) hypotézy N^ : CáG^
proti K.: G" >0f o rozptylu normálního rozděleni.
z o
(4) Necht X,/.../Xn je náhodný výběr z rozděleni gama s hustotou
55-
■p,i ía) * -=- ' x>0, ^>0, p>0
I (p)
O jinde.
Předpokládejme, že p je známo a 1 je neznámý parametr měřítka. Ukažte, že stejnoměrně nejsilněji* test H tle J proti K i ^>J^ ■* kritický obor V" X1 > C, kde
c ■ "t"™ 9n (1-cC) a g (1-oC) je 1Q0( 1-«L)-procentni kri tická hodnota rozděleni gama s parametry np,1.
56