MULTIVARIÁTNA ANALÝZA 2 1. Kvadratické formy Definícia 1.1. Nech Xi,X2, ...,X„ sú nezávislé, ÍV(0, 1) rozdelené náhodné veličiny. Potom Y = X21+X22+... + X2n má rozdelenie x\ (centrálne chĺ kvadrát rozdelenie s n stupňami voľnosti). Veta 1.2. Nech Y ~ x\- Y má hustotu 1 e 2 y 2 x pre y > 0, /»(y) = 4 2fr(t; 0 inde. Dôkaz. Pozri [Anděl, str. 79]. Poznámka. Xn rozdelenie je špeciálny prípad gama rozdelenia s parametrami a, p (a > 0,p > 0), ktoré má hustotu m Označujeme ho T(a,p). Platí, že Xn Je rozdelenie T Q, -j). ( T» = J^e-Hr^dt, p>0.) Definícia 1.3. Nech Xi,X2} ...}Xn sú nezávislé, X. i ~ N(/ii,l), i = 1,2,..., n. JVecŕi A = X^r=i /-*? Ť^ 0- Náhodná veličina Y = X2+X22+... + X2n má necentralne x2 rozdelenie s n stupňami voľnosti a oeňcientom necentrality A. Označujeme ho x2n \- Veta 1.4. JVecŕi X\, X2,..., Xn sú nezávislé, X{ ~ N(/ii, 1), z = 1,2,..., n. Rozdelenie pravdepodobnosti náhodnej veličiny Y = ^ľ=i -^2> (teda x2n \, kde A = Sľ=i /"D závisí len od n a X (nezávisí od jednotlivých /j\,..., /inJ. Dôkaz. Pozri [Anděl, str. 80]. 1 z Lema 1.5. Nech X ~ N(jj, 1). Náhodná veličina X2 má hustotu t+V /.v=(<)= { J2isft V ' 2! ' 4! e — '! + e!í + W +. , i>0. O í<0. Dôkaz. X2 má distribučnú funkciu pre t > O Fx2(t) = P{X2 0 Vt -I c n 2 1 Q-m) Ví v2tt : e 2 (/x. „ . , dFX-2Ít) 1 1 (VT-m)2 1 1 (-VT-M)2 dt 2VÍVŽ 7T 2VÍV2ŤŤ .i+nl e 2 'eiíVi + e-iiVt 2VÍVŽ 7T .i+nl e 2 í1 + f^t + {f^_+ , Vz^Vi V ' 2! ' 4! Samozrejme pre t ^ 0 je fx2(t) = 0. D Poznámka. Použili sme vzorec d fß(y) fß(y) d f (x,y) — f(x,y)dx = ----—2—dx+ß'(y)f[ß(y),y] -a'(y)f[a(y),y]. ty Ja(y) Ja(y) ÔV Počítajme teraz charakteristickú funkciu náhodnej veličiny £ = XÁ ^(t)=S(e^) itx f^(x)da 00 _£+Ü e 2 / . /i2x (jj2x)2 2ttVž V + 2! + 4! + ... ) dx. Postupne pre prvý člen '2tT .E+J± e e 2 x 2dx e 2 '2tT "^ lt^x 2dx (substitúcia x(y — it) = w) ó Pre druhý člen 1 V2tt Jo (substitúcia z(4 — it) = w) 2 2 —-Ľ— r-oo /j e 2 ' 2 — — /-»o ,jťaľ,_£±ii___i/i X ^ _ /i e 2 j __x(i_it)xa_ldx e e 2 z 2 2! -dx 2!V2tt Jo u; 2 I - ^)3 2!V2tt Jo Pre tretí člen 1 r0^-*^-! (^)2*2 :x?(t)4>xš(t)-4>x*(t) 't Tk „2 g l_2it Z^J=1 ^J it A el-2it 'l-2zt)l (l-2zt)ľ kde A = Y,j=i(A 4 Veta 1.6. Nech náhodné premenné Xi, X2, ...,X„ s ú nezávislé, X{ ~ N(/ii, 1), z 1, 2,..., n. Potom i=l i=l má x\ g rozdelenie práve vtedy ak (i) 7i = O alebo 1 pre i = 1, 2,..., n, (ii) ak 7i = O =>■ &i = O pre z = 1, 2,..., n, AJc sú podmienky (i),(n) a (iii) splnené, tak k = ^ľ=i H a $ = Sľ=i 7«(^« + /^í)2-Dôkaz. Porovnáme charakteristické funkcie V't(-) a í/>y(-), kde Y ^ \\ s- Platí /, V>t(í) = f {eltT) = S it E"=i 7^+2 £"=i &JxJ+c+2E^=1 6,-X,- 7j7ÍO 7j7ÍO 7j=0 \ V £ /« v E%i 7í(*í+%)2+c-£'}=1 | + 2E'i-, 6,-x 3-7i ^0 J = ± 7i 7i ^0 7i =0 \ iť y-n !i_ ^ J = l 7j 7i ^0 . i*2E"-=1 6,-X,- £ I e tí=o IP 7i ^0 bi \2 **7i [Xj + ^T it \^n -L 7i ^0 n^(26i*) n^fr;*) 7i =0 J = l 7i ^0 kde & ~ iV f/i, + £-, l) ak 7í ^ O a & ~ iV (/i,, 1) ak 7í = 0. Podľa (1.2) je ;i.4) VtW , V 7i #0 /g 7i =0 7i =0 b,' \2 7i ^0 7 f I M f + 77T- 7i #0 Podľa (1.3) pre charakteristickú funkciu y ~ \\ s platí Porovnaním (1.4) a (1.5) musí platiť pre každé t G TZ Y[ y/l - 2itfj = JJVl -lit j=l 1=1 7i ^0 a súčasne 2 T^n 1,2 -. TT^n J \ J h g V Tj^O /g 7j=0 7j=0 g 7j7Í0 _ gil^it z čoho je jasne vidieť, ako dokončíme dôkaz. D Veta 1.7. Nech £ ~ Nn(jx,l), AH)n je symetrická, b G TZn a c G TZ. Náhodná premenná T = £' A£ + 2b'^ + c má \\ s rozdelenie práve vtedy ak (i) A2 = A, (ii) b G /i(A), (jíjV c = b'b. AJc sú podmienky (i),(n) a (iii) splnené, tak k = h(A), S = (b + /í)'A(b + /a). Dôkaz. Pre A existuje ortogonálna matica P, že platí P'AP = A (diagonálna matica), P'P = PP' = I (pozri napr. Rao, str. 62). Potom rj = P'£ ~ N(P'fi,ľ) a £ = P77. Preto T = £'A£ + 2b'£ + c = íy'P'APíy + 2b'Pí7 + c = rj'Arj + 2b'Pí7 + c. Podľa vety 1.6 má T rozdelenie \\ s práve vtedy ak (i) {A}tl = 0 alebo 1 pre\ = 1,2,...,n ^ A2 = A & P'APP'AP = P'A2P = PAP <& A2 = A, (ii) {A}ii = 0 => {P'b}i = 0, čo je ekvivalentné s tým, že P'b G /u(A) <^ PP'b = b G /i(PP'AP) = /i(AP) = /i(A), (iii) c = (b'P)P'b = b'b. Ak sú podmienky (i),(ii) a (iii) splnené, potom podľa vety 1.6 k = J^=1{A}^ = trA = h(A) = /í(PAP') = h(A) a S = Eľ=i{A}"({P'b}* + {P'/*}»)2 = (b'P + ^'P)A(P'b + P'n) = (b + /i)'PAP'(b + /a) = (b + A*)'A(b + fi). D Veta 1.8. Nech £ ~ Nn(jx, S), Anjn je symetrická, h G 7\!.n a c G 7£. Náhodná premenná T = ^'A^ + 2b'^ + c má x| á rozdelenie práve vtedy ak (i) SASAS = SAS & (SA)3 = (SA)2, (ii) S(Aa* + b) G /í(SAS), (jii) (A/A + b)'S(A/i + b) = n'Ap + 2b'/i + c. AJc sú podmienky (i),(n) a (iii) splnené, tak k = tr(AS) a S = (b + A/í)'SAS(b + Am). Dôkaz. Faktorizujeme maticu S = 33', kde J je typu n x /i(S) (pozri Anděl, str. 64). Vieme, že P{£ = ß + «M = 1, kde 77 ~ ÍVÄ(S)(0,I) (Anděl, str. 76). Teda T = £'A£ + 2b'£ + c=(n + Jí7)'A(^ + Jíy) + 2bV + Jíy) + c = ö = rj'3'A3rj + 2(/z + 3rj)'3rj + fiAfi + 2b'fi + c. Podľa vety 1.7 má T rozdelenie x| $ práve vtedy ak (1) J'AJJ'AJ = J'AJ, (2) J'(AA* + b)G/i(J'AJ), (3) (Afi + b)'JJ'(A/i + b) = n'An + 2b> + c. Ďalej platí J'AJJ'AJ = JAJ =>■ JJ'AJJ'AJJ' = JJ'AJJ', čiže SASAS = SAS, a tiež naopak SASAS = SAS =>■ JJ'AJJ'AJJ' = JJ'AJJ' =>■ (J'J)"1 J'. JJ'AJJ'AJJ'. J(J'J)-1 = (J'J)"1 J'. JJ'AJJ'. J(J'J)"1, čiže J'AJJ'AJ = JAJ, čo dokazuje prvú časť (i). Ekvivalencia SASAS = SAS & (SA)3 = (SA)2 je jedným smerom (=£>) zrejmá. Ku opaku potrebujeme nasledovné tvrdenie (1.6) 3 T>n,n ■ SAS = SASAD. Tvrdenie (1.6) dokážeme takto: /í(SAS) = h(33'A33') ^ /z((J'J)_1 J'.JJ'AJJ'.J(J'J)-1) = h(3'A3). Podľa Anděl, str. 62 je (1.7) h(3'A3) = h(3'A33'A3) ^ h(33'A33'A3) = /z(SASAJ), ale /z(SASAJ) = h(33'A33'A3) ^ /z((J'J)_1 J'.JJ'AJJ'AJ) = (1.8) =h(3'A33'A3) = h(3'A3)} a preto z (1.7) a (1.8) /í(SAS) = /z(SASAJ) ^ /z(SASA) ^ /z(SAS), teda /z(SASA) = /z(SAS). Y Pretože zrejme //(SASA) C /í(SAS) a hodnosti matíc vytvárajúcich tieto pod-priestory sa rovnajú, platí /i(SASA) =/i(SAS) a dostávame vzťah (1.6). Z predpokladu (SA)3 = (SA)2 pomocou (1.6) dostávame SASASAD = SASAD =>■ SASAS = SAS, čím sme (i) úplne dokázali. Poďme teraz dokázať (ii), čiže dokázať, že J'(Afi + b) G /i(J'AJ) <& S(Aa* + b) G /í(SAS). Ak J'(A/a + b) G /i(J'AJ), tak 3J'(Afi + b) G /i(JJ'AJ) = /i(SAJ) = = /i(SAJJ'AS) = /i(SASAS) = /i(SAS) (podľa (i)). Naopak ak £(Aj* + b) G /i(SAS), tak (J'J)"1 J'.JJ'(A/a + b) = J'(A/a + b) G /í((J'J)_1 J'.JJ'AJJ') = /í(J'AJJ') C /í(J'AJ), čím sme dokázali (ii). Samozrejme (iii) už máme dokázané (je ekvivalentné (1)). Dôkaz vety už dokončíme jednoducho. Podľa vety 1.7 je totiž k = h(JJ'A) = tr(SA) = tr(AS) a S = ([J'(Afi + b)]'J'AJ[J'(AA* + b)]) = (Afi + b)'SAS(A/i + b). D Uvedieme bez dôkazu vety o nezávislosti kvadratických foriem. Podrobnejšie pozri [Rao, Mitra, kapitola 9]. Veta 1.9. JVeci Y ~ Np(fi, S) a Q1 = Y'AY, Q2 = Y'BY dve kvadratické formy Nutné a postačujúce podmienky nezávislosti Q\ a Q2 sú (a) SASBS = 0,SASB/i = 0, EBEA/i = 0 a /í'ASB/í = 0; ak A a B sú symetrické, nemusia byť pozitívne semidennitne, pričom S nemusí byť regulárna. (b) ASBS = 0, ASB/i = 0, ak A je pozitívne semidefínitná. (c) ASB = 0, ak A aj B sú pozitívne semidennitne. (d) ASB = 0, ak S je regulárna, A a B sú symetrické, nemusia byť pozitívne semidennitne. Veta 1.10. JVeci Y ~ Np(fi, S) a Qx = Y'AY + 2a'Y + a, Q2 = Y'BY + 2b'Y+/3 dve lineárne-kvadratické formy. Nutné a postačujúce podmienky nezávislosti Q\ a Q2 sú (a) SASBS = 0, SASb = 0, SBSa = 0 a a'Sb = 0, ak fi = 0, pričom S nemusí byť regulárna. (b) ASB = 0, BSa = 0, ASb = 0 a a'Sb = 0, ak S je regulárna, pričom fi môže byť aj nenulový vektor. 2. wlshartovo rozdelenie 2.1. Úvodné poznámky a definícia Majme U^ ~ Np(fii,'Ľ), i = 1,2,..., k, ktoré sú nezávislé, S je pozitívne definitná matica. Označme U^ = (Un, U2i}..., Upi)', Yj = (ř/ji, Uj2, •••, Ujk)', j = 8 1,2,...,p a (U\\ u12 u13 ... Ulk\ U21 U22 U23 ■■■ U2k Mp,k- \ Upi Up2 Up3 . . . Upk / Teda í3.\ u* = (\j1\u1\..:.uh Y' \ M. p / Ďalej označme M A*21 A*22 A*23 p,k Vlk\ P>2k J (^■.^■■■■■Hk, \^pl I^p2 I^p3 ■ ■ ■ l^pk Pre pevný vektor 1 £ 1ZP sú náhodné veličiny l'Ui ~ ÍV(1'a*í, l'Sl = (J;2), z = 1, 2,..., A; nezávislé (lebo U i sú nezávislé). Náhodný vektormi = íY^i je lineárna kombinácia normálne rozdelených nezávislých náhodných vektorov, pričom (2.1) lY-iV^Ml,^2^). Ak b = (&i, &25---j frfc)'je vektor konštánt, tak (2.2) U'h = 61 Ui + ... + &*U* ~ iVp(M'b, b'bS). Poznámka. Nech / on • ■ aln \ /í»ll • • • 6ia\ 0.21 ■ 02n 1 ti r, s — &21 • • • b2s \ami Q"mn ' \6ri . ■ ■ brs / Kroneckerov súčin matíc A a B je A (8) B / aiiB ai2B ... alnB \ Ü2lB Ü22B ... 02nB \amiB am2B ... amnB/ Vlastnosti kroneckerovho súčinu matíc pozri napr. v [Rao]. 9 Ak napíšeme "pod seba" stĺpce matice K, povieme, že sme vykonali na matici operáciu vec. Teda /Ul\ í u2 vecU = UkP,i = VuJ Ukážte, že (2.3) vecU' = U ~ Nkp(vecM',Ik,k <£> ^P,P) a (2.2) sa dá zapísať ako (2.4) U'h = (b' <8> IM)ueeW' ~ iVp((b' ® IP)P)vecM\ (W <8> 1^(1^ <8> 5^)(b <8> IPlP)). Poznámka. Nech bi ^ b2, bi,b2 G 7£fe. Platí cao{U'huU'h2) = (b'x ® IPii))(I (8) S)(bi <8> I,,,,) = b;b2 ® S = b'^E. Ak b'xb2 = 0, t.j. ak bi a b2 sú ortogonálně, tak U'hi a Wb2 sú neskorelované, t.j. v tomto prípade nezávislé. Podľa predchádzajúcej poznámky ľahko dokážeme nasledujúcu lemu Lema 2.1. Ak bi, b2,..., br, r ^k tvorí ortonormálny systém v 1Z , tak Vi =W'bi,...,Vr =W'br sú navzájom nezávislé a majú normálne rozdelenie, pričom V i ~ iVp (M'bi, S). Ľahko dostaneme aj nasledujúci dôsledok Dôsledok 2.2. Ak B^ je ortogonálna matica (BB' = B'B = 1), tak V; = (Ui:...:U*){B}.i = U'{B}.t ~ iVp(M'{B}.ř, £), z = 1,2,...,A; a coi^V^V,) = ({B}[ť (8) Ip,p)(I (8) SHB}^-(8) I) = {B}[i{B}.i (8) S = 0 pre i £ j, teda \u ..., Vk sú nezávislé. Definícia 2.3. Združené rozdelenie prvkov matice SPiP = Ei=i U^U^ = lÁ'lÁ sa nazýva Wishartovo rozdelenie s k stupňami voľnosti a značí Wp(k, S, M). Ak M = 0, jedná sa o centrálne rozdelenie, označujeme ho Wp(k, S). Poznámka. (i) {S}ťi = ÍEti UíU',}.. = Eti tf«tf;/ = Y:Y, = {U'Uhj, lebo u / Ľľ=i^ ZliUuU: >p,p 21 Zi=iUuUpi\ Žilovú Ei=1ul ... Eľ=i^ př \Ľr=i^^ií Y,Uuplu2l ... Eti^ / (ii) Pre p = 1 a //n = //12 = ... = //i* = 0 sú Uz = {7^ ~ iV(0,cr2), i = 1,2,..., A; nezávislé, WW = Eti ^ľi ~ W!(k, a2). Pretože ^ ~ ÍV(0, 1), má ELi ^ ~ xl rozdelenie a WlÁ ~ &2x\ rozdelenie. (iii) Pre k íl p existuje hustota Wp(k, S, M) rozdelenia, ináč nie. Dôkaz je naznačený v [Rao, str. 641]. lU 2.2. Niektoré vlastnosti Wishartovho rozdelenia Lema 2.4. Nech S ~ Wp{k^) a \ e Kp je vektor konštánt. Potom l'Sl ~ o\x\ (o\ = 1'Sl). Dokaz. S = Eti UiU'ť, preto 1'Sl = Eli l'UiUjl = ELiO'U*)2 = lY' lY ~ k). Ak M = 0, tak S = 0. D Lema 2.5. JVeci U i ~ iVp(0,S), z = 1,2,..., A; sú nezávislé, Akjk reálna symetrická matica. W AU ~ Wp(r, S) práve vtedy ak V 1 G 7^ iY'A iY~ 0 sú vlastné čisla matice A a bi,..., br im prislúchajúce charakteristické vektory). Z rovnosti A2 = A dostávame Aťbťbí, r r r ^A^-bJ^A.b.b', ^ j=l s=l í=l cize A2bibí + A^bí, + ...A2brb'r = Aibibi + A2b2b2 + ...Arbrb'r, z čoho vyplýva, že A2 = A^, i = 1, 2,..., r, čiže Ai = A2 = ... = Ar = 1 (lebo A^ > 0). Môžeme písať A = Ej=i bjbj a tiež W AU = Y,]=iU'hjh'jU = Ej=iVjVí> Vr sú nezávislé. Z definície preto pričom podľa lemy 2.1 V i ~ iVp(0, S) a Vi, V2, U'AU- W„fr,S). D Veta 2.6. JVeci S ~ Wp(fc, S) a BPig matica konštánt. Potom B'SB ~ W9(fc, B'SB). £>ÓÄ;az. B'SB = B'U'UB, kde WB /ľ'A U' /Vi\ B Vu;7 fe,p V' V v; / u, iVp(0,S) sú nezávislé. Preto /vi\ V' U2B \v^/ Vu'.b/ má riadky nezávislé, ccw(B'Ui, B'Uj B'coí;(Uz,Uj)B 0 a B'U, iVg(0, B'SB). Platí B'SB = E*=i YřV^ ~ W9(fc, B'SB) (priamo z definície). D 11 Dôsledok 2.7. (a) Diagonálne suhmatice matice S majú tiež Wishartovo rozdelenie, lebo ak C _ [ Sn Si2 VS2I S22 kde S11 je rozmeru l x l, tak i/,/ 0\c(hi °\ = (sn ° o oj ^o oj \ o o (b) Ak S ~ Wp(k, I) a ak pre BP:q platí B'B = I, potom B'SB ~ Wq(k, I). Veta 2.8. ATeci S ~ Wp(k,'Ľ) a a G 7\!.p je taký vektor konštánt, že a'Sa ^ 0. a'Sa Potom r^j 2 Xk a'Sa Dôkaz. Podľa vety 2.6 platí, že a'Sa ~ W\(k, a'Sa), čo znamená podľa poznámky /••\ lír*/* ^ ^^ 9 (11) pod definíciou 2.3, že ——— ~ \k. D a žja Veta 2.9. JVeci Ui,..., Un je náhodný výber z Np(0, S) (teda W'W ~ Wp(n, T,)), je symetrická matica. Platí U'QU-WJrX) ^C2 = C. 'pv ■> V takomto prípade r = Ír (C). Dokaz. Podľa lemy 2.5 je U'CU ~ Wp(r, S) ^ V 1 G 7^ iY'C jY ~ a\xl, (^ľ = l'Sl, iY = U\). V tomto prípade r = /z(C) = ťr(C). Pretože podľa (2.1) je -!— ~ ÍV,(0,I), je podľa vety 1.7 iY'C ,Y ~ a2X2 ^ ^Cp^ ~ xl ^ C2 = C. V tomto prípade r = h(C). D Lema 2.10. Nech Si ~ VFp(ni,S); S2 ~ VFp(n2,S). Si a S2 sú nezávislé. Potom S1 + S2 ~ W^(ni+n2,S). Dôkaz. Si = WÍW1? S2 =U!2U2, kde Wí = (UiL.iU^), ^ = (Uni+1:...:Uni+„2) a U i ~ iVp(0,S),z = l,2,...,ni + r*2 sú nezávislé. Preto ak označíme W = (U{:.U^)p,ni+n2} tak Si + S2 = ili[Ux + U!2U2)=U'U ~ W^(m +n2,S). D Veta 2.11. JVeci Cn^n = C je matica konštánt, U^ ~ iVp(0,S),z = 1,2,..., n nezávislé. Platí, že W CU ~ E™=i A^VFp (1, S), Jede Ai,...,An sú vlastné čísla matice C a Wp(1)(l,£),..., Wp(n)(l,£) sú nezávislé. Dôkaz. Môžeme písať C = ^2i=1 A^Pip'j, I = X]i=i P«PÍ> pričom Ai ^ ... ^ An sú vlastné čísla matice C a pi,...pn ortonormálně vektory. Teda U'CU = Eľ=i AiW'pip'jW = Eľ=i A*V*V^ kde V* ~ ^p(0,S) a sú nezávislé (lema 2.1). Z lemy 2.9 vieme, že U'plp'tU = V,V^ ~ Wp(0(l, S). D IZ Lema 2.12. Pře matice príslušných rozmerov platí (2.5) vecABC = (C ® A)vecB, tr AB = (uecB'VuecA. D<5& az. Lemu dokážte ako cvičenie. Veta 2.13. Nech U i ~ Np(fi, S), z = 1,2,..., n, Ui,U2,...,Un sú nezávislé, Ci, C2 symetrické a idempotentné. IÁ'Q>\IÁ a WC2U sú nezávislé, ak C1C2 = 0. Dôkaz. Ak U'C\ a WC2 sú nezávislé, tak sú nezávislé aj IÁ'Q>\IÁ a WC2U. U'Ci a WQ>2 sú nezávislé práve vtedy ak sú nezávislé IVÍ'Ci a IWC2 a to je práve vtedy ak sú nezávislé veciVJ'C\) a vec(VJ'C2)} čiže podľa lemy 2.12 ak sú nezávislé vektory (C'x (x) I)vecW a (C2 I)vecW} ktoré sú podľa (2.3) normálne rozdelené, pričom vecW ~ Nnp(0,ln,n®i:p,p). Pretože (C'x I)(I (g. £)(C2 (8)1) = (CiC2(8)S) = 0, sú U'Ci a WQ>2 nezávislé. Teraz už ľahko dokončíme dôkaz. D Veta 2.14. Nech S ~ Wp(k, S), S je regulárna, k^p-1. Platí: \žj jpp _ 2 fe-(p-i) xx a nezávisí od {S}íj 1,2, l'S_1l (b) Pre každý 1 G 7^ je ^^ ~ x\-{p-iy Dôkaz. S = Ei=i UiU'j, U^ ~ iVp(0,S), U^ nezávislé, U2t ,P-1, j 1,2, ,p-l. U; *7, p-i,i U* U pi 1,2,..., A;, U*~iVi(0,£n), kde /i(Sn) = p — 1. Ďalej označme U fe,i V t/pi / Su S12 S21 S22 t^>2 \UpJ ĽÍ=iU?(uí)' EÍ=iU?^ť ĽtiMu*)' Eti^ iV^O^Ej-ppIfc,*), uz \Up-l,i/ 1,2, ., K, Podľa lemy 4, Anděl, str. 121, P{Ei=i U*(U*)' je pozitívne definitná} Ä; ^ p - 1, teda P{MEÍ=i U*(U*ľ) = p - 1} = 1. Pre maticu 1, ak X /Uli u 12 \ult U21 U22 U2k %,-l,2 U p-l,k platí k E- A: 11,11- X'X, J^ t/piu'i = U'X a Y^ u*Up* = X'U i=i 13 {S"1}«, = {E u2pi - E(u?)'ME u*(u*)Tx E ^u*}"1 i=l i=l i=l i=l {u'u - E(u*)'mE ur(ur)')-1 E c^iur}-1 i=l i=l i=l (pozri Anděl, str. 66). Podmienené rozdelenie ÍTpi/U* = Ui,...,U£ = U& je to isté ako ÍTpi/U* = Ui (lebo Up\ nezávisí od U2,...,U£) a teda ÍTpi/U* = Ui ~ iV(0 + S2iS-11u1,S22 -S2iS1-11S12), čo je iV^íSňV, {E"1}^1). Analogicky Upi/U* = uz ~ A/'(S2iSf11ui,{S_1}~í,1), z = 2,3, ...,& (pričom Upi,UPJ pre z ^ j sú nezávislé). Preto ?2 U/UÍ = Ul,...,U^ = u, ~JV( pričom podstatné je aj to, že /S2iS1-11u1\ S2lSn U2 \S2iS11 Uyt / {^ }ppl)5 (2.6) /S2iS1-11u1\ S2lSxl U2 /U;s1-1|s12\ U2^11 ^12 x7. VSnEIiW V^n^W Dostávame, že rozdelenie —/U]* = Ui, ...,U£ = U& je rozdelenie i"5 Jpp et - E u&(E u;uí)_1 E u<& = ^ - x(x'x)-ix')t i=l J=l i=l Podľa vety 1.8 má kvadratická forma £'(I — X(X'X) X')£ rozdelenie {'E~1}~pXk-( -D? ktoré vďaka (2.6) nezávisí od podmienky (teda od {S}íj, i, j £ {1, 2, ...,p — 1}) a je preto aj nepodmieneným rozdelením. Dostávame, že {S }pp {S"1} pp Xk-(p-i)- Pretože dôkaz sme úplne analogicky mohli urobiť pre rU = (Ur\, Ur2}..., Urk)', r G {1,2,...,p} platí, {z] }r, {S"1}, Xjfc-(p-i), r G {1,2,...,p}. (b) Vezmime ortogonálnu maticu B, ktorá má prvý riadok ——ľ. Podľa vety 2.6 platí BSB' ~ Wp(k,WĽB'). Pretože ÍBSB')-1 =BS"1B', BEB i\-i BS_1B, 14 dost avame za {BS-iB}u t^I'S-11 Xk-(p-i) (ortogonálnou transformáciou sa príslušné hodnosti v dôkaze (a) nemenia). K dôkazu vety 2.16 potrebujeme nasledujúce tvrdenie: Lema 2.15. Nech X ~ \m a Y ~ Xn s~ú nezávislé. Potom X+Y ~ B { Dôkaz. Pozri Rao, vzťah (3b. 1.12), dokážte ako cvičenie. D m n 2 ' 2 , (náčrt dôkazu: U Xm, V ~ x«, tak fu(u) 1 2~T( __u m._i „ -e 2^2 x pre u > U, t : 22 ríf — iL R. — 1 n -e 2t)2 x pre u > U, t : u-\-v U + V D-r(y,z) = det( zy z{\ -y z y -z 1-y [2*r( e 2 (^yj 2 fUtv(u,v) = fu(u)fv(v), ft(u,v)(y,z) f (y) = Jo °° f(y>z)dz = B(j^)ž/f ~1(1 -y)^"1 Veta 2.16. JVeci Si ~ VFp(A;i,S), S2 ~ Wp(&2,S) sú nezávislé, S je regulárna. I ^ I AJc &i ^ p — 1, íaJc .g1 +g , má rozdelenie ako súčin r)\...r)p nezávislých náhodných veličín, m ~ B [ 1~/ , t?- I a nezávisí od {Si + S2}íj, í, j G {1,2, ...,p — 1}. icin, r^ ' 2 ^ fcl + ^2 DÔÄa*. Označme Si = £ľ=i UřU'z, S2 = E"=!"+! U*U« kde U* ~ ^(0,2 1, 2,..., k\ + A;2 a nezávislé. / ^ \ u, Up-i^i V t/pi / S11 S12 S21 S22 Ďalej označme U* U pi h(Jl 1,2, &1+&2, U* ~ iVp_i(0, En), kde n, p — 1. U fcl + &2,l / ^1 \ Up2 \UPikl+k2/ (DU (2)U,2,i fei,i 2,: iV*1+*2(0, {£}„„!), u, «2z \Up-l,i/ 1,2, ,k1 + k2 15 Si ^! v*! Ľľ=iU*(u*y Z-L1u*upt\_fs11 s S21 s ^ kí jj2 Ľľ=iMu*)' Eľ=i^ pz >12 22 Si + S, vSi + 82)11 (Si + S2J12 vSi + S2J21 (Si + S2J22 Eki + k2 TT /t t* y v-^fci + &2 rr2 i=l ^M^iJ 2^i=l Upi Podľa lemy 4, Anděl, str. 121, P{EÍ=Li U*(U*ľ Je pozitívne definitná} = 1, (pretože k\ ^ p — 1), teda -P{MEi=i U*(U*)') = p — 1} = 1. (Samozrejme aj PiHY^lX^ U*(U*ľ) = p - 1} = 1. Ďalej označme Xi / «n «21 «12 U22 \ulkl U2k± Up-l,l \ Up-1,2 Up-l:k! ' X X UlJk1 + 2 U2,k1 + 2 \uljkl+k2 U2,k1+k2 Xi X, «p-i,fei+i ^ Up-l,k1 + 2 Ur -l,k1 + k2 ' Úplne analogicky ako vo vete 2.14 (a jej dôkaze) dostávame k\ k\ k\ ^uíu'^X'jXí, J2Up*<= (1)U'Xi, Y/uiUpi = X'1WlJ i=l i=l i=l fcl+ŕí2 kx+k-2 kx+k-2 J2 uřu'ř = X2X2, J] t/piu'i = (2)U'X2, J2 u*Up* = X2 (2)U- K onecne {s-1},, = { «u' (Du- Öun'M^UiW)')-1 j^u^n-1.. i=l i=l i=l {(Si + s2)-1U = {(Wu';(2)u')(;2!u ki + k2 ki + k2 ki + k2 E (U*)'M E uKunr1 E ^u*}_1- 1=1 1=1 1=1 Pretože platí (Anděl, str. 66) {S }pp — (S22 — S2iSxl S12) — IS22 — S2iSxl S12I , cize {S"1} pp |Sii||S22 — S2iS1:L S12I |S| lö dost avame (2-7) {Sf1}-1 = M (1)u' (1)u - f^n'ME^u?)')-1 Í>*u* z=i z=i z=i (2.8) {(s1 + s2)-1};,1= 'Sl + S^ (i)U': (2)U' ^ ŕ (1)u (2)U i=l i=l i=l Zhodne ako vo vete 2.14 sa ukáže, že í = (|) = U/UÍ = Ul,..., Uti+k2 = ukl+k Nk± + k2 ( 2212"^! \ S2lSxl U2 X7JS-1},,!), \S2lSn ukl + k2 J pričom £i je k\ rozmerný a £2 je &2 rozmerný náhodný vektor. Preto podmienené rozdelenie {(S! + s2)-1};,1/uí = m, ...,u*i+,2 = Ufcl+fca je rozdelenie kvadratickej formy £'£ - £'X(X'X)_1X'£ ~ {'Ľ~1}~pxl1+k2-P+n pričom nezáleží na podmienke a preto je totožné s nepodmieneným rozdelením a je nezávislé od rozdelenia {S^Vy/U* = ui>->U*i+*2 = nk1+k2, ktoré je rozdelením kvadratickej formy éíéi-éíXííxíxo^x;^ («2 1 o o o ~ t^J Spp Xki—p+l: nezávisí na podmienke a je preto totožné s nepodmieneným rozdelením. Podľa vety 1.8 je {(Si + S2)-1};,1 - {Sf1}-1/^ = ul7 ...,u*i+,2 = ufcl+fca = lY p>í(Q ° V /^Xi[(X'1X1+X^X2)-1-(X'1X1)-1]X1 * \\0 Ik2)kJ \ X2(X'1X1+X'2X2)-1X'1 X1(X'1X1+X^X2)"1X x2(x'1x1+x2x2)-1x £ ^~{£-n-M nezáleží od podmienky a je preto opäť totožné s nepodmieneným rozdelením. Mimo toho ľahko sa ukáže, že {(Si + S2)-1}-1 - {sr1}-1/^ = Ul, ...,u*i+,2 = ufcl+fca nezávisí od {si }pp /Uí = Ui,...,U^i+í,2 = ukl+k2 (lebo AB = 0). Preto ___________{sr1}-1_________ {(Si + s2)-i}-; - {s-1},-; + {s-1} >pp j—y/ VI = ui,...,U*ki+k2 = ukl+k2 ípp je rozdelené ako (2.9) Xkl-p+i 2 _j_ 2 ' pričom x| a \\ -p+i v (2-9) sú nezávislé. Podľa lemy 2.15 má preto KS +s I-3"1)-1 rozdelenie B ŕ 1~2P+1,^) a nezávisí od {Si + S2}ZJ, i,j G {1,2,..., p-I}.' (Cn Cl2 ••• Clr C-21 C-2-2 ... C2r I ako crl cr2 ••• cr |C|r, r G {1,2,...,p}. Využijúc (2.7) a (2.8) dostávame, že rozdelenie ic i / uí = Ui5---5U^1+A.2 = Uí,1+í,2 = |Si + 52|/ SI Q I i 1 \p l°l |f» — 1 |Si|p-i_______|Si|p_2 |Si|i / _ _ |C i C I |C i C I •••"ÍČ i C I / 1 ~~ Ul' '••' lJk1 + k2 — Uki + k2 |Sl+S2|p_i |Si+S2|p_2 pričom |Si|p Pi P-1 /TT* TT* T) í |S1+S2|, / Ul = Ul' -' u^+*a = u*^ ~ 5 (/ Si + S2L_i 2 ' 2 18 a nezávisí od |Si|p-|Si|p- |Sl + S2\p-l U* = u i,...,UA.i+A.2 ukx + k2 Si + S 2 |p —2 ktoré má B í 1 ^—i~2i rozdelenie nezávislé od podmienky, at ď. Teda ,s _}'s , má rozdelenie ako súčin r]i...r]p navzájom nezávislých náhodných veličín, pričom D / fci— p+i k^ Vi - ■" \ 2 '2 D Veta 2.17. AJc Ui,...,Un sú nezávislé, Np(jx, S) rozdelené, S = — ^ľ=i(U* ~~ Ü)(Ui - Ü)', WeÜ=i Eľ=i Ui, tak nS ~ Wp(n - 1, S). DÓ&az. nS = Eľ=i(U* - U)(u« - Ü)' = Eľ=i u«uí - nU U' = U'U-\U'\n^nU = U'{\ - ±lľ)W = W'AW = Z?AZY, kde Ü' = (Ui - a*, -, Un - /*), lebo (fi,...,fi)A = 0. Podľa lemy 2.5 Z?AZY ~ Wp(r,£) <& VI G 72* l'W'AM ~ (l'Sl)x2, pričom v tomto prípade r = h(A) = tr(A). Pretože m /(Ui-M)'l\ (u2 - ßy\ \{\5n-ti)'\) iÝ~iVn(0,(l'Sl)I) (pozri (2.1)), má VWAU\ rozdelenie x\ (podľa vety 1.8) práve vtedy ak A2 = A. V tomto prípade r = h(A) = Ír (A). Je zrejmé, že v našom prípade A2 = A a h(A) = tr(A) = n — 1, preto nS ~ Wp n 1,S] D Veta 2.18. Ak Ui,..., U& sú nezávislé, Np(jx, S) rozdelené, tak U = ^ Si=i U i a A;S = J^i=i UiU'j — kXJ U sú nezávislé, pričom U ~ Np(jx, jS) a A;S ~ Wp(k — 1,S). Dôkaz. Nech C^ je ortogonálna matica taká, že jej k—ty stĺpec je (—tť, •••, ~jť)'■ Označme (U1:...:UJfc)C = (V1:...:VJfc). Potom Vk = ^-(Ui + ... + U*) = V& Ü resp. Ü = -^Vk, /H'í\ kS = J]UZU'Z -kU U' = (Ui!...:Uř i=i u; ViV l'7fv'7Iví /ľí\ (Vi:...:Vř)C'C v; v v, y k-1 v*v* = Y, v*v; - v*v* = E v*v^ i=l i=l Pretože Vi,..., V& sú nezávislé, dostávame tvrdenie lemy (pomocou vety 2.17). D 19 3. HOTELLINGOVO T2 ROZDELENIE Nech SpjP je matica náhodných veličín (náhodná matica) dPii náhodný vektor nezávislý na S, S ~ Wp(k,'S), d ~ Np(6, c_1S). Hotellingova zovšeobecnená štatistika T2 je definovaná ako T2 = dfeďs-M = , ^cďs-M. V nasledujúcom budeme uvažovať 5 = 0, c = 1, S = I, teda S ~ VFp(A;,I), d ~ Np(0,I). Hotellingovo T2(p, k) rozdelenie je T2 = M'S-M a píšeme A;d'S_1d ~ T2(p,k). Veta 3.1. Nech X ~ Np(fi, S) aS~ Wp(k, S) sú navzájom nezávislé, S regulárna. Potom k(X - a*)'S_1(X - fi) ~ T2(p,k). Dokaz. S = U AU', I = UU',A = diag{\u..., \}, \i ^ A2 ^ ... ^ Ap > 0, S-3 = Udiag{\~^,...,\p}U', S^ = lMa#{Af,..., Af}U'. Položíme d* = S"3(X-a*), S* = S-5SS-5, teda (S*)"1 = S^S-^i Zrejme d* ~ iVp(0,1), S* ~ Wp(k,I) a preto podľa definície Ä^d*)'^*)"1^ = k (X - a*)'S_1(X - fi) ~ T2(p,k). D Dôsledok 3.2. Majme Ui,...,Un nezávislé, U^ ~ Np(fi,'Ľ), S regulárna, U = ^Ľľ=iU,, s = i£ľ=i(uť-u)(uť-u)', s, = ^Eľ=i(u,-u)(ur-Uy. Potom (n_l)(U-M)'S-1(Ü-M) = n(Ü-M)'S;1(Ü-M)~T2(p,n-l). DÓ&az. TJ~ iVp(/i, ±£), teda^ňU~ Np(y/ňii,ll), S* = ^S, čiže (n-l)S-1 = nS"1, ďalej nS ~ Wp(n — 1,S) (pozri vetu 2.17), U a S sú nezávislé (veta 2.18), teda (n- l)yfíi(U - fi)'(nS)'1 y^(TJ - fi) = (n - 1)(TJ - fiyS-^TJ - fi) = = n(U-fiyS-1y^(U-fi)^T2(p,n-l). D Veta 3.3. m — p + 1 Dôkaz. Podľa definície má T2(p,m) rozdelenie náhodná veličina md'S_1d, kde d ~ iVp(0,I), S ~ Wp(m,I). Teda náhodná veličina , , md'S-M „ , d'd (3.1) __ďd = m__. d'S-M Zu Podľa vety 2.14 (b) menovateľ v (3.1) nezáleží od d a má Xm-p+i rozdelenie (pre ľubovoľnú realizáciu náhodného vektora d má Xm-p+i rozdelenie), čitateľ v (3.1) má podľa vety 1.7 x\ rozdelenie. Preto (3.1) je podiel dvoch nezávislých náhodných veličín, s x2 rozdelením, a síce rozdelenie (3.1) je Xp 2 mp— 2 mXp p rnp T (p, m) = —-------- = ---------------------2---------- = —Z—-7-7Fp,m-p+\- D Xm-p+l , . .. s Xm-p+1 m P + -L (m-p+ 1)----------— m — p + 1 Lema 3.4. Súčin k navzájom nezávislých náhodných veličín s rozdelením B{"n, Si), i = 1, 2,..., k takých, že 7^ = 7^+1 + $i+i, i = 1,2,...,A; — 1 má rozdelenie B(^k} $1 + ... + sk). Dôkaz. Pozri viac v Rao, 3a.3. Lema 3.5. Nech d ~ iVp(0,I) a S ~ Wp(m,\) sú nezávislé, teda md'S_1d ~ T2(p, m), m ^ p — 1. Platí T2(p,m)\ |S| [m —p-\-lp 1 H------------------= T^—.—TTTT ~ -D m y |S + dď| V 2 '2, Dôkaz. Podľa Anděl, str. 63 pre determinant štvorcovej matice I ,, J platí |S + dď| = -|S|(l + d'S-1d), teda S d ď -1 i + T2(^m)) =(i + ďs-M-1 m J IS + dďl pričom S ~ Wp(m, I), dď ~ VFp(l, I), (nezávisí od S) a podľa lemy 2.10 S + dď ~ g Wn(m + 1,1). Preto podľa vety 2.16 má--------——■ rozdelenie ako súčin navzáiom p ' |S + dď| nezávislých náhodných veličín s rozdelením beta a parametrami m — p + 1 1^ (m — p + 2 1^ /m 1 2/ ' V 2 '2/ '■"' V 2 ' 2 / ?77- — /) -)- 1 D \ Podľa lemy 3.4 má tento súčin B I --------------, — J rozdelenie. D Dôsledok 3.6. Nech X a S je aritmetický priemer a výberová kovariančna matica z výberu rozsahu n z rozdelenia Np(fi, S). Potom n-Pfv „vo-i p x-fiys-^x-ri-F^n-p. 2Í Dôkaz. Podľa dôsledku 3.2 má (n — 1)(X —/z)'S X(X — fi) ~ T2(p, n — 1) rozdelenie, čiže podľa vety 3.3 má ^(X-m/S-^-íí) ~ ^^T2(p,n - 1) = p p(n — Ij n — p p(n — 1) p(n — 1) n — 1 — p -\- 1 rozdelenie. D "p,n — í— p-\-í — "p,n—p 4. Iné rozdelenia vyskytujúce sa pri multivariátnych štatistických analýzach Definícia 4.1. Nech A ~ Wp(m, I), B ~ Wp(n, I) sú nezávislé, m íľ p—l. Potom hovoríme, že náhodná veličina A= , |A| , =|I + A-1B|-1 A + B ' ' má Wilksovo lamhda-rozdelenie s parametrami p, m, n. Označujeme ho A(p, m, n Veta 4.2. Wilksovo A(p, m, n) rozdelenie, m ^ p — 1, je totožné s rozdelením í Tfl — 1) -\- % TI súčinu r/i...r/p nezávislých náhodných veličín, pričom m ~ B 2 ' 2 Dôkaz. Ak A ~ Wp(m,I), B ~ Wp(n,I) sú nezávislé, tak podľa vety 2.16 má A= , |A| , =|I + A-1B|-1 |A + B| ' ' rovnaké rozdelenie ako súčin r]i...r]p nezávislých náhodných veličín, pričom m írn-p^ n\ V 2 '2^ Poznámka. Ak Si ~ Wp(ki,I), S2 ~ Wp(k27I) sú nezávislé, k\ ^p— 1, tak |Si| A |Si + S5 má rozdelenie rovnaké ako súčin r]i...r]p nezávislých náhodných veličín, pričom m B I --------------, — J, čo je podľa vety 2.16 to isté ako rozdelenie |Gi| |G! + G2 kde Gi ~ Wp(ki,'Ľ), G2 ~ VFp(A;2,S) sú nezávislé, S je regulárna & kí ^ p — 1. Teda A nezáleží od S a môžeme ju zadefinovať ako A= |G1 + G2|' zz kde Gi ~ Wp(k\, S), G2 ~ Wp(k2} S) sú nezávislé, S je regulárna a kí ^ p — 1. Poznámka. Ak S ~ Wp(n — 1, S), d ~ Np(0, S) sú nezávislé, tak Wilksovo lambda-rozdelenie s parametrami p, n — 1,1 je to isté ako rozdelenie náhodnej veličiny --------------, teda (podľa lemy 3.5) B I --------, |S + dď|' yí y ' V 2 ' Zo vzťahov medzi beta rozdelením a F rozdelením možno odvodiť vzťahy medzi A a F rozdelením: ^ 1 - A(p,m, 1) p ~ "p,m — p-\-l A(p, m, 1) m — p-\-1 (b) 1-A(l,mn) ^ n Fí A(l,m,n) m n,m V/A(P>m>2) r1 Y^p, m, 2) m-p+1 -^2p,2(m-p+l) idi ------/ w~ F~ ~ ľľ-----7-ť2n,2(m-l)- 1 — ^^.(2, m, n) n -------------------- r^j -------------- Y/A(2,m,n) m - ľ Pre ostatné hodnoty n a p za podmienky, že m je veľké, možno použiť Bartlettovu asymptotickú aproximáciu 1 m- ^(p-n + ľ) HnA(p,m,n) ~ xlP- Pri hľadaní simultánnych intervalov spoľahlivosti parametrov multivariátnych lineárnych modelov sa používa nasledovné rozdelenie. Definícia 4.3. Nech A ~ VFp(m,X), B ~ Wp{n,11) sú nezávislé, m ^ p, S je pozitívne deňnitná. Rozdelenie najväčšej vlastnej hodnoty 6 matice (A + B)-1 B označujeme #(p, m, n). Podľa Rao, str. 588 toto rozdelenie nezávisí od S. Poznamenávame tiež, že 6 môžeme definovať ako najväčší koreň rovnice |B-0(A + B)| =0. Ak A ie vlastná hodnota A_1B, tak-------- ie vlastná hodnota (A + B)_1B. Keďže , . . l + A. , ide o monotónnu funkciu premennej A, 6 je dané vzťahom l + A, kde Ai značí najväčšiu vlastnú hodnotu matice A-1 B. Pretože Ai > 0, platí 0 < 6 < 1. Vzťahy medzi rozdeleniami 6, A a F sú: (a) #(p, m, n) a 0(n, m + n — p, p) majú rovnaké rozdelenie, 0(1, m, n) 1 — A(l,m,n) n 1 — 0(1,m,n) A(l,m,n) m #(p, m, 1) 1 — A(p, m, 1) p (b)------ün _ ^ = —A/1 _ ^ ~ —rn)m, #(p, m, 1) A(p, m, 1) m — p + 1 ' Zó 5. Metóda maximálnej vierohodnosti a test pomerom vierohodnosti Združenú funkciu hustoty rozdelenia náhodného výberu XnPii = (X'l7..., X'n)' uvažovanú pri danom x (realizácia X £ 1ZP) ako funkciu vektorového parametra 6 G lZr nazývame funkciou vierohodnosti n L(x;o) = JI/(xť;o), i=l resp. jej logaritmus, teda n Z(x,0) = Z(xi,x2,...,xn,0) = lnL(x;0) = ^ln/(xi;0). i=i Vierohodnostnými rovnicami rozumieme systém 3In/(x,-, 9) E i=i 50* 0, k = 1,2,..., r. Majme náhodný výber X = (X'x, X^,..., X'n)', kde X^ ~ Np(fi, S), S je regulárna. Potom L(x;M,S) = |27rS|-fe-ÍSľ=i(^-M)'S-1(xr-M)5 cize 1 n Z(x;a*,S) =1iiL(x;a*,S) = ~ In |2tt£| - - J](xř - a*)'S_1(xí A* i=i Platí (x; - /í)'S x (x; - /a) = (x; - x + x - /í)'S x (x; - x + x - p) = (x, - x)'!!-1 (x, - x) + (x - a*)'S_1 (x - a*) + +2(xí-x)'S-1(x-/A), cize J](xí - ^'S-^Xi - n) = J](xí - xJ'S-^Xi - x) + n(x - ^'XT^x - fi) + i=l z=l +2j](xí-x)'S-1(x-íí) = ŕr J](x^-x)'£-1(x^-x) + n(x-/^)'£-1(x A') i=i i=i ír S-M^Xi-xKxi-x)' . t=i + n(x-/A)'£-i(x-/A) + nír J£-is(rea° } + n(x - a*)'S_1 (x - /*) 11 1 n n S(-a/) = _^(Xi_x)(Xi-x)' a 2^(x!-x)'S"1(x n i=i i=i 2Jn-Vx'!S-1(x-/x) -nx'S-^x-^) \ = 0. n i=l Dostávame /(x;M,S) = -^ln|27rS|-^r{s-1S(^)}-^r{S-1(x-M)(x-M)'}. Ak n ^ p + 1, tak odhady metódou maximálnej vierohodnosti sú p, = X, S = S (pozri Rao, str. 575,576). Definícia 5.1. X = (X'l7 X2,..., X'n)' je náhodný výber z rozdelenia závislého od parametra 6. Testujeme Ho : 6 G Oo X H\ : 6 G Oi (Oi je oblasť v 7Zq} Oo je podoblasť v Oi hodnosti s). Test pomerom vierohodnosti hypotézy Ho oproti H\ má testovaciu štatistiku (LR-štatistiku t.j. likelihood ratio statistiku, presnejšie jej realizáciu) w x _ Lo_ _ maxg£ňo L(0) L max^n L(0) Jeho kritická oblasť na hladine významnosti a je R = {x : A (x) < c}, kde c je určené tak, aby sup^^ P{x G R} = a. Veta 5.2. Nech A je testovacia štatistika pre test pomerom vierohodnosti Ho : 0 G Oo X Hi : Ö G Oi — Oo (Oi je oblasť v 7Zq). Za určitých podmienok regulárnosti pre každý 6 G Oo má —2 In A asymptoticky (pre n —y 00) rozdelenie x'l-s, keď Oo je podoblasť Oi hodnosti s, (q > s),( q — s možno chápať ako počet reštrikcií na parametre Q\,..., #r). Ilustrácia: (a) Nech X = (X'l7 X2,..., X'n)'je náhodný výber z Np(fi, S), S je známa pozitívne definitná matica. H0 : /a = A*o X #1 : H ^ Ho- Potom L(x; M, S) = |27rS|-f e" 2 Ľľ=i(x* " A^'S"^ " A*) = = |27rS|-feftr{S"1S(rea0}e-f^-^)S-1(x-M)'. Ak platí f/o, tak fi = fio a max I/(x; /a, S) = I/(x; /Zo, S) = = |27rSrfe-ftr[S"1S(rea0]e-f^-^o)'S-1(x-Ato) Zb (je to jediné číslo). Ak fi "nie je ohraničená", q = p, teda max^^Kf -^(x! A4? S) sa dosahuje pre fi = fi = x a preto max L(x; n, S) = L(x; /i(rea°, S) = = |27rsrfe~ftr[S"1S(rea0]e~f^~^(rea0)'S"1^~^(rea°) = = |27rSr2 e~2ír^ =>' ;J. Preto testovacia štatistika (vlastne jej realizácia) je -21nA(x) = -2 In-!------'------ \2tt-l\-2 e~ 2tri^ =>' '\ = n(x - /Ao)'S_1(x - /i0). Je to realizácia štatistiky n(X — /Ao)'S_1(X — /*o), ktorá má za platnosti Hq podľa vety 1.8 Xp rozdelenie. (Poznamenávame len, že h(Qo) = s = 0, teda aj podľa tvrdenia vety 5.2 sedí pre asymptotiku, že q — s = p — 0 = p.) (b) (Hotellingov jednovýberový T2—test.) Majme náhodný výber X = (X'l7 X2,..., X'n)' z Np(fi, S), S je neznáma pozitívne definitná matica. #0 : H = Ho yc Hi : H ^ Holi sa musí odhadnúť vzhľadom na Ho ako aj "bez ohraničenia". Dá sa ukázať, že odhady získané metódou maximálnej vierohodnosti (ich realizácie) sú za platnosti H0 : (i{real) = Ho, £(rea° = S(rea^ + dď, kde d = x - ii0, "bez ohraničenia": ii{real^ = x, í](rea0 = s(rea*). Dostávame, že za platnosti Ho max L(x; ß, S) = L(x; a*o, S(rea° + dď) = =_________1_________ -f {tr(S(rea')+ dď)-^'""') + d'(S(rea') + dd')"1d} = (27r)^|S(—0+dd'|f e 1 e-fír(S(rea/)+dď)_1(S(rea/)+dď) = i27r)^|S(—0 + dd'|f 1 _HE e 2 . (27r)^|S(rea0 + dd'|t Ďalej max L(x;a*,S) = L(x; x, S(rea/)' i27r)^|S(—0|f _e-ftr(S(rea'))-1S(rea')) - (x-^'(S^6^))"1^-x) Vo (27r)^|S(-a0|f teda testovacia štatistika (LR - štatistika) je -21nA(X) = -2 In np ■e~~. (5.1) = — n In |S + (X-a*o)(X-a*o)'| |S + (X-a*o)(X-a*o)'| Za platnosti Ho je y/ň(X — fio) ~ Np(0, S); podľa vety 2.18 nS ~ Np(n — 1, S) pričom y/ň(X — fio) a nS sú nezávislé. Preto podľa poznámky za vetou 4.2 InSl |S| |nS + n(X - a*o)(X - a*o)'| |S + (X - a*o)(X - a*o)'| má A(p, n — 1,1) rozdelenie. Podľa lemy 3.5 je to totožné s rozdelením (1 + —-^zj—)_1? čo je rozdelenie náhodnej veličiny (1 + (X — fio)'S~1(X — /^o))-1 í TI — T) t)\ (pozri dôkaz lemy 3.5) a podľa poznámky za vetou 4.2 to je i? I --------, — J rozdelenie. Asymptoticky má teda podľa vety 5.2 -21nA(X) = -nlnf--------=-----^L----------- ) = nln(l +(X-uoYS^ÍX-u0)) y } vis + (x-Mo)(x-Mo)'i; y y "» y ^ Xp rozdelenie. Ak chceme použiť neasymptotický test, tak za platnosti Ho má náhodná veličina (í + ix-fioys-^x-tio))-1 TI — T) T) \ B [ --------, — J rozdelenie, alebo podľa dôsledku 3.6 má za platnosti Hq štatistika P (x-noYs-^x-no) FPjn-p rozdelenie. (c) Hypotézu Ho : S = S0 X Hi : S ^ S0 ( fi nepoznáme), pričom máme výber z Np(fi, S) rozdelenia o rozsahu n testujeme tak, že získame odhady metódou maximálnej vierohodnosti. Za platnosti H0 : ß{real) = x, S = S0, "bez ohraničenia": ji{rea^ = x, £(rea0 = s(rea*). li Preto za platnosti Hq je np n n max Z(x;a*,S) = /(x;x,S0) =------ ln27r - - In |S0| - -tr(Ľo1S(real)) S—So Z Z z a "bez ohraničenia" je maxI(x;M,E) = Z(x;x, S=n\n------------- - 2 2 \ 0 S22 J ^821 S22 J J |S| 1 lsl 1 |Sn||S22 - S2iSn Si2| c-ic c-ic 1 = _nlnT^—ÍT^—ľ = ~nln----------ií—ňä~\---------- = -"ln|I- S22 S2iSn Si2|. P11IP22I P11IP22I Tato štatistika má asymptoticky \2 rozdelenie s p\P2 stupňami voľnosti (pip2 = q, r = 0). (d) Hypotéza Ho : S = diag (špeciálny prípad (c)) ( fi nepoznáme), pričom máme výber z Np(fi, S) rozdelenia o rozsahu n je tá istá ako hypotéza H0: R = I (R je korelačná matica). Tvrdí, že zložky vektora X sú nezávislé. Test pomerom vierohodnosti má testovaciu štatistiku (jej realizáciu) —2 In A = —nln|Rx,x| (R-X,x je výberová korelačná matica). Táto štatistika má asymptoticky \2 rozdelenie s hp(p — 1) stupňami voľnosti (q = ^^—-, r = p). ZS 6. Lineárny model a metóda najmenších štvorcov 6.1. Úvod Majme lineárny regresný model (LRM) (6.1) Ynji = Xn)PßP)i + en,ii £(e) = 0, cov(e) = a2\. Veta 6.1. ~Y^i=\ £1 = £'£ = (Y — X/3)'(Y — X/3) nadobúda minimum (vzhľadom na ß) pre ß, ktoré je (ľubovoľným) riešením normálnych rovníc (6.2) X'X/3 = X'Y. Toto minimum je rovnaké pre všetky riešenia rovníc (6.2). Dôkaz. /i(X') = /i(X'X) ==>■ X'Y G /i(X'X) ==>■ (6.2) sú vždy riešiteľné. Ich ľubovoľné riešenie označme ß. Platí (Y - X/3)'(Y - X/3) = (Y - X/3 + X/3 - X/3)'(Y - X/3 + X/3 - X/3) = (Y - X/3)'(Y - X/3) + (/3 - /3)'X'X(/3 - ß) ž (Y - X/3)'(Y - X/3). Teraz už dôkaz ľahko dokončíme. D Označme ešte Ý = X/3 a R20 = (Y - X/3)'(Y - X/3) = Y'(I - X(X'X)"X')Y. 6.2. Matica plánu X má plnú hodnost' Nech h(Xn^p) = p ^ n. Veta 6.2. Majme LRM (6.1), pričom h(X) = p. Platí (a) ß = (X'X)-1X'Y, £(ß) = ß (b) cou/3 = (72(X'X)-1. Dôkaz. Pozri Anděl. Veta 6.3. Pre ľubovoľné p £ 1ZP má odhad p'/3 = p'/3 minimálnu disperziu zo všetkých lineárnych nevychýlených odhadov funkcie p'/3. Dôkaz. Pozri Anděl. Veta 6.4. / P2 \ 2 n — p Dôkaz. n — p S ŕ-^O = -J_£(Y'(I - X(X'X)"1X')Y) = \n — py n — p {[/3'X'(I - X(X'X)"1X')X/3 + ťr[(I - X(X'X)-1X')(j2I]} = a2. D 2\) Veta 6.5. V LRM (6.1) nech Y ~ Nn(Xß, a2I), h(X) =p^n Platí (a) ß ~ Nniß^^X'X)-1), R2 (J 2 ~ X n—p} (c) ß a Rq sú nezávislé, (d) (ß - ß)'X'X(ß - ß) ~ (J2x2p a nezávisí od R2. Dôkaz. (a) zrejmé; ^ = yi-x(x'x)-x'Y = _ i-x(x'x)-x' _ m, ^Id-XŕX'XI-iX'l rozdelenie podľa vety 1.8; (c) (X'X^X'Y a Y/I~X(X/2X)"1X/Y sú nezávislé, lebo ' ~ X(X'X)~1X' je pozitívne semidefinitná matica a (X'X) 1X' (podľa vety 6.5 (b)). Za platnosti Ho je n — p F a'j/3 ~ iV(a'j/3 = c^, cr2a'j(X'X)_1ai) (pomocou vety 6.5 (a)), í?q a ß su nezávislé (podľa vety 6.5 (c)), teda a-/3 - c% g^a^X^X)-1^ = a'ž/3-cž ^ cr2 (n — p) ÓZ 100(1 — a)%—ný interval spoľahlivosti pre a\ß je U'ß - tn-p(l - D^a'^X'X)-1^, a[ß + tn_p(l - f )^a'ř(X'X)-1aA . Ak chceme testovať, či súčasne platí Ho : a!iß = Ci i =,2,...,k X #1 : 3i G {1,2,..., A;} a'ť/3 ^ cť. potom sú tu možnosti: (a) Bonferroniho metóda je založená na trv. Bonferroniho nerovnosti, ktorá tvrdí, že ak E\,Ľ2,..., -Efc sú náhodné udalosti, tak / k \ k k p í n e* =i - É p(E*c)=* - D1 - p(^))- VZ=1 / 1=1 1=1 ,C Dôkaz tejto nerovnosti sa zakladá na rovnosti (P|í=i -^)° = Ui=i Ef, z ktorej vyplýva, že k P[f]EA=l-P \i=l k \c" n e, vi=l i-p U^n^-D1-^)), vi=l / i=l čo vyplýva zo subaditívnosti pravdepodobnostnej miery P, a síce P í (Ji=i -^ ) = X^i=i P(Ej). Pomocou Bonferroniho nerovnosti dostávame P f Q {a'ť)9 G (a'ť/§ ± ín_p(l - ^)av/a'ť(X'X)-ia^ } j = l-k- = l-a. k (b) Metóda maximálneho modulu. Nech a[ß, ...,a'kß sú nezávislé, t.j. a'j(X'X)_1a'- = 0 pre i ^ j, a'-Š — c- ti = ---- % ~ tn-p, i = 1, 2,..., k, nech ďalej v{k, n — p, a) je a—kritická SY/a'í(X'X)_1ai hodnota rozdelenia max-L<2<£, |í/|, tecla 1 — a = P < max \ti\ = v(k,n — p, a) > = P {\ti\ = v(k,n — p, a) Vi}. Pravdepodobnosť, že k intervalov a'j/3 ± v(k, n — p, a)s-i/a'í(X'X) xai, i = 1,2,...,k súčasne pokryje všetkých k lineárnych kombinácií a[ß je 1 — a. Hodnoty v{k,n — p, a) sú napr. v Lamoš, Potocký, tab. VIL Ak sú a[ß lineárne závislé, treba v nahradiť inou hodnotou, pozri napr. Hahn, Hendrickson, Biometrika 58, 1971. Intervaly v tomto prípade zostanú rovnaké. (c) Scheffeho metóda. Je založená na vete 6.8, ktorá zase vychádza z nasledujúcej lemy óó Lema 6.7. Nech M^; je pozitívne defínitná matica. Pre ľubovoľný x G lZf platí x'Mx ^ 1 ^^ (h'x)2 ^ h'M"^ Vheť. Dôkaz, pozri Anděl, str. 147. Veta 6.8. Nech lineárny priestor B C 1ZP je generovaný vektormi ai,...,afc, čiže B = /i(a.i:...:a.k)Pik a nech h(a.i'....:ak) = k. Potom P \ |a'/3 - a'/3| ^ sJkFk,n-p(l - a)a'(X'X)-1a V a G B \ = 1 - a Dôkaz. Označme A' = (ai:...:afc), teda A vety 6.6 (c) má í<\ W7 pričom A;(A) = k. Podľa k,p {n - p)(Aß - A/3)'(A(X'X)"1 A^-^A/Í - A/3) k (n — p)s2 (Aß - A/3)'(A(X'X)-1A')-1(A/3 - A/3) ks2 F, k,n—p rozdelenie. Teda P {(Aß- Aß)' (,A2(p,X)71A,)"! (A/f - A/3) g 1 í = 1 - a kszŕk)n-p(l - a) a podľa lemy 6.7 je P h'(A/3-A/3) ^[ks2Fk)n-p(l-a)]h'A(X'X)-1A'h Vh e Kk \ = 1 - a cize P A'h)'(/3 -/3)1 ^ks2Fkín-p(l-a)(A'hy(X'X)-1A'h VhčKk\ = l-a čo je to isté ako PJ(a'/3-a'/3)2 ^ A;52Pfcin_p(l-a)a'(X'X)-1a Va G /i(A') = #} = 1 - a. D 34 6.3. Matica plánu X nemá plnú hodnost' Nech h(X.njP) = r < p ú n. Normálne rovnice majú veľa rôznych riešení, pričom jedno riešenie ß nemôžeme považovať za odhad ß. Treba odstrániť nejednoznačnost'. Robí sa to nasledujúcim spôsobom. Uvažujme maticu Bp_riJ,, ktorej riadky sú nezávislé, t.j. h(B) = p — r, pričom tieto riadky nezávisia od riadkov matice plánu X. Preto h I J = p V / n-\-p — r,p (matica plnej hodnosti v stĺpcoch). Pre maticu I n,p J = Fn+p-r)P platí, že h(F) = p. Preto p x p matica F'F = (X' B') I j = X'X + B'B je regulárna (/i(F'F) = /i(F'), čiže aj h(F'F) = h(F') = h(F) = p). K normálnym rovniciam X'X/3 = X'Y pridáme rovnice B/3 = 0 a dostávame X'X/3 + B'B/3 = F'F/3 = X'Y, ktorých riešenie ß = (F'F)_1X'Y je jediné. Pre toto ß platí £($) = (F'F)_1X'X/3 = (F'F)"1(X'X + B'B)/3 = ß. Dostávame teda "zúženie" systému normálnych rovníc, ktorý má takto jediné riešenie (postup pri analýze rozptylu). Definícia 6.9. a'ß je lineárne nevychýlené odhadnuteľná ak existuje pre ňu lineárny nevychýlený odhad, t.j. ak existuje 1 G lZn, že £ß{\'\) = a'ß V/3 G 1ZP. Lenia 6.10. a'ß je lineárne nevychýlené odhadnuteľná práve vtedy ak a G //(X'). Dôkaz, nájdete v Anděl. Veta 6.11. JVeci a'ß je lineárne nevychýlené odhadnuteľná, ß je ľubovoľné riešenie normálnych rovníc, t.j. X'X/3 = X'Y. Potom (a) a'ß je jednoznačný, (b) a'ß je NNLO (najlepší nevychýlený lineárny odhad) a'ß, t.j. pre každý iný lineárny nevychýlený odhad a'ß funkcie a'ß piati T>(a'ß) — T>(a'ß) ^ 0. Dôkaz. Nájdete v Anděl. Skôr ako ukážeme test hypotézy H : A/3 = 0, dokážeme si dve lemy. Lenia 6.12. JVeci Amifc,Bnifc sú ľubovoľné pevné matice, h(B) = r ú min{n,A;}. Platí (6.4) Mb) =/i[A(I-B'(BB')"B] + ^(B)- Dôkaz. Matica (B':I — B'(BB') ~B)kjn+k má hodnosť k, lebo každý stĺpec matice B', teda B'e^ je kolmý na všetky stĺpce matice I — B'(BB')~B, teda na (I — 35 B'(BB')-B)ej, j = 1,2,..., k. lebo e'ťB(I - B'(BB')-B)ej = O, j = 1,2,...,k. Teda B' má r lineárne nezávislých stĺpcov, I — B'(BB')~B má k — r lineárne nezávislých stĺpcov (lebo h(l — B'(BB')~B) = k — r). Tiež B'e^ je kolmé na (I-B'(BB')"B)eJ, j e {1,2,...,k}, teda (B':I-B'(BB')-B)*in+* má k lineárne nezávislých stĺpcov, teda h(B':I — B'(BB')~B) = k (plná hodnosť v riadkoch). Teraz B':I-B'ÍBB')B) AB' A(I-B'(BB')"B) BB' 0 AB'(BB') I AB' A(I-B'(BB')B) BB' 0 0 A(I-B'(BB')"B) BB' 0 /i(B) + /i[A(I-B'(BB')"B)]. D Lema 6.13. Ak h(XnjP) = r < p ú n, AqiP má hodnosťh( A) = q, h X r-\-q (riadky A sú lineárne nezávislé s riadkami X), tak ľubovoľné 6 G /u(X) sa dá písať ako X6, kde A6 = 0. Dôkaz. Zrejme /i(X) D /j(X(I-A'(AA')_A)). Ale podľa (6.4) je hodnosť h(X(I- A'(AA')-A)) = h X h(A) = r -\- q — q = r = h(X.), teda /i(X) = /i(X(I A'(AA') A)) t.j. každé 0 G /"(X) sa dá písať ako Xč, kde A6 = 0. D Ak chceme testovať H : A/3 = 0 keď h (X) < p, h(Aq:p) = q, pričom X r + q, tak podľa lemy 6.13 R2H= min (Y - X/3)'(Y - X/3) = min(Y - X7)'(Y - X7)' ß: A/3 = 0 T R0 a iío nevieme testovať (podľa vety 6.6). Definícia 6.14. Hypotéza Ho : A/3 = 0 je testovateľná, ak riadky matice A sú lineárne kombinácie riadkov matice X, t.j. ak existuje matica Mgjn; že A = MX. Poznámka. Hypotéza Ho : A/3 = 0 je testovateľná, ak každá lineárna kombinácia a'j/3 = {A}i./3 je lineárne nevychýlené odhadnuteľná. Poznámka. Ak máme Ho : A/3 = c, tak vezmime ßo~ľubovoľné riešenie systému A/3 = c a vytvorme 6 = ß — ßo- Model Y = X/3 + e prepíšeme na model Y — Xßo = X(ß — Xßo)-\-£, čiže (pri označení observačného vektora Y* = Y — Xßo) dostávame model Y* = X6 + e. V tomto modeli testujeme hypotézu Ab = 0. Pôvodná hypotéza Ho : A/3 = c je teda testovateľná práve vtedy ak hypotéza A6 = 0 je testovateľná v "novom" modeli, teda ak A = MX. 3ö Veta 6.15. Nech Ho : A/3 = c, kde A.qjP má hodnosť h(A) = q ú r, je testovatelná, t.j. A = MX (Y je normálne rozdelený). Nech Rl = min(Y - X/3)'(Y - X/3), R2H= min (Y-X/3)'(Y-X/3). /3: A/3=c AJc f/o platí, tak (a) R2H-Rl = (A/3 - c)'(A(X'X)-A')-1(A/3 - c), kde ß je ľubovoľné riešenie normálnych rovníc X'X/3 = X'Y, (h) n-r R2H- R2 F, q,n — r- Dôkaz, pozri Anděl. 7. Viacrozmerná regresná analýza 7.1. Úvod Na každom z n objektov robíme p meraní. Výsledky meraní na i—tom objekte sú realizácie náhodného vektora Y- = (YllYl2...Yip) = {xlXxl2...xiq) (ß\\ ß\2 ■ ßl\ ßl2 .. ßlp\ ■■ ß2p + e'i, \ßql ßq2 ■■■ ßqp ' pričom Yn je meranie l—tého znaku na i—tom objekte. Všetky merania dávajú maticu ~Yn,p náhodných veličín (jej i—ty riadok značí p meraní na i—tom objekte), teda (Yxx Y12 Y21 Y22 \Ynl Yn2 Y, Y ip\ 2p Y J 1 np ' / xu x12 ... xlq\/ßu ß12 ... ßlp\ /e[ \ x 2\ x22 ... x2q ß21 ß22 ... ß2p + \xnl xn2 ... xn q ' \ßql ßq2 ■■■ ßqp ' W cize (7.1) n,p -s*-n,q£*q,p ~T~ &n P- V modeli (7.1) je XUjg daná pevná známa matica, B matica neznámych parametrov, &i = (£n£i2---£ip)' je chybový vektor na i—tom objekte a £n £12 ■n,p \£nl £n2 £íp\ £ip 'np ■ áí je matica náhodných chýb. Platí E{ ~ iVp(0,S), e\^e2l ••-,£« sú navzájom nezávislé, BgjJ9 = (/3i,...,/3p). Vektor meraní z—teho znaku je (YnY2i.. .Yni)' = Z; G "K™, z = 1,2,...,p. Teda /Aa £(Zj) - Xn,g/3j, /3j - G ft9, \/?„7 cov(Zj) = ctjjI, j = 1,2,..., p, ^'i — {^}jj / ccw Zi,Zj) - Yu,Yij) cov(Yll,Y2j) ... cov(Yu,Ynj)\ cov( cov{Y2l,Ylj) cov(Y2l,Y2j covi \cov{Yni,Yij) cov(Yni,Y2j) ... cov(Yni,Ynj) J 0 a i j Vo o Iné vyjadrenie modelu je 0 ... 0 0 \ G -7 — ^ij^-n,n — \2jjij*-n,n- vec 1 — Zjnp\ — íZl\ Z2 \zPJ /x o ' o x o ißl\ ß2 Vo o ... x) \ßjpqil + vece, čiže Ak /i(X) = q ^ n} tak a uecY = (Ip,p Xnjg)uecB + vece, cov(vecY) = T,P)P (ZJ-Xßj: a» Pre vektor Z i + Z j platí £(Zi + Zi) = X(/3i+/3i), NNLO /3i + ßj je Nevychýleným odhadom att + 2crZJ + (Tjj cov(Zl + Zj) = (crzz + 2a i j + <7^)I. X'X)-1X'(Zř + ZJ)=/3ř+/3V _ (Z, + ZjO'ÍI - X(X'X)-1X')(ZÍ + Z,) _ n Rld.D W + Ägui: + 2- R2 ■o\hJ, n — q teda nevychýleným odhadom aij je n n R? crtJ üKhJ, n Mati íca Rn ä§(2, i: Äg(l,2) i2g(2,2) \Äg(p,l) Äg(p,2) Äo(l,p)\ Rl(2,p) R20(p}P)J je zvyškovou maticou súčtov štvorcov a súčinov. Nevychýleným odhadom matice S je teda -R n ■o- Dá sa písať Rn Y'fl - XŕX'X)_1X')Y = Y'PY. Ak sú merania na jednotlivých objektoch nezávislé a majú mnohorozmerné normálne rozdelenie s tou istou kovariančnou maticou S, potom môžeme považovať ei,£2,...,en za náhodný výber z iVp(0,S). V takom prípade má vece rozdelenie Nnp(0, ^p,p In,n) (vyplýva z definície mnohorozmerného normálneho rozdelenia). Preto v takom prípade vecY ~ Nnp((lPjP X)uecB, ^PjP In,n)- Platí veta Veta 7.1. JVeci v modeli (7.1) je £i, £2, •••, £n náhodný výher z Np(0} S). Potom (a) B má normálne rozdelenie (rozumie sa tým, že vecQ má mnohorozmerné normálne rozdelenie). (b) Y'PY- Wp(n-q,Tl) (c) B a S sú nezávislé (rozumie sa tým, že vecQ a uecS sú nezávislé). X'X^X'YI Dôkaz. (a) Pretože B = (X'X^X'Y, je vecB = uec(X'X)-1X'Y = vec^ = (I (x) (X'X)_1X')uecY, z čoho je tvrdenie (a) evidentné. (b) Y'PY = Y'P'PY = (PY)'P(XB + e) = e'Pe ~ Wp(w, S) ^^ P2 = P, (pozri vetu 2.9), čo je splnené. V tomto prípade w = trP = n — q ay íc) vecB = (I (g) (X'X^X'WY a vect XfX'X^X'lY -vec[ n — q -i v/y -uecRo Y'ŕl - XŕX'X^X'Vŕl - XfX'X^X'm St n — q ■vec(Y'(l aci n — q ak ukážeme, že (I (g) (X'X)-1X')uecY a vec{\ - X(X'X)"1X')Y = (I (g) (I X(X'X)_1X'))uecY sú nezávislé. Pretože (I (g (X'X)_1X')[coi;(i;ecY)](I (g (I - X(X'X)_1X')) = = (I (g (X'X^X'XE (g I)(I (g (I - X(X'X)-1X')) = 0, dostávame aj tretie tvrdenie vety. D 7.2. Testovanie hypotéz V modeli n,p -?*-n,q£*q,p ~T~ S n,p, í£}\ pričom £i, e2, •••, En je náhodný výber z iVp(0, S) W kde/z(X) = q(S n), e testujeme hypotézu H0 : CXB = D, Ci je známa g x q matica, h(Ci) = g} D je známa g x p matica. Veta 7.2. V modeli (7.1) nech h(X) = q} n — q ^ p — 1, S je regulárna, Bo je ľubovoľné riešenie rovníc CiB = D. Označme Y_|_ = Y — XBo- Za platnosti H0: CiB = D, (h(C1)=g)má A lY'PYl |Y'PY + YYP2Y+| Wilksovo A(p, n — q, g) rozdelenie, pričom P = I — X(X'X) 1X', P2 = X(X'X)-1C'1(C1(X'X)-1C'1)-1C1(X'X)-1X'. Dôkaz. Y'PY = (XB + e)'P(XB + e) = e'Pe. Podľa vety 2.9 má Y'PY rozdelenie Wp(r, S) práve vtedy ak P2P, pričom \ takomto prípade r = trP. Ľahko sa vidí, že naozaj P2P a r = trP = n — q. teda Y'PY ~ Wp(n - q, S). Tiež platí Y^P2Y+ = (Y-XB0)'X(X'X)-1C'1(Ci(X'X)-1C'1)-1Ci(X'X)-1X'(Y-XB0; a za platnosti Ho je np2Y+ = = (X(B-Bo)+e)'X(X'X)-1C'1(C1(X'X)-1C'1)-1C1(X'X)-1X'(X(B-B0)+e) = = e'X(X'X)-1C'1(C1(X'X)-1C'1)-1C1(X'X)-1X'e. 4U Podľa vety 2.9 má Y^P2Y+ rozdelenie Wp(g,H). Podľa vety 2.13 sú Y'PY a Y^j_P2Y_|_ nezávislé, lebo (i - x(x'x)-1x')x(x'x)-1c'1(c1(x'x)-1c'1)-1c1(x'x)-1x' = 0. Podľa poznámky pod vetou 4.2 má |Y'PY| |Y'PY + YYP2Y+| Wilksovo A(p, n — q, g) rozdelenie. D Hypotézu Ho : CiB = D teda testujeme pomocou A(p, n — q}g) rozdelenia. Zamietame ju pre malé hodnoty A. Poznámka. Podobne v modeli (7.1), kde h(X.) = q} S je regulárna, môžeme testovať všeobecnejšiu hypotézu H0 : CiBMi = D, kde Mi je známa p x r matica s li(Mi) = r. Z modelu (7.1) totiž vyplýva model (7.2) Yn,pMi = Xn,9B9ii,Mi + en,pMu v ktorom je matica observácií YMi, matica plánu X a matica "neznámych parametrov" BMi, pričom e'e~ Wp(n, S) a podľa vety 2.6 má M^e'eMi ~ Wp(r, M^SMi) rozdelenie. (eMi)' je preto náhodný výber z Np(0} MjSMi) rozdelenia. Teraz už úplne analogicky ako vo vete 7.2 dostávame, že za platnosti Ho : CiBMi = D má |E| |H + E| A(r,n - q,g) rozdelenie, pričom E = (YMi)'P(YMi) a H = [(Y - XB0)Mi]'P2 [(Y-XBo)M!]. 7.3. Intervaly spoľahlivosti pre parametre modelu Pomocou kapitoly 7.2 nájdeme intervaly spoľahlivosti pre lineárne kombinácie b'CiBa (alebo b'CiBMia) v prípadoch, že a, b sú pevne dané; a je pevne dané a pre každé b; pre každé a, b. Nech B sú skutočné parametre (ich skutočná hodnota). Položíme tentokrát Y+ = Y - XB. Nech ařF, b G TZ9 sú pevne dané. Podľa lemy 2.12 b'Ci(X'X)-1X'Y+a = uec(b'Ci(X'X)-1X'Y+a) = = uec(b'Ci(X'X)-1X'ea) = (a' ® b'Ci(X'X)-1X>ece, pričom cov(vece) = cov(vecY) = ^PlP In,n (pozri kapitolu 7.1). Preto D(b'Ci(X'X)-1X'Y+a) = D((a' ® b'Ci(X'X)-1X')í;ece) = 41 = (a'(g)b'C1(X'X)-1X')(S(g)I)(a(g)X(X'X)-1C'1b) = (a'Sa)(b'C1(X'X)-1C'1b). Už v kapitole 7.2 sme ukázali, že Y'PY = Y'(I - X(X'X)"1X')Y ~Wp{n- q} S) a teda pre a ^ 0 je podľa vety 2.8 a'Y'PYa a'Sa ^n — q' Samozrejme a'Y'PYa An- a'e'Pea feaVPea a'Sa ^n~q a'Sa a'Sa b'Ci(X'X)-1X'Y+a = b'C^X'X^X'ea, pričom ea eóa Ve' a/ iVn(0,(aSa)Inin). Podľa vety 1.10 sú a'Y'PYa a'Sa a b'Ci(X'X)-1X'Y+a nezávislé, lebo -^-(a'Sa)I-X(X'X)-1C'b = 0. Pretože b'Ci(X'X)-1X'Y+a = b'C^X'X^X'ea má (WC ÍX'X"l_1X'Y Ft)2 iV1(0,(a'Sa)(b'C1(X'X)-1C'1b)) rozdelenie, má -^- U ' +) (b'Ci(X'X)-1C'1b)(a'Sa) roz- a'Y'PYa delenie \\ a Je nezávislé od ------—-----, ktoré má Xn-a rozdelenie. Dostávame, a'Sa q ze (b'C1(X'X)-1X'Y+a (b'Ci(X'X)-1C'1b)(a'Y'PYa) Pre pevné a G VI, b G VJ b'C1(X'X)-1X'Ya - b'C1(X'X)-1X'XBa)2 n — q ■F\ n- q- P ;b'Ci(X'X)-1C'1b)(a'Y'PYa) < n — q -Fltn-q(l - a)\ = l-a cize p|(b'C1(X'X)-1X'Ya-b'C1Ba)2 <, <, —^—F1 n_q(l - a)b'Ci(X'X)-1C'1ba'Y'PYal = 1 n — q J čo je to isté ako (7.3) plb'CiBaG (b'Ci(X'X)-1X'Ya- a, n — q Fhn-q(l - a)b'Ci(X'X)-1C'1ba'Y'PYa, b'Ci(X'X)-1X'Ya+ + --------Fhn-q(l - a)b'Ci(X'X)-1C'1ba'Y'PYa 1 — a. VI Poznámka. Tento výsledok dostaneme aj keď uvažujeme regresný model Ya = XBa + ea, kde observačný vektor je Ya, vektor parametrov je Ba a chybový vektor ea (pozri príklad za vzťahom (6.3)). Hľadajme teraz intervaly spoľahlivosti, ktoré súčasne pokrývajú všetky b'CiBa, kde a G 1ZP je pevné, ale b sa mení a môže byť ľubovoľné z 1Z9. Budeme potrebovať nasledujúcu lemu. Lema 7.3. Nech AíjÍ7 ~Nt,t sú symetrické matice, pričom N je pozitívne defínitná. Potom a.) pre ľubovoľné c G IV, c^O (7.4) max ^----->- = c'N^c, X7Í0 pričom maximum sa dosahuje pre x = N-1 c; h.) x'Ax 7.5 max——— = Ai, X7Í0 kde Ai je najväčšia vlastná hodnota matice AN-1. Dôkaz. Schwarzova nerovnost tvrdí, že pre ľubovoľné dva vektory x, y G 7Zf platí (x'y)2 ^ x'x y'y. Maticu N môžeme písať ako N 2 N 2, maticu N-1 môžeme písať ako N~ 2 N~ 2 (pozri Anděl, str. 64). Preto pre vektory u = N2 x, v = iV~2y (x, y ľubovoľné z 7Zf) platí (u'v)2 = (x'iV^iV-^y)2 = (x'y)2 S u'u v'v = x'Nx y'N_1y, čiže pre ľubovoľné x, y G 7Zf (7.6) (x'y)2 ^ x'Nx y'N'V- a.) Vezmime ľubovoľné c G 7Zf} c/0. Pre každé x G 7Zf platí zo (7.6) (c'x)2 S x'Nx c'N_1c, čiže pre každé x G 7Zf} x/0 platí <^ — u ex 11a „ (7-10) „\,^ ~Fg,n-q. n — q a'Ha g a'Ea Zo vzťahov (7.8) a (7.10) dostávame, že pre pevné a G 7^ f (b'Ci(X'X)-!X'Y+a)2 ^ (b'Ci(X'X)-1C'1b)(a'Y'PYa) - q ^ --------Fgjn-q(l — o) pre každé b G 7\!.5 > = ! — «, n cize p|(b'C1(X'X)-1X'Ya-b'C1Ba)2 ^ JPSin_g(l-a)b'Ci(X'X)-1C'1ba'Y'PYa pre každé b G ^5 1 < -l n — q = 1 — a. Teda intervaly spoľahlivosti, ktoré súčasne pokrývajú všetky kombinácie b'CiBa (a pevné, b G 1Z9 sa mení) s pravdepodobnosťou 1 — a sú (7.11) b'Ci(X'X)-1X'Ya± ./^—JPSin_g(l-a)b'Ci(X'X)-1C'1ba'Y'PYa. y ' ^ q Poznámka. Tento výsledok sa zhoduje s vetou 6.8 (Scheffeho metóda), ak uvažujeme regresný model Ya = XBa + ea. Teraz preberme prípad, keď "sa menia" vektory a aj b (a G 1ZP, b G 1Z9). Podľa (7.5) je a'Ha A max ——— = Ai, aenp a'Ea kde Ai je najväčšia vlastná hodnota matice HE-1. Poznamenávame len, že E ~ Wp(n - q} S) a preto E = Yľi=i €i€'ii kde €i; €2, •••, Ín-q sú nezávislé Np{0,Yi) rozdelené a podľa Anděl, str. 121 platí pre n — q ^ p, že P{E je pozitívne definitná matica } = 1. Podľa Kubáček, Kubáčková, Volaufová, str. 445 je H + E pozitívne definitná matica (H je pozitívne semidefinitná a E je pozitívne definitná matica). Preto A = — 1 nemôže byť vlastným číslom matice HE-1. Ak by totiž —1 bola vlastným číslom matice HE"1, tak |HE-1+I| = 0, ale |HE-1+I| = |(H+E)E"1| = |H + E||E_1| 7^ 0. Ďalej máme, že A (7^ —1) je vlastným číslom matice HE-1 práve vtedy ak |HE_1 - AI| = 0 <í=>- (j^xY |HE_1 - AI||E| = 0 ^^ 45 P H - AEI = O ^^ IHt^t - t^tEI = 0 l+XJ I I ^ r I l+A 1+A ^ IH ^ - TTä) - TTÄEI = 0 ^ IH - ^(H + E) ^KH + E^H čiže práve vtedy ak-------- je vlastné číslo matice (H + E)-1 H. Funkcia-------- je rastúca pre A £ ( — oo, oo), preto ak Ai je najväčšia vlastná hodnota matice HE-1, tak ------— je najväčšia vlastná hodnota matice (H + E)-1 H. Nasledujúce ekvivalencie nám dokazujú, že A je vlastná hodnota E-1 H práve vtedy ak je vlastnou hodnotou HE-1: (7.12) (HE"1 - AI| = 0 <í=>- |HE"5 - AE^E"^ = 0 ^^ ^^ |E^||E"5HE"5 — AI||E~i | =0 ^^ |E"5||E"^HE"5 - AI||E^| = 0^^ ^^ |E_1H-AI| = 0. Ak A je vlastná hodnota matice E-1 H (teda práve aj matice HE-1), tak zo (7.12) ie A > 0. Preto 6 =------------naiväčšia vlastná hodnota matice (H + E)-1 H musí 1 + Ai v ; byť v intervale < 0, 1). Keď 6 považujeme za náhodnú premennú (najväčšiu vlastnú hodnotu náhodnej matice (H + E)-1 H), tak 6 má podľa definície 4.3 6(p, n — q, g) rozdelenie. Platí tiež pre a—kritickú hodnotu rozdelenia 0, t.j. pre také 8a, že P{6 > 6a} = a, že P{9^ 9a} = 1-a, čiže t-. í X, n / n 1 . — a. P {i&; = * ú **} = P{\1 ^(l + \1)6a} = l-a, P{X1(l-ea)S0a} = l-a, (7.13) PiX, S 1%;} = 1 a (pretože Ai ^ 0, je 9 £< 0,1)). Vráťme sa teraz k (7.9). Ak a G VI, a ^ 0 (pevné) tak (b'C1(X'X)-1X'Y+a)2 a'Ha max hen" (b'Ci(X'X)-1C'b)(a'Y'PYa) a'Ea' Al: pozri (7.10)). Podľa (7.5) je zase max a^O a'Ha a'Ea 4ö a kde Ai je najväčšia vlastná hodnota matice E-1 H. Podľa (7.13) P{\\ ^ ------—} = 1 — 0 a 1 — a. Preto p|(b'C1(X'X)-1X'Ya-b'C1Ba)2 S S -----^—b'Ci(X'X)-1C'1ba'Y'PYa pre každé ařF a každé b e U9 1 = 1 — 0 a J = 1 — a, čiže intervaly spoľahlivosti, ktoré súčasne pokrývajú všetky lineárne kombinácie b'CiBa s pravdepodobnosťou 1 — a sú b'Ci(X'X)-1X'Ya ± J-----^—b'Ci(X'X)-1C'1ba'Y'PYa. \ 1 — 0a Ak chceme vedieť intervaly spoľahlivosti pre lineárne kombinácie b'CiBMia, kde Mi je matica p x r s hodnosťou /i(M) = r, postupujeme tak, že vytvoríme model (7.2) a v ňom postupujeme úplne analogicky ako v tejto kapitole. Príklad (Lamoš, Potocký, str.246). V tabuľke sú uvedené hmotnosť pšenice Y{ a hmotnosť slamy Z{ z i—teho pozemku, i = 1,2,..., 7. xn = 1, i = 1,2,..., 7 a X2i znamená množstvo hnojiva použitého na i—tom pozemku. Za predpokladu, že závislosť Yi a Z{ od xn a X2i je lineárna, nájdite regresné koeficienty. Potom testujte hypotézu o tom, či závislosť je významná, t.j. overte, či /?2 = 72 = 0. Hladina významnosti a = 0.05. pozemok 12 3 4 5 6 7 Y 30 35 31 18 28 18 29 Z 35 38 30 20 30 22 28 x2 15 21 18 9 14 9 12 Riešené. Model je Yi = ßixu + ß2x2l Zz = 7lXii +72^2z