MULTIVARIÁTNA ANALÝZA 2 1. Kvadratické formy Definícia 1.1. Nech X\,X2, ...,-Xre sú nezávislé, ÍV(0, 1) rozdelené náhodné veličiny. Potom Y = Xl+Xl + ... + X2n má rozdelenie x\ (centrálne chí kvadrát rozdelenie s n stupňami voľnosti). Veta 1.2. Nech Y ~ xl- Y má hustotu i ň—t—re 2V2 pre v > 0, /«(y) = < 2^r(#) 0 inde. Dôkaz. Pozri [Anděl, str. 79]. Poznámka. x\ rozdelenie je špeciálny prípad gama rozdelenia s parametrami a, p (a > 0,p > 0), ktoré má hustotu ap „—ax_p—1 ^ pre £ > 0, /(*) = { r(p) 0 inde. Označujeme ho T(a,p). Platí, že x\ Je rozdelenie r -j). (r(p) = /0ooe-^-1dt, P>o.) Definícia 1.3. Nech X\,Xi,...,Xn sú nezávislé, Xi ~ iV(/ij,l), i = 1,2, JVecii A = X^ľ=i Ä 0- Náhodná veličina Y = Xl+Xl + ... + X2n má necentrálne x2 rozdelenie s n stupňami voľnosti a oeňcientom necentrality A. Označujeme ho x\ \- Veta 1.4. JVecii X\,Xii--~,Xn sú nezávislé, Xi ~ iV(/ij,l), i = 1,2,..., ra. Rozdelenie pravdepodobnosti náhodnej veličiny Y = X^ľ=i (teda x\ a> ^e ^ = Sľ=i závisí len od n a A (nezávisí od jednotlivých /ii,/iraj. Dôkaz. Pozri [Anděl, str. 80]. 1 ■z Lema 1.5. Nech X ~ N(fi, 1). Náhodná veličina X2 má hustotu e 2 ( iŕt (u2t)2 \ o t s o. Dôkaz. X2 má distribučnú funkciu pre t > O Fx2(t) = P{X2 < t} = P{-VÍ < X < Vi} = f -^e-^^dx. J Si V2tt Preto je hľadaná hustota pre t > 0 • JJ'AJJ'AJJ' = JJ'AJJ', čiže EAEAE = EAE, a tiež naopak EAEAE = EAE =>• JJ'AJJ'AJJ' = JJ'AJJ' =>• (J'J)-1 J.JJ'AJJ'AJJ.J(J'J)-1 = (J'J)-1J'.JJ'AJJ'.J(J'J)-1, čiže J'AJJ'AJ = JAJ, čo dokazuje prvú časť (i). Ekvivalencia EAEAE = EAE (EA)3 = (EA)2 je jedným smerom (=^) zrejmá. Ku opaku potrebujeme nasledovné tvrdenie (1.6) 3 Dra,ra : EAE = EAEAD. Tvrdenie (1.6) dokážeme takto: ä(SAS) = ä(JJ'AJJ') ^ /i((J'J)_1J'.JJ'AJJ'.J(J'J)-1) = fc(J'AJ). Podľa Anděl, str. 62 je (1.7) ä(J'AJ) = /i(J'AJJ'AJ) ^ /i(JJ'AJJ'AJ) = /i(EAEAJ), ale /í(SASAJ) = /i(JJ'AJJ'AJ) ^ /i((J'J)_1J'.JJ'AJJ'AJ) = (1.8) = /i(J'AJJ'AJ) = fc(J'AJ), a preto z (1.7) a (1.8) ä(SAS) = /í(SASAJ) ^ /í(SASA) ^ /i(EAE), teda /i(EAEA) = ä(SAE). Y Pretože zrejme /i(SASA) C //(SAS) a hodnosti matíc vytvárajúcich tieto pod-priestory sa rovnajú, platí /i(SASA) = //(SAS) a dostávame vzťah (1.6). Z predpokladu (SA)3 = (SA)2 pomocou (1.6) dostávame SASASAD = SASAD =>• SASAS = SAS, čím sme (i) úplne dokázali. Poďme teraz dokázať (ii), čiže dokázať, že J'(A/x + b) e //(J'AJ) & S(A/x + b) e //(SAS). Ak J'(A/x + b) e //(J'AJ), tak JJ'(A/x + b) e //(JJ'AJ) = //(SAJ) = = //(SAJJ'AS) = //(SASAS) = /t(SAS) (podľa (i)). Naopak ak S(A/x + b) e //(SAS), tak (J'J)-1 J'. JJ'(A/x + b) = J'(A/x + b) e //((J'J)-1 J'.JJ'AJJ') = /t(J'AJJ') C /t(J'AJ), čím sme dokázali (ii). Samozrejme (iii) už máme dokázané (je ekvivalentné (1)). Dôkaz vety už dokončíme jednoducho. Podľa vety 1.7 je totiž k = ä(JJ'A) = tr(SA) = tr(AS) a S = ([J'(A/x + b)]'J'AJ[J'(A/í + b)]) = (A/x + b)'SAS(A/x + b). □ Uvedieme bez dôkazu vety o nezávislosti kvadratických foriem. Podrobnejšie pozri [Rao, Mitra, kapitola 9]. Veta 1.9. Nech Y ~ Np{ji, E) a Qi = Y'AY, Q2 = Y'BY dve kvadratické formy. Nutné a postačujúce podmienky nezávislosti Q\ a Q2 sú (a) SASBS = 0,SASB/x = 0,SBSA/x = 0 a /x'ASB/x = 0; ak A a B sú symetrické, nemusia byť pozitívne semideňnitné, pričom S nemusí byť regulárna. (b) ASBS = 0, ASB/x = 0, ak A je pozitívne semideňnitná. (c) ASB = 0, ak A aj B sú pozitívne semideňnitné. (d) ASB = 0, ak S je regulárna, A a B sú symetrické, nemusia byť pozitívne semideňnitné. Veta 1.10. Nech Y ~ JV^jí, S) a Qi = Y'AY + 2a'Y + a, Q2 = Y'BY+2b'Y+/3 dve lineárne-kvadratické formy. Nutné a postačujúce podmienky nezávislosti Q\ a Q2 sú (a) SASBS = 0, SASb = 0, SBSa = 0 a a'Sb = 0, ak n = 0, pričom S nemusí byť regulárna. (b) ASB = 0, BSa = 0, ASb = 0 a a'Sb = 0, ak S je regulárna, pričom fi môže byť aj nenulový vektor. 2. wlshartovo rozdelenie 2.1. Úvodné poznámky a definícia Majme Uj ~ iVp(/Xi,E), i = 1,2,..., k, ktoré sú nezávislé, S je pozitívne deŕmitná matica. Označme Uj = (Un7U2i} ...,Upi)', Y j = (Uj\}Uj2} ...}Ujk)'} j = 8 1,2,...,p a /ř/n ^12 U13 ■■■ Ulk\ U21 U 22 U23 ■■■ U2k \Upi Up2 Up3 Teda zY/ = (u1;u1;...;ufc) = V Y'/ Ďalej označme M / /ill /Í12 fJ-13 /Í21 A<22 A<23 (fii.fi2-■ ■ ■ [J-pk J Pre pevný vektor 1 G 1ZP sú náhodné veličiny l'U8 ~ JV(ť/*ť, l'Sl = of), 1 = 1,2,jfe nezávislé (lebo U j sú nezávislé). Náhodný vektor IÁ\ = \Yk,i je lineárna kombinácia normálne rozdelených nezávislých náhodných vektorov, pričom (2.1) iY~iVfc(Ml,<7,2IM). Ak b = (61,62, ■■■ibk)' je vektor konštánt, tak (2.2) U'h = 61U1 + ... + bkVk ~ ^(M'b, b'bE). Poznámka. Nech / au a-21 ain \ «2ra 1 B r, s &21 Kroneckerov súčin matíc A a B je bis\ A ® B / anB ai2B «21 B Q22B V 6ri ... brs ) alnB \ G2raB VamiB am2B ... amnQ/ mrns Vlastnosti kroneckerovho súčinu matíc pozri napr. v [Rao]. y Ak napíšeme "pod seba" stĺpce matice K, povieme, že sme vykonali na matici operáciu vec. Teda /Ul\ , u2 vecU = \Jkp,i = Ukážte, že (2.3) vecU' = U ~ Nkp(vecM', Ik)k ® a (2.2) sa dá zapísať ako (2.4) U'b = (b' Ik,k)vecU' ~ JVp((b' I^uecM', (b' ® SPiP)(b 1^)). Poznámka. Nech bi ^ b2, bi,b2 G Platí cou(W'bi,W'b2) = (b'x IJ,iJ,)(I S)(bi 1^) = b;b2 £ = bib2S. Ak b'xb2 = 0, t.j. ak bi a b2 sú ortogonálně, tak U'h\ a ZY'b2 sú neskorelované, t.j. v tomto prípade nezávislé. Podľa predchádzajúcej poznámky ľahko dokážeme nasledujúcu lemu Lema 2.1. Air bi, b2,br, r "š k tvorí ortonormálny systém v lZk, tak Vi = W'bi,...,Vr = W'br sú navzájom nezávislé a majú normálne rozdelenie, pričom V j ~ iVp(M'bj, S). Ľahko dostaneme aj nasledujúci dôsledok Dôsledok 2.2. Air B* * je ortogonálna matica (BB' = B'B = I), tair V j = (Ui:...:U*){B}.ť = U'{B}A ~ JVp(M'{B}.ť,S), i = 1,2,...,*; a coo(\í,\j) = ({B}'j (g) Ip,p)(I <8> S){B}.j ® I) = {B};ť{B}.j (8> S = 0preí ^ j, teda Vi,...,V* sú nezávislé. Definícia 2.3. Združené rozdelenie prvkov matice SPtP = Eí=i U^UJ = U'U sa nazýva Wishartovo rozdelenie s k stupňami voľnosti a značí Wp(k, S, M). Air M = 0, jedná sa o centrálne rozdelenie, označujeme ho Wp(k, S). Poznámka. (i) {S}ťi = ÍĽti U,U',} = £ti UuUji = Y-Yj = {W'W}ťi, lebo g _ Eľ=i UnUu Eľ=i ^li \Eľ=i^ľ Eľ=i^2i Eř=i^2, / (ii) Pre p = 1 a /in = /ii2 = ... = /ii* = 0 sú U; = ř7ij ~ ÍV(0, kde í = l'M'Ml, lebo iY ~ Nk(M\,a2Ik)k). Ak M = 0, tak S = 0. □ Lema 2.5. JVecii Uj ~ iVp(0,E), i = 1,2, sú nezávislé, Akjk reálna symetrická matica. U'AU ~ R/p(r, S) práve vtedy ak V 1 G W iY'A iY'~ (r\xl, (of = l'Sl, iY = Wl). V tomto prípade r = h(A) = tr(A). Dôkaz. Z lemy 2.4 vyplýva, že akU'AU ~ TVp(r, E), tak VI e 7?.p iY'A iY ~ ofx2.-Samozrejme z (2.1) iY ~ Nk(0, er2!^), čiže ^ ~ ^(0,1^^). Teda podľa vety 1.8 A1^ ~ Xr ^ A2 = A a v tom prípade r = h(A) = tr(A). Naopak ak V 1 G Kp iY'A iY = VU'AUl ~ afxl, čo je podľa vety 1.8 ekvivalentné tomu, že A2 = A, pričom v tom prípade h(A) = tr(A). A je reálna symetrická matica, idempotentná a h(A) = r. Teda A je pozitívne semidefinitná a preto existuje ortonormálny systém vektorov bi,hk G 1Zk, že A = £j=1 Ajb.;bj5 I = Ej=i b.?bj (reálne čísla Ai ^ A2 ^ ... ^ Ar > 0 sú vlastné čisla matice A a bi,br im prislúchajúce charakteristické vektory). Z rovnosti A2 = A dostávame r r r Y xihjh'j Y xshsK = Y A*b*b*> cize A2bib'x + A2b2b2 + ...A2brb'r = Aibib^ + A2b2b2 + ...Arbrb'r z čoho vyplýva, že A2 = Aj, i = 1, 2, čiže Ai = A2 = ... = Ar = 1 (lebo A^ > 0) Môžeme písať A = £j=i bjbí a tiež ZY'AZY = £j=iW'bjbíw = Ej=iViví> pričom podľa lemy 2.1 V; ~ ^(0, S) a Vi, V2,Vr sú nezávislé. Z definície preto ZY'AZY ~ Wp(r,H). □ Veta 2.6. JVeci S ~ VVp(A;, E) a BPi? matica konštánt. Potom B'SB ~ Wq(k, B'EB). Dote. b'sb = B'U'UB, kde ZYB = /Uí\ U2 B = /Ví\ V2 V m/ V vi 7 Uj ~ iVp(0, E) sú nezávislé. Preto /Ví\ V' /UÍB\ U2B Vv^7 Vu',b7 má riadky nezávislé, cov(B'Ui} b'U,-) = b'cew(U;, U^b = 0 a b'U; ~ ÍV?(0, b'eb). Platí b'sb = E*=i V*VÍ ~ VV9(/fc, b'eb) (priamo z definície). □ ii Dôsledok 2.7. (a) Diagonálne suhmatice matice S majú tiež Wishartovo rozdelenie, lebo ak g _ í Sn S12 \S21 S22 kde S11 je rozmeru l x l, tak h,i 0\ /lM 0\ = /S11 o o oj \ o oy l^o o (b) Ak S ~ Wp(k, I) a ak pre BPi9 plat/ B'B = I, potom B'SB ~ W^(/fc, I). Veta 2.8. Nech S ~ Wp{k,H) a a e W je taký vektor konštánt, že a'Ea ^ 0. a'Sa „ P°t0ma^^Xfc- Dôkaz. Podľa vety 2.6 platí, že a'Sa ~ W\(k, a'Sa), čo znamená podľa poznámky (11) pod definíciou 2.3, že ~ \k. □ Veta 2.9. Nech U1,Ura je náhodný výber z Np(0, E) (teda ZY'ZY ~ Wp(n, E)); je symetrická matica. Piati U'CU ~ Wp(r, E) <í^ C2 = C. V takomto prípade r = tr(C). Dote. Podľa lemy 2.5 je ZY'CZY ~ Wp(r, E) V 1 e W> iY'C iY ~ ofx2, (of = Y l'El, iY = Wl). V tomto prípade r = h(C) = tr(C). Pretože podľa (2.1) je -j— ~ Np(0,ľ), je podľa vety 1.7 iY'C ,Y - ni+n„ tak Si + S2 = {U[UX+U'2U2) = U'U ~ Wv{nx + n2,S). □ Veta 2.11. iVeci C„jra = C je matica konštánt, Uj ~ iVp(0, E),i = 1,2, nezávislé. Platí, že U'p nCU ~ Sľ=i ^jWp^ (x5 ^e Ai, -.., Are sú vlastné čísla matice C a W^(l, E),Wpn\l, E) sú nezávislé. Dôkaz. Môžeme písať C = X^ľ=i ^iPiPii I = Sľ=i P«PÍ' pričom Ai ^ ... ^ Ara sú vlastné čísla matice C a pi,...pra ortonormálně vektory. Teda U'CU = Eľ=i WPiP'M = X)"=i AiViVí, kde V* ~ a su nezávislé (lema 2.1). Z lemy 2.9 vieme, že U'ptp'tU = V8VJ ~ Wp(0(l, E). □ VI Lema 2.12. Pre matice príslušných rozmerov platí (2.5) uecABC = (C ® A)vecB, črAB = (vecQ')'vecA. Dôkaz. Lemu dokážte ako cvičenie. Veta 2.13. Nech Uj ~ iVp(jí, E), i = 1,2, Ui,U2,...,Ure sú nezávislé, Ci, C2 symetrické a idempotentné. IA'Q,\IA a lÁ'Q,2lÁ sú nezávislé, ak C1C2 = 0. Dôkaz. Ak ZY'Ci a WC2 sú nezávislé, tak sú nezávislé aj U'C\U a IÁ'Q,2U. U'C\ a WC2 sú nezávislé práve vtedy ak sú nezávislé KY'Ci a \U'C>2 a to je práve vtedy ak sú nezávislé uec(KY'Ci) a veci\U'C>2)^ čiže podľa lemy 2.12 ak sú nezávislé vektory (Cj (g) Vjvecli' a (C2 <8> V)vecU', ktoré sú podľa (2.3) normálne rozdelené, pričom uecZY' ~ JVnj,(0, In,„ SPiP). Pretože (Ci I)(I E)(C2 ® I súZY'Ci zlU'C>2 nezávislé. Teraz už ľahko dokončíme dôkaz. Veta 2.14. Nech S ~ Wp(k, E), E je regulárna, k^p-1. Platí: (cic2 □ 0, v 7 {s-1},, (b) Pre každý 1 e W je DÔkaz. S = £*=1 UťU'ť, U / ^ \ xL(p-i) a nezávisí od {S}íj ľS"1! 1,2, Í = 1,2, ...,p-l. ^fc-(p-i)- iVp(0,E), U i nezávislé, E = V t^i / S11 E12 S21 E22 /UPi\ Up2 u* U ry i 1, 2, U* ~ iVp_i(0, En), kde /i(En) = p — 1. Ďalej označme u, = U2i \Up-l,i/ 1 = 1,2, s= ŕE?=iU?(u?)' Etiurt/P VľLiMu*)' Eti^ Podľa lemy 4, Anděl, str. 121, P{E?=i U*(U*ľ Je pozitívne definitná} teda P{Ä(E?=i U*(U*ľ) = p - 1} = 1. Pre maticu 1, ak X /Ull U12 U21 U22 ■U\k u2k Up-l,l\ Up-1,2 U, platí u, k U'X a uiUpi = X'U- ľô (a) {s-1}^ = {J2UÍ - E(U*)'^(EU*(U«)')_1 E^u*>_1 = i=l i=l k i=l i=l k k = {u'u - E(U*)'ME u*(u*)T1 E ^u*}_1 i—l i—l i—l (pozri Anděl, str. 66). Podmienené rozdelenie Upi/xj* = Ui,...,U£ = u& je to isté ako [/pi/U* = Ui (lebo Up\ nezávisí od U|,...,U^) a teda C/pi/U* = Ui ~ iV(0 + E2iEr11ui,E22 -E2iE1-11Ei2), čo je JV(£2i£uV, {E"1}-;). Analogicky Upi/U? = Ui ~ ^(E2iEf11ui,{E-1}-p1), i = 2,3,..., k (pričom Upi,Upj pre i ± j sú nezávislé). Preto 6 /SaiSr^uA U/UÍ = Ul,...,U* = ufc ~JV( w pričom podstatné je aj to, že íl i-i. E2iEn u2 V E2iE111uífc / (2.6) /E^E-VX E2iExl u2 V E2iE111uífc / U2^11 ^12 = X7. Dostávame, že rozdelenie rc-i-i /Ui = Ui,--,U^ = ufc je rozdelenie 1* jPP ťt - É U'^É u^)_1 E u^ = ?$ ~ xcx'x)-1*)*- i=l i=l Podľa vety 1.8 má kvadratická forma — X(X'X) XX')£ rozdelenie xl-(p-ip ktoré vďaka (2.6) nezávisí od podmienky (teda od {S}^-, i, j G {1, 2, ...,p — 1}) a je preto aj nepodmieneným rozdelením. Dostávame, že {E 1}pp 2 ~ Xk-(p-i)- {s-1} Pretože dôkaz sme úplne analogicky mohli urobiť pre rU = (Ur\, č7r2,Urk)', r G {1,2,...,p} platí, -f V-1"!. rc-u--Xfc-(p-i), r G {1,2,...,p}. t3 Jrr (b) Vezmime ortogonálnu maticu B, ktorá má prvý riadok ^ ^ ť. Podľa vety 2.6 platí BSB' ~ Wp(fc,B£B'). Pretože (BSB')_1 = BS_1B', (BEB')-1 = BS_1B, 14 dostávame z (a) {BE_1B}n F ^l'S-1! — l'S_1l ~ Xk-(p-l) {BS 1B}n mn (ortogonálnou transformáciou sa príslušné hodnosti v dôkaze (a) nemenia). K dôkazu vety 2.16 potrebujeme nasledujúce tvrdenie: Lema 2.15. Nech X ~ \m a ^ ~ Xn s" nezávislé. Potom x*y ~ B (y, Dôkaz. Pozri Rao, vzťah (3b. 1.12), dokážte ako cvičenie. □ (náčrt dôkazu: U ~ ^ ~ X», tak .M") = t : i 2~2"r(^ -e 2 it 2 1 pre u > 0, 2 2 r(f v y z e 2^2 1 pre v > 0, u+d i — lí + v ^(i-y) * y -z 1-y fu,v(u,v) = fu(u)fv(v), ft(u,v)(y,z)= [2*r(f) — 1 — =det( = z e 2 [2fr(f)]-1e-í-[,(i-y)]f-^ Veta 2.16. iVech Si ~ Wp(k\,Yi), S2 ~ Wp(k2,'S) sú nezávislé, S je regulárna. Ak k\ = p — 1, taJc |S^^| má rozdelenie ako súčin r]i...r]p nezávislých náhodných veličín, r]i ~ B ^kl~P+l; a nezávisí od {S\ + S2}íj, i, j g {1,2, ...,p — 1}. Dote. Označme Si = X)?=i UťU'ť, S2 = E?=í*+i U«U! kde U* ~ ^(°, S) 1, 2,äji + ä^2 a nezávislé. U2l V upi / S21 S22 Ďalej označme U* U Eu^ = xí(1)u i=l i=l i=l ki+k-2 ki + k2 i=ki+l Konečne i=ki ^ . _ . . _ ki + k2 uŕU;. = x'2x2, J] [/p;u;. = <2>u'x2, E u*up* = x's(2)u- i=ki kí kí kí {sr1},, = {(1)u' (1)u - E(u*)'t«E utiuryr1 E ^u*}_1< i=l i=l {(Si + s.)-1},^^ ^u'! (2)u')( I^u)- ki+k2 ki+k2 ki+kr> - E (u*)'m E urcu?)')-1 E ^u*}-1- i=l i=l i=l Pretože platí (Anděl, str. 66) {S_1}pP = (£22 — S2iS111Si2) 1 = |E22 — S2iS111Si2| 1, čiže 16 dostávame -í-i-i (2.7) {Sr1} |Si| ^u' (!)u - E(U*)'MEu*(u*)T1 E i=l i=l i=l (2.8) {(Si + S^-1}-^ = ((1)u- (2)u')(Su) |Si + S2| (Si +S2)u| - E (U*)'M E urcu?)')-1 E i=l i=l i=l Zhodne ako vo vete 2.14 sa ukáže, že É= (|) =U/UI = u1,..,u:i+Jka = uJkl + k2 í SaiSr^ui \ Nkl+k2( íi -i. S2lSxl U2 XxíS"1}^!) \ E2iS111ufcl+fc2 / pričom £i je &i rozmerný a £2 je &2 rozmerný náhodný vektor. Preto podmienené rozdelenie {(Si + S2)-1}-1/UÍ = ui,..,UJ1+Jka = ukl+k2 je rozdelenie kvadratickej formy É'É-É'xtx'x^x'É-íE"1}-1 Xfc!+fc2— Í> + 1' pričom nezáleží na podmienke a preto je totožné s nepodmieneným rozdelením a je nezávislé od rozdelenia {s^Vp/u* = ui> ■-,~u*kl+k2 = ufcl+fc2, ktoré je rozdelením kvadratickej formy ÉÍÉi-Éix^xixo^x;^ = (^)((í o) " (í )(xíx1)-1(x1io)) (|) = ?a*~ Xfcj-p+i? nezávisí na podmienke a je preto totožné s nepodmieneným rozdelením. Podľa vety 1.8 je {(Si + S2)-1}-1 - {sr1}-1/^ = uls ...,u*i+fc2 = ukl+k2 = ä>f(° 0 ^ _ fx1[(x'1x1+x2x2)-1-(x'1x1)-1]x1 ? \\0 Ik2,kJ \ x2(x'1x1 + x2x2)-1x'1 X^X'^ +x'2x2)-1x'2\\ x2(x'1x1 +x'2x2)-1x,J f* = rB^{E-i>-vfc2, nezáleží od podmienky a je preto opäť totožné s nepodmieneným rozdelením. Mimo toho ľahko sa ukáže, že {(Sx + S,)"1}-1 - {Sr1}"1/!!! = ul5...,U*i+fc2 = ukl+k2 nezávisí od (lebo AB = 0). Preto {^1 }pp 1 JYC i c WH rc-li-l , rc-li-l / ^1 — Ul'•"'Ufci + *2 — U*i + *2 {(»1 + Í»2J \pp - \pp + )pp I je rozdelené ako 1 ' Y2 + Y2 ' pričom x\2 a X^-p+i v (2-9) sú nezávislé. Podľa lemy 2.15 má preto {(Sl{+s2)}-Pi}-i rozdelenie B ^) a nezávisí od {Si + S2}ťi, h J e {1, 2, p-I}.' (Cn Ci2 ••• Cir C21 C22 ••• C2r I ako |C|r, r G {1,2,...,p}. Využijúc (2.7) a (2.8) dostávame, že rozdelenie l^i I / U* = ui,U*kl+k2 = Ufci+fc2 = |Si + 52|/ |Sl \p |Sl |jr> — 1 |Si|p-i |Si|p-2 |Si|i / Ux = Ui, vkl+k2 = ufcl+fc2, |Si + S2|í, |Si + S2|í,_i |Si+52|i |Si + S2|í,_i |Si + S2|J9_2 pričom |Si\p \Si\p-i /TT* j x* fh-p+1 k2\ |Si + S2|p_i 18 a nezávisí í od |Si\p-j |Sl\p-2 |Si + S2|p-i U* = ui, ...,U*kl+k2 = ufcl+fc2, |Si + S2|p-2 ktoré má B , rozdelenie nezávislé od podmienky, atd. Teda jg^g^ má rozdelenie ako súčin r)\...r)p navzájom nezávislých náhodných veličín, pričom Veta 2.17. Ak Ui,...,Ure sú nezávislé, iVp(jí, E) rozdelené, S = — ^ľ=i(Ui — U)(Uť - U)', ide U = i ELi Uť, taJc raS ~ - 1, E). Dote. raS = £"=1(Uj - U)(U8 - U)' = £ľ=i UťU'ť - raU TJ' = ZY'ZY-iW'l„,iliinW = - ±lľ)W = U'AU = Ú'KÚ, kde Z? = (Ui - p, ...,Un - /x), lebo (/x,...,/x)A = 0. Podľa lemy 2.5 Z?AZY ~ Wp(r,£) VI e ^ YÚ'AÍÁ\ ~ (l'El)x2, pričom v tomto prípade r = /a(A) = ír(A). Pretože /(Ui-/*)'1\ (U2 - ti)'\ V (Ura-/*)'!/ = !Ý~JVn(0,(l'Sl)I) (pozri (2.1)), má \'U'AU\ rozdelenie Xr (podľa vety 1.8) práve vtedy ak A2 = A. V tomto prípade r = h(A) = tr(A). Je zrejmé, že v našom prípade A2 = A a r = h(A) = tr(A) = n-l, preto nS ~ Wp(n — 1, E). □ Veta 2.18. Ak Ui,XJk sú nezávislé, Np(fi, E) rozdelené, tak U = ^ X^í=i Ui a Ä;S = X^!=i UiUj — Ä;U U sú nezávislé, pričom U ~ Np(fi, -^E) a &S ~ Wp(k — 1,E). Dôkaz. Nech je ortogonálna matica taká, že jej k—ty stĺpec je (^, ■ Označme (Ui:...:Ufc)C = (Vi:...:V*). Potom Vfc = 4-(Ui + ... + U*) = Vfe U resp. U = 4-V*, žfcS = EU*U* -ÄU U' = (Ui:...:Ufc) i=l /uí\ U' Vu;7 = (Vi:...:Vfc)C'C /Vi \ fc-i i=l i=l Pretože Vi,V& sú nezávislé, dostávame tvrdenie lemy (pomocou vety 2.17). □ 3. hotellingovo T2 rozdelenie Nech SPjP je matica náhodných veličín (náhodná matica) dPj\ náhodný vektor nezávislý na S, S ~ Wp(k,'E), d ~ Np(6, c-1 E). Hotellingova zovšeobecnená štatistika T2 je definovaná ako atI'S-1H T2 = dfed'S-M = , , ^cďS-M. V nasledujúcom budeme uvažovať 6 = 0, c = 1, S = I, teda S ~ 1^,(^,1), d ~ iVp(0,1). Hotellingovo T2(p,&) rozdelenie je T2 = fcďS-1d a píšeme &d'S_1d ~ T2(p, k). Veta 3.1. Nech X ~ Np(fi, S) aS ~ Wp(k, E) sú navzájom nezávislé, E regulárna. Potom k(X - /x)'S_1(X - fi) ~ T2(p,k). Dokaz. E = U AU', I = UU',A = dia^Ai,Ap}, Ai ^ A2 ^ ... ^ Ap > 0, E"* = lMa#{A~ V..,A~^}U', E^ = lMa#{Af,Af }U'. Položíme d* = £-3(X-ji), S* = E-3SE-3, teda (S*)"1 = EsS-^i Zrejme d* ~ JVp(0,I), S* ~ Wp(fc,I) a preto podľa definície jfe(d*)'(S*)-1d* = k (X - ^'S'^X - fi) ~ T2(p,fc). □ Dôsledok 3.2. Majme Ui,...,Ure nezávislé, Uj ~ iVp(jí, E), E regulárna, U = ÍĽľ=iU8, s = iEľ=i(uť-u)(uť-u)', s, = ^TEľ=i(ui-u)(uť-u)'. Potom („ _ i)(u - ^'S-1 (U — /í) = n(U - vYS^CU - ») ~ T2 (p, n - 1). Dôtou:. U~ iV^/x, iS), teda VräU ~ Np(y/ňp,Yi), S* = ^-S, čiže (n- 1)S_1 = raS"1, ďalej raS ~ Wp(n — 1,E) (pozri vetu 2.17), U a S sú nezávislé (veta 2.18), teda (n - l)y/ň(U - /x)'(raS)_1Vrä(U - /x) = (n - 1)(U — /x)'S_1(U — /x) = = n(U - fiyS-1^^ - fi) ~ T2(p,n - 1). □ Veta 3.3. 2 mp T \P,m) = --rrFp,m-p+l- m — p + 1 Dôkaz. Podľa definície má T2(p, m) rozdelenie náhodná veličina md'S_1d, kde d ~ iVp(0,1), S ~ Wp(m,T). Teda náhodná veličina 20 ,2 Podľa vety 2.14 (b) menovateľ v (3.1) nezáleží od d a má xín-p+i rozdelenie (pre ľubovoľnú realizáciu náhodného vektora d má Xm-p+i rozdelenie), čitateľ v (3.1) má podľa vety 1.7 x\ rozdelenie. Preto (3.1) je podiel dvoch nezávislých náhodných veličín, s x2 rozdelením, a síce rozdelenie (3.1) je Xp 2 mn— T2/ \ m*P P Tľip T(p,m) = —-= -j- = -—Fp,m-p+i. □ Xm-p+l , , 1X Xm-p+1 m — p-\- l (m-p+ 1)-— m — p + 1 Lema 3.4. Súčin k navzájom nezávislých náhodných veličín s rozdelením B(-ji, Si), i = 1, 2,k takých, že 7^ = 7^+1 + íj+i, i = 1, 2,k — 1 má rozdelenie -8(7^, S\ + ... + Sk). Dôkaz. Pozri viac v Rao, 3a.3. Lema 3.5. Nech d ~ Np(0,I) a S ~ Wp(m,l) sú nezávislé, teda md'S_1d ~ T2{p,m), m = p-l. Platí 1 T2(p,m)Y1 |S| fm-p+1 p 1 H--= T^~.—tttt ~ m J |S + dď| V 2 2, Dôkaz. Podľa Anděl, str. 63 pre determinant štvorcovej matice ^ ^, ^ ^ platí -|S + dď| = -|S|(l + ďS-1d), S d ď -1 teda T2 (p, m l + ^m)y1 = (l + ďs_ld)_1 m 7 7 |S + dď|' pričom S ~ Wp(m, I), dď ~ Wp(l, I), (nezávisí od S) a podľa lemy 2.10 S + dď ~ Wp(m + 1,1). Preto podľa vety 2.16 má ^ ^ rozdelenie ako súčin navzájom nezávislých náhodných veličín s rozdelením beta a parametrami m — p + 1 1 \ f m — p + 2 1 \ f m 1 2 y' v 2 '2y' "' v 2' 2 Podľa lemy 3.4 má tento súčin B l---, — J rozdelenie. □ Dôsledok 3.6. Nech X a S je aritmetický priemer a výberová kovariančná matica z výberu rozsahu n z rozdelenia Np(fi, S). Potom "'■(X-Ai)'S-1(X-Ai)~ii,Pin_p. p 21 Dôkaz. Podľa dôsledku 3.2 má (ra — 1)(X — /x)'S_1 (X — /x) ~ T2(p,ra-1) rozdelenie, čiže podľa vety 3.3 má ^(X - ^)'S-\X - n) ~ T2(pjn _ i) = p p[n — i.) n — p p(n — 1 / i\ i i i Fpn — 1— p+1 — Fp,n—p p(n — 1) n — 1 — p + 1 rozdelenie. □ 4. Iné rozdelenia vyskytujúce sa pri multivariatnych štatistických analýzach Definícia 4.1. iVech A ~ T^p(m,I), B ~ Wp(n,ľ) sú nezávislé, m ^ p— 1. Potom hovoríme, že náhodná veličina 11 +A_1B 1T3I-1 |A + B| má Wilksovo lamhda-rozdelenie s parametrami p, m, n. Označujeme ho A (p, m, n) Veta 4.2. Wj'IJcsovo A (p, m,n) rozdelenie, m ^ p — 1, je totožné s rozdelením súčinu r]i...r]p nezávislých náhodných veličín, pričom r\i ~ B \---, — Dôkaz. Ak A ~ Wp(m,I), B ~ Wp(n,I) sú nezávislé, tak podľa vety 2.16 má IAI A + B 11 +A_1B IXJI-I rovnaké rozdelenie ako súčin r}i...r]p nezávislých náhodných veličín, pričom r\i ím-P + l n\ V 2 >2j Poznámka. Ak Si ~ Wp(k\,\), S2 ~ Wp(k2,l) sú nezávislé, k\ ^ p — 1, tak A=, 'S'' , |Si + S2| má rozdelenie rovnaké ako súčin r}i...r]p nezávislých náhodných veličín, pričom r\i B ^——2~~~~i ' ^° ^6 Poc^'a ve^ ^° ak° rozdelenie |Gi| 1 |Gi +G2| kde Gi ~ Wp{k\, S), G2 ~ Wp(k2} S) sú nezávislé, S je regulárna a k\ ^ p — 1. Teda A nezáleží od S a môžeme ju zadefinovať ako a — -[GjJ- Gi + G2 TI kde Gi ~ Wp{k\, X), G2 ~ Wp(k2} X) sú nezávislé, S je regulárna a k\ ^ p — 1. Poznámka. Ak S ~ Wp(n—1, S), d ~ ATp(0, S) sú nezávislé, tak Wilksovo lambda-rozdelenie s parametrami p, 77. — 1,1 je to isté ako rozdelenie náhodnej veličiny § f TI _J) p —, teda (podľa lemy 3.5) B |S + dď|' "~ X1"' ' "~J V 2 ' 2y Zo vzťahov medzi beta rozdelením a F rozdelením možno odvodiť vzťahy medzi A a F rozdelením: 1 - A(p,m,l) p A(p, m,l) m-p+1 1 - A(l,m,ra) ra A(l,m,ra) m 1 - y/A(p, m, 2) p v/A(p,m,2) m-p+1 p' 1 p+j (d) 1 - ^(2,777,77) tí ^(2,777,77) m-1 K ' Pre ostatné hodnoty n a p za podmienky, že m je veľké, možno použiť Bartlettovu asymptotickú aproximáciu m ~ \(P- n+ l)|lnA(p,m,n) ~ xlP- Pri hľadaní simultánnych intervalov spoľahlivosti parametrov multivariátnych lineárnych modelov sa používa nasledovné rozdelenie. Definícia 4.3. JVeci A ~ Wp(m,Yi), B ~ Wp(n,Yi) sú nezávislé, m ^ p, S je pozitívne defínitná. Rozdelenie najväčšej vlastnej hodnoty 9 matice (A + B)-1 B označujeme #(p, m, 7i). Podľa Rao, str. 588 toto rozdelenie nezávisí od S. Poznamenávame tiež, že b môžeme definovať ako najväčší koreň rovnice |B-0(A + B)| = 0. Ak A je vlastná hodnota A_1B, tak-- je vlastná hodnota (A + B)_1B. Keďže ide o monotónnu funkciu premennej A, 0 je dané vzťahom i + V kde Ai značí najväčšiu vlastnú hodnotu matice A_1B. Pretože Ai > 0, platí 0 < 0 < 1. Vzťahy medzi rozdeleniami 0, A a F sú: (a) #(p, m, 7i) a 0(n, m + n — p, p) majú rovnaké rozdelenie, 9(1, m, tí) 1 - A(l,m,ra) ^ 1 J l-0(l,m,n) A(l,m,ra) ~ m ™'m' (9(p,m, 1) _ 1 - A(p,m, 1) p p lCj l-(9(p,m,l)" A(p,m,l) ~ m - p + 1 i^n*-*+1- ■za 5. Metóda maximálnej vierohodnosti a test pomerom vierohodnosti Združenú funkciu hustoty rozdelenia náhodného výberu Xraj9ii = (X'x,X're)' uvažovanú pri danom x (realizácia X G 1ZP) ako funkciu vektorového parametra 6 G 1Zr nazývame funkciou vierohodnosti n L(x;0) = H/(xí;0), i=l resp. jej logaritmus, teda n /(x,0) = /(Xl,x2,...,xra,0) = lnL(x;0) = ^ln/(xť;0). i=l Vierohodnostnými rovnicami rozumieme systém ain/(Xi,9 E i=l = 0, fc = l,2 ?"i • • • i • Majme náhodný výber X = (X'x, X2,X're)', kde Xj ~ iVp(ix, E), S je regulárna. Potom £(x;/x,E) = ^TrEpf e_lEľ=i(x* - (xť - /x) ^ cize /(x; /x, E) = ln£(x;/x,E) = -^ln|27rE| - - ^(x8 - /x/E"1 (xť - /x). i=l Platí (x, - /x)'E 1 (x, - /x) = (x, - x + x - /x)'E 1 (x, - x + x - /x) = (xť - x/E-1 (xť - x) + (x - /x/E"1 (x - /x)+ +2(x8 -^'E-^x-zx), cize ^(x8 - /x/E"1 (xť - /x) = ^(x8 - x/E-1 (xť - x) + n(x - /x/E"1 (x - /x)+ i=l i=l +2 ^(x8 - x/E"1 (x - /x) = ír ^(x8 - x/E"1 (xť - x) + ra(x - /x/E"1 (x - /x) = i=l i=l S"1 ^(xí-xKx.-x)' . i=l + ra(x-/x)'E-1(x-/x)+ rcírJE^S^0} + rc(x-/x)'E-1(x-/x) 24 lebo 1 n n s(-a0 = _y(Xí_x)(Xí_x)' a 2y(xí-x)'£-1(x-/í) = i=i i=i = 2Jra-^x'íE-1(x-/x) - rax'E-^x - /x) j = 0. Dostávame /(x; /x, E) = -| ln |2ttE| - |tr {e^S^O} _ "tr (3E _ ^ _ . Ak n ^ p + 1, tak odhady metódou maximálnej vierohodnosti sú /t = X, É = S (pozri Rao, str. 575,576). Definícia 5.1. X = (X'l5 X2,X're)' je náhodný výher z rozdelenia závislého od parametra 6. Testujeme Ho : 6 G ílo X -ffi : 0 G íli ("íli je oblasť v 1Zq, ížo je podoblast' v íži hodnosti s). Test pomerom vierohodnosti hypotézy Ho oproti H\ má testovaciu štatistiku (LR-štatistiku t.j. likelihood ratio statistiku, presnejšie jej realizáciu) \í \ _ L° _ max0eS2o 1,(0) AW - ~T - 1/ maxses] L(6) Jeho kritická oblasť na hladine významnosti a je R = {x : A(x) < c}, kde c je určené tak, aby supeeS2o P{x G R} = a. Veta 5.2. Nech A je testovacia štatistika pre test pomerom vierohodnosti Ho : 0 G ílo X -ffi : 0 G íli — ílo C^i je oblasť v 1Zq). Za určitých podmienok regulárnosti pre každý 6 G ílo má —2 ln A asymptoticky (pre n —> ooj rozdelenie x\-Sj keď ílo je podoblast' Q,\ hodnosti s, (q >■$),( q — s možno chápať ako počet reštrikcií na parametre B\,#r). Ilustrácia: (a) Nech X = (X'x, X2,X're)' je náhodný výber z Np(fi, E), E je známa pozitívne deŕmitná matica. #0 : a* = a*o X .Hi : /* a*o- Potom X(x;/x,E) = |27rErfe~2 Ľľ=i(x« -M)'^-1^ - M) = = |27rE|-f efír {E"1^™1^-?(x - ^E-^x - /,)'_ Ak platí ffo, tak /x = /io a max -L(x; /x, E) = I/(x; /*o, E) = = |27rE|-fe-fMS-1S(-0]e_f(x-Mo)'E-1(x-/,o) 25 (je to jediné číslo). Ak /x "nie je ohraničená", q = p, teda max^^p Z,(x; /í, E) sa dosahuje pre fi = ft = x a preto max L(x; /í, E) = L(x; «(rea°, E) = = |27rE|-fe-fMS-1S(-')]_ Preto testovacia statistika (vlastne jej realizácia) je -21nA(x) = -2 ln , ™ _ H/^ry^ —1 cOeaOl = ra(x - /í0) E x(x - /x0). Je to realizácia statistiky ra(X — /io)'E_1(X — fi0), ktorá má za platnosti H0 podľa vety 1.8 Xp rozdelenie. (Poznamenávame len, že h(Q0) = 5 = 0, teda aj podľa tvrdenia vety 5.2 sedí pre asymptotiku, že q — s = p — 0 = p.) (b) (Hotellingov jednovýberový T2—test.) Majme náhodný výber X = (X'l5 X2,X're)' z Np(fi, E), E je neznáma pozitívne definitná matica. H0 : (i = fio X -ffi : fi ^ fi0- E sa musí odhadnúť vzhľadom na iř0 ako aj "bez ohraničenia". Dá sa ukázať, že odhady získané metódou maximálnej vierohodnosti (ich realizácie) sú za platnosti H0 : fi(rea^ = fi0, É(rea') = S(rea') + dď, kde d = x - /í0, "bez ohraničenia": p,(rea0 = x, É(rea') = S(rea'). Dostávame, že za platnosti Ho max L(x; E) = L(x; /x0, S(rea') + dď) = /x=/x0 (27r)^|S(^')+dd'|i -f {tr(S(rea') + dď)"^^"') + d'(S(rea') + dď)"1!!} _1_ -f tr(S(rea') + dď)_1(S(rea') + dď) (2tt)^|S(^0 + dď|t 1 _ np e 2 . (27T)^|S^ea0 + dď|7 Ďalej max L(x; /í, E) = L(x; x, S(rea'h (2tt)^|S(—<)|# !*ír(S(reflí))-1S(reaí)) - (x-xVíS^'^-^x-x) za (27T)^|S(™a0|f teda testovacia statistika (LR - statistika) je -21nA(X) = -2 ln rap -e" 2 , \s + (x - fi0)(x - ti0y\ (5.1) =-nln |S+(X- fio)(X- ti0y\ Za platnosti H0 je y/ň(X - fi0) ~ iVp(0, E); podľa vety 2.18 nS ~ iV^ra - 1, E) pričom y^rä(X — íXq) a sú nezávislé. Preto podľa poznámky za vetou 4.2 n S + n(X — fi0)(X - fio)'\ |S + (X - fi0)(X - /x0)'| má A(p, rc. — 1,1) rozdelenie. Podľa lemy 3.5 je to totožné s rozdelením (1 + T ^!ľi~1'>)~17 čo je rozdelenie náhodnej veličiny (1 + (X — /Xo)'S_1(X — /Xo))_1 / TI — p p \ (pozri dôkaz lemy 3.5) a podľa poznámky za vetou 4.2 to je B í —-—, — J rozdelenie. Asymptoticky má teda podľa vety 5.2 -21nA(X) = -nln (-=--) = „Wl + (X - u0)'S-1(X - u0)) 1 ; vis+(x-Mo)(x-Mo)'i; 11 ^ y ™)} X p rozdelenie. Ak chceme použiť neasymptotický test, tak za platnosti Ho má náhodná veličina (l + (X-/ío)'S-1(X-/ío))-1 f TI — p P\ B í —-—, — j rozdelenie, alebo podľa dôsledku 3.6 má za platnosti Ho štatistika "1-(X-/ío)'S-1(X-/ío) P FPjn-p rozdelenie. (c) Hypotézu Ho : E = Eo X H\ : E ^ Eo ( fi nepoznáme), pričom máme výber z Np(fi, E) rozdelenia o rozsahu n testujeme tak, že získame odhady metódou maximálnej vierohodnosti. Za platnosti H0 : p.(real) = x, E = E0, "bez ohraničenia": fi(rea^ = x, É(rea') = S(rea'). 21 Preto za platnosti Hq je max /(x; /x, E) = /(x; x, E0) = -—ln2?r - -ln |S0| - -^(E"1 S(reaí)) EJ=Eio 2 2 2 a "bez ohraničenia" je max/(x;/x,E) = /(x; x, S^) = -^ln27r - -ln|S^ea/>| - ^. s v ' ; 2 2 1 1 2 Teda testovacia LR - štatistika je -2 ln A(X) = nír(£o 1 S) - ln |SE^ | - np. Táto náhodná veličina má zložité rozdelenie, ale asymptoticky má Xm rozdelenie, kde m = \p{p + 1). (d) Hypotézu Hq : E12 = 0 ( fi nepoznáme), pričom máme výber z Np(fi, E) rozdelenia o rozsahu n testujeme tak, že normálne rozdelený náhodný vektor rozdelíme na podvektory s pi a p2 zložkami, p1 -\- p2 = p. Predpokladajme rovnaké delenie kovariančnej matice E = Sn E12 „ . . Dá sa ukázať, že odhady metódou maximálnej vierohodnosti za 2j21 e22 / platnosti Ho sú: p, = X, E = f ^ ) (Sn a S22 sú príslušné submatice \ 0 »22 / matice S). Test pomerom vierohodnosti má testovaciu štatistiku -21nA(X) = 2 f-^ln27T - -lnlSl - -írŕS^S) + ^ ln27r+ v; 1 2 2 1 1 2 v ; -r 2 -r 1« 11« ŕSn 0 VS" S^\\ i lSnllS22| 1 s 1 SH S22 - S2lSn S12 , c-lc c-lc I = ~ralnic ne i = ~nln-ic ne i- = -raln|I- S22 S2iSn Si2|. Pll|P22| |»ll||»22| Tato štatistika má asymptoticky %2 rozdelenie s pip2 stupňami voľnosti (pip2 = q, r = 0). (d) Hypotéza Ho : E = diag (špeciálny prípad (c)) ( fi nepoznáme), pričom máme výber z Np(fi, E) rozdelenia o rozsahu n je tá istá ako hypotéza Ho: R = I (R je korelačná matica). Tvrdí, že zložky vektora X sú nezávislé. Test pomerom vierohodnosti má testovaciu štatistiku (jej realizáciu) —21nA = —raln|Rx,x| (Rx,x je výberová korelačná matica). Táto štatistika má asymptoticky \2 rozdelenie s \p{p — 1) stupňami voľnosti (q = SÍŽŽll^ r = py 2» 6. Lineárny model a metóda najmenších štvorcov 6.1. Úvod Majme lineárny regresný model (LRM) (6.1) Yraji = ~Kn)Pf3P)i + £„,1, S(e) = 0, cov(e) = cr2I. Veta 6.1. Y^i=i £í = £>£ = (Y — X/3)'(Y — X/3) nadobúda minimum (vzhľadom na (3) pre /3, ktoré je (ľubovoľným) riešením normálnych rovníc (6.2) X'X/3 = X'Y. Toto minimum je rovnaké pre všetky riešenia rovníc (6.2). Dokaz. /i(X') = /i(X'X) =>• X'Y e /i(X'X) =>• (6.2) sú vždy riešiteľné. Ich ľubovoľné riešenie označme /3. Platí (Y - X/3)'(Y - X/3) = (Y - X/3 + X/3 - X/3)'(Y - X/3 + X/3 - X/3) = (Y - X/3)'(Y - X/3) + (/3 - /3)'X'X(/3 - /3) ^ (Y - X/3)'(Y - X/3). Teraz už dôkaz ľahko dokončíme. □ Označme ešte Ý = X/3 a R20 = (Y - X/3)'(Y - X/3) = Y'(I - X(X'X)-X')Y. 6.2. Matica plánu X má plnú hodnost Nech h(XniP) = p ^ n. Veta 6.2. Majme LRM (6.1), pričom h(X) = p. Platí (a) $ = (X'X^X'Y, £0) = /3 (b) cov$ = cr^X'X)-1. Dôkaz. Pozri Anděl. Veta 6.3. Pre ľubovoľné p G 1ZP má odhad p'/3 = p'/3 minimálnu disperziu zo všetkých lineárnych nevychýlených odhadov funkcie p'/3. Dôkaz. Pozri Anděl. Veta 6.4. e (-^U = a2 n — p Dôkaz. n — p £ (= _J_£(Y'(I - X(X'X)-1X')Y) = \n — p J n — p {[/3'X'(I - X(X'X)-1X')X/3 + tr[(I - X(X'X)-1X')n-p. Zadefinujme R2„= min (Y - X/3)'(Y - X/3). /3: A/3=c ' V 7 Veta 6.6. iVech A?iJ9 má hodnosť h(A) = q, c G 7?.?. Platí (za predpokladu normality rozdelenia Y) (a) R2H-Rl = (A/3 - c)'(A(X'X)-1A')-1(A/3 - c). (b) £(£2, _ El) = a2q + (A/3 _ cy(A(X'X)-1 A')"1 (A/3 - c), n-pR2H -_R2 _ , ?2 Dôkaz. Platí (c) aif platí A/3 = c, tair F =--^—■=—- má Fq^n_p rozdelenie. q Rn (Y - X/3)'(Y - X/3) = (Y - X/3)'(Y - X/3) + (/3 - /3)'X'X(/3 - /3) (pozri aj v dôkaze vety 6.1). R2H = min (Y - X/3)'(Y - X/3) = /3: A/3=c au mm /3: A/3=c (Y - X/3)'(Y - X/3) + (/3 - /3)'X'X(/3 - /3) (Y - X/3)'(Y - X/3) + min ($ - /3)'X'X(/3 - /3). /3: A/3=c Hľadajme teda min (/3 -/3)'X'X(/3 -/3), /3: A/3=c čiže mm /3: A/3=c /3'X'X/3 - 2/3'X'X/3 + /3'X'X/3 . Metodou neurčitých Lagrangeových multiplikátorov dostávame $(/3, A) = /3'X'X/3 - 2/3'X'X/3 + /3'X'X/3 + 2A'(A/3 - c) — = -2X'X/3 + 2X'X/3 + 2A'A = 0 op <9M'x <9x'Mx (lebo —— = M, —--= 2Mx, pozri Rao, str.98). dx. _ dx. Dostávame rovnice X'X/3 + A'A = X'X/3 A/3 = c, ktorých riešenie /3# nás zaujíma. Platí postupne $H = -(X'X)"1A'A + ^ A/3 - c = A(X'X)_1A'A (A(X'X)-1A')-1(A/3 - c) = A, teda Preto Ph = P- (X'X)-1A'(A(X'X)-1A')-1(A/3 - c). R2H-R20= min (Y - X/3)'(Y - X/3) - (Y - X/3)'(Y - X/3) /3: A/3=c min (/3 - /3)'X'X(/3 - /3) = (/3 - /3H)'X'X(/3 - $H) = /3: A/3=c = (A/3 - c)'(A(X'X)-1A')-1(A/3 - c). (b) Zrejme A/3 - c ~ iV9(A/3 - c, er2 A(X'X)-1 A'). Preto £{R2H - R20) = (A/3 - c)'(A(X'X)-1A')-1(A/3 - c) + + tr[(A(X'X)-1A')-12 c>2 -"-íř — -"-0 2 = - ~ v <7Z H R2 (podľa vety 1.8). Vo vete 6.5 sme dokázali, že —j ~ Xn-p- Ďalej máme Rl = Y'(I - X(X'X)-1X')'(I - X(X'X)-1X')Y. Pretože co?;((A(X'X)-1A')~5(A/3 - c), (I - X(X'X)-1X')Y) = 0, sú R2H — Rq a Rq nezávislé. Za platnosti H : A/3 = c má ř?2 c>2 (6.3) F = )=1-P n* !-p U^cU1-E(1-p(^)), u=l / i=l čo vyplýva zo subaditívnosti pravdepodobnostnej miery p, a síce p ^Uí=i -^í^) = X^!=i P(Ef). Pomocou Bonferroniho nerovnosti dostávame p ja',/3 e (a'8/3 ± íB_P(1 - ^^^(X'X)-^) }^ 1 - *| = 1 - a. (b) Metóda maximálneho modulu. Nech a^/3, ...,a'fc/3 sú nezávislé, t.j. a'i(X'X)_1a^ = 0 pre i ^ j, ti = —, 8 ~ ín-p, i = 1, 2,nech ďalej i>(&, n — p, a) je a—kritická 5 v aí(X'X)_1ai hodnota rozdelenia max1(&, rc. — p, a) > = p {|í j | _ u (ä;, n — p, a) Vi}. {í^i^k J Pravdepodobnosť, že ä; intervalov a.'l$±v(k,n-p,a)s^sĽl(X'X)-1SLl, i = 1,2,...,k súčasne pokryje všetkých k lineárnych kombinácií a'^/3 je 1 — a. Hodnoty vik,n — p, a) sú napr. v Lamoš, Potocký, tab. VII. Ak sú a'^/3 lineárne závislé, treba v nahradiť inou hodnotou, pozri napr. Hahn, Hendrickson, Biometrika 58, 1971. Intervaly v tomto prípade zostanú rovnaké. (c) Scheffeho metóda. Je založená na vete 6.8, ktorá zase vychádza z nasledujúcej lemy óó Lema 6.7. Nech Mťjť je pozitívne deňnitná matica. Pre ľubovoľný x G 1Zf platí x'Mx ^ 1 (h'x)2 ^ h'M-^ V h e "R*. Dôkaz, pozri Anděl, str. 147. Veta 6.8. Nech lineárny priestor B C 7?.^ je generovaný vektormi ai,...,a^, čiže S = /i(ai:...:aífc)í,ifc a necii /&(ai:...:afc) = k. Potom P \ |a'/3 - a'/3| ^ sJkFkin-p(l - ^'(X'X)-^ V a e B \ = 1 - a. Dôkaz. Označme A' = (ai:...:afc), teda A vety 6.6 (c) má pričom A;(A) = k. Podľa k/ k, (n - p)(A/3 - A/3)'(A(X'X)-1 A^-^A/í - A/3) k (n — p)s2 (A/3 - A/3)'(A(X'X)-1A')-1(A/3 - A/3) ks2 Fk ,n—p rozdelenie. Teda ^,..,(1-: a podľa lemy 6.7 je h'(A/3 - A/3)l 2 ^ [ks2Fk>n-p(l - a)]h'A(X'X)_1 A'h Vh e lZk \ = 1 - a /(A(X'X)-1A'^-1 -(A/3 - A/3) ^l\ = l-a cize (A'h)'(/3 - p)] ^ks2Fk:n-p(l-a)(A'hy(X'X)-1A'h Vh e ft* [■ = 1 - a čo je to isté ako p{(a'/3-a'/3)2 ^ /^^„(l - ^a^X'X)"^ Va e fi(A') = #} = !-«. □ 34 6.3. Matica plánu X nemá plnú hodnost Nech h(KnjP) = r < p ú n. Normálne rovnice majú veľa rôznych riešení, pričom jedno riešenie 0 nemôžeme považovať za odhad (3. Treba odstrániť nejednoznačnost'. Robí sa to nasledujúcim spôsobom. Uvažujme maticu B^-^p, ktorej riadky sú nezávislé, t.j. h(B) = p — r, pričom tieto riadky nezávisia od riadkov matice plánu X. Preto h ( g j = p v / n-\-p — r,p (matica plnej hodnosti v stĺpcoch). Pre maticu ( j^~n'p j = Fn+p-rjP platí, že h(F) = p. Preto p x p matica F'F = (X' B') (J^J = X'X + B'B je regulárna (/i(F'F) = /i(F'), čiže aj h(F'F) = h(F') = h(F) = p). K normálnym rovniciam X'X/3 = X'Y pridáme rovnice B/3 = 0 a dostávame X'X/3 + B'B/3 = F'F/3 = X'Y, ktorých riešenie [3 = (F'F)_1X'Y je jediné. Pre toto 0 platí 8(0) = (F'F)_1X'X/3 = (F'F)~1(X'X + B'B)/3 = /3. Dostávame teda "zúženie" systému normálnych rovníc, ktorý má takto jediné riešenie (postup pri analýze rozptylu). Definícia 6.9. a'/3 je lineárne nevychýlené odhadnuteľná ak existuje pre ňu lineárny nevychýlený odhad, t.j. ak existuje 1 G 1Zn, že £ľg(l'Y) = a'/3 V/3 G 1ZP. Lema 6.10. a'/3 je lineárne nevychýlené odhadnuteľná práve vtedy ak a G /i(X'). Dôkaz, nájdete v Anděl. Veta 6.11. Nech a'/3 je lineárne nevychýlené odhadnuteľná, 0 je ľubovoľné riešenie normálnych rovníc, t.j. X'X/3 = X'Y. Potom (a) a'/3 je jednoznačný, (b) a!0 je NNLO (najlepší nevychýlený lineárny odhad) sĽ/3, t.j. pre každý iný lineárny nevychýlený odhad a'/3 funkcie a'/3 piati £>(a'/3) — D(a!0) ^ 0. Dôkaz. Nájdete v Anděl. Skôr ako ukážeme test hypotézy H : A/3 = 0, dokážeme si dve lemy. Lema 6.12. Nech Amjk}^n,k sú ľubovoľné pevné matice, h(H) = r ú mm{n,k}. Platí (6.4) h ^g^j = h[A(I - B'(BB')-B] + h(B). Dôkaz. Matica (B':I — B'(BB') H)k,n+k má hodnosť k, lebo každý stĺpec matice B', teda B'e^ je kolmý na všetky stĺpce matice I — B'(BB')_B, teda na (I — 35 B'(BB')-B)ei, j = 1,2,...,k. lebo e-B(I — B'(BB')_B)ej = 0, j = 1,2,...,k. Teda B' má r lineárne nezávislých stĺpcov, I — B'(BB')_B má k — r lineárne nezávislých stĺpcov (lebo h(l — B'(BB')_B) = k — r). Tiež B'e^ je kolmé na (I-B'(BB')-B)ei, j e {1,2,...,*;}, teda (B':I - B'(BB')-B)fcjra+fc má k lineárne nezávislých stĺpcov, teda h(B':I — B'(BB')_B) = k (plná hodnosť v riadkoch). Teraz h ' b) = h (b) ecB + uece, cov(vecY) = TiP)P (g) Ira,ra. Ak /i(X) = g ^ ra, tak najlepší lineárny nevychýlený odhad /3, je /3ť = (X'Xr'X'Zi nevychýlený odhad o~u je Z:-(I-X(X/X)-1X/)ZŽ = R* (i, i n — q n — q a = (Ti Teda NNLO parametrov B je B = (X'X)-XX'Y. Označme R*(i,j) = (Zi-X$iy(Zj-X/3j). as Pre vektor Z j + Z j platí £(Zť +Zj) = X(/3i+/3i), NNLO /3ť + p j je cew(Z; + Zj) = (au + 2<7jj + ajj)l. (X,X)-1X'(Zl + Zj) = f3l + f33 Nevychýleným odhadom (Zť + Zj)'(I - X(X'X)-1X')(ZÍ + Zj — q teda nevychýleným odhadom aij je n — q n — q n — q Matica Rn iž2(2,l) n — q iž2(l,2) iž2(2,2) \iž2(p,l) Äg(p,2) iž2(2,p) R20(p,p)J je zvyškovou maticou súčtov štvorcov a súčinov. Nevychýleným odhadom matice S je teda S = -Rq. n — q Dá sa písať Rn Y'(I - X(X'X)_1X')Y = Y'PY. Ak sú merania na jednotlivých objektoch nezávislé a majú mnohorozmerné normálne rozdelenie s tou istou kovariančnou maticou E, potom môžeme považovať £1, £2, za náhodný výber z iVp(0, X). V takom prípade má vece rozdelenie Nnp(0, ~Sp,p <8> Ire,re) (vyplýva z definície mnohorozmerného normálneho rozdelenia). Preto v takom prípade vecY ~ Nnp((IPiP X)i>ecB, T^PjP in,n)- Platí veta Veta 7.1. iVech v modeli (7.1) je £1, £2, náhodný výher z Np(0, S). Potom (a) B má normálne rozdelenie (rozumie sa tým, že vecQ má mnohorozmerné normálne rozdelenie). (h) Y'PY~ Wp(n-q,Y,) (c) B a S sú nezávislé (rozumie sa tým, že vecQ a vec'E sú nezávislé). Dôkaz. (a) Pretože B = (X'X^X'Y, je vecB = uec(X'X)-1X'Y = uec(X'X)-1X'YI = (I (g) (X'X)_1X')i>ecY, z čoho je tvrdenie (a) evidentné. (b) Y'PY = Y'P'PY = (PY)'P(XB + e) = s'Ps ~ Wp(w,Jl) P2 = P, (pozri vetu 2.9), čo je splnené. V tomto prípade w = trP = n — q (c) vecB = (I ® (X'X)-1X')?;ecY a vect n — q -vecílo n — q -vec(Y'(l - X(X'X)-1X')Y) = -uec(Y'(I - XŕX'XWX'Vŕl - X(X'X)-1X')Y). Stačí n — q ak ukážeme, že (I ® (X'X^X'^ecY a vec(l - X(X'X)-1X')Y = (I ® (I -X(X'X)_1X'))i>ecY sú nezávislé. Pretože (I ® (X'X)-1X')[cou(uecY)](I (I - X(X'X)_1X')) = = (I <8> (X'X)-1X')(E I)(I (I - X(X'X)-1X')) = 0, dostávame aj tretie tvrdenie vety. □ 7.2. Testovanie hypotéz V modeli kde h(X) = q(^ n), s testujeme hypotézu ~^n,p — ~^-n,q^ q,p ~\~ &n,pi pričom £\, £2,sn je náhodný výber z iVp(0, E) #0 : CiB = D, Ci je známa g x q matica, h(C\) = g} D je známa g x p matica. Veta 7.2. V modeli (7.1) nech h(K) = q} n — q ^ p — 1, E je regulárna, Bo je ľubovoľné riešenie rovníc CiB = D. Označme Y+ = Y — XBo- Za platnosti H0 : CiB = D, (h(C1) = g)má A = lY'PYl |Y'PY + Y^P2Y+| Wilksovo A (p, n — q, g) rozdelenie, pričom P = I — X(X'X) 1X'; P2 = X(X'X)-1Ci(Ci(X'X)-1Ci)-1Ci(X'X)-1X'. Dôkaz. Y'PY = (XB + e)'P(XB + s) = s'Ps. Podľa vety 2.9 má Y'PY rozdelenie Wp(r, E) práve vtedy ak P2P, pričom v takomto prípade r = trP. Ľahko sa vidí, že naozaj P2P a r = trP = n — q, teda Y'PY ~ Wp(n - g, E). Tiež platí Y^P2Y+ = (Y-XB0)'X(X'X)-1C'1(Ci(X'X)-1C'1)-1Ci(X'X)-1X'(Y-XB0) a za platnosti Ho je YVp2Y+ = = (X(B-Bo)+í)'X(X'X)-1C'1(C1(X'X)-1C'1)-1C1(X'X)-1X'(X(B-B0)+í) = = í'X(X'X)-1C'1(C1(X'X)-1C'1)-1C1(X'X)-1X'í. 4U Podľa vety 2.9 má Y^P2Y+ rozdelenie Wp(g, E). Podľa vety 2.13 sú Y'PY a YÍ1.P2Y+ nezávislé, lebo (i - x(x'x)-1x')x(x'x)-1c'1(c1(x'x)-1c'1)-1c1(x'x)-1x' = o. Podľa poznámky pod vetou 4.2 má |Y'PY| |Y'PY +Y^P2Y+| Wilksovo A(p, n — q, g) rozdelenie. □ Hypotézu Ho : CiB = D teda testujeme pomocou A (p, n — q, g) rozdelenia. Zamietame ju pre malé hodnoty A. Poznámka. Podobne v modeli (7.1), kde h(K) = g, S je regulárna, môžeme testovať všeobecnejšiu hypotézu H0 : C1BM1 = D, kde Mi je známa p x r matica s h(M.\) = r. Z modelu (7.1) totiž vyplýva model (7.2) Y„,pMi = XniíBíiPMi + e„lPMi, v ktorom je matica observácií YMi, matica plánu X a matica "neznámych parametrov" BMi, pričom e'e ~ Wp(n, S) a podľa vety 2.6 má Mie'eMi ~ Wp(r, M[ EMj) rozdelenie. (eMi)' je preto náhodný výber z JVj,(0, MjSMi) rozdelenia. Teraz už úplne analogicky ako vo vete 7.2 dostávame, že za platnosti Ho : C1BM1 = D má iei ih + ei A(r,n - q,g) rozdelenie, pričom E = (YMi)'P(YMi) a H = [(Y - XB0)M1]'P2 [(Y-XBo)Mi]. 7.3. Intervaly spoľahlivosti pre parametre modelu Pomocou kapitoly 7.2 nájdeme intervaly spoľahlivosti pre lineárne kombinácie b'CiBa (alebo b'CiBMia) v prípadoch, že a, b sú pevne dané; a je pevne dané a pre každé b; pre každé a, b. Nech B sú skutočné parametre (ich skutočná hodnota). Položíme tentokrát Y+ = Y - XB. Nech a e W, b e TI9 sú pevne dané. Podľa lemy 2.12 b'Ci(X'X)-1X'Y+a = uec(b'Ci(X'X)-1X'Y+a) = = uec(b'Ci(X'X)-1X'ea) = (a' ® b'C^X'X^X'^ecsr, pričom cov(vecs) = cov(vecY) = ^PlP <8> Ire,re (pozri kapitolu 7.1). Preto D(b'Ci(X'X)-1X'Y+a) = X>((a' ® b'Ci(X'X)-1X>ecí) = 41 = (a'®b'Ci(X'X)-1X')(E(g)I)(a(g)X(X'X)-1C'1b) = (a'Ea)(b'Ci(X'X)-1C'1b). Už v kapitole 7.2 sme ukázali, že Y'PY = Y'(I - X(X'X)-1X')Y ~Wp(n- q, E) a teda pre a ^ 0 je podľa vety 2.8 a'Y'PYa 2 Are- a'Sa Samozrejme a'Y'PYa 2 _ a'e'Pea _ (ea)'Pea rsj a'Sa Xn~q a'Sa a'Sa b'Ci(X'X)-1X'Y+a = b'Ci(X'X)-1X'sa, ~ JVn(0, (a£a)In,n). Podľa vety 1.10 sú pričom ea = 1 2 \e'nJ a'Y'PYa a'Sa b'Ci(X'X)-1X'Y+a nezávislé, lebo -^-(a'EaU-XŕX'X^CÍb = 0. a'Sa1 J 2 y ' 1 Pretože b'Ci(X'X)-1X'Y+a = b'Ci(X'X)_1X'ea má ^(O^a'S^lb'C^X'X)-^'^)) rozdelenie, má (ff^^ ^ a'Y'PYa a'Sa (b'Ci(X'X)-1X'Y+a)2 1 delenie xí a Je nezávislé od -—-, ktoré má Xn-q rozdelenie. Dostávame, (b'Ci(X'X)-1C'1b)(a'Y'PYa) ~ n - qFl'n q' Pre pevné a G TZP, b G 1Z9 [(b'C^X'^-^X'Ya-b'C^X^-^X'XBa)2 ^ 1 n_„K_,_„ \ (b'C1(X'X)-iC'1b)(a'Y'PYa) =n-q1'n-q{ ~ ' cize p|(b'C1(X'X)-1X'Ya-b'C1Ba)2 ^ ^ -J—i?!^.^! - a)b'Ci(X'X)-1C'1ba'Y'PYa| = 1 - a, čo je to isté ako (7.3) p|b'CiBa G ^b'Ci(X'X)-1X'Ya— - yJ-^—Fhn-q(l - a)b'Ci(X'X)-1C'1ba'Y'PYa, b'Ci(X'X)_1X'Ya+ + yJ^-^F1>n-q(l - «)b'C1(X'X)-1C'1ba'Y'PYa^ | = 1 - a. Poznámka. Tento výsledok dostaneme aj keď uvažujeme regresný model Ya = XBa + sa, kde observačný vektor je Ya, vektor parametrov je Ba a chybový vektor sa (pozri príklad za vzťahom (6.3)). Hľadajme teraz intervaly spoľahlivosti, ktoré súčasne pokrývajú všetky b'CiBa, kde a G TZP je pevné, ale b sa mení a môže byť ľubovoľné z TZ9. Budeme potrebovať nasledujúcu lemu. Lema 7.3. Nech AíjÍ5 ~Nt,t sú symetrické matice, pričom N je pozitívne deňnitná. Potom a. ) pre ľubovoľné c G TV, c ^ 0 (7.4) max = c'N^c, V ; xeť x'Nx x^O pričom maximum sa dosahuje pre x = N-1 c; b. ) x' .A-X (7.5) max——— = Ai, x^O kde Ai je najväčšia vlastná hodnota matice AN_1. Dôkaz. Schwarzova nerovnost tvrdí, že pre ľubovoľné dva vektory x, y G TV platí (x'y)2 = x'x y'y. Maticu N môžeme písať ako N2N2, maticu N-1 môžeme písať ako N-2 N-2 (pozri Anděl, str. 64). Preto pre vektory u = N'2 x, v = N~^y (x, y ľubovoľné z TV) platí (u'v)2 = (x'iV^JV-^y)2 = (x'y)2 ^ u'u v'v = x'Nx y'N_1y, čiže pre ľubovoľné x, y G TV (7.6) (x'y)2 ú x'Nx y'N_1y- a.) Vezmime ľubovoľné c G TV, c/0. Pre každé x G TV platí zo (7.6) (c'x)2 ú x'Nx c'N_1c, čiže pre každé x G TV, x ^ 0 platí x'Nx = ' teda max ' ' < c'N_1c, (c^x) ce7?; x'Nx x^o pričom je ľahko vidieť, že maximum sa dosahuje pre x = N c. 4a b.) Označme Ai = A2 ^ ... ^ \t korene rovnice |A — AN| = 0. Pretože A — AN| = 0 |AN_1 - AI||N| = 0 |AN_1 - AI 0, sú Ai,...,Aí aj práve všetky vlastné hodnoty matice AN 1. Podľa Rao, lc.3 (II) existuje matica R, ktorá je regulárna a platí (7.7) kde r-1'ar-1, n = r_1'r- /Ai 0 0 A2 V o Pretože každý vektor x G lV môžeme písať ako R 1u, u G lV (čiže lV {R-1 u, u G K*}), platí zo (7.7) u'Au u'R-1 AR^u max max x'Ax max —;— = Ai. ,ew* u'Nu uerc* u'R-^R-iu xerc* x'x u^O u^O x^O lebo x'Ax _ Yfi=i < A Ľ Ai a rovnosť sa dosahuje napr. pre x = (1, 0,0)'. □ Podľa (7.4) sa maximum výrazu (b'C1(X'X)-1X'Y+a)2 (7.8) (b'Ci(X'X)-1Cib)(a'Y'PYa) dosahuje vzhľadom na b (a je pevné, teda Ci(X'X)_1X'Y+a je "fixné") ak b = (C1(X'X)-1C'1)-1C1(X'X)-1X'Y+a a toto maximum je a'Y;[X(X'X)-1Ci(C1(X'X)-1C'1)-1C1(X'X)-1X']Y+a _ a'Y'PYa ~ (7 9) = a'[YVP2Y+]a = a^Ia 1 ' a'Ea a'Ea Ľahko sa ukáže (pozri vetu 7.2 a vetu 2.9), že H = YÍ|_P2 Y+ ~ Wp(g} S) (tentokrát Y+ = Y - XB), E = Y'PY ~Wp(n- q, S), pričom H a E sú nezávislé (podľa vety 2.13). Preto podľa vety 2.8 má a'Ha 2 a'Ea Xg 44 a'Ea a'Ea Xn~q a posledné dve náhodné veličiny sú nezávislé. Dostávame, že n — q a'Ha „ 7-10 ---^~^,n-,- g a'Ea y' * Zo vzťahov (7.8) a (7.10) dostávame, že pre pevné a G 1ZP f (b'CMX'XriX'Y+a)2 c (b'Ci(X'X)-1C'1b)(a'Y'PYa) ^ —-—Fg^n-q(l — a) pre každé b G TZ9 ^ = 1 — a, cize p|(b'C1(X'X)-1X'Ya-b'C1Ba)2 ^ ^ -^—F„ n-Jl - a)b'Ci(X'X)_1C'1ba'Y'PYa pre každé b G TZ9 \ = n-q ' J = 1 — a. Teda intervaly spoľahlivosti, ktoré súčasne pokrývajú všetky kombinácie b'CiBa (a pevné, b G 1Z9 sa mení) s pravdepodobnosťou 1 — a sú (7.11) b'Ci(X'X)-1X'Ya± , —2—Fg>n-q(l - a)b'Ci(X'X)-1C'1ba'Y'PYa. y n — q Poznámka. Tento výsledok sa zhoduje s vetou 6.8 (Scheffeho metóda), ak uvažujeme regresný model Ya = XBa + sa.. Teraz preberme prípad, keď "sa menia" vektory a aj b (a G 1ZP} b G 1Z9). Podľa (7.5) je a'Ha ^ max- = Ai, a |H^ - ^E| = O <=> ^ lH i1 ~ ih) ~ TTÄEI = O IH - ttä(H + E)| = O « «|(H + E)-1H-T^I|=0, čiže práve vtedy ak ^ ^ je vlastné číslo matice (H + E)-1 H. Funkcia ^ ^ je rastúca pre A G (—00, 00), preto ak Ai je najväčšia vlastná hodnota matice HE-1, tak -í— je najväčšia vlastná hodnota matice (H + E)_1H. Nasledujúce ekvi- 1 + Ai valencie nám dokazujú, že A je vlastná hodnota E-1 H práve vtedy ak je vlastnou hodnotou HE"1: (7.12) |HE_1 - AI| = 0 |HE-3 - AEÍ||E_i | = 0 |E3||E_5HE~5 _ AI||E~5| = o |E~5||e-5HE~5 _ AI||E= | = 0 «==> |E_1H - AI| = 0. Ak A je vlastná hodnota matice E_1H (teda práve aj matice HE-1), tak zo (7.12) je A _ 0. Preto B = -^—--najväčšia vlastná hodnota matice (H + E)-1 H musí 1 + Ai byť v intervale < 0,1). Keď B považujeme za náhodnú premennú (najväčšiu vlastnú hodnotu náhodnej matice (H + E)_1H), tak B má podľa definície 4.3 #(p, n — q, g) rozdelenie. Platí tiež pre a—kritickú hodnotu rozdelenia 9, t.j. pre také Ba} že P{B > Ba} = a, že P{B Ú0a} = l-a, čiže P{AX S (1 + Ai)0a} = 1-a, P{Ai(l-(9a) ^Ba} = 1-a, (7.13) P{Al^T^-} = l-a (pretože Ai _ 0, je B €< 0,1)). Vráťme sa teraz k (7.9). Ak a e TZP, O (pevné), tak (b/Ci(X/X)-1X/Y+a)2 _ a'Ha bei$ (b'Ci (X'X)-1 CÍ b)(a'Y'PYa) _ a'Ea b^O v v / 1 /v ) (pozri (7.10)). Podľa (7.5) je zase a'Ha ^ max ——— = Ai, aer a'Ea 46 kde Ai je najväčšia vlastná hodnota matice E_1h. Podľa (7.13) P{AX ú -^—} = 1 — 0a 1 — a. Preto p|(b'C1(X'X)-1X'Ya-b'C1Ba)2 ^ ^ °a b/Ci(X/X)-1C/1ba/Y/PYa pre každé aeF a každé beK9 \ = 1 — Ba J = 1 — a, čiže intervaly spoľahlivosti, ktoré súčasne pokrývajú všetky lineárne kombinácie b'CiBa s pravdepodobnosťou 1 — a sú b'Ci(X'X)-1X'Ya± J—^-b'Ci(X'X)-1Ciba/Y/PYa. V 1 — B a Ak chceme vedieť intervaly spoľahlivosti pre lineárne kombinácie b'CiBMia, kde Mi je matica p x r s hodnosťou h(M.) = r, postupujeme tak, že vytvoríme model (7.2) a v ňom postupujeme úplne analogicky ako v tejto kapitole. Príklad (Lamoš, Potocký, str.246). V tabuľke sú uvedené hmotnosť pšenice Yi a hmotnosť slamy Z{ z i—teho pozemku, i = 1,2, ...,7. xn = 1, i = 1,2, ...,7 a X2i znamená množstvo hnojiva použitého na i—tom pozemku. Za predpokladu, že závislosť Yi a Zi od xn a X2i je lineárna, nájdite regresné koeficienty. Potom testujte hypotézu o tom, či závislosť je významná, t.j. overte, či /32 = 72 = 0. Hladina významnosti a = 0.05. pozemok 1 2 3 4 5 6 7 Y 30 35 31 18 28 18 29 Z 35 38 30 20 30 22 28 x2 15 21 18 9 14 9 12 Riešené. Model je Yi = faxu + (32x2i Zi = JlXu + 72^2i