PLÁNOVANIE REGRESNÉHO EXPERIMENTU Predložený text bol spracovaný hlavne podlá [5], [6], [7]. 1. ZÁKLADNÉ POJMY Prvá fáza prípravy experimentu spočíva v stanovení delových parametrov a pokial tieto nie su priamo observovatelné (meratelné), v stanovení dostatočného počtu takých priamo observovatelných parametrov, ktoré sú vo vhodnom (vysvetlíme neskôr) známom funkčnom vztahu s cielovými parametrami. Vektor cielových parametrov označme j3. Budeme předpokládat, že j3 G 7Zk. Priamo observovatelné (meratelné) teoreticky bezchybné parametre (veličiny) označme /i2,/xjv0, teda počet priamo meratelných veličín je Nq. Ďalej predpokladáme, že poznáme funkciu f(-) : 7Zk —> 7ZN° (vyjadrujúcu meratelné parametre ako funkcie cielových parametrov) . Túto situáciu popisuje teoretický model merania /x = f (/3) im \Ín0((3)J Príklad 1.1. Úlohou je stanovú súradnice P\, P2 bodu A = (P\,P2), ked meriame vzdialenosti Hi,H2,H3 (daných) bodov B = (x±,yi), C = (x2,y2) D = (2:3,1/3) od bodu A. Teoretický model merania je ^/{p1-x1Y + {P2-y1y = I ^{Pl-X2)2+{P~2~V2? V(/5i-^)2 + (/32-y3)2 Príklad 1.2. Treba určit váhu troch predmetov P\,P2,Pz na ručičkových váhach (majú jednu misku). Vážit môžeme veličiny /i8, pričom teoretický model váženia je / a) \ M2 Po + Pl M3 Po + P2 M4 = Po + p3 Ms P0 + P1+ P2 M6 Po + Pl + p3 . M7 I P0 + P2 + p3 VMS/ \Po+Pl+P2 + p3/ kde napr. /iq znamená, že vážime prázdne váhy, /í5 znamená, že vážime spolu prvé a druhé závažie, atd. Stretli sme sa tu aj s novým fenoménom, a síce parametrom 1 2 Po. Je to nulový údaj váh (prázdne váhy). Voláme ho tzv. rušivým parametrom. Z našich úvah ho vylúčime, hoci z modelu merania ho vylúčit nemôžeme. V nasledujúcom budeme předpokládat, že teoretický model merania je lineárny (alebo linearizovaný) v cielových parametroch, t.j. (1.1) /x = f (/3) = F/3 : Vr / kde F je známa N0 x k matica plánu, je jej z—ty riadok. Model z príkladu 1.2 je lineárny. Model z príkladu 1.1 vieme linearizovat. Ako ? Príklad 1.1 - pokračovanie. Nech — 0,00m, yi — 0,00m; x2 — 2365,22m, 1)2 — 0,00m; x3 — 3603,67m, y3 — 823,35m. Približné (namerané) hodnoty m « 1980,102m, H2 ~ 2040, 243m, /i3 « 2598, 878m. Z rovníc 1980,102 = y/(p10 - 0, 00)2 + (P20 - 0,00)2 2040, 243 = V(/3i0 - 2365,22)2 + (p20 - 0, 00)2 spočítame hodnoty Piq a /?2o, z čoho dostávame Pio — 1131,5m a /320 = 1625, 0m. Funkciu f linearizujeme (rozvinieme do Taylorovho radu a zanedbáme členy rádu druhého a vyšších) okolo hodnôt Pio a P20, teda H ~ \/(äo - x,)2 + (/320 - y*)2 + Xllo =% VÍPio - aľí)2 + (P20 - Vi) ^{Pw-xl)2 + {p2o-Vi) Dostávame linearizovaný model (1.1) ^20 - Vi xa • 1 o Q %, * = 1, 2, 3. Mi - 1980,131 \ / 0,571%+0,821% \ / 0,571 0,82l\ H2 - 2040, 267 = -0,605% + 0, 796% = -0,605 0,796 m - 2598, 897/ \-0,951% + 0, 308% / \-0,951 0,308/ s (novými) parametrami (% a (%. Observovatelný parameter /ii samozrejme nepoznáme presne. Výsledok jeho zmerania je číslo yi, ktoré považujeme za realizáciu náhodnej veličiny Yi. Váha tohto merania je A^ a je nepriamo úmerná disperzii D(Yi). Všetky merania považujeme v nasledujúcom za neskorelované. Dostávame sa k stochastickému modelu merania. V prípade, že práve jedenkrát (nezávisle) meriame každý priamo observovatelný parameter i — 1,2,Nq a váhy jednotlivých meraní sú Aj, i — 1,2, ...,Nq, stochastický model merania je lineárny regresný model (Yjv0,i, Fjv0,fe/3fe,i, c2A_1). 3 Observačný vektor (vektor meraní) Y má vektor stredných hodnôt F/3 a kova-riančnú maticu c2 A-1, kde A /Ai 0 ... 0 \ ' 0 A2 ... 0 1 VO 0 ... \NJ Ďalšia fáza prípravy experimentu spočíva v respektovaní pravidiel optimálneho návrhu (regresného) experimentu, kedy odpovedáme na otázku, kolkokrát ktorý priamo observovatelný parameter treba merat, aby výsledok spracovania respektoval určité dopredu zadané kritéria optimality, napr. aby experiment pri zadanej presnosti cielových parametrov bol čo najlacnejší, aby určité vybrané parametre boli odhadnuté s najväčšou možnou presnostou, t.j. s minimálnou možnou disperziou ich odhadov, atd. Príklad 1.3. Každý priamo observovatelný parameter meriame práve jedenkrát. Lineárny regresný model merania je (Yjv0ji, Fjv0,fe/3fe,i, c2A 1), teda stredná hodnota observačného vektora je Vr / /3 = F/3 a jeho kovariančná matica je a2 A 1. Najlepším lineárnym nevychýleným odhadom (NNLO) parametra (3 je /3(Y) = (F'AF)_1F'AY. Kovariančná matica NNLO 0 je = cr2(F'AF)_1 = ^2 (fi-f«.) /Ai 0 ' 0 A2 VO 0 W5\ AjV0 / U=i Predpokladáme, že experiment je navrhnutý tak, že matica F'AF je regulárna (váhy Aj, i — 1,2,No sú kladné a hodnost matice F, teda h(F) — k 5= A?o). Príklad 1.4. Vyberme r rôznych priamo observovatelných veličin ,. ličinu Hi merajme krát, pričom všetkých meraní nech je opát Nq, čiže ELi^3 = No- 4 Observačný vektor a matica plánu v tomto prípade sú /{i\ N0,l 41, «1 ' N0,k f 41 f í 2 f 42 (riadok f/, je práve krát, j — 1,2, ...,r). Matica váh observačného vektora je * A — díag{Xi1,A^, \2,\2,Air,Air}, pričom na diagonále je A^ práve Tii. krát, j — 1, 2,r. Ľahko vidíme, že NNLO /3 je v tomto prípade /3(*Y) = (*F' *A *F)~1 *F' *A *Y = („F' *A *F) „F' *A „Y = /3(„Y) kde *-c r,k 'ť 41 f/ n^Ajj 0 0 nl2 Aí2 \ * * r,l VO 0 ... nÍT\ÍT) pričom yÍ3 = ^I]ľ=i^,,t, j = 1,2,..., r, YL ,i, YL,2, ^4,,™,. sú nezávislé mera-nia veličiny /i^. Kovariančná matica odhadu ^(„Y) je = cr2(,F' *A „F)"1 = ^< (f4l,...,fv) n^Ajj 0 0 nl2\l2 0 \ V o o Vi J (>>a, r, r; Zadefinujme si niektoré základné pojmy. Definícia 1.5. Funkcia ô : {1,2,...,AV -> <0,1> pre ktorú platí J^iSi ^(*) — 1 sa nazýva návrh, plán alebo projekt experimentu (design of experiment). Ak celkový počet meraní je N, potom číslo rii — N ô (i) udáva počet opakovaných meraní hodnoty Číslo ô (i) je relatívny počet replikácií (opakovaní) merania hodnoty jii. 5 Definícia 1.6. Množinu indexov S p (ô) — {i : ô (i) > 0} nazývame spektrom (suportom, nosičom) návrhu ô. Samozrejme S p (ô) c {1,2,Nq}. Meráme tie veličiny /ííi;/íí2, ...,[iiT spomedzi všetkých experimentálnych bodov (observovatelných veličín, parametrov), teda z množiny £ — {/ii, ...,/íjv0}, ktorých indexom plán ô priradil nenulovú hodnotu, čiže pre ktoré S (i j) > 0. Definícia 1.7. Matica kde f/ je daný vektor, pre ktorý piati íl/3 — sa nazýva informačná matica experimentu pri návrhu ô. Definícia 1.8. Majme £ — {/ii,/íjv0} (množinu priamo observovatelných parametrov) a návrh S. Celkový počet meraní je N. Cielové parametre sú (3 G 7Zk. Poznáme ii - vektor, pre ktorý platí £[(3 — /ii a Xi - váhu merania veličiny i — 1,2,Nq. Rešpektujeme plán ô, t.j. opakujeme rii — Nô(i) krát meranie veličiny /ii, ak prirodzené číslo i G Sp(ô). Potom lineárny regresný model experimentu s (presným) návrhom ô je (1.2) (Yä.FäA^A^1). Ak {íi, ...,ír} — Sp(ô), tak matica Fg je vytvorená riadkami j — 1,2, ...,r a S.^, je diagonálna matica A, /Xllnll 0 ... 0 \ /Xll5(i1) 0 ... 0 \ ' " ^ - " » '0 \l25{i2) ... 0 » 8 0 Aí2ní2 ... 0 = N Vo 0 ... XirnirJ Vo 0 ... \irö(ir)J Yg je r rozmerný náhodný vektor, ktorého j - ta súradnica je {Yg}j — -^-(Yí^i + ^,2 + -.. + ^,^.), J = 1,2,..., r. Veta 1.9. Majme lineárny regresný model (1.2) z definície 1.8. Platí 1. Lineárny funkcionál g(-) vektora parametrov ß je (lineárne a nevychýlené) odhadnutelný práve vtedy ak g(ß) — g'ß, pričom g G M(M.(ö)) — {M(5)u : ueKk}. 2. Vektor parametrov ß je (lineárne a nevychýlené) odhadnutelný práve vtedy ak M(5) je regulárna matica. 3. Najlepší nevychýlený lineárny odhad (NNLO) parametra ß je ß(Ys) = (F'sAsFsy-F'gAsYs. 4- Kovariančná matica NNLO ß(Yß) je 2 cov(ß(Ys),N) = ^(F'sAsFs)-1 = ^-M_1(5). 6 Dôkaz. Spravte ako cvičenie. Pre experiment s delovými parametrami j3\,...,j3k a observovatelnými parametrami ni, ...,hn0 možno určit tolko návrhov, kolko je funkcií ô : {1, 2, Nq} —> < 0,1 > spĺňajúcich podmienku J^iSi ^(*) — 1- -Pre = 2 je týchto funkcií nekonečne vela. Triedu všetkých návrhov označme A. Návrh ô G A nazveme regulárnym, ak deí(M(5)) ^ 0. Triedu všetkých regulárnych návrhov označíme ^■reg ■ Príklad 1.10. (podlá [7], str. 13) Majme tri predmety Ai, A2, A%, ktorých hmotnosti sú /?i, /?2, /?3 (neznáme). Pomocou N — 4 vážení treba určit (odhadnut), na ručičkových váhach tieto hmotnosti. Vytvorme si teoretický model váženia podlá príkladu 1.2 a stochastický model podlá príkladu 1.3. Nq — 8, £ — {ni, 8,1 8,4 f1 0 0 1 1 0 0 1 0 1 0 1 0 0 1 1 1 1 0 1 1 0 1 1 0 1 1 \1 1 1 1/ l8,8- I. organizácia váženia (nazvime ju bežnou): 1. váženie - zistenie nulovej výchylky váh n 2. váženie - váženie predmetu Ai 3. váženie - váženie predmetu A2 4. váženie - váženie predmetu A% Podlá príkladu 1.2 sme si vybrali 4 observatelné veličiny, a síce ni, M2; M3> M4- Počet všetkých vážení je N — 4, plán tohto (bežného) experimentu je 4, pre ktorý platí 4(1) = 4(2) = 5b(3) = 5b(4) = i, 4(5) = 4(6) Sp(Sb) — {1,2,3,4}. Observačný vektor je Y$b — stredná hodnota je = 4(7) = 4(8) = 0, teda (*M.^2,i.*3,i.^4,i)'- Jeho pričom 7 — (k, Pi, p2, P3)'■ Matica váh meraní je A$b — NNLO parametra 7 . AsbFsb)~1F's Agb ~Ygb a kovariančná matica tohto odhadu je (T2(F^AábFáJ-1 = ^M-1(4) = (r2 -1 2 1 1 II. organizácia váženia (nazvime ju premyslenou): 1. váženie - váženie všetkých troch predmetov 2. váženie - váženie predmetu Ai 7 3. váženie - váženie predmetu 4. váženie - váženie predmetu A3 Tentokrát sme si vybrali 4 observatelné veličiny /zs, M2; m3; m4- Počet všetkých vážení je opát N — 4, plán (premysleného) experimentu je ôp, pre ktorý platí Sp(8) = Sp(2) = 5„(3) = 5P(4) = \, Sp(5) = 5P(6) = Sp(7) = 5P(1) = 0, teda Sp(ôp) = {8,2,3,4}. Observačný vektor je Yáp = (T8,i,y2,i^3,i,y4,i)'- Jeho stredná hodnota je Fáp7 = 7 = (k, /3i, ^2, ä)'- matica váh meraní je opát A$p — NNLO parametra 7 je (F^ AgpFgp)^1F's AgpYgp a kovariančná matica tohto odhadu je o2 1 -0,5 -0,5 -0,5 0,5 1 0 0 0,5 0 1 0 0,5 0 0 1 a\F'sASpFSp)-^-m-\5p)^^ Ked porovnávame oba organizácie váženia (oba plány), vidíme, že pri oboch dostávame nevychýlené odhady neznámych hmotností /31; /32, P%. Pri bežnom pláne majú tieto odhady disperzie 2a2, pokial pri premyslenom pláne sú disperzie odhadov a2, teda menšie. Navyše pri premyslenom pláne sú odhady neskorelované. 2. Najdôležitejšie kritériá optimality Návrh ô treba vybrat tak, aby spĺňal nejaké kritéruim. Máme napr. určit čo najpresnejšie hodnotu h'(3, (3 G 7Zk (h je daný vektor). Merat môžeme N- krát. Za optimálny budeme považovat ten návrh ô*, pre ktorý platí h'M^Onh = miíifh'M-'ííjh : ô G Areg}. Návrh ô* v tomto prípade minimalizuje disperziu odhadu h'/3. V praxi sa najčastejšie vyskytujú tie kriteriálne funkcie, ktoré sú uvedené v nasledujúcom. Používa sa pre ne označenie D—optimalita (podlá slova dispersion), A—optimalita (average), L—optimalita, reštringovaná A—optimalita a reštringova-ná Z?—optimalita. Iné kritériá pozri napr. v [7]. Definícia 2.1. Zobrazenie L(-) : Sk —> 1Z je lineárny pozitívny funkcionál definovaný na priestore Sk symetrických matic typu k x k, pre ktorý piati (i)V{A,BeSk} L(A + B) = L(A) + L(B), (U) V{a G ft}V{A G Sk} L(aA) = aL(A), (iii) V{A G Sk ■ A je pozitívne definitná matica } L(A) > 0. Definícia 2.2. Návrh ô*D G Ares je D—optimálny ak cteípVr1^)] = mmídeípVr1^)] : 5 G AreJ. 8 Definícia 2.3. Návrh 5*A G Ares je A—optimálny ak Tr[M_1(5^)] = mm{Tr[M_1(5)] : 5 G Areg}. Definícia 2.4. Návrh ô*L G Ares je L—optimálny ak LpVT1^)] = mmíLpVI-1^] : ô G AreJ. Nech je vektorový parameter /3 G 7?.fe vyjadrený v tvare či kde /3i (užitočný parameter) je k\ rozmerný a /32 (rušivý parameter) je k^ rozmerný, pričom ki+k2 — k. V súlade s týmto rozkladom je rozložená aj informačná matica a jej inverzia. Teda platí, že pri použití plánu ô a celkovom počte meraní N je (t2 kovariančná matica cov(0i) — — M1'1 (5), kde [2-1} m [ô> ~ [m2'1^) m2>2(ô)J- Definícia 2.5. Návrh ô*D G Ares je reštringovane D—optimálny ak deípVE1'1^)] = minidetiM1'1^)] : ô G Ares}. Definícia 2.6. Návrh ô*A G Ares je reštringovane A—optimálny ak TrpVE1'1^)] = mmíTrpM1'^)] : 5 G AreJ. Trochu odlišné je kritérium E—optimality. Definícia 2.7. Návrh G Ares je E— optimálny ak S-^M-1^) S-^M-1^) 5 G Areg, iV = 1,2, fcde S je dopredu zadaná cielová kovariančná matica výsledného odhadu vektorového parametra (3, pričom ||A|| = i/Tr(AA'). V prípade S—optimality hladáme nielen plán % ale aj optimálny počet meraní AT*. Kritérium Z?—optimality má nasledovnú interpretáciu: Ak Y s ~ Nn(Fs(3, C72AJ1), tak (1 — a)—konfidenčný elipsoid pre vektor /3 G TZk pri A" meraniach je £i-a(P) = {u : (u - ^'^ľi^ľl^ - P) s x|(0; 1-a)} 9 a jeho objem je V(S) ^ [xt(0;l-a)]Í T^ + l)yJdet[^(F'sAsFs)] (pozri [1], kapitola 11.12). Pretože 1 .k N? rVdeí[M-i(5)], D—optimalita návrhu zaručuje minimálny objem konfidenčného elipsoidu. Pri použití tohoto kritéria je niekedy potrebné kontrolovat približnú gulatost konfidenčného elipsoidu. Príliš velké rozdiely medzi velkostami jeho hlavných poloosí môžu niekedy signalizovat nežiadúce vlastnosti návrhu. Na druhej strane Z?—optimalita má tzv. minimaxnú vlastnost (pozri vetu 3.1 v kapitole 3). Táto vlastnost návrhu ô môže byt v niektorých prípadoch velmi dôležitá. Preto sa Z?—optimalita v praxi pomerne často používa. A—optimálny plán minimalizuje súčet disperzií odhadov zložiek vektora (3. Kritérium A (A—optimalita) je špeciálnym prípadom L—optimality, lebo TV(-) je lineárny a pozitívny funkcionál. Pri riešení odhadu lineárnej funkcie h{(3) — h!(3 s minimálnou disperziou odhadu (pozri začiatok tejto kapitoly) ide zase o L—optimálny plán, lebo funkcionál L(-) definovaný vztahom L(A) — h'Ah (h je daný pevný vektor) je opát pozitívny lineárny funkcionál. Špeciálnym prípadom L—optimality je aj reštringovaná A—optimalita, ked minimalizujeme Tr[M1'1(S)] (pozri (1.2)) vhodnou volbou S G Ares. Matica M1'1 (5) patrí parametrom, pre ktoré chceme minimalizovat súčet disperzií ich odhadov. V prípade S—optimality ide o maximálne priblíženie (v danej norme) matice cov(f3) — — M_1(5) k delovej matici S. Okrem uvedených kritérií sa objavujú kritériá motivované špeciálnymi požiadavkami užívatela. Obyčajne majú konvexnú (alebo konkávnu) kriteriálnu funkciu. Niekedy sa použije kritérium, ktoré je konvexnou kombináciou uvedených kritérií. Jedná sa o snahu udržat dobré vlastnosti oboch kritérií, alebo potlačit nežiadúcu vlastnost návrhu optimálneho podlá jedného kritéria priblížením k návrhu optimálneho podlá iného kritéria. Podrobná teória o kritériách optimality je napr. v [7], kde je uvedená aj bohatá literatúra o optimálnom navrhovaní regresného experimenta. 3. Vety o ekvivalencii pre niektoré kritériá optimality Veta 3.1. Nasledujúce tvrdenia sú ekvivalentné. 1. Návrh 5*D G Ares je D—optimálny, teda deí[M_1(5^)] = min^etlMT1 {ô)\ : ô G Areg}. 2. Návrh ô*D G A.reg minimalizuje d(ô) — max{Aifí'M_1(5)fi : i — 1,2,Nq}, teda d(ôp) — min{d(ô) : ô G A.reg}. 3. d(ôjy) — k (dimenzia vektora (3). Pretože cov[(3s] = — M-1^), 10 Dôkaz. Dôkaz vety realizujeme nasledovným spôsobom: 1. =>• 2. a súčasne 2. <ŕ=> 3. a 2. 1. 1. =>• 2. a súčasne 2. •<=> 3. Nech 5*D G Ares je U-optimálny, teda deí [M-1 (#£,)] — 7ran{deí[M_1(5)] : S G Ares}. Vezmime lubovolný návrh ô a a G< 0,1). Návrh 5 = (1 — a)5£, + aô je podlá lemy 8.11 regulárny, pričom M(5)= E [(l-a)^(í) + aá(í)]Aífíf; = (l-a)M(^) + aM(5). íe5P(ä) Podlá lemy 8.12 je pre a G< 0,1) funkcia g (a) — lndet~M.(S) spojitá diferencovatelná, pričom g(0) — max{g(a) : a G< 0,1)}. Teda g(0) ^ g{a) pre a G< 0,1) a musí byt linln l~9Ía) = 0 (ide o deriváciu sprava). Dostávame (pomocou lemy 8.6) lim -^-IndetUí - a)M(5*n) + aM(5)} = q^o da = lim Tr{[(l - a)M(ô*D) + aM(5)]_1[-^-((l - a)M(5í,) + aM(í))]} = a^o da = Tr{M_1 (5jb) [—M(5£,) + M(5)]} = -Trlfcjfc + TVM_1(5£,)M(5) = = Tr[M-1(ô*D) Y, SWXidíl] - k = S^XiíiM-^ô^íi-k^O, teda (3.1) 6(i)^M-\5*D)ti ^ k. Ak vezmeme jednobodový návrh ô so S p (ô) — {io}, tak z (3.1) pre i0 — 1, 2,N0 je (3.2) =max{Aif/M-1(5£j)fi : í = 1, 2,A0} ^ A:. Pravda pre každý regulárny návrh ô G Ares platí (3.3) k = TrM_1(5)M(5) = Tr[M_1(5) A^f.f/] = Ô^X^M.-1 (ô%. i=l i=l Okrem toho pre každý ô G Ares je (3.4) d(ô) =max{\itlM-1(ô)ti: i — 1,2, ...,N0} ^ k. 11 Dôkaz tvrdenia (3.4) vykonáme sporom. Ak by pre nejaký návrh 77 G Ares bolo max{\lí'iMr1{rl)íl : í = 1, 2, iV0} < /s, tak z (3.3) Ä; = ^ 77(2)A,f/M"1 (^f, ^^^maxíA.f/M-1^)^ : i = 1, 2,.., JV0} = i=l i=l ^maxíA.f/M-1^)^ : z = 1, 2,w0} ]T t?(í) = i=l = max{\lí'iMr1{rl)íl : í = 1,2, ...,-/V0} < čo je v spore s (3.3). Z (3.2) a (3.4) pre (pretože 5*D G Ares) dostávame čiže d{ô*D) — k — mín{d(ô) : ô G Ares}. Dokázali sme 1. =^ 2. a tiež 2. •<=> 3. 2. 1. Ak teda máme regulárny návrh ô G Ares, tak = max{Xlí[Mr1{5% : i = 1, 2,iV0} ^ d(<^) = kde je (lubovolný) Z?—optimálny návrh. Nech ô G Ares minimalizuje = max{X1ílM.-1{5% : i = 1, 2,iV0} na množine Areg. Musí byt (3.5) = (lebo podlá (3.4) pre každý S G Ares je d(S) k a. pre (lubovolný) Z?—optimálny návrh 5*D je d{5*D) — k). Platí (pretože je Z?—optimálny) 0 < detM'1^) S detM.-1^), teda (podlá lemy 8.9) k (3.6) 1 ^ defM-{5*D)defMr1{5) = deílM^M"1^)] = J|7í i=l (71,, 7fc sú vlastné hodnoty matice M(5£,)M_1(5), ktoré sú podlá lemy 8.8 reálne a kladné), čiže 1 / k \ k (3.7) 1 ^ í n^*) ■ 12 Na druhej strane podia lemy 8.10, lemy 8.9 a (3.5) je i = £ E ^WmoaľíAif^M-1^)^ : i = 1, 2,i\T0} = (3.8) =- £ =-A X! ^H1. z čoho dostávame k (3.9) n^=i- i=l Zo vztahov (3.6) a (3.9) máme 1 S detM^detM-1^) S 1, teda deíM(^) = deíM(5), čo znamená, že deíM(5) = max{iieíM(/i) : \x G Ares}, alebo ekvivalentne deíM_1(5) = mm{deíM_1(/i) : /x G Ares}. Dokázali sme 2. =>■ 1. celú vetu. □ Veta 3.2. Nasledujúce tvrdenia sú ekvivalentné. 1. Návrh ô*A G A.reg je A—optimálny, teda TV[M_1(5^)] — 7mn{TV[M_1(5)] : 5 G Areg}. 2. Návrh 5A G A.reg minimalizuje A(ô)— max'{Ajf/fM-1 (ô)]2'ti : z = 1, 2,Ao}, íeda = ram{i(á) : 5 G Ares}. 5. A(Ô*A) = TrM"1^). Dôkaz. Dôkaz vety realizujeme nasledovným spôsobom: 1. => 2., 1. => 3., 2. =>• 1., 3. 1. 1. => 2. 13 Nech Ô*A G Areg je A-optimálny, teda TrM^1(S*A) = miniTrM.-1 (ô) : ô G Ares}. Vezmime lubovolný návrh ô a a G< 0,1). Návrh ô — (1 — a)ô*A + aô je podlá lemy 8.11 regulárny, pričom M(5)= [(l-a)^(í) + aá(í)]Aífíf; = (l-a)M(^) + aM(5). i£Sp(Š) Pre a G< 0,1) je funkcia h(a) — TrM.^1(ô) spojitá diferencovatelná, pričom h(0) — mín{h(a) : a G< 0,1)}. Teda h(0) 5= h(a) pre a G< 0,1) a musí byt lim -^-h(a) > 0 (ide o deriváciu sprava). Pomocou dôsledku 8.4 (položíme tam C — I) dostávame lim -^-TrM-^ií - a)5*A + aô) = a^o da = - lim TVM ((1 - a)<% + a5) -^-M((l - a)0 |[(l-a)M(ÍÍ) + aM(í)] aa lVr^l-a^ + aíT) = = —TrM_1(5^)[—M(5^) + M^lVr1^) = (3.10) = TrM_1(5^)[M(^) - M( 3. Teraz 2. 1. Nech ô* G Ares minimalizuje A(ô) na množine Areg.Z predpokladu (3.15) TrM^1(5*) > míniTrMT1 (5) : 5 G Areg} = TrM-1^) vyplynie spor. Potom totiž musí existovat návrh ô, že pre funkciu s(a)=TrM-1((l-a)5* + a5), a G< 0,1) platí (3.16) lim 4-TrM-1((l-a)5*+a5) < 0. 15 Keďže ô* minimalizuje A(ô), je maxiKÍ^M.-1^*)]2^ : i = 1, 2,N0} ^ S max{Xi{i[M-\5*A)?ti ■ i = 1,2, ...,N0} = — TrM^1(5*A) — 7ran{TVM_1(5) : 5 G Areg} a súčasne z platnosti (3.15) vyplýva (analogickou cestou ako odvodzovanie (3.10)), že lim -^-TrM-^tl - a) ô* + a ô) = a^>o cla = TrMT1 (ô*)\M.(ô*) - M{5)]Mr~s-{5*) = n0 = TrM-1(5*)-TrM-1(5*)[^>*5(i)fif!]M-1(5*) ^ i=l ^ TrMT1 ((T) - maxíA.TrM-^^f.f/M-1^*)} = (3.17) = TrM.-1^*) - A(ô*) ^ TrM"1^) - A( TrM"1^), čiže (3.18) TrM_1((5*) ^ mm{TrM_1(í) : 5 G Ares} — TrM.^1 (5'X)■ Samozrejme (3.19) mm{TrM_1(5) : 5 G Ares} ^ TrM^1(5*) a dostávame, že TrM_1(5*) = miniTrM.-1 (5) : 5 G Areg}. Dokázali sme 2. ^> 1. Konečne dokážeme sporom 3. => 1. Nech ô** G Ares je taký návrh, ktorý neminimalizuje TrM_1(5), čiže TrM_1(5**) > TrM_1(5^) = mm{TrM_1(5) : 5 G Ares}. Potom ale musí existovat návrh ô, že ô — (1 — a)5** + má vlastnosti, že (3.20) lim -^-TrM_1(5) < 0. Položme (3.21) lim -^-TrM.'1 (ô) = d < 0. a->o da 16 Podobnou cestou ako pri odvodzovaní (3.17) a s využitím (3.12) a (3.21) dostávame d N° d= lim — TrMT1^) — TVM_1( 0, teda A(5**) = maaľíAif^pVI-1^**)]2^ : i = 1, 2,JV0} > TVM_1(detM{s)j k J \\i*d(if., 5) — 1 pričom i* je také číslo z množiny {1, 2, N0}, že \i*d(i*, ô) — max{\id(í, ô) : i — 1,2,Nq}. Dôkaz. Z lemy 4.1 je vidiet, že det[(l — a)M(5) + aAifjf/] je rastúca funkcia veličiny Xid(i,ô) (táto veličina nezávisí od a). Aby sme (pre daný plán ô G Ares) dosiahli maximum det[{l — a)M(5) + aAjfjf/], musíme použit hodnotu Xi*d{i*,5) a maximalizovat (1 —a)fe < 1 +---Xi*d(í*, S) > det^AÍS) vzhladom na a. Budeme l (1-a) J maximalizovat lndet[(l — a)M(5) + aAj«fj«f/„] vzhladom na a. 4-lndet[(l - a)M(5) + aX^t^tĹ] = = 4- Iklníl -a) + ln\l + -—-—r\i*d(i*,ô)X + lndetM(ô)\ = da { { (1 — aj J J * , 1 \i-d(i*,5) =Q 1 — a l-al-a + aXi* d(í*, ô) „ Xl*d{i*,ô)-k ex — - [Xi.d(i*,S) - l]k 18 Pretože z predpokladu návrh ô nie je Z?—optimálny, musí byt \i*d(i*,ô) — k > 0, teda a* > 0. Ľahko sa presvedčíme, že d2 — lndet[(í - a)M(ô) + aA^f^f/,] daz <0, čiže takto určený extrém je maximum. Teda max{det[(l - a)M(ô) + aX&t-} : a G (0, ľ),i = 1, 2,N0} = - a)fe 11 + Q ,Airi(ž, 5) 1 detMtô) : a G (0,1), í l (1-a) J = l,2,..,iVo} = = (1 - a*)fe (l + r-^--Aj« d(i*, ô) X deťMíô) = l (I-"*) J ^)t(Ä^FT)"tóM(<)>*ÍM<^ D Veta 4.3. Nech pre postupnost plánov Ôq, ô±, ... piati Ss+i = (1 - a>*s+1)ôs + a*+1ô*+1, M(SS+1) = (1 - a;+1)M(5s) + a:+1Aí:+ifí;+if;:+i, (ôs Je "jednobodový" plán so spektrom Sp(ô*) — {i^+i}), pričom je určené z rovnice Aj«+1d(i*+1, ôs) — max{\id(i, ôs) : « = 1,2,iVo} — = moaľíAif^M-^^)^ : i = 1, 2,W0} a as+1 ~~ [Ai*+1cí(i*+1, 5S) - l]/s' Nech ôi ^ ô*D, i — 1,2,potom lim detM(ôs) = detM(ô*D). Dôkaz, je zložitý a potrebuje hlbšie vniknut do teórie, pozri napr. [7],[2]. Preto ho tu vynecháme. V predchádzjúcich tvrdeniach opísaná optimálna volba čísel a*, s — 1,2,je dost zložitá. Jednoduchší postup pre volbu čísel as a tiež iteračný postup, ktorý sa osvedčil v praxi je nasledovný. Nech Ôq je štartovací návrh. Prvé zlepšenie, ktoré vedie k návrhu ôi je konvexná kombinácia plánu Ôq a vhodne zvoleného "jednobodového" návrhu ô{ so spektrom Sp(ô$) = teda ôi — (1 - a0)S0 + a0Sl, a0e(0,1). 19 Návrh Ô2 je opát konvexná kombinácia plánu ôi a vhodne zvoleného "jednobodového" návrhu 5^ so spektrom Spiô^) — {i^i teda S2 — (1 — ai)ôi + «1^2, «i G (0,1). Takto postupujeme, až získame návrh ôopt, ktorý spĺňa zvolené kritérium optimality dostatočne presne. Volba štartovacieho návrhu Ôq, volba čísel ao, ot\,... a volba postupnosti je daná nasledujúcimi pravidlami. Nech Sp(ôo) — i2, ifc} a hodnoty návrhu Ôq v bodoch spektra nech sú $o(i) — Ti i- G Sp(ôo). Je vhodné, aby štartovací plán mal v spektre práve k k indexov, alebo len o málo väčší počet indexov ako k (k je dimenzia vektora parametrov (3). Volba štartovacieho plánu Ôq musí byt taká aby jeho informačná matica M(c>o) bola regulárna. Regularita tejto matice je ekvivalentná nevychýlenej (nestrannej) odhadnutelnosti vektora parametrov (3 (pozri vetu 1.9). V dalšom budeme pokračovat tak, že počet bodov spektra štartovacieho plánu bude rovný k. lahko sa dajú upravit nižšie uvedené vztahy pre prípad inej volby (väčšieho počtu) bodov spektra štartovacieho plánu. Ak i\ G Sp(ôo), potom zrejme Sp(ôi) — Sp(ôo). Hodnoty ôi(j) zvolíme podlá nasledujúceho pravidla o ak j = i\, k+í k+í 0, inak. Ak i\ £ Sp(ô0), potom = Sp(ô0) U {^} a ak j = il, ak j ^ íj a súčasne j e Sp(ôo), k+1 — { _a^ j j. j* a sučasne j Sp(ôo), 0, inak. Úplne analogicky postupujeme v dalších iteráciach. Ak Sp(Sp) = {ii,i2,-,ikp} a G Sp(Sp), potom (k + p)ôp(it+1) + í Sp(sp+i) = Sp(sp), sp+1(ip+1) =-k + p + i- a pre ostatné indexy j G Sp(ôp) je + 1 a pre je ôr+^;+i) = k+p+1- Takto popísaný postup, ktorý určuje ôp+i — (1 — ap)ôp + dáva pre čísla ap vztahy ap —---, p — 0,1, 2,... . V literatúre [7],[2] sú i iné volby čísel k -\- p -\- 1 a0, «i,... . Určenie postupnosti i\,i\,pri jednotlivých kritériách optimality: D—optimalita: Ai:+1fí:+1M-1(5s)^.+i = moxiXfiM-^ôsVj : j = 1,2,JV0}, a = 0,l,2,... . Reštringovaná D—optimalita pre určenie prvých &i súradníc vektora (3: = maxíA^fjM-1^)^" - (ff tyM^^ff >] : j = 1, 2,A0}, a = 0,l,2,... . A—optimalita: Aí:+if/;+i [M-1(5s)]2fi:+i = maxíA.fjlM-1^)]2^- : j = 1, 2,JV0}, a = 0,l,2,... . L—optimalita: = maaríAjLpVI-^J^fjfjM-1^)] : j = 1,2, ...,JV0}, a = 0,l,2,... . Pri uvedenom sekvenčnom vylepšovaní štartovacieho návrhu Ôq je potrebné na každom dalšom kroku znovu určit inverziu príslušnej informačnej matice plánu. Pri väčšom počte parametrov k a väčšom počte iterácií (niekedy rádovo 100 — 1000 iterácií) je iterovanie informačných matíc náročnou numerickou úlohou. Poznámka 4.4. Pri iteratívnom vylepšovaní štartovacieho návrhu Ôq s výhodou používame vztah 21 (pozri Lemu 8.15). V našom prípade (ak v štartovacom návrhu bolo práve k experimentálnych bodov) je M(SS+1) = Y, *MSs+i(i) = ieSp(ss+1) ,k + \ m(ôs) + -—^— Ai- t- f;» . fc + s+1 v; k + s+í Vk Vk Preto A; + s + 1 Aj- M_1(5s)fi- f/, M_1(5S)' M-l/r x--* + l-* + l ' + 1- fc + s + Aí:+if/:+iM-i(5s)fí:+1 5. Pravidlá pre zastavenie iterácií Pravidlá z predchádzjúcej kapitoly zaručujú konvergenciu iteračne vylepšovaných návrhov k návrhu optimálnemu. Konvergencia nemusí vždy postupovat tak rýchle, ako by sme si to priali, ale na druhej strane ani nepotrebujeme, aby proces dokonvergoval. Postačí nám vyhovujúce priblíženie k optimálnemu plánu. Toto priblíženie si stanovíme pravidlom zastavenia pomocou dostatočne malého kladného čísla s > 0. Iterácie zastavíme pri návrhu, ktorý označíme ôposi (posledný). D—optimalita: Posledný návrh ôposi bude ten, pre ktorý platí maxl^Xj^M-^Spo^íj : j = 1,2, ...,N0} ] : j = 1, 2, ...,N0} <í + s. D dokázat, že potom platí _ deíM1'1^) _ maarí^-Aj^M-1^)^ - (í^)'M^2(Sposl)í^} : j = 1,2,a0}. 6. S —optimalita Podlá definície 2.7 návrh 5|, G Are„ je S—optimálny ak 5 G Ares,A= 1,2, kde S je dopredu zadaná cielová kovariančná matica výsledného odhadu vektorového parametra (3. Hladáme a N*. Označme £, í = 1,2,..., N, G' = (í o)- Pri nejakom a a návrhu S^. má NNLO /3 kovariančnú maticu 1(^s), ktorej inverzia je a sMíôt) = G'a a1 / 01,(1) 0 ... 0 0 5^(2) ... 0 V 0 0 ^(a0)/ G. Ak existujú nezáporné čísla 5^(1), 5^(2),Ô^(N0), (pre ktoré ^s(0 — 1) ze platí (6.1) G'a 61,(1) 0 0 5f,(2) Vo o o \ G = £ ^(a0)/ 23 tak sme našli aj N* — N. Podia lemy 8.18 sa dá systém (6.1) prepísat ako (G' <8> G')vec / 01,(1) 0 ... 0 \ ' 0 5f,(2) ... 0 > V 0 0 ô^No)/ ktorý sa dá ešte zjednodušit tým, že sa vynechajú rovnice pre {S-1}^j, pre ktoré k(k — 1) i < j (dostaneme--- rovníc). Ak označíme y taký vektor, ktorý dostaneme ked vo vektore vecS^1 vynecháme súradnice {S-1}^j, pre i < j a A takú maticu, ktorú dostaneme ked v matici G' G' vynecháme práve tie isté riadky, ktoré zodpovedajú súradniciam vynechaným vo vektore fecS-1, tak nájst S—optimálny návrh (pri nejakom N) je ekvivalentné hladaniu vektora x G 7?.^° n M, kde n0 M = {x G KN° : x1^0,x2^ 0, ...,xNo ^ O^Xj = N}, i=i ktorý (vektor) minimalizuje veličinu K (x) = x'A'Ax - 2y'Ax. Problém riešime ako úlohu kvadratického programovania (pozri napr. [3], str. 118). Riešenie xo — N(ô^(l), ô^(2),ô^(Nq)Y nám dáva optimálny návrh pri danom počte meraní N. Uvažujme teraz dva návrhy s rôznym počtom meraní. Pri prvom experimente nech je tento počet Ni, pri druhom N2 ■ V obidvoch experimentoch nech sú matica A a vektor y rovnaké. Nech xi je riešenie našej úlohy pre prvý experiment a tí2 je riešenie úlohy pre druhý experiment. Môže nastat situácia, že Ä"(xi) < K(~x2), teda s menším počtom meraní sa v prvom experimente lepšie priblížime k predpísanej matici S-1. Samozrejme dáme přednost návrhu prvého experimentu. Táto úvaha nás vedie k nasledovnej modifikácii definície S—optimálneho návrhu, s ktorou v praxi vystačíme. Vektor xo — NoptS^ nazveme približne S—optimálnym, ak minimalizuje veličinu -KT(x) — x'A'Ax — 2y'Ax, jeho komponenty aľ01, x02,x0jy0 sú nezáporné a pre komponenty vektora á|- platí J^il°i^s(*) — 1- číslo Nopt je optimálny počet meraní, pričom Nopt 5= Nmax, kde Nmax je maximálny počet meraní, ktorý v danom experimente ešte pripúštame. Zrejme n0 č£00 = —^-, Nopt = ^2x0l. Z^i=l x0i Ak použijeme označenie K (x) = x'A'Ax - 2y'Ax, B i=l -In0,n0 \ u = ( °No U..... 1 ' [Nm, tak xo minimalizuje Ä"(x), pričom spĺňa podmienky Bxo 5= b (toto označenie chápeme tak, že pre zvolený komponent vektora na íavej strane zodpovedajúci komponent vektora na pravej strane nie je menší). Problém riešime opát metódami kvadratického programovania. 24 7. Určenie optimálneho návrhu experimentu v niektorých špeciálnych prípadoch Niekedy máme za úlohu určit optimálny návrh experimentu, ked množina priamo observovatelných parametrov nie je konečná. Predpokladajme, že množina priamo observovatelných parametrov je {/ix — ťx(3 : x e< a, b >}, kde ix — (1, x, x2,aľfe_1)'. Majme tiež dané váhy ako A^ — , pričom <72[X) (72(-) je polynóm, ktorý nemá korene v intervale < a, b > a jeho stupeň je menší alebo sa rovná 2{k — 1). V tomto prípade existuje Z?—optimálny návrh 5*D, že Sp(S*D) = {x^\x^2\ ...,x^}. Pre návrh S*D platí *í>(z(i)) = p 2 = 1,2 , íj, ..., i Dôkaz tvrdenia nájdete v [7]. Ako určit body x^\ x^2\ x^ spektra tohto Z?—optimálneho návrhu ? Dostaneme ich riešením maximalizačnej úlohy fe fe max T\cj-2{x^) TT (x® - x^) a;<1»e,...,a;(fe)e "M; ±J\ za podmienky x^ < x^ < ... < x^k\ Ide o úlohu maximalizácie reálnej funkcie k reálnych premenných. Iný prípad, ked vieme napísat optimálny návrh je ak {/ix — ťx(3 : x e< a, b >}, kde íx — (1, x, x2,xk~1)' a váhy sú konštantné. Nech y e 1Z— < a, b >. Odhadujeme hodnotu fýj3 — J^j=i V31-1 Pj (predikcia, alebo extrapolácia). Optimálny návrh experimentu v tomto prípade je ten, ktorý vedie k minimalizácii disperzie odhadu iý/3, čiže je to L—optimálny návrh, kde lineárny funkcionál L(-) je definovaný ako L (A) — íýAíy. Označme z« = cos , i =1,2 Hladaný L— optimálny návrh pre extrapoláciu 5*L má spektrum pozostávajúce z bodov (í) _ a + &+(&-g)z^ 2 ' i = 1'2 takých, že platí i ■) • • • ■)' Dôkaz pozrite v [7], kde sú dokázané aj iné podobné tvrdenia pre nájdenie optimálnych návrhov v niektorých špeciálnych situáciách. 25 8. Pomocné tvrdenia Nech B je regulárna n x n matica, ktorej prvky sú diferencovatelnými funkciami premennej í, čiže {B}íj — — bij(t), i, j — 1, 2, ...,n, dB ~dt —— je n x n matica, ktorej prvky su dt i, j = 1,2, ...,n ddetB . . dcteíB 1 „ —-- je n x n matica, ktorej prvky su ———, i,j — 1,2,...,n, dB obi i díag~B /{B}i,i 0 ' 0 {B}2j2 Lema 8.1. Piati V 0 dB-1 dt {B}n^n / B l9BB 1 Dôkaz. Prvky matice B označme b- , í,j — 1,2,...,n. Tiež sú diferencovatelnými funkciami premennej t, čiže b. (-1) - !,(-!) &i7- (*), J = 1,2, ...,n. Pre í, j 1,2,..., n je fe=l je tzv. Kroneckerovo delta, čiže ôij — 0 pre i ^ j a 4j = 1 pre z = j.) Preto fe=l = E^&1)(*) + ÉMt) 9í fe=i čo v maticovom zápise je fe=i — B 1 + B 9í i, j = 1,2, ...,n, dB, dB- = 0, ^1 = -B-^B-. □ dt dt Lema 8.2. Nech C je n x n matica konštánt. Piati dTrBC dB dt dt' Dôkaz. dTrBC d dt dt i—l j—l i—l j—l Z predchádzajúcich dvoch liem priamo dostávame dbijít) dB„ „dB 26 Dôsledok 8.3. Platí dTrB _ dB dt ~ T~dt' Dôsledok 8.4. Piati dt dt Lema 8.5. Piati ddetB dB (detB)(B ak je B nesymetrická (detB)(2B-1 — díagB^1), ak je B symetrická. Dôkaz. Determinant regulárnej n x n matice B sa dá písat ako detB = {B^.iSi.i + {B}ij2Bij2 + ... + {B}i>nSijn pre i G {1, 2, ...,n}, pričom Bst je doplnok (n — l)-ho stupňa determinantu detB patriaci k prvku {B}st (pozri napr. [4], str. 270). Preto ddetB d Dostávame ({Bj-^iZ^i + {B}ií2Bi {B}i^nBi^n). ddetB ddetB dB d{B}id í Bi,i Bií2 í B21 B22 ■ ■ = B Bn,i B, n,2 Bl,n B2 B„ ,71 J (detB)(B-1)' lebo ( Bltl B2,i Bn,i detB Bl,2 detB -82,2 detB Bn,2 B 1 — detB detB detB Bl,n B2,n det B det B detB / (pozri napr. [4], str. 320). Toto platí o nesymetrickej matici B. V prípade, že B je symetrická, platí {B}r,s — {B(&n, 612,bin, b22, 623, ■ ■ ■, b2n,..., bn-i „, bnn)}r^s — ak r s, ak r > s. 27 Pre symetrickú maticu teda /{B}i,i {B}i,2 ÍDl ÍDl B {B}2jl {B}2j2 ... {B}2,„ V{B}nji {B}„j2 ... {B}nj„/ {B}l,n\ /&11 6l2 ■■■ hn\ D bi2 b22 ■ ■ ■ b2n V bin b2n bnn / Preto ddetB _ ddetB d{B}Kl _ ddetB d{B}, k,l <9{B}M dbr, d [{BKiSi,! + {B}íj2Bíj2 + ... + {B}ijnSijn] .1 = Bij, í = 1,2,...,n. ddeíB A A 9deíB <9{B}M ddeíB 9{B}4^ ddeíB d{B}jti _ <9{B}M Pre z < j je 2§0{B}fcjí 06ý- d{B} 1,3 ^u*j d{B} d{B} [{Bj^iß^i + {B}ij2£?i, {B}i,nBi,n] -1- 9 [{B}j,l-Bj,l + {B}jt2Bjt2 + ••• + {B} j,n B j,n] .1 Úplne rovnako pre i > j dostaneme ddetB dctetB dB ddetB ddetB ddetB dbu ddetB db12 ddetB dbln ddetB db12 db22 db2n ddetB ddetB ddetB dbln db2n dbnn (detB)(2B^1 - diagB-1). □ Lema 8.6. Pre symetrickú regulárnu n x n maticu B piati dlndetB(t) _T B-i9B(í) dt dt Dôkaz. Ak si uvedomíme, že B aj B 1 sú symetrické matice, teda pre i > j platí C U OjJ J-J OH O V 111C Li I^IYC 111 d L1^, C, ICUCli JJ1C l ^ j J_»J 1 = i —— 1 a tvrdenie predchádzjúcej lemy, ČÍ2 J..., lJ.,.. ddetB f 2{B-1}íJdeíB, ak í < j, {B 1}itidetB, ak i — j dostávame dlndetB(t) _ 1 ddetB 1 9í detB dt detB J2 ddetB dbv =TrB-l9B. □ i=l j=i dba dt dt 28 Lema 8.7. A, B nech sú symetrické m x to matice, A je pozitívne definitná. Potom existuje nesingulárna m x m matica U taká, že platí UAU' = I, UBU' = A, pričom A je diagonálna. Dôkaz. Označme wi,...,wm ortonormálně charakteristické vektory matice A a di,dm jej charakteristické čísla prislúchajúce týmto charakteristickým vektorom. Teda Awj — diVfi, i — 1,2,..., to. Čiže existujú matice W — (wi:w2:... :wm) a D /di 0 ' 0 d2 ° \ 0 dm' alebo Označme Vo o . AW = WD, WW' = W'W = I, W'AW = D, WDW' = A, WD 1 W' = A 1 0 o Vď^ Vo o 0 \ o 0 o -k D 'ž 0 \ 0 V 0 0 ■■■ 7c/ C=WD5W'. Matica C je regulárna, symetrická, pričom C2 — WD^W'WD^W' — WDW' — A, teda WD 5 W' = C"1 a C 2 = A"1. Matica S = C^BC"1 je symetrická. Nech si,sm sú jej ortonormálně charakteristické vektory a Ai,Am charakteristické čísla prislúchajúce týmto vektorom, teda C_1BC_1Sj — AjSj, i —1,2,...,m. Označme Zj = C_1Si, i = 1,2,..., m. Zrejme A^Bz, = A^BC ^ = A^CC^BCrV = A^CAä = C"1 A, s* = AíZí. Preto z,i, i — 1,2, ...,m sú charakteristické vektory matice A *B a \, i — 1, 2,to sú im prislúchajúce charakteristické čísla, čiže A Bzí — XíZí, i —1,2,...,m. 29 Pre maticu U' — (zi:z2:...:zm) platí í5\ U AU' = / z'jAzi z[Az „I A „ „' A „ A(zi:z2:...:zm) Vz'; z2Azi Az2 iAzm \ ' A „ z2Az Vz' AZl ZínAz2 t Azm / lebo z^Azj = z^C'Czj = s^s,- = fc. Ďalej UBU' Vz' / B(zi:z2:...:zm) /Ai 0 ' 0 A2 0 1 = A, lebo z^Bzj = z^AA-^Zj = z^C2A ^Bzj VO 0 ... Am/ □ Lema 8.8. Nech Mi, M2 súmxm symetrické a pozitívne definitné matice, Ai,A„ sm charakteristické čísla matice MjMj1. Potom sú Ai,Am reálne a kladné. Dôkaz. Ai,Am sú riešením rovnice det{M.1M.~21 - AI) = 0, ktorá je ekvivalentná nasledujúcim rovniciam deí[(Mi - AM2)M21] = 0, deí(Mi - AM2) = 0, deí[M|(M^MiM^ - AI)M|] = 0, deí(M2^MiM^ - AI) = 0. _ i _i Pretože M2 2MiM2 2 je pozitívne deŕinitná matica, všetky jej vlastné čísla, teda _i _i riešenia rovnice deí(M2 2M!M2 2 — AI) — 0 sú reálne a kladné. □ Lema 8.9. Majme nxn maticu F a nech 71, ...,7„ sú korene jej charakteristickej rovnice, t.j. rovnice det(F — 7I) — 0. Potom detF — Yľj=i 7j a TrF — X)ľ=i 7i- Dôkaz. Charakteristická rovnica det(F — 7I) — 0 sa dá písat ako (-l)"7n + h^1 + - + &n-l7 + bn = 0, (8.1) (-1)"(7" + «i7"_1 + + a„_i7 + a„) = 0, pričom (priamo z definície determinantu) platí (8.2) bn = (-l)"a„ = deíF, 61 = (-l)nai = (-l)"-1TrF. 30 Rovnicu (8.1) môžeme písat ako (8-3) (-1)"(7 - 7i)(7 - 72).-.(7 - 7«) = 0 a roznásobením (8.3) dostávame vztahy medzi koreňmi a koeŕicientami charakteristickej rovnice, teda -ai =7i + ... + 7„(= TrF) «2 = 7172 + ■■■ +7n-l7n (g 4) -«3 = 717273 + ■■■ + 1n-2ln-l1n (-l)"a„ = 7i72-7n(= K = detF). Z (8.2) a (8.4) dostávame tvrdenie lemy. □ Lema 8.10. Nech Ai,A„ sú nezáporné čísla. Platí /n \i n (8.5) (1[XA S"5>. \i=l / i=l Dôkaz. Ak a ^ 0, 6^0, tak (8.6) ab^^(a2 + b2), lebo (a-b)2 ^0, teda postupne a2 - 2ab + b2 ^ 0 a2 + 62 ^ 2a6 i(a2 + 62) ^ ah. Nech Ai ^ 0, A2 ^ 0, a položme v (8.6) a — y/Xi, b — \/Ä~2. Potom z (8.6) (8.7) ^MM=ab^ i(Ai + A2). Nech ďalej Ai,A2, A3,a4 sú nezáporné. Podlá (8.7) platí \/AiA2 S ^(Ai + A2) a \/Ä7ÄI^ i(A3 + A4), čiže (znovu využijúc (8.7)) ^/AiA2A3A4 = y/y/Xi^y/)*^^ ^(Ai + A2)i(A3 + A4) S 31 < ^(Ai + A2) + i(A3 + A4) Ai + A2 + A3 + A4 Matematickou indukciou dokážeme, že (8.5) platí pre n — 2k (k je prirodzené číslo). Pre k — 2 (8.5) platí. Nech platí (8.5) pre n — 2k, ukážeme, že platí aj pre n — 2k+1. Teda nech platí n H =^5> .i=l j i=l Vezmime Ai, A2,A2fc, A2fc+1,A2fc+i=2 2fc. Naozaj '2k+1 \ 2fe+1 n a, N (2k \ 2k j 2k J_ 2k 2k+j < i=i < / 2 2 \ 2 2 \¥ ^ ai + 9* A2fe+J 1 = ^fe+T Z! A 2fe A2fe+i i=i 2fe+l Teraz ukážeme, že ak (8.5) platí pre nejaké n ^ 2, tak platí aj pre n — 1 (spätná indukcia). Ai + A2 + ... + A„_i —. Všetky A^ su nezáporné. Uvažujme Ai; A2,A„_i, A„ = n — 1 Teda ak nerovnost (8.5) platí pre (nejaké) n ^ 2, má tvar , , , Ai + A2 + ... + A„_i , AiA2...A„_i- ^ A1 + A2 + ... + A„_1 + n — 1 Ai + A2 + ... + A„_i n — 1 Nerovnost (8.8) sa dá písat tiež ako n — 1 (Ai + A2 + ... + A„_i). čiže (ak aspoň jedno A^ > 0) /n — l \ n — l 1 n—l n 1 n — l - 1 ^ 3 - n- 1 ^ 7=1 i=i /n—1 \ n —1 n* < n—1 i=i Umocnením na n — 1 dostávame /n—1 \ n —1 < n —1 Tým sme lemu dokázali pre každé n — 1,2, i=l □ 32 Lema 8.11. Majme dva návrhy 61,62, pričom ôi G Ares. Pre a G< 0,1) patri ô — (í — a)ôi + aÔ2 do A.reg a M(ô) = (1 - a)M(5i) + aM(í2). Dôkaz. Najprv ukážeme, že ô je návrh. Skutočne ô je zobrazenie z {1, 2,Nq} —> < 0,1 >, pre ktoré platí N0 Y~ô^= (l-a)5i(i) + crô2(i) = i=l íe{5p(äi)U5p(ä2)} = (l-a) ôi(i) + a Y $2(1) = (1 ~ a)+a = 1- ieSp(ái) íe5P(ä2) Informačné matice návrhov 5i, 62 sú M(50 = ]T a M(52)= ]T ^A^-fj, iesp(ái) jesP(s2) pričom M(5i) je pozitívne deŕinitná a M(52) je pozitívne semideŕinitná. Informačná matica návrhu ô je M(Š) = ]T [(l-a^ + a^A^f^ íe{5p(äi)U5p(ä2) = (l-a) Z MW^' + a 52(i)Ai^ = (l-a)M(5i)+aM(52) ieSp(ái) íe5P(ä2) a pre a G< 0,1) to je pozitívne deŕinitná matica (vyplýva priamo z definície pozitívnej deŕinitnosti matice). □ Lema 8.12. Majme návrhy ô±, Ô2, pričom ô± G Ares, a G< 0,1), 5=(1 —a)5i + ac>2 (G Ares podlá Lemy 8.11). Reálna funkcia g{a) = ZndeíM(Š) = Zndeí[(l - a)M(5i) + aM(í2)] je spojitá a diferencovatelná na < 0,1). Dôkaz. Z definície determinantu vyplýva, že detM.(ô) — det[(l — a)M(5i)+aM(52)] je polynóm /s—teho stupňa premennej a, teda to je spojitá a diferencovatelná funkcia. Pretože pre a G< 0,1) je det[(í — a)M(5i) + aM(52)] > 0 a In(-) je všade na (0, 00) spojitá a diferencovatelná, je g(-) (ako funkcia a) na < 0,1) spojitá a diferencovatelná. □ Uvedme jednu z charakteristických vlastností funkcie lndetM.(ô) na množine {M(ô) : ô G Areg}. 33 Lema 8.13. Funkcia lndet(.) je na množině {M(5) : ô G Ares} konkávna. Dôkaz. Vezmime lubovomé 61,62 G Ares. Podlá lemy 8.7 existuje regulárna matica U, že UM(5i)U' = I a UM(á2)U' = A (diagonálna). Pretože In(-) je na (0, oo) (rýdzo)konkávna funkcia, dostávame pre každé a G< 0,1 > lndet[{\ - a)M(5i) + aM(52)] = IndeW1^! - á)l + aA]U'_1 = fe = ln{detU~2det[(l - a)I + aA]} = IndetV^2 + In JJ[(1 - a)l + aA4] = i=l k k = lndet\J~2 + ^2 lni(l + aXi] ^ lndet\J~2 + J^K1 ~~ «)^1 + cdnAj] = i=l i=l — lndet\J~2 + alndetA — (1 — a)lndet\J~2 + a{lndet\J~2 + žndeíA] = ^(l-^ZndeíMíáO-l-aZndeíU-^^^^íl-^ZndeíMíáO-l-aZndeíU-^U'"1^ = (1 - a)ZndeíM(5i) + aindeíM(<52). Nerovnost je ostrá, ak a G (0,1) a ak Aj ^ 1 aspoň pre jedno i G {1,2, ...,k}, t.j. ak M(5i) ^ M(52). □ Lema 8.14. JVec/i A, D sm regulárne matice. Potom piati A B C D detAdet(D - CA *B) = detT)det(A - BD^C). Dôkaz. Zrejme A B det C D — det I 0\ f A B\ íl -A*B CA 1 I M C D H 0 I Tiež A B C D A 0 0 D-CA_1B = detAdet(D - CA^B). — det I BD 1 0 I A B C D I 0 -D_1C I det A-BD^C 0 0 D detT>det(A-BG^C). □ Lema 8.15. Nech A je regulárna nxn matica, u, v G lZn. Piati: a-wa-1 (A + uv')"1 = A - 1 +v'A-!u Dôkaz. Lemu lahko dokážeme vynásobením matíc (A + uv')(A + uv') 1. □ 34 Definícia 8.16. Nech / an «21 ain \ «2n \ami ... c Kroneckerov súčin matic A a B je A (8) B / anB ai2B a2iB (Í22B \amiB am2B /&11 621 b2s \bri ... 6rs / ai„B \ «2nB Vlastnosti kroneckerovho súčinu matíc pozri napr. v [9]. Definícia 8.17. Ak napíšeme "pod seba" stĺpce matice K, povieme, že sme vykonali na matici operáciu vec. Teda vecKm,n — uec(ki:k2:...:k„) k2 Vk„/ Lenia 8.18. Pre matice príslušných rozmerov platí vecABC = (C (8> A)vecB, Tr AB = (í;ecB')'^ecA. Dôkaz. Lemu dokážte ako cvičenie. Viac o optimálnom návrhu experimentu nájdete v monografii [7], príklady sú v [8]. V [7] sa nachádza aj obšírny zoznam dalšej literatúry k danej téme. References [1] Cramer, H., Mathematical Methods 0} Statistics, Princeton University Press, Princeton, N.J., 1946. [2] Fedorov, V., V., Theory of Optimal Experiment, Duxbury Advanced Series, Second Edition, Belmont CA, 1990. [3] Hamala, M., Nelineárne programovanie, ALFA, Bratislava, 1972. [4] Ko"rínek, V., Základy algebry, Nakladatelství ČSAV, Praha, 1953. [5] Kubáček, L., Kubáčková, L., Statistika a metrologie, Univerzita Palackého v Olomouci -vydavatelství, 2000. [6] Kubáčková, L., Kubáček, L., Kukuča, J., Pravděpodobnost a štatistika v geodézii a geofyzike, VEDA, Bratislava, 1982. [7] Pázman, A., Základy optimalizácie experimentu, VEDA, Bratislava, 1980. [8] Pázman, A., Mikulecká, J., Raffaj, J., Tokošová, M., Riešené situácie z navrhovania experimentov, ALFA, Bratislava, 1986. [9] Rao, C. R., Lineárni metody statistické indukce a jejich aplikace, Academia, Praha, 1978.