Obr. 1 Strukturální schéma lineárního časově invariantního systému S> l> xm - Kvadratické kritérium optimality, tzv. kvadratický funkcionál+je pak ve tvaru ^-I^-x/Q^-xj+^^-ü/R^-üa 1=1 2 f i=0 [3] kde Q je daná matice typu (n x n), R daná matice typu (r x r). S ohledem na existenci a jednoznačnost řešení je matice Q positivně semidefinitní a matice R je positivně definitnitní. Jak Q a R jsou obvykle diagonální matice. + Důležité je uvědomit si význam kvadratického funkcionálu. Prvky diagonální matice Q udávají váhy čtverců odchylek stavových proměnných od jejich nominálních průběhů. Některé prvky v Q mohou být nulové. Prvky diagonální matice R udávají váhy čtverců odchylek řídících proměnných od jejich nominálních průběhů. Všechny prvky diagonály R musí být nenulové, je to nezbytná podmínka pro matematické řešení. Problém optimálního řízení spočívá v nalezení konečné posloupnosti r - rozměrných vektorů řízení {u i *, i = 0,1,... ,N-1} takové, která minimalizuje kritérium [3] při kauzální relaci [1 ] a počáteční podmínce [2]. 2. Nutné podmínky optimality Vyjádření nutných podmínek vychází z Pontrjaginova principu minima. K řešení problému optimality použijeme nutné podmínky optimality ve formě Hamiltonovych kanonických rovnic. Hamiltonova funkce (Hamiltonián) je pro daný problém ve tvaru H(X,pM,",-) = T(*i - *i)TQ(*ť - *,) + 2 (Mt - ůi)TR(M ~ůí) + PÍi(A*, + Bu, + Czt) [4] kde p i je kovektor stavu (resp. vektor souvisejících stavů, resp. vektor dynamických Langrangeových multiplikátorů). Z nutných podmínek plynou za předpokladu symetrických matic Hamiltonovy kanonické rovnice popisující optimální trajektorie x; *, p j * a u i * Ön| * * „ x,:, -x. =------1, = Ajc. +Bm. +C V!+l ""i dpM [5], ÔH kde Ay I* značí hodnotu derivace podél optimálních trajektorií, * * (yrlj _^, * . .t * jol. pM - Pí = —z— U= -Q(*,- - *,) - A #+, Rovnice jsou podmíněny okrajovými podmínkami Pl =Q(x*n-xn) Nutná podmínka pro relativní minimum Hamiltonovy funkce má tvar dtt [8]. du. L=0 = R(ii;-£i) + BT/£I [9] Z toho plyne rovnice pro optimální řízení [10]. »;=-ribt^1+«í Řešení rovnic [5] a [6] při [10] a při daných okrajových podmínkách na začátku intervalu [7] a na konci intervalu [8] představuje tzv. „klasický lineární dvoubodový okrajový problém", jehož řešení spolu se vztahem [10] určuje hledanou vektorovou posloupnost {us*, i = 0,1».->>N-1}. + 3. Řešení úlohy optimálního řízení Dosazením rovnice [10] do rovnice [5] dostaneme vztah xm - x* = Ax* - BR_1BT/?* + B& + Cr. [11] i = 0,l,...,N-l Předpokládejme, že existuje posloupnost matic K,a posloupnost vektorů gi takové, že pro kovektor stavu [12] Pi =Kixi+gi i = 0,l,...,N-l platí, že posloupnost { W, i = 0,1,...,N-1} je identická s posloupností { Uj* [xj; i = 0,1,...,N-1}. Řízení lze vyjádřit jako funkci stavu systému. Za daného předpokladu můžeme výraz [10] zapsat ve tvaru u* = -R BT (KM4, + gí+1) + ú, [U] + Rovnice [6] a [11] představují dvě části soustavy diferenčních rovnic prvního řádu pro neznámé posloupnosti vektoru uj" a vektoru Xi* . Všech rovnic je 2n s celkem 2n okrajovými podmínkami [7] a [8]. Soustavu lze řešit a výslednou posloupnost kovektoru p;* dosadit zpět do rovnice [10], abychom získali hodnoty posloupnosti vektorů optimálního řízení u; . Postup je relativně složitý, výpočty při větším počtu proměnných jsou značně rozsáhlé. Použili jsme proto jiný způsob řešení optimálního řízení u*, o kterém se zmiňujeme v následující části kapitoly. 4 a výraz [11] ve tvaru x* -x* = Ar, -BR-,BTKI+fx* -BR jBV , +Bw, +Cz, Rovnice [14] může být interpretována jako stavová rovnice optimálně řízeného zpětnovazebního systému a rovnice [13] jako rovnice řídícího systému generujícího optimální řízení uf dané jako funkce stavu v okamžiku (i+1), tj. posunutím jedné periody vzorkování. Pindyck ukázal, že předpokládaná posloupnost matic Ki a posloupnost vektorů gi s požadovanými vlastnostmi existuje a odvodil vztahy, z nichž mohou být stanoveny: K,. =Q + (I + A)T[Kí+1 KI+1B(R + BTKMB) BTK,+1](I + A) g, =-a+A)T[Ki+1-Kí+1B(R+BTKi+1B)-1BTKJ.+1]BR-1BT^+1 + + a + A)Tgi+1 +(I + A)T[K,+1 -KWB(R + BTKMB) 'B^J [15] [16] Ríccatiho rovnice [15] a určující rovnice [16] s okrajovými podmínkami KA,=Q [17], gN = -Q*v [18], řeší náš problém optimálního řízení. Posloupnost vektorů optimálního řízení Ui* vyjádřených pomocí posloupností optimálních vektorů stavu xf a řešení Ríccatiho rovnice [15] a [16] je následující u* = -(R + BTK)+1B) BTKW(I + A)x* + + (R + BTK1+1B)1BIKI1BR,BI&+1-R1BT&1 - - (R + BTK MB)^BTK!+1 (B«ŕ + Czi) + w, [19]" 4. Zpětná vazba Můžeme definovat posloupnost matic Hs. H, = (R + BKi+íB) BK+1(I + A) [20] posloupnost vektorů hj kt = (R + BTK;1B) BTKi+1BR BTg+1 - - (R + BTK1+1B) ' BTK+1 (Bů, + Cz,) + ůr P1] 5 Posloupnost vektorů optimálního řízení Ui je tedy definována následovně: < = -HX+h, [22], kde Hi je posloupnost zpětnovazebních matic typu (n x n), v čase i, hi je posloupnost vektorů přímého řízení rozměru n. v čase i Zpětnovazební složka řízení, definovaná posloupností matic Hi, není závislá na xr, uj az; a představuje optimální řízení systému do počátku ve smyslu kritéria [3] pro xt = 08^ = 0 při nulovém vstupním exogenním vektoru Zi. Strukturální schéma optimálně řízeného zpětnovazebního systému je znázorněno na obr.2. 5. Shrnutí postupu řešení Jestliže jsme znali kvantifikovaný systém (matice parametrů A, B, C), trajektorii exogénni z;, nominální trajektorii řízení ůj, nominální trajektorii stavové x; a funkcionál (matice Q a R) bude postup řešení úlohy optimálního řízení následující: (i) Řešením Riccatiho rovnice [15] s okrajovou podmínkou [17] zpětně v čase, získáme hodnoty posloupnosti matic {Kj; i = 1,.....,N} a N výsledných matic uložíme. (ii) Vypočteme určující rovnici [16] s okrajovou podmínkou [18], tím získáme hodnoty posloupnosti vektorů {gi; i = 1,.....,N} a uložíme N výsledných vektorů. (iii) Vypočteme optimální řízení uo pomocí rovnice [19] s použitím podmínky xq * = ž; . Z rovnice systému [5] vypočteme vektor Xi , který je využit v rovnici [19] k výpočtu vektoru ui *. Vektor ui použijeme pak zase v rovnici [5] k výpočtu vektoru x2 , atd. V postupu pokračujeme tak dlouho, až jsou vypočteny celé posloupnosti vektorů optimálního řízení { Ui * ; i= 0,1,...,N-1} a vektorů stavu {xí* ; i =1,...,N}. (iv) Optimální hodnotu funkcionálu lze vyčíslit pomocí rovnice [3], 6 Obr. 2 Strukturální schéma lineárního časově invariantního optimálně řízeného zpětnovazebního systému Uj X; Zj V V SLOŽKA PŘÍMÉHO ŘÍZENÍ hi U X * Um _____XZ______ ŘÍZENÝ SYSTÉM SLOŽKA ZPĚTNOVAZEBNÍHO ŘÍZENÍ H I když se může zdát uvedený postup řešení složitý, ve skutečnosti tomu tak není. Řešení všech popsaných kroků je rekursivní a kroků je pouze N. Vyžaduje invertování symetrických matic, násobení a sčítání matic. Je nutno pamatovat na to, že největší matice, která by mohla být v průběhu řešení invertována je řádu r. proto by za normálních okolností mělo být r menší než 10. Zpracování všech kroků (i) až (iv) uvedeného řešení vyžaduje minimální množství strojového času. 7