Akademie věd České republiky Základy teorie numerických metod pro řešení diferenciálních rovnic obsah Předmluva............................................................................. 11 Kapitola I. Obyčejné diferenciální rovnice - úlohy s počátečními podmínkami 13 1 Úvod ............................................................................... 13 2 Eulerova metoda....................................................-...........21 3 Obecná jednokroková metoda ....................................................... 33 3.1 Špeciálni prípady .............................................•................. 34 3.2 Konvergence obecné jednokrokové metody ..........................39 3.3 Asymptotický vzorec pro chybu .................................... -............ 45 3.4 Problematika zaokrouhlovacích chyb ............................♦............... 48 ■3 Mnohokrokové metody .............................................................. 4.1 Špeciálni prípady ..............................•................................ ^1 4.1.1 Interpolace při ekvidistantních argumentech............................... 51 4.1.2 Adamsova-Bashforthova metoda ........................................... ^3 4.1.3 Adamsova-Moultonova metoda............................................ 56 4.1.4 Nystromova metoda....................................................- ■ ■ 58 4.1.5 Zobecněná Mílnova-Símpsonova metoda ................................• • • 58 4.1.6 Metody založené na numerickém derivování................................ 59 4.2 Obecná lineární mnohokroková metoda......................................... 61 4.2.1 Nutné podmínky konvergence.........................................---- 63 4.2.2 Postačující podmínky konvergence . *....................................... 67 4.2.3 Asymptotický odhad chyby.............................----............... 76 4.2.4 Problematika aaokrouhlovacích chyb....................................... 86 4.2.5 Stabilita při pevném mtegrachím kroku .................................... 87 4.2.6 Optimální metody........................................................ 88 4.3 Užití lineárních mnohokrokových metod........................................ 96 4.3.1 Metody prediktor-korektor ................................................ 97 4.3.2 Volba integračního kroku...................-............................. 102 4.3.3 Změna integračního kroku................................................ 104 5 Porovnání mnohokrokových metod a Rungových-Kuttových metod .................. 105 6 Soustavy diferenciálních rovnic a problematika silného tlumení ...................... 108 6.1 Lineární mnohokrokové metody................................................ 108 6.2 Rungovy-Kuttovy metody..................................................... 109 6.3 Problematika řešení diferenciálních rovnic se silným tlumením .................. 109 Cvičení............................................................................... 117 Poznámky k literatuře................................................................ 118 Literatura............................................................................ 119 Kapitola II. Obyčejné diferenciální rovnice — okrajové úlohy .,............. 122 1 Úvod .............................................................................. 122 2 Metody založené na převodu na úlohy s počátečními podmínkami................... 125 2.1 Metoda střelby ................................................................ 125 2.1.1 Okrajová úloha pro lineární rovnici druhého řádu ......................... 125 7 OBSAH OBSAH 2.1.2 Obecná okrajová úloha............................................ 127 2.1.3 Obtíže spojené s metodou střelby ....................-................... 128 2.1.4 Střelba na více cílů............................•.....-...................* 130 2.2 Metoda přesunu okrajové podmínky ........................................... 131 2.2.1 Diferenciální rovnice druhého řádu .................*..................... 131 2.2.2 Obecná soustava lineárních diferenciálních rovnic ...................... .. . 138 2.2.3 Svázané a integrální okrajové podmínky .................................. 140 2.2.4 Obtíže spojené s metodou přesunu okrajové podmínky ..................... 141 2.3 Metoda normalizovaného přesunu.............................................. 142 2.3.1 Diferenciální rovnice druhého řádu ....................................... 142 2.3.2 Obecná soustava lineárních diferenciálních rovnic ......................... 156 3 Metoda sítí ........................................................................ 162 3.1 Monotónní matice ....................*........................................ I63 3.2 Lineární diferenciální rovnice druhého řádu.................................... 167 3.2.1 Sestavení diferenčních rovnic............................................- 167 3.2.2 Konvergence ............................................................. I78 3.2.3 Řešení vzniklých soustav lineárních rovnic................................ 190 3.3 Lineární diferenciální rovnice čtvrtého řádu........................•........... 195 3.3.1 Sestavení diferenčních rovnic............................................. 197 3.3.2 Konvergence............................................................. 200 3.3.3 Řešení vzniklých soustav................................................. 203 3.4 Nelineární diferenciální rovnice................................................ 204 3.4.1 Sestavení diferenčních rovnic a jejich řešitelnost........................... 207 3.4.2 Konvergence............................................................. 211 4 Variační metody................................................................... 213 4.1 Variační formulace okrajových úloh............................................ 214 4.1.1 Lineární diferenciální rovnice druhého řádu ............................... 214 4.1.2 Lineární diferenciální rovnice vyšších řádů .......................-........ 220 4-1-3 Jiné typy okrajových podmínek.......................................... 221 4.2 Základní přibližné metody.........................................• •.......... 222 4.2.1 Ritzova metoda ...............................................-......• - ■ ■ 222 4.2-2 Galerkinova metoda .............................................-........ 224 4.3 Metoda konečných prvků.................................................... 225 4-3.1 Aproximace po částech lineárními funkcemi............................... 226 4.3.2 Aproximace Hermitova typu.............................................. 230 4.3.3 Některé praktické otázky spojené s metodou končených prvků ............ 235 Cvičení..............----................................-.....•...................** ■ 237 Poznámky k literatuře.......................................................•........ 239 Literatura............................................................................ 240 Kapitola III. Parciální diferenciální rovnice eliptického typu ................ 242 1 Úvod .............................................................................. 242 2 Metoda sítí ........................................................................ 245 2.1 Lineární rovnice druhého řádu........................................<........ 245 2.1.1 Sestavení diferenčních rovnic............................................. 245 2.1.2 Přepis okrajových podmínek a konvergence vzniklých metod.............. 253 2.1.3 Metody zvýšené přesnosti, jiné tvary sítí................................. 265 2.2 Lineární rovnice čtvrtého řádu ..............................-.................. 266 2.3 Řešení vzniklých soustav lineárních rovnic..................................... 272 2.3.1 Přímé metody ........................................................... 274 2.3.2 Iterační metody........................................................ 377 2.4 Obecné otázky konvergence a odhadů chyb při metodě sítí ................... 286 2,4-1 Základní pojmy teorie diferenčních schémat.............................. 286 2.4.2 Obecné věty o konvergenci metody sítí................................... 288 3 Variační metody.........................................-......................... 292 3-1 Variační formulace okrajových úloh...........................................* 293 3.1.1 Diferenciální rovnice druhého řádu.....................................*• 293 3.1.2 Diferenciální rovnice čtvrtého řádu..............................-.......• * 297 3.1.3 Jiné typy okrajových podmínek, nehomogenní okrajové podrnmky ........ 298 3.2 Základní přibližné metody..................................................... 299 3-2.1 Ritzova metoda........................................................ 299 3.2.2 Galerkinova metoda...................................................... 300 4 Metoda konečných prvků........................................................... 301 4.1 Troj úhelníkové prvky.......................................................... 304 4,1.1 Lineární Lagrangeův prvek ............................................... 304 4.1-2 Kvadraticky Lagrangeův prvek........................................... 312 4.1.3 Kubický Lagrangeův prvek..................................... 315 4.1.4 Obecný Lagrangeův prvek................................................ 317 4.1.5 Hermitův prvek...............................................-.....----- 318 4.1.6 Prostory konečných prvků pro řešení diferenciálních rovnic čtvrtého řádu ... 319 4.2 Čtyř^elníkové prvky ----..................................................... 321 4.2.1 Obdélníkové Lagrangeovy prvky .................................-........ 321 4.2.2 Obdélníkové Hermitovy prvky .......................-......"............ 323 4.3 Algoritmické otázky spojené s metodou končených prvků....................... 323 Cvičení............................................................................... 324 Poznámky k literatuře...................................................*.......... 325 Literatura..................................................-----*................... 326 Kapitola FV. Parciální diferenciální rovnice parabolického typu ............. 330 1 Úvod .............................................................................. 330 2 Metoda sítí........................................................................ 331 2.1 Rovnice pro vedení tepla v jedné prostorové proměnné ........................- 332 2.1.1 Explicitní a implicitní metoda............................................ 332 2.1.2 Crankovo-Nicolsonovo schéma............................................ 341 2.2 Obecná parabolická rovnice v jedné prostorové proměnné ...................... 350 2.2.1 Odvození metody....................................................• • • • 351 2.2.2 Konvergence, speciální případy.....................................•..... 356 2.2.3 Konvergence, obecný případ..................................--.......... 359 2.3 Dvou- a vícedimenzionální parabolické rovnice.........................-....... 376 2.3.1 Základní metody ......................................................... 376 2.3.2 Metody střídavých směrů ................................-.......*....... 382 2.3.3 Lokálně jednorozměrné metody.........................................* ■ 386 3 Seinidiskrétní metody................................................-.....*....... 387 3.1 Metoda přímek........................................................ 38S 3.1.1 Klasická metoda přímek.................................................. 388 3.1.2 Numerovovametoda............................----................... 391 3.2 Semidiskrétní metody Galerkinova typu...................----................. 392 3.3 Metody Rotheova typu ........................................................ 400 Cvičení ............................................................................... 403 Poznámky k literatuře......................................................♦......... 404 Literatura ............................................................................ 404 Rejstřík .............................................................................. 407 8 9 předmluva Kniha, kterou dostává čtenář do rukou, si klade za cíl podat elementární a ne příliš rozsáhlý úvod do problematiky numerického řešení diferenciálních rovnic- Vznikla na základě mého dlouholetého působení jako učitele na matematicko-fyzikální fakultě Karlovy University, kdy moje přednáška tvořila (a dosud tvoří) tu část základního čtyřsemestrového kursu numerických metod pro posluchače specializace numerická matematika, která se týká diferenciálních rovnic. Obsah knihy je tedy v podstatě dán studijním plánem zmíněné specializace a zahrnuje základní metody pro řešení obyčejných diferenciálních rovnic (úloh s počátečními podmínkami i okrajových úloh) a parciálních diferenciálních rovnic eliptického a parabolického typu. Historicky vzniklo, že diferenciální rovnice hyperbolického typu nejsou zatím pojaty do základního kursu numerické matematiky, což tvoří jeden z důvodů, proč je čtenář nenalezne ani v této knize. Druhý důvod je ten, že chovám rovnic hyperbolického typu je natolik odlišné od chovaní eliptických a parabolických rovnic, že by se při jejich vyšetřování dalo užít jen velmi málo z ostatního obsahu knihy. Její rozsah by tedy vzrostl neúnosně. Určitou mezeru, která tak vznikne, bude třeba zaplnit teprve v budoucnosti. Kniha je rozdělena do čtyř kapitol. V první kapitole věnované problematice numerického řešení úloh s počátečními podmínkami pro obyčejné diferenciální rovnice se studují běžné lineární fc-krokové metody a obecné jednokrokové metody čítaje v to důležitý speciální případ metod Runga a Kutty. Kromě toho jsou zde pojednány také problémy spojené s řešením diferenciálních rovnic se silným tlumením. Obsah druhé kapitoly je tvořen základními metodami pro řešení okrajových úloh pro obyčejné diferenciální rovnice. Omezujeme se zde převážně na lineární problémy a jmenovitě jde o metody převodu na úlohy s počátečními podmínkami (metoda střelby, metoda přesunu okrajové podmínky), o metodu sítí a o základy variačních metod zejména pak o metodu konečných prvků. Kapitola třetí pojednává o metodě sítí a o základech metody konečných prvků pro řešení parciálních diferenciálních rovnic eliptického typu. Konečně v kapitole čtvrté si všímáme problematiky přibližného řešení parciálních diferenciálních rovnic parabolického typu. Zabýváme se zde metodou sítí a klasickými i variačními semidiskrétnímí metodami. Kromě toho je 11 PŘEDMLUVA ke každé kapitole připojen komentovaný seznam doporučené literatury čítaje v to samozřejmě ty publikace, které jsou v textu bezprostředně použity. Nesnažil jsem se přitom podat vyčerpávající výčet literatury, ale spíše ukázat studentu základní prameny, z nichž může rozšířit své znalosti. Už na začátku jsem uvedl, že kniha představuje elementární úvod do výše popsané problematiky. Rád bych k tomu dodal, že mně při jejím psaní šlo o to dát čtenáři základní orientaci zejména v teoretických otázkách spjatých se studovanými metodami. Měl jsem přitom na mysli ani ne tak podat co nejobecnější výsledky a co nejúplnější seznam stávajících metod, jako zdůraznit základní myšlenku příslušného postupu a užívat přitom co nejméně předběžných matematických znalostí. Skutečně k tomu, aby čtenář plně porozuměl celé knize, vystačí pouze s těmi nej-elementárnějšími pojmy a poznatky z lineární algebry a reálné analýzy (pojem vektoru, matice a lineárního prostoru, základní vlastnosti derivace a integrálu). Jen na několika málo místech se užívají některá speciálnější tvrzení z teorie funkcí komplexní proměnné. Kníhaje zaměřena tedy spíše teoreticky, proto i cvičení připojená k jednotlivým kapitolám jsou teoretická a slouží k hlubšímu porozumění vykládané látky. S tím souvisí i charakter konkrétních numerických příkladů, které v ní čtenář nalezne. Tyto příklady nejsou myšleny jako přímé vzory k řešení konkrétních praktických problémů — k tomu slouží, nebo by měla sloužit praktická cvičení přímo na počítači — ale jako ilustrace někdy i nečekaných jevů, s nimiž se lze v praxi za většinou podstatně složitějších okolností setkat. Mimoto slouží některé z těchto příkladů jako motivace k prováděným teoretickým úvahám. Závěrem je mou milou povinností poděkovat všem, kteří v té či oné míře přispěli k vytvoření této knížky. Jsou to zejména všichni moji kolegové z oddělení konstruktivních metod matematické analýzy Matematického ústavu AV CR a řada kolegů z katedry numerické matematiky matematicko-fyzikální fakulty Karlovy univerzity, kteří byli kdykoliv ochotni vést se mnou dlouhé diskuse o obsahu a zaměření knihy Jmenovitě bych rád uvedl prof. dr. Ivo Marka, člena korespondenta AV CR, který jako vědecký redaktor věnoval publikaci péči a pozornost daleko přesahující běžné zvyklosti. Dále pak vděčím svým přátelům RNDr. Petru Přikrylovi, CSc, a RNDr. Michalu Křížkovi, DrSc, kteří pečlivě přečetli celý rukopis a řadou připomínek přispěli ke zkvalitnění textu. Co nejvřeleji také děkuji Radě Fondu pro vydávání vědecké literatury AV ČR, jejíž subvence byla pro vydání knihy rozhodující. Manželům Šidákovým pak patří můj dík za nesmírně pečlivou přípravu matrice pro tisk, Konečně co nejupřímněji děkuji své ženě za oporu, kterou mně byla při psaní této knihy, a za trpělivost, se kterou znovu a znovu přepisovala náročný rukopis. Praha, leden 1989 Autor Kapitola I. Obyčejné diferenciální rovnice -úlohy s počátečními podmínkami 1 Úvod V této kapitole se budeme zabývat problematikou numerického řešení úloh s počátečními podmínkami pro obyčejné diferenciální rovnice. Úlohou s počátečními podmínkami pro soustavu m diferenciálních rovnic prvního řádu (í.i) V = 1/(*,'1».. ■■,"»), yV •-,"»). "V -"70*,ly,...,my) rozumíme úlohu nalézt m funkcí 1y,-.-,my proměnné x definovaných, spojitých a spojitě diferencovatelných v intervalu (a, b), které vyhovují rovnicím (1.1) a pro něž platí (1.2) 1y(í) = viM() = V2,---,my(í)^vm, kde tj = (iji,... ,Jjm)T je daný m-dirnenzionální vektor a £ pevně zvolený bod v intervalu {a,b). Často to bývá levý krajní bod daného intervalu, což také v dalším výkladu budeme předpokládat. Doplňující podmínky (1.2) kladené na řešení soustavy (1.1) se nazývají počáteční podmínky. Protože každou diferenciální rovnici m-tého řádu (1.3) ir-m) = f{x,y,y',...Jm-x)) lze psát po zavedení nových neznámých funkcí (1.4) 1y = y, 2y = W(= y1), S»«-V (=v"l 12 tm_1V (= s/m_1'), 13 i. obyčejné diferenciální rovnice - úlohy s počátečními podmínkami jako soustavu diferenciálních rovnic prvního řádu (i.5) V = 2v, je i tento typ rovnic zahrnut v případě (1.1). Při vyšetřování konkrétních metod se skoro všude omezíme na jednu diferenciální rovnici (16) !/-/(*,!/), x€{a,b) s počáteční podmínkou (1-7) V(a) = ■?■ Toto omezení není většinou nikterak podstatné. Přejdeme-li totiž k vektorovému zápisu a položíme-li (1.8) y = Cy,---,my)T, f = (1/,--,m/)T, můžeme soustavu (1.1) s počátečními podmínkami (1.2) psát ve tvaru (1.9) y' = f(*,y), y(0 = v- K přenesení výsledků, které zformulujeme pro případ rovnice (1.6) s počáteční podmínkou (1.7) na případ soustavy (1.1) s počátečními podmínkami (1.2) tedy stačí obvykle pouze předpokládat, že y v rovnici (1.6) je vektor a / vektorová funkce. Dále se omezíme na metody diskrétni, které spočívají v tom, že přibližné hodnoty hledané funkce hledáme pouze v nějaké diskrétní množině bodů x„ G (a, b), n = = 0, 1,...,N. Tyto body budeme volit pro jednoduchost převážně ekvidistantní, tj. položíme (1.10) xn=a + nh, n = 0,l, kde h je konstanta, kterou nazveme integračním krokem. Rovněž toto omezení se většinou snadno odstraní. Naproti tomu metody typu postupných (nebo Picardových) aproximací, které spočívají v tom, že se diferenciální rovnice (1.6) s počáteční podmínkou (1.7) nahradí ekvivalentní integrální rovnicí (1.11) y(x) = r)+ í f(t,y(t))át Ja 1 úvod a pro tuto rovnici se konstruují postupné aproximace předpisem (1.12) y„+i(x) = íj+ / f(t,yn(t))át, n = l,2,..., J a a které hrají významnou roli v teorii diferenciálních rovnic, ponecháváme stranou našeho zájmu. Důvod je ten, v že efektivitě nemohou konkurovat výše zmíněným diskrétním metodám. O pravé straně / diferenciální rovnice (1.6) budeme předpokládat všude v této kapitole, i když to nebudeme vždy znovu opakovat, že r(i) je definovaná a spojitá jako funkce dvou proměnných v pásu a £ x £ b, oo < y < oo (a, b jsou konečná čísla) a že | (ii) splňuje v tomto pásu Lipschitzovu podmínku vzhledem k y s konstantou nezávislou na x, tj. že existuje konstanta L taková, že platí (1.13) pro každé x £ (o, 6) a pro libovolná y a z. K splnění této podmínky stačí např., aby ve zmíněném pásu měla pravá strana dané diferenciální rovnice omezenou první parciální derivaci podle y, jak plyne ihned z věty o střední hodnotě. To je splněno zejména v případě lineární diferenciální rovnice. Globální předpoklady o pravé straně dané diferenciální rovnice, které jsme zformulovali, zaručují, jak hned ukážeme, existenci a jednoznačnost řešení úlohy (1.6), (1.7) v celém intervalu (a, b), zatímco obvyklé lokální předpoklady, které se uvádějí ve většině příruček o teorii obyčejných diferenciálních rovnic, zaručují existenci řešení pouze lokálně. Uvedené předpoklady nás tedy ušetří úvah, zda v té části intervalu, do níž jsme dospěli s přibližným řešením, ještě řešení existuje apod. Na druhé straně je však předpoklad (1.13) značně silný a často se tedy v praktické situaci stane, že není splněn. To však není tak tragické, jak se může na první pohled zdát, neboť numericky většinou řešíme takové diferenciální rovnice, o nichž už předem máme k dispozici nějakou informaci umožňující odhadnout polohu hledaného řešení. Pak už obvykle snadno změnou definice dané pravé strany v těch částech pásu o ž x £ 6, —oo < y < oo, kde řešení zaručeně neleží, dosáhneme splnění předpokladu (ii). Další důležitá přednost předpokladů (i), (ii) souvisí s tím, že u všech metod, které uvedeme, bude v příslušném algoritmu nutno vypočítávat hodnoty f(x,y), kde x bude ležet v intervalu (a, b), avšak hodnotu y nebudeme mít možnost předem odhadnout. Předpoklad, že funkce / je definována pro libovolné y, teoretické zkoumání takové metody značně zjednoduší. Jako nejjednodušší příklad metody, kterou máme na mysli, uveďme tzv. Eule-rovu metodu, ve které přibližné hodnoty yn řešení y{x) diferenciální rovnice (1.6) 14 15 i. obyčejné diferenciální rovnice úlohy s počátečními podmínkami v bodech x — xn daných rovnicí (1.10) počítáme z rekurence (114) S/o = ij, Vn+l = yn +hf(xn,yn), n = 0,l,...,xne {a,b}. Zavedení této metody je motivováno geometricky. Geometricky řečeno udává totiž diferenciální rovnice (1.6) v pásu a í x ^ b, —oo < y < oo směrové pole. Nalézt její řešení splňující danou počáteční podmínku (1.7) značí tedy nalézt křivku, jejíž graf prochází bodem (0,57) a má v každém svém bodě směrnici určenou tímto směrovým polem. Eulerova metoda v této interpretaci tedy značí aproximaci hledané křivky lomenou čarou procházející body (ar,-, j/,), i = 0,1,..., přičemž směrnice úseček, které ji vytvářejí, souhlasí se směrovým polem vždy v levém krajním bodě. Z praktického hlediska je jistě rozumné žádat, aby přibližné řešení y„ získané danou metodou konvergovalo v nějaké vhodném smyslu při zmenšování integračního kroku k přesnému řešení y dané úlohy. Tento požadavek totiž aspoň teoreticky zaručí, že řešení úlohy (1.6), (1.7) lze získat s libovolnou přesností volbou dostatečně malého h. Zavedeme-li tedy tzv. celkovou diskretizační chybu e„ rovnicí en = yn — — y{xn), bude její chování jako funkce integračního kroku h důležitou charakteristikou dané metody. Zdůrazněme, že chování celkové diskretizační chyby při h —> 0 je třeba vyšetřovat při pevném xn = x E {a, b), neboť jen tak udává tato veličina velikost chyby, které se dopouštíme při aproximaci hodnoty přesného řešení v bodě x. Vzhledem k rovnici x„ = a + nh to má ovšem za následek, že při zvoleném x probíhá integrační krok nikoliv spojitou, ale diskrétní množinu, a to těch hodnot h, pro něž je (x — a)/h celé číslo; při /i->0 musí tedy platit n —► 00, Konvergenční vlastnosti celkové diskretizační chyby budeme vyšetřovat na různé úrovni. Podaří-li se dokázat, že pro h —* 0 a xn = x platí e„ —> 0, mluvíme o prosté konvergenci. Nalezneme-li funkci <p(h), pro niž je \im<p(h) = 0 pro h —► 0 a platí-li en = 0(tp(h)) pro h —> 0 a x„ = x, řekneme, že jsme zjistili rychlost konvergence. Zápis e„ = 0(ip(h)) totiž znamená, že existuje konstanta M taková, že pro malá h a pro n definovaná rovnicí xn — x platí |e„| í Mtp{h). Chyba tedy konverguje k nule nejméně tak rychle jako známá funkce <p(h) (v praxi je funkce ip nejčastěji tvaru hP). Ještě silnější informací je odhad chyby |e„| ^ ý(h), kde ^ je známá funkce, pro niž platí ý(h) —> 0 pro h —> 0. Konečně, podaři-li se nalézt funkci T? takovou, že platí e„/rj(h) -» 0 pro h —► 0 a xn = x, mluvíme o funkci rj jako o asymptotickém odhadu chyby. Ze všech právě uvedených informací o chovám chyby se zdá být na první pohled nejužitečnější odhad chyby, neboť jen on umožňuje volit předem velikost integračního kroku tak, aby chyba, které se dopustíme, nepřesáhla předepsanou hodnotu. V dalším však uvidíme, že tato úvaha vede skoro vždy k zbytečně malým integračním krokům, takže ji z praktických důvodů nelze většinou použít. Proto znalost rychlosti konvergence nebo asymptotického chování chyby poskytuje často podstatně více prakticky použitelné informace o dané metodě než odhad chyby. Pro získání představy o celkové diskretizační chybě bývá mnohdy užitečné znát 16 I ÚVOD tzv, lokální diskretizační chybu dané metody. Rozumíme jí chybu, které se dopustíme tím, že provedeme jeden krok dané metody a předpokládáme, že všechny hodnoty, které k jeho realizaci potřebujeme, jsou přesné. V konkrétním případě Eulerovy metody je tedy lokální diskretizační chyba dána výrazem (1.15) L(y(x);h) = y(x + h)-y(x)-hf(x,y(x)), kde y je přesné řešení dané diferenciální rovnice. I lokální diskretizační chyba se většinou vyjadřuje jako funkce integračního kroku. Při numerickém řešení diferenciální rovnice se dopouštíme lokální diskretizační chyby v každém kroku, a celková diskretizační chyba je tedy výsledkem nakupení lokálních diskretizačních chyb. Přitom je třeba brát navíc v úvahu, že každý krok vychází z hodnot, které už jsou zatíženy chybou z předešlého výpočtu. Je tedy žádoucí, aby daná metoda měla tu vlastnost, že při jejím užití nedochází ke katastrofální akumulaci lokálních diskretizačních chyb. O metodách, u nichž tomu tak je, se obvykle mluví jako o stabilních metodách. Pojmů stability je přitom řada; některé z nich v dalším rovněž vyšetříme. Při všech předchozích úvahách jsme mlčky předpokládali, že přibližné řešení splňuje rovnici Eulerovy metody (nebo rovnice složitější metody) přesně. Tak tomu v důsledku toho, že aritmetické operace jsme schopni provádět pouze s konečným počtem čísel o konečném počtu cifer, samozřejmě není a místo veličiny yn vypočteme veličinu y„, která splňuje rovnici (1.14) pouze přibližně. Celková chyba přibližného řešení, které dostaneme jako výsledek konkrétního výpočtu, se tedy skládá ze dvou částí: celkové diskretizační chyby e„ a z veličiny rn = j/„ — y„, kterou nazveme celkovou zaokrouhlovací chybou. Mají-li být naše znalosti o dané metodě uspokojivé, musíme mít představu i o chování této zaokrouhlovací chyby. Všechny právě zmíněné aspekty budeme mít na mysli při vyšetřování konkrétních metod v dalších článcích této kapitoly. Začneme přitom podrobným vyšetřením Eulerovy metody, ne ani proto, že bychom ji nějak zvlášť doporučovali pro praktické počítání — v efektivitě nemůže většinou soutěžit s důmyslnějšími metodami, jak uvidíme — ale hlavně proto, že mnohé charakteristické postupy použitelné i u složitějších metod, jsou u ní snadněji patrné, protože nejsou tolik zastřeny komplikovaným zápisem. Protože však Eulerovu metodu použijeme v důkazu slíbené existenční věty, zformulujeme jednu její jednoduchou vlastnost už zde. Začneme pomocným tvrzením, které bude užitečné i v dalších článcích. Lemma 1.1. Buďte A a B nezáporné konstanty a nechť pio posloupnost čísel <Po,...,<Pn P-íat-í (1.16) \v„+1\ŠA\Vn\ + Bl n -- 0,1,..., JV- 1. Pak pJati l nB, A-l pro n^0,...,N. 17 i. obyčejné diferenciální rovnice - úlohy s počátečními podmínkami Důkaz se provede velice snadno např. úplnou indukcí, a proto jej přenecháme čtenáři. Obsahem následujícího lemmatu je apriorní odhad přibližného řešení získaného Eulerovou metodou. Lemma 1.2. Nechť / splňuje předpoklady (i) a (ii) a nechť h je libovolné kladné číslo. Nechť N je největší takové číslo, že je x^ e (a, b) a nechť ya, ■ ■ ■ ,VN je posloupnost získaná Eulerovou metodou (1.14). PaJc platí (1.18) \yn\$Y, 71 = 0,..., N, kde (1.19) (1.20) a (1.21) Y^\n\eL^ + cEL{b-a), pro L > 0, pro L 0 c= max |/(z,0)|. TE{a,h) Důkaz Předně si všimněme, že číslo c definované rovnicí (1.21) je konečné, neboť z předpokladu (i) plyne, že funkce |/(-, 0)| je spojitá na kompaktní množině. Z (1.14) plyne ihned, že platí (1-22) \yn+i\é Ifcl+ *[/(*«. Z předpokladu (ii) a trojúhelníkové nerovnosti dostáváme (1.23) \f{xn,yn)\ \f(xn,0)\á\f(*n,yn)-f(XnMáL\Vn\, neboli (1.24) l/(a»,!fe)ái|tt.! + l/(*».0)|á£|ftl| + c, n = 0, ..,N, neboť je xn 6 (a,b). Dosadíme-li tento výsledek do nerovnosti (1.22), máme (1-25) \yn+1\í(l + hL)\yn\ + ch a z lemmatu 1.1 plyne, že platí (1.26) pro L > 0 a (1.27) \yn\š\r,\ + nhc pro L — Q. Použijeme-li nyní zřejmé nerovnosti l+/i£ S ehL a faktu, že nh - xn -— a ž b - a, dostáváme požadovaný výsledek ihned z nerovností (1.26) a (127). 18 |ft.| á (1 + hL)"\V\ + {1 + h^" 1ke 1 úvod Nyní už se dostáváme k formulaci slíbené globální existenční věty. Věta 1.1. Nechť pravá strana f diferenciální rovnice (1.6) splňuje předpoklady (i) a (ii) a nechť rj je libovolné reálné číslo. Pak existuje jediná funkce y, pro niž platí (i) y je definována a spojitá v intervalu (o, b), (ii) y je spojitě diferencovatelná v {a,b) a platí {/(x) = f(x,y(x)) pro každé x e (a,b), (iii) j/(o) = f). Důkaz. K důkazu existence řešení použijeme, jak už jsme se zmínili v předchozím textu, Eulerovu metodu. Označme k tomu cíli symbolem H libovolnou posloupnost kladných čísel h takových, že h ~► 0 a že (& — a)/h je celé číslo a uvažujme posloupnost ya,.. ■, yN {N — (b — a)/ft) získanou Eulerovou metodou (1-14) s integračním krokem h £ //. Přiřaďme dále této posloupnosti (a tedy vlastně integračnímu kroku h £ H) spojitou funkci tak, že její graf je lomená čára složená z úseček spojujících body (x„, yn), n = 0,..., N- Je tedy (1.28) Vh(x) = yn + f(xn,yn)(x - xn) pro n =: 0,... ,N — 1 a pro x„ ^ x í 3ľ„+i. Protože podle lemmatu 1.2 platí, že je \Vn\ = Y pr0 n — 0, - . iV a číslo Y nezávisí na h, je právě zavedená posloupnost funkcí {i//,; h £ H} stejnoměrně ohraničená. Dále, každá funkce jft je po částech diferencovatelná a platí < x < xn+1. 0, ,N-l. (1.29) y'h(x) = f(xn,yn), Položíme-li nyní (1.30) R={(*,y);ašxZb,\y\ŠY}, je R kompaktní a funkce / je na ní vzhledem k předpokladu (i) ohraničená. Pro každé h & H a. pro každé x e x„, n — 0,..., N tedy platí (1.31) kde M- max \f{x,y)\. (1.32) Odtud ihned dostávame, že pro libovolná x, x* e (a, b) platí (1.33) \yh(x)-yh(x*)\ = \ f y'h(t)dtU M\x* - x\. I Jx Posloupnost {j/j,; h e w} je tedy na intervalu (u, b) nejen stejnoměrně ohraničená, ale i stejně spojitá. Podle Arzelovy-Ascoliovy věty tedy existuje množina H" C H taková, že posloupnost {t//,; h £ H*} je stejnoměrně konvergentní. Označme její limitu y. Je to zrejme spojitá funkce, pro niž platí y(x) — n. Dokazme ještě, že 19 E. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI splňuje danou diferenciální rovnici. Abychom toho dosáhli, uvědomme si nejprve, že platí (1.34) S/n = 1 + h Y^, f{x»,Vv), n = 0,1,..., xne{a,b), jak plyne ihned z rovnic (1.14). Zvolme dále pevně x £ (a, b) a při fixovaném h É E H* určeme přirozené číslo n = n(h, x) tak, aby platilo xn^1 < x š xn. Z definice funkce plyne, že platí (1.35) =0 a-a K=0 n-1 ů hL ^2 \Vh(x") ~ V{*v)\ ů(t>- "}L max \yh(x) - y(x)\ -> 0 pro h —f 0, h £ H*. Dále zřejmě platí (1-36) f f{t,y{t))At pro 1 -» 0, t E Jř*, neboť pro —> 0 bod i„ konverguje k bodu x. Přejdeme-li tedy v (1.34) k limitě pro h —> 0, h £ H*, dostáváme (1.37) y(x) = v+ f f(t,y{t))át. J a Z rovnice (1.37) však už bezprostředně plyne, že funkce y je diferencovatelná a že splňuje danou diferenciální rovnici. Abychom dokázali jednoznačnost, předpokládejme, že existují dvě řešení y a, z. Z podmínky (ii) bezprostředně plyne, že je (1.38) \y{x) - *(B)| < L f \y(t)-z(t)\dt. Ja Rozdíl y —z jena, intervalu (o, b) zřejmě spojitý, a proto existuje konstanta Mo tak, že platí (1.39) max \y(x) z{x)\ = MB. Dosadíme-li do nerovnosti (1.38) z (1.39), dostáváme (1-40) \y{x)-z(x)\<MBL{x-a). 20 2 EULEROVA METODA Dosadíme-li právě získaný odhad znovu do (1.38), máme t2(í-o)2 (1.41) \y(x)-z(x)\ ÍMo- 2! Pokračujeme-li v tomto postupu dále, dostaneme Lk(x-a)h (1.42) \y{x)-z(x)\<: Mo- tt pro libovolné k a libovolné x £ (a,b). Odtud ale plyne, že platí y(x) = z(x) pro každé x £ (a, b). Věta je dokázána, Poznamenejme, že z jednoznačnosti plyne, že k řešení sestrojenému v důkazu věty 1.1 konverguje nejen vybraná posloupnost {yj,; h £ H*}, ale dokonce celá posloupnost {j/m h £ H}. Skutečně, kdyby tomu tak nebylo, existovala by posloupnost H C H a Eo > 0 takové, že by platilo (1.43) max \yh{e) - y(x)\ ž E0, h £ H, Stejně jako v důkazu věty 1.1 se nyní dá ukázat, že musí existovat H* C H tak, že posloupnost {j/„; h £ H*} je stejnoměrně konvergentní. Limitní funkce je však řešením dané diferenciální rovnice, jak plyne opět z důkazu věty 1.1. Vzhledem k nerovnosti (1.43) je toto řešení nutně různé od řešení y, což odporuje jednoznačnosti. Tato poznámka tedy dává vlastně odpověď na otázku konvergence Eulerovy metody. V následujícím odstavci dokážeme konvergenci Eulerovy metody ještě jednou, a to poněkud jiným způsobem. Tento postup bude vhodnější k bezprostřednímu přenesení na obecnější případy, k jeho realizaci však bude třeba existenci řešení úlohy (1.6), (1.7) předpokládat. 2 Eulerova metoda Jak už jsme se dohodli v úvodu, budeme všude v této kapitule předpokládat, že pravá strana dané diferenciální rovnice splňuje předpoklady (i) a (ii) z prvního odstavce, takže řešení problému (1.6), (1.7) existuje a je jediné. Vyšetřování Eulerovy metody začneme přesnou definicí pojmu konvergence, i když je tento pojem z předešlého textu intuitivně jasný, Definice 2.1. Řekněme, že Eulerova metoda je konvergentní, jestliže pro každé x £ (a, b) platí (2.1) lim yn - y(x), h—*0 xn—x 21 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI 2 EULEROVA METODA kde yn je přibližné řešení získané z rovnic (1.14) při integračním kroku n a jí je přesné řešení. Limitní přechod ve vzorci (2.1) je přitom nutno chápat tak, že současně h —> —> 0 a n —► co tak, že platí x„ = a + nh — x. Jak už jsme upozornili dříve, je limitní přechod v rovnici (2.1) diskrétní, neboť při pevně zvoleném x bereme v úvahu jen ta h, pro něž platí, že (x — a)/h je celé číslo. Tohoto omezení je možné se zbavit tak, že při zmíněném limitním přechodu požadujeme platnost podmínky xn —* x. Za n v (2.1) je pak třeba vzít, např. celistvou část podílu {x — a)/h. Než zformulujeme konvergenční větu pro Eulerovu metodu, připomeneme pojem modulu spojitosti spojité funkce, který se zavádí v matematické analýze jako kvantitativní charakteristika stejnoměrně spojitých funkcí. Definice 2.2. Buď (p funkce spojitá na uzavřeném intervalu (a, b). Pak funkci OJif, definovanou pro nezáporná 6 předpisem (2.2) uv(S) ~ sup \<p(x) - ip(x*)\ nazveme modulem spojitosti funkce <p. Funkce ĺj^ jě zřejmě spojitá zprava v bodě s = 0, tj. platí (2.3) \im+uy(8) = 0. Věta 2.1. Nechť jsou splněny předpoklady (i) a (ii) z odst. 1, nechť yn je přibližné řešení úlohy (1.6), (1.7) získané Eulerovou metodou (1.14) s integračním krokem h a nechť y je přesné řešení. Pak platí (2.4) \yn-y{*n)\ ž=u(h)EL{xn -a), n = 0,...,N, kde N je největší přirozené číslo, pro něž je Xff e (a, b), funkce Ej, je definována rovnicemi (1.20) a symbol u značí modul spojitosti první derivace přesného řešení, tj- je (2.5) w(h)= sup \t/(x)-í/(X*)l Důkaz Přibližné řešení yn splňuje rovnici (2.6) yn+i = y„ + hf(xn,y„), n = 0,...,N 1. Použijeme-li definice lokální diskretizační chyby Eulerovy metody (srv. vzorec (1.15)), dostáváme pro přesné řešení analogickou rovnici (2.7) y(xn+i) = y(xn) + hf(xrl,y(xn))+L(y(xny,h), n -i 0,...,N - 1. 22 Odečteme-li tuto rovnici od rovnice (2.6) a položíme-li en — yn — y(xn), máme (2.8) e„+i = en + h[f(xn,yn) - f(xn,y(xn))\ -L((x„);h), n = 0,...,iV-l. Odtud užitím toho, že funkce / splňuje Lipschitzovu podmínku vzhledem k proměnné y, dostáváme (2.9) \en+1\š(l + hl)\en\ + \L(y(xn);h)\, n - 0,..., N - 1. Abychom tedy byly schopni odhadnout celkovou diskretizační chybu Eulerovy metody, je třeba mít k dispozici odhad její lokální diskretizační chyby. Podle věty o střední hodnotě však existuje číslo 0n, 0 < 6„ < 1, tak, že platí (2.10) y{xn+i)-y{xn) = hy'{xn + 9nh), n = 0,...,JV-l1 a tedy z rovnic (2.7) (f(xn, y(x„)) = y'(zn)), (2.10) a z definice modulu spojitosti dostáváme (2.11) \L(y(x„);h)\ íhu(h). Dosadíme-li tento odhad do (2.9) a na vzniklé nerovnosti užijeme lemma 1.1, máme (2.12) |e„|g (1+/'i;)n~1Mn), L>0 g nhu(h), L = 0, neboť e0 — 0. Z nerovností (2.12) a ze zřejmé nerovnosti 1 + hL < ehL (kterou jsme v podstatě ve stejné souvislosti ostatně užili v důkazu lemmatu 1.2) už tvrzení věty plyne bezprostředně. Věta je dokázána. Vzhledem k tomu, že funkce El je na konečném intervalu omezená, plyne z této věty konvergence Eulerovy metody. Je třeba poznamenat, že věta 2.1 nedokazuje v té podobě, jak je formulována, skutečně nic víc než pouhou konvergenci, i když nerovnost (2.4) má formálně tvar odhadu chyby. O funkci u, která v této nerovnosti vystupuje, totiž víme pouze, že existuje a že pro /i-»0 konverguje k nule, avšak zmíněná věta nic neříká o jejím konkrétním tvaru. Aby nerovnost (2.4) byla skutečným odhadem chyby, museli bychom být schopni popsat (nebo odhadnout) funkci u na základě vstupních dat dané úlohy. Pokusme se tedy o to, V lemmatu 2.1 jsme zjistili, že pro každé přibližné řešení y„ získané Eulerovou metodou platí \yn\ i Y', kde konstanta Y je dána vztahem (1.19). Z důkazu věty 1.1 však plyne, že tentýž odhad platí i pro přesné řešení rovnice (1.6) s počáteční podmínkou (1.7). Definujme pro nezáporná s funkci £2 vztahem (2.13) íl(í)= sup \f{x,y) - }(x*,y)\, |í-x'|£4 23 lim ílfí) = 0. Í-.0+ I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI kde R je obdélník definovaný rovností (1.30). Protože / je spojitá v Ji a Ä je kompaktní množina, je / stejnoměrně spojitá na R, což implikuje, že platí (2.14) Buďte nyní x, x* libovolné dva body z intervalu (a,b), pro něž platí \x - x'\ í í h. Protože je vzhledem k tomu, co jsme řekli výše, y(x)\ á Y, \y(x*)\ 5 Y je (x,y(x)) e ji, (**,»(**)) e R-Platí tedv (2.15) \y'{x) - = \f(x,y{x)) - f(x*,y(x*))\^ š\f{x,y(x)) f{x\y(x))\+ + \f(x',y(x)) -/(*',y(**))\S ^Q{h) + L\y(x)-y{x')\. Pro rozdíl y(x) — y(x*) však platí podle věty o střední hodnotě odhad (2.16) \y(x)-y(x*)\ = \y'(0\\*-**\ = = \f(t,y(Í))\\z-*'\ÚMh, kde bod £ leží mezi body x a i* a M je konstanta definovaná vztahem (1.32). Dqsadíme-li tedy (2.16) do (2.15), dostáváme pro funkci ui z věty 2.1 odhad (2.17) u(h)ÍQ(h) + LMh a z nerovnosti (2.4) nerovnost (2.18) \yn - y[xn)\ $ [fi(A) + LMh]EL{xn - a), která už je odhadem chyby. Počítat funkci fí je vsak velice nepohodlné a často prakticky vůbec neproveditelné. Praktická cena odhadu (2.18) je tedy značně problematická. Pokusme se proto nalézt použitelnější odhad než (2.18) za cenu, že zesílíme předpoklady na danou úlohu. Věta 2.2. Nechť jsou splněny předpoklady (i) a (ii) a nechť přesné' řešen/rovnice (1.6) určené' počáteční podmínkou (1.7) má v intervalu {a, b) dvě spojité derivace. Buď M(x) = i max \y"(t)\. «6(<i,i> (2.19) Pale platí (2.20) líh, - »(a„)| g hM(xn)EL(x„ -a), n =» 0,.. -, N, přičemž význam symbolů yn, N a EL je stejný jako ve větě 2.1. Důkaz. Zvolme h > 0 pevně a buď n libovolné pevně zvolené přirozené číslo takové, že je xn £ (o, 6). Ze vzorce (2.9) je zřejmé, že pro m - 0, (2.21) |em+1| S (1 + hL)\em\ + \L(y{xm); h)\. 24 , n — 1 platí 2 EULEROVA METODA Z Taylorova vzorce plyne, že pro tatáž m existují čísla 0m, 0 < 9m < 1, tak, že platí (2-22) £(»(»»); A) = V(»» + í>mA). Pro m = 0,..., n — 1 však platí podle definice funkce JW (2-23) jiftVízm + ímA)| g n2M(z„). Tedy celkem (2.24) |em+i| á (1 + AX)|em| + M(ar„)^2, m = 0,..., n - 1. Odtud dostáváme podle lemmatu 1.1, že pro m = 0.....n platí (2.25) (1+AX)" h L -h2M(x„), L > 0, g m/í2M(2„), X = 0. Položíme-li zde speciálně m = n a užijeme už dříve několikrát užitou nerovnost 1 + AX < ehL, dostáváme nerovnost (2.20). Věta je dokázána. Věta 2.2 odpovídá vlastně na dvě otázky týkající se konvergence Eulerovy metody. Známe-li funkci M(x), představuje vzorec (2.20) odhad chyby. Víme-li jen, že tato funkce existuje, říká vzorec (2.20), že rychlost konvergence Eulerovy metody je h. Poznamenejme, že žádným dalším zvyšováním požadavků na hladkost řešení dané diferenciální rovnice nelze obecně docílit vyšší rychlosti konvergence. Skutečně, řešíme-li Eulerovou metodou např. diferenciální rovnici y1 = 1x s počáteční podmínkou s/(0) = 0, jejíž přesné řešení y (= x2) je dokonce analytické, snadno vypočteme, že platí yn - y(xn) = -x„h. Uveďme ještě, jak lze jednoduše odhadnout funkci M z věty 2.2. Za předpokladu, ře pravá strana dané diferenciální rovnice má v obdélníku R daném vztahem (1.30) spojité parciální derivace podle x ay, platí zřejmě (2.26) 2M{x)ú max \fx + fyf\. (Symboly fx a fy zde značí parciální derivace podle x a y.) Před uvedením jednoduchého příkladu ilustrujícího výsledky, ke kterým jsme do této chvíle dospěli, uveďme ještě jednu větu, která bude v dalším užitečná. Věta 2.3. Nechť platí tatáž označení jako ve větě 2.2 a nechť jsou rovněž splněny předpoklady této věty. Buď dále posloupnost yn, n = 0,..., N definována lekurencl (2.27) ij0=n Ôn+i = yn + hf{xn,yn) + enCh2, n = 0, .,JV-1, ide C je konstanta a Sn jsou libovolná reálná čísla, pro něž platí n = 0,...,N- 1. Pak platí í 1 pro (2.28) \5n -y(x„)\ S h[M(xn) + C]EL(xn a), n s* 0,..., JV, 25 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Důkaz této věty je zřejmý a je v podstatě opakováním důkazu věty 2.2. Jediný rozdíl je v tom, že na pravé straně nerovnosti (2.21) vystupuje navíc člen 9nCh2, který se snadno majorizuje výrazem Ch2. Věta 2.3 vlastně říká, že k přesnému řešení dané diferenciální rovnice konverguje nejen přibližné řešení získané Eulerovou metodou, ale i řešení, které vznikne tak. že se v každém kroku Euterovy metody dopustíme navíc chyby velikosti A2. Je to důsledkem skutečnosti, které si pozorný čtenář už jistě všiml, a která spočívá v tom, že akumulací lokálních chyb se ztratí jeden řád (měřeno mocninou integračního kroku h). Příklad 2.1. Řešme Eulerovou metodou v intervalu (0,5) diferenciální rovnice y1 = y, resp. ý = -y, obě s počáteční podmínkou y(0) = 1. Přesná řešení jsou tedy funkce e', resp. e-*. Lipschitzova konstanta L je v obou případech rovna jedné a 2M(i) = e", resp. 1M{x) = 1, takže výrazy he*"(ec- - l)/2, resp. h(cŕ" - l)/2 představují odhad chyby ve smyslu věty 2.2. Výsledky jsou pro integrační krok h — 1/64, uspořádány v tab. 2.1 a 2.2 a nejsou příliš uspokojivé, neboť získané odhady jsou velmi pesimistické. Tak např., chceme-li vypočítat e-5 s chybou, která nepřevýší 10"3, je podle odhadu nutno vzít h tak, aby platilo ri(e5 l)/2 ^ 10_J, tj. h á 1/73707; ve skutečnosti stačilo h = 1/64. Tabulka 2.1 Přibližné řešení diferenciální rovnice y' — y Xn 1 2 3 4 5 !ín 2,69735 7,27567 19,62499 52,93537 142,7850 e,i -0,02093 -0,11339 -0,46055 -1,66278 -5,6282 odhad en 0,03649 0,36882 2,99487 22,86218 170,9223 Tabulka 2-2 Přibližné řešení diferenciální rovnice y' - -y x„ 1 2 3 4 5 Wn 0,364987 0,133215 0,048622 0,017746 0,006477 £n -0,002892 -0,002120 -0,001165 -0,000570 -0,000261 odhad en 0,013424 0,049914 0,149106 0,418735 1,151666 Tento jev, i když jsme jej ukázali pouze na zcela triviálních příkladech, je pro odhady typu (2.20) typický a představuje silně limitující faktor pro jejich praktické použití. Je tedy velmi žádoucí mít k dispozici jinou možnost, pomocí níž by bylo 2 EULEROVA METODA Tabulka 2.3 Závislost chyby na inte^ačním kroku Vn en ř»_1e„ 1 0,250000 -0,117879 -0,235758 2 0,316406 -0,051473 -0,205893 3 0,343609 -0,024270 -0,194164 6 0,364987 -0,002892 -0,185147 7 0,366438 -0,001441 -0,184540 8 0,367160 -0,000719 -0,184239 možné učinit si o chybě realističtější představu. Abychom jeden takový postup získali, začneme opět jednoduchým příkladem. V tab. 2.3 je ukázána závislost výrazu en/h na integračním kroku v případě diferenciální rovnice y1 = -y s počáteční podmínkou j/(0) = 1. Z předešlého výkladu víme, že tento výraz je při h —► 0 a při xn = x ohraničený. Z tabulky se však zdá, že tento výraz je nejen ohraničený, ale že má dokonce při h —► 0 limitu. Kdyby tomu tak bylo a kdybychom tuto limitu znali, dávala by nám pro malá h asi daleko lepší představu o skutečné chybě než uvažovaný maximalistický odhad. Následující věta ukazuje, že za vhodných předpokladů zmíněná limita skutečné existuje. Věta 2.4. (Asymptotický vzorec pio chybu.) Nechť jsou splněny předpoklady (i) a (ii) a nechť navíc má pravá strana f dané diferenciální rovnice spojité první a druhé parciální derivace podle obou proměnných v množině R definované rovnicí (1.30) . Pat celková diskretizační chyba en přibližného řešení vypočteného Eulerovou metodou se dá psát ve tvaru (2-29) e„ = e(xn)h + 0(h2), kde funkce e je řešením diferenciální rovnice (2-30) e' = fy(x,y{x))e-íy"(x) s počáteční podmínkou e(a) — 0. Důkaz. Z předpokladů o hladkosti funkce / plyne, že přesné řešení dané diferenciální rovnice má v intervalu (a, b) tři derivace spojité. Z Taylorova vzorce tedy plyne (2.31) y(xn+l) = y(xn) + hy'(xn) + §ftV(*») + ^V'(U kde bod leží mezi body xn á rn+1. Odečtením této rovnice od (1.14) dostáváme (2.32) e„+1 = e„ + h[f(xn,yn) - f(xn,y(xn))] - \h2y"{xn) - |ftV"(f»). 26 27 i. obyčejné diferenciální rovnice - úlohy s počátečními podmínkami Protože je e„ = yn — y(x„), můžeme v rozdílu v hranaté závorce na pravé straně poslední rovnice psát y(xn) + e„ místo y„ a opět podle Taylorova vzorce máme, že (2.33) f(xn,yn) - f(xn,y(x„)) = fy [xn, y(x„))en + \fyy{xn, y")t%, kde bod y* leží mezi body yn a y(xn). Zaveďme nyní veličinu ě„ — en/h. Podle věty 2.2 je \ě„\ á M(xn)E[,(xn — a), a protože jak funkce M, tak funkce El jsou na intervalu (a,b) omezené, existuje konstanta C\ taková, že platí (2.34) |ě„|áCi- Dělíme-li rovnici (2.32) integrační krokem a použijeme-li rovnici (2.33), dostáváme (2.35) ě„+i = e„ + hfy (i„, y(x„))ěn + \h2fss(xn, y*)ě*- - i V(*„) " |k V(í-.) neboli (2.36) e„+i = ě„ + h[fy(xn,y{xn))ěn \y"{xn)\ + k2rnt kde jsme položili (2-37) rn = ífyy(xn,y')ěl~íy'"(ín) Přitom existuje konstanta Ci taková, že platí (2.38) \rn\ŠC2. Na rekurenci (2.36) se tedy můžeme dívat jako na Eulerovu metodu pro řešení diferenciální rovnice (2.30) s počáteční podmínkou e(a) = 0 (neboť je eo = 0), kde se v každém kroku dopouštíme navíc chyby, která nepřevýší Cítí1. Vzhledem k předpokladům o hladkosti funkce / má pravá strana rovnice (2.30) spojité parciální derivace podle x a e; její řešení má tedy dvě spojité derivace. Podle věty 2.3 tedy platí (2.39) |fc_1c„ -e(x)\£hC3ELl(xn a), kde (2.40) C3 = h max \e"(x)\ + C2, li = max \f3(x,y(x))\. iě(«,Í)) T£{a,b} Věta je dokázána. Ilustrujeme právě dokázanou větu opět jednoduchým příkladem. Příklad 2.2. Řešme diferenciální rovnici y1 = —y s počáteční podmínkou y(0) = 1. V tomto případě je y(x) — e~", fy(x,y(x)) — —1, y" = e-*, a tedy e(x) = —xe~*/2. V tabulce 2.4 je uveden průběh funkce he(xn) pri h - 2-6. Je z ní vidět velmi dobrá shoda skutečné chyby s hodnotou he(xn), takže znalost funkce e (tj. znalost asymptotického chování celkové diskretizační chyby) může být velice cenná. 2 eulerova metoda Tabulka 2.4 Asymptotický odhad chyby 1 2 3 4 5 Cn -0,002892 -0,002120 -0,001165 -0,000570 -0,000261 he[xn) -0,002874 -0,002114 -0,001167 -0,000572 -0,000263 odhad met. pol. kroku -0,002902 -0,002123 -0,001165 -0,000568 -0,000260 Určení funkce e podle věty 2.4 však vyžaduje nutnost řešení další diferenciální rovnice, v níž navíc vystupuje hledané řešení, tj. neznámá funkce. Tato obtíž se sice dá za určitých okolností obejit; my však nyní ukážeme jiný postup ocenění celkové diskretizační chyby, který se sice také opírá o větu 2.4, zužitkovává však přímo pouze její existenční část. Mějme dán pevně bod x G (o,t) a značme pro tuto chvíli symbolem y[x\h) přibližné řešení v bodě z získané Eulerovou metodou s krokem h (který musí samozřejmě být takový, že (x—a)/h je celé číslo). Jsou-li splněny předpoklady věty 2.4, platí (2.41) y(x;ft) = y(x) + e(x)h + 0(h2). Píšeme-li zde A/2 místo h, dostáváme (2.42) y(x; h/2) = y(x) + \e(x)h + 0(ň2). Odečteme-li rovnici (2.42) od rovnici (2.41), máme (2.43) y{x; h) - y(x; h/2) - \e(x)h + 0(h2), a tedy pro chybu přibližného řešení platí (2.44) y(x;h) - y(x) = 2[y(x;h) - y(x; h/2)] + 0(h2). Až na veličiny vyššího řádu lze tedy získat velikost celkové diskretizační chyby tak, že přibližné řešení vypočteme dvakrát se dvěma různými integračními kroky. I když není zřejmě nutné, aby v právě popsaném postupu byl jeden z užitých integračních kroků polovina druhého, je tento případ nejčastější, a proto se tomuto způsobu ocenění chyby Často také říká metoda polovičního kroku. V tab. 2.4 jsou uvedeny hodnoty chyby získané touto metodou. Opět vidíme velmi dobrou shodu se skutečností. Je však třeba důrazně upozornit, že vzorec (2.44) platí pouze asymptoticky, tj. až na veličiny vyššího řádu, a proto je třeba při jeho užití zachovávat jistou opatrnost. Poznamenejme ještě, že výraz 2[ji(x; h) — y(x; h/2)] (a také výraz e(x)h), který se rovná až na veličiny vyššího řádu celkové diskretizační chybě, se alternativně nazývá hlavní část celkoví diskretizační chyby. Uveďme také, že vzorec (2.44), který je 28 29 i. obyčejné diferenciální rovnice - úlohy s počátečními podmínkami možné sestavit až na základě provedeného výpočtu, je příkladem tzv. aposteriorního odhadu na rozdíl od apriorního odhadu, který je dán už pouhými vstupními daty dané úlohy (srv. např. odhad v větě 2.2). Poslední otázka spojená s Eulerovou metodou, kterou zde stručně objasníme, je otázka ovlivnění přibližného řešení zaokrouhlováním. Jak už jsme uvedli v úvodu, v důsledku zaokrouhlování vypočteme místo veličiny yn veličinu yn a naším úkolem je učinit si představu o velikosti rozdílu rn = yn — Vn, který nazveme celkovou zaokrouhlovací chybou. Předpokládejme k tomu cíli, že veličiny yn splňují rovnice (2.45) S/o = r). yn+i -ýn + hf(xn,y„) + e„ 0,...,JV-1. Veličina sn vyskytující se v těchto rovnicích je mírou nepřesnosti, které se dopustíme při výpočtu veličiny yn+i za předpokladu, že yn je zadáno přesně a je ovlivněna zejména tím, s jakou přesností jsme schopni vypočítat součet v (2.45). Je tomu tak proto, že integrační krok h je většinou malé číslo, takže chyba, se kterou vypočteme funkční hodnotu pravé strany dané diferenciální rovnice, se tolik neprojeví. Z těchto důvodů je rozumné nazvat veličinu en lokální zaokrouhlovací chybou apředpokládat o ní, že je v průběhu výpočtu omezená. Všimněme si ještě, že rovnice (2.45) obsahují předpoklad, že počáteční podmínka je zadána přesně. Tento předpoklad není na újmu obecnosti, jak bude dále na první pohled vidět, a je činěn v podstatě pouze z pohodlí, abychom si v dalším ušetřili psaní. I o dalším předpokladu, který je v (2.45) obsažen implicitně, je třeba se zmínit. Je to předpoklad, že jak bod a. tak body x„ jsou zadány bez zaokrouhlovacích chyb. V praxi je splnění takovéhoto předpokladu zřejmě snadno dosažitelné, Odečteme-li od rovnic (2.45) rovnice (1.14), zjistíme, že pro celkovou zaokrouhlovací chybu platí (2.46) r„+i = rn + h[f(xn,yn)-f(xn, yn)] + £„, n = 0,..., N - 1. Je-li nyní |e„| 5 £ pro n — 0,... ,n, dostáváme z rovnice (2.46) nerovnost (2.47) \rn+1\<(l + hL)\r„\ + e, n = 0,..., - 1. Z nerovnosti (2.47) a z lemmatu 1.1 však ihned plyne následující věta. Veta 2.5. JVechť funkce f splňuje předpoklady (i) a (ii) a nechť lokální zaokrouhlovací chyba en je omezená, tj. nechť existuje konstanta. £ taková, že platí |e„| á e pro n = 0, ., N - 1. Pak platí (2.48) ,N. Z této věty plyne několik prakticky velmi důležitých důsledků. Nerovnost (2.48), kterou nelze obecně zlepšit, jak se snadno nahlédne (stačí k tomu např. uvažovat 30 2 eulerova metoda diferenciální rovnici y' — Ay, kde A je konstanta a e„ = s), tak říká, že pří omer zených lokálních zaokrouhlovacích chybách celková zaokrouhlovací chyba roste při h —i- 0 jako 1/h. Skutečně vypočtené řešení je zatíženo dvěma chybami: celkovou diskretizační chybou, která při h —* 0 konverguje k nule, a celkovou zaokrouhlovací chybou, která při h —► 0 roste. Pokud tedy nejsme schopni zaručit při výpočtu více než jen to, že lokální zaokrouhlovací chyba je ohraničená, vypadá situace tak, že pro velká h převládne celková diskretizační chyba a celková chyba se bude při zmenšování h zmenšovat. Při dalším zmenšování integračního kroku h dospějeme však k takovému ha, při němž převládne celková zaokrouhlovací chyba, která při dalším zmenšování h roste. Další zmenšování integračního kroku je tedy zbytečné a nejen to, dokonce škodlivé, protože celkovou chybu jen zvětšuje. V této situaci tedy existuje pro danou metodu a danou velikost lokální zaokrouhlovací chyby určitá mezní přesnost, kterou nelze překročit. Je-li tedy nezbytné z jakéhokoliv důvodu vypočíst řešení přesněji, než činí tato mezní přesnost, nemáme na základě toho, co dosud víme, jinou možnost, než zmenšit lokální zaokrouhlovací chybu a posunout tak mezní přesnost k menším integračním krokům. To však značí užít dvojnásobnou nebo případně i vícenásobnou aritmetiku, což jistě není příliš pohodlné řešení. V dalších článcích uvidíme, že naštěstí existuje jiné východisko, které spočívá v tom, že se užije jiná metoda než Eulerova, a to taková, že její celková diskretizační chyba je při daném h menší než u Eulerovy metody. Chování celkové zaokrouhlovací chyby je totiž do značné míry nezávislé, jak uvidíme, na konkrétní metodě a tato skutečnost zřejmě umožňuje zmenšit velikost kritické chyby. V dalších článcích si všimneme rady možností konstrukce těchto obecnějších metod. Než k nim však přejdeme, ilustrujme problematiku mezní přesnosti jednoduchým příkladem. Příklad 2.3. Vypočtěme Eulerovou metodou hodnotu přibližného řešení diferenciální rovnice y' = y s počáteční podmínkou í/(0) = 1 v bodě a: = 1 a užijme přitom integrační kroky h — 1/2S, * = 1,..., 20. Na obr. 2.1 a 2.2 je znázorněn průběh celkové chyby (tj. celkové diskretizační chyby a celkové zaokrouhlovací chyby) v závislosti na velikosti integračního kroku h. Z obou obrázků je vidět velmi dobrá shoda s předpověděným chováním. Celková chyba se nejprve zmenšuje, a to lineárně s h, neboť Eulerova metoda je řádu jedna, a po dosažení minima se v důsledku toho, že převládne zaokrouhlovací chyba, lineárně zvětšuje. Velikost kritické chyby je přitom na druhém obrázku menší než na prvním. Je to způsobeno tím, že příslušné výpočty byly v případě obr. 2.1 provedeny na počítači, u něhož je reálné číslo uloženo v 32 bitech, zatímco v případě obr. 2.2 byl užit počítač s přesnější aritmetikou o délce reálného čísla 40 bitů. 31 t QByČS!N& DIFEKĽNrIALNt HOVNKt- 0U>HV S FOf ATKÍINÍMI PODMÍNKAMI 01». 1.1 /.-tvľ Imi rrlknvŕ rhyKy n» initgrarrilm kroku _* I___ : 3 5 7 9 " a B r? rs--tagth Obr. 2.2 Zivi.lo.i celkov* Uiyliy . ml-sraŕiilm kroku í' i 5 Ť 9 n 13 S—.-/oy,/i 3 OBECNÁ JEDNOKROKOVÁ METODA 3 Obecná jednokroková metoda .ledním z charakteristických rysů Eulerovy metody je, že približné řešení j/„+1 v bode in+i se při jejím užití počíta pouze ze znalosti přibližného řešení yn v bodě x„. Můžeme ji tedy pokládat za speciální případ obecné jednokrokové metody, když obecnou jednokrokovou metodou rozumíme jakýkoliv algoritmus pro řešení problému (1.6), (1.7), v němž se přibližné řešení yn+i v bodě x„+i počítá pouze na základě znalosti veličin x„, yn a h. Funkcionální závislost veličiny Jfo+i na veličinách x„, y„ a h je užitečné zapsat ve tvaru (3.1) Vn+i = yn+h9{x„,yn,h), kde funkce <ř tří reálných proměnných závisí na dané diferenciální rovnici (resp, na její pravé straně). Vypočítat přibližné řešení y„ problému (1.6), (1.7) obecnou jednokrokovou metodou pak znamená generovat posloupnost aproximací yo,..., J/jv opakovaným užitím vzorce (3.1), přičemž se klade jfo = *?• Intuitivně se dá očekávat, že i v případě obecné jednokrokové metody bude hrát lokální chyba stejně důležitou roli, jako tomu bylo u Eulerovy metody. Začneme proto vyšetřování obecné jednokrokové metody přesnou definicí její lokální chyby. Definice 3.1. Výraz L(y(x);h) definovaný rovnicí (3.2) L(y(x);h) = y(x + h)-y(x)-h<S-(x, y(x),h), kde y je přesné řešení problému (1.6), (17), nazveme lokální chybou obecné jednokrokové metody. Veličina h&(x;y,h) udává zřejmě, oč vzroste na intervalu {x,x + h) přibližné řešení, které vychází z bodu (x,y); veličina $(x;y,h) je tedy relativní přírůstek přibližného řešení (tj. přírůstek vztažený na jednotku nezávisle proměnné). Lokální chyba dané jednokrokové metody bude tedy malá, bude-li se přírůstek přibližného řešení málo lišit od přírůstku přesného řešení, které prochází tímtéž bodem. Abychom tento požadavek mohli snadno zapisovat, zavedeme následující označení: Nechť jsou splněny předpoklady (i) a (ii) z čl. 1 a buďte ie(a,i)aj libovolná čísla. Podle věty 1.1 existuje v intervalu (a, b) právě jedna funkce z, která v tomto intervalu řeší diferenciální rovnici (3.3) 4i = /(ť'z) a pro kterou platí (3.4) z(x) - y. Pro každé h takové, že je x + h £ (a, b) definujme funkci A(i, y, h) předpisem z(x + h)-y (3.5) &{x,y, h) h f(*, y), h /O, h=0. 33 i. obyčejné diferenciální rovnice úlohy s počátečními podmínkami 3 obecná jednokroková metoda Funkce hA(x,y,h) tedy představuje přírůstek přesného řešení dané diferenciální rovnice procházejícího bodem (x,y) a funkce A(ar, y, h) relativní přírůstek přesného řešení. Podle definice 3.1 zřejmě platí (3.6) L(y{x);h) = h{&{x,y{x),h) 4>(x,y(x),h)} Funkci <ř, jíž je definována obecná jednokroková metoda, se tedy budeme snažit volit tak, aby rozdíi $(x, y, h) — A(x, y, h) byl pro malá h co nejmenší. Dříve než si všimneme podrobněji problematiky spjaté s obecnou metodou typu (3.1), uvedeme některé důležité speciální případy. Jak už jsme uvedli výše, budeme tyto speciální jednokrokové metody konstruovat tak, aby jejich lokální chyba byla pro malé hodnoty integračního kroku malá. Chování lokální chyby se obvykle charakterizuje veličinou, která se nazývá řád obecné jednokrokové metody. Tento pojem bude hrát důležitou roli při konstrukci konkrétních jednokrokových metod, a to je také důvod, proč jej zavedeme už nyní. Definice 3.2. Symbolem SHq označme množinu diferenciálních rovnic, jejichž pravé strany splňují požadavky (i) a (ii) z čl. 1, a buď 9Jt C Sílo- Maximální přirozené číslo p takové, že platí (3.7) L{y(x);h) = 0(V+1) pro každou funkci y, která je řešením diferenciální rovnice z množiny £DT, nazveme řádem dané obecné jednokrokové metody na množině 97t. V předešlém článku jsme viděli, že některá tvrzení, která jsme tam dokázali, jako např. věta 2.1, platí pro celou množinu ©to, jiná (příkladem může být věta 2.2) platí pouze pro vhodnou vlastní podmnožinu množiny 9Jío. V důkaze zmíněných vět jsme také viděli, že o lokální chybě Eulerovy metody můžeme pro celou třídu Wíq říci jen, že se chová jako hu(h), kde u je modul spojitosti první derivace řešení, kdežto pro třídu OTi diferenciálních rovnic, jejichž řešení mají spojitou nejen první, ale i druhou derivaci, je lokální chyba řádu ň2. Eulerova metoda má tedy na množině DJli řád 1, kdežto na množině SJto se o jejím řádu ve smyslu definice 3.2 nedá dost dobře mluvit. V dalším uvidíme, že i v případě obecné jednokrokové metody je tomu podobně; zavedení množiny 271 v definici 3.2 je tedy nezbytné. Upozorněme také, že v smyslu definice 3.2 lze mluvit o řádu dané jednokrokové metody pro dané řešení. 3.1 Speciální případy Předpokládejme v tomto odstavci, že pravá strana / dané diferenciální rovnice má pro x e (a, b) a pro libovolné y parciální derivace až do řádu p, kde p je nějaké pevné přirozené číslo. Pak řešení y má derivace až do rádu p + 1 a tyto derivace jsou úplně určeny funkcí /. Tak např. platí (3.8) j/' = /x(z,j,) + /*(*, y)f{*,y) a analogické vzorce lze psát pro y'"} y"" atd. Abychom zjednodušili zápisy, pišme y" — f'(x,y), y"' = f"(x,y) atd. Čárka tedy značí totální derivaci funkce / podle x (tj. derivaci funkce / podle x, v níž y je též funkce proměnné x). Použijeme-li tohoto označení, platí pro přírůstek hA(x,y,h) přesného řešení podle Taylorova vzorce (3.9) hA(x,y,h) = z(x + h) - y- r hf(x, y) + ±h2f'(x,y) +... + -h"f^\x, y) + 0{h"+1), a tedy pro funkci A (3.10) A(x,y,h) = f(x,y) + thf'(x,y)+ + -h"-1/^(x, y) + 0{h"). Vzhledem k tomu, co jsme řekli výše, se zdá přirozené volit funkci <ř tak, aby souhlasila s A tak dobře, jak je to jen možné. Vzorec (3.5) nabízí okamžité řešení spočívající v tom, že položíme (3.11) y, h) = f(x, y) + \hf{x,») + ...+ -.h?-1 /^(x, y). Metodu danou vzorcem (3.11) nazveme metodou Taylorova rozvoje řádu p. Její početní nevýhody jsou očividné: K tomu, abychom vypočetli hodnotu funkce je třeba mít k dispozici hodnoty funkcí /,/',...,/fa-1). Určit tvar těchto funkcí však nebude v konkrétních případech většinou vůbec jednoduché. Čtenář se o tom může přesvědčit na příkladě velice nevinně vyhlížející diferenciální rovnice j/ = — x2 + y2. Proto je snaha sestrojit funkci <6 tak, aby se lišila od funkce A až teprve ve členech rádu hp a aby zároveň nebylo třeba k výpočtu jejích hodnot počítat žádné derivace funkce /, zcela přirozená. Vzniká jen otázka, je-li možné. Klíčem ke kladné odpovědi na tuto otázku je známá skutečnost, že derivaci libovolného řádu každé funkce lze aproximovat lineární kombinací jejích hodnot v nějakých vhodně zvolených bodech. Základní myšlenkou příslušného postupu, který dá vzniknout tzv. Rungovým-Kuttovým metodám, si ukážeme pro jednoduchost na případě p ~ = 2. Hledejme funkce <ř ve tvaru (3.12) $(x, y, h) = wiki + u>2fc2, kde (3.13) *i = /(*,!/), *2 = f{x + ah,y + l3hkx) a mi, wi, a a § jsou konstanty, které určíme tak, aby rozvoj funkce $ jako funkce proměnné h souhlasil co možno nejdále s rozvojem funkce A. Rozviňme tedy funkci 35 L OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI <ř podle h. Dostaneme (Z.U)^(x,y,h)-wíkl + w2k2 - y) + w2f(x + ah, y + 0hf(x, y)) - - (wi + w2)f(x, y) + w2[afx(x, y) + 0fy (z, y)f(x, y)]h + 0(ft2). Porovnáním koeficientů u stejných mocnin h ve vzorci (3.14) a (3.10) dostáváme (3.15) ti>i + w2 — 1, U)20f=i, u>2/3=|. Táto soustava má nekonečně mnoho řešení a každé řešení dostaneme zřejmě pomocí vzorců (3-16) «i = l-ťf w2 = t, a = jť 0=1, kde ť je libovolné reálné číslo různé od nuly. Dále se dá také snadno přímým výpočtem ukázat, že žádnou volbou parametrů wi, w2, a a 0 nelze docílit, aby v rozvojích (3.14) a (3.10) souhlasily pro obecnou diferenciální rovnici i členy s h2. Zvolíme-li tedy ve vzorci (3.12) a (3.13) parametry Wi, w2, a a 0 podle (3.16), dostáváme obecnou jednokrokovou metodu, pro niž platí <ř(z, t/, h) — A(x, y, h) — 0(h?), a která je tedy řádu 2 na množině S3JÍ2 diferenciálních rovnic, jejichž řešení mají 3 spojité derivace. Lokální chyba této metody má, jak vidíme, stejnou vlastnost jako lokální chyba metody Taylorova rozvoje řádu 2. Nutnost počítat derivace pravé strany dané diferenciální rovnice je však nahrazena tím, že se počítají v každém kroku dvakrát hodnoty funkce /. V obecné Rungově-Kuttově metodě je funkce <ř dána předpisem (3.17) $(x,y, h) = mi.fci + ■ . + w,k„ kde (3.18) fc, <=f(x,y), ki = f(x + aih,y + h^20ijkj 1, i = 2,... ,s, ^ ;=1 ' a k výpočtu její hodnoty je tedy třeba s-krát vypočítat hodnotu pravé strany dané diferenciální rovnice. Postupem, který jsme ukázali výše, o mnoho však pracnějším a komplikovanějším, se dá ukázat, že parametry v každé Rungově-Kuttově metodě lze volit tak, že pro její rád p — p(s) platí p(s) —> co pro s —> oo. Řádu p(s) lze přitom dosáhnout nekonečně mnoha volbami příslušných koeficientů. Do dalších podrobností nebudeme zacházet, spokojíme se pouze s konstatováním, že pro ä s ž 4 je na množině diferenciálních rovnic s dostatečně hladkými řešeními p{s) = s, zatímco pro s > 4 roste funkce p už pomaleji než s. To je také v podstatě důvod, proč se v praxi jen zřídka užívá Rungových-Kuttových metod řádu většího než 4, Druhý důvod je ten, že koeficienty každé Rungovy-Kuttovy metody se určují ze značně složité soustavy nelineárních algebraických rovnic, při jejímž řešení vznikají 36 3 OBECNÁ JEDNOKROKOVÄ METODA pro velká s prakticky nezvládnutelné problémy. Aby si čtenář mohl udělat představu o jejich charakteru, uveďme tuto soustavu pro s — 4; (3.19) «2 s hu «3 = 031 +032, Ol A = 041 +042 + 043, Wl + W2 + W3 + 104 = 1, W2a2 + W3OI3 + U)4QÍ4 = |, w2al + w3a\ + WiCtl - g, w2a2 + w3a>l + «j4a| = \. W3CI2032 + W4(CÍ2042 + Ol3043) - g, w3otl032 + w4(al042 + a\043) = i, w3a2a3032 + W4(a2042 + «3^43)0(4 = g, W4<X2032043 - V následujících řádcích uvedeme některé důležité speciální Rungovy-Kuttovy metody. Dvě metody druhého řádu (3.20) yn+i = y„+ hf(xn + \h, yn + \hf{xn,yn)) a (3.21) yn+1 = yn + \h[f(xn,yn) + f(xn + h,yn + hf(xn,y„)}, které vzniknou ze vzorce (3.12) a (3.13) dosazeními podle (3.16) s t = 1, resp. i = — 1/2, se vyskytují v literatuře pod názvem modifikovaná Eulerova meioda a Heu-nova metoda. Geometricky lze obě tyto metody interpretovat podobné jako Eule-rovu metodu. Řešení se opět aproximuje lomenou čarou procházející body (xn,yn)', její směrnice se však volí o něco důmyslněji. Je to právě metoda (3.20), kterou navrhl už koncem minulého století Runge a dal tak vlastně podnět ke vzniku všech ostatních metod tohoto typu. Z metod třetího řádu uveďme metodu (3-22) yn+1 = jfc, + \h(ki + 3k3), h - f{xn + 5A, yn + g^íii): &3 - f(x„ + |ň, yn + ihk2) známou rovněž jako Heunova metoda. 37 i. obyčejné diferenciální rovnice - úlohy s počátečními podmínkami 3 obecná jednokroková metoda Dvě velmi známé metody čtvrtého řádu jsou (3.23) yn+1 = yn + i/i(*, + 2fe2 + 2*3 + fe4), *2 = + \h, yn + |ft*i), h ~ f(xn + \h, yn + \hk2), *4 = /(í„ + h,y„ +hks) i (3.24) yn+1 = yn + ^A(Jbi + 3*2 + 3*3 + h), *i = f(xn,y„), k-i = f(x„ + J/n + 5M1), *3 - /(zn + |A, y,. - 5W1 + hk2), *4 = /(^n + h,y„ + hki - /i*2 + hks). Daleko nejužívanější Rungovou-Kuttovou metodou je metoda (3.23); proto také, mluví-li se o Rungově-Kuttově metodě, myslí se tím často právě tato konkrétní metoda. Budeme o ní proto v dalším textu mluvit jako o standardní Rungově-Kuttově metodě. Metodě (3.24) se často říká tříosminové pravidlo. Z metod pátého řáduje dosti populární tzv. Fehlbergova metoda, která vyžaduje šest funkčních hodnot a ie dána vzorci (3.25) y„+i = y„ + A (lišh + flgfci, + §f|§I*4 - ft*. + ±ks) , *1 = f(zn,yn), Í2 = f(xn + \h,yn + fftfe2), *3 = f(x„ + lh, yn + 53^(3*1 + 9*2)), fc4 =f(xn + %h, yn + jysťKI 932*! - 7 200*2 + 7 296fe3)) , h = f(xn + h,yn + A(g|fc, - 8fc2 + fe3 - fc6 = /^a;n + fh,yn+ -|-íl^ 27«i -I- íki 256SK3 T 4104K4 40K5H- Tato metoda má tu vlastnost, že šest hodnot k v ní užitých se dá zkombinovat tak, že se dostane nová aproximace t/*+1, (3.26) sS+1 = », + fc + Iggfe + figt* - lh) , 38 která je čtvrtého řádu. Rozdíl y* +1 — pak lze pokládat za přibližný odhad velikosti lokální chyby. Je tomu tak proto, že přibližné řešení j/„+i vypočtené metodou pátého řádu je většinou podstatně přesnější než přibližné řešení takže je lze pro účel odhadnutí chyby ztotožnit s přesným řešením. Hutova metoda (3.27) t/„+1 = yn + s|5ň(4Ui + 216*3 + 27*4 + 272*5 + 27fe64 + 216fc7 + 41*8), *i = f(x„,y„). ta = f(xn + 1/í, yn + \hkx), h = f{xn + ±h,yn + i&(*, + 3*2)), *4 = f(xn + \h,yn + l/í(fei - 3*2 + 4*3)), *5 = f(xn + f fc, yn + |A(-5*i + 27*2 - 24fc3 + 6*4)), *6 = f(xn + lh, yn + 1/1(221*! - 981*2 + 867*3 - 102*4 + h)), *7 = f(xn + f h, yn + ^n(-183*j + 678*2 - 472*3 - 66*4+ + 80*5 + 3*6)), ks = f(xn + h, yn + ^„(716*! - 2 079*2 + 1002*3 + 834*4- - 454*5 - 9*6 + 72*7)), je šestého řádu a vyžaduje v každém kroku osmkrát vypočítat hodnotu pravé strany dané diferenciální rovnice. Huťova metoda i další zde explicite uvedené Rungovy-Kuttovy metody vysokých řádů se užívají velmi zřídka, ačkoliv k tomu není vlastně žádný vážný důvod. Většinou se argumentuje v jejich neprospěch tím, že k provedení jednoho krokuje třeba mnohokrát vypočíst pravou stranu dané diferenciální rovnice (což činí beze sporu největší podíl v práci vynaložené na provedení jednoho kroku metody). Tyto metody jsou však vysokého řádu, takže je lze užít s větším integračním krokem, čímž může být zmíněná nevýhoda do značné míry kompenzována. 3.2 Konvergence obecné jednokrokové metody V tomto odstavci zformulujeme požadavky, které je nutné klást na obecnou jed-nokrokovou metodu, abychom zaručili její konvergenci, resp. abychom byli schopni odhadnout její chybu. Definice 3.3. Řekněme, že obecná jednokroková metoda je regulární, platí-li: (i) funkce <ř je definovaná a spojitá v oboru oíitíii)-K><j< 00, 0 S h ž h0 [ho je kladná konstanta); (ii) existuje konstanta L taková, že platí (3.28) Mx,y,h)-<S>(x,z,h)\<:L\y-z\ pro každé a; G (a, b), h G (0, ho) a pro libovolné y a p. 39 i. obyčejné diferenciální rovnice - úlohy s počátečními podmínkami Definice 3.4. . Řekněme, že obecná jednokroková metoda daná funkcí $ je komisientní s danou diferenciální rovnicí (1.6), je-li regulární aplatí-li (3.29) *(*,»,<>) = /(*,») pro a í x 5 b a —oo < y < oo. Věta 3.1. Nechť jsou splněny předpoklady (i) a (ii) z odst. 1 a nechť y je přesné řešení diferenciální rovnice (1.6) s počáteční'podmínkou (1.7). Buď dále yn přibližné řešení vypočtené obecnou jednokrokovou metodou (3.1), která je konzistentní s danou diferenciální rovnicí. Pak platí (3.30) \yn - y(xn)\ g [u(h) + <p(h)]EL(xn - a) pro n = 0,... | N a pro A íj A0, kde N je celá část podílu (b — o)jh, tv je modul spojitosti první derivace přesného řešení (tj. funkce w je dána vzorcem (2.5)), funkce ip je definována rovnicí (3.31) <p(h) = sup |*(ar,j/(z),A) -&(x,y(x),Q)\ iE(«,l| a Er, je funkce definovaná v (1.20). Důkaz. Podle definice lokální chyby obecné jednokroková metody je jl(x„+i) = y(x„) + h$(xn,y(xn),h) + L(y(xn); h). Odečteme-li tuto rovnici od rovnice (3.1), dostaneme pro celkovou diskretizační chybu e„ = yn — y(xn) rovnici (3.32) en+i = e„+ [®(x„,y„,h) - $(xn,y(xn),h)] - L(y(xn);h) a odtud (3.33) \en+i\^(l + hL)\en\+\L{y(xny,h)\, n = 0,. ,JV-1. Tato nerovnost je úplně stejná jako nerovnost (2.9) v důkazu konvergenční věty pro Eulerovu metodu. K získání nerovnosti (3.30) je tedy stejně jako tam třeba odhadnout vhodně lokální diskretizační chybu. Podle věty o střední hodnotě existuje číslo 9n, 0 < 9„ < 1, takové, že platí (3.34) y{xn+i) = y(xn) + hy>{xn + 9nh), n = d...,N-l. Píšeme-li ještě (3.35) h<5>(x„,y(xn),h) = h$(xn, y{xn), 0)+ + A[*(x„, y{xn), h) - *(ar„, !/(»„),0)]. a užijeme-li podmínku konzistence, dostáváme (3.36) L(y(xn);h) = A[i/{xn + 9nh) - f(xn,y{x„))]- - h[<t>(xn,y(xn),h) - <&(xn,y(xn),0)]. 40 3 obecná jednokroková metoda První sčítanec na pravé straně poslední rovnice lze odhadnout výrazem Aw(ft), neboť je f{xn, y(xn)} = jŕ'(a:„) a druhý výrazem hip(h), jak plyne ihned z definice funkce <p. Odtud už úplně stejným postupem jako v důkazu věty 2.1 plyne platnost nerovnosti (3.30). Veta je dokázána. Z věty 3.1 plyne ihned konvergence obecné jednokroková metody, tj. platnost vztahu (3.37) lim y„ = y{x), h-*0 neboť jak funkce u, tak funkce <p konvergují pro h —> 0 k nule. O funkci w to už víme, o funkci ip to plyne ze stejnoměrné spojitosti funkce ®(x, y(x), h) na množině aíiŽi,0SAS/io. Z nerovnosti (3.30) můžeme dostat odhad chyby analogicky jako u Eulerovy metody. Zesílením požadavků na danou metodu můžeme rovněž tak sestrojit odhad analogický odhadu z věty 2.2. Věta 3.2. Buď dána množina diferenciálních rovnic EDt C ÍEKd, buď y přesné řešení diferenciální rovnice z 9Jt a buďyn jeho aproximace získaná obecnou jednokrokovou metodou, která je regulární a je řádu p 2; 1 na SDT. Pak existuje konstanta M taková, že platí (3.38) \y„ - y(xn)\ í Mh»EL{xn - a) pro n = 0,..., N a pro h ^ ho- Důkaz je v podstatě opakováním důkazu věty 3.1. Jediný rozdíl je v tom, že za předpokladů uvedených ve znění věty platí pro lokální chybu vyšetřované metody odhad (3.39) \L(y(xn);h)\ á M/ŕ+1. Užitím tohoto odhadu v nerovnosti (3.33) dostaneme ihned požadovaný výsledek. Na první pohled by se mohlo zdát, že požadavek konzistence se ve větě 3.2 oproti větě 3.1 ztratil. Ve skutečnosti tomu tak není, neboť z toho, že daná metoda je řádu aspoň jedna na vhodné množině, plyne, že je pro tuto množinu diferenciálních rovnic i konzistentní. Skutečně, z nerovnosti \L(y(x); A)| !? Mh2 plyne nerovnost (3.40) \y{x + hl-v{x)-*(x,y(x},h)\íMh. Protože pravá strana této nerovnosti konverguje pro h —► 0 k nule, platí totéž i pro levou stranu. První sčítanec na levé straně má však pro A —> 0 limitu, a to rovnou číslu f/(x) = f{x, y(x)), tutéž limitu má tedy i druhý sčítanec. Zcela analogicky jako větu 3.2 lze dokázat i následující větu, která tvoří paralelu k větě 2.3. 41 i. obyčejné diferenciální rovnice - úlohy s počátečními podmínkami Věta 3.3. Nechť jsou splněny předpoklady vity 3.2 a nechť yn je posloupnost čísel definovaná rekurencí (3.41) y0 = r,, Vn+i - yn + h[$(xn,yn,h) + hq9nK], n = 0, ,JV, ,N kde K je konštanta a $n jsou čísla, pio než platí \&n\ S 1, Pak pro n = 0, a pro h g ho platí (3.42) \yn-y(xn)\^MxhrEL(^-a), kde t = minQ>, q)aM1 = Mhp0~r + Khl~r. Větu 3.2 můžeme interpretovat podobně jako analogickou větu v případě Eule-rovy metody dvojím způsobem. Pokud o konstantě ve vzorci (3.38) víme pouze, že existuje, ale neznáme její konkrétní hodnotu, je věta 3.2 jen výrokem o rychlosti konvergence dané metody. Pokud tuto konstantu známe nebo jsme schopni ji odhadnout, představuje vzorec (3.38) odhad chyby. Všimněme si proto problému odhadu konstanty M v nerovnosti (3.39) podrobněji. Buď dána diferenciální rovnice (16) s počáteční podmínkou (1.7) a buď y její přesné řešení. Nechť dále funkce $ definuje obecnou jednokrokovou metodu, která je pro toto řešení řádu p. Konečně předpokládejme, že funkce /, resp. $ má p spojitých parciálních derivací podle obou, resp. všech tří proměnných v množině R, resp. R x (0, ho), kde (3.43) R={(x,y); a^x^b, -YíyZY} a Y je definováno vztahem (1.19). Protože platí (3.6), plyne z Taylorova vzorce a z předpokladu, že daná metoda je řádu p ^ [A(z, y(x), h) - <ř(z, y(x),h)]\h=o = 0 (3.44) pro k — 0,.. (3.45) A(x,y(x),h) - $(x,y(x),h) - U"^-[A(x,y(x),h)- 1 a p< dhf 1 -Q(x,y(x),h)]\ = 0, kde hi je vhodné číslo, pro něž platí 0 < hi < h. Vypočtěme tedy p-tou derivaci podle h rozdílu A — <ř. Pokud není dán konkrétní tvar funkce <ř, nelze s výrazem dp&(x,y(x),h)/dh1' nic dalšího dělat. Pro výraz dpA(x,y{x),h)/dhp však platí 42 3 obecná jednokroková metoda podle Leipnitzova pravidla pro derivování součinu d" y(x + h) - y(x) (3.46) —A(x,y(x),h) f)(-ir'Qo>-")! 1 d" /1P—+1 dh ~[y(x + h) -y(x)] ■. t u—n Z Taylorova vzorce užitého na funkci y a na interval {x + h, x + h + (—h)) nyní plyne, že existuje /ij, 0 < hz < h tak, že výraz v hranaté závorce na pravé straně rovnosti (3.46) je roven výrazu y(P+1)(a; 4- h2)(-hy+1/(p + 1)!. Celkem tedy dostáváme (3.47) A(x,y(x),h)-4>(x,y(x),h) = Přesné řešení dané diferenciální rovnice, které se vyskytuje v tomto vzorci, sice neznáme, víme však, že dvojice (x, y(x)) leží pro každé x (E (a, í>) v množině R dané rovnici (3.43). Za výše uvedených předpokladů lze tedy položit (3.48) M : 1 \{p+ 1)! D<A<Ao kde z je řešení diferenciální rovnice z' = /(í, z) s počáteční podmínkou z(x) = y. Aplikujme nyní uvedenou teorii velmi stručně na speciální jednokrokové metody zavedené v předešlém odstavci. Všimněme si z tohoto hlediska nejprve Rungovy-Kuttovy metody (3.12), (3.13). Příslušná funkce $ je zřejmě spojitá, je-li pravá strana / dané diferenciální rovnice spojitá. Splňuje-li pravá strana dané diferenciální rovnice Lipschitzovu podmínku vzhledem k proměnné y — příslušnou konstantu označíme nyní Lq — platí (položíme-li k* = k(x, y*, ft)) \k\ — &i| ľ£ La\y* — |*5 - k2\ % L0\y* + hkll{1ť) - y - hfci|(2ť)| g L0[\y' - y\ + h\k{ - k1\/(2\t\)} g g i0 (1 + hLa/{2\t\))\y* - y\. Celkem tedy je (3.49) -#(!,», fc)| š [|l-i|^ + |ŕ|(i + ^j)io]|y*-y| a pro konstantu L v nerovnosti (3.28) platí odhad (3.50) L g \i-t\La + \t\(l + ^)Lo. Jsou-li tedy splněny předpoklady (i) a (ii) z či, 1, je uvažovaná Rungova-Kuttova metoda regulární. Je zřejmé, že totéž je pravda i pro libovolnou jinou Rungovu-Kuttovu metodu, jen odhad (3.50) je třeba nahradit jiným odhadem, který se od- 43 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI vodí stejně snadno. Uveďme jeho konkrétní tvar ještě pro standardní Rungovu-Kuttovu metodu: ,h0L 1 ho (3.51) ií (i+^+^I + MíÍ)x0Ž Všimněme si dále u metody (3.12), (3.13) problému odhadu konstanty M v nerovnosti (3.39). Uvažovaná metoda je řádu 2, neboť tak bylo odvozena, takže chceme-li k odhadu této konstanty užít rovnici (3.48), musíme vypočítat (a odhadnout) derivace d2$/dh2 a /". Pišme k tomu cíli funkci <ř ve tvaru (3-52) *(*> V, h) - (1 - t)f(x, y) + tf(x, y), kde jsme položili (3.53) Odtud však již snadno vypočteme, že platí C3'54) ^ = ^{f"i£'y) + 2M*.^f(*,y) + M*,m(',v)\> Určíme-li nyní konstanty Ma a K tak, aby platilo M0 í! 1 a Qi+lf K (3.55) \f(x,y)\^M0, v R, lze výraz (3.54) odhadnout takto: (3.56) I ft)| < ^ Protože je (3.57) I dx'dyk I - M^'1' i + k<2 dh2 l*ľ f"(*,y) = f**(x,y) + f*y(x,y)f(x,y) +/!,!,(x,2/)/2(3:,y)4-+ /»(*.»)[/.(*.»)+ /,(*.»)/(*,»)], dostáváme snadno nerovnost (3-58) |/"(z1y)|g4/rMo + 2A'2Mo. Pro konstantu M máme tedy odhad Podobným způsobem, jen podstatně komplikovanějším a pracnějším, odvodil L. Bieberbach pro standardní Rungovu-Kuttovu metodu dnes už klasický odhad (3.60) Mg6M0A-(l + A- + A-2-|-Ä-3-fA-4). Je přitom samozřejmě třeba předpokládat, že druhý odhad (3.55) platí pro i+k g 4, neboť uvažovaná metoda je 4. řádu. 44 3 OBECNÁ JEDNOKROKOVÁ METODA Obraťme se k metodě Taylorova rozvoje řádu p. Odhad konstanty M podle vzorce (3.48) je triviální, neboť v tomto případě je zřejmě dp®/dhr = 0. Vyšetření regularity je zde však o něco komplikovanější než u Rungových-Kuttových metod a abychom ji zaručili, je třeba klást na pravou stranu dané diferenciální rovnice podstatně silnější požadavky. Silnější předpoklady o funkci / jsou ostatně nutné už z toho důvodu, aby uvažovaná metoda měla vůbec smysl. Předpokládáme-li např., že funkce / má spojité derivace dostatečně vysokého řádu v pásu a ž x S b, -co < y < oo, položíme-li d (3.61) sup Up/W (*>!<) -oc<y<co t = 0,1,. a předpokládáme-li dále, že tato čísla jsou konečná, je metoda Taylorova rozvoje řádu p regulární a pro příslušnou konstantu L platí odhad (3.62) L<L0 + ^-L1 + ...+ jak plyne z věty o střední hodnotě. Zakončeme tento odstavec příkladem ilustrujícím dosažené výsledky. Příklad 3.1. Řešme standardní Rungovou-Kuttovou metodou v intervalu (0, 5) diferenciální rovnici y1 — y s počáteční podmínkou y(0) — 1. Výsledky výpočtu pro h = 1/8 spolu s odhadem chyby získaným z věty 3.2 za použit! odhadů (3.51) a (3.60) jsou uvedeny v tab. 3.1. Opět vidíme tentýž jev, na který jsme upozornili už u Eulerovy metody, totiž, že apriorní odhad je nesmírně pesimistický, a tedy prakticky nepoužitelný. Tabulka 3.1 Řešení diferenciální rovnice y* = y Rungovou-Kuttovou metodou 1 2 3 4 5 Vn 2,718277 7,389029 20,08543 54,59775 148,4118 Cn -0,000005 -0,000027 -0,00011 -0,00040 -0,0014 odhad 0,05 0,40 2,95 21,8 161,33 3.3. Asymptotický vzorec pro chybu V tomto odstavci vyšetříme asymptotické chování chyby obecné jednokrokové metody. Nechť tedy funkce <& definuje obecnou jednokrokovou metodu řádu p ž 1. Už u Eulerovy metody jsme viděli, že k získání asymptotického vzorce pro chybu bylo třeba klást na regularitu dané diferenciální rovnice přísnější požadavky, než když jsme chtěli získat pouze údaje o maximální rychlosti konvergence. Budeme 45 i. obyčejné diferenciální rovnice - úlohy s počátečními podmínkami tedy i zde klást silnější hladkostní požadavky, než které nám umožnily odhadnout konstantu ve větě 3.2 pomocí rovnice (3.48). Konkrétně budeme předpokládat, že funkce $ a / mají p -+ 1 spojitých derivací podle všech svých proměnných v oboru R x (0, fto)> resp. R, kde množina Ä je definována rovnicí (3.43). Na základě úplně stejných úvah, které nás vedly v předešlém odstavci k odhadu konstanty M, můžeme tvrdit, že za výše uvedených předpokladů existuje funkce tp a konstanta K taková, že platí (3.63) A(x, y, h) - ${x, y, k) = <p{x, i/)W + 6Kh?+l, kde číslo 9 závisí na x, y a h, vždy však pro ně platí \9\ S 1. Funkce tp je přitom dána vzorcem (3.64) (p+l)\- - ■- p\ Výraz tp(x, j/(i))ftI>+1 je hlavni čási lokální diskretizační chyby, neboť se jí podle (3.6) a (3.63) až na veličiny řádu hp+2 rovná, Pro Eulerovu metodu — abychom uvedli triviální příklad — je 9(x,y,h) = = f{*,y) ap = 1; tedy tp(x,y) = f'(x,y)/2 = (/*-r/j,/)/2. Pro klasickou Rungovu-Kuttovu metodu lze, ovšem už zdaleka ne tak triviálně, vypočítat, že je (3.65) <p{x, y) = - jig/W + ^/V/W - Og(/= - /„, - /„/)/"- ~~ lMi^fvyfy ~ť ^fyyfyf ~ 2/' + fyyfx)/' Pro chybu e„ = yn — y{x„) platí rovnice (3.32). Použijeme-li vztah (3,6), lze tuto rovnici psát ve tvaru (3-66) e„+1 = e„ + h[$(x„,yn,h) - $(xn,y(x„),h)+ + é(xn,y(x„),h) - A(xn,y(xn),h)}. Za námi učiněných předpokladů jsou splněny předpoklady věty 3.2, existuje tedy konstanta K\ (nezávislá na h) taková že pro n — 0,..., JV platí (3.67) |e„| £ Kih". Užijme této skutečnosti k získání odhadu rozdílu ^(xniyn,h) — ^(xnjyfxn)^), který bude přesnější než ten, který se dostane tak, že se užije pouze lipscbitzovskosti funkce <5. Předně podle Taylorova vzorce je (3.68) <b(xn,yn,h) — $(x„,y{x„),h) = = ®(xn,y(xn) + en,h) - $(x„,y(x„),h) = - &y(xn,y(xn),h)en + ^$3y(x„, y*, h)el = = [*y(^n,!/(^n),0) +$yh(xn,y(xn),h,)h]en + \<Í!yy{xn, y*, A)e2, 46 r 3 obecná jednokroková metoda kde y* leží mezi body y(xn), yn a pro h* platí 0 < h" < h, neboť p k 1 a funkce $ má p + 1 spojitých derivací podle všech proměnných, tedy alespoň dvě. Protože uvažovaná metoda splňuje podmínku konzistence, jak plyne opět z toho, že je p í! 1, máme (3.69) $!/{zn,y(xn),0) - fy(x„,y(xn)). Vezmeme-li v úvahu, že druhé derivace funkce * jsou v R x (0,ho) ohraničené, dostáváme z (3.67), (3.68) a (3.69), že existuje konstanta Ki (která ovšem závisí mimo jiné na konstantě Ki, nezávisí však na A) taková, že platí (3.70) |*(*„, ita, h) - $(xn>y(x„), h) - fy(xn, y(xn))en \ % k3h"+\ a tedy existuje 9' takové, že \9'\ í 1 a že (3.71) 4(*niíte, *>)-$(*„, »(*„), A) = fy{xnty(xn))en + e'K2h"+1. Dosadíme-li do rovnice (3.66) podle (3.63) a (3.71), máme (3.72) en+1 = en + h[fy(*„,y(xn))en + &K2h*+l - <p(xn,y(xrí))h>' + 9Khp+1]. Položíme-li in = A_pe„, dostáváme pro tuto veličinu rekurenci (3.73) ě„+i = ě„ + h[fy(xn,y(xn))ěn - tp(xn,y(xn))] + 9"K3h\ kde \9"\ S 1 a K3 = K + ÁY Protože je zřejmě ě"o = 0, představuje rovnici (3.73) Eulerovou metodou pro řešení diferenciální rovnice (3.74) e' = fy(x,y(x))e~ f(x,y(x)) s počáteční podmínkou e(a) = 0, kde se v každém kroku dopouštíme navíc chyby velikosti h2. Podle věty 2.3, jejíž předpoklady jsou v důsledku předpokladů o hladkosti funkcí $ a / zřejmě splněny, dostáváme tedy výsledek, který zformulujeme v následující větě. Věta 3.4. Nechť jsou splněny předpoklady (i) a (ii) z čí. 1 a buďyn přibližné řešení vypočtené obecnou jednokrokovou metodou řádu p ž 1 a buď y příslušné přesné řešení. Nechť dále funkce $ a / mají v Jí x (0, hg), resp. v R p + 1 spojitých parciálních derivací podle všech proměnných. Pak platí (3.75) yn-y(xtl) = e(xn)h" + 0(h"+í)! kde e je řešením diferenciální rovnice (3.74) s počáteční podmínkou e(a) = 0. O vzorci (3.75) platí úplně totéž, co bylo řešeno o analogickém vzorci pro Eulerovu metodu. Funkce e dává ve většině případů velice dobrou představu o chování skutečné chyby, získat ji však explicite je, jak je na první pohled vidět, velice obtížné. Tu skutečnost však, že tato funkce existuje, i když neznáme její konkrétní tvar, 47 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI 3 OBECNÁ JEDNOKROKOVÁ METODA lze zužitkovat úplně analogicky, jako jsme to učinili u Eulerovy metody. Použijeme-li symbol y(x, h) opět k označení přibližného řešení v bodě x získaného obecnou jednokiokovou metodou s krokem h, platí op (3.76) y(x, k) - y(x) = yT^W, h) - y(x, A/2)] + 0(fcp+1), jak se snadno zjistí úplně stejným postupem jako v čl. 2. Aposteriorní odhad (3.76) získaný metodou polovičního kroku, je ve většině praktických případů velmi účinný a bývá také v podstatě podkladem mnoha algoritmů pro řešení úloh s počátečními podmínkami s automatickou volbou integračního kroku. Uveďme závěrem opět jednoduchý příklad. Příklad 3.2. Vypočtěme pro diferenciální rovnici yf = y s počáteční podmínkou j/(0) = 1 z příkladu 3.1 a pro standardní Rungovu-Kuttovu metodu asymptotický odhad chyby a odhad metodou polovičního kroku. Snadno se zjistí, že zde je tp(x,y) = J//120, takže e(a:) = —are^/^O. Z tabulky 3.2 vidíme podobně jako u Eulerovy metody opět velmi dobrou shodu se skutečností: Tabulka 3.2 Asymptoticky odhad chyby 1 2 3 4 5 -0,000005 -0,000027 -0,00011 -0,00040 -0,0014 -0,000006 -0,000030 -0,00012 -0,00044 -0,0015 odhad met. po), kroku -0,000005 -0,000027 -0,00011 -0,00039 -0,0013 3.4. Problematika zaokrouhlovacích chyb V tomto odstavci ukážeme, že obecná jednokroková metoda se co do závislosti na zaokrouhlovacích chybách chová úplně stejně jako Eulerova metoda. Postup je v principu úplně stejný jako u Eulerovy metody, a proto budeme postupovat s maximální stručností. Zavedeme-Ii i zde lokální zaokrouhlovací chybu tn rovnicí (3.77) yn+í = ji„ + h<S>{xn,y„,h) + £„, dostáváme ihned následující větu. Veta 3.5. Buď dána regulární obecná jednokroková metoda. Nechť dále platí, že je \e„\ á e pro n = 0,..., N. Pak pro celkovou zaokrouhlovací chybu y — yn platí odhad (3.78) \y-yn\ á ^EL{xn-a), n = Q,...,N. Argumentace, že předpoklad o omezenosti lokální zaokrouhlovací chyby je i v případě jednokroková metody z praktického hlediska rozumný, je zřejmě i zde stejná jako u Eulerovy metody. Na základě předešlého tedy vidíme, že užití obecné jedno-krokové metody řádu p s p > 1 má oproti Euleiově metodě z praktického hlediska dvojí efekt: Výpočet je ve většině případů ekonomičtější, neboť vzhledem k tomu, že pro malá h je hf podstatně menší než h, většinou stačí k dosažení požadované přesnosti brát u obecné jednokroková metody s p > 1 podstatně větší hodnotu h než u Eulerovy metody, a provádět tedy méně kroků. Provádí-li se však méně kroků, je výpočet méně ovlivněn zaokrouhlováním. To má většinou za následek, že při užití metody s p > 1 se zmenší kritická chyba, o níž jsme mluvili v souvislosti s Eulerovou metodou, aniž je nutno použít vícenásobnou aritmetiku. Ilustrujme to na jednoduchém příkladě, Příklad 3.3. Řešme diferenciální rovnici y1 = y a s počáteční podmínkou 8/(0) — 1 standardní Rungovou-Kuttovou metodou s integračním krokem h = 2~", s = 1,2.....10. Obr. 3.1 Závislost celkové chyby na mtegračxtím kroku w'- 1 3 5 7 9 ^ í09j/! Na obr. 3.1 je znázorněn průběh celkové chyby v závislosti na velikosti integračního kroku. K výpočtu byla použita 40ti bitová aritmetika. Porovnáním s obr. 2.2, 48 49 i. obyčejné diferenciální rovnice - úlohy s počátečními podmínkami který znázorňuje tutéž závislost získanou v téže aritmetice pro Eulerovu metodu, vidíme, že kritická chyba skutečně velmi podstatně poklesla. 4 Mnohokrokové metody V předchozím článku jsme viděli, že výpočet přibližného řešení dané diferenciální rovnice jednokrokovou metodou probíhá tak, že po provedení jednoho kroku se vlastně řeší nový problém s počáteční podmínkou zadanou v tom bodě, do něhož jsme s řešením v předešlém kroku dospěli. To má své výhody: metoda je teoreticky jednoduchá, jednoduše se programuje, změna velikosti integračního kroku je natolik jednoduchá, že jsme o této otázce vlastně dosud nepotřebovali ani explicite mluvit, apod. Na druhé straně však mají tyto metody některé podstatné nevýhody. 5 jednou z nich spočívající v tom, že odhad lokální diskretizační chyby je (alespoň v případě metody Rungova-Kuttova typu) značně složitý, jsme se už setkali, také to, že v tom okamžiku, kdy vypočítáme přibližné řešení v jednom bodě, zapomeneme všechny informace o řešení v předchozích bodech, se zdá neprozíravé. Naopak intuitivně se zdá zřejmé, že užijeme-li k získání přibližného řešení v bodě x = xn+1 nejen to, že známe přibližné řešení v bodě x — xn, ale i to, že je známe také např. v bodech x = x„-i a x = zn-2, dostaneme nutně přesnější výsledek. Praxe ukazuje, že je tomu skutečně tak a že metody, které ke konstrukci přibližného řešení užívají nejen informace z bezprostředně předchozího bodu, ale i informace z několika předchozích bodů, a které jsou tedy v tomto smyslu mnohokrokové, jsou většinou — hlavně v případech, kdy se vyžaduje vysoká přesnost — efektivnější než metody jednokrokové. Cena, která se za to zaplatí, spočívá, jak uvidíme, ve větší složitosti z programovacího hlediska (je třeba speciální startovní procedury, změna velikosti integračního kroku představuje dosti komplikovaný problém). Pro mnohokrokovou metodu je tedy charakteristické, že k výpočtu přibližného řešení yn+it v bodě x — x„+i. (xs je zde stejně jako u jednokrokové metody tvaru x, = a + sh) použijeme k předchozích hodnot přibližného řešení. Intuitivně se nabízejí hned dvě možnosti, jak generovat metody tohoto typu. V první z nich vycházíme z identity (4.1) y(xr) - y(xu) = f " f(t,y(t)) it, A, kterou splňuje přesné řešení dané diferenciální rovnice (1.6) pro libovolné dva body xT a xu z intervalu (a, 6), v níž nahradíme neznámou funkci za integračním znamením vhodným interpolačním polynomem. Metody, které vzniknou na základě tohoto obecného principu, se souhrnně nazývají metody numerické integrace a jsou v současné době dosti populární. Nejčastěji se zmíněný interpolační polynom sestrojuje tak, aby v bodech xv, v = n, ...,n + k — 1, resp. v = n..., n 4- k nabýval hodnot - f(x„,y„) a za dvojici xu, xr se volí z„+lt_i, xn+k nebo xn+k-i, Xn+k- 50 4 mnohokrokové metody Druhá možnost konstrukce metod, které máme na mysli, vychází přímo z dané diferenciální rovnice. Postupuje se tak, že se sestrojí polynom, který v bodech xr, v = n,... ,n + k nabývá hodnot y„, vypočte se derivace tohoto polynomu ve vhodném bodě a položí se rovna hodnotě pravé strany dané diferenciální rovnice v odpovídajícím bodě. Přirozený název pro metody tohoto typuje metody numerického derivování. Obě zmíněné skupiny speciálních mnohokrokových metody popíšeme podrobně v následujících odstavcích. 4.1 Speciální případy Dříve než začneme popisovat jednotlivé konkrétní metody, uvedeme některé speciální výsledky z teorie interpolace, které nám budou při tomto popisu užitečné. 4.1.1 Interpolace při ekvidistantních argumentech V tomto odstavci se budeme zabývat úlohou sestrojit polynom stupně nejvýše q, který v bodech xf,xp_x,..., xp_q (xp = a + ph) nabývá zadaných hodnot Zp, zp-i> ■ ■ ■, zp-t- Řešení tohoto problému je čtenáři jistě dobře známo: Hledaný polynom existuje, je jediný a je možné jej napsat ve tvaru Lagrangeova interpo-lačního polynomu. Zde odvodíme jednodušší vzorec, který zužitkovává to, že uzly interpolace jsou ekvidistantní. V této situaci se k zápisu interpolačních polynomů užívá většinou různých typů diferencí. V literatuře byla popsána řada nejrůzněj-ších diferencí a interpolačních vzorců založených na nich. Pro naše účely je vhodné pracovat s pojmem diference zpět. První diferenci zpět budeme značit symbolem V a definovat rovností (4-2) Vzp = zp-zp_ť, m-tou diferenci zpět pak označíme symbolem Vm a definujeme rekurentně rovností (4-3) Vmzp = V(Vm-1zp), m = 2,3,..., kde klademe V1 = V. Z důvodu zjednodušení dalších zápisů položíme ještě V°zp — — zp. Úplnou indukcí snadno zjistíme, že platí (4.4) V%=£(-ir(*V_m, , = 0,1,..., m=0 ^ ' kde je <4-5) (o)-1' fg) = '('"!)" (rmi+I), m = l,2,., \0J \mj m(m -1)... 1 11 a naopak, že pro každé q = 0,1,... platí (4.6) *-,= £(-!)"(*) V",,; m=0 ^ ' I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY s POČÁTEČNÍMI PODMÍNKAMI j-tou diferenci zpět lze tedy vyjádřit jako lineární kombinaci hodnot zp, Zy-i, . ., zp_, a naopak hodnotu zP_5 jako lineární kombinaci nulté, pTvní atd. až 9-té diference zpět. Pomocí pojmu diference zpět už snadno zapíšeme hledaný polynom. Věta 4.1. Položme (4.7) kde (4.8) w=£(-ir(;)v-*, h ' Pak P je polynom stupně nejvýše q v x a pjati (4.9) P(*p-t) - zp-r, r = 0.....q. Důkaz Předně výraz (^*) = C*'^'*) je podle vzorců (4.5) zřejmě polynom stupně m v x, a tedy P je polynom stupně nejvýše q. Protože je (^) = 0 pro celé kladné r a m > r (viz vzorec (4.5), který platí pro libovolné reálné 5), platí (4.10) £(-ir Qv-% = E(-i)m(r)v"V Poslední součet v rovnici (4.10) je však podle (4.6) roven číslu zj,_r. Věta je dokázána. Věta 4.2. Buď I interval obsahující body xf,xp-\,...,xv-q a buď z funkce definovaná na /, která má v I q + 1 derivací a buď P polynom (4.7) s zf-r ~ = z(rp_r), r = Ó,... 1 4. Pat ke každému 1 £ I existuje bod { E / takový, že platí (4.11) z(x) - P(x) = (-l)»+1ft'+1 (a7l)*C,+1)(ť)- Důkaz Je-li x = «p_r pro některé r, je rovnice (4.11) splněna a to dokonce pro libovolné f. Můžeme tedy předpokládat, že je a; ^ sBp_r pro r = 0,..., q. Definujme v tomto případě funkci ip proměnné t £ í předpisem p(i) = z{t) - P(t) - li^-L^íí(i), (4.12) kde (4.13) fi(ť) = (í - xp)(t-xp-i). ,(ť-xp_,). Funkce (p má v intervalu I zřejmě q + 1 derivací a platí tp{xp-r) — 0 pro r = = 0.....ja tp(x) = 0. V intervalu I tedy existuje q + 2 navzájem různých bodů, 52 4 MNOHOKROKOVÉ METODY ve kterých je hladká funkce tp rovna nule. Opakovaným užitím Rblleovy věty ihned plyne existence takového £ 6 J, že platí (4.14) *>C'+1)(0 = 0. Je však p(?+1)(ť) = 0, neboť stupeň polynomu P je nejvýše q; dále je Íl(9+I)(t) = — (q + 1)!. Dosazením do rovnice (4.14) dostáváme 1 (4.15) *(») - P(X) : Tn(.)»(«+1>(fl. Použijeme-li nyní ve vzorci (4.13) rovnosti x — xp-r = x — xp + rh — sh + rh = = (—h)(—s — r), dostaneme z (4.15) ihned vzorec (4.11). Věta je dokázána. 4.1.2 Adamsova-Bashforthova metoda Tato metoda je speciálním případem metody numerické integrace. Klademe v ní xr — xn+t, xu — Xn-i-k-i (i ž 1) > interpolační polynom P prokládáme body {xtr,fu), ľ = n + k — 1,..., n. Položíme-li tedy v odst. 4.1.1 p — n + k — ls.q = = k — 1, je polynom P tvaru h-i (4.16) m=0 kde s = (x — xn+k-i)/h. Odtud integrací v mezích od xn+i~i do xn+j, už snadno odvodíme, že Adamsova-Bashforthova metoda je dána vzorcem (4.17) í/„+i - y„+*-i ~h^2 7mVm/„+t_ll m=0 kde í4-is) ^4ii(-ir(-)di=(-i)mrts)ds /•(■)= E í-irf^v"/,.^. f m—n ■ \ / nebo vzorcem (4.19) kde (4.20) chceme-li, aby na pravé straně vzorce vystupovaly přímo hodnoty funkce /. Vzorec (4.19) se snadno dostane za vzorce (4.17) užitím rovnice (4.4). Všimněme si, že koeficienty ve vyjádření (4.17) na rozdíl od vyjádření (4.19) nezávisí na k. To je také výhoda tvaru (4.17), který byl populární zejména v předpočítačové éře. 53 [. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OLOHY S POČÁTEČNÍMI PODMÍNKAMI Při výpočtu přibližného řešení se vzorec (4.17) nebo (4.19) užívá postupně pro n = 0,1,____Na začátku výpočtu musíme mít tedy k dispozici nejen hodnotu yo, která je dána počáteční podmínkou, jako tomu bylo u obecné jednokrokové metody, ale ještě hodnoty j/i,..., yt-i, které musíme získat nějakým jiným způsobem (např. jednokrokovou metodou). Tento jev je pro mnohokrokové metody typický. Počítat koeficienty Adamsova-Bashforthova vzorce podle (4.18) je nepohodlné. Odvoďme proto jiný způsob jejich výpočtu, který nevyžaduje počítání žádných integrálů. Definujme k tomu cíli funkci G komplexní proměnné t předpisem (4.21) G(ť)= /'(l-ij-'ds. JO Protože zřejmě platí (4.22) G(í) = -; í (l-í)ln(l-ť)' je funkce G holomorfní v kruhu |ť| < 1. Podle binomické věty však platí (4.23) a tato řada konverguje absolutně a stejnoměrně uvnitř jednotkového kruhu. Lze ji tedy integrovat člen po členu, čímž dostaneme (4.24) c?(*) = E(-1)m / L)d*r = E- Dosadíme-li tento výsledek do (4.22), dostaneme identitu (4.25) nebo (4.26) ln(l - t) m=0 1 LAJ ~ ľ = 0 m=Q m=0 platnou pro každé \t\ < 1. Je však (4-27) E ^ E 7mím+" = £ ^ E W" = co / tn - \ neboť upravovaná řada konverguje absolutně a lze tedy libovolně přerovnat pořádek jejích členů. Dosadíme-li do identity (4.26) podle (4.27) a porovnáme-li koeficienty 54 4 MNOHOKROKOVÉ METODY u stejných mocnin proměnné t na levé a pravé straně, dostáváme (4.28) 1 pro 771 = 0,15____ Koeficienty ym můžeme tedy počítat z (4.28) rekurentně. (h) V tab. 4.1 jsou uvedeny tyto koeficienty a v tab. 4.2 koeficienty pi, pro několik prvních hodnot indexů. Tabulka 4.1 Koeficienty T Adamsovy-Bashforthovy metody m 0 1 2 3 4 S 6 Im 1 1 2 5 12 3 8 251 720 95 266 19 087 60 480 Tabulka 4.2 Koeficienty /? Adamsovy-Bashforthovy metody 0 1 2 3 4 5 /#> 1 -1 3 l2/S<3) 5 -16 23 M/4*' -9 37 -59 55 720/Í6' 251 -1274 2 616 -2 774 1901 1440/3Í,8' -425 2 627 -6 798 9482 -7673 4 227 Všimněme si ještě vztahu Adamsovy-Bashforthovy metody k původní diferenciální rovnici. U obecné jednokrokové metody jsme její kvalitu měřili velikostí lokální chyby, tj. velikostí výrazu y(x + h) — y(x) — h$(x,y(x), h) jako funkce h. U Adamsovy-Bashforthovy metody tomuto výrazu odpovídá výraz (4.29) ^» = j(In+i) - S(.n+M) - /, ^ t^V/^+h, j(í„ti-,)) = fc-1 = y(Xn + h) ~ y(xn+k-l) h E 7mVmt/(3;„+ŕ_i), který tak hraje roli lokální chyby. Za předpokladu, že přesné řešení uvažované diferenciální rovnice má k +1 spojitých derivací, platí podle věty 4.2 (p = n + k-1. 55 L OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI i — k — l, z(x) - y>(x)) (4.30) ✓ (*) = E(-1)m(r)V"lj''(K-+i-l) + (-1)*',*(ľ)í'(*+l)(í)' kde s — (x - x„+i,-i)/h. Integrací v mezích od xn+i-i *n+t odtud plyne, že je (4.31) =(-i)*/i*£-+* (~sy*+i)(o<i:c. Protože funkce {"j.") nemění v intervalu (xn+i-i, ^n+ib) znaménko, dává první věta o střední hodnotě integrálního počtu jednoduchý výsledek (4.32) RÍB = (-l)*kV*+1)(*) (7) d* " y^"+1Hl)hk+1 4.1.3 Adamsova-Moultonova metoda Tato metoda je velmi podobná Adamsově-Bashforthově metodě. Jediný rozdíl je ten, že interpolační polynom prokládáme body (xv, /„) pro u — n,... ,n + k, takže jep = n + ibag=:<;. Metoda je tedy dána vzorcem k (4.33) Vn+i -Vn+k-1 =h Y, TmV"7n+*, m=0 kde (4.34) m = 0,1..... nebo vzorcem fc (4.35) y„+ifc - Wn+t-i = '»X^/í*(*)-fn+'" 11=0 kde (4.36) «<*) = (-1)*- £ ífcľj^' * = 0,...,*. m=k-v Podobně jako u Adamsovy-Bashforthovy metody je třeba se na vzorec (4.33) nebo (4.35) dívat tak, že pomocí něj máme vypočítat yn+s za předpokladu, že hodnoty ..., yn jsou už známé. Hodnota jm-j-j, se zde však na rozdíl od Adamsovy-Bashforthovy metody vyskytuje i na pravé straně vzorce (4.33) (nebo (4.35)). Rovnice (4.33) tedy představuje obecně nelineární rovnici pro určení yn+k V tomto smyslu mluvíme o Adamsově-Moultonově metodě jako o metodě implicitní na rozdíl od explicitní Adamsovy-Bashforthovy metody. V daný okamžik tedy vlastně nevíme, je-li Adamsova-Moultonova metoda vzorcem (4.33) vůbec dobře definována, neboť zatím nic nevíme o řešitelnosti zmíněné nelineární rovnice. Později 4 MNOHOKROKOVÉ METODY uvidíme, že pro dostatečně malá h lze tuto rovnici řešit postupnými aproximacemi. Tím sice zatím existující mezeru v definici Adamsovy-Moultonovy metody vyplníme, vyvstane ovšem ihned přirozená otázka, zda má vůbec smysl zavádět implicitní metody, které jsou vzhledem k nutnosti řešení nelineární rovnice z hlediska výpočetní práce patrně méně efektivní než explicitní metody. Později uvidíme, že jiné kladné vlastnosti tuto nevýhodu implicitních metod bohatě vyváží. Koeficienty -y^ lze počítat pomocí integrálů (4.34) nebo, patrně ekonomičtěji, z rekurence m (4.37) 7o* = 1, £—-77:-, -0, m =1,2,..., která se odvodí úplně stejně jako v případě Adamsovy-Bashforthovy metody. Některé konkrétní hodnoty koeficientů 7JJ, a jsou uvedeny v tab. 4.3. a 4.4. Tabulka 4.3 Koeficienty 'Y* Adamsovy-Moultonovy metody m 0 1 2 3 4 5 6 -y* i. l 1 19 3 řm 2 12 21 720 160 Tabulka 4.4 Koeficienty f3* Adamsovy-Moultonovy metody ľ 0 1 2 3 4 5 2K1 1 1 12/3? -1 8 5 24/3« 1 -5 19 9 720,3;* -19 106 -264 646 2S1 1440/9JS 27 -173 482 -798 1427 475 Stejně snadno jako u Adamsovy-Bashforthovy metody se odvodí, že pro lokální chybu RfM Adamsovy-Moultonovy metody platí (samozřejmě za předpokladu dostatečné hladkosti řešení) i (4.38) RÍM a y(xn+l) - »(*„+»_,) - h £ V«V(*»4*) - m=0 56 57 I I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI 4.1.4 Nystromová metoda Jde o explicitní metodu, která vznikne integrací polynomu P, jehož graf prochází body {Xi,,ív) pro v — n-\-k — 1,..., n, v mezích Xn+fc^ d° xn+k- Pro k = 2,3,.. tedy platí (4.39) yn+h - yn+k-2 = K">'^mfn+k-i> m=l kde koeficienty Km jsou dány integrály (4.40) B- = í-í>"/!1(™)d'' ! nebo rekurencemi m 1 (4.41) «o=2, V"—— rem-„ = 1, m = 1,2,..., n " + 1 a jejichž hodnoty jsou pro m = 0, . ,6 uvedeny v tab. 4.5. Tabulka 4.5 Koeficienty k Nystromovy metody m 0 1 2 3 4 5 6 2 0 1 3 1 3 29 90 14 45 1139 3 780 Vzorec (4.39) lze samozřejmě přepsat do tvaru, který obsahuje pouze hodnoty funkce /. Pro příslušné koeficienty se odvodí podobné vzorce jako v případě Adamsovy-Bashforthovy nebo Adamsovy-Moultonovy metody. Naproti tomu pro lokální chybu Nystromovy metody už obecně neplatí jednoduchý vzorec typu (4.32) nebo (4.38). 4.1.5 Zobecněná Milnova-Simpsonova metoda Tato implicitní metoda je pro k = 2, 3,... dána vzorcem (4.42) yn+i - y„+k-2 = h ]T C^/n+i. m=0 Pro koeficienty K*m platí (4.43) c=(-ir/°2 (;;)<!*, 58 4 MNOHOKROKOVÉ METODY nebo m ^ (4.44) «5=2, <=-2, C^E^TTT*™-' m = 2,3,..., v = 0 a jsou pro m = 0,..., 6 uvedeny v tab. 4.6. Tabulka 4.6 Koeficienty k* zobecněné Milnovy-Simpsonovy metody m 0 1 2 3 4 5 6 K* 2 -2 i 3 0 "~9Ô" 1 90 37 3 780 Čtenář si jistě už snadno sám sestaví polynom, jehož integrací tato metoda vznikla. Poznamenejme jen ještě, že ani u Milnovy-Simpsonovy metody nelze odvodit tak jednoduchý vzorec pro lokální chybu, jako u Adamsových metod. 4.1.6 Metody založené na numerickém derivování Základní myšlenka konstrukce těchto metod spočívá, jak už bylo řečeno, v tom, že se sestrojí polynom (4.45) í>(x)= J>ir(-S)v"W, .,= ^|=±», který nabývá v bodech Xn+fci • hodnot j/n+jt, .-,!/«, zvolí se bod xn+],_T (0 5 í r í i) a !a derivaci v diferenciální rovnici (1.6) psané pro bod x — x„+k-r se dosadí derivace tohoto polynomu v tomto bodě. Vzniklá metoda se tedy dá zapsat ve tvaru t (4.46) £ írmVml/„+t = hfn+k_r, m=l kde (4.47) Pro r = 0 jde o metodu implicitní, jinak jsou to metody explicitní. Položíme-li oo (4.48) Dr(l)^Wm 59 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI je (4,9) ^)=ŽHri(;)Lr=^[£ (;>*>- m = l X ' Lm=0 = jL(l_t)-|. = -(l -í)"l«(l "O- CIS lí = -r Odtud snadno plyne, že platí (4.50) Dr+l(t) = {l-t)Dr(t). Dosadíme-li (4.48) do (4.50), porovnáme-li koeficienty u stejných mocnin na levé a pravé straně a položíme-li ještě Sr0 = 0 pro r = 0,1,..., dostáváme rovnici (4.51) ír+l,m trní ' Äiyn-li která platí pro r = 0,1,... a m = 1,2,.... Položíme-li v (4.49) r = 0 a vyjádříme-li funkci na pravé straně ve tvaru mocninné řady, máme (4.52) íom = ^, m =1,2,.... Z rovnic (4.51) a (4.52) však už snadno generujeme koeficienty Srm rekurentně. Prvních několik jejich hodnot je uvedeno v tah. 4.7. Tabulka 4.7 Koeficienty S metody založené na numerickém derivování 1 2 3 4 5 6 0 1 1 2 1 3 1 5 1 6 1 1 1 2 1 6 -A 1 20 1 30 2 1 3 2 1 3 12 1 30 60 3 1 5 2 7 6 17 12 1 20 1 Vzorec (4.46) lze psát také ve tvaru k (4.53) ^a^Vn+v = A/n+*-r, který neobsahuje žádné diference. V tomto případě se určí koeficienty aík) ze vzorce (4.54) = £ " = °.>-fc-jak se snadno zjistí užitím rovnice (4.4). 60 4 MNOHOKROKOVÉ METODY Pro lokální chybu Rf popsané metody, která je definována v tomto případě vzorcem k (4.55) iZf = £ ÄrmVro^„+i_r) hs/(im+*_P), m=l platí (4.56) Ař = ^,*+i*(*+1)('j)A*+1- Tento vzorec se odvodí stejně snadno jako obdobný vzorec pro Adamsovy metody. 4.2 Obecná lineární mnohokroková metoda Všechny metody vyšetřované v předešlém odstavci měly společné, že svazovaly přibližné hodnoty hledaného řešení a jeho derivací lineárně. Je proto přirozené omezit se v dalším na tento druh závislosti a za obecnou lineární k-krokovou metodu považovat metodu danou vzorcem k k (4.57) ^a„ífa+i, = h^Pvfn+*< kde ao.....ctk, @o, jsou reálné konstanty, h je integrační krok a /, je zkrá- cený zápis pro f{xs,ys). Všude v dalším budeme předpokládat, že je ctk ^ 0 a že koeficienty oro a 0q nejsou současně rovny nule. O fc-krokové metodě budeme také všude tam, kde není konkrétní hodnota parametru k podstatná, mluvit jako o mnohokrokové metodě. Na rovnici (4.57) je třeba se dívat tak, že z ní máme určit přibližnou hodnotu yn4-k řešení v bodě x — xn+j. za předpokladu, že přibližné hodnoty 3/n+i-i> ■ • -j3/n jsou známé a tento postup opakovat postupně pro n = 0,1,..., N — k, kde N — — [(b — a)h]. Je tedy především nutno předpokládat, že přibližná řešení yo,..., jft-j jsou dána. Vzorec (4.57) tak vyžaduje narozdíl od jednokrokové metody k počátečních hodnot. Na tuto skutečnost jsme už ostatně upozornili při popisu speciálních mnohokrokových metod. Aby metoda daná rovnicí (4.57) měla vůbec rozumný smysl, je třeba se přesvědčit, že veličina y„+k její (za předpokladu, že veličiny yn,yn+i, ■ ■ -íVn+k-i jsou známé) skutečně jednoznačně určena. To je zřejmé na první pohled v případě, že je 0k = — 0. V tomto případě budeme mluvit o explicitní metodě. V případě, že je /íj, ^ 0, nazveme příslušnou metodu implicitní] u ní je třeba vypočítat yn+k jako řešení obecně nelineární rovnice (4.58) kde (4.59) y = F{y), F(y) = h—f(xn+t,y) + c a* 61 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI 4 MNOHOKROKOVÉ METODY 1 (4.60) 1 / i_1 \ a je to tedy známé číslo. Předpokládáme-li, že jsou splněny předpoklady (i) a (ii) z čl. 1, je funkce F definovaná pro libovolná y a platí pTo ni (4.61) Splňuje-li h podmínku (4.62) \F(y)-F(y-)\^hLlM\y-f h < je zobrazení F kontrakce a podle Banachovy věty o pevném bodu mi rovnice (4.58) právě jedno řešení a toto řešeni lze vypočítat metodou postupných aproximací. Ať už je tedy daná metoda explicitní nebo implicitní, má — alespoň pro malá h — smysl, Pojem lokální chyby a s ním související pojem řádu lineární mnohokrokové metody bude hrát stejně důležitou roli, jako tomu bylo u jednokrokové metody. Uveďme proto přesné definice těchto pojmů. Definice 4.1. Buď dána lineární mnohokroková metoda a buď y libovolná funkce, která je v (a, 6) definovaná, spojitá a spojitě diferencovatelná. Výraz I definovaný rovnicí k k (4.63) L(y(x); h) = £ a„y{x + vh) - h £ /W(* + "h) v—O Ľ=0 nazveme lokální chybou dané mnohokrokové metody. Všimněme si, že v důsledku linearity dané metody není nutné v definici její lokální chyby vůbec mluvit o řešení dané diferenciální rovníce. Definice 4.2. Řekneme, že lineární mnohokroková metoda je řádu p, platí-li Co = Ci = ... = Cp = 0, Cp+i jí 0, kde Cp jsou konstanty, definované rovnicemi (4.64) Co = ao + ... + at, Ci = ai+2<*2+ ...!:«*-(#> + ■-.+A). C, - ^(a1 + 2'a, + ... + k*at)- -7-^(A + 2'-1& + .- + *,_1ft)> ? = 2'3 (q - 1)! Abychom objasnili důvody, které nás vedly k této definici, předpokládejme na okamžik, že funkce y je nekonečně diferencovatelná a že ji lze v okolí každého bodn 62 rozvinout v Tayolorovu radu. Pak platí * 1 (4.65) L(y(x),k) = £ «„ \y{x) + Vhy'{x) + -vWy"(x) + ...] - - \hy'(x) + vh2y"(x) + ~v2h3y"'{x) + ...] = i/ = 0 = Coj/Ot) + Cihý(x) + C2h2y"(x) + ... + Ct Wy^Xx) + .... Rovnice (4.64) tak skutečně vyjadřují intuitivně očekávanou skutečnost, totiž, že pro každou dostatečně hladkou funkci y je (4.66) L{y{x);h)=0(h?+1). Vidíme také, že linearita dané metody, která už zjednodušila definici lokální chyby, umožnila definovat její řád čistě algebraicky, tj. pouze pomocí algebraických vztahů pro její koeficienty. Vezeme-li v úvahu výsledky, k nimž jsme dospěli v případě jednokrokové metody, zdá se rozumné konstruovat lineární mnohokrokové metody tak, aby měly pokud možno vysoký řád. Předtím, než budeme tyto otázky zkoumat teoreticky, uveďme jednoduchý příklad. Příklad 4.1. Řešme diferenciální rovnici y1 = — y s počáteční podmínkou t/(0) = 1 na intervalu (0,1) metodou (4.67) + 4j/n+l - 5y„ = ri(4/„+1 + 2/„), která je řádu 3, jak se snadno vypočte z rovnic (4.64). Výsledky jsou pro h — 1/10 a 1/20 uvedeny v tab. 4.8. Protože užitá metoda je dvoukroková, je třeba kromě hodnoty ya (= 1) dodat ještě hodnotu j/i; za tu jsme zvolili hodnotu přesného řešení v bodě 0,1, resp. 0, 05. Z tabulky je na pTvní pohled vidět, že jsme dostali zcela nesmyslné výsledky. U metody (4.67) lze tedy jen stěží očekávat konvergenci. Uvedený příklad ukazuje, že skutečnost, že lokální chyba je pro malá h malá, nemusí ještě u mnohokrokové metody stačit k tomu, aby byla malá i globální chyba. Abychom uhádli, jaké podmínky kromě malosti lokální chyby je třeba klást na danou metodu, aby byla zaručena konvergence, začneme teoretické zkoumání obecné mnohokrokové metody vyšetřováním nutných podmínek konvergence. 4.2.1 Nutné podmínky konvergence Zatímco u jednokrokové metody záviselo přibližné řešení kromě na počáteční podmínce už jen na integračním kroku, u mnohokrokové metody závisí ještě na dalších počátečních podmínkách. Přibližné řešení získané fc-krokovou metodou tedy závisí na integračním kroku nejen proto, že na něm závisí daná metoda, ale také proto, že 63 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Tabulka 4.8 Numerické řešení diferenciální rovnice y' — —y metodou (4,67) h = 0,1 h = 0,05 X přibližaé řešení chyba přibližné řešení chyba 0,0 1,000000 0 1,000000 0 0,1 0,904837 0 0,904 836 -0,000 001 0,2 0,818715 -0,000015 0,818 711 -0,000 019 0,3 0,740 872 0,000054 0,740315 -0,000 503 0,4 0,669997 -0,000323 0,656 994 -0,013326 0,5 0,608200 0,001669 0,252935 -0, 353 596 0,6 0,539907 -0,008905 -8, 833877 -9, 382 689 0,7 0,543768 0,047183 -248,4746 -248, 9711 0,8 0,198971 -0,250358 -6 606,041 -6606,490 0,9 1,734617 1,328048 -175 303,9 -175 304,3 1,0 -6,677257 -7,045136 -4651 727 -4651728 na něm závisí i další počáteční podmínky. Veškeré úvahy o konvergenci r-krokové metody musí proto brát zřetel na tuto závislost. Studium konvergence proto začneme přesnou definicí tohoto pojmu. Definice 4.3. platí-li (4.68) Řekneme, že lineární jfc-kroková metoda (4.57) je konvergentní, lim y„ pro každé x £ {a, b), kde y je řešení libovolné diferenciální rovnice (1.6) s počáteční podmínkou (1.7), jejíž pravá strana splňuje požadavky (i) a (ii) z čl. 1 a yn je libovolné přibližné řešení této rovnice vypočtené metodou (4.57), určené integračním krokem h a počátečními podmínkami y, = y,(h), s = 0,..., k — 1, pro něž platí (4.69) lim y,(h) = ij, s — 0,..., k — 1. h—*0 Abychom mohli formulovat první důležité tvrzení týkající se konvergence obecné lineární fc-krokové metody, je třeba zavést ještě další pojem. Definice 4.4. Řekneme, že metoda (4.57) je stabilní ve smyslu Dahlquista1^ nebo stručně D-stabiiní, platí-li pro všechny kořeny f„ polynomu g definovaného ^ Podle švédského matematika G. Dahlquista, který je tvůrcem celé teorie, která bude následovat. 64 4 MNOHOKROKOVÉ METODY (4.70) |í„| á 1 a jsou-li ty z nich, pro něž je — 1, jednoduché. Poznámka 4.1. Polynom o se nazývá první charakteristický polynom dané metody. Zavedeme-li ještě tzv. druhý charakteristický polynom a rovnicí k (4-71) <r(0 = E/U", je zřejmé, že zadat metodu (4.57) je ekvivalentní se zadáním polynomů g a cr. Věta 4.3. Konvergentní metoda (4.57) je D-stabiiní Důkaz. Daná metoda je konvergentní pro každou diferenciální rovnici, jejíž pravá strana splňuje podmínky (i) a (ii), tedy speciálně je konvergentní pro diferenciální rovnici y/ = 0 s počáteční podmínkou y(a) - 0. Je-li tedy yn libovolné řešení rovnice (4-72) pro něž platí (4.73) musí platit (4.74) Ea^"+" - °> limt/s=0, s = 0, . ,k— 1, n-. 0 lim yn = 0, h — fí neboť přesné řešení uvažované diferenciální rovnice je funkce identicky rovná nule. Protože je xn = a + nh - x, můžeme rovnici (4.74) psát ve tvaru (4.75) Jim yn = 0. Buoľ nyní ^ ~ reltpv kořen polynomu g a předpokládejme, že je r > 1. Posloupnost {r"e'"lf"; n = 0,1...} řeší zřejmě rovnici (4.72) a protože tato rovnice nezávisí explicitně na h, řeší ji rovněž posloupnost {hrnemlp"}, a tedy také reálné posloupnosti {hrn cos(tiíp„)} a {hr" sm(nipu)}, neboť koeficienty dané mnohokro-kové metody jsou reálné. Protože pro obě tyto posloupnosti platí (4.73), platí pro ně také (4.75). Je však |/ir™ein^| = hr". Protože je r > 1 i Ji = (i - o)/n, platí |/ir™e"r" | —> oo pro n —► oo. Totéž tedy platí aspoň pro jednu z posloupností {Re(íír"ein^")} a {lm(hrne'n^)}. To je však ve sporu s (4.75). Je tedy ríl. 65 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Buď dále = rellp" kořen polynomu g o násobnosti větší než jedna. V tomto případě řeší rovnici (4.72) posloupnost {nrnemv>-}. Posloupnosti {Re(A.1''2Ilr"e]n<p,')} a {Im(/^1'2nr"e'"''!,')} jsou tedy také jejími řešeními a platí pro ně (4.73), což implikuje platnost rovnice (4.75). Je však |/i1/2nr"emlŕ" | = ŕi^nr". Předpokládáme-li tedy, že je r ž 1, platí \h1/2nrne""1'" | —> oo pro n-*coah = (x — a)/n. To je však spor dokazující, že platí r < 1. Věta je dokázána. Věta 4.4. Rád konvergentní metody (4.57) je nejméně 1 (tj. konstanty Co a Ci z dennice 4.2. jsou nulové). Důkaz . Dokažme nejprve, že je Co = 0. Daná metoda je konvergentní speciálně pro diferenciální rovnici j/ = 0s počáteční podmínkou y(a) = 1, jejíž přesné řešení je funkce y(x) = 1 v (a,b). Tedy každé řešení rovnice (4.72), pro jehož počáteční podmínky platí lim^oj^ = 1 pro s -- 0,..., k — 1, musí konvergovat k jedničce. Zvolíme-li tedy speciálně ys = 1 pro s ^ 0,,.., k - 1, musí pro řešení určené těmito počátečními podmínkami platit (4.76) lim K={x-a)jn Vn — 1 Toto speciální řešení však nezávisí explicitně na h, tedy pro ně platí (4.77) lim yn — 1. Přejdeme-li tedy v rovnici (4.72) k limitě pro n —► oo, dostaneme h (4.78) £>„ = 1, i/=0 což není nic jiného než, že Co - 0, Dokažme nyní, že je C\ — 0. K tomu cíli uvažme diferenciální rovnici y' = 1 s počáteční podmínkou y(a) = 0, jejíž přesné řešení je funkce y(x) - x - a. Pro každé řešení yn rovnice (4.79) pro něž platí (4.73), musí tedy platit (4.80) lim yn ■ e (a, b) . Položme (4.81) nh, n ~ 0, ., N (= [(b-a)/h]), kde g a a jsou první a druhý charakteristický polynom dané metody. (Jde tedy o polynomy definované rovnicí (4.70) a (4.71).) Vzorec (4.81) má smysl, neboť 4 MNOHOKROKOVÉ METODY podle první části důkazu je Co = g(i) = 0; jednička je tedy kořenem polynomu g a podle věty 4.3 je tento kořen jednoduchý, takže je g'(l) 0. Funkce yn definovaná rovnicí (4.81) splňuje zřejmě požadavky (4.73). Rovnice (4.79) je rovněž splněna, neboť je (4.82) ^a„yn+u -hY^0„ - h~j^^2aw(n + v) - ha(l) - Podle (4.80) tedy dostáváme, že pro každé x £ (a, b) platí (4.83) x — a = um yn = —j—r lim nh = —r-r-ix - a). A+o " Í>'(1) A^o e'(l)v ; Odtud však plyne, že je c(l) = £>'(1), což je jen jiný zápis podmínky Ci = 0. Věta je dokázána. Poznámka 4.2. Podmínky z věty 4.4 můžeme pomocí polynomů g a o- psát alternativně také ve tvaru (4.84) o(l) = 0, e'(l) = «r(l). Protože tyto podmínky vyjadřují tu skutečnost, že lokální chyba příslušné metody se chová jako 0(h2), říkáme jim analogicky jako v případě jednokrokové metody podmínky konzistence. Z důkazů vět 4.3 a 4.4 je vidět, že jde o velmi elementární tvrzení, která vlastně neříkají nic víc než jen to, že přibližná řešení konvergují k přesným řešením v případě diferenciálních rovnic, jejichž řešení jsou postupně nula (D-stabilita), konstanta (Co = 0) a polynom prvního stupně [C\ = 0). Proto čtenáře možná překvapí, že jednoduché podmínky, které jsou obsahem těchto vět, jsou nejen nutné, ale i postačující podmínky pro konvergenci. 4.2.2 Postačující podmínky konvergence Hlavním cílem tohoto odstavce je dokázat, že D-stabilita a konzistence jsou postačujícími podmínkami konvergence. Dále pak zde sestrojíme apriorní odhad chyby. Začneme několika pomocnými tvrzeními. Lemma 4.1. Nechť ipn a ijin jsou posloupnosti reálných čísel definované pro n — 0, .., JV a nechť m je nezáporná konstanta. Nechť dále platí n-l (4.85) <p„SÍ>n + m^ip^ nrO, ,N.V ^ Součet, jehož horní mez sčítání je menší než dolní, pokládáme za rovný nule, 67 r I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Pak platí n-l (4.86) ^g^ + m^^l + m)"-1-", n = o, N Důkaz Položme n-l (4-87) ^ = 1»^^ n = 0, ,N. Podle (4.85) platí Rn+1 - R„ = rrupn g mý„ + mRn, neboli (4.88) Ä„+1 g (l + m)Ä„ + m<ŕ„, m = 0,..., .řV 1. Definujeme-li nyní funkci Zn, n = 0, .. , N, tekurencí (4.89) Zo = 0, Zn+i ~ (1 +m)Zn +m^„, n = 0, ...,JV 1, je n-l (4.90) Z„ = m^^(l + m)"-1-", n = 0,...,JV, v=a jak se snadno přesvědčíme např. úplnou indukcí. Na druhé straně, položíme-li V„ -= Z„ - iJ„, je zřejmě V0 = 0 a V„+i ž (1 + m)^ pro n = 0,.. - 1. Odtud však plyne, zeje K, ^ 0 pro n — 0,... ,N, tj. Zn^Rn.Z této nerovnosti, z rovnic (4.90), (4.87) a z nerovnosti (4.85) už tvrzení snadno plyne. Lemma 4.2. Buďdána D-stabiJn/mnohokroiová mefocřa (4.57) a buď A matice řádu k definovaná rovnicí (4.91) 1 0 _ Sil a* Pak existuje konstanta F taková, že platí (4-92) \\A"\\ ŽT, n 0,1, . . Symbolem ||. || přitom rozumíme -^„-(Čebysevovu) normu matice, tj. maticovou normu indukovanou JS^-normou vektoru (tj. normou vektoru, která je dána jeho složkou, která má maximální absolutní hodnotu). Důkaz. Charakteristický polynom matice A je zřejmě polynom g. Buď T (regulární) matice taková, že matice J = T'1 AT je v Jordánově kanonickém tvaru. 68 4 MNOHOKROKOVÉ METODY Protože je zřejmě A" - rj"7~_1, stačí dokázat omezenost n-tých mocnin matice J. Protože však J je blokově diagonální matice, stačí se dále omezit pouze na vyšetřování mocnin jednotlivých bloků. Vzhledem k podmínce stability jsou všechna vlastní čísla matice A v absolutní hodnotě menší nebo rovna jedné a ta z nich, která jsou v absolutní hodnotě rovna jedné, jsou jednoduchá. Jordánovy bloky příslušné vlastním číslům rovným v absolutní hodnotě jedné jsou tedy matice řádu jedna, tj. přímo tato vlastní čísla. Jejich mocniny jsou tedy zřejmě omezené. Bloky J, řádu r{ většího než jedna nutně přísluší vlastním číslům A, pro něž je |A| < 1. Kromě toho, úplnou indukcí se snadno zjistí, že pro ně platí (4.93) A*1 (I)*"-1 n—ri+l o 6) A-' A" Nyní zbývá už pouze uvědomit si, že jS?„j-norma matice je maximum ze součtů absolutních hodnot prvků v jednotlivých řádcích. Utvoříme-li totiž tyto řádkové součty, jsou všechny sčítance typu polynom v n krát |A|™_f*, kde ct je omezené. V důsledku toho, že je |A| < 1, konverguje každý sčítanec pro n —» oo k nule. Odtud však už lemma bezprostředně plyne. Poznámka 4.3. Lemma 4.2 platí zřejmé nejen pro Jžř^-normu, ale pro libovolnou maticovou normu. Lemma 4.3. Nechť z„ splňuje rovnici k k (4.94) Cř„zn+„ = h ^ 0ni>Zn + v + An ť = 0 pro n — 0,1,. ., kde av jsou koeficienty D-stabilní k-krokové metody a /?„„, v -= 0,..., h, n = 0,1, jsou libovolná čísla. Nechť dále Z, A, B a p jsou takové konstanty, že platí (4.95) (4.96) (4.97) \zf, \ S Z, {i = 0, -.,k-l, |A„|gA, n = 0,1,..., Vk„-—oj<.0, n = 0,1, a (4.1 |/3„i| = A n =0,1, 69 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Nechť je konečně ha číslo, pro něž je ho < (4.99) y Pak pro libovolné h á ho a libovolné n = 0,1,.. platí (4.100) |z„| 2 rZeL'nh +r*Ane-L*n\ kde r (4.101) r* (4.102) .» F je konstanta z lemmatu 4.2. I°*I(i-i£tM i* = r*s Důkaz. Přičtěme k levé i pravé straně rovnice (4.94) číslo Z/*=o A^otvzn+„. Po jednoduchých úpravách dostaneme (4.103) Odtud plyne, že pro h ^ h0 je (4.104) kde (4.105) neboť pro h í ho je výraz 1 — hfin^ja^ vzhledem k nerovnostem (4.98) a (4.95) kladný, a můžeme jím tedy dělit. Buď nyní z„ ^-dimenzionální vektor o složkách Zn,zn+i, • ■ • • zn+k-l a qn fc-dimenzionální vektor o složkách 0, 0,..., Pomocí těchto vektorů a matice A z lemmatu 4.2 můžeme rovnici (4.104) zapsat maticově takto: (4.106) neboť prvních k — l rovnic v (4.106) jsou identity a poslední rovnice je právě rovnice (4.104). Rovnice (4.106) je však ekvivalentní s rovnicí (4.107) Zn - ^zo + ^/r-1-^, 4 MNOHOKROKOVÉ METODY jak se snadno zjistí úplnou indukcí. Podle lemmatu 4.2 je tedy (4.108) Podle (4.105) je (4.109) IMšr||z„|| + r£|Mi Kl i°*i(i-fc*ř) /3 Protože je íj || pro í = 0,. . ,k — 1, dostáváme odtud, z (4.108) a z (4.95) až (4.98), že pro h 2 ho platí (4.110) ||2»||^r3 + £AL*||rr|| + r*An. Položíme-li v lemmatu 4.1 ip„ — \\zn\\, ipn = VZ + T*An a m - L*h, dostaneme z nerovnosti (4.110) nerovnost ti-i (4.111) ||zn|| ÚTZ + r*An + hL* J^{TZ + rAf)(l + hL*)™-1-" iz tak, že prc £(l + fcL* Upravme vzniklý výraz tak, že provedeme naznačené součty. Zřejmě platí (4.112) (4.113) (hL*)2 hL*' j;ili se snadno zjistí např. úplnou indukcí. Dosadíme-Ii do nerovnosti (4.111) ze vzorců (4.112) a (4.113), dostaneme po jednoduchých úpravách (4.114) hL* Požadované tvrzen! pak už plyne odtud, z nerovnosti \z„\ ú )|z„|| a z takřka zřejmých nerovností (4.115) (1 + hL*)" "1 <neM* hL" Právě zformulované a dokázané lemma hraje v teorii mnohokrokových metod stejnou roli jako hrálo lemma 1.1 u jednokrokových metod. Konvergence i další důležitá tvrzení týkající se mnohokrokových metod se pomocí něj už snadno dokáží. 70 71 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Věta 4.5. D-st&bilní a konzistentní lineární k-kroková metoda je konvergentní. Důkaz. Buď y řešení diferenciální rovnice (1.6), jejíž pravá strana splňuje předpoklady (i) a (ii) z cl. 1, s počáteční podmínkou (1.7) a bud yn řešení rovnice (4.57) s počátečními podmínkami ys = y,(h), s = 0,.,., k — 1. Položme 6(h) = max \y,(h) - y(xs s=0....,fc-l (4.116) a předpokládejme, že platí (4.117) limr(A)=.0. h—*0 Vzhledem k definici 4.1 máme dokázat, že platí (4.68). Položme jako dříve e„ — - Vn - y{xn) a odhadujme tuto veličinu. Přesné řešení dané diferenciální rovnice má v intervalu (a, b) spojitou derivaci, a je tedy (viz definice 4.1) k k (4.118) ^a„t/(x„+„) - h^2pvf(zn+r,y(!cB+ll)) = L(y(xn);h). Odečteme-li tuto rovnici do rovnice (4.57), dostaneme k (4.119) J^aven+Í,= ir=e k = h^0v[f{xn+v,yn+v) - f(xn+v,y(xn+ll))] L(y(xn);h). Položíme-li ještě f{xn,yn) - f(x„,y(xn)) (4.120) S„ =0, en = 0, můžeme rovnici (4.119) psát ve tvaru (4.121) ^2oiven+u = h"^2Pv9n+i>en+v - L(y(xn};h), což je rovnice typu (4.94). K odhadu jejího řešení použijeme tedy lemmatu 4.3. Protože je zřejmě \gn\ g L, jsou předpoklady (4.95), (4.97) a (4.98) splněny, klademe-li (4.122) (I je lipschitzovská konstanta pravé strany dané diferenciální rovnice.) Protože podmínky stability jsou také splněny, zbývá odhadnout lokální chybu L (y(x„); h). K tomu použijeme stejně jako v případě jednokrokové metody modulu spojitosti u 72 4 MNOHOKROKOVÉ METODY derivace přesného řešení. Podle definice modulu spojitosti je \ý(xn+v) — y'{xn)\ £ S u(yh), a tedy existuje číslo 6„u takové, že je \8nu \ ž 1 a že platí (4.123) i/(£„+*) = s/(a;„) + r„„ui(vA). Dále, podle věty o střední hodnotě existuje číslo £„„ takové, že je xn < £„„ < z„+„ a že platí y(x„+„) = y(xn)-T-vhy'(£ni/). Existuje tedy číslo $'„„ takové, že je \6'n„\ <i 1 a že platí (4.124) y(xn+u) = y(xn) + uh[y'(xn) + 6'nuu(yh)]. Dosadíme-li do výrazu (4.118) podle (4.123) a (4.124), máme (4.125) L(y(xn);h) = »(*„)!>.. + hlr(*n)(+ k k První dva sčítance na pravé straně rovnice (4.125) se rovnají nule v důsledku konzistence; platí tedy (je 0 g ui{vh) g u(kh), v= 1,2,... ,k) (4.126) kde (4.127) \L{y(xn)\h)\ £ Khu(kh), « = E(H«.I + IAI). Podle lemmatu 4.3 platí pro h < |on|/(I|ft|) a pro n takové, zeje xn e (a, b) (4.128) |e„| g [TS(h) + r*K(xn - aMfcA)]^1-—^*, kde r (4.129) r* = a V — V*B. Z nerovnosti (4.128) však už tvrzení věty ihned plyne. Věta 4.5 je dokázána. Ta část vzorce (4.128), která obsahuje funkci w, je zcela analogická obdobnému vzorci, který jsme odvodili pro Eulerovu nebo pro obecnou jednokrokovou metodu. Kromě toho však tento vzorec obsahuje navíc sčítanec, který charakterizuje chybu, které se dopouštíme nepřesným zadáním počátečních podmínek. Přítomnost tohoto členu je pro mnohokrokové metody typická, a rychlost konvergence je tedy u těchto metod dána nejen tím, jak rychle konverguje k nule lokální chyba, ale také tím, jak dobře jsou aproximovány počáteční podmínky. 73 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OLOHY S POČÁTEČNÍMI PODMÍNKAMI Z důkazu věty 4.5 je zřejmé, že lepší odhad, než je vzorec (4.128), dostaneme, odhadneme-tí lépe lokální chybu. Za předpokladu, že hledané řešení je dostatečně hladké, se to provede např. pro Adamsovu-Bashforthovu nebo pro Adamsovu-Moultonovu metodu snadno. Pro obě tyto metody totiž platí (4.130) L(y(x); h) = C^j/'+D^H-i pro vhodné f e (a, b), jak plyne ihned ze vzorců (4.32) a (4.38). Má-li tedy hledané řešení spojitou (p + l)-ní derivaci, je lokální chyba Adamsovy-Bashforthovy a Adamsovy-Moultonovy metody řádu hp+1. Vztah analogický k (4.130) sice obecně pro lineární fc-krokovou metodu neplatí, platí však následující tvrzení. Lemma 4.4. Buď dána lineární k-kioková metoda řádu pž 1 a buď y funkce mající p + 1 spojitých derivací v intervalu (a, b). Pak platí (4.131) kde (4.132) \L{y(x);h)\ŠGYh"+l, Y = max \y(p+1)(x)\, G= ľ\g(s)\ds, Jo (4.133) funkce g je dána rovnicí (4134) „(,) = £ g(„ - sf+ - j^fy - <i=o a symbol z+ je definován jako z, je-li 2Ž0, a jako 0, je-li z < 0. Důkaz. Spokojíme-li se pouze s existencí konstanty G (nezávislé na h) takové, že platí (4.131), stačí k důkazu této nerovnosti elementární užití Taylorova vzorce. Chceme-li dostat vyjádření (4.133) pro G, je vhodnější užít Taylorův vzorec s integrálním tvarem zbytku, Proto jej nejprve připomeňme. Má-li funkce y spojité derivace až do řádu j + lv(a,i)a jsou-li x a x dva body z tohoto intervalu, platí (4.135) y(x) ■= y(x) + (ž - x)y'(x) + ...+ -(£- *)V«>(s)+ + A ľ(x-tyy<-q+1\t)dt. Užijeme-li tento vzorec pro funkce y a y' a pro í = x + vh, máme (4.136) y(x + vh) = y(x) + vhy>(x) +...+ ^jVrhF^(x)+ J.P + 1 ŕ" + ~- / (v syV^+l1{x + hs)ds P- Jo 74 4 MNOHOKROKOVÉ METODY (4.137) t/(z + vh) = y'(x) + vhy"(x) +...+--—v^hf-^^-r (p - 1)! + j^jy jf (v - sf-'y^Hx + hs) d s. Vynásobíme-li rovnici (4.136) číslem a„, rovnici (4.137) číslem -hp„ a sečteme pro v = 0 až k, dostaneme (srov, vzorce (4.64)) (4.138) L(y(x); h) = CBy(x) + Ciy'(x)h + ...+ Cfy^{x)h?+ Metoda je řádu p; proto je Co = Ci = ... = Cp = 0. Dále je (1139) [ {^^-')p-^riy^-^-1]y<r+1)(x + sh)ds = = Jo ~sf+ ~ (F^íJ!Ä(i'" s£~1]»(p+1)(* + s;í)dí' neboť jes'-sž0pro0ísSi/ai/-s<0 pro s > v. Dosazením do (4.138) je tedy ŕ (4.140) L(y(x);h) = h''+1 g(a)y^+1^x + sh) d s. Jo Odtud však už lemma ihned plyne. Poznámka 4.4. Nemění-li funkce g v intervalu (0, k) znaménko, platí pro lokální chybu dokonce (4.141) L(y(x); h) - Cp+1^+V(p+1)(0 a (4-142) Cp+1 = ľg(s)ds, Jo jak plyne ihned z první věty o střední hodnotě integrálního počtu. Z lemmatu 4.4 a z důkazu věty 4.5 už snadno plyne, že platí následující věta. Věta 4.6. Nechť je dána D-stabilní mnohokroková metoda řádu p ž 1. Nechť jsou splněny předpoklady (i) a (ii) t 11. 1 a nechť řešení dané diferenciální rovnice máp+1 spojitých derivací v intervalu (a, b). Pak pro h < ]ak\/(L|ft |) píatí (4.143) lift, - y(xn)\ g [T6(h) 4- T'{x„ - a)GYhp]e^-^L' 70 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI pro každén takové, že je xn e (a, b). Funkce 6 je přitom definována vzorcem (4.116) a význam konstant T,V*, L*, G aY je stejný jako v lemmatech 4.3 a 4.4. Znovu připomeňme, že k tomu, aby chyba, která vznikne řešením diferenciální rovnice (1.6) mnohokrokovou metodou řádu p, byla řádu hp, nestačí jen dostatečná hladkost řešeni, jako tomu bylo u obecné jednokrokové metody. Navíc musí být i k počátečních podmínek, jimiž je přibližné řešení určeno, zadáno s přesností hp 4.2.3 Asymptotický odhad chyby Vyšetřování asymptotického chování chyby je v případě mnohokrokové metody podstatně komplikovanější než v případě jednokrokové metody. Dalo se to ostatně očekávat, neboť u mnohokrokové metody závisí přibližné řešení nejen na integračním kroku, ale i na počátečních podmínkách. Abychom získali alespoň orientační výsledky, omezíme se na jednoduchý případ diferenciální rovnice (4.144) j/ = Ay s počáteční podmínkou y(0) = 1, kde A je nenulová konstanta. Přesné řešení tohoto problému je tedy funkce y(x) = eAx. Buď dále dána D-stabilní ij-kroková metoda (4.57) řádu 1 a předpokládejme navíc, že příslušné charakteristické polynomy g a <r nemají netriviální společné dělitele. Tento předpoklad není příliš omezující a ve všech uvedených konkrétních příkladech mnohokrokových metod je splněn. Aplikujeme-li danou metodu na rovnici (4.144), dostaneme pro přibližné řešení yn rovnici k (4.145) £)(a„ - hAp„)yn+„ = 0. !/ = 0 Rovnice (4.145) je příkladem lineární diferenční rovnice fc-tého řádu s konstantními koeficienty. Z teorie těchto rovnic je známo, že položíme-li k (4.146) ě(í) = £>" - hAfi„)ť = e(í) - nA<r({), u=a označíme-li fi,...,£t kořeny polynomu g a předpokládáme-li, že jsou navzájem různé, dá se každé řešení rovnice (4.145) psát ve tvaru k (4.147) yn^J2A*Ž"' kde A, jsou vhodné konstanty. Pokud čtenář není obeznámen s teorií diferenčních rovnic, dokáže si platnost uvedeného tvrzení snadno takto: Předně je hned vidět, že každá funkce tvaru (4.147) řeší rovnici (4.145). Dále, protože každé řešení rovnice (4.145) je jednoznačně určeno 4 MNOHOKROKOVÉ METODY svými počátečními podmínkami, stačí k důkazu požadovaného tvrzení dokázat, že soustava lineárních algebraických rovnic k (4.148) Y,A>ž = yr> r=0> ■■•k~l x — 1 pro neznámé A\,..., Aj. má při libovolných y0,..., yk-i řešení. Determinant této soustavy je však Vandermondův determinant pro čísla {i,..., fit a protože tato čísla jsou navzájem různá, je tento determinant různý od nuly. Abychom tedy vyšetřili chování řešení rovnice (4.145), musíme začít zkoumáním vlastností kořenů polynomu g. To provedeme v následujícím lemmatu. Lemma 4.5. Nechť polynomy g a cr jsou nesoudělné a nechť £s je kořen polynomu e násobnosti r. Pak existuje funkce $ komplexní proměnné t, která je holomorfní v okolí bodu t = 0 a taková, že položíme-li £s = <Ě(fr1/r), kde hltr je jedna z r (navzájem různých) hodnot r-té odmocniny z h, je toto £s pro dostatečně malá h kořen polynomu g. Důkaz. Předpokládejme nejprve, že je jednoduchý kořen polynomu g. Protože polynomy g a a nemají netriviálního společného dělitele, má funkce (4.149) h = fc(í) = -4£L A<r(£) v nějakém okolí bodu £ = £, smysl a pro dané £ definuje takové h, že toto f je kořenem polynomu £(£) = ?(£) - hAo-(£). Funkce h je zřejmě holomorfní v okolí bodu í = f, a platí pro ni h[í.) = 0, h'((.) = rKO/OMČ.)) # 0, neboť 6 je jednoduchý kořen polynomu g, a je tedy g'(£s) ^ 0. Podle věty o inverzi holomorfní funkce existuje funkce £ = <ř(A), která je holomorfní v okolí počátku a která je inverzní k funkci h ~ A(f). Tato funkce udává tedy při daném h takové £, které řeší rovnici j>(f) = 0. Buď nyní kořen polynomu q násobnosti r > 1. Za tohoto předpokladu platí, že je fc(í) = (í — ÍjJ'vÍÍ) aipje holomorfní a různá od nuly v bodě ( — (,. Existuje tedy funkce ij>, která je holomorfní v okolí bodu f = a pro niž platí V,r(í) = <f(í) (holomorfní větev r-té odmocniny z funkce tp). Definujme funkci í = r(£) předpisem *(í) = (í — fj)V>(0. Tato funkce je holomorfní v okolí bodu £ = £s a platí pro ni í(íí) = 0, í'(í,) = V(6>) + 0. Existuje tedy funkce £ = 4(ť), která je holomorfní v okolí počátku a která je inverzní k funkci í = ť(£) (viz např. Černý (1967)). K dokončení důkazu už stačí uvědomit si, že funkce f = <ř(t) udává tu hodnotu £. která je při daném ŕ kořenem rovnice p(£) = trAc(^) = 0. Důkaz je hotov. Z uvedeného lemmatu plyne, že pro dostatečně malé ň leží v okolí každého jednoduchého kořene polynomu g právě jeden kořen polynomu p a v okolí každého kořene polynomu g násobnosti r právě r kořenů polynomu g. Tyto kořeny polynomu g, na něž se rozštěpí r-násobný kořen polynomu p, jsou navzájem různé, neboť vzniknou 76 77 i. obyčejné diferenciální rovnice - olohy s počátečními podmínkami 4 mnohokrokové metody dosazením r-různých hodnot r-té odmocniny z ft do holomorfní funkce, která je prostá. Kořeny polynomu q jsou tedy navzájem různé a řešení rovnice (4.145) se dá psát pro dostatečně malé h ve tvaru (4.147). Buďte £l,...,{í kořeny polynomu q (každý z nich píšeme tolikrát, kolik činí jeho násobnost) a očíslujme je speciálně. Protože daná metoda je stabilní, platí pro každé s, že Ž 1. Má-li polynom g m kořenů v absolutní hodnotě rovných jedné, přidělme jim indexy 1,..., m a speciálně položme £i = 1 (takový kořen v důsledku toho, že je p ž 1 zaručeně existuje). Tyto kořeny nazveme podsiatné. V důsledku instability o nich víme, že jsou všechny jednoduché. Zbývající kořeny (pokud existují) označíme fm+i,..., £i a nazveme je nepodstatné. Kořeny polynomu q očíslujeme tak, že pro dostatečně malé h leží kořen £Ä v okolí kořene £s, s = 1,..., k. Je-li ís kořen polynomu q, který se pro d -> 0 blíží k nepodstatnému kořenu polynomu g (tj. je-li s — m + 1, .., k), existuje konstanta t < 1 taková, že platí (4.150) lí.| = * pro s — ra + 1, ..., k a pro dostatečně malé h. To je zřejmé, neboť nepodstatné kořeny polynomu g leží uvnitř jednotkového kruhu a za číslo t lze tedy vzít např. (4.151) * = !(! + max =m+l,... ie.D- Kořeny £s závisí pro s = 1,..., m na integračním kroku h podle lemmatu 4.5 analyticky, neboť podstatné kořeny jsou jednoduché. Platí tedy (4.152) t, = a + l3h + 0(h2) pro h —í 0 a pro í = 1,,, , m. Určeme koeficienty a a /?. Zřejmě je a = neboť ía ~* ía pro h —» 0. Dosazením do rovnice ě(£) — 0 a užitím Taylorova vzorce dostaneme, ze existují čísla a £** taková, že platí (4.153) ř(í.) + [/??«+ o^Mk) + + o(fc2)] V'(č;)- - hA{o-(£,) + \fih + 0(h2)y(C')} = o, neboli (4.154) W&)- Acr(t3)]h + 0(h2)=Q., protože je ř?(fs) ~ 0. Porovnáním koeficientů u stejných mocnin h na levé a pravé straně rovnice (4.154) dostaneme, že pro s — 1,..., m platí (4.155) kde číslo (4.156) 78 í. =í,[l + A5J4/i + 0(íi2)], a, nazveme růstovým parametrem příslušným k podstatnému kořenu £,. Všimněme si, že v důsledku ÍJ-stability má definice růstových parametrů smysl a že v důsledku konzistence je Ai =: 1. Vyšetřeme nyní chování mocnin kořenů fs při h —> 0 a xn = nh = konst. Platí (4.157) [l + XsAh + 0(h2)]n e"Hi+*.Ah+o(h>)] = ^mi+í.am-oc/.1)] _ a tedy, položíme-li (4.158) 6 = tÍV-pro s = 1,..., m, máme (4.159) Č S ein<'-[eA-J*"'- + O(h)]. Speciálně pro s = 1 platí = e"*1* + 0(h). Určeme funkci O(h) v této rovnici přesněji. Podle rovnice (4.155) je (4.160) (ii=eah+t, kde t je analytická funkce h, která se pro h —* 0 chová jako 0(/i2). Abychom určili tuto funkci přesněji, dosaďme do rovnice p(£) = 0. Užitím Taylorova vzorce dostaneme (4.161) e(eAh) + Te'(eAh) + 0(r2) - hAo-(eAh) + 0(hr) = 0. Předně platí 0(r2) + 0(hr) = O(hr) pro h -» 0, neboť je r = 0(ři2). Dále, pro každou funkci t/, která má p + 2 spojitých derivací v (a, b), platí (4.162) ^2auy(x + vh)-h^2Mi* + vh) i = Cf,+i^"+1J(jr)ftf,+1 + O^2), neboť daná metoda je řádu p. Platnost vztahu (4.162) se snadno ověří analogickým postupem jako v důkazu lemmatu 4.4. Speciálně, dosadíme-li do (4.162) za y funkci e^1, dostáváme k k (4.163) av<sAxeAhv - hAj^ 0reAxeAhv - = C^lA^h^fŕ" + 0(W+2): neboli, zkrátíme-li funkcí eAl:. (4.164) e(eAh) - hA<r(eAh) = Cp+1(Ah.y+1 + 0(^+2). Dosadíme-li do rovnice (4.161) z rovnice (4.164), máme (4.165) tq,(eAh) = -Cp+1(Ahf+1 + 0(hr) + O^2). 79 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI 4 MNOHOKROKOVÉ METODY Vezmeme-li v úvahu, že pro h -» 0 platí 0(hr) = rO(fc), g'(eM) = g'{l) + O(h) -= ?'(!)[! + 0(k)] a 1/[1 + O(ft)] = 1 + 0{h), plyne z (4.165), že pro h ->■ 0 platí (4.166) kde jsme položili (4.167) r = -C(A^+1 + 0(hp+2), Poznamenejme, že konstanta C patří k jedné z charakteristik dané metody a nazýva se konstanta chyby. Dosadíme-li do (4.160) z (4.166), máme (4.168) Či = eAh - C(Ahy+1 + 0(hp+2) = _ eAh{l - [C(Ah)'+1 + 0(hP+2)]e-Ah} - = eAh{l - [C(Ahf+1 + 0(h"+2)][l + 0(h)]} = = eAh[l - C(Ah)t>+1 + 0(hp+2)]. Odtud ihned plyne, že pro h —> 0 a xn = nh = konst. platí (4.169) $ = eAx-[\ - x^A^CW + 0{h?+l)l neboť je (4.170) [l-C(^ft)P+1 + 0(ftp+2)]"=eí^1"[1-c<'4'')'+1+0(','+2» - = e{-«.cJ4'+'ft'+o(*'+')} = fl _ xnCAp+1hp + 0(h"+1)][l + 0(h"+1)]. Nyní už máme představu, jak závisí na h mocniny kořenů £, ve vzorci (4.147). Dalším naším úkolem je vyjádřit koeficienty As v tomto vzorci pomocí počátečních podmínek. Čísla As splňují soustavu lineárních algebraických rovnic (4.148). Abychom tuto soustavu rozřešili, definujme čísla ír, r = 0,. ., k - 1, rovnicemi (4.171) Sr = yr - í[ a polynomy g„, v — 1,..., ír, rovnicemi (4.172) é„(Č) = -^t = í„0 + a„ť + + ov.t-lČ*-1 Protože je e(íľ) — O pr° " = 1> > platí (4.173) ř„í.) = ' ^ L e (v)> " = *• Dosadíme-li za pravou stranu v rovnici (4.148) podle (4.171), vynásobíme-li každou z takto vzniklých rovnic koeficientem ä„r a sečteme od r = 0 do r = i - 1, 80 dostaneme ifc (4.174) = š„(fl) + Ař, v = 1,,. ,fc, 1=1 kde fc—i (4.175) Á„ = ^ä„ír. r=0 Použijeme-li rovnic (4.173), přejdou rovnice (4.174) v (4.176) Arě'&) = ě„(Íi) + í„ v = l,...,k. Protože je é'(Čľ) ^ 0 pro v — 1,.,., Jfc (kořeny polynomu q jsou jednoduché), plyne z rovnic (4.176), že platí (4.177) Al=l+-^lT, Av=^r-;, V~2,...,k. ě'(6) Podařilo se nám tedy jednoduše vyjádřit koeficienty Av pomocí veličin A„. Koeficienty ävr, které vystupují v definici těchto A^ však závisí na h. Pokusme se tuto závislost blíže osvětlit. Definujme proto pro v — l,...,k veličiny A„ rovnicemi t-i (4.178) A. = £«„«,., r = 0 kde (4.179) ft-(fí=í?^- = «,o+ +aVjk-ie-\ takže koeficienty otVT už na h nezávisí. Zřejmě platí (4-180) lÄ.-A^á í £>,r kde (4.181) S- max Ir, I. J = 0,.„,*-i K posouzení rozdílu A„ — A„ je tedy třeba odhadnout rozdíl 5ivr — a„r. Koeficienty <xvr polynomu gv lze počítat jednoduše z koeficientů ar polynomu g Homérovým schématem, tj. z rekurence (4.182) ayk = 0, avr = ar+i + £„a„ir+i, r = i - 1,..., 0, a podobné rekurence platí pro koeficienty ä„r polynomu §„, Platí tedy (4.183) avr — a„r - ár+i - ar+1 + - £1/)ä„ir+i + í»(ôv>r+1 - a„,r+i) 81 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI pro r = fc - 1,..., 0. Protože však platí podle lemmatu 4.5, že je (4.184) ^Ofh1/*), kde s je násobnost kořene polynomu g a protože je äT = ar — hAf}r, plyne z rovnic (4.183) snadno úplnou indukcí, že platí (4.185) a„r-avr = 0(h1''), a tedy, že je i- (4.186) Ä„ - A„ + 0(Shí/s). Vyšetřeme konečně, jak závisí na h čísla Podle definice polynomu g platí (4.187) ě'(í„) = g'(Í„) - hAcrfa). Podle Taylorova vzorce platí pro každé s š k (4.188) ŕ'(í„) = e'(í„) + ^/'(Wl - ť,) + .. .+ Je-li £„ s-násobný kořen polynomu ý, plyne ze vzorcu (4.188) a (4.184), že platí (4.189) = ^-Ljjet*)^)^ - ť,)*"1 + 0(Ä). Pro jednoduchý kořen f„ polynomu g tedy odtud a z (4.187) dostáváme (4.190) ě'(í„) = r>'(6>) + 0(/O. Buď nyní kořen polynomu g násobnosti s. Holomorfní funkce <ř vystupující v lemmatu 4.5 má v bodě t — 0 derivaci od nuly různou. Platí tedy nejen (4.184), ale existuje dokonce konstanta fv ^ 0 taková, že je (4.191) tr-t^^hV'll + Oih1'')]. Použijeme-li rovnice (4.187) a (4.189), plyne odtud, že pro kořen polynomu g násobnosti s platí (4.192) é'({"„) = e^-^'ll + OÍÄ1'*)] + 0(h) = = evhl-1V'[l + 0(h1'')], kde £„ ^ 0 je vhodná konstanta. Získané odhady už umožňují posoudit závislost koeficientů Av na h. Dosadíme-li do vzorce (4.177) podle (4.186) a (4.190), dostaneme (4.193) 82 0(Sh), i/-2,...,m, 4 MNOHOKROKOVÉ METODY neboť kořeny £„ jsou pro v = 1,..., m jednoduché. Pro c = m+1,..., fc o násobnosti kořenů nic nevíme, a musíme proto vyjít ze vzorce (4.192) platného pro libovolnou násobnost. Z něj snadno plyne, že je (4.194) Pro v = tn + 1, (4.195) &{L) £<,h(-i)/>[l + 0(hU°)] , k tedy máme A, = [A„ + 0(*V/*)]o(i) =0(£)- Dosaďme konečně do vzorce (4.147) odhady (4.150), (4.159), (4.169) (4.193) a (4.195). Dostaneme (4.196) yn = [l + + 0(ž/»)]e^"[l - a^C^1*,' + 0(fcř+1)]+ »=3 LťWľJ »=m+l " Odečteme-li od levé i pravé strany rovnice (4.196) přesné řešení y(xn) = e^1", dostaneme po jednoduchých úpravách (4.197) yn-y(x„)- - x^CA^e^h" +0(h"+1)+ neboť e""/h/h2 -^Opro/i-tO. Čísla A„ jsou dána vzorci (4.178), a závisí tedy na daných počátečních podmínkách dosti nepřehledně. Vyšetřeme proto podrobněji tuto závislost, samozřejmě za vhodných doplňujících předpokladů. Předně podle (4.171) platí pro s = 0.....k — l (4.198) S.=y,~ íí = y(xs) - řf; + y, - y{xs). Pro |i však platí (4.168). Pro s = 0,..., fc - 1 tedy platí (4.199) £{ = eAsh[í - (Ahf+1C+ 0(W+2)]J = e"'* +0(np+1). Dosazení do (4.198) tedy máme (4.200) í, = !/s-i/(^) + 0(ft',+1). Předpokládejme dále, že počáteční hodnoty jfoi • • • > íte-i jsou dány s přesností hq (q je nějaké přirozené číslo) a že pro ně platí asymptotické vzorce (4.201) y. = »(*.) + i.hf + o(h"+1), s = o,..., fc -1, 83 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI kde 7, jsou konstanty. Položíme-li k-l (4.202) D„=£a»,7„ s = 1> 1 = 0 můžeme psát (4.203) A„ = Dvhq + 0(hr+1), v=l, .k, kde (4.204) r = min(p, q). Protože je za uvedených předpokladů 0(Sh) = 0(h,+1), dostáváme dosazením do (4.197) konečný výsledek, který zformulujeme do věty. Věta 4.7. Buď dána diferenciám; rovnice yf — Ay s počáteční podmínkou y(0) = 1 a buďy„ její přibližné řešení získané lineární k-krokovou metodou řádu p, které je určené počátečními podmínkami, pro něž platí (4.201). Pak píaíi (4.205) jfr, -»(*„)= -znC^+1e*"hř+ m _ + k*Y _±^ei"*,"eA-^" + 0(hr+1), fťi kde f„ = e"p" jsou kořeny charakteristického polynomu g, které jsou v absolutní hodnotě rovny jedné, C a A„ jsou konstanty dane' vzorci (4.167) a (4.156), D„ jsou funkce počátečních podmínek definované vzorci (4.202) a pro r platí (4.204). Ze vzorce (4.205) je vidět, že celková diskretizační chyba se skládá ze dvou podstatně odlišných částí. První část daná členem -i„CipWejll-/iř plně odpovídá celkové diskretizační chybě u obecné jednokrokové metody, neboť funkce -xCApJrleAx je řešením diferenciální rovnice e' = fy(x,y(x))e + p(x,y(x)), kde <p(x,y(x)) = — -Cj/p+1'(z). Je to tedy'celková diskretizační chyba v užším smyslu, neboť závisí pouze na hlavní části lokální diskretizační chyby, tj. na prvním nenulovém členu v jejím rozvoji do mocninné řady podle integračního kroku h. Druhá část celkové diskretizační chyby je ve vzorci (4.205) reprezentována součtem a závisí na počátečních hodnotách přibližného řešení. Ze zmíněného vzorce je vidět, že struktura této startovní chyby je podstatně složitější, než je tomu u vlastní diskretizační chyby. Nicméně v případě m = 1 (tj. nemá-li polynom jiné kořeny, které jsou v absolutní hodnotě rovny jedné, než fi) není ani tato část chyby nebezpečná. Růstový parametr je totiž v tomto případě pouze jeden, a to rovný jedné, a startovní chyba je úměrná přesnému řešení, což je přijatelná situace. Je-li však m > 1, objeví se v součtu (4.205) dodatečné oscilační členy (oscilační v důsledku přítomnosti činitele e'"""), jejichž amplituda je úměrná číslu e^"^*. Je-li X„A < A, nejsou rovněž nebezpečné. V opačném případě však jejich amplituda roste rychleji než přesné řešení, a mohou tedy velmi rychle počítané řešení úplně znehodnotit. 84 4 MNOHOKROKOVÉ METODY Na první pohled se může zdát, že všech potíží se startovní chybou se zbavíme, zadáme-li počáteční podmínky pro přibližné řešení přesně. Nehledě na to, že z praktického hlediska je takové opatření obecně těžko proveditelné, není tato úvaha ani věcně správná. Ze vzorce (4.198) je totiž vidět, že veličiny &„ nejsou v tomto případě rovny nule. Je tedy S / 0 a vrátíme-li se ke vzorci (4.197), z něhož jsme vzorec (4.205) odvodili, vidíme, že startovní chyba se tak jako tak objeví. Ani volba y„ = vedoucí k <5„ = 0 mnoho nespraví, neboť v důsledku zaokrouhlování nejsme schopni splnit tyto podmínky přesně. Ilustrujme popsané chování jednoduchým příkladem: Příklad 4.2. Uvažujme metodu (4-206) yn+2 = y„ + 2hfn+l. Tato explicitní metoda je řádu 2 a je pro ní g(£) = £2 — 1, <7(f) = 2£, fi = 1 a Í2 = — 1. Podstatné kořeny jsou tedy dva (m = 2) a příslušné růstové parametry jsou Ai = 1 a A2 = —1. Rešíme-li touto metodou modelovou diferenciální rovnici t/ = Ay s A < 0, osciluje chyba s amplitudou úměrnou ě~Al:, a tedy s délkou intervalu, v němž hledáme řešení, exponenciálně roste. Řešme metodou (4.206) nelineární diferenciální rovnici (4.207) j/ = l-J/2 s počáteční podmínkou y(0) = 5. Výsledky jsou pro h = 1/64 uvedeny v tab. 4.9, která pro srovnání obsahuje také výsledky získané dvoukrokovou Adamsovou-Bashforthovou metodou. V obou případech jsme za t/i vzali hodnotu přesného řešení. I když rovnice (4.207) je nelineární, jev, který jsme předpověděli pro modelovou rovnici, nastává i zde. Metody, které se chovají jako metoda (4.206), tj. metody, pro něž je m > 1 a některý z růstových parametrů je záporný, se nazývají slabě nestabilní. Tyto metody jsou sice D-stabilní, a tedy konvergentní (tj. při daném intervalu, ve kterém hledáme řešení, lze volbou dostatečně malého integračního kroku a dostatečně přesnou aproximací počátečních hodnot dosáhnout toho, že chyba je libovolně malá), závislost integračního kroku a přesnosti aproximace počátečních podmínek však není stejnoměrná vzhledem k intervalu, v němž hledáme řešení. Tato skutečnost je z praktického hlediska značně nepříjemná, neboť integrační krok a přesnost počátečních podmínek, které jsou dostačující v daném intervalu, nemusí stačit, objeví-li se nutnost řešit danou rovnici na delším intervalu. I když všechny zde provedené úvahy platí přísně vzato pouze pro modelovou diferenciální rovnici y' — Ay, dávají kvalitativně velmi přesnou indikaci o chování chyby v obecném případě. To je intuitivně jasné a dá se to i teoreticky dokázat. Do dalších podrobností (které jsou formálně značně složité) však nebudeme zacházet. Závěrem ještě upozorněme, že užít existenci asymptotického vzorce k získání odhadu chyby metodou polovičního kroku (podobně jako v případě obecné jedno- 85 L OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Tabulka 4.8 Řešeni diferenciální rovnice (4.207) dvěma dvoukrokovými metodami Metoda (4.206) Adamsova-B ashforthova 71 metoda Vn en Vn 0 5 000000 0 5,000000 0 1 4 652 200 0 4,652 200 0 2 4 354907 0,003373 4,355881 0,004347 63 1 159287 -0,048115 1,206 536 0,001252 64 1 246457 0,048115 1,199552 0,001210 65 1 141986 -0,049670 1,192 825 0,001170 127 0 599828 -0,425689 1,025688 0,000171 128 1 409513 0,384790 1,024888 0,000166 129 0 568993 -0, 454960 1,024114 0, 000 161 191 -1 606091 -2,609506 1,003 441 0,000 026 192 1, 827522 0,824211 1,003336 0,000025 193 -1, 679211 -2,682419 1,003 233 0,000 024 krokové metody) lze jen tehdy, je-li zaručeno, že hlavní část celkové diskretizačm chyby se chová „rozumně", tj. nenastávají-li jevy slabé nestability, 4.2.4 Problematika zaokrouhlovacích chyb V tomto odstavci si velice stručně všimneme problematiky šíření zaokrouhlovacích chyb. Zavedeme-li opět zcela analogicky jako u jednokrokové metody lokální zaok-rouhlovací chybu en, splňuje skutečně počítané přibližné řešení yn rovnici t k (4.208) ^2 avýn+w = A ^ 0vf(xn+u, jř„+„) + e„ w=0 v=C s počátečními podmínkami y0, • • ■, Št-i- Použijeme-li lemma 4.3, dostáváme ihned, že platí následující věta. Věta 4.8. Buďyn přibližné řešení vypočtené D-stabilní mnohokrokovou metodou a buď yn řešení rovnice (4.208). Buď konečně \en\ £ e pro n a 0, ..., JV. Pak 86 4 MNOHOKROKOVÉ METODY píati (4.209) |íín-2/nláír maí \v.-y,\ + T*(xn-a)jU'--^L'. L a=0,...,B —1 íl\ Vidíme tedy, že celková zaokrouhlovaní chyba bez ohledu na řád metody roste při h -+ 0 opět lineárně. O důsledcích, které z tohoto poznatku plynou, platí tak doslovně totéž, co bylo řečeno u Eulerovy metody nebo u obecné jednokrokové metody. 4.2.5 Stabilita při pevném integračním kroku Charakter vět týkajících se konvergence metod, které jsme až dosud uvedli, je asymptotický, tj. příslušná tvrzení platí pro dostatečně malá h. Jen pro dostatečně malé h je např. zaručeno, že při užití D-stabilní a konzistentní mnohokrokové metody (ale také např. Rungovy-Kuttovy metody) nedojde při rekurentním užívání příslušného vzorce ke katastrofálnímu nakupení lokálních chyb a celková diskretizační chyba zůstane přijatelně malá. Při konkrétním výpočtu však vždy pracujeme s pevným h, které nemusí být dostatečně malé. V této souvislosti je důležitý pojem tzv. intervalu absolutní stability dané metody. Zhruba řečeno, chceme, aby to byl takový interval, že leží-li v něm číslo hA, kde h je integrační krok a A je odhad pro derivace dfjdy, je více méně zaručeno, že lokální chyby, kterých se dopouštíme v jednotlivých krocích, se v průběhu výpočtu tlumí. Jinými slovy žádáme, aby přibližné řešení modelové diferenciální rovnice t/ = Ay při pevném h konvergovalo pro n —► oo k nule. Přistupme nyní k přesné definici. Zaveďme k tomu cíli tzv. třetí charakteristický polynom ir dané fc-krokové metody rovnicí (4.210) »({,*) = e(í) - M"(ť). Definice 4.5. Řekneme, že lineární fe-kroková metoda daná polynomy g a a je pro dané z absolutně stabilní, platí-li pro všechny kořeny £ä, s — 1.....k, polynomu jr nerovnosti < 1. V opačném případě říkáme, že daná metoda je pro dané z absolutně nestabilní. Intervalem absolutní stability pak rozumíme největší takový interval, že pro z v něm ležící je metoda absolutně stabilní. Poznámka 4.5. Je zřejmé, že analogickou definici lze vyslovit i pro jednokro-kovou metodu. Na základě motivace předcházející tuto definici se lze domnívat, že při užití integračního kroku h takového, že z určené rovnicí (4.211) z = hA leží v intervalu absolutní stability, nedojde v průběhu řešení k nepřípustnému růstu chyby. 87 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI 4 MNOHOKROKOVÉ METODY Interval absolutní stability dané mnohokrokové metody je určen pouze jejími koeficienty. Přípustný integrační krok je však rovnicí (4.211) vázán na konkrétní diferenciální rovnici. V případě obecné nelineární rovnice klademe, jak už jsme řekli, A — df/dy. Veličina d fjdy není samozřejmě konstantní; za A se bere v tomto případě odhad derivace df/dy nebo některá její typická hodnota, která se v průběhu výpočtu eventuálně mění. Změnám ve volbě A pak přirozeně odpovídají i změny v maximální přípustné velikosti integračního kroku. Snadno se zjistí (viz cvič. 9), že každá D-stabilní a konzistentní lineární fc-kroková metoda je absolutně nestabilní pro každé dostatečně malé kladné z, Odtud plyne, že užije-li se mnohokroková metoda k řešení diferenciální rovnice, pro níž je df/dy > > 0, chyba v průběhu výpočtu roste. To však není tak vážné, jak by se mohlo na první pohled zdát. Uvedené tvrzení platí totiž přesně pouze za předpokladu, že daná diferenciální rovnice je typu y1 = Ay 4- q(x), kde A je konstanta. Řešení této rovnice obsahuje člen eAl, který je aproximován členem f", kde {i je ten kořen polynomu ir, pro který platí {i —» 1 pro h —* 0 (srv. vzorec (4.169)). Zdá se tedy, že převládne-li v přibližném řešení tento člen, chyba sice v průběhu řešení poroste, ale tento růst bude úměrný řešení. To však je přijatelná situace. Úvahy tohoto typu vedou k vyslovení alternativní definice stability, kdy řekneme, že pro dané z je metoda relativně stabilní, platí-li pro kořeny polynomu ir nerovnosti |f, | < |£i pro s = 2,..., k. Interval relativní stability je pak maximální interval takový, že pro z v něm ležící je metoda relativně stabilní. V souvislosti s popisovanou problematikou se v literatuře vyskytuje řada mírně se navzájem lišících definic — je to např. požadavek, že je |í» | ž |{i | a ty kořeny £s, pro něž nastává rovnost, jsou jednoduché, nebo požadavek, že je \(, | S e* apod. — a vždy se přitom mluví o relativní stabilitě. Rozdíly sice nejsou většinou podstatné, je však třeba při porovnávání výsledků si vždy uvědomit příslušnou přesnou dciinici. I když se zdá, že pojem relativní stability byl zaveden pouze proto, abychom byli schopni pracovat s případem z > 0, je užitečný i v obecném případě. Existují dokonce dobré důvody domnívat se, že relativní stabilita je pro posouzení chování chyby výstižnější než absolutní stabilita. Na druhé straně je však těžší ji podrobně analyzovat. Upozorněme ještě, že přestože intervaly stability představují velice užitečnou charakteristiku dané metody, při utváření příliš kategorických soudů na jejich základě je třeba být opatrný. Veškeré úvahy, které odtud vycházejí, jsou totiž ovlivněny tím, že se vlastně předpokládá, že df/dy je konstantní. Pro silně nelineární problémy, kdy se hodnota funkce df/dy rychle mění, dává naznačená teorie jen hrubou orientaci a je nebezpečné brát velikost integračního kroku příliš blízko největší přípustné odhadnuté hodnotě. 4.2.6 Optimální metody V tomto odstavci si všimneme přirozené otázky, jak sestrojit lineární jfc-krokovou metodu, která je maximálního možného řádu. Polynomy o a cr, jimiž je metoda 88 definována, mají dohromady 1k + 2 koeficientů. Jeden z nich lze libovolně volit, neboť polynomy ctg a aer, kde a = konst. ^ 0, definují zřejmě tutéž metodu, takže podstatných koeficientů je pouze 2k + 1. Uvažujeme-li tedy pouze podmínky určující, že metoda je řádu p, je možno obecně dosáhnout, že je p = 2k (viz definice 4.2). Konvergentní metoda však musí být navíc stabilní. Tento požadavek patrně nedovolí dosáhnout výše zmíněného maximálního řádu. Abychom relaci mezi p a k blíže objasnili, začneme poněkud jiným, jednodušším problémem. Buď dán polynom g stupně k, který splňuje podmínky stability a pro nějž platí g{l) = 0. Máme sestrojit polynom tr stupně nejvýše k tak, aby ŕ-kroková metoda daná polynomy q a cr měla maximální řád. Abychom takový polynom sestrojili, definujme nejprve řád mnohokrokové metody poněkud jiným způsobem než v definici 4.2. Buď tedy dána lineární fc-kroková metoda, tj. polynomy Q a cr. Definujme funkci tp komplexní proměnné £ vzorcem (4.212) lní r(í)-*(í). přičemž jednoznačnou větev funkce ln£ zvolíme tak, že rozřízneme komplexní rovinu podél záporné reálné osy a položíme ln 1 = 0. Funkce l/ln£ má v bodě £ = 1 pól prvního řádu. Je-li daná metoda konzistentní, je g(l) = 0, a tedy funkce p({)/ln£ je holomorfní v bodě £ — 1. Totéž platí samozřejmě i pro funkci tp. Zmíněná alternativní definice řádu mnohokrokové metody se opírá o následující větu. Věta 4.9. K tomu, aby mnohokroková metoda daná polynomy g aer, byla řádu p, je nutne a stačí, aby funkce f> definovaná rovnicí (4.212) měla v bodě { = 1 kořen násobnosti p. Důkaz. Nechť daná metoda je řádu p. Pak pro každou dostatečné hladkou funkci y platí (4.213) L(y(x); h) = Cp+Ij/(f>+1>(z)ň-(p+1) + 0(h*>+2) a je Cp+i ^ 0. Tedy speciálně, položíme-li ve vztahu (4.213) y(x) = e*, máme (4.214) neboli (4.215) e1 ^ Wh hex Yjpveřh = C^h'*1 + 0(h*+2), g(eh) - h<r(eh) = Cp+1h^ + 0{b?+2). Odtud ale plyne, že holomorfní funkce f(h) = g(eh) — hc(eh) má v bodě h - 0 kořen násobnosti p 4- 1. Funkce f(h)/h má tedy v bodě h = 0 kořen násobnosti p. Protože transformace f = e' zobrazuje jednoznačně okolí bodu h = 0 na okolí bodu £ = 1, platí totéž pro funkci tp a pro bod f = 1. E. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Naopak, nechť funkce ip má v bodě £ = 1 kořen násobnosti p. Pak funkce htp(eh) má v bodě h = 0 kořen násobnosti p + 1. Platí tedy (4.216) e(eÄ) - kc{eh) = yhP+1 + 0(/l"+2), kde y je nenulová konstanta. Porovnáním koeficientů u stejných mocnin proměnné h na levé i pravé straně rovnice (4.216) ihned dostaneme, že pro čísla Cq definovaná v definici 4.2 platí Co — C\ — ... — Cp — 0 a Cp+i — 7 ^ 0. Metoda je tedy řádu p a věta je dokázána. Vzhledem k tomu, že tvrzení věty 4.9 je nutná a postačující podmínka pro to, aby metoda byla daného řádu, lze je použít jako alternativní definici tohoto pojmu. Tato nová definice je na rozdíl od algebraické definice 4.2 analytická. Na základě věty 4.9 už snadno odpovíme na otázku, kterou jsme si před její formulací položili, Věta 4.10. Buď g polynom stupně k, pro který plutí g(l) = 0 a buď k celé číslo, pro než platí 0 g k g k. Pak existuje právě jeden polynom tr stupně nejvýše k takový že mnohokroková metoda daná polynomy g a a je rádu nejméně k + 1. Důkaz Funkce ;?(£)/In £ je holomorfní v bodě £ = 1; v okolí tohoto bodu tedy platí ž«2 ln£ = Co + c1(í~l) + c2(í -1)2 + . (4.217) Položme (4.218) Pak funkce ^?(£) = £(£)/ln£ — <r(f) má v bodě £ = 1 kořen násobnosti nejméně k + 1 a příslušná mnohokroková metoda je řádu nejméně k + 1. Nechť naopak g a <r definují metodu řádu nejméně k + 1. Pak c musí být tvaru (4.218), jak plyne z jednoznačnosti Taylorova rozvoje. Polynom u je tedy určen jednoznačně a věta je dokázána. Poznámka 4.6. Metoda daná polynomy g a. u z věty 4.10 je řádu p > k + 1, platí-li pro koeficienty v rozvoji (4.217) c^+1 = Cjr+2 = ... = ep_x = 0. Tato poznámka, i když je triviální, bude v dalších úvahách velmi užitečná. Vraťme se nyní ke studiu fc-krokové stabilní metody mající nejvyšší možný řád. Z věty 4.10 plyne, že tato v právě uvedeném smyslu optimální metoda má řád nejméně k +1. Toto číslo však už nelze o mnoho překročit, jak vyplývá z následujících vět. Věta 4.11. Stabilní k-kroková metoda s lichým k nemůže být řádu vyššího než fc + 1. 90 4 MNOHOKROKOVÉ METODY Věta 4.12. Stabilní k-kroková metoda se sudým k je řádu nejvýše k+ 2. Rádu právě k + 2 je tehdy a jen tehdy, má-li polynom g všechny kořeny v absolutní hodnotě rovny jedné, je-li +1 a —1 mezi nimi a je-li polynom c určen podle věty 4.10, Při lichém k tedy existuje nekonečně mnoho optimálních metod. Abychom některou z nich dostali, stačí zřejmě vzít libovolný polynom g splňující podmínky stability a takový, že je g(l) — 0 a určit polynom tr podle věty 4.10. Optimálních fc-krokových metod při sudém k > 2 je sice také nekonečně mnoho, jejich množina je však podstatně užší než v případě lichého k a její struktura je zcela popsána ve větě 4.12. K důkazu vět 4.11 a 4.12 budeme potřebovat řadu pomocných tvrzení. Lemma 4.6. Buď g polynom stupně k a buď r polynom deňnovaný rovnicí (4,19) ,(„=(^,([±3, Buď dále f o ^ — 1 kořen polynomu g násobnosti m. Pak (4.220) 20 = ^1 je m-násobným kořenem polynomu r. Naopak, buď zq ^ 1 kořen polynomu r násobnosti m. Pak (4.221) je m-násobný kořen polynomu (4-222) e(0=(í + i)*r(í^i). Důkaz Je-li 7^ —1 m-násobný kořen polynomu g, platí (4-223) g(0 = Íyř('»>(ío)(í - ťoj™ + ... a g(m)(£o) ^ 0. Dosazením do (4.219) dostáváme, že je _l-Mo 1-20 (4.224) 1-20 Z vyjádření (4.224) je však vidět, že koeficient u (z — zo)m je od nuly různý. První část našeho tvrzení je tedy dokázána. Druhá část se dokáže zcela analogicky, Lemma 4.7. Buď—1 jednoduchý kořen polynomu g. Pak polynom r definovaný rovnicí (4.219) je stupně k — 1. Naopak, nechť polynom r je stupně k — 1. Pat polynom g daný vzorcem (4.222) má jednoduchý kořen -1. 91 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Důkaz Pro polynom g platí (4.225) g(0 = ie'(-l)(č +1) +.. • + lem(-m + !)*■ Je tedy (4.226) ^.(^^^^..^^(-l)^)'] Odtud však už plyne první část tvrzení. Důkaz druhé části tvrzení je stejné snadný. Lemma 4.8. Nechť polynom g splňuje podmínky stability. Pak pro kořeny Zi polynomu r definovaného rovnicí (4.219) plat/Rez,- í Oa ty kořeny Zi, pro které je Rez, = 0, jsou jednoduché. Důkaz plyne ihned z lemmat 4.6 a 4.7. Lemma 4.9. Nechť jsou splněny předpoklady lemmatu 4.8 a nechť je g(l) = 0. Pak plat/ (4.227) r(z) = aiz+ ... + atzk kde oi 5í 0 a všechny ostatní koeficienty a,- mají stejná znaménka jako ai nebojsou to nuly. Důkaz. Podle lemmatu 4.6 platí r(0) = 0, r'(0) ŕ 0, tedy platí (4.227) a aj / 0. Abychom dokázali platnost dalšího tvrzení, označme Zi kořeny polynomu r. Položíme-li Zj = — xj + ij/3, je xj ž 0 podle lemmatu 4.8 (polynom splňuje podmínky stability). Platí tedy (4.228) r(z) = a,z J[(z + x<) J[ [(z + xtf + y]}, • i kde index i probíhá hodnoty příslušné reálným kořenům polynomu r, j hodnoty příslušné párům komplexně sdružených kořenů polynomu a aj je nejvyšší nenulový koeficient v rozvoji (4.227). Všechny koeficienty v rozvoji (4.227) mají tedy stejná znaménka jako aj. Lemma 4.10. Buďte (4.229) /(í) = X>i* (4.230) í(ť) = Z)Bií* dvě mocninné řady 4 kladnými poloměry konvergence a nechť platí (4.231) f(t)g(t) - 1. 92 i MNOHOKROKOVÉ METODY Nechť dále platí At > 0 pro k = 0,1,... a Ai+iAt_i - A\ > 0 pio k = 1,2,.... Pat platí Bk < 0 pro k - 1,2,.... Důkaz. Z předpokladů Ak > 0, k = 0,1,... a A^iA^-x — A\ > 0, k = = 1,2,... plyne, že je At+j/At > Afc/Afc_i pro i: — 1,2,.... Posloupnost A^/A^ je tedy rostoucí, takže platí (4.232) An An — Jfc pro fc = 1,2,Z identity (4.231) plyne, že je A0B0 = 1, AiBo-t- AoB! — 0, ., obecně (4.233) A„B0 + An_iBi + ... + A0Bn = 0. Je tedy Bo = 1/Ao > 0, B\ = —A1B0/A0 < 0. Vynásobíme-li rovnici (4.233) číslem A„+i a rovnici, která vznikne z rovnice (4.233) záměnou n za n + 1 číslem —A„, a vzniklé rovnice sečteme, dostaneme B"+i = a \ [(Ai+iAi-i - A„A„)Bi + (A„+1An_2 - A„A„_1)fl2+ AoAn (4.234) +... + (A^A,^ - AnAn_k+1)Bh + ... + (A„+1Ao - AnA,)B„] = A„-% /An+i \ „ , , An_t /An+i An_t+:p 1_\ + j A„_). /Ai+l -fln_t+iN A0 V An An„j/ 1 "' A„ \ An An-k J Nyní už dokážeme požadované tvrzení snadno úplnou indukcí. Předpokládáme-li totiž, že platí Bi < 0 pro k = 1.....n, plyne ihned z (4.232) a (4.234), že je B„+i < 0. Lemma je dokázáno, Lemma 4.11. Pro \z\ < 1 je (4.235) a piatl (4.236) ln rpr = c0 + c2z +. c2i < o, i = 1,2, Důkaz Funkce na levé straně rovnice (4.235) je zřejmě holomorfm v okolí bodu z = 0, takže ji lze v okolí tohoto bodu rozvinout v mocninou řadu. Protože je to navíc funkce sudá, je rozvoj tvaru (4.235). Abychom dokázali nerovnosti (4.236), položme v lemmatu 4.10 (4.237) m = ^T^=2tžkhth 93 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI (4.238) ff(0 - = C0 + Cit + c4 +---- In í-HV3 Nyní už se snadno zjistí přímým výpočtem, že všechny předpoklady lemmatu 4.10 jsou splněny, takže požadované tvrzení plyne z tohoto lemmatu. Uvedená lemmata už umožní poměrně snadno dokázat věty 4.11 a 4.12, Důkaz provedeme pro obě tyto věty zároveň. Buď tedy dána lineární fe-kroková stabilní metoda řádu p Ž 1. Definujeme-li funkci / předpisem T — z\k /\ + z\ r(z) (4.239) kde (4.240) f (z): /l-z\* (l + z\ r(z) a ip je funkce definovaná vzorcem (4.212), plyne ihned z věty 4.9, že nula je p-násobným kořenem funkce /. Pro polynom s musí proto podle věty 4.10 platit (4.241) t(z) - h + biz + .., + br-i*' kde bj jsou koeficienty rozvoje funkce r(z)/ln jjj, tj. (4.242) r(z) lnl±f' Stupeň polynomu s však smí být nejvýše k. Proto, je-li p S k + 1, lze polynom s zvolit k libovolnému polynomu r. Je-li však p > k + 1, musí být polynom r takový, že platí (4.243) bk+l =ifc+2= ... = =0 (srv. poznámku 4.6). Na otázku po existenci stabilní fc-krokové metody řádu většího než k + 1 tedy odpovíme, sestrojíme-li polynom r tak, aby splňoval podmínky stability a aby pro něj platily rovnice (4.243). Vyjádřeme proto koeficienty bf pomocí koeficientů polynomu r (které označíme jako v lemmatu 4.9 a,). Položíme-li ještě o; = 0 pro i > k, platí podle lemmatu 4.9 (je p Ž 1, a tedy p(l) = 0) a podle vzprce (4.242) oo co - co (4.244) £ať+1*'XCi,''**ř = kde koeficienty p2> jsou dány rovnicí (4.235). Porovnáním koeficientů u stejných mocnin na levé a pravé straně identity (4244) dostaneme (4.245) ř>j„ = (J2í>+iC() + 020-1C2 4-... + oic2wi r 4 MNOHOKROKOVÉ METODY Podle lemmatu 4.11 je c2ť < 0 pro i = 1, 2, ... Vzhledem k lemmatu 4.9 můžeme předpokládat, že platí a\ > 0 a a,- ž 0 pro 1 = 2,3,..., neboť v opačném případě bychom místo metody dané polynomy g a <t uvažovali metodu danou polynomy —p a -"<r. Buď nejprve k liché. Pak vzhledem k tomu, co jsme právě řekli, je (4.246) = átci + ... + aicl+i < 0. Žádnou volbou polynomu r tedy nelze dosáhnout toho, aby platilo — 0. Odtud však už ihned plyne věta 4.11. Buď nyní k sudé. Pak platí (4.247) h+l = Ckty + • ■ • + 0,lC\t- K tomu, aby mohlo být b).+\ = 0, je tedy nutné a stačí, aby 02 — 04 = .. - Ofc — = 0. V tomto případě je polynom r lichá funkce, tj. platí r(z) = — r(—z). Protože polynom r nemůže mít v důsledku stability kořeny v pravé polorovině, musí tedy být jeho kořeny ryze imaginární (a nula). Polynom g musí mít proto kořeny v absolutní hodnotě rovny jedné (viz lemma 4.6). Protože je a* == 0, je polynom r stupně k — l] — 1 je tedy kořenem polynomu g (viz lemma 4.7). Pro koeficient bj,+2 platí (4.248) = al_1c4 + ... + alCt+2 < 0, takže žádnou další speciální volbou polynomu r nelze docílit, aby řád byl větší než k + 2. Tím je dokončen důkaz věty 4.12. Z věty 4.12 vidíme, že všechny kořeny polynomu g optimální i-krokové metody se sudým k jsou podstatné ve smyslu odst. 4.2.3. Může se tedy stát, že některé z těchto metod jsou slabě nestabilní. Následující věta ukazuje, že je tomu tak pro všechny tyto metody. Věta 4.13. Buď dána k-kioková metoda se sudým k, která je optimální ve smyslu věty 4.12. Pak pro růstový parametr X příslušný ke kořenu f — — 1 polynomu g platí (4.249) Důkaz (4.250) Je ✓ (-1)' Vyjádřeme hodnoty ŕ>'(£) a rr(f) pomocí hodnot polynomů r a s definovaných vzorci (4.219) a (4.240). Protože zřejmě platí g(í) = (1 + £)*r((£ ~ + 1)) a -= (1 + €)*»((* - l)/(f + 1)), je fá) = fc(l + Í)*-V((ť - l)/(í + 1)) + 2(1 + + Ot-2'-'((í - l)/(í + *))■ Odtud máme (4.251) </(-!) - fUrn [*(1 + fj'^r(|^|) + 2(1 + £)*" V(|^|)] 94 95 L OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Protože polynom r je stupně k — 1, dostáváme i tohoto vzorce, že je (4.252) ř'(-l) = (-íy-'a'-Wi + (-l)*-^*"1^ - l)0i_i = = (_l)»-i2*-i«j_l. Analogicky dostáváme, že je (4.253) <r(-l) = (-l)'2fcfrt. Celkem je tedy podle (4.250) Dosadíme-li do této rovnice podle (4.245), máme 2 (4.255) A =-(cjai-i + C4aj;_3 + ■ - ■ + ctai) ^ 2c2, a>k-i neboť čísla cj,- jsou záporná a a; nezáporná. Tvrzení věty nyní plyne z toho, že je c2 = —1/6, jak se snadno zjistí ze vzorce (4.235). 4.3 Užití lineárních mnohokrokových metod Užijeme-li k řešení dané diferenciální rovnice implicitní metodu, je nutné přibližné řešení počítat z obecně nelineární rovnice. Proto otázka, jak to učinit co nejefektivněji, je značně důležitá. Než se na ni pokusíme odpovědět, všimneme si poněkud podrobněji, k čemu vůbec implicitní metody potřebujeme, když u explicitních metod zmíněné problémy vůbec nenastanou. Z předchozího výkladu víme, že maximální dosažitelný řád D-stabilní Jfc-krokové metody je u explicitní metody nižší než u implicitní metody. Vypočítat více počátečních hodnot, které vyžaduje užití metody s větší hodnotou ír, však nepředstavuje žádný vážný problém. Proto není vidět žádný na první pohled patrný důvod, proč nedat přednost explicitní metodě s větší hodnotou fc, která má stejný řád jako uvažovaná implicitní metoda. Implicitní metody však mají další výhody proti explicitním metodám, než jen to, že mají při daném i: vyšší řád. Jako příklad porovnáme z několika dalších hledisek explicitní Adamsovy-Bashforthovy metody a implicitní Adamsovy-Moultonovy metody. Výsledky jsou shrnuty v tabulce 4.10, v níž p značí řád metody, Cp+i konstantu z definice 4.2 (což je v tomto případě konstanta chyby ve smyslu vzorce (4.167), neboť u Adamsových metod je f>'(l) = 1) a (a,0) je interval absolutní stability. Z tabulky je vidět, že implicitní Adamsova metoda téhož řádu jako explicitní metoda má menší konstantu chyby a větší interval absolutní stability. Tak např. tří-kroková implicitní metoda má interval absolutní stability lOkrát větší a konstantu chyby asi 13krát menší než čtyřkroková explicitní metoda, která je stejného řádu. Toto pozorování je typické i pro daleko obecnější případy a pro explicitní metody i MNOHOKROKOVÉ METODY natolik nevýhodné, že se jako samostatné metody užívají v praxi jen zřídka. Hrají však důležitou roli v souvislosti s tzv. metodami prediktor-korektor, které nyní popíšeme. Tabulka 4.10 Porovnání Adamsových explicitních a implicitních metod Adams-Bashforth Adams-Moulton 2 3 4 2 3 4 k 2 3 4 1 2 3 5 12 3 S 251 T20 l 12 1 24 19 120 a -1 S 11 3 10 —oo -6 -3 4.3.1 Metody prediktor-korektor Při užití implicitní mnohokrokové metody je třeba v každém kroku řešit rovnici (4.58) pro neznámou j/n+it, což se většinou provede postupnými aproximacemi. V každém kroku těchto iterací je třeba vypočítat hodnotu pravé strany dané diferenciální rovnice. Protože výpočet hodnoty funkce / spotřebuje většinou mnohem více výpočetního času než všechny ostatní početní operace, které je třeba v jednom kroku provést, snažíme se minimalizovat počet potřebných iterací, tj. snažíme se volit počáteční aproximaci tak přesnou, jak je to jen možné. Toho dosáhneme tak, že k jejímu určení použijeme vhodnou explicitní metodu. Explicitní metoda užitá k tomuto cíli se nazývá predikior a původní implicitní metoda, kterou užijeme v iteracích, se nazývá korektor. Postupovat můžeme dvojím způsobem. První způsob spočívá v tom, že v iteracích pokračujeme až do „konvergence", což v praxi znamená tak dlouho, až je splněno nějaké kritérium typu \y„*^ - j£+J < £, kde e je předem daná tolerance (srovnatelná nejčastěji s velikostí lokální zaokrouhlovací chyby). Získanou hodnotu Vn+P Pak pokládáme za přijatelnou aproximaci přesné hodnoty yn+k- Při tomto způsobu nelze předem udat počet hodnot funkce / potřebných k provedení jednoho kroku metody. Získaná hodnota však nezávisí na počáteční aproximaci, takže lokální chyba i charakter stability metody jsou určeny pouze korektorem. Při druhém způsobu provádíme v každém kroku vždy pevný počet iterací, takže počet funkčních hodnot potřebných k provedení jednoho kroku je předem znám. Při tomto postupu už není pravda, že stabilita a lokální chyba jsou určeny pouze korektorem, což může mít podstatný vliv na výběr dvojice prediktor-korektor. 96 97 L OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Nyní popíšeme naznačený postup podrobněji. Nechť explicitní metoda užitá jako prediktor je metoda (4.256) a implicitní metoda užitá jako korektor je metoda (4.57). Protože se často ukazuje výhodné užít prediktor stejného řádu, jako je řád korektoru a protože, jak víme, u implicitní metody lze dosáhnout při daném k vyššího řádu než u explicitní metody, je často vhodné použít prediktor s vetší hodnotou čísla k, než je příslušná hodnota u korektoru. Abychom mohli formálně jak v prediktoru, tak v korektoru užívat tutéž hodnotu čísla k, dohodneme se, že v tomto odstavci upustíme od požadavku, že čísla or0 a po nejsou současně rovna nule, takže nyní připouštíme v korektoru i případ, že je oío = A — O- Nechť dále m ž 1 je pevně zvolené číslo. Pak za přibližné řešení v bodě a:n+ifc získané užitím prediktoru a m-násobným užitím korektoru budeme pokládat číslo vypočtené pomocí rekurencí (4.257) eltfl + J2 "'Ml = £/(*«+» »£+,). Jb-l V praxi se zřídka užívá hodnoty m větší než 2. Pod metodou prediktor-korektor se většinou v literatuře rozumí právě popsaná metoda, někdy dokonce jen její speciální případ s m = 1. Žádná z těchto metod nespadá do třídy lineárních fe-krokových metod, neboť veličiny j/m) a f(x,y^) v nich nevystupují lineárně. Předchozí teorii tedy nelze bezprostředně užít a má-li mít metoda (4.257) rozumný smysl, musíme vyšetřit její konvergenci. Omezíme se přitom na případ m = 1. Věta 4.14. Bud" dána Dstabilní mnohoktoková metoda (4.57) rádu p ž 1 a explicitní metoda (4.256) řádu p" ž 0. Nechť jsou dále splněny předpoklady (i) a (ii) z cl. 1 a nechť přesné řešení jc dostatečně hladké. Nechť konečně počáteční podmínky jsou dány s přesností 0(hr), kde r = min(p* + 1, p), nebo vyšší. Pak pro pňbližné řešení j/l'-1 vypočtené metodou prediktor-korektor (4.257) s m = 1 platí pro h —* 0, x„ = x (4.258) S/W-»/K)-0(V). Důkaz Protože prediktor je řádu p* a korektor řádu p, platí pro každou 98 4 MNOHOKROKOVÉ METODY dostatečně hladkou funkci y, a tedy také pro přesné řešení (4.259) ~ hY^FJix^) = Cp*.+1^*+1^x„)^*+1 + 0(h»*+2) (4.260) X>„y(rn+„) hÝ^M{^) = Cr^1\xn)h^ + 0(h''^). v—Q v=0 Zavedeme-li veličiny e„ a e^0' rovnicemi e„ = j/S,1' - y(xn) a el°' = — y(x„), je (4.261) «íe^ + £<e"+" = l/=0 = h^2rZ9n+,en+l,-C;.+iy^^(xn)h^^ + 0(h''^) (4.262) ^Ce"e"+" = AA?ľ+ien+i + hJ^P»9n+»en+v- - Cp+isíp+1>(a„)fcp+1(*»)W+1 + 0(W+2), kde jsme položili f /c*.,*!.'')-/(»■*(» (4.263) g„ = i pro e„ # 0 pro e„ = 0 (4.264) 9ä. (0) : 0 pro eiC) = 0. Vyloučíme-li z rovnic (4,261) a (4.262) veličinu e£Jt, dostaneme & Ä — 1 .3 (4.265) ^a"e"+" ftD [A-fe+K + ^J-ffi+tí-^J + A#ff"+i')] e»+* » !/ = 0 J/=0 fc + 0(nř'*+3) + 0(h"+2) = 0(hT+'). Protože polynom daný koeficienty a„ splňuje podmínky O-stabillty a protože chyba v počátečních podmínkách je řádu 0(hr), plyne tvrzení věty ihned z lemmatu 4.3. Z právě dokázané věty vidíme, že ke konvergenci metody prediktor-korektor v námi uvažovaném případě m - 1 není vůbec třeba, aby prediktor byl £>-stabilní. I. OBYČEJNÉ DJf ERENCIALNl ROVNICE ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Dále je rovněž vidět, že k tomu, abychom dosáhli touto metodou stejnou řádovou přesnost, jako kdybychom použili pouze implicitní metodu danou korektorem (tj. kdybychom iterovali do konvergence), může být řád prediktoru o jedničku menší než řád korektoru. Poznámka 4.7. V případě obecného m zůstává věta 4.14 v platnosti, položíme-li r — min(p* + m,p). Důkaz je úplně stejný. Uvědomíme-li si, že technika, kterou jsme užili k důkazu věty 4.14, je zcela analogická, jako technika užitá v podobné situaci v případě mnohokrokové metody, je zřejmé, že pro metodu prediktor-korektor platí i tvrzení analogická k ostatním tvrzením, která jsme dokázali v případě lineární mnohokrokové metody. Speciátně aplikujeme-li metodu (4.257), opět s m = 1, na rovnici y' — Ay, dostaneme pro přibližné řešení y^ rovnici * t-i „ (4.266) 5>Ä = M£ [ä, + + hAfi)]£l,. To je opět lineární diferenční rovnice s konstantními koeficienty. Platí tedy vzorec zcela analogický ke vzorci (4.205), jen růstové parametry jsou nyní jiné. Čísla A; ve vzorci (4.205) jsou totiž definována rovnicí (4.155), kde £« je kořen charakteristického polynomu g diferenční rovnice (4.145) a & je kořen polynomu g. Růstové parametry A;1^ uvažované metody prediktor-korektor jsou tedy definovány rovnicí (4.267) $l) = &\l + )P)hA + 0(h% i = l,. .,m, kde fj1^ je kořen polynomu #W daného rovnicí (4.268) ět»(í) - g(0 - M{ff(£) -Mk + %[-ř'(í) + «íí* + l^iO]} = = e(0 - hA\<r(() - §«*(£) + nA§o-*(0l L ak ak 1 a m je počet podstatných kořenů polynomu g. Postupem zcela analogickým jako v odst. 4.2.3 plyne z rovnice (4.267) a (4.268), že platí fn «r(í.)-ÍMčO (4'269) V' MÍ) ■ Přítomnost prediktoru mění tedy růstové parametry korektoru, a tím také asymptotické chování chyby. V následujícím příkladě ukážeme, jak lze této skutečnosti využít. Příklad 4.3. Uvažujeme Milnovu-Simpsonovu metodu (srv. odst. 4.1.5) (4.270) yn+2 -yn = |ft(/„+a + 4/n+i + /„)■ 100 4 MNOHOKROKOVÉ METODY Tato metoda je řádu 4, je tedy optimální ve smyslu věty 4.12 a podle věty 4.13 je slabě nestabilní. (Přímým výpočtem zjistíme, že je A2 — —1/3.) Její užití může být v případě některých rovnic nebezpečné. Přibereme-li k metodě (4.270) metodu (4.67) jako prediktor a korigujeme-li pouze jednu, dostaneme metodu prediktor-korektor řádu 4, neboť metoda (4.67) je řádu 3. To, že metoda (4.67) není samostatně použitelná, neboť není £>-stabilní, u prediktoru podle věty 4.14 nevadí. Ze vzorce (4.269) snadno vypočteme, že růstový parametr Aj ' právě sestrojené metody je roven jedné. Přítomnost vhodného prediktoru odstranila tedy slabou nestabilitu Milnovy-Simpsonovy metody (4.270). V tabulce 4.11 jsou uvedeny výsledky konkrétního numerického řešení diferenciální rovnice y1 = 1—y2 s počáteční podmínkou y(0) = 5 metodou (4 270) a metodou prediktor-korektor (4.67) a (4.270). Tabulka 4.11 Řešení diferenciální rovnice y' — 1 — y2 MHnova-Simpsonova metoda Metoda prediktor-korektor (4.67) a (4.270) Bn yn 190 191 192 1,0034734603 1,0034671476 1,003258 502 6 -0,0000508966 0,000051 4090 -0,000 0519709 1,003 5243708 1,0034157504 1,003310486 5 0,0000000139 0,0000000118 0,0000000131 318 319 320 0,9998711821 1,000257714 5 0,999863 209 2 -0,0001932573 0,000195 2578 -0,000197325 9 1,000064 4396 1,00D062 4569 1,000 060 535 3 0,0000000003 0,0000000002 0,000 000 000 2 V obou případech byl užit integrační krok h — 1/64 a hodnota yi byla vzata z přesného řešení. Vidíme, že výsledky jsou i v nelineárním případě takové, jak jsme teoreticky očekávali. Závěrem tohoto odstavce ještě poznamenejme, že metoda daná rovnicemi (4.27i) «;p&+£oc«ftl = fcEft/í*-^";1'), ■i«£í*l) +*í>»i+), = hM(xn+k,y„Ík)+ k-\ + ^W(«™+n!/ÍT»1)). s = °. -,m-l, 101 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI se rovněž nazývá metoda prediktor-korektor. Rozdíl mezí oběma popsanými variantami je v tom, že v každém kroku užíváme v bodech, v nichž už je přibližné řešena vypočteno, v případě metody (4.257) hodnoty f(xr,yím^), zatímco v případě metody (4.271) hodnoty f{xr,yím ^). Při způsobu daném rovnicemi (4.257) je tedy nutno vypočítávat o jednu hodnotu pravé strany dané diferenciální rovnice více než při způsobu (4.271). Abychom byli schopni stručně a jednoznačně popsat, který z uvedených způsobů máme v konkrétní situaci na mysli, zavedeme následující symbolické značení (které je v literatuře týkající se problematiky řešení diferenciálních rovnic už zcela standardní). Symbolem P označíme užití prediktoru, symbolem E výpočet hodnoty pravé strany a symbolem C užití korektoru (důvody k zavedení těchto symbolů jsou mnemotechnické a pocházejí od anglických slov prediction, evaluation a correction). Postup (4.271) s m = 1 se tedy užitím této symboliky zapíše jako PEC, s m — 2 jako PECEC = P(ECf atd. obecně P(EC)m. Postup (4.257) je pak označen PECE, P(EC)2E atd. Z uvedeného zápisu je také hned vidět, kolikrát je třeba v jednom kroku vypočítávat hodnotu pravé strany dané diferenciální rovnice. Teoretické zkoumání metod pTediktor-korektor v režimu P[EC)m je obdobné, jako tomu bylo u metod P(EC)mE. 4.3.2 Volba integračního kroku Jeden z nej nesnadnějších problému, který je třeba rozřešit při konkrétní aplikaci mnohokrokové metody, je volba integračního kroku. Odhady celkové diskretizač-ní chyby neposkytují k této volbě vhodné vodítko, neboť jsou skoro vždy natolik pesimistické, že vedou k zbytečně a často také neúnosně malé hodnotě integračního kroku. Proto se většinou užívá při řešení této otázky přístup, kdy integrační krok se volí tak, aby lokální diskretizační chyba byla přijatelně malá a aby číslo z = kdf/dy leželo v intervalu stability užité metody, což zabrání nebezpečnému nakupení lokálních chyb v dalším průběhu výpočtu. Při odhadu lokální diskretizační chyby podle (4.141) vzniká značná praktická obtíž spočívající v nutnosti odhadu (p+ l)-ní derivace hledaného řešení. Užijeme-li však vhodným způsobem metodu prediktor-korektor, můžeme se nutnosti odhadu vyšších derivací vyhnout užitím postupu, který pochází od W. E. Milného. Popišme jej v případě metody PECE a za zjednodušujícího předpokladu, že hodnoty yn,..., vypočtené v pře- dešlých krocích jsou rovny hodnotám přesného řešení. Za tohoto předpokladu je přibližné řešení dáno rovnicemi Jc-l i-I (4.272) a*kyWh + ,£<y^n+,) = A */(*„+,)), ft-1 102 4 MNOHOKROKOVÉ METODY Předpokládáme-li, že prediktor a korektor mají stejný rád p, platí (pro každé dostatečně hladké řešení dané diferenciální rovnice) * k-l (4.273) £«£»(*»+..) = &£#/(*»+./,*(*..+.■)) + v—0 f/=C + C;+1y(f+1Hxn)h"+1 +0(h"+3), k k ^a„j/(a;„+„) = h ^ @vf(xn+v, y(xn+v)) + + Cp+1y^\xn)h"+1+0(h^2). Odečteme-li první rovnici (4.273) od první rovnice (4.272) a druhou rovnici (4.273) od druhé rovnice (4.272), dostáváme (4.274) - y(xn+k)] = -C;+l2/'+1>K)n'+1 + 0(/r+2) a (4.275) ah[y% - y(x„+k)] = - Cp+1y^+1Hxn)k"+í + 0(A"+2)+ + hfa [f(xn+h, y^J - f(xn+i, v(<cn+i))] = = _ - Cp+1^+1)(s„)Ŕ"+1 + 0(h"+2). Všimněme si, že vzorec (4.275) znovu dokazuje skutečnost známou nám už z důkazu věty 4.14, totiž, že hlavní část lokální chyby metody PECE je za předpokladu rovnosti řádu prediktoru a korektoru stejná jako hlavní část lokální chyby korektoru. Vyloučíme-li nyní z rovnice (4.274) a (4.275) hodnotu přesného řešení y(xn+]!)1 máme (4-276) - £>h = (3±i - ^±1) + 0(k'+í). Platí tedy celkem (4.277) y^(xn) = (3±i - ) "V-^ - $ J + 0{k), ak ak ' což je zmíněný Milnův vzorec. Podtrhněme ještě jednou, že rovnost řádů prediktoru a korektoru je zde podstatný předpoklad. Abychom byli schopni zvolit integrační krok tak, aby byla zaručena stabilita, potřebujeme odhadnout velikost čísla df/dy v každém kroku. To pak umožní vypočítat číslo z = hdf/dy a posoudit, zda leží v předem známém intervalu absolutní (relativní) stability. Jedna z možností, jak to provést, vychází opět z metody 103 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI 5 POROVNÁNÍ MNOHOKROKOVÝCH METOD A RUNGOVÝCH-KUTTOVÝCH METOD prediktor-korektor v režimu PECE a spočívá v užití takřka zřejmého přibližného vzorce (4.278) ~dy k „CD ZJ®-" Tento postup však nelze jednoduše přenést na případ soustav diferenciálních rovnic. 4.3.3 Změna integračního kroku V předešlém odstavci jsme stručně shrnuli požadavky, které je třeba klást na přípustný integrační krok. Aby výpočet probíhal co nejekonomičtěji, je žádoucí, aby se integrační krok volil co největší. Připomenutá kritéria však na něj mohou klást v různé fázi výpočtu nestejně přísná omezení. A nalezneme-li tedy možnost, jak v průběhu výpočtu integrační krok měnit, bude patrně výsledný algoritmus ekonomičtějším, než když se této možnosti vzdáme. U Rungových-Kuttových metod změna integračního kroku nepředstavuje žádný technický problém, neboť provést jeden krok této metody znamená vlastně řešit novou úlohu. V případě ^-krokových metod je situace odlišná, neboť k výpočtu přibližné hodnoty y„+k v bodě in+t je zapotřebí znát přibližné hodnoty hledané funkce y a funkce / v bodech x„+k-i, ■ ■ ■ ,xn. Ty mohou být už vypočteny v předchozích krocích, ale také tomu tak nemusí být. Jestliže např. před výpočtem přibližné hodnoty yn+t integrační krok zdvojnásobíme (tak sc to často dělá. dovolují-li velikost lokální chyby a požadavky stability zvětšení integračního kroku), jsou všechny potřebné hodnoty k dispozici, neboť jde o hodnoty v bodech xn+k^i,xn±i-3,..., xn_i+1 a ve všech těchto bodech se přibližné řešení v předchozím průběhu výpočtu už počítalo. Některé z těchto hodnot si však nebylo třeba pamatovat při výpočtu s pevným integračním krokem, a tedy i při zvětšování integračního kroku mohou vzniknout jisté nevelké programovací obtíže. Jestliže však integrační krok před výpočtem hodnoty yn+k rozpůlíme, potřebujeme znát hodnoty funkce y a / v bodech z„+*-i,*n+t-3/Si ■ ■ •. *n+(*-i)/2> přičemž ty z nich, kde příslušný index není celé číslo, se v předchozím výpočtu nepočítaly. V dalším výkladu naznačíme tři způsoby, jak tyto dodatečné hodnoty získat. Patrně nejjednodušší z programátorského hlediska je způsob, kdy se na tento problém díváme jako na speciální problém získání počátečních hodnot pro užití mnohokrokové metody. Pro výpočet potřebných hodnot funkce y použijeme tedy např. Rungovu-Kuttovu metodu a potřebné hodnoty funkce / pak dopočteme vypočtením hodnot pravé strany dané diferenciální rovnice. Druhý způsob spočívá v dopočítání potřebných hodnot funkce y pomocí standardní interpolace. Samozřejmě je třeba volit interpolační vzorec tak, aby chyba interpolace byla stejného řádu, jako je lokální diskretizační chyba použité metody. Upozorněme, že v případě, že dvojice prediktor-korektor je tvořena Adamsovou-Bashforthovou a Adamsovou-Moultonovou metodou, je potřebná funkční hodnota 104 funkce y vždy známá, neboť jde o hodnotu j/„+jt_i, takže lze interpolovať přímo funkci /, což ušetří počet potřebných výpočtů funkčních hodnot pravé strany dané diferenciální rovnice. Konečně se používá postup, který pochází od A. Nordsiecka a jehož základní myšlenka spočívá v tom, že místo hodnot funkce y a, f v několika bodech (které potřebujeme v dalším kroku metody) se uchovávají v paměti derivace lokálního interpolačního polynomu, který představuje přibližné řešení, v jediném bodě. Do dalších podrobností zde už nebudeme zacházet; upozorněme pouze, že tento postup je ve srovnání s předešlými z programátorského hlediska komplikovanější. 5 Porovnání mnohokrokových metod a Rungových-Kuttových metod V tomto článku se velice stručně dotkneme závažného a z praktického hlediska nepominutelného problému výběru konkrétní metody k přibližnému řešení konkrétní matematické úlohy. Tento problém prolíná celou numerickou matematikou a chceme-li řešit jakoukoliv matematickou úlohu až od konce (tj. až do získání konkrétních čísel), musíme se s ním tak či onak vyrovnat. Poněkud paradoxně na první pohled je situace svým způsobem jednodušší v těch případech, kdy je úloha natolik složitá, že jsme rádi, že máme k jejímu řešení k dispozici vůbec nějakou metodu Existuje-li však celá třída metod a to ještě pro celou třídu úloh, je otázka výběru nejvhodnější metody nesmírně složitá a v současné době zatím matematicky obecně nerozřešená. Při prakticky nezbytném výběru konkrétní metody jsme tedy nuceni se řídit pouze určitými vodítky, která se budou ovšem opírat o matematicky přesně definované pojmy a rigorózně dokázaná tvrzení. To také je důvod důležitosti podrobného teoretického zkoumání přibližných metod a tomuto účelu je také podřízen obsah této knihy. Následující porovnání Rungových-Kuttových metod a metod prediktor-korektor užitých v režimu PECE je proto nutno chápat pouze jako příklad postupu při praktické interpretaci teoretických výsledků, který ani zdaleka nevyčerpáva zmíněnou problematiku. Metody obou zmíněných skupin budeme porovnávat z hlediska lokální přesnosti (k jejíž hrubé charakteristice slouží řád metody), z hlediska charakteru stability, z hlediska pracnosti (měřené množstvím výpočtů hodnot pravé strany) a z hlediska složitosti algoritmu, a tím také složitosti programování. Všimněme si nejprve lokální přesnosti metod, které mají stejný řád p. Má-li pre-diktor a korektor řád p, je hlavní část lokální diskretizační chyby metody prediktor-korektor dána výrazem (5.1) kde C = Cp+i/gfl) je konstanta chyby korektoru. Hlavní část lokální diskretizační 105 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI chyby Rungovy-Kuttovy metody je tvaru (5.2) v>(«», »(*»)) přičemž <p závisí na přesném řešení dané diferenciální rovnice podstatně komplikovaněji než v případě metody prediktoť-kořektor. Abychom to konkrétně dokumentovali, stačí se podívat na vzorec (3.85), v němž je uveden tvar této funkce pro standardní Rungovu-Kuttovu metodu čtvrtého řádu. Z uvedených vzorců je vidět, že přímé srovnání hlavních částí lokální diskretizační chyby není možné. Praktické zkušenosti však ukazují,k že lokální chyba Rungových-Kuttových metod čtvrtého řádu je většinou menší než lokální chyba metod prediktor-korektor téhož řádu. Toto srovnání se však může změnit, učiníme-li předpoklad, že budeme porovnávat metody stejného řádu za doplňující podmínky, že obě srovnávané metody užívají tentýž počet hodnot pravé strany dané diferenciální rovnice. Protože pro p g 4 existují Rungovy-Kuttovy metody řádu p vyžadující p hodnot pravé strany a neexistují metody, u nichž je tento počet nižší, a protože metody prediktor-korektor užité v režim PECE vyžadují dvě funkční hodnoty na jeden krok, lze při zachování stejné pracnosti užít u metod PECE integrační krok, který je (2/p)-násobkem integračního kroku Rungovy-Kuttovy metody. Za těchto podmínek je třeba výraz pro hlavní část lokální diskretizační chyby metody PECE nahradit výrazem (5.3) c^M{^y+\ ze kterého plyne, že při tomto způsobu porovnání je lokální chyba metod prediktor-korektor už většinou menší než chyba Rungových-Kuttových metod. Snaha porovnávat přesnost Rungovy-Kuttovy metody a metody prediktor-korektor pouze z hlediska počtu potřebných hodnot pravé strany bez ohledu na jejich řád nemá dobrý smysl, neboť u metod prediktor-korektor lze řád libovolně zvýšit, aniž by bylo třeba výpočtu dalších funkčních hodnot. Velikost intervalů absolutní stability se mění s řádem u Rungových-Kuttových metod úplně jinak než u lineárních í;-krokových metod. Snadno se zjistí, že interval absolutní stability Rungovy-Kuttovy metody řádu p užívající p hodnot pravé strany (takové metody existují jen prú pá 4) závisí pouze na p a nikoliv na konkrétní metodě. Tyto intervaly jsou po řade (-2; 0), (-2; 0), (-2,51; 0), (-2,78; 0) pro metodu prvního až čtvrtého řádu, a tedy se s rostoucím řádem poněkud zvětšují. Z tabulky 4.10 naproti tomu je vidět, že intervaly stability Adamsových metod se se zvětšováním řádu dosti podstatně zmenšují. Intervaly absolutní stability u Rungových-Kuttových metod jsou přitom podstatně příznivější než u explicitních Adamsových metod. I u jiných explicitních mnohokrokových metod je tomu podobně a to je také důvod, proč se tyto metody samostatně většinou nepoužívají. Dále je třeba si uvědomit, že užijeme-li implicitní metodu jako část metody prediktor-korektor, je tím její interval absolutní stability rovněž ovlivněn, většinou pak nepříznivě. Tak např. PECE Adamsova-Bashforthova a Adamsova-Moultonova metoda čtvrtého řádu 5 POROVNÁNI MNOHOKROKOVÝCH METOD A RUNGOVÝCH-KUTTOVÝCH METOD má interval absolutní stability (—1, 25; 0) oproti intervalu (—3; 0) u čisté Adamsovy-Moultonpvy metody. Interval absolutní stability této metody prediktor-korektor je tedy zhruba poloviční než u Rungovy-Kuttovy metody 4. řádu. Uvšdomíme-li si však, že při stejné pracnosti metoda PECE umožňuje užití polovičního integračního kroku než u standardní Rungovy-Kuttovy metody, je interval absolutní stability takové metody vlastně dvojnásobný. Potom jsou však standardní Rungova-Kuttova metoda a Adamsova-Bashforthova-Moultonova PECE metoda z hlediska stability v podstatě rovnocenné. Kromě toho, co bylo právě řečeno, je třeba při porovnávání Rungových-Kuttových metod a mnohokrokových metod z hlediska stability vzít také v úvahu, že je-li daná úíoha takového charakteru, že při jejím řešení vznikají vážné problémy se stabilitou, umožňují mnohokrokoyé metody mnohem více prostoru pro modifikace zlepšující stabilitu než Rungovy-Kuttovy metody. Tak např. iterujeme-li s Adamsovým-Moultonovým korektorem druhého řádu do konvergence, je příslušný interval absolutní stability (—co; 0). Tedy i porovnání z hlediska stability spíše mluví pro metody prediktor-korektor. Porovnání Rungových-Kuttových metod a mnohokrokových metod z hlediska složitosti programování vyzní naproti tomu dosti jednoznačně ve prospěch Rungových-Kuttových metod. Nepotřebují žádné speciální procedury na začátku výpočtu a změna velikosti integračního kroku v kterékoliv fázi výpočtu rovněž nepředstavuje technicky žádný problém. Cheeme-li však řídit velikost integračního kroku na základě kritérií zformulovaných v odst. 4.3.2, je třeba mít možnost odhadnout velikost lokální diskretizační chyby a velikost derivace df/dy. U metod prediktor-korektor se tyto odhady získají relativně jednoduše a hlavně lacino co do počtu potřebných operací (viz odst. 4,3.2), TJ Rungových-Kuttových metod je to sice také možné (hlavní část lokální chyby lze např. odhadnout metodou polovičního kroku analogicky, j ako se to dělalo pro celkovou diskretizační chybu, viz cvič. 12, nebo lze k tomu cíli užít dvou metod různých řádů, viz Fehlbergova metoda (3.25)), zaplatí se však za to většinou dosti vysoká cena ve vzrůstu nároků na počet operací. Shrneme-li výsledky porovnání, lze soudit, že zejména z hlediska univerzálnosti a možnosti řízení stability a velikostí lokální chyby je třeba dát metodám prediktor-korektor přednost před Rungovýrni-Kutťovými metodami. Jednoduchost logické struktury příslušného algoritmu je pak významnou předností Rungových-Kuttových metod, takže i tyto metody mohou být dosti užitečné zejména v případech malých nároků na přesnost. Poznamenejme ještě, že v praktické situaci je výběr konkrétní metody často podstatně ovlivněn také tím, že je k dispozici skutečně fungující a ověřený program. Tento program pak většinou použijeme a spokojíme se tím, že výběr rnetody za nás vlastně už provedl autor programu. Předchozí text měl sloužit zejména k tomu, aby čtenáři alespoň naznačil, jakými směry by se měly ubírat úvahy při vytváření nových programů. 106 107 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI 6 Soustavy diferenciálních rovnic a problematika silného tlumení Máme-li řešit úlohu s počátečními podmínkami pro soustavu diferenciálních rovnic (1.1), lze v principu užít všechny metody, které jsme až dosud popsali a stačí přitom pouze předpokládat, že veličiny y„ a f„ jsou m-dimenzionální vektory. Vznikají však také některé rozdíly a některé nové problémy, které stručně popíšeme v následujícím odstavci, 6.1 Lineární mnohokrokové metody Lineární fc-kroková metoda pro řešení soustavy (1.1) je dána vzorcem * k (6.1) ^2a„yn+l, = h'YjPJn+v: kde (6.2) y» = (1!ft,,--,"W\ fn = Qfn,...,mfn)T a (6-3) 'A = 7(*n,1Ifci, .-,m2M)- Všechny základní teoretické výsledky, které jsme zformulovali v čl. 4 pio jednu diferenciální rovnici, jako jsou např. věty o konvergenci, o řádu metody atd., zůstávají v platnosti i v případě soustavy diferenciálních rovnic. Jen je třeba si uvědomit, že lokální chyba je nyní m-dimenzionální vektor a nikoliv skalár, a že tam, kde se vyskytují v různých odhadech absolutní hodnoty, je třeba užít nějakou normu v m-dimenzionálním vektorovém prostoru. V problematice stability při pevném integračním kroku však dochází k podstatným rozdílům. V definici absolutní nebo relativní stability se totiž vyskytoval parametr z = h A, kde A byl odhad derivace df/dy pravé strany dané diferenciální rovnice. Roli tohoto čísla hrají nyní vlastní čísla Jacobiovy matice df/dy, tj. matice - 9^/_ ajj_ a1/ ■ dly d3y 8">y a"1/ am/ o™ f . dly d'2y 8my . Protože tato matice není obecně symetrická, mohou být její vlastní čísla i komplexní a za parametr z v definici intervalu stability je nyní třeba vzít komplexní číslo. V souvislosti se soustavou diferenciálních rovnic tedy mluvíme o oblastech stability, které se zavádějí obdobně jako intervaly stability. Kromě případu nejjednodušších metod nelze většinou popsat oblast stability jinak než obrázkem. Jako příklad může sloužit obr. 6.1, v němž je znázorněna oblast absolutní stability Adamsovy-Moultonovy metody čtvrtého řádu. 6 SOUSTAVY DIFERENCIÁLNÍCH ROVNIC A PROBLEMATIKA SILNÉHO TLUMENI Obr. 6.1 Oblast stability Adamsovy-Moultonovy metody čtvrtého rádu 6.2 Rungovy-Kuttovy metody Metody této třídy lze rovněž aplikovat úplně beze změny i v případě soustavy diferenciálních rovnic. Je jen třeba pokládat veličiny íalrve vzorcích (3.17) a (3.18) za m-dimenzionální vektory. Upozorněme však na to, že řád některých Rungových-Kuttových metod může být v případě soustavy rovnic nižší než v případě jedné rovnice. Tento jev nastává pouze pro některé metody řádu vyššího než 4, a ty se v praxi málo užívají. U všech metod vyššího řádu než 4, které jsme uvedli v odst. 3.1, však tento jev nenastává a jejich řád nezávisí na tom, zda jsou užity v případě jedné nebo více diferenciálních rovnic. Pokud jde o stabilitu při pevném integračním kroku, platí totéž, co bylo řečeno v souvislosti s lineárními Jb-krokovými metodami. Ve shodě o tom, co víme o intervalech stability Rungových-Kuttových metod prvního až čtvrtého řádu, které užívají jednu až čtyři hodnoty pravé strany, jsou pro tyto metody i oblasti stability nezávislé na konkrétní metodě. Tyto oblasti jsou znázorněny na obr. 6.2. 6.3 Problematika řešení diferenciálních rovnic se silným tlumením V mnoha oblastech aplikací, zejména v problémech chemického inženýrství a v problémech regulace, vznikají soustavy diferenciálních rovnic, které vykazují jev, který je v anglicky psané literatuře znám pod jménem „stiffhess". Doslovný překlad tohoto termínu „tuhost" se nám v češtině příliš nelíbí a budeme jej většinou opisovat tak, že budeme mluvit o soustavách diferenciálních rovnic se silným tlumením. Podstatu tohoto jevu objasníme na následujícím jednoduchém příkladě, 108 109 OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Obr. 6.2 Oblasti stability Rungových-Kuttových metod Mějme soustavu (6.5) y' = Ay + b(x) m lineárních diferenciálních rovnic, kde A je čtvercová konstantní matice řádu m s navzájem různými vlastními čísly Á; a odpovídajícími vlastními vektory u;. Obecné řešení této soustavy se dá v tomto případě psát ve tvaru (6.6) /O) =£eieiiaruť + p(z), kde p(x) je partikulární řešení nehomogenní soustavy (6.5). Předpokládejme, že je ReA,- < 0 pro i = 1,..., m. Pak platí (6.7) ^cjeAii5Uj —» O pro x —» co. Z tohoto důvodu mluvíme o kombinaci ve vzorci (tí.7) jako o přechodovém řešení a o vektoru p(x) jako o ustáleném řešení. Buďte dále Amax a \miri taková vlastní čísla, že platí (6.8) |ReAraax| ž |ReA,| ž |ReAmin|, i = l,...,m. Je-li naším úkolem vypočítat ustálené řešení, je třeba řešit soustavu (6.5) nejméně 110 6 SOUSTAVY DIFERENCIÁLNÍCH ROVNIC A PROBLEMATIKA SILNÉHO TLUMENI až do toho bodu, v němž je nejpomaleji klesající exponenciála v přechodovém řešení už zanedbatelná. Cím menší je tedy |ReAmin |, tím na delším intervalu je třeba soustavu (6.5) řešit. Na druhé straně z důvodu zachování stabilního průběhu výpočtu je žádoucí volit integrační krok h tak, aby číslo z = ftAmax leželo v oblasti absolutní stability užité metody. Je-li tato oblast omezená, je omezení, které zmíněný požadavek klade na velikost integračního kroku tím přísnější, čím větší je |ReAmax|. Je-li |ReA max I podstatně větší než |ReAmin|, můžeme se tedy dostat do obtížné situace řešit na dlouhém intervalu diferenciální rovnici a užít při tom integrační krok, který je v kterékoliv fázi výpočtu velice malý vzhledem k délce příslušného intervalu O soustavě, která vykazuje právě popsané chování, mluvíme jako o soustavě se silným tlumením. Poměr (6.9) s=|m=s| zvaný S-poměr dané soustavy přitom slouží za míru zmíněných obtíží. Cím je číslo S větší, tím hůře se soustava chová. V případě, že soustava (6.5) je nelineární, je třeba vlastní čísla matice A nahradit vlastními čísly Jacobiovy matice (6.4). Protože ta už nejsou konstantní, může se charakter uvažovaného jevu měnit v závislosti na nezávisle proměnné x. Za předpokladu, že pravá strana dané soustavy diferenciálních rovnic má v nějaké vhodné oblasti omezené všechny parciální derivace podle proměnných 1y.....my, lze za její Lipschitzovu konstantu vzít číslo L — \\df/dy\\. Tato konstanta bude při velkém čísle |ReAmax| rovněž velká. Proto se o soustavě se silným tlumením mluví také jako o soustavě s velkou Lipschitzovou konstantou. Je třeba podtrhnout, že v uvedené definicí jsme se záměrně vyhnuli tomu, abychom udali, co přesně kvantitativně znamenají slova „ |ReAmax| je podstatně větší než |ReAmm|". Jinými slovy neuvedli jsme žádnou konkrétní hranici, kdy se už soustava chová špatně a kdy ještě ne. To vzhledem k heuristické povaze zmíněné definice není ani možné; je jen jasné, že Čím je větší S-poměr, tím je popsaný jev závažnější, Uveďme pou2e, že soustava s 5-poměrem 20 se pokládá ještě za velmi rozumnou, a že se nezřídka v praxi vyskytují soustavy, kde je toto číslo 106. Následující příklad ukazuje, že obtíže spojené s řešením soustav diferenciálních rovnic se silným tlumením se mohou drasticky projevit už ve velmi jednoduchém případě. Příklad 6.1. Řešme soustavu diferenciálních rovnic y1 — z, z' — — 106jř — - (106 4- l)z s počátečními podmínkami y(0) — 1, z(0) = -1 » s presnýmřešením y(x) =,e~x a z(z) = —e~x EuIětovou metodou. Interval absolutní stability této metody je (—2,0), iterační krok je tedy třeba volit menší než 2.10-6 (vlastní čísla matice uvažované soustavy jsou —1 a —106). Tak např. při výpočtu s integračním krokem h = 10~5 dostaneme zcela nesmyslné výsledky už po provedení pouhých několika desítek kroků a to v situaci, kdy se přesné řešení chová jako e-1. Stejné přesné řešení má i diferenciální rovnice y1 =t —y s počáteční podmínkou j/(0) - 1. 111 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI 6 SOUSTAVY DIFERENCIÁLNÍCH ROVNIC A PROBLEMATIKA SILNÉHO TLUMENÍ Řešíme-li však tuto rovnici Eulerovou metodou, není v intervalu (0,1) celková dis-kretizační chyba větší než 2.10-5, použijeme-li dokonce podstatně větší integrační krok h = ÍO-4. Zvolíme-li na druhé straně k řešení dané soustavy tzv. implicitní Eulerovu metodu yn+i = yn + hf{xnjr\, j/n+i)> která má interval absolutní stability (—oo,0) a položíme-li h = 10-4, vypočteme řešení na intervalu (0,1) s přesností na 4 desetinná místa, tedy stejnou, jako v případě explicitní Eulerovy metody a rovnice y1 — —y. Řešíme-li soustavu diferenciálních rovnic se silným tlumením, je tedy žádoucí užít k tomu takovou metodu, že omezení, která z ní plynou pro integrační krok z důvodu zachování stability, nejsou pokud možno příliš vážná. Z tohoto hlediska se zdá rozumné omezit se v této situaci na takové metody, jejichž oblast absolutní stability obsahuje celou levou polorovinu komplexní roviny. V tomto případě požadavky stability nekladou na velikost integračního kroku žádné omezení bez ohledu na to, jak velké je číslo |ReAmax|. Metody mající tuto vlastnost se nazývají A-stabilní a pro jejich zřejmou důležitost si jich všimněme poněkud podrobněji. Vzpomeneme-li si, že interval stability byl definován na základě chování přibližného řešení modelové diferenciální rovnice (6.10) V1 - Ay při n —> oo, je skoro na první pohled patrné, že žádná Rungova-Kuttova metoda nemůže být j4 stabilní. Skutečně, přibližné řešení diferenciální rovnice (6.10) libovolnou Rungovou-Kuttovou metodou je totiž dáno vzorcem (6.11) kde z = hA a P(z) je polynom stupně nejméně 1. Nutná a postačující podmínka A-stability této metody je tedy platnost nerovnosti \P(z)\ < 1 pro všechna z, pro než je Rez < 0. To však není možné, neboť funkce P je polynom, a má tedy v nekonečnu pól. Komplikovanější situace je v případě lineární fc-krokové metody. Podle definice 4.5 je tato metoda .A-stabilní právě tehdy, má-li třetí charakteristický polynom (6.12) «<*,£) = e(É)-*»(ť) při libovolném z takovém, že Rez < 0 všechny kořeny uvnitř jednokrokového kruhu. K dalšímu vyšetřování A-stability mnohokrokových metod bude užitečná jiná nutná a postačující podmínka. Její formulace je obsahem následujícího pomocného tvrzení. Lemma 6.1. Buď dána lineární k-kioková metoda, jejíž charakteristické polynomy g a rr nemají společné činitele. Buď dále R racionální funkce definovaná 112 (6.13) Pak je daná metoda A-stabilní tehdy a jen tehdy, je-li funkce R holomorfní vně jednotkového kruhu a platí-li pro ni (6.14) ReÄ(í) g 0 pro |£| > 1. Důkaz. Předpokládejme nejprve, že daná metoda je A-stabilní a buď fa takový bod ležící vně jednotkového kruhu, v němž je funkce R regulární. Pak v důsledku toho, že polynomy g a u nemají společné činitele, platí c(£o) ^ 0. Položíme-li z — iž(fo) = e(£o)/<r(to), je ío kořenem polynomu (6.12) pro toto z. Protože Je l£o| > li je v důsledku A-stability Rez ž 0. Buď dále > 1 takový bod, že Je <r(íi) = 0. Pak opět v důsledku nesoudělnosti polynomů g a c platí r>(£i) ^ 0 a funkce R se tedy chová v okolí bodu f = íi jako a(f - íi)~m, kde o^Oamje přirozené číslo. V okolí bodu í = íi tedy existují body, které stále ještě zůstávají vně jednotkového kruhu a v nichž nabývá funkce Reň jak kladných, tak záporných hodnot. To je ale ve sporu s právě dokázanou nerovností Reií(£) ž 0, která platí ve všech zmíněných bodech. Funkce H je tedy regulární pro každé |£| > 1 a platí (6.14). _ Nechť naopak podmínka (6.14) je splněna a nechť existuje pro nějaké z, pro něž je Rez < 0 kořen £i polynomu (6.12), pro který platí |fi| ^ 1. Pak je <r(fi) -£ 0, neboť v opačném případě by byl bod £i společným kořenem polynomů g a c, což není možné. Platí-li dokonce |fi| > 1, dostáváme spor s (6.14). Je-li = 1, plyne ze spojitosti funkce Rei? v bodě £ = f i existence bodu £2, pro který platí |f2| > 1 a Refí(f2) < 0. Došli jsme tedy opět ke sporu. Lemma je dokázáno. Pomocí tohoto lemmatu už snadno dokážeme základní a typickou vlastnost A-stabilních mnohokrokových metod zformulovanou v následující větě. Věta 6.1. A-stabilní lineární k-kroková metoda je implicitní (tj. platí pro ni & * o;. Důkaz Buď dána explicitní lineární &-kroková metoda. Je tedy /?j = 0 a pro funkci R definovanou rovnicí (6.13) platí ontk + - ■ ■ + <*o (6.15) «(í) kde ctk ^ 0, / 0 a s í 1. V okolí bodu v nekonečnu se tedy chová funkce R jako f * a nabývá tak hodnot jak z levé, tak z pravé poloroviny. Podle lemmatu 6.1 není tedy uvažovaná metoda A-stabilní. K tomu, abychom dokázali ještě závažnější vlastnost A-stabilních mnohokrokových metod, totiž že jejich řád je silně limitován, budeme potřebovat jedno pomocné 113 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI 6 SOUSTAVY DIFERENCIÁLNÍCH ROVNIC A PROBLEMATIKA SILNÉHO TLUMENI tvrzení, které pojednává o integrální reprezentaci holomorfní funkce s hodnotami v pravé polorovině komplexní roviny. Lemma 6.2. Buď funkce ip holomorfní v polorovině Rez > 0, a nechť platí (6.16) s\ip{\xip(x)\; 0 < x < co] < cc a (6.17) Re<p(z) ä 0 pro Rez g 0. Pak existuje omezená neklesající funkce u taková, že platí (\u(l) (6.18) 9(z) = [ J — ů pro každé z takové, že je Rez > 0. z — iť Důkaz lemmatu přesahuje elementární rámec této knihy a lze jej nalézt např. v knize Achiezer, Glazman (1950), str. 206. Věta 6.2. Maximální řád a-stabilní a D-stabilní lineární k-krokové metody takové, že polynomy q a a nemají společné činitele, je 2, Důkaz. Buď dána lineární i-kroková metoda řádu 2. Podle věty 4.9 má funkce g(£) — a(£) lnf v bodě ( — 1 kořen násobnosti p +1, tj. pro £ —» 1 platí (6.19) P(£) - «r({) ln í = -C(í - lf+1 + O ((£ - lf+2). V důsledku D-stability a konzistence je <r(l) 0; platí tedy pro £ —> 1 (6-20) í(ěj" ^(i) + jV(i)(£ -!) + .■■ + át»<*>(i)(e -1)* = = ^[1 + 0(Í-1)]. Dělíme-li rovnici (6.19) funkcí cr, dostáváme odtud, že pro £ —» 1 platí 0«) (6.21) ■ c-(£-~i)>«+o((f-ir+2)) kde jsme položili c* = c/<r(l).' Zaveďme nyní novou proměnnou z pomocí transformace (6.22) a položme í+1 , z+\ (-) K.)-(^)Mí±i)- 114 Protože transformace (6.22) převádí vnějšek jednotkového kruhu roviny £ na pravou polorovinu roviny z, lze lemma 6.1 vyslovit také tak, že uvažovaná lineární h-kroková metoda je A-stabilní právě tehdy, je-li funkce rjs holomorfní v polorovině Rez > 0 a má-li tam nezápornou reálnou část. Dále, protože je g(l) = 0, je polynom r v (6.23) stupně nejvýše k — 1 a protože je tr(l) ^ 0, je polynom s stupně Ir. Funkce xr(x)/s(x) je proto na intervalu (0, oo) omezená. Je-li navíc daná metoda A-stabilní, jsou pro funkci rjs splněny předpoklady lemmatu 6.2. Platí tedy (6.24) «(*) -r ■t — c Z — iť pro Rez > 0, kde u je vhodná ohraničená a neklesající funkce. Pro kladná x je však výraz xr(x)j s(x] reálný, neboť daná metoda má reálné koeficienty. Podle (6.24) tak dostáváme , , xr(x) [°° du(i) !x x(x + ít) , . . [°° x2 (o. Při pevném t je funkce x x2/(x2 + ť2) neklesající, a tedy také funkce x —i- ir(i)/s(a:) je neklesající. Přejděme konečně ve vzorci (6.21) k proměnné z. Dostaneme 2-1 SÍZ) \zJ \zP+2J (6.26) pro z —> oo. Protože je zřejmě (6.27) 2 2 'z - 1 """ 1 - i ,z 3*3 pro 2 —> oo, plyne z (6.26), že pro z —» oo platí »(f) (6.28) kde (6.29) s(z) z K3 'z3 \z5/ U je-li p = 2 je-li p > 2, Je-li daná metoda A-3tabilní, je funkce ir(a;)/s(í;) neklesající. Funkce 2 -I- (2/3 -— Sč)/x2 musí být tedy vzhledem k rovnici (6.28) také neklesající. To však pro p > 2 není možné a pro p = 2 je to možné právě tehdy, je-li koeficient u x~2 nekladný, tj. je-li c* ž 1/12. Věta je dokázána. Pro Adamsovu-Moultonovu metodu řádu 2 (6.30) y„+i - Vn + ih(/„+i 115 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI CVIČENÍ která se nazývá lichoběžníkové pravidlo, je c* = 1/12. Protože pro tuto metodu je r(z)/s(z) = 2/z, je A-stabilní. Adamsova-Moultonova metoda je tedy příkladem A-stabilní metody řádu dvě. Věta 6.2 říká, že žádná z eventuálně dalších A-stabilních metod nemá vyšší řád a z jejího důkazu dokonce plyne, že metoda (6.30) má mezi těmito metodami nejmenší konstantu chyby. Omezení na řád plynoucí z A-stability je velmi závažné a proto byla navržena řada dalších méně omezujících definic stability. Jeden z těchto pojmů je např. tzv. A(ct)-stabihia, kdy se požaduje, aby oblast stability obsahovala nekonečný úhel Ua = {z; —cv < t — argz < a}. A(a)-stabilita sice pořád ještě vyžaduje impli-citnost dané metody, omezení na její řád však není tak přísné jako u A-stability. Do dalších podrobností nebudeme zacházet a spokojíme se konstatováním, že ve speciálních případech mohou prokázat A(a)-stabilní metody stejně cennou službu jako A-stabilní metody. Na druhé straně nelze zamlčet, že ani požadavek A-stability není v jistém smyslu dostačující. Přibližné řešení yn modelové diferenciální rovnice (6.10) získané libovolnou jednokrokovou metodou, kterou jsme až dosud zavedli, je tvaru R"(z)y(a), kde z — hA a R je racionální funkce aproximující funkci e". Požadavek A-stability proto znamená, že tato funkce musí splňovat podmínku (6.31) |fí(z)| < 1 pro Rez < 0. Např. pro lichoběžníkové pravidlo (6.30) je funkce R dána rovnicí (6.32) R(z). Podmínka (6.31) je sice pro tuto funkci splněna, pro Rez —+ —oo však platí R(z) —» —» 1. Silně tlumené složky tedy klesají k nule, ale velmi pomalu Právě provedená úvaha vede k zavedení pojmu L-stability jednokrokové metody, kdy kromě A-stability požadujeme, aby pro funkci R platilo (6.33) R(z) —* 0 pro Rez —* —oo. Příkladem L-stabilní metody je implicitní Eulerova metoda (6-34) Vn+l = Vn + hfn+l- Zakončeme tento odstavec a vůbec celou kapitolu o obyčejných diferenciálních rovnicích užitečným a důležitým upozorněním. V souvislosti s řešením soustav diferenciálních rovnic se silným tlumením jde vždy o metody implicitní, takže v každém kroku je třeba řešit soustavu (6.35) Yn+k ■ h—f(xn+t,yn+k) ■ &k Postupy prediktor-korektor P(EC)rn nebo P(EC)mE s konečným m, které jsme doporučili v případě „normálně" se chovajících diferenciálních rovnic, zde nepřicházejí v úvahu, neboť nepřípustně mění oblast stability použité metody. Rovněž tak iterování do konvergence zde není vhodné, neboť k tomu, aby tento proces skutečné konvergoval, je třeba splnění podmínky 1.36) ft|-|i<l, la* I kde L je Lipschitzova konstanta pravé strany dané soustavy diferenciálních rovnic. Tato konstanta je však u soustavy diferenciálních rovnic se silným tlumením natolik velká, že podmínka (6.36) klade na velikost integračního kroku stejně vážné omezení jako podmínky stability nevhodné metody. Užijeme-li však k řešení nelineární soustavy (6.35) Newtonovu metodu, je tato metoda většinou konvergentní, aniž by bylo nutno klást příliš vážná omezení na velikost integračního kroku, jen když počáteční aproximace je dostatečně přesná. K jejímu získání je možné užít vhodný prediktor. Je však třeba vzít na vědomí, že tento postup je značně náročný na počet potřebných operací, neboť v každé Newtonově iteraci je třeba invertovat vždy novou matici. CVIČENI 1. Dokažte, že odhad rychlosti konvergence Eulerovy metody daný větou 2.2 nelze obecně zlepšit. Návod: Řešte např. diferenciální rovnici y1 = 2x, y(0) = 0 Eulerovou metodou, vypočtěte přibližné řešení vzorcem a ukažte, že je en ~ = yn- y(xn) = -xnh. 2. Odvoďte rovnice (3.19). 3. Odvoďte aposteriorní odhad typu (3.71) pro obecné integrační kroky hi a h2. 4. Odvoďte rekurence (4.37), (4.41) a (4.44) pro koeficienty Adamsovy-Moultono-vy, Nystrómovy a Milnovy-Simpsonovy metody. 5. Odvoďte vzorec (4.56) pro lokální chybu metody numerického derivování. 6. Nechť ip„, ifin a Xn jsou posloupnosti reálných čísel definované pro n = 0.....N takové, že je Xn ž 0, n = 0,..., JV, a Pak platí ipn ^ in + Y^Xv¥<" n = 0, ...,JV, n-\ n-1 Dokažte! 7. Dokažte poznámku 4.3 ze str. 116 117 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI LITERATURA 8. Dokažte nerovnosti (4.115), 9. Dokažte, že D-stabilní lineární fc-kroková metoda řádu nejméně jedna je absolutně nestabilní pro každé dostatečně malé kladné z. Návod: Použijte toho, že růstový parametr Ai je roven 1. 10. Vypočtěte intervaly absolutní stability metod z tab. 4.10. 11. Dokažte poznámku 4.7 ze str. 100. 12. Odvodíte vzorec pro hlavní část lokální diskretizační chyby Rungovy-Kuttovy metody metodou polovičního kroku. Návod: Buďte a přibližná řešen vypočtená Rungovou-Kuttovou metodou s integračním krokem h, resp. 2h v bodě x = xn±i za předpokladu, že výchozí hodnoty jsou přesné. Pak platí y(x + h) -!/„+, =L(y(x);h) = p(*,g(c))h"+1 + 0(h"+2)t y(x + h) -y-n+l=L(y(x),2h)=<p{x-h,y(x-h))(2h)<>+1-rO(h<>+2) = -- [<ř{x,y(x))+0(h)](2hY+1 + 0(hf+1) = = ^{x^x^^hP^ +0(hp+2). Odtud vyloučením přesného řešení dostanete L{y(x), h) = SÍJ_T(IM.1 - y*+1) + 0(h"+2). 13. Ukažte, že interval absolutní stability Rungovy-Kuttovy metody řádu p, která užívá p hodnot pTavé strany, nezávisí na její konkrétní podobě. Návod: Tvrzení plyne z toho, že přibližné řešení diferenciální rovnice y' — Ay vypočtené zmíněnou Rungovou-Kuttovou metodou řádu p je dáno vzorcem yn = (1 + z + + z2/2\ +... + zr/p\)nyo, kde z = hA. POZNÁMKY K LITERATUŘE Cl. 1. Publikací, které pojednávají o teorii obyčejných diferenciálních rovnic je celá řada. K velmi dobrým a pro českého čtenáře dostupným pramenům patří kniha Coddingtona a Levinsona (1955). Literatura věnovaná problematice numerického řešení obyčejných diferenciálních rovnic je rovněž neobyčejné obsáhlá. Základní informace čtenář získá v celé řadě příruček: viz např. Collatz (1951), Henrici (1964), Beiezin, Židkov (1966), Isaacson, Keller (1966), Shampine, Allen (1973), Dahlquist, Bjôrck (1974), Stoer, Bulirsch (1980), Vitásek (1987). Z celé řady specializovaných knih, z nichž některé jsou uvedeny v seznamu literatury bez dalšího komentáře, jmenujme knihu Henriciovu (1962), patrně jeden z nejlepších a nejúplnějších pramenů zejména v teoretických otázkách souvisejících s numerickým, řešením obyčejných diferenciálních rovnic. Většina materiálu první kapitoly je na ní také založena a čtenáři hledajícímu hlubší porozumění této problematice ji lze co nejvřeleji doporučit. Rovněž kniha Stetterova (1973) i když pro čtenáře dosti náročná, zaslouží 118 být jmenována. Praktičtěji než uvedené dvě publikace je zaměřena vynikající kniha Lambertova (1973), která nepomíjí snad žádný aspekt spojený s praktickou realizací popisovaných metod. Na mnoha místech této kapitoly jsme z ní vydatně čerpali. Podobný charakter má také kniha Lapiduse a Seinfelda (1971). Konečně upozorněme na sborník vydaný Mailem a Wattem (1976), v němž nalezne čtenář popis a hodnocení celé řady algoritmů založených nejen na metodách popisovaných v této knize, ale i na tzv. extrapolačních metodách, které jsou rovněž dosti populární. Cl. 2. Nejlepším pramenem k obsahu tohoto článku je kniha Henriciova (1962). Cl. 3. Rungovy-Kuttovy metody jsou klasické a základní informace o nich je v každé učebnici. Většinu materiálu zde uvedeného nalezne čtenář v už zmíněné knize Lambertově (1973), která také obsahuje odkazy na originální literaturu o jednotlivých metodách. Kniha Forsytha, Malcoma a Molera (1977) obsahuje velmi dobře implementovaný program pro tzv. Rungovu-Kuttovu-Fehlbergovu metodu. ČI. 4. Všechny otázky spojené s problematikou konvergence a konstrukcí většiny základních tříd mnohokrokových metod jsou vyčerpávajícím způsobem řešeny v knize Henriciově (1962). Problémy stability při pevném integračním kroku jsou v souvislosti s mnohokrokovými metodami a s metodami prediktor-korektor podrobně studovány v knize Lambertově (1973). Výhradně metodám Adamsova typu je věnována velmi přístupně psaná kniha Shampinova a Gordonova (1975), která obsahuje mimo jiné dobře osvědčený program užívající Adamsovy metody proměnného řádu a automatickou volbou integračního kroku. Na Adamsových metodách proměnného řádu je založen také program publikovaný Gearem (1971b), který realizuje změnu integračního kroku na základě Nordsieckovy (1962) myšlenky. Cl. 5. Tento článek se opírá hlavně o Lambertovu knihu (1973). Cl. 6. Průkopnická práce o problematice řešení soustav diferenciálních rovnic se silným tlumením je práce Dahlquistova (1963). Velmi mnoho materiálu o této problematice obsahuje sborník vydaný Willoughbym (1974). Gearův (1971b) program, o němž jsme se už zmínili, obsahuje opci pro integraci stiff systémů. Příslušné metody jsou založeny na metodách numerického derivování. LITERATURA ACHIJEZER, N.I. - GLAZMAN, I.M.: Teorija linejnych operátorov. Moskva, GIT-TL 1950. BABUŠKA, I. - PRÄGER, M. - VITÄSEK, E.: Numerical Processes in Differential Equations. Praha-London-New York-Sydney, SNTL + Interscience Publishers 1966. (Překlad do ruštiny: Moskva, Mir 1969.). BACHVALOV, N.S.: Cislennyje metody. Moskva, Nauka 1975. CODDINGTON, E.A. - LEVINSON, N.: Theory of Ordinary Differential Equations. New York, McGraw-Hill 1955. (Překlad do ruštiny: Moskva, IL 1958.) COLLATZ, L.: Numerische Behandlung von Differentialgleichungen. Berlin- 119 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Göttingen-Heidelberg, Spiingei-Verlag 1951. (Překlad do ruštiny: Moskva, IL 1953.) ČERNÝ, I.: Základy analýzy v komplexním oboru. Praha, Academia 1967. DAHLQUIST, G.: A Special Stability Problem for Linear Multistep Methods. BIT, 3, 1963, s. 27 - 43. DAHLQUIST, G. - BJÖRCK, A.: Numerical Methods. Englewood Cliffs, N.J., Prentice-Hall 1974. DANIEL, J.W. - MOORE, R.E.: Computation and Theory in Ordinary Differential Equations. San Francisco, W.H. Freeman and Co. 1970. FORSYTHE, G.E. - MALCOLM, M.A. - MOLER, OB.: Computer Methods for Mathematical Computations. Englewood Cliffs, N.J., Prentice-Hall 1977. (Překlad do ruštiny: Moskva, Mir 1980.) FOX, L.: Numerical Solution of Ordinary and Partial Differential Equations. Oxford, Pcrgamon Press 1962. GEAR, C.W: Numerical Initial Value Problems in Ordinary Differential Equations. Englewood Cliffs, N.J., Prentice-Hall 1971a. GEAR, C.W.: Algorithm 407, DIFSUB for Solution of Ordinary Differential Equations. Com. ACM, 14, 1971b, s. 185 - 190. GRIGORIEFF, R.D.: Numerik gewöhnlicher Differentialgleichungen. Stuttgart, B.G. Teubner 1972 - 1977, 2 sv. HALL, G. - WATT, J.M. (ed.): Modern Numerical Methods for Ordinary Differential Equation. Oxford, Clarendon Press 1976. (Překlad do ruštiny: Moskva, Mir 1979.) HAMMING, R.W.: Numerical Methods for Scientists and Engineers. New York, McGraw-Hill 1962. (Překlad do ruštiny: Moskva, Nauka 1968.) HENRICI, P.: Discrete Variable Methods in Ordinary Differential Equations. New York-London, J. Wiley and Sons 1962. HENRICI, P.: Error Propagation for Difference Methods. London, J. Wiley and Sons 1963. HENRICI, P.: Elements of Numerical Analysis. New York, J. Wiley and Sons 1964. ISAACSON, E. - KELLER, H.B.: Analsysis of Numerical Methods. New York-London-Sydney, J. Wiley and Sons 1966. LAMBERT, J.D.: Computational Methods in Ordinary Differential Equations. London-New York-Sydney-Toronto, J. Wiley and Sons 1973. LAPIDUS, L. - SEINFELD, J.H.: Numerical Solution of Ordinary Differential Equations. New York-London, Academic Press 1971. NORDSIECK, A.: On Numerical Integration of Ordinary Differential Equations, Math. Comp., 16, 1962, s. 22 - 49. RICE, J.R. (ed.): Mathematical Software. New York-London, Academic Press 1971. SHAMPINE, L.F. ALLEN, R.: Numerical Computing. Philadelphia, Saunders 1973. LITERATURA SHAMPINE, L.F. - GORDON, M.K.: Computer Solution of Ordinary Differential Equations. San Francisco, W.H. Freeman and Co. 1975, STETTER, H.J.: Analysis of Discretization Methods for Ordianary Differential Equations. Beriin-Heidelberg-New York, Springer-Verlag 1973. (Překlad do ruštiny: Moskva, Mir 1978.) STOER, J. - BULIRSCH, R.: Introduction to Numerical Analysis. New York-Heidelberg-Berlin, Springer-Verlag 1980. VITÁSEK, E.: Numerické metody. Praha, SNTL 1987. WILLOUGHBY, R.A. (ED.): Stiff Differential Systems, New York-London, Plenum Press 1974. 120 121 1 ÚVOD Kapitola II. Obyčejné diferenciální rovnice - okrajové úlohy 1 Úvod V této kapitole popíšeme některé základní metody pro numerické řešení okrajových úloh pro obyčejné diferenciální rovnice. Okrajovou úlohou nebo podrobněji dvoubodovou okrajovou úlohou pro soustavu diferenciálních rovnic prvního řádu (1.1) kde (1.2) y = f{*,y) = 7(*,ly, Ví*.1*, nv) "/(*,V--,ms/) rozumíme úlohu nalézt takové řešení soustavy (1.1), pro něž platí (1.3) r{y(a),y(b)) = 0, kde r je m-složková vektorová funkce 2m proměnných a a a b jsou dva navzájem různé body intervalu, v němž hledáme řešení. Nejčastěji to jsou jeho krajní body. Dají-li se podmínky (1-3), které nazýváme okrajovými podmínkami, psát ve tvaru (1.4) n(y(a)) = 0, r2(y(t))=0; kde ri, resp. r2 jsou mi-, resp. m2-složkové vektorové funkce m proměnných (m = = mi + m2), mluvíme o separovaných okrajových podmínkách. Ještě speciálnější typ okrajových podmínek jsou lineární okrajové podmínky (1.5) Uy(a)+Vy(b) = c, kde U a V jsou čtvercové matice řádu jtí a c je m-dimenzionální vektor a lineární separované okrajové podmínky (1.6) 122 viy(a) = vi, V2y(b) = v2, kde V\, resp. Ví, jsou obdélníkové matice typu mi x m, resp. m2 X m, a v%, resp. v2 jsou mi-, resp. m2-dimenzionální vektory. Protože každou diferenciální rovnici m-tého řádu lze psát zavedením nových neznámých funkcí jako soustavu rovnic prvního řádu (srv, vzorec (1.4) a (1.5) z kap. 1), je zřejmé, co rozumíme dvoubodovou okrajovou úlohou pro rovnici m-tého řádu. Položíme-li v rovnici (1.5) U = / a V = 0, vidíme, že úloha s počátečními podmínkami je speciálním případem okrajové úlohy. Tedy už nejjednodušší separované okrajové podmínky jsou značně obecnější než počáteční podmínky. To má velmi závažné důsledky. Zatímco řešení úlohy s počátečními podmínkami existuje a je jediné pro značně širokou třídu nelineárních rovnic typu (1.1), u okrajové úlohy se může i v případě jednoduché lineární rovnice snadno stát, že řešení neexistuje, nebo naopak, že řešení je nekonečně mnoho. Tuto skutečnost si dobře uvědomíme na příkladě jednoduché diferenciální rovnice 2. řádu (1.7) y" + y-0 nebo ekvivalentní soustavě prvního řádu (1.8) která se dostane z rovnice (1.7) standardní substitucí. Každé řešení rovnice (1.7) se dá psát ve tvaru [V ' 0 1" \ly~\ -1 0_ V (1.9) y(x) — Cl cos x 4- C2 sin x, kde Ci a Ci jsou libovolné konstanty. Odtud ihned plyne, že každá funkce tvaru A síni, kde A je libovolné číslo, je řešením diferenciální rovnice (1.7) s okrajovými podmínkami (1.10) y(0) = O', y(w) = 0. Okrajová úloha (1.7), (1.10) má tedy nekonečně mnoho řešení. Zaměnírne-li naproti tomu okrajové podmínky (110) okrajovými podmínkami (1.11) 3,(0) = 0, ?(*■) = 1, neexistuje vůbec žádné řešení. Uvedený jednoduchý příklad napovídá, že teorie existence a jednoznačnosti řešení okrajových úloh je značně komplikovanější než odpovídající teorie úloh s počátečními podmínkami. Odrazem této skutečnosti v numerických metodách pro řešení okrajových úloh je pak to, že pro ně doposud nebyla vypracována natolik univerzální teorie, jako tomu bylo u metod pro řešení úloh s počátečními podmínkami. Proto také popis jednotlivých konkrétních metod bude mít v této kapitole znaíně jiný charakter, než tomu bylo v kap. I. Tam jsme vlastně všude vystačili s tím, že 123 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI m y fy jsme se zabývali jedním obecným problémem, totiž diferenciální rovnicí (1.1) s příslušnou počáteční podmínkou a v podstatě všechny uváděné metody měly pro tuto úlohu smysl. Zde je tomu z naznačených důvodů jinak, a proto další text bude vlastně do značné míry souhrn jednotlivých více méně konkrétních úloh a příslušných algoritmů pro jejich řešení. Jednou z nejvíce frekventovaných úloh v této kapitole bude úloha řešit lineární samoadjungovanou diferenciální rovnici 0-12) -(p(x)y,)' + q(x)y=f(x) se separovanými lineárními okrajovými podmínkami (1.13) -*itía)ý{a) + j3iy(af= 7l, Většinu výsledků, které dostaneme pro tuto okrajovou úlohu, lze bez podstatných obtíží přenést na diferenciální rovnici čtvrtého řádu (114) {P(*)y")" + q(x)y = f(x) s okrajovými podmínkami např. (115) äfa) =71, VW = «i, m=72, s/(fr) = ŕ2. Rovněž touto úlohou se budeme v dalším zabývat. Konečně si také všimneme, zejména proto, abychom ilustrovali problémy, které vznikají při řešení nelineárních úloh, diferenciální rovnice (1.16) s okrajovými podmínkami (1.17) y" = f(*,v) y(<*)-7i, S/(6) = 72, Většinu prostoru budeme tedy věnovat lineárním úlohám, které jsme v případě úloh s počátečními podmínkami ani separátně neprobírali. Důvody pro to jsou v podstatě dva. 0 jednom z nich — teoretických obtížích spjatých S nelineárními okrajovými úlohami —jsme se už zmínili. Druhý důvod je ten, že nelineární úlohy se často, opět na rozdíl od úloh s počátečními podmínkami, řeší iteračně tak, že se konstruuje posloupnost lineárních úloh, jejichž řešení konvergují k řešení původní úlohy. K provedení tohoto postupu je uspokojivé a efektivní řešení lineárních úloh nezbytným předpokladem. Z konkrétních jednotlivých metod pro řešení výše popsaných problémů se všimneme metod, které převádějí řešení okrajové úlohy na řešení úloh s počátečními podmínkami, dále pak metody sítí a konečně velmi stručně variačních metod, zejména jejich důležitého speciálního případu, totiž metody konečných prvků. 2 Metody založené na převodu na úlohy s počátečními podmínkami V kapitole 1 jsme viděli, že úlohy s počátečními podmínkami pro obyčejné diferenciální rovnice umíme celkem uspokojivě řešit. Je proto přirozené snažit se převést řešení okrajové úlohy na řešení úloh s počátečními podmínkami. V tomto článku si všimněme několika způsobů, jak toho lze docílit. 2.1 Metoda střelby Základní myšlenka této metody je velmi jednoduchá a nabízí se na první pohled. Popíšeme ji nejprve na příkladě diferenciální rovnice druhého rádu. 2.1.1 Okrajová úloha pro lineární rovnici druhého řádu Uvažujme diferenciální rovnici (1.12) s okrajovými podmínkami (1.17), které jsou zřejmě speciálním případem podmínek (1.13). Často se jim také říká Dirichleto-vy okrajové podmínky. Předpokládejme přitom, že funkce p, p', q f jsou spojité v intervalu (a, i), že existuje kladná konstanty po taková, že platí (2.1) p(x) g po (> 0), xe{a,b), a že je (2.2) ?0)š°. xĚ{a,b). Později uvidíme, že tyto předpoklady zaručují existenci a jednoznačnost řešeni úlohy (1.12), (1.17). (Ve skutečnosti je možno tyto předpoklady ještě podstatně zeslabit, nám však nejde o to vyslovit příslušná tvrzení za co nej obecnějších předpokladů, ale o to ukázat základní myšlenku a použít přitom pokud možno co nejelementár-nějšl matematický aparát.) Z věty 1.1 z kap. I (vyslovené pro případ soustav diferenciálních rovnic) a z výše zformulovaných předpokladů o koeficientech diferenciální rovnice (1.12) plyne, že existuje právě jedna funkce y(x) = ylx\ aj, která je v intervalu (a,b) řešením diferenciální rovnice (1.12) a pro niž platí Ca (2.3) y(a) = 7i, j/(o)=a, kde a je libovolné pevně zvolené reálné číslo. Funkce y splňuje tedy danou diferenciální rovnici, jednu z okrajových podmínek (1.17) (v bodě x — a) a závisí na parametru a. Podaří-li se určit takovou hodnotu a" parametru a, aby platilo (2.4) y(*l«*) = 72, bude funkce y(x; a") řešením okrajové úlohy (1.12), (1.17). Hodnoty funkce y(b; a*) proměnné a jsme schopni určovat pomocí řešení diferenciální rovnice (1.12) a počátečními podmínkami (2.3) a převedli jsme tedy původní úlohu na řešení úloh 124 125 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY s počátečními podmínkami a na řešení rovnice (2.4) pro a*. Je také dostatečně jasné, proč jsme tuto metodu nazvali metodou střelby. Všimněme si nyní řešitelnosti rovnice (2.4). Označme symbolem z(x) řešení diferenciální rovnice (2.5) -(p(*)*0' + s(*)* = 0 (tj. homogenní rovnice příslušné k rovnici (1.12)) s počátečními podmínkami (2.6) z{a) = 0, z'(a) = 1. Pak platí pro libovolné a (2.7) c>r''r<>- y(x;a) = y(ii;Q) + az(x) ' * a speciálně pro x — b máme y(b;at) — y(b)0) + az(b). Rovnice (2.4) pro určení a* je tedy lineární a za předpokladu, že je z(b) ^ 0, platí (2.8) "' = ^j [■»-»(*; 0)]. Dosadíme-li konečně do rovnice (2.7) podle (2.8), dostáváme pro řešení y(x;a*) dané okrajové úlohy vzorec (2.9) y{x;a*) = y(x;0) + a'z(x) platný samozřejmě za předpokladu, že je z(b) ^ 0. O něco později ukážeme, že předpokládáme-li o koeficientech diferenciální rovnice (1.12) nerovnosti (2.1) a (2.2), je tento požadavek skutečně splněn. Řešit lineární okrajovou úlohu (1.12),' '(117) metodou střelby tedy znamená vyřešit jednu homogenní rovnici, jednu nehomogenní rovnici, obě s počátečními podmínkami a získané funkce zkombinovat podle rovnice (2.9). Takřka na první pohled je vidět, že metoda střelby je použitelná i při obecných okrajových podmínkách (1.13). Je-li např. /?i ^ 0, stačí Za funkci j/(ar; ct) vzít řešení diferenciální rovnice (1.12) splňující počáteční podmínky i -;c á ti n (2.10) y{a) = —fa + alP(a)c,], i/(a) = á. Pl Pak tato funkce splňuje při libovolném a první okrajovou podmínku (1.13) a k tomu, aby daná okrajová úloha byla vyřešena, stačí vypočítat a" z rovnice (2.11) a2P(b)y(b;a") + /32y(b; a") = jí. Tato rovnice je podobně jako rovnice (2.4) opět lineární, neboť funkce j/(a?; a) se dá psát ve tvaru (2.12) 126 y(x;a) = y(x;0) + á^-z{x), r 2 METODY ZALOŽENÉ NA PŘEVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI kde z je řešením homogenní rovnice (2.5), tentokrát s počátečními podmínkami (2.13) z(a) = a1,'2 p(a)z'(a) = &. 1 Rovnice (2.11) tedy přejde v rovnici (2.14) a2p(b) [y'ib; 0) + a ^z'(i)] + [y(b; 0) + iP-^z{b)\ = ^ a je-li 0J2í>(6)z'(6) + ^2(i) ^ 0 (což opět později za vhodných předpokladů dokážeme), můžeme odtud a* vypočítat. 2.1.2 Obecná okrajová úloha Podobně jako v případě modelové rovnice druhého řádu lze postupovat i při řešení soustavy diferenciálních rovnic (1.1) s okrajovými podmínkami (1.3). Zvolíme libovolný m-dimenzionální vektor a = (ai,.. .am)T a řešíme soustavu (1.1) s počátečními podmínkami (2.15) y (o) - a. Získané řešení je opět jako v případě rovnice druhého řádu funkcí parametru a a označíme je y (x; a). Další krok spočívá v řešení soustavy m (obecně nelineárních) rovnic (2.16) F(a) = 0, kde vektorová funkce F je definována předpisem (2.17) F («) = r (a, y (6; a)). Označíme-li a* řešení soustavy (2.16), nalezneme řešení dané okrajové úlohy řešením soustavy diferenciálních rovnic (1.1) s počáteční podmínkou (2.18) y(o) = a*. Jsou-li okrajové podmínky dané okrajové úlohy separované, tj. tvaru (1.4), volíme parametr a apriori tak, aby pro něj platila rovnice (2.19) fl(a) = 0. Funkce F na levé straně rovnice (2.16) je pak definována vztahem (2.20) F(a) = r2(y(t;a)), takže soustava, kterou je třeba řešit, má méně rovnic a také méně neznámých než v obecném případě. Jedním z kroků, který je třeba provést při užití této metody, je tedy řešení soustavy nelineárních rovnic (2.16), což je obecně značně obtížný problém. Tento problém odpadá v případě soustavy lineárních rovnic (2.21) y' = Ay + f 127 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY s lineárními okrajovými podmínkami (1.5). Zde A je čtvercová matice řádu m, jejíž prvky jsou spojité funkce a f je m-dimenzionální vektor se spojitými složkami. V tomto případě je funkce F tvaru (2.22) F(a) = Ua + Vy (&; a) - c, kde vektor y(x\a) je řešením diferenciální rovnice (2,21) s počáteční podmínkou (2.15). Tento vektor však lze psát ve tvaru (2.23) y (x; a) — $(x)a + y (x; 0), kde matice <ř je tzv. fundamentální matice soustavy diferenciálních rovnic (2.21) v bodě x = a, tj. je to matice, jejíž i-tý sloupec je řešením homogenní diferenciální rovnice (2.24) y'=Ay s počátečními podmínkami (2.25) 'y(a) =1, Ma)=0, j # i. Řešení rovnice (2.16) je tedy dáno vzorcem (2.26) o* = [t/ + V«ř(6)]-l[c - Vy (b; 0)] (samozřejmě za předpokladu, že příslušná inverzní matice existuje) a k jeho získání stačí řešit jednu soustavu lineárních algebraických rovnic. Sloupce matice * lze vypočítat řešením m úloh s počátečními podmínkami. Požadované řešení y{x;d) dané okrajové úlohy pak už není třeba získávat řešením rovnice (2.21) s počáteční podmínkou y (a) = a*, ale obdobně jako v případě rovnice druhého řádu lze použít vzorec (2.27) y(x;a*) =#(x)a*+y(x;0), neboť funkce, které se v něm vyskytují, jsme už v předchozím průběhu museli stejně počítat. 2.1.3 Obtíže spojené s metodou střelby V předchozích odstavcích jsme viděli, že metoda střelby je aspoň formálně použitelná i v případě velmi obecných okrajových úloh. Upozornili jsme již, že řešení nelineární soustavy (2.16), které je při jejím užití nezbytné, může být neobyčejně obtížné. I když však od tohoto problému odhlédneme (to je možné například, řešíme-li lineární úlohu), mohou se při provádění metody střelby objevit další vel mi vážné obtíže vyplývající z toho, že aritmetické operace nejsme schopni provádět přesné. Jejich podstatu nejlépe pochopíme na jednoduchém příkladě. 128 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Příklad 2.1. Řešme metodou střelby diferenciální rovnici druhého řádu (2.28) -y" + 100y = 0 s lineárními separovanými okrajovými podmínkami (2.29) y(0) = y($ = 1. Řešení této jednoduché okrajové úlohy lze tedy nalézt ze vzorce (2.9), kde je (2-30) y(x;0) = £e10* + ie"10*, (2.31) (2.32) .//o; r= a* — —10 -I- 20 1-e- /č>f (jde o řešení diferenciální rovnice (1.12) s počátečními podmínkami (2.3) s ct — 0, o řešení diferenciální rovnice (2.5) s počátečními podmínkami (2.6) a o určení a* z rovnice (2.8)). Vypočteme-li a* s relativní chybou £, dostaneme jako aproximaci hledaného řešení funkci *)*/• (2.33) yc(x) = -lee101 + (1 + Jeje"11*. Položíme-li zde např. e = 10-10, nabývá toto přibližné řešení v bodě 2 = 10 hodnotu (2.34) yc0 « - i 10-10e10° w -1, 34.1033. Z uvedeného jednoduchého příkladu vidíme, že i když vypočítáme hledanou počáteční hodnotu na plnou strojovou přesnost, ještě zdaleka odtud neplyne, že je možné vypočítat i přibližné řešení s přijatelnou přesností. Zároveň také vidíme, že vzniklé obtíže budou v^ašemjednpduchém příkladě tím větší, čím větší bude koeficient u y v rovnici (2.28) nebo čím delší bude interval, v němž hledáme řešení. Konečně je z tohoto příkladu patrné, že podstata obtíží spočívá v tom, že malá změna v počáteční podmínce způsobuje velkou změnu v řešení. Jev, který jsme pozorovali v uvedeném příkladě, je naneštěstí pro „rozumné" okrajové úlohy typický. „Rozumnou" úlohou zde rozumíme úlohu, v níž malé změny ve vstupních datech mají malý vliv na řešení. Úlohy vzniklé správnou aplikací fyzikálních zákonů většinou tuto vlastnost mají. Praktická zkušenost přitom ukazuje, že je-li pro danou rovnici „rozumná" okrajová úloha, je pro tuto rovnici úloha s počátečními podmínkami nepřirozená, a proto se tato úloha chová většinou „nerozumné". Obtíže metody střelby, které jsme právě popsali, i když jsou značné a mohou často její užití úplně znemožnit, nejsou jediné. V případě nelineární okrajové úlohy, i když její řešení existuje (a soustava (2.16) musí mít tedy řešení), může metoda střelby selhat z toho důvodu, že řešení diferenciální rovnice (1.1) s počáteční podmínkou y {a)— a existuje v celém intervalu (a, b) pouze pro ty hodnotu parametru a, které ľ. v<^ 139-í.-' II. OBYČEJNĚ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ CLOHY leží v nějakém — často velice malém — okolí bodu a*. Určení tohoto okolí však představuje většinou velmi vážný problém, takže lze jen těžko odhadnout přesnost, s níž je třeba řešit soustavu (2.16), abychom byli schopni nalézt vůbec nějaké řešení. Důvody, které jsme uvedli, nemají čtenáři vnutit představu, že metoda střelby je v zásadě špatná. Chtěli jsme jen upozornit na některé typické problémy, které se při jejím užití mohou vyskytnout a které také vedly k tomu, že byl navržena řada jiných postupů převádějících okrajovou úlohu na úlohu s počátečními podmínkami, které si kladou za cíl aspoň některé ze zmíněných obtíží odstranit. Jeden takový postup, který navazuje přímo na metodu střelby, popíšeme v následujícím odstavci, dalších si pak všimneme v odst. 2.2 a 2.3. 2.1.4 Střelba na více cílů V předešlém odstavci jsme ukázali, že při metodě střelby může docházet k podstatným obtížím, které jsou způsobeny často tím, že jsme nuceni řešit úlohu s počátečními podmínkami pro danou diferenciální rovnici na příliš dlouhém intervalu. Metoda, kterou popíšeme v tomto odstavci, možnost vzniku těchto obtíží většinou dosti podstatně snižuje. Její základní myšlenka spočívá v tom, že se hodnoty hledaného řešení počítají ne v jednom bodě, ale v několika bodech najednou. Buď tedy dána okrajová úloha (1.1), (1.3) a buďte xq,.. .,xn takové body intervalu {a, b), pro něž platí (2.35) a = x0 <X! < ■ ■ ■ < xn = b. Označme y(x\xk,a.k) řešení diferenciální rovnice (1.1) s počáteční podmínkou (2.36) y(xk) = ak = (akl.....akn)T. Podaří-li se nalézt n + 1 vektorů ak, k = 0,. -., n, tak, aby platilo (2.3T) y(xk+1;xk,a.h) = ai+u fc = 0,...,n - 1, a (2.38) r(a0,an)=0, je funkce y — y (x) definovaná předpisem (2.39) y{x)-y(x;xk,ak) pro x f= (xk, xk+1), k = 0,..., n - 1, řešením dané okrajové úlohy. Zavedeme-li označení (2.40) a = (aD,..,o„f a (2.41) F (a) = (Fa(ua, ai)T, Fi{alt a2)T',.... F„_1(o;n_i,an)'r, Fn(aB,an)T)T, 2 METODY ZALOŽENÉ NA PftEVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI kde (2.42) F0(aa,a1) = yix^xcaa) -aj, Maii, «2) ~ y (x2;xi,ai) - a2, fVi-i(an-i,oi„) = y (xn;xn-i,a„_i) - ct„, Fn(a0,a„) = r(<*o,«n), dá se soustava (2.37), (2.38) (n + l)m rovnice pro (n -f- l)m neznámých oto.....a„ psát ve tvaru (2.43) F (a) = 0. Ústředním bodem metody střelby na více cílů je tedy řešení obecně nelineární soustavy (2.43). Jejím řešením získáme hodnoty hledaného řešení dané okrajové úlohy v bodech xB,...,xn. Zajímá-li nás řešení ještě v dalších bodech intervalu (a, b), získáme je řešením úloh s počátečními podmínkami, jak plyne z rovnic (2.39). Praktické zkušenosti ukazují, že metoda střelby na více cílů má ve srovnání s metodou prosté střelby většinou podstatně příznivější vlastnosti. I přesto, že o ní není teoreticky zatím mnoho známo, představuje často v případě složitých nelineárních úloh jedinou alternativu, jak se pokusit je numericky řešit. 2.2 Metoda přesunu okrajové podmínky Tato metoda převodu okrajové úlohy na úlohy s počátečními podmínkami je vhodná především v případě lineárních okrajových úloh se separovanými okrajovými podmínkami. Popíšeme ji nejprve ve speciálním případě diferenciální rovnice druhého řádu a pak v případě obecné lineární soustavy se separovanými okrajovými podmínkami. V odst. 2.2.3 pak ukážeme, jak lze užít metodu přesunu v případě složitějších okrajových podmínek a v odst. 2.2.4 stručně upozorníme na některé problémy spojené s její numerickou realizací. 2.2.1 Diferenciální rovnice druhého řádu Buď dána okrajová úloha (1.12), (1.13). Popisovaná metoda vychází z následující úvahy: Obecné řešení rovnice (1.12) závisí na dvou parametrech. Splňuje-li toto řešení kromě toho ještě jednu z okrajových podmínek (1.13), představuje tato podmínka vazbu mezi zmíněnými parametry. Množina řešení diferenciální rovnice (1.12), které splňují jednu z podmínek (1.13), závisí tedy na jedné konstantě. Vyloučíme-li tuto konstantu derivováním, dostaneme jako charakteristiku zmíněné množiny diferenciální rovnici prvního řádu. Následující tvrzení ukazuje, že tomu tak skutečně je. 130 131 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Lemma 2.1. Nechť funkce y splňuje v intervalu {£1,^2} diferenciální rovnici (1.12), kde p, p' a q jsou spojité funkce a p splňuje nerovnost (2.1). Nechť kromě toho v nějakém bodě (o £ (Ši, £2) platí > -r /.'■■, i,. > (2.44) «pKoy(£o) + /3j/(£o)=7. ^ ■ * ■ Nechť konečně funkce z je v intervalu (£1,^2) řešením diferenciální rovnice (2.5) s počátečními podmínkami ^ (2-45) *«<>) = -«, p((0)A(o) = P a funkce c řešením diferenciální rovnice (2.46) c'-fz s počáteční podmínkou (2-47) c(£0) = 7. Pat platí (2.48) -«(i)p(x)»/'(i) + p(z)2'(*)í/(*) = c(x) pro každé x G ((1,(2). Důkaz. Funkce z, resp. c jsou diferenciálními rovnicemi (2.5), resp. (2.46) a počátečními podmínkami (2.45), resp. (2.47) jednoznačně určeny, jak plyne z modifikace věty 1.1 kap. I pro soustavy diferenciálních rovnic prvního řádu. Vynásobíme-li tedy rovnici (1.12) funkcí z a dosadíme-li do vzniklé rovnice z rovnic (2.5) a (2.46), máme (2.49) -lp(*y(*)]'2(*) + y(x)\p(x)z'(x)]' ~ ''(*) = 0 :>0 "/j'''.K pro x £ (£i,£2). Položíme-li Jj h ^ V' (2.50) n(x) - -z(x)p(x)yJ(x)+p(x)z'(x)y(x) - c(x), plyne z rovnice (2.49), že pro každé x 6 (£i,£j) Je l'(x) — Oí^Funkce n je tedy v intervalu (£i,£2) konstantní. Protože platí n(£o) = 0, jak plyne z rovnic (2.44), (2.45) a (2.47), je j)(x) = 0. Lemma je dokázáno. Jf Vzhledem k tomu, že diferenciální rovnice prvního řádu (2.48) je obdobného tvaru jako podmínka (2.44), můžeme tvrzení lemmatu 2.1 interpretovat také tak, že lineární podmínku (2.44) platnou v jednom bodě intervalu, v němž je splněna daná diferenciální rovnice, lze přesunout do libovolného jiného bodu tohoto intervalu, přičemž přesunutá podmínka bude mít tvar (2.48). Lemma 2.1 nabízí postup řešení okrajové úlohy (1.12), (1.13): Každou z podmínek (1.13) přesuneme do téhož bodu intervalu (o, í>). Dostaneme tak dvě rovnice, které svazují lineárně hodnotu hledané funkce s hodnotou její derivace v tomtéž bodě. Z těchto rovnic můžeme, alespoň za vhodných předpokladů, vypočíst funkční hodnotu a hodnotu první derivace, a získat tak počáteční podmínky pro rovnici (1.12). V následující větě zformulujeme základní vlastnosti právě popsané metody. Veta 2.1. Nechť funkce p, p', q a / jsou spojité na intervalu (o, b) a nechť platí (2.1). Nechť dále funkce z, resp. z jsou řešením diferenciální rovnice (2.5) s počátečními podmínkami (2.51) *(<")=<*!, p(a>'(") = A, resp, (2.52) !(») = -«,, P(b)-z'íb) = 02 a funkce c, resp. č řešením diferenciální rovnice (2.46), resp. diferenciální rovnice (2.53) č' = f ž s počáteční podmínkou (2.54) c(o) = 7l, resp. (2.55) č(b) = y,, Pak lze pro každé ij £ (a, b) sestavit soustavu lineárních algebraických rovnic (2.56) pro niiplatí: Má-Ji okrajová úloha (1.12), (1.13) řešeníy,je vektor (y(xa),y'(xo))T řešením soustavy (2.56), a naopak, má-li soustava (2.56) řešení (k±, k2)T, je funkce y, kterou získáme řešením diferenciální rovnice (1.12) s počátečními podmínkami y(xo) = fci, y'(xo) — k2, řešením okrajové úlohy (1.12), (1.13). Má-li okrajová úloha (1.12), (1.13) jediné řešení, má i soustavy (2.56) jediné řešení a naopak. Důkaz. Existence řešení soustavy (2.56) za předpokladu existence řešení okrajové úlohy (1.12), (1-13) plyne ihned z lemmatu 2.1, neboť první rovnice soustavy (2.56) je první podmínka (1.13) přesunutá do bodu x — x0 a druhá rovnice této soustavy je druhá podmínka (1.13) přesunutá do téhož bodu. Naopak, nechť soustava (2.56) má řešení (ki,k2)T. Pak existuje funkce y, která je řešením diferenciální rovnice (112) a pro niž platí y(xo) — ti, »/(*o) = k3. Pro tuto funkci platí dále (2.57) p(x0)z'(xa) -p(x0)z(x0) v C(xa) p(x0)ž'(x0) -p(x0)ž(xa) Axo). -z(x0)p(x0)ý{x0) + p(x0)z'(xo)y(x0) ~ c(io) (2.58) -z(x0)p(x0)y'(xl)) + p(x0)ž'(xo)y(xa) - čfxo) 132 133 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY Přesuňme podmínku (2.57) do bodu a. Podle lemmatu 2.1 platí (2 59) -p(«)f(«)!/(«)+P(«y(«)j(!/) " s(a), kde r je řešením diferenciální rovnice (2.5) s počátečními podmínkami (2.60) a s řešením diferenciální rovnice r(x0) = z(x0), r'(x0) = ' \ ■'- = z'(x0) P(xo) (2.61) s' = fr s počáteční podmínkou (2-62) s(x0) ~ c(x0). Protože funkce r splňuje tutéž diferenciální rovnici jako funkce z a protože pro ni platí (2.60), plyne z věty o jednoznačnosti řešení úlohy s počátečními podmínkami pro obyčejné diferenciální rovnice, že je rix) = z(x). Odtud však už plyne, že je také &(x) = c(x). Námi sestrojená funkce y splňuje tedy vzhledem k podmínkám (2.51), (2.54) levou okrajovou podmínku. Splnění pravé okrajové podmínky se dokáže úplně stejně. Za předpokladu řešitelnosti soustavy (2.56) se nám tedy skutečně podařilo sestrojit řešení okrajové úlohy (1.12), (1.13). Nechť nyní má okrajová úloha (1.12), (1.13) jediné řešení a předpokládejme, že soustava (2.56) má dvě různá řešení (k\, kz)7 a (kít k2)T. Sestrojme funkce y\, resp. j/2 jako řešení diferenciální rovnice (1.12) s počátečními podmínkami yi(x<s) = k\, j^(io) = k2, resp. Jftfao) — fci, y'2(xa) = ij. Obě tyto funkce jsou podle toho, co už jsme dokázali, řešeními dané okrajové úlohy, a musí se tedy sobě identicky rovnat. To ale odporuje předpokladu, že je (ki, ki)T ^ (ifci, žj)2^. Nechť konečně má soustava (2.56) právě jedno řešení a nechť okrajová úloha (1.12), (1.13) má dvě různá řešení y\ a y2. Pak opět z věty o jednoznačnosti řešení úlohy s počátečními podmínkami pro obyčejnou diferenciální rovnici plyne, že (í/i(zo), yi(xt))) ^ (íM^o), Víi^a)) , což je znovu spor. Věta je dokázána. g Z věty 2.1 plyne, že řešitelnost okrajové úlohy (1.12), (1.13) a řešitelnost soustavy (2.56) jsou úlohy ekvivalentní. Z hlediska získání metody pro řešení okrajové úlohy (1.12), (1.13) lze interpretovat právě dokázanou větu dvojím způsobem. Přesunem obou okrajových podmínek do téhož bodu intervalu (a, b) získáme pro hledanou funkci počáteční podmínky a hodnotu hledaného řešení v libovolném bodě intervalu (a, b) pak vypočteme řešením původní diferenciální rovnice. Tento postup jsme také měli až dosud na mysli. Pokud však povaha řešeného problému je taková, že nás řešení zajímá jen v jednom nebo několika málo bodech intervalu (o, !>), může být výhodnější (tj. ekonomičtější) takový postup, že žádanou hodnotu nebo hodnoty vypočteme přímo ze soustavy (2.56). Řešení původní diferenciální rovnice pak odpadá. I tuto variantu nazveme metodou přesunu. 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Upozorněme ještě, že při řešení okrajové úlohy (1.12), (1-13) metodou přesunu okrajových podmínek založeném na větě 2.1 se předem nemusíme starat o její řešitelnost. Soustavu (2.56) lze sestavit vždy a má-li řešení, nalezneme též řešení původní okrajové úlohy. Nemá-li soustava (2.56) řešení, nemá ani okrajová úloha (1.12), (1-13) řešení. Tato skutečnost také umožní nalézt elementárně podmínky, za kterých je úloha (1.12), (1.13) řešitelná při libovolných 71 a 72. K tomu cíli dokážeme nejprve následující lemmata. Lemma 2.2. Nechť funkce p, p' a q jsou spojité a nechť platí nerovnosti (2.1) a (2.2). Nechť dále ct-, a 0\ jsou nezáporná čísla, pro něž platí (2.63) «!+/?! >0. Buď konečně funkce z definovaná diferenciální rovnicí (2.5) a počátečními podmínkami (2.51). Pak pro každé x 6 (a, b) platí (2.64) *(*)Žai+ftjf ^ (2.65) p(x)z'(x) ^ /?1 + Ofl dí. Důkaz Dokažme nejprve, že platí z(x) ž 0a z'(x) ž 0 pro x £ (a, i). Důkaz tohoto tvrzení provedeme sporem. Položme k tomu cíli 9Jt = {x\ a < x á 6, z(x) < < 0} a předpokládejme, že množina 9Tt je neprázdná. Za tohoto předpokladu je io = inf2Jt reálné číslo ležící v intervalu (a, b). Dále z počátečních podmínek pro funkci z ihned plyne, že je a < xq ž 6. Skutečně, je-li ai > 0, plyne to ze spojitosti funkce z; je-li ai = 0, je v důsledku předpokladu (2.63) ft>0a funkce z je v bodě x = o rostoucí. Existuje tedy S > 0 takové, že je z(x) > 0 pro x <E (a, a 4- <5). Konečně je z(xq) = 0, neboť z definice čísla xq plyne, že je z(xq) ^ 0 1 ostrá nerovnost odporuje definici čísla xo a spojitosti funkce z. Pro x fí xq zřejmě platí z(x) "í 0. Integrací rovnice (2.5) v mezích od a do x dostáváme (2.66) p{x)x'{x) = p1 + í q(t)z(t)dt. Ja Odtud však ihned plyne, že je i z'(r) 5 0 pro x 5 x0. Je tedy speciálně z'{xq) ž 0. Kdyby bylo z'(a:o) > 0, byla by funkce z v bodě ar. = Xg rostoucí, což odporuje definici čísla xg. Celkem je tedy z(x0) = z'(xa) = 0. Odtud ale plyne, že je z(x) = = 0, neboť funkce z je řešením lineární diferenciální rovnice (2.5), pro niž platí věta o jednoznačnosti. To je však ve sporu s předpokladem ct\ ž 0, /3i ž 0, ai + Pí > 0. Obdržený spor dokazuje, že množina 971 je prázdná, a tedy je skutečně z(x) ž 0 pro x £ (a, b). Z rovnice (2.66) pak plyne, že na tomto intervalu je také z'(x) ž 0. Protože je z'(i) ž 0, je funkce z neklesající a platí tedy (2.67) z(x) ^ Ct\. 134 135 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY Použijeme-li tuto nerovnost v (2.66), dostáváme nerovnost (2.65), Z nerovnosti (2.65) však plyne, že je (2.68) p(x) neboť funkce g je nezáporná. Z této nerovnosti dostáváme integrací ihned nerovnost (2.64). Lemma je dokázáno. Ě Lemma 2.3. Nechť funkce p, p' a q splňují tytéž předpoklady jako v lemmatu 2.2 a neciť «2 a fa jsou nezáporná čísla, pro něž platí (2.69) C-2 + fa > 0. Pai pro řešení ž diferenciální rovnice (2.5) s počátečními podmínkami (2.52) platí pro každé x £ (o, o) nerovnosti (2.70) t(x) g -0,2 -fa J 6ii P(í) (2.71) p(x)z'(x) ž fa + a2 /' í(í) d í. Důkaz se provede zcela analogicky jako důkaz lemmatu 2.2. Lemma 2.4. Nechť jsou splněny předpoklady lemmat 2.2 a 2.3. Pat platí implikace (2.72) (2.73) det det p(b)z'(b) _»(») Ä «2 p(a)z'(a) -ž(a) = 0 => A=A=0a 9(i) = 0 = 0 =*• fa = A = 0 a }(») = 0. (2.74) det = <*jpW*'(») + A*W2 Důkaz. Pro determinant na levé straně implikace (2.72) platí podle lemmatu 2.2 p(b)z'(b) -z(bY fa <*2 š«aA+aiA+<*iasjí q(t)dt + fafaj^ což je součet nezáporných čísel. Je-li tedy determinant na levé straně nerovnosti (2.74) roven nule, rovnají se nule všechny sčítance na pravé straně, tj. platí (2.75) a2fa = aifa = alQ2 J q(t)dt - fafa -iydi = 0. 136 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Podle (2.63) a (2.69) je 0 < (<xi+fa)(a2+fa) = aiati+aifa+faai+fafo = onai. Je tedy ai>0aor2>0az rovnic (2.75) plyne, že fa — fa = 0 a J q(t)dt = 0. Z poslední rovnosti však plyne, že je q = 0, neboť funkce q je nezáporná a spojitá. Implikace (2.73) se dokáže stejně snadno. Lemma je dokázáno. Veta 2.2. Nechť funkce p, p', q a / jsou spojité v intervalu (o, b) a nechť platí nerovnosti (2.1) a (2.2). Nechť koeňcienty a,- a $ jsou nezáporné a nechť pro ně platí nerovnosti (2.63) a (2.69). Konečně nechť není současně fa = fa = Q aq = Q Pak okrajová úloha (1.12), (1.13) má při libovolných yi a y2 právějednoře&ní. Důkaz. Podle věty 2.1 je řešitelnost dané okrajové úlohy ekvivalentní s řešitelností soustavy (2.76) (Ve větě 2.1 jsme položili x<y — b.) Podle lemmatu 2.4 je však determinant této soustavy od nuly různý; soustava (2.76) má tedy při libovolné pravé straně právě jedno řešení. Tvrzení věty tedy plyne z věty 2.1. Věta 2.2 udává jednoduché postačující podmínky pro existenci a jednoznačnost řešení okrajové úlohy (1.12), (1.13). Abychom se v dalším nemuseli příliš často opakovat, umluvíme se, že pokud budeme mluvit o této úloze, budeme předpokládat, že předpoklady věty 2.2 jsou splněny, aniž to vždy budeme konkrétně uvádět. Z věty 2.1 také snadno plyne následující poznámka, která pokrývá případ vyloučený ve větě 2.2. Řešení diferenciální rovnice '*(»)*'(») -p(b)z(bY V c(by fa p(b)ct2 . T2 . Poznámka 2.1 (2.77) s okrajovými podmínkami (2.78) •(K*)' = /W -p(a)j/(o) =7i, pW(b) = 72 (tzv. Neumannovými podmínkami) existuje tehdy a jen tehdy, platí-li (2.79) Ti + 72 + / /(z)di = 0. J a Je-li podmínka (2.79) splněna, je řešení určeno jednoznačně až na aditivní konstantu. Než ukážeme, jak lze myšlenku přesunu okrajové podmínky přenést na obecnou soustavu lineárních diferenciálních rovnic, všimneme si ještě, jak překlenout mezeru, která zůstala v odvození metody střelby pro rovnici druhého řádu v odst. 2.1.1. Tato metoda byla odvozena za předpokladu nenulovosti čísel z(ř>), resp. ai2p(b)z'(b) 4-+ faz{b), kde funkce z byla v intervalu (a,b) řešením diferenciální rovnice (2.5) 137 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY s počátečními podmínkami (2.6), resp. (2.13). Jsou-li však splněny předpoklady věty 2.2, plyne tato skutečnost ihned z lemmatu 2.4. Z této úvahy také vidíme, že metoda střelby a metoda přesunu okrajové podmínky jsou si značně blízké, neboť v obou případech počítáme podobné veličiny. K této poznámce se ještě vrátíme v odst. 2.2.4. 2.2.2 Obecná soustava lineárních diferenciálních rovnic V tomto odstavci si všimneme, jak lze jednoduše formulovat metodu přesunu okrajových podmínek pro soustavu lineárních diferenciálních rovnic (2.21) se separovanými lineárními okrajovými podmínkami (1.6). O prvcích matice A a o složkách vektoru f budeme přitom předpokládat, že jsou to funkce spojité v intervalu (a, b), takže jsme oprávněni užívat vetu o existenci a jednoznačnosti pro úlohu s počátečními podmínkami pro tuto soustavu. Kromě toho budeme předpokládat, že okrajové podmínky jsou nezávislé, což znamená, že hodnosti matic Vi a V? (typů mi x m a m2 x m s mi + = m) jsou rovny počtu jejich řádků. Metoda přesunu okrajových podmínek se opírá o následující lemma, které je přímým zobecnění lemmatu 2.1. Lemma 2.5. Nechť vektor y splňuje v intervalu (íi.ía) C (a, 6) diferenciální rovnici (2.21) a neciť v nějakém bodě £o € (ťi,íä) platí (2.80) Voy(ío) = vo, ide Vo je obdélníková matice typu mo x m (raj á m) a vo je daný mo-dimenzíoná/ní vektor. Buď dále R (x), x € (íi,Í2), matice typu mo x m, která je definovaná v intervalu (íi,íj) (maticovou) diferenciální rovnici (2.81) R' = -RA(x) s počáteční podmínkou (2.82) ŕ?(ío) = Vo. Buďkonečně r (x) mo-dimenzionální vektor definovaný v intervalu {fi,fa) diferenciální rovnicí (2.83) r'= R (x) f (x) s počáteční podmínkou (2.84) r(eo) = v0. Pak pro každé x e (f i, f 2) platí (2.85) R(x)y(x) = r (x). Důkaz. Předně rovnice (2.81) s podmínkou (2.82) skutečně jednoznačně definuje matici 17, neboť jde vlastně o soustavu m0m lineárních diferenciálních rovnic 138 2 METODY ZALOŽENÉ NA PŘEVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI prvního řádu pro mam neznámých prvků této matice. Totéž platí i o vektoru r. Vynásobíme-li rovnici (2.21) maticí R a použijeme-li rovnic (2.81) a (2.83), dostaneme (2.86) [R{x)y{x)-r{x)}, = 0. Vektor R (x)y (x) — r (x) je tedy v intervalu (f i, &) konstantní a vzhledem k podmínce (2.80) je nulový. Lemma je dokázáno. Postupem zcela analogickým, jakým jsme dokázali větu 2.1, se na základě lemmatu 2.5 dokáže i následující věta. Věta 2.3. Nechť prvky matice A a složky vektoru f jsou spojité na intervalu (a, 6). Nechť dále matice R (x), resp. R (x) typu miXm, resp. »712 x m jsou definovány diferenciální rovnicí (2.87) s počáteční podmínkou (2.88) resp. diferenciální rovnicí (2.89) s počáteční podmínkou (2.90) R' = -RA(x) R (a) = Vu Ŕ' - -RA(x) 6(6) = V2. Nechť konečně r (x), resp. r (x) jsou nu-, resp. m^-dimenzionální vektory definované diferenciální rovnici (2.91) r' = R(x) f (x) s počáteční podmínkou (2-92) r(a) = Vl, resp. diferenciální rovnicí (2.93) f = R (x) f (x) s počáteční podmínkou (2.94) ř(b) = V2. Utvoříme-Ii pak pro libovolné Xq 6 (a, b) soustavu m lineárních algebraických rovnic (2.95) R(x0y k = r(x0)' 139 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY platí: má-Ii okrajová úloha (2.21), (1.6) řešení y (x), je vektor y (x0) řešením soustavy (2.95), a naopak, je-li vektor k řešením soustavy (2.95), je vektor y (x), který získáme řešením soustavy (2.21) s počáteční podmínkou y (xq) = k, řešením okrajové úlohy (2.21), (1.6). Má-íi okrajová úlohy (2.21), (1.6) jediné řešení, má i soustava (2.95) jediné řešení a naopak. Poznámka 2.2. Z právě uvedené věty plyne následující jednoduché, často však velmi užitečné tvrzení: Nechť okrajová úloha (2.21), (1.6) má při libovolném f a při libovolných vi a v2 nanejvýš jedno řešení a nechť je rm + m2 - m. Pak má tato úloha při libovolných /, v\ a v3 právě jedno řešení. Skutečně, podle věty 2.3 stačí ukázat, že determinant soustavy (2.95) je od nuly různý. Kdyby však byl tento determinant roven nule, měla by homogenní soustavy příslušná k soustavě (2.95) netriviální řešení a okrajová úloha (2.21), (1.6) s f = 0 a vi = v2 = 0 by měla kromě triviálního řešení ještě také netriviální řešení. Na základě věty 3.2 se dají formulovat algoritmy pro řešení okrajové úlohy (2.21), (1.6), které jsou zcela paralelní k algoritmům pro rovnici druhého řádu popsaným v odst. 2.2.1. 2.2.3 Svázané a integrální okrajové podmínky V tomto odstavci ukážeme, jak lze některé úlohy s obecnějšími okrajovými podmínkami, než jsou lineární separované podmínky, převést na úlohu vyšetřovanou v předešlém odstavci. Nejprve si všimneme diferenciální rovnice (2.21) s obecnými lineárními okrajovými podmínkami (1.5). Tato úloha se převede na úlohu se separovanými podmínkami následujícím jednoduchým obratem. Řešíme v intervalu (a, (a + b)/2) soustavu 2tn diferenciálních rovnic (2.96) A(x) 0m -A(a + b-x) f{x) -f(a + b kde u je 2m-dimenzionální vektor a Om je čtvercová nulová matice řádu m, se separovanými lineárními okrajovými podmínkami (2.97) [U, V]u(a)-c, [lm,-lm]u{(a + b)/2) = 0, kde lm značí jednotkovou matici řádu m. Hledaný vektor y(x) = [1y(i), . ,mj/(z)]T je pak dán rovnicemi (2.98) 'y(x) = 'u(x), i=l,...,m, pro x e (a, (a + b)/2) a rovnicemi (2.99) 'Ví*) = m+iu(a + b-x), i = l,...,m, pro x e ((a + 6)/2, b). 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Okrajovou úlohu se svázanými okrajovými podmínkami se tedy podařilo převést na okrajovou úlohu se separovanými okrajovými podmínkami. Počet rovnic však přitom vzrostl na dvojnásobek. Jak druhý příklad uvažujme okrajovou úlohu, kdy kromě okrajových podmínek typu (1.6) je zadána ještě podmínka tvaru (2.100) J a (x)y(x)ix ■■ kde D (x) je daná obdélníková matice typu raj x m se spojitými prvky a c je daný konstantní mo-dimenzionáln! vektor. Doplňující podmínka tohoto typu se praxi vyskytuje např. při úlohách na vlastní čísla. Nalezneme-li řešení soustavy mo + m diferenciálních rovnic A(x) D(x) + (2.101) se separovanými lineárními okrajovými podmínkami (2.102) ' V: 0 >(<*)' 0 1 .»(■). 0 V2 0 rv2 0 1 .»(*). c kde y je m-dimenzionální vektor, u je mo-dimenzionámí vektor a typy nulových a jednotkových matic 0 a / jsou zřejmé ze souvislosti, je složka y nalezeného řešení řešením původní diferenciální rovnice (2.21), které splňuje okrajové podmínky (1.6) a integrální podmínku (2.100). 2.2.4 Obtíže spojené s metodou přesunu okrajové podmínky Metoda přesunu okrajových podmínek je jednoduchá, elegantní a má, alespoň teoreticky, významnou přednost v tom, že zároveň dává odpovědna otázku, zda řešení dané okrajové úlohy existuje. Praktické zkušenosti však ukazují, že při její konkrétní realizaci dochází často k značným obtížím. Kořen těchto obtíží je stejný, jako tomu bylo u metody střelby, jak je vlastně více méně zřejmé, neboť při metodě přesunu okrajových podmínek řešíme v podstatě tytéž úlohy s počátečními podmínkami jako u metody střelby. Ilustrujme typické jevy, které mohou nastat při metodě přesunu na následujícím jednoduchém příkladě, Příklad 2.2. Řešme v intervalu (0,1) diferenciální rovnici (2.103) — [(1 + z)j/]' + qy = [q + 7r2(l + x)] smwx - jr cos Tra: s Dirichletovými okrajovými podmínkami y(0) — y(l) = 0. Předpoklady existenční věty 2.2 jsou zřejmě splněny a přesné řešení této okrajové úlohy je funkce sin7rx. 140 141 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE OKRAJOVÉ ÚLOHY 2 METODY ZALOŽENÉ NA PS.EVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI V tab. 2.1 jsou uvedeny výsledky výpočtu pro q = 100 a q = 500. Potřebné úlohy s počátečními podmínkami byly řešeny standardní Rungovou-Kuttovou metodou s integračním krokem h = 0,0025. Z tabulky vidíme, že zejména v případě q = 500 jsou výsledky zcela neuspokojivé. Pro srovnání uvádíme v tab. 2.2 ještě řešení téže okrajové úlohy metodou střelby. I touto metodou dostáváme výsledky stejně špatné. Tabulka 2.1 Řešení okrajové úlohy pro diferenciální rovnici (2.103) metodou přesunu 1 - 100 ? = 500 X přibližné chyba přibližné chyba řešení řešení 0,0 0,000275 0,000275 163,484000 163,484000 0,1 0,309114 0,000097 18,324700 18, 015 700 0,2 0,587819 0,000 034 2,779730 2,191950 0,3 0,809028 0,000011 1,099890 0,290869 0,4 0,951059 0,000003 0,992 730 0, 041 673 0,5 1,000000 0,000000 1,006387 0,006387 0,6 0,951056 0,000000 0,952 091 0, 001 034 0,7 0,809017 0,000000 0,809189 0,000172 0,8 0,587785 0,000000 0,587813 0,000 028 0,9 0,309017 0,000000 0,309021 0,000003 1.0 0,000000 0,000000 0,000000 0,000 000 V následujícím odstavci ukážeme, jak lze neuspokojivé chování metody přesunu, které jsme ilustrovali v právě uvedeném příkladě, podstatně zlepšit. 2.3 Metoda normalizovaného přesunu Jde o modifikaci metody přesunu okrajové podmínky, která je motivována snahou odstranit obtíže spojené s praktickou realizací této metody. Při jejím popisu začneme opět s diferenciální rovnicí druhého řádu. 2.3.1 Diferenciální rovnice druhého řádu Buď dána okrajová úloha (1.12), (1.13). V odst. 2.2.1 jsme ukázali, že přesuneme-li levou a pravou okrajovou podmínku pomocí rovnic (2.56) do téhož bodu intervalu (a, 6), jsme schopni získat počáteční podmínky hledaného řešení řešením soustavy dvou rovnic o dvou neznámých. Máme-li na mysli jako konkrétní příklad okrajovou úlohu (2,28), (2.29), kterou jsme užili v odst. 2.1.3 k ilustraci potíží spojených Tabulka 2.2 Řešení okrajové úlohy pro diferenciální rovnici (2.103) metodou střelby 6 = 100 b = 500 X přibližné řešení chyba přibližné řešení chyba 0,0 0 0 0 0 0,1 0,309016 -0,000 001 0, 309012 -0,000005 0,2 0,587781 -0,000 004 0, 587774 -0,000011 0,3 0, 809011 -0,000005 0,809006 -0,000011 0,4 0,951039 -0,000017 0,950 562 -0,000495 0,5 0, 999936 -0,000064 0,997559 -0,002441 0,6 0,950 989 -0,000068 0,953125 0,002068 0,7 0,808945 -0,000072 0,710938 -0,098080 0,8 0, 587387 -0,000398 0,625 000 0,037 215 0,9 0,307861 -0,001156 0 -0,309018 1,0 -0,000 244 -0,000224 -1,000000 -1,000000 s metodou střelby, a přesouváme-li např. pravou okrajovou podmínku, jsou příslušné funkce f a č dány vzorci ž{x): J_„10(iC-10)__Le"1^*-10) 20B 20K (2.104) a (2.105) Č(x}=l. Soustava (2.56) (s xo = a - 0) je tedy tvaru 1 0 V i i (2.106) L 2" '2" 20" 20- Neznámé ki a k?, tj. hodnoty přesného řešení dané okrajové úlohy a jeho derivace v bodě 1 = 0 vypočteme z této soustavy sice v rámci běžné strojové přesnosti přesně (í?i = 1 a íľ2 — —10 dokonce na více než 42 platných dekadických cifer), tato přesnost však ani zdaleka nestačí k výpočtu uspokojivé aproximace, užijeme-li je jako počáteční podmínky pro rovnici (2.28) (srv. příklad 2.1 na str. 129). Čtenář se už sám může snadno přesvědčit, že obtíže zůstanou stejné, budeme-li přesouvat levou okrajovou podmínku. Je zde však ještě další okolnost, která může realizaci metody přesunu okrajové podmínky (a ostatně i metodu střelby, protože se v ní řeší tytéž rovnice) znemožnit ještě dříve, než sestrojíme soustavu (2.56). Tato okolnost spočívá v tom, že prvky matice této soustavy mohou být značně velké (u soustavy (2.106) jsou řádu 1043), 142 143 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE OKRAJOVÉ ÚLOHY 2 METODY ZALOŽENÉ NA PftEVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI takže může dojít k přeplnění dříve než dospějeme s řešením příslušných rovnic do žádaného bodu. Následující věty udávají vodítko, jak se těchto obtíží zbavit. Navíc pak nabídnou možnost, jak obejít nutnost řešit úlohu s počátečními podmínkami pro rovnici (1.12), která může být neúnosně citlivá na malé chyby ve vstupních datech. Věta 2.4. Nechť p, p', q a f jsou spojité funkce v intervalu (a, b) a nechť platí (2.1) a (2.2). Nechť funkce y splňuje v intervalu (a, b) diferenciální rovnici (1.12) a první' okrajovou podmínku (1.13) a nechť platí cti í 0, ž 0 acti + ft > 0. Pak platí: (i) Je-li cti > 0, je (2.107) -p(x)y'(x) + <p(x)y(x) = v(x) pro každé x 6 (a, b), kde funkce ip je řešením diferenciální rovnice 1 (2.108) s počáteční podmínkou (2.109) a fufl&ce v je řešením diferenciální rovnice _ <p(x) p(x) + /(*) (2.110) s počáteční podmínkou (2.111) (ii) Je-li ^ > 0, je (2.112) -i>{x)p(x)y'(x) + y(x) = u(x) pro každé x € (a, b), kde funkce ij> je řešením diferenciální rovnice v(a) = p-. t»l />' - -q(x)ip2 + 1 p(x) (2.113) s počáteční podmínkou (2.114) a funkce u řešením diferenciální rovnice (2.115) u' - -q(x)i,(x)u + f{x)iji{x) 144 s počáteční podmínkou (2.116) Důkaz. Buď z řešení diferenciální rovnice (2.5) s počátečními podmínkami (2.51) a c řešení diferenciální rovnice (2.46) s počáteční podmínkou (2.54). Je-li ari > 0, pak podle lemmatu 2.2 je z(x) ž ai > 0 pro každé x 6 (a, b), a je tedy možno rovnici —z(x)p(x)y'(x) + p(x)z'(x)y(x) - c(x) platnou podle lemmatu 2.1 pro každé x G (a, 4) dělit funkcí z. Položíme-li tedy <p(x) — p(x)z'(x)/z(x) a v(x) = = c(x)jz{x), platí rovnice (2.107). Funkce ipav jsou však zřejmě v intervalu (a, b) spojitě diferencovatelné a přímým výpočtem se snadno zjistí, že splňují diferenciální rovnice (2.108), resp. (2.110) s počátečními podmínkami (2.109), resp. (2.111). Je-li P\ > 0, dává lemma 2.2 nerovnost p{x)z'(x) ž p\ > 0. Položíme-li il>(x) — = z(x)/\p(x)z'(x)] a u(x) = c(x)/\p(x)z'(x)], dokážeme stejně snadno jako výše platnost tvrzení (ii). Věta je dokázána. Věta 2.5. Nechť p, p', q a f jsou spojité funkce v intervalu (a, b) a nechť platí (2.1) a (2.2). Nechť funkce y splňuje v intervalu (a, i) diferenciální rovnici (1.12) a druhou okrajovou podmínku (1.13) a nechť cti ž 0, p\ ž 0, cti + Pl > 0. Pai plat/ (i) Je-Ji a 2 > 0, je (2.117) -p{x)v'(x) + <f>(x)y(x) = v{x) pro každé x £ [a, b), kde funkce ip je řešením diferenciální rovnice (2.118) s počáteční podmínkou (2.119) m = «2 a fiintce v je řešením diferenciální rovnice VÍ*) (2.120) s počáteční podmínkou (2.121) 6(6) = (ii) Je-li p2 > 0,je (2.122) -4{x)p{x)^(x) + 7rt» = ú(x) pro každé x £ (a, i>), kde funkce ý je řešením diferenciální rovnice 72 Qí2 ' (2.123) í>' = -q(x)ý2 + p(x) 145 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI s počáteční podmínkou (2.124) "2 a funkce ň je řešením diferenciální rovnice (2.125) ů' - -q{x)^x)ú + f(x)ý{x) s počáteční podmínkou (2.126) Důkaz Větu 2.5 dokážeme pomocí lemmatu 2.3 stejně snadno, jako jsme dokázali větu 2.4 pomocí lemmatu 2.2. Z věty 2.4 je vidět že lineární okrajovou podmínku typu (1.13) lze přesouvat pomocí rovnice (2.107), resp. (2.112), v ní? je koeficient u p(x)y'(x), resp. u y(x) roven minus jedné nebo jedné. Tento tvar přesunuté podmínky vznikl normalizací rovnice —z(x)p(x)y'(x)+p(x)z'(x)y(x) = c(z), a dá se proto očekávat, že koeficient <p, resp. ip neporoste tak nebezpečně, jako tomu bylo u koeficientů z a pz'. Totéž samozřejmě platí i pro druhou okrajovou podmínku. Jen je třeba vycházet místo z věty 2.4 z věty 2.5. Nyní už je snadné sestavit algoritmus pro řešení dané okrajové úlohy založený na normalizovaném přesunu okrajové podmínky. Přitom lze vycházet stejně dobře z věty 2.4 jako z věty 2.5. Začněme prvním případem. Nechť jsou splněny předpoklady existenční věty 2.2 a buď nejprve cti > 0. Pak podle věty 2.4 platí pro řešení dané okrajové úlohy speciálně (2.127) -p(b)y'(b) + <p(b)y(b) = v(b). (2.128) Protože platí zároveň i druhá okrajová podmínka (1.13), můžeme z rovnic (1.13) a (2.127) vypočítat hodnotu hledaného řešení v bodě x — b. Dostaneme 72 + ot2v(b) 01 + a2<p(b) a tento vzorec má smysl, neboť je fi2 + ot2<p(b) = \p\z{l) + ct2p(b)z'(b)]/z(b) £ 0 podle věty 2.2. Kdybychom ze zmíněných rovnic vypočetli ještě hodnotu y'(b), měli bychom k dispozici počáteční podmínky pro původní diferenciální rovnici (1.12). Jejím řešením se získanými počátečními podmínkami bychom dostali, aspoň teoreticky, řešení okrajové úlohy. Provedením tohoto postupu bychom se však zbavili pouze jedné nepříjemné vlastnosti metody prostého přesunu, totiž růstu prvků matice (2.56). Druhá potíž spočívající v citlivosti původní diferenciální rovnice na počátečních podmínkách by zůstala jako dříve. Protože však řešení dané okrajové úlohy splňuje rovnici (2.107) pro každé x € (a, 6), což je diferenciální rovnice prvního řádu, zdá se, že řešení dané okrajové úlohy je možné dostat také tak, že řešíme 146 (2.129) y(b) diferenciální rovnici (2.107) s počáteční podmínkou (2.128). Později uvidíme, že tento postup bude dokonce v jistém smyslu výhodný. Podobně postupujeme i v případě, že je /?i > 0. Z rovnice (2.112) psané pro x = b a z druhé okrajové podmínky (1.13) dostaneme Tij>{b) +aiu{b) MQ>) + «2 Použít tuto hodnotu jako počáteční podmínku přímo pro rovnici (2.112) je sice v zásadě možné, mohou však přitom vzniknout jisté problémy, protože na základě dosud uvedených tvrzení není jasné, zda nemůže nastat degenerace rovnice (2.112) v důsledku anulování koeficientu i}>. Proto je rozumnější počítat místo funkce y funkci (2.130) P(x)y'(x) = w(x) % diferenciální rovnice (2.131) -w' + q(x)il>(x)w = f(x) - q(x)u(x) s počáteční podmínkou 72 - /?2ti(fr) (2.132) w(b) = OC-2 + M(b) a funkci y pak vypočítat z rovnice (2.133) j/(i) = u(r) + rí>(x)w(x). Diferenciální rovnice (2.131) vznikla z diferenciální rovnice (1.12) dosazením za p(x)z'(x) podle (2.130) a za y podle (2.133) a počáteční podmínka (2.132) vznikla řešením rovnice (2.112) psané pro x = b a druhé rovnice (1.13) pro neznámou p(6)j/(i) = 11,(6). Následující věta právě popsanou metodu ospravedlňuje. Věta 2.6. Nechť jsou splněny předpoklady věty 2.2. Buďcti > 0 a buď funkce ip definovaná diferenciální rovnicí (2.108) s počáteční podmínkou (2.109), funkce v diferenciální rovnicí (2.110) s počáteční podmínkou (2.111) afunice y diferenciální rovnicí (2.107) s počáteční podmínkou (2.128). Pak y je řešením okrajové úlohy (1.12), (1.13). Buď 0i > 0 a buď funkce vj deňnovaná diferenciální rovnicí (2.113) s počáteční podmínkou (2.114), funkce ti diferenciální rovnicí (2.115) s počáteční podmínkou (2.116) a funkce w diferenciální rovnicí (2.131) s počáteční podmínkou (2.132). Pat funkce y deňnovaná rovnicí (2.133) je řešením okrajové úlohy (1.12), (1.Í3). Důkaz. Vyšetřujeme nejprve případ oři > 0. Podle věty 2.2 existuje jediné řešení problému (1.12), (1.13). Označme je pro potřeby tohoto důkazu y. Podle věty 147 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI 2.4 platí (2.134) a zároveň -p(b)y'(b) + v(b)y(b) = (2.135) c*2í>(W) +&£(*) = 72 Vypočteme-li z těchto dvou rovnic y(b), dostaneme (2.136) 72 + C12V{<>) ... 02 + a2<p(b) Dosadíme-li však za y(b) do rovnice (2.134) hodnotu y(b) a vzniklou rovnici odečteme od rovnice (2.107) psané pro x — b, dostaneme, že platí (2.137) p(4)ý'(6)=p(ft)j/(t). Z rovnice (2.107) je na první pohled vidět, že funkce y má v intervalu (a, b) spojitou nejen první derivaci, ale i druhou derivaci. Derivujeme-li rovnici (2.107) a dosadíme-li za ip' podle (2.108), za v' podle (2.110) a za y1 znovu podle (2.107), dostaneme, že funkce y splňuje diferenciální rovnici (1.12). Funkce y tedy splňuje stejnou diferenciální rovnici a stejné počáteční podmínky v bodě b jako funkce y. Podle věty □ jednoznačnosti je y(x) = y(x). Všimněme si nyní případu 0\ > 0. Je-li § opět řešení problému (112), (113), platí znovu podle věty 2.4 (2.138) -wmw)+$(*) = «(») a zároveň (2.135). Z těchto dvou rovnic však ihned plyne, že je (2.139) P(b)y'(b) = w(b). Píšeme-li však rovnici (2.133) pro x = b a dosadíme-li do rovnice (2.138) podle (2.139) a vzniklé rovnice odečteme, dostáváme, že je (2.140) Derivováním rovnice (2.133) a dosazením podle (2.115), (2.113) a (2.131) dostaneme, že platí (2.141) p(x)y'{x) = w(x). Odtud dalším derivováním plyne, že funkce y splňuje diferenciální rovnici (1.12). Toto zjištění spolu s podmínkami (2.140) a (2.139) však dává, že je y(x) = y(x). Věta je dokázána. Metodou popsanou ve větě 2.6, která tedy spočívá v tom, že okrajová podmínka se přesouvá v normalizovaném tvaru a že hledané řešení se dostane řešením diferenciální rovnice nižšího řádu, než je řád původní diferenciální rovnice, nazveme metodou normalizovaného přesunu okrajové podmínky. 148 Při metodě normalizovaného přesunu okrajové podmínky tedy řešíme nejprve zleva doprava dvě rovnice prvního řádu, z nichž jedna je nelineární (Ricattiova) a druhá lineární (v případě a i > 0 jsou to rovnice (2.108) a (2.110)), ahledané řešení dostaneme řešením lineární diferenciální rovnice zprava doleva. Řešení příslušných úloh s počátečními podmínkami přitom provedeme některou z metod popsaných v kap. I. Tam jsme sice všude předpokládali, že počáteční podmínka je zadaná v levém krajním bodě intervalu, v němž hledáme řešení, metody, které jsme uvedli, však lze beze změny užiti k řešení úloh, v nichž počáteční podmínka je zadaná v pravém krajním bodě daného intervalu. Stačí k tomu pouze předpokládat, že příslušný integrační krok je záporný. V popsaném postupu lze samozřejmě zaměnit roli krajních bodů intervalu (a, b). Postup je zřejmý, je jen třeba užít místo věty 2.4 větu 2.5. Tak za předpokladu, že je ot2 > 0, se řešení okrajové úlohy (1.12), (1.13) dostane řešením diferenciální rovnice (2.118) s počáteční podmínkou (2.119), diferenciální rovnice (2.120) s počáteční podmínkou (2.121) (obě tyto rovnice se řeší zprava doleva) a diferenciální rovnice (2.117) s počáteční podmínkou (2.142) Yl — ai0(a) V případě, že je 02 > 0, se řeší diferenciální rovnice (2.123) a (2.125) s počátečními podmínkami (2.124) a (2.126) zprava doleva, pak se řeší diferenciální rovnice (2.143) -w' + q(x)$(x)w - f(x) - q(x)ú(x) s počáteční podmínkou 71 ~ /?!"(") (2.144) w{a)-. -ai +0ií>(a) a hledané řešení se dostane z rovnice (2.145) y(x) = ů(x) + ij>(x)w(x). V případě, že nás zajímá řešení dané okrajové úlohy jen v jednom nebo několika málo bodech, je obvykle výhodnější postupovat obdobně jako u metody prostého přesunu. Řešením rovnic (2.108) a (2.110), resp. rovnic (2.113) a (2.115) přesuneme levou okrajovou podmínku do žádaného bodu xq a pomocí rovnic (2.118) a (2.120), resp. (2.123) a (2.125) přesuneme pravou okrajovou podmínku do téhož bodu. Hodnotu y(x0) a p(xa)y'(xo) pak vypočteme ze vzniklé soustavy. I tuto variantu nazveme metodou normalizovaného přesunu. O metodě normalizovaného přesunu bychom rádi tvrdili, že se v nějakém smyslu chová lépe než metoda střelby nebo metoda prostého přesunu. Doposud ovšem víme pouze, že tato metoda odstraňuje jen ten menší problém spojený s metodou prostého přesunu nebo metodou střelby, totiž přílišný růst veličin, s nimiž jsme nuceni počítat. Daleko vážnější nedostatek zmíněných metod spočívající v neúnosné 149 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE.- OKRAJOVÉ ÚLOHY vysoké citlivosti výchozí rovnice na počátečních podmínkách jsme zatím odstranili pouze tak, že jsme příslušnou úlohu z algoritmu normalizovaného přesunu prostě vyřadili a nahradili ji úlohou s počátečními podmínkami pro jinou diferenciální rovnici. Snažme se proto nalézt nějaké matematické důvody, které by vhodnost tohoto postupu podepřely. Začněme následující definicí: Definice 2.1. Řekneme, že řešení y diferenciální rovnice (2.146) ý = f(x,y) je stabilní vzhledem k trvale působícím poruchám, jestliže ke každému s > 0 existuje A > 0 tak, že pro každé řešení diferenciální rovnice (2.147) pro něž platí (2.148) Šř* = f (x, 9) + *(*). r £ (a, co), |iŕ(a) - y(a)\ S A (2.149) platí (2.150) pro každé x g (a, oo). sup \Ó(x)\ 5= A, \y(x) - y(x)\ < e Je zřejmé, že stejně dobře můžeme mluvit o stabilitě vzhledem k trvale působícím poruchám i v případě diferenciálních rovnic vyšších řádů nebo soustav diferenciálních rovnic. Stačí k tomu pouze pokládat v předchozí definici veličiny y a / nikoli za skaláry ale za vektory. Definice 2.1 postihuje zejména to, že řešení diferenciální rovnice, které je stabilní vzhledem k trvale působícím poruchám, závisí spojitě na malých změnách počáteční podmínky a pravé strany stejnoměrně vzhledem k délce intervalu, v němž je uvažujeme. Stabilita vzhledem k trvale působícím poruchám tedy vylučuje chování, které je při metodě střelby nebo metodě prostého přesunu typické, totiž že chyby podstatně závisí na délce intervalu, v němž hledáme řešení. Proto kdyby se nám podařilo dokázat, že rovnice normalizovaného přesunu jsou stabilní vzhledem k trvale působícím poruchám, byl by to velmi významný matematický argument v jejich prospěch. V dalším textu ukážeme, že za určitých doplňujících předpokladů tomu tak skutečně je. Nejdříve však zformulujeme a dokážeme pomocné tvrzení citované obvykle jako Bellmanovo nebo Gronwallovo lemma. 150 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Lemma 2.6. Nechť funkce ip, V> a x jsou spojité v intervalu (a,b) a nechť x je v tomto intervalu nezáporná. Nechť dále platí (2.151) y*.) i V(x) + f x{tMt)At pro každé x g (a, b). Pak platí (2.152) <p(x)^^(x)+ ľ X(r)Í>{rW"x^didT J a pro každé x g (a, b). Důkaz. Položme (2.153) R(x) = ľ X(t)<p(t)dt. J a Z předpokladu (2.151) a z nezápornosti funkce x snadno plyne, že platí (2.154) R'{x)-x{x)R{x)Sx(xmx). Definujeme-li funkci V diferenciální rovnicí (2.155) V - X(x)V = X(x)i>(x) s počáteční podmínkou (2.156) V (a) = 0, je (2.157) R(x) g V(x) pro každé x £ (a, 6). Skutečně, položíme-li Z{x) = V(x) — R(x), je (2.158) Z'(x)-x(x)Z(x) = j(x), kde 7 je nezáporná funkce; rovnice (2.158) plyne ihned odečtením nerovnosti (2.154) od rovnice (2.155). Řešení diferenciální rovnice (2.158) s počáteční podmínkou Z{a) = 0, která je zřejmě splněna, však lze psát vzorcem (2.159) Z{x)- ľ y(r)el' *Wd< d r, Ja jak se snadno zjistí přímým výpočtem. Ze vzorce (2.159) je však patrno, že funkce Z je nezáporná v intervalu {a, b). Použijeme-li vzorec (2.159) ještě jednou, tentokrát na funkci V, dostáváme tvrzení lemmatu z nerovnosti (2.157). Věta 2.7. Nechť funkce p, p', q a / jsou spojité v intervalu (a,oo) a nechť v tomto intervalu platí (2.160) 0 < po S p(x) § Po 151 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI .t (2.161) 0 < 3o š q(x), kde po, qo a Po jsou konstanty. Nechť dále platí cn > 0 a f}\ > 0. Pale řešení diferenciální rovnice (2.108) a (2.110) s počátečními podmínkami (2.109) a (2.111) jsou stabilní vzhledem k trvale působícím poruchám. Důkaz Začneme rovnicí (2.108). Buď tedy <p řešení diferenciální rovnice 1 (2.162) a položme (2.163) e(x) = tp(x)-<f(x). Odečteme-li rovnici (2.108) od rovnice (2.162), dostaneme po snadných úpravách, že funkce e splňuje diferenciální rovnici (2.164) e' + 2<p(x) e + - 1 p2 - p(x) p(x) Máme dokázat, že řešení této diferenciální rovnice je pro každé x £ (a, oo) malé za předpokladu, že jeho počáteční podmínka je malá a že pravá strana je malá. Abychom toto tvrzení dokázali, ukažme nejprve, že existuje konstanta ipa > 0 taková, že pro řešení ^ diferenciální rovnice (2.108) s počáteční podmínkou (2.109) platí (2.165) ip{x) ž po pro každé x ě (a, oo). Definujme k tomu cíli v intervalu (a, oo) funkci ip diferenciální rovnicí 1 Po (2.166) s počáteční podmínkou (2.167) Ví(a) = y(a) Přímým výpočtem se zjistí, že je 9n (2.168) 1/2y(tt) + (w/2tgM(£r >-■»)] PÍ«)t*[(ft)1/,(»-«)]+(Poío)1/í' Položíme-li w{x) = tp(x) — ij>{x), zjistíme snadno, že platí (2.169) J(x) + i"(a) + *(*)ul(«) = q(x) - ,o + (- - -fr) ž 0. P(x) \po P[x)J 152 Odtud a ze vzorce (2.167) však plyne, že je (2.170) <p(x) ž tp(x) pro každé a; e (a, oo). Je-li nyní (2.171) ?(a) ž (p0?o)1/2, je (2.172) ?(a){l - tgh [( 2j)1/2(x - a)] } g (p0?0)l/2{l - tgh [(g) - a)] }, neboť platí tgh 2; í 1 pro každé z. Z nerovnosti (2.172) však ihned plyne, že je (2.173) ť(c) =1 (Po?o)1/2. Je-li naopak (2-174) #>(a) < (po^o)1'2, je zřejmě tp2(a) < po9o, a tedy (2.175) ^2(a)tgh " a)] + (poío)1/2řW š ŽPoíotgh [(^)!/% - °)] + (poíoJ^Vfa) - = (poSc)1/2{(po4o)1/2tgh [(g)I/S(* «)] +**.)} Z nerovnosti (2.175) už snadno plyne, že je (2.176) i>(x) ^ ip(a). Za číslo <po v nerovnosti (2.165) tedy staří vzít min ((poío)1'2! í*(<0) 1 protože vzhledem k předpokladu > 0 je p(a) > 0. Za předpokladu, že rovnice (2.164) má řešení, platí (2.177) e(*)-=:e(a)exp[-£^dí] + Zde jsme použili vzorce analogického ke vzorci (2.159) pro řešení lineární diferenciální rovnice s nenulovou počáteční podmínkou. Položme dále (2.178) takže platí (2.179) 0 < <T < Po ' p(x) 153 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE OKRAJOVÉ ÚLOHY pro každé x £ (a,oo). Odhadneme-li integrály z funkce 2<p/p ve vzorci (2.177) pomocí tohoto čísla <r, dostaneme (2.180) e(z)| S \e(a)\e-°(*-^ + ľ jŕ(r) - tjllL-l*-*) d Ja 1 P(T) 1 Buď nyní S libovolné pevně zvolené kladné číslo, pro něž platí (2.181) s S iporr a buď/3(e) = sup{/?; řešení e rovnice (2.164) existuje na intervalu (a, /?) a je je(ar) | š á e}. Podle dennice čísla /3(s) tedy platí pro x £ {a,j3(e)) (2.182) I p(s) I po Dosadíme-li tento odhad do nerovnosti (2.180) a položíme-li S = maxjÄ(z)|> dostaneme po snadných úpravách, že je (2.183) |e(i)|e'(í'-a) g |e(a)| + -[e"^-"5 - 1] + — T Kr)^—' d r. Použijeme-li na nerovnost (2.183) lemma 2.6, dostaneme. (2.184) |e(x)|e°(*-,I> š |e(o)| + -[e**-) - 1]+ O" + — T j|e(o)| + -ľe"^-"' - l])e» ("-T) d r. Po J« L <r J Výpočtem integrálů a snadnou úpravou odtud plyne, že platí (2.185) |e(z)| š ^(a^'-^-'h H--H1-e *° ]■ Z nerovnosti (2.181) plyne, že je cr - ŕ/po ä o- - (r/2 > 0 a l/(cr - e/po) í 2/o\ Tedy pro x £ (a,/?(s)) a pro \S(x)\ í 5 platí (2.186) Buď konečně (2.187) a nechť platí (2.188) a (2.189) 154 |e(*)|S|«(a)| + ^. A = min g, ^) \<p{a) (p(a)I^A |«(*)| g A. 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Tvrdíme, že pak řešení e existuje na intervalu (a, oo) a platí (2.190) |e(z)| < e. Skutečně, ze spojitosti funkce c a z nerovnosti \e(a)\ í s/4 < í plyne, že číslo f}(e) je větší než a a nerovnost (2.190) zřejmě platí pro x £ (a,/?(«)). Předpokládejme, že je /?(ř) < oo. Podle (2.186) platí pro x £ (a,/3(£)), že je (2.191) |e(s)|ŠA+_Š3 + 5 = -<*. To je však spor s definicí čísla /?(e). Rešení y rovnice (2.108) je tedy skutečně stabilní vzhledem k trvale působícím poruchám. Platnost stejného tvrzení pro rovnici (2.110) se už dokáže podstatně snadněji, neboť tato rovnice je lineární. Buď tedy v řešení diferenciální rovnice S' + ^S = /(*) + %) (2.192) a položme (2.193) e(x) = v(x) - v(x) Pak funkce e splňuje diferenciální rovnici (2.194) PW Řešení této diferenciální rovnice existuje v celém intervalu (a, oo) a dá se psát pomocí vzorce e(x) = e(a)e~f* 5$d'+ (2.195) + f f(r)e_í' %%á1di. la Použijeme-!i nerovnost (2.179), plyne odtud, že je (2.196) í. |e(z)| í |e(a)|eí(*-a> + -[1 - e"^-")], kde Ä = max|ó"(z)|. Odtud však už požadované tvrzení plyne bezprostředně. Věta je dokázána. Snadno lze též dokázat, že za předpokladů analogických jako ve větě 2.7, ovšem tentokrát formulovaných pro interval (—oo, b), je i rovnice (2.107) stabilní vzhledem k trvale působícím poruchám, Na závěr tohoto odstavce ilustrujme metodu normalizovaného přesunu řešením téže okrajové úlohy jako v příkladě 2.2. Výsledky, které byly získány za stejných podmínek jako v citovaném příkladě, totiž užitím standardní Rungovy-Kuttovy metody s integračním krokem h — 0, 025, jsou shrnuty v tab. 2.3. Vidíme, že jsou podstatně uspokojivější než u metody střelby nebo prostého přesunu. 155 I II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY Tabulka 2.3 Řešení okrajové úlohy pro diferenciální rovnici (2.103) metodou normatiaovaného přesunu 9 = = 100 i = : 500 X přibližné řešení chyba přibližné řešení chyba 0,0 0,000000 0,000 000 0, 000000 0,000 000 0,1 0,309012 -0,000005 0,309007 -0,000 010 0,2 0,587778 -0,000007 0,587770 -0,000 015 0,3 0,809009 -0,000008 0,808999 -0,000018 0,4 0,951048 -0,000 009 0, 951037 -0,000019 0,5 0,999989 -0,000 011 0,999979 -0,000021 0,6 0,951045 -0,000012 0,951038 -0,000018 0,7 0,809009 -0,000 008 0,809007 -0,000010 0,8 0, 587784 -0,000001 0,587780 -0,000 005 0,9 0, 309018 0,000 001 0,309016 -0,000 001 1,0 0, 000000 0,000 000 0,000000 0,000 000 2.3.2 Obecná soustava lineárních diferenciálních rovnic V tomto odstavci stručně ukážeme, jak lze přenést myšlenku normalizovaného přesunu na případ obecné soustavy lineárních diferenciálních rovnic. Začneme několika pomocnými tvrzeními. Lemma 2.7. Buď <l>(x) = {pij(x)} čtvercová matice řádu m, jejíž prvky jsou diferencovatelné funkce v intervalu I. Pak platí (2.197) [det$(x)]' = tr[$'(x)&(x) pro každé iěí, ide * = {'Pij) a pij je algebraický doplněk prvku ipj, matice tj. determinant matice řádu m — 1, která vznikne z matice * vypuštěním j-tého řádku a i-toho sloupce opatřený znaménkem (—1)'+J a tr(.) značí stopu matice, tj. součet jejích diagonálních prvků. Důkaz. Z definice determinantu plyne, že platí (2.198) [det*(s;)]' = det Vál P12 ^22 Pln P2n Vml Vm2 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI + det Vil Vl2 V21 <p22 Vml Vm2 Vln Vir, Vmm + ... + det Vil V12 <P21 V22 Vml Vm2 Vir, IPztr Rozvineme-li první determinant na pravé straně rovnice (2.198) podle prvků prvního sloupce, druhý determinant podle prvků druhého sloupce atd., dostaneme m m (2.199) [det*(j!)]'= X>iiVi* + ^vS^-r fc=i t=ij=i což dokazuje lemma. Lemma 2.8. Buď4?(x) ~ {ípij(x)} čtvercová matice, jejíž prvky <Pij{x) jsou diferencovatelné pro i^Ja nechť existuje pro « £ í inverzní matice #-1(ar), Pak prvky matice #-1(a;) jsou také diferencovatelné via platí (2.200) [#-1(a0]' - -í-1^)*^)*-1^). Důkaz. Diferencovatelnost matice ^~1(x) plyne ihned z rovnosti $~1(x) = = &(x)/ det$(a;), kde í je matice z lemmatu 2.7. Rovnici (2.200) pak dostaneme derivování identity 4ř~1(x)$(x) = i. Lemma 2.9. BuďA(x) čtvercová matice řádu m se spojitými prvky v intervalu I a buď<l>(x) čtvercová matice řádu m definovaná maticovou diferenciální rovnicí (2.201) s počáteční podmínkou (2.202) #' = A(x)$, x e I, <P(a) = /, kde I je jednotková matice řádu maiEl, Pat matice $(x) je regulární pro každé x € I. Důkaz. Podle lemmatu 2.7 platí pro x € I (2.203) [det *(*)]' = tr[#'{x)Í(x)} = ti[A(x)$(x)$(x)] = [det *(i)] tr[A(x)], neboť $(x)$(x) = [det #(«)]/. Pro libovolné i£í tedy platí (2.204) det = e'- '^MN r_ protože je det^(a) = 1. Připomeňme, že matici í zavedenou v lemmatu 2.9 jsme v odst. 2.1.2 nazvali fundamentální matici soustavy y' = Ay. 156 157 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE OKRAJOVÉ ÚLOHY Zatímco lemmata 2.7 - 2.9 mají obecnou platnost, následující lemma už se bezprostředně týká metody přesunu okrajových podmínek pro soustavu lineárních diferenciálních rovnic (2.11) s lineárními separovanými okrajovými podmínkami (1.6), Předpokládejme tedy v dalším, že pro tuto okrajovou úlohu jsou splněny předpoklady zformulované na začátku odst. 2.2.2. Lemma 2.10. Nechť matice R (x) typu mj x m je defínovaná v intervalu (£1,^2) diferenciální rovnicí (2.81) s počáteční podmínkou (2.82). Pak hodnost matice/? (x) je pro každé x £ (Íi,Íj) rovna hodnosti matice V0. Důkaz . Buď í (x) fundamentální matice soustavy y' = Ay určená počáteční podmínkou #(£0) — /■ Podle lemmatu 2.9 je matice <p(x) regulární pro každé x £ £ (íiiía)- Matice Vo$~1(x) má tedy smysl a splňuje zřejmě podmínku (2.82), Na základě lemmatu 2.8 se snadno vypočte, že splňuje i diferenciální rovnici (2.81). Platí tedy (2.205) R(x) = V0*-l(x) pro každé x £ (íi.ťa)- Odtud však už požadované tvrzení plyne, neboť matice *-1(x) je regulární pro každé x £ (£1, £2). Obraťme se nyní k řešení okrajové úlohy (2.21), (1.6), V odst. 2.2.2 jsme viděli, jak lze mi okrajových podmínek tvaru (2.206) Viy(a) = vi, kde Vi je obdélníková matice typu mi x m, přesunout do libovolného bodu intervalu (a, b). Předpokládáme-li, že hodnost matice V\ je rovna číslu mi, lze v ní vybrat mi lineárně nezávislých sloupců. Budeme předpokládat, že je to prvních mi sloupců, neboť toho lze vhodným přečíslováním složek vektoru y, a tedy přerovnáním sloupců matice V\, vždy dosáhnout. Dá se tedy psát (2.207) kde v/1^ je regulární čtvercová matice řádu mi, a okrajovou podmínku (2.206) lze uvést na tvar (2.208) [/,-G0]y(a) = ffo, kde matice G<y typu mi x (m — mi) je dána rovnicí (2.209) G0 = -(V1W)-1Vií) a mi-dimenzionální vektor jo rovnicí (2.210) jo = (Vo(1))-V 158 2 METODY ZALOŽENÉ NA PŘEVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Nechť matice R(x) a vektor r (x) realizují přesun okrajové podmínky (2.208). Matice R tedy splňuje diferenciální rovnici (2.87) s počáteční podmínkou (2.211) ff(a) = [/,-Gb] a vektor r diferenciální rovnici (2.91) s počáteční podmínkou (2.212) r(a) = ga, přičemž plati (2.213) R(x)y(x) = r(x) pro každé řešení dané okrajové úlohy (srv. větu 2.3 z odst. 2.2.2). Položme (2.214) r?(x) = [/?i(x), /?2(x)], kde bloky matice R jsou utvořeny stejně jako bloky matice Vi. Položíme-li ještě (2.215) y(x) =[yi(x),y2(x)f, kde (2.216) yi(x)=[1y(x),...riy(*)f, Ä(«)=r+1»M....."itfof (tj. vektor yi má za složky prvních ra; složek vektoru y a vektor y2 je tvořen zbývajícími složkami tohoto vektoru), lze rovnici (2.213) psát ve tvaru (2.217) Ri(x)yi(x) + R2(x)y2(x) = r (x), x e (a, 4). Mimoto pro matici /?i(x) platí podmínka Ri(a) = /. V důsledku spojitosti prvků této matice tedy existuje í > 0 takové, že matice Ri{x) je regulárni na intervalu (a, a + í). Předpokládáme-li, že matice /?i(x) je regulární na celém intervalu (a, b), lze přesunutou podmínku (2.217) psát ve tvaru (2218) yi(x) - G(x)y2(x) = 3(x), kde matice G(x) je dána rovnicí (2.219) G(x) = -[R1(x)]-1R2(x) a vektor j(x) rovnicí (2.220) g(x) = [R1{x)]-1r(x). Podmínka (2.218) už je v normalizovaném tvaru v tom smyslu, že koeficienty vystupující u prvních mi složek vektoru y(x) tvoří v celém intervalu (a, 4) jednotkovou matici. Abychom tedy mohli přesouvat danou okrajovou podmínku v normalizovaném tvaru, musí být především matice Ri(x) regulární pro každé x £ (a, 6) a musí být 159 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY možné počítat prvky matice G(x) a složky vektoru g(x) přímo a nikoliv pomocí matice R(x) a vektoru r(x) z metody prostého přesunu. Položíme-li (2.221) a (2.222) kde (2.223) A(x) = Au(x) Au(x)l *n(x) A22(x)\ ' M = I/i(»),/»(*)]*■, ' a„(i) ... almi(x) An(x) = An(x) ■ An{x) = A22{x) = ai,mi+i(x) .am1,m,+l(x) ami+i,i(a;) .. "mi(x) amí+l,mi+l(x) (*) aim(x) •■ amim(x) am1+l,m1(x) "mnv, (z) am1+l,m(x) ^mmííc) =[1/(í),...,mi/(ir)]T, =ri+7(«),...,"/w]T, určí se matice G(x) řešením maticové diferenciální rovnice (2.224) e« = ^u(a)G _ G^22(x) _ GA21(x)G + Au(x) s počáteční podmínkou (2-225) 6(a) = Gb a vektor g řešením diferenciální rovnice (2.226) j' = [An(x) - G(x)A2l(x)]g + - G(x)f2(x) s počáteční podmínkou (2-227) g(a) = gQi jak se snadno zjistí. 160 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Maticová diferenciální rovnice (2.224) je nelineární (viz člen GA2\G), takže její řešení nemusí existovat v celém intervalu (a, 4). Předpoklad, že matice Rf 1(x) existuje pro každé x 6 (a, i), je vlastně totožný s předpokladem, že soustava diferenciálních rovnic (2.224) má řešení v celém intervalu (a,fc). O opatřeních, která je třeba učinit, je-li tento předpoklad porušen (což se pozná podle toho, že se nepodaří dojít s řešením rovnic (2.224) až do bodu b), se zmíníme později. Pomocí rovnic (2.218) přesuneme tedy okrajovou podmínku až do bodu b. Dostaneme tak rovnice (2.228) yi{b)-G{b)n{h) = g{b). Přidáme-li k těmto rovnicím druhou okrajovou podmínku (1-6), kterou zapíšeme pro názornost ve tvaru V2^[V2wm\ (2.229) kde jsme položili (2.230) dostaneme řešením takto vzniklé soustavy rovnic počáteční podmínku y{b) = = [yi(',)>>r2('l)]T hledaného řešení. Abychom utvořili úplnou analogii metody normalizovaného přesunu z odst. 2.3.1, nesmíme použít tuto počáteční podmínku pro původní soustavu diferenciálních rovnic, ale použijeme pouze její složku y2(6) jako počáteční podmínku pro soustavu diferenciálních rovnic (2.231) y'2 = [^22(x) 4- A21G(x)]y2 + f2+A21g. Tato soustava diferenciálních rovnic vznikla vyloučením složky y\ (x) hledaného řešení z původní soustavy (2.11) užitím rovnic (2.218). Řešením diferenciální rovnice (2.231) dostaneme složku y2 hledaného řešení. Potřeb ujeme-li znát i složku yi, určíme ji z (2.218). Metoda normalizovaného přesunu spočívá i pro uvažovanou obecnou okrajovou úlohu v řešení dvou úloh s počátečními podmínkami v bodě a, z nichž jedna je nelineární, a lineární úlohy s počátečními podmínkami v bodě b. Není-li splněn předpoklad regularity matice ŕ?i(x) v celém intervalu (a, b), za něhož jsme metodu normalizovaného přesunu okrajové podmínky odvodili, projeví se to tak, že uvnitř intervalu (a, b) existuje bod, v němž absolutní hodnoty některých prvků matice G(x) rostou nade všechny meze. Z lemmatu 2.10 však plyne, že matice R{x) = [rři(x), /?2(x)]r má hodnost mi pro každé x e (a, b), a tedy má vždy některých mj sloupců lineárně nezávislých. Můžeme tedy postupovat tak, že v tom bodě intervalu (a, b), v němž absolutní hodnota některého prvku matice G(x) převýší nějakou předem danou toleranci, provedeme nový výběr lineárně nezávislých sloupců matice R(x). V dalším výpočtu pak bude roli matice Ri(x) hrát matice sestavená z těchto sloupců. Příslušné diferenciální rovnice se samozřejmě změní, neboť nový výběr lineárně nezávislých sloupců znamená nové přečíslování složek 161 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY hledaného vektoru. Do dalších podrobností, které mohou být značně komplikované, už nebudeme zacházet, naším cílem bylo ukázat pouze základní myšlenku možného postupu. Pravou okrajovou podmínku lze samozřejmě také přesouvat v normalizovaném tvaru pomocí diferenciálních rovnic, které jsou analogické k rovnicím (2.224) a (2,226). Přesuneme-li tedy levou okrajovou podmínku a pravou okrajovou podmínku do téhož bodu £, můžeme vypočítat složky hledaného vektoru řešení v tomto bodě řešením soustavy lineárních algebraických rovnic. Dostaneme tak modifikaci metody normalizovaného přesunu, při níž řešení soustavy diferenciálních rovnic typu (2.231) odpadá. Praktické zkušenosti ukazují, že popsaná metoda normalizovaného přesunu okrajové podmínky vykazuje např. ve srovnání s metodou střelby většinou podstatně stabilnější chování. Je však dosti náročná na paměť počítače a kromě toho soustavy diferenciálních rovnic, které se v ní vyskytují, jsou často soustavami se silným tlumením, z čehož mohou vzniknout určité problémy při jejich řešení. Toto vše spolu s tím, že jde o metodu určenou výhradně k řešení lineárních problémů, může představovat v některých případech její citelný nedostatek. 3 Metoda sítí y^'f -„ Základní myšlenka metody sítí, zvané také diferenční metoda, je velice jednoduchá. V intervalu {a, b), v němž hledáme řešení dané okrajové úlohy, se zvolí konečná množina bodů zvaná síť — může to být např. množina ekvidistantních bodů k - 0,..., n}, tj. množina bodů daných předpisem (3.1) xh = a + kh, k = 0,...,n, kde a n je přirozené číslo — a v bodech této množiny se splní daná diferenciální rovnice (eventuálně i okrajové podmínky) přibližně, a to tak, že derivace, které se v nich vyskytují, se nahradí diferenčními podíly (tj. lineárními kombinacemi funkčních hodnot v okolních bodech), které je aproximují. Zanedbáme-li chyby, které přitom vzniknou, dostaneme pro hodnoty v bodech sítě soustavu konečně mnoha rovnic (v případě lineárního problému lineárních). Abychom mluvili konkrétně, uvažujme jako příklad jednoduchou diferenciální rovnici (3.3) ý"~f{x,y), xe(a,b), s okrajovými podmínkami (3.4) y(a) = 71, y(b) - 72. 162 3 METODA SlTl V odst. 3.4 ukážeme, že tato okrajová úlohy má za předpokladu dostatečné hladkosti funkce / a za předpokladu, že platí fv(x,y) ž 0, právě jedno řešení. Provedeme-li postup, který jsme naznačili, tj. aproximujeme-li druhou derivaci funkce y v bodě Xk podílem [j/(a:fc_i) — "íy(xk) + y(xk+i)]/h?, dostaneme, že pro i; = 1,.. .,n - 1 platí (3.5) -p-= f{Xk,yk) + £t, kde £t je chyba, které jsme se dopustili náhradou druhé derivace zmíněným podílem. Hodnoty přibližného řešení v bodech Xk, k = 0,..., n, které označíme yk, budeme tedy hledat ze soustavy (3.6) 3/jfc-i - tyk + Vk-i = h2f(xk,yi), k = 1, ,n-l, Vo - Ti, yn - ti- Vidíme, že soustavu rovnic (3.6), která nahrazuje původní okrajovou úlohu (3.3), (3.4) konečnědimenzionálním problém, jsme získali formálně velice jednoduše. Abychom však mohli mluvit o skutečné numerické metodě pro řešení dané okrajové úlohy, musíme ještě dát odpověďna tři otázky: (i) Musíme zjistit, zda soustava (3.6) má vůbec nějaké řešení, (ii) Musíme určit numerickou metodu pro řešení této soustavy a vyšetřit její vlastnosti (např. otázku konvergence iterací apod.). (iii) Musíme vyšetřit vztah mezi veličinami yk získanými řešením soustavy (3.6) ahodnotami y(xk) přesného řešení při h —> 0; jinými slovy, je třeba vyšetřit konvergenci popsaného postupu. Dát univerzální návody na řešení bodů (i), (ii) a (iii) není za současného stavu našich znalostí možné, upozorňujeme pouze na nutnost provedení patřičných úvah pro každý jednotlivý případ zvlášť. Z předchozího textu by mohl vzniknout dojem, že „nultý" bod při užití metody sítí, tj. postup, kterým získáme soustavu typu (3.6), je natolik jednoduchý, že se jím není třeba už dále zabývat. Není však tomu úplně tak, neboť je známo, že zdánlivě nepatrné modifikace mohou mít dosti podstatný vliv na vyšetřování problémů (i), (ii) a (iii). Proto si v dalších odstavcích, v nichž popíšeme metodu sítí pro některé konkrétní úlohy, všimneme všech čtyř zmíněných aspektů. Ještě předtím však věnujeme zvláštní odstavec tzv. monotónním maticím, neboť tato třída speciálních matic hraje v souvislosti s metodou sítí značně důležitou roli. 3.1 Monotónní matice Definice 3.1. Řekněme, že čtvercová matice A = {a,3} řádu n je monotónní, platí-li implikace (3.7) Ax^0=^x^0. Nerovnostem mezi vektory, případně maticemi, zde rozumíme tak, že příslušné nerovnosti platí pro všechny složky, případné prvky. Podobně symbolem |x| rozumíme, vektor, jehož složky jsou absolutní hodnoty složek vektoru x. 163 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE OKRAJOVÉ ÚLOHY Monotónní matice je tedy taková matice A, že z nezápornosti všech složek vektoru Ax plyne nezápornost všech složek samotného vektoru x. V několika následujících tvrzeních ukážeme některé základní vlastnosti monotónních matic, které v dalším textu použijeme. Lemma 3.1. Matice A je monotónní tehdy a jen tehdy, je-li regulární a je-li inverzní matice A'1 nezáporná (tj. má-li všechny prvky nezáporné). Důkaz. Předpokládejme nejprve, že matice A je monotónní a nechť vektor x je řešením soustavy Ax = 0. Z definice 3.1 pak ihned plyne, že je x = 0 (Ax ž ž 0 a A(—x) ž 0). Homogenní soustava Ax = 0 má tedy pouze triviální řešení, což dokazuje regulárnost matice A. Nezápornost matice A-1 plyne ihned z rovnice AA~X = / a definice 3.1. Obrácené tvrzení je zřejmé na první pohled. Lemma je dokázáno. Lemma 3.2. Nechť A je monotónní matice a nechť pro vektory y a z platí (3.8) \Ay\š Az. Pak platí (3.9) |y| í z. Důkaz Z nerovností (3.8) ihned plyne, že pro vektory z — y a. z + y platí A(z — y)~_\ 0 a A(z + y) ^ 0. Použijeme-li nyní implikaci (3.7), dostaneme ihned požadované tvrzení, Lemma 3.3. Nechť pro monotónní matice A a B platí nerovnost (3.10) A^B. Pak platí (3.11) A-XZB-1. Důkaz Tvrzení plyne ihned z identity A'1 - B'1 = A~1(B — A)B~1, na jejíž pravé straně je součin tří nezáporných matic, tj. nezáporná matice. Z uvedených lemmat vidíme, že monotónní matice mají řadu sice jednoduchých, ale, jak uvidíme, velmi důležitých vlastností. Podtrhněme zejména lemma 3.2, které dává možnost odhadnout řešení soustavy lineárních rovnic s monotónní maticí řešením soustavy, jejíž pravá strana majorizuje pravou stranu původní soustavy, a které tak představuje účinný aparát ke konstrukci nejrůznějších odhadů. Vzhledem k tomu, že zkoumání monotonie dané matice přímo z definice 3.1 je většinou nepohodlné (a často také vůbec prakticky neproveditelné) a ani ekvivalentní podmínka vyjádřená v lemmatu 3.1 obecně také mnoho nepomůže, uvedeme jednoduchou postačující podmínku uváděnou v literatuře pod názvem Collatzovo lemma. Před jeho formulací je třeba zavést ještě některé další pojmy. 3 METODA SlTf Definice 3.2. Řekněme, že čtvercová matice A = {clíj} řádu n je reducibilní, je-li možné přerovnat indexy l,...,n v posloupnost ri,...,ív, <ri,...,<r„-r, 1 S úr<n, tak, že platí ae„0ll = 0 pro v = 1,..., r a u = 1,..., n — r. Matici která není reducibilní nazveme ireducibilní. Poznamenejme, že kromě slov reducibilní a ireducibilní se užívá také pojmů rozložitelná a nerozložitelná. Lemma 3.4. Matice A řádu aspoň 2 je ireducibilní tehdy a jen tehdy, existuje-li ke každé dvojici indexů i, j, i ^ j posloupnost indexů j'i ,..., i, taková, že platí Důkaz . Nechť za prvé tvrzení lemmatu není pravda. Pak existuje dvojice indexů io, jo, 'o jo, taková, že ať zvolíme posloupnost ..., is jakkoliv, vždy je některé z čísel a,-,,;,, 0{1i2,..., dí.j-j rovno nule. Znakem £ označme množinu indexů, do které patří index !*o a dále každý index j ^ io takový, že k němu existuje posloupnost indexů i\,..., im taková, že je (!,■„,-, ^ 0, ail!2 ^ 0,..., o.imj ^ 0. Množina Jř je neprázdná (io E ^) a neobsahuje všechny indexy, neboť index jo do ní nepatří. Je tedy tvořena indexy gi,... ,gr> 1 á r < n. Zbývající indexy označme tri,..., on-r. Tvrdíme, že platí arlJÍr(J - 0 pro v — 1,..., r a fi = 1,..., n — r. Kdyby to totiž nebyla pro některé íi, fí pravda, platilo by aetajl ^ 0. Podle definice množiny ^ však existuje posloupnost ..., im taková, že platí a,-,,^ ^ 0, a,^,-, ^ 0,..., Ojmŕs ^ 0. Celkem by tedy platilo Oí0íl ^ 0, Oj,ť3 ^ 0,..., a,-mei! £ 0, aeeVf ^ 0, tj. o-ji £ f. To je však spor dokazující, že skutečně platí ae>ff = 0 pro ľ = l,...,ra/i = = 1,..., n — r. Odtud však plyne, že matice A je reducibilní. Nechť naopak A je reducibilní. Pak tvrzení lemmatu neplatí pro libovolnou dvojici indexů qv, cr^. Lemma je dokázáno. Tvrzení lemmatu 3.4 se nejsnáze pamatuje a také prověřuje pomocí pojmů teorie grafů. Pojem graf je značně obecný topologický pojem a je základem velmi obsáhlé teorie. My se zde omezíme na konečné orientované grafy. Konečným orientovanými grafem rozumíme uspořádanou dvojici konečných množin V a H, kde množina H je tvořena některými uspořádanými dvojicemi bodů z množiny V (je tedy H C V x V). Prvky množiny V se nazývají uzly nebo vrcholy grafu a prvky množiny H hrany daného grafu. Je-li počet uzlů grafu malý, můžeme jej znázornit diagramem tak, že uzly znázorníme body v rovině a hrany oblouky označenými šipkami. Tyto oblouky vycházejí z uzlu, v němž hrana začíná a směřují do uzlu, v němž hrana končí. Posloupnost neopakujících se uzlů u%, - ■ -, "Jc taková, že dvojice (ui,U2), («2, U3),..., (nfc_i, u*) jsou hrany grafu, se nazývá dráha. Existuje-li z každého uzlu daného grafu dráha do libovolného dalšího uzlu, nazveme graf silite souvislým. Přiřaďme dané matici A = {ay} řádu n orientovaný graf tak, že za uzly vezmeme množinu indexů {1, 2,..., n} a za jeho hrany ty dvojice indexů (i, k), po něž platí 164 165 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY a,j ^ 0. Nyní se dá lemma 3.4 parafrázovat takto: Matice A je ireducibilní tehdy a jen tehdy, je-li její graf silně souvislý. Pravdivost tohoto tvrzení je zřejmá. Definice 3.3. Řekněme, že čtvercová matice A = {ay} řádu n je diagonální dominantní, platí-li pro i = 1,... ,n (3.12) la«l ž ^2\aal J5*>" řekneme, že je ostře diagonálně dominantní, platí-li v (3.12) ostrá nerovnost pro každý index i a konečně řekneme, že je ireducibilně diagonálně dominantní, je-li ireducibilní, diagonálně dominantní a platí-li v (3.12) ostrá nerovnost alespoň pro jeden index i. Nyní máme vše připraveno k formulaci Collatzova lemmatu. Lemma 3.5. Nechť matice A — {a^} řádu n má kladné diagonální prvky a nekladné nediagonální prvky a nechť je ostře diagonálně dominantní nebo ireducibilně diagonálně dominantní. Pak je monotónní. Důkaz. Tvrzeni dokážeme sporem, a to pro případ ireducibilně diagonální matice. V průběhu důkazu uvidíme, že je tím pokryt i případ ostře diagonálně dominantní matice. Předpokládejme tedy, že matice A s kladnými diagonálními prvky a nekladnými nediagonálními prvky je ireducibilně diagonálně dominantní, ale není monotónní. Pak existuje vektor x takový, že je Ax ä o a přitom aspoň jedna jeho složka je záporná. Položíme-li Xj — min(a;i, ..,xn), je Xj < 0. Nechť pro tento index platí za prvé, že je (3.13) Pak platí (3.14) lajjl - ~Y^a>k >0- *=1 tjtj á ajjXj + ^ ajkXj = Xj ^ ajk < 0. t=i To je však spor dokazující v tomto případě lemma. Nechť za druhé pro výše definovaný index j platí (3.15) k = l k?j 166 3 METODA SlTl Pak je (3.16) 0 í ]T <yta>« -■ 53 o.jk{xh - xj) + x} ]T ajh = J2 aAXi ~ xi) kssl i=l k-1 l=J součet vesměs nekladných čísel ajk(xk — xj), * — 1,. -., u, má být tedy nezáporný. To je možné jen tak, že platí ajk{xk — Xj) — 0 pro k = 1, .., n. Je tedy zj. = x j pro každý takový index k, pro který je 0. Bud* ia index, pro který pla- tí v (3,12) ostrá nerovnost. Protože matice A je ireducibilní, existuje posloupnost indexů ij,..., i, taková, že je oy,-, ^ 0, aiíi2 £ 0,..., Oi,ia £ 0. Podle právě dokázaného je tedy Kj, = Xj a celý postup můžeme zopakovat pro index pro který také platí, že je — min(ii,..., *n). Platí-li pro tento index ostrá nerovnost (3.12), jsme hotovi, v opačném případě dostaneme, že je x^ = Xil = Xj. Pokračujeme-li v tomto postupu dále, nutně dojdeme k indexu, pro který už platí (3.12) ostře. Důkaz je hotov. Po této krátké exkurzi do teorie speciálních matic se vraťme znovu k vyšetřování metody sítí. 3.2 Lineární diferenciální rovnice druhého řádu V tomto odstavci podrobně probereme problematiku užiti metody sítí k řešení okrajové úlohy (1.12), (1.13). Aby nedocházelo k zbytečným obtížím a nedorozuměním, dohodneme se, že budeme předpokládat, aniž to vždy budeme znovu opakovat, že jsou splněny předpoklady existenční věty 2.2. 3.2.1 Sestavení diferenčních rovnic Základní myšlenka metody sítí vychází, jak vidíme, z náhrady derivací v daných rovnicích diferenčními podíly. Začneme proto tím, že uvedeme několik nejednodušších příkladů takových podílů. Lemma 3.6. Nechť funkce z má v intervalu I derivace do řádu dvě včetně a nechť platí (x,x + h) Cl. Pak existuje bod £ e (x, x + h) takový, že platí (3.17) Z(X + h)~*{x)- = z'(x) + lhz"(i). Důkaz Vztah (3.17) je speciálním případem Taylorova vzorce. Lemma 3.7. Nechť funkce z má v intervalu I spojité derivace až do třetího řádu včetně a nechť platí (x - h, x + h) C I. Pak existuje bod f £ (x - h, x + h) takový, žc platí (3.18) z(x + h)-z(x-h) _ k 2h 167 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE OKRAJOVÉ ÚLOHY Důkaz. Za uvedených předpokladů zaručuje Taylorův vzorec existenci bodů £1 e (x, x + h) a £2 £ {x - h, x) takových, že platí (3.19) a (3.20) z{x + h) = z(x) + z'(x)h + \z"{x)h2 + \z'"{íy)h3 z(x -h) = z(x) - z'(x)h + ±z"(x)h2 - y"(Í2)h3. Odečtením rovnice (3.20) od rovnice (3.19) a dělením činitelem 2/í dostaneme (3.21) z{x + h)-z(x-h) = z,{x) + + /(/(6)]ft3 Funkce z'" je však spojitá v uzavřeném intervalu (x — h,x + h) a číslo [z"'(£i) + +^'"(Í2)]/2 leží zřejmě mezi jejím maximem a minimem. Z darbouxovské vlastnosti funkcí spojitých na uzavřeném intervalu plyne existence bodu £ 6 {x — k, x+ h) takového že platí Dosadíme-li (3.22) do (3.21), dostaneme požadovaný výsledek, Lemma 3.8. Nechť funkce z má v I čtyři spojité derivace a nechť platí {x - h, x + h) C /• Pak existuje bod £ e {x — h, x + h) takový, že platí z(x + h)- 2z(x) + z(x — h) (3.23) h2 z»(x)+±z»»(t)h* Důkaz je zcela analogický důkazu lemmatu 3.7, a proto jej přenecháme čtenáři. Zanedbaním chybových členů v uvedených lemmatech dostaneme výrazy, které aproximují první a druhou derivaci uvažované funkce. Tyto a podobné výrazy jsme také měli na mysli, když jsme v dřívějším textu hovořili o diferenčních podílech. Vzhledem k tomu, že na vznik aproximace první derivace dané např. vzorcem (3.21) se lze dívat také tak, že se sestrojí polynom P(t) stupně dvě, který v bodech i — x — h, x a x + h nabývá hodnot z(x — h), z(x) a z(x + h) a vypočte se derivace tohoto polynomu v bodě t = x a vzhledem k tomu, že podobná tvrzení platí i pro aproximace z ostatních lemmat, je zřejmé, jak by se sestrojily další diferenční podíly, které by aproximovaly příslušné derivace eventuálně s vyšší přesností. Rozdělme nyní interval (a, i) na n dílů délky h dělicími body (3.1) a pokusme se aproximovat diferenciální operátor vystupující na levé straně rovnice (1.12), Použijeme-li přímočaře lemmat 3.7 a 3.8, tj. provedeme-li v diferenciálním operátoru (3.24) (Ly)(x) - -Ipix)^(x)]' + q(x)y(x) 3 METODA SlTl naznačené derivování a derivace ý, resp. y" v bodě x — xk nahradíme diferenčními podíly ze vzorců (3.21) a (3.23), dospějeme k operátoru Lff \ který (n + 1)-dimenzionálnímu vektoru y = (j/o, ■ - •, yn)T přiřazuje (n + l)-dimenzionální vektor í.(°Vi který je definován předpisem (3.25) (tj|0)/)i = ^{ - [pír*) - íhp'(xk)]yt.1+ + [2p(xt) + h2q(xk)]yk - \p(xk) + \hp\xk)]yí+i}. Tento operátor aproximuje diferenciální operátor L ve smyslu následující věty. Veta 3.1. Nechť funkce p má v (a, b) spojitou derivaci a nechť funkce q je spojitá. Nechť dále funkce y má v (0,6) čtyři spojité derivace. Položme y(pr) = = [y(xo) 1 , yc1" )F ■Pak P1&tí (3.26) (LÍ0)yM)k = (Ly)(xk) + O(h% k^l,...,n-l. Důkaz plyne ihned z lemmat 3.7 a 3.8. Nahradíme-li derivace v okrajových podmínkách (1.13) diferenčními podíly podle lemmatu 3.6 dostaneme operátory 1^ a které vektoru y = (j/o,; ■ •, !/n)T přiřazují čísla ij^y a l^y definované předpisem (3.27) /„(1)y = -alP(a)^^. + Ay0i '» y ~ «2p(6) yn - yn-i Užitím lemmatu 3.6 dostaneme snadno následující větu. Věta 3.2. JVechť koeficient p je spojitý v (a, b). Pak pro každou funkci y, která má v (a, 6) spojité dvě derivace, platí (3.28) f/W^/Wj + OIÍ.), Zde y(pr' značí stejně jako ve větě 3.1 vektor o složkách y(xk) a l^y, resp. I^y je stručný zápis levých stran okrajových podmínek (1.13). Jsou-li nyní splněny předpoklady věty 2.2 a předpokládáme-li navíc, že funkce p má v intervalu (a, b) tři a funkce q a f dvě spojité derivace, existuje nejen jediné řešení okrajové úlohy (1.12), (1.13), ale toto řešení má dokonce čtyři spojité derivace v (a, b). Pro vektor y(pr\ jehož složky jsou nyní hodnoty přesného řešení v bodech xk, k = 0,..., n, tedy podle vět 3.1 a 3.2 platí (3.29) (ífV(pr))t = /(**) + 0(ft2), k 1,..., n - 1, 168 169 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY a (3.30) tfV^-Ti + CW, /Wy(Pr) = 72 + 0(A) Je tedy přirozené hledat přibližné řešení y — (jfo, ■ - ■, 2/n)T ze soustavy rovnic (3.31) <fa)y = T>. Úvaha, která nás přivedla k soustavě (3.31) (na níž je zatím třeba dívat se pouze formálně, neboť doposud nevíme vůbec nic o její řešitelnosti), není zdaleka jediná možná a dokonce není asi ani nepřirozenější. Praktické zkušenosti ukazují, že při aproximaci nekonečnědimenzionálních problémů konečnědimenzionálními je žádoucí zachovat co nejvíce vlastností původního problému. V našem případě je diferenciální operátor (3.24) vystupující v diferenciální rovnici (1.12) samoadjungovaný, což by mělo vyústit v symetrii matice aproximující soustavy lineárních rovnic. Tuto vlastnost však matice soustavy (3.31) nemá. K její symetrii je totiž třeba, aby koeficient p(x*) + (h/2)p'{xk) = p(xk + A/2) + 0{h2) u neznámé jfe+i v i-té rovnici (3.31) se rovnal koeficientu p{xk+1) - (A/2)p'(xi+1) = p(xk + h/2) + 0(h2) u neznámé ji v (H l)-ní rovnici. Tato čísla se však sobě rovnají pouze přibližně. Matice soustavy (3.31) je tedy sice blízká symetrické matici, ale obecně symetrická není. Při odvození rovnic (3.31) jsme postupovali tak, že jsme naznačené derivování v operátoru L provedli, a tím jsme vlastně vůbec jeho samoadjungovanost nezužitkovali. Položíme-li v tomto operátoru p(x)i/(x) = z(x), apioximujeme-li derivaci \p(x)y'(x)Y — z'{x) v bodě x = xk podílem [z(xk + h/2)-z(xk — h/2)]/h — [p(xi + + fc/2y(i* + h/2) - p(xj, - h/2)ý{xk - h/2)]/h (ve vzorci (3.21)jsme užili h/2 místo h) a hodnotu funkce py1 v bodě x — xt + A/2, resp. x = x* — ft/2 podílem p(*k + h/2)[y(xk+1) - y(xk)]/h, resp. p{xk - h/2)[y(xk) - y(xi-1)]/h, dostaneme operátor L^y (y = (jfo, • ■ •, J/n)T), definovaný předpisem (3.32) (Lhy)k = i{ -p(xk - h/2)yk-i+ + \p(xt - h/2) + p(xh + ň/2) + A25{xt)]lft--p(xi + h/2)yk+1}. Aproximační vlastnosti tohoto operátoru jsou popsány v následující větě. Věta 3.3. Nechť koefícient p má v intervalu (a, b) tři spojité derivace a nechť koefícient q je v tomto intervalu spojitý. Pak pro každou funkci y, která má v intervalu (a, b) čtyři spojité derivace, platí (3.33) (i»y(pr))i = (Í!/)(*t) + 0(A2), t = l,...,n-l. 170 3 METODA SlTl Důkaz Přímočaré použití lemmatu 3.7, které se nabízí, vede pouze k slabšímu tvrzení (Lhy^)k = (Ly)(xh) + 0(h). Proto je třeba provést důkaz podrobněji. Položme p(x)y'(x) = z(x). Pak funkce z má v intervalu (a, 6) tři spojité derivace a podle lemmatu 3.7 dostáváme, že pro každé x £ (a + h, b — h) platí z{x + h/2) — z(x — h/2) (3.34) Z Taylorova vzorce plyne, že je = z'(x) + 0(A2). (3.35) y(x + h) = y(x + h/2) + j/(x + h/2)-+ + tf(x + h/2)~ + y"{x + fc/2)y + 0(h*) (3.36) y(x) = y{x + h/2) y'(x + h/2)-+ + íy"(x + h/2)^ - W'{x + A/2)£ + 0(fc*). Odečtením rovnice (3.36) od rovnice (3.35) dostáváme, že platí (3.37) V{X + hl V[X) = y\x + h/2) + ±y"'(x + h/2)h2 + 0(A3). Podobně se dokáže, že je (3.38) »(')->('-*) : fr(x - h/2) + ±ý"{z - h/2)h2 + 0(h3). Vynásobíme-li rovnici (3.37) číslem p(x + h/2)/h, rovnici (3.38) číslem —p{x — h/2)/h a vzniklé rovnice sečteme, dostaneme (3.39) i [p{x + h/2)y{x + h)h-y{-x) - P(x - A/2)yW-f = _ z(x + h/2) - z(x - h/2) _ A + + i[p(x + h/2)y"'{x + h/2) - p(x - h/2)y"'(x - h/2)]h + 0(h2). Protože však funkce py"' má v intervalu (a, 6} spojitou derivaci, plyne tvrzení (3.33) ihned z (3.39), z včty o střední hodnotě a z (3.34). Věta je dokázána. Aproximační vlastnosti operátoru í.;, jsou tedy stejné jako u operátoru 1^ a navíc přidáme-li k rovnicím (3-40) (Lhy)k = f(xk), t=l,.r,fi-l, okrajové podmínky (3,41) 171 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY vynásobené vhodnými konstantami, dostaneme soustavu rovnic se symetrickou maticí. Až dosud jsme generovali diferenční rovnice tak, že jsme nahrazovali derivace v diferenciální rovnici (1.12) a v okrajových podmínkách (1.13) diferenčními podíly. Velmi užitečný, v některých případech asi dokonce lepší postup je založen na tzv. Marčukově integrální identitě, která je obsahem následujících věty. Veta 3.4. Nechť funkce y splňuje v intervalu (a,b) diferenciální rovnici (1.12) a nechť koeficienty této diferenciální rovnice splňují předpoklady zformulované v existenční větě 2.2. Nechť Xk-i, xk-i/2, xk, xk+i/2, xk+l jsou libovolné body z intervalu (a, i), pro něž platí xk-± í= Xk-x/v < Xk < %k+i/2 = xfc+i- Pak platí (3.42) y(xk+1) - y(xk) y(xk) - j/fxjt-i) [q{x)y(x) - f(x)]dx+ *i^=k^L {mí. ww-nw>y.+ (3.43) p(xk--L)y'{xk-1) = —\ »(*t-i-a (3.44) p(Kit+i)j/(3:*+i) = r^1! , \v(xk+i) ~y{xk)+ Důkaz. Položme z(x) = p(x)y'(x). Integrací diferenciální rovnice (1.12) v intervalech (zt-i/ž,2*4.1/2), (xk-i/2,x) a (Zj^h-i/í) dostáváme postupně (3.45) z(xk+1/2) - z(xk_1/2) = / [q(x)y(x)-f(x)]dx, (3.46) p(*y(*) = *(**-i/2)+ f [«(*)»(*) -/(Ol dť 172 3 METODA SlTl (3.47) P(x)l/(x) = z(xi+1/2) - j '+1/2 [q(t)y(t) - /(*)] d ť. Dělením rovnice (3.46) funkcí p a integrací v intervalu (zfc-i, xk) nalezneme (3.48) y(xk) - y{xk-x) = 2(^-1/2) / -j-^di-r- +£{^0(ťMí)-/(i)]díld* neboli (3.49) z(xk.1/2) = y(*k) - y(xk-i) ~r ^dxľ {i) f bw»(o-/(0]dí}d«. Podobnými manipulacemi odvodíme z rovnice (2.47) vztah (3.50) z(xk+Ui)=^2ŕŕ + Položíme-li nyní v rovnici (3.49), resp. (3.50) Xjr-i/2 = resp. aľfc+i/2 = «fr+i, dostáváme ihned identity (3.43) a (3.44). Dosazení do rovnice (3.45) podle rovnic (3.49) a (3.50) pak dává identitu (3.42). Věta je dokázána. Položíme-li v identitě (3.42) xk = a + kh, xk+I/2 — xk + hjl a aproximujeme-li integrály následujícími jednoduchými kvadraturními vzorci (3.51) / —-dxnh--- + h/2)' ľ" S . Ó.X h —,-, ■■ —. x) P(xk-h/2)' / liíx)y(x) - f(x)]dxm h[q(xk)y(xh) - f(xk)]. 173 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 3 METODA SlTÍ o a chyby, kterých se přitom dopustíme, zanedbáme, dostaneme rovnice (3.40), tj. rovnice, v nichž vystupuje už dříve definovaný operátor Lh- Podobně, nahradíme-li integrály ve vzorci (3.43) s k = 1 a ve vzorci (3.44) s k - n — 1 kvadraturnämi vzorci (3.52) x0) 1 f —L-dasa/i-r- 4« pw nx ľ" — dx~ 7»,-! p(x) ~"p(*»)' r{^£[^(^/(r)idi}di!B dx «ä 0. a užijeme-li vzniklé aproximace v okrajových podmínkách studovaného problému, dostaneme operátory Z^1' a Užijeme-li v těchto vzorcích první dva kvadraturní vzorce (3.51) a vzorce (3.53) i p(x0 + V2)[?(a:°Wa:o)"/(3:o)1' * ^2p(xn-n/2)[^")!/(X^ -dostaneme operátory /íl'1,d' a /^2,d^ dané rovnicemi (3.54) ť'd)y = -<*ip(x<, + h/2)^^- + [^^(xo) + p\)yn, 'i5,dV = <*2P(*n - h/2) h Vn - !/n-l Pro tyto operátory platí následující věta. 174 Věta 3.5. NecM funkce p má v intervalu (o, í>) dvě spojité derivace a nechť funkce q je v (a, b} spojitá. Pak pro každou funkci y, která má v (a, b) tři spojité derivace, piati (3.55) z^ypr) = /(»„ + íaih(Ly){x0) + 0{h\ ,ft(2.d)y(pr, = ,Wy + ia3ft(iJ,)(a.n) + 0(fci)i ide y (pr^ je veitor o složkách t/(xo), - • ■, Jř(*n). Důkaz. Za učiněných předpokladů platí podle Taylorova vzorce (3.56) p(„ + h/2)**l):''(gB) = n =[p(x0) + |fcp'(»o) + O(/.2)][y(x0) + £k»"(*o) + 0(h2)] = =p(*o)ir>o) + |ftp'(x0)3/(x0) + %hp(x0)y"(xo) + 0(h2) s= =PÍ*oyt>o) + ^ft[p(*o)!/'(*o)]' + 0(A3) = =p(x0)j/(x0) + ift[9(x0)!/(ro) - (ÍJŕ)(xo)] + 0(h2). Je tedy (3.57) (MyW = - «iP(xD)3/(x0) - iai%(x0M*o) - (i»)(z0)]+ + [|aifc?(*0) + A]lrt>o) + 0(A2). Z rovnice (3.57) však už plyne první rovnice (3.55). Druhá rovnice (3.55) se dokáže úplně analogicky. Věta je dokázána. Nahradíme-li okrajové podmínky rovnicemi (3.58) l^'d)y = 7i + £«iA/(«o), /fd)y = 72 +W*/(x„), (y = (j/o.....yn)T)j dopustíme se tedy na rozdíl od rovnic (3.41) chyby velikosti 0(h2). Rovnice (3.58) přitom nejsou o nic složitější než rovnice (3.41). V následujícím odstavci uvidíme, že lepší aproximační vlastnosti rovnic (3.58) oproti rovnicím (3.41) se projeví tak, že jejich užití jako okrajových podmínek pro operátor t* vede k celkové chybě velikosti 0(h2), zatímco užití rovnic (3.41) pouze k chybě řádu 0(h). Intuitivně není tento výsledek překvapující, neboť při odvození operátorů a '*2'i a'' u^ užitím diferenčních podílů nebo kvadraturních vzorců v integrální identitě z věty 3.4, jsme užili méně kvalitní aproximace než při konstrukci operátoru a operátorů //ld' a ';[2'd'. Z tohoto hlediska je tedy odvození rovnic (3.58) z integrální identity pomocí kvadraturních vzorců (3.51) a (3.53) dokonce přirozenější, než odvození rovnic (3.41) pomocí kvadraturních vzorců (3.52), neboť vzorce (3.53) aproximují příslušné integrály se stejnou řádovou chybou jako vzorce (3.51). Zakončeme stručný výklad o generování konečnědimenzionálních aproximací daného diferenciálního operátoru poznámkou, že užitím přesnějších kvadraturních vzorců v integrálních identitách z věty 3.4, než které jsme dosud užili, lze dosáhnout 175 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY aproximací daného operátoru, které jsou vyššího řádu, než tomu bylo u operátoru Lh. K této otázce se v odst. 3.2.2 ještě vrátíme. Až dosud jsme sestrojovali konečnědimenzionální soustavy, jejichž řešení má být přibližným řešením dané okrajové úlohy formálně, aniž bychom studovali, zda tyto soustavy mají vůbec rozumný smysl, tj. zda jejich matice jsou regulární. Nyní si všimneme této otázky. Při jejím řešení a i při studiu konvergence v dalším odstavci nám prokáže velmi cenné služby následující lemma. Před jeho formulací se však ještě dohodněme, že o integračním kroku h = (6 — a)/n budeme všude v odst. 3.2 předpokládat, že je volen v případě, že je q(x) = 0 v {a,b) libovolně a v opačném případě tak, aby existoval bod xj = a + kh, 0 < k < n, takový, že platí g(xj) > 0. K splnění tohoto požadavku stačí v důsledku spojitosti funkce q zřejmě, aby toto h bylo dostatečně malé. Lemma 3.9. Neciť funkce p a q jsou spojité a nechť platí nerovnosti (2.1) a (2.2). Nechť dále rj — (f/o,..., nn)T je libovolný vektor, pro který platí (3.59) (Ía>|)^0, fc = l,...,n-l. Nechť konečně je. (3.60) M - max nk > 0. k=0,...,n Pak platí (3.61) M — max()jo, In) a existuje-li index fco, 0 < fco < n takový, že je nka = M, je q(x) = 0 v (a,b) .i j;* = M pro k = 0,..., n. Důkaz. Předpokládejme, že existuje index fco, 1 ^ fco ^ n — 1, takový, že platí r)k0 = M. Pak je (3.62) 0§ -p{xka-h/2)r,k^i + \p(xko- h/2) + p(xko + h/2) + h2q(xto)]M- - p(xko + ň/2)Wo+i ž h2q(xk„)M ž 0. Protože M je kladné a q(xka) nezáporné, plyne z nerovnosti (3.62) především, že je q(xko) - 0. Kdyby platilo n^-i < M nebo nko+1 < M, bylo by tedy (3.63) 0 ^ - p(xio - ft/2)fíi0-i + [p(*i„ " fc/2) + p(xio + h/2)]M- - p(xka + h/2)r)ko+1 > 0, což není možné. Platí proto nj^-i = 7)k0+i = M a celou úvahu je možno zopakovat pro indexy ko — 1 a k0 + 1. Postupně tak dostaneme, že platí (3.64) q(xt) = 0, fc = l, ■•■«-!, a (3.65) ijt = Af, fc = 0,..., n. 176 3 METODA SlTl Není-li funkce q identicky rovna nule v intervalu (a, 6), není rovnice (3.64) pro k = k splněna. Tento spor dokazuje, že v případě, že funkce q není rovna nule identicky, platí nk < M pro k — 1,..., n — 1. V tomto případě je tedy lemma dokázáno. V případě, že je q(x) s 0 v (a, b), však plyne tvrzení lemmatu z rovnic (3.65). Stručně můžeme vyjádřit podstatu tvrzení lemmatu 3.9 tak, že funkce r/k definovaná na diskrétní množině bodů xk a splňující nerovnosti (3.59) nabývá kladného maxima v krajním bodě. To je také důvod, proč se toto tvrzení nazývá princip maxima. Pomocí něj už snadno dokážeme regularitu matic námi sestrojených soustav. Jako příklad uveďme následující větu. Věta 3.6. Nechť jsou splněny předpoklady existenční věty 2.2 anechťh je dostatečně malé. Pak soustava (3.40), (3.41) má při libovolné' funkci f a při libovolných Ti a 72 právě jedno řešení. Důkaz Buď nk, k = 0,..., n, řešením příslušné homogenní soustavy, tj. (3.66) (i»Ti)fc = 0, *=l,...,n-l, a (3.67) = '„(3)f=0. Položme M = maxj;=ol.,.,n % a předpokládejme, že je M > 0. Pak podle lemmatu 3.9 platí, že M = max(r]B, 7]„) a zřejmé bez újmy na obecnosti můžeme předpokládat, že je tjo § n„, takže je M = no. Píšeme-li první rovnici (3.67) podrobněji, máme (3.68) [cvip(a) + h0i]rjo - aií>(a)7;i = 0- Je-li nyní a\ - 0, je 0i > 0 a z rovnice (3.68) plyne, že je ij0 = 0. To však znamená, že je M = 0 a to je spor dokazující, že je M ž 0. Je-li cti > 0, je též 0i > 0. Kdyby tomu tak totiž nebylo, plynulo by z rovnice (3,68), že je i)i = íjq, a tedy podle lemmatu 3.9 by bylo rjk = M pro k = 0,..., n a q(x) 5 0 v (a, b). Z druhé rovnice (3.67) by tedy plynulo, že je (3.69) 0 = [ct2p{b) + hp2]M - ct2p(b)M = hfaM. a tedy 02 — 0. To však není možné, neboť případ /3i = 02 = 0 a q(x) = 0 je předpoklady věty 2.2 vyloučen. Při cti > 0 je tedy skutečně 0i > 0 a z rovnice (3.68) dostáváme (3.70) 0 = [aip(ffl) + hfa]M - alP(a)r}i ^ h0tM > 0, tedy opět spor, dokazující, že je M ^ 0. Celkem jsme tak dostali, že je nk íS 0 pro i: = 0,..., n. Zopakujeme-li celou úvahu pro funkci ~nk, dostaneme, že je i\k ~í ž 0 pro k = 0,..,, n. Celkem tedy platí nk — 0 pro k — 0,..., n. Soustava (3.66) a (3.67) má tedy pouze triviální řešení, což dokazuje větu. 177 H. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 3 METODA SlTl Poznámka 3.1. Pfedpokládáme-li, že místo rovnic (3.66) a (3,67) platí nerovnosti (LhTj)k S 0, k — 1,..., n — 1, I^ti ÍOa ty^i} ~ 0, dokážeme úplně stejným postupem jako v důkazu věty 3.6, že je nk á 0, k = 0,.. .,n. Matice soustavy (3.40), (3.41) je tedy zřejmě monotónní (implikace Ax > 0=> x ž 0 je zřejmě ekvivalentní implikaci Ax < 0 0). Monotónnost matice soustavy (3.40), (3.41) (a tedy speciálně její regularitu) je možno také dokázat pomocí Collatzova lemmatu 3.5. Zde je však třeba projevit určitou opatrnost. Uvažovaná matice má sice diagonální prvky kladné a nediagonální prvky nekladné, ostře diagonálně dominantní však obecně není, takže je třeba zkoumat její ireducibilní diagonální dominanci. Podle lemmatu 3.4 je třídiagonální matice ireducibilní právě tehdy, jsou-li její nediagonální prvky nenulové. To je však pro uvažovanou matici splněno pouze v případě, jsou-li oba koeficienty ctt á a2 nenulové. Diagonální dominance se v tomto případě už prověří snadno: Všechny řádkové součty jsou nezáporné, jak je vidět na první pohled a kladné jsou v nultém nebo n-tém řádku podle toho, je-li nebo /?2 různé od nuly. Jsou-li obě tato čísla nulová, nesmí se koeficient q rovnat nule identicky a ostrá nerovnost pak platí pro k-tý řádek, kde k je určeno tak, že přo něj je q(xk) > 0. Je-li cti nebo a2 rovno nule, je matice soustavy reducibilní. V tomto případě je však /?i nebo fa nenulové a nultá nebo n-tá rovnice udává přímo hodnotu nulté nebo n-té neznámé. Dosadíme-li tuto hodnotu do první nebo (n — l)-ní rovnice, dostaneme soustavu, jejíž matice je řádu n nebo n — 1 a je zřejmě ireducibilně diagonálně dominantní. Collatzovo lemma pak aplikujeme na tuto redukovanou matici. Monotónnost matice soustavy (3.31) se dokáže stejně snadno. Rovněž tak snadno se dokáže monotónnost soustavy, která vznikne tak, že se okrajové podmínky (3.41) nahradí okrajovými podmínkami (3.58). Lze k tomu použít opět Collatzovo lemma nebo princip maxima, který platí i pro operátor 3.2.2 Konvergence V předešlém odstavci jsme na základě rovnic (3.33) a (3.30) usoudili, že je rozumné počítat přibližné řešení j/t>, ■••>!/« dané okrajové úlohy z rovnic (3.40) a (3.41) a ukázali jsme, že tento postup má smysl, neboť vektor yo,...,Vn je rovnicemi (3.40), (3.41) jednoznačně určen. V tomto odstavci ukážeme konvergenci popsaného postupu, tj. ukážeme, že rozdíl r\k = yk — y(xk) (který se i zde podobně jako v kap. I nazývá celková iiskreiizační chytá) lze volbou dostatečně malého h učinit libovolně malý. Nechť jsou splněny předpoklady věty 2.2 zaručující existenci a jednoznačnost přesného řešení a položme (3.71) (Lhr,)t = ek, k - l,...,n-l, 178 a (3.72) /4(1)fl = «o, Právě zavedené veličiny ek se nazývají lokální chyby metody sítí a vlastně udávají, jaké chyby se dopouštíme aproximací daných diferenciálních operátorů konečnědi-menzionálními operátory. Předpokládáme-li navíc, že funkce p, q a / jsou dostatečně hladké, plyne z vět 3.3 a 3.2 existence konstanty M takové, že pro dostatečně malé h platí (3.73) \sk\^Mh2, t = l,...,n-l, a (3.74) |e0| š Mh, \e„\^Mh. Z důvodu dalšího zestručnění zápisu se dohodneme, že konstantu M zde a v podobných případech pokládáme za tzv. generickou konstantu, tj. za konstantu, kteTá v jednotlivých případech může nabývat různých hodnot. Ze vztahů (3.71) až (3.74) vidíme, že chyba splňuje soustavu lineárních algebraických rovnic s malou pravou stranou. V následující větě ukážeme, že to má za následek i malost příslušného řešení. Věta 3.7. Nechť jsou splněny předpoklady věty 2.2 a nechť navíc funkce p má v intervalu (a, 6) tři spojité derivace a funkce q a f dvě spojité derivace. Buď dále yk přibližné řešení vypočtené ze soustavy (3,40), (3.41). Pak existují konstanty M a h0 > 0 tátové, že platí (3.75) \yk - y{xk)\ < Mh pro k — 0,..., n a k ^ ho. Důkaz. Bud" z funkce, která je v intervalu (a, b) řešením diferenciální rovnice (3.76) -(p(*)z')'+ !(*)* = ! s okrajovými podmínkami (3.77) -alP(a)z'(á) + p\z(a) - 1, CX2P(b)z'(b) + 0iz{b) - 1. Z předpokladů plyne, že tato funkce nejen existuje a je jediná, ale má v intervalu (a, b) čtyři spojité derivace. Podle vět 3.3 a 3.2 tedy existuje konstanta K taková, že platí (3.78) \{Lhz)k l|gÄ'/i2, fc = l,...,n- 1, 178 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY (3.79) - 1| 5 Kh, \lj,2)z-l\%Kh. (Položili jsme z = (z(x0), ■..,z(xk))T.) Z nerovností (3.78), (3.79) plyne existence čísel 9k, k = 0,..., n, takových, že platí \6k | á 1 pro £ = 0,..., n a že je (3.80) (Lhz)k = l + 9kKh2, *=l,...,n-l, /„(1)z = 1 + 6„Kh, Zvolme nyní h0 pevně tak, aby platilo a (3.81) /A(2)z = 1 + 6nKh. ho < min (—, — (3.82) a položme M (p5s-i3kj). kde M je konštanta z nerovností (3.73) a (3.74). Pak pro /i á ňo platí (3.84) 0 < 1 - Kh0 S 1 + flotíl, a tedy je (3.85) JV/i(l + So-K/i) ž N{1- Kho)h~ÍMh. Analogicky se dokáže, že je též (3.86) Nh(l + 9nKh)^Mh a (3.87) Nh(l + ehKh2)ŽMh2, Jb = 1,. ,«-1. Položíme-li tedy (3.88) vk = Nhz(xk), plyne z (3.71) až (3.74), (3.80), (3.81) a (3.85) až (3.87), že pro h g h0 platí (3.89) l(ÍÄí?)tlš(^ľ)t, t = l,...,n-l, (3.90) 180 3 METODA SÍTÍ Protože matice soustavy (3.71), (3.72) je podle poznámky 3.1 monotónni, plyne z nerovností (3.89) a (3.90) a z lemmatu 3.2, že platí \r)i.[ á vk pro k = 0, ...,n. Protože pomocná funkce z je v intervalu (a, 6) omezená, plyne odtud tvrzení věty. Právě dokázaná věta dává tedy odpověď na otázku po konvergenci metody sítí (3.40), (3.41). Konvergence metody sítí (3.31) by se dokázala úplně stejně. Podtrhněme tu skutečnost, že k důkazu tvrzení věty 3.7 bylo třeba předpokládat větší hladkost hledaného řešení, než kterou zajišťuje existenční věta. To je v situaci, kdy dokazujeme vlastně tvrzení o rychlosti konvergence, a tedy více, než pouhou konvergenci, typické a není na tom nic překvapivého. S podobnými jevy jsme se setkali i v případě řešení úloh s počátečními podmínkami. Stejně jako tam pouhá konvergence se dá dokázat za podstatně slabších předpokladů o hladkosti hledaného řešení. Zde je však příslušný postup výrazně složitější, než tomu bylo v důkazu věty 3.7, a to je také důvod, proč jsme se omezili pouze na hladký případ, Vzhledem k tomu, že při sestavování n— 1 rovnic (3.40), jejichž počet se při h —» 0 bez omezení zvětšuje, jsme se dopustili lokální chyby velikosti 0(h2) a pouze ve dvou rovnicích chyby 0(h), může vzniknout dojem, že lepší odhad celkové diskretizační chyby než pouze O(h) nebyl odvozen pouze proto, že jsme užili ne dosti důmyslnou důkazovou techniku. Následující jednoduchá věta však ukazuje, že tomu tak není. Věta 3.8. Odhad chyby metody sítí (3.40), (3.41) daný vzorcem (3.75) nelze zlepšit. Důkaz. Buď y řešením diferenciální rovnice (3.91) y" = 2 v intervalu (—1,1) s okrajovými podmínkami (3.92) -!/(-!) + y(-l) = 3, y'(l)4-S/(l) = 3, takže jsou splněny předpoklady existenční věty a přesné řešení je funkce y(x) — x2 ■ Přibližné řešení metodou (3.40), (3.41) se vypočte z diferenční rovnice (3.93) -j/it_i + 2yh -ste+i = -2h2, k = 1,...,n- 1, s okrajovými podmínkami V\ -yo (3.94) h + yo = 3, + yn — 3. Z teorie lineárních diferenčních rovnic s konstantními koeficienty (nebo také přímým dosazením) ihned plyne, že řešení těchto rovnic je dáno vzorcem (3.95) yk ~ (-l + khf+ h = x2k + h. 181 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY Pro chybu 17», tedy platí rjj. = h, což dokazuje větu. Návod, jak sestrojit metodu sítí, jejíž chyba je řádu 0(ft2), je vlastně obsažen v důkazu věty 3.7. Z něj je vidět, že žádaný výsledek se dosáhne, podaří-li se volit funkci ve tvaru Nz(xk)h2 a nikoliv pouze ve tvaru Nz(xt)h. K tomu však zřejmě stačí, aby okrajové podmínky byly aproximovány s přesností 0(h2) a aby přitom nebyla porušena monotónnost příslušné matice. Okrajové podmínky, které mají tuto vlastnost, jsou dány operátory a VJ[2'd'' z předešlého odstavce. Připojením okrajových podmínek (3.58) k rovnicím (3.40) dostaneme tedy metodu sítí, jejíž celková chyba je řádu 0{h2). Důkaz tohoto tvrzení se provede úplně stejně jako důkaz věty 3.7. My zde zmíněné tvrzení dokážeme ještě jednou jiným postupem, který bude sice formálně komplikovanější, ale vzhledem k tomu, že se v něm nebude užívat princip maxima (a tedy ani s ním související teorie monotónních matic), bude jej možné přednést na vyšetřování rovnic vyšších řádů, kde princip maxima neplatí, Základní idea vlastně všech konvergenčních důkazů, které jsme až dosud v celé knize prováděli, je i zde samozřejmě stejná: vždy sestrojujeme apriorní odhad pro přibližné řešení v závislosti na pravých stranách rovnic, které je definují, neboť celková diskretizační chyba splňuje rovnice tohoto typu. Ve větě 3.7 jsme takový odhad konstruovali na základě principu maxima. Zde to provedeme pomocí tzv. energetických nerovnosti. Základní myšlenku příslušného postupu ukážeme nejprve na spojitém případě, kde je méně zastřena komplikovanou symbolikou. Nechť funkce p, í a y jsou dostatečně hladké a nechť platí nerovnosti (2.1) a (2,2), Buď dána funkce y a položme (3.96) (3.97) (Ly)(x) = -\p(x)y'(x)]' + q{x)y(x) = -ovip(a)j/'(a) + piy{a), iWy = <*Mb)y'(b) + Mb)- Naším úkolem je odhadnout nějakou normu funkce y pomocí vhodné normy funkce Ly a pomocí čísel l^y a l^y. Pro určitost předpokládejme, že koeficienty oti a v rovnicích (3.97) jsou vesměs kladné. Tento případ lze pokládat za modelový a modifikace uvedeného postupu, které je nutno provést v jiných případech, jsou snadné. Čtenář si je provede podle návodu, který uvedeme později, bez problémů sám. Vynásobme rovnici (3.96) funkcí y a integrujme v mezích od a do b. Užitím integrace per partes a dosazením za p(o)i/(a) a p(b)y'(b) z rovnic (3.97) dostaneme (3.98) f\iy)(x)y(x)dx = ^y\b) - -L(/C»B)j,(fr)+ Ja a2 Ot2 + ^-y\a) -—(iWy)y(a) + í p^y1^)]2 d x + f q(x)y2(x)dx. «1 Cti Ja Ja 3 METODA SÍTl Odtud vzhledem k předpokladům (2.1) a (2.2) ihned plyne, že platí (3.99) — y{a)l^y+— y{b)l^y+ / (Ly)(x)y(x) á x ä evi «2 Ja > ^V(a)+^V(&)+Po Íw(x)?áx. cti <*2 Ja Pokusme se nyní odhadnout hodnoty funkce y pomocí výrazu na pravé straně nerovnosti (3.99) (který je v podstatě kvadrátem tzv. energetické normy funkce y; tato norma hraje významnou roli ve funkcionálně analytické teorií diferenciálních rovnic). Zřejmě platí (3.100) »(»)■= \y(a) + \y{b) + \ f </(i) dť - \ í y1^ dí. Použij eme-li nerovnost (3.101) (ct + P? S2a2+2/J2, která platí pro libovolná reálná a a j3, dostáváme (3.102) [y(x)]2^2[íy{a) + íy(b)]2+2^jy'(t)dt-íj\'(t)dt ž í y\a) + y2(ft) + QT j/(í) d i)' + ( J* y'{t) dí) . Podle Schwartzovy nerovnosti je však (3.103) ^jTlV(í)d*y í j^l2 dí jfV(t)]s dťg(e - a) j\y'(x)]2dx a podobně (3.104) Q*ý(t)dtj ú(b-x) jy{x)]2dx Dosazení (3.103) a (3.104) do (3.102) dává ŕ (3.105) [y{x)f g j,2(a) + y2(b) + (b - a) d«. J a Protože tato nerovnost platí pro libovolné x e {a, fc), plyne odtud ihned, že je (3.106) Ul, š l[ ^/(«) + ?V W + W / V(*)]2 d x), kde jsme položili (ct\ «2 b — a\ Po (3.107) 7 = max (SI 182 183 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVĚ ÚLOHY a symbol ||. značí normu v prostoru Cca, tj. \\y\\c„ = supse(<1)í) \y{x)\. Z nerovností (3.106) a (3.99) plyne, že platí (3.108) 111» š 7 š tIMI «1 «2 Ja -\i(1M + -\i(2M+ ľ\(i-y)(x)\d "1 «2 Ja Odtud však už plyne hledaný odhad (3.109) J_|/CDy|+J_|/Wy|+ f \(Ly)(x)[dx «1 «2 Ja Podarilo se nám tedy skutečné odhadnou jC^-, normu funkce {/ pomocí C\ normy funkce Ly. V několika následujících lemmatech ukážeme, jak lze popsaný postup přenést na konečnědimenzionámí případ. Lemma 3.10. Nechť 74 a 6^ jsou libovolné posloupnosti čísel definovaných pro k = 0,..., n — 1. Pat píaií n-l n—1 (3.110) ~^2(lk - 7k-i)ik = 7r.-i<5„-i - 7aÄo - Y fk-i(Sk ~ í*-i). Důkaz. Vzorec (3.110) ihned plyne ze zřejmé identity fk&k — 7k-i$k-i -= (fk - 7k-i)h + yk-\(Sk - Äjt-i). Tvrzení tohoto lemmatu je obdobou vzorce pro integraci per partes. Lemma 3.11. Nechť koeňcienty p aqjsou spojité a nechť platí nerovnosti (2.1) a (2.2). Nechť dále je cti > 0 pro i = 1,2 a h je kladné číslo. Pak pro libovolný vektor tj = (»;o 1 ■ ■ -, Vn)T phití (3.111) h-n4l%+h-n42A\ + h^(Lyrj)km > al #2 r""~ «1 «2 £í Důkaz Podle definice operátoru Ln a podle lemmatu 3.10 je n-l (3.112) /i3 ^(UiiJuft = t = i - X^M** + 'i/2)('?*+l ~ "») - P(xk - h/2)(Vk ~ •ř*-l)]»Jt+ *=1 n-l + ft2^9(x*)^ = 184 3 METODA SÍTÍ = - p(x„ - h/2)(r)n - r)„_!)í)„_i + p(x0 + ft/2)(?yi - 170)170+ n — l n—l + £ p(zt - fc/2)(ijj - "t-i)2 + h2 ifaWk = t = l fc=l = ■ p(i„ - A/2)(i)„ - J7n-i)»)n + p(zo + h/2)(ni - 170)%+ n n — l + ^ p(a:fc - A/2)(»ft - íři-O2 + A2 Použijeme-li rovnic (3.54) k vyjádření výrazů p(io+'í/2)(')i —f)o) ap(a!„-ft/2)(r7„ — - >7n-i) pomocí operátorů /jf1'^ a /^2,d' a dosadíme-li do (3.112), dostaneme (3.113) fc'= -A—\h\{*n)vl +A—»7™- ř^í «2 ^ <*2 ■ A-fc^-H- ^2?(x0)%2 + /'-'řo2+ n n — l + £>(x* - A/2)(rfc - í?*-i)2 + ^2 Y, íW)^ Jr = l fc=l Užijeme-li ve vztahu (3.113) nerovnosti (2.1) a (2.2), dostáváme už tvrzení lemmatu. Lemma 3.12. Nechť platí cti > 0 a > 0 pro i = 1,2. Pak existuje konstanta 7 > 0 taková, že pro libovolný vektor rj = (r/o,..., ?7n)T plat/ (3.1H) NIL g tt[/A„2 + ^„ +I*X>->J*-i)s]1 We IMI*c„ - maxfc=0,...,n |nt|. Důkaz . Přímým výpočtem se zjistí, že pro k - 0, ..., n platí fc n (3.115) ijt = |»ír> +5^ + 5 - %-0 "5 E ~ j=i ;'=*+i (činíme obvyklou konvenci, že součet je roven nule, pokud jeho dolní mez je větší než horní). Užijeme-li nerovnost (3.101), dostaneme odtud, že je (3.116) í7iši)2 + »ř2 + j=l J L;=)=+l Podle Schwarzovy nerovnosti platí (3.117) fc n 2 Je n ^(rjj - íJjf-i) á fc £(ife - T7j-l)2 š i " ^'-^2 j=i J j=i j=i 185 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 3 METODA SlTl (3.118) 53 fa ~ ty-J š (n - *) 53fa " j=*+l J í=l Dosadíme-li odhady (3.117) a (3.118) do nerovnosti (3.116), dostaneme, že pro k = 0,..., n platí (3.119) 4 š '"Jo + fc>?n + (í- " «) X>i " ^-i)2 Abychom dostali tvrzení lemmatu, stačí už jen zavést číslo y rovnicí (3.107). Lemma 3.13. Nechť platí cť; > 0 a /?,■ > 0 pro i — 1,2, nechť koeňcienty p a g jsou spojité a nechť jsou splněny nerovnosti (2.1) a (2.2). Pak pro libovolný vektor i)=(n0,...,nny platí (3.120) MU. š 7 -ľCM)ll + -|/tM)ll + ÄX;i(i^)t| Důkaz . Tvrzení lemmatu plyne ihned spojením nerovností (3.114) a(3.111). Důkaz konvergenční věty pro metodu sítí (3.40), (3.58) je nyní už snadný. Věta 3.9. Nechť íunkce p má v intervalu (a, 4) tri spojité derivace a funkce q a f dvě spojité derivace. Nechť dále platí nerovnosti (2.1) a (2.2) a nechť je cti > 0, 0i > 0 pro« = 1,2. Nechť konečně yk je přibližné řešení získané metodou sítí (3.40), (3.58). Pak existuje konstanta M taková, že pro každé dostatečně malé h platí (3.121) 1» - !/(*»)! š Mh2 Důkaz. Za uvedených předpokladů existuje podle vět 3.3 a 3.5 konstanta K taková, že platí (3.122) (i»yCpr))l =st, k=l,...,n 1, (3.123) |£jfe|S/<fft2, *.*:0,...,n. Položíme-li dosadíme-li do nerovnosti (3.120) z rovnic (3.122), máme n-l (3.124) 186 < — |£o| + — \sn\ + h n — i v (3.125) Odhadneme-li nyní lokální chyby ek pomocí nerovností (3.123), dostáváme, že platí J_ J_ Protože konstanta 7 nezávisí na h, dokazuje nerovnost (3.125) tvrzení věty. Poznámka 3.2. Vynásobím-li každou z rovnic (3.40) číslem h2, první rovnici (3.58) číslem h/oti a druhou rovnici (3.58) číslem h/cti, dostaneme soustavu (3.126) h2(Lhy)k = h2f(xk), k=l,. .,n-l, <*1 n+1 rovnic o n+1 neznámých, která je ekvivalentní soustavě (3.40), (3.58) definující vyšetřované přibližné řešení. Matice této soustavy — označme ji Ah — je přitom symetrická a pozitivně definitní. Skutečně, pro libovolný vektor r) = (r)0,..., t]n)T je n (3.127) (/Ut?,»j) = 5>Uí?W = k=a = [p(x0 + h/2) + \h2q(x0) + h^-] ijg - p(i0 + ft/2)ij0iji+ n-l 4- [f>(ar„ - h/2) + hh2q(xn) + A—] t?„ -p(x„ - h/2)r,n^rjn = = -p(*o - A/2)(i)i - ijo)i/0 4- [|fc2?(*o) 4- ä^-] í?o+ n-l + h2^{Lhr))kr]k+ fc=3. + p(a;„ - A/2)(J)„ "n-iK + [^g(in) + h^\nl = Odtud a z lemmatu 3.11 a 3.12 však plyne, že platí (3.128) 7 Z poznámky 3.2 plyne jednoznačná řešitelnost soustavy (3.40), (3.58) (nebo (3.126)), aniž je zapotřebí užít monotonie matice A\. 187 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY V právě popsané technice vyšetřování metody sítí (3.40), (3.58) jsme se omezili na typický případ, že je cti > 0 a fa > 0 pro i = 1,2. Zmiňme se nyní stručně o modifikacích postupu v případě, že některá z těchto podmínek není splněna. Je-li jedno nebo obě z čísel ai a a2 rovno nule, udává příslušná okrajová podmínka přímo hodnotu hledaného řešení. Při přepisu této okrajové podmínky se tedy nedopustíme žádné chyby a příslušnou složku vektoru chyby lze položit rovnu nule. Nerovnosti (3.111) a (3.114) pak platí s tím, že je v nich třeba vypustit členy obsahující nulové c«l nebo a2. V případě, že je jedno z čísel fa a fa rovno nule, stačí při konstrukci maxima ve vzorci (3.107) příslušný člen vypustit. Je-li konečně fa — fa — 0, není funkce g identicky rovna nule a při odhadování členů na pravé straně rovnice (3.113) je třeba zachovat nenulovou část součtu q(xk)ll< Zakončeme tento odstavec několika poznámkami o možnostech zlepšení rychlosti konvergence popsané metody sítí. Toho lze podle předešlého výkladu dosáhnout tak, že nalezneme konečnědimenzionální náhradu příslušných diferenciálních výrazů takovou, že její chyba je řádově menší než u těch, které jsme až dosud užili. V literatuře se většinou doporučuje takový postup, že se derivace v dané diferenciální rovnici aproximují s větší přesností, než které je možno dosáhnout námi užitými prostými diferenčními podíly. Tak např. lc náhradě druhé derivace lze užít vzorec (3.129) y"(xk) = _ -y(xk-i) + 16y(a;r_i) - 30y(xk) + Uy{xk+1) -12ft2 y(*k+-i) který platí pro každou dostatečně hladkou funkci a který vznikl derivováním in-terpolačního polynomu čtvrtého stupně pro funkci y. Užijeme-li k sestavení diferenčních rovnic vzorce tohoto typu, je na první pohled patrné, že matice vzniklé soustavy bude pětidiagonální, a že tedy řešení této soustavy bude pracnější než v předešlých případech. Kromě toho, každou z takto vzniklých rovnic lze užít pouze pro k = 2,... ,n — 2, takže je třeba přidat celkem čtyři další rovnice, zatímco okrajové podmínky dávají přirozenou možnost k sestrojení pouze dvou takových rovnic. Tento problém zřejmě vznikne i v jednoduchém případě, kdy pTo koeficienty ai a «2 v okrajových podmínkách platí ai = a.2 = 0. Konečně je třeba také upozornit, že matice takto vzniklé soustavy ztrácí některé pro její vyšetřování příjemné vlastnosti, např. monotónnost. Mnohým z těchto problémů se lze vyhnout, vycházíme-li i zde z Marčukovy integrální identity. Tak např. položíme-li (3.130) / Jx l p(x) dx ; 1 + + 1 P(zi) p(xk + h/2) p(xk+1) [q(x)y(x) - f(x)]dx K h{q(xk)y(xk) - f(xk)+ + jihO^+iM^+i) ~ 2i(xk)y(xk) + q{zk-i)y{zk-i))- 3 METODA SlTl -jí[f(xh+1)-2f(xk) + f(xk^)]}, - p(J^+1){fa(a!tMa!*) " ^í1*)] + ^íO^+iM^+O - /0*+i)]}) a užijeme-li analogické vzorce také pro aproximaci ostatních integrálů v identitě (3.42), dostaneme soustavu (3.131) {-Ä-1/2 + ^A^i-iH + i^Pt-l/aítast-l) [-7-^—r -7^rl)fflb-l+ Lpííjb-i) p(xt)ÍJ + {pVl/2 + Pt+1/2 + ^h2q(xk)-r + ^-v^)[^-~y] + + { - Pi+1/2 + Jih2q(xk+l)-r + M2P.+W^+i)[-^--^y]} = /l2{á+48-p"*-l/2[- lp(xk-i) p(xk +hi{^^-Apih)-M+ +^hMP7xbr)-J^\}f{Xk)+ + fe2{íi + 48^+1/2 [ kde (3.132) Pt-1/2 — p{xk+l) p(xk) 6 1 , 4 , 1 P(*i-i) P^k-h/2) t* p7ř^ a analogický vzorec platí pro Pi+i/a- Přidáme-li k této soustavě (jejíž matice je pro dostatečně malá h monotónní) vhodné okrajové podmínky (např. v případě, že je ai = c«2 = 0, je to jednoduché, neboť pak známe krajní hodnoty hledaného řešení přesně), dostaneme soustavu rovnic s třídiagonální maticí. Její řešení je tedy 188 189 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE OKRAJOVÉ ÚLOHY 3 METODA SlTl stejně pracné jako dříve, přesnost však je řádu 0(/t4). Je však poctivé upozornit, že přepis okrajových podmínek obsahujících derivace tak, aby se vysoká přesnost uvedené metody neznehodnotila, představuje dosti vážný problém. 3.2.3 Řešení vzniklých soustav lineárních rovnic V tomto odstavci si stručně všimneme problematicky řešení soustav lineárních rovnic, které vznikají při řešení dané okrajové úlohy metodou sítí. Omezíme se opět na případ eťj > 0, pi > 0 pro i = 1,2 a přepis okrajových podmínek pomocí operátorů ř(f1,d^ a '/2,d'- Řešíme tedy soustavu (3.126) z předešlého odstavce. Zapišme ji ve tvaru (3.133) Je tedy (3.134) = h2f(xk), fc = l,...,n-l, 90 fft = h2f(xk ffn = A* + 9 -■(go,--- \h2) Matice je symetrická a pozitivně definitní. Pišme ji ve tvaru (3.135) ao ba 0 0 a bn„! a o bn-l Pak je (3.136) a0 = p(xa + h/2) + ih2q(xa) + —h, cti at = p(xh - h/2) + p(xt + h/2) + h2q(xk), i„ = p(x„ - h/2) + \h2q(x„) + ^h k — 1, - -, ,n — 1, (3.137) bk = -p(xk + h/2), fc = 0,...,n-l. Řešme nejprve soustavu (3.133) eliminační metodou. Snadno se zjistí přímým 190 výpočtem, že jsou-li čísla dk definována rekurencí (3.138) platí (3.139) kde (3.140) do — ao, dk — ak- dk-i' k=l,...,n, 1 0 0 0 . (3.141) do bn 0 'v 0 .. o f>n-l d„ Rovnice (3.139) platí samozřejmě pouze za předpokladu, že definice čísel dk má smysl, tj. za předpokladu, že je dk ^ 0 pro k = 0,. ., n 1. V následující větě ukážeme, že tomu tak skutečně je. Věta 3.10. Nechť funkce p, p' a q jsou spojité, nechť platí nerovnosti (2.1) a (2.2), nechť je c<i > 0, /?,■ > 0 pro i — 1, 2 a nechť akt bk jsou definována vzorci (3.136), (3.137). Pat pro čísla dk definovaná rekurencí (3.138) platí pro dostatečně malá h (3.142) dk ž po, k = 0,..., n — 1. Důkaz Bud! <p řešení diferenciální rovnice (2.108) v intervalu (a, b) s počáteční podmínkou (2.109). Z věty 2.4 víme, že funkce ip existuje a je jediná a z důkazu této věty dokonce víme, že funkce <p je v intervalu {a, b) kladná. Položíme-li dále (3.143) $(x, ip,h) — ■ + q(x + h), p(x + h/2) + htp je obecná jednokroková metoda daná funkcí <ř konzistentní s diferenciální rovnicí 191 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 3 METODA SÍTÍ (2.108) (srv. kap. I, odst, 3.2). Pro posloupnost ipk definovanou rovnicemi (3.144) po = — + hhq(x0), fk = ipk-i + h*(sj!-i, <pk-i, h), k = 1,..., n, tedy platí podle věty 3.1 z kap. I (3.145) ipk — f>(xic) —► 0 pro /i^O, xjc = a + kh = konst. Přesně vzato, toto tvrzení ze zmíněné věty přímo neplyne, neboť v ní se předpokládá, že počáteční podmínka přibližného řešení je rovna přesné počáteční podmínce. Zde tomu tak není, neboť počáteční podmínka pro přibližné řešení k přesné počáteční podmínce pouze konverguje pro k —► 0. Je však naprosto zřejmé, jak modifikovat větu 3.1 z kap. I, aby pokrývala i tento případ, Ze vztahu (3.145) plyne, že pro všechna dostatečně malá A jsou čísla tpk nezáporná (funkce if> je kladná). Položíme-li tedy (3.146) J* =p{xl + A/2) +Apj,, k = 0,..., n -1, platí pro k = 0,..., n — 1 (3.147) ďh^pa. Z rekurence (3.144) dostáváme ihned, že je (3.148) ďB = p(x0 + A/2) + \h2q{x0) + h^- = a0 a (3.149) dk = p(xk + A/2) + hipk = = p(it+A/2) + A^_i-A2 ■ + h2q(xh) p(xk - h/2) + hipk-i ■ p(xk - A/2) +p(xk + A/2) + h2q{xk) + h<pk-i -p(xk - h/2)- - h2- Vk-i p(xh - A/2) + htpk-i ' ak+ h<pk-ip(xk - |) + ftVl-i - P2(xk - |) - hpjxk - |)pt-i - AV2.! _ p(zt - A/2) + htfk-i ■ ik ■ dk~i pro k = 0,..., n — 1. Platí tedy dk = dk pro it = 0,..., n — 1 a tvrzení věty plyne z nerovnosti (3.147). 192 Jsou-li tedy splněny předpoklady věty 3.10, rozklad (3,139) skutečně existuje a protože je rovněž dn > 0, jak plyne ihned přímo z rovnic (3.138) (nebo také. chceme-li, ze skutečnosti, že matice je regulární), lze řešit soustavu (3.133) tak. že nejprve vypočteme vektor c — (co,..., cn)T ze soustavy (3.150) Lhc = g a pak hledaný vektor y = (y0, ■.., yn)T ze soustavy (3.151) Rhy = c. Vzhledem k speciálnímu tvaru matic a zřejmě platí (3.152) co = go, h-iCk-i , , Ck=9k--j-, *=1, dk-i (3.153) Vk ■ (ck-hyt+i), k = n-l,. ,0. Soustavu (3.133) lze tedy řešit eliminační metodou bez výběru hlavního prvku a znamená to vypočítat veličiny dt a c* z rekurencí (3.138) a (3.152) a hledané řešení z rekurence (3.153). Pokud jde o jiné metody pro řešení soustavy (3.133), dá se jistě užít Gaussova-Seidelova metoda nebo optimalizovaná superrelaxační metoda, neboť matice Ah je pozitivně definitní. Všeobecně však nelze užití iteračních metod v tomto případě doporučit. Z rekurencí (3.138), (3.152) a (3.153) je totiž ihned vidět, že k provedení eliminační metody je třeba řádově pouze 0(n) operací, tj. řádově pouze tolik operací, kolik je neznámých. Žádná iterační metoda nemůže tedy eliminační metodě co do výpočetní ekonomie konkurovat. Všimněme si ještě jedné zajímavé okolnosti spojené s eliminační metodou. Z důkazu věty 3.10 je vidět, že defmujeme-li pro k = 0,..., n — 1 posloupnost ipt rovnicí dk = p[xk + A/2) + htpk, kde posloupnost dk je definovaná rekurencí (3.138), představuje tato posloupnost přibližné řešení rovnice (2.108) z metody normalizovaného přesunu. Tak je tomu i pro ostatní rekurence, podle nichž se v eliminační metodě počítá. Skutečně, definujeme-li posloupnost vk rovnicí - hvk, kde Ck jsou dány rekurencí (3.152), snadno vypočteme, že platí (3.154) «0 = ^ + ifc/ízo), Vk = Vk-i + A J ■ Wfc-l"*-! f(xk) p(xk - A/2) + hifk-i takže posloupnost vk aproximuje řešení diferenciální rovnice (2.110) s počáteční podmínkou (2.111). Vyjádříme-li konečně tft definované rekurencí (3.153) pomocí 193 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 3 METODA SlTl veličin <pi a «i, dostaneme (3.155) yn 72 +<*2T>n-\ + 0(A), Sft = í/t+i 1P*Wt+l — »i p(xk + A/2) + hVk' takže posloupnost yk představuje přibližné řešení rovnice (2,107) s počáteční podmínkou (2.128). Právě zjištěná souvislost eliminační metody s metodou normalizovaného přesunu opravňuje domnívat se, že i eliminační metoda se chová stejně jako metoda normalizovaného přesunu numericky uspokojivě. Praktické zkušenosti to také plně ^^P-Pfeszují. •C. " Zakončeme celý odstavec věnovaný problematice metody sítí pro rovnice druhého řádu dvěma jednoduchými příklady. Tabulka 3.1 Řešení okrajové úlohy (3.156), (3.157) metodou sítí Užitá metoda Přesné X (3.40) (3.40) (3.131) řeaení h = 1/20 h = 1/40 h= 1/20 0,10 1.005 181 88 1,00506131 1,005020 25 1,005 020 91 0, 20 1,02065127 1,020 41730 1,020 33752 1,02033883 0,30 1,047205 57 1,04686562 1,046 74961 1,04675159 0,40 1,086 28794 1,085 85099 1,085 70174 1,085 70442 0,50 1,140 190 24 1,13966880 1,139490 55 1,13949391 0,60 1,212 41116 1,21182488 1,211624 28 1, 21162030 0,70 1,308 28355 1,30766627 1,30745466 1,30745925 0,80 1,43610636 1,435 52074 1,435 31938 1,43532420 0,90 1,609 29885 1,608 86991 1,608 72101 1,608 725 79 Příklad 3.1. Řešme v intervalu (0,1) diferenciální rovnici (3.156) -y" + (í + 2tg2x)y = a s okrajovými podmínkami 1 [!]■ ľ (3.157) y(0) = l, y(i)- cos 1 a s přesným řešením y(x) = 1/cosa;. V tab. 3.1 jsou uvedeny hodnoty přibližného řešení získaného pomocí rovnic (3.40) s h — 1/20 a s h = 1/40 a hodnoty přibližného řešení získaného pomocí rovnic (3.131) s h = 1/20 spolu s hodnotami přesného 194 řešení. Z tabulky je vidět, že podstatné méně pracná metoda (3.131) s h — 1/20 dává skutečně dosti lepší výsledky než metoda (3.40) s h = 1/40. Příklad 3.2. (3.158) Řešme diferenciální rovnici (3.156) s okrajovými podmínkami 1/(0) Přesné řešení této úlohy je opět funkce y(x) — 1/cosar. Tab. 3.2 uvádí příslušné výsledky získané ze soustavy (3.40), (3.41) a (3.40), (3.58). Vidíme z ní, že nevhodný přepis okrajových podmínek se může projevit dosti dramaticky. Tabulka 3.2 Řešení okrajové úlohy (3.156), (3.158) metodou síti ar Užitá metoda Přesné řešení (3.40), (3.41) h = 1/40 (3.40), (3.58) h = 1/40 0 00 1,06053663 0,99911825 1 000 000 00 0 10 1,064 53236 1,00413347 1 005 02091 0 20 1,07943178 1,019433 84 1 02033883 0 30 1,10606484 1,045 815 84 1,046 75159 0 40 1,14594359 1,084722 28 1,080 704 42 0 50 1,201475 20 1,138445 72 1 139 493 91 0 60 1,27633903 1, 21048776 1 21162030 0 70 1,376148 32 1,30618892 1 307 459 25 0 80 1,509 646 22 1,43386691 1 435 32420 0 90 1,690986 79 1,60698715 1 608 725 79 1 00 1,944423 37 1,848623 70 1 850815 72 3.3 Lineární diferenciální rovnice čtvrtého řádu V tomto odstavci si všimneme užití metody sítí k řešení okrajové úlohy (1.14) s okrajovými podmínkami (1.15). Začneme tím, že vyslovíme a dokážeme základní existenční větu. Věta 3.11. Nechť funkce p je dvakrát spojitě diferencovatelná v intervalu (a, b), nechť funkce q a f jsou spojité v (o, b) a nechť platí (3.159) p(i)^po>0, }(i)ŽO, ze(a,ó), kde po je konstanta. Pak existuje právě jedno řešení úlohy (1.14), (1.15). 195 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY Důkaz. Podle poznámky 2.2 na str. 140 stačí ukázat, že příslušná homogenní úloha má pouze triviální řešení. Buď tedy n řešen! diferenciální rovnice (3.160) (i«í)W = (ľW)" 4-í(*)<7 -0, x e (a,i) s okrajovými podmínkami (3-161) ,(<,) = rf(a) = V(b) = t/(6) = 0. Máme dokázat, že funkce tj je rovna v intervalu (a, i) identicky nule. Vynásobme rovnici (3.160) funkcí tj a integrujme v mezích od a do 6. Dvojí integrací per partes a užitím okrajových podmínek (3.161) dostaneme (3.162) / {Wx)r,"(x)]" + q(x)i,(x)}Ti(x)ix = J a = fp(x)W'(x)]2dx+ f q(x)n\x)dx. J a J a Použijeme-H nerovnosti (3.159), máme (3.163) £ + ff(*)iR»}ij(*) dx ^ p0 j\rf'(x)]> d x. Na druhé straně vzhledem k okrajovým podmínkám (3.161) zřejmě platí (3164) iK*) = jT"^V,Wdí)dí. Zaměníme-li ve vzorci (3.164) pořadí integrace, dostaneme (3165) n(x)= ľ(x-s)t]"(s)ds. Ja Odtud užitím Schwarzovy nerovnosti vypočteme, že platí (3.166) v2(x)Z Jjx-sýds jjV"(s)]2dsg i(b-af j\n"(s)ťds. Dosadíme-li z této nerovnosti do nerovnosti (3.163), dostáváme celkem, že pro každé x e (a, 6) platí (3.167) ns(*)š s(fr-°)3^/ {|p(«)?"W]" + í(íWí)}il(«)di. Pravá strana této nerovnosti je však nulová; je tedy nulová i levá strana a tj(x) = 0 v (a,b). Věta je dokázána. 196 3 METODA SlTl 3.3.1 Sestavení diferenčních rovnic Položíme-li p{x)y"{x) = z(x) a aproximujeme-li derivaci z"(x) v diferenciální rovnici (1.14) podílem [z(x + h) - 2z{x) 4- z(x - h)]/h2 a chybu, které se přitom dopustíme, zanedbáme, jsme přirozeně přivedeni k zavedení operátora (užití téhož symbolu jako v předešlém odstavci nepovede k nedorozumění), který (n 4-1)-dimenzionálnímu vektoru y = (j/o> ■ ■ •, Un)T přiřazuje (n — 3)-dimenzionální vektor Lky předpisem (3.168) h\Lhy )t = p(i*-i)í/jfc-2 - 2[p(*t_i) + p{xk)]yk-i+ + \p(xí-i) + 4p(xt) +p(xk+i) + A4g(«t)]!ft- - 2[p(xt) +p(xk+i)]yk+i+ + p(xk+\)yk+2, k = 2, ...,n-2. Tento operátor aproximuje operátor i na levé straně diferenciální rovnice (1.14) ve smyslu následující věty. Věta 3.12. Nechť funkce p má v intervalu (a, 6) čtyři spojité derivace a nechť q je spojitá. Pak pro každou funkci y, která má v intervalu (a, 6) šest spojitých derivací, plat! (3.169) (Lhy^)k = (Ly)(xk)-rO(h2), ŕ = 2,..., n-2, kdeyW = (y(x0),...,y(xrL)f. Důkaz. Buď x € (a,b) a položme z(x) -p(x)y"(x). Funkce z má v intervalu (o, 6) čtyři spojité derivace a podle Taylorova vzorce (nebo podle lemmatu 3.8) platí (3.170) z(* + A)-2z(x) + z(*-ft) = z"(x) + 0(h2). Užijeme-li znovu Taylorův vzorec, máme y{x 4 h)- h2 2y(x) 4- y(x -h) h2 I/(a:)- 2y(x -h) + y(x - 2h) h2 (x-h) + i^"'(x-A)ft3 + 0(/i4), neboť funkce y má podle předpokladu šest spojitých derivací. Vynásobíme-li první rovnici v (3.171) číslem p(x + h)/h2, druhou číslem -2p(x)/h2, třetí číslem p(x -— h)/h2 a sečteme, dostaneme (3.172) ^{pís + h)[y(x 4- 2h) - 2y(x + h) + y(x)]- ■ 2p(x)[j/(x + h)- 2y(x) 4- y(x - h)]+ + p(x - h)[y(x) - 2y[x - h) + y(x - 2h)}} = 197 H. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY _ z(x + h)- 2z(x) + z(x - h) h2 + + + h)y""(x + h) — 2p{x)y""(x) + p(x - h)y""(x - h)}+ + 0(h2). Výraz v hranaté závorce na pravé straně rovnice (3.172) je však velikosti 0(/i2), neboť funkce p(x)y""(x) má v intervalu (a,í>) dvě spojité derivace. Tvrzení věty tedy plyne z rovnic (3.172) a (3.170). Na základě této věty je přirozené hledat přibližné řešení ya,. úlohy z rovnic ., yn dané okrajové (3.173) (Lhy)k=f(xt), k = 2, i-2. Počet těchto rovnic je n — 3, zatímco neznámých je n + 1. Je tedy třeba připojit k nim ještě čtyři rovnice, které se získají z okrajových podmínek. Dvě z nich dostaneme ihned tak, že položíme yo — 7i a yn = j2. Další dvě rovnice lze získat snadno tak, že ve zbývajících okrajových podmínkách se nahradí derivace prostými diferenčními podíly (srv. odvození rovnic (3.27) v odst. 3.2.1). Tím se však dopustíme chyby řádu 0(h), zatímco v rovnicích (3.173) děláme chybu řádu 0(h2). Proto použijeme postup, který se v podobných případech často doporučuje (a který jsme už vlastně mohli užít i v odst. 3.2.1). Derivace v příslušných okrajových podmínkách nahradíme výrazy (yx - j)_1)/(2/i), resp. (yn+1 - yn_1)/(2h), kde-y_i, resp. yn+1 značí aproximaci prodloužení hledaného řešení do bodů z_i — xq — h, resp. r„+i = = x„ + h, neboť tyto podíly aproximují odpovídající derivace s přesností 0(h2). Protože však hodnoty y_ľ a i/„+i se v nich vyskytují oproti rovnicím (3.173) navíc, je třeba požadovat platnost těchto rovnic i pro k = lak = n — í. Přidané hodnoty a yn+i pak můžeme vyloučit, takže zůstanou zachovány původní neznámé VOf-iVn- Výsledky naznačeného postupu jsou shrnuty v následující větě. Věta 3.13. Nechť funkce p, p' a q jsou spojité v nějakém okolí bodu a a b. Pak pro každou funkci y, která má v okolí bodu a a b tři spojité derivace, platí (3.174) ,Wy(pr) = 2hp(a)y'(a) + 0(h3), /«y(pr) = -2hp(b)y'(b) + 0(h3): kde y (pr) s [s/(a;o), ■ y{xn)]T a operátory a /^2' jsou definovány předpisem (3.175) /„(Vpr) = - 2[p(*o)+p(*i)]l/(ao)+ + [2p(z0) + 4p(zi) + p(x2) + ft49(*0M*i)- - 2\p(xx) + P(x2)]y(x2) + p(x2)y(x3}, /P)y(pr) - p(Xn_I)y(z„_3)-2\p(xn-2)+p{xn-1)]y{xn-3)+ + [pfan-a) + 4p(x-„_i) + 2p{x„) + /í4í(rn_i)]j/(j;„_i)- - 2[p(»„_i) + p(xn)]y(xn). 3 METODA SlTÍ Důkaz Za uvedených předpokladů zřejmě platí (3.176) y(zi) - lííz-i) = 2hy'(x0) + 0(h3) (srv. lemma 3.7). Rovněž snadno se zjistí, že je (3.177) p(*o)ir{*-i) - 2[p(i0) +-p(*i)]»(*o) + b(*o) + 4p(iEi) + K*2)M*i)- - 2]p(xi) + p(x2)]y(x2) + p{x2)y(x3) + A4g(xi)y(ii) = = p(x2)[y(x3) - 2y(x2) + yfa)] - 2p(x1)[y(x2) - 2y(x1) + y(x0)] = + P(xo)[y{xi) - 2y(x0) + y(x-i)] + k43(xi)í/(x1) = = h2]p(x2)y"(x2) - 2p(x1)y"(x1) + p(x0)y"{x0)] + 0(h4) = 0(hs), neboť funkce y má v okolí bodu x = xq = a tři spojité derivace, a tedy funkce py" má v okolí téhož bodu spojitou derivaci. Vyloučíme-li y(x^i) z rovnic (3.176) a (3.177), dostaneme první rovnici (3.174). Druhá rovnice (3.174) se dokáže úplně stejně. Důkaz věty 3.13 je hotov. Přibližné řešení okrajové úlohy (1.14), (1.15) budeme tedy počítat ze soustavy (3.173) doplněné rovnicemi (3.178) yo ■ Fy- ■n, y* =72, : 2hp(x0)6: '(3) 1^'y = -2hp{x„)S2. Vzhledem k speciálnímu tvaru prvních dvou rovnic (3.178) jsou neznámé vlastně pouze složky yi,..., j/„_i. Značí-lí nyní y vektor o složkách in,..., 2M-l> Je třeba jej vypočíst ze soustavy (3.179) Ahy = g, kde Ah je pětidiagonální symetrická matice řádu n dimenzionální vektor. Položíme-li ještě A^ — {ay} a 3 = (gi (3.180) au - 2p(x0) + 4p(Xl) + p(x2) + ^qixi), ctkk = p(tfjb-i) + 4p(zt) + p(a:»+l) + h*q(xk), k — 2 Ctfi— l,n— 1 - p(xn-2) + 4p(z„_i) + 2p(i„) + ň4í(a;n_i), ak,k+i = -2[p(sit) + p(xjt+1)], * = 1,..., n - 2, a*,i+2 = p(z*+i), fc = !,...,«-3, 1 a g je daný (n - 1)- i9n-l)T, a (3.181) 31 = 2{p(x0) + p(xi)hi + 2hp(xQ)ó1. Í2 ~ -PÍxifa + lrffa), qk = kVí^s), fc = 3,...,n —3, 9n-a = -p(ain-i)72 + hif(xn-2), 3„_i = 2[p(x„_i) + p(a;„)]r2 - 2hp(xn)62, 198 199 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY jak plyne ihned z rovnic (3.173) a (3.178). Chceme-li, aby právě sestrojená metoda sítí měla rozumný smysl, je třeba především ukázat, že soustava (3.179) má právě jedno řešení. To bude snadným důsledkem lemmatu, které představuje paralelu z lemmatu 3.13 a které bude hrát klíčovou roli v důkazu konvergence popsané metody. Proto úvahy o regularitě matice A;, odsuneme až do následujícího odstavce. 3.3.2 Konvergence Základem všech úvah, které budou prováděny v tomto odstavci, je následující lemma. Lemma 3.14. Necht funkce p a q jsou spojité v (a, b) a nechť platí nerovnosti (3.159). Pak existuje konstanta y > 0 taková, že pro každý (n - l)-dimenzionální vektoz n = (iji.....Vn~i)T platí (3.182) kde (3.183) IHk-SS. = max (|fji|n-3^2, jfe=max_j \r,„\, i|A~3/=) Důkaz Buď tj = ..., t)„_i)t libovolný (n — l)-dimenzionální vektor. Položíme-li n0 = ijn = 0, = ^ a 7}n+1 = r]n-i, plyne z rovnic (3.180), že je (3.184) Zavedeme-li ještě čísla zk rovnicemi (3-185) zjt = ni+1 - 2r/fc + nk-1, k = 0, ,n, lze rovnici (3.184) psát ve tvaru (3.186) kde {Ahv,-n) = Sn + /í4^4(xí)í?í, (3.187) 5„ = J]{[p(^Jb+i)2*+i - p(xk)zk] \p{xk)Zk - p(xk-i)zh-i]}rik- 200 3 METODA SÍTl K úpravě posledního součtu užijeme dvakrát lemma 3.10; dostaneme (3.188) Sn = \p(xn)zn -p(a:B_i)íB-i]i)a-i- n-l - 53[p(art)«i - p(xk-i)zi-i\(w> - *lk-i) = k=i - p(»n)2n»?n-l - p(zn-l)zn-l»Jn-l- n-1 - pfln-ljin-ltíjn-l - ^-2) - p(xo)zoVl + ^2^-1)4-1 = 1=1 = P(*n)-íní?n-l ~ p(En-l)-Zn-l(2j?r.-l - í?n-2) - p(*o)2oí?l+ n-1 + X)p(*í)** +pí*o)*Ž -p(*»-i)*n-i- Protože je však 2jj„_i — i^-2 — -a (3.189) jak plyne ihned z definice čísel 2*, dostáváme celkem, že platí (3.190) k=1 Dosadíme-li tento výsledek do rovnice (3.186) a použijeme-li nerovnosti (3.159), máme f n — 1 (3.191) (Ah-n, n) ž po ( Y 4 + iz° ^ 1,»))ŠPo(l^^ + ^0 + bn)' Odtud a z rovnic (3.189) plyne speciálně, že je (3.192) (Ahrilrj)ž2pBr)l (AhV,v) š 2poij„_i; je tedy (3.193) (/A„i7,ri) Ž 2p0fc3[max(|n1|ft-3/2,|í?„-i|íi-3/s)]2. Píšeme-li rovnice (3.185) ve tvaru zk - (ijt+i - n*) - (n* - rjk-\) a sečteme je pro k — !,...,!/, dostaneme, že je (3.194) Sečtením rovnic (3.194) s u = 1, ., j - 1 dostáváme dále, že platí (3.195) li ~ li ~ U - l)>7i =53** 201 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY pro j = 2, 3,. .., n neboli, zaměníme-li pořádek sčítání a dosadíme-li za r/i podle rovnice (3.189), (3.196) Použijeme-li nyní nerovnost (3.101) s Schwarzovu nerovnost, plyne z rovnice (3.196) , že pro j = 2,..., n platí (3.197) tfšJj»*3+aĎj *)2I>ÍŠ«3*o2 + 2«3&2 + n3^ fc = l fc = l i=l Z nerovností (3.197) a (3.191) však už bezprostředně plyne, že je (3.198) 2(í>- 1 l i i\2 2(&-a)3 1 . PO 1 h3 po pro j = 2, ., rt, neboť je n = (i — n)/fc. Je tedy také (3.199) Položíme-li konečně (3.200) 7 =Pomin[2,2(6_a)3 plyne z tvrzení lemmatu už snadno z nerovností (3.199) a (3.192), Z lemmatu 3.14 plyne bezprostředně, že jsou-li funkce p a q spojité a platí-lí nerovnosti (3.159), je matice Ah pozitivně definitní, a soustava (3.179) má tedy při libovolné pravé straně právě jedno řešení. Skoro stejně snadno umožňuje lemma 3.14 dát odpověď i na otázku po konvergenci uvažované metody sítí. Věta 3.14. Nechť funkce p má čtyři spojité derivace funkce q a / dvě spojité derivace v intervalu (a, b) a nechť platí nerovnosti (3.159). Pak existuje konstanta M taková, že platí (3.201) \\y-y (pO|| < Mh3'2, kde y = (jft,..., yn-l)T je řešení soustavy (3.179) a y ÍPr) je veitor, jeiiož složky jsou hodnoty přesného řešení y okrajové úlohy (1.14), (1.15) v bodech ajfc. Důkaz. Za uvedených předpokladů řešení y okrajové úlohy (1.14), (1.15) nejen existuje a je jediné, ale má mimo to v intervalu (o, b) šest spojitých derivací. Položíme-li (3.202) 202 3 METODA SlTl existuje podle vět 3.12 a 3.13 konstanta K taková, že pro složky et vektoru e platí odhady (3.203) \a\SKh3, \ek\%Kh\ k = 2,... ,n - 2, |«„_i| S Kh3. Pro vektor t) = y (pr' — y tedy máme (3.204) Aj,r) a e. Podle lemmatu 3.14 platí pro libovolný vektor tj nerovnost (3.182). Dosadíme-li do této nerovnosti speciálně podle (3.204) a použijeme-li nerovnosti (3.203), snadno odvodíme, že platí (3.205) 7h3\\V\\l^ g (e,„) á X>|M g + £|£i|l')i|+kn-l|ň3/3|^-l|A-3/3š fc=2 á |HlfcA (|ei|ft8/a+£|e»| + k-il*^a) š g 7Í«3[^2 + (b - a)h2 + A^lNk^ . Odtud již požadovaná nerovnost (3.201) ihned plyne. Zcela stejně se dokáže konvergence metody sítí i v případě obecné samoadjungo-vané diferenciální rovnice 4. řádu. (3.206) {p(x)y")"-(s{x)i/)'+ q{X)y = f{x). Na vyšetřovaný speciální případ jsme se omezili hlavně z důvodu zjednodušení zápisu. Analogicky by se také vyšetřovaly jiné typy okrajových podmínek. Upozorněme závěrem ještě na jednu okolnost. Rychlosti konvergence, které jsme uvedli v případě rovnic druhého řádu, se nedaly zlepšit. Numerické experimenty naznačují, že zde tomu patrně tak není a že exponent 3/2 v odhadu (3.201) lze pravděpodobně zlepšit na 2. Dokázat se to však doposud nepodařilo. 3.3.3 Řešení vzniklých soustav V tomto odstavci uvedeme vzorce pro řešení soustavy (3.179) Gaussovou eliminační metodou bez výběru hlavního prvku. V případě rovníce druhého řádu jsme tento postup ospravedlnili tak, že jsme ukázali jeho souvislost s metodou normalizovaného přesunu. Zde nemáme vybudován potřebný aparát; pTotože však matice soustavy (3.179) je symetrická a pozitivně definitní, odvoláme se na obecné tvrzení o proveditelnosti Gaussovy eliminace bez výběru hlavního prvku pro tuto třídu matic (viz např. Wilkinson (1965)). 203 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY Řešit soustavu (3.179) Gaussovou eliminací znamená vzhledem k pětidiagonál-nosti její matice vypočítat čísla s; a ť, z rekurencí (3.207) Sl = au tl=<Xil, t2 = «22--, au gj°i,i+a — «14-1,14-2 ' , *i+l 1,1+2 , „ íi+2 = aí+2,i+2 -----;—, « = 1, . ..n-3. *i+l *i čísla d, z rekurence (3.208) «12 "i - 91, 02 = 92--Sl, on j s'+l j a»,«+2 j ■ , o "i+2 = 9i+2 —--Qi+i---—"i, !=!,.. .n—i. *i+l t< a složky j/, hledaného vektoru y z rekurence (3.209) Sfra-l = T1—-, Jřn-2 = T—-(dn-2 - Sn-2Sfa-l), ín-1 «n-2 !/i = - Siyi+1 - aíji+2t/;+2)> i = n - 3,. .., 1. Eliminační metoda je v tomto případě sice pracnější než v případě okrajové úlohy pro rovnici druhého řádu, počet potřebných operací je však opět úměrný počtu rovnic, takže patrně žádná jiná metoda nebude efektivnější. 3.4 Nelineární diferenciální rovnice V tomto odstavci zakončíme studium metody sítí pro řešení okrajových úloh pro obyčejné diferenciální rovnice tím, že na příkladě diferenciální rovnice (3.3) s okrajovými podmínkami (3.4) ukážeme, s jakými problémy se můžeme setkat při řešení nelineárních okrajových úloh. Začneme tím, že zformulujeme předpoklady, které stačí k tomu, aby výše zmíněná úloha měla právě jedno řešení. Věta 3.15. Nechť platí (i) funkce f je definovaná a spojitá v pásu R = {(x, y); a S x í= 6, —oo < y < < oo}; (ii) existuje konstanta L taková, že platí (3.210) \f{x,y)-f{x,z)\ÚL\y-z\ pro libovolnou dvojici (x, y) £ R a (x, z) £ R; (iii) pro každé (x, y) £ R existuje derivace f3 a je spojitá a nezáporná v R. Pak okrajová úloha (3.3), (3.4) má pň libovolných fi a j2 právě jedno řešení. 204 3 METODA SÍTÍ Důkaz. K důkazu použijeme myšlenku metody střelby. Buď tedy y{x; a) řešení diferenciální rovnice (3.3) s počátečními podmínkami y(x; a) = 71 a y'(x; a) = ~ a (čárkou zde i v dalších částech důkazů se rozumí derivace podle proměnné x). Podaří-li se dokázat, že rovnice (3.211) y(fc;a) = 72 má při libovolném 72 právě jedno řešení, bude existence a jednoznačnost řešení dané okrajové úlohy dokázána. Abychom to dokázali, uvědomme si předně, že za našich předpokladů funkce y[x; a) nejen existuje a je dvakrát spojitě diferencovatelná podle proměnné x při libovolném (pevném) a — tento fakt plyne ihned z věty 1.1 kap. I — ale je to dokonce spojitá funkce proměnných sána její parciální derivace ya(x; a) podle a existuje a je spojitá pro 35 £ (a, b) a pro libovolné a. Toto tvrzení plyne snadno z lemmatu 2.6. Položme (3.212) ' : n{x) = ya{x\a) a dokažme, že při pevném a platí (3.213) j](x) > x - a; xe(a,b). Důkaz tohoto tvrzení provedeme sporem. Předpokládejme tedy, že (3.213) neplatí. Pak existuje bod /; € (a, b) takový, že je (3.214) !»(£)<*-o. Derivujeme-li identitu (3.215) y"(x;a) = f.(x,y(x;a)) platnou pro libovolné x £ (a, b) a pro libovolné a podle a, dostaneme (3.216) n"{x) = fy{x,y{x;a))n(x). Protože platí y(a; a) = 71 a y'(a; a) = or, platí dále (3.217) ij(o) = 0, 7j'(a) = 1. Odtud plyne předně, že pro bod £ v nerovnosti (3.214) platí f > a. Dále tvrdíme, že tento bod lze zvolit dokonce tak, aby platilo (3.218) tj(x) > 0 pro o < 1 í Položíme-li totiž £0 = inf{:c;a <«íi, n(x) <j 0}, je £0 > «, protože platí (3.217). Dále je n(x) > 0 pro x £ (a,£o) a íj(Ío) = 0, jak plyne ihned z definice čísla {0. Nyní mohou nastat dva případy: 1) £ < £0; pak (3.218) platí. 2) f > £0; v bodě £o platí »j(ío) = 0 < £0 — a. Funkce r)(x) — (x — a) je tedy v bodě x = £0 záporná. Protože jde o spojitou funkci, je možno nalézt bod fi, £1 < £0 tak, že platí (3.219) >?(íi)<íi-a. 205 r II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE OKRAJOVÉ ÚLOHY Protože je však £j < fo, platí (3.220) r){x) > 0 pro a < x g fi a za bod £ lze vzít bod £1. Není-li tedy tvrzení (3.213) pravda, existuje skutečně bod í G (o,i) tak, že platí (3.214) a (3.218). Podle věty o střední hodnotě existuje bod & € (a, £) tak, že platí (3.221) r,(£) = (í - a),j'(6). V důsledku nerovnosti (3.214) je tedy (3.222) tj'Cía) < 1. Aplikujeme-li znovu větu o střední hodnotě, tentokrát na funkci r/ a na interval (a.Í2). dostaneme, že existuje bod £3 E («,£2) takový, že platí (3.223) «/(&)-! = (Ca-a)iř"(ťs)- Z rovnice (3.223) a z nerovnosti (3.222) plyne, že v bodě £1 platí tJ2'(Í3) < 0. To je však ve sporu s rovnicí (3.216), neboť je fy(x, Jí) ž 0 podle předpokladu (iii) a 'ífo) > 0 podle (3.118). Tento spor dokazuje platnost nerovnosti (3.213). Z nerovnosti (3.213) plyne speciálně, že je (3.224) ya{b; a) ž b- a > 0, takže funkce y(b,a) je v intervalu -00 < a < 00 rostoucí. Zvolíme-li cti pevně, plyne z nerovnosti (3.224) ihned, že pro a ž tví platí (3.225) y(b;a) = y(b;ai)+ f ya(b;t)dt^ Jůi ž y{b;ai) + (a — tvi)(4 -a). Platí tedy (3.226) lim i/(4; a) = 00. a—t-oo Úplně stejně se dokáže, že platí také (3.227) lim y(b; a) = -00. a—*-oo Funkce j/(i>; uť) je tedy rostoucí funkce proměnné a, která zobrazuje interval (-00,00) na interval (-00,00), Rovníce (3.221) má tedy při libovolném 72 právě jedno řešení. Věta je dokázána. Důkaz věty 3.15 je konstruktivní v tom smyslu, že udává současně postup, kterým lze hledané řešení sestrojit. Protože jsme však viděli, že už v lineárním případě může docházet při metodě střelby k nežádoucí ztrátě přesnosti, ukážeme v dalších dvou pododstavcích, jak lze danou okrajovou úlohu alternativně řešit metodou sítí. 206 3 METODA SÍTÍ 3.4.1 Sestavení diferenčních rovnic a jejich řešitelnost Řešit okrajovou úlohu (3.3), (3.4) metodou sítí značí, jak už víme z úvodu k tomuto článku, hledat přibližné řešení 1/1,..., ji„-i ze soustavy rovnic (3.6). Položíme-li y = — (j/l, ■ • - > Vn-l)T, lze tuto soustavu psát ve tvaru (3.228) Ay + h2f(y) = 9, kde A je čtvercová matice řádu (n — 1) daná vzorcem (3.229) A = 2-10 0 -1 '♦. 0 0 ; -1 0 .,. 0 -1 2 f je vektorová funkce (n — 1) proměnných daná předpisem (3.230) f(y) = [/(si, ih),.. ■, /(*„_!, yn-i)f a g = (71,0,..., 0,72)T je daný (n — l)-dimenzionální vektor. Poznamenejme, že vektorová funkce, která je tvaru (3.230), tj. funkce, která (n — 1)-dimenzionálnímu vektoru přiřazuje (n — l)-dimenzionální vektor takový, že jeho i-tá složka závisí pouze na i-té složce argumentu, se nazývá diagonální zobrazení. Stejně jako dříve je první otázka, na kterou je třeba odpovědět, otázka po existenci řešení soustavy (3.228). Má-li však soustava, na kterou vede metoda sítí, popisovat algoritmus pro řešení dané úlohy, je nutno nejen vědět, že její řešení existuje, ale i udat postup, kterým lze toto řešení vypočítat. Proto na otázku po existenci řešení soustavy (3.228) odpovíme konstruktivně, a to tak, že existenční důkaz provedeme pomocí konstrukce určité iterační metody pro řešení této soustavy. K tomuto cíli vyslovíme a dokážeme několik pomocných tvrzení. Lemma 3.15. Buď B matice, jejíž spektrální poloměr g(B) je menši než 1. Pak rada (3.231) konverguje. Důkaz Buď J — I ~lBT Jordánův kanonický tvar matice B. Protože zřejmě platí (3.232) t—n U-n ' 207 IL OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY stačí tvrzení dokázat pro matici v Jordánově kanonickém tvaru. Protože však taková matice je blokově diagonální, stačí se omezit najeden Jordánův blok. Obecný prvek matice J*, kde J, jě Jordánův blok řádu s, je tvarů P(k)Xl~r, kde P je polynom stupně nejvýše s — 1 a pro číslo r platí nerovnosti 0 á r í s-1 (srv. důkaz lemmatu 4.2 v kap. T). Konvergence řady £3 P(fc)Al_'' pak plyne ihned napr. z podílového kritéria, neboť A je vlastní číslo matice 8 a pro ně platí J A| < 1 podle předpokladu. Lemma 3.16. Položme (3.233) A= D-L- U, kde D je diagonální matice, L dolní trojúhelníková matice, U horní trojúhelníková matice, obě s nulami na diagonále a A je matice daná vzorcem (3.229). Pak platí (3.234) Důkaz Je zřejmě Qp-^L + U)) <1. (3.235) 0 1/2 0 1/2 0 '•■ ' ■ 1/2 L 0 .. 0 1/2 .0 Přímým výpočtem se snadno přesvědčíme, že soustava vektorů i/W = (t>í"^ "Í"20T, ľ = l,-.-,«-l.kdB (3.236) O) kw -> k-l,. ,n- 1. tvoří úplnou soustavu vlastních vektorů matice D~1(L+U) a že odpovídající vlastní čísla A'"' jsou dána vzorcem vis (3.237) 1, ...,n-l. Odtud už tvrzení lemmatu plyne. Lemma 3.17. Nechť jsou splněny předpoklady (i) až (iii) věty 3.15 a nechť R = (jRi, ..., R„-\)T je vektorová funkce (n - 1) proměnných j/i,..., yn_i daná předpisem (3.238) R(y)=y + Sf(y), kde S je diagonální matice s nezápornými diagonálními prvky a f (ý) je vektor ze vzorce (3.230). Pak rovnice (3.239) /?(/) = r, 3 METODA SÍTÍ kde r = (n, . rn_!)T je libovolný (n - l)-dimenzionáJni vektor, má právě jedno řešení. Důkaz Protože je (3.240) «l(y) = S«+ *(/(**,.!«). i = n 1, kde Si jsou diagonální prvky matice 5, je R diagonální zobrazení a každá složka vektoru y je řešením skalární rovnice (3.241) Äí(í«) = Vi + Sif(xi, Vi) - r; Tato rovnice má však při libovolném r; právě jedno řešení, neboť funkce Ri(yi) je rostoucí funkce proměnné yi a zobrazuje interval (—00,00) na interval (—00,00). Je tomu tak proto, že platí dRi(yi)/dyi = 1 + Sify(xi,yi) a čísla s; a fy{xi,yi) jsou vesměs nezáporná (srv. důkaz věty 3,15). Věta 3.16. Nechť jsou splněny předpoklady (i) až (iii) z věty 3.15 a nechť je libovolný (n — l)-dímenzionáh>( vektor. Definujme posloupnost veJctorn y M předpisem (3.242) y^ + h2D-lf(y^) = D-'(L+U)y^ + D-1g, v = 0,l,..., kde matice D, L a U jsou definovány rovnicí (3.233). Pat posloupnost y W konverguje k jedinému řešení soustavy (3.228). Důkaz . Položme speciálně (3-243) R{y) = y + h2D-1f(y). Protože matice D _1 má nezáporné prvky, jsou splněny předpoklady lemmatu 3.17 a posloupnost vektorů y W je tedy rovnicemi (3.242) skutečně definována. Buďte y a ý dva libovolné (n — l)-dimenzionální vektory a vyšetřujme rozdíl R (y) — R(ý ). Je (3.244) Ri(yi) - iiííšfc) = j/, + —/(«,,») - fc - —/(«,,*) - A2 = & - Si + —[f(xi, yi) - f(xi,yi)\ aii (a,,- jsou diagonální prvky matice A). Protože podle předpokladu (iii) je /(ar,-, yi) ž š? f{xi, yi) pro j/,- ž j/,-, plyne odtud, že platí (3.245) lífi - Äl š « = l,.-.,n 1. Nerovnosti (3.245) můžeme stručně zapsat ve tvaru (3-246) |y-ý|g|ff(y) /?(ý)|. 208 209 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY Položíme-li v této nerovnosti y — y a y — y dostáváme (3.247) t/("+1)-y(v)\ S ľ?(y("+1>) - R(y w)l = = \D~\L + U)(yW -yC""1))! ^ D_1(i + <V)|y<"> -y'""1^. Poslední nerovnost plyne z toho, že prvky matice D-1(L + f) jsou nezáporné. Z nerovnosti (3.247) však plyne okamžitě úplnou indukcí, že je (3.248) |y(.<+i)_y(,)|š[D-i(i+ly)ny Protože však je g(D ~1(L + U)) < 1 (viz lemma 3.16), je podle lemmatu 3.15 řada CO (3.249) £|yCH-i)_y<»)| konvergentní. Konverguje tedy také řada JZ^L0(y^r+^ - y W)> tj- také posloupnost y ("5. Limitní vektor y je řešením soustavy (3.228), jak plyne ihned limitním přechodem v rovnici (3.242), neboť obě její strany jsou spojité. Zbývá dokázat jednoznačnost řešení. Důkaz provedeme sporem. Nechť tedy existují dvě řešení y a z soustavy (3.228). Pro ně platí (3.250) Ay + h,2f(y}^ Az+h2f(z) neboli (3.251) A(y-z) + hí[f(y)-f(z}] = 0. Podle věty o střední hodnotě však existují čísla 9,-, i = 1,. , n — 1, taková, že je (3.252) f{y)~f{z) = H{y-z) a H je diagonální matice s čísly fy(xi, (?j) na diagonále. Tato čísla jsou však nezáporná a matice A + h2H je tedy podle Collatzova lemmatu 3.5 monotónní. To však dokazuje, že je y — z — 0. Tím jsme dokončili důkaz věty. Metoda sítí pro řešení problému (3.3), (3.4) má tedy skutečně smysl a věta 3.16 dává navíc návod, jak přibližné řešení nalézt. K řešení (n — 1) skalárních nelineárních rovnic, na něž se rozpadá konstrukce každé iterace ve vzorci (3.242), lze užít kteroukoliv metodu pro řešení nelineárních rovnic; jako příklad vhodné metody může sloužit Newtonova metoda. Poznamenejme, že Newtonovu metodu lze užít na soustavu (3.228) také přímo. V tomto případě se posloupnost aproximací řešení sestrojuje podle vzorce (3.253) yWiUyW + [G(y(»))]-V()rW), v = 0,1, ., kde jsme položili (3.254) <p(y) = Ay + h2f{y)-g 210 3 METODA SÍTÍ a G (y) je Jaccobiova matice této funkce, tj. je (3.255) G{y) = A + h1F(y), kde A je matice (3.229) a F (y ) je diagonální matice tvaru (3.256) F(y) = o o o o Protože matice F je nezáporná, je matice G podle Collatzova lemmatu (viz lemma 3.5) regulární a posloupnost y M je rovnicemi (3.253) dobře definována. Je-li tedy y'"5, dostatečně blízko přesnému řešení, iterace (3.253), jak je známo, konvergují. Upozorněme ještě závěrem, že všechny provedené úvahy lze bezprostředně zobecnit na případ diferenciální rovnice (3.3), kde druhá derivace na levé straně je nahrazena takovým lineárním diferenciálním operátorem druhého řádu, že jeho aproximace metodou sítí vede na matici A, pro jejíž rozklad (3.233) platí, že diagonální matice D má kladné diagonální prvky, že matice D~l(L 4- U) je nezáporná a že platí nerovnost (3.234). 3.4.2 Konvergence Důkaz konvergence navržené metody sítí je ve srovnání s důkazem řešitelnosti soustavy (3.228) už velice jednoduchý a je v podstatě pouhým důsledkem následujícího lemmatu. Lemma 3.18. BuoM matice rádu n—1 daná vzorcem (3.229). Pak A je regulární a oznacíme-li prvky inverzní matice a"1, plat/ (3.257) i š Ji Důkaz Regularita matice A plyne triviálně např. z Collatzova lemmatu. Bud" dále o-1 j-tý sloupec matice A _1, tj. o-".1'' = (oy1,..., a^-i jÝ'■ pl&tí Aa _lj = e O), kde vektor e (J) je j-tý sloupec jednotkové matice, neboli, položíme-li "Oj --nj (3.258) -"i-1! j + ťaj.1 - - 0, i = 1,..., n - 1, i / j, (3.259) -«TÍij+*»H Hledejme řešení soustavy (3.258), (3.259) ve tvaru (3.260) of/ - ai 211 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 4 VARIAČNÍ METODY pro i — 0, .., j a (3.261) By» = /?(» - i) pro i = j,..., n, kde a a /? jsou vhodné konstanty. Rovnice (3.258) jsou zřejmě splněny při libovolném a a /?, je tedy třeba určit tyto konstanty tak, aby platilo (3.262) aj = p[n - }) a aby byla splněna rovnice (3.259), tj. aby platilo (3.263) -a(j - 1) + a j + p(n - j) - p(n - j ^ 1) = 1. Vypočteme-li tv a p z rovnic (3.262) a (3.263), dostaneme už rovnice (3.257). Lemma je dokázáno. Veta 3.17. Nechť pravá strana / diferenciální rovnice (3.3) splňuje požadavky (i) až (iii) z věty 3.15 a nechť navíc má v R spojité druhé parciální derivace podle y. Nechť dále y je přesné řešení úlohy (3.3), (3.4) a yk, k = 1,..., n — 1, je řešení soustavy (3.228). Pat existuje konstanta M taková, že pro fc = 1,..., n — 1 a pro každé dostatečně malé h platí (3.264) \y* - srt>*)l š Mh2 Důkaz. Za uvedených předpokladů má přesné řešení y dané okrajové úlohy v intervalu (a, b) čtyři spojité derivace. Podle lemmatu 3.8 tedy platí (3.265) ■ + 2y(xk) - y(xk+1) + h2f(xk,yk)\ á ±Zh4 Z- max \y""(x k - 1,. ..,n- 1, kde (3.266) Z nerovností (3.265) vsak plyne, že existují čísla 9k, \9k\ á 1, taková, že je (3.267) -y(,xi^1) + 2y(xk)-y{xk+1)-rh2f{xi,yk) = ±0kZhA. Položíme-li jjj. — y(xk) — yk, odečteme-li fc-tou rovnici (3.228) od rovnice (3.267) a užijeme-li větu o střední hodnotě, dostaneme (3.268) - vt-i + 2r)k - Tjt+i + h2ghr!h e ^ŕ^/i4, t = l,.„,n-l: >?0 = f?n = 0, kde gk jsou hodnoty funkce fy(xk,y) ve vhodných bodech y — yk, tedy nezáporná čísla. Položíme-li jako obvykle rj — (iji,..., »?ii-i)T, můžeme rovnice (3.268) zapsat maticově jako (3.269) 212 (A+h2H)r)= ±Zh4P< kde H a P jsou diagonální matice s čísly gk, resp. 6k na diagonále. Matice H je tedy nezáporná a matice A + h2H je podle Collatzova lemmatu monotónní. Podle lemmatu 3.3 tedy platí (3.270) (A+h'H)-1 ZA-1. Maticová norma, která je indukována JSfoo-vektorovou normou, je rovna maximu ze součtů absolutních hodnot prvků v jednotlivých jejích řádcích. Užijeme-li tedy tuto maticovou normu, platí (3.271) ll^ + Ä'wr'IIŠIIA-1!!, protože matice A + h2H a A jsou monotónní, a tedy matice (A + h2H)~y a A~l jsou podle lemmatu 3.1 nezáporné. Je však n-i (3.272) ll^_1ll»..= m« X0-^? (n — i)i n2 (b — a)2 1 = max--— S — S--— t^7 ■=i,...,n-i 2 - 8 ~ 8 h2 Z nerovností (3.270), (3.271) a z rovnice (3.272) už tvrzení věty plyne bezprostředně. 4 Variační metody V tomto článku si všimneme velice stručně takových metod pro řešení okrajových úloh, které souvisí s variačním počtem. Tyto metody vycházejí ze skutečnosti, že velmi mnoho fyzikálních zákonů lze vyjádřit pomocí minimálních principů. Tak např. rovnovážný stav mechanické soustavy je takový stav, který odpovídá minimu její potenciální energie. Z toho důvodu je okrajová úloha pro diferenciální rovnici popisující rovnováhu mechanické soustavy obecně ekvivalentní s úlohou nalezení funkce, pro níž integrál vyjadřující potenciální energii této soustavy nabývá minima. Matematicky řečeno to znamená, že řešení okrajové úlohy pro diferenciální rovnici je ekvivalentní úloze variačního počtu, tj. úloze nalézt extrém integrálu, jehož Eulerovou rovnicí je daná diferenciální rovnice. K řešení úloh variačního počtu lze užít metody, kdy se přímo sestrojuje aproximace extrému daného integrálu, aniž by se napřed přecházelo k jeho Eulerově rovnici. V důsledku naznačené ekvivalence jsou tyto metody zároveň přibližnými metodami řešení okrajových úloh pro diferenciální rovnice. Z důvodů, které byly naznačeny výše, se variační metody řešení okrajových úloh nazývají také přímé metody. Dříve než popíšeme nej důležitější z nich, totiž Ritzovu a Galerkinovu metodu, ukážeme souvislost některých důležitých okrajových úloh s variačními úlohami. Protože variační metody velmi úzce souvisí s funkcionálně analytickou teorií okrajových úloh pro diferenciální rovnice, budeme v celém tomto článku předpokládat znalosti základních pojmů funkcionální analýzy, zejména pak teorie Hilbertových prostorů. 213 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 4.1 Variační formulace okrajových úloh 4.1.1 Lineární diferenciální rovnice druhého řádu Bud dána diferenciální rovnice (1.12) s jednoduchými okrajovými podmínkami (4.1) a nechť jsou splněny předpoklady věty 2.2, takže okrajová úloha (1.12), (4.1) má právě jedno řešení. Položíme-li v(x) — y(x) — l(x), kde funkce í je dána vzorcem (4.2) 1(x): b — x a — x 7it—- + 72-—r (graf této funkce je přímka spojující body (a, 71) a (6,72)), je funkce v řešením diferenciální rovnice — (p(x)v') + q(x)v — g(x) s okrajovými podmínkami u(a) = = v(b) = 0. Protože tato diferenciální rovnice je stejného typu jako diferenciální rovnice (1.12), jen její pravá strana je jiná, lze v dalším výkladu bez újmy na obecnosti předpokládat, že řešíme diferenciální rovnici (1.12) s homogenními okrajovými podmínkami (4.3) íř(o) = 0, y(b) = 0. Zaveďme operátor I předpisem (4.4) Lv — — (pu')' + qv. Tento operátor zobrazuje množinu což je množina funkcí, které mají v intervalu (a, 6) dvě spojité derivace a které splňují podmínky v(a) = v(b) = 0, do množiny *íř((íi,f>)) funkcí spojitých na intervalu {a,b). Řešit okrajovou úlohu je tedy totéž, jako řešit rovnici (4.5) v množme 2?^. Následující pomocná tvrzení umožní formulovat variační úlohu, jejíž řešení je řešením dané okrajové úlohy. Lemma 4.1. Operátor L definovaný na množině rovnicí (4.4) je symetrický operátor, tj. pro každé dvě funkce u,v £ @i platí (4,6) J (Lu)(x)v(x)dx - j u(x)(Lv)(x)dx. Důkaz . Tvrzení lemmatu dostaneme ihned dvojí integrací per partes. 214 4 VARIAČNÍ METODY Lemma 4.2. Nechť funkce p, p' a q jsou spojité a nechť platí nerovnosti (4.7) p{x) g po > 0, q(x) g 0, xě (a, 6), Pat pro každou funkci u £ piatj (4.8) r(Lit)(x)v(x)áx^T^-\\u\ J a <>-a kde symbol IIuUjí,, značí normu funkce v. v prostoru Sč^, tj.\\u\\tg^ - max |u(x)|. Důkaz. Tvrzení bylo už v podstatě dokázáno v odst. 3.2.2, když jsme studovali konvergenci metody sítí pomocí energetických nerovností (srv. vzorce (3.98), (3.99) a (3.106)). Protože však tam vyšetřovaná rovnice má jiné okrajové podmínky, zopakujeme příslušný důkaz ještě jednou. Pro každou funkci u ě &t platí pro každé x £ (a, b) (4.9) «(*)= r«'(í)df, J a protože je u(a) = 0, Odtud pomocí Schwarzovy nerovnosti dostáváme (4.10) tia(z) g (*-<•) /V(Oj2d£S(&-a) /V(Č)]2<U, J a J a tj- (4.11) IMIkí(»-«)f[«'W]2ä^ Ja Na druhé straně, integrace per partes a nerovnosti (4.7) dávají fb rb rb (4.12) / (iu)(a;)u(iE)dar - / p(x)[u'{x)]2 d x + / q(x)u2(x) i x g Ja Ja Ja ž po / VO*)]2 d b. Ja Z nerovností (4.12) a (4.11) však už tvrzení lemmatu plyne bezprostředně. Položme nyní pro u £ &l (4.13) F(u}= / (Lu)(x)u(x)dx-2 f(x)u{x)dx Ja Ja nebo alternativně (4.14) F(u)= / {p(x)[u\x)]'> + q(x)u2(x)}dx-2 f f{x)u(x)dx. Ja Ja kde vztah (4.14) vznikl ze (4.13) integrací per partes. Zavedené označení dovoluje zformulovat následující větu. 215 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE OKRAJOVÉ ÚLOHY Věta 4.1. Nechť funkce p,p', q a / jsou spojité v intervalu {a, b) a nechť jsou splněny nerovnosti (4.7). Nechť dále funkce y G 3iL je řešením rovnice (4.5). Pak platí (4.15) F(u) > F(y) pro každou funkci u & @l, y. Naopak, nechť existuje funkce y€.9i_ íaJtová, že pro každou funkci u € &i, u ^ y, platí nerovnost (4.15). Pak y je řešením rovníce (4.5). Důkaz . Buď za prvé y G &i řešením rovnice (4.5) a buď u libovolná funkce taková, že je ti 6 u ^ y. Pak podle lemmatu 4.1 platí (4.16) F(u) = / (í«)(i)u(i)di -2 f f(x)u(x)dx = J a J a = í (Lu)(x)u(x)dx-2 í (Ly)(x)u(x)dx+ J a J a + í {Ly)(x)y(x)dx~ f {Ly)(x)y(x) d x - J a Ja — / L(u-y)(x)[u(x)-y(x)]dx - f (Ly)(x)y(x)dx. Ja Ja Podle lemmatu 4.2 však pro v. jí y platí (4.17) í L{u-y)(x){u(x)-y{x)]dx>0, Ja takže odtud a z rovnice (4.16) plyne, že je (4.18) F(u) > - f{Ly)(x)y{x)dx = F(y). Ja Nechť naopak je y funkce, ve které nabývá funkcionál F absolutního minima v množině Buď u libovolná pevně zvolená funkce z množiny &i a položme (4.19) <p(t) = F(y + tu). Funkce ip jedné reálné proměnné ť je zřejmě diferencovatelná na celé reálné ose a nabývá v bodě t = 0 minima. Musí tedy pro ni platit (4.20) 216 *p'(0) = 0. 4 VARIAČNÍ METODY Protože je (4.21) ?'(t) TF(y + tu) 2 Jb {p(xW(x) + iu'(x)]u'(x) + q(x)[y{x) + tu(x)]u(x)} dx--2 J f(x)u(x)dx, je (4.22) ^'(0) = 2 J p(x)yl(x)u'(x) d x + 2 J q(x)y(x)u{x) d x- - 2 J* f(x)u(x) d i = 2 £ { - \p(x)y'(x)]' + q(x)y(x) - /(«)}«(*) dx. Pro každou funkci u G @t tedy platí (4.23) / { - W*)^*)]' + - /W}«W<li = 0. Ja Protože však množina @l je zřejmě hustá v prostoru Jž%(a, b) funkcí, které jsou měřitelné a integrovatelné v intervalu (a, b) s druhou mocninou, je — \p(x))/(x)]' + + j(i)jř(u) - f(x) = 0 skoro všude v (a, b). Protože je však y G Qi, je funkce —(p(í)jr'(i)]' + q(x)y(x) — f(x) vzhledem k předpokladům o funkcích p, p', q a / spojitá, a tedy rovna nule pro každé x G (a, i). Věta je dokázána. Ve větě 4.1 jsme tedy nalezli hledanou ekvivalenci mezi řešením okrajové úlohy (1.12), (4.3) a mezi hledáním extrému funkcionálu definovaného rovnicí (4.13) nebo (4.14). Poznamenejme, že variační formulace okrajové úlohy, která je obsahem věty 4.1, tvoří výchozí bod k podstatnému zobecnění pojmu okrajové úlohy, a to nejen v případě obyčejných diferenciálních rovnic, ale i v případě parciálních diferenciálních rovnic. Aby čtenář získal aspoň přibližnou orientaci, popíšeme, aniž budeme zacházet do podrobností, základní rysy příslušného postupu. Množina která zřejmě tvoří reálný vektorový prostor (tj. takovou množinu, že patří-li do ní prvky nav, patří do ní také lineární kombinace au-\-/3v, kde a a /? jsou libovolná reálná čísla), se pokládá za podprostor Hilbertova prostoru ^i{a., b) funkcí integrovatelných v intervalu (o, b) s kvadrátem, v němž je skalární součin zaveden rovnicí (4.24) a norma rovnicí (4.25) ŕ (u, v) = I u(x)v(x)di J a IMI = («,«)1/2 217 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY Operátor L definovaný rovnicí (4.4) je pak lineární operátor, který zobrazuje množinu &i_ C do prostoru a tento operátor je podle lemmat 4.1 a 4.2 symetrický a pozitivně definitní v tom smyslu, že platí (Lu,u) > 0 pro každou funkci u £ u / 0. Definujeme-li tedy na @i bilineární formu [ti, v] (tj. funkci dvou proměnných u a v, která je lineární v každé proměnné zvlášť) rovnicí (4.26) [u,v] = (Lu,v) nebo alternativně vzhledem k možnosti integrace per partes rovnicí (4.27) W,v]= f \p(x)u'(x)v'(x) + q(x)u(x)v(x)]dx, Ja je tato forma skalárním součinem. Zavedeme-li ještě normu rovnicí (4.28) \\u\\L = [u,uf'\ stane se vektorový prostor @i lineárním normovaným prostorem, který není obecně úplný. Jeho úplný obal označíme @; je to Hilbertův prostor, pro nějž je zřejmě @ 3 D a množina &i je v něm hustá v metrice dané normou (4.28). Prvky prostoru 9 jsou tvořeny právě těmi funkcemi z tzv. Sobolevova prostoru Jť1 které splňují okrajové podmínky (4.3). Sobolevovým prostorem Jťk (běžné značení je také W*) se přitom rozumí Hilbertův prostor funkcí, které mají v daném omezeném intervalu absolutně spojitou (k — l)-ní derivaci takovou, že platí (4.29) a v němž je skalární součin dán rovnicí /V*>(*)] J a 2 áx < oo, (4.30) 3=0 Rozšíříme-li definici funkcionářů F na funkce ti £ & rovnicí (4.31) FH = [«,«.]-2(/,«), což má smysl, neboť skalární součin [u,v] je pro prvky z prostoru & dán rovnicí (4.27), zůstává věta 4.1 v platnosti, bereme-li v ní funkce u z množiny & místo z množiny Až dosud jsme předpokládali, že koeficient p v diferenciálním operátoru L je spojitě diferencovatelná funkce v intervalu (a, 6). K tomu, aby integrál na pravé straně rovnice (4.27) měl smysl, je tento požadavek příliš přísný a lze jej podstatně zeslabit, stačí např. předpokládat, že koeficient je omezená měřitelná funkce, pro niž platí nerovnost p(x) ä po > 0. Podobně k tomu, aby měl smysl výraz (/,«), není třeba předpokládat, že funkce / je spojitá; stačí např., aby platilo / £ -£i(p, b). Pro funkce / a p právě zmíněných vlastností a pro u £ 3> nemá rovnice (4.5) obecně vůbec smysl, nicméně funkcionál F je rovnicí (4.31) stále dobře definován a nadto, jak hned uvidíme, nabývá v množině & svého minima. V tomto 218 r 4 VARIAČNÍ METODY případě je rozumné pokládat toto minimum za zobecnené řešení úlohy, která není nyní charakterizována operátorem L (ten nemá obecně smysl), ale bilineární formou (4.27). Zobecněné řešení lze charakterizovat také tak, že je to takový prvek y prostoru pro který platí rovnice (4.32) [V, v] = (/> v) pro každou funkci u £ V této souvislostí se zobecněné řešení dané okrajové úlohy nazývá také slabé řešení. Důvod je ten, že v případě, že řešení y leží v množině @l a že jak koeficient p, tak pravá strana / jsou dostatečně hladké, takže jde o klasické řešení rovnice (4.5), lze rovnici (4.32) psát ve tvaru (4.33) J (Ly)(x)v(x)dx = j /(i)i;(a:)da!. Tato rovnice vznikla vynásobením obou stran rovnice (4.5) funkcí v £ 9\_ a integrací v mezích od a do b. Vzorec (4.33) tedy vyjadřuje splnění rovnice (4.5) v integrálním, tj. slabém smyslu. Závěrem uveďme existenční větu pro takto přeformulovanou okrajovou úlohu. Veta 4.2. Buď Jír reálný Hilbertův prostor se skalárním součinem (u, v) a normou ||u||. Buď dále [u,v] symetrická bilineární forma definovaná na vektorovém prostoru C Jřkterá je pozitivně definitní, tj. pro niž existuje konstanta 7 > 0 taková, že platí (4.34) [u, u] 2í 7(u, u), u £ $l, takže [u, v] je skalární součin na&i-Buď konečně @) úplný obal prostoru f&i v normě \\u\\i = [u, u]1'2 a / 'ibovoJný prvek z Jť. Pak existuje právě jeden prvek y £ ® takový, že platí (4.35) F(y) = minimu), kde funkcionál F je definován rovnicí (4.31) Důkaz. Za uvedených předpokladů je výraz (/, u) lineární ohraničený funkcionál na Hilbertově prostoru 0, neboť ze Schwarzovy nerovnosti a z nerovnosti (4.34) plyne, že je (4.36) K/.^IŠII/IIIHIŠ-ttíII/IINIl. Podle Rieszovy věty o reprezentaci lineárního spojitého funkcionálu existuje tedy právě jeden prvek y £ & takový, že platí (4.37) 219 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY Dosadíme-li do (4.31) podle (4.37), máme (4.38) F(u) = [u,u] - 2[y, u] = [ti, u] - 2[y, u] + [y, y] - [y, y] - = [u-y,u-y]-[y,y\. Protože však je [u — y, u — y] > 0 pro u^y podle (4.34), plyne požadovaná tvrzení z identity (4.38). Poznámka 4.1. Rovnice (4.37), kterou jsme odvodili v průběhu důkazu věty 4.2, je totožná s rovnicí (4.32). Zobecněné řešení je tedy skutečně zároveň slabé řešení úlohy charakterizované bilineární formou [«, v]. V předešlém textu jsme ukázali, jak lze definovat bilineární formu z věty 4.2 v případě okrajové úlohy (1.12), (4.3). V dalším odstavci ukážeme, že i v případe diferenciálních rovnic vyšších řádů je postup principiálně stejný, 4.1.2 Lineární diferenciální rovnice vyšších řádů Uvažujme nejprve okrajovou úlohu (3.206), (1.15). Ze stejných důvodů, jako jsme uvedli v odst. 4.1.1, můžeme předpokládat, že dané okrajové podmínky jsou homogenní, tj. že jsou tvaru (4.39) y(a) = 0, y'{a) = 0, !/(*)= 0, j/(fc) = 0. Kdyby totiž tomu tak nebylo, sestrojíme snadno polynom třetího stupně, který splňuje podmínky (1.15) a pomocí něj převedeme řešení dané okrajové úlohy s nehomogenními okrajovými podmínkami na řešení okrajové úlohy s homogenními okrajovými podmínkami a jinou pravou stranou. Značí-linyní množinu funkcí čtyřikrát spojitě diferencovatelných v intervalu (a, b) a splňujících okrajové podmínky (4.39) a označíme-li L operátor definovaný na množině 2*/_ rovnicí (4.40) Lv = (pv")" - (st/)' + qv: lze okrajovou úlohu (3.206), (4.39) zapsat jako rovnici (4.41) Lu = f, jejíž řešení hledáme v množině Zavedeme-li v množině ®^ skalární součin [u, v] rovnicí ŕ (4.42) [u,v}= i (pu"v" + su'v' + quv) d x Ja a funkcionál F opět rovnicí (4.31), je úloha (4.41) ekvivalentní úloze nalezen! minima funkcionálu F v množině která vznikne zúplněním vektorového prostoru %>i v normě dané skalárním součinem (4.42). Množina S je tvořena právě těmi funkcemi ze Sobolevova prostoru Jť2, které splňují okrajové podmínky (4.39). Úlohu i VARIAĎNl METODY (4.41) lze opět jako v případě rovnice druhého řádu zobecnit na případ, že koeficienty p, s a q jsou omezené nezáporné měřitelné funkce, že platí p(x) ž po > 0 a že pravá strana / je z prostoru Sfj. Stačí k tomu pokládat rovnici (4.42) za definici bilineární formy z věty 4.2 a za řešení vzít takovou funkci y £ 0, pro niž funkcionál (4.31) nabývá minima nebo pro niž platí rovnice [y, v] = (/, v) pro každou funkci o € 3>L. Popsaný postup lze snadno zobecnit na okrajovou úlohu 2m-tého řádu, kde m je přirozené číslo. Bud' dáno m + 1 nezáporných měřitelných omezených funkcí aj (j = 0,..., m) a nechť platí am(x) ž a > 0. Označme @i množinu funkcí, které jsou v intervalu (a, 6) 2m-krát spojitě diferencovatelné a které splňují homogenní okrajové podmínky (4.43) j(('''(a) = 0, i - 0,...,m- 1, i,M(6) = 0, i-0, ...,m 1. Definujme na množině 9i bilineární formu [u, v] rovnicí (4.44) [u,v] = Yi aj{x)u^i\x)v<J\x)dx. Za uvedených předpokladů je tato bilineární forma skalární součin a Hilbertův prostor který vznikne zúplněním množiny $>i v normě dané tímto skalárním součinem, je tvořen právě těmi prvky Sobolevova prostoru m, které splňují okrajové podmínky (4.43). Zobecněná okrajová úloha příslušná k bilineární formě (4.44) je pak stejně jako výše úloha nalézt takový prvek y prostoru ®, který minimalizuje funkcionál (4.31). Podle věty 4.2 řešení této úlohy existuje a je jediné pro každou pravou stranu / £ Jžf2. Jsou-li koeficienty aj(x) dostatečně hladké a pravá strana / je spojitá, leží toto zobecněné řešení dokonce v je tedy klasickým řešením diferenciální rovnice m (4.45) (iy)(*)*£(-iy>i(*)^H*)]U) = /{«), *eM) j=o s okrajovými podmínkami (4.43). 4.1.3 Jiné typy okrajových podmínek Variační formulace okrajových úloh není vázána pouze na okrajové podmínky typu (4.3) nebo (4.43). Je-li např. dána okrajová úloha (1.12), (1.13), můžeme stejně jako v odst. 4.1.1 bez újmy na obecnosti předpokládat, že okrajové podmínky jsou homogenní, tj. že jsou tvaru (4.46) ~alP(a)y'(a) + 0iy(a) = 0 <*2P(b)ý(b) + foy(b) = 0. 220 221 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY V opačném případě snadno sestrojíme funkci l, která splňuje okrajové podmínky (1.13); funkce v = y — l pak splňuje diferenciální rovnici typu (1.12) s homogenními okrajovými podmínkami. Předpokládáme-li, že je > 0 a ct2 > 0, je okrajová úloha (1.12), (4.46) ekvivalentní s úlohou nalézt v prostoru Jf1 minimum funkcionářů (4.31), kde bilineární forma [u, v] je dána rovnicí (4.47) [u,v]=j \p(x)u'(x)v'(x) + q(x)v(x)v(x)] d x+ + ^-u(a)v(a) + fou/b)v{b). Cti 012 Protože pravá strana vzorce (4.47) vznikla z výrazu ŕ (4.48) / { - \p(x)u'(x)]'v(x) + q(x)u(x)v(x)} d x Ja integrací per partes za využití podmínek (4.45), je také naznačeno, jak se postupuje v případě jiných okrajových úloh. 4.2 Základní přibližné metody 4.2.1 Ritzova metoda V odstavci 4.1 jsme ukázali, že řešení mnoha okrajových úloh pro diferenciální rovnice je ekvivalentní s hledáním minima jistého funkcionálu. Tak např. řešit lineární diferenciální rovnici (112) s okrajovými podmínkami (4.3) je totéž jako nalézt minimum funkcionálu F daného rovnicí (4.14) na prostoru funkcí 0, které patří do Sobolevova prostoru Jř1 a které splňují okrajové podmínky (4.3). Princip Ritzovy metody spočívá v tom, že se zvolí konečnědimenzionální podprostor 3>n prostoru ^ a za aproximaci řešení dané okrajové úlohy se pokládá funkce j/jv, která minimalizuje funkcionál F na tomto konečnědimenzionálním prostoru. Tvoří-lifunkce $i, -.. bázi prostoru 0« (funkce $lt..., <řjv jsou tedy takové lineárně nezávislé funkce z prostoru @j\r, že každá jiná funkce z tohoto prostoru se dá psát jako jejich lineární kombinace), je hledaná aproximace tvaru (4.49) vn Koeficienty c* — (e*,... , cj,)1* je přitom třeba určit tak, aby funkce F ti proměnných Ci,..., cti definovaná rovnicí (4.50) FN(cu . .,cN) - Fl J2ck I VARIAČNÍ METODY nabývala v bodě (c*, .., c*N) svého minima. Protože zřejmě platí n n n (4.51) FN(Cl, ..,<;„) = ££2£*(/,*<)■ i=l 1=1 i = l je funkce FN jako funkce proměnných ci.....cN diferencovatelná. Pokud tedy funkce Fff nabývá v nějakém bodě extrému, musí v tomto bodě platit rovnice dFN (4.52) 8cj = 0, j=l,...,N. Dosadíme-li však do rovnic (4.52) podle definice funkce F^, dostáváme, že tyto rovnice představují soustavu lineárních algebraických rovnic (4-53) Ac = g, kde A je čtvercová matice řádu JV, jejíž prvky ay jsou dány rovnicemi (4.54) ay = [*,,*,], i,j- l....,.V: a g je JV-dimenzionální vektor o složkách gi daných vzorci (4-55) 9, = (/,*.), i=l,...,N. Soustava (4.53) tedy představuje nutné podmínky pro existenci extrému funkcionálu F na podprostoru Qjq. V následující větě dokážeme, že tyto podmínky jsou také postačující. Veta 4.3. Nechť jsou splněny předpoklady věty 4.2, nechť !zV je konečnědimenzionální' podprostor prostoru & a nechť funkce <řj,..., (řjy tvoří jeho bázi. Pak soustava (4.53) má při libovolném vektoru g právě jedno řešení a navíc toto řešení minimalizuje funkci Ftt definovanou vzorcem (4.50). Důkaz. Matice A, jejíž prvky jsou dány rovnicemi (4.54), je zřejmě symetrická. Dokážeme, že je také pozitivně definitní. Buď tedy e = (ci,,.., c;v)T libovolný nenulový vektor, takže funkce u = YliLi představuje nenulový prvek prostoru Je tedy N N (4.56) cTAc = EEc'cj[$í.$j] = K"! > 0. i=l 3=1 neboť bilineární forma [«, v] je pozitivně definitní. Soustava (4.53) má tedy právě jedno řešení c *. Protože je Fjv(c ) = cT Ac—2gT c, je (4.57) FN(c) = cTAc - 2(c*)TAc = = cTAc-2{c*)TAc+{c')TAc' - (c')TAc' = = (c - c*)TA(c ■ c*) {c*)TAc* > -{c*fAc* - FN(c") 222 223 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 4 VARIAČNÍ METODY pro c ^ c". Tato nerovnost však dokazuje, že funkce Jľjv skutečně nabývá v bodě c = c * svého minima. Věta je dokázána. Vypočíst Ritzovou metodou přibližné řešení okrajové úlohy charakterizované bi-lineární formou [u, v] a pravou stranou / značí tedy utvořit funkci yw tvaru (4.49), kde vektor c* je řešením soustavy lineárních algebraických rovnic (4.53). Matice této soustavy se v matematické literatuře nazývá Gramová matice. V technické literatuře, zejména pak v souvislosti s metodou konečných prvků, se matice A nazývá většinou matice tuhosti příslušná k bázi $i,...,4j\r a vektor g na pravé straně soustavy (4.53) se nazývá vektor zatížení. Abychom mohli posoudit velikost chyby, dokážeme ještě následující větu. Věta 4.4. Nechť jsou splněny předpoklady věty 4.3. Pak funkce yx tvaru (4.49), kde vektor c* je řešením soustavy (4.53), je ortogonédní projekcí v prostoru & přesného řešení dané okrajové úlohy do podprostoiu ®jv ■ Důkaz. Buď y přesné řešení okrajové úlohy charakterizované bilineární formou [u, v] a funkcí /. Z identity (4.38) platné pro libovolný prvek u E & plyne speciálně, že je (4.58) \\yN - y\\l = {yN -y,yN-y] = F(yN) + [y, y] - = min F(u) + [y,y] = min [u-y,u-y]= min ||ti - y\\2L. UĚ^U líĚ^í UÉ^V Přibližné řešení t/jv je tedy prvek podprostoru který leží nejblíže přesnému řešení. Odtud a ze známých vět o nejlepší aproximaci v Hubertově prostoru už tvrzení plyne. Ze vzorce (4.58) vyplývá, že každý horní odhad výrazu min,^^ ||u — y\\i dává odhad chyby přibližného řešení získaného Ritzovou metodou. Chyba Ritzovy metody tedy závisí na tom, jak dobře jsme schopni aproximovat přesné řešení prvky konečnědimenzionálního podprostoru &tf. Volba prostorů S>jv a bázových funkcí ä>i,... ,<řjv má tedy zřejmě při užití Ritzovy metody zásadní důležitost. V odst. 4.3 popíšeme jednu zejména v poslední době populární strategii pro systematickou konstrukci bázových funkcí. Tato metoda je známá pod názvem metoda konečných prvků a má pro efektivní užití variačních metod prvořadou důležitost, 4.2.2 Galerkinova metoda Základní myšlenka této metody je ještě jednodušší, než je tomu u Ritzovy metody. Vychází z toho, že zobecněné řešení okrajové úlohy se dá definovat rovnicí (4.32). Opět, jako u Ritzovy metody, se zvolí konečnědimenzionální podprostor ®jv prostoru ® a za přibližné řešení se pokládá taková funkce j/jv G ®iv, pro niž platí (4.59) [yN,Vfí]-(f,vN) pro každou funkci wjv G Tvoří-li funkce 3>i,.. bázi v prostoru í^v, je přibližné řešení t/jv dáno úplně stejnými vzorci jako u Ritzovy metody. V případě, že okrajovou úlohu lze interpretovat jako minimalizační úlohu, jsou tedy metody Ritzova a Galerkinova totožné. Proto se často v této souvislosti mluví □ Ritzově-Galerkinově metodě. Galerkinova metoda je však obecnější než Ritzova metoda, neboť je ji možné užít i v případě zobecněné úlohy typu (4.32), kde výraz [v, v] je bilineární forma, která nemusí být nutně symetrická. V tomto případě obecně nelze udat funkcionál typu (4.31), jehož extrém by bylo možno interpretovat jako zobecněné řešení. Úloha (4.32) však přesto může mít rozumný smysl. 0 volbě bázových funkcí Galerkinovy metody platí samozřejmě totéž, co bylo řečeno u Ritzovy metody. 4.3 Metoda konečných prvků Při popisu Ritzovy a Galerkinovy metody v odst. 4.2 jsme neudali žádný systematický způsob konstrukce konečnědimenzionálních podprostoru <?jv prostoru &. Této otázky si všimneme teprve v tomto odstavci, a proto objasníme nejprve, jaká hlediska je přitom záhodno respektovat. Pro rozdíl přibližného řešení j/jv získaného Ritzovou-Galerkinovou metodou a přesného řešení y platí nerovnost (4.60) \\yN - y\\L g ||u- y\\Ll kde u je libovolný prvek z prostoru &ft (viz věta 4.4). Podtrhněme, že index L v nerovnosti (4.60) značí, že jde o tzv. energetickou normu, tj. o normu definovanou pomocí bilineární formy [u,v\. Pro konkrétní příklady bilineárních forem uvedené v odst. 4.1.1 a 4.1.2 je však známo, že příslušné energetické normy jsou ekvivalentní s normami ve vhodných Sobolevových prostorech. Místo nerovnosti (4.60) lze tedy eventuálně užít nerovnost (4.61) lliw-yll* gMJlu-i/Hi, kde M je konstanta, která nezávisí na volbě podprostoru &n a index k značí, že jde o normu v Sobolevově prostoru Jťk. Otázka přesnosti Ritzovy aproximace je tedy v podstatě otázkou, jak přesně lze aproximovat libovolnou funkci z prostoru 9 funkcí z konečnědimenzionálního podprostoru ®jv. První hledisko, kterým je rozumné řídit se při konstrukci prostoru , je proto požadavek co nejlepší aproximovatelnosti funkcí z prostoru $ funkcemi z prostoru Druhé, neméně důležité hledisko je efektivnost vzniklého algoritmu. Podstatnou část tohoto algoritmu tvoří řešení soustavy obecně velice mnoha lineárních rovnic (4.53). Je-li matice této soustavy plná (tj. má-li všechny nebo alespoň převážnou většinu prvků různých od nuly), mohou vznikat dosti závažné problémy s pamětí počítače a s počtem prováděných operací. Tyto problémy se velmi podstatně zmírní, je-li zmíněná matice řídká (tj. má-li pouze 0{N) nenulových prvků), nebo je-li navíc dokonce pásová. 224 225 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY Je tedy žádoucí řídit se při konstrukci prostoru ®jv a zejména jeho báze i tímto hlediskem. Řídkosti matice soustavy (4.53) se obvykle dosáhne tím způsobem, že bázové funkce se volí tak, aby měly malé nosiče (tj. množiny bodů, v nichž jsou od nuly různé) ve srovnání s intervalem (a, b). Je také důležité, aby všechny výpočty potřebné k sestavení konečnědimenzio-nálního problému, tj. výpočty potřebné k určení prvků matice A a složek vektoru g, byly snadno proveditelné. S touto otázkou souvisí také to, že je žádoucí, aby koeficienty ct nebo aspoň některé z nich měly význam hodnot hledaného řešení, resp. jeho derivací v některých bodech intervalu (a, b), aby nebylo nutné ještě navíc počítat součet (4.49). Všechny tyto požadavky do značné míry splňuje metoda konečných prvků, která dává dostatečně obecný a systematický návod pro konstrukci bázových funkcí pro Ritzovu-Galerkinovu aproximaci řešení okrajových úloh. Její základní myšlenka vychází z polynomiální interpolace, nikoliv však jedním polynomem na celém intervalu, ale různými polynomy na podintervalech, na které daný interval rozdělíme. Příslušné aproximace jsou pak na jednotlivých podintervalech rovny polynomům nízkých stupňů. Při konstrukci podprostoru ^jv prostoru & budeme tedy postupovat takto: Daný interval (a, 6) rozdělíme body (zvanými nejčastěji uzly) na podíntervaly, které mají společné jen tyto uzly. V uzlech budeme zadávat tzv. uzlové parametry, tj. hodnoty polynomu a jeho derivací. Protože některé uzly jsou společné pro dva podinter-valy rozkladu, užijí se hodnoty odpovídajících uzlových parametrů pro interpolaci na obou těchto sousedních podintervalech. Podinterval rozkladu, na něm definované uzlové parametry a příslušný interpolační polynom nazveme konečným prvkem. Souhrn všech funkcí, které jsou polynomiální na jednotlivých podintervalech rozkladu, mají na sousedních prvcích společné uzlové parametry a jsou dostatečně hladké, tvoří při všech možných hodnotách uzlových parametrů konecnědimenzio-nální podprostor % Sobolevova prostoru Jťk. O podprostoru % budeme hovořit jako o prostorů konečných prvků. Index h, který jsme užili místo dřívějšího indexu N, který udával dimenzi příslušného podprostoru, se rovná délce největšího podin-tervalu rozkladu a budeme jím měřit kvalitu aproximačních vlastností příslušného podprostoru. V dalších odstavcích si všimneme několika speciálních případů této konstrukce podrobněji. 4.3.1 Aproximace po částech lineárními funkcemi Rozdělme interval (a, b) na n podintervalů dělicími body x,-, pro něž platí (4.62) a - x0 < xi < ... < x„ = b. Je-li dáno n + 1 čísel co,..., cn a sestrojíme-li funkci u, která je na každém podin-226 * VARIAČNÍ METODY tervalu (xj-y, Xj) lineární a pro níž platí (4.63) u(xi) = cí, ršO,...,n, je tato funkce spojitá a její derivace je v každém podintervalů (x;-i, X;) konstantní. Tato funkce zřejmě patří do Sobolevova prostoru Jí?1 a kromě toho je parametry co i • ■ • i c„ jednoznačně určena. Vezmeme-li tedy krajní body každého podintervalů za uzly a hodnoty funkce za uzlové parametry, tvoří soustava všech funkcí tohoto typu prostor končených prvků, který je podprostorem prostoru Jť1. Abychom tuto skutečnost zdůraznili, označíme jej @ky- Je-li / £ Jtf1, existuje právě jedna funkce fh € taková, že pro ni platí fh(xi) = f(xi) pro i = 0,... ,n. Aproximační vlastnosti právě sestrojeného prostoru jsou popsány v následující větě. Veta 4.5. Necht'je f £ Jf pro r = 1 nebo 2. Pak existuje konštanta. M > 0 tak, že pro chybu interpolace fh 6 &hi platí odhady (4.64) H/-ÄH, š A""1"-'ll/^ľ kde r= 1,2, p = 0,...,r-l, (4.65) h — max (x,-|_i — Xj) i=0,...ln — l a index 0 značí, že jde o normu v prostoru Jf2. Důkaz. Zvolme pevně interval (xj, xj+i), položme x;+i - x< = hi a buď nejprve / G Jf1. Definujeme-li funkci ip proměnné f na intervalu (0,1) předpisem (4.66) í>(e) = /W + *0, je zřejmě <p e Jťx{Q, 1). Definujme podobně funkci tp^ předpisem (4.67) MO = Mhií + Xi). Protože funkce fn je lineární na intervalu (xí,x,+i), platí totéž pro funkci iph na intervalu (0,1); je tedy (4.68) Mf) = (K0)(l-O + íí»(l)í-Položíme-li konečně (4.69) JC{í,r)={^í' snadno vypočteme, že platí r>í. (4.70) rtí)-p*(o= ľ' m,r)<p'(T)ái Jo 227 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY Odtud pomocí Schwarzovy nerovnosti snadno odvodíme, že je (4.71) [<p(Q - ^(f)]2 ž t K^> T) dr / W)]2 ir. jo jo Integrací obou stran nerovnosti (4.71) podle £ v mezích od £ = 0 do £ = 1 dostáváme odhad (4.72) /V«) - Mí)? d€ š 7 / W)]adr. Jo Jo kde (4.73) 7 = [ /1/í2(€,r)d£dr, jo jo a je to tedy absolutní konstanta. Dosaďme konečně do odhadu (4.72) za funkce ip a ph z rovnic (4.66) a (4.67). Protože je zřejmě <p'(r) = hj/'(/ijr + x;), je (4.74) / \J(h£ + mt)-MI*e + *i)?itŘll$ [/'('"i''+ S,)]2dr. Jo Jo Provedeme-li v integrálech na levě i pravé straně této nerovnosti substituce /i;£ i + xí — x, resp. /i;r + = x, dostaneme (4.75) f ""[/(z) " h{x)fc\x g 7h? r+\f'(x)]2dx (krátili jsme činitelem 1/fe;). Sečtením přes všechny intervaly dělení a použitím odhadu ň, S h však už dostaneme odhad (4.64) pro r = 1. Předpokládejme nyní, že je / € Jť2. Pak platí totéž i pro funkci p a ve vyjádření (4.70) můžeme integrovat per partes. Potřebnou primitivní funkci jádra k vzhledem k proměnné t označíme k\ a zvolíme ji ve tvaru (4.76) JO Zřejmě je ífi(£,0) = 0. Položíme-li však ve vzorci (4.70) speciálně <p(£) = £, zjistíme, že je i iři(í,l) = 0, neboť v tomto případě je také ^/i(f) = £• Zmíněná integrace per partes tedy dá vzorec (4.77) <p(0 - Wk(f) = / Xiíť.r^rjdr. Jo Odtud úplně stejným postupem jako výše dostaneme, že platí (4.78) f Mí) - <pk(()]2 dí á 71 Í\<p"{t)?At, Jo Jo 228 4 VARIAČNÍ METODY kde (4.79) 7l = f /'/f'íí.rjdídr, jo J o což je opět absolutní konstanta. Dosadíme-li však do nerovnosti (4.78) za ip a ph podle vzorců (4.66) a (4.67), a provedeme-li substituci íi,-£ + Xí - x, resp. r;f + + X{ — x, dostaneme nerovnost (4.80) r+\f{x)-fk(x)]2dx^yihi r+\f\x)]2dx. Jar, J s i Odtud už bezprostředně plyne platnost nerovnosti (4.64) sr = 2ap - 0. Abychom dokázali zbývající případ, derivujme identitu (4,77) podle £. Dostaneme (4.81) Jo kde k2(í,t) = ôifi(£, r)/9£. Z vyjádření (4.81) zopakováním předešlého postupu dostaneme nerovnost (4.82) r+\f'{x) - f'h(x)]2dx g ^h} r^lf'ixtfdx, Jxí J Si kde 72 je absolutní konstanta (rovná integrálu z kvadrátu jádra k2). Protože je \ \f— ~ fh\\í - 11/ - fh\\o + ||/' - fh\\o< P'yne tvrzení věty pro r = 2 a p - 1 z nerovností (4.80) a (4.82). Věta je dokázána. Na pravé straně nerovností (4.64) jsme stejně dobře mohli psát normy funkce / v prostoru Jť1 nebo Jť2, neboť zřejmě platí ||/'||fl <i ||/||i a ||/"||a S ||/||2- Někdy však může být užitečné, že na pravé straně těchto nerovností stačí brát pouze normu nejvyšších derivací. Poznamenejme v této souvislosti, žc S£i norma k-lé derivace funkce / £ Jťk se nazývá ir-tá seminorma této funkce a značí se \f\k- Poznámka 4.2. Přibližné řešení modelové okrajové úlohy (1.12), (4.3) získané Ritzovou metodou v prostoru těch funkcí z 3h\, které splňují podmínky (4.3), konverguje při h —> 0 k přesnému řešení. Tvrzení poznámky plyne ihned z nerovnosti (4.61), v níž je k = 1, yjv je přibližné řešení, y přesné řešení a u je libovolný prvek z prostoru Pravou stranu této nerovnosti lze totiž majorizovat výrazem M(||t/e — + ||j/s„ — j/£||i), kde ye € € Jť2 a ysh je interpolace funkce ys. Normu prvního rozdílu lze učinit libovolně malou, neboť prostor Jť2 je hustý v prostoru Jť1 a norma druhého rozdílu je malá v důsledku věty 4.5. O rychlosti konvergence se nedá obecně nic říci; v případě, že je y £ Jť2, je rychlost konvergence (v normě prostoru Jť1) ovšem O(h). Sestrojme ještě bázi v prostoru &h\- Tento prostor má dimenzi rovnou zřejmě počtu uzlových parametrů, tj. číslu n + 1. Jednu z možných (a jak hned uvidíme také vhodných) bází tvoří soustava funkcí <řj, které vzniknou tak, že j-tý uzlový 229 i II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY parametr položíme rovný jedné a ostatní uzlové parametry rovné nule. Provedeme-li naznačený postup, jsou prvky báze dány rovnicemi (4.83) *o(i) = *i(z) ; :t + l-3? I ^ x ^ xn, <x< i = 1, . - - ,n - 1 0, 0, »1+1 < < x~ xa Chceme-li sestrojit prostor konečných prvků, který je podprostorem prostoru & těch funkcí z prostoru Jt?1, jež splňují okrajové podmínky (4.3), stačí vzít (n — l)-dimenzionální prostor který je lineární obal funkcí $1,..., <ř„_i, neboť uzlové parametry pro uzly xq a xn jsou trvale rovny nule. Užijeme-li tuto bázi pro přibližné řešení okrajové úlohy (1.12), (4.3), je matice A v soustavě lineárních rovnic (4.53) třídiagonální, neboť nosiče bázových funkcí 5>; a <&j jsou pro \i — j\ ž 2 disjunktní, takže integrály ve vzorci (4.27) jsou pro tato i a j rovny nule. Složky vektoru řešení soustavy (4.53) mají přitom přímo význam hodnot přibližného řešení, neboť každá bázová funkce je rovna jedné v právě jednom uzlu a v ostatních uzlech je rovna nule. Přibližné řešení modelové úlohy (1.12), (4.3) Ritzovou-Galerkinovou metodou při užití právě sestrojeného prostoru konečných prvků vede tedy na řešení soustavy lineárních algebraických rovnic s třídiagonální maticí podobně jako v metodě sítí. Kdybychom k přibližnému výpočtu integrálů, které je nutno počítat při výpočtu prvků matice soustavy (4.53), zvolili vhodné kvadraturní vzorce, byly by dokonce obě tyto metody totožné. Metodu sítí lze tedy uvést do velmi úzké souvislosti s variačními metodami. Stejným způsobem jako výše lze užít metodu konečných prvků užívající lineární prvky S^i i k řešení jiných okrajových úloh druhého řádu. Předpoklad, že problém je druhého řádu, je zde podstatný, neboť prostor !@hi je podprostorem Sobolevova prostoru Jť1, v němž je přirozené hledat řešení rovnic druhého řádu. Protože první derivace funkcí z Sfoi nejsou obecně spojité, tím méně absolutně spojité, není tento prostor podprostorem žádného prostoru JPl pro k > 1; k řešení úloh vyššího řádu jej tedy nelze užít. 4.3.2 Aproximace Hermitova typu Jedna z možností konstrukce prostorů konečných prvků, které jsou podprostory Sobolevova prostoru Jířk pro libovolné k, vychází z myšlenky Hermitovy interpolace. Z teorie této interpolace plyne, že jsou-li Cjj, i — 0,..., n, j — 0,..., k — 1, libovolná čísla, existuje právě jedna funkce u, která je na každém podintervalu (;eí_i, xí) 230 polynomem stupně nejvýše 2k - 1 a pro niž platí (4.84) uU\xí) - dj, i = 0,...,n, j = 0, ■i VARIAČNÍ METODY 1. Každá taková funkce má spojité derivace až do řádu k — 1 a fc-tá derivace má nespojitosti pouze v uzlech z,-; patří tedy do prostoru Jľk. Vezmeme-li krajní body podintervalu, na něž jsme rozdělili interval (a,b), za uzly a hodnoty funkce spolu 5 hodnotami jejích derivací až do řádu i: —1 za uzlové parametry, dostaneme prostor konečných prvků C Jř'. Každou funkci / £ Jťk můžeme opět jako v odst. 4.3.1 aproximovat funkcí fa £ &hh, která je jednoznačně určena rovnicemi (4.85) fH\xi) = f<»{xl), i = 0.....n, J =0, 1. V dalším se zejména pro zjednodušení zápisu omezíme na ekvidistantní uzly, tj. na uzly dané vzorcem (4.86) Xí = a + ih, i = 0,,.,, n, h = (b — a)/n. Následující věta popisuje aproximační vlastnosti prostoru 9\k- Věta 4.6. Nechť je f £ Xr pro re{i,.:., 2k}. Pak pro chybu aproximace fa určené rovnicemi (4.85) platí odhad (4.87) \\f - fa\\p % Mhr-"\\f^\\0< r =*,.., ,2fc, p = 0,... ,mm(r - 1, *). Důkaz provedeme pouze pro případ k = 2. Budeme vycházet stejně jako v důkazu věty 4.5 z integrálního vyjádření chyby interpolace. Definujme funkce ip a iph opět rovnicemi (4.66) a (4.67). Funkce <ph je nyní polynom třetího stupně a dá se psát ve tvaru (4.88) Mí) = ¥>(0)(1 + 2Í)(1 - í)s + ř(l)(3 - 2Í)Í2+ + ^'(O)f(l-Í)2+ ¥■'(!)(£-l)í2. Dosadíme-li do tohoto vzorce ze zřejmých identit rt (4.89) P(0) = í>(0-Mí) + f tv"(t)At, Jo řKl) = <PÍO + (1 - fV(f) + J (1 - ry'(r) d 1 P'(0) = P'(Í)- /V'(r)dr, JB = V'(í) + /V(r)dr 231 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY platných pro ip £ Jť2(0,1), dostaneme po elementárních úpravách (4.90) n(0 = p(í)- rw-íf -(1 + 20(1 -í)V]p"(r)dr-Jo - f '[(S - 2í)í2(r - 1) + (1 - í)í VM dr, neboli (4.91) kde (4.92) P(í) ľ m,r)V"(r)r\r, Jo (í-l)2[í-(l + 2f)r], f2[l-í + (2ř-3)(l-t)], t>Í. Další postup je identický jako v důkazu věty 4.5, jen případů, které je třeba vyšetřit, je více. Z identity (4.91) ihned plyne odhad (4.93) r+1[f(x)-fh(x)fdx^ Tlft4 r+í[f"(x)]2dx: kde Ti je absolutní hodnota. Z nerovnosti (4.93) však už plyne tvrzení věty pro v = 2 a p — 0. Derivováním identity (4.91) odvodíme nerovnost (4.94) r^[f(x) ~ í>h{-x)]2áx = J2k2 J^Wi*)?**. která spolu s tím, co už jsme dokázali výše, dokazuje nerovnost (4.87) pro r = 2 a p — 1. Abychom vyšetřili případ / 6 Jř"3, uvažme, že je <p = ipk, pokud funkce ip je polynom třetího nebo nižšího stupně. Dosadíme-lí tedy do identity (4.91) za <p funkci £2/2, dostaneme, že je (4.95) Jo 0. Primitivní funkci iíi(£, t) k funkci ií(£, r) vzhledem k proměnné t lze proto volit tak, že pro ni platí Ki(£, 0) = k(£, 1) = 0. Integrace per partes v pravé straně identity (4.91) pak dá vyjádření (4.96) Jo Odtud a z identit, které se dostanou dvojím derivováním této identity podle f. dostáváme tvrzení věty pro r = 3 a pro p = 0,1, 2. Konečně v případě, že je / e Jť4, můžeme integrovat per partes ve vzorci (4.96). 232 4 VARIAČNÍ METODY Výsledné vyjádření bude tvaru (4.97) Jo protože primitivní funkci k2{£, r) k funkci ki(£,t) lze zvolit ze stejných důvodů jako výše tak, že pro ni platí k2(£, 0) = k2((,, 1) = 0 (tentokrát je třeba dosadit do identity (4.96) tp(£) ~ í3/6). Dvojím derivováním identity (4.97) podle £ dostaneme tvrzení věty pro r = 4 a p = 0,1,2. Důkaz je hotov. Poznamenejme, že třetí derivování identity (4.97) dá odhad (4.98) r+í[f"(x)-f'J'{x)]dx^yh2 f '+\f""(x)]2dx. Jxí J Ti Tuto nerovnost však ke konstrukci odhadu chyby aproximace v prostoru Jť3 použít nelze, neboť funkce fh obecně nemusí být vůbec prvkem tohoto prostoru. Důkaz tvrzení věty 4.6 pro obecné k vychází z identity (4.99) P(í)-*>»«)= f m,T)^\T)di Jo platné pro ip £ Jťk. Odvození toto identity je však dosti komplikované, a proto jsme se omezili na uvedený speciální případ. Prvky prostorů Shis se nazývají Hermitovy spline-funkce stupně 2k— 1. Abychom mohli těchto prostorů efektivně využívat k variačnímu řešení okrajových úloh, je třeba v nich zavést vhodné báze. Všimněme si proto nyní této otázky. Začneme případem k = 2. V tomto případě je dimenze prostoru 9h2 rovna 2{n + 1), neboť v fi+1 uzlech zadáváme vždy dva uzlové parametry, totiž hodnotu funkce a hodnotu její derivace. Je tedy třeba sestrojit 2(n + 1) bázových funkcí 3>o, • ■ •, $2n-t-l- Jedna z možností, jak je získat, je zcela analogická jako v případě aproximace po částech lineárními funkcemi. Funkci *2i, i = 0,..., n, sestrojíme tak, že uzlový parametr, který udává funkční hodnotu v i-tém uzlu, položíme rovný jedné a všechny ostatní uzlové parametry položíme rovny nule; u funkcí *2i+i. i = 0,..., n, to provedeme obráceně v tom smyslu, že uzlový parametr, který udává hodnotu první derivace v í-tém uzlu, položíme rovný jedné a všechny ostatní uzlové parametry rovny nule. Abychom mohli takto vzniklé bázové funkce snadno zapsat, položme (4.100) tpB(x) f 0, 1 - 3x2 - 2x3, l-3x2 + 2x3, 1.0, x ú -1, -líiíO, Oíií 1 1 < x 233 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 4 VARIAČNÍ METODY (4.101) o, x + 2x2 + i3, 2x2 0, * á -1. -líiíO, 0 g Z g 1, 1 < x. Funkce 9?o je tedy v bodě nula rovna jedné a má tam nulovou derivaci a ve všech ostatních bodech o celočíselných souřadnicích je spolu se svou první derivací rovna nule. U funkce ipi Je oproti funkci ipo role funkčních hodnot a hodnot první derivace obrácená. Užijeme-li právě zavedené funkce, jsou bázové funkce $j dány jednoduchými vzorci (4.102) «M*): *2i+l(z) : <pi o, Vypustíme-li v soustavě bázových funkcí (4.102) funkce $0, $i> $2n, $2n+i, dostaneme prostor konečných prvků který je podprostorem prostoru & = Jt?a2 těch funkcí ze Sobolevova prostoru Jť2, které splňují okrajové podmínky (4.39). Užijeme-li tuto bázi k přibližnému řešení okrajové úlohy čtvrtého řádu (3.206), (4.39), bude matice příslušné soustavy lineárních rovnic pásová se sedmi nenulovými diagonálami, neboť z toho, že každá bázová funkce $2>, $2í+i je různá od nuly pouze v intervalu {asj-i, x;+i), plyne, že platí [<řj, <ř,-] = 0 pro ji — j\ § 4. Prostor konečných prvků %3 lze užít i k řešení úloh druhého řádu, neboť podmínka, aby byl podprostorem prostoru Jť1, je samozřejmě splněna. V tomto případě plyne ze vzorců (4.61) a (4.87), že za předpokladu dostatečné hladkosti řešení lze dosáhnout rychlosti konvergence měřené v normě prostoru Jť1 až 0(h3). Cena, která se za to zaplatí, je však ta, že matice soustavy (4.53) je nyní sedmidiagonální a je zhruba dvojnásobného řádu než v případě prostoru Při konstrukci báze v prostoru &hk při obecném k lze postupovat obdobně. Za bázi lze vzít soustavu funkcí <řo, ■ ■ ■, ^A(n4-i)-i> z nichž každá vznikne tak, že je pro ni právě jeden z uzlových parametrů rovný jedné a ostatní jsou rovny nule. Je-li funkce tpj (j = 0.....k — l) rovna v intervalu (-1,0) a v intervalu (0,1) polynomu (2k — l)-ního stupně (v každém intervalu jinému) určenému podmínkami ^'(O) = = 1, pjr)(0) = 0 pro r = 0,..., k - 1, r =/4 j a <p)r>(±l) = 0 pro r = 0,..., k - 1 a všude jinde na reálné ose je rovna nule, jsou bázové funkce <&,- dány vzorci 00/ (4.103) (*) = <Pi (X hXt)> i = 0,1, i = 0, Vypustíme-li v soustavě bázových funkcí (4.103) funkce <řo, ■ ■ ■, ^t-i a funkce $„it,..., $(n+i)je-i, dostaneme prostor konečných prvků ^jy,, který je podprostorem těch funkcí ze Sobolevova prostoru Jťk, které splňují okrajové podmínky 234 (4.43) s m = Jfc. Tento prostor je tedy vhodný k přibližnému řešení diferenciální rovníce (4.45) s okrajovými podmínkami (4.43). Prostor konečných prvků f8\t lze také užít k řešení okrajových úloh pro diferenciální rovnice řádů nižších než 2k. Vhodnou volbou parametru k (tj. stupně aproximačních polynomů) lze dosáhnout, že rychlost konvergence je řádu 0(/V), kde p je libovolně vysoké číslo (samozřejmě za předpokladu dostatečné hladkosti řešení). Tento vzrůst v přesnosti je však zaplacen komplikovanější strukturou matice soustavy (šíře jejího pásu je větší) a větší počtem rovnic. 4.3.3 Některé praktické otázky spojené s metodou koneĚných prvků V předchozích odstavcích jsme popsali základní myšlenky užití metody konečných prvků k řešení okrajových úloh pro obyčejné diferenciální rovnice. Zde si všimneme některých aspektů praktické realizace popsaných algoritmů. Pro určitost budeme mít v tomto odstavci na mysli diferenciální rovnici (1.12) s okrajovými podmínkami (4.3), protože i na tomto jednoduchém příkladě budou patrné všechny jevy, které jsou důležité a podstatné v obecném případě. Při řešení dané okrajové úlohy metodou konečných prvků musíme vždy provést čtyři kroky: (i) zvolit prostor konečných prvků a jeho bázi, (ii) sestavit příslušnou matici tuhosti (Gramovú matici) a vektor zatížení, (iii) řešit vzniklou soustavu rovnic a (iv) vypočítat hodnoty přibližného řešení v bodech, v nichž nás zajímá. Začneme bodem (iv) jako nejsnazším. Už dříve jsme konstatovali, že báze v prostorech konečných prvků je žádoucí volit tak, aby aspoň některé neznámé, které dostaneme řešením soustavy z bodu (iii), byly už přímo hodnoty hledaného řešení. Pokud tento požadavek splníme — v případech prostorů konečných prvků, které jsme uvedli, tomu tak vždy bylo — krok (iv) vlastně odpadá. Poznamenejme, že v některých případech nás zajímají spíše hodnoty některých derivací hledaného řešení než hodnoty samotného řešení. V tomto případě může být užít! Hermíto-vých prvků výhodné, protože při něm část vypočítaných neznámých udává přímo hodnoty derivací řešení. Probereme nyní body (i) až (iii). Pokud se týká bodu (i), k problematice volby prostoru konečných prvků se dá říci obecně jen velmi málo. Udat nějaká matematicky podložená exaktní kritéria, která by udávala, jaký konkrétní prostor konečných prvků v daném případě zvolit, je obtížné. Zkušenost s řešením problémů podobného typu zde může být velmi užitečná. Zdůrazněme, že při volbě báze v už zvoleném prostoru konečných prvků je třeba postupovat tak, aby vzniklá matice tuhosti měla co možná nejmenší šíři pásu. Tento požadavek je pro ekonomii výpočtu natolik důležitý, že může ovlivnit zpětně i volbu samotného prostoru konečných prvků. Všimněme si dále bodu (ii), tj. problematiky sestavení matice tuhosti a vektoru zatížení. Pro určitost zvolme za příslušný prostor konečných prvků prostor ®£i z odst. 4.3.1 s bází tvořenou po částech lineárními funkcemi <řj,..., definovanými rovnicemi (4.83). Píšeme-li v případě modelové úlohy integrál udávající prvky 235 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY matice tuhosti A jako součet integrálů přes jednotlivé intervaly dělení, dostaneme (4.104) °ij = Í2a<?< kde (4.105) a£> = í T \p(x)9'i(x)^'j(x) + q(x)^i(x)^j(x)]dx, r=l,...,n. Matici A^ = \a\ý) nazveme elementární maticí tuhosti příslušnou k podintervalu (acr-ii xr). Pro vektor zatížení (tj. pro pravou stranu soustavy (4.53)) platí podobně (4.106) kde (4.107) g\r) = í ' *.-(*)/0Od ,(0 I, r — 1, -.,fi, přičemž vektor - (g^\ ..., g„li)T nazveme elementárním vektorem zatížení pro podinterval (xr-i,xr). Prvky matice tuhosti a složky vektoru zatížení můžeme tedy vypočítat jako součet příspěvků od jednotlivých podintervalu rozkladu. Tato okolnost, přestože je zcela elementární, má pro efektivní užití metody konečných prvků zásadní význam. Vzhledem k tomu, že bázové funkce se na jednotlivých prvcích rovnají jen několika málo velmi jednoduchým funkcím (ve všech příkladech prostorů konečných prvků, které jsme uvedli, jsou tyto funkce polynomy nízkých stupňů), je možné sestrojit matici A a vektor g tak, že se v podstatě vypočítá elementární matice A (r) a elementární vektor g(r' jen pro typický prvek a pak se užijí vzorce (4.104) a (4.106). V našem konkrétním případě je každá bázová funkce na podintervalu {xr-i,Xr) rovna buď přímce (x — xr)/h, nebo přímce (xr — x)/h, nebo je nulová. K sestavení elementární matice tuhosti je tedy třeba vypočítat integrály pouze tří typů: (4.108) £ [±TP(x) + „(x)(X^^-)2}dx = = h j |^p(arr_i + hs) + g(av-1 + h«)«2] ds, (4.109) jf" [ - ±M + »(»)' 'I''1 XrHX]Ax = = h j [ - -^p(xr-i + hs) + q(xT-1 + hs)s(l - *)j d« 236 CVIČENI (4.110) jí" [^PÍx) + g(x)(X^y]dx = - h j [jjP(xr - hs) + q(xr - hs)s2^ d s. Podobně k výpočtu elementárního zatížení je třeba počítat pouze integrál (4.111) / ' f(x)X~Xr~i dx = h í f(xr-i-rhs)sds Ar_, h Ja a integrál (4.112) / ' /(x)1—^- dx = h í f(xr-hs)sds. Jxr-i h Jo Pravé strany vzorců (4.108) až (4.112) ukazují, že výpočet prvků elementární matice tuhosti a elementárního vektoru zatížení, se vlastně provádí na referenčním prvku (0,1). Upozorněme také, že integrály uvedených typů nelze v obecném případě počítat analyticky. K jejich výpočtu je tedy třeba užít kvadraturu! vzorce. Přitom je třeba si uvědomit, že tento postup zavádí do výpočtu další chybu. Provedení kroku (iii) nepředstavuje při užití metody konečných prvků k řešení jednodimenzionálních problémů principiálně žádný příliš závažný problém. Vzniklé soustavy rovnic totiž mají pásové matice, jejichž šíře pásu nezávisí na počtu rovnic. Užijeme-li k řešení takových soustav Gaussovu eliminaci bez výběru hlavního prvku (a to je možné, neboť příslušné matice jsou pozitivně defínitní), je počet potřebných operací úměrný počtu rovnic. Z tohoto důvodu nelze očekávat, že by některá iterační metoda mohla být výhodnější než eliminační metoda. CVIČENÍ 1. Odvoďte rovnici (2.48) tak, že napíšete obecné řešení rovnice (1.12), jednu konstantu vyloučíte 7. podmínky (2.45) a druhou derivováním. 2. Dokažte lemma 2.3 (viz str. 136). 3. Dokažte implikaci (2.73). 4. Ukažte, že (2.79) je nutná a postačující podmínka řešitelnosti okrajové úlohy (2.77), (2.78). 5. Dokažte podrobně větu 2.3 (viz str. 139). 6. Ukažte, že okrajové úlohy (2.21), (1.5) a (2.96), (2.97) jsou ekvivalentní. 7. Dokažte ekvivalenci okrajových úloh (2.21), (1.6), (2.100) a (2.101), (2.102). 8. Proveďte podrobný důkaz věty 2.5 ze str. 145. 237 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 9. Dokažte lemma 3.8 (viz str. 168) 10. Odvoďte řády chyb kvadraturních vzorců (3.51), (3.52) a (3.53) užitých v Mar-čukově identitě a zformulujte potřebné hladkostní požadavky, 11. Proveďte podrobný důkaz poznámky 3.1 (viz str. 178). 12. Dokažte princip maxima pro operátor ř.^0' definovaný rovnicí (3.25). 13. Prověřte monotónnost matice soustavy (3.31). Návod: Užijte výsledku cvičení 12. 14. Dokažte konvergenci metody sítí (3,31). Návod: Postupujte obdobně jako při důkazu věty 3.7 na str. 179. 15. Buď íj = (rjo,..., r)n)T vektor, pro kteTý platí r]o = rjn = 0. Dokažte, že platí nerovnosti n—l n h2 Yl(Lhrl)*1í ž Po YsiV* - Vt-i)2 1 ™ Návod: Postupujte analogicky jako v důkazu lemmat 3.11 a 3.12 na str, 184 až 186. 16. Dokažte, že metoda sítí (3.131) má v případě řešení okrajové úlohy (1.12), (1.13) s tx\ — ct2 = 0 chybu řádu 0(n4). Návod: Ukažte, že operátor definovaný levou stranou rovnic (3.131) splňuje princip maxima. 17. Zformulujte metodu sítí pro řešení diferenciální rovnice (1.14) s okrajovými podmínkami y(a) = -fa, y"(a) = íi, y(b) = j2, y" = S2. 18. Dokažte konvergenci metody sítí z předešlého cvičení. 19. Ukažte, že operátor L definovaný na množině &i_ C %2 rovnicí (4.40) je symetrický a pozitivně definitní. 20. Dokažte symetrii a pozitivní definitnost operátoru L daného rovnicí (4.45) na množině SIL dostatečně hladkých funkcí, které splňují okrajové podmínky (4.43). Návod: Vyjádřete y(x) pomocí integrálu z m-té derivace. 238 POZNÁMKY K LITERATUŘE POZNÁMKY K LITERATUŘE ČI. 1. Základy teorie okrajových úloh pro obyčejné diferenciální rovnice lze nalézt např. v knize Reidově (1971) a v řadě dalších standardních příruček o obyčejných diferenciálních rovnicích (viz např. Coddington, Levinson (1955)). Literatura pojednávající o numerických aspektech této problematiky je skoro stejně rozsáhlá jako literatura o úlohách s počátečními podmínkami. Kromě příslušných kapitol v obecných příručkách o numerické matematice, viz např. Collatz (1951), Babuška, Práger, Vitásek (1964), Berezin, Zidkov (1966), Babuška, Práger, Vitásek (1966), Stoer, Bulirsch (1973), Vitásek (1987), existuje řada monografií věnovaných této problematice. V seznamu literatury se tato díla poznají většinou už podle názvu; proto uvedeme jmenovitě pouze sborník redigovaný Azizem (1975), protože obsahuje velmi obsáhlou bibliografii. ___ Cl. 2. O metodě střelby pojednává už např. (Foiti(1957) 33eJler/(1960). Metoda střelby na více cílů pochází od Odborná (1969) a spolu s ostatními variantami metody střelby ji podrobně popisuje Stoer a Bulirs£h^(1980). ŘsljCTÍsora^SJÚ£rnan^ova (1972) monografie je věnována výhradne metodě střelby. Metoda přesunu a normalizovaného přesunu okrajové podmínky v podobě, jak ji uvádíme, pochází od Taufera (1973). Tyto metody velice úzce souvisí s metodami invariantního vnoření," kterým je věnována poměrně rozsáhlá literatura; viz např. Meye^ (1973) a,jä£ajyt_ (1977). V ruské literatuře se podobné metody nazývají „metod progonki" (viz např. Babuška, Práger, Vitásek (1964)). Cl. 3. Metoda sítí patří k základním metodám pro numerické řešení okrajových úloh a aspoň její princip je vyložen ve většině příruček zabývajících se přibližným řešením diferenciálních rovnic. O monotónních maticích, jakož i o dalších důležitých třídách matic, které vznikají při metodě sítí, nalezne čtenář poučení např. v knize Vargově (1962) a Fiedlerově (1981). Myšlenka užití integrálních identit k sestavení diferenčních schémat pochází od Marčuka (1961) a byla dále rozpracována Babuš-kou, Prágerem a Vitáskem (1966) a Marčukem (1980). Jiné integrální identity než ty, které jsou zde uvedeny, užívá Varga (1962). Mnoho materiálu o metodě sítí lze nalézt v obsáhlé monografii Samařského (1971). Velmi přístupný výklad o řešení nelineárních úloh metodou sítí podává Isaacson a Keller (1966). Cl. 4. Teoretický základ, na němž spočívají variační metody řešení okrajových úloh, je podrobně a hlavně také s ohledem na čtenáře nespecialistu vyložen v knize Rektorysově (1974). Nezbytná funkcionálně-analytická teorie okrajových úloh pro obyčejné i parciální diferenciální rovnice je vyložena také v knize Strangově a Fixově (1973) , kterou lze čtenáři, který chce hlouběji proniknout do teorie metody konečných prvků, co nejvřeleji doporučit. Rovněž tak Michlinovy knihy (1957 a 1966) mohou být pro čtenáře, který se zajímá o problematiku tohoto článku, velmi užitečné. Metoda konečných prvků prodělala v posledním dvacetiletí bouřlivý rozvoj a v současné době je jí věnována už značně rozsáhlá literatura. Protože však její hlavní uplatněn! je zejména při řešení parciálních diferenciálních rovnic, uvedeme hlavní prameny pro její studium v následující kapitole a zde se zmíníme jen o ně- 239 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY kterých příručkách, které obsahují elementární úvod do této problematiky. Takový přístupný výklad se nalezne kromě v už zmíněné knize Strangově a Fixově (1973), např. také v knize Stoerově a Bulirschově (1980), Beckerově, Careyově a Odenově (1981), která uvádí čtenáře také do problémů spojených s implementací metody konečných prvků na počítači a v knize Axelssonově a Barkerově (1984). LITERATURA AXELSSON, O. BARKER, V.A.: Finite Element Solution of Boundary Value Problems, Theory and Computation. New York-San Francisco-London, Academic Press 1984. AZIZ, A.K., ed.: Numerical Solution fo Boundary Value Problems for Ordinary Differential Equations. New York-San Francisco-London, Academic Press 1975. BABUSKA, I. - PRÄGER, M. - VITÄSEK, E.: Numerické řešení diferenciálních rovnic. Praha, SNTL 1964. BABUSKA, I. - PRÄGER, M. - VITÄSEK, E.: Numerical Processes in Differential Equations. London-New York-Sydney, Interscience Publishers 1966 (Překlad do ruštiny: Moskva, Mir 1969 ). BAILEY, P.B. - SHAMPINE, L.F. - WALTMAN, P.E.: Nonlinear Two Point Boundary Value Problem. New York, Academic Press 1968. BECKER, E.D. - CAREY, G.F. ODEN, I.T.: Finite Elements. An Introduction, Vol. I. Englewood Cliffs, N.J., Prentice-Hall 1981. BEREZIN, I.S. - ŽIDKOV, N.P.: Metody vyčislenij. 3. vyd. Moskva, Nauka 1966, 2 sv. CODDINGTON, E.A. - LEVINSON, N.: Theory of Ordinary Differential Equations. New York, McGraw-Hill 1955. (Překlad do ruštiny: Moskva, IL 1958.) COLLATZ, L.: Numerische Behandlung von Differentialgleichungen. Berlin-Göttingen-Heidelberg, Springer-Verlag 1951. (Překlad do ruštiny: Moskva, IL 1953.) FIEDLER, M.: Speciální matice a jejich použití v numerické matematice. Praha, SNTL 1981. -——FOX, L.: The Numerical Solution of Two Point Boundary Value Problems. Oxford, Clarendon Press 1957. v-l\ ISAACSON, E. - KELLER, H.B.: Analysis of Numerical Methods. New York-London-Sydney, J. Wiley and Sons 1966. "^KELLER, H.B.: Numerical Methods for Two Point Boundary Value Problems. Waltham, Mass., Blaisdell 1968. MARCUK, G.I.: Metody rasčota jaderných reaktorov. Moskva, Gosatomizdat 1961. MARCUK, G.I.: Metody vycislitel'noj matematiky. 2 vyd. Moskva, Nauka 1980. (Překlad do češtiny: Praha, Academia 1987.) LITERATURA \ —MEYER, G.H.: Initial Value Methods for Boundary Value Problems: Theory and Application of Invariant Imbedding. New York, Academic Press 1973. MICHLIN, S.G.: Variacionnyje metody v matematičeskoj fizike. Moskva, Gostechiz-dat 1957. MICHLIN, S.G.: Cislennaja realizacija variacionnych metodov. Moskva, Nauka 1966. ."-"--OSBORNE, M.R.: On Shooting Methods for Boundary Value Problems. J. Math. Anal. Appl., 27, 1969, s. 417 - 433. REID, W.T.: Ordinary Differential Equations. New York-London-Sydney-Toronto, Interscience Publishers 1971. REKTORYS, K.: Variační metody v inženýrských problémech a v problémech matematické fyziky. Praha, SNTL 1974. ROBERTS, S.M. - SHIPMAN, I.S.: Two Point Boundary Value Problems: Shooting Methods. New York, American Elsevier 1972. 1 íťt6t>& é-^A.~'-^x,. ^ SAMARSKIJ, A.A.: Vvedenije v teoriju raznostnych schem. Moskva, Nauka 1971. " ' SCOTT, M.R.: Invariant Imbedding and its Applications for Ordinary Differential Equations: An Introduction. Reeding, Mass., Addision-Wesley 1977. ^STOER, J. - BULIRSCH, R.: Introduction to Numerical Analysis. New York-Heidelberg-Berlin, Springer-Verlag 1980. / - * STRANG, G. - FIX, G.J.: An Analysis of the Finite Element Method. Englewood Cliffs, N.J., Prentice-Hall 1973. (Překlad do ruštiny: Moskva, Mir 1977.) TAUFER, J.: Lösung der Randwertprobleme von linearen Differentialgleichungen. Praha, Rozpravy ČSAV, Rada mat. přír. věd, 83, Academia 1973. (Překlad do ruštiny: Moskva, Nauka 1981.) -VITÄSEK, E.: Numerické metody. Praha, SNTL 1987, VARGA, R.S.: Matrix Iterative Analysis. Englewood Cliffs, N.J., Prentice-Hall 1962. WILKINSON, J.H.: The Algebraic Eigenvalue Problem. Oxford, Clarendon Press 1965. 240 241 Kapitola III. Parciální diferenciální rovnice eliptického typu 1 Úvod Základní úloha pro parciální diferenciální rovnici eliptického typu je okrajová úloha, tj. úloha při níž je třeba nalézt funkci, která splňuje uvnitř dané oblasti danou diferenciální rovnici a na celé hranici této oblasti ještě další doplňující podmínky, zvané okrajové podmínky. Typickým příkladem okrajové úlohy pro eliptickou lineární parciální diferenciální rovnici druhého řádu je úloha nalézt funkci u (m reálných proměnných x = (xi,.. .,xm)), která v dané omezené oblasti Í2 C Em (Em je m-dimenzionální euklidovský prostor) splňuje diferenciální rovnicí (1.1) a pro niž na hranici T této oblasti platí (1.2) . . du .. . , . Zde a,ij = dji, q a / jsou funkce zadané v oblasti fž, funkce a, /? a 7 na její hranici a symbol du/9nc značí derivaci ve směru tzv. konormály a je definován rovnicí (1.3) du kde cos(i>, Xj) je kosinus úhlu, který svírá vnější normála k hranici v příslušném bodě s osou Xj. Eliptičnost diferenciální rovnice (1.1) je charakterizována zpravidla nerovností (1.4) i,j = l i=l kde jpo je předem daná kladná konstanta a £ — (íi,... íím)*" je libovolný m-dimenzionální vektor. Platnost nerovnosti (14) se přitom požaduje pro každý bod x e fí. 242 1 ÚVOD O koeficientech aa^v okrajové podmínce se většinou předpokládá, že splňují nerovnosti (1.5) a(x) ž 0, /?(x) ž 0, . a(x) + /?(x) > 0. V případě, že je <x(x) = 0 pro x £ V, hovoříme o Dirichletově okrajové podmínce v bodě x £ T, v případě, že je /?(x) = 0, o Neumannově podmínce; obecná podmínka (1.2) se nazývá Newtonova okrajová podmínka. V první a druhé kapitole jsme viděli, že už pro obyčejné diferenciální rovnice je okrajová úloha podstatně komplikovanější než úloha s počátečními podmínkami, a to nejen po stránce teoretické, ale i po stránce prakticky početní. Je tomu tak zejména proto, že zatímco řešení úloh s počátečními podmínkami vede většinou na algoritmy rekurentního charakteru, řešení okrajových úloh vede na soustavy rovnic, které je nutno (někdy i velmi pracně) řešit. Je přirozené, že u parciálních diferenciálních rovnic s růstem počtu dimenzí tyto obtíže porostou. Dimenze prostoru, v němž je definována hledaná funkce, přináší však ještě další problém. Zatímco u jednodimenzionálních úloh jsme měli co dělat zejména s dvoubodovými okrajovými úlohami, a tedy s případy, kdy definiční obor hledané funkce byl jednorozměrný interval, u parciálních diferenciálních rovnic pracujeme v prostoru, jehož dimenze je větší než jedna, čímž je dána nesrovnatelně větší pestrost v možných definičních oblastech a okrajových podmínkách. Tím spíše jsme tedy nucení omezit se v této kapitole při popisu uváděných metod na vyšetřování jednotlivých konkrétních příkladů. Odlišný bude v této kapitole přístup k teoretickým otázkám spojeným s řešenými problémy. V předchozích dvou kapitolách jsme nemuseli o řešitelnosti úloh, jimiž jsme se zabývali, nic předpokládat předem, neboť způsob, kterým jsme vyšetřovali zavedené přibližné metody, nám umožnil zároveň také odpovědět i na tyto existenční otázky. Zde by tento postup byl sice také možný, byl by však tak náročný a zdlouhavý, že by přesahoval rámec i rozsahové možnosti této elementární příručky. Pokud tedy půjde o otázku existence řešení studovaných úloh, odvoláme se na obecnou teorii eliptických rovnic, která je rozpracována do značných podrobností, a to jak moderními funkcionálně analytickými metodami (viz např. Nečas (1967), Lions-Magenes (1968)), tak i klasickými metodami (viz např. Bers, John, Schechter (1964), Miranda (1955)). Pojem eliptičnosti parciální diferenciální rovnice není ovšem vázán na jednu rovnici daného řádu (ani rovnice (1,1) není nejobecnější lineární eliptická parciální diferenciální rovnice druhého řádu; jde pouze o tzv. samoadjungovanou rovnici) a dá se zavést i pro rovnice vyšších řádů nebo pro soustavy rovnic. Typickým příkladem eliptické diferenciální rovnice čtvrtého řáduje biharmonická rovnice (1.6) pro niž mohou okrajové podmínky nabývat velice různých forem. Vždy však bude 243 > III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU k jednoznačnému řešení zapotřebí dvou okrajových podmínek; za příklad mohou sloužit okrajové podmínky u = <ři(x) a du/dn = Qí{x) pro x£í, které jsou v jistém smyslu obdobou Dirichletových okrajových podmínek pro rovnici druhého rádu. Jako příklad eliptické soustavy diferenciálních rovnic druhého řádu mohou sloužit v dvoudimenzionálním případě rovnice d fduľ du2\ 92«i dV d /duí du2\ d2u2 d2u2 _ r , . které se vyskytují v matematické teorii pružnosti. Z metod pro přibližné řešení eliptických parciálních diferenciálních rovnic si zde všimneme dvou základních skupin. Především to budou metody založené na aproximaci derivací diferenčními podíly. Nahradíme-li všechny derivace, které se v rovnici vyskytují, těmito podíly, dostaneme metodu sítí, ponecháme-li derivace podle jedné z proměnných a pouze derivace podle zbývajících proměnných nahradíme diferenčními podíly, dostaneme metodu, jejíž běžný název je metoda přímek. V této metodě se tedy řešení dané okrajové úlohy aproximuje okrajovou úlohou pro soustavu obyčejných diferenciálních rovnic. Metodou přímek se nebudeme v dalším detailně zabývat, pokládáme však za užitečné, aby se čtenář seznámil aspoň s její základní myšlenkou. Další skupina metod, jichž si také stručně všimneme, je tvořena variačními metodami založenými na stejném principu jako metody v čl. 4 z kap. II. Zde je důležitý zejména speciální případ, totiž metoda konečných prvků. Je užitečné upozornit, že metody všech zmíněných skupin spolu úzce souvisí. Tak např. metoda přímek přechází ve variantu metody sítí, řešíme-li aproximující soustavu obyčejných diferenciálních rovnic znovu metodou sítí. Podobně metoda konečných prvků při určité volbě bázových funkcí přechází v metodu sítí. Pokud jde o konkrétní realizaci zmíněných metod na počítači, má zde podstatný význam rychlost a kapacita paměti stroje. Současný stav je takový, že řada trojdi-menzionálních úloh přesahuje praktické možnosti. Proto se v této kapitole, v níž si postupně všimneme zmíněných metod, omezíme na dvoudimenzionální a lineární problémy. Přitom budeme také věnovat pozornost problematice řešení náhradního problému, který aproximuje původní problém. Pokud jde o nelineární úlohy, nebudeme se jimi zabývat, neboť tyto problémy přinášejí často už i teoretické těžkosti při důkazu existence a jednoznačnosti řešení a je nutno většinou vyšetřovat každý případ jednotlivě. Jejich byť jen částečné pojednání by tedy neúnosně zvětšilo rozsah příručky. 2 METODA SlTl 2 Metoda sítí Metoda sítí je velmi oblíbená metoda pro numerické řešení nejen parciálních diferenciálních rovnic eliptického typu, ale parciálních diferenciálních rovnic vůbec. Popularita metody konečných prvků, která v současnosti stále roste, její význam v poslední době sice poněkud zmenšila, přesto však řada důležitých fyzikálních a technických problémů, které vedou na parciální diferenciální rovnice, se dodnes pomocí ní řeší. Oblíbenost metody sítí má zřejmě své kořeny v tom, že její základní myšlenka je velice prostá. Spočívá v tom, jak už bylo ostatně řečeno v čl. 3 z kap. II. a v úvodu k této kapitole, že v oblasti, ve které hledáme řešení, zvolíme nějakou konečnou množinu bodů, kterou nazveme sítí a příslušné body jejími uzly, a nahradíme derivace, které se vyskytují v dané diferenciální rovnici a v jejích okrajových podmínkách, diferenčními podíly (tj. lineárními kombinacemi funkčních hodnot), které je aproximují. Tím dostaneme místo původního problému soustavu konečně mnoha rovnic pro hodnoty hledané funkce v uzlech. Zde se hned setkáváme s podstatnou odchylkou od jednodimenzionálního případu. Zatímco v jedné dimenzi bylo možno volit uzly v podstatě pouze dvěma způsoby, a to ekvidistantní a ne-ekvidistantní, ve dvou- a vícedimenzionálním případě i při zachování pravidelnosti v rozmístění uzlů je zřejmě možná podstatně větší rozmanitost. Tak např. v rovině lze vzít za uzly sítě vrcholy čtverců, rovnostranných trojúhelníků, pravidelných šestiúhelníků apod. Z uvedeného výkladu je vidět, že metoda sítí je v principu použitelná pro libovolný typ diferenciální rovnice, ať už lineární nebo nelineární. V dalším textu se však z důvodů, o nichž jsme se zmínili v úvodu, omezíme na některé příklady lineárních dvoudimenzionálních problémů. 2.1 Lineární rovnice druhého řádu 2.2.1 Sestavení diferenčních rovnic V tomto odstavci popíšeme různé možnosti odvození diferenčních rovnic pro lineární rovnice druhého řádu ve dvou prostorových proměnných. Většinou se přitom omezíme na speciální případ lineární samoadjungované rovnice, totiž na rovnici í2-1) Lu = ~í(p(x'y)ii:) ~ ^(rt*>¥)Sj) += /(*.») v omezené oblasti fí, jejíž hranice ľ je tvořena konečným počtem po částech hladkých oblouků. O funkcích p, q a / budeme přitom předpokládat, že jsou dostatečně hladké v nějaké oblasti Q takové, že pro ni platí Q C ň (pruhem značíme uzávěr příslušné množiny), a navíc, že koeficient p je v této oblasti kladný a koeficient q nezáporný. O jaký konkrétní stupeň hladkosti jde, bude v jednotlivých situacích buď specifikováno, nebo to bude patrné ze souvislosti. 244 245 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU Podrobně probereme zejména případ pravidelné čtvercové sítě JfW. Tato síť vznikne tak, že se sestrojí soustava rovnoběžek a; — xk — Xa + kh, y = y, = J/o + + sh, k,s = 0, ±1,±2,kde (xo,yo) je libovolný pevně zvolený bod v rovine [x,y) a h > 0 je parametr zvaný integrační krok nebo oko síti, a za uzly sítě se vezmou všechny průsečíky těchto rovnoběžek, tj. body o souřadnicích (xk,ys) = = (xc + kh,y0 + sh). Při zavádění metody sítí v jednodimenzionálním případě jsme postupovali tak, že v uzlech, které ležely uvnitř daného intervalu, jsme příslušné lineární rovnice získali z dané diferenciální rovnice a v krajních bodech jsme využili okrajové podmínky. Totéž je třeba provést i ve dvou dimenzích. Abychom mohli příslušný postup snadno popsat, zavedeme nejprve několik pojmů a označení. Uzly sítě budeme značit buď jejich souřadnicemi, tj. (xk,ys), nebo také, zejména tam, kde na konkrétních hodnotách souřadnic nezáleží, pouhými velkými písmeny. Dva uzly sítě nazveme sousedními, je-li jejich vzdálenost ve směru osy x nebo ve směru osy y rovna oku sítě h. Každý pevně zvolený uzel sítě má tedy právě čtyři sousední uzly. Uzel (xt, y3) nazveme vnitřním uzlem sítě vzhledem k množině íi, leží-li všechny čtyři k němu sousední uzly v množině Q. Množinu všech vnitřních uzlů (vzhledem k množině Q) označíme fiCO. Uzel (xlíSt) € £J\fiW takový, že aspoň jeden jeho soused je vnitřním uzlem, nazveme hraničním uzlem. Množinu všech hraničních uzlů označíme ľ(h\ Kromě toho budeme pro množinu £)(*) U rW užívat označení ílW. Dále budeme předpokládat, že integrační krok h je zvolen tak malý, že ke každým dvěma vnitřním uzlům P a Q existuje konečná posloupnost vnitrních uzlů Po, Pl, - ■ ■, Pr taková, že Pq = P, Pr = Q a libovolné dva uzly P,_i a P,- jsou sousední. To je vzhledem k souvislosti množiny fi možné. O této souvislosti budeme mluvit jako o souvislosti množiny fiC1). Nyní už můžeme snadno sestavit diferenční rovnice, které aproximují diferenciální rovnici (2.1). Proveďme v rovnici (2.1) naznačené derivování a nahraďme derivace d2u/dx2, d2u/dy2, du/dx a du/dy podíly [u(xk — h,ys) — 2u(xt,ys) + + v(xk + h,y„)]/h2, [u{xk,ys - h) - 2u(xk,ys) + u(xk,yt + h)]/h2, [u(xk+h,ys) -— u(xk — h,y,)]/(2h), [u(xk,y, + h) — u(xk,y, — h)]/(2h), které aproximují příslušné derivace s přesností 0(fcs). Dostaneme tak operátor LJ^, který funkci u definované na množině fi^1' (tedy vlastně vektoru, který má tolik složek, kolik prvků má množina ň^) přiřazuje funkci L^u definovanou na množině fiW a který je dán předpisem (2.2) fc^i^ti)*, = [4p(xk, y.) + h2q(xk, y,)]ukt- - [p(äSr, y.) + í/«)]u*+i,<- &p - \p{*i,,y.) - ?hfa(x>"!*»)]«*-!,*- - b>{xk, y,) + \h—(xk,y,))uki$+í- - bim,!/.) - 3*3£v**> »*)]°m-ii (■«■■ y>)e qW 246 2 METODA SlTl Všimněme si, že operátor definovaný touto rovnicí svazuje funkce u v uzlu (xk,ys) a ve všech jeho sousedech. Zavedení pojmu sousedního uzlu bylo touto skutečností motivováno. Z Taylorova vzorce ihned plyne následující věta popisující aproximační vlastnosti operátoru . Věta 2.1. Nechť funkce p má v Ú spojité první parciální derivace podle obou proměnných a nechť funkce q je v Q spojitá. Nechť dále funkce u má v ČI spojité parciální derivace podle x a y až do Čtvrtého řádu včetně. Pak platí (2.3) (LÍ%^)k, ={Lu){xk,ys) + 0(h\ (*»,»,) e Í.M kde «(pr) je funkce definovaná na množině ú^h~> předpisem ukp^ = u(xk, y,) a operátor L je definovaný v rovnici (2.1). Položíme-li p(x, y)(du/dx) — z(x. y), aproximujeme-h derivaci d(p(x,y)du/8x)/ /dx = dz(x,y)/dx v uzlu (xk,y,) podílem [z(xk + h/2,y,) - z(xk - h/2,y,)]/h a hodnotu funkce z, tj. hodnotu funkce p(du/dx) v bodě (xk -řh/2,ys), resp. (xk — - h/2,y,) podílemp(xk + h/2)[u(xk + h, yt) - u(xk,y,)]/h, resp. podílem p(xk -—h/2,ys)[u(xk,ys)—u(xk—h, ys)]/h a provedeme-li analogické operace i pro derivaci padle proměnné y, dostaneme operátor LJ^ definovaný rovnicí (2.4) h2(L{2)u)k,~ [p(xk + h/2,y,)-rp(xk-h/2,y,)+ + P(xk,ys +h/2} + p(xk,y, -h/2)-rh2q(xk,yí)]u*,--p(xk + h/2,ys)uk+ltB -p(xk - A/2, j/„ )«*_!,,--p{xk,ys + h/2)ukiS+í -p(xk,ys - ft/2)ul>,_i. Aproximační vlastnosti operátoru ' jsou podobné jako aproximační vlastnosti operátoru LJ^ a jsou popsány v následující větě. Věta 2.2. Nechť koeficient p má v Ci spojité parciální derivace až do třetího řádu včetně a nechť koeficient q je v Q spojitý. Pak pro každou funkci u, která má v Ô spojité' parciální derivace až do čtvrtého řádu, platí (2.5) (Lla)uW)k. = (£«)(**,*) + 0(h2), (■», y.) e |J(»), kde uípr' je funkce definovaná na množině fž'*' předpisem u^F^ — u(xk, ys) a L je operátor z rovnice (2.1). Důkaz je podobný důkazu věty 3.3 z kap. II a plyne ihned z Taylorova vzorce. í 21 Operátor svazuje opět hodnoty funkce u v uzlu (xk,ys) a v jeho čtyřech sousedech a splňuje stejně jako operátor princip maxima. Užití operátoru L^ však vede ve spojení s vhodným předpisem okrajových podmínek (o těchto otázkách budeme hovořit v dalším odstavci) k soustavě lineárních algebraických rovnic 247 III. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU se symetrickou maticí. Vzhledem k tomu, že původní diferenciální rovnice je sa-moadjungovaná, je třeba dát operátoru Lf^ přednost před operátorem L^, který vede k soustavě, jejíž matice je pouze „skoro" symetrická (srv. také odst. 3.2.1 v kap. II). Proto také přesně zformulujeme a dokážeme zmíněný princip maxima pouze pro operátor ijj2'. Dříve se však ještě dohodněme, že o integračním kroku, jehož velikost jsme už omezili požadavkem souvislosti množiny Q(h\ budeme navíc předpokládat, že je tak malý, že v případě, že funkce q není v íí identicky rovna nule, existuje uzel (a^, ys) 6 íž<fc) takový, že v něm platí q(xjí, ys) > 0. To je vzhledem k spojitosti funkce q jistě možné. Lemma 2.1. Nechť funkce p a q jsou spojité v Ú a nechť je p kladná a q nezáporná. Nechť dále u je libovolná funkce definovaná na množině Ú^h\ pro niž platí (2-6) UÍ'Mf š 0 pro každý uzel (xk, ys) 6 fiW Nechť konečně je (2.7) M = max_ iik, a buď M > 0. Pak piati (2.8) M — max uks (*i,í.)er<»> a existuje-li uzel (xt^^h,,) e fi^ takový, že je uÍBl,a = M, je q(x) 0 v Í2 a Uk, = M pro každý uzel (xk,ys) € ÉJW. Důkaz. Při důkazu tohoto tvrzení budeme postupovat stejně jako při důkazu lemmatu 3.9 z kap. II. Předpokládejme tedy, že existuje uzel (xk0,y!o) £ íi^1' takový, že platí uí0ij,, = M. Pak je (2.9) 0 g \p(xk, + A/2, y.0) + p{xia - A/2, y„)+ + P(xka,ys„ + h/2) + p(xk„,ySB - h/2) + h2q(xka,y,0)]M--p{xk0 + h/2,ySo)nk0+íiS„ -p(xkí, - h/2,ySa)uk0-\,So- - p(xk0,ys0 + h/2)ukOi,0+i - p(xko,y80 - h/2)uka,So-i g ^h2q(xk„,y,0)MZG- Protože M je kladné a q(xk0, yao) nezáporné, plyne z nerovnosti (2.9) především, že je q(xk0,y,0) = 0. Kdyby aspoň jedno z čísel «*„_!,,„, wfc„+i,*,„ ti*„,Jo-i, "fc0,s„+i bylo menší než M, platilo by (2.10) 0g [p(^0 + A/2,^J+p(z6o + A/2,^+ + p(xk0,y,0 - A/2) + p(xk„,y,0 + h/2)]M- - p(xk0 - A/2, yBo)uka-ilSo - p{xko + A/2, j/,0)«t0+i,so--p(,xio,ySo - A/2)ui|llJ0_i -p(xka,ysi, + A/2)uS:o,J,n+1 > 0. 248 2 METODA SlTl což není možné. Platí tedy u*0-i,Jo = «t0+i,So = «*n,j„-i ~ «k0,sa+i = M a celou úvahu je možno zopakovat pro uzly Xka-i]So, xk„+i,sa, at„,jn-i a Xk0i,0+i. Protože množina £1^ je souvislá, dostaneme tak postupně, že platí (2.11) q(x*,V.) = 0 pro (a*, j/s) e fiW a (2.12) u*5=M pro (iit,ir,)'eň« Není-li funkce 4 identicky rovna nule, není rovnice (2.11) splněna pro uzel [xk, tfe). Tento spor dokazuje, že v případě, že funkce q není rovna nule identicky, platí uks < < M pro (xk, ys) S fiC1). V tomto případě je tedy lemma dokázáno. V případě, že je q(x) = 0 v Q, však plyne tvrzení lemmatu ihned z (2.12). Při zavedení operátorů LJp a LJ^ jsme postupovali tak, že jsme derivace, které se vyskytují v aproximovaném operátoru nahradili diferenčními podíly. Odtud také pocházejí názvy diferenční meiody a diferenční rovnice, které často v souvislosti s metodou sítí užíváme. Vyskytuje-li se v dané diferenciální rovnici kromě derivací d2u/dx2 a d2u/8y2 i smíšená derivace d2u/(dxdy), lze ji aproximovat pomocí rovnice d2,u 1 (2.13) ^^(;B*'ľJ) ~ 2h2^Xk + h'y' + h) ~ u^Xk ~ h'y' + ^+ + u(xk - h,y, - h) - u(xk + h,ys- A)] + 0(A2). Tuto rovnici dostaneme tak, že položíme z = du/dy, derivaci dz/dx v bodě (xk, ys] aproximujeme podílem [z(xk + h, y,) — z(xk — h, ys)]/(2h) a hodnoty funkce z v bodě (xk+h, ys) a (xk — A, y,), tj. hodnoty derivace du/dy v těchto bodech, podíly [íifzfc-t-+ h,y,+h) — u(xk + h,y, — A)]/(2A) a [u(xh - A,y, + A) - u(xt-h,ys - A)]/(2A). V tomto případě pak vzniklý operátor svazuje hodnoty přibližného řešení nejen v uzlu (xjt.j/.,) a v uzlech (xk+i,ys), (zjt-i, ?/«), (z*, 2/s+i) a (a:*, J/s-i), ale navíc ještě v uzlech (xj,+i,2/>+i), (i*_i, j/j+i), (^it+i, !/í-i) a 2/a_i). Všechny tyto uzly je tedy třeba pokládat za sousedy uzlu (xk, ys). Samozřejmě, že se pak změní množina vnitřních uzlů íl^ i množina hraničních uzlů , neboť obě tyto množiny jsou definovány pomocí pojmu sousedního uzlu. Operátory íjp a lze také sestrojit následujícím postupem, zvaným metoda neurčitých koeficientů. Tento postup je obecnější a je použitelný v podstatě pro libovolnou síť, ať pravidelnou či nepravidelnou. Při tomto postupu stanovíme ke každému uzlu P skupinu uzlů <3,, i = 1,..., rp, které nazveme sousedními k uzlu P. Dále hledáme operátor Lh jako výraz tvaru rp (2.14) (ifc«)i. = ^.r(P,0i)«(<3í)1 (Qo = P), i=i přičemž koeficienty c{JP, Qi) určíme tak, aby Taylorův rozvoj výrazu na pravé straně rovnice (2.14) vzhledem k bodu P souhlasil až na členy vyššího řádu s hodnotou 249 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU daného diferenciálního operátoru v bodě P. Je-li např. diferenciální operátor, který chceme aproximovat, dán rovnicí ,01S, , a2u d2u d2u (2.15) Lu = _au___2ai2— -a21} mají-li uzly Q, souřadnice (xi,jrí) a předpokládáme-li, že uzel P má souřadnice (0, 0) (což zřejmě není na újmu na obecnosti), platí (2.16) u(Q;) _ u(xi,yi) = u(P) + xi^{P) + yi^{P)+ . du . du '' dx2 dxdy takže po dosazení do rovnice (2.14) máme aý (2.17) (tfcU)(P) = (J :(-)U(P) + ^£(P) + ^|(P)-VP^(Pj 2a{P>~rPV kde (2.18) t=0 i=0 4P)=EV"*P> <W. «n > = -l E<w> i=0 í=0 r, r, IE"wC.<w. - -i Ey>(p<Qô- a12 K tomu, aby operátor Lj, daný rovnicí (2.14) aproximoval operátor L ze vzorce (2.15) stačí, aby platily rovnice (2.19) c^-c(P), 6<P) = B1(P), b[P) = b2(P), a[V = an(P), 4P) = a12(P), a(2P) = aM(P). Soustava (2.18) je soustava šesti rovnic pro neznámé c(P, Qi). K jejich splnění je tedy obecně třeba šesti hodnot ít(P, Qí). To tedy znamená, že k aproximaci operátoru L ze vzorce (2.15) je třeba, aby každý uzel měl nejméně pět sousedů. V případě konstrukce operátorů a l|3' jsme vystačili pouze se čtyřmi sousedy. Bylo to proto, že diferenciální rovnice (2.1) neobsahuje smíšenou derivaci d2u/(dxdy). ftád aproximace operátoru Lh sestrojeného právě popsaným postupem je třeba vypočítat pro konkrétní volbu sousedů uzlu P. Obecně se dá říci, že nebude horší než O(h), označíme-li zde písmenem h nejdelší z úseček PQ,. K jeho zlepšení je třeba vzít více bodů Qi nebo je umístit symetricky. Tím totiž můžeme dosáhnout 250 2 METODA SÍTl toho, že několik dalších (nevypsaných) členů v rozvoji (2.17) vymizí. Jako příklad uveďme aproximaci Laplaceova operátoru (2.20) Atl- — — dx2 dy2 operátorem definovaným rovnicí (2.21) (Ah)kS — [4(tH;+iiS + ufc-i,, + 4- u*,,_i) 4- (ují+i,s+i 4- «jr+i,s-i 4- tn_i|S+i 4- ut-i.j-i) 20utJ. Pro tento operátor totiž platí (za předpokladu dostatečné hladkosti funkce u) (2.22) (áhub%, - (Au)(xt,y.) + ±h2(AAu)(xhlys)-r +úb* [(Aa«)(**,ft)+2£^(^.^)]+°(h6)- Rád aproximace je zde 0(he), za sousedy uzlu (xk,ys) je však třeba vzít osm uzlů (zt+lil**), (**-!>!/•)> (xk,y,+i)> (xk,y,-i), (xt+i,sf,+1), (xí-i,J/»+i), (íc*-i,!/.-i) a (xk+i,ys-i), tj. všechny uzly, které mají od uzlu (xt,ys) vzdálenost menší nebo rovnu číslu 2^2A. Při řešení okrajových úloh pro obyčejné diferenciální rovnice metodou sítí jsme pro sestavování diferenčních rovnic doporučovali také postup opírající se o integrální identity platící pro řešení dané diferenciální rovnice. I zde je analogický postup možný, příslušné identity jsou však formálně podstatně komplikovanější. Jako příklad uveďme takovou identitu pro diferenciální rovnici (2.1). Věta 2.3. Nechť funkce u splňuje v oblasti f! diferenciální rovnici (2.1) a nechť pro uzavřený čtverec Rks o vrcholech (xj,+i, !/,+l)> (zi-i, y»+i), (*t-i,ífc-l)i (xk+i, y>-i) platí Rks C Cl. Pak platí ,„„ ľ'+1 (Q(x*-i,v)u(xk~i,v) Q(zk+i,vM Js.-i Jit.! WS) ří^i - Q(«t, y)u(xtly) [ _\ 4- p,, \ dJ } dlH-j-P(jE,y,-i)u(x,yt-i) P(a,ď.+i)u(g,i/«+i) /•»■ i d« r+'-r^dy / -P(x,y,M«.y,)[r \ d + r„ \ d ]}dx+ 251 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU + Jj[f(z,y)-q(x,y)u(x,y)]P(x,y)Q(z,y)dxdy = + / ry-+i i J7 / —^—«(*,y)dy- 1 /*' 3P(s,y) , v , 1 - r»» i — / —5-u{x,y)Ax dy, kde funkce P a Q jsou definovány vzorci (2.24) P(x,y) Q(x,y) = i J*S-1 f* xk _ x g o:j;+1, !/„_] g i/ g Xk-i í ií ii, í/,-i g s/ g j/s+i, ar*_l g s g xk+u y, g y g li-i g a; g xj,+1, y,_L S y g y,. Důkaz Vynásobíme-li rovnici (2.1) funkcí u definovanou vzorcem (2.25) „(z, j,) = Pi*, »)<?(*, y) a integrujeme přes čtverec Ä*,, dostaneme identitu = fjtf(x> V) - l(x< V)u(x< y)]v(x,y) dxdy. 252 2 METODA SlTl Abychom dostali identitu (2.23), stačí v rovnici (2.26) dvakrát integrovat per partes a uvědomit si, že funkce definovaná vzorcem (2.25) je rovna nule na hranici čtverce Pjtj a že její derivace mají skoky na úsečkách x = xk, ys-i g y g yj+i a y — ya, xic-i g a; g It+i- Výpočty jsou sice zdlouhavé, ale natolik triviální, že je není třeba podrobně provádět. 2.1.2 Přepis okrajových podmínek a konvergence vzniklých metod V předešlém odstavci jsme ukázali několik možností, jak sestrojit konečnědimen-zionální operátory, které aproximují lineární diferenciální operátory druhého řádu. Z úvah tam provedených se ukázalo rozumné hledat přibližné řešení modelové diferenciální rovnice (2.1) ze soustavy rovnic (2.27) kde operátor je definován rovnicí (2.4). Těchto rovnic je tolik, kolik je vnitřních uzlů, zatímco počet neznámých je roven počtu vnitřních a hraničních uzlů dohromady. K soustavě (2.27) je tedy třeba přidat ještě tolik rovnic, kolik prvků má množina hraničních uzlů , a tyto rovnice je nutno získat z okrajových podmínek. Symbolicky je budeme zapisovat ve tvaru (2.28) (M*. = (AkT)*- (**,y.)er<*>. Zde /fc je operátor, který funkci definované na množině přiřazuje funkcí definovanou na množině T(h\ 7 je pravá strana okrajové podmínky 1.2 a Aj, je operátor, který funkci definované na T přiřazuje funkci definovanou na . Některé způsoby, jak konkrétně sestrojit tyto operátory /j, a A^ ukážeme v tomto odstavci. Začneme Dirichletovou okrajovou podmínkou, tj. podmínkou tvaru (2.29) »(*,!/) = y(z,y), (x,y)eľ. Okrajová podmínka tohoto typu nepředstavovala v jednodimenzionálním případě žádný problém, neboť v hraničních uzlech jsme znali přibližné řešení přesně. Zde tomu obecně tak není, neboť hraniční uzly nemusí ležet na hranici oblasti ú. V každém případě však leží blízko hranice v tom smyslu, že ke každému hraničnímu uzlu existuje bod na hranici oblasti Q, jehož vzdálenost od uvažovaného uzlu je nanejvýš h. Tato skutečnost nabízí elementární způsob přepisu Dirichletových okrajových podmínek, při němž položíme (2.30) (2.31) (/*«)*> = «*» pro (xh,ys)eTw {&hl)ks - v{xk,ys) pro (xh,ys) 6 r(íi>, 253 III. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU kde f je libovolná spojitá a spojitě diferencovatelná funkce v Ô a taková, že pro ni platí (2.32) <p(x,y) = i{x,y), (j,})er. Ukažme předně, že soustava (2.27) doplněná právě sestrojenými rovnicemi typu (2.28) skutečně jednoznačně určuje přibližné řešení, tj. že její matice je regulární. Toto tvrzení je bezprostředním důsledkem následujícího lemmatu. Lemma 2.2. Matice soustavy (2.27), (2.28), kde operátory i^2', /& sAi jsou deňnovány rovnicemi (2.4), (2.30) a (2.31), je monotónní. Důkaz. Bud' n funkce definovaná na množině íjW a taková, že pro ni platí (2.33) (t-ľHk, š 0, (**,!/.) G 0« a (2.34) Vhr)h, = 0, (**,»,) e rw. Máme dokázat, že je nks g 0 pro (xk, ys) e ÚSh\ To však plyne ihned z principu maxima (viz lemma 2.1), neboť rovnice (2.34) neznamenají nic jiného, než že funkce n je na množině nekladná. Lemma je dokázáno. O konvergenci sestrojené metody sítí platí následující věta. Věta 2.4. Nechť řešení diferenciální rovnice (2.1) s okrajovou podmínkou (2.29) existuje a má v O spojité parciální derivace podle x a y až do čtvrtého řádu včetně. Nechť dále existuje funkce z, která je v Í2 řešením diferenciální rovnice s okrajovou podmínkou (2.36) z(x,y) = l, (x,y)£T, a která má v Ď spojité parciální derivace až do čí vrte'lio řádu včetně. Nechť konečně u*j je přibližné řešení získané ze soustavy (2.27) a (2.28), kde operátory L^2\ k a A;, jsou definovány rovnicemi (2.4), (2.30) a (2.31). Pak existují konstanty M a hty > 0 takové, že platí (2.37) \uk. ~ u(xk,y,)\ g M h pro každé h g ho a pro každý uzel [xk,ys) G Q(hK Důkaz . Položíme-li r]ks = uks — u(xk, y3), existuje za uvedených předpokladů podle věty 2.2 konstanta Ki taková, že platí (2.38) (£]PM** = (^k,y,)en(h\ 254 r 2 METODA SlTl (2.39) \ek,\ g Kih2. Podle (2.30) je (2.40) {k*i)kS = >p{xi,y>)-u{xk,y,), (xk,y,)er™. V důsledku definice hraničních uzlů existuje ke každému uzlu [xk,y,) € bod (ž, y) €: ľ takový, že jeho vzdálenost od uzlu (xk,y,) je nanejvýš h. Protože však funkce u a <p mají spojité derivace, plyne z věty o střední hodnotě, že platí (2.41) u(xk,y,) =u(x,y) + 0(h} (2.42) <p(xt,y,) = <p(x,y) + 0(h). Protože však je tp(x, y) — -j(x, y), dostáváme odtud celkem, že je (2.43) (lhr,)t. = sk„ (íilS,)erW a (2.44) |£i,| <l Kxh. Ze stejných důvodů však existuje konstanta K2 taková, že pro funkci z platí (2.45) U,[2)z(pr))*» = i + r*„ (**.».) en(*>, (/^(pr))^ = i + £tJ, (xk,y,)erw, kde z(pr) je funkce definovaná na množině ÍJW předpisem z^f* = z(a;fc, J/S) a (2.46) \ii.\^K2h3, (zi.j/.JeflW léi.lš^, (i,,!/,)erw, Postupem úplně stejným jako v důkazu věty 3.7 z kap. II (viz str. 179) nyní už snadno dokážeme, že existuje konstanta N taková, že pro funkci vks = Nz(xk, ys)h platí (2.47) (LÍ2)v)ks > K.h2 g 1(4*^.1, («»,».) e nW, (Ikv)i. ž Ärfc ž |(/^)t,|, (**,&) e rw: pro každé dostatečně malé h. Z těchto nerovností a z lemmatu 2.2 (srv. také lemma 3.2 z kap. II) však už plyne, že funkce vka majorizuje funkci rjkl. Protože funkce z je za uvedených předpokladů omezená v Í2, plyne odtud tvrzení věty. Poznamenejme, že existence funkce z ve větě požadovaných vlastností není podstatná pro tvrzení této věty a váže se pouze na zvolenou techniku důkazu. Jiným postupem, podstatně však komplikovanějším, by bylo možno dokázat větu 2.4 i bez funkce z. 255 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU Aproximace řešení dané okrajové úlohy získané popsaným postupem tedy konvergují při h —> 0 k přesnému řešení, rychlost konvergence je však obecně pouze 0(h) a chyba může navíc dosti podstatně záviset na charakteru prodloužení funkce 7. Z těchto důvodů se tento postup užívá jen zřídka. Když už je použit, doporučuje se volit množinu O^1' ne striktně tak, jak jsme ji definovali v odst. 2.1.1, ale připustit do ní ještě některé další body ležící v oblasti íí. Příslušné hraniční uzly pak mohou samozřejmě ležet i vně množiny fi, můžeme však dosáhnout toho, že množina r^1' lépe vystihuje hranici T dané oblasti. Následující příklad ukazuje, že to může přinést až překvapivý efekt. Příklad 2.1. Řešme Dirichletův problém pro rovnici Au = 0 na jednotkovém kruhu Q = {(x, y); x2 + y2 < 1} pro okrajovou podmínku 7(cos(?,sin0) = sin40, 0 < 9 g 27T. Přesné řešení této okrajové úlohy je funkce u(x, y) = 4xy(x2 — y2). Protože v tomto případě je d^u/dx4 = diu/dy* = 0, jsou veličiny ej., pro (ij,, ys) £ rovny nule a celková chyba přibližného řešení je způsobena pouze nepřesným splněním okrajových podmínek. Funkci 7 prodloužíme do bodů blízkých k hranici předpisem j?(rcosť', rsinfl) = sin49, 0 < f S 2f s množiny a zvolíme podle obr. 2.1a, 2.1b a 2.1c, v nichž jsou body z rW označeny křížky. Výsledky v bodech, které jsou v obrázcích označeny čísly 1 až 10 jsou uspořádány v tab. 2.1. Pro porovnání jsou uvedeny také hodnoty přesného řešení a hodnoty přibližného řešení s množinou fi'A' zvolenou podle obr. 2.1a a přepisem okrajových podmínek podle Collatze, který bude popsán v dalším textu. Tabulka 2.1 Závislost řešení na volbě hraničních uzlů r 2 METODA SÍTÍ Bod Užitá metoda Přesné řešení Přibližné řešení s přepisem okrajových podmínek dle Collatze a b c 1 0,002 046 0 0,001446 7 0,0018014 0,001639 2 0,0004648 2 0,0204759 0,0144711 0, 018018 2 0,016392 3 0,015 2682 3 0,0722098 0,050 7785 0,063196 7 0,0573731 0,058 8973 4 0,010213 6 0,0072297 0,0090023 0,008196 2 0,0069724 5 0,0715117 0,0506118 0, 063039 0 0,0573731 0,058565 6 6 0.2161745 0,152 2059 0,1901021 0,1721194 0,1772701 7 0,0284809 0,0202160 0,025155 4 0,022 9483 0,0233160 8 0,1643993 0,116 8746 0,145 5464 0,132 7778 0,1365299 9 0,0606202 0,0432254 0,0535307 0,049177 0 0,050 5218 10 0,3094698 0,2215432 0, 273353 2 0,252 4418 0, 2597308 Obr. 21a Speciální volba množiny V(h*> pro příklad 2.1 Obr. 2.1b Speciální volba množiny T^h^ pro příklad 2.1 i v í3 Z důkazu věty 2.4 je zřejmé, že platí-li speciálně rC1' C T, je možno volit funkci z tak, že pro ni platí z(x, y) = 0 pro (x, y) £ T. Tato volba pak umožní brát funkci v ve tvaru JVz(xj.,ys)h? a dokázat tak rychlost konvergence 0(h2). Nepříznivější výsledek, který jsme obdrželi v obecném případě, je tedy způsoben ne dosti přesným předpisem okrajových podmínek. Zároveň je také vidět, že k rychlosti konvergence 0(h2) vede každý takový přepis okrajových podmínek, který nenaruší monotónnost matice vzniklé soustavy a jehož lokální chyba (jak se veličina et, zavedená v dů- 256 257 III. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU Obr. 2.1c Speciální volba množiny ľ^h^ pro příklad 2.1 4\ \\\ _\— TI 1 1 ľvL 1 1 1 JMJJ'b ~ľU rlPi S 3 K — 6 'aA \ \ n III 1 1 1 / ] rJ U -f 1 r J i v i-i \ m M 1 I r M M kazu věty 2.4 nazýva) je nejméně řádu 0(h2). V dalším textu uvedeme dvě takové možnosti. Nejprve popíšeme nejběžnější a nejčastěji používaný přepis Dirichletových okrajových podmínek, který je založen na lineární interpolaci a bývá spojován se jménem Collatzovým. Buď tedy A hraniční uzel. Pak musí existovat aspoň jeden uzel B, který je sousední k uzlu A a který je vnitřní a uzel C", který je sousední k uzlu A a který leží vně oblasti Í2. Uvedené uzly můžeme přitom zřejmě vybrat tak, že leží na přímce, a bez újmy na obecnosti můžeme předpokládat, že tato přímka je rovnoběžná s osou x. Buď dále C průsečík úsečky CA s hranicí Y dané oblasti a položme trh = CA, takže je 0 g c < 1 (viz obr. 2.2a). Nechť konečně u je dostatečně hladká funkce v íl. Položíme-li počátek souřadnic do bodu A a osu x orientujeme kladně ve směru od bodu A k bodu B, je funkce u(A)(A — x)jh + v.{B)xjh Lagrangeovým interpolačním polynomem pro funkci u. Platí tedy (2.48) u(Xiy)-vrA)^-l + u(B)Z+rA a je (2.49) |ru| á M/i2 pro body ležící na úsečce C'B. Speciálně je tedy (pro x ~ —trh v našem souřadném systému) (2.50) u{C) = {í + o-)u{A)-(Tu{B)-rrA. 2 METODA SlTf Obr. 2.2a Přepis Dirichletových okrajových podmínek ť c E B xh 2 h D ah' h ' si Vyjdeme-li z této rovnice, je přirozené definovat operátory l£ a A£ předpisem (2.51) (k°u)A = uA - j^ug a (2.52) (ASt)> - rT^(c). Při Collatzově přepisu okrajových podmínek tedy doplníme soustavu (2,27) rovnicemi typu (2.53) (lhcu)A = y^7(C), které zapíšeme pro každý hraniční uzel. Z lemmatu 2.2 opět plyne, že matice metody sítí dané rovnicemi (2.27), (2.53) je monotónní, takže tato metoda má smysl. Její rychlost konvergence je příznivější než u metody sítí, kdy okrajové podmínky přepisujeme na základě pouhé spojitosti, a je popsána v následující větě, Věta 2.5. Nechť řešeni u diferenciální rovnice (2.1) s okrajovou podmínkou (2.29) existuje a má čtyři spojité parciální derivace v Ci. Nechť dále existuje funkce z vlastnosti popsaných ve větě 2.4. Buďionečně uks řešeni soustavy (2.27), (2.53). Pak existují konstanty M a hB > 0 takové", že pro každý uzel (xk, ys) e fi^ a pro každé h á ho platí (2.54) \uks-u(xk,yc)\^Mh2. Důkaz je přesným opakování důkazu věty 2.4 s tím jediným rozdílem, že pro 258 259 1676 iii. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU 2 METODA SlTl operátor 1^ platí rovnice (2.43) s lepším odhadem (2.55) M á M h2 Tato skutečnost umožňuje brát funkci u*, splňující nerovnosti (2.47) ve tvaru Nz(xk,y,)h2. . Postulování existence funkce z požadovaných vlastností opět není nutné a důmyslnější důkazovou technikou se mu lze vyhnout. Přepis Dirichletových okrajových podmínek založený na lineární interpolaci je tedy z hlediska řádové přesnosti výhodný a ve srovnání s přepisem založeným na spojitosti není o mnoho komplikovanější. Proto se jej v praxi také velice často užívá. Přesto má však podle našeho názoru určité nevýhody. Předně při sestavování rovnic typu (2.53) není v některých případech jasné, jak vybrat směr, v němž máme inter-polovat. Tak např. nastává-li situace jako na obr. 2.2a, můžeme stejně oprávněně jako rovnici (2.53) užít rovnici (2.56) uA - -1-uo = ~y(E), I + t 1 -+- r která svazuje uzly Au D. Kromě toho, už vícekrát jsme zdůraznili, že při diskretiza-ci kteréhokoliv problému je žádoucí zachovat co nejvíce jeho původních vlastností. a jsme v předchozím odstavci sestrojili tak, aby byla kte- Tak např. operátory i^1' zachována platnost principu maxima. Přednost jsme však dali operátoru L^, rý vedl na symetrickou soustavu lineárních rovnic, takže lépe odpovídal tomu, že původní rovnice je samoadjungovaná. Připojíme-li však k rovnicím (2.27) rovnice typu (2.53), je matice takto vzniklé soustavy nesymetrická. Proto se zdá přirozené vyjít sice z myšlenky lineární interpolace, a tím dosáhnout i stejné řádové rychlosti konvergence jako výše, modifikovat však užitý postup tak, abychom získali symetrii matice soustavy pro určení neznámých u)-s. Takový postup nyní popíšeme. Rozlišujme přitom tři případy charakteru hraničního uzlu tak, jak jsou vyznačeny na obr. 2.2a, 2.2b a 2.2c. (a) Charakter hraničního uzlu podle obr. 2.2a: V tomto případě užijeme rovnici (2.57) 1 (A + B l + £r (A + B\ , l + i- fA + D\] )*KC) + ip(^)^, kterou dostaneme užitím rovnice (2.53) vynásobené činitelem (l+<r)p((.A-}-ií)/2) jo-a rovnice (2.56) vynásobené číslem (1 + t)p((A + d)/2)/r. Lokální chyba této rovnice je tedy zřejmě opět 0(h2). (b) Charakter hraničního uzlu podle obr. 2.2b: Zde užijeme rovnici (258) l + *-fA + B\-. íA + B\ 1 fA + B^ Í,l-2^)UB = ?Í,(^T£)^C)' 260 Obr. 2.2b Přepis Dirichletových okrajových podmínek A , ß A + B 2 S ObT. 2.2c Přepis Dirichletových okrajových podmínek která je pouhým násobkem rovnice (2.53). (c) Charakter hraničního uzlu podle obr. 2.2c: V tomto případě užijeme rovnici (A + B\ (A + D\ (A+H\ 1 (A + B\ Rovnice (2.59) vznikla tak, že jsme k rovnici (2.53) vynásobené činitelem (1 -f-+ cr)p((^l + B)/2) jo- přičetli rovnici (2.60) -p(— )uD-v{—)uh + [p(—) + p(—)]«Á = °-Pro přesné řešení dá totiž operace na levé straně rovnice (2.60) výsledek 0(h2), jak 261 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU plyne ihned z Taylorova vzorce, takže lokální chyba rovnice (2.59) je stejně jako u předešlých rovnic řádu 0(h2). Soustava rovnic (2.27), k níž přidáme rovnice typu (2.57) až (2.59), má zřejmě ■ symetrickou matici a pro přibližné řešení vypočtené pomoc! ní platí opět věta 2.5. . Obr. 2.3 Nepravidelná síť pro aproximaci rovnice druhého rádu V Jiný často užívaný přepis Dirichletovy okrajové podmínky je založen na myšlence aproximace dané diferenciální rovnice i v hraničním uzlu, a to tak, že se užije nepravidelná síť. Popišme stručně i tento postup. Buď tedy A uzel, v němž chceme aproximovat diferenciální rovnici (2.1) pomocí bodů B, C, D a E, které jsou rozmístěny jako na obr. 2.3. Pomocí Taylorova vzorce nebo metodou neurčitých koeficientů snadno zjistíme, že rovnice A3 + A4 (A + B\ A3- (2.61) 1A4 í <l\TV\ 2 Ai + A2 fA + D + A4 (A + C\ 2 (A + V\ -p\—2-r 2A2 Ai +A2 2A3 ľ\ 2 A3 + A4 (A+B L 2Ai , A! + A2 + —s-í—p ) 2A4 A3 +A. 2A2 Ai +A2 M ( 2A3 v 2 / 2A4 v 2 + {(\i+\i)(\3 + ^)h2q(A)]uA = = Í(Ai + A2)(A3 + A4)/í2/(^) aproximuje diferenciální rovnici (2.1) s přesností 0{h). Rovnici tohoto typu užijeme v každém hraničním uzlu. Za body B, C, D a E z obr. 2.3 vezmeme přitom ty uzly, které jsou sousední k uzlu A a jsou vnitřní, a ty body, v nichž protínají vlákna sítě procházející uzlem A hranici. V těchto posledních bodech jsou tedy hodnoty přibližného řešení známé a dané okrajovou podmínkou. Soustava lineárních algebraických rovnic, která vznikne připojením rovnic typu (2.61) k rovnicím (2.27) 262 r 2 METODA SÍTl má opět monotónní (a tedy i regulární) matici a celková diskretizační chyba je opět řádu 0(h7). Upozorněme však, že zmíněná matice není obecně symetrická. Všimněme si závěrem tohoto odstavce ještě stručně problematiky přepisu okrajových podmínek obsahujících derivace. Začneme Neumannovou úlohou pro rovnici (2.1), tj. úlohou nalézt funkci u, která splňuje v Í2 diferenciální rovnici (2.1), je spolu s prvními parciálními derivacemi spojitá v Ô a pro niž platí na hranici F oblasti í) ..... kde v je vnější normála ke hranici v daném bodě a 7 je funkce definovaná a spojitá na F. Vzhledem k tomu, že přepis okrajových podmínek obsahujících derivace přinášel už i v jednodimenzionálním případě určité obtíže, čtenáře jistě nepřekvapí, že se vzrůstem dimenzí tyto obtíže rostou. Protože celá řada otázek týkajících se nejvhodnější formy tohoto přepisu není dosud úplně uspokojivě vyřešena, omezíme se na popis jedné velmi jednoduché možnosti, která se opírá opět o myšlenku lineární interpolace. Buď tedy A hraniční uzel. Označme C průsečík normály ke křivce r vedené tímto uzlem s ľ a B' ten průsečík sestrojené normály s některou přímkou sítě, který leží nejblíže uzlu A a zároveň leží uvnitř oblasti £2. Jsou-li tyto body rozmístěné jako na obr. 2.4, platí pro úhel a, který svírá normála CA s osou x zřejmě Oí aš ir/4 a pro každou dostatečně hladkou funkci je (2-63) ^.{C)=^(A) + 0(hy. Obr. 2.4 Přepis Neumannových okrajových podmínek u(A) - u(B') h cos a + 0(h). sl A B i B' 1 B D Aproximujeme-li hodnotu v(B') v bodě, který nepatří do sítě, pomocí lineární interpolace, dostaneme (2.64) u(B') = (tga)u(D) + (l -tga)u(S) + 0(/i2), 263 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU takže celkem platí du (2.65) ■ -tga)u(B)-(tSa)u(D)} + 0(h). Zanedbáme-li v této rovnici člen 0(h) a dosadíme-li podle ní do okrajové podmínky (2.62), dostaneme pro hraniční uzel A rovnici (2.66) uA - (1 - tga)uB - (tga)uD -T(C). I zde se užívá modifikace popsaného postupu, kterou jsme doporučili již při přepisu Dirichletových podmínek a která spočívá v tom, že množina uzlů, ve které hledáme aproximaci daného problému, se rozšíří o některé uzly, které leží vně oblasti fi. Tak např. v obr. 2.4 můžeme za hraniční uzly pokládat uzly E a F. Uzel A se pak stane vnitřním a např. v uzlu E dostaneme zcela analogicky jako v předchozím výkladu rovnici (2.67) uE - (1 - tgíí)uA - (tg/5)«G - -U(ff). cos/? Uvedeným postupem se může podařit opět lépe vystihnout hranici dané oblasti, než když postupujeme striktně podle definic z odst. 2.1.1. Ať už užijeme podmínku typu (2.66) nebo (2.67), vznikne v případě, že funkce g v rovnici (2.1) není identicky rovna nule, soustava rovnic s monotónní maticí. Je-li funkce g identicky rovna nule, je řešitelnost vzniklé soustavy vázána na splnění jistých podmínek pro funkci 7. Jsou-li tyto podmínky splněny, je řešení určeno až na konstantu. Jednoznačným je můžeme učinit, zvolíme-li pevně hodnotu funkce 11 v některém uzlu. Touto volbou pak dostaneme ze soustavy (2.27) a (2.66), resp. (2.67) novou soustavu, jejíž matice je monotónní. Pokud jde o Newtonovu okrajovou podmínku, tj. o podmínku (2.68) ^ = -k(u - 7) na f, kde k a 7 jsou zadané funkce na ľ a k je kladná, je možno užít analogický postup. Tak např. v uzlu A z obr. 2.4 dostaneme rovnici (2.69) l + ACk(C) „ 1 + B'Ck(C) l + A~Čk(C) (tg a)uD ■ AB>k{C) 1 + WČk{C) 1 + B'Ck{C) jejíž lokální chyba je opět 0(h). Postup pro přepis okrajových podmínek obsahujících derivace, který jsme právě popsali, vede (samozřejmě za předpokladu dostatečné hladkosti přesného řešení) k rychlosti konvergence řádu 0(h). Důkaz příslušných tvrzení, jejichž přesnou formulací si snadno provede čtenář sám, je úplně analogický jako důkaz věty 2.4; a proto jej nebudeme detailně provádět. Pokud jde o postupy, pomocí nichž lze 264 2 METODA SÍTl docílit rychlosti konvergence řádu 0(h2), není současná situace plně uspokojivá. Je známa sice řada formulí, pomocí nichž se této rychlosti konvergence dosáhne (je-li např. hranice složená z úseček sítě, vychází se obvykle z faktu, že výraz [u(x + h) — - u(x — h)]/(2h) aproximuje první derivaci s přesností 0(/i2)), univerzální předpis však není v případě obecné křivočaré hranice dosud znám. 2.1.3 Metody zvýšené přesnosti, jiné tvary sítí Zatím jsme při náhradě okrajové úlohy konečnědimenzionálním problémem postupovali tím nejjednodušším způsobem. K aproximaci diferenciálního operátoru jsme totiž používali diferenční operátory svazující hodnoty přibližného řešení v nejmen-ším možném počtu bodů. Použijeme-Ii k této aproximaci více bodů než je nezbytně nutné, dosáhneme přesnější aproximace daného operátoru. Metody, které takto vzniknou, se nazývají metody zvýšené přesnosti. Za příklad takové metody může sloužit náhrada Laplaceova operátoru operátorem Ah definovaným rovnicí (2.21), při níž se dopouštíme chyby řádu 0(h®). Aby celková diskretizační chyba byla rovněž řádu 0(ft6), je třeba i okrajové podmínky aproximovat se zvýšenou přesností. Zde však vznikají obtíže, zejména pak v případě, že hranice je křivočará a že okrajové podmínky obsahují derivace. Obtíže tohoto druhu jsou pro metody zvýšené přesnosti typické a protože otázky s nimi související nejsou dosud uspokojivě řešeny, užívají se tyto metody dosti zřídka. Druhá otázka, které je třeba se alespoň stručně dotknout, je problematika tvarů sítí užívaných pro řešení eliptických parciálních diferenciálních rovnic. Daleko nej-běžnější jsou čtvercové sítě, jimiž jsme se zabývali až dosud. Kromě nich se někdy užívají, zejména v případech speciálních tvarů oblasti íí, jiné pravidelné sítě jako např. trojúhelníkové, šestiúhelníkové apod. Tak např. Poissonovu rovnici (2.70) dx2 + dy2-n*,y), (která je zřejmě speciálním případem diferenciální rovnice (2.1)) lze aproximovat na trojúhelníkové síti znázorněné na obr. 2.5 diferenční rovnicí Obr. 2.5 Trojúhelníková síť 265 III. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU (2.71) ua - i(ug + uc + uo + ub + tip + uq) -= -\h?f(A) - ±k*m(A) s přesností 0(h4) a na šestiúhelníkové síti z obr. 2.6 rovnicí (2.72) uA - Í(iífl 4- uc + uD) = -\h2f{A) s přesností 0(h). Nepravidelné sítě (kosoúhlé, eventuálně křivočaré) se používají nesmírně zřídka; jejich užití může být někdy ospravedlněno zjednodušením diferenčních rovnic. Obr. 2.6 Šestiúhelníková síť 2.2 Lineární rovnice čtvrtého řádu Problematiku užití metody sítí pro řešení okrajových úloh pro diferenciální rovnice vyšších řádů budeme ilustrovat na příkladě biharmonické rovnice (2.73) AA„ S g + 2^+0 = /(■.») ve čtverci O = {(x, g/); 0 < a: < 1, 0 < s < 1} s okrajovými podmínkami (2.74) u(x,y) tf>i(x,y), ■£{x,y) = <f>i(x,y) na hranici ŕ tohoto čtverce (i/ je vnější normála). Sestrojme stejně jako v odst. 2.1 v oblasti fi čtvercovou síť a položme h — 1/n, kde n je přirozené číslo, což zaručí, že hranice ľ splyne s některými vlákny sítě. Protože operátor Lj, definovaný předpisem (2.75) h2(Lh.u)n, = iUk, - ttk+i,s - «it-i,j - uk,i+i - Ujt,»-i 266 2 METODA SlTl ŕ 2") aproximuje Laplaceův operátor —A (jde o speciální případ operátoru í.^ z odst. 2.1), dá se očekávat, že operátor L^Lj, — L2, který je tedy definován rovnicí (2.76) h\ilu)hs = 2Quk, - 8(«i+i,, + ut-i,, + ullJ+i 4- tit,,-i)+ + 2(uj.+iij+i + uj,_ii<+i + m+i,j-i + «*-i,t-i)+ + («ifc+2,ä + «*-2,s + «»,,+2 + "*,j-3)i aproximuje biharmonický operátor. Z následující věty plyne, že tomu tak skutečně je- Veta 2.6. Buď u funkce, která má v nějakém okolí U bodu (x, y) šest spojitých parciálních derivací podle obou proměnných a buď h tak malé, že body (x + h, y), (x-h,y), (x,y+h), x,y—h), (x-rh,y+h), (x-h,y+h), (x+h,y-h), (x-h,y-h), (x + 2h, y), (x — 2h,y), (x, y + 2n) a [x, y — 2h) leží v U. Pak platí (2.77) 20u(x, y) - S[u(x + h, y) + u{x - h, y) + u(x, y + h) + u(x,y - h)]+ + 2[u{x + h,y + h) -f- u(x - h,y + h) + u(x + h,y - h) + v(x - h,y - h)}+ + [u(z + 2h, y) + u(x - 2h, y) + u(x,y + 2h) + u{x, y - 2h)} -= r»4(AA)«(a;,j/) + 0(ri6). Důkaz tohoto tvrzení plyne ihned z Taylorova vzorce, a nebudeme jej proto podrobně provádět. Obr. 2.7 Sírové schéma pro biharmonickou rovnici C L D A S J H M Přibližné řešení uk, budeme tedy počítat z rovnic (2.78) (L2u)hs = f(xk,ys), kde uzel (xk, ys) probíhá jako dříve množinu vnitřních uzlů ííW, doplněných rovnicemi psanými pro každý hraniční uzel (xk, y„) 6 ľ^h\ které se získají z okrajových 267 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU podmínek. Množiny 0« a se přitom definují stejně jako v odst. 2.1 pomocí pojmu sousedních uzlů. Je však třeba mít na paměti, že za sousedy uzlu A z obr. 2.7 je třeba pokládat dvanáct uzlů B,... ,M (srv. vzorec (2.76)). V našem speciálním případě je tedy množina 0,^ tvořena uzly (xk, ys), pro něž je k,s = 2,..., n — 2, a pro množinu platí rW = rjh^urjh\ kde AW obsahuje uzly ležící na hranici ľ čtverce íí a obsahuje uzly, jejíchž vzdálenost od F je právě h. Vzhledem k první okrajové podmínce (2.74) hodnoty přibližného řešení v uzlech z ľ[h^ známe. V uzlech z 7*2*' zužitkujeme druhou okrajovou podmínku úplně stejně, jako jsme to učinili u okrajové úlohy pro obyčejnou diferenciální rovnici čtvrtého řádu v předešlé kapitole. Tak např. v uzlu {x\, ys) píšeme rovnici (2.79) = «1,1 + 2^2(2:0, !/>) a hodnotu u_i,s vypočtenou z této rovnice dosadíme do rovnice (2.78) psané pro uzel (a;i,sřf). Tímto postupem dostaneme zřejmě soustavu (n — l)2 rovnic o (n — - I)2 neznámých uk, v uzlech (xk,y,) <E kde Í2W = fiW Uľf. Každá rovnice z této soustavy je přitom bud'přímo rovnice (2.78), nebo — v případě, že je {xk, ya) € / j*'' — rovnice (2.78), do níž se za hodnotu resp. hodnoty ležící vně í! dosadilo z rovnic typu (2.79). Vynásobme ještě všechny rovnice číslem A4 a matici takto vzniklé soustavy lineárních rovnic označme Bj,. Tato matice je zřejmě řádu (n — l)2. Je-li tj libovolný (n — l)2-dimenzionální vektor o složkách rjkí, položíme-li "fcj = 0 pro (xk, ys) £ r[h\ íj-i,, = tjij a analogicky pro ostatní uzly z r«, platí pro každou složku (Bnri)ks vektoru 8j,jj (2.80) (Bhr,)k. - h*(Lgt))k„ (xi.y.) e O jak se snadno zjistí. Symbolem u'1' označíme (n —l)2-dimenzionální vektor přibližného řešení. Tento vektor je třeba vypočíst ze soustavy (2.81) kde 3 je daný vektor (jehož složky závisí na pravé straně dané diferenciální rovnice a na pravých stranách okrajových podmínek). Aby námi sestrojená metoda sítí měla vůbec smysl, je třeba odpovědět na otázku po řešitelnosti této soustavy. K tomu, ale i k úvahám o konvergenci použijeme následující lemma. Lemma 2.3. Existuje konstanta 7 > 0 taková, že pro libovolný (n - l)2-dimenzionální vektor t) o složkách r]k, platí (2.82) Arie (e»»i,»i)ž7ä2Nk*,, (2.83) Nk.su =max[ max |»)t,|, max \nkí\h 1], 268 2 METODA SlTl a kulaté závorky v (2.82) značí skalární součin v (n -1)2-dimenzionálním euklidovském prostoru. Důkaz Podle vzorce (2.80) je (2.84) (BhVtV) = h4 £ (^ = ft4ELV^W,. Dvojím užitím lemmatu 3.10 z kap. II na každý z dvojnásobného součtu na pravé straně (2.84) snadno zjistíme (srv. také důkaz lemmatu 3.14 z kap. II), že platí (2.85) (ftr,, „) = /■* £ [(iÄlJ)*,]2 + 2 £ + 2r,lx + 2n2_11 + 2r,?i„_1 + 2^_ln_1. Čísla (iníj)t, jsou však zřejmě složky vektoru AHr,, kde Ah je matice soustavy rovnic (286) A2(i^)i5 = st5, (.»,»,) €flÍ»). Je tedy (2.87) (Bhv,v) = (AnV,AhV) + 2 £ %2J+ + Wu + 2f)2_i,i + 2v?,„_i + 2Í)2_1,„_1. Z rovnice (2.87) však ihned plyne, že platí (2.88) {BhV,V)Ž2 £ = % max |%,|]2 = 2h2[ max ^h^. Buď nyní e(?>»), p,« = 1,... ,n - 1, vektor, který má (p, ?)-tou složku rovnu jedné a všechny ostatní složky rovny nule. Pak zřejmě platí (2-89) VPt = {n^M). Buď dále aď'ti vektor, který je řešením soustavy (2.90) Aha^ = .<m). Abychom mohli řešení této soustavy jednoduše zapsat, uvažujme soustavu vektorů v ^'ľ\ i/,/j = l,...,n-l, jejichž složky jsou dány vzorci (2.91) i>i4"v = 2nsin-siní-—, k,s = 1,... n - í n n Přímým výpočtem snadno zjistíme, že vektory v ("''O tvoří úplnou ortonormovanou soustavu vlastních vektorů matice Ah a že příslušná vlastni čísla A„„ jsou dána 269 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU 2 METODA SlTl f vir (2.92) XUII = 4-2^cos — + cos^-J = ,4(sm2- + sm2-), ,,„=!,....n-1. Odtud mimo jiné plyne, že existují konstanty eířji^ takové, že platí (2.93) <*<'•»>= E cí™M"'">. Vynásobíme-li rovnici (2.93) zleva maticí Ah, dostaneme (2.94) 4^«) = E A^c^v^"). Čísla A„ŕcí,l'fi,), ľ, Ai = 1..., n - 1, jsou tedy Fourierovy koeficienty vektoru e<P'«) vzhledem k ortonormální bázi v , a proto platí (2.95) neboli (2.96) uľf< \ ti Z rovnice (2.92) a ze zřejmé nerovnosti sin2 z ä 4z2/ir2 platné pro libovolné reálné z z intervalu (0,tt/2) však plyne existence konstanty yx (nezávislé na n) takové, že platí (2.97) 1 < Ti 1 Dosadíme-li tento výsledek do (2.96) a použijeme-li rovnic (2.91), máme (2.98) I^X^rhř- Pro euklidovskou normu vektoru tedy dostáváme podle (2.93) a (2.98) (2.99) .(p,?)||2 < M V" _ < 11 neboť řada £ l/(ľ2 + ^2)2, kde sčítáme přes všechna celá čísla, je konvergentní. Dosadíme-li do rovnice (2.89) za vektor a^') podle rovnice (2.90) a použijeme-li toho, že matice Ah je symetrická, máme (2.100) 270 Podle Schwarzovy nerovnosti je tedy (2.101) \np,|2 S || Wlk^lf ž jjjM»H, a tato nerovnost platí pro všechny dvojice (p, q) takové, že je {xp, yq) £ Odtud a z rovnice (2.87) však ihned plyne, že platí (2.102) h2 (B*»J,!?)Ž—[ max-M. 72 K důkazu nerovnosti (2.82) stačí už jen položit y = min(2,1/72) apoužít nerovností (2.88) a (2.102). Důkaz lemmatu je hotov. Z právě dokázaného lemmatu plyne předně, že matice Bj, je pozitivně definitní. Soustava (2.81) má tedy právě jedno řešení. Z lemmatu 2.3 však plyne snadno i konvergence uvažované metody sítí. Věta 2.7. Nechť řešení u diferenciální rovnice (2.73) s oirajovými podmínkami (2.74) má ve čtverci Cl spojité parciální derivace až do šestého řádu včetně a nechť u*j Je přibližné řešení vypočtené ze soustavy (2.81). Nechť r) je vektor o složkách Ufca — «(*fc, </«), (xk,ys) £ ílj^. Pak existuje konstanta M taková, že pro každé dostatečně malé h platí (2.103) IMU,^ g Mh. Důkaz Buď u'pr) vektor o složkách u{xk, ys) a položme (2.104) £ = B,,i/pr) - g, kde g je pravá strana rovnice (2.81). Vzhledem ke konstrukci matice Bj, a k hlad-kostním předpokladům kladeným na funkci u existuje konstanta M taková, že je (2.105) a (2.106) Pro vektor tj platí (2.107) a podle nerovnosti (2.82) máme J_ 7/i2 1 (2.108) HU š < = 7fc2 271 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU Protože množina ííM má řádově 0(l//i2) prvků a množina pouze 0(l/h) prvků, plyne tvrzení věty už snadno z nerovnosti (2.108) a z odhadů (2.105) a (2.106). Při přepisu okrajových podmínek jsme v námi vyšetřovaném případě využili speciálního tvaru hranice dané oblasti. V obecném případě se při přepisu okrajových podmínek vychází z obdobných principů, jak bylo uvedeno u okrajových podmínek pro rovnici druhého řádu. Obtíže, které tam nastávaly zejména v případě, že okrajová podmínka obsahovala derivace, se zde vyskytují v případě jakékoliv okra/-jové podmínky, neboť u rovnice čtvrtého řádu jsou zadány okrajové podmínky dvě, a aspoň jedna z nich musí vždy obsahovat derivaci. 2.3 Řešení vzniklých soustav lineárních rovnic V předchozím textu jsme viděli, že řešit okrajovou úlohu pro lineární parciální diferenciální rovnici metodou sítí znamená řešit jistou soustavu lineárních algebraických rovnic. Algoritmus pro řešení dané okrajové úlohy je tedy dán teprve tehdy, je-li udána konkrétní metoda pro řešení zmíněné soustavy rovnic. Protože tato poslední část celkového algoritmu metody sítí je z praktického hlediska značně důležitá — řešení náhradní soustavy lineárních rovnic spotřebuje prakticky všechen potřebný výpočetní čas — všimneme si i této problematiky. Z důvodu zachování přijatelného rozsahu této knížky budeme velice struční a v podstatě se omezíme na výčet nejtypičtějších možností, aniž budeme zacházet do nějakého podrobnějšího rozboru uváděných metod. Jako modelová úloha nám pro většinu výkladu v tomto odstavci poslouží Dirichletova úloha pro Poissonovu rovnici r (2.109) -Au = f(x,y) na čtverci íí = {(x,y)\ 0 < x < 1,0 < y < 1}. Laplaceův operátor -A budeme přitom aproximovat operátorem ř_j, definovaným rovnicí (2,75). Budeme se tedy zabývat soustavou rovnic (2.110) 4ui;í-«fc+iia-U)t_i,J-Ujfc|J+i-«ifc,a-i = h2f(xk,ys), k,s= l,...,n-l, kde hodnoty u0s, uní, uka, "fcn jsou známé a pro integrační krok h platí h — 1/n, kde n je přirozené číslo. Jde tedy o soustavu N — (n - l)2 rovnic o N neznámých. Očíslujeme-li neznámé jedním indexem, a to tak, že postupujeme po řádcích sítě odleva doprava a odshora dolů, lze soustavu (2.110) zapsat v maticovém tvaTu (2.111) Au = 3, kde A je čtvercová matice řádu N (která je symetrická a ireducibilně diagonálně dominantní) a g je daný vektor pravé strany určený pravou stranou dané diferenciální rovnice a okrajovými podmínkami. Matice A je při daném očíslování neznámých 2 METODA SlTl blokově tří diagonální, tj. je tvaru (2.112) Al ŕ?! Si 0 '■■ 0 0 Sn_2 j kde A), a Bk jsou čtvercové matice řádu n — 1 dané rovnicemi (2.113) 4 -l 0 L o -i o o o •. -1 -1 4 -i o o 0 -1 a symbol 0 ve vzorci (2.112) znač! nulovou matici rádu n - 1. Matice Ak jsou tedy třídiagonální a matice Bk diagonální (platí dokonce Bk = -/, kde / je jednotková matice). Hledaný JV-dimenzionální vektor lze přitom psát blokově ve tvaru kde uk jsou (ri — l)-dimenzionální vektory dané rovnicemi (2.115) Ufc = [lil1n-t,...,un-l1n-«]T1 t=l,...,n-l. V případě obecnějších diferenciálních rovnic druhého řádu bude struktura matice A v podstatě zachována, matice At a Bk ve vyjádření (2.112) však nebudou konstantní a v případě obecnějších oblastí bude i jejich řád záviset na indexu k. To byl také důvod, proč jsme psali ve vzorci (2.112) indexy, i když v našem speciálním případě je to zbytečné, neboť všechny matice Ak i Bk jsou zde stejné. V případě rovnice čtvrtého řádu lze většinou matici A uvést na blokově pětidiagonální tvar. Ať už jde o rovnici druhého či vyššího řádu, je volba očíslování neznámých podstatná a kdybychom ji provedli náhodně, dostali bychom matici, která by byla sice řídká, tj. obsahovala by mnoho nulových prvků, avšak ty by v ní byly rozmístěny náhodně. V případě nami zvoleného očíslování je však matice A nejen řídká, ale dokonce pásová a přitom žádným jiným očíslováním neznámých nelze dosáhnout menší šíři pásu. Možnost takového očíslování neznámých je pro matice vznikající v metodě sítí typická. V následujících odstavcích stručně popíšeme některé konkrétní metody řešení soustavy (2.111). 272 273 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU 2 METODA SlTl 2.3.1 Přímé metody K řešení soustavy (2.111) lze v zásadě užít všechny běžné varianty Gaussovy eliminační metody. Vzhledem k tomu, že matice A je symetrická a pozitivně dcfmitní, lze užít eliminační metodu bez výběru hlavního prvku a využít tak skutečnost, že matice je pásová. To vede k podstatné redukci počtu potřebných operací i počtu paměťových míst. (Počet násobení je např. řádově roven 0(l/fc4) oproti 0(l/h6) bez využití pásovosti matice A.) Speciální strukturu matice A však můžeme využít také přímo: Se soustavou (2.111), kterou lze psát blokově ve tvaru (2.116) 8i o e„ "i Bn_2 A>-lJ L«n-1 9i . 9n-l -1 budeme manipulovat přesně tak, jako kdyby veličiny Aj, B;, resp. u,, gt nebyly matice, resp. vektory, ale čísla. Tento postup vede k následujícím rekurencím (srv. vzorce (3.138), (3.152) a (3.153) z kap. II). Nejprve vypočteme matice Dk (řádu n — 1) z rovnic (2.117) Di = Au Dt=Ak- Bt-iD^St-i, k.= 2.....n - 1, pak (n - l)-dimenzionální vektory ck z rovnic (2.118) c0 = g0, ck — gt — Si-iD^jCjj-i, a konečně neznámé vektory uk z rovnic k = 2,.. (2.119) "n-l = D„_1C„-l, 1-1 uk = Dk l(ck - Bkuk+1), fc = R-2,...,l. Postup popsaný rovnicemi (2.117) je co do počtu operací ekvivalentní Gaussově eliminační metodě a lze jej bez obtíží provést, neboť postupně vznikající matice Dk jsou pozitivně definitní, takže matice k nim inverzní lze konstruovat trojúhelníkovým rozkladem bez výběru hlavního prvku. Zároveň je také vidět, že tento postup lze s mírnými modifikacemi užít i u obecnějších úloh druhého řádu. V případě rovnic čtvrtého řáduje přirozeně třeba užít rekurence typu (3.207) až (3.209) z kap. II. 274 Užití eliminační metody k řešení velkých soustav typu (2.111) často usnadní, lze-li matici A psát blokově ve tvaru (2.120) A = P\ 0 0 \ 0 L Oi Qí 0 Pn-2 Ql_ Qn-2 kde Pk jsou symetrické pozitivně definitní matice. Pro matici A pak platí (2.121) A = MM7, kde M je dolní trojúhelníková matice tvaru (2.122) M-i. 0 0 ••- 0 L Ni M„_2 /V„-2 0 Mn-1 a matice Mk a Nk splňují rovnice (2.123) (2.124) NkM? = Qh, fc = l,...,n-2, fc = l,. .,n-2, (2.125) = P„_, - A/iň/r - ... - A/„_2/VnT_2. Matice Mk lze tedy pro k = 1,..., n - 2 sestrojit Choleského metodou nezávisle jednu na druhé. Z rovnic (2.124) se pak určí matice N], pro k = 1,..., n—2 akonečně z rovnice (2.125) — opět Choleského metodou — matice M„_t. Řešení původní soustavy se pak zřejmě (viz rovnici (2.121)) dostane řešením rovnic (2.126) Mv = g, = v. Popišme jednu z možností, jak očíslovat uzly sítě tak, aby matice A soustavy (2.111) byla tvaru (2.120). Tento postup lze užít i v případě obecného pětibodového schématu (2.4). Předpokládejme, že platí n - 1 = rm, kde r a m jsou celá čísla, a rozdělme nejprve všechny vnitřní uzly do r2 + 1 skupin takto: Do první skupiny 275 T III. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU dáme uzly (kh, sh), pro něž je k = 1,..., m-1 a s = 1,..., m- 1; do druhé skupiny dáme uzly, pro něž je * = 1,..., m - 1 a s ~ m + 1,..., 2m - 1 atd. až do r-té skupiny dáme uzly, pro něž je k = 1.....m— ls» = (r - l)m + 1,..., rm — 1; do (r + l)-ní skupiny dáme uzly, pro něž je * = m + 1,.... 2m — 1 a s = 1,..., m — 1 atd. až do (2r)-té skupiny dáme uzly, pro něž je fc = m + 1,..., 2m - 1 a s — (r- - l)m + 1.....rm - 1 atd. až do r2-té skupiny dáme uzly, pro něž je k = (r - - l)m + 1,..., rm - 1 a a = (r- l)m + 1,..., rm - 1; do (r2 + l)-ní skupiny dáme všechny zbývající uzly. Uzly z první skupiny očíslujeme prvními (m - l)2 indexy, uzly z druhé skupiny druhými (m — l)2 indexy atd. Za předpokladu, že platí A* - D a Bt - - T pro k = 1.....n - 1, kde D a T jsou třídiagonálnf matice, že je n = 2,+1 a že matice D a T komutují, lze soustavu (2.111) řešit velmi efektivně metodou zvanou metoda cyklické redukce. Postup je následující: Položme pro i — 0,. ., e (2.127) Di = n[D-2cosí^lT], T = l Ti = T2' a vypočtěme pro i = 1,..., s rekurentně vektory g^ (2.128) s/ť) = t,^z\} + Di-i^-15 + 7;_1?£;i>, i = l,...,2'+1-'-l, přičemž klademe jí°' = pro i = 1,..., 2*+1 — 1. Dále řešme soustavu (2.129) D,Ulw==Sl(,) Konečně pro i = s — 1,. ., 0 položme (2.130) «iť) = "/í+1). j = l,...,2*-'-l, „(0 _ „CO _ n a řešme soustavy (2.131) DiU^^TiU^ + g^+TiU^, j = 0,...,2'-i-l. Výsledné vektory u^°\..., o^ľ+i.i jsou řešením soustavy (2.111). Provádíme-li součiny matic a vektorů na pravé straně rovnic (2.128) a (2.131) opakovaným násobením třídiagonálními maticemi D — 2 cos ((2r - l)7r/2'+1) T a T a řešíme-li soustavy (2.131) tak, že opakovaně řešíme soustavy s třídiagonálními maticemi O — 2 cos ((2r - 1)tt/2'+1)T, je počet potřebných operací řádově roven číslu (n - l)2 ln(n - 1), tedy až na faktor ln(n - 1) počtu rovnic. Popsaný postup 276 2 METODA SÍTÍ redukuje tedy počet potřebných operací ve srovnání např. s Gaussovou eliminací velice výrazně. Upozorněme, že uvedené vzorce jsou správné i v případě, že D a T jsou libovolné, ne nutně třídiagonální matice řádu (n — 1), jen když komutují. V tomto případě už však nebude počet potřebných operací tak výhodný jako výše. Jedna z obtíží spojených s užitím přímých metod k řešení rovnic vznikajících v metodě sítí spočívá v potřebě vysokého počtu paměťových míst i v případě, že příslušná matice má velmi mnoho nulových prvků. Při těchto metodách se totiž, ať už přímo nebo nepřímo, konstruuje trojúhelníkový rozklad dané matice, a vzniklé trojúhelníkové matice mohou obsahovat nenulové prvky i v těch místech, kde výchozí matice nuly měla. Stoneova metoda neúplného rozkladu redukuje podstatně počet potřebných paměťových míst. Vychází z toho, že se postupuje přesně podle vzorců pro trojúhelníkový rozklad obecné matice, prvky příslušných trojúhelníkových matic se však počítají pouze v těch polohách, které odpovídají polohám nenulových prvků původní matice, a jinde se kladou nuly. Součin takto vzniklých matic se pak přirozeně nerovná původní matici, přesto však mohou tyto matice sloužit za východisko k velmi efektivním algoritmům. Do dalších podrobností nebudeme zacházet a odkazujeme čtenáře na specializovanou literaturu (viz např. Stone (1968)). Nakonec se zmíníme ještě o jedné skupině přímých metod, které se v poslední době intenzivně vyvíjejí a které se snaží zužitkovat tu skutečnost, že jednoduché rovnice vznikající v metodě sítí umíme velmi efektivně řešit, je-li i daná oblast jednoduchá (viz např. metoda cyklické redukce). Základní myšlenku těchto metod popíšeme jen ve velmi hrubých rysech. Nechť je např. třeba řešit soustavu (2.110), avšak na složitější oblasti, než je čtverec. Pak tuto oblast vnoříme do vhodného čtverce a v uzlech, které přitom přibudou, dodáme další rovnice typu (2.110). Pravé strany pro ně získáme řešením vhodné soustavy lineárních rovnic, která sice bude mít plnou matici, ta však bude nízkého řádu. Řešení původního problému se tak převede na řešení malé soustavy s plnou maticí a na řešení soustavy, kteTá má zhruba tolik neznámých (ve skutečnosti o něco více) jako původní soustava, avšak kterou je možné vyřešit velice rychle. Podrobnější poučení o metodách tohoto typu nalezne čtenář např. v článku Proskurowského a Widlunda (1976). 2.3.2 Iterační metody Přímé metody jsou pro řešení diferenčních rovnic většinou uspokojivé, jsou-li vůbec proveditelné, tj. zejména tehdy, nezabrání-li jejich užití nedostatečná paměťová kapacita počítače, který máme k dispozici. Proto se v souvislosti s metodou sítí (a také v souvislosti s metodou konečných prvků, jak uvidíme) užívají podstatně častěji než v případě jednodimenzionálních úloh iterační metody. Ze skupiny tzv. maticových iteračních metod jsou nejběžnější Gaussova-Seidelova metoda, superrelaxační metoda (metoda SOR) a různé varianty metod střídavých směrů. Z gradientních metod. 277 - III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU tj. metod, které vycházejí z myšlenky minimalizace kvadratické formy (2.132) Q(u) = \uTAu- uTg, (jejíž minimum je v případě, že matice A je symetrická a pozitivně definitní, řešením soustavy (2.111)), je to pak zejména metoda sdružených gradientů, která je v poslední době značně populární. Všimněme si proto zmíněných metod poněkud podrobněji. Připomeňme, že superrelaxační metoda je dána vzorcem (2.133) u<*+1> =/ki/W+Cs, s maticemi K,aQ, definovanými rovnicemi Hu = (D-uL)-1[(l~w)D+uU] (2.134) (2.135) přičemž je (2.136) du = u(D — uĽ)~ A = D-l-U, kde D je diagonální matice, i dolní trojúhelníková a U horní trojúhelníková matice, obě s nulami na hlavní diagonále au je číselný paTametr zvaný relaxační faktor. Gaussovou-Seidelovu metodu dostaneme pak pro 0) = 1. Matice soustavy (2.111) má v každém řádku kromě diagonálního prvku už jen nanejvýš čtyři nenulové prvky. K výpočtu jedné iteTace je tedy zapotřebí řádově tolik operací, kolik složek má hledaný vektor. Protože pracujeme stále s toutéž původní maticí, počet potřebných paměťových míst je dán počtem jejích nenulových prvků a přirozeně dimenzí hledaného vektoru. To je také hlavní výhoda nejen superrelaxační metody, ale vlastně všech iteračních metod oproti přímým metodám. Připomeňme také, že je-li 0 < w < 2 a je-li matice A symetrická a pozitivně definitní, je superrelaxační metoda konvergentní. Dále připomeňme, že je-li matice A dvoucyklická (tj. existuje-li permutační matice P taková, že matice PTD"1(L + + U)P je tvaru (2.137) 0 S21 r?i2 0 kde nuly znamenají čtvercové nulové matice) a konzistentně uspořádaná (tj. nezávisí-li vlastní čísla matice B(a) — aD~xL + a~1D~1U, a ^ 0 na parametru a), je možno superrelaxační metodu optimalizovat, tj. je možno nalézt takové číslo w0pt, 0 < uopt < 2, že platí (2.138) 278 2 METODA SÍTÍ přičemž optimální relaxační faktor je dán vzorcem (2.139) u, 1 + [i-e2(D-i(i + (y))]1/2' Konečně připomeňme, že platí (2140) e!(D-1(i+y)) = e(Hi), takže číslo £2(D_1(/. + U)) je spektrální poloměr Gaussovy-Seidelovy iterační matice a že pro spektrální poloměr optimalizované superrelaxační metody je (2.141) 0(H ,_i-[i-g2(D-1q + ^))]1/3 Ukažme, že v případě naší modelové úlohy příslušná matice (tj. matice soustavy (2.111)) do výše popsané třídy patří. Matice D ~1(L+ U) vznikne z matice A zřejmě tak, že se její diagonální prvky nahradí nulami, u nediagonálních prvků se změní znaménko a vydělí se čtyřmi. Vynásobit matici D ~1(L+ U) zleva maticí PT a zprava maticí P, kde P je permutační matice, znamená přečíslovat neznámé v příslušné soustavě rovnic a změnit odpovídajícím způsobem pořadí rovnic. Přečíslujme neznámé „šachovnicově", tj. v případě, že n je liché, číslujeme ty neznámé, kde součet k+s je lichý, postupně zleva doprava a shora dolů indexy 1,2,..., (n-l)2/2 a ty neznámé, kde součet k+s je sudý, indexy (ra — l)2/2+l,..., (n —l)2; v případě, že n je sudé, užijeme pro ty neznámé, kde součet k + s je sudý, indexy 1,..., [(n —1)2 +1]/2 a pro ty neznámé, kde součet k + s je lichý, indexy [(n — l)2 + l]/2-rT,..., (n — l)2. Přerovnáme-li odpovídajícím způsobem i rovnice, dostaneme soustavu, jejíž matice je zřejmě tvaru (2.137). Matice A je tedy dvoucyklická. Abychom dokázali konzistentní uspořádanost matice A, uvažujme libovolné vlastní číslo A matice D~1(L+U). Je-li i>£, jemu odpovídající vlastní vektor apoložíme-li "Oj = Vni = 0 pro ■ = 1,..., n — la vito. = «kn = 0 pro k = 1,..., n - 1, platí (2.142) + «4+1,« + "M+i + «M-l = 4A"*« pro k, s = 1,..., n—1. Vynásobíme-li každou z těchto rovnic číslem a*""', dostaneme (2.143) í(i-1)-'.t.1]1 + ra'-<,+%í,!+1+ a a Číslo A je tedy také vlastním číslem matice B(ct) = aD~1L + a~lD~lU (a odpovídající vlastní vektor je ct*-'ujfc,). Snadno se už zjistí, že každé vlastní číslo matice B(a) se dostane popsaným způsobem. Vlastní čísla matice B(ce) tedy skutečně nezávisí na a a matice A je konzistentně uspořádaná. Při řešení soustavy (2.110) superrelaxační metodou platí tedy vzorce (2.139) a (2.141). Speciální případ této soustavy umožňuje také ilustrovat, co se skutečně získá na rychlosti konvergence užitím optimalizované superrelaxační metody. 279 III. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU Rychlost konvergence budeme přitom měřit, jak je zvykem, velikostí spektrálního poloměru příslušné iterační matice. Snadno se zjistí, že čísla A„M daná vzorcem (2.144) — k\ cos--Hcos— i v,u — 1,... ,n - 1, * \ n n J jsou všechna vlastní čísla matice D_1(í. + U). Plyne to totiž z toho, že vektory ir("''í), jejichž souřadnice jsou dány vzorci (2.91) a které tvoři úplnou soustavu vlastních vektorů matice z odst. 2.2, jsou zároveň vlastními vektory matice D"1(/.+ U). Je tedy (2.145) a tedy také (2.146) g(D~l(L + U)) =cos- = costt/i = 1- 0(h2), g(H1) = g2(D-\L+ U)) = í-0(h2). Odtud a ze vzorce (2.141) však plyne, že platí (2.147) ?(W^P.) = 1 - O(h). Spektrální poloměr optimalizované superrelaxační metody je tedy pro malá h skutečně podstatně menší než spektrální poloměr Gaussovy-Seidelovy metody. Při praktickém užití superrelaxační metody se postupuje obvykle tak, že se výpočet zahájí Gaussovou-Seidelovou metodou a po výpočtu několika iterací se odhadne spektrální poloměr příslušné iterační matice H\ mocninnou metodou. Tato aproximace se pak užije ve vzorci (2.139), do něhož se dosadí ze vzorce (2.140). Rešíme-li obecnější eliptickou rovnici druhého řádu na čtverci nebo obdélníku, jehož strany jsou tvořeny přímkami sítě, je příslušná matice rovněž dvoucyklická a konzistentně uspořádaná, takže vzorec (2.141) lze užít i v tomto případě. Tohoto vzorce se však v praxi užívá i v těch případech, kdy nevíme, zda skutečně vede k minimální hodnotě spektrálního poloměru. Alternativně se při užití superrelaxační metody postupuje také tak, že se v situaci, kde se řeší celá velká skupina problémů podobného charakteru, určí optimální relaxační faktor experimentálně v jednom případě a v dalších případech se užije takto získaná hodnota. Gaussovu-Seidelovu i superrelaxační metodu (a i mnohé další maticové iterační metody) lze realizovat v tzv. blokové podobě.. Stručně řečeno to znamená, že matice dané soustavy se rozdělí na bloky tak, aby diagonální bloky byly regulární čtvercové matice a iterace se konstruují podle stejných vzorců, jaké byly uvedeny výše s tím, že skaláry, které se v nich vyskytují, je třeba pokládat za vektory, resp. matice. To mimo jiné znamená, že kdekoliv se v těchto vzorcích vyskytuje dělení, je třeba je chápat jako násobení příslušnou inverzní maticí. Tyto blokové iterační metody mohou být v naší speciální situaci výhodné, neboť bloková struktura matice A soustavy (2.111) je velice jednoduchá. Předpokládáme-li, že tato soustava je zapsána ve tvaru (2.116), Gaussova-Seidelova bloková metoda dána vzorcem (2.148) = V(w-ft-i«£í (i+l) . k= l,...,n r 2 METODA SlTl Podobně bloková superrelaxační metoda je dána vzorcem (2.149) u^+1^uAh-\3k Bk.lU^-Bku^) + (l-U)u^, k ~ 1,..., n — 1. Pro výpočet je výhodnější přepsat rovnice (2.149) v ekvivalentním tvaru (2.150) Akú^ = (>+i) /-fi+i) (0\ , (0 Je-li bloková matice A dvoucyklická a konzistentně uspořádaná tyto pojmy se definují úplně stejně jako dříve — platí pro optimální relaxační faktor vzorec (2.139). Matice D, í. a U v tomto vzorci jsou samozřejmě matice dané vztahy (2.151) D = Ax 0 0 0 An- L = 0 ... Si • 0 0 B„-2 0\ 0 0 Vzhledem k tomu, že popsané blokové metody lze upravit tak, že provedení jedné iterace u nich nevyžaduje více početních operací než výpočet jedné iterace u dřívějších metod (kterým se v této souvislosti říká bodové iterační metody), a vzhledem k tomu, že konvergují většinou rychleji než metody bodové, jsou dosti vážnými kandidáty na univerzálně použitelné metody pro řešení rovnic, které vznikají při metodě sítí. Další metoda, která se zdá vhodná pro řešení diferenčních rovnic, je Peacemanova-Rachfordova metoda střídavých směrů. Abychom ji popsali v případě modelové soustavy (2.110), pišme matici A této soustavy ve tvaru (2.152) A= H+ V, 280 281 III. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU kde H a. V jsou matice řádu (n — l)2 definované vzorci í (2.153) (2.154) V = C 0 ...... o o '■■ ■ : 0 0 ...... 0 c 2lr -L 0 ... -Ir 0 0 -Ir 0 -lT 2/r v nichž lr je jednotková matice řádu n — 1 a <T je třidiagonální matice řádu n — 1 daná rovnicí 2-10 -1 '•-0 ''. (2.155) 0 '■. -1 -1 2 J Peacemanova-Kachfordova metoda je pak dána dvojicí vzorců (2.156) (uJ + H),,^1/2) = (a.,-/ - v>« + g, (uil+V)i/<i+1> = {u>il - H )uV+1M + g, i = 0,1,..., kde / je jednotková matice řádu (n — l)2 a na vektor u í'+1/2) je třeba se dívat jako na mezivýsledek. Rozklad (2.152) vznikne tak, že píšeme levou stranu rovnice (2.110) ve tvaru (-«i-i,. + 2ut< —uj,+ljJ)+(-«n,,_i+2«t,—«i,,+i), matici H vytvoříme z prvního sčítance a matici V z druhého sčítance. 2 METODA SlTl Pro matici <j,7 + H na levé straně první rovnice (2.156) platí (2.157) Uil+H: w,/r + C 0 ... 0 0 '•■ : 0 0 ... 0 Uilr + C takže je to blokově diagonální matice. Položíme-li tedy (2.158) „G+i/iJ = [uii+mT, »„(Í+,1/2)T]T. (uir~V)uM + g = {v1T,...,v?_1f, rozpadne se první soustava ve vzorci (2.156) na n — 1 soustav (2.159) (4tC)jJí+1/!) = «, fc = l,...,n-l, s třídiagonálními maticemi. Vektory u5'+1'S , z nichž je sestaven vektor i/í,+1/2), můžeme tedy pohodlně a velmi ekonomicky vypočítat Gaussovou eliminací pro třidiagonální matici. Výpočet vektoru u('+1/2) tak vede na řešení n — 1 soustav s třídiagonálními maticemi pro n — 1 neznámých. Všimněme si přitom, že vzhledem k použitému očíslování složek hledaného vektoru u představuje vektor u^'+1''2' hodnoty přibližného řešení na přímce y — (n — k)h rovnoběžné s osou x. Uvědomíme-li si, že matice utl + V je blokově třidiagonální, přičemž jednotlivé bloky jsou diagonální matice, je zřejmé, že očíslujeme-li nyní na rozdíl od předchozího výkladu neznámé v soustavě (2.110) po sloupcích odshora dolů a odleva doprava, lze matici Ulil + V psát ve tvaru (2.160) mil + V = Uilr + C 0 0 iúilr + C tj. zcela stejně jako matici a>;/ + H. Druhá soustava ve vzorci (2.156) se tedy rozpadne na n — 1 soustav (2.161) M+0<Í+1>: w*, * s 1, 1, s třídiagonálními maticemi a výpočet vektoru vede opět na řešení n 1 soustav o n — 1 neznámých s třídiagonálními maticemi. Zdůrazněme však ještě jednou, že vektor uí!+1) je rozdělen na bloky jinak než vektor u^'*1/2) a jeho složka Ujji+1' značí nyní hodnoty přibližného řešení na přímce x — kh rovnoběžné s osou y. Složky vektoru přibližného řešení tedy počítáme v prvním půlkroku metody (2.156) postupně po přímkách rovnoběžných s osou isv druhém půlkroku po přímkách rovnoběžných s osou y. Odtud také pochází název metody, 282 283 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU 2 METODA SlTl Vezmeme-li v úvahu způsob, kterým jsme došli k maticím V a H v rozkladu (2.152), je snadné zobecnit metodu střídavých směrů i na podstatně obecnější diferenciální rovnici (2.1) s okrajovou podmínkou (2.68) v obecné oblasti íí. Dokonce není ani nutné omezit se na rovnoměrnou síť. Matice C a lr v rovnicích (2.153) a (2.154) nebudou ovšem konstantní a v případě obecné oblasti nebudou dokonce ani stejných řádů, jejich třídiagonální, resp. diagonální struktura však zůstane zachována. Z algoritmického hlediska bude tedy výpočet jednotlivých iterací probíhat stejně jako v popsaném příkladě. Rovnice (2.156) představují nestacionární iterační metodu, kde čísla (zvaná iterační parametry) se mohou od iterace k iteraci měnit a je třeba je volit tak, aby konvergence byla co možná nejrychlejší. Obvykle se postupuje tak, že pro každých m po sobě jdoucích iteracích se za ně bere konečná posloupnost čísel u>;, i = — 0,..., m — 1. Iterační parametry se tedy periodicky opakují. Pro ilustraci uveďme bez zdůvodnění některé volby iteračních parametrů, které byly v literatuře navrženy. Položíme-li m = 1, je u,- = o> pro každé i a optimální hodnota iteračního parametru je dána vzorcem (2.162) "opt — 4 sin — eos —. In 2n Metoda střídavých směrů konverguje v tomto případě asi tak rychle jako optimalizovaná superrelaxační metoda. Protože však její provedení vyžaduje více početních operací, než je tomu u superrelaxační metody, nelze tuto její variantu příliš doporučit. Podstatné zlepšení rychlosti konvergence Peacemanovy-Rachfordovy metody střídavých směrů lze dosáhnout až teprve tehdy, připustíme-li m > 1, tj. užijeme-li více iteračních parametrů než jeden. Byla navržena celá řada postupů, jak tyto parametry volit, a v současné době je této problematice věnována už rozsáhlá literatura. Jedna z možností, jak určit nejen dobré parametry, které jsou v případě výše uvažované modelové úlohy blízké optimálním parametrům, ale i jejich počet, tj. číslo m, pochází od Douglase. Číslo m se při tomto postupu určí jako nej větší celé číslo, pro něž platí nerovnost (2.163) /2'/2 + l I2V2 l\m . 2 7t l) Sm Yn S cos —, 2n' a iterační parametry oij se pro i = 0.....m — 1 počítají ze vzorců (2.164) nebo ze vzorců (2.165) 2l/2 + lV , 4 ľľ'* + 1\ U* ~ 2l/2_ll21/2-lJ 2n 4 /21/2-ly 2 tv W' = 5T7ŠTlV2WlJ C°S 2r7 Ačkoliv z teoretického hlediska jsou obě tyto možnosti rovnocenné, praktické zkušenosti naznačují, že druhá volba vede k větší rychlosti konvergence. 284 Jiná posloupnost iteTačních parametrů pochází od Wachspresse a je dána vzorcem 4cos2f- kde m je nejmenší celé číslo, pro něž platí nerovnosti (2.167) m>2, (21/2 - l)"-1 < tg^-. 2n Příznivé vlastnosti všech uvedených voleb iteračních parametrů jsou dokázány za předpokladu, že matice H a V v rozkladu (2.152) komutují. Je-li tento předpoklad porušen (napr. proto, že daná oblast není čtverec, nebo že koeficienty dané rovnice nejsou konstantní), bere se často za posloupnost iteračních parametrů posloupnost, která se získá pro modelovou úlohu na nejmenším čtverci obklopujícím danou oblast. I když teoretické zdůvodnění zde není k dispozici, dochází při tomto postupu ve srovnání např. se superrelaxační metodou k podstatnému urychlení konvergence. Poznamenejme ještě, že existuje celá řada variant metody střídavých směrů. Tak např. poměrně častá je tzv. lokálně jednorozměrná metoda, která vychází opět z rozkladu (2.152) a v níž se iterace počítají z dvojic vzorců {uil + r/)u(,+1/2> - (u>il - H)u« + 3l, ((*/ + V)u(,+1) (<j,-/ V)i/(i+1/2) 4. g2. (2.168) Při užití těchto vzorců se postupuje podobně jako u Peacemanovy-Rachfordovy metody. Upozorněme také, že metodu střídavých směrů lze užít i pro řešení diferenčních rovnic, které vzniknou diskretizací m-dimenzionálních úloh, kde m > 2. V tomto případě se rozkládá matice na m sčítanců, z nichž každý odpovídá náhradě derivací ve směru jedné souřadnicové osy, a jedna iterace se skládá z m dílčích kroků. Uveďme končené ještě dvě iterační metody, jejichž teoretický výzkum je v současné době velmi intenzívní a není ani zdaleka ještě ukončen, pro něž však existuje řada indikací, že by mohlo jít o vůbec nej efektivnější metody pro řešení soustav lineárních rovnic, které vznikají v metodě sítí nebo v metodě konečných prvků. První z nich, metoda sdružených gradientů, slouží k přibližnému řešení soustavy Au = g se symetrickou pozitivně definitní maticí. Je to, jak už jsme uvedli výše, gradientní metoda, v níž se kvadratická forma Q daná rovnicí (2.132) minimalizuje postupně ve směrech v^'\ které vzniknou A-ortogonalizací vektorů reziduí. Příslušné vzorce jsou (2.169) = 9 AUW, vCYTAvW + ohv CO 285 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU v(i)TAr(,+l) Tato metoda má pozoruhodnou vlastnost, že za předpokladu, že se nedopouštíme zaokrouhlovacích chyb, vede po N krocích (N je řád matice A) k přesnému řešení. Nejde tedy v přesném slova smyslu o iterační metodu, přesto se však jako taková užívá, neboť ve speciálních případech, zejména při užití na diferenční rovnice vznikajících v metodě sítí a v metodě končených prvků, dává často řešení s požadovanou přesností mnohem dříve než po N iteracích. Efektivitu metody sdružených gradientů je možné podstatně zvýšit úpravami matice A, které mají zhruba řečeno za cíl vhodně modifikovat její spektrum. V tomto případě se pak mluví o před-podmíněné metodě sdružených gradientů. Jde však o postupy dosti komplikované, takže do podrobností nelze v tomto elementárním textu zacházet. Další iterační metoda, o níž se zde chceme zmínit, je metoda více sítí (multigrid method). Tuto metodu nelze jednoduše zařadit do žádné z výše zmíněných skupin iteračních metod a ani její teoretické fundování není dosud zdaleka ukončeno a v mnoha jejích variantách se zatím postupuje intuitivně. Proto naznačíme její základní myšlenku jen v těch nejhrubších obrysech, aniž bychom se sebeméně snažili udat nějaký konkrétní návod ke skutečnému počítání. Důvod, proč o ní vůbec mluvíme, je ten, že chceme čtenáře upozornit, že vůbec nějaká taková metoda existuje. Metoda vychází z toho, že řešení soustavy (2.111) představuje přibližné řešení dané diferenciální rovnice na síti JfW, které pro h —> 0 konverguje k přesnému řešení. Proto, je-li h malé, jsou řešení této soustavy při integračním kroku h, 1h,... v těch uzlech, které jsou společné sítím KW, JrW.....blízká. Této skutečnosti metoda více sítí využívá tak, že ke konstrukci zlepšené aproximace na síti se užije kombinace nějaké jednoduché iterační metody (např. Gaussovy-Seidelovy metody nebo metody sdružených gradientů) a oprav, které se vypočtou interpolací přibližného řešení z hrubší sítě na jemnější síť. Přibližné řešení na hrubší síti se získá snáze a lze to učinit např. zase tak, že se naznačeným způsobem užije ještě hrubší síť. Zakončeme tuto stručnou poznámku o metodě více sítí, že k tomu, aby byla skutečně efektivní, je třeba její dobrá implementace na počítači. 2.4 Obecné otázky konvergence a odhadů chyb při metodě sítí V tomto odstavci popíšeme stručně princip konvergenčních důkazů pro metodu sítí. Začneme tím, že zformulujeme problém řešení okrajové úlohy metodou sítí abstraktně. 2.4.1 Základní pojmy teorie diferenčních schémat Buď dána oblast Q s hranicí ľ. Vyšetřujme diferenciální rovnici (2.170) Lu = / vň, 286 2 METODA SlTl kde u je hledaná funkce, / daná funkce a L lineární diferenciální operátor, s okrajovými podmínkami (2.171) tu = (pi na ľ{, 1 = 1,..., s. Zde ľ{ jsou nějaké části hranice F, <pi funkce zadané na li a /; lineární operátory přiřazující dané funkci u funkci definovanou na množině Ji. Poznamenejme, že množiny f; nemusí být pro různá i disjunktní. Stejně tak není nutné, aby sjednocení množin F; vyčerpalo celou hranici f oblasti Q. Tak např. v případě okrajových podmínek (2.74) pro biharmonickou rovnici (2.73) je s = 2, J\ = F2 = ľ, liu = u a l2u = dujQv. Budľ dále k libovolnému h > 0 dána v uzavřené oblasti Ú nějaká konečná množina bodů, kterou nazveme sítí a označíme fiW, a buď L\ lineárni operátor, který funkci vfJ1) definované na síti přiřazuje funkci L^vW definovanou na nějaké podmnožině fiW množiny Í)W Množinu ííW nazveme množinou vnitřních uzli sítě fiM. Buď konečně lf-h\ i = 1,..., s, operátor, který funkci uW definované na fi(*> přiřazuje funkci /ťWtí« definovanou na množině lih) C ňw, lf°nííW = 0, operátor, který funkci ipt uvažované na množině F^\ což je konečná podmnožina množiny ľi, přiřazuje funkci A^ipi definovanou na množině r^h\ Uzly z množiny Uí=i ^í*^ nazveme hraničními uzly. V dalším budeme předpokládat, že platí uf=1 r/*5 u n(*> = {*(*>. Uvažujme nyní diferenční rovnici (2.172) = /, jejíž pravá strana je definována na množině fiW vnitřních uzlů a je tam rovna hodnotám pravé strany diferenciální rovnice (2.170), s okrajovými podmínkami (2.173) //Mu<k) = A?V, i = l,...,s. Každá rovnice (2.173) představuje končené mnoho rovnic pro uzly z množiny a rovnice (2.172) konečně mnoho rovnic pro uzly z množiny ílW, takže soustava (2.172) s okrajovými podmínkami (2.173) tvoří soustavu lineárních rovnic pro určení hodnot neznámé funkce v uzlech sítě Q(h\ Diferenční rovnice (2.172) s okrajovými podmínkami (2.173) je tedy konečnědimenzionálním analogem diferenciální rovnice (2.170) s okrajovými podmínkami (2.171). Operátory v rovnicích (2.173) vlastně představují způsob, jakým se převádějí dané okrajové podmínky do uzlů sítě fiW. Tak např. pro přepis Dirichletových okrajových podmínek pro rovnici (2.1) pomocí lineární interpolace je s = 1, množina /j je množina uzlů typu A z obr. 2.2a, množina je množina bodů typu C z téhož obrázku a je (2.174) (/^uXA) = vSh\A) „CO (s), (AÍ*V)tA) ■ 1 + <T V{C). 287 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU 2 METODA SlTl Poznamenejme, že podobně obecně jako v případě okrajových podmínek bychom mohli převádět do sítě i pravou stranu dané diferenciální rovnice. Na výše uvedený speciální případ, kdy pravé straně dané diferenciální rovnice přiřazujeme funkci definovanou na síti jejími funkčními hodnotami v uzlech sítě, jsme se omezili proto, že je v praxi daleko nejčastější a nejužívanější. 2.4.2 Obecné věty o konvergenci metody sítí Máme-li dokázat konvergenci metody sítí nebo sestrojit odhad její chyby, je třeba posoudit velikost rozdílu u^ — u. K tomu cílije třeba nějakým způsobem normovat funkce, které vystupují v našich úvahách. Buď tedy U normovaný prostor funkcí definovaných v O a takových, že pro každou funkci u £ U mají smysl výrazy Lu a /,-u. Buďte dále F, resp. i — 1,..., s, normované prostory funkcí definovaných na íí, resp. na J; a takových, že pro u £ U platí Lu £ F a ku £ <ř,-. Analogicky je normovaný prostor funkcí definovaných na fiW a t resp. jsou normované prostory funkcí definovaných na fiW, resp. F^h\ přičemž pro u^) £ {/W a f>i £ £ íi platí UuW 6 FW, //^uW £ *ÍÄ) a A^Vi £ *[A). Předpokládejme, že každá funkce u £ U, resp. / £ F je jako funkce definovaná pouze na množině ÍJM, resp. íiW prvkem prostoru U(-h\ resp. fW, Pak mají smysl výrazy LhU a //'"'u. Předpokládejme dále, že normy zavedené v prostorech, které jsme právě definovali, jsou takové, že pro každou funkci u £ U, f E F a ipi £ $; platí (2-175) MifW HMltr, ll/bw-» II/IIf, II^VíIIjw — INk pro ň; —ř 0. Následující definice shrnují požadavky, které je nutno klást na danou metodu sítí, aby bylo možné odvodit základní informace o její konvergenci. Definice 2.1. Řekneme, že diferenční rovnice (2.172) s okrajovými podmínkami (2.173) aproximuje diferenciální rovnici (2.170) s okrajovými podmínkami (2.171), platí-li pro každou funkci u £ (7 (2.176) \\Lu - M|FW -> 0, ||AÍft)(ííU) - //Ä)U||4,.) - 0 pro h —s- 0. Výrazy na levé straně rovnic (2.176) se nazývají lokální chyby dané metody. Definice 2.2. Řekneme, že aproximace diferenciální rovnice (2.170) s okrajovými podmínkami (2.171) diferenční rovnicí (2.172) s okrajovými podmínkami (2.173) je řádu p, exietují-li pro každou funkci u £ U konstanty M a M; tak, že platí (2.177) ||líí - U«||fw š MhP-, NM(H - 'íW«ll.jH- š Mih? 288 pro každé dostatečně malé h. Definice 2.3. Řekneme, že diferenční rovnice (2.172) s okrajovými podmínkami (2.173) je korektní (nebo stabilní vzhledem k vstupním datům), má-lí při libovolných pravých stranách / a <pi právě jedno řešení a existují-li konstanty N a Ní takové, že pro libovolnou funkci £ a libovolné dostatečně malé h platí (2.178) \\«W\U) g tflM^jw + ÉMlHW«Wll.ř>- • = 1 Korektnost diferenční rovnice (2.172) s okrajovými podmínkami (2.173) tedy vlastně značí spojitou závislost jejího řešení na pravé straně rovnice a okrajových podmínek. Poznamenejme, že uvažujeme-li diferenční rovnici (2.173) s homogenními okrajovými podmínkami (2.179) 4wuW = o a platí-li nerovnost (2.180) \\u^\\uM^N\\LhuW\\FW, mluvíme o stabilitě vzhledem k pravé' straně; podobně, uvažujeme-li homogenní tov-nici (2.181) LtuW = 0 s nehomogenními okrajovými podmínkami (2.173) a platí-li nerovnost (2-182) Il^lli/WŠÉ^H^^II*!1'- mluvíme o stabilitě vzhledem k okrajovým podmínkám. Analogicky lze také zavést pojem stability pouze vzhledem k některé okrajové podmínce. Diferenční rovnice je tedy korektní, je-li stabilní vzhledem ke všem okrajovým podmínkám a vzhledem k pravé straně. Zavedené pojmy dávají možnost zformulovat konvergenční větu pro abstraktní metodu sítí. Veta 2.8. Nechť u £ U je řešení diferenciální rovnice (2.170) s okrajovými podmínkami (2.171). Nechť diferenční rovnice (2.172) s okrajovými podmínkami (2.173) aproximuje diferenciální rovnici (2.170) s okrajovými podmínkami (2.171). Konečně nechť diferenční rovnice (2.172) s okrajovými podmínkami (2.173) je korektní. Pak platí (2.183) lim ||tí<*> - ullrjw = 0. h—*0 289 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU 2 METODA SÍTl Je-íi navíc řád aproximace roven číslu p, platí pro chybu přibližného řešení odhad (2.184) ||„W - ulítej g tf (MN + p MiN^j. Důkaz Z rovnic (2.170) až (2.173) plyne, že je (2.185) Lh(u(h) -u) = iAuW _ Lhu + Lu~Lu-Lu- Lhu a (2.186) t«(««-i0 = tW«W-4w«+Aří(4«)-AÍ*)(4«) = Ař>(4ii)-í*>ii. Odtud vzhledem ke korektnosti dané diferenční rovnice s danými okrajovými podmínkami dostáváme (2.187) ||U<fc) - ž JV||lä(„« - u)||fW 4- £M||4W(U(») U)||#ř, - (=1 = - MIfM 4- É^ll4Ä)('.-u) - '/"'"lUíM. Tvrzení věty nyní už snadno dostaneme užitím rovnice (2.187) a rovnic (2.176), resp. (2.177) z definic 2.1, resp. 2.2. Věta je dokázána. Předpoklady této věty lze ve speciálních situacích zeslabit. Je-li např. některá podmínka přepsána do diferenčního tvaru přesně, tj. je-li r/'1' C ľi, = ij a A-* Ví = Vi Pro některý index i, není třeba v předpokladu o korektnosti požadovat spojitou závislost na této podmínce. Upozorněme také, že bez podstatných obtíží lze zformulovat obdobnou větu pro obecný případ nelineární soustavy diferenciálních rovnic s nelineárními okrajovými podmínkami. Teoretické schéma, které jsme právě uvedli, se v podstatě ať už v té či oné podobě vždy používá při důkazu konvergence libovolné diferenční metody a při odhadu její chyby. Vždy je tedy třeba prověřit platnost požadavků (2.177) a (2.178), tj. vždy je třeba učinit si představu o velikosti lokální chyby metody — to většinou není příliš obtížné a často na to stačí pouhý Taylorův vzorec — a vyšetřit korektnost příslušného diferenčního přepisu, tj. vyšetřit spojitou závislost tohoto přepisu na okrajových podmínkách a na pravé straně. Tento poslední problém je už většinou podstatně obtížnější. U rovnic druhého řádu zde velmi pomáhá už vícekrát připomenutý princip maxima. U rovnic čtvrtého řádu, kde věta o maximu neplatí, si vypomáháme pozitivní definitností diferenčního problému, nerovnostmi, které, fyzikálně řečeno, bilancují energii soustavy popsané danou diferenciální rovnicí apod. Podaří-li se všechny tyto obtíže překlenout, dostáváme ve vzorci (2.184) odhad chyby užité metody. Tento odhad je však prakticky málo cenný, neboť bývá značně obtížné určit konkrétní velikost v něm vystupujících konstant (některé z nich závisí na vyšších derivacích hledané Funkce), kromě toho bývá vždy značně pesimistický. V praxi se proto k posouzení chyby užívá velice často metoda polovičního kroku, 290 o níž jsme hovořili v souvislosti s obyčejnými diferenciálními rovnicemi v kap. I. Teoretický podklad k jejímu užití dává následující věta. Věta 2.9. Nechť jsou splněny předpoklady věty 2.8 a nechť existují funkce ý &%l>i nezávislé na h tak, že pro dané řešení diferenciální rovnice (2.170) s okrajovými podmínkami (2.171) platí (2.188) lim \\h-"(Lu - Lhu) - J,\\fW tt 0, h—>0 lim \\h-»U4%u) - /,.(A)«] - A^iWtV = 0. Nechť dále v nějaké třídě V, na které diferenční rovnice (2.172) s okrajovými podmínkami (2.173) aproximuje diferenciální rovnici (2.170) s okrajovými podmínkami (2.171), existuje řešení okrajové úlohy (2.189) Lw - i>, liw = ýi, i = l,...,í. Paíc platí (2.190) lim ||n-',(uW u) w\\u[h) = o. h—*0 Důkaz. Za uvedených předpokladů platí pro d->0 (2.191) ||ia[a-p(uW - u) - HIIíW = \\h-"Lh(uW - u) _ Lhw +Lw- Lw\\FW g g \\k-rih(uW -u)- V-Hfw + \\Lw - Lhw\\FW = = \\h-r(LhuM - Lhu +Lu- Lu) - tP\\fM + \\Lw - Í-HIfím s \\h-"{Lu - Lhu) - VIIíw 4- ||líí) - Lhw\\FW -» 0 a (2.192) MW[fc-'(u«-«)-w]||.w = = \\h-"l^h\UW _ „) _ i.Ww + A^h\hw) - JvW(t«B)||,ř) á S [|fc-*4<*>(«tfcí - «) - ASfc)^||#{M+ + \\^h\liv>)-l}h)w\\^) = = \\h-"[l}h)uW - líh)u + 4h\l;u) - AÍ*>(4«)] - AÍhVi||^)+ 4- \\4h\li">) ~ tW»ll#fM = = Hh-^iliu) - l^u] - A(«*||#ř,+ 4- ||AÍ«(4w) - kW«hfl - 0 Z těchto rovnic a z korektnosti vyšetřovaného diferenčního schématu však už tvrzení věty ihned plyne. 291 III. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU Předpoklady této věty jsou obvykle splněny, je-li řešení daného diferenciálního problému dostatečně hladké. Vyjdeme-li z rovnice (2.190) a jsou-li u(Ä») a u(h*> dvě řešení diferenční rovnice (2.172) s okrajovými podmínkami (2.173) získaná užitím sítí c fiC"), kde hx = chi a c > 1, platí (jsou-li splněny předpoklady věty 2.9) (2.193) - u = wh? + cih*) a (2.194) -u = c-*wh\ + o(h{). VylouČíme-li z těchto rovnic přesné řešení u tak, že odečteme rovnici (2.194) od rovnice (2.193), dostaneme (2.195) U(M - = + "(K). Platí tedy (2.196) i/fcl> - u = -^—[„{äO u(M] + 0{h\). Zanedbáme-Ii ve vzorci (2.196) člen o{h\), který je vyššího řádu, než je řád chyby, dostáváme odhad chyby metodou polovičního kroku. K jeho získání je tedy třeba řešit daný problém dvakrát se dvěma různými hodnotami parametru k. Alternativně lze vzorce (2.196) užít také tak, že za přibližné řešení se bere funkce i/e) daná vzorcem (2.197) = _íL__u(A,) _J_u(*i). k ' cf - 1 cf - 1 Vzorec (2.197) dostaneme tak, že z rovnice (2.196) vypočteme přesné řešení ti a zanedbáme člen o(ftf). Tato funkce dá patrně přesnější aproximaci než kterákoliv z funkcí uC*1) a u(h*\ zbavíme se však možnosti odhadu chyby. Poznamenejme ještě, že postup, který vedl k rovnici (2.197), představuje první krok tzv. Richardsonoíiy extrapolace, jíž se někdy užívá v případě, že pro přibližné řešení lze odvodit asymptotický vzorec typu (2.198) tíW = u + uji/ip + w2h2p + ... 3 Variační metody Variační metody, které stručně popíšeme v tomto článku, jsou založeny na úplně stejných principech jako metody v čl. 4 z kap. II. Stejně jako tam se vychází ze skutečnosti, že řešení mnohých okrajových úloh pro parciální diferenciální rovnice eliptického typu je ekvivalentní úloze nalezení extrému integrálu, jehož Eulerovou rovnicí je daná diferenciální rovnice. Proto si nejprve stručně všimneme souvislosti [ 3 VARIAČNÍ METODY některých základních úloh pro eliptické parciální diferenciální rovnice s variačními úlohami. Omezíme se přitom převážně na dvoudimenzionální problémy. 3.1 Variační formulace okrajových úloh 3.1.1 Diferenciální rovnice druhého řádu Nechť je dána diferenciální rovnice (2.1) s Dirichletovou okrajovou podmínkou (2.29). Předpokládejme přitom, že koeficient p je kladný, koeficient q nezáporný a že hranice oblasti a funkce p, q, f a 7 jsou tak hladké, že existuje klasické řešení úlohy (2.1), (2.29). Při hledání funkcionálu, jehož extrémem je řešení této okrajové úlohy se opět jako v odst, 4.1.1 z kap. II omezíme na homogenní Dirichletovu okrajovou podmínku, tj. na podmínku (3.1) u(x,y) = o, (x,y)er. Okrajová úloha s obecnou Dirichletovou okrajovou podiriínkou 6e převede na úlohu typu (2.1), (3.1) stejně jako v případě okrajové úlohy pro obyčejnou diferenciální rovnici, a to tak, že se nalezne dostatečně hladká funkce w, která splňuje podmínku (2.29), a místo funkce tí hledáme funkci ti — w. Tato funkce pak splňuje diferenciální rovnici (2.1) s jinou pravou stranou a s homogenní okrajovou podmínkou. Funkce vj se většinou nazývá přípustná funkce. Upozorněme, že zatímco v případě obyčejné diferenciální rovnice bylo určení přípustné funkce triviální, v případě více proměnných to už může být podstatně složitější problém. Dostatečnou hladkostí přípustné funkce zde rozumíme takovou hladkost, která dovoluje dosadit ji do dané diferenciální rovnice. Z dalších úvah vyplyne, že se lze spokojit s hladkostí menší a že stačí, aby přípustná funkce byla prvkem prostoru, v němž je přirozené hledat zobecněné řešení dané okrajové úlohy. Zaveďme diferenciální operátor L předpisem (3.2) ^-U^'^-U^9^)^''^ a buď 9l množina funkcí spojitých v Q, které mají v íí spojité parciální derivace až do druhého řádu včetně a které splňují podmínku (3.1). Operátor L pak zřejmě zobrazuje tuto množinu do množiny funkcí spojitých v U. Při zavedení tohoto označení je řešení okrajové úlohy (2.1), (3.1) totéž, jako řešení rovnice (3.3) Lv = f v množině Definujme dále na množině $>l funkcionál F předpisem (3.4) F(u) = / (Lu)(x, y)u(x, y) dxdy — 2 / f(x, y)u(x, y) dx d y Jsi Jsi 292 293 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU nebo alternativně předpisem (3.5) F(u)=j^{p(x,y)[{^)\{^y]+q(X,yy}dxdy- — 2 / f(x, y)udx dy, Jn přičemž vyjádření funkcionálu F ve tvaru (3.5) vzniklo z vyjádření (3.4) užitím Greenova vzorce. Nyní už můžeme zformulovat následující větu. Věta 3.1. Buď u £ &i řešení rovnice (3.3). Pak platí (3.6) F(v) > F(u) pro každou funkci v € v ý= u. Naopak, nechť existuje funkce u £ 9\_ taková, že pro ni nabývá funkcionál F minima v množině @\_. Pak je tato funkce řešením rovnice (3.3). Tato věta je obdobou k větě 4.1 z kap. II a její tvrzení plyne stejně snadno ze symetrie a pozitivní definitnosti operátoru L, jako tomu bylo u zmíněné věty. Symetrie operátoru L se bez obtíží dokáže užitím Greenova vzorce. Jeho pozitivní definitnost plyne z nerovnosti (3.7) / (Lu)(x,y}u(x,y)dxdy ž 7lNlis . kde 7 je kladná konstanta a symbol \\u\\_% značí normu funkce u £ @i v prostoru Jžfa(íí) funkcí integrovatelných s kvadrátem v oblasti fi. Důkaz této nerovnosti však už není zdaleka tak elementární, jako tomu bylo u analogické nerovnosti v jednodimenzionálním případě. Nebudeme jej proto provádět a odkazujeme čtenáře na specializovanou literaturu (viz např. Nečas (1967)). Věta 3.1 ukazuje ekvivalenci mezi řešením okrajové úlohy (2.1), (3.1) a hledáním extrému funkcionálu F definovaného rovnicí (3.4) nebo (3.5). Situace je zde tedy stejná jako v odst. 4.1 v kap. II. Tato paralela jde však i dále a variační formulace okrajové úlohy tvoří stejně jako v jednodimenzionálním případě podklad k zobecnění pojmu okrajové úlohy. Myšlenkový postup je v podstatě stejný jako ve zmíněném jednodimenzionálním případě a uvedeme jej bez důkazů s odvoláním např. na už zmíněnou knihu Nečasovu (1967). Množina která zřejmě tvoří vektorový prostor, se pokládá za podprostor Hilbertova prostoru JS^(íi) a operátor L definovaný rovnicí (3.2) představuje tak v JŽ2(£5) lineární symetrický operátor s definičním oborem Protože platí pro každé u £ také nerovnost (3.7), kterou lze stručně psát jako (3.8) (Lu, u) ^ f(u, u) (kulaté závorky zde i v dalším značí skalární součin y prostoru Jž?2(f2)), je možné 3 VARIAČNÍ METODY ve vektorovém prostoru Z&l zavést nový skalární součin rovnicí (3.9) [u,v] = (Lu,v), nebo, vzhledem ke Greenově vzorci, alternativně rovnicí (3.10) [u,v] = Jjp(x,v)(^ + ^)+q(x,y)uV] dxdy. Zavedeme-li ještě ve vektorovém prostoru % normu obvyklým způsobem, tj. rovnicí (3.11) \\«\\l = [vM1", stane se vektorový prostor ^£ lineárním normovaným prostorem. Poznamenejme, že právě zavedená norma se nazývá energetická norma a příslušný skalární součin energetický skalární součin. Zúplněním prostoru S>i v této normě dostaneme Hilbertův prostor @, v němž je zřejmě podprostor hustý. V jednodimenzionálním případě byl prostor S tvořen právě těmi funkcemi ze Sobolevova prostoru Jť1, které splňovaly dané homogenní okrajové podmínky. Ve vícedimenzionálním případě je situace složitější a platnost obdobného tvrzení závisí na topologických vlastnostech hranice ľ dané oblasti. Důležitá třída oblastí, pro níž zmíněné tvrzení platí, tj. pro niž je prostor & tvořen právě těmi funkcemi ze Sobolevova prostoru Jťírct), které splňují okrajovou podmínku (3.1) ve smyslu stop (tento podprostor prostoru Jíří(Q) se značí Jťgfä)), je tvořena oblastmi s tzv. lipschitzovskou hranicí. Přitom řekneme, že hranice P dané oblasti je lipschitzovská, jestliže existuje m kartézských soustav souřadnic, čísla Cť>0a/9>0am funkcí ar definovaných a lipschitzovských v intervalech (-a, a) tak, že platí (a) každý bod hranice ľ lze psát aspoň v jedné z uvedených soustav souřadnic ve tvaru (xr, ar(xr)); (b) body (xr,yr), pro něž platí nerovnosti —a < xr < a, ar(xr) < yr < ar(xr) + /?, leží v f! a body (xr,yr), pro něž platí nerovnosti —cť < xr < a, ar(xr) — 0 < yr < ar(xr), leží vně množiny Í2 (viz obr. 3.1). V dalším budeme předpokládat, že uvažovaná oblast do této třídy patří. Samotný pojem Sobolevova prostoru Jťk(Cl) není také možno definovat tak jednoduše jako v případě jedné dimenze, kdy k jeho zavedení stačil pojem absolutní spojitosti a běžný pojem derivace. Ve vícedimenzionálním případě se prostor Jťk(Q) nejobvykleji definuje (definici vyslovíme pro obecný případ funkcí m proměnných) jako množina měřitelných funkcí definovaných v oblasti Sí C Em (přesněji řečeno jako množina tříd funkcí, které se navzájem liší na množině míry nula), které mají zobecněné derivace až do r-tého řádu včetně, přičemž tyto derivace jsou integrovatelné s kvadrátem, a v níž je skalární součin definován rovnicí (3.12) (u, v) E ( «1 + - +«mí' dx? ...dxZr' dx?1 ...d, xZrJ Přitom řekneme, že funkce g definovaná a lokálně integrovatelná na množině ST. 294 295 HL PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU Obr. 3.1 Oblast s bpschitsovskou hranicí je zobecněnou derivací ôai+"+am/9i"1 . platí-li . dx%" lokálně integrovatelné funkce /, (3.13) Jíi dal+...+a„<p dzľ...dxZr dx = (_!)<»>.+■•■+<*- [ g<pd: Jsi pro každou funkci ip, která je definovaná v Q, má derivace všech řádů a jejíž nosič K (tj. uzávěr největší podmnožiny množiny ÍJ, na níž je funkce ip různá od nuly) je kompaktní množina, pro niž je K C íí. Chápeme-li derivace ve smyslu Schwarzových distribucí (srv. např. Schwarz (1957)), má každá lokálně integrovatelná funkce derivace všech řádů. V této souvislosti pak má funkce zobecněnou derivaci, je-li příslušná distributivní derivace ekvivalentní lokálně integrovatelné funkci. Proto se zobecněné derivace také nazývají derivacemi v distributivním smyslu. Výrok, že prostor 0 je tvořen těmi funkcemi ze Sobolevova prostoru Jť1(Q), které splňují okrajovou podmínku ve smyslu stop, který jsme užili výše, je ve dvou (i více) proměnných rovněž nutný. Narozdíl od jednodimenzionálního případu, kdy každá funkce z prostoru Jťl(a, b) je spojitá na intervalu (a, 6), zde tomu tak není Dá se pouze říci, že je integrovatelná s libovolně vysokou mocninou, a nemusí být dokonce ani omezená. Hraniční hodnotu v normálním smyslu lze tedy přiřadit jen takovým funkcím z prostoru Jř,1(Q), které jsou spojité v Í2. Dá se však ukázat, že operátor, označme jej S, který jsme vlastně právě zavedli a který spojité funkci z JP^Íl) přiřazuje její hodnoty na hranici, lze rozšířit na celý prostor Jř'1(íí) jako spojitý lineární operátor do prostoru Jžráfr). Každé funkci u £ Jř"(Q) je tedy přiřazena funkce Su E Jfi(r), která se nazývá její stopa a která se v hladkém případě rovná její hraniční hodnotě. Stopa funkce je proto přirozeným rozšířením pojmu hraniční hodnoty pro ty funkce z prostoru Jř1(ÍJ), které ji v normálním smyslu nemají. 3 VARIAČNÍ METODY Vraťme se k Hilbertově prostoru Ql. Rovnice (3.10) definuje skalární součin [u, v] nejen pro prvky z množiny @\_ ale i pro libovolné dva prvky z prostoru @, neboť platí 3 C Jť\CÍ). Rozšíříme-li definici funkcionálu F pomocí vzorce (3.14) F(u) = [u,u]-2(/,u) na celý prostor zůstává věta 3.1 v platnosti, budeme-li v ní brát funkce v místo z množiny &[_ z celého prostoru 9. Opět stejně jako v jednodimenzionálním případě můžeme připustit v diferenciální rovnici (2.1) podstatně obecnější funkce než dosud. Stačí na ně klást jen takové požadavky, které zaručí, že výrazy na pravé straně rovnice (3.14) mají smysl. V tomto případě se může stát, že funkcionál F nenabývá minima v množině @i_, ale v množině 0. Funkci u £ ® udílící tomuto funkcionálu extrém, nazveme opět zobecněným řešením. Za zobecněné řešení dané okrajové úlohy můžeme také pokládat, opět analogicky jako v jednodimenzionálním případě, funkci u, pro niž platí (3.15) [u,v] = (f,v) pro každou funkci v e 9[_. V této souvislosti mluvíme také o slabém řešení. Opět je slabé řešení totožné se zobecněným a pokud jde o jejich existenci, platí úplně beze změny věta 4.2 z kap. II. Poznamenejme také, že pojem slabého řešení, ne však zobecněného řešení, lze převést i na případ, že okrajová úloha je charakterizovaná bilineámí formou, která není symetrická. V podstatě úplně stejně jako výše lze formulovat okrajové úlohy pro eliptické parciální diferenciální rovnice druhého řádu s libovolným počtem nezávisle proměnných. 3.1.2 Diferenciální rovnice čtvrtého řádu Uvažujme jako typický příklad biharmonickou rovnici (2.73) s homogenními okrajovými podmínkami (3.16) u = 0, 7T- = 0 na ľ. on Od nehomogenních okrajových podmínek přejdeme k homogenním opět pomocí přípustné funkce. Její sestrojení je zde však obecně obtížnější než v případě rovnic druhého řádu, neboť je třeba splnit dvě okrajové podmínky. Schéma dalšího postupu bude v podstatě stejné jako u rovnic druhého řádu a uvedeme je opět bez důkazu. Nechť *&l značí nyní množinu funkcí čtyřikrát spojitě diferencovatelných v Q a splňujících okrajové podmínky (3.16). Deiinujeme-li na množině která tvoří zřejmě vektorový prostor, operátor L rovnicí (3.17) Lu = — 4-2-^— dx4 8x2dy2 + 8y4' 296 297 Hl. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU 3 VARIAČNÍ METODY lze okrajovou úlohu (2.73), (3.16) stručně zapsat jako rovnici (3.18) Lu = f v množině @i. Zavedeme-li v množině &i skalární součin rovnicí ,„,„. r . / (d2ud2v n d2u d2v d2ud2v\, (3"19) [U'V] = L + ^yJxlfy + WW)Axáy a funkcionál F rovnicí (3.20) f(w) = [u,u]-2(/,u), je úloha (3.18) ekvivalentní úloze nalezení minima funkcionálu F v prostoru Si, který vznikne zúplněním vektorového prostoru $i v normě dané skalárním součinem (3.19) . Je-li hranice oblasti lipschitzovská, je prostor 3 roven podprostoru Jťa2(Q) takových funkcí ze Sobolevova prostoru Jť2(íl), které splňují okrajové podmínky (3.16) ve smyslu stop. Extrém funkcionálu je tedy třeba hledat v prostoru Jť2(£l). Řešení dané okrajové úlohy lze i v tomto případě charakterizovat jako funkci u, pro niž platí rovnice (3.21) [u,v] = (f,v) pro každou funkci o e TJvědomíme-li si, že bilineární forma (3.19) vznikla za skalárního součinu (Lu, v) užitím Greenova vzorce, je snadné formulovat variačně i úlohy s obecnějším operátorem čtvrtého řádu. 3.1.3 Jiné typy okrajových podmínek, nehomogenní okrajové podmínky Až dosud jsme se v příkladech variační formulace omezili na nejjednodušší typy okrajových podmínek. Popsaný postup lze však snadno přenést i na podstatně obecnější okrajové úlohy. Tak např. řešení diferenciální rovnice (2.1) s homogenní Newtonovou okrajovou podmínkou (3.22) |^ = -ku na ľ je ekvivalentní s úlohou nalézt minimum funkcionálu F(u) = [u, u] - 2(/, u), kde (3.23) [«,«] = jf [p(x, y) (|f Jj; + ~) + «(*> »)««] d x d y + k{s)uv d *, na celém prostoru Jť1(Q). Protože integrály na pravé straně identity (3.23) vznikly úpravou vzorce (Lu, v) pomoci Greenova vzorce při využití okrajových podmínek (3.22), je naznačeno, jak postupovat i v případě jiných okrajových podmínek. Úlohy s nehomogenními okrajovými podmínkami jsme převedli na homogenní případ pomocí přípustné funkce. Lze však také postupovat přímo. Tak např. řešení diferenciální rovnice (2.1) s nehomogenní Dirichletovou okrajovou podmínku lze nalézt minimalizací funkcionálu (3.5) ve třídě funkcí, které patří do Sobolevova prostoru Jť1(Sl) a které splňují tuto nehomogenní podmínku. K tomu, abychom dostali řešení rovnice (2.1) s nehomogenní Newtonovou podmínkou (2.68), je třeba minimalizovat funkcionál (3.24) F(u)=Jn{p(x,y)[{^y + ^y]+q(x,y)u2}dxdy+ + / k(s)[u2-2uy(s)]ds-2 / fudxdy Jr Jet na celém prostoru Jř?1(fi). Z předchozích příkladů je vidět, že Dirichletovy okrajové podmínky a Newtonovy okrajové podmínky se chovají podstatně odlišně, Dirichletovy podmínky je třeba při minimalizaci příslušného funkcionálu předem splnit. Naproti tomu Newtonovy podmínky vedou sice k nutnosti modifikace funkcionálu, který minimalizujeme, členem obsahujícím integraci po hranici dané oblasti, při volbě množiny funkcí, na níž hledáme minimum, k nim však nemusíme přihlížet a nalezené minimum už je splní automaticky. Toto odlišné chování souvisí s tím, jaký Hilbertův prostor vznikne při zúplnění množiny S>i v energetické normě. Zatímco v případě (homogenní) Dirichletovy podmínky prvky výsledného prostoru tuto podmínku splňují, v případě Newtonovy podmínky tomu tak není. Proto se také, a to i v případě obecnějších eliptických diferenciálních operátorů, podmínky, které se chovají jako Dirichletovy okrajové podmínky v našem příkladě, nazývají stabilní okrajové podmínky, a ty je tedy třeba při hledání minima splnit. Okrajové podmínky, které se chovají jako Newtonovy podmínky, se nazývají nestabilní nebo přirozené okrajové podmínky. Ty mají vliv na tvar příslušného funkcionálu, při hledání minima však k nim není třeba přihlížet. Do dalších podrobností nebudeme zacházet a odkazujeme čtenáře opět na příslušnou speciální literaturu. 3.2 Základní přibližné metody V tomto odstavci popíšeme velmi stručně Ritzovu a Galerkinovu metodu řešení eliptických okrajových úloh, neboť jde o takřka doslovné opakování toho, co bylo o těchto metodách řečeno v odst. 4.2. kap. II. 3.2.1 Ritzova metoda V odst. 3.1 jsme ukázali, že celá řada okrajových úloh pro parciální diferenciální rovnice eliptického typu je ekvivalentní úloze na hledání minima funkcionálu F typu F(u) = [u, u]—2(/, u) ve vhodném prostoru ® (např. v Sobolevově prostoru J^i(Q.) nebo jeho podprostoru Jť0t(Q)). Výraz [.,.] přitom znamená skalární součin, který je ekvivalentní se skalárním součinem ve zmíněném Sobolevově prostoru a který souvisí s daným diferenciálním operátorem a eventuálně i s okrajovými podmínkami způsobem, který byl naznačen v předchozím textu. 298 299 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU Základní myšlenka Ritzovy metody spočívá v tom (srv. odst. 4.1.1 z kap. II), že se zvolí konečnědimenzionální podprostor @jv prostoru f aza aproximaci řešení dané okrajové úlohy se pokládá funkce ujv, pro kterou nabývá funkcionál F svého minima v tomto konečnědimenzionámím prostoru. Zvolíme-li za bázi v prostoru Djv funkce <řj,..., je hledaná aproximace ujv dána vzorcem (3.25) ECÄ' přičemž vektor koeficientů c — (ci,..., C[f)'r je řešením soustavy lineárních rovnic (3.26) Ac = g, kde A je čtvercová matice řádu JV, jejíž prvky a,j se určí ve vzorců (3.27) aij = [*;,*,], a 9 = • • i 9n)t je JV-dimenzionální vektor o složkách daných rovnicemi (3.28) íf = (/,*•■)■ Matice A se stejně jako v jednodimenzionálním případě nazývá Gramová matice nebo matice tuhosti příslušná k bázi <&i, ...,$„ a je v námi uvedených příkladech symetrická a pozitivně definitní. Vektor g se nazývá vektor zatížení. 3.2.2 Galerkinova metoda Základní myšlenka Galerkinovy metody vychází z toho, jak už bylo ostatně řečeno v odst. 4.2.2 v kap. II, že řešení dané okrajové úlohy vyhovuje rovnici [u, v] = (/, v) pro každou funkci «6^. Je-li @tf konečnědimenzionální podprostor prostoru @, je galerkinovské přibližné řešení taková funkce »íjv £ $n, pro niž platí (3.29) [uN,VN\ — (/, Djv) pro každou funkci Vn E %>n- Tvoří-li funkce $1,..., <řjv bázi v prostoru ízVi je toto přibližné řešení dáno stejnými vzorci jako u Ritzovy metody. Galerkinova metoda je tedy totožná s Ritzovou metodou, jsou-li obě realizovatelné, a stejně jako v jednodimenzionálním případě je Galerkinova metoda obecnější, neboť se dá užít i v těch případech, kdy danou okrajovou úlohu nelze formulovat jako minimalizační úlohu. Kvalita aproximace získané jak Galerkinovou, tak Ritzovou metodou je dána volbou konečnědimenzionálního prostoru !zV, tj. volbou bázových funkcí $1,..., <3>jv. Zejména v předpočítačové éře numerického počítání byla navržena řada postupů, jak tyto bázové funkce volit hlavně s ohledem na to, aby v součtu (3.25) stačilo k přijatelné představě o chování řešení vzít jen několik málo sčítanců. Tato snaha byla diktována zejména tím, že na mechanických stolních kalkulátorech nebylo možné 300 4 METODA KONEČNÝCH PRVKŮ a únosné provádět příliš velký počet početních operací. Tak např. se doporučovalo vzít za bázové funkce vlastní funkce „podobného" problému, přičemž podobný problém znamenal problém, v němž se např. místo proměnných koeficientů vzaly konstantní koeficienty, daná oblast se vnořila do nějaké kanonické oblasti apod. Je zřejmé, že univerzálnost těchto postupů byla značně omezená a že problémy, které bylo možno takto uspokojivě řešit, byly jen velice speciální. V současné době se Ritzova a Galerkinova metoda užívá takřka výhradně v souvislosti s metodou konečných prvků. V této metodě byl nalezen značně univerzální způsob konstrukce konečnědimenzionálních podprostorů prostoru, v němž hledáme řešení. Metoda konečných prvků tak umožňuje řešit s velkou přesností i značně obecné problémy. Pro její důležitost jí budeme věnovat samostatný článek i přesto, že spadá pod obecné schéma variačních metod. 4 Metoda konečných prvků Při popisu Ritzovy a Galerkinovy metody v odst. 3.2 jsme uvedli, že tyto metody mají v současné době největší význam ve spojitosti s metodou konečných prvků jako systematického způsobu konstrukce konečnědimenzionálních prostorů, v nichž hledáme příslušné aproximace. V tomto článku popíšeme důležité základní typy prostorů konečných prvků vhodných k řešení dvoudimenzionálních problémů a ukážeme teoretické problémy, které je třeba při jejich užití řešit. Všimneme si také, velice stručně, některých aspektů početní realizace metody konečných prvků. Začneme rekapitulací základních hledisek, která je záhodno respektovat při konstrukci konečnědimenzionálních prostorů nutných k užití Ritzovy-Galeikinovy metody. Tato hlediska jsou do značné'míry podobná těm, která jsme uvedli už v jednodimenzionálním případě, a proto je připomeneme jen velice krátce. Pro určitost a jednoduchost budeme mít zde na mysli úlohy druhého řádu. Pro rozdíl přibližného řešení ufi získaného Ritzovou-Galerkinovou metodou a přesného řešení u dané úlohy platí i zde nerovnost typu (4.1) ■ "Jvljjři(fi) á M inf ií||#(n) ■ Jde-li o Ritzovu metodu, tj. je-li daná okrajové úloha definovaná jako minimalizační úloha a je-li příslušná energetická norma ekvivalentní s normou v Sobolevově prostoru Jťl, plyne tato nerovnost z faktu, že i ve dvoudimenzionálním případě je přibližné řešení ortogonální projekcí (v energetickém skalárním součinu) přesného řešení do příslušného podprostorů. Nerovnost (4.1) však platí pro podstatně širší množinu problémů čítaje v to i okrajové úlohy, které nelze formulovat jako úlohy na hledání minima funkcionálu F a u nichž lze hovořit pouze o slabém řešení. V této souvislosti se nerovnost (4.1) spojuje se jménem Céovým (viz např. Ciarlet (1978)). Otázka přesnosti Ritzovy-Galerkinovy aproximace je tedy opět jako v jedné dimenzi otázkou, jak přesně lze aproximovat funkci z prostoru @ (což je většinou prostor 301 - III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU Jř^íí) nebo jeho podprostor) funkcí z prostoru S>y. První požadavek, který je tedy při konstrukci podprostoru 0jv žádoucí respektovat, je, aby měl dobré aproximační vlastnosti. Druhé, stejně důležité hledisko při konstrukci prostoru &n je požadavek maximální efektivnosti vzniklého algoritmu. Z rovnic (3.25) až (3.28) je vidět, že při realizaci Ritzovy-Galerkinovy metody je třeba vypočítat prvky matice A a složky vektoru g, řešit soustavu lineárních rovnic (3.26) a konečně provést součet (3.25). Zvolený prostor &n musí tedy umožňovat takovou volbu báze, aby se prvky matice A a složky vektoru g počítaly co nejsnáze a aby matice soustavy (3.26) byla pokud možno řídká nebo ještě lépe pásová. Posledního požadavku se dosáhne tehdy, mají-li bázové funkce malé nosiče ve srovnání s oblastí íž. Skalární součin ve vzorci (3.27) je totiž dán pomocí integrálů přes oblast fi a zmíněná vlastnost má pak za následek, že většina prvků matice A je rovna nule. Je tedy žádoucí volit bázové funkce tak, aby měly i tuto vlastnost. Konečně zmenšení počtu potřebných operací se dosáhne také tehdy, mají-li některé (nebo všechny) koeficienty ct přímo význam hodnot přibližného řešení v některých bodech dané oblasti, neboť pak odpadne nutnost počítat hodnoty součtu (3.25). Metoda konečných prvků tyto požadavky do značné míry splňuje. Její základní myšlenka je založena na interpolaci a představuje přímé, nikoliv však triviální rozšíření myšlenek, z nichž jsme vycházeli v jednodimenzionálním případě. Při konstrukci prostoru 0jv je tedy třeba rozdělit danou oblast Q na konečný počet geometricky jednoduchých podoblastí a interpolaci provést pomocí funkcí, které jsou po částech rovny polynomům v těchto jednotlivých podoblastech. Každý polynom definovaný na určité podoblasti budeme charakterizovat funkčními hodnotami, eventuálně hodnotami některých derivací v nějakých pevně zvolených bodech této podoblasti tak, aby byl těmito podmínkami jednoznačně určen. Tyto body nazveme stejně jako v jednodimenzionálním případě uzly a příslušné veličiny, které v nich zadáváme, uzlovými parametry. První problém, kterým se tedy musíme zabývat, je volba rozkladu oblasti fi. Tento rozklad by mčl být najedná straně tak obecný, aby dovoloval modelovat nepravidelné oblasti, na druhé straně tak jednoduchý, aby příliš nenarůstala výpočetní složitost. Praktické zkušenosti ukazují, že těmto do jisté míry protichůdným požadavkům velmi uspokojivě vyhovují jednoduché trojúhelníky nebo čtyrúhelníky. Při konstrukci konečnědimenzionálních prostorů metodou konečných prvků budeme tedy v dalším výkladu předpokládat, že daná oblast je sjednocením konečně mnoha trojúhelníků nebo čtyřúhelníků, přičemž kombinace obou útvarů současně nebudeme připouštět. Dále pak budeme předpokládat, že pro libovolné dva útvary rozkladu nastává právě jeden z těchto případů: (a) útvary jsou disjunktní; (b) útvary mají společnou celou jednu stranu; (c) útvary mají společný jeden vrchol (viz obr. 4.1 a 4.2). O útvarech, pro něž na stává případ (b) nebo (c) budeme mluvit jako o sousedních útvarech. Za uzly, v nichž zadáváme uzlové parametry, tj, funkční hodnoty a hodnoty derivací, připouštíme kromě vrcholů ještě i některé další body ležící v daném 302 4 METODA KONEČNÝCH PRVKŮ Obr. 4.1 Rozklad oblasti na trojúhelníky Obr. 4.2 Rozklad oblasti na čtyrúhelníky trojúhelníku nebo čtyřúhelníků (např. středy stran, těžiště apod.). Protože některé uzly jsou společné pro více útvarů rozkladu, užijí se hodnoty odpovídajících uzlových parametrů pro interpolaci na všech těchto sousedních útvarech. Útvar rozkladu, na něm definované uzlové parametry a příslušný interpolační polynom nazveme konečným prvkem. Často také, zejména tam, kde nebude hrozit nedorozumění, budeme termín prvek užívat pro samotný útvar rozkladu. Souhrn všech funkcí, které jsou polynomiální na jednotlivých prvcích rozkladu, mají v sousedních prvcích stejné uzlové parametry a jsou dostatečně hladké, tvoří při všech možných hodnotách uzlových parametrů konečnědimenzionální podprostor ®\ Sobolevova prostoru Jz,*(f2). Prostor @£ budeme nazývat prostorem konečných prvků a jeho dimenze je zřejmě rovna počtu všech uzlových parametrů. Index h, kterým jsme opatřili jeho označení, udává závislost tohoto prostoru na velikosti jednotlivých prvků rozkladu použitých k jeho konstrukci a můžeme jej pokládat za rovný délce největší strany užitých prvků. 303 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU Při numerické realizaci Rítzovy-Galerkinovy metody je třeba sestrojit v prostoru 0* vhodnou bázi. Ve všech konkrétních případech prostorů konečných prvků, které v tomto článku zavedeme, je možno za bázi vzít množinu funkcí , které sestrojíme tak, že j-tý uzlový parametr položíme rovný jedné a všechny ostatní rovny nule. Takto sestrojená bázová funkce bude nenulová jen na těch prvcích rozkladu, které obsahují j-tý uzlový parametr. Bude mít tedy malý nosič, takže jeden ze zformulovaných požadavků na prostor, v němž hledáme řešení, je splněn. Protože některé nebo všechny uzlové parametry budou mít, jak uvidíme později, význam hodnot aproximované funkce, bude při popsané konstrukci báze splněn i další požadavek, totiž, že řešením soustavy lineárních rovnic (3.26) už dostaneme přímo veličiny, které nás zajímají. Tím, že jsme se omezili na trojúhelníkové a čtyřúhelníkové prvky, dopouštíme se při obecné křivočaré hranici vždy jakési chyby, neboť sjednocení všech prvků rozkladu tvoří polygon, který se nemůže přesně rovnat nepolygonální oblasti. Zjemněním rozkladu lze však danou oblast aproximovat s libovolnou přesností. Kromě toho se k lepšímu vystižení hranice oblasti užívají také křivočaré prvky (např. trojúhelníky, jejichž některé strany jsou parabolické oblouky apod.). Příslušné prostory konečných prvků se přitom konstruují na zcela stejných principech, jak bylo naznačeno. V dalších několika odstavcích si všimneme některých nejdůležitějších speciálních případů konstrukce prostorů konečných prvků. 4.1 Trojúhelníkové prvky V tomto odstavci popíšeme konstrukci takových prostorů konečných prvků, kdy základním prvkem rozkladu je trojúhelník. 4.1.1 Lineární Lagrangeův prvek Tento konečný prvek je založen na myšlence Lagrangeovy interpolace a jeho konstrukce se opírá o následující větu: Věta 4.1. Bud* K trojúhelník o vrcholech Pj = (xj,yj), j = 1,2,3, a buďte Uj, j — 1,2,3 libovolná reálná čísla,. Pale existuje právě jeden polynom IIi(x,y) prvního stupně, pro který platí (4.2) /ri(xilW) = iij, j = 1,2,3. Důkaz. Geometricky je tvrzení věty zřejmé, neboť každé tři body, které neleží v přímce, určují v trojrozměrném euklidovském prostoru právě jednu rovinu. Proveďme nicméně příslušný důkaz podrobně, abychom ukázali, jak postupovat později v komplikovanějších případech. Hledaný polynom je tvaru (4.3) JI1(x,y) = a + px + yy, 304 4 METODA KONEČNÝCH PRVKŮ kde a, 0 a 7 jsou konstanty, které je třeba zvolit tak, aby platilo (4.4) a + fixj+yyJ = ui, j = 1,2,3. Tato soustava tří rovnic o třech neznámých má při libovolné pravé straně právě jedno řešení tehdy a jen tehdy, má-li příslušná homogenní soustava rovnic pouze triviální řešení, neboli, jinými slovy, je-li každý polynom prvního stupně, který se anuluje ve vrcholech trojúhelníku K, identicky roven nule. Uvažovaný polynom je polynomem prvního stupně na každé úsečce ležící v trojúhelníku K. Odtud především plyne, že se anuluje na každé straně tohoto trojúhelníku, neboť je podle předpokladu roven nule v jejích koncových bodech. Odtud však už bezprostředně plyne, že se anuluje i v každém dalším bodě v K. Abychom to dokázali, stačí vést takovým bodem libovolnou přímku a uvažovat zkoumaný polynom na ní. Věta je dokázána. Často je výhodné psát polynom Tli ve tvaru 3 (4.5) Ili(x,y) = YlujPi(x>y)' 3=1 kde pj, j = 1,2,3 jsou polynomy, pro něž platí (4.6) r i, i = j, Pi(xj,yj) = i . ... i,j = 1,2,3. 16, i^li Z Cramerova pravidla ihned dostáváme, že je (4.7) P\{x,y) - det T[{X2V3 - x3y2) - (ife — y2)x + (s3 - x2)y], P2(x,y) - detT^391 ~ xiy3) - (ä/l yí)x + (*i - x3)y], P3{x,y) = detT[{XlV2 -X2Vl) - {V2 - yi)x + (x2 -xi)y], kde 7~ je matice soustavy (4.4), tj. (4.8) = 1 Xl Jíl 1 x2 tfe .1 xs ys Poznámka 4.1. Rovnice (4.9) Pj{x,y) = 0 je rovnice přímky, v níž leží strana trojúhelníku K protější k vrcholu (xj, yj). Tato poznámka je sice úplně elementárni, bude však důležitá pro vyšetřování prostorů konečných prvků založených na polynomech vyšších stupňů než jedna. Věta 4.1 dovoluje zavést Lagrangeův trojúhelníkový prvek jako polynom prvního stupně na příslušném trojúhelníku, který interpoluje funkční hodnoty v jeho 305 in. parciální diferenciální rovnice eliptického typu vrcholech. Uzlové parametry jsou tedy v tomto případě funkční hodnoty a uzly vrcholy trojúhelníku rozkladu. Prostor konečných prvků sestrojený pomocí popsaného prvku označíme symbolem . Každá funkce z tohoto prostoru je na každém trojúhelníku rozkladu lineární a protože v společných uzlech jsou uzlové parametry stejné, je také spojitá. Jej! parciální derivace jsou tedy po částech konstantní, z čehož plyne, že prostor J^1 je podprostorem Sobolevova prostoru Jť1. Je proto vhodný k řešení problémů druhého řádu. Bázi v prostoru vytvoříme postupem zmíněným výše, tj. za j'-tou bázovou funkci bereme funkci <ř3, která je v j-tém uzlu rovna jedné, ve všech ostatních uzlech rovna nule a na každém trojúhelníku je lineární. Každá bázová funkce je tedy v každém trojúhelníku rozkladu tvaru r-bokého jehlanu, kde číslo r udává počet trojúhelníků, které obsahují tento uzel (viz obr. 4.3). Obr. 4.3 Bázové funkce v prostoru ^} Bázová funkce příslušná k uzlu, který leží na hranici oblasti, je přirozeně tvořena pouze částí tohoto jehlanu. Chceme-li sestrojit prostor konečných prvků, který je podprostorem prostoru Jť0l (a který je tedy vhodný k řešení problémů druhého řádu s homogenní Dirichletovou okrajovou podmínkou), vypustíme z popsané soustavy bázových funkcí ty funkce, které jsou rovny jedné v uzlu ležícím na hranici. Z nerovnosti (4.1) plyne, že rychlost konvergence Ritzovy-Galerkinovy metody je dána přesností, se kterou je možno aproximovat přesné řešení prvkem užitého koneč-nědimenzionálního prostoru. Abychom byli schopni učinit si představu o rychlosti konvergence, musíme mít dispozici nějaké poznatky o aproximačních vlastnostech prostoru konečných prvků 3£ . V jednodimenzionálním případě jsme mohli každou funkci z prostoru Jt1(a,b) jednoduše aproximovat po částech lineární funkcí pomocí interpolace. Zde je situace složitější, neboť obecná funkce z prostoru Jf1(í2) nemusí být nejen spojitá, ale dokonce ani omezená (přesněji řečeno, není možné dosáhnout této vlastnosti změnou její definice na množině míry nula, neboť prvek prostoru Jř,1(í2) není jedna funkce, ale třída funkcí lišících se na množině míry nula), takže o její hodnotě nemá obecně smysl mluvit. Aproximaci dané funkce / £ Jř^flJ) funkcí fh £ áj,1 nelze tedy sestrojit přímo pomocí interpolace. Je však 306 4 metoda konečných prvku možné postupovat např. tak, že se nejprve sestrojí funkce / £ Jť2(Q), která funkci / aproximuje ve smyslu normy prostoru Jť1. To je možné, neboť množina Jť2(íí) je hustá v prostoru Jť1. K funkci / se pak sestrojí funkce f h jako její interpolace, což má smysl, neboť funkce / je už spojitá (tato skutečnost plyne z tzv. Sobolevo-vých vět o vnoření, viz např. Nečas (1967)). Pokud o aproximované funkci nemáme žádné další informace než jen ty, že leží v prostoru Jť1{CÍ), nelze o řádu chyby takto i jakkoliv jinak sestrojené aproximace nic říci. Aby bylo možné rozdíl f - fh nějakým použitelným způsobem odhadnout, je třeba zpřísnit požadavky na hladkost aproximované funkce. Jako příklad tvrzení tohoto typu uveďme následující větu. Veta 4.2. Nechť K je uzavřený trojúhelník o vrcholech P, = (xj, j/y), j = 1,2,3. Nechť u 6 ^2(K) a nechť ITu je polynom prvního stupně určený podmínkami {Hu)(P}) - u(Pj), j - 1, 2,3. Pak platí (4.10) ||u-/7u||^mš2^amax=J|£^" (4.11) max dai+°3(u - nu) < p K kde (4.12) a hic je nejdelší strana a qk průměr kružnice vepsané trojúhelníku K. Důkaz Zřejmě je IMI-sSoCK-) = max \u(x,y)\ (4.13) (IIu)(x,y) = Y^u(.>ci>yj)Pi(.!E>v)i kde pj jsou polynomy (4.7). Podle Taylorova vzorce platí ďu dtt (4.14) u(f, rj) - u(x, y) + fa(x, y)(t ~x> + fy(x< Mi -y) + R(x<y'>Z> i)> kde (4.15) R(x,y;Cv)-^(Lm-ri)2+ d2u dxdyv m-*)(n-y) + \d^(lň){n-y? a bod (£, íj) leží na úsečce spojující body ({, n) a (x, y). Položíme-li speciálně (£, rf) = (Xj,yj), máme pro j - 1,2,3 (4.16) "(zj.ľj) = u{x,y) + °Ax<y) + Äj(z,y), 307 HI. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU kde (417) 9j0, V) = y)(xj - x) + -^(x, y)(yj - y) a (4.18) Rj(x,y) - R(x, y; Xj,yj). Protože je \xj — x\ á Ají a \yj — y\ á říje, dostáváme pro funkci fž, odhad Dosadíme-li do (4.13) ze (4.16), dostaneme 3 (4.20) (Hu)(x,y) = u{x,y)J2Pj(x,y)+ (4.19) Dokažme nyní, že je (4.21) 3=1 j=l 53pj(i,Jí) = 1 3=1 (4.22) Eíjís.ífJPjO*,!/^!). j'=i Důkaz obou těchto rovností je založen na skutečnosti plynoucí ihned z věty 4.1, totiž, že je (4.23) u — nu pro každou funkci u, která je na K lineární. Dosadíme-li do (4.20) funkci u{x, y) =s = 1, pro niž zřejmě platí (4.23), dostáváme ihned (4.21), neboť v tomto speciálním případě je qj(x,y) = Rj(x,y) = 0. Abychom dokázali (4.22), položme ve (4.20) u(x, y) — yx + Sy, kde 7 a Ä jsou libovolná reálná čísla. Protože i v tomto případě platí (4.23) a protože je Rj(x, y) = 0, máme 3 (4.24) u(x, y) = u(x, y) + ^[7 (z j ~ x) + %J ~ ^fe' (x> v\ j=l Pro libovolná reálná 7 a ä tedy platí 3 (4.25) -x) + Kvs - y)]pi(x<y) = °' 3=1 r 4 METODA KONEČNÝCH PRVKU Polož!me-li speciálně 7 = du/dx a S = du/dy, dostáváme odtud platnost (4.22). Použijeme-li v (4.20) vztahy (4.21) a (4.22), je {iiu)(x, y) = u(x, y) + Y^ Rj(x< y)Pi(x> y) 3=1 u(x,y)^{nu)(x,y) = - ^2Rj(x,y)pj(x,y). i=i (4.26) neboli (4.27) Protože pro (x,y) G K platí 0 í Pj(x, y) S 1, je 3 (4.28) \u{x,y) (iTii)(a!,»)|š$3|Ä<(*.»)l«{«.I/)š 3=1 3 ^ max lÄjfx, y)| Vpj(i,y) = max |1Íj-(jí,i/)|. Odtud a z nerovnosti (4.19) už bezprostředně plyne nerovnost (4.10). Abychom dokázali nerovnost (4.11), derivujme rovnici (4.13) podle x; dostaneme (4.29) 3=1 Dosadíme-li do této rovnice z rovnice (4.16), máme (4.30) dnu dx fy, 3=1 + '£Rj(x,y)^l(x<yy 3=1 Protože však je (4.31) jak plyne z (4.21) * (4.32) 3=1 308 jak plyne z rovnice (4.30), položíme-li v ní u(x,y) = yx + Äy, plyne z (4.30), že 309 III. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU platí (4.33) neboli (4.34) Protože platí (4.35) dx j"=i i=i dx max -^-(s, !ř) S —, jak se snadno zjistí, plyne z (4.34) a (4.19) odhad (4.36) i du dílu I dx dx max_ Sk <*i+"2=2 Il5z°"óy*2 IIä,(ä") Úplně stejně odhadneme rozdíl du/dy — d{IIu)jdy. Platí tedy (4.11) a důkaz věty 4.2 je zakončen. Ve větě 4.2 jsme tedy nalezli tvrzení, které nám dává představu o velikosti chyby interpolace v prostoru Protože však v nerovnostech (4.10) a (4.11) vystupuje Jží^-norma, nejsou tyto odhady ideální ke konstrukci odhadu chyby Ritzovy-Galerkinovy metody na základě nerovnosti (4.1), neboť v ní se užívá norma typu -Ž2-normy. Zformulujme proto větu, která je paralelní k větě 4.2, v níž však jsou příslušné veličiny měřeny integrálními normami. Věta 4.3. Nech f jsou špiněny předpoklady věty 4.2. Pak existuje absolutní konstanta C taková, že platí \\u - nu\\M(K) g Ch1K\v\jt.(K) (4.37) .i (4.38) kde (4.39) qk 1/2 a je to tedy r-tá seminorma funkce u. Důkaz této věty, který už není tak elementární, jako tomu bylo u věty 4.2, nalezne čtenář v článku Dupontově a Scottově (1980). 310 r 4 METODA KONEČNÝCH PRVKŮ Jak už jsme řekli, ke konstrukci odhadů chyby interpolace a tedy také chyby Ritzovy-Galerkinovy aproximace řešení okrajové úlohy se častěji užívá věty 4.3 než věty 4.2. Abychom se však vyhnuli značným technickým komplikacím, uvedli jsme zde pouze důkaz věty 4.2, neboť se domníváme, že je dostatečně charakteristický k ilustraci postupů v obdobných situacích. Užijme ještě větu 4.3 k odhadu chyby interpolace na celé oblasti 12. Předpokládejme, že je dána posloupnost rozkladů {Zh} dané oblasti charakterizovaných parametrem (4.40) h — max hg K&Zh a předpokládejme dále, že pro každý trojúhelník K rozkladu platí (4.41) sk hK kde /? je kladná konstanta nezávislá na h. Takovou posloupnost rozkladů obvykle nazýváme regulární posloupností rozkladů. Požadavek značí, že v rozkladu Z), nejsou přípustné trojúhelníky, které mají některý úhel příliš malý. Buď nyní / £ Jť2(il) a buď /j, její interpolace. Sečtení nerovností (4.37) pro všechny trojúhelníky rozkladu dává (4.42) IIZ-Alli,^, = E ll/-A|liW É - C,2h4|/|2#,(íl') , Analogicky plyne z nerovnosti (4.38), použijeme-li zároveň (4.41), že je (4-43) |/-Al2,<n) ú E CJ Jl/lW) ž C2h2 Spojením nerovností (4.42) a (4.43) dostáváme, že pro h g A0 platí (4-44) ||/ - fh\\j*(n) g Mh\f\je.(n) , kde M je konstanta daná vzorcem takže nezávisí na h. Pro .í^-normu rozdílu f — f h samozřejmě platí lepší odhad (4A6) ||/-/*lk(o) š CA2|/I^(n), jak plyne ihned ze vzorce (4.42), (4.45) 311 r III. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU Rychlost konvergence Ritzovy-Galerkinovy metody je zde tedy 0(h2) měřeno normou prostoru Sr2 a 0(h) měřeno normou prostoru Jť1. Poznamenejme konečně, že provedeme-li triangulaci dané oblasti pravidelně (je-li např. Q čtverec, sestrojíme v něm nejprve pravidelnou čtvercovou síť a vzniklé čtverce rozdělíme navzájem rovnoběžnými úhlopříčkami na trojúhelníky) a k přibližnému výpočtu integrálů, které je třeba počítat při sestavování Gramový matice a vektoru pravé strany, užijeme vhodné kvadraturní vzorce, dostaneme metodu sítí. 4-1.2 Kvadratický Lagrangeův prvek Sestrojme nyní prostor konečných prvků založený na interpolaci polynomy druhého stupně. Dokážeme proto nejprve následující větu. Věta 4.4. Butí K trojúhelník o vrcholech Pj = (xj,yj), j = 1,2,3, označme Pi = (14,3/4), fs = (^5,1/5) a P6 = {x6,ye) středy jeho stran (viz obr. 4.4) a buď-te Uj, j = 1,... 16, libovolná reálná čísla. Pak existuje právě jeden polynom JI2 druhého stupně, pro který platí (4.47) ni(xj,yj)4ui, j = l,...,6. Obr. 4.4 Lineární, kvadratický a kubický Lagrangeův prvek Důkaz Zřejmě stačí dokázat, že jediný polynom druhého stupně, který se anuluje v bodech Pj, je nulový polynom. Bud tedy u polynom druhého stupně, pro který platí (4.48) u(xj,yj) = 0, j = 1,. ,6, 312 4 METODA KONEČNÝCH PRVKO a dokažme, že tento polynom je nulový. Uvažujme k tomu cíli stranu P2P3 daného trojúhelníka. Podél této strany je funkce u zřejmě polynom druhého stupně v jedné proměnné, který je roven nule ve třech navzájem různých bodech; odtud ihned plyne, že polynom u je na úsečce P2P3 identicky roven nule. Podle poznámky 4.1 je však rovnice pi(x, y) — 0, kde funkce pi je definovaná první rovnicí (4.7), rovnicí přímky P2Pa. Musí tedy platit (4.49) u(x,y) = pi(x,y)u1(x,y), kde Ui je polynom stupně nejvýše jedna. Stejným způsobem dokážeme, že funkce u se anuluje na úsečce P1P3. Pro každý bod (x,y) £ K tedy platí (4.50) u(s, y) = pi(x, y)pi(x, y)v0, kde uq je nyní polynom stupně nula, tj. konstanta. Dosadíme-li však do rovnice (4.50) za (x,y) bod P4 ležící mezi body P\ a P2, dostaneme (4.51) 0=|i«o, což dokazuje, že je tio = 0. Nulovost polynomu u pak už plyne z (4.50). Tím je zakončen důkaz věty. Na základě věty 4.4 lze zvolit vrcholy trojúhelníka a středy jeho stran za uzly a funkční hodnoty za uzlové parametry a sestrojit tak jejich interpolací kvadratický Lagrangeův prvek. Polynom II2 splňující podmínky (4.47) lze psát ve tvaru 6 (4-52) n2(x,y) = Yiujpf\x,y)í j'=i kde elementární polynomy p^ jsou podobně jako v případě lineárních prvků definovány rovnicemi. ( 1, i = t, (4.53) P<r\**,yt) = < j,fe = l,...,6. { 0, j t k, Abychom odvodili konkrétní tvar těchto polynomů, užijeme pojmu tzv. referenčního trojúhelníku. Zavedení tohoto trojúhelníku vychází z poznámky 4.1. Protože pro funkce pi, p2 a P3 vystupující v této poznámce platí rovnice (4.21), převádí transformace (4.54) Pi=Pi(x,y), P2 = Pi(x, y) trojúhelník P1P2P3 roviny (x, y) na trojúhelník Q1Q2Q3 roviny (pi,p2), přičemž je Q, = (1,0), Q2 - (0,1) a Q3 = (0,0) (viz obr. 4.5). Trojúhelník Q1Q2Q3 se nazývá jednotkový referenční trojúhelník nebo stručně referenční trojúhelník. 313 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU Obr. 4.5 Referenční trojúhelník oj o. o, Protože transformace (4.54) je lineární, je snadné vypočítat inverzní transformaci z roviny (pi,p2) na rovinu (x,y). Tato transformace je samozřejmě opět lineární a je tvaru (4.55) i = x(pi,p2), !f = J/ÍPi.Pz), kde (4-56) x(pi,p2) = x3 + (xi - x3)pi + (x2 - *3)P2, y(pi>P2) — v3 + (yi - yí)pi + (j/2 - y<i)p2- Transformace (4.54) a (4.55) umožňují podle potřeby přecházet snadno od referenčního trojúhelníka k obecnému a naopak. Protože transformace (4.55) je lineární, je každý polynom druhého stupně v proměnných x, y polynomem druhého stupně v proměnných pi, p2. Elementární polynom nabývá v uzlu P\ hodnotu jedna a v ostatních uzlech hodnotu 0. Protože přímka pi = 0 prochází uzly P2, p3 a P5, a přímka pi — 1/2 uzly P4 a. Ps, nesmí í 21 polynom p\ ' záviset na proměnné p2 a musí být roven nule pro p\ — 0 a p\ — = 1/2 (a samozřejmě jedné pro p\ — 1). Jediný polynom druhého stupně, který splňuje tyto podmínky, je polynom pi(2pi — 1). Polynom pj2' je tedy roven výrazu P2(2pi — 1), kde za pi je třeba dosadit ze vzorců (4.7) (nebo (4.54)). Polynomy P22' a Pa^ sestrojíme na základě úplně stejných úvah. Elementární polynom p£\ který je roven jedné v uzlu P4 a v ostatních uzlech je roven nule, sestrojíme pomocí přímek pi = 0 a P2 = 0, které procházejí body P2l P3 a P5 a body Pi, P3 a Pg. Polynom p42' musí být tedy tvaru apip2, přičemž konstanta a se určí z podmínky P^\x*,Sto) = li která je splněna pro a = 4. Elementární polynomy pf jsou tedy dány vzorci (4.57) Pi2)=Pi(2pi - 1), p22)=p2(2p2- 1), 314 4 METODA KONEČNÝCH PRVKU - P3(2p3 Á2} = 4pip2, PÍ2) = 4p2P3, Á2) = 4piP3, přičemž pi, p2 a pa jsou lineární polynomy definované rovnicemi (4.7). Postup, pomocí něhož jsme odvodili tvar polynomů majících vlastnosti (4.53), demonstruje, že užití referenčního trojúhelníku může podstatně zjednodušit příslušné úvahy. Možnost práce s referenčním trojúhelníkem, eventuálně s jiným referenčním obrazcem, jsou-li užity jiné základní obrazce než trojúhelníky, patří rovněž k charakteristickým rysům metody konečných prvků. Prostor konečných prvků sestrojený pomocí právě popsaného kvadratického prvku označíme symbolem 3^. Vytvoříme-li v tomto prostoru bázi jako v předchozím odstavci, tj. za j-tou bázovou funkci vezmeme funkci, která je po částech kvadratická, která je v j-tém uzlu rovna jedné a v ostatních uzlech rovna nule, je tato bázová funkce různá od nuly pouze v trojúhelnících obsahujících zmíněný uzel, a má tedy malý nosič. Na každém trojúhelníku, kde je nenulová, je přitom rovna některé elementární funkci (4.57). Funkce z prostoru 3f£ jsou zřejmě spojité, mají tedy po částech spojité první parciální derivace a vytvářejí tak podprostor Sobolevova prostoru Jť1. Jsou tedy stejně jako lineární prvky vhodné k řešení úloh druhého řádu. O konstrukci aproximace funkce z Jf1 funkcí z platí totéž, co bylo řečeno v odst. 4.1.1 o aproximaci funkcemi z Uveďme ještě pro úplnost bez důkazu, že je-li posloupnost triangulací regulární, je-li / £ Jťr(Q) pro r - 2 nebo 3 a je-li f k interpolace funkce /, platí pro rozdíl f — f h odhad (4.58) ||/-A|U»(o) P =0,1, kde Jť°(Sl) - Sft(Q). Přitom předpoklad, že je / £ Jř^(fi) s r větším než 3, už nevede k zlepšení uvedeného odhadu. Užití kvadratických Lagrangeových prvků vede tedy při řešení rovnice druhého řádu k chybě řádu 0(ft2) měřeno normou Sobolevova prostoru Jťx(Q)r je-li hledané řešení dostatečně hladké. 4.1.3 Kubický Lagrangeův prvek Abychom sestrojili tento prvek, vezmeme za uzly vrcholy trojúhelníka, body, které dělí jeho strany na tři stejné díly, a těžiště (viz obr. 4.4), za uzlové parametry funkční hodnoty v těchto uzlech a interpolujeme je polynomem třetího stupně. Označme užité uzly Pi — (xi, i/i),..., Pia = (xio,yío). Následující věta ospravedlňuje popsaný postup. Veta 4.5. BuďK trojúhelník P\P2P3 a buďte uj, j = 1,..., 10, libovolná reálná 315 III. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU čísla. Pak existuje právě jeden polynom 11% třetího stupně, pro který platí (4.59) ffsC*7,ft)==«í, j = l,.-.,10. Důkaz. Protože podmínek (4.59) je právě tolik, kolik má koeficientů polynom třetího stupně, stačí opět jako ve větě 4.1 a 4.4 dokázat, že polynom u třetího stupně, pro který platí (4.60) u{x,,yi) = Q, j = 1.....10, je nutně nulový polynom. Polynom u je identicky roven nule podél každé strany trojúhelníku K, neboť je na těchto stranách polynomem třetího stupně v jedné proměnné, který se anuluje ve čtyřech navzájem různých bodech. Polynom u lze tedy psát ve tvaru (4.61) "(ar,!/) = ■ÍPi{x,y)p2{x,y)p3(x1y), kde polynomy pi, p2 a P3 jsou opět definovány rovnicemi (4.7) a 7 je konstanta. Dosadíme-li nyní do (4.61) za (x,y) těžiště trojúhelníka, dostáváme z (4.60), že je (4.62) 0 = 7iII. Je tedy f — 0 a u je podle (4.61) nulový polynom, což dokazuje větu. Polynom 7J3 lze podobně jako v případě Lagrangeova kvadratického prvku psát ve tvaru 10 (4.63) na(x,y) = '£lUiP?\*,v), 3=1 kde polynomy jsou definovány rovnicemi f 1, í = *, (4.64) P?\*t,V>)=< í',*=l. --">• i 0, j + k, Elementární polynomy p|-3' se přitom dají vyjádřit pomocí elementárních polynomů lineární interpolace. Prostor konečných prvků vytvořený pomocí polynomů II3 označíme Je opět podprostorem Sobolevova prostoru Jř1. Vytvoříme-li v něm bázi standardním postupem popsaným výše, je složena z funkcí, které jsou na jednotlivých trojúhelnících rovny některé elementární funkci pí3' a které mají malý nosič. Označíme-li opět fh interpolaci funkce / e Jľr, kde za číslo r připouštíme nyní hodnoty 2, 3 a 4, platí pro chybu nerovnost (4.58). Tento odhad už nelze dále zlepšit zvětšováním čísla r, tj. dalším zvyšováním hladkosti interpolované funkce. Měříme-li tedy velikost chyby normou Sobolevova prostoru Jťl(fí), vede Ritzova-Galerkinova metoda při použití prostoru k rychlosti konvergence řádu 0(h3), samozřejmě stejně jako dříve za předpokladu dostatečné hladkosti hledaného řešení. 316 4 METODA KONEČNÝCH PRVKO 4.1.4 Obecný Lagrangeův prvek V tomto odstavci popíšeme stručně bez jakýchkoliv důkazů, jak lze sestrojit obecný Lagrangeův prvek založený na interpolaci obecným polynomem stupně m. Polynom IIm stupně TU má Srn - (m-)-l)(m-(-2)/2 koeficientů, a lze jej tedy užít k interpolaci v sm uzlech umístěných v uvažovaném trojúhelníku. Uspořádáme-li jednotlivé sčítance v obecném polynomu stupně m do schématu znázorněného v tab. 4.1, máme v něm návod, jak potřebné uzly rozmísti symetricky: Každou stranu trojúhelníku P1P2P3 rozdělíme na m stejných dílů a takto vzniklé dělicí body spojíme přímkami rovnoběžnými se stranami trojúhelníku. Tímto postupem rozdělíme daný trojúhelník na ro2 podobných trojúhelníků, jejichž vrcholy, kterých je pravé sm, vezmeme za uzly. Popsaným návodem jsme se ostatně už řídili ve speciálních případech uvedených v odst. 4.1.1 až 4.1.3. Tabulka 4.1 Schéma obecného polynomu ve dvou proměnných X 1 y X2 xy v2 xa X2y xy2 V3 x* *3y xy' v1 Označíme-li Uj, j = 1,..., sm, hodnoty interpolované funkce v právě sestrojených uzlech, lze polynom i7m psát ve tvaru (4.65) nm{x, y) = Yl UMi (*• y) kde každá funkce p^-7™' je polynom stupně m, který nabývá v právě jednom uzlu hodnoty jedna a v ostatních uzlech hodnot nula. Každý z těchto elementárních polynomů py"1' lze opět složit z lineárních polynomů pi, P2 ap3. Pro příslušný prostor konečných prvků J^"1 platí C -Jť1 a jeho aproximační vlastnosti jsou popsány opět nerovností (4.58), v níž předpokládáme / G Jf' a za r připouštíme hodnoty 2,..., m + 1. Bázové funkce v prostoru Syf- mají opět malé nosiče a na jednotlivých trojúhelnících rozkladu jsou rovny elementárním polynomům pjm\ Prostor je možno užít opět pouze k řešení problémů druhého řádu, neboť není podprostorem žádného Sobolevova prostoru X'k s k > 1. Maximální dosažitelná rychlost konvergence je 0(hm). 317 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU I METODA KONEČNÝCH PRVKU 4.1.5 Hermitův prvek Jako alternativu k interpolaci funkčních hodnot v mnoha uzlech je možné uvažovat interpolaci hodnot dané funkce a hodnot některých jejích derivací, tj. interpolaci Hermitova typu, v menším počtu uzlů. Jedna z možností tohoto postupu v případě polynomů třetího stupně je založena na následující větě. Věta 4.6. Polynom třetího stupně je jednoznačně určen svými funkčními hodnotami a hodnotami prvních parciálních derivací podle x a y ve vrcholech trojúhelníku PiP2P3 a funkční hodnotou v jeho těžišti. Důkaz. Protože i v tomto případě je počet podmínek roven počtu koeficientů uvažovaného polynomu, stačí dokázat, že polynom u, pro který platí (4.66) ■ľ(xj,yj)=^(xj,yj) = ~{xhyj)-0, j = 1,2,3, «(14,5/4) = 0, kde (xj , yj), j = 1,2,3, jsou souřadnice vrcholů trojúhelníku PiP2P3 a Pa - (*4, Sto) je jeho těžiště, je nulový polynom. Z rovnic (4.66) plyne, že je t. ^ 9u. . du du. (4.67) fo(Xj,y^ = dx~(Xi'y^Sl + ~tTyi-x''V^ = °' kde d/ds je derivace ve smeru s = (si, s2). Speciálně je tedy (4.68) ^(*2,Ih) = £(ea,lft) = 01 kde s je směr od bodu P2 do bodu P3. Protože je také «(3:2, J/2) = v(x3,y3) = = 0 a protože funkce « je podél úsečky P2P3 polynomem třetího stupně, je funkce u rovna na této úsečce identicky nule. Podobně se dokáže, že u se anuluje i na zbývajících dvou stranách trojúhelníka. Důkaz věty se nyní už zakončí za užití podmínky «(14, j/4) = 0 stejně jako důkaz věty 4.5. Kubický Hermitův prvek dostaneme tak, že za uzly vezmeme vrcholy P\, P2 a P3 daného trojúhelníka a jeho těžiště P4 a za uzlové parametry funkční hodnoty v uzlech Pi až P4 a hodnoty prvních parciálních derivací podle x a y v uzlech Pi až P3. Prostor konenčných prvků vytvořený právě popsaným kubickým prvkem označíme Vytvoříme-li jeho bázi naším standardním postupem, tj. položíme-li vždy právě jeden uzlový parametr rovný jedné a ostatní parametry rovny nule, mají bázové funkce opět malé nosiče. Prostor Jfj? je stejně jako prostor pouze podprostorem Sobolevova prostoru Jťl, takže je vhodný pouze k řešení problémů druhého řádu. Jeho aproximační vlastnosti jsou popsány nerovností (4.58) s r = 3 a 4, a jsou tedy stejné jako aproximační vlastnosti prostoru Za číslo r v nerovnosti (4.58) zde však nepřipouštíme hodnotu 2, jako tomu bylo v případě prostoru 5^3. Důvod je ten, že ke konstrukci interpolace v prostoru nestačí užít pouze hodnoty interpolované funkce, ale jsou zapotřebí hodnoty jejích derivací, a ty pro funkci z prostoru JŠ?2 nemusí mít smysl. Podobně jako jsme vytvořili kubický Hermitův prvek a prostor konenčných prvků , dají se vytvořit prostory S"^"^1 pro libovolné v = 1,2,____Stačí k tomu vzít za uzly stejně jako v kubickém případě vrcholy daného trojúhelníku a jeho těžiště a za uzlové parametry hodnoty interpolované funkce a jejích všech parciálních derivací až do řádu v včetně ve vrcholech trojúhelníku a hodnoty interpolované funkce a jejích parciálních derivací až do řádu v — 1 včetně v těžišti. Prostor ^j2""1"1 je stále vhodný pouze k řešení rovnic druhého řádu, neboť je podprostorem pouze prostoru Jť1 a není podprostorem žádného Sobolevova prostoru Jťk pro jfc > > 1. Lze však pomocí něj, stejně jako pomocí obecného Lagrangeova prvku, docílit rychlosti konvergence Ritzovy-Galerkinovy metody libovolně vysokého řádu, neboť jeho aproximační vlastnosti jsou dány nerovností (4.58) s r = 1/ + 2,..., 2ľ + 2. 4.1.6 Prostory konečných prvků pro řešení diferenciálních rovnic čtvrtého řádu Prostory konečných prvků, které jsme až dosud sestrojili, obsahují funkce, jejichž první parciální derivace mohou být podél straň trojúhelníků rozkladu nespojité. Takové funkce proto patří pouze do Sobolevova prostoru JŽ°1(Í2), Abychom sestrojili prostory, které jsou podprostory Sobolevova prostoru Jf2(Sl) a které jsou tak vhodné k řešení problémů čtvrtého řádu, je třeba, aby byly spojité nejen příslušné funkce samotné, ale i jejich první parciální derivace. Nejjednodušší prvek, pomocí něhož to lze dosáhnout, je založen na interpolaci polynomy pátého stupně. Při volbě uzlů a uzlových parametrů, kterých je zapotřebí 21, je však třeba postupovat jinak, než jsme postupovali při konstrukci prostoru S^jf založeného také na polynomech pátého stupně. Požadované spojitosti prvních parciálních derivací se dosáhne, jak hned uvidíme, tak, že za uzly se zvolí vrcholy Pi, P2 a P3 daného trojúhelníku a středy jeho stran P4, Pg a Pg a zá uzlové parametry se berou funkční hodnoty prvních a druhých parciálních derivací ve vrcholech a hodnoty derivace podle normály ve středu stran. Nejprve však ukážeme, že polynom pátého stupně je zvolenými uzlovými parametry skutečně jednoznačně určen. Veta 4.7. Polynom II5 pátého stupně je jednoznačně určen svými hodnotami a hodnotami parciálních derivací až do řádu dvě ve vrcholech trojúhelníka a hodnotami derivací podle normály ve středech jeho stran. Důkaz. Zřejmě stačí podobně jako při důkazu napr. věty 4.6 dokázat, že polynom u pátého stupně, pro který platí (469) ftť.iair.fo-»> = 0- «i + «3Í2, aigo, «2^o, j = 1,2,3, ^(*3,5/j)-0, j- 4,5,6, 318 319 [II. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU 4 METODA KONEČNÝCH PRVKU je nutné nulový polynom (je samozřejmě Pj = (x j, j/j), j = 1,..., 6, a body P, jsou rozmístěny jako na obr. 4.4). Abychom to nahlédli, všimneme si především, že pro j = 2,3 platí (4.70) kde s značí směr úsečky P2P3. Protože funkce ti je na úsečce P2P3 polynom stupně nejvýše pět, plyne z podmínek (4.70), že je na ní identicky roven nule. Protože funkce dujdn je na této úsečce polynom stupně nejvýše čtyři a protože pro j = 2, 3 platí (4-Tl) £(*i.W) = ž(S^W)*Í0 a samozřejmě také (4.72) du dn (»5,2/5) = 0, je funkce dujdn identicky rovna nule na úsečce P2P3. Protože tedy obě funkce u a dujdn se anulují na P2P3, dá se polynom u psát ve tvaru (4.73) u{x, y) = [pi(x, y)]2u3(x, y), kde U3 je polynom nejvýše třetího stupně. Poslední tvrzení platí ovšem i pro další dvě strany trojúhelníku P1P2P3; platí tedy (4.74) v) = 7b>i(z, y)]2b>2(x, y)Ý\p4*, y)Ý Protože však u je polynom stupně nejvýše pět, je nutně 7 = 0. Je tedy u = 0 a věta je dokázána. Buďte nyní Kí a K2 dva trojúhelníky se společnou stranou S, buďte «1 a u2 polynomy pátého stupně definované na K\, resp. K2 a předpokládejme, že platí (4.75) dx^dy"* dx^dy** , v koncových bodech S, Sui _ ô«2 ^ stře<lu úsečky S, dn dn w = -y— = 0 na S. on kde n je směr normály k úsečce S. Pro rozdíl w = Ui — U2 tedy platí (4.70), (4.71) a (4.72), a je tedy (4.76) dv' Je-li však w = 0 na S, je také (4.77) 320 dw c 0 na 5 (s je směr úsečky S). Relace (4.76) a (4.77) však ukazují, že funkce ti, která je definovaná na K\ U K2 tak, že je rovna funkci u± na Ki a funkci u2 na K2, je spojitá spolu se svými prvními derivacemi podél úsečky S. Prostor konečných prvků vytvořený pomocí právě sestrojeného prvku, označme jej St\, je tedy skutečně podprostorem Sobolevova prostoru Jť2(p,). Je-li fh interpolace funkce / £ JťT(Q), platí pro rozdíl f — f h opět nerovnost (4.58), kde za p připouštíme nyní hodnoty 0, 1 a 2. Na podobném principu lze sestrojit prostor konečných prvků který je podprostorem Sobolevova prostoru Jť"+1(íl), je tvořen po částech polynomy stupně 4ľ + 1 a je vhodný k řešení úloh řádu 2v + 2. Za uzlové parametry je třeba vzít hodnoty interpolované funkce a jejích derivací až do rádu 2v ve vrcholech trojúhelníku, funkční hodnoty a hodnoty derivací až do řádu v — 2 v těžišti a hodnoty první derivace podle normály ve středu každé strany, hodnoty druhé derivace podle normály v bodech dělících každou stranu na tři stejné díly atd., až hodnoty v-té derivace podle normály v bodech dělících každou stranu na v + 1 stejných dílů. Za předpokladu, že pro aproximovanou funkci platí / £ JřE,r(fi) pro r = 2i/ + 4- 2,..., 4v + 2, je chyba aproximace popsána nerovností (4.58) s p = 0,..., 1/ + 1. Prostor č@^"+1 lze samozřejmě užít i k řešení rovnic nižších řádů. 4.2. čtyřúhelníkové prvky V současné době jsou čtyřúhelníkové prvky méně populární než trojúhelníkové prvky. Všimneme si jich proto pouze velice stručně. 4.2.1. Obdélníkové Lagrangeovy prvky Tyto prvky podobně jako obdélníkové Hermitovy prvky, které popíšeme v odst. 4.2.2, jsou vhodné k řešení úloh na oblastech, jejichž hranice je tvořena rovnoběžkami se souřadnicovými osami. Jsou založeny na myšlence Lagrangeovy interpolace a vzniknou tak, že za lokální aproximaci na každém obdélníku vezmeme funkci, která vznikne formálním vynásobením polynomů stupně m v proměnné x a y. Obecný tvar polynomu tohoto typu je (4.78) u(x,y) = '$2'Yai3xiyj, i=0 j=0 takže k jednoznačnému určení jeho koeficientů je třeba (ra + l)2 uzlových parametrů. Obvykle se za ně berou funkční hodnoty ve vrcholech navzájem podobných obdélníků, které vzniknou tak, že každou stranu obdélníku rozdělíme na m stejných dílů a dělicí body spojíme rovnoběžkami se stranami. Tak např. v případě m = 1 jsou uzlovými parametry hodnoty ve vrcholech obdélníku a mluvíme o bili-neární aproximaci, v případě m = 2 jsou uzlovými parametry funkční hodnoty ve 321 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU 4 METODA KONEČNÝCH PRVKU vrcholech obdélníku, ve středech jeho stran a v těžišti a mluvíme o bikvadratickc aproximaci apod. Vzniklé prostory končených prvků jsou tvořeny podobně jako v případě trojúhelníkových Lagrangeových prvků funkcemi, které mají po částech spojité derivace, a jsou proto podprostory Sobolevova prostora Jť1(Ct). Jsou tedy vhodné k řešení úloh druhého rádu. Ve spojení s Ritzovou-Galerkinovou metodou vedou k rychlosti konvergence, která je stejného řádu jako při užití příslušných trojúhelníkových Lagrangeových prvků. Bázové funkce se v těchto prostorech konstruují opět zcela stejně jako v případě trojúhelníkových prvků. Za bázovou funkci se bere funkce, která má právě jeden uzlový parametr rovný jedné a ostatní rovny nule. Je zřejmé, že takto vzniklé funkce budou mít malé nosiče. Označíme-li u j, j = 1,..., (m+1)2, hodnoty interpolované funkce v uzlech, lze psát na daném obdélníku interpolační polynom U ve tvaru (m+l)a (4.79) U(x,y)= £ Uj^H^y), j=i kde pro elementární funkce platí (4.80) tf°c*.«)={5; i;i Každá bázová funkce je tedy na tom obdélníku, kde je nenulová, rovna některé elementární funkci ■ Protože obdélníkové prvky se užívají hlavně v těch případech, kdy hranice dané oblasti je tvořena úsečkami rovnoběžnými se souřadnými osami, omezíme se v dalším na obdélník, jehož strany jsou rovnoběžné se souřadnicovými osami. Každý takový obdélník lze převést jednoduchou transformací typu (4.81) Pi=-^(x-0, pí - T~{y -1) "2 na jednotkový referenční čtverec v rovině (pi,Ps). Každou elementární funkci iry"1' tedy stačí zadat pouze v referenční rovině a pak užít transformaci inverzní k transformaci (4.81). Tak např. pro m — 1 jsou funkce i/ií1-* dány vzorci (4.82) VÍ0 = P1P2, 031) = (l-Pl)(l-P2), kde indexy 1 až 4 se vztahují k vrcholům referenčního čtverce (1,1), (0>1), (0,0) a (1,0). Podobně lze také vyjádřit funkce 4>^ 4.2.2 Obdélníkové Hermitovy prvky Tyto prvky jsou založeny na Hermitově interpolaci a formálně je sestrojíme jako součin jednorozměrných Hermitových spline-funkcí (viz odst. 4.3.2 z kap. II). Vzniklý prostor konečných prvků označíme JŽ2"-1. Tento prostor je tvořen funkcemi, které se na každém obdélníku rovnají funkci U, která je součinem polynomů naj stupňů Iv - 1, a je tedy tvaru 2ľ-12ľ-l (4.83) U(x,y) = £ £°<f"V- 1=0 j=0 Polynom (4.83) má 4v2 koeficientů, a je tedy určen 4ľ2 uzlovými parametry. Za ty se volí hodnoty derivací d"1+a2/(dxair)yaí) pro cti, <*2 = 0. .. .. v — 1 ve vrcholech obdélníku. Pro prostor .S2"-1 platí .S2,"-1 C ^"(fi), takže je vhodný k řešení problémů řádu Iv. Báze v něm se sestrojí opět standardním postupem, přičemž elementární polynomy, pomocí nichž jsou definovány bázové funkce na jednotlivých obdélnících, se sestrojí obdobně jako v případě Lagrangeových prvků. 4.3 Algoritmické otázky spojené s metodou konečných prvků V předchozích odstavcích jsme popsali základní myšlenky, na nichž je založena metoda konečných prvků, takže je více méně jasné, jak při řešení konkrétní okrajové úlohy postupovat. Je třeba (i) zvolit prostor konečných prvků a jeho bázi; (ii) sestavit matici tuhosti a vektor zatížení; (iii) řešit vzniklou soustavu lineárních rovnic; (iv) vypočítat hodnoty přibližného řešení. Body, které jsme uvedli, jsou samozřejmě stejné jako v jednodimenzionálním případě, neboť princip Ritzovy-Galerkinovy metody nezávisí na počtu dimenzí. Dát však odpověď na problémy, které jsou v těchto bodech obsaženy tak, aby vzniklý algoritmus byl co nejefektivnější, je zde však podstatně komplikovanější. Tak např. při konstrukci prostoru konečných prvků a jeho báze jsme se v jednodimenzionálním případě snažili dosáhnout především toho, aby příslušná matice tuhosti byla pásová o co možná nejmenší šíři pásu. To zde platí v podstatě také, ale jen potud, pokud počet neznámých dovolí řešit uvalovanou soustavu eliminací. Je-li třeba užít některou iterační metodu (zejména z důvodu potřeby paměti), je pouhá řídkost příslušné matice většinou stejně užitečná jako její pásovost. Volbou prostoru končených prvků lze však velmi podstatně ovlivnit další vlastnosti této matice, které umožňují užít zvolenou iterační metodu co nejefektivněji (srv. odst. 2.3.2). Proto při vytváření programů užívajících k řešení okrajových úloh metodu konečných prvků se setkáme s netriviálními problémy už hned při návrhu konkrétního prostoru konečných prvků. 322 323 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU Přístup k problémům týkajících se bodu (ii) je v podstatě stejný jako jsme uvedli v odst. 4.3.3 z kap. II. Opět jednotlivé prvky matice tuhosti skládáme z příspěvků na jednotlivých útvarech rozkladu a integrály, které je třeba přitom vypočítat, transformujeme na integrály na referenčních útvarech. Technické komplikace při provádění tohoto postupu jsou však značné. Už jen problém, jak ekonomicky popsat rozklad dané oblasti na elementární útvary, není zdaleka triviální. K tomuto problému přistupují problémy spojené s přibližným výpočtem dvourozměrných integrálů, kdy příslušné kvadraturní vzorce jsou rovněž komplikovanější než v jedné dimenzi, nutnost eventuálního výpočtu křivkových integrálů apod. Pokus podat jen hrubý návod jak se vypořádat s uvedenými problémy, by vlastně znamenal vypracovat projekt implementace metody konečných prvků pro řešení určité skupiny problémů, což přesahuje rámec této elementární učebnice. Proto jsme se omezili na těchto několik poznámek. CVIČENÍ" 1. Sestavte metodu přímek pro řešení Dirichletova problémů pro Laplaceovu rovnici Au — 0 na jednotkovém čtverci tak, že nahradíte diferenčním podílem [u(ar, g — h) — 1u(x, y) + u(x, y + h)]/h2 derivaci d2u/Ôy2. 2. Dokažte princip maxima pro operátor definovaný rovnicí (2.2). 3. Odvoďte chybu aproximace derivace d2uj(dxdy) dané vzorcem (2.13). 4. Dokažte platnost vzorce (2.22). 5. Proveďte podrobně výpočty potřebné k důkazu věty 2.3 na str. 251. 6. Dokažte, že pro operátor A;, definovaný rovnicí (2.21) platí princip maxima. 7. Dokažte, že metoda sítí (Ajiti)j,s = 0 pro řešení Dirichletova problému pro Laplaceovu rovnici v takové oblasti fi, že všechny hraniční uzly leží na její hranici, vede k rychlosti konvergence 0(hs). Návod: Použijte pomocnou funkci jako v důkazu věty 2.4 na str. 254 a výsledek cvič. 6.) 8. Dokažte, že metoda sítí (2.27), (2.61) má chybu řádu 0(h2). 9. Dokažte konvergenci metody sítí (2.27), (2.66) pro řešen! Neumannovy úlohy. 10- Dokažte, že vektory ví"1'1', jejichž složky jsou dány vzorci (2.91), tvoří ortonor-movanou soustavu vlastních vektorů matice Ah metody (2.86). 11. Prověřte, že číslování uzlů tak, jak je popsáno na str. 275, skutečně vede k matici tvaru (2.120). 12. Prověřte platnost vzorců (2.121) až (2.125). 13. Dokažte správnost algoritmu cyklické redukce 324 POZNÁMKY K LITERATUŘE 14. Rozmyslete si, proč oblast íí = {(x, y); (x2 + y2 < 1) A (x £ (0,1))} nemá lipschitzovskou hranici. 15. Prověřte, že funkce [-±ln(x2 + »/2)]1/4 patří do JP^Íl), kde £í s {(x,y); x2 + + y2 < 1}, a přitom není spojitá. 16. Dokazte, že pro úlohu (2.1), (3.1) platí nerovnost (4.1). 17. Dokážte nerovnost (4.35). 18. Nalezněte užitím referenčního trojúhelníku vyjádření elementárních polynomů Pj ' kubické Lagrangcovy interpolace. 19. Odvoďte tvar elementárních funkcí ijr- ' bikvadratického obdélníkového prvku. POZNÁMKY K LITERATUŘE Cl. 1. Teorie okrajových úloh pro parciální diferenciální rovnice eliptického typu je rozpracována do značných podrobností a je jí věnována rozsáhlá literatura. Podrobný výklad založený na funkcionální analýze nalezne čtenář např. u Nečase (1967), Lionse a Magenese (1968) a v knize Rektorysově (1976). Okrajové úlohy pro rovnice vznikající v matematické teorii pružnosti jsou velmi detailně rozebrány v knize Nečasově a Hlaváčkově (1983). Klasického pojetí se přidržují např. knihy Petrovského (1950), Mirandy (1955) a Berse, Johna a Sehechtera (1964). O numerické problematice uvažované v této kapitole nalezne čtenář mnoho cenného materiálu např. v knihách Collatze (1951), Forsytha a Wasowa (1960), Babušky, Prágera a Vitáska (1964), Berezina a 2idkova (1966), Babušky, Prágera a Vitáska (1966), Mitchella (1969), Marčuka (1980) a Meise a Mareowitze (1981). Poslední ze zmíněných knih obsahuje kromě toho některé užitečné programy a kniha Marčukova rozsáhlou bibliografii. Výběr látky zpracované v této kapitole se do značné míry kryje s obsahem příslušné kapitoly jiné autorovy knihy (Vitásek (1987)), která však jako přehled základních numerických metod neobsahuje žádné důkazy. Cl. 2. O metodě sítí bylo napsáno velmi mnoho. Obsáhlou bibliografii nalezne čtenář např. v už zmíněné knize Marčukově (1980) a ve sborníku redigovaném Jacobsem (1977). Základní principy této metody jsou vyloženy např. ve všech knihách, o nichž jsme se zmínili, kniha Samařského a Andrejeva (1967) je monografií, která je celá věnována metodě sítí pro řešení eliptických problémů. O užití integrálních identit k sestavení diferenčních rovnic viz Babuška, Práger a Vitásek (1966). Souvislost konvergence se stabilitou diferenčních schémat studuje např. Rjabeňkij a Filippov (1966) a Samarskij a Gulin (1973). Rovněž existuje velmi rozsáhlá literatura zabývající se řešením soustav lineárních rovnic, které vznikají v metodě sítí. Řadu informací i v tomto směru nalezne čtenář v obecných pramenech, které jsme uvedli. Sborník Jacobsův (1977) podává velmi zasvěcený přehled o nejnověj-ších modifikacích algoritmů založených hlavně na přímých metodách a obsáhlou 325 III. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU LITERATURA bibliografii. Varga (1962), Wachspress (1966), Young (1971) a Samarskij, Nikolajev (1978) představují jedny z nejúplnějších pramenů ke studiu iteračních metod. Upozorněme také na rozsáhlý soubor programů pro řešení eliptických okrajových úloh, v němž se kromě metody sítí užívá i metoda konečných prvků a který je podrobně popsán v knize Riceově a Boisvertově (1985), Cl. 3. Teoretický základ, na němž spočívají variační metody řešení eliptických úloh, je v podstatě stejný jako v případě obyčejných diferenciálních rovnic. Proto i zde odkazujeme na Rektoryse (1974) a na knihy Michlinovy (1966 a 1970). Kromě toho většina knih zabývajících se metodou konečných prvků, např. Strang, Fix (1973), Mitchell a Wait (1977), Ciarlet (1978), Johnson (1988), Křížek a Ne-ittaanmäki (1990), obsahuje aspoň přehled základních teoretických výsledků. Cl. 4. Metoda konečných prvků patří v současné době k jedné z nejužívanějších metod pro řešení eliptických okrajových úloh. Přestože její bouřlivý rozvoj začíná teprve na sklonku šedesátých let, její už věnována obrovská literatura. Např. už v r. 1976 vyšla kniha Norrieova a de Vriesova, která je cele věnována pouze bibliografii této metody. Velmi obsáhlou bibliografii nalezne čtenář také v další knize Norrieově a de Vriesově (1978), která představuje velmi užitečný pramen pro všechny aspekty spojené s metodou konečných prvků. Kniha Ciarletova (1978), která má rovněž obsáhlou komentovanou bibliografii, je sice pro studium dosti náročná, jako jeden z nejúplnějších pramenů je však třeba ji maximálně doporučit. Velmi přístupně je napsána kniha Mitchellova a Waitova (1977), kniha Axelssonova a Barkerova (1984) a zejména kniha Johnsonova (1988). I v nich nalezne čtenář mnoho cenných informací. Rada dalších pramenů ke studiu metody končených prvků je uvedena v seznamu literatury, aniž bychom o nich zde konkrétně hovořili, upozorněme jen ještě na zcela elementární knihu Beckerovu, Careyovu a Odenovu (1981). Otázky spojené s problematikou řešení vzniklých soustav lineárních rovnic a s technikou programování jsou rovněž v poslední době intenzívně studovány. Relevantním pramenem je např. Bathe a Wilson (1976) a příslušné kapitoly z knihy Norrieovy a de Vriesovy (1978). Softwarové realizaci je výhradně věnován např. sborník redigovaný Kardestuncerem a Norriem (1987). LITERATURA AXELSSON, O. - BARKER, V.A.: Finite Element Solution of Boundary Value Problems, Theory and Computation. New York-San Francisco-London, Academic Press 1984. BABUSKA, I. - PRÄGER, M. - VITÁSEK, E.: Numerické řešení diferenciálních rovnic. Praha, SNTL 1964, BABUSKA, I. - PRÄGER, M. - VITÄSEK, E.: Numerical Processes in Differential Equations. London-New York-Sydney, Interscience Publishers 1966. BATHE, K.J. - WILSON, E.L.: Numerical Methods in Finite Element Analysis. 326 Englewood Cliffs, N.J., Prentice-Hall 1976. BECKER, E.B. - CAREY, G.F. - ODEN, J.T.: Finite Elements. An Introduction, Vol. 1. Englewood Cliffs, N.J., Prentice-Hall 1981. BEREZIN, I.S. - ŽIDKOV, N.P.: Metody vyčislenij. 3. vyd. Moskva, Nauka 1966, 2 sv. BERS, L. - JOHN, F. - SCHECHTER, M.: Partial Differential Equations. New York-London-Sydney, Interscience Publishers 1964. (Překlad do ruštiny: Moskva, Miř 1966.) CIARLET, P.G.: The Finite Element Method fo Elliptic Problems. Amsterdam, North Holland 1978. COLLATZ, L.: Numerische Behandlung von Differentialgleichungen. Berlin-Göttingen-Heidelberg, Springer-Verlag 1951. (Překlad do ruštiny: Moskva, IL 1953.) DUPONT, T. - SCOTT, R.: Polynomial Approximations in Sobolev Spaces. Math. Comp. S4, 1980, s. 441 - 463. FORSYTHE, G.E. - WASOW, W.R.: Finite Difference Methods for Partial Differential Equations. New York-London, J. Wiley and Sons 1960. (Překlad do ruštiny: Moskva, IL 1963.) GALLAGHER, R.G.: Finite Element Analysis. Englewood Cliffs, N.J., Prentice-Hall 1975. JACOBS, D.A.G. (ed.): The State of the Art in Numerical Analysis. London-New York-San Francisco, Academic Press 1977, JOHNSON, O: Numerical Solutions of Partial Differential Equations by the Finite Element Method. Cambridge, Cambridge University Press 1988. KARDESTUNCER, H. - NORRIE, D.H. (eds.): Finite Element Handbook. New York, McGraw-Hill 1987. KŘÍŽEK, M. - NEITTAANMÄKI, P.: Finite Element Approximation of Variational Problems and Applications. Essex, Longman 1990. LIONS, J L. - MAGENES, E.: Problěmes aux limites nonhomogenes et applications. Paris, Dunod 1968-1970, 3 sv. (Překlad do ruštiny: Moskva, Mir 1971.) MARCUK, G.I.: Metody vyčisliteFnoj matematiky. 2. vyd. Moskva, Nauka 1980. (Překlad do češtiny: Praha, Academia 1987.) MARTIN, H.C. - CAREY, G.F.: Introduction to Finite Element Analysis. New York, McGraw-Hill 1973. MEIS, T. - MARCOWITZ, V.: Numerical Solution of Partial Differential Equations. New York-Heidelberg-Berlin, Springer-Verlag 1981. MICHLIN, S.G.: Cislennaja realizacija variacionnych metodov. Moskva, Nauka 1966. MICHLIN, S.G.: Variacionnyje metody v matematicčeskoj fäzike. 2. vyd. Moskva, Nauka 1970. MIRANDA, C: Equazioni alle deriváte parziali di tipo ellittico. Berlin-Göttingen-Heidelberg, Springer-Verlag 1955. (Překlad do ruštiny: Moskva, IL 1957.) ÍÍ27 III. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU LITERATURA MITCHELL, A.R.: Computational Methods in Partial Differential Equations. YOUNG, D.H.: Iterative Soluytion of Large Linear Systems. New York-London London-New York-Sydney-Toronto, J. Wiley and Sons 1969. Academic Press 1971. MITCHELL, A.R. - WAIT, R.: The Finite Element Method in Partial Eifferential ZIENKIEWICZ, O.C.: The Finite Elements Method in Engineering Science. 2. vyd Equations. Chichester-New York-Brisbane-Toronto, J. Wiley and Sons 1977. New York. McGraw-Hill 1971. (Překlad do ruštiny: Moskva, Mir 1975.) (Překlad do ruštiny: Moskva, Mir 1981.) NEČAS, J.: Les méthodes directes en théorie des equations elliptiques. Praha, Academia 1967. NECAS, J. - HLAVÁČEK, I.: Úvod do matematické teorie pružných a pružně plastických těles. Praha SNTL 1983. NORRIE, D.H. - VRIES, G.A., DE: A Finite Element Bibliography. New York, Plenum Press 1976. NORRIE, D.H. - VRIES, G.A., DE: An Introduction to Finite Element Analysis. New York-San Francisco-London, Academic Press 1978. (Překlad do ruštiny; Moskva, Mir 1981.) ODEN, J.T.: Finite Element of Nonlinear Continua. New York, McGraw-Hill 1972. (Překlad do ruštiny: Moskva, Mir 1975.) PETROVSKIJ, I.G.: Lekcii ob uravnenijach s častnymi proizvodnymi. Moskva-Leningrad, Gostechizdat 1950. (Překlad do češtiny: Praha, Přírodovědecké vydavatelství 1952.) PROSKUROWSKI, W. - WIDLUND, O.: On the Numerical Solution of Helmhol-tz's Equaiton by the Capacitance Matrix Method. Math. Comp. 30, 1976, s. 433 -468. REKTORYS, K.: Variační metody v inženýrských problémech a v problémech matematické fyziky. Praha, SNTL 1974. RICE, J.R. - BOISVERT, R.G.: Solving Elliptic Problems Using ELLPACK. New York-Berlin-Geidelberg, Springer-Verlag 1985. RJABEŇKIJ, V.S. - FILLIPPOV, A.F.: Ob ustojčivosti raznostnych uravněnij. Moskva, Gostechizdat 1956. SAMARSKIJ, A.A. - GULIN, A.V.: Ustojčivosť raznostnych schein. Moskva, Nauka 1973. SAMARSKIJ, A.A. - ANDREJEV, V.D.: Raznostnyje metody dlja elliptičeskich uravněnij. Moskva, Nauka 1976. SAMARSKIJ, A.A. - NIKOLAJEV, J.S.: Metody rešenija setočnych uravněnij. Moskva, Nauka 1978. (Překlad do češtiny: Praha, Academia 1984.) SCHWARTZ, L.: Théorie des distributions I et II. 2. vyd. Paris, Hermann 1957. STONE, H.L.: Iterative Solutions of Implicit Approximations of Multidimensional Partial Differential Equaitons. SIAM J. Numer. Anal. 5, 1968, s. 530 - 558. STRANG, G. - FIX, G.J.: An Analysis of the Finite Element Method. Englewood Cliffs, N.J., Prentice-Hall 1973. (Překlad do ruštiny: Moskva, Mir 1977.) VARGA, R.: Matrix Iterative Analysis. Englewood Cliffs, N.J., Prentice-Hall 1962. WACHSPRESS, E.L.: Iterative Solution of Elliptic Systems. Englewood Cliffs, N.J., Prentice-Hall 1966. 328 329 2 METODA SlTl Kapitola IV. Parciální diferenciální rovnice parabolického typu i 1 Úvod Dostatečně obecným příkladem parciální diferenciální rovnice parabolického typu v m + 1 proměnných je rovnice (1.1) Lu-f{x,ť), (x,t)eR, kde R — Q x (0, T), Í2 C Em, je omezená oblast, T je kladná konstanta a „. , du dl du \ (L2) Lu = cm-^dVi{ai^)+qu- Koeficienty c(x,t), a;y(x,ŕ), q(x,t) a pravá strana /(x,í) jsou dané funkce m + 1 proměnných, o nichž se obvykle predpokladá, že pro ně platí (1.3) c(x,t)^c0, aťj(x,ť) = aji(x,t), m m pro každé (x, í) e R a f; £ E1, kde ca a po js°u kladné konstanty. Parabolický diferenciální operátor L lze tedy psát také ve tvaru lu = cdu/dt + Leu, kde Le je eliptický diferenciální operátor. Typická úloha pro rovnici (1.1) je úloha nalézt funkci u, která splňuje v R rovnici (1.1) a pro niž platí (1.4) u(x,0) = j(x), x e íl, a (1.5) a^-rPu = y, x e r, ť e (0,T), kde funkce a, 0 a f jsou definovány na ľ x (0, T), a(x, t) + 0{x, t) > 0 a dujdnc je derivace ve směru konormály. 330 Podmínka (1.4) je počáteční podmínka a podmínka (1.5) okrajová podmínka. Pro okrajovou podmínku (1.5) se také užívá při a = 0 (podobně jako v případě okrajové úlohy pro eliptickou parciální diferenciální rovnici) název Dirichletova podmínka, při 0 = 0 Neumannova podmínka a v obecném případě Newtonova podmínka. Otázkami řešitelnosti právě zformulované úlohy se nebudeme zabývat a odkážeme čtenáře na obsáhlou specializovanou literaturu (viz např. Petrovskij (1952) nebo Friedman (1964) pokud jde o klasickou teorii, nebo Lions (1961) pokud jde o moderní funkcionálně analytickou teorii.) Důvody pro to jsou podobné, jako tomu bylo v kap. III, a nebudeme je proto znovu opakovat. Všimneme si však jiné okolnosti patrné ostatně na první podhled. Z rovnice (1.1) a z doplňujících podmínek (1.4) a (1.5) je vidět, že proměnná i, jejíž fyzikální význam je obvykle čas, má mezi všemi nezávislými proměnnými výjimečné postavení a že vzhledem k této proměnné má daná úloha charakter úlohy s počátečními podmínkami, zatímco vzhledem k ostatním proměnným, nazvěme je prostorovými proměnnými, jde o okrajovou úlohu. Dá se proto očekávat, že algoritmy pro řešení dané úlohy budou mít vzhledem k proměnné í rekurentní charakter, a že tedy metody pro numerické řešení parabolických problémů budou vykazovat současně rysy metod pro řešení úloh s počátečními podmínkami i okrajových úloh. Tato skutečnost bude v dalším výkladu zřetelně patrná a přinese také některé specifické zvláštnosti. Z metod pro přibližné řešení parabolických parciálních diferenciálních rovnic popíšeme podrobně zejména metodu sítí čítaje v to důležitý speciální případ metody střídavých směrů. Dále pak si všimneme tzv. semidiskrétních metod. Tyto metody jsou obdobou metody přímek, o níž jsme se zmínili v kap. III, a spočívají v tom, že diskretizace se provede pouze vzhledem k prostorovým proměnným ati,..., xm a proměnná ť (čas) se ponechá spojitá. U těchto metod se tedy řešení původní úlohy aproximuje řešením soustavy obyčejných diferenciálních rovnic. Pokud se při zmíněné diskretizaci vychází z myšlenky metody sítí, vznikne klasická metoda přímek, užijeme-li metodu konečných prvků, dostaneme semidiskrétní metodu Galerkinova typu. Podobné semidiskrétním metodámjsou metody Rotheovy, kdy se diskretizace provádí pouze vzhledem k proměnné í. Náhradní úloha je pak okrajová úloha pro eliptickou soustavu diferenciálních rovnic. I o těchto metodách se stručně zmíníme. 2 Metoda sítí Metoda sítí vychází i zde z úplně stejných principů, jak jsme o nich hovořili v kap. II a III, a je to jedna z nejpopulárnějších metod pro řešení parabolických diferenciálních rovnic. Užití metody sítí k řešení okrajových úloh pro obyčejné diferenciální rovnice a pro eliptické parciální diferenciální rovnice vede, jak víme, na soustavy lineárních algebraických rovnic. Zde je tomu v principu také tak, v důsledku zvláštního postavem proměnné t však budou tyto soustavy speciálního charakteru, což přinese některé další jevy, zejména problém stability, s nimiž jsme se až dosud ne- 331 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU setkali. Abychom tyto problémy co nejjednodušeji objasnili, vyšetříme metodu sítí nejprve v jednoduchém speciálním případě. 2.1 Rovnice pro vedení tepla v jedné prostorové proměnné V tomto odstavci se budeme zabývat rovnicí du 82u (2.1) i„=^_^_ = o, £ e (0,1), te(0,r) s počáteční podmínkou (2.2) u(x,0) - g(x), x e (0,1) a okrajovými podmínkami (2.3) U(0,í) = u(l,ť) = 0, í€(0,r), která je zřejmě speciálním případem rovnice (1.1) a která se vzhledem ke své nej-běžnější fyzikální interpretaci nazývá rovnicí pro vedení tepla. Začneme dvěma nej-jednoduššími variantami metody sítí pro řešení této rovnice. Předtím však ještě poznamenejme, že existence a jednoznačnost řešení úlohy (2.1) až (2.3) je zaručena např. spojitostí a omezeností funkce g. 2.1.1 Explicitní a implicitní metoda V případě úlohy (2.1) až (2.3) je množina R obdélník (0,1) x (0,T). Sestrojme v něm síť složenou z přímek x = xk a í = íj, kde xk = kh, k — 0,...,n, h = 1/n, ti = ít, i = 0,..., r, T = T jr a n ar jsou přirozená čísla. Skutečnost, že proměnné x a ť nemají v rovnici (2.1) stejnou roli tedy respektujeme tím, že uvažujeme síť obdélníkovou nikoliv čtvercovou. Znakem Äj,lT označme množinu všech uzlů (xk,ti) ležících v Ř, znakem fíj,T označme ty uzly (xk,t{), pro něž je fc = 1,... ,n — 1 a f = = 1,..., r, a Th.r uzly, které leží na úsečkách t = 0, 0 g as g 1, ac = 0, 0 <t _T a i = 1, 0 < t á T. Je-li nyní LJf^ operátor, který funkci u = vfp definované na množině uzlů Řh,T přiřazuje funkci L^u definovanou na množině Rh,T a který je dán vzorcem -tÍ[4,:í)-24'-1)+4';11)]. M)eRKr, platí pro každou dostatečně hladkou funkci « (2.5) (L$rtW)l? = (Lu)(xk,tl) + 0(T + h*), (xk,t,) e Rh,T, kde u(pr) je funkce definovaná na množině RhlT předpisem (u(pr>)jj.° - u(xk,U), jak se snadno zjistí pomocí Taylorova vzorce. 332 2 METODA SÍTÍ Vzhledem k této rovnici je přirozené hledat přibližné řešení ze soustavy rovnic (2.6) = 0, * = l,...,n-l, í=l.....r. Protože těchto rovnici je zřejmě méně než neznámých, jek nim třeba ještě připojit rovnice (2.7) ui0)=g(xk), t = 0, a (2.8) = /=1) ,.jPi získané z počáteční podmínky a z okrajových podmínek. Všimněme si, že jsme se zde přiklonili k možnosti předepsat hodnoty přibližného řešení v rohových uzlech (0,0) a (1,0) z počáteční podmínky. Stejně oprávněně jsme mohli také užít okrajové podmínky. Zádáme-li totiž, aby řešení úlohy (2.1) až (2.3) bylo alespoň spojité v R, je nutné, aby pro funkci g platily podmínky g(0) = g(í) = — 0. Tyto podmínky se nazývají podmínkami souhlasu, a nejsou-li splněny, je nutně řešení dané okrajové úlohy v bodech (0,0) a (1,0) nespojité. V tomto případě je pak jedno, kterou z uvedených možností zvolíme. Soustava (2.6) až (2.8) představuje soustavu (n + l)(r + 1) rovnic pro (n + l)(r + 4- 1) hodnot hledaného řešení v uzlech sítě ležících v Ř\T. Tato soustava je však velice speciální. Každá z rovnic (2.6) obsahuje pouze jednu hodnotu přibližného řešení v čase t = i( a rovnice (2.7) a (2.8) pak přímo udávají hodnoty některých neznámých. Vynásobíme-li rovnice (2.6) číslem r, dostaneme po elementární úpravě (2.9) 40 = (hj'-u+(1 _ 2/j)«r >+p4;1\ k = 1,. ., ři - 1, / = 1, ,., r, kde (2.10) Protože přibližné řešení 4°'' pro k = 0,..., u známe, můžeme použitím rovnic (2.9) s 1 = 1 vypočítat hodnoty pro k = 1,..., n — 1; hodnoty uk^ °pět známe (v našem případě jsou to nuly), můžeme tedy vypočítat pro k = 1,..., n — — 1 atd. Přibližné řešení počítáme tedy rekurentně postupně pro přibývající časové řádky sítě. Žádný problém s řešením odvozené soustavy vlastně nevzniká a rovnice (2.9), (2.7) a (2.8) popisující diferenční schéma udávají přímo algoritmus přibližného řešení uvažované úlohy. Z tohoto důvodu se právě popsaná varianta metody sítí nazývá explicitní metoda nebo explicitní schéma. Lokální chyba, tj. chyba, která vznikne náhradou derivací v původní diferenciální rovnici diferenčními podíly, je u explicitní metody za předpokladu dostatečné hladkosti přesného řešení velikosti 0(r + h2) (srv. rovnici (2.5)). Je tedy při dostatečně jemné síti libovolně malá, V eliptickém případě měla tato skutečnost většinou za 333 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU 2 METODA SlTl následek konvergenci, neboť diferenční rovnice vzniklé na základě zmíněného jednoduchého principu náhrady derivací diferenčními podíly byly už v podstatě vždy korektní, tj. jejich řešení spojitě záviselo na vstupních datech úlohy. Abychom posoudili platnost tohoto závěru v případě parabolické rovnice, začneme jednoduchým příkladem. Příklad 2.1. Řešme rovnici (2.1) s okrajovými podmínkami (2.3) a s počáteční podmínkou g(x) — sinu. V tomto jednoduchém příkladě je přesné řešení dáno vzorcem (2.11) u(x, t) — e * i sin 7rx. takže lze snadno posoudit chybu vypočteného přibližného řešení. Protože lokální chyba je řádu 0(r + A2), zvolili jsme časový integrační krok t řádově rovný druhé mocnině prostorového integračního kroku h. Přibližné řešení a jeho chyba v bodě x = 1/2 je pro dvě alternativy sítě uvedeno v tab. 2.1 (symbol co v ní značí, že došlo k přeplnění). Tabulka 2.1 Řešeni rovnice (2.1) explicitní metodou T .10000 T = 10-4 h = 10-2 T = 10"4, h = 2.10-2 přibl. řeš. chyba přibl. řeš. chyba 1 0,999 013 2 0,0000004 0,999012 9 0,0000006 2 0,998 0271 0,0000009 0,998 0273 0,000 000 7 3 0,997042 5 0,000 0010 0,997042 4 0,000 0011 4 0,9960578 0,000 0021 0,996 058 2 0,000 001 7 5 0,995 076 7 0,000 000 7 0,995 075 0 0,000002 4 6 0,994 089 9 0,000 005 8 0,994 093 2 0,000002 6 7 0,9931213 -0,000 006 2 0,9931121 0,000 002 9 8 0,992107 9 0,000 0275 0,992 1319 0,000003 5 9 0,9912201 -0,000063 4 0,991153 0 0,000 003 7 10 0,989 9864 0,000192 6 0,990 1 74 8 0,000 004 4 96 -2,83.1037 2,83.1037 0,909 562 3 0,000 0396 97 8,52.1037 -8,52.103T 0,908664 7 0,0000400 98 -2,56.1038 2,56.1038 0,907 768 2 0,0000401 99 7,72.1038 -7,72.1038 0,9068723 0,000 040 5 100 -2,32.1038 2,32.103S 0,905 9775 0,0000406 10 000 co oo 0,000 051 5 0,000 0002 334 Z této tabulky vidíme, že v případě sítě r - 10~4, h = 10-2 dostáváme úplně nesmyslné výsledky, zatímco v druhém případě, i když užitá síť je hrubší, jsou výsledky přijatelné. Pokusme se vysvětlit, proč tento na první pohled jistě překvapivý jev nastal. Položíme-liuM podmínkami (2.8) psát ve tvaru fl'li)Ti můžeme rovnici (2.9) s příslušnými okrajovými (2.12) kde (2.13) ul» = AEuV-1\ 1 = 1,....r, 1-2/3 fi 0 0 fi 0 •• '•■ o ■■, ■•. fi 0 6 1-2/? je matice řádu n—1 a t/°) je známý vektor určený počátečními podmínkami. Matice Ag charakterizuje operaci přechodu od (/ — l)-ního časového řádku sítě k /-tému řádku, a nazývá se proto matice přechodu. Z rovnice (2.12) ihned plyne, že platí «('> = AÍuC°> (2.14) í = 0,. Chování složek vektoru o W v závislosti na / je tedy určeno chováním prvků matice AE. Vlastní čísla A„ matice Ae a příslušné vlastní vektory v M -— (v[ jsou však dány jednoduchými vzorci ľ7T „O) JT (2.15) A„ = l-4/?sin'! 2n' v= l,...,n- 1, (2.16) visk k = 1,. 1, jak se snadno zjistí přímým výpočtem. Ze vzorce (2.15) plyne, že vlastní číslo A„_i je pro velká n přibližně rovno číslu 1 — 4/5. Některé prvky matice AE se tedy chovají jako {1 - 4/?)'. Je-li však fi > 1/2, je 1 - 4/3 < -1, a tedy alespoň jeden prvek matice AB musí při rostoucím l exponenciálně růst. Tato situace právě nastala pro první síť užitou v příkladě 2.1, neboť pro ni je fi = 1. Platí-li však, že je (2-17) fi g i, plyne ihned ze vzorce (2.15), že všechna vlastní čísla matice Ag js0u v absolutní hodnotě menší než jedna, Prvky matice A^ jsou tedy omezené konstantou nczávis- 335 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU 2 METODA SlTÍ lou na r a n. Tento prípad nastal pro druhou síť v uvedeném příkladě, neboť pro ni je /» = 1/4. Na základě uvedeného rozboru je zřejmé, že podmínka (2.17) je v případě uvažované diferenciální rovnice nutnou podmínkou konvergence. Následující věta ukazuje, že jde i o podmínku postačující. ^ Věta 2.1. Nechť tešení problému (2.1) až (2.3) existuje a má\yR dvě' spojité derivace podle t a čtyři spojité derivace podle x. Nechť dále platí (2.17). Pak existují konstanty M a ho > 0 takové', že pro h £ h0 a pro každý uzel (xk,ti) £ Ěh,r platí (2.18) I"!0-«(**,*()l = M(r+h2). Důkaz Pro přesné řešení platí za uvedených předpokladů (2.19) (c)u(pr))*° = -4°, (».*•) 6 *,„ kde funkce u'pr) je definována stejně jako ve vzorci (2.5) a kde (2.20) |4'}| ÍK(T + h2). Pro chybu rfp = u1^' - u(xt,,ti) tedy platí (2.21) neboli (2.22) =0, Jr = 0,. 1,..., n — 1, í = 1,..., r, ,«=,(0 = 0, | = 1,; k = 1,... ,n — 1, / = 1,..., r s příslušnými počátečními a okrajovými podmínkami. Z rovnic (2.22) a z nerovností (2.20) však snadno indukcí dokážeme, že platí (2.23) \nT\SirK(t + h2) pro ř = 1,..., r, neboť koeficienty v lineární kombinaci na pravé straně rovnice (2.22) jsou v důsledku splnění nerovnosti (2.17) nezáporné. Je tedy (2.24) S ttK{t + h2) = TK(r + h2), což dokazuje větu. Užití operátoru vede tedy ke konvergentní metodě, při limitním přechodu jsou však parametry sítě vázány nerovností (2.17). Z právě dokončeného důkazu věty 2.1 však plyne, že podmínka (2.17) zaručuje nejen konvergenci uvažované metody při h —» 0, r —► 0, ale i její uspokojivé chování vzhledem k zaokrouhlovacím 336 chybám. Při splnění této podmínky je tedy explicitní metoda v tomto smyslu stabilní. Naopak rozumné chování metody, u níž je podmínka (2.17) porušena, se nedá očekávat ani ve speciálním případě. Tak např. při užití první sítě v příkladě 2.1 jsou přesné hodnoty přibližného řešení ujj.^ dány vzorcem (2.25) «1° = (l ■ Z tohoto vzorce je vidět, že v případě speciální počáteční podmínky «(i, 0) = sin tsx přesné hodnoty přibližného řešení nejen že nejsou nesmyslné, ale dokonce uspokojivě aproximují přesné řešení. Jelikož však mocniny matice přechodu užitého schématu nejsou omezené, rekurentní výpočet přibližného řešení se v důsledku zaokrouhlování zhroutí, a to, jak je vidět z tab. 2.1, velmi rychle. Explicitní schéma, které jsme právě popsali, je tedy stabilní ve výše zmíněném smyslu, je-li splněna podmínka (2.17); v opačném případě je nestabilní. Protože jeho stabilita závisí na splnění podmínky, která podřizuje časové dělení sítě prostorovému dělení, mluvíme o relativně stabilním schématu. Podmínku stability (2.17) musíme samozřejmě respektovat i při zjemňování sítě. V tomto případě se tato podmínka může ukázat značně restriktivní, neboť rozpůlíme-li např. prostorový integrační krok, je třeba za časový krok brát čtvrtinu původního; počet potřebných časových řádků tak může neúnosně růst. Proto vzniká přirozená otázka, zda neexistuje diferenční schéma pro řešení úlohy (2.1) až (2.3), které by ke své stabilitě nevyžadovalo splnění žádné podmínky typu (2.17). Pokusme se takové schéma, které nazveme absolutně stabilní, nalézt. K explicitnímu schématu jsme došli tak, že jsme derivaci du/dt v uzlu (xt, ti-i) aproximovali podílem [u(eí, ťj) — «(sj,, r|_i)]/r. Tento podíl však aproximuje stejně dobře uvedenou derivaci i v uzlu (ij., t\). Stejně oprávněně můžeme tedy dojít místo 2 7t \ 1 . kw 1 2Ôô) Smiôô- k operátoru k operátoru L' danému rovnici (D (2.26) 2ul')+u (0 i ■*+lJ r1 * 1 ' h}[ neboť opět pro každou dostatečně hladkou funkci u platí (2.27) a£T)u(pr))í° = . *') + °(t+*2) (jak ihned plyne z Taylorova vzorce). Funkce i/pr' je přitom definována stejně jako ve vzorci (2.5). Přibližné řešení ti^ se tedy můžeme pokusit hledat z rovnic (2-28) aíM° = 0' * = !.■■■.n-1, í = l.....r, s počáteční podmínkou (2.7) a okrajovými podmínkami (2.8). Přepíšeme-li rovnice (2.28) podobně jako v případě explicitní metody, dostaneme -^1 + (l + 2/?)«íi)-M'l1 = 4'-1), k = 1, í= l,...,r, (2.29) 337 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU s příslušnými počátečními a okrajovými podmínkami. Použijeme-li znovu dříve zavedeného vektorového označení u'') = (u['\ ..., un^_1)T, lze rovnici. (2.29) spolu s okrajovými podmínkami (2.8) přepsat maticově do tvaru (2.30) kde (2.31) Am» = „('-D, igi.....r 1 + 2/3 -0 0 -P '■■ 0 '■. '-. 0 -P 0 -p 1 + 2/3. je opět třídiagonální matice řádu n 1 a ií'0' je známý vektor určený počáteční podmínkou. Řešení probíhá opět rekurentně od jednoho časového řádku k druhému, k získání přibližného řešení v /-tém časovém řádku za předpokladu, že v (/ — l)-ním časovém řádkuje už známe, je však třeba řešit soustavu n—1 lineárních rovnic o n—1 neznámých s třídiagonální maticí (2.31). Z tohoto důvodu se metoda (2.28) nazývá implicitní metoda nebo implicitní schéma. Výpočet je proveditelný při libovolné hodnotě P, neboť matice A\ je zřejmě regulární. Dá se to zjistit např. pomocí lemmatu 3.5 z kap. II (viz str. 166), neboť matice A\ je ireducíbilně diagonálně dominantní při libovolném kladném p, má kladné diagonální prvky a nekladné nediagonální prvky. Roh matice přechodu implicitní metody hraje matice A^1. Vlastní čísla jiv této matice jsou dána vzorcem (2.32) uu--!—=-, v = l,...,n-l, y ' F l+4/W§£' ' ' takže jsou při libovolném p > 0 v absolutní hodnotě menší než 1. Přechod od (/ — l)-ního časového řádku k /-tému časovému řádku je tedy stabilní při libovolném poměru prostorového a časového dělení sítě a v implicitní metodě tak máme příklad absolutně stabilní metody. Obraťme se nyní ke studiu její konvergence. Stejně jako v případě explicitní metody, platí pro chybu t;® = ujj.'' — "(*t,ť/) této metody rovnice (2.33) n£O) = 0, i = 0,...,n, (') i-l, i = 1, 0, í = l.....r, a existuje konstanta K taková, že je (2.34) 338 2 METODA SlTl Rovnice pro chybu implicitní metody jsou tedy také implicitní, takže už nejsme schopni tak snadno jako v případě explicitní metody odhadnout na jejich základě velikost chyby. Dokážeme proto nejprve několik pomocných tvrzení. Lemma 2.1. Nechť pro funkci definovanou na množině JŠjíiT platí (2 35) ž 0, (**,*!) € Pat pro každý uzel (xk,t\) £ S^, platí (2.36) nf° < (0 ní S max rň'. B ů k a z . Buď M — max r$ a nechť existuje uzel (ej„, tjB) e Rh,r, pi° který je = M. V tomto uzlu platí nerovnost (2.35), kterou můžeme psát ve tvaru (2.37) (i + - pn^l, - (hfcl - nll;-v š o. Předpokládáme-li nyní, že aspoň v jednom z uzlů (zi,,, <i0-i), (xk„~i,tta) a (jh,0+1,í,0) je í? < M, plyne z nerovnosti (2.37) (p > 0), že je (2.38) 0 = (1 + 20)M - pM - pM - M < < (1 + 2/J)^-/^, a to je spor. Je tedy ijj^Zj = li'°+i = = M- Pokračujeme-li tímto způsobem dále, dospějeme nutně k uzlu z th,r, ve kterém funkce n nabývá hodnoty M. Lemma je dokázáno. Právě dokázané lemma ukazuje, že operátor splňuje princip maxima. Lemma 2.2. Nechť pro funkci r/^ definovanou v Ři,tT platí rovnice (2.33) a buď (2.39) E = max |e co. Pat existuje konstanta M (nezávislá na h ar) taková, že platí (2.40) Irj^l^Afe, k = 0.....n, / = 0,...,r. Důkaz . Položme rj^ == 1 - e**-1 pro ír = 0,..., n a / = 0,. Taylorova vzorce je 1 , r. Podle (2.41) e*H-i-l _ 2eJ"-1 +ea:*+1-1) = (eXl-1 -2e"k + eXk+1) - = e-1(e'' + i/iV')že-1. 339 iv. parciální diferenciální rovnice parabolického typu 2 metoda sítí Položme dále (2.42) takže je Protože podle (2.41) je e(Z.,^r)j' ^ 1, plyne z rovnice (2.39), že platí (2.44) neboli £<° = -eer® ± fc = 0.....n, / = 0, (2.45) Platí tedy (2.46) a z lemmatu 2.1 dostáváme (2.47) -e<>r)«±4°i0. max ŕj\ (ik,*i)ern,r Funkce f je však na množině Tat zřejmě nekladná, a je tedy nekladná v celé množině Řh,r- Protože funkce rj^ je v Äj|T omezená, plyne tvrzení lemmatu z rovnice (2.42). ' Důkaz následující konvergenční věty pro implicitní metodu už nyní nepředstavuje žádný problém. Věta 2.2. Nechť řešeni' problému (2.1) až (2.3) má v R dvě spojité derivace podle t a čtyři spojité derivace podle x a nechť ujj.'' je přibližné řešení vypočtené implicitní metodou (2.29). Pak existuje konstanta M taková, že pro dostatečně male h a r platí (2.48) \u<P-u(xk,t,)\^M(T + h2). Důkaz. Tvrzení věty plyne ihned z rovnice (2.27) a z lemmatu 2.2. Konvergenci implicitní metody se nám teď podařilo dokázat bez jakýchkoliv doplňujících předpokladů o poměru r/h2. Při implicitní metodě proto můžeme volit časový integrační krok r bez jakéhokoliv ohledu na zvolený prostorový integrační krok, aniž bychom narušili konvergenci. Tuto skutečnost však nemůžeme obecně plně využít. Nechceme-li totiž, aby převládla chyba, která vznikne v důsledku dis-kretizace proměnné t, je třeba brát časové oko sítě r řádově tak velké, jako je kvadrát prostorového oka sítě h (viz odhad (2.48)). Splnění této podmínky má však za následek, že při zjemňování sítě musíme stejně jako u explicitní metody při rozpůlení prostorového integračního kroku rozdělit časový integrační krok na čtyři díly. Vzniká proto přirozená otázka, není-li možné sestrojit takové diferenční schéma pro řešení úlohy (2.1) až (2.3), které by vedlo k chybě řádu 0(r2 + h2) a při kterém by stejně jako při implicitní metodě nebylo třeba brát žádný ohled na h při volbě r. Konstrukci takového schématu provedeme v následujícím odstavci. 2.1.2 Crankovo-Nicolsonovo schéma Uvědomíme-li si, že úloha (2.1) až (2,3) má vzhledem k proměnné í charakter úlohy s počáteční podmínkou (na tuto skutečnost jsme už ostatně upozornili v úvodu) a že při řešení obyčejné diferenciální rovnice j/ = f(t, y) metodami typu j/f+i = = yi + ^[a/i+i + (1 — a)fi], kde a je číselný parametr, je chyba obecně řádu O(r), avšak při a = 1/2 řádu 0(r2), přirozeně se objeví otázka, zda mezi aproximacemi daného parabolického operátoru tvaru lr (2.49) „(') . 1 - ar h2 ^ k~1 ■2«« + 4u (i-i) , (í-il nemá hodnota 1/2 parametru a opět výlučné postavení. Následující věta ukazuje, že tomu tak skutečně je. Věta 2.3. Nechť funkce u má v R tři spojité derivace podle t a čtyři spojité derivace podle x a nechť u'pr' je funkce definovaná na síti r předpisem (v.(pr))k^ = u(xk,t\). Pak pro každý uzel (xk,ti) e Rh>T platí (2.50) (i£.Vpr3)i° =oi(Lu)(xk,!,) + (! " ^(Lu^t^-řOir + h2) při obecném a a (2.51) aiíVW)? = \(L*)fa,t,) + \{Li.){xk,tl-1)+0(-r' + h*). Důkaz. Pomocí Taylorova vzorce snadno vypočteme, že platí (2.52) (tW«W)[" = = a[w(xh,t,)~ -^(xk,t,) \t-^(xk,t,) + 0(rs + h2)\ + + 0(r2 + h2)\ = = a(Lu)(xk,t,) +(1 - a)(iu)(a!i,íi_i)- - ¥(**■*«) " í1 - *I-0] + 0(r2 + h2). Z rovnice (2.52) však už tvrzení věty plyne snadno. 340 341 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU Z důkazu věty 2.3 je zrejmé, že v prípade a ^ 1/2 není třeba předpokládat spojitost třetí derivace podle t, ale stačí pouze spojitost druhé derivace, stejně jako tomu bylo u explicitní a implicitní metody. Přibližné řešení ujj.'' budeme nyní hledat z rovnice (2.53) (tí"r«)i°=0, * = 1.....n-1, í=l.....r, s počáteční podmínkou (2.7) a okrajovými podmínkami (2.8). Použijeme-li už vícekrát užitou vektorovou symboliku, můžeme rovnice (2.53) spolu s příslušnými okrajovými podmínkami zapsat ve tvaru (2.54) Auu(i) = W_1), í=l,...,r, kde u je daný vektor a matice Au a A^ jsou třídiagonální matice dané vzorci (2.55) Av = 1 + 2«/? -<*/? 0 -a(3 0 0 -ap 0 -ap l + 2a/3. (2.56) Al ■- l-2(l-a)r? (l-a)t3 0 (l-a)8 0 0 o (1-«)/? 0 (1-<*)/? l-2(l-a)jrí, Matice /lu je zřejmě regulární, neboť je podle Collatzova lemmatu (viz lemma 3.5 z kap. II) monotónní, takže rovnice (2.53) s příslušnými počátečními a okrajovými podmínkami definují skutečně metodu. Při a ý- 0 je tato metoda implicitní v tom smyslu, že k tomu, abychom vypočetli přibližné řešení na nějakém časovém řádku, je třeba řešit soustavu lineárních algebraických rovnic. Jak je to s konvergencí zavedené třídy metod? V případě a = 0 byla situace velice jednoduchá a konvergence této metody byla takřka zřejmá (ovšem za splněni podmínky (2.17)). V případě a — 1 jsme rovněž bez podstatných obtíží dokázali konvergenci užitím lemmatu 2.2, tj. pomocí principu maxima. Tento princip ostatně platil i v případě a = 0. V obecném případě lze sice také dosáhnout platnosti principu maxima, je však k tomu třeba klást na poměr /? = r/k2 nepřirozené požadavky. Proto budeme postupovat poněkud jinak, abychom se vyhnuli nutnosti užití principu maxima. 2 METODA SÍTl Pro chybu rfp všech uvažovaných metod platí zřejmě (2.57) (1 W,)P> = e", k = 1,. ...n - 1, / = 1,.. s počáteční podmínkou (2.58) n<0)=0, k = 0,...,n, a okrajovými podmínkami (2-59) ^ -^° = 0, Z-l, ...p. Přepíšeme-li tyto rovnice maticově, dostaneme (2.60) Avt}W = AlijC-1)+ tcW, 1=1, .p, kde (2.61) ^={1?.....tf-ď (2.62) tei > ■ • • ! £l (0 a matice /4u a /4l jsou definované rovnicemi (2.55) a (2.56). Z věty 2.3 víme, že pravé strany rovnic (2.57) jsou (za předpokladu dostatečné hladkosti přesného řešení) malé. Rádi bychom usoudili, že tento fakt má za následek i malost příslušného řešení. Je tedy třeba dokázat, že řešení uvažovaných diferenčních rovnic spojitě závisí na pravých stranách, neboli, užijeme-li terminologie z odst. 2.4 kap. III, že uvažované diferenční rovnice jsou stabilní vzhledem k pravým stranám. Pro pohodlí čtenáře vyslovíme zde nezbytné definice specializované na náš případ ještě jednou. Definice 2.1. Řekneme, že diferenční schéma dané operátorem 1^" je stabilní vzhledem k pravé straně, existuje-li konstanta M (nezávislá nafiar) taková, že pro každé řešení »7''' rovníce (2.60), pro které je j|eO|| 5 £ pro l — 1,.. .,r, platí (2.63) ||íjW[| S Jf£. Zde se rozumí, že symbol ||.|| značí nějakou vhodnou pevně zvolenou normu v (n — l)-dimenzioná]ním vektorovém prostoru. Např. pří vyšetřování implicitní metody jsme vlastně konstruovali odhad typu (2.63) na základě principu maxima a za vektorovou normu jsme přitom brali jSfoo normu (tj. ||x|| = max|ar,-j). i Z definice 2.1 je vidět, že je-li dané schéma stabilní vzhledem k pravé straně a jsme-li schopni odhadnout lokální chyby — to není většinou velký problém — je metoda konvergentní. Stabilita vzhledem k pravé straně se však neověřuje vždy pohodlně, a proto zavedeme ještě jeden pojem a zformulujeme další pomocné tvrzení, které její studium podstatně usnadní. 342 343 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU Definice 2.2. Řekneme, že diferenční schéma dané operátorem LJ^ je stejnoměrně stabilní vzhledem k počátečním podmínkám, existuje-li konstanta M (nezávislá na h a t) taková, že pro každé celé s z intervalu (0, r) a pro každou soustavu vektorů »/'), / = s, s + 1,..., r, která je řešením rovnic (2.64) Avt,V = AL^'-11 pro í = s + 1, .., r, platí (2.65) 111,(0(1 ^ M||r,W|j, i = s,. ,r. Lemma 2.3. Nechť pro diferenční schéma, dané operátorem platí (i) existuje konstanta M (nezávislá na h a t) taková, že je \\A^l\\ š M; (ii) schéma je stejnoměrně stabilní vzhledem k počátečním podmínkám. Pak schéma je stabilní vzhledem k pravé straně. Důkaz . Buď rfi^ řešením rovnic (2.60) a buď ||eW || á e pro / = 1.....r. Přiřaďme každému celému číslu m, 0 á m S r, soustavu vektorů £^\rn), l = = 0, ...,r, takto: £('>(m) = fl pro / = 0,..., m a pro l = m + 1,..., r jsou vektory r;«(rn) řešením rovnic (2.66) Avé'Hrn) - i4Lí('-1)(m) + re« Zvolme nyní pevně m, 1 í m $ r a položme (2.67) *-<'>=íw(m-l)-£<'>(„,). Předně je v « = 0 pro í - 0,..., m - 1 a v M = É(m)(m 1). Dále je (2.68) AVVW = Alv'-'-1'! pro i = m + 1,.. .,r. V důsledku stejnoměrné stability vzhledem k počátečním podmínkám existuje konstanta M\, taková, že platí (2-69) lk(0II^Afi||*Cm)ll pro l = m..., r. Protože však pro l < m je v'1' = 0, platí vztah (2,69) pro / = = 0,...,r. Platí tedy (2.70) \\é'\m - 1) - á lix\£m\m - 1)|| pro / = 0,...,r. Odhadněme nyní normu vektoru ^m\m - 1). Tento vektor je podle své definice řešením rovnice (2.71) Av^m\m - 1) = AU^^Hm - 1) + re(m>. Protože však vektor ^m-1-'(m — 1) je nulový, je podle předpokladu (i) (2.72) l|Č(m)("i - 1)|| š tMc. 344 Odtud a z nerovnosti (2.70) tedy dostáváme, že platí (2.73) llí(0(t" " 1) - e(0("i)|| S riAM\t pro / = 0,..., r. Pišme nerovnost (2.73) postupně pro m = 1, (2.74) ||í«(o) -{«(1)11 árMM,£, ||ť«(l)-(«(2)||áTMMie, 2 METODA SlTÍ , r; dostaneme ||Čw(r - 1) - Čw(r)|| g rAÍMií. Spojením těchto nerovností máme (2.75) Ilíí0(°) - Í^MII S rrMMl£ = TMMxt pro / = 0.....r. Vektor £^(r) je však pro l = 0,..., r nulový vektor a {'''(O) splňuje tytéž rovnice jako vektor ijW. Je tedy £*■''(()) — rjW pro / = 0,...,ra nerovnosti (2.75) dokazují lemma. Upozorněme, že v definicích 2.1 a 2.2 a v právě dokázaném lemmatu není nikterak podstatné, že se konkrétně jednalo o operátor íj^j daný rovnicemi (2.49). Příslušné pojmy lze zřejmě zavést pro libovolný diferenční operátor, jen vede-li na soustavu rovnic, kterou je možné psát ve tvaru (2.54). Chceme-li dokázat konvergenci studované metody, stačí v důsledku lemmatu 2.3 prověřit jeho předpoklady. Protože jsme se rozhodli, že se chceme vyhnout principu maxima, užijeme tzv. metodu separace proměnných, zvanou také Fourierova metoda. Začneme zavedením vhodné normy (n — l)-dimenzionálních vektorů, které v našich úvahách vystupují. Vzhledem k postupu, který chceme užít, je přirozené požadovat, jak uvidíme, aby uvažovaný (n — l)-dimenzionální vektorový prostor byl Hilbertův prostor. Normu budeme proto definovat pomocí skalárního součinu. Obyčejný euklidovský skalární součin zde není vhodný, neboť složky vektorů, s nimiž pracujeme, aproximují hodnoty funkcí definovaných ve všech bodech intervalu (0,1), a je tedy žádoucí, aby námi zavedený skalární součin konvergoval pro /i-+0 k Sfi(0, l)-skalárnímu součinu (srv. požadavky (2.175) z kap, III.). Tuto vlastnost má jednoduchá modifikace euklidovského skalárního součinu, kdy za skalární součin vektorů v, w bereme číslo (v, w)^ dané vzorcem (2.76) (v, w)h - h^jTvkWk. Norma vektoru v je tedy dána výrazem 1/2 / V (2-77) IMk=(fc5>ž ■ ^ *=l ' Označme ještě vektorový prostor opatřený normou (2.77) symbolem 345 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU Stabilita diferenčních schémat LJfJ v právě zavedené normě je popsána v následující větě. Věta 2.4. Buď dán diferenční operátor íj^ sOSaí la nechť v případě, že je 0 ú a< 1/2 platí (2,78) 1 2(1-2«)' Pak diferenční schéma dané tímto operátorem je stejnoměrně stabilní vzhledem k počátečním podmínkám. Důkaz-. Pišme matice A\j a Ai, dané vzorci (2.55) a (2.56) ve tvaru (2.79) Av = l + a/3P0 a (2.80) AL= /-(l-a)/?P0l kde / je jednotková matice a trídiagonálnt matice Prj rádu n — 1 je dána vzorcem (2.81) 2 -1 -1 '■■ 0 0 0 0 : % , -i 0 ... 0 -1 2 _ Snadno zjistíme, že vektory v^"\ v = 1,.. .,n — 1, jejichž složky jsou dány rovnicemi (2.16), tvoří ortogonální soustavu vlastních vektorů matice (2.81), a to jak v obyčejném euklidovském, prostoru, tak v prostoru E^"-1', a že příslušná vlastní čísla jsou (2.82) A„ = 4 sin In v = l,...,n- 1. Vzhledem k rovnicím (2.79) a (2.80) jsou vektory v také vlastními vektory matice ^lui resp. A\, s odpovídajícími vlastními čísly A(.u> = 1 + K = l,...,n-1, - i_ (i _ a)pX„, v-\.....n-1. (2.83) resp. (2.84) Abychom dokázali tvrzení věty, je třeba odhadnout řešení soustavy (2.64) pomocí počáteční podmínky. Vzhledem k právě zjištěné skutečnosti, že matice Au a Ai, mají tytéž vlastní vektory, se pokusíme splnit rovnici (2.64) soustavou vektorů tvaru (2.85) z« =c(i>w... 346 2 METODA SlTl kde c(!) je skalární veličina závisející pouze na indexu /. Funkci ijj', která řeší rovnici (2.64), se tedy snažíme nalézt ve tvaru součinu dvou funkcí, z nichž jedna je funkcí pouze proměnné / a druhá funkcí pouze proměnné k. Odtud také pochází název metoda separace proměnných. Má tedy platit rovnice (2.86) c(/)Auv W = c(l - 1)ALv Odtud plyne, že funkce c(/) musí splňovat rovnici A™ (2.87) Každá soustava vektorů z O tvaru (2.88) z('> = c|TmrJ v c-) kde c je libovolná konstanta a rS libovolné celé číslo, tedy řeší rovnici (2.64). Vzhledem k tomu, že vektory v'"' tvoří ortogonální bázi v prostoru E^1-1', existují k libovolnému vektoru r) = g E^n_1' čísla c\, .., cn_i taková, že platí n-l (2.89) „(0 = ^0^«. i/=i Z ortogonality vektorů v W přitom plyne, že je (2-90) ll^lll = ECÍH,'(")IIÍ- Z rovnic (2.89) a (2.88) tedy dostáváme, že řešení soustavy (2.64) určené počáteční podmínkou lze psát ve tvaru (2.91) Přitom platí (2.92) "(° = I>[^>] ^0lll = £í Tib)! H"M|I?- lí = l A„ jak plyne opět z ortogonality vektorů Podle rovnic (2.83) a (2.84) je A(„L) _ l-(l-«)/?A„ (2.93) Platí-li (2.94) 1 + a/3A„ ^ l-(l-a)^A, 1 + a/?A„ - ' 347 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU je (2.95) \\ffi% 5 ||r/s>|k jak plyne ihned ze vzorcu (2.92) a (2.90). Splnění nerovností (2.94) tedy stačí ke stabilitě. Pravá z těchto nerovností je splněna vždy, nebol! je 0 í a í 1, /J > > 0 a A„ > 0. Je-li a ä 1/2, je splněna i levá z těchto nerovností bez dalších doplňujících podmínek, neboť v tomto případě je (1 — 2a)p\v í 0, a tedy tím spíše platí nerovnost (2.96) (1 - 2a)/3Xv < 2 neboli (2.97) -l-a0\u <l-{l-a)0K. Je-li však lía< 1/2 a platí-li navíc nerovnost (2.78), platí opět (2.96), a tedy také (2.97), neboť je Au < 4, jak plyne ihned z rovnic (2.82). Tím je důkaz věty zakončen. Diferenční schémata 1^"' jsou tedy při 1/2 íaí 1 absolutně stabilní. Vzhledem k tomu, že pro velká n je jedno z vlastních čísel matice přechodu A^1AiJ velice blízké číslu [1 — 4(1 — a)p\/(\-\-4aP) a vzhledem k tomu, že toto čísloje v případě 0Sa< < 1/2 a při porušení podmínky (2.78) menší než —1, je tato podmínka i nutnou podmínkou stability. Uvažovaná diferenční schémata jsou proto při 0 í a < 1/2 pouze relativně stabilní a nerovnost (2.78) je jejich podmínkou stability. Věta 2.4 spolu s lemmatem 2.3 dovolují už snadno dokázat základní konvergenční větu pro uvažovanou třídu schémat. Věta 2.5. Nechť řešení okrajové úlohy (2.1) - (2.3) má v R dvě spojité derivace podle t a čtyři spojité derivace podle x. Nechť v případě a = 1/2 má řešení navíc spojitou třetí derivaci podle t. Nechť konečně při 0 á a < 1/2 je splněna nerovnost (2.78). Pale existuje konstanta M taková že pro chybu rj'p = u® — u(zt,i|) přibližného řešení spočítaného schématem platí (2.98) \\v{l)\\h í M(r + h*) v obecném případě a (2.99) HAá^ + A2) při a = 1/2. Důkaz Za uvedených předpokladů splňuje chyba nj^ rovnice (2.60) a přitom je (2.100) ů M{r+h2) 2 METODA SÍTl při a jí 1/2 a (2.101) ^i^M^ + h2) při a — 1/2, jak plyne ihned z věty 2.3. Matice Au je symetrická a její vlastní Čísla jsou dána vzorcem (2.83). Vzhledem k tomu, že H^IJ1!!* íe zřejmě obyčejná spektrální norma, platí (2102) HVIU = -pjy ž I- Amin Protože schéma í.^™' je podle věty 2.4 zároveň stejnoměrně stabilní vzhledem k počátečním podmínkám, je podle lemmatu 2.3 stabilní vzhledem k pravé straně, a zbývá tedy už jen odhadnout velikost normy vektorů e^. Z nerovností (2.100) a (2.101) však ihned plyne, že je (2.103) « = fc£V*°]2á M'ir + h'yhY^Zl 1 š M2(r + h2)2, a / 1/2, M2(r2 + h2)2hYHZ{ 1 š ^(t2 + ft2)2> <* = 1/2- Důkaz je hotov. Výsledek, který jsme dostali, je tedy poněkud slabší, než tomu bylo v případě explicitní a čistě implicitní metody, a to v tom smyslu, že jsme užili horší normu než normu užitou v odst. 2.1.1. Toto zhoršen! není příliš podstatné a navíc je lze důmyslnějším postupem, jak uvidíme, odstranit. Hlavního výsledku, tj. sestrojení absolutně stabilního diferenčních schématu s celkovou chybou řádu 0(r2 + h2) jsme však dosáhli. Takové schéma je dáno operátorem í-j1/2' a příslušná metoda se nazývá Crankova-Nicolsonova metoda. Tato metoda je velmi populární a v praxi se často užívá. Důvod je ten, že její užití je podstatně ekonomičtější, než je tomu např. u explicitní metody. Čtenáře možná toto tvrzení na první pohled poněkud překvapí, neboť při užití Crankova-Nicolsonova schématu je třeba navíc ve srovnání s explicitní metodou řešit v každém kroku soustavu lineárních algebraických rovnic. Tato soustava má však třídiagonální matici, takže počet potřebných operací je řádově roven počtu neznámých, tj. veličině 0(l/h). Protože celková diskretizační chyba je 0(r2 + h2), je rozumné volit t = 0{h). Počet potřebných časových řádku je tedy 0(l/h) a celkový počet operací je řádově roven 0(l/h2), což je pro malá h podstatně méně než u explicitní metody, kde je toto číslo rovno 0(l/h3). Zakončeme tento odstavec ještě jedním postřehem. Z toho, co jsme až dosud uvedli, by mohl vzniknout dojem, že všechna schémata pro řešení rovnice pro vedení tepla, která jsou sestavena „přirozeným" způsobem, jsou buď absolutně stabilní, nebo v nejhorším případě relativně stabilní. Tak tomu však není. Abychom to uká- 348 349 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU 2 METODA SlTl žali, uvažujme schéma (2.104) 0+i) k_' 0-i) „0) 0) , „0) - 2u"> + u' 2r h2 f = l,...,r- 1, které vznikne tak, že derivaci du/dt v uzlu (ii, i;) nahradíme podílem [u(ící, ír+i) — — tí(;Efc,ií_i)]/(2r), který ji aproximuje s přesností 0(t2). Schéma (2.104) je tedy odvozeno zcela v duchu metody sítí a jeho lokální chyba je jako u Crankova-Nicolsonova schématu řádu 0(r2 + h2). S Crankovým-Nicolsonovým schématem dokonce souvis! ještě těsněji, neboť nahradíme-li v něm veličiny iJp průměry ']/2 a užijeme-li je jen v sudých časových řádcích, dostaneme přímo Crankovo-Nicolsonovo schéma. V podobě, jak je schéma (2.104) zapsáno, je to však schéma třívrstvové, takže je nutné k němu připojit kromě okrajových podmínek (2.8) a počáteční podmínky (2.7) ještě další počáteční podmínku v čase t = t, kterou je třeba vypočítat jiným vhodným způsobem. Rovnice (2.104) s příslušnými okrajovými podmínkami lze zapsat maticově ve tvaru (2.105) kde Pq je matice daná vzorcem (2,81). Zavedeme-li (2n -i/0) rovnicí 2)-dimenzionální vektory (2.106) : „(0 u 0+1) lze třívrstvové schéma (2.105) psát jako dvouvrstvové schéma (2,107) vW = Pi/0-1), í = l,...,r-l, kde matice R je řádu 2n — 2 a je daná vzorcem / -WPo (2.108) R = Přímým výpočtem se snadno zjistí, že všechna vlastní čísla matice R se určí řešením n — 1 kvadratických rovnic £2 + 2/?A„£ — 1 = 0, v = 1,..., n — 1, kde čísla X„ jsou vlastní čísla matice Po, a jsou tedy dána vzorci (2.82). Z uvedených rovnic je však vidět, že ať zvolíme síť jakkoliv, vždy existují vlastní čísla matice R, která jsou v absolutní hodnotě větší než 1. Schéma (2.104) je tedy absolutně nestabilní. 2.2 Obecná parabolická rovníce v jedné prostorové proměnné V tomto odstavci se budeme zabývat metodou sítí pro řešení diferenciální rovnice (2.109) Lu = f(x,t) v R, 350 kde R je opět množina {(x, ť); 0 < as < 1, 0 < < < T} a (2.110) Ltt = c(x,t)^ - ^-{p(x,i)~^+q(x,ť]u, s počáteční podmínkou (2.111) u(x,0) = g(x), 0<I<1, a okrajovými podmínkami (2.112) !i(0,í) = T(O)(t). u(l,t) = 7W(ť), 0<f<T, (Dirichletova nebo první okrajová úloha) nebo (2.113) (/<0)„)(t) = 70>)(t), (/(%)(*) = 7(1)(0> 0<t<T kde (2.114) (*<°>ii)(t) = -pío,ť)^(o,o + /*0H*)«(<M). (/<%)(«) =p(l.*)£(l.*) + /9(1)W«(l.*)- Funkce o, p, q, /, p(°\ Z?'1), 7W, 7W a g jsou dány a předpokládáme, že jsou spojité a že funkce p má navíc spojitou derivaci v Ě. Kromě toho předpokládáme, že existují konstanty p0, pi, Co, Ci, Ji, Po, P\ takové, že platí (2.115) 0 <p0 % p{x,t) í pi, 0<ca^c(x,t)-gclt 0 = g(a:,í) á 9i a že je buď ft'^(t) = 0 pro i — 1,2 (v tom případě mluvíme o Neumannově nebo druhé okrajové úloze) nebo (2.116) (v tomto případě hovoříme o Newtonově nebo třetí okrajové úloze). Uvedené předpoklady jsou příkladem podmínek, které zaručují jednoznačnou řešitelnost výše zmíněných úloh. Následující odstavec věnujeme sestavení příslušných diferenčních operátorů. 2.2.1 Odvození metody Na základě výsledků, k nimž jsme dospěli při studiu metody sítí pro okrajové úlohy pro obyčejné diferenciální rovnice v druhé kapitole a na základě myšlenky studovat ne jednu izolovanou metodu, ale celou třídu metod závislých na parametru a £ £ (0,1), je přirozené aproximovat diferenciální operátory L a /O) operátory LJ^J a \ které funkci u definované na množině ÍžjjiT (jejíž význam je stejný jako 351 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU v odst. 2.1.1) přiřazují funkci definovanou na Ä/,iT, resp. na množině {/; í = 1.....r} a které jsou dány vzorci CO _ (i-i) (2.117) (íWu)« =[«(»*,(,) + Í1 - aMxj,*,.!)]^-ÍL-- t " ^íM** - h/2,ii)4-i - [p(xt - A/2,tf)+ + PO* + Ä/2,íi)]«*) + P(*t + h/2,t,)u^+1}- + p(xt + *r-i>]«Sí-lí + p(** + A/2,íi-i)«ř;í)}+ + ajfxt.í.Jujj,0 + (1 - a)g(^,*i-i)4'_I). í1*.*') € Rh.r a (0 P-i) (2.118) (lta;a)uf) = Jfc[ae(*l>,ťí) + (1 - a)c(xo,ť,-t)P-^-- r - [p(x0 + Ä/2, <l)"'°;"°) - rtOuo0] - (i-i) _ (i-i) -(1-«)[;»(*,, +A/2, ti-t)^-^-- ^^)(t,_1)«ri)]+ + Ikajfco.tfjuo0 + 5*(1 - a)9(*o,*í-i)«ol_1):í C) (i-i) (íí,r"M<0 = JAM«»,Í|) + (1 - a)e(«„i|-i)]g= ~"" + t C) _ CO + a[p(*„ - A/2, ŕ,)"" + /^OK0] + + (1 - a) [p(x„ - /1/2,fi_1)""~1);"":il) + ^1)(ťí_1)„('-1)] + + ln<v9(xn,í,)u« + ift(l í,-i)«í,'-l). K těmto rovnicím se dojde nejsnáze tak, že v diferenciální rovnici (1.12) z kap. II píšeme místo pravé strany / funkci —cdu/dt + f, výraz —cdu/dt v místě (xt,ti), resp. (xt,ťj_i) aproximujeme výrazem c(xí,íi)[íí(x|;, íj) - ti(xj,, ťi_i)]/r, resp. c(xíi,ťi_i)[u(xjt,íi)-u(ii,ij_i)]/r, napíšeme rovnice typu (3.40) a (3.58) z kap. II pro bod (xfc.ťi) a (xjt.ŕj-i) a zkombinujeme je s vahami a a (1 — a). Opět nás bude zajímat, jako dříve při vyšetřování metody sítí, jaký bude výsledek aplikace právě zavedených operátorů na funkce definované na Řh,T, které vzniknou z hodnot (dostatečně hladké) funkce u v uzlových bodech. To popíšeme v následujících dvou větách, v nichž klademe jako dříve (ti(pr))jjP = u(xjr,íj). 2 METODA SlTl Veta 2.6. JVechť koeficienty diferenciálních operátorů (2.110) a (2.114) jsou dostatečně hladké a nechť u je dostatečně hladká funkce definovaná v R. Pak existují funkce vq a v\ definované a spojitě diferencovatelné v intervalu (0, T) a takové, že platí (2.119) (A&V'*^0 - erf»v**,*i) + (1 - *l-i) + 0(t + A2), fc = l,...,n-l, l=l,...,r, a (2.120) (jQfl&yf* = íh[(Lu)(i,tl)+ (1 - «)(lti)(i,ir-i)]+ + £*(/««)((,) + (1 - a)(/««)(íj_i)- - [«!,((,) + (1 - «0nr(*i_i)]ť + O(rA) + 0(A3), J = l,...,r, i = 0,l. Věta 2.7. JVechť koeficienty diferenciálních operátorů (2.110) a (2.114) jsou dostatečně hladké a nechť u je dostatečně hladká funkce definované v Ř. Pak existují funkce Vg a i>i definované a spojitě diferencovatelné v intervalu (0,T) a takové, ie platí (2.121) (Ll]í2)uW)ľ = }(fai)(x»,f,) + l(l«X*i.*i-0 + °(t2 + ft2). i = 1,..., n — 1, i = 1,... ,r, a (2.122) (^^.WjtO = lA[I(/.„)(i,ťi) + |(l„)(,,tl-i)]+ + l(/Wu)(ť,)+i(ř(Ou)(t,_1)- - iK(i,) + ^(ií-OJA2 + 0(r2A) + 0(h3), 1=1.....r, i = 0,1. Důkazy obou těchto vět se provedou přímočaře pomocí Tayolorova vzorce. Vyžadují však dosti zdlouhavé psaní a protože jsme už řadu podobných důkazů podrobně prováděli, přenecháme je čtenáři. V právě uvedených větách jsme nespecifikovali přesně hladkostní předpoklady, které je třeba klást na koeficienty daných diferenciálních operátorů a na funkci u. Zformulovat tyto požadavky není samozřejmě žádný problém; že jsme tak neučinili, je motivováno zejména tím, že jsme nechtěli těmito pro další úvahy nepodstatnými podrobnostmi snižovat přehlednost citovaných vět. Na základě vět 2.6 a 2.7 se zdá rozumné nahradit danou okrajovou úlohu rovnicemi (2.123) UftMÍ0 = <*/(**.*r) + (1" «)/(**.<<-i). k = 1,... .n — 1, / = 1,.. . ,r, 352 353 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU 2 METODA SlTl s počátečními podmínkami (2.124) "S? = »(»»). * = 0,...,», a okrajovými podmínkami (2.125) = 7(«(ŕ|), «SP = ^Dfo), i = 1,...r, v případě Dirichletovy okrajové úlohy a podmínkami (2.126) (l£a)u)W = íhaf(v0,t,) + |A(1 - «)/(«o,*l-i)+ + aT«(i,) + (1 - a)7<°>(f|-i), i = 1,.... r, (C'a)u)(° = k^f(*n,t,) + §A(1 - «)/(*„,ť|_i)+ + a7(1)(í;) + (l-«)7(1)(<í-i), í = l> .r. v případě druhé a třetí okrajové úlohy, neboť se přitom dopustíme lokálně malé chyby. Především je třeba se přesvědčit o tom, že rovnice (2.123) spolu s příslušnými počátečními a okrajovými podmínkami definují skutečně algoritmus, neboli jinými slovy jednoznačně určují veličinu Provedeme to analogicky jako dříve. Buď opět i/G) vektor, jehož složky jsou hodnoty přibližného řešení v ř-tém časovém řádku. Vynásobíme-li rovnice (2.123) integračním krokem r a rovnice (2.126) číslem r/A, dostaneme (2.127) ^Ou(0=^Wu(i-i) + ^[af(0 + (1._lB)f ('-D], /=l,...,r, kde (2.128) A$ = aC<'> + (1 - oOCC-1) + oiIpW, A® = «C« + (1 - «)CC-l3 - (1 - ^)^P(Í_1). ' - L - - .r, C(') je diagonální matice, P V) je symetrická třídiagonální matice, obě řádu n — 1 nebo ra + 1 podle druhu okrajových podmínek a f"> je (n — l)-dimenzionální, resp. (n + l)-dimenzionální vektor, (2.129) = {cil}, c^c(xk,t,), k = l,...,n-l, resp. coo = H^ď*'). ckl—c(xk,tl), t=l.....<%l = lc(x„,t,), (2.130) PO = {p« }, Pkll^VÍXk-hl2,t,)+p{xk + hl2,tl)-rh2q(xk,t,), k = 1, ...n-l, PM+i = P*+i,t = -P(*» + ft/2>r'). * = 1.....» - 2- 354 resp. p(x0 + A/2, í,) + /!/?<°>(í|) + §fc2?(*o, ť,), p(xk - A/2, ťi) + pí** + A/2, *)) + h2q(xk, t,), p(xn - A/2,t,) + ft/?W(ťi)+ áA2g(in,í,), -p(it + A/2,ť|), t=l,...,n-2, k = 1, ...,n - 1, „CO (2.131) resp. /{'í = h2^, i,) + p(*„ + ň/2, i,)7(0)(*í), ŕ = 2,..., n-2, /<'>, - A2/(a;n_i,íi) + p(*„ - ft/2,ť,)-^(ít), yí,) = |Aa/<»o,íi) + fc7tfl)(*i). /£'> = h2f{xk,h), k = \,...,n-l, /W = I„2/(ÍCn,íI) + ň7W(ii). Matice >4u je podle lemmatu 3.5 z kap. 2 monotónní. Je proto regulární a rovnice (2.123) s příslušnými počátečními a okrajovými podmínkami tvoří tedy skutečně metodu. Je-li u)p přibližné řešení dané úlohy vypočtené z rovnic (2.123) s počáteční podmínkou (2.124) a okrajovými podmínkami (2.125), resp. (2.126) a jsou-li koeficienty a přesné řešení dané úlohy dostatečně hladké, platí pro chybu l^'' — — ujj.1' — u(xk, <i) podle vět 2.6 a 2.7 rovnice (2.132) (ll'Wr = $> *=!,■■■.""L Z = l,...,r, s počáteční podmínkou (2.133) a okrajovými podmínkami nj-0) = 0, jb = 0,...,n, (0 16 = ^»0, 1=1, .. (2.134) resp. (2.135) = 4» + ««<'> + (1 - = «S> + ««1° + (1 - ^íí'"1'. i=l.....r, kde (2.136) e^ = 0(r+fc2), t = 1.....n - 1, / = 1.....r 355 iv. parciálni diferenciální rovnice parabolického typu a (2-137) 42 = 0(rÄ) + 0(A3), «í0 = fí(*f)ft3, • = 0,1, 1=1,..., r, v obecném případě a (2.138) 4° = C(r2 + A2), fc = l,...,n 1, í=l,...,p, a (2.139) $ = 0(r2A) + O(ft3), *f> = t);(í;)fc2, i = 0,1, i =1,...,r, v případě, že je a = 1/2. Pravé strany rovnic pro chybu jsou tedy malé a abychom dokázali konvergenci, je třeba dokázat, že z toho plyne i malost příslušných řešení. Tyto otázky vyšetříme v následujících dvou odstavcích. 2.2.2 Konvergence, speciální případy Vzpomeňme si, jak jsme postupovali při vyšetřování konvergence u rovnice pro vedení tepla. V případě explicitní metody (a = 0) byl postup přímočarý vzhledem k jejímu rekurentnímu charakteru. V případě čistě implicitní metody (a = 1) jsme užili principu maxima. Konečně v případě obecného a jsme užili metody separace proměnných. Je přirozené položit si otázku, zda lze tyto postupy přenést na zde vyšetřovaný obecný případ. Pro explicitní a implicitní metodu to zřejmě možné je, Nám však jde zejména o obecnou metodu, protože při a = 1/2 je její lokální chyba minimální. Pokusíme se tedy užít metodu separace proměnných. Při jejím užití bude patrně vadit proměnnost koeficientů a hlavně pak jejich závislost na t. Předpokládejme tedy, že koeficienty dané diferenciální rovnice a okrajových podmínek jsou nezávislé na čase a uvažujme pro jednoduchost Dirichletovu úlohu. Jiné okrajové podmínky by totiž působily rovněž určité obtíže vzhledem k tomu, že rovnice (2.135) nejsou homogenní. Pro chybu rf^ přibližného řešení tedy platí rovnice (2.132) s podmínkami (2.133) a (2.134). Přepíšeme-li tyto rovnice pomocí vektorové symboliky, dostaneme (2.140) 4V> = ač'V'-15 (0 kde matice A$ a nezávisí na indexu í. Horní index budeme tedy v dalším vypouštět. Vzhledem k předpokladu (2.115) o koeficientu c můžeme bez újmy na obecnosti předpokládat, že je c(x) = 1, a žc matice Atj a Aj_ lze tedy psát takto: (2.141) Al = / — (! — a)/3P, 2 metoda sítí kde P je třídiagonáln! matice s prvky (2.142) m^K^-^l+řťí + ^l + ^í), fc=l,...,n-l, Pk,k+i = Pk+i,k - ~p(xk + h/2), k = 1,.,., n - 2, a kde jsme opět položili r/h2 =. 0. Dostali jsme se tedy do úplně stejné situace, jako když jsme vyšetřovali konvergenci obecné metody pro rovnici pro vedení tepla. Budeme proto postupovat stejně jako v odst. 2.1.2. Konvergenci dokážeme, dokážeme-li, že dané schéma je stabilní vzhledem k pravé straně. Tuto poslední skutečnost pak dokážeme použitím lemmatu 2.3. Ověříme proto jeho předpoklady. Odhadněme nejprve velikost normy matice A^1 v prostoru E^"-1'. Protože je to obyčejná spektrální norma, jak už víme, a protože matice A{j1 je zřejmě symetrická, stačí k tomu nalézt její vlastní čísla. Matice P je samozřejmě také symetrická. Označme její navzájem ortogonální vlastní vektory w^"\ v = 1,..., n — 1, a jim odpovídající vlastní čísla A„. Kromě toho, že matice P je symetrická, je navíc diagonálně dominantní. Odtud a z Geršgorinovy věty o lokalizaci vlastních čísel plyne, že její vlastní čísla jsou nezáporná. Z Collatzova lemmatu však plyne, že matice P je monotónní, a tedy regulární. To vše dohromady dává, že matice P je pozitivně definitní. Z první rovnice (2.141) plyne, že vektory w 00 jSOu také vlastními vektory matice A\j a že příslušná vlastní čísla AÍU-* jsou dána vzorci (2.143) = l + a/?A„, n = l,...,n-l. Odtud máme, že je AÍU' ž 1 pro v — 1.....n — 1, což dává (2.144) První podmínka lemmatu 2.3 je tedy splněna. Zkoumejme dále stejnoměrnou stabilitu daného schématu vzhledem k počátečním podmínkám. To znamená odhadnout normu vektorů »j(') , které jsou řešením soustavy (2.145) I = s+1, ...,r, normou vektoru i/*). Abychom toho dosáhli, stačí opět opakovat úvahy, které jsme už prováděli v odst. 2.1.2. Vektor w (*Ô je totiž nejen vlastním vektorem matice A\j s odpovídajícím vlastním číslem daným rovnicí (2.143), ale je samozřejmě i vlastním vektorem matice Ar, s vlastním číslem AÍ,L' daným vzorcem (2.146) \<ť> = l-(l-a)p\v. Řešení rovnice (2.145) je tedy možné opět psát ve tvaru (2.147) Au 00 356 357 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU kde (2.148) Odtud už stejnoměrná stabilita vzhledem k počátečním podmínkám snadno plyne, platí-li, že je (2.149) -™y|gl, v=l, ..,n-l. Au Tato podmínka je však stejně jako v odst. 2.1.2 splněna v případě, že je 1/2 á a í g 1, bez jakýchkoliv doplňujících podmínek, neboť matice P je pozitivně definitní. V případě, že je 0 S a < 1/2, k jejímu splnění je nutné a stačí, aby platila nerovnost (2.150) 0 = — <_-_ 1 ' P h* = (l-2a)Amax! kde Ama„ je největší vlastní číslo matice P. Dokázali jsme tedy následující větu. Věta 2.8. Nechť řešení Dirichletovy úlohy pro rovnici (2.109), jejíž koeficienty nezávisí na t, je dostatečně hladké a necnť při 0 g a < 1/2 platí navíc nerovnost (2.150). Pak existuje konstanta M taková, že pro chybu rf^ přibližného řešení vypočteného pomocí operátoru platí (2.151) m = \M(r2 + fc2) pro q = 1/2. Metoda daná operátorem L^3^ se opět nazývá Crankova-Nicolsonova metoda a vede mezi všemi metodami danými operátory i[a^ k nejekonomičtějšímu algoritmu. Pokusme se ještě zkonkretizovat nerovnost (2.150), tj. odhadnout maximální vlastní číslo matice P. Použijeme k tomu, že pro symetrickou pozitivně definitní matici platí (2.152) (Pv,f)h Amax - SUp . »#0 (w,u)* Buď tedy v = («i,... ,t>„_i)T a vypočtěme veličinu (Pv,v)h. Položíme-li ještě v0 = = v„ = 0, je zřejmě (2.153) (Pv, v)h = h ^{-ptx,, - &/2)«*-i + [p(z* - A/2) + p(x* + A/2)+ + ft2g(xjt)]iii - p(xt + Ä/2)tit+i}t)jfc. 358 2 METODA SÍTI Odtud však sumací per partes (srv. lemma 3.10 z kap. II) snadno dostaneme, že je (2.154) {Pv,v)h =ft£p(xt-V2)K-^-i)2 + '«£'í2g(*i)í'l- *=i *=i Použijeme-li nyní nerovnosti (2.115), dostáváme odtud, že platí (2.155) (Pv,v)h á (Pv,v)h, kde (2.156) P — PiPo + h2q\l a matice P0 je dána vzorcem (2.81). Je tedy AÍSt á AÍ£?X = PiAÍS +ft29i. V odst. 2.1.2 jsme však zjistili, že je AÍSí) í 4' K splnění nerovnosti (2.150) tedy stačí, aby platila nerovnost (215?) P ~ (l-2a)(2pl-rií23l/2)- 2.2.3 Konvergence, obecný případ Začneme obecnou rovnicí (2.109) a explicitní metodou a omezíme se jako na nejslo-žitější na třetí okrajovou úlohu. U tohoto omezení zůstaneme i v dalším vyšetřování. Případy ostatních okrajových úloh by se studovaly analogicky; navíc by většinou došlo ještě k dalšímu zjednodušení. V tomto případě tedy pro chybu nj^ platí (operátory L$, /Ä(r,0) a /A(1;0) jsou dány vzorci (2.117) a (2.118)) (2.158) (C')ř>=e-I)- h=l,...,n-l,l=l,...,r, a za předpokladu dostatečné hladkosti je (2.159) 4° = 0(r + ft2), fc = l,. ,n-l, í= l,...,r, 42 = 0(TA) + 0(h3), *í,_1> = «fC*i-i)^2. « = 0,1, I = 1> >r< kde funkce Ví mají spojitou derivaci v intervalu (0, T). Abychom dokázali konvergenci, je třeba odhadnout řešení soustavy (2.158). Prepíšme je proto tak, že první rovnici vynásobíme číslem t/c(xii, ŕi_i) a druhé dvě 359 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU čísly 2T/[hc(j!o,íí-i)] a 2r/[ňc(xrl,íj_i}]. Dostaneme (2.160) vO)=ŕ^-h/2,tll) v C(»i,íl-l) + N _ ^(xŕ - ft/2,i,-i) + p(xt + h/2,ti.1) + /t2j(xt,ŕ|-Ql 4-A/2, tref**,íi-i) i fJ<«* + Vg.«r-i _ro) „(0_f, a2p(x0 + V2,<f_!) + 2ft/?C)(ž,_1) + /iMzcí,-!)! (,_!) c(io,<l-l) h c(x0,íi-l) a analogickou rovnici pro druhý kraj. (Položili jsme opět 0 — r/h2.) Na základě tohoto vyjádření snadno dokážeme následující větu. Věta 2.9. Nechť koeficienty dané diferenciální rovnice a okrajových podmínek splňují nerovností (2.115) a (2.116). Nechť dále plat/nerovnost co (2.161) 2(pi+Aň) + ?ift2' Pak existuje konstanta M taková, že pro řešení rovnic (2.158) s - S\' — 0 platí (2.162) max I^IgM max max^-1!^!, max lej^l, '»"1|4")|)+ k=Q,...1n v = l,...}/ k—l.....n — 1 + max |^°'|, í = l,...,r. Důkaz tohoto tvrzení plyne snadno úplnou indukcí, neboť vzhledem k podmínce (2.161) jsou koeficienty v hranatých závorkách na pravé straně rovnice (2.160) nezáporné. Z této věty a z odhadů (2.159) ihned plyne, že explicitní schéma konverguje jako 0(r + h). Rychlost konvergence 0(r + h2), kterou na základě analogie s výše vyšetřovanými případy očekáváme, bychom dostáli jen v tom případě, kdyby náho- dou bylo S) = 0. Tak tomu samozřejmě obecně není, a k vyspravení odhadu chyby tedy potřebujeme jemněji odhadnout řešení rovnic (2.158), ve kterých je = 0. K takovému odhadu použijeme dvě skoro zřejmá pomocná tvrzení. Lemma 2.4. Nechť platí nerovnosti (2.115), (2.116) a (2.161) a nechť x[l) a f/jp jsou dvě funkce definované na síti Řh,T, pro než platí (2.163) líCWlžíCx)!0, * = l,...,«-l,/=l,...,r, lO)(,,l = (^x)'", í= 0,1, 1 = 1.....r, tó0)l = x£0), fc = 0,...,n. 360 2 METODA SlTl Pak platí (2.164) to^lšx*0. * = °> ■■■'»■ 1 = 0,....r. Důkaz tohoto tvrzení plyne ihned z analogického rozpisu jako v rovnici (2.160). Poznamenejme také, že tvrzení lemmatu 2.4 je v podstatě ekvivalentní principu maxima pro operátor lh t. Lemma 2.5. Nechť pro koeficienty dané diferenciální rovnice a okrajových podmínek platí nerovnosti (2.115) a (2.116) a nechť při pevném l je ý\ íesenim soustavy (2.165) p{xk -h/2, í,)^-! " W* ~ k/2, U) + P(*h + h/2, t,)]<p^-ř + p(xk + /i/2,íi)pÍ+i = C k = 1,.... n - 1, (() (i) - P(x0 + h/2,t,)yi ~hV0 + ^(íiM0 = $, (0 (0 p(x„ - h/2,tlfn -^+^Xu)<pV> = bf. Pak existuje konstanta M (nezávislá na kal) taková, že platí (2.166) max I^I^Mmaxdíž0!,^0!), t=0,...,n max l=l,...,n I l^-^il max k-0,...,n \<Pk -fk í Afmax(|í«|,|í{0|), ŠMmax(|íW|,|í«l,|ío,-1)l>l*í'-1)l> t ' t ) Důkaz. Tvrzení lemmatu plyne snadno ze skutečnosti, že řešení soustavy (2.165) se dá psát vzorcem h (2.167) ^^[l + ^jCjlí • h/2,t,) kde (2.168) ♦4+^>£i5™]}' jak se snadno ověří dosazením do rovnic (2.165). Pomocí těchto dvou lemmat už snadno dokážeme následující větu. 361 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU Věta 2.10. Nechí koeficienty dané diferenciální rovnice a okrajových podmínek splňují nerovnosti (2.115) a (2.116) a nechť platí nerovnost (2.161). JVechť dále je í)['* řešením soustavy (2.158) s nulovou počáteční podmínkou a s = 0 pro k = =; 0,..., n a i - 1,..., r. Pak existuje konstanta M taková, že pro l - 1,..., r platí (2169) Än1^^^^-!^^1'1^15-Důkaz Zvolme pevně /, 1 S I S ľ, položme (2.170) ť><'> = max |íj')|, ép= max |íj">| ľ=o,...,í-i1 u ' 1 i/=o,...,r-i1 1 1 a buď jfj"^ řešením soustavy (2.171) Uffxjlr^O, * = 1. -."-L ľ = l,-,l, (/)(<;o)x)W=9(Oi í = 0ili„ = 1..... xľ'-O, k = 0.....n. Protože v důsledku lemmatu 2.4 je |n^"'| S Xt"' P™ v = 0,..., í, stačí odhadnout řešení soustavy (2.171). Odhadujme xí"^ ve tvaru součtu (2.172) xľ = <pP+9l"\ kde ip^ řeší při pevném i/, 0 S ľ í I, rovnice (2.173) píit - ftA*,)^ - [p(»i - h/2,íF) + p(i» + A/2,^)]^"'-)-+ p(i* + h/2, t„)iŕ>i+i = °. t = 1, n - 1, s okrajovými podmínkami „("> _ ,„« (2.174) -p(*o + h/2,tv)<Pl hv°' + 0(0)^ )^) = ŕí0j p(z„ + V2,<>.) W (") Funkci Vj"' umíme odhadnout pomocí lemmatu 2.5 a funkce fří"' řeš resi rovnice (2.175) (í.<°>)<"> = - ^.í,-.)^--9(-»,í,-!)^*-15■ fc = l,...,n-l, i/= 1,...,/, -IM*™,^-!)^"1'. * = 0,1, V =1.....i, 362 2 METODA SÍTÍ Řešení posledně napsané soustavy umíme odhadnout pomocí pravých stran užitím věty 2.9, přičemž pravé strany rovnic (2.175) umíme odhadnout užitím lemmatu 2.5. Protože však pravé strany rovnic (2.174) nezávisí na běžném indexu ľ, redukuje se pravá strana poslední nerovnosti v (2.166) na výraz Mmax(|ff£O|,|0iO|). Odtud však už tvrzení věty plyne. Z vět 2.9 a 2.10 dostáváme už ihned nejen konvergenci explicitní metody v případě obecné parabolické rovnice, ale i odhad chyby 0(t + h2). Obraťme se nyní ke studiu schématu LJ^ s příslušnými okrajovými podmínkami v případě, že je 1/2 í «í 1. Případ 0 < a < 1/2 vyžaduje, jak jsme viděli v příslušném odstavci ve speciálním případě, omezení na poměr r/h2, a proto jej jako méně zajímavý vyšetřovat nebudeme, i když by to bylo následující metodikou dobře možné. Pokusíme se postupovat paralelně k explicitnímu případu, tj. zkusíme odhadnout řešení rovnice (2.132) s okrajovými podmínkami (2.135) zvlášť pro případ íf' = 0 a 4'' - 0. K tomu cíli použijeme postup, který, pokud je nám známo, užil k odhadu řešení parabolické rovnice v závislosti na její pravé straně jako první Lees (1960). Základní myšlenku tohoto postupu ukážeme na příkladě diferenciální rovnice (2.176) s okrajovými podmínkami (2.177) du d2u , ,. « 5P = e<M> u(0,t) = ii(i,t) = 0. Budeme přitom předpokládat, že všechny operace, které budou následovat, jsou oprávněné, aniž bychom podrobně zkoumali potřebné předpoklady, neboť nám nejde v daný okamžik o získání přesného tvrzení, ale pouze o vysvětlení základní myšlenky. Vynásobme rovnici (2.176) výrazem du/dt a integrujme podle i od 0 do 1. Dostaneme (2.178) Je však (2.179) ŕ(9u\2A ť &udu f1 du Jo d2udu dx2 dt ' [řa1+/1 idx dt J o J0 du d2u dx dxdt d x. = neboť platí (2.177). Platí tedy « i (*) Ax + Í2TtJB (fa) ix = l^-dldx- 363 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU Vzhledem k zrejmé nerovnosti |<xi>| ^ ^u2 + |&2, platné pro libovolná reálná a, b, kterou jsme už vícekrát užili, platí (2.181) a tedy (2.182) Odtud však plyne (2.183) a tedy, položíme-li (2.184) (2.185) Je však (2.186) šjjf^.,*)d.+*j[1(5)ld,. EM2**- fl(()ÍD(0) + | [jí ea(s,r)dí d r. u(i'í)=/£(í,í)dí; odtud pomocí Schwarzovy nerovnosti dostáváme (2.187) «»(.,<) š » jí" [£(£>ť)fd£ ž £><*)■ Z (2.185) tedy máme (2.188) |«0M)lš {D(°)+/< [^^(^'-Jdij dT-j ' . Odhad tohoto typu bychom rádi získali pro řešení soustavy (2.132), (2.135). Jak už jsme řekli, budeme postupovat opět dvoufázově, tj. odhadneme zvlášť případ í,.'^ = 0 a případ e^' = 0. Dříve než zformulujeme tvrzení, která budou paralelní k větám 2.9 a 2.10, dokážeme ještě tři pomocná tvrzení, se dvěma z nichž jsme se už v podstatě setkali v kap. II. Lemma 2.6. Buď p libovolná funkce definovaná v intervalu (0,1) a buďte j/* 364 r 1 METODA SlTl a z\ libovolné funkce definované pro k — 0,... ,n. Pak platí n-l (2.189) „^-{p^-fc/^jfc.,- - \p(xk - A/2) + p(Xk + fc/2)]j* + p(xh + h/2)yt+1}zt = n + PÍX, - h/2)V" - p(xB + h/2)^-^-z0. Důkaz tohoto lemmatu je analogický jako důkaz lemmatu 3.11 z kap. II (viz str. 184), a přenecháme jej proto čtenáři. Lemma 2.7. Nechť koeficienty p a dané diferenciální rovníce a okrajových podmínek splňuji nerovnosti (2.115) a (2.116). Pak existuje konstanta M taková, že pro libovolnou funkci definovanou na síti Řh,jT platí nerovnost (2.190) kde (2.191) [xL0]2 š MD{X[\ " C) O , Ptá0) = *Erf'»-*/V')[- ,**-'] -+ ^0>(ť()[xo°]2 + ^1)(tOtó')]2. Důkaz Tvrzení tohoto lemmatu je v podstatě identické s tvrzením lemmatu 3.12 z kap. II (viz str. 185). Lemma 2.8. Buď g funkce definovaná a spojitě diferencovatelná v intervalu (0,T) a nechť pro ni v tomto intervalu platí g(t) ž go > 0, |ff'(í)| 5 g\. Pak pro libovolnou funkci i/') definovanou pro l — 0,..., r a pro libovolné a, 1/2 í mí 1, platí (2.192) |[aj(f,) - (1 - a)í(ij-i)]»< g š J Í2o, - 1 + o^r)^,)^]2 + fííi-i)!^-15]1}. Důkaz Z učiněných předpokladů plyne především, že platí (2.193) Protože je g(tt) ž}0a g(h-i) ž go, je (2-194) [ff(íí)]1/2[s(t|-l)]1/:! š so, 365 |ď(<>)-9(<l-i)| <- „ I-r-\ = 91- |j(t,)"g(*,-l)|žgi-ig(t,)]1^b(*.-i)]lff. IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU a tedy (2.195) Platí-li g(t)) < g(ti-i), je také (2.196) [si*,)]1'2 < [9(í,-i)]1/2 š (l + M</-i)]1/2. Je-li však g{t{] ž f/(ť;_i), plyne z nerovnosti (2,195), že platí (2.197) Platí tedy (2.198) ti(t,)Ý<* S A»L + r«Lb(t|_0]i/». UJ(*l)J ' 30 Za výše uvedeného předpokladu je však [är(íj_i)/ff(íí)]1^2 ž 1, a tedy íř(ír_i)/[ff(ťí)]1'2 á [^(ii.i)]1/2. Dosadíme-li z této nerovnosti do nerovnosti (2.198), dostaneme, že platí (2.199) \ So' Nerovnost (2.199) tedy platí bez ohledu na relaci mezi čísly <j(í|) a <j(ť|_i). Z nerovností (2.195) a (2.199) plyne, že je (2.200) |[«f(í,) - (1 - oOřfr.iHiríV'-1)! = = 1(2« - %(ť;) + (i - a)b(t,) - ff(*,_x)]| |um„(i-i)| g á {(2a - l)[ff(ŕ,)]1/2(l + ^)b(<r-i)j1/!,+ + (i - ^ríi^toi^fs^-!)]1/2}!^/'-1'! = = f(2a - l)(l + r^) + (1 - «)r^l [ff(*i)]1'a[ír(*i-1)]1/a|»<,>t»<1-15|. Odhadneme-li pravou část poslední nerovnosti podle známého vzorce |a6| S |a2 + + ^i2, dostaneme požadovanou nerovnost. Lemma je dokázáno. Nyní už můžeme zformulovat a dokázat větu, která je analogická k větě 2.9. Věta 2.11. Nechť koeficienty dané diferenciální rovnice a okrajových podmínek jsou dostatečně hladké a nechť splňují nerovností (2.115) a (2.116). Nechť dále ijj^ je řešeni soustavy (2.132) s okrajovými podmínkami (2.135) s í('^ = 0 a nechť je 366 2 METODA SlTÍ 1/2 í a í 1. Pat existují konstanty M a rB > 0 tátové, že pro t á to platí (2-201) ^maxJijjPlŠ g m W>)+í>[f i^i2+ä£ i^i2 + si£- 3i2l f'- l. y=1 L J J Důkaz . Vynásobme každou z rovnic (2.132) při pevném í výrazem h[rj — «j a vzniklé rovnice sečtěme od k — 1 do k — n — 1. Dostaneme n-l (!) _ (I-l) 2 (2.202) rA U) + (1 - ar)e(j!», *,_,.)] p-&-] - *=i T n-l _ afc E 12 WXfc - V2,i;)4-i " M** " A/2,íl) +P(^ + h/2,t,)]r,W+ +K^ + ft/2,íí)')í'i1}['?í0-^"1)]- - (1 - a)hj^^{p(xk - A/S.íi-i)^-!4 " W** " V2,íi-i)+ t=i + p(zt + A/2,í,-!)]^-1' + P{*k + A/2, ti-ifol+íW - iř"'V + aft£g(I)t,íI)»7Í0[»)i0-^-1)]+ fc=l + (i - or)A 2 . hÍ° - = í=l Upravíme-li tuto rovnost pomocí lemmatu 2.6, máme "-i (0 _ 0-0,a (2.203) TA^Iac^íO+íl-aJe^.ťi-Ojp*-^-j + + aft^H^-V2,<i)[% - fc = l - oih2^p{xk - A/2,i,)-^-- ■- ■■ ft-- - a*.,, - A/2,f,)'?")7"-1hi') " rf-^H (0 (0 + ap(s0 + A/2,tí)Ľ^tó') - 367 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU - (l-a)hY,P(xt - A/2,ť,. ,0-1) _ „('-!) 1k W-i *=1 - (1 - <v)p(x„ - fc/2,ti_1)t'""l3~'7"-')[^0 _ „('-!)]+ + (l-a)p(xo + A/2,ť,_i) C-i) _ „('-O k = l (0 ('-i) 1* -q* :0. V důsledku okrajových podmínek (2.135) je (bf) = 0 !) (0 _ (0 ('-!) _ (i-1) (2.204) ap(x0 + h/2,t,) 1 , 170 + (1 - cv)p(x0 -f A/2, íí_1)^l- (0 _ C-i) = jM°4*o,í|) + (1 - a)c(x0,íi_1)]'?2__J?o-+ + »^0>(ír)i)S0 + (1 " cO^Cír-Oflř"1^ + iAa^xcí,)^0 + |A(1 - a)9(*o,íf-i)i?0'~1) -4° (2.205) - [ap(x„-A/2,r,)''" ^S=í+ + (l-a)p(x„-h/2,t]_i) J'-1) _ „0-0 (1) _ ((-1) = lA[tvc(x„,ťr) + (1 - <v)C(xn,t,_1)]'?n f-+ + api^t,)^ + (1 _ a)^1)^^)^'-1^ + ifta,^,*,)^0 + ^(1 - c)q(xn,t,.l)^-1) - eg). Dosadíme-li do identity (2.203) ze vztahů (2.204) a (2.205), dostaneme n-l (2.206) Th Y]L<*<A*k,t>) + (1 - a)c(*i,i,-i)] [ t=l " r„(0 „(0 + aA^p(xt-A/2,f,)[^^] - C) ('-i) i + 368 2 metoda sítí n -(l-a)A h/2, li %-l - AX>p(** - A/2,ťf) (1 - a)p(x* - A/2,t,_1)]. .(') _ _0-i) „«_„(') „('-!)_„('-!) A A r„0) _„('-!), 2 + irA[aC(xn,í,)-t-(l-a)c(xTl, *,_x)] [*_5f_] + + ^OOtá0]2 + (1 - ^^(tr-i)^^-1'-- a/JÍ^^O^O-D - (1 - «/VSÍ1>(«,-,)[flff-1)p+ + S^M*.,*!)^ + (1 - íl-l)!/?-1'] (0 C-i) rnW_n0-l)l3 + irA[ac(x0,í,) + (1 - <v)c(x0,í,-i)] [25—JiS-j + «rt>totíP>t1) - u - «)^°'(*>-o[iř-1)i,+ (0 _ (J-i) + irAIa^xo.ťO-ío0 + (1 - cjg^o,^!)^'"^]^-^-- __0) ^0 1o , re0---r + 1"A^[tv4(x|:,ŕ()40 + (1 - «)9(^i,,ti-i)»í ri}- Poslední rovnost pišme ve tvaru (2.207) 5« + <vD(4°) = (1 - a)i?(4'-1)) + (?0) + flO), kde D(i)jO) je definováno rovnicí (2.191), {(0 _ ('-i)l2 iAMxo.í,) -(- (1 - a)«(.0f*,_!)] [52—22-] + n-l (i) _ (1-1) , + A *,) + (1 - *)<<**, p -3i ] - 369 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU + ÍA[ac(*n, *,) + (1 - t,-i)] [*_^_] l (2.209) Q« - -t^hfa(t„,t,)$ + (l-a)fa,ii-i)úl CO (i-i) i)i Vo ~ m + n-l (I) _ + *£[««(■»,«1)1»? + (1 - arM**.*!-!)*?"1']5*-~+ 1=1 (1) _ (1-1) -> n-l (i) (I) (i-l)n +h y: c^lV-ý + 4,) &-ý Jj + r (0 (1-1) "-1 (0 (1-1) (0 (I-l)n (2.210) Ä« = A £[<*?(** - A/2, t,)- - (i - - A/2, *,_,)] "* ^-l7t + + [o/9<0J(í,) - (1 - o)/J<0»(t|-i)]«í00iji,"1)+ + [«/?«(*,) - (1 - »)^»(*i-i)]iiíPiiff-1>. Odhadněme nyní shora pravou stranu výrazu (2.207). Začněme s ijO), Vzhledem k předpokladu o dostatečné hladkosti koeficientů a vzhledem k nerovnostem (2.115) a (2.116) splňují funkce p a /?0) předpoklady lemmatu 2.8. Platí tedy (2.211) |(ap(i*-A/2,í,)- „0) _ „(0 „('-D _ _('-i). -(1-«)*«, ft/2,«,-!)]^ j^=± |g g i(2« - 1 + «M,r){P(It - A/2, t,) P"^*"1] 2+ (i-i) (i-i) H } a (2.212) + p(a!i-A/2,ťi_i)[ lM0(tl) _ (i _ a)/3W(e(_l)]l7«^-i)| g pro i = 0,1, kde Mi je kladná konstanta. Z nerovností (2.211) a (2.212) však už plyne, že platí (2.213) 370 á i(2a - 1 + <*Mir)[D« + X^'-1)]. 2 METODA SlTl Zde jsme položili pro stručnost £>0) = DOjI'-1) Obraťme se dále k odhadu veličiny . Abychom to provedli, uvědomíme se především, že nerovnost (2.214) platí pro libovolná reálná a a i a pro libovolné 7 > 0. Skutečně, tato nerovnost plyne ihned ze zřejmé nerovnosti (2.215) Užitím nerovnosti (2.214) snadno zjistíme, že platí (2.H6) |,K-».*)rf>a£^=^| s 4eťaÄlfc)[!í£^^]"i * = (),..., n, (0 C-1) (2.217) l^,^'-')"* * | = v (0 O-i) 1 (2.218) (2.219) 0) _ „0-1), š f [4!>]2+ (I) _ (1-1) J + iHíi,!,) + (1 - a)e(,i,*,_!)][Ä—Ji—] . t = l,...,n-l, 0) O-i) 1 T I r I co n rn0) _0-iha + JAMío.íi) + (1 - «)e(«o, Í1-1)] f° ^ ] (2.220) Lg)*_Z*U_ g lí[í«]2+ r„0) _„('-!),2 + iAM^n.ť,) + (1 - «)c(i„fc,í,_i)] ['" J" J - 371 1 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU Použitím nerovností (2.216) až (2.220) dostávame (2.22i) |g(')| š Tká YMnľÝ + (i - a)[ví'-l)]2H c° *=i "-1 (í) _ (í-1) 2 + IrA^tore^, í,) + (1 - a)c{xk, *,_!>] [5i__5i_] + + lrA2iWI)m]2 + (l-a)[rí(,-1)]2}+ co (í) _ (1-1) 2 + |Tfci[ae(*o, *i) + (1 - <*)c(x0, í,_i)] [-?—-] + + lrh^{alT,Wť+(l-aM-V]2}+ Co + lTAj[«c(»B,ť,) + (i - «)<<*„,*,_!)] [2l_2s_] + (0 _ (i-i) ,, + |rh[ac(0o, íl) + (1 - «)c(íd, íi-i)] [—^-] + »-i (i) _ O-i) 2 + Jrfc í,) + (1 - «)e(*»1(|.i)HU-] + *=i r + JrAMxn.íO + fl »)eí>,,ti-1)][1'" ^" ] Tuto nerovnost však můžeme přepsat do tvaru (2.222) |Q«| š 15(0 + r|ia|lM^)]2 + fcgfeWfi + iM,(0]2J + ^ i=i j kde jsme položili (2.223) Efi> = + h g[£(0f + 2 [£(0]2 t=i Podle lemmatu 2.7 je (2.224) 1 A[„W]2 + A £><'>]= + IA[n(0]2 g M/jW *=i 372 2 METODA SÍTl Dosadíme-li z této nerovnosti do nerovnosti (2.222), máme (2.225) |Q(0|Š i5(0 + Ta?lM£,(0+ CŕJ «2 + r(l-rt)?lM£lC'-1) + -i^(,). Co Co Použijeme-li nyní v rovnici (2.207) nerovnosti (2.213) a (2.225) a vezmeme-li v úvahu, že je SW 5 0 pro každé í, dostaneme (2.226) §{l - [aMi + ^.aMJrJDW S g i{l + [aMi + M(i _ aJMJrJDC'-1) + I-iffi, neboli, protože je a ž 1 /2, (2.227) kde (2.228) Pro r í ro < l/(arAf2) plyne z nerovnosti (2.227) nerovnost (2.229) kde (2.230) M3: (1 - raM2)D<'> S (1 + raiVMi}''-1) + —£('), co M2 = Mi + —M. co fl(0<i±^n(W)+TMs£(l)i — 1 — raAÍ2 co(l - aMiT0)' Z nerovnosti (2.229) pak už dostáváme, že je (2.231) D«< (l±^)>) + rM3f (i±I^),-"^)1 v=i jak se snadno přesvědčíme úplnou indukcí. Pro t í ro je však (1 + TaMi)j(l — TaM-í) > 1, a tedy platí U-roAfJ = V1-tojM2/ (2.232) pro s = 0,,,., r. Konečně pro dostatečně malá r platí Vl-T-aM,-' Vl-raM,/ = 3 (2.233) neboť je (2.234) lim (i + W^ = e^- 373 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU Dosadíme-li konečně odhad (2.232) a (2.233) do nerovnosti (2.231) a použijeme-li lemmatu 2.7, dostaneme nerovnost (2.201). Věta je dokázána. Dále je třeba dokázat ještě větu, která je paralelní k větě 2.10. Věta 2.12. Nechť koeficienty dane' diferenciální rovnice a okrajových podmínek jsou dostatečné hladké a nechť jsou splněny nerovností (2.115) a (2.116). Nechť dále rfip je řešením soustavy (2.132) s nulovou počáteční podmínkou a s okrajovými podmínkami (2.135) s = 0. Pak existuje konstanta M (nezávislá na h a r) taková, že pro každé dostatečně malé r platí (2.235) g M j max [|í<!)|2, |í»|i, maxO^I2, |í<0)|2)+ +^x:max(iíWiM^)iMíri)iMíí''-i)r l r II t Důkaz je podobný důkazu věty 2.10. Veličinu ffp, kterou máme odhadnout, pišme ve tvaru (2.236) if^přV+d0, kde tp^ je řešením soustavy (2.165) z lemmatu 2.5. Podle tohoto lemmatu platí (2.237) iT I^IŠMÍmaxdŕWlMíľ'l2]}1/2- Funkce í/Jjp splňuje soustavu (2.238) kde je (2.239) (,(».-V)(0=s(0> 4M^M'}-(i»>)i0 = = -[cec(xi,,í|) + (1 - a)c(xk,íi_i)] (0 (l-i) - a^xt.írVt0 - U - «)9(a!*>*i-i)*>* 1}> fc = l,...,n-l, 374 2 METODA SlTl (2.240) e0'U(ř^)(0_(,^V)(0 = „(0 = -±h[ac(xBlt,) + (1 - oJiKso.ť,.!)]^-£8 (1-0 - §ftaf(x0,ťi)¥>b - |A(1 - ají^o.ťf-i)^ a analogická rovnice platí pro e^'. Položíme-li tedy (2.241) ^0 =max[|5(')|2i|í«|2j|r('-i)|2|5(--i)|2i (1-1) je znovu podle lemmatu 2.5 (2.242) |ei°l š Af [JB(I)]1/a, * = 1,. , n - 1, ř = 1,..., r, a (2.243) \e^\^hM[^]1'2, ^hM[E^]l'\ Použijeme-li k odhadu funkce \j>^ větu 2.11, máme (2.244) ^axj^lg < M J, i1/2 1/2 D(9f) + r Na druhé straně podle definice čísla D(ip^) a podle lemmatu 2.5 je (2.245) 7J(^0))gMmax[|í(0'|2,|ÄÍ0)|2]. Nerovnosti (2.237), (2.244) a (2.245) však už dokazují větu. Závěrem tohoto odstavce zformulujme ještě konvergenční větu pro obecnou parabolickou rovnici a pro 1/2 g a g 1. Věta 2.13. Nechť přesné řešení u okrajové úlohy (2.109), (2.111), (2.114) je dostatečně hladké, nechť jsou splněny nerovnosti (2.115), (2.116) a nechť je přibližné řešení vypočtené pomocí operátorů LJ^J, 1^"\ 1^"^ s 1/2 g a ^ 1. Pak existuje konstanta M taková, že platí -u(xk,t,)\<,M(r+h2) (2.246) v obecném případě a (2.247) 4>-u(Xk,t,)\^M(r2-rh2) 375 I IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU v případě, že je ct= 1/2. Důkaz plyne bezprostredne z vět 2.11 a 2.12. Stačí si pouze uvědomit, že chyba vfp — u(xk,t}) splňuje rovnici (2.132) s okrajovými podmínkami (2.135), pro jejichž pravé strany platí odhady (2.136) a (2.137), resp. (2.138) a (2.139) a že v důsledku spojité diferencovatelnosti funkcí Vi jsou výrazy [ť(0 _ ř(f-i)]/r řadu 0(ft2). Crankova-Nicolsonova metoda vede tedy i v obecném případě k nejefektivnějšímu algoritmu, neboť její celková diskretizační chyba je řádu 0(r2 + h3), takže lze opět volit t = O(ft). Upozorněme také na to, že věta 2.13 je obecnější než věta 2.8 nejen proto, že se v ní vyšetřuje obecná parabolická rovnice, ale také proto, že chyba se v ním měří -normou. 2.3 Dvou- a vícedimenzionální parabolické rovnice V předchozích odstavcích jsme viděli, že problematika metody sítí při řešení parabolických parciálních diferenciálních rovnic v jedné prostorové proměnné je dosti úzce svázána s problematikou řešení okrajových úloh pro obyčejné diferenciální rovnice. Tak např. otázky spojené s přepisem okrajových podmínek se řešily zcela stejně jako v případě obyčejných diferenciálních rovnic. Nové byly pouze problémy vyvolané přítomností význačné proměnné, času. Dá se očekávat, že analogická situace nastane i v případě řešení parabolických diferenciálních rovnic ve dvou (a více) prostorových proměnných. Komplikace proti prostorově jednodimenzionálnímu případu budou souviset tedy zejména s přepisem okrajových podmínek, což je problematika, jíž jsme se zabývali ve třetí kapitole, zatímco parabolický charakter úlohy (tj. přítomnost proměnné t) přinese patrně již jen takové problémy, se kterými jsme se setkali v předchozích odstavcích. Proto budeme postupovat stručně a omezíme se vlastně jen na jednoduché ilustrativní příklady. 2.3.1 Základní metody Způsob, jakým lze řešit metodu sítí parabolickou parciální rovnici ve dvou a více prostorových proměnných, si ukážeme na Dirichletově úloze pro dvoudimenzionální rovnici pro vedení tepla. Budeme tedy řešit rovnici (2.248) iu=*i_^_^ = n [ ' dt dx2 čV v íí x (0,T), kde Í2 je omezená oblast v E2, s počáteční podmínkou (2.249) u(x,y,0)=g(x,y), (x,y)eÚ, a s okrajovými podmínkami (2.250) u(x,y,t) = y(x,y,t), (x,y) G ľ, ť g (0,T). T 2 METODA SlTl Vzhledem k úvahám, které jsme prováděli v kap. III a vzhledem k postupu v předchozích odstavcích budeme přibližné řešení v bodech (xk,y,,t\), kde (xk, ys) 6 a ť| == lr, l — 0,..., r, t = T/r, hledat ze soustavy (2.251) (4"'»)*? = 0, (**,lf.) £ ÍÍ(Ä), í = 1, • -.r, s počátečními podmínkami (2-252) u<°> = g(xk,y,), (xk,y.) e Ď<*>, s okrajovými podmínkami (2.253) {k,ru)[l] =AhAr,Xk,y„h), (xk,y,) 6 r« / = !,...,r. Množiny ílC*> &h\ rW zde mají samozřejmě stejný význam jako v odst. 2.1 kap. III a í.^™ je operátor, který funkci ukl definované pro (aijfcjj/j) é a pro / = 0,..., r přiřazuje funkci (LJ^úfP definovanou pro (xk, y,) £ Q(h\ / = 1,..., r a danou předpisem (0 ('-i) (2.254) affU)<'>="*' > - 1-, ■IV ^2 + "f" "fc-l,í + "fc,s + l T "fc,j-Í - ""*J;i J- Symbol lh]T v okrajové podmínce (2.253) je pak lineární operátor tvaru (2.255) (V«)« = «2 - xx*Zl ~ X**Z,- -xAL-x^, («»,».) 6r<"), kde uzly {xki,y,t) jsou sousední k uzlu (xk,y,) a platí-li {xki,yai) £ ň«, je příslušné Xi rovno nule (vzhledem k definici množiny existuje aspoň jedno takové ŕ) a ostatní koeficienty jsou (stejná) nezáporná čísla, přičemž platí 4 (2.256) £xí-3Xo<1, i=i kde xo je konstanta nezávislá na h a r. Konečně operátory A;,iT jsou dány vzorcem (2.257) A.h,T(T,xk, y,,ti) = íi7(it;, Z/,;,ii) + Í27(z*;, y^Ji)+ + (ay(xk>s, y,'3, ti) + ^TÍ**; ,y>'t,U), («*,y.)er<*), / = i,...,r, kde í; jsou jistá čísla, body (xki,y,i) jsou průsečíky přímek sítě procházející uzlem (xk,ya) s hranicí T, jejichž vzdálenost od bodu (xk,y,) je menší než h a = 0, jestliže takový průsečík neexistuje. Upozorněme, že to jsou právě ta i, pro něž je koeficient Xi v (2.255) od nuly různý (srv. odst. 2.1.2 z kap. III.). 377 0-1) + u (f-l) C-i)i 376 IV. PARCIÄLNl DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU Pro a = 0 dostaneme explicitní metodu, ve které se hodnoty přibližného řešen! v i-tém časovém řádku vypočítávají přímo jako lineární kombinace hodnot přibližného řešení v (/— l)-ním časovém řádku. To je sice z numerického hlediska příjemné, hned však uvidíme, že za to musíme zaplatit dosti vážným omezením na velikost časového integračního kroku. Implicitní metoda, která vznikne při a = 1, touto nevýhodou netrpí, abychom však při její užití dostali přibližné řešení v /-tém časovém řádku, je třeba řešit soustavu 0(l/h2) rovnic o 0(l/k2) neznámých. Podobně je tomu i u ostatních schémat m^O. Vyšetřeme nyní konvergenci uvedených metod. Začneme explicitní a implicitní metodou, které pojednáme najednou. Užitím Taylorova vzorce se snadno zjistí, že pro každou dostatečně hladkou funkci u platí (2.258) (ti"Vpr>)(t'> = «(l«)(xiIs(Mt,) + (l-«)(lti)(«t,».,íí-i)+ + 0(T + k2), (»*,»,) e OW, /=!,...,r, (2.259) (LÍ"mPT))k! = A*.r(«i «»,»., *i) + 0{h2), (xk,y,)eT<h\ J = l,...,r. Zde jsme položili jako už vícekrát v této i předchozích kapitolách (11^)21 = = u(xk,y„ti) pro (xk,yt) £ £}W a / = 0,.. .,r. Je-li tedy přesné řešení okrajové úlohy (2.248) až (2.250) dostatečně hladké, platí pro celkovou diskretizační chybu nj^ — tij^ — u(ii,ířs,ť() rovnice (2.260) (t».Tiř)i? = 0(t + Aí). («*,l(.)6nW, /=lI...,r, (lh,rv)£ = 0(h2), (*»,».) e rW. ' = !,•■■,«•■ Ukažme dále, že operátor 1^ splňuje při a = 0 a a = 1 princip maxima. Lemma 2.9. Bud* dána libovolná funkce nj^' definovaná pio (xk,y,) £ fi^ a pro / = 0,..., r. Buď dále a = 0 nebo a = U nechť plať/ (2.261) (0?)^°. (*»,») € 0«, J = l,...,r. Necht konečně v případě, že je a = 0 plať/ (2.262) ^=Ž=í' Pak platí (2.263) 378 max ni (r»,i(.,*i)eri>* 2 METODA SlTl kde Tp1^ je množina bodů (xk, ya, í[) takových, že je (xk,ys) € r^*) a 1 = 0,..., r nebo (xk,ys) £ a 7 = 0. Důkaz je zcela analogický důkazu lemmatu 2.1, a proto jej přenecháme čtenáři. Lemma 2.10. Nechť při a = 0 nebo a = 1 platí (2.264) ■|(tí?D)2|á(tír,V)S, (**,y,)£fi(*J, i*l,...,r, ' 1^1 (*.,».) e fiW I(4,rlj)£l š (fc,rlŕ)i? , (*», V.) £ rW, / = 1, i.., r, a nechť v případě, zeje a = 0, platí navíc nerovnost (2,262). Pak platí (2.265) . lifSl^^g, (**,«,) e 0«, 1 = 0.....r. Důkaz, Lemma je bezprostředním důsledkem lemmmatu 2.9. Na základě právě zformulovaných pomocných tvrzení je už snadné dokázat kon-vergenční větu pro případ cv =. 0 a ct =. 1. Věta 2.14. Nechť řešení u(x,y,t) diferenciální rovnice (2.248) s počáteční podmínkou (2.249) a okrajovými podmínkami (2.250) je dostatečně hladké. Dále nechť existuje dostatečně hladké řešení w(x, y, i) diferenciální rovnice (2.266) (Lw)(x,y,t) = l, (x, y) £ fi, ť £ (0,T), s okrajovou podmínkou (2.267) «(«,!,,*) = 1, (*,í)6r, t£(0,r), a s nezápornou počáteční podmínkou. Buď konečně u^} řešení soustavy (2.251) s počáteční podmínkou (2.252) a okrajovými podmínkami (2.253) při ct = 0 nebo ot = 1 a nechť platí (2.262), je-li a = 0. Pak existuje konstanta M taková, že je (2.268) 14? " u(xt,V„ti)\ ^M(r+h2) pro (xt,y.) £ ň« a/ = 0,...,r, Důkaz. Položme nk^ = 4's — u(xk,ys,ti). Na základě úvah úplně analogických jako v důkazu věty 3.7 z kap. II nebo věty 2.4 z kap. III (viz str. 179 nebo 254) snadno zjistíme, že lze nalézt konstantu M tak, aby pro funkci t/^ = = Mw(xk,ys,t{)(T + h2) platily nerovnosti (2.264). Tvrzení věty pak plyne ihned z lemmatu 2.10 a omezenosti funkce to. Analogická tvrzení se dokáží i pro ostatní okrajové podmínky, pokud jsou formulovány tak, aby platilo lemma 2.10. Obraťme se konečně k vyšetření konvergence metod daných operátorem při obecném a. Zde je situace komplikovanější než u explicitní nebo čistě implicitní 379 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU metody, neboť při 1/2 S a < 1 je princip maxima splněn jen za dodatečných omezení na poměr časového a prostorového integračních kroku, což je v jistém smyslu nepřirozené. Ani postup užitý v odst. 2.2.3 sem nelze bezprostředně přenést, neboť ve dvou (a více) dimenzích neplatí nerovnost (2.190). Pokud se spokojíme při vyšetřování operátorů LJ^ s normou analogickou normě dané vzorcem (2.77) a omezíme se na případ, že okrajové podmínky jsou splněny přesně, lze se opřít o lemma 2.3 a postupovat analogicky jako v odst. 2.1.2. K důkazu konvergence v tomto případě bude tedy stačit zjištění, že užité schéma je stejnoměrně stabilní vzhledem k počátečními podmínkám. Zformulujeme a dokažme příslušné tvrzení pro případ okrajové úlohy (2.248) až (2.250), kde oblast íí je čtverec (0,1) x (0,1). Položíme-li v tomto případě h = — l/n, kde n je přirozené číslo, tvoří funkce definované na množině £)M (n — l)2-dimenzionální vektorový prostor. Zaveďme v tomto prostoru normu analogickou normě (2.77), tj. za normu vektoru v o složkách v^,, (xj, u,) £ £jW berme číslo (2.269) mu. = [ft2 £ 1 («j,,s.)€n<k) a tak vzniklý vektorový prostor označme e^""1-1 Věta 2.15. Buď Í2 = (0,1) x (0,1), buď h — l/n a neciť v případě, že je Oí a< 1/2, piatí nerovnost (2.270) h2 = 4(1 - 2a)' Pak diferenční schéma dané operátorem je v normě prostoru e^"-1' stejnoměrně stabilní vzhledem k počátečním podmínkám. Důkaz. Ve shodě s definicí 2.2 máme dokázat, že existuje konstanta M taková, že pro každé řešení soustavy (2.271) (ifc?!)!,? = 0, (■», y.) £ Í2W, I = m + 1,..., r, s okrajovými podmínkami (2.272) ,<'> = 0, (xi.ff.JerW, l = m,...,r, platí (2.273) ||t,«||äí g M||,/m>|U,, pro každé m = 0,..., r — 1 a pro / = m.....r, kde ní'> je vektor o složkách ijj^, (xk,ys) £ flW. Abychom toho dosáhli, užijeme stejně jako v odst. 2.1.2 metodu separace proměnných, která nám dovolí psát řešení soustavy (2.271), (2.272) v uzavřeném tvaru. Buď tedy m libovolné pevně zvolené celé číslo, pro něž je 0 S m < r, a buď 380 2 METODA SlTl r/m> libovolný vektor z prostoru e£? ^'. Protože soustava vektorů v^'^, u,u = = 1,..., n 1, o složkách t)^'ř<) daných vzorci v it ,w =8111-sin-—, k,s = l.....n— 1. (2.274) tvoří zřejmě ortogonální bázi v prostoru e^""1^ (srv. také vzorec (2.91) z odst. 2.2 kap. III), dá se vektor t/"1) psát ve tvaru (2.275) „(»> = J2 «ft)"("''0. kde ai™1 jsou vhodné konstanty, a přitom platí (2.276) l|n(m)iu* = E tfďľh1' Hledejme řešení soustavy (2.271), (2.272) ve tvaru (2.277) i# = E <0«r)- Dosazením do rovnic (2.271), (2.272) snadno zjistíme, že k jejich splnění je třeba, aby pro funkci c(í) platilo (2.278) c(m) = 1, (1 + a/JA^Mí) = (1 - (1 - c)pX^)c(l - 1), ( = m + 1,... ,r, kde (2.279) Je tedy (2.280) A„, = 4(sin2^ + sin2g). v,p-\.....n - 1. ,n ri-(i-«)/?W-" a z rovnic (2.277) plyne, že platí (2.281) «,= s i^^r^yik^ie,. Vyšetřované schéma bude tedy stejnoměrně stabilní vzhledem k počátečním podmínkám právě tehdy, budou-li platit nerovnosti (2.282) l ^ 1 - (1 - a)/?A,„ L - 1 + ot/W,,,, ~ Pravá z těchto nerovností je splněna vždy, neboť podle vzorce (2.279) je Xrll S j> 0. Je-li 1/2 _ a á 1, platí i levá nerovnost (2.282) bez jakýchkoliv doplňujících 381 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU idmínek, neboť v tomto prípade je (1 — 2a)pXwll á 0, a tedy tím spíše platí rovnost po nerovnost (2.283) neboli (2.284) (1 - 2<*)j8A„íl < 2, -1 -ap\vfl < 1-(1 -a)p\ulí. Je-li naopak l í a< 1/2 a platí-li navíc nerovnost (2.270), platí opět (2.283), neboť je \vv. < 8. Tím je věta dokázána. Schéma dané operátorem LJ^ pri obecném a vede tedy v normě (2.269) k rychlosti konvergence 0(r + h2). Protože ve vzorci (2.258) lze zřejmě při a = 1/2 zaměnit sčítanec 0(t + h2) sčítancem 0(t2 + h2), má metoda daná operátorem t-h"t i zvaná i zde Crankova-Nicolsonova metoda, celkovou diskretizační chybu řádu 0(t2 + h2), V prostorově jednodimenzionální případě vedlo Crankovo-Nicolsonovo schéma k algoritmu s minimálním počtem operací mezi všemi metodami vycházejícími z operátorů i^™'. Zde tomu už tak není. Při užití Crankova-Nicolsonova schématu musíme totiž stejně jako u čistě implicitní metody řešit v každém časovém řádku soustavu 0(l/h2) rovnic o 0(l/h2) neznámých. Matice této soustavy je sice pásová (srv. odst. 2.1 z kap. III), šíře pásu je však 0(l/h), takže k řešení zmíněné soustavy např. Gaussovou eliminační metodou je třeba řádově 0(1/A4) operací. Položíme-li t = 0{h), je celkový počet operací 0(l/ři5) a toto číslo je dokonce větší než u explicitní metody. To je také důvod, proč se zavádějí tzv. metody střídavých směrů a lokálně jednorozměrné metody. Tyto metody jsou co do velikosti celkové chyby v podstatě ekvivalentní Crankově-Nicolsonově metodě, vedou však k podstatně ekonomičtějším algoritmům. Některé z nich si nyní stručně popíšeme. 2.3.2 Metody střídavých směrů Hlavním důvodem zavedení těchto metod je, jak už jsme uvedli, snaha po dosažení maximální výpočetní ekonomie. Základní myšlenka, která se sledovala při jejich vzniku, byla spojit výhody implicitních metod spočívající v nezávislosti jejich stability na poměru časového a prostorového integračního kroku, s tou skutečností, že soustavy lineárních algebraických rovnic s třídiagonální maticí lze velmi ekonomicky řešit Gaussovou eliminační metodou (neboť v této situaci je počet potřebných operací úměrný počtu rovnic). Princip těchto metod ukážeme na příkladě okrajové úlohy (2.248) až (2.250), kde fi je čtverec (0,1) x (0,1). Kromě přibližného řešení Uj.'*1' v čase t = se v těchto metodách počítá ještě pomocná hodnota ujj.j v mezivrstvě í = íi+1/2 = *i + r/2, a to tak, že k výpočtu hodnot Uj's+1'2' se za předpokladu, že hodnoty ujj.'' jsou už známé, použijí jiné vzorce než k výpočtu hodnot tíjj*"1^. Jedna z historicky prvních metod tohoto typu pochází od Peacemana 2 METODA SlTÍ a Rachforda a je dána dvojicí vzorců (2.285) „(1+1/2) „C+1) _ „C+1/1) +ô^[«í?.-i-H,íj+«.ľ.+j. (0 ^.,(') Zií. 2h 2h2' „C+l/2) . + 2^|U (i+i) k, s ■■ l,...,n .0+1) ''ti ■1,1 = 0,. (1+1/2) t+1 ľ'] + (1+1) 1 *,»+!)> První z rovnic (2.285) tedy vznikla tak, že v intervalu (řj, ri-1-1/2) jsme aproximovali derivaci d2v./dx2 příslušným diferenčním podílem v horní (tj. počítané) časové vrstvě a derivaci d^u/Oy2 v dolní (tj. známé) vrstvě. V druhém vzorci (2.285) jsme tento postup prohodili, Přepíšeme-li rovnice (2.285) ve tvaru (2.286) -^4'-+í,í2, + (i+^^1/2) ¥-U\T- = Í/J«.0-i,. + (i-M'.) + ^«&i... „C+l/2) k,S = 1, . -1, 1 = 0,. (1+1/2) ,r- 1 (položili jsme opět jako obvykle 0 = r/h2), je ihned vidět, že hodnoty přibližného „(1+1/2) ,0+1/2) '2i „(1+1/2) v čase f = ťi+1/2 dostaneme při pevném s řešením soustavy (n — 1) lineárních rovnic (n — 1) neznámých s třídiagonální regulární maticí a hodnoty přibližného řešení u^1', i'i'2"1' 1 ■ ■ ■ > ul'T.-i v ^ase ' ~ ''+1 P" pevném k rovněž řešením (n — 1) lineárních rovnic o (n — 1) neznámých s třídiagonální maticí (v našem speciálním případě budou dokonce všechny zmíněné třídiagonální matice stejné). Příslušný algoritmus tedy probíhá tak, že hodnoty přibližného řešení v mezivrstvě t = <[+i/2 počítáme postupně na přímkách y — yt rovnoběžných s osou x a hodnoty přibližného řešení ve vrstvě í = ť[+1 postupně na přímkách x = Xt rovnoběžných s osou y. Z tohoto charakteru algoritmu také pochází název metoda střídavých směrů. K tomu, abychom vypočítali přibližného řešení (1 + l)-ní časové vrstvě za předpokladu, že přibližné řešení v ř-té časové vrstvě je už vypočteno, je tedy třeba řešit dvakrát (n — 1) soustav lineárních rovnic o (n — 1) neznámých s třídiagonálními maticemi. Celkový počet operací potřebných k získání přibližného řešení v jedné časové vrstvě je tedy řádově roven číslu 0(l/h2). Při dalším vyšetřování Peacemanovy-Rachfordovy metody budeme už velice struční. Její lokální chyba (tj. chyba, se kterou se vypočte přibližné řešení v (i +■ + l)-ní časové vrstvě za předpokladu, že řešení v 1-té vrstvě je přesné) je řádu 382 383 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU 0(r2 -I- h2), jak se snadno zjistí standardním užitím Taylorova vzorce. Že i celková diskretizační chyba je téhož řádu (v normě prostoru EJ£_1) ) plyne pak už v podstatě z lemmatu 2.3 a z následující věty. Věta 2.16. Peacemanova-Rachfordova metoda střídavých směrů je v normě (2.269) stejnoměrně stabilní vzhledem k počátečním podmínkám. Důkaz. Podobně jako v důkazu věty 2.15 máme dokázat, že pro každé řešení soustavy (2.285) s nulovými okrajovými podmínkami platí odhad (2.287) HtfCOUn, g M||U(m>||„= pro m = 0,..., r — 1 a pro 1 = m, .., r. Funkci hledejme opět ve tvaru (2.288) 4'j= £■ c(l)a^vir\ kde funkce v ("■'') jsou dány vzorcem (2.274) a čísla ctí^ jsou Fourierovy koeficienty počátečního vektoru, tj. platí (2.289) u (0 _ v kt — / . Dosadíme-li (2.288) do (2.285), snadno zjistíme, že musí platit (2.290) T c(l + 1) - c(l + 1/2) 2^e,C(i + i)-^e,c(í + l/2), kde (2.291) Položíme-li znovu /? = rjh2 a vyloučíme-li c(l + 1/2) z rovnic (2.290), dostaneme g„ = 4sin2 v = 1, , n — 1. 2n (2.292) c(i i l)=^-iM(i-kM c(l). (l+i/?e„)(l + i^) Zopakujeme-li nyní doslova úvahy z důkazu věty 2.15, dostaneme, že podmínka (2.293) I(i+í^)(i+í^)I- je nutná a postačující podmínka požadované stability. Tato podmínka je však vzhledem k (2.291) splněna pro libovolné (i > 0. Věta je dokázána. Peacemanova-Rachfordova metoda je tedy absolutně stabilní a je při ní rozumné klást r = 0(h). Výpočet pak vyžaduje 0(l/h3) operací, což je výsledek podstatně příznivější než u kterékoliv z metod popsaných v odst, 2.3.1, 384 2 METODA SlTl Metod střídavých směrů byla navržena celá řada. Uveďme z nich ještě velmi známou metodu D'Jakonovovu, která je dána dvojicí vzorců (2.294) (/ - tf6W*m = (! + + i/?í>W (/-I/3Í2S,)U<<+1)= „0+1/2). Zde jsme použili stručný zápis diferenčních schémat pomocí identického operátoru/a operátoru centrální diference. Centrální diferenci přitom definujeme, jak je obvyklé, jako operátor, který funkci / přiřazuje funkci S f předpisem (í/)(x) — = f{x + h/2) — f(x — h/2). Mocninou operátoru S pak rozumíme operátor 5* definovaný rekurentně vztahem (Skf)(x) = (č*-1/)^ + h/2) - (5k~lf)(x - h/2). Pokud užijeme tuto operaci na funkci více proměnných, pak připojený index označuje proměnnou, které se operace týká. I pro D'Jakonovovu metodu platí věta 2.16, jak se snadno zjistí, a její lokální chyba je opět 0(r2 + A2). Poznamenejme, že zapíšeme-li Peacemanovu-Rachfordovu metodu analogickým způsobem jako metodu D'Jakonovovu, dostaneme dvojici vzorců (2.295) (/-í^V+^^z + i^V), V souvislosti s metodami střídavých směrů je ještě třeba upozornit na jednu velmi závažnou skutečnost. Údajům o velikosti chyb, které jsme uvedli, je nutno rozumět tak, že se týkají přibližného řešení pro celá l a že tato přibližná řešení jsou dána jak v případě Peacemanovy-Rachfordovy metody, tak v případě D'jakonovovy metody vzorcem (2.296) (' - »(' " =(' + »(' + l/M?)"1 CO s počátečními podmínkami " g(xk,ys) a okrajovými podmínkami iijj - f(xi, ya,ŕ|), (ajfc.y,) e ľ(h\ l = 0,...,r. Veličiny «('+1/2) s lomenými indexy přitom pokládáme za pomocné. Tyto pomocné veličiny nemusí aproximovat řešení v žádné časové vrstvě a zavádějí se jen proto, abychom řešení soustav rovnic, které je nutno při užití schématu (2.296) řešit, získali ekonomicky. Veličiny u('+1/2) jsou tedy vlastně definovány vzorci (2.297) a0+i/2) = i(/ _ ^5i)u<»+i) + i(/ + ipsfy (0 (Peacemanova-Rachfordova metoda) a (2.298) (/-i^V+i) (D'jakonovova metoda). Odtud však plyne, že i okrajové podmínky, které pro tyto veličiny potřebujeme při počítání podle vzorců (2.294), (2.295), je třeba volit 385 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU 3 SEMIDISKRÉTNl METODY v souladu s rovnicemi (2.297) a (2.298), tj. je třeba je počítat ze vzorců (2.299) 4',+,/2) = |(/ - 2-f362)J(xk,ys,tm)+ (Peacemanova-Rachfordova metoda) a (2.300) u^1/2) = (I - \pS2)y(xk,y„tw) (D'jakonovova metoda). Kdybychom kladli zdánlivě přirozeně Uj.'*1^ = = l{xh, S/j,í(+i/2), narušili bychom odhady chyb, které jsme uvedli. Závěrem tohoto odstavce upozorněme ještě na jednu zajímavou a důležitou souvislost. V odst. 2.3.2 z kap. III jsme zavedli Peacemanovu-Rachfordovu metodu střídavých směrů jako iteračm metodu pro řešení soustav lineárních rovnic, které vznikají při řešení okrajových úloh pro eliptické parciální diferenciální rovnice metodou sítí. Tato metoda vznikla Ve skutečnosti tak, že řešení eliptické rovnice se pokládá za ustálené řešení parabolické rovnice a tato parabolická rovnice se pak řeší metodou (2.285). 2.3.3 Lokálně jednorozměrné metody Tyto metody jsou velmi podobné metodám střídavých směrů. I zde se přibližné řešení u',+1) v čase í = t;+i za předpokladu, že přibližné řešení i»W v čase t = t; je už vypočteno, počítá tak, že se nejprve vypočte pomocná hodnota u('+1/2) pomocí jednoho vzorce a pak teprve konečná hodnota pomocí jiného vzorce. Nejběžnější metoda tohoto typu pochází od Janenka a je dána dvojicí vzorců (2.301) (/ - $pfyfl+w ~ (, + ipSi)um _ (í-^>(,tl)=(í + ^>|,+1'!). Přibližné řešení se tedy počítá tak, jako kdyby v časovém úseku mezi časy ť — íj a i = r|+i/2 vedl materiál teplo jen ve směru osy x a v časovém úseku {íi+1/2, U+i) pouze ve směru osy y. Odtud také pochází název metody. Je zřejmé, že jeden dvou-krok uvedené metody se realizuje stejně jako u metod střídavých směrů řešením soustav s třídiagonálními maticemi a že je řádově stejně pracný. Rovněž je zřejmé, jak lze tuto metodu přenést na případ více prostorových proměnných. Je k tomu pouze třeba rozdělit časový úsek (ťj, íj+i) na m mezivrstev, kde m je počet prostorových proměnných, a v každé mezivrstvě aproximovat pouze derivaci podle jedné prostorové proměnné. Metoda (2.301) je v normě (2.269) opět stejnoměrně stabilní vzhledem k počátečním podmínkám bez jakéhokoliv dalšího omezení na parametry raiav případě homogenních okrajových podmínek vede k rychlosti konvergence 0{r2 + h2). V případě nehomogenních Dirichletových okrajových podmínek se obvykle doporučuje brát za okrajové hodnoty pomocné veličiny u',+1/2) hodnoty okrajové funkce, tj. klást ukí = y(xk,ys, tl+i/i) Tato volba však vede podobně jako u metod střídavých směrů ke ztrátě přesnosti. Na rozdíl od tamní situace je však zde obtížné udat korekční vzorce typu (2.299) a (2.300), které by tuto obtíž odstraňovaly. To je také důvod, proč jsou lokálně jednorozměrné metody podstatně méně populární než metody střídavých směrů, 3 Semidiskrétní metody Již vícekrát jsme v této kapitole upozornili na to, že základní úloha pro parciální diferenciální rovnice parabolického typu má vzhledem k proměnné t charakter úlohy s počátečními podmínkami pro obyčejnou diferenciální rovnici a vzhledem k prostorovým proměnným charakter okrajové úlohy pro obyčejnou diferenciální rovnici, resp. pro parciální diferenciální rovnici eliptického typu. Metody, které v tomto článku popíšeme, si kladou za cíl této skutečnosti využít, a to tak, že diskre-tizace se provádí pouze vzhledem k prostorovým proměnným nebo pouze vzhledem k proměnné t. Nejdůležitějšími reprezentanty metod první skupiny jsou metoda přímek a semidiskrétní metody Galerkinova typu. V metodě přímek se diskretizace prostorových proměnných provádí na základě metody sítí, u semidiskrétních metod Galerkinova typu se vychází z Ritzovy-Galerkinovy metody pro řešení eliptických úloh a postup se většinou spojuje s metodou končených prvků. Metody druhé skupiny, kdy se diskretizace provádí pouze vzhledem k proměnné ť, se nazývají Rotheovy metody. Je třeba upozornit, že metody obou zmíněných skupin jsou odlišného charakteru než metoda sítí, jejíž různé varianty jsme popsali v předešlém článku- Zatímco výsledkem algoritmů založených na metodě sítí jsou přibližné hodnoty hledaného řešení v nějaké konečné množině bodů zadané oblasti, tedy veličiny, které nás už bezprostředně zajímají, za aproximaci přesného řešení v případě semidiskrétních metod slouží stále ještě nekonečnědimenzionální problémy, i když jednodušší než původní. Konkrétně jde v případě metod první skupiny o soustavy obyčejných diferenciálních rovnic s počátečními podmínkami, v případě Rotheovy metody o okrajové úlohy pro obyčejné nebo parciální eliptické diferenciální rovnice. K řešení těchto úloh se pak dají užít metody, které byly popsány v kap. I, II a III. Abychom se mohli v dalším výkladu soustředit na základní myšlenku vyšetřovaných metod a nezastreli ji množstvím technických podrobností, omezíme se v tomto článku prakticky výhradně na prostorově jednodimenzionální rovnici pro vedení tepla (2.1) s počáteční podmínkou (2.2) a s homogenními Dirichletovými okrajovými podmínkami (2.3) a možnosti rozšíření na obecnější úlohy jen stručně okomentujeme. 386 387 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU 3.1 Metoda přímek Tato metoda vychází, jak už jsme uvedli, z myšlenky metody sítí. Na rozdíl od ní se však síť sestrojí jen v oblasti prostorových proměnných a diferenčními podíly sc nahradí pouze derivace podle těchto proměnných. Přesné řešení daného problému je pak aproximováno řešením soustavy obyčejných diferenciálních rovnic s počátečními podmínkami. V odst. 3.1.1 popíšeme klasickou variantu této metody a v odst. 3.1.2 si stručně všimneme Numerovovy metody, v níž se uvedená základní myšlenka realizuje dosti důmyslně, a která má proto jistou popularitu. 3.1.1 Klasická metoda přímek Buď ti řešením problému (2.1) až (2.3), buď n přirozené číslo a rozdělme interval (0,1} na n dílků délky h = 1/n dělicími body xk — kh, k = 0,..., n. Nahradíme-li drahou derivaci d2u/dx2 v bodě ť) podílem [u(zi-i,r) - 2u(a;j;,i) + + u(x);+i,t)]/h2 a chybu, které se přitom dopustíme, zanedbáme, dostaneme pro přibližné řešení Ujt(í) na přímce í = íj, 0 ž í í t, soustavu obyčejných diferenciálních rovnic (3.1) ůi(t) = i[ui-i(i)-2u»(i) + ut+i(ť)], k = 1, ...,n- 1, t e (0,T), kde (3.2) (3.3) Uo(í) = Un(t) = 0, «*(0) - g(xk), fc=l, 1, a tečku užíváme jako stručné označení derivace podle proměnné t. Je zřejmé, že stejně jednoduše se dá postupovat i v případě složitějších parabolických rovnic. Chceme-li provést úplnou diskretizaci daného problému, je třeba řešit soustavu (3.1) vhodnou numerickou metodou. Užijeme-li např. nejprostší Eulerovu metodu, dostaneme explicitní metodu sítí. Podobně řešení této soustavy lichoběžníkovým pravidlem vede ke Crankově-Nicolsonově schématu. Souvislost mezi klasickou metodou přímek a metodou sítí je tedy skutečně velice úzká. V této souvislosti je také třeba upozornit na jednu důležitou a pro metodu přímek a pro semidiskrétní metody, v nichž se ponechává čas spojitý, vůbec typickou okolnost. Matice soustavy diferenciálních rovnic (3.1) je matice — (l/h2)Pa, kde P0 je matice (2.81). Její vlastní čísla jsou tedy dána vzorcem (3.4) Vv = -t? sin —, w = l,...,n-hl 2n (srv. vzorec (2.82)). Z tohoto vzorce však plyne, že absolutní hodnota vlastního čísla p\ konverguje pro h —» 0 k — jt2> zatímco absolutní hodnota vlastního čísla tin-i roste při h —+ 0 nade všechny meze. Soustava (3.1) tvoří tedy soustavu diferenciálních rovnic se silným tlumením (srv. odst. 6.3 z kap. I) a tento její charakter 388 3 SEMIDISKRÉTNÍ METODY je tím výraznější, čím je integrační krok h menší. Prakticky to má za následek, že řešení této soustavy obecnou metodou pro řešení úloh s počátečními podmínkami pro obyčejné diferenciální rovnice vede obecně pouze k relativně stabilním diferenčním schématům a že absolutní stabilitu lze očekávat pouze při užití A-stabilních nebo aspoň A(0)-stabilních metod. Konvergenční vlastnosti klasické metody přímek jsou uvedeny v následující větě. Věta 3.1. Nechť řešení problému (2.1) až (2.3) existuje — označme je ti — a nechť má v množině R = {(x, i); Oí iSl, 0 S ť ^ T) spojitou čtvrtou derivaci podle x. Nechť dále ut je přibližné řešení vypočtené z rovnic (3.1) až (3.3). Pak existují konstanty M a ho > 0 takové', že pro každé h ž /io a t e (0, T) platí (3.5) kde (3.6) (3.7) \\uM(t)-u(t)\\hŠMh3, uW(ť) = [„1(ť),...,un_1(í)]T u(t) = [u(asi,t)l...1ut>„-i,í)]T. Důkaz. Připomeňme především, že norma užitá ve vzorci (3.5) je norma v prostoru EÍ;n"13, tj. je to obyčejná euklidovská norma vynásobená činitelem h1 {viz vzorec (2.77))'. Užijeme-li označení (3.6), dá se soustava (3.1) psát maticově ve tvaru uM(ť)s-.lPoUW(t)i (3.8) »--w--fcj' kde Po je už výše zmíněná matice (2.81). Položme dále (3.9) •(*) » »WM - "(*) r(ť) = -prW*H*) -«■(*). (3.10) r(t) = [^(x1,t), ,^(--i,*)]T. takže je (3.11) Z předpokladů věty plyne, že platí (3.12) ^(■i,*)=0(«i,í) = ^[«(*i-i.O-2»(*».O-r «t>*+i,01 +«*(*). přičemž je pro h < ho, t £ (0,7*) a k = 1,... ,n 1 (3.13) \eh{t)\ÚMh2 389 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU a M a ha > 0 jsou vhodné konstanty. Položíme-li (3-H) .(t) = en-i(*)]T, plyne ze vzorců (3.10) a (3.12), že pro vektor r platí rovnice (3.15) Celkem tedy dostáváme, že vektor e(ť) splňuje soustavu diferenciálních rovnic 1 (3.16) s počáteční podmínkou (3.17) Je tedy (3.18) e(ť) Odtud však plyne, že je (3.19) ||e(t)|U í •»(*> = —Sä^eCO - =(*> e(0) = 0. Jo Jo Matice exp [ — (l//j2)(ť — r)Po] je symetrická a všechna její vlastní čísla jsou dána vzorcem exp [ — (l/k2)(t — r)A„], v = 1,..., n — 1, kde A„ jsou vlastní čísla čísla matice P0 (viz vzorec (2.82)). Všechna vlastní čísla matice exp [ —(l//»2)(ť — t)P0] jsou tedy pro r € (0,ř) menší než jedna. Protože maticová norma indukovaná vektorovou normou ||. ||Ä je zřejmě obyčejná spektrální norma, plyne odtud, že platí (3.20) \\e-b{t-T)Po\\h š 1, r€{0,t). Z nerovnosti (3.13) plyne, že pro í e (0,T) platí (3.21) ll«(*)ll* 1/2 § (AnM2ft4)l/S = M h". L i=l Z nerovností (3.19), (3.20) a (3.21) však už snadno dostáváme, že je (3-22) ||e(ť)|U š MTh\ což dokazuje větu. 3 SEMIDISKRÉTNl METODY 3.1.2 Numerovova metoda Tato metoda vychází z pozorování, že pro každou dostatečně hladkou funkci y platí (3.23) y{x - h) - 2y(x) + y(x + h) = - ift%"(* - h) + I0y"(x) + y"(x + h)) + 0(h6). Máme-li na mysli opět úlohu (2.1) až (2.3) a píšeme-li v této rovnici dv(x, t)/dt místo y"(x), dostaneme po zanedbání chybového členu pro přibližné řešení ut(t) soustavu rovnic (3.24) íV["*-i(ť) + 10"*W + »*+i(í)J = - 2u*(ť) + «t+i(*)]. fc = 1,..., n - 1, u0(í) - «„(ť) = 0 s počátečními podmínkami (3.3). Právě popsaná metoda se nazývá Numerovova metoda. O její konvergenci platí následující věta. Věta 3.2. Nechť řešení problému (2.1) až (2.3) existuje a má v R šest spojitých derivaci podle x. Nechť u^(i) je vektor přibližného řešení vypočteného Numero-vovou metodou a nechť u(í) je vektor přesného řešení. Pak platí (3.25) ||«iW(í) - «,(í)||, = 0{h% Důkaz je skoro totožný s důkazem věty 3.1, a proto budeme postupovat velmi rychle. Označíme-li matici na levé straně soustavy (3.24) symbolem B, zjistíme snadno, že pro vektor chyby e definovaný opět rovnicí (3.9) platí (3.26) 6 «(Í) = -Tí M0 -«(*). přičemž složky vektoru c jsou řádu 0(ři4). Pro matici S zřejmě platí B = = (1/12)(12/ — Po). Z tohoto vyjádření a ze znalosti vlastních čísel matice Po (viz znovu vzorec (2.82)) však ihned plyne, že matice B je pozitivně definitní a že pro ni platí ||B||a = 0(1) a (|B_1||a = 0(1). Vynásobíme-li tedy rovnici (3.16) zleva maticí B~íl dostaneme soustavu rovnic, jejíž řešení odhadneme úplně stejným způsobem jako řešení soustavy (3.16) v důkazu věty 3.1. Důkaz je hotov. Numerovova metoda tedy konverguje s rychlostí řádu 0(h4). Protože matice 6 je třídiagonální, vede numerické řešení soustavy (3.24) k řešení soustavy lineárních rovnic s třídiagonální maticí pro každý časový řádek. Numerovova metoda není tedy o nic pracnější než implicitní metoda sítí, která má ovšem řádově větší diskretizační chybu. To jej jistě pozoruhodné a pramení odtud i určitá popularita Numerovovy metody. 390 391 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU 3.2 Semidiskrétní metody Galerkinova typu Základní myšlenka tohoto postupu je obdobná jako u Galeikinovy metody pro řešení okrajových úloh pro obyčejné diferenciální rovnice, resp. pro parciální rovnice eliptického typu. Protože Galerkinova metoda v eliptickém případě vychází z pojmu slabého řešení, musí náš první krok spočívat v zavedení podobného pojmu pro parabolický případ. Postup je zcela analogický jako v eliptickém případě, a popíšeme jej proto jen velmi stručně, a to na příkladě modelové úlohy (2.1) až (2.3). Buď JPq podprostor těch funkcí u ze Sobolevova prostoru Jť1, které splňují okrajovou podmínku u(0) = «(1) = 0. Řekneme, že funkce ti: (0,T) —> jťal je slabým řešením úlohy (2.1) až (2.3), platí-li pro každé i 6 (0, T) a pro každé v £ £ JPq identita (3.27) (ú(ť),tí) + [u(ť),„] = D a pro t = 0 a pro každé v 6 Jťg identita (3.28) («(0), «) = («,*) (počáteční podmínka). Zde kulaté závorky značí skalární součin v prostoru -2a(0,1): [«, v] je bilineární forma definovaná vzorcem (3.29) (a je to tedy skalární součin v prostoru JrJ1) a tečka označuje stejně jako výše derivaci funkce u podle i. Buď dále % konečnědimenzionální podprostor prostoru JÄg1. Semidiskrétní Galerkinovu aproximaci řešení úlohy (3.27), (3.28) pak definujeme jako funkci "h '■ (0, T) —* pro niž platí (3.30) (úh{t),v) + [uh(t),v]--0, í£(0,T> .i (3.31) M<M=(ff.») pro každé leSj. Je zřejmé, že pro zavedení uvedených pojmů není vůbec podstatné, že bilineární forma [«, v] je definovaná právě vzorcem (3.29) a že na pravé straně rovnic (3.27), resp. (3.30) je nula. Úplně stejně by se postupovalo i v případě rovnice du/dt+Lu — = /, kde t je lineární eliptický diferenciální operátor druhého řádu v libovolném počtu prostorových proměnných. Tvoří-li funkce $i,..., bázi v prostoru je hledaná aproximace uj, tvaru N (3.32) «„(*,*) = £ij,-(í)4<(a0, 392 3 SEMIDISKRÉTNÍ METODY kde i), jsou reálné funkce proměnné t. Dosadíme-li do rovnice (3.30) za podle (3.32) a za v postupně funkce , j — 1.....JV, dostaneme N N (3.33) E'j.Wtí.-.^O + ^^Wt^.^^o, íe(0,T>, N 1=1 Hledané koeficienty íj = [iji(ť), .., t}n-i{t)]T tedy splňují soustavu diferenciálních rovnic (3.34) Bii(t) + Ari(t) = 0, í e (0, T), s počáteční podmínkou (3.35) 0,(0) = tf°\ kde A a. B jsou symetrické matice řádu N dané vzorci (3.36) A= {[*,, *j]} = {£*'i(x)ťi{x)dxy B = {(**, - { jf d* J a »/0' je iV-dimenzionální vektor o složkách (3,$,). Matice A a, B jsou zřejmě symetrické a pozitivně defmitní, soustavu diferenciálních rovnic (3.34) lze tedy psát ve tvaru (3.37) i7(í) + Av{t) = 0, kde (3.38) A = B~1A. Za prostor &h se většinou volí prostor konečných prvků, neboť pak je zaručeno, že matice A i B jsou pásové, což podstatně usnadňuje řešení soustavy (3.34). Poznamenejme v této souvislosti, že v důsledku přítomnosti matice B v soustavě (3.34) nemá smysl řešit tuto soustavu explicitní metodou, neboť tak jak tak musíme v každém kroku řešit soustavu lineárních rovnic. V tomto smyslu je zde tedy situace podobná jako u Numerovovy metody vyšetřované v odst. 3.1.2. V dalším textu se omezíme na případ, že za prostor Sfy, bereme prostor po částech lineárních funkcí, které splňují nulové Dirichletovy okrajové podmínky a že příslušné dělení intervalu (0,1) je ekvidistantní s podintervaly délky h. Na tomto speciálním případě pak ukážeme jeden z možných způsobů vyšetřování konvergence studované metody. Uvidíme, že už i v této jednoduché situaci nebude ani zdaleka vše tak elementární, jako tomu bylo u metody sítí nebo u klasické metody přímek. Než zformulujeme a dokážeme příslušné tvrzení, uvedeme několik lemmat, která při 393 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU jeho důkazu použijeme. Abychom však nemuseli psát příliš mnoho indexů, umluvíme se ještě předtím, že pod symbolem absolutní hodnoty budeme v dalším rozumět euklidovskou normu vektoru nebojí indukovanou normu matice a že obyčejný symbol normy bez jakéhokoliv indexu bude značit normu v prostoru JSfa(0,1). Lemma 3.1. Buď 9^ C prostor po částech lineárních funkcí s ekvidistant-nún dělením o délce dílku h — 1/(N + 1) a bud'$i,..., <Ějf jeho standardní báze. Pak pro matice A a B definované vzorci (3.36) platí A=^Po, B = iA(6/-P0), (3.39) kde Po je matice (2.81) a (3.40) W = 0G)> lfll = °(A)- l8_1l = °(ä- Důkaz Vzorce (3.39) odvodíme přímým výpočtem za použití konkrétního tvaru bázových funkcí (viz vzorec (4.83) z kap. II). Z těchto vzorců a ze znalosti vlastních čísel matice Po (viz vzorec (2.82)) však plyne, že vlastní čísla A^ a XÍB^ matice A a B jsou dána vzorci 4 (3.41) (3.42) A(") = rin"2(iv+i)' Odhady (3.40) pak plynou odtud a z toho, že je \A\ Amáx, \B\ ~ Anfáx a \B 1| — Lemma 3.2. Existují kladné konstanty c a C takové, že pro každou funkci N (3.43) rí=^iK*,-G^ c%|2 g |M|2 $ ChW2. platí (3.44) Důkaz. Je (3.45) ||n|p = EE *■&<*«•*') = ^ i=l ;=1 Protože pro symetrickou a pozitivně definitní matici B platí (3-46) AffiMašVB?gAÍ&Í«l|a. plyne tvrzení ze vzorce (3.42). r 3 SEMIDISKRÉTNl METODY Lemma 3.3. Nechť je dána množina matic Ct, kde t probíhá libovolnou množinu indexů I, a nechť pro každé t e I je matice Q symetrická a pozitivně semideňnitní. Pak existuje konstanta M taková, že pro každé t € I platí (3.47) |Ge-c'|gM. Důkaz . Vlastní čísla symetrické matice Cte~c' jsou tvaru A<e-*', kde Aj je vlastní číslo matice Ct- Protože matice Ct je pozitivně semideňnitní, je A( S (0, oo). Reálná funkce Ae~A reálné proměnné A £ (0,oo) však nabývá zřejmě v bodě A = 1 svého maxima. Odtud už tvrzení plyne. Lemma 3.4. Slabé" řešeni' úlohy -y" = 6, y(0) - y{\) - 0, kde 6 6 JSř2(0,1) existuje a leží dokonce v prostoru Jť2. Navíc existuje konstanta M taková, že pro každé 6 £ Sf2(0,1) platí odhad (3.48) š M||ff||. Důkaz Za uvedených předpokladů je výraz (8, v) zřejmě lineární funkcionál nad prostorem JIÍq. Podle Ríeszovy věty tedy existuje právě jeden prvek y £ Jťg1 takový, že platí (3.49) [y, v] - (&, v) pro každé v G JPn1- Slabé řešení uvažované okrajové úlohy tedy existuje a je určeno jednoznačně. Snadno se ověří, že je lze psát ve tvaru (3.50) y(x) = (1 - x) f f 0(0 d f + x [\l - 09(() d í. Jo Jx Z tohoto vyjádření však plyne, že je (3.51) y'(x) = - f f 0(0 dí + í\l - 0<?(0 df Jo Ju Protože obě funkce £0(0 i (1 — 0"(í) jsou lebesgueovsky integrovatelné, je funkce y' absolutně spojitá a platí pro ni y"(x) = —9(x) skoro všude na intervalu (0,1). Odtud však už nerovnost (3.48) plyne bezprostředně. Věta 3.3. Nechť u je slabé řešení problému (2.1) až (2.3) a nechť pro ně platí u(t) £ 3Č12 pro každé t £ (0, T). Nechť 9h je podprostor prostoru Jť^ z lemmatu 3.1 a buď ui> příslušné semidiskrétní řešení. Pak existují konstanty M a ho > 0 takové', že platí (3.52) max \\u(t)-uh(t)\\<h2M(l + ]n^r) max ||u(í)|| <s(o,r) ~ v h3/t£{o,t) pro každé h ^ ho. 394 395 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU Důkaz. Buď t pevně zvolené a buď iph : {0, í) —» &k pomocná funkce, která je řešením úlohy (3.53) -(^(s), „) + [¥>,,(«), v], 5 6(0, i), vE&h, s „koncovou" podmínkou (3.54) <ph(t) = eh(t). Přitom jsme položili (3.55) eh(s) = uh(s) - uh(s), kde funkce Uí,(s) je ortogonální projekce v prostoru Jťg přesného řešení u(s) na podprostor Pro každou funkci v e a pro každé s e (0, T) tedy platí (3.56) [u(s)-äÄ(í),tj] = 0. Úloha (3.53), (3.54) má právě jedno řešení, neboť položíme-li N (3-57) W.m = m. (3.58) je ekvivalentní s úlohou (3.59) -eš(s) + Aí(s) - o, se(o,í), í(í)=í(0). Položme v (3.53) u = £;>{s). Dostaneme (3.60) -(<pfc(»),e„(s)) + [(p*(í),efc(«)] = 0. Integrací v mezích od 0 do t odtud máme (3.61) / (<pK(s),eh(s))ds = í [^(í),efc(í)]d*. Jo jo Úprava per partes dá (je třeba si uvědomit, že skalární součin v prostoru -S?2 je integrál) (3.62) (Vfc(*).e»(ť))-(pk(0W0)) ' / (?*(»),«»(«)) ds t= Jo = / DpnOO.ekWjds Jo 3 SEMIDISKRÉTNl METODY neboli, protože je iph(t) = ej,(i), (3.63) ||eA(ť)||2 = (W(0),e*(0)) + /' {(«*(«).*»(«)) + [**(«).<*(')]} ds- Jo Položme dále (3.64) 9(s) = U(s) - Úh(s). Je (3.65) ľ {(»(•), + [*(.), ,»»(«)]} ds = Jo ~ / {(ú(s) - ^(sj.^fcís))+[«(«)-«(,(«),^fc(s)]} dí- jo = f {(ú(*),<ph(s)) + [u(s),<ph(s)]}ds-Jo - / {(ň.(s),<ph(s))+ [uh(s),<ph(s)]}ds = Jo - / {(«&(»). PaOO) + [«*(»),?«(«)]} ds- yo - / {(5(s),pa(í)) + [«i.(*),V*(«)]}á^ j o jo Dále je (3.66) (9(0), <pH(0)) = («(0) - S„(0), ^(0)) = = («h(0) - ú*(0) + u(0) - uA(0), ^,(0)) = = («4(0),*>*(0)) + («(0)~iii(0)ltP»(0)) - (e»(0),V»(0)), přičemž poslední rovnost platí v důsledku počátečních podmínek, které splňují funkce « a Uh - Dosadíme-li poslední dva vztahy do rovnice (3.63), máme (3.67) ||e„(i)||2 = (9(0), M°)) + /' { (*(»). WkW) + PM, P» Wl} «!*• JO Provedeme-li v prvním integrálu na pravé straně rovnice (3.67) integraci per partes a užijeme-li toho, že podle definice funkce íj, je [9(s), tpk(s)} = [«(*) -— úji(s), <pk(s)] = 0, dostáváme konečně (3.68) \\eh(t)\\2 = (B(t), Vh(t)) ■ ľ (fl(«), ?»(«)) d<. Jo Abychom mohli právě odvozenou reprezentaci podstatné části chyby dál zužitkovat, je třeba odhadnout funkci iph a její derivaci. Použijeme k tomu vyjádření 397 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU (3.57). Řešení soustavy diferenciálních rovnic (3.59) lze psát ve tvaru (3.69) kde (3.70) Ä = B'1 A Protože matice A je pozitivně definitní, platí (3.71) ,Äfál pro každé s £ (0,i) (srv. důkaz věty 3.1). Z rovnice (3.69) proto plyne, že je (3.72) K(s)|2 5 |í(í)|2, ,€{0,<) Derivujeme-íi rovnici (3.69) podle s, máme 1 j(s) = ^e-t<-")/>í(í) = ^(ť - sJÄe-í'-^ífť). (3.73) Odtud použitím lemmatu 3.3 dostáváme (3.74) Pišme dále (3.75) /*lé(»)|d.= /' " |{(»)|d*+ f \k{s)\ás. JO JO Jl-h3 Podle (3.74) je (3.76) j~ |í(s)|dsSM|í(i)|jí" - ~ = MjS(í)|lnp. Dosadíme-Ii do druhého integrálu na pravé straně rovnice (3.75) za £(s) /. rovnice (3.59) a normu vektoru £(s) odhadneme podle (3.72), dostáváme (3.77) Jt-h? j)|df £|í(í)||>*|Äa Podle lemmatu 3.1 je však \A\ - 0(l/h2): takže celkem dostáváme z rovnice (3.75) a nerovností (3.76) a (3.77) (3.78) /jťM|d«SM|É(Ol(l + lnj£)-Z lemmatu 3-2 a z nerovnosti (3.72).plyne, že je (3.79) llpíMH* ž Ch\í(s)\2 á Ch|€WI2 š flMOlP 398 3 SEMIDISKRÉTNl METODY Platí tedy (je ^(ť) = eh(í)) (3.80) \\Vh(t)\\ S M\Mt)\\. (Konstanta M je zde i dále samozřejmě generická.) Zcela analogicky odvodíme z nerovnosti (3.78) nerovnost (3.81) jT* \\M*)\\ i" š M||eh(i)|] (l + ln ±). Nyní jsme už skoro hotovi. Z vyjádření (3.68) plyne (3.82) |Mt)||2 š\W)\\ IM0II + í'\\0(*)\\ \\M')\\i'- Jo Dosadíme-Ii do této nerovnosti odhad (3-81), dostáváme (3.83) IMOH2 S (m^ ||«(«)||)||ek(í)|| [l + Af (l + ln-)], a tedy celkem (3.84) IMOII ú M(l + ln 1) max Píšeme-li nyní celkovou diskretizační chybu u — uj, ve tvaru (3.85) u — Uh — u - Ub 4- «» — u/i = 9 - e/,, dostáváme pro ni z odhadu (3.84) nerovnost (3.86) ||«-u»|| ^ M(l 4-ln^) max ||(?(S)||. Abychom dokázali nerovnost (3.52), stačí už jen odhadnout normu funkce 6. Řešme k tomu cíli pro tuto funkci okrajovou úlohu zformulovanou v lemmatu 3.4. Funkce 9 patří podle (3.64) nejen do prostoru Jžŕji ale dokonce do JČq1, takže ji lze dosadit do identity (3.49). Dostaneme tak rovnici (3.87) |l«||a = l»,fl = (»-ini,«]1 kde j/;, je interpolace funkce & v prostoru &f,. Je tomu tak proto, že podle definice funkce 6 je [8, v] — 0 pro každou funkci v £ &h- Z rovnice (3.87), z věty 4.5 z kap. II (viz str. 227) a z lemmatu 3.4 postupně dokážeme, že platí (3.88) \\e\\2 š \\y - yh\\^ á MhM\^ á Mih\\0\\ ||«||# Odtud však plyne, že je (3.89) \]9\\ í MhWBWjp . Na druhé straně však je (3.90) ||j(t = ||u - «k||jť« Sllu-tJ[|jr' 399 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU pro každou funkci v G &h, neboť Uh je ortogonální projekce na podprostor 3\. Tedy speciálně, opět podle věty 4.5 z kap. II, máme (3.91) Celkem tedy platí (3.92) IIjc ^Mh\\u\\ ||0(«)|| ŠMA2||„(S)||^ Odtud a z nerovnosti (3.86) však už plyne nerovnost (3.52) bezprostředně. Věta je dokázána. 3.3 Metody Rotheova typu V předchozích odstavcích jsme popsali ty semidiskrétní metody pro numerické řešení parciálních diferenciálních rovnic parabolického typu, které vznikly tak, že diskretizace se prováděla pouze vzhledem k prostorovým proměnným. Řešení původního problému pak bylo aproximováno úlohou s počátečními podmínkami pro soustavu obyčejných diferenciálních rovnic. Obrácení tohoto postupu, tj. provedení diskretizace pouze vzhledem k proměnné í, tvoří základní myšlenku metod Rotheova typu. Podrobněji se budeme zabývat jen nejjednodušší z nich a omezíme'se opět na modelovou úlohu (2.1) až (2.3). Položíme-li í[ — Ir, kde t = T/r, nahradíme-li derivaci dujdt v bodě (x,ti) podílem \u{x,ti) — u(x, ŕ/_i)]/r a chybu, které se přitom dopustíme, zanedbáme, je přibližné řešení uW(x), 1 — 1,..., r, v čase í = t; dáno řešením diferenciální rovnice (3.93) d V) 1 d z2 s okrajovými podmínkami (3.94) (0 . 1 í= 1, „(0 (0): (i) = o- Popsaná metoda tedy vznikne tak, že se na danou diferenciální rovnici díváme jako na obyčejnou diferenciální rovnici vzhledem k proměnné í a tu řešíme implicitní Eulerovou metodou. Náhradní problém je tedy okrajová úloha pro obyčejnou diferenciální rovnici, k jejímuž řešení lze většinou bez podstatných obtíží užít kteroukoliv z metod popsaných v kap. II. Často přitom vznikne některá z variant metody sítí. Při vyšetřování konvergence Rotheovy metody vyjdeme ze dvou elementárních lemmat, která vyjadřují některé jednoduché vlastnosti diferenciální rovnice typu (3.93). Lemma 3.5. Buď y funkce spojitá v intervalu (0,1), která je navíc dvakrát spojitě diferencovatelná v (0,1). Buď dále q kladná konstanta a nechť platí (3.95) 400 -y"(x) + qy(x)ÚO M — max y(x) 3 SEMIDISKRÉTNÍ METODY pro každé x e (0,1). Položme konečně (3.96) a předpokládejme, že je M > 0. Pak platí (3.97) M = max[j/(0),!í(l)]. Důkaz. Buď M = y(xo) a předpokládejme, že je x0 e (0,1). Protože funkce y nabývá v bodě xo svého maxima a je v něm dvakrát spojitě diferencovatelná, platí y'(xa) - 0 a y"(x0) - 0. Podle (3.95) v tomto bodě platí (3.98) 0 ž -y"(x0) + qy{x0) ž qy{xB) = qM > 0, což není možné. Proto je Xo = 0 nebo z o = 1 a důkaz lemmatu je hotov. Diferenciální operátor na levé straně nerovnosti (3.95) splňuje tedy princip ma- Lemma 3.6. Buďte u a rf dvě funkce spojité v intervalu (0,1) a dvakrát spojitě diferencovatelné v otevřeném intervalu (0,1). Nechť dále pro každé x £ (0,1) piati (3.99) | - u"{x) + qu{x)\ g -n"(x) + qr){x), kde q je kladná konstanta. Nechť konečně je |u(0) | á í)(0) a |tí(l)| á »j(l). Pak platí (3.100) |ií(z)| S r)(x) pro každé x £ (0,1), Důkaz. Položme ip = ±u — n. Z nerovnosti (3.99) ihned plyne, že pro každé x £ (0,1) platí (3.101) -<p"(x) + q>p{x) - =Fu"(i) ± qu(x) + rr"(x) - 917(1) á 0. Buď nyní (3.102) M = max ľ±ti(z) - n(x)} a předpokládejme, že je M > 0. Pak je podle lemmatu 3.5 (3.103) M - max[±u(0) - n(0), ±«(1) - n(l)] g 0. To je však spor dokazující, že je M ^ 0, Odtud už tvrzení lemmatu plyne bezprostředně Veta 3.4. Nechť řešení úlohy (2.1) ai (2.3) existuje a má v množině R = = {(x, t); 0 í í í 1, 0 š t í t} dvě spojité derivace podle proměnné t. Nechť dále j/!'(a:) je přibližné řešení vypočtené Rotheovou metodou (3.93), (3.94). Pak existují konstanty M a tq > 0 takové, že pro r To píafcí (3.104) \uV)(x)-u(x,ti)\ ÍJÍT, i = l, 401 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU Důkaz Chyba ij(0(i) = u^(x) - u(x,ti) Rotheovy metody splňuje rovnice (3.105) a (3.106) d r2 + -tŕ'> = -v' ,(0(o) = fJW(i) = o, 1 = 1, ...r, ^ - 0.. přičemž existuje konstanta M taková, že pro každé x £ (0,1) a pro každé dostatečně malé t platí (3.107) |e0)(z)| g Mt. Položme v rovnici (3.105) nejprve / = 1. Pak pro chybu v prvním časovém řádku platí (3.108) dVl> + -n (i) - M) d z2 r/W(0) = ijWíl) = 0. Podle lemmatu 3.6 je však řešení této okrajové úlohy majorizováno funkcí (3.109) <p(x) = Mt1>(x), kde funkce ip jc řešením pomocné okrajové úlohy (3.110) yj" + -ip = 1, 4>(o) = V(i) = o. Pro funkci ip totiž platí vzhledem k nerovnosti (3.107) (3.111) -V'(*) + -*>(*) = Mr > I - d fy + V>04 r I d aľ1 r I Funkce -i/i, která řeší okrajovou úlohu (3.110), je však dána vzorcem (3.112) t/>(x) r — r- cosh jak se snadno zjistí přímým výpočtem. Odtud však plyne, že pro každé x £ (0,1) platí (3.113) 0 g ip(x) % r. (Abychom to nahlédli, stačí vypočíst maximum funkce (3.112) v intervalu (0,1).) Je tedy (3.114) 402 \ri(1)(x)\ a Mr\f(x) <| Mr2 CVIČENI Nyní již snadno dokážeme úplnou indukcí, že platí (3.115) lijWfi)! g M/r2. Skutečně, předpokládáme-li, že nerovnost (3.115) platí pro i — 1, dostaneme z (3.105), (3.107) a z indukčního předpokladu, že je I dVor*) (3.116) dx2 ■ + -'/''(z)! š M(í- l)r+ Afr = Mír. Odtud však úplně stejnou úvahou, jako jsme dospěli k nerovnosti (3.114), dokážeme, že platí (3.115). Věta je dokázána. CVIČENÍ 1. Formulujte přesně hladkostní předpoklady, které stačí k platnosti vzorce (2.5). 2. Odvoďte vzorec (2.25). 3. Proveďte příslušné numerické výpočty dokazující komentář pod vzorcem (2.25). 4. Prověřte platnost vzorce (2.32). 5. Dokažte platnost principu maxima pro operátor daný vzorcem (2.4) (tj. pro explicitní schéma). 6. Dokažte, že maticová norma indukovaná normou prostoru E^"1-1' je obyčejná spektrální norma. 7. Na základě rovnic (3.40) a (3.58) z kap. II odvoďte tvar operátorů a l^'^ daných vzorci (2.117) a (2.118). 8. Formulujte přesně hladkostní předpoklady ve větách 2.6 a 2.7 (viz str. 353) a dokažte jejich tvrzení. 9. Dokažte konvergenci explicitní metody pro rovnici (2.109) s Dirichletovou okrajovou podmínkou. Nalezněte podmínku stability. 10. Proveďte podrobně výpočty potřebné k důkazu lemmatu 2.4 ze str. 360. 11. Dokažte, že splnění podmínky (2.161) implikuje platnost principu maxima pro operátor LJfl daný vzorcem (2.117). 12. Formulujte a dokažte pro D'Jakonovovu metodu střídavých směrů větu analogickou k větě 2.16 (viz str. 384). 13. Dokažte stejnoměrnou stabilitu vzhledem k počátečním podmínkám Janenkovy metody (2.301). 14. Dokažte platnost odhadu (3.23). 403 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU POZNÁMKY K LITERATÚRE Cl. 1. Teorii parciálních diferenciálních rovnic parabolického typu je věnována skoro stejně rozsáhlá literatura jako teorii eliptických rovnic, viz např. Petrovskij (1960), Friedman (1964), Ladyženskaja, Solonnikov a Uralceva (1967), pokud jde o klasickou teorii, Lions (1961) a Lions-Magenes (1968), pokud jde o funkcionálně analytické metody. Dobrými obecnými prameny k problematice této kapitoly jsou např. Collatz (1951), Forsythe, Wasow (1960), Babuška, Práger, Vitásek (1964), Berezin, Zidkov (1966), Babuška, Práger, Vitásek (1966), Mitchell (1969), Ansorge (1978) a Marčuk (1980). Cl. 2. Základy metody sítí jsou vyloženy ve všech obecných pramenech uvedených k čl. 1; kniha Sauljevova (1960) je věnována speciálně řešení parabolických rovnic metodou sítí. Ke studiu problémů stability jsou velmi dobrými prameny Richtmyer (1957), Richtmyer, Morton (1967) a Samarskij (1971). Obsáhlou bibliografii metody sítí jakož i ostatních metod pro řešení parabolických rovnic nalezne čtenář ve sborníku Jacobsově (1977). Speciálně metodami střídavých směrů a lokálně jednorozměrnými metodami se zabývá Janenko (1966). Cl. 3. Klasická metoda přímek je populární zejména v sovětské literatuře a zabývá se jí např. Berezin, Židkov (1966). Základní poučení o ní lze nalézt také ve sborníku vydaném Hallem a Wattem (1976). Semidiskrétní metody Galerkinova typu se zejména v poslední době dosti intenzívně studují a poučení o nich lze nalézt už v celé řadě knižních publikací. Uveďme z nich jmenovitě knihu Strangovu a Fixovu (1973), Mitchellovu a Waitovu (1977), Thoméovu (1984), Goeringovu, Roosovu a Tobiskovu (1988) a zejména pak knihu Johnsonovu (1988), z níž jsme také vydatně čerpali. Rotheova metoda se už dlouho užívá k teoretickým úvahám, viz např. Ladyženskaja, Solonnikov, Uralceva (1967). Kniha Rektorysova (1982) je monografií, která je v podstatě celá věnována této metodě, LITERATURA ANSORGE, R.: Differenzenapproximationen partieller Anfangsweraufgaben. Stuttgart, Teubner 1978. BABUŠKA, I. - PRÁGER, M. - VITÁSEK, E.: Numerické řešení diferenciálních rovnic. Praha, SNTL 1964. BABUŠKA, I. - PRÄGER, M. - VITÁSEK, E.: Numerical Processes in Differential Equations. London-New York-Sydney, Interscience Publishers 1966. BEREZIN, LS. - ŽIDKOV, N.P.: Metody vyčislenij. 3. vyd. Moskva, Nauka 1966, 2 sv. COLLATZ, L.: Numerische Behandlung von Differentialgleichungen. Berlin-Göttingen-Heidelberg, Springer-Verlag 1951. (Překlad do ruštiny: Moskva, IL 1953.) LITERATURA D'JAKONOV, E.G.: Raznostnyje Bchemy s rasščepljajuščimsja operatorom. Ž. Vyčísl. Mat. i Mat. Fiz. 2, 1962, s. 549 - 568. FORSYTHE, K.E. - WASOV, W.R.: Finite Difference Methods for Partial Differential Equations. New York-London, J. Wiley and Sons 1960. (Překlad do ruštiny: Moskva, IL 1963.) FRIEDMAN, A.: Partial Differential Equations of Parabolic Type. Englewood Cliffs, N.J., Prentice-Hall 1964. GOERTNG, II. - ROOS, H.G. - TOBISKA, L.: Finite-Element-Methode. Berlin, Akademie-Verlag 1988. HALL, G. - WATT, J.M. (eds.): Modern Numerical Methods for Ordinary Differential Equations. Oxford, Clarendon-Press 1976. (Překlad do ruštiny: Moskva, Mir 1979.) JACOBS, D.A.H. (ed.): The State of the Art in Numerical Analysis. London-New York San Francisco, Academic Press 1977. JANENKO, N.N.: Metod drobných šagov. Novosibirsk, Iz. NGU 1966. (Překlad do angličjtny: New York-Geidellierg-Kerlin, Springcr-Vcrlag 1971.) JOHNSON, C: Numerical Solutions of Partial Differential Equations by the Finite Element Method. Cambridge, Cambridge University Press 1988. LADYŽENSKAJA, O.A. - SOLONNIKOV, V.A. - URALCEVA, N.N.: Linejnyje i kvazilinejnyje uravnenija paraboličeskoho tipa. Moskva, Nauka 1967. LEES, M.: Apriori Estimates for the Solution of Difference Approximations to Parabolic Equations. Duke Math. J. 27, 1960, s. 297 - 311. LIONS, J.L.: Equations differentielles operationelles et problěmes aux limites. New Vork-Heidclbcrg-Bcrlin, Springer-Verlag 1961. LIONS, J.L. - MAGENES, E.: Problěmes aux limites non homogěnes et applications. Vol. 2. Paris, Dunod 1968. MARČUK, G.I.: Metody vycislitel'noj matematiki. 2. vyd. Moskva, Nauka 1980. (Překlad do češtiny: Praha, Academia 1987.) MITCHELL, A.R.: Computational Methods in Partial Differential Equations. London-New York-Sydney-Toronto, J. Wiley and Sons 1969. MITCHELL, A.R. WAIT, R: The Finite Klement, Method in Partial Differential Equations. Chichester-New York-Brisbane-Toronto, J. Wiley and Sons 1977. (Překlad do ruštiny: Moskva, Mir 1981.) PEACEMAN, D.W. - RACHFORD, H.H.: The Numerical Solution of Parabolic and Elliptic Differential Equations. J. Soc. Indust. Appl. Mat. 3, 1955, s. 28 - 41. PETROVSKIJ, I.G.: Lekcii ob uravnenijach s častnymi proizvodnymi. Moskva-Leningrad, Gostechizdat 1950. (Překlad do češtiny: Praha, Přírodovědecké vydavatelství 1952.) REKTORYS, K.: The Method of Discretization in Time and Partial Differential Equations. Dordrecht, J. Reidel 1982. (České vydání: Praha, SNTL 1985.) 404 405 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU RICHTMYER, R.D.: Difference Methods for Initial Value Problems. New York- REJSTŘÍK London, Interscience Publishers 1957. (Překlad do ruštiny: Moskva, IL I960.) RYCHTMYER, R.D. - MORTON, K.N.: Difference Methods for Initial Value Problems. New York-London-Sydney, J. Wiley and Sons 1967. SAMARSKIJ, A.A.: Vvedenije v teoriju raznostnych schein, Moskva, Nauka 1970. SAULJEV, V.K.: Integrirovanije uravnenij paraboliceskoho tipa metodom setok. Moskva, Fizmatgiz I960. STRANG, G. - FIX, K.J.; An Analysis of the Finite Element Method. Englewood Cliffs, N.J., Prentice-Hall 1973. (Překlad do ruštiny: Moskva, Mir 1977.) THOMÉE, V.: Galerkin Finite Element Methods for Parabolic Problems. Berlin-New York-Heidelberg, Springer-Verlag 1984. aproximact: Picardovy 14 - postupné 14 - semidiskrétní Galerkinova 392 - v metodě sítí 288 A-stabilita 112 A(a)-stabilita 116 část hlavní diskretizační chyby celkové 29 ----lokální 46, 84 derivace distributivní 296 - zobecněná 296 diference centrální 385 - zpět 51 dráha v grafu 165 D-stabilita 64 extrapolace Richardsonova 292 funkce přípustná 293 graf konečný orientovaný 165 - silně souvislý 165 hrana grafu 165 hranice hpschitzovská 295 chyba diskretízační celková 16, 178 - lokální 17 ---Adamsovy-Bashforthovy metody 55 ---Adamsovy-Moultonovy metody 57 ---metody numerického derivování 61 --metody sítí 179, 257, 288 ---mnohokrokové metody 62 ---obecné jednokrokové metody 33 zaokrouhlovací celková 17, 30 - - lokální 30 identita integrální Marčukova 172 interpolace při ekvidistantních argumentech 51 interval stability absolutní 87 --relativní 88 konormála 242 konstanta chyby 80 konvergence abstraktní metody sítí 289 - Eulerovy metody 21 - obecné jednokrokové metody 41 - obecné mnohokrokové metody 64 - prostá 16 konzistence 40, 67 korektnost metody sítí 289 korektor 97 kořeny charakteristického polynomu nepodstatné 78 - — — podstatné 78 krok integrační 14, 246 lemma Bellmanovo 150 - Collatzovo 166 - Gronwalovo 150 L- stabilita ] 16 matice diagonálně dominantní 166 - dvoucyktická 278 - fundamentální 128, 157 - Gramová 224, 300 - ireducíbilně diagonálně dominantní 166 - íreducibilní 165 - konzistentně uspořádaná 278 - monotónní 163 - nerozložitelná 165 - ostře diagonálně dominantní 166 - přechodu 335 - reducibilní 165 - rozložitelná 165 407 REJSTŘÍK REJSTŘÍK tuhosti 224, 300 - elementární 236 metoda Adamsova-Bashforthova 53 - Adamsova^Moultonova 56 cyklické Tedukce 276 - diferenční 162, 249 - Eulerova 15, 21 - modifikovaná 37 - Fehlbergova 38 - Fourierova 345 - Galerkinova 224, 300 - Gaussova-Seidelova 277 - - bloková 280 - Heunova 37 - Huíova 39 - jednokroková obecná 33 ---konzistentní 40 - - regulární 39 - k-kroková 61 - absolutně stabilní 87 - - D-stabilní 64 - explicitní 56, 61 - implicitní 56, 61 - konzistentní 67 - optimální 88 --relativně stabilní 88 - konečných prvků 226, 301 - lokálně jednorozměrná 285, 386 - Milnova-Simpsonova 58 - mTiňhokroková Gl --absolutné stabilní 87 - - £>-stabilní 64 --explicitní 56, 61 --implicitní 56, 61 - konzistentní 67 --optimami 88 - relativně stabilní 88 - neúplného rozkladu (Stoneova) 277 - neurčitých koeficientů 249 - Numerovova 391 - Nyatrômova 58 - polovičního kroku 29, 290 - přesunu okrajové podmínky 131 ----normalizovaného 148 - pfímek 244, 387 - - klasická 388 - Ritzova 222, 299 - Rítzova-Galerkinova 225 - Rotheova 387, 400 - Rungova-Kuttova 35 —- obecná 36 - standardní 38 - ^družených gradientů 278, 285 - - - předpodmíněná 286 - separace proměnných 345 - sítí 162, 245, 331 - Crankova-Nicolsonova 349 - - explicitní 333, 378 - - implicitní 333, 378 - zvýšené přesnosti 265 - střelby 125 --na více cflů 130 - Střídavých směrů 277, 382 —■ ™ D'jakonovova 385 ---Peacemanova-Rachfordova 282, 382 - supertelaxační 277 --bloková - Taylorova rozvoje 35 - více sítí 286 metody A stabilní 112 - diskrétní 14 - gradientní 277 - iteraČní 277 --bodové 281 - - blokové 280 - lokálně jednorozměrné 285, 386 - mnohokrokové 50 --optimami 88 - numerického derivování 51, 59 - numerické integrace 50 - prediktor-korektor 97 - přímé 213 - Rotheova typu 387, 400 - Rungovy-Kuttovy 35 - sernidiskrétní 331, 387 --Galerkinova typu 387 - střídavých směrů 277, 382 - variační 213 - zvýšené přesnosti 265 modul spojitosti 22 nerovnost Céova 301 nerovnosti energetické 182 nestabilita slabá 85 norma energetická 183, 295 oblast stability 108 odhad chyby 16 --aposteriorní 30 --apriorní 31 --asymptotický 16, 27, 76 --Bieberbachův 44 oko sítě 246 parametr růstový 79 - uzlový 226, 302 parametry iterační 284 - uzlové 226, 302 podmínka Lipschitzova 15 - okrajová 242, 330 - - Dirichletova 243, 331 --Neumannova 243, 331 --Newtonova 243, 331 - počáteční 13, 330 podmínky konzistence 67 - okrajové 122, 242 --Dtrich letový 128 --lineární 132 408 - nestabilní 299 - Neumannovy 137 --separované 122 --stabilní 299 - počáteční 13 - souhlasu 333 pole směrové 16 polynom charakteristický druhý 65 ■— první 65 - - třetí 87 posloupnost rozkladů regulární 311 pravidlo tříosminové 38 prediktor 97 princip maxima 177 prostor konečných prvků 226, 303 - Sobolevův 218, 295 prvek konečný 226, 303 - obdélníkový 321 ---Hermitův 323 - Lagrangeův 321 - trojúhelníkový 304 ---Hermitův 318 ---Lagrangeův kubický 315 - — kvadratický 312 ----lineární 304 ■----obecný 317 přepis okrajových podmínek Collatzův 258 přesnost mezní 31 rovnice biharmonická 243 - diferenční 243 - Poissonova 265 - pro vedení tepla 332 rychlost konvergence 16 řád lineární mnohokrokové metody 62 - metody sítí 288 - obecné jednokroková metody 34 řešení slabé 219, 297 - parabolické rovnice 392 - zobecněné 219, 297 explicitní 333 - implicitní 338 sí£ 245, 287 splinořunkre Hermitovy 233 S-poměr 111 součin skalární energetický 295 soustava cliferentiálních rovnic se silným tlumením 111 stabilita absolutní 87 - metody sítí 289, 337 - ■ absolutní 337 ---relativní 337 ---vzhledem k okrajovým podmínkám 289 -----počátečním podmínkám 344 -----pravé straně 289, 343 -----vstupním datům 289 - podle Dahlquista 64 - při pevném integračním kroku 87 - relativní 88 - vzhledem k trvale působícím poruchám 150 stopa funkce 296 trojúhelník referenční 313 úloha okrajová 122, 242 - s počátečními podmínkami 13 uzel grafu 165 - sítě 245 --hraniční 246, 287 --vnitrní 246, 287 uzly sousední 246 - v metodě konečných prvků 226, 302 vektor zatížení 224, 300 --elementární 236 vrchol grafu 165 vzorec Milnův 103 - asymptotický 27, 45 semmorma 229 schéma CrankovoNicolsonovo 349 změna integračního kroku 104 zobrazení diagonální 207 409