Akademie věd České republiky Základy teorie numerických metod pro řešení diferenciálních rovnic obsah Předmluva............................................................................. 11 Kapitola I. Obyčejné diferenciální rovnice - úlohy s počátečními podmínkami 13 1 Úvod ............................................................................... 13 2 Eulerova metoda....................................................-...........21 3 Obecná jednokroková metoda ....................................................... 33 3.1 Špeciálni prípady .............................................•................. 34 3.2 Konvergence obecné jednokrokové metody ..........................39 3.3 Asymptotický vzorec pro chybu .................................... -............ 45 3.4 Problematika zaokrouhlovacích chyb ............................♦............... 48 ■3 Mnohokrokové metody .............................................................. 4.1 Špeciálni prípady ..............................•................................ ^1 4.1.1 Interpolace při ekvidistantních argumentech............................... 51 4.1.2 Adamsova-Bashforthova metoda ........................................... ^3 4.1.3 Adamsova-Moultonova metoda............................................ 56 4.1.4 Nystromova metoda....................................................- ■ ■ 58 4.1.5 Zobecněná Mílnova-Símpsonova metoda ................................• • • 58 4.1.6 Metody založené na numerickém derivování................................ 59 4.2 Obecná lineární mnohokroková metoda......................................... 61 4.2.1 Nutné podmínky konvergence.........................................---- 63 4.2.2 Postačující podmínky konvergence . *....................................... 67 4.2.3 Asymptotický odhad chyby.............................----............... 76 4.2.4 Problematika aaokrouhlovacích chyb....................................... 86 4.2.5 Stabilita při pevném mtegrachím kroku .................................... 87 4.2.6 Optimální metody........................................................ 88 4.3 Užití lineárních mnohokrokových metod........................................ 96 4.3.1 Metody prediktor-korektor ................................................ 97 4.3.2 Volba integračního kroku...................-............................. 102 4.3.3 Změna integračního kroku................................................ 104 5 Porovnání mnohokrokových metod a Rungových-Kuttových metod .................. 105 6 Soustavy diferenciálních rovnic a problematika silného tlumení ...................... 108 6.1 Lineární mnohokrokové metody................................................ 108 6.2 Rungovy-Kuttovy metody..................................................... 109 6.3 Problematika řešení diferenciálních rovnic se silným tlumením .................. 109 Cvičení............................................................................... 117 Poznámky k literatuře................................................................ 118 Literatura............................................................................ 119 Kapitola II. Obyčejné diferenciální rovnice — okrajové úlohy .,............. 122 1 Úvod .............................................................................. 122 2 Metody založené na převodu na úlohy s počátečními podmínkami................... 125 2.1 Metoda střelby ................................................................ 125 2.1.1 Okrajová úloha pro lineární rovnici druhého řádu ......................... 125 7 OBSAH OBSAH 2.1.2 Obecná okrajová úloha............................................ 127 2.1.3 Obtíže spojené s metodou střelby ....................-................... 128 2.1.4 Střelba na více cílů............................•.....-...................* 130 2.2 Metoda přesunu okrajové podmínky ........................................... 131 2.2.1 Diferenciální rovnice druhého řádu .................*..................... 131 2.2.2 Obecná soustava lineárních diferenciálních rovnic ...................... .. . 138 2.2.3 Svázané a integrální okrajové podmínky .................................. 140 2.2.4 Obtíže spojené s metodou přesunu okrajové podmínky ..................... 141 2.3 Metoda normalizovaného přesunu.............................................. 142 2.3.1 Diferenciální rovnice druhého řádu ....................................... 142 2.3.2 Obecná soustava lineárních diferenciálních rovnic ......................... 156 3 Metoda sítí ........................................................................ 162 3.1 Monotónní matice ....................*........................................ I63 3.2 Lineární diferenciální rovnice druhého řádu.................................... 167 3.2.1 Sestavení diferenčních rovnic............................................- 167 3.2.2 Konvergence ............................................................. I78 3.2.3 Řešení vzniklých soustav lineárních rovnic................................ 190 3.3 Lineární diferenciální rovnice čtvrtého řádu........................•........... 195 3.3.1 Sestavení diferenčních rovnic............................................. 197 3.3.2 Konvergence............................................................. 200 3.3.3 Řešení vzniklých soustav................................................. 203 3.4 Nelineární diferenciální rovnice................................................ 204 3.4.1 Sestavení diferenčních rovnic a jejich řešitelnost........................... 207 3.4.2 Konvergence............................................................. 211 4 Variační metody................................................................... 213 4.1 Variační formulace okrajových úloh............................................ 214 4.1.1 Lineární diferenciální rovnice druhého řádu ............................... 214 4.1.2 Lineární diferenciální rovnice vyšších řádů .......................-........ 220 4-1-3 Jiné typy okrajových podmínek.......................................... 221 4.2 Základní přibližné metody.........................................• •.......... 222 4.2.1 Ritzova metoda ...............................................-......• - ■ ■ 222 4.2-2 Galerkinova metoda .............................................-........ 224 4.3 Metoda konečných prvků.................................................... 225 4-3.1 Aproximace po částech lineárními funkcemi............................... 226 4.3.2 Aproximace Hermitova typu.............................................. 230 4.3.3 Některé praktické otázky spojené s metodou končených prvků ............ 235 Cvičení..............----................................-.....•...................** ■ 237 Poznámky k literatuře.......................................................•........ 239 Literatura............................................................................ 240 Kapitola III. Parciální diferenciální rovnice eliptického typu ................ 242 1 Úvod .............................................................................. 242 2 Metoda sítí ........................................................................ 245 2.1 Lineární rovnice druhého řádu........................................<........ 245 2.1.1 Sestavení diferenčních rovnic............................................. 245 2.1.2 Přepis okrajových podmínek a konvergence vzniklých metod.............. 253 2.1.3 Metody zvýšené přesnosti, jiné tvary sítí................................. 265 2.2 Lineární rovnice čtvrtého řádu ..............................-.................. 266 2.3 Řešení vzniklých soustav lineárních rovnic..................................... 272 2.3.1 Přímé metody ........................................................... 274 2.3.2 Iterační metody........................................................ 377 2.4 Obecné otázky konvergence a odhadů chyb při metodě sítí ................... 286 2,4-1 Základní pojmy teorie diferenčních schémat.............................. 286 2.4.2 Obecné věty o konvergenci metody sítí................................... 288 3 Variační metody.........................................-......................... 292 3-1 Variační formulace okrajových úloh...........................................* 293 3.1.1 Diferenciální rovnice druhého řádu.....................................*• 293 3.1.2 Diferenciální rovnice čtvrtého řádu..............................-.......• * 297 3.1.3 Jiné typy okrajových podmínek, nehomogenní okrajové podrnmky ........ 298 3.2 Základní přibližné metody..................................................... 299 3-2.1 Ritzova metoda........................................................ 299 3.2.2 Galerkinova metoda...................................................... 300 4 Metoda konečných prvků........................................................... 301 4.1 Troj úhelníkové prvky.......................................................... 304 4,1.1 Lineární Lagrangeův prvek ............................................... 304 4.1-2 Kvadraticky Lagrangeův prvek........................................... 312 4.1.3 Kubický Lagrangeův prvek..................................... 315 4.1.4 Obecný Lagrangeův prvek................................................ 317 4.1.5 Hermitův prvek...............................................-.....----- 318 4.1.6 Prostory konečných prvků pro řešení diferenciálních rovnic čtvrtého řádu ... 319 4.2 Čtyř^elníkové prvky ----..................................................... 321 4.2.1 Obdélníkové Lagrangeovy prvky .................................-........ 321 4.2.2 Obdélníkové Hermitovy prvky .......................-......"............ 323 4.3 Algoritmické otázky spojené s metodou končených prvků....................... 323 Cvičení............................................................................... 324 Poznámky k literatuře...................................................*.......... 325 Literatura..................................................-----*................... 326 Kapitola FV. Parciální diferenciální rovnice parabolického typu ............. 330 1 Úvod .............................................................................. 330 2 Metoda sítí........................................................................ 331 2.1 Rovnice pro vedení tepla v jedné prostorové proměnné ........................- 332 2.1.1 Explicitní a implicitní metoda............................................ 332 2.1.2 Crankovo-Nicolsonovo schéma............................................ 341 2.2 Obecná parabolická rovnice v jedné prostorové proměnné ...................... 350 2.2.1 Odvození metody....................................................• • • • 351 2.2.2 Konvergence, speciální případy.....................................•..... 356 2.2.3 Konvergence, obecný případ..................................--.......... 359 2.3 Dvou- a vícedimenzionální parabolické rovnice.........................-....... 376 2.3.1 Základní metody ......................................................... 376 2.3.2 Metody střídavých směrů ................................-.......*....... 382 2.3.3 Lokálně jednorozměrné metody.........................................* ■ 386 3 Seinidiskrétní metody................................................-.....*....... 387 3.1 Metoda přímek........................................................ 38S 3.1.1 Klasická metoda přímek.................................................. 388 3.1.2 Numerovovametoda............................----................... 391 3.2 Semidiskrétní metody Galerkinova typu...................----................. 392 3.3 Metody Rotheova typu ........................................................ 400 Cvičení ............................................................................... 403 Poznámky k literatuře......................................................♦......... 404 Literatura ............................................................................ 404 Rejstřík .............................................................................. 407 8 9 předmluva Kniha, kterou dostává čtenář do rukou, si klade za cíl podat elementární a ne příliš rozsáhlý úvod do problematiky numerického řešení diferenciálních rovnic- Vznikla na základě mého dlouholetého působení jako učitele na matematicko-fyzikální fakultě Karlovy University, kdy moje přednáška tvořila (a dosud tvoří) tu část základního čtyřsemestrového kursu numerických metod pro posluchače specializace numerická matematika, která se týká diferenciálních rovnic. Obsah knihy je tedy v podstatě dán studijním plánem zmíněné specializace a zahrnuje základní metody pro řešení obyčejných diferenciálních rovnic (úloh s počátečními podmínkami i okrajových úloh) a parciálních diferenciálních rovnic eliptického a parabolického typu. Historicky vzniklo, že diferenciální rovnice hyperbolického typu nejsou zatím pojaty do základního kursu numerické matematiky, což tvoří jeden z důvodů, proč je čtenář nenalezne ani v této knize. Druhý důvod je ten, že chovám rovnic hyperbolického typu je natolik odlišné od chovaní eliptických a parabolických rovnic, že by se při jejich vyšetřování dalo užít jen velmi málo z ostatního obsahu knihy. Její rozsah by tedy vzrostl neúnosně. Určitou mezeru, která tak vznikne, bude třeba zaplnit teprve v budoucnosti. Kniha je rozdělena do čtyř kapitol. V první kapitole věnované problematice numerického řešení úloh s počátečními podmínkami pro obyčejné diferenciální rovnice se studují běžné lineární fc-krokové metody a obecné jednokrokové metody čítaje v to důležitý speciální případ metod Runga a Kutty. Kromě toho jsou zde pojednány také problémy spojené s řešením diferenciálních rovnic se silným tlumením. Obsah druhé kapitoly je tvořen základními metodami pro řešení okrajových úloh pro obyčejné diferenciální rovnice. Omezujeme se zde převážně na lineární problémy a jmenovitě jde o metody převodu na úlohy s počátečními podmínkami (metoda střelby, metoda přesunu okrajové podmínky), o metodu sítí a o základy variačních metod zejména pak o metodu konečných prvků. Kapitola třetí pojednává o metodě sítí a o základech metody konečných prvků pro řešení parciálních diferenciálních rovnic eliptického typu. Konečně v kapitole čtvrté si všímáme problematiky přibližného řešení parciálních diferenciálních rovnic parabolického typu. Zabýváme se zde metodou sítí a klasickými i variačními semidiskrétnímí metodami. Kromě toho je 11 PŘEDMLUVA ke každé kapitole připojen komentovaný seznam doporučené literatury čítaje v to samozřejmě ty publikace, které jsou v textu bezprostředně použity. Nesnažil jsem se přitom podat vyčerpávající výčet literatury, ale spíše ukázat studentu základní prameny, z nichž může rozšířit své znalosti. Už na začátku jsem uvedl, že kniha představuje elementární úvod do výše popsané problematiky. Rád bych k tomu dodal, že mně při jejím psaní šlo o to dát čtenáři základní orientaci zejména v teoretických otázkách spjatých se studovanými metodami. Měl jsem přitom na mysli ani ne tak podat co nejobecnější výsledky a co nejúplnější seznam stávajících metod, jako zdůraznit základní myšlenku příslušného postupu a užívat přitom co nejméně předběžných matematických znalostí. Skutečně k tomu, aby čtenář plně porozuměl celé knize, vystačí pouze s těmi nej-elementárnějšími pojmy a poznatky z lineární algebry a reálné analýzy (pojem vektoru, matice a lineárního prostoru, základní vlastnosti derivace a integrálu). Jen na několika málo místech se užívají některá speciálnější tvrzení z teorie funkcí komplexní proměnné. Kníhaje zaměřena tedy spíše teoreticky, proto i cvičení připojená k jednotlivým kapitolám jsou teoretická a slouží k hlubšímu porozumění vykládané látky. S tím souvisí i charakter konkrétních numerických příkladů, které v ní čtenář nalezne. Tyto příklady nejsou myšleny jako přímé vzory k řešení konkrétních praktických problémů — k tomu slouží, nebo by měla sloužit praktická cvičení přímo na počítači — ale jako ilustrace někdy i nečekaných jevů, s nimiž se lze v praxi za většinou podstatně složitějších okolností setkat. Mimoto slouží některé z těchto příkladů jako motivace k prováděným teoretickým úvahám. Závěrem je mou milou povinností poděkovat všem, kteří v té či oné míře přispěli k vytvoření této knížky. Jsou to zejména všichni moji kolegové z oddělení konstruktivních metod matematické analýzy Matematického ústavu AV CR a řada kolegů z katedry numerické matematiky matematicko-fyzikální fakulty Karlovy univerzity, kteří byli kdykoliv ochotni vést se mnou dlouhé diskuse o obsahu a zaměření knihy Jmenovitě bych rád uvedl prof. dr. Ivo Marka, člena korespondenta AV CR, který jako vědecký redaktor věnoval publikaci péči a pozornost daleko přesahující běžné zvyklosti. Dále pak vděčím svým přátelům RNDr. Petru Přikrylovi, CSc, a RNDr. Michalu Křížkovi, DrSc, kteří pečlivě přečetli celý rukopis a řadou připomínek přispěli ke zkvalitnění textu. Co nejvřeleji také děkuji Radě Fondu pro vydávání vědecké literatury AV ČR, jejíž subvence byla pro vydání knihy rozhodující. Manželům Šidákovým pak patří můj dík za nesmírně pečlivou přípravu matrice pro tisk, Konečně co nejupřímněji děkuji své ženě za oporu, kterou mně byla při psaní této knihy, a za trpělivost, se kterou znovu a znovu přepisovala náročný rukopis. Praha, leden 1989 Autor Kapitola I. Obyčejné diferenciální rovnice -úlohy s počátečními podmínkami 1 Úvod V této kapitole se budeme zabývat problematikou numerického řešení úloh s počátečními podmínkami pro obyčejné diferenciální rovnice. Úlohou s počátečními podmínkami pro soustavu m diferenciálních rovnic prvního řádu (í.i) V = 1/(*,'1».. ■■,"»), yV •-,"»). "V -"70*,ly,...,my) rozumíme úlohu nalézt m funkcí 1y,-.-,my proměnné x definovaných, spojitých a spojitě diferencovatelných v intervalu (a, b), které vyhovují rovnicím (1.1) a pro něž platí (1.2) 1y(í) = viM() = V2,---,my(í)^vm, kde tj = (iji,... ,Jjm)T je daný m-dirnenzionální vektor a £ pevně zvolený bod v intervalu {a,b). Často to bývá levý krajní bod daného intervalu, což také v dalším výkladu budeme předpokládat. Doplňující podmínky (1.2) kladené na řešení soustavy (1.1) se nazývají počáteční podmínky. Protože každou diferenciální rovnici m-tého řádu (1.3) ir-m) = f{x,y,y',...Jm-x)) lze psát po zavedení nových neznámých funkcí (1.4) 1y = y, 2y = W(= y1), S»«-V (=v"l 12 tm_1V (= s/m_1'), 13 i. obyčejné diferenciální rovnice - úlohy s počátečními podmínkami jako soustavu diferenciálních rovnic prvního řádu (i.5) V = 2v, je i tento typ rovnic zahrnut v případě (1.1). Při vyšetřování konkrétních metod se skoro všude omezíme na jednu diferenciální rovnici (16) !/-/(*,!/), x€{a,b) s počáteční podmínkou (1-7) V(a) = ■?■ Toto omezení není většinou nikterak podstatné. Přejdeme-li totiž k vektorovému zápisu a položíme-li (1.8) y = Cy,---,my)T, f = (1/,--,m/)T, můžeme soustavu (1.1) s počátečními podmínkami (1.2) psát ve tvaru (1.9) y' = f(*,y), y(0 = v- K přenesení výsledků, které zformulujeme pro případ rovnice (1.6) s počáteční podmínkou (1.7) na případ soustavy (1.1) s počátečními podmínkami (1.2) tedy stačí obvykle pouze předpokládat, že y v rovnici (1.6) je vektor a / vektorová funkce. Dále se omezíme na metody diskrétni, které spočívají v tom, že přibližné hodnoty hledané funkce hledáme pouze v nějaké diskrétní množině bodů x„ G (a, b), n = = 0, 1,...,N. Tyto body budeme volit pro jednoduchost převážně ekvidistantní, tj. položíme (1.10) xn=a + nh, n = 0,l, kde h je konstanta, kterou nazveme integračním krokem. Rovněž toto omezení se většinou snadno odstraní. Naproti tomu metody typu postupných (nebo Picardových) aproximací, které spočívají v tom, že se diferenciální rovnice (1.6) s počáteční podmínkou (1.7) nahradí ekvivalentní integrální rovnicí (1.11) y(x) = r)+ í f(t,y(t))át Ja 1 úvod a pro tuto rovnici se konstruují postupné aproximace předpisem (1.12) y„+i(x) = íj+ / f(t,yn(t))át, n = l,2,..., J a a které hrají významnou roli v teorii diferenciálních rovnic, ponecháváme stranou našeho zájmu. Důvod je ten, v že efektivitě nemohou konkurovat výše zmíněným diskrétním metodám. O pravé straně / diferenciální rovnice (1.6) budeme předpokládat všude v této kapitole, i když to nebudeme vždy znovu opakovat, že r(i) je definovaná a spojitá jako funkce dvou proměnných v pásu a £ x £ b, oo < y < oo (a, b jsou konečná čísla) a že | (ii) splňuje v tomto pásu Lipschitzovu podmínku vzhledem k y s konstantou nezávislou na x, tj. že existuje konstanta L taková, že platí (1.13) pro každé x £ (o, 6) a pro libovolná y a z. K splnění této podmínky stačí např., aby ve zmíněném pásu měla pravá strana dané diferenciální rovnice omezenou první parciální derivaci podle y, jak plyne ihned z věty o střední hodnotě. To je splněno zejména v případě lineární diferenciální rovnice. Globální předpoklady o pravé straně dané diferenciální rovnice, které jsme zformulovali, zaručují, jak hned ukážeme, existenci a jednoznačnost řešení úlohy (1.6), (1.7) v celém intervalu (a, b), zatímco obvyklé lokální předpoklady, které se uvádějí ve většině příruček o teorii obyčejných diferenciálních rovnic, zaručují existenci řešení pouze lokálně. Uvedené předpoklady nás tedy ušetří úvah, zda v té části intervalu, do níž jsme dospěli s přibližným řešením, ještě řešení existuje apod. Na druhé straně je však předpoklad (1.13) značně silný a často se tedy v praktické situaci stane, že není splněn. To však není tak tragické, jak se může na první pohled zdát, neboť numericky většinou řešíme takové diferenciální rovnice, o nichž už předem máme k dispozici nějakou informaci umožňující odhadnout polohu hledaného řešení. Pak už obvykle snadno změnou definice dané pravé strany v těch částech pásu o ž x £ 6, —oo < y < oo, kde řešení zaručeně neleží, dosáhneme splnění předpokladu (ii). Další důležitá přednost předpokladů (i), (ii) souvisí s tím, že u všech metod, které uvedeme, bude v příslušném algoritmu nutno vypočítávat hodnoty f(x,y), kde x bude ležet v intervalu (a, b), avšak hodnotu y nebudeme mít možnost předem odhadnout. Předpoklad, že funkce / je definována pro libovolné y, teoretické zkoumání takové metody značně zjednoduší. Jako nejjednodušší příklad metody, kterou máme na mysli, uveďme tzv. Eule-rovu metodu, ve které přibližné hodnoty yn řešení y{x) diferenciální rovnice (1.6) 14 15 i. obyčejné diferenciální rovnice úlohy s počátečními podmínkami v bodech x — xn daných rovnicí (1.10) počítáme z rekurence (114) S/o = ij, Vn+l = yn +hf(xn,yn), n = 0,l,...,xne {a,b}. Zavedení této metody je motivováno geometricky. Geometricky řečeno udává totiž diferenciální rovnice (1.6) v pásu a í x ^ b, —oo < y < oo směrové pole. Nalézt její řešení splňující danou počáteční podmínku (1.7) značí tedy nalézt křivku, jejíž graf prochází bodem (0,57) a má v každém svém bodě směrnici určenou tímto směrovým polem. Eulerova metoda v této interpretaci tedy značí aproximaci hledané křivky lomenou čarou procházející body (ar,-, j/,), i = 0,1,..., přičemž směrnice úseček, které ji vytvářejí, souhlasí se směrovým polem vždy v levém krajním bodě. Z praktického hlediska je jistě rozumné žádat, aby přibližné řešení y„ získané danou metodou konvergovalo v nějaké vhodném smyslu při zmenšování integračního kroku k přesnému řešení y dané úlohy. Tento požadavek totiž aspoň teoreticky zaručí, že řešení úlohy (1.6), (1.7) lze získat s libovolnou přesností volbou dostatečně malého h. Zavedeme-li tedy tzv. celkovou diskretizační chybu e„ rovnicí en = yn — — y{xn), bude její chování jako funkce integračního kroku h důležitou charakteristikou dané metody. Zdůrazněme, že chování celkové diskretizační chyby při h —> 0 je třeba vyšetřovat při pevném xn = x E {a, b), neboť jen tak udává tato veličina velikost chyby, které se dopouštíme při aproximaci hodnoty přesného řešení v bodě x. Vzhledem k rovnici x„ = a + nh to má ovšem za následek, že při zvoleném x probíhá integrační krok nikoliv spojitou, ale diskrétní množinu, a to těch hodnot h, pro něž je (x — a)/h celé číslo; při /i->0 musí tedy platit n —► 00, Konvergenční vlastnosti celkové diskretizační chyby budeme vyšetřovat na různé úrovni. Podaří-li se dokázat, že pro h —* 0 a xn = x platí e„ —> 0, mluvíme o prosté konvergenci. Nalezneme-li funkci 0 a x„ = x, řekneme, že jsme zjistili rychlost konvergence. Zápis e„ = 0(ip(h)) totiž znamená, že existuje konstanta M taková, že pro malá h a pro n definovaná rovnicí xn — x platí |e„| í Mtp{h). Chyba tedy konverguje k nule nejméně tak rychle jako známá funkce 0 pro h —> 0. Konečně, podaři-li se nalézt funkci T? takovou, že platí e„/rj(h) -» 0 pro h —► 0 a xn = x, mluvíme o funkci rj jako o asymptotickém odhadu chyby. Ze všech právě uvedených informací o chovám chyby se zdá být na první pohled nejužitečnější odhad chyby, neboť jen on umožňuje volit předem velikost integračního kroku tak, aby chyba, které se dopustíme, nepřesáhla předepsanou hodnotu. V dalším však uvidíme, že tato úvaha vede skoro vždy k zbytečně malým integračním krokům, takže ji z praktických důvodů nelze většinou použít. Proto znalost rychlosti konvergence nebo asymptotického chování chyby poskytuje často podstatně více prakticky použitelné informace o dané metodě než odhad chyby. Pro získání představy o celkové diskretizační chybě bývá mnohdy užitečné znát 16 I ÚVOD tzv, lokální diskretizační chybu dané metody. Rozumíme jí chybu, které se dopustíme tím, že provedeme jeden krok dané metody a předpokládáme, že všechny hodnoty, které k jeho realizaci potřebujeme, jsou přesné. V konkrétním případě Eulerovy metody je tedy lokální diskretizační chyba dána výrazem (1.15) L(y(x);h) = y(x + h)-y(x)-hf(x,y(x)), kde y je přesné řešení dané diferenciální rovnice. I lokální diskretizační chyba se většinou vyjadřuje jako funkce integračního kroku. Při numerickém řešení diferenciální rovnice se dopouštíme lokální diskretizační chyby v každém kroku, a celková diskretizační chyba je tedy výsledkem nakupení lokálních diskretizačních chyb. Přitom je třeba brát navíc v úvahu, že každý krok vychází z hodnot, které už jsou zatíženy chybou z předešlého výpočtu. Je tedy žádoucí, aby daná metoda měla tu vlastnost, že při jejím užití nedochází ke katastrofální akumulaci lokálních diskretizačních chyb. O metodách, u nichž tomu tak je, se obvykle mluví jako o stabilních metodách. Pojmů stability je přitom řada; některé z nich v dalším rovněž vyšetříme. Při všech předchozích úvahách jsme mlčky předpokládali, že přibližné řešení splňuje rovnici Eulerovy metody (nebo rovnice složitější metody) přesně. Tak tomu v důsledku toho, že aritmetické operace jsme schopni provádět pouze s konečným počtem čísel o konečném počtu cifer, samozřejmě není a místo veličiny yn vypočteme veličinu y„, která splňuje rovnici (1.14) pouze přibližně. Celková chyba přibližného řešení, které dostaneme jako výsledek konkrétního výpočtu, se tedy skládá ze dvou částí: celkové diskretizační chyby e„ a z veličiny rn = j/„ — y„, kterou nazveme celkovou zaokrouhlovací chybou. Mají-li být naše znalosti o dané metodě uspokojivé, musíme mít představu i o chování této zaokrouhlovací chyby. Všechny právě zmíněné aspekty budeme mít na mysli při vyšetřování konkrétních metod v dalších článcích této kapitoly. Začneme přitom podrobným vyšetřením Eulerovy metody, ne ani proto, že bychom ji nějak zvlášť doporučovali pro praktické počítání — v efektivitě nemůže většinou soutěžit s důmyslnějšími metodami, jak uvidíme — ale hlavně proto, že mnohé charakteristické postupy použitelné i u složitějších metod, jsou u ní snadněji patrné, protože nejsou tolik zastřeny komplikovaným zápisem. Protože však Eulerovu metodu použijeme v důkazu slíbené existenční věty, zformulujeme jednu její jednoduchou vlastnost už zde. Začneme pomocným tvrzením, které bude užitečné i v dalších článcích. Lemma 1.1. Buďte A a B nezáporné konstanty a nechť pio posloupnost čísel 0, pro L 0 c= max |/(z,0)|. TE{a,h) Důkaz Předně si všimněme, že číslo c definované rovnicí (1.21) je konečné, neboť z předpokladu (i) plyne, že funkce |/(-, 0)| je spojitá na kompaktní množině. Z (1.14) plyne ihned, že platí (1-22) \yn+i\é Ifcl+ *[/(*«. Z předpokladu (ii) a trojúhelníkové nerovnosti dostáváme (1.23) \f{xn,yn)\ \f(xn,0)\á\f(*n,yn)-f(XnMáL\Vn\, neboli (1.24) l/(a»,!fe)ái|tt.! + l/(*».0)|á£|ftl| + c, n = 0, ..,N, neboť je xn 6 (a,b). Dosadíme-li tento výsledek do nerovnosti (1.22), máme (1-25) \yn+1\í(l + hL)\yn\ + ch a z lemmatu 1.1 plyne, že platí (1.26) pro L > 0 a (1.27) \yn\š\r,\ + nhc pro L — Q. Použijeme-li nyní zřejmé nerovnosti l+/i£ S ehL a faktu, že nh - xn -— a ž b - a, dostáváme požadovaný výsledek ihned z nerovností (1.26) a (127). 18 |ft.| á (1 + hL)"\V\ + {1 + h^" 1ke 1 úvod Nyní už se dostáváme k formulaci slíbené globální existenční věty. Věta 1.1. Nechť pravá strana f diferenciální rovnice (1.6) splňuje předpoklady (i) a (ii) a nechť rj je libovolné reálné číslo. Pak existuje jediná funkce y, pro niž platí (i) y je definována a spojitá v intervalu (o, b), (ii) y je spojitě diferencovatelná v {a,b) a platí {/(x) = f(x,y(x)) pro každé x e (a,b), (iii) j/(o) = f). Důkaz. K důkazu existence řešení použijeme, jak už jsme se zmínili v předchozím textu, Eulerovu metodu. Označme k tomu cíli symbolem H libovolnou posloupnost kladných čísel h takových, že h ~► 0 a že (& — a)/h je celé číslo a uvažujme posloupnost ya,.. ■, yN {N — (b — a)/ft) získanou Eulerovou metodou (1-14) s integračním krokem h £ //. Přiřaďme dále této posloupnosti (a tedy vlastně integračnímu kroku h £ H) spojitou funkci tak, že její graf je lomená čára složená z úseček spojujících body (x„, yn), n = 0,..., N- Je tedy (1.28) Vh(x) = yn + f(xn,yn)(x - xn) pro n =: 0,... ,N — 1 a pro x„ ^ x í 3ľ„+i. Protože podle lemmatu 1.2 platí, že je \Vn\ = Y pr0 n — 0, - . iV a číslo Y nezávisí na h, je právě zavedená posloupnost funkcí {i//,; h £ H} stejnoměrně ohraničená. Dále, každá funkce jft je po částech diferencovatelná a platí < x < xn+1. 0, ,N-l. (1.29) y'h(x) = f(xn,yn), Položíme-li nyní (1.30) R={(*,y);ašxZb,\y\ŠY}, je R kompaktní a funkce / je na ní vzhledem k předpokladu (i) ohraničená. Pro každé h & H a. pro každé x e x„, n — 0,..., N tedy platí (1.31) kde M- max \f{x,y)\. (1.32) Odtud ihned dostávame, že pro libovolná x, x* e (a, b) platí (1.33) \yh(x)-yh(x*)\ = \ f y'h(t)dtU M\x* - x\. I Jx Posloupnost {j/j,; h e w} je tedy na intervalu (u, b) nejen stejnoměrně ohraničená, ale i stejně spojitá. Podle Arzelovy-Ascoliovy věty tedy existuje množina H" C H taková, že posloupnost {t//,; h £ H*} je stejnoměrně konvergentní. Označme její limitu y. Je to zrejme spojitá funkce, pro niž platí y(x) — n. Dokazme ještě, že 19 E. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI splňuje danou diferenciální rovnici. Abychom toho dosáhli, uvědomme si nejprve, že platí (1.34) S/n = 1 + h Y^, f{x»,Vv), n = 0,1,..., xne{a,b), jak plyne ihned z rovnic (1.14). Zvolme dále pevně x £ (a, b) a při fixovaném h É E H* určeme přirozené číslo n = n(h, x) tak, aby platilo xn^1 < x š xn. Z definice funkce plyne, že platí (1.35) =0 a-a K=0 n-1 ů hL ^2 \Vh(x") ~ V{*v)\ ů(t>- "}L max \yh(x) - y(x)\ -> 0 pro h —f 0, h £ H*. Dále zřejmě platí (1-36) f f{t,y{t))At pro 1 -» 0, t E Jř*, neboť pro —> 0 bod i„ konverguje k bodu x. Přejdeme-li tedy v (1.34) k limitě pro h —> 0, h £ H*, dostáváme (1.37) y(x) = v+ f f(t,y{t))át. J a Z rovnice (1.37) však už bezprostředně plyne, že funkce y je diferencovatelná a že splňuje danou diferenciální rovnici. Abychom dokázali jednoznačnost, předpokládejme, že existují dvě řešení y a, z. Z podmínky (ii) bezprostředně plyne, že je (1.38) \y{x) - *(B)| < L f \y(t)-z(t)\dt. Ja Rozdíl y —z jena, intervalu (o, b) zřejmě spojitý, a proto existuje konstanta Mo tak, že platí (1.39) max \y(x) z{x)\ = MB. Dosadíme-li do nerovnosti (1.38) z (1.39), dostáváme (1-40) \y{x)-z(x)\ 0 takové, že by platilo (1.43) max \yh{e) - y(x)\ ž E0, h £ H, Stejně jako v důkazu věty 1.1 se nyní dá ukázat, že musí existovat H* C H tak, že posloupnost {j/„; h £ H*} je stejnoměrně konvergentní. Limitní funkce je však řešením dané diferenciální rovnice, jak plyne opět z důkazu věty 1.1. Vzhledem k nerovnosti (1.43) je toto řešení nutně různé od řešení y, což odporuje jednoznačnosti. Tato poznámka tedy dává vlastně odpověď na otázku konvergence Eulerovy metody. V následujícím odstavci dokážeme konvergenci Eulerovy metody ještě jednou, a to poněkud jiným způsobem. Tento postup bude vhodnější k bezprostřednímu přenesení na obecnější případy, k jeho realizaci však bude třeba existenci řešení úlohy (1.6), (1.7) předpokládat. 2 Eulerova metoda Jak už jsme se dohodli v úvodu, budeme všude v této kapitule předpokládat, že pravá strana dané diferenciální rovnice splňuje předpoklady (i) a (ii) z prvního odstavce, takže řešení problému (1.6), (1.7) existuje a je jediné. Vyšetřování Eulerovy metody začneme přesnou definicí pojmu konvergence, i když je tento pojem z předešlého textu intuitivně jasný, Definice 2.1. Řekněme, že Eulerova metoda je konvergentní, jestliže pro každé x £ (a, b) platí (2.1) lim yn - y(x), h—*0 xn—x 21 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI 2 EULEROVA METODA kde yn je přibližné řešení získané z rovnic (1.14) při integračním kroku n a jí je přesné řešení. Limitní přechod ve vzorci (2.1) je přitom nutno chápat tak, že současně h —> —> 0 a n —► co tak, že platí x„ = a + nh — x. Jak už jsme upozornili dříve, je limitní přechod v rovnici (2.1) diskrétní, neboť při pevně zvoleném x bereme v úvahu jen ta h, pro něž platí, že (x — a)/h je celé číslo. Tohoto omezení je možné se zbavit tak, že při zmíněném limitním přechodu požadujeme platnost podmínky xn —* x. Za n v (2.1) je pak třeba vzít, např. celistvou část podílu {x — a)/h. Než zformulujeme konvergenční větu pro Eulerovu metodu, připomeneme pojem modulu spojitosti spojité funkce, který se zavádí v matematické analýze jako kvantitativní charakteristika stejnoměrně spojitých funkcí. Definice 2.2. Buď (p funkce spojitá na uzavřeném intervalu (a, b). Pak funkci OJif, definovanou pro nezáporná 6 předpisem (2.2) uv(S) ~ sup \0 g nhu(h), L = 0, neboť e0 — 0. Z nerovností (2.12) a ze zřejmé nerovnosti 1 + hL < ehL (kterou jsme v podstatě ve stejné souvislosti ostatně užili v důkazu lemmatu 1.2) už tvrzení věty plyne bezprostředně. Věta je dokázána. Vzhledem k tomu, že funkce El je na konečném intervalu omezená, plyne z této věty konvergence Eulerovy metody. Je třeba poznamenat, že věta 2.1 nedokazuje v té podobě, jak je formulována, skutečně nic víc než pouhou konvergenci, i když nerovnost (2.4) má formálně tvar odhadu chyby. O funkci u, která v této nerovnosti vystupuje, totiž víme pouze, že existuje a že pro /i-»0 konverguje k nule, avšak zmíněná věta nic neříká o jejím konkrétním tvaru. Aby nerovnost (2.4) byla skutečným odhadem chyby, museli bychom být schopni popsat (nebo odhadnout) funkci u na základě vstupních dat dané úlohy. Pokusme se tedy o to, V lemmatu 2.1 jsme zjistili, že pro každé přibližné řešení y„ získané Eulerovou metodou platí \yn\ i Y', kde konstanta Y je dána vztahem (1.19). Z důkazu věty 1.1 však plyne, že tentýž odhad platí i pro přesné řešení rovnice (1.6) s počáteční podmínkou (1.7). Definujme pro nezáporná s funkci £2 vztahem (2.13) íl(í)= sup \f{x,y) - }(x*,y)\, |í-x'|£4 23 lim ílfí) = 0. Í-.0+ I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI kde R je obdélník definovaný rovností (1.30). Protože / je spojitá v Ji a Ä je kompaktní množina, je / stejnoměrně spojitá na R, což implikuje, že platí (2.14) Buďte nyní x, x* libovolné dva body z intervalu (a,b), pro něž platí \x - x'\ í í h. Protože je vzhledem k tomu, co jsme řekli výše, y(x)\ á Y, \y(x*)\ 5 Y je (x,y(x)) e ji, (**,»(**)) e R-Platí tedv (2.15) \y'{x) - = \f(x,y{x)) - f(x*,y(x*))\^ š\f{x,y(x)) f{x\y(x))\+ + \f(x',y(x)) -/(*',y(**))\S ^Q{h) + L\y(x)-y{x')\. Pro rozdíl y(x) — y(x*) však platí podle věty o střední hodnotě odhad (2.16) \y(x)-y(x*)\ = \y'(0\\*-**\ = = \f(t,y(Í))\\z-*'\ÚMh, kde bod £ leží mezi body x a i* a M je konstanta definovaná vztahem (1.32). Dqsadíme-li tedy (2.16) do (2.15), dostáváme pro funkci ui z věty 2.1 odhad (2.17) u(h)ÍQ(h) + LMh a z nerovnosti (2.4) nerovnost (2.18) \yn - y[xn)\ $ [fi(A) + LMh]EL{xn - a), která už je odhadem chyby. Počítat funkci fí je vsak velice nepohodlné a často prakticky vůbec neproveditelné. Praktická cena odhadu (2.18) je tedy značně problematická. Pokusme se proto nalézt použitelnější odhad než (2.18) za cenu, že zesílíme předpoklady na danou úlohu. Věta 2.2. Nechť jsou splněny předpoklady (i) a (ii) a nechť přesné' řešen/rovnice (1.6) určené' počáteční podmínkou (1.7) má v intervalu {a, b) dvě spojité derivace. Buď M(x) = i max \y"(t)\. «6( (2.19) Pale platí (2.20) líh, - »(a„)| g hM(xn)EL(x„ -a), n =» 0,.. -, N, přičemž význam symbolů yn, N a EL je stejný jako ve větě 2.1. Důkaz. Zvolme h > 0 pevně a buď n libovolné pevně zvolené přirozené číslo takové, že je xn £ (o, 6). Ze vzorce (2.9) je zřejmé, že pro m - 0, (2.21) |em+1| S (1 + hL)\em\ + \L(y{xm); h)\. 24 , n — 1 platí 2 EULEROVA METODA Z Taylorova vzorce plyne, že pro tatáž m existují čísla 0m, 0 < 9m < 1, tak, že platí (2-22) £(»(»»); A) = V(»» + í>mA). Pro m = 0,..., n — 1 však platí podle definice funkce JW (2-23) jiftVízm + ímA)| g n2M(z„). Tedy celkem (2.24) |em+i| á (1 + AX)|em| + M(ar„)^2, m = 0,..., n - 1. Odtud dostáváme podle lemmatu 1.1, že pro m = 0.....n platí (2.25) (1+AX)" h L -h2M(x„), L > 0, g m/í2M(2„), X = 0. Položíme-li zde speciálně m = n a užijeme už dříve několikrát užitou nerovnost 1 + AX < ehL, dostáváme nerovnost (2.20). Věta je dokázána. Věta 2.2 odpovídá vlastně na dvě otázky týkající se konvergence Eulerovy metody. Známe-li funkci M(x), představuje vzorec (2.20) odhad chyby. Víme-li jen, že tato funkce existuje, říká vzorec (2.20), že rychlost konvergence Eulerovy metody je h. Poznamenejme, že žádným dalším zvyšováním požadavků na hladkost řešení dané diferenciální rovnice nelze obecně docílit vyšší rychlosti konvergence. Skutečně, řešíme-li Eulerovou metodou např. diferenciální rovnici y1 = 1x s počáteční podmínkou s/(0) = 0, jejíž přesné řešení y (= x2) je dokonce analytické, snadno vypočteme, že platí yn - y(xn) = -x„h. Uveďme ještě, jak lze jednoduše odhadnout funkci M z věty 2.2. Za předpokladu, ře pravá strana dané diferenciální rovnice má v obdélníku R daném vztahem (1.30) spojité parciální derivace podle x ay, platí zřejmě (2.26) 2M{x)ú max \fx + fyf\. (Symboly fx a fy zde značí parciální derivace podle x a y.) Před uvedením jednoduchého příkladu ilustrujícího výsledky, ke kterým jsme do této chvíle dospěli, uveďme ještě jednu větu, která bude v dalším užitečná. Věta 2.3. Nechť platí tatáž označení jako ve větě 2.2 a nechť jsou rovněž splněny předpoklady této věty. Buď dále posloupnost yn, n = 0,..., N definována lekurencl (2.27) ij0=n Ôn+i = yn + hf{xn,yn) + enCh2, n = 0, .,JV-1, ide C je konstanta a Sn jsou libovolná reálná čísla, pro něž platí n = 0,...,N- 1. Pak platí í 1 pro (2.28) \5n -y(x„)\ S h[M(xn) + C]EL(xn a), n s* 0,..., JV, 25 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Důkaz této věty je zřejmý a je v podstatě opakováním důkazu věty 2.2. Jediný rozdíl je v tom, že na pravé straně nerovnosti (2.21) vystupuje navíc člen 9nCh2, který se snadno majorizuje výrazem Ch2. Věta 2.3 vlastně říká, že k přesnému řešení dané diferenciální rovnice konverguje nejen přibližné řešení získané Eulerovou metodou, ale i řešení, které vznikne tak. že se v každém kroku Euterovy metody dopustíme navíc chyby velikosti A2. Je to důsledkem skutečnosti, které si pozorný čtenář už jistě všiml, a která spočívá v tom, že akumulací lokálních chyb se ztratí jeden řád (měřeno mocninou integračního kroku h). Příklad 2.1. Řešme Eulerovou metodou v intervalu (0,5) diferenciální rovnice y1 = y, resp. ý = -y, obě s počáteční podmínkou y(0) = 1. Přesná řešení jsou tedy funkce e', resp. e-*. Lipschitzova konstanta L je v obou případech rovna jedné a 2M(i) = e", resp. 1M{x) = 1, takže výrazy he*"(ec- - l)/2, resp. h(cŕ" - l)/2 představují odhad chyby ve smyslu věty 2.2. Výsledky jsou pro integrační krok h — 1/64, uspořádány v tab. 2.1 a 2.2 a nejsou příliš uspokojivé, neboť získané odhady jsou velmi pesimistické. Tak např., chceme-li vypočítat e-5 s chybou, která nepřevýší 10"3, je podle odhadu nutno vzít h tak, aby platilo ri(e5 l)/2 ^ 10_J, tj. h á 1/73707; ve skutečnosti stačilo h = 1/64. Tabulka 2.1 Přibližné řešení diferenciální rovnice y' — y Xn 1 2 3 4 5 !ín 2,69735 7,27567 19,62499 52,93537 142,7850 e,i -0,02093 -0,11339 -0,46055 -1,66278 -5,6282 odhad en 0,03649 0,36882 2,99487 22,86218 170,9223 Tabulka 2-2 Přibližné řešení diferenciální rovnice y' - -y x„ 1 2 3 4 5 Wn 0,364987 0,133215 0,048622 0,017746 0,006477 £n -0,002892 -0,002120 -0,001165 -0,000570 -0,000261 odhad en 0,013424 0,049914 0,149106 0,418735 1,151666 Tento jev, i když jsme jej ukázali pouze na zcela triviálních příkladech, je pro odhady typu (2.20) typický a představuje silně limitující faktor pro jejich praktické použití. Je tedy velmi žádoucí mít k dispozici jinou možnost, pomocí níž by bylo 2 EULEROVA METODA Tabulka 2.3 Závislost chyby na inte^ačním kroku Vn en ř»_1e„ 1 0,250000 -0,117879 -0,235758 2 0,316406 -0,051473 -0,205893 3 0,343609 -0,024270 -0,194164 6 0,364987 -0,002892 -0,185147 7 0,366438 -0,001441 -0,184540 8 0,367160 -0,000719 -0,184239 možné učinit si o chybě realističtější představu. Abychom jeden takový postup získali, začneme opět jednoduchým příkladem. V tab. 2.3 je ukázána závislost výrazu en/h na integračním kroku v případě diferenciální rovnice y1 = -y s počáteční podmínkou j/(0) = 1. Z předešlého výkladu víme, že tento výraz je při h —► 0 a při xn = x ohraničený. Z tabulky se však zdá, že tento výraz je nejen ohraničený, ale že má dokonce při h —► 0 limitu. Kdyby tomu tak bylo a kdybychom tuto limitu znali, dávala by nám pro malá h asi daleko lepší představu o skutečné chybě než uvažovaný maximalistický odhad. Následující věta ukazuje, že za vhodných předpokladů zmíněná limita skutečné existuje. Věta 2.4. (Asymptotický vzorec pio chybu.) Nechť jsou splněny předpoklady (i) a (ii) a nechť navíc má pravá strana f dané diferenciální rovnice spojité první a druhé parciální derivace podle obou proměnných v množině R definované rovnicí (1.30) . Pat celková diskretizační chyba en přibližného řešení vypočteného Eulerovou metodou se dá psát ve tvaru (2-29) e„ = e(xn)h + 0(h2), kde funkce e je řešením diferenciální rovnice (2-30) e' = fy(x,y{x))e-íy"(x) s počáteční podmínkou e(a) — 0. Důkaz. Z předpokladů o hladkosti funkce / plyne, že přesné řešení dané diferenciální rovnice má v intervalu (a, b) tři derivace spojité. Z Taylorova vzorce tedy plyne (2.31) y(xn+l) = y(xn) + hy'(xn) + §ftV(*») + ^V'(U kde bod leží mezi body xn á rn+1. Odečtením této rovnice od (1.14) dostáváme (2.32) e„+1 = e„ + h[f(xn,yn) - f(xn,y(xn))] - \h2y"{xn) - |ftV"(f»). 26 27 i. obyčejné diferenciální rovnice - úlohy s počátečními podmínkami Protože je e„ = yn — y(x„), můžeme v rozdílu v hranaté závorce na pravé straně poslední rovnice psát y(xn) + e„ místo y„ a opět podle Taylorova vzorce máme, že (2.33) f(xn,yn) - f(xn,y(x„)) = fy [xn, y(x„))en + \fyy{xn, y")t%, kde bod y* leží mezi body yn a y(xn). Zaveďme nyní veličinu ě„ — en/h. Podle věty 2.2 je \ě„\ á M(xn)E[,(xn — a), a protože jak funkce M, tak funkce El jsou na intervalu (a,b) omezené, existuje konstanta C\ taková, že platí (2.34) |ě„|áCi- Dělíme-li rovnici (2.32) integrační krokem a použijeme-li rovnici (2.33), dostáváme (2.35) ě„+i = e„ + hfy (i„, y(x„))ěn + \h2fss(xn, y*)ě*- - i V(*„) " |k V(í-.) neboli (2.36) e„+i = ě„ + h[fy(xn,y{xn))ěn \y"{xn)\ + k2rnt kde jsme položili (2-37) rn = ífyy(xn,y')ěl~íy'"(ín) Přitom existuje konstanta Ci taková, že platí (2.38) \rn\ŠC2. Na rekurenci (2.36) se tedy můžeme dívat jako na Eulerovu metodu pro řešení diferenciální rovnice (2.30) s počáteční podmínkou e(a) = 0 (neboť je eo = 0), kde se v každém kroku dopouštíme navíc chyby, která nepřevýší Cítí1. Vzhledem k předpokladům o hladkosti funkce / má pravá strana rovnice (2.30) spojité parciální derivace podle x a e; její řešení má tedy dvě spojité derivace. Podle věty 2.3 tedy platí (2.39) |fc_1c„ -e(x)\£hC3ELl(xn a), kde (2.40) C3 = h max \e"(x)\ + C2, li = max \f3(x,y(x))\. iě(«,Í)) T£{a,b} Věta je dokázána. Ilustrujeme právě dokázanou větu opět jednoduchým příkladem. Příklad 2.2. Řešme diferenciální rovnici y1 = —y s počáteční podmínkou y(0) = 1. V tomto případě je y(x) — e~", fy(x,y(x)) — —1, y" = e-*, a tedy e(x) = —xe~*/2. V tabulce 2.4 je uveden průběh funkce he(xn) pri h - 2-6. Je z ní vidět velmi dobrá shoda skutečné chyby s hodnotou he(xn), takže znalost funkce e (tj. znalost asymptotického chování celkové diskretizační chyby) může být velice cenná. 2 eulerova metoda Tabulka 2.4 Asymptotický odhad chyby 1 2 3 4 5 Cn -0,002892 -0,002120 -0,001165 -0,000570 -0,000261 he[xn) -0,002874 -0,002114 -0,001167 -0,000572 -0,000263 odhad met. pol. kroku -0,002902 -0,002123 -0,001165 -0,000568 -0,000260 Určení funkce e podle věty 2.4 však vyžaduje nutnost řešení další diferenciální rovnice, v níž navíc vystupuje hledané řešení, tj. neznámá funkce. Tato obtíž se sice dá za určitých okolností obejit; my však nyní ukážeme jiný postup ocenění celkové diskretizační chyby, který se sice také opírá o větu 2.4, zužitkovává však přímo pouze její existenční část. Mějme dán pevně bod x G (o,t) a značme pro tuto chvíli symbolem y[x\h) přibližné řešení v bodě z získané Eulerovou metodou s krokem h (který musí samozřejmě být takový, že (x—a)/h je celé číslo). Jsou-li splněny předpoklady věty 2.4, platí (2.41) y(x;ft) = y(x) + e(x)h + 0(h2). Píšeme-li zde A/2 místo h, dostáváme (2.42) y(x; h/2) = y(x) + \e(x)h + 0(ň2). Odečteme-li rovnici (2.42) od rovnici (2.41), máme (2.43) y{x; h) - y(x; h/2) - \e(x)h + 0(h2), a tedy pro chybu přibližného řešení platí (2.44) y(x;h) - y(x) = 2[y(x;h) - y(x; h/2)] + 0(h2). Až na veličiny vyššího řádu lze tedy získat velikost celkové diskretizační chyby tak, že přibližné řešení vypočteme dvakrát se dvěma různými integračními kroky. I když není zřejmě nutné, aby v právě popsaném postupu byl jeden z užitých integračních kroků polovina druhého, je tento případ nejčastější, a proto se tomuto způsobu ocenění chyby Často také říká metoda polovičního kroku. V tab. 2.4 jsou uvedeny hodnoty chyby získané touto metodou. Opět vidíme velmi dobrou shodu se skutečností. Je však třeba důrazně upozornit, že vzorec (2.44) platí pouze asymptoticky, tj. až na veličiny vyššího řádu, a proto je třeba při jeho užití zachovávat jistou opatrnost. Poznamenejme ještě, že výraz 2[ji(x; h) — y(x; h/2)] (a také výraz e(x)h), který se rovná až na veličiny vyššího řádu celkové diskretizační chybě, se alternativně nazývá hlavní část celkoví diskretizační chyby. Uveďme také, že vzorec (2.44), který je 28 29 i. obyčejné diferenciální rovnice - úlohy s počátečními podmínkami možné sestavit až na základě provedeného výpočtu, je příkladem tzv. aposteriorního odhadu na rozdíl od apriorního odhadu, který je dán už pouhými vstupními daty dané úlohy (srv. např. odhad v větě 2.2). Poslední otázka spojená s Eulerovou metodou, kterou zde stručně objasníme, je otázka ovlivnění přibližného řešení zaokrouhlováním. Jak už jsme uvedli v úvodu, v důsledku zaokrouhlování vypočteme místo veličiny yn veličinu yn a naším úkolem je učinit si představu o velikosti rozdílu rn = yn — Vn, který nazveme celkovou zaokrouhlovací chybou. Předpokládejme k tomu cíli, že veličiny yn splňují rovnice (2.45) S/o = r). yn+i -ýn + hf(xn,y„) + e„ 0,...,JV-1. Veličina sn vyskytující se v těchto rovnicích je mírou nepřesnosti, které se dopustíme při výpočtu veličiny yn+i za předpokladu, že yn je zadáno přesně a je ovlivněna zejména tím, s jakou přesností jsme schopni vypočítat součet v (2.45). Je tomu tak proto, že integrační krok h je většinou malé číslo, takže chyba, se kterou vypočteme funkční hodnotu pravé strany dané diferenciální rovnice, se tolik neprojeví. Z těchto důvodů je rozumné nazvat veličinu en lokální zaokrouhlovací chybou apředpokládat o ní, že je v průběhu výpočtu omezená. Všimněme si ještě, že rovnice (2.45) obsahují předpoklad, že počáteční podmínka je zadána přesně. Tento předpoklad není na újmu obecnosti, jak bude dále na první pohled vidět, a je činěn v podstatě pouze z pohodlí, abychom si v dalším ušetřili psaní. I o dalším předpokladu, který je v (2.45) obsažen implicitně, je třeba se zmínit. Je to předpoklad, že jak bod a. tak body x„ jsou zadány bez zaokrouhlovacích chyb. V praxi je splnění takovéhoto předpokladu zřejmě snadno dosažitelné, Odečteme-li od rovnic (2.45) rovnice (1.14), zjistíme, že pro celkovou zaokrouhlovací chybu platí (2.46) r„+i = rn + h[f(xn,yn)-f(xn, yn)] + £„, n = 0,..., N - 1. Je-li nyní |e„| 5 £ pro n — 0,... ,n, dostáváme z rovnice (2.46) nerovnost (2.47) \rn+1\<(l + hL)\r„\ + e, n = 0,..., - 1. Z nerovnosti (2.47) a z lemmatu 1.1 však ihned plyne následující věta. Veta 2.5. JVechť funkce f splňuje předpoklady (i) a (ii) a nechť lokální zaokrouhlovací chyba en je omezená, tj. nechť existuje konstanta. £ taková, že platí |e„| á e pro n = 0, ., N - 1. Pak platí (2.48) ,N. Z této věty plyne několik prakticky velmi důležitých důsledků. Nerovnost (2.48), kterou nelze obecně zlepšit, jak se snadno nahlédne (stačí k tomu např. uvažovat 30 2 eulerova metoda diferenciální rovnici y' — Ay, kde A je konstanta a e„ = s), tak říká, že pří omer zených lokálních zaokrouhlovacích chybách celková zaokrouhlovací chyba roste při h —i- 0 jako 1/h. Skutečně vypočtené řešení je zatíženo dvěma chybami: celkovou diskretizační chybou, která při h —* 0 konverguje k nule, a celkovou zaokrouhlovací chybou, která při h —► 0 roste. Pokud tedy nejsme schopni zaručit při výpočtu více než jen to, že lokální zaokrouhlovací chyba je ohraničená, vypadá situace tak, že pro velká h převládne celková diskretizační chyba a celková chyba se bude při zmenšování h zmenšovat. Při dalším zmenšování integračního kroku h dospějeme však k takovému ha, při němž převládne celková zaokrouhlovací chyba, která při dalším zmenšování h roste. Další zmenšování integračního kroku je tedy zbytečné a nejen to, dokonce škodlivé, protože celkovou chybu jen zvětšuje. V této situaci tedy existuje pro danou metodu a danou velikost lokální zaokrouhlovací chyby určitá mezní přesnost, kterou nelze překročit. Je-li tedy nezbytné z jakéhokoliv důvodu vypočíst řešení přesněji, než činí tato mezní přesnost, nemáme na základě toho, co dosud víme, jinou možnost, než zmenšit lokální zaokrouhlovací chybu a posunout tak mezní přesnost k menším integračním krokům. To však značí užít dvojnásobnou nebo případně i vícenásobnou aritmetiku, což jistě není příliš pohodlné řešení. V dalších článcích uvidíme, že naštěstí existuje jiné východisko, které spočívá v tom, že se užije jiná metoda než Eulerova, a to taková, že její celková diskretizační chyba je při daném h menší než u Eulerovy metody. Chování celkové zaokrouhlovací chyby je totiž do značné míry nezávislé, jak uvidíme, na konkrétní metodě a tato skutečnost zřejmě umožňuje zmenšit velikost kritické chyby. V dalších článcích si všimneme rady možností konstrukce těchto obecnějších metod. Než k nim však přejdeme, ilustrujme problematiku mezní přesnosti jednoduchým příkladem. Příklad 2.3. Vypočtěme Eulerovou metodou hodnotu přibližného řešení diferenciální rovnice y' = y s počáteční podmínkou í/(0) = 1 v bodě a: = 1 a užijme přitom integrační kroky h — 1/2S, * = 1,..., 20. Na obr. 2.1 a 2.2 je znázorněn průběh celkové chyby (tj. celkové diskretizační chyby a celkové zaokrouhlovací chyby) v závislosti na velikosti integračního kroku h. Z obou obrázků je vidět velmi dobrá shoda s předpověděným chováním. Celková chyba se nejprve zmenšuje, a to lineárně s h, neboť Eulerova metoda je řádu jedna, a po dosažení minima se v důsledku toho, že převládne zaokrouhlovací chyba, lineárně zvětšuje. Velikost kritické chyby je přitom na druhém obrázku menší než na prvním. Je to způsobeno tím, že příslušné výpočty byly v případě obr. 2.1 provedeny na počítači, u něhož je reálné číslo uloženo v 32 bitech, zatímco v případě obr. 2.2 byl užit počítač s přesnější aritmetikou o délce reálného čísla 40 bitů. 31 t QByČS!N& DIFEKĽNrIALNt HOVNKt- 0U>HV S FOf ATKÍINÍMI PODMÍNKAMI 01». 1.1 /.-tvľ Imi rrlknvŕ rhyKy n» initgrarrilm kroku _* I___ : 3 5 7 9 " a B r? rs--tagth Obr. 2.2 Zivi.lo.i celkov* Uiyliy . ml-sraŕiilm kroku í' i 5 Ť 9 n 13 S—.-/oy,/i 3 OBECNÁ JEDNOKROKOVÁ METODA 3 Obecná jednokroková metoda .ledním z charakteristických rysů Eulerovy metody je, že približné řešení j/„+1 v bode in+i se při jejím užití počíta pouze ze znalosti přibližného řešení yn v bodě x„. Můžeme ji tedy pokládat za speciální případ obecné jednokrokové metody, když obecnou jednokrokovou metodou rozumíme jakýkoliv algoritmus pro řešení problému (1.6), (1.7), v němž se přibližné řešení yn+i v bodě x„+i počítá pouze na základě znalosti veličin x„, yn a h. Funkcionální závislost veličiny Jfo+i na veličinách x„, y„ a h je užitečné zapsat ve tvaru (3.1) Vn+i = yn+h9{x„,yn,h), kde funkce <ř tří reálných proměnných závisí na dané diferenciální rovnici (resp, na její pravé straně). Vypočítat přibližné řešení y„ problému (1.6), (1.7) obecnou jednokrokovou metodou pak znamená generovat posloupnost aproximací yo,..., J/jv opakovaným užitím vzorce (3.1), přičemž se klade jfo = *?• Intuitivně se dá očekávat, že i v případě obecné jednokrokové metody bude hrát lokální chyba stejně důležitou roli, jako tomu bylo u Eulerovy metody. Začneme proto vyšetřování obecné jednokrokové metody přesnou definicí její lokální chyby. Definice 3.1. Výraz L(y(x);h) definovaný rovnicí (3.2) L(y(x);h) = y(x + h)-y(x)-h(x,y(x),h)} Funkci <ř, jíž je definována obecná jednokroková metoda, se tedy budeme snažit volit tak, aby rozdíi $(x, y, h) — A(x, y, h) byl pro malá h co nejmenší. Dříve než si všimneme podrobněji problematiky spjaté s obecnou metodou typu (3.1), uvedeme některé důležité speciální případy. Jak už jsme uvedli výše, budeme tyto speciální jednokrokové metody konstruovat tak, aby jejich lokální chyba byla pro malé hodnoty integračního kroku malá. Chování lokální chyby se obvykle charakterizuje veličinou, která se nazývá řád obecné jednokrokové metody. Tento pojem bude hrát důležitou roli při konstrukci konkrétních jednokrokových metod, a to je také důvod, proč jej zavedeme už nyní. Definice 3.2. Symbolem SHq označme množinu diferenciálních rovnic, jejichž pravé strany splňují požadavky (i) a (ii) z čl. 1, a buď 9Jt C Sílo- Maximální přirozené číslo p takové, že platí (3.7) L{y(x);h) = 0(V+1) pro každou funkci y, která je řešením diferenciální rovnice z množiny £DT, nazveme řádem dané obecné jednokrokové metody na množině 97t. V předešlém článku jsme viděli, že některá tvrzení, která jsme tam dokázali, jako např. věta 2.1, platí pro celou množinu ©to, jiná (příkladem může být věta 2.2) platí pouze pro vhodnou vlastní podmnožinu množiny 9Jío. V důkaze zmíněných vět jsme také viděli, že o lokální chybě Eulerovy metody můžeme pro celou třídu Wíq říci jen, že se chová jako hu(h), kde u je modul spojitosti první derivace řešení, kdežto pro třídu OTi diferenciálních rovnic, jejichž řešení mají spojitou nejen první, ale i druhou derivaci, je lokální chyba řádu ň2. Eulerova metoda má tedy na množině DJli řád 1, kdežto na množině SJto se o jejím řádu ve smyslu definice 3.2 nedá dost dobře mluvit. V dalším uvidíme, že i v případě obecné jednokrokové metody je tomu podobně; zavedení množiny 271 v definici 3.2 je tedy nezbytné. Upozorněme také, že v smyslu definice 3.2 lze mluvit o řádu dané jednokrokové metody pro dané řešení. 3.1 Speciální případy Předpokládejme v tomto odstavci, že pravá strana / dané diferenciální rovnice má pro x e (a, b) a pro libovolné y parciální derivace až do řádu p, kde p je nějaké pevné přirozené číslo. Pak řešení y má derivace až do rádu p + 1 a tyto derivace jsou úplně určeny funkcí /. Tak např. platí (3.8) j/' = /x(z,j,) + /*(*, y)f{*,y) a analogické vzorce lze psát pro y'"} y"" atd. Abychom zjednodušili zápisy, pišme y" — f'(x,y), y"' = f"(x,y) atd. Čárka tedy značí totální derivaci funkce / podle x (tj. derivaci funkce / podle x, v níž y je též funkce proměnné x). Použijeme-li tohoto označení, platí pro přírůstek hA(x,y,h) přesného řešení podle Taylorova vzorce (3.9) hA(x,y,h) = z(x + h) - y- r hf(x, y) + ±h2f'(x,y) +... + -h"f^\x, y) + 0{h"+1), a tedy pro funkci A (3.10) A(x,y,h) = f(x,y) + thf'(x,y)+ + -h"-1/^(x, y) + 0{h"). Vzhledem k tomu, co jsme řekli výše, se zdá přirozené volit funkci <ř tak, aby souhlasila s A tak dobře, jak je to jen možné. Vzorec (3.5) nabízí okamžité řešení spočívající v tom, že položíme (3.11) y, h) = f(x, y) + \hf{x,») + ...+ -.h?-1 /^(x, y). Metodu danou vzorcem (3.11) nazveme metodou Taylorova rozvoje řádu p. Její početní nevýhody jsou očividné: K tomu, abychom vypočetli hodnotu funkce je třeba mít k dispozici hodnoty funkcí /,/',...,/fa-1). Určit tvar těchto funkcí však nebude v konkrétních případech většinou vůbec jednoduché. Čtenář se o tom může přesvědčit na příkladě velice nevinně vyhlížející diferenciální rovnice j/ = — x2 + y2. Proto je snaha sestrojit funkci <6 tak, aby se lišila od funkce A až teprve ve členech rádu hp a aby zároveň nebylo třeba k výpočtu jejích hodnot počítat žádné derivace funkce /, zcela přirozená. Vzniká jen otázka, je-li možné. Klíčem ke kladné odpovědi na tuto otázku je známá skutečnost, že derivaci libovolného řádu každé funkce lze aproximovat lineární kombinací jejích hodnot v nějakých vhodně zvolených bodech. Základní myšlenkou příslušného postupu, který dá vzniknout tzv. Rungovým-Kuttovým metodám, si ukážeme pro jednoduchost na případě p ~ = 2. Hledejme funkce <ř ve tvaru (3.12) $(x, y, h) = wiki + u>2fc2, kde (3.13) *i = /(*,!/), *2 = f{x + ah,y + l3hkx) a mi, wi, a a § jsou konstanty, které určíme tak, aby rozvoj funkce $ jako funkce proměnné h souhlasil co možno nejdále s rozvojem funkce A. Rozviňme tedy funkci 35 L OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI <ř podle h. Dostaneme (Z.U)^(x,y,h)-wíkl + w2k2 - y) + w2f(x + ah, y + 0hf(x, y)) - - (wi + w2)f(x, y) + w2[afx(x, y) + 0fy (z, y)f(x, y)]h + 0(ft2). Porovnáním koeficientů u stejných mocnin h ve vzorci (3.14) a (3.10) dostáváme (3.15) ti>i + w2 — 1, U)20f=i, u>2/3=|. Táto soustava má nekonečně mnoho řešení a každé řešení dostaneme zřejmě pomocí vzorců (3-16) «i = l-ťf w2 = t, a = jť 0=1, kde ť je libovolné reálné číslo různé od nuly. Dále se dá také snadno přímým výpočtem ukázat, že žádnou volbou parametrů wi, w2, a a 0 nelze docílit, aby v rozvojích (3.14) a (3.10) souhlasily pro obecnou diferenciální rovnici i členy s h2. Zvolíme-li tedy ve vzorci (3.12) a (3.13) parametry Wi, w2, a a 0 podle (3.16), dostáváme obecnou jednokrokovou metodu, pro niž platí <ř(z, t/, h) — A(x, y, h) — 0(h?), a která je tedy řádu 2 na množině S3JÍ2 diferenciálních rovnic, jejichž řešení mají 3 spojité derivace. Lokální chyba této metody má, jak vidíme, stejnou vlastnost jako lokální chyba metody Taylorova rozvoje řádu 2. Nutnost počítat derivace pravé strany dané diferenciální rovnice je však nahrazena tím, že se počítají v každém kroku dvakrát hodnoty funkce /. V obecné Rungově-Kuttově metodě je funkce <ř dána předpisem (3.17) $(x,y, h) = mi.fci + ■ . + w,k„ kde (3.18) fc, <=f(x,y), ki = f(x + aih,y + h^20ijkj 1, i = 2,... ,s, ^ ;=1 ' a k výpočtu její hodnoty je tedy třeba s-krát vypočítat hodnotu pravé strany dané diferenciální rovnice. Postupem, který jsme ukázali výše, o mnoho však pracnějším a komplikovanějším, se dá ukázat, že parametry v každé Rungově-Kuttově metodě lze volit tak, že pro její rád p — p(s) platí p(s) —> co pro s —> oo. Řádu p(s) lze přitom dosáhnout nekonečně mnoha volbami příslušných koeficientů. Do dalších podrobností nebudeme zacházet, spokojíme se pouze s konstatováním, že pro ä s ž 4 je na množině diferenciálních rovnic s dostatečně hladkými řešeními p{s) = s, zatímco pro s > 4 roste funkce p už pomaleji než s. To je také v podstatě důvod, proč se v praxi jen zřídka užívá Rungových-Kuttových metod řádu většího než 4, Druhý důvod je ten, že koeficienty každé Rungovy-Kuttovy metody se určují ze značně složité soustavy nelineárních algebraických rovnic, při jejímž řešení vznikají 36 3 OBECNÁ JEDNOKROKOVÄ METODA pro velká s prakticky nezvládnutelné problémy. Aby si čtenář mohl udělat představu o jejich charakteru, uveďme tuto soustavu pro s — 4; (3.19) «2 s hu «3 = 031 +032, Ol A = 041 +042 + 043, Wl + W2 + W3 + 104 = 1, W2a2 + W3OI3 + U)4QÍ4 = |, w2al + w3a\ + WiCtl - g, w2a2 + w3a>l + «j4a| = \. W3CI2032 + W4(CÍ2042 + Ol3043) - g, w3otl032 + w4(al042 + a\043) = i, w3a2a3032 + W4(a2042 + «3^43)0(4 = g, W4(x,z,h)\<:L\y-z\ pro každé a; G (a, b), h G (0, ho) a pro libovolné y a p. 39 i. obyčejné diferenciální rovnice - úlohy s počátečními podmínkami Definice 3.4. . Řekněme, že obecná jednokroková metoda daná funkcí $ je komisientní s danou diferenciální rovnicí (1.6), je-li regulární aplatí-li (3.29) *(*,»,<>) = /(*,») pro a í x 5 b a —oo < y < oo. Věta 3.1. Nechť jsou splněny předpoklady (i) a (ii) z odst. 1 a nechť y je přesné řešení diferenciální rovnice (1.6) s počáteční'podmínkou (1.7). Buď dále yn přibližné řešení vypočtené obecnou jednokrokovou metodou (3.1), která je konzistentní s danou diferenciální rovnicí. Pak platí (3.30) \yn - y(xn)\ g [u(h) + {xn + 9nh), n = d...,N-l. Píšeme-li ještě (3.35) h<5>(x„,y(xn),h) = h$(xn, y{xn), 0)+ + A[*(x„, y{xn), h) - *(ar„, !/(»„),0)]. a užijeme-li podmínku konzistence, dostáváme (3.36) L(y(xn);h) = A[i/{xn + 9nh) - f(xn,y{x„))]- - h[(xn,y(xn),h) - <&(xn,y(xn),0)]. 40 3 obecná jednokroková metoda První sčítanec na pravé straně poslední rovnice lze odhadnout výrazem Aw(ft), neboť je f{xn, y(xn)} = jŕ'(a:„) a druhý výrazem hip(h), jak plyne ihned z definice funkce 0 k nule. O funkci w to už víme, o funkci ip to plyne ze stejnoměrné spojitosti funkce ®(x, y(x), h) na množině aíiŽi,0SAS/io. Z nerovnosti (3.30) můžeme dostat odhad chyby analogicky jako u Eulerovy metody. Zesílením požadavků na danou metodu můžeme rovněž tak sestrojit odhad analogický odhadu z věty 2.2. Věta 3.2. Buď dána množina diferenciálních rovnic EDt C ÍEKd, buď y přesné řešení diferenciální rovnice z 9Jt a buďyn jeho aproximace získaná obecnou jednokrokovou metodou, která je regulární a je řádu p 2; 1 na SDT. Pak existuje konstanta M taková, že platí (3.38) \y„ - y(xn)\ í Mh»EL{xn - a) pro n = 0,..., N a pro h ^ ho- Důkaz je v podstatě opakováním důkazu věty 3.1. Jediný rozdíl je v tom, že za předpokladů uvedených ve znění věty platí pro lokální chybu vyšetřované metody odhad (3.39) \L(y(xn);h)\ á M/ŕ+1. Užitím tohoto odhadu v nerovnosti (3.33) dostaneme ihned požadovaný výsledek. Na první pohled by se mohlo zdát, že požadavek konzistence se ve větě 3.2 oproti větě 3.1 ztratil. Ve skutečnosti tomu tak není, neboť z toho, že daná metoda je řádu aspoň jedna na vhodné množině, plyne, že je pro tuto množinu diferenciálních rovnic i konzistentní. Skutečně, z nerovnosti \L(y(x); A)| !? Mh2 plyne nerovnost (3.40) \y{x + hl-v{x)-*(x,y(x},h)\íMh. Protože pravá strana této nerovnosti konverguje pro h —► 0 k nule, platí totéž i pro levou stranu. První sčítanec na levé straně má však pro A —> 0 limitu, a to rovnou číslu f/(x) = f{x, y(x)), tutéž limitu má tedy i druhý sčítanec. Zcela analogicky jako větu 3.2 lze dokázat i následující větu, která tvoří paralelu k větě 2.3. 41 i. obyčejné diferenciální rovnice - úlohy s počátečními podmínkami Věta 3.3. Nechť jsou splněny předpoklady vity 3.2 a nechť yn je posloupnost čísel definovaná rekurencí (3.41) y0 = r,, Vn+i - yn + h[$(xn,yn,h) + hq9nK], n = 0, ,JV, ,N kde K je konštanta a $n jsou čísla, pio než platí \&n\ S 1, Pak pro n = 0, a pro h g ho platí (3.42) \yn-y(xn)\^MxhrEL(^-a), kde t = minQ>, q)aM1 = Mhp0~r + Khl~r. Větu 3.2 můžeme interpretovat podobně jako analogickou větu v případě Eule-rovy metody dvojím způsobem. Pokud o konstantě ve vzorci (3.38) víme pouze, že existuje, ale neznáme její konkrétní hodnotu, je věta 3.2 jen výrokem o rychlosti konvergence dané metody. Pokud tuto konstantu známe nebo jsme schopni ji odhadnout, představuje vzorec (3.38) odhad chyby. Všimněme si proto problému odhadu konstanty M v nerovnosti (3.39) podrobněji. Buď dána diferenciální rovnice (16) s počáteční podmínkou (1.7) a buď y její přesné řešení. Nechť dále funkce $ definuje obecnou jednokrokovou metodu, která je pro toto řešení řádu p. Konečně předpokládejme, že funkce /, resp. $ má p spojitých parciálních derivací podle obou, resp. všech tří proměnných v množině R, resp. R x (0, ho), kde (3.43) R={(x,y); a^x^b, -YíyZY} a Y je definováno vztahem (1.19). Protože platí (3.6), plyne z Taylorova vzorce a z předpokladu, že daná metoda je řádu p ^ [A(z, y(x), h) - <ř(z, y(x),h)]\h=o = 0 (3.44) pro k — 0,.. (3.45) A(x,y(x),h) - $(x,y(x),h) - U"^-[A(x,y(x),h)- 1 a p< dhf 1 -Q(x,y(x),h)]\ = 0, kde hi je vhodné číslo, pro něž platí 0 < hi < h. Vypočtěme tedy p-tou derivaci podle h rozdílu A — <ř. Pokud není dán konkrétní tvar funkce <ř, nelze s výrazem dp&(x,y(x),h)/dh1' nic dalšího dělat. Pro výraz dpA(x,y{x),h)/dhp však platí 42 3 obecná jednokroková metoda podle Leipnitzova pravidla pro derivování součinu d" y(x + h) - y(x) (3.46) —A(x,y(x),h) f)(-ir'Qo>-")! 1 d" /1P—+1 dh ~[y(x + h) -y(x)] ■. t u—n Z Taylorova vzorce užitého na funkci y a na interval {x + h, x + h + (—h)) nyní plyne, že existuje /ij, 0 < hz < h tak, že výraz v hranaté závorce na pravé straně rovnosti (3.46) je roven výrazu y(P+1)(a; 4- h2)(-hy+1/(p + 1)!. Celkem tedy dostáváme (3.47) A(x,y(x),h)-4>(x,y(x),h) = Přesné řešení dané diferenciální rovnice, které se vyskytuje v tomto vzorci, sice neznáme, víme však, že dvojice (x, y(x)) leží pro každé x (E (a, í>) v množině R dané rovnici (3.43). Za výše uvedených předpokladů lze tedy položit (3.48) M : 1 \{p+ 1)! D V, h) - (1 - t)f(x, y) + tf(x, y), kde jsme položili (3.53) Odtud však již snadno vypočteme, že platí C3'54) ^ = ^{f"i£'y) + 2M*.^f(*,y) + M*,m(',v)\> Určíme-li nyní konstanty Ma a K tak, aby platilo M0 í! 1 a Qi+lf K (3.55) \f(x,y)\^M0, v R, lze výraz (3.54) odhadnout takto: (3.56) I ft)| < ^ Protože je (3.57) I dx'dyk I - M^'1' i + k<2 dh2 l*ľ f"(*,y) = f**(x,y) + f*y(x,y)f(x,y) +/!,!,(x,2/)/2(3:,y)4-+ /»(*.»)[/.(*.»)+ /,(*.»)/(*,»)], dostáváme snadno nerovnost (3-58) |/"(z1y)|g4/rMo + 2A'2Mo. Pro konstantu M máme tedy odhad Podobným způsobem, jen podstatně komplikovanějším a pracnějším, odvodil L. Bieberbach pro standardní Rungovu-Kuttovu metodu dnes už klasický odhad (3.60) Mg6M0A-(l + A- + A-2-|-Ä-3-fA-4). Je přitom samozřejmě třeba předpokládat, že druhý odhad (3.55) platí pro i+k g 4, neboť uvažovaná metoda je 4. řádu. 44 3 OBECNÁ JEDNOKROKOVÁ METODA Obraťme se k metodě Taylorova rozvoje řádu p. Odhad konstanty M podle vzorce (3.48) je triviální, neboť v tomto případě je zřejmě dp®/dhr = 0. Vyšetření regularity je zde však o něco komplikovanější než u Rungových-Kuttových metod a abychom ji zaručili, je třeba klást na pravou stranu dané diferenciální rovnice podstatně silnější požadavky. Silnější předpoklady o funkci / jsou ostatně nutné už z toho důvodu, aby uvažovaná metoda měla vůbec smysl. Předpokládáme-li např., že funkce / má spojité derivace dostatečně vysokého řádu v pásu a ž x S b, -co < y < oo, položíme-li d (3.61) sup Up/W (*>!<) -oc resp. R, kde množina Ä je definována rovnicí (3.43). Na základě úplně stejných úvah, které nás vedly v předešlém odstavci k odhadu konstanty M, můžeme tvrdit, že za výše uvedených předpokladů existuje funkce tp a konstanta K taková, že platí (3.63) A(x, y, h) - ${x, y, k) = +1 je hlavni čási lokální diskretizační chyby, neboť se jí podle (3.6) a (3.63) až na veličiny řádu hp+2 rovná, Pro Eulerovu metodu — abychom uvedli triviální příklad — je 9(x,y,h) = = f{*,y) ap = 1; tedy tp(x,y) = f'(x,y)/2 = (/*-r/j,/)/2. Pro klasickou Rungovu-Kuttovu metodu lze, ovšem už zdaleka ne tak triviálně, vypočítat, že je (3.65) y(x„), h) - fy(xn, y(xn))en \ % k3h"+\ a tedy existuje 9' takové, že \9'\ í 1 a že (3.71) 4(*niíte, *>)-$(*„, »(*„), A) = fy{xnty(xn))en + e'K2h"+1. Dosadíme-li do rovnice (3.66) podle (3.63) a (3.71), máme (3.72) en+1 = en + h[fy(*„,y(xn))en + &K2h*+l - ' + 9Khp+1]. Položíme-li in = A_pe„, dostáváme pro tuto veličinu rekurenci (3.73) ě„+i = ě„ + h[fy(xn,y(xn))ěn - tp(xn,y(xn))] + 9"K3h\ kde \9"\ S 1 a K3 = K + ÁY Protože je zřejmě ě"o = 0, představuje rovnici (3.73) Eulerovou metodou pro řešení diferenciální rovnice (3.74) e' = fy(x,y(x))e~ f(x,y(x)) s počáteční podmínkou e(a) = 0, kde se v každém kroku dopouštíme navíc chyby velikosti h2. Podle věty 2.3, jejíž předpoklady jsou v důsledku předpokladů o hladkosti funkcí $ a / zřejmě splněny, dostáváme tedy výsledek, který zformulujeme v následující větě. Věta 3.4. Nechť jsou splněny předpoklady (i) a (ii) z čí. 1 a buďyn přibližné řešení vypočtené obecnou jednokrokovou metodou řádu p ž 1 a buď y příslušné přesné řešení. Nechť dále funkce $ a / mají v Jí x (0, hg), resp. v R p + 1 spojitých parciálních derivací podle všech proměnných. Pak platí (3.75) yn-y(xtl) = e(xn)h" + 0(h"+í)! kde e je řešením diferenciální rovnice (3.74) s počáteční podmínkou e(a) = 0. O vzorci (3.75) platí úplně totéž, co bylo řešeno o analogickém vzorci pro Eulerovu metodu. Funkce e dává ve většině případů velice dobrou představu o chování skutečné chyby, získat ji však explicite je, jak je na první pohled vidět, velice obtížné. Tu skutečnost však, že tato funkce existuje, i když neznáme její konkrétní tvar, 47 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI 3 OBECNÁ JEDNOKROKOVÁ METODA lze zužitkovat úplně analogicky, jako jsme to učinili u Eulerovy metody. Použijeme-li symbol y(x, h) opět k označení přibližného řešení v bodě x získaného obecnou jednokiokovou metodou s krokem h, platí op (3.76) y(x, k) - y(x) = yT^W, h) - y(x, A/2)] + 0(fcp+1), jak se snadno zjistí úplně stejným postupem jako v čl. 2. Aposteriorní odhad (3.76) získaný metodou polovičního kroku, je ve většině praktických případů velmi účinný a bývá také v podstatě podkladem mnoha algoritmů pro řešení úloh s počátečními podmínkami s automatickou volbou integračního kroku. Uveďme závěrem opět jednoduchý příklad. Příklad 3.2. Vypočtěme pro diferenciální rovnici yf = y s počáteční podmínkou j/(0) = 1 z příkladu 3.1 a pro standardní Rungovu-Kuttovu metodu asymptotický odhad chyby a odhad metodou polovičního kroku. Snadno se zjistí, že zde je tp(x,y) = J//120, takže e(a:) = —are^/^O. Z tabulky 3.2 vidíme podobně jako u Eulerovy metody opět velmi dobrou shodu se skutečností: Tabulka 3.2 Asymptoticky odhad chyby 1 2 3 4 5 -0,000005 -0,000027 -0,00011 -0,00040 -0,0014 -0,000006 -0,000030 -0,00012 -0,00044 -0,0015 odhad met. po), kroku -0,000005 -0,000027 -0,00011 -0,00039 -0,0013 3.4. Problematika zaokrouhlovacích chyb V tomto odstavci ukážeme, že obecná jednokroková metoda se co do závislosti na zaokrouhlovacích chybách chová úplně stejně jako Eulerova metoda. Postup je v principu úplně stejný jako u Eulerovy metody, a proto budeme postupovat s maximální stručností. Zavedeme-Ii i zde lokální zaokrouhlovací chybu tn rovnicí (3.77) yn+í = ji„ + h{xn,y„,h) + £„, dostáváme ihned následující větu. Veta 3.5. Buď dána regulární obecná jednokroková metoda. Nechť dále platí, že je \e„\ á e pro n = 0,..., N. Pak pro celkovou zaokrouhlovací chybu y — yn platí odhad (3.78) \y-yn\ á ^EL{xn-a), n = Q,...,N. Argumentace, že předpoklad o omezenosti lokální zaokrouhlovací chyby je i v případě jednokroková metody z praktického hlediska rozumný, je zřejmě i zde stejná jako u Eulerovy metody. Na základě předešlého tedy vidíme, že užití obecné jedno-krokové metody řádu p s p > 1 má oproti Euleiově metodě z praktického hlediska dvojí efekt: Výpočet je ve většině případů ekonomičtější, neboť vzhledem k tomu, že pro malá h je hf podstatně menší než h, většinou stačí k dosažení požadované přesnosti brát u obecné jednokroková metody s p > 1 podstatně větší hodnotu h než u Eulerovy metody, a provádět tedy méně kroků. Provádí-li se však méně kroků, je výpočet méně ovlivněn zaokrouhlováním. To má většinou za následek, že při užití metody s p > 1 se zmenší kritická chyba, o níž jsme mluvili v souvislosti s Eulerovou metodou, aniž je nutno použít vícenásobnou aritmetiku. Ilustrujme to na jednoduchém příkladě, Příklad 3.3. Řešme diferenciální rovnici y1 = y a s počáteční podmínkou 8/(0) — 1 standardní Rungovou-Kuttovou metodou s integračním krokem h = 2~", s = 1,2.....10. Obr. 3.1 Závislost celkové chyby na mtegračxtím kroku w'- 1 3 5 7 9 ^ í09j/! Na obr. 3.1 je znázorněn průběh celkové chyby v závislosti na velikosti integračního kroku. K výpočtu byla použita 40ti bitová aritmetika. Porovnáním s obr. 2.2, 48 49 i. obyčejné diferenciální rovnice - úlohy s počátečními podmínkami který znázorňuje tutéž závislost získanou v téže aritmetice pro Eulerovu metodu, vidíme, že kritická chyba skutečně velmi podstatně poklesla. 4 Mnohokrokové metody V předchozím článku jsme viděli, že výpočet přibližného řešení dané diferenciální rovnice jednokrokovou metodou probíhá tak, že po provedení jednoho kroku se vlastně řeší nový problém s počáteční podmínkou zadanou v tom bodě, do něhož jsme s řešením v předešlém kroku dospěli. To má své výhody: metoda je teoreticky jednoduchá, jednoduše se programuje, změna velikosti integračního kroku je natolik jednoduchá, že jsme o této otázce vlastně dosud nepotřebovali ani explicite mluvit, apod. Na druhé straně však mají tyto metody některé podstatné nevýhody. 5 jednou z nich spočívající v tom, že odhad lokální diskretizační chyby je (alespoň v případě metody Rungova-Kuttova typu) značně složitý, jsme se už setkali, také to, že v tom okamžiku, kdy vypočítáme přibližné řešení v jednom bodě, zapomeneme všechny informace o řešení v předchozích bodech, se zdá neprozíravé. Naopak intuitivně se zdá zřejmé, že užijeme-li k získání přibližného řešení v bodě x = xn+1 nejen to, že známe přibližné řešení v bodě x — xn, ale i to, že je známe také např. v bodech x = x„-i a x = zn-2, dostaneme nutně přesnější výsledek. Praxe ukazuje, že je tomu skutečně tak a že metody, které ke konstrukci přibližného řešení užívají nejen informace z bezprostředně předchozího bodu, ale i informace z několika předchozích bodů, a které jsou tedy v tomto smyslu mnohokrokové, jsou většinou — hlavně v případech, kdy se vyžaduje vysoká přesnost — efektivnější než metody jednokrokové. Cena, která se za to zaplatí, spočívá, jak uvidíme, ve větší složitosti z programovacího hlediska (je třeba speciální startovní procedury, změna velikosti integračního kroku představuje dosti komplikovaný problém). Pro mnohokrokovou metodu je tedy charakteristické, že k výpočtu přibližného řešení yn+it v bodě x — x„+i. (xs je zde stejně jako u jednokrokové metody tvaru x, = a + sh) použijeme k předchozích hodnot přibližného řešení. Intuitivně se nabízejí hned dvě možnosti, jak generovat metody tohoto typu. V první z nich vycházíme z identity (4.1) y(xr) - y(xu) = f " f(t,y(t)) it, A, kterou splňuje přesné řešení dané diferenciální rovnice (1.6) pro libovolné dva body xT a xu z intervalu (a, 6), v níž nahradíme neznámou funkci za integračním znamením vhodným interpolačním polynomem. Metody, které vzniknou na základě tohoto obecného principu, se souhrnně nazývají metody numerické integrace a jsou v současné době dosti populární. Nejčastěji se zmíněný interpolační polynom sestrojuje tak, aby v bodech xv, v = n, ...,n + k — 1, resp. v = n..., n 4- k nabýval hodnot - f(x„,y„) a za dvojici xu, xr se volí z„+lt_i, xn+k nebo xn+k-i, Xn+k- 50 4 mnohokrokové metody Druhá možnost konstrukce metod, které máme na mysli, vychází přímo z dané diferenciální rovnice. Postupuje se tak, že se sestrojí polynom, který v bodech xr, v = n,... ,n + k nabývá hodnot y„, vypočte se derivace tohoto polynomu ve vhodném bodě a položí se rovna hodnotě pravé strany dané diferenciální rovnice v odpovídajícím bodě. Přirozený název pro metody tohoto typuje metody numerického derivování. Obě zmíněné skupiny speciálních mnohokrokových metody popíšeme podrobně v následujících odstavcích. 4.1 Speciální případy Dříve než začneme popisovat jednotlivé konkrétní metody, uvedeme některé speciální výsledky z teorie interpolace, které nám budou při tomto popisu užitečné. 4.1.1 Interpolace při ekvidistantních argumentech V tomto odstavci se budeme zabývat úlohou sestrojit polynom stupně nejvýše q, který v bodech xf,xp_x,..., xp_q (xp = a + ph) nabývá zadaných hodnot Zp, zp-i> ■ ■ ■, zp-t- Řešení tohoto problému je čtenáři jistě dobře známo: Hledaný polynom existuje, je jediný a je možné jej napsat ve tvaru Lagrangeova interpo-lačního polynomu. Zde odvodíme jednodušší vzorec, který zužitkovává to, že uzly interpolace jsou ekvidistantní. V této situaci se k zápisu interpolačních polynomů užívá většinou různých typů diferencí. V literatuře byla popsána řada nejrůzněj-ších diferencí a interpolačních vzorců založených na nich. Pro naše účely je vhodné pracovat s pojmem diference zpět. První diferenci zpět budeme značit symbolem V a definovat rovností (4-2) Vzp = zp-zp_ť, m-tou diferenci zpět pak označíme symbolem Vm a definujeme rekurentně rovností (4-3) Vmzp = V(Vm-1zp), m = 2,3,..., kde klademe V1 = V. Z důvodu zjednodušení dalších zápisů položíme ještě V°zp — — zp. Úplnou indukcí snadno zjistíme, že platí (4.4) V%=£(-ir(*V_m, , = 0,1,..., m=0 ^ ' kde je <4-5) (o)-1' fg) = '('"!)" (rmi+I), m = l,2,., \0J \mj m(m -1)... 1 11 a naopak, že pro každé q = 0,1,... platí (4.6) *-,= £(-!)"(*) V",,; m=0 ^ ' I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY s POČÁTEČNÍMI PODMÍNKAMI j-tou diferenci zpět lze tedy vyjádřit jako lineární kombinaci hodnot zp, Zy-i, . ., zp_, a naopak hodnotu zP_5 jako lineární kombinaci nulté, pTvní atd. až 9-té diference zpět. Pomocí pojmu diference zpět už snadno zapíšeme hledaný polynom. Věta 4.1. Položme (4.7) kde (4.8) w=£(-ir(;)v-*, h ' Pak P je polynom stupně nejvýše q v x a pjati (4.9) P(*p-t) - zp-r, r = 0.....q. Důkaz Předně výraz (^*) = C*'^'*) je podle vzorců (4.5) zřejmě polynom stupně m v x, a tedy P je polynom stupně nejvýše q. Protože je (^) = 0 pro celé kladné r a m > r (viz vzorec (4.5), který platí pro libovolné reálné 5), platí (4.10) £(-ir Qv-% = E(-i)m(r)v"V Poslední součet v rovnici (4.10) je však podle (4.6) roven číslu zj,_r. Věta je dokázána. Věta 4.2. Buď I interval obsahující body xf,xp-\,...,xv-q a buď z funkce definovaná na /, která má v I q + 1 derivací a buď P polynom (4.7) s zf-r ~ = z(rp_r), r = Ó,... 1 4. Pat ke každému 1 £ I existuje bod { E / takový, že platí (4.11) z(x) - P(x) = (-l)»+1ft'+1 (a7l)*C,+1)(ť)- Důkaz Je-li x = «p_r pro některé r, je rovnice (4.11) splněna a to dokonce pro libovolné f. Můžeme tedy předpokládat, že je a; ^ sBp_r pro r = 0,..., q. Definujme v tomto případě funkci ip proměnné t £ í předpisem p(i) = z{t) - P(t) - li^-L^íí(i), (4.12) kde (4.13) fi(ť) = (í - xp)(t-xp-i). ,(ť-xp_,). Funkce (p má v intervalu I zřejmě q + 1 derivací a platí tp{xp-r) — 0 pro r = = 0.....ja tp(x) = 0. V intervalu I tedy existuje q + 2 navzájem různých bodů, 52 4 MNOHOKROKOVÉ METODY ve kterých je hladká funkce tp rovna nule. Opakovaným užitím Rblleovy věty ihned plyne existence takového £ 6 J, že platí (4.14) *>C'+1)(0 = 0. Je však p(?+1)(ť) = 0, neboť stupeň polynomu P je nejvýše q; dále je Íl(9+I)(t) = — (q + 1)!. Dosazením do rovnice (4.14) dostáváme 1 (4.15) *(») - P(X) : Tn(.)»(«+1>(fl. Použijeme-li nyní ve vzorci (4.13) rovnosti x — xp-r = x — xp + rh — sh + rh = = (—h)(—s — r), dostaneme z (4.15) ihned vzorec (4.11). Věta je dokázána. 4.1.2 Adamsova-Bashforthova metoda Tato metoda je speciálním případem metody numerické integrace. Klademe v ní xr — xn+t, xu — Xn-i-k-i (i ž 1) > interpolační polynom P prokládáme body {xtr,fu), ľ = n + k — 1,..., n. Položíme-li tedy v odst. 4.1.1 p — n + k — ls.q = = k — 1, je polynom P tvaru h-i (4.16) m=0 kde s = (x — xn+k-i)/h. Odtud integrací v mezích od xn+i~i do xn+j, už snadno odvodíme, že Adamsova-Bashforthova metoda je dána vzorcem (4.17) í/„+i - y„+*-i ~h^2 7mVm/„+t_ll m=0 kde í4-is) ^4ii(-ir(-)di=(-i)mrts)ds /•(■)= E í-irf^v"/,.^. f m—n ■ \ / nebo vzorcem (4.19) kde (4.20) chceme-li, aby na pravé straně vzorce vystupovaly přímo hodnoty funkce /. Vzorec (4.19) se snadno dostane za vzorce (4.17) užitím rovnice (4.4). Všimněme si, že koeficienty ve vyjádření (4.17) na rozdíl od vyjádření (4.19) nezávisí na k. To je také výhoda tvaru (4.17), který byl populární zejména v předpočítačové éře. 53 [. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OLOHY S POČÁTEČNÍMI PODMÍNKAMI Při výpočtu přibližného řešení se vzorec (4.17) nebo (4.19) užívá postupně pro n = 0,1,____Na začátku výpočtu musíme mít tedy k dispozici nejen hodnotu yo, která je dána počáteční podmínkou, jako tomu bylo u obecné jednokrokové metody, ale ještě hodnoty j/i,..., yt-i, které musíme získat nějakým jiným způsobem (např. jednokrokovou metodou). Tento jev je pro mnohokrokové metody typický. Počítat koeficienty Adamsova-Bashforthova vzorce podle (4.18) je nepohodlné. Odvoďme proto jiný způsob jejich výpočtu, který nevyžaduje počítání žádných integrálů. Definujme k tomu cíli funkci G komplexní proměnné t předpisem (4.21) G(ť)= /'(l-ij-'ds. JO Protože zřejmě platí (4.22) G(í) = -; í (l-í)ln(l-ť)' je funkce G holomorfní v kruhu |ť| < 1. Podle binomické věty však platí (4.23) a tato řada konverguje absolutně a stejnoměrně uvnitř jednotkového kruhu. Lze ji tedy integrovat člen po členu, čímž dostaneme (4.24) c?(*) = E(-1)m / L)d*r = E- Dosadíme-li tento výsledek do (4.22), dostaneme identitu (4.25) nebo (4.26) ln(l - t) m=0 1 LAJ ~ ľ = 0 m=Q m=0 platnou pro každé \t\ < 1. Je však (4-27) E ^ E 7mím+" = £ ^ E W" = co / tn - \ neboť upravovaná řada konverguje absolutně a lze tedy libovolně přerovnat pořádek jejích členů. Dosadíme-li do identity (4.26) podle (4.27) a porovnáme-li koeficienty 54 4 MNOHOKROKOVÉ METODY u stejných mocnin proměnné t na levé a pravé straně, dostáváme (4.28) 1 pro 771 = 0,15____ Koeficienty ym můžeme tedy počítat z (4.28) rekurentně. (h) V tab. 4.1 jsou uvedeny tyto koeficienty a v tab. 4.2 koeficienty pi, pro několik prvních hodnot indexů. Tabulka 4.1 Koeficienty T Adamsovy-Bashforthovy metody m 0 1 2 3 4 S 6 Im 1 1 2 5 12 3 8 251 720 95 266 19 087 60 480 Tabulka 4.2 Koeficienty /? Adamsovy-Bashforthovy metody 0 1 2 3 4 5 /#> 1 -1 3 l2/S<3) 5 -16 23 M/4*' -9 37 -59 55 720/Í6' 251 -1274 2 616 -2 774 1901 1440/3Í,8' -425 2 627 -6 798 9482 -7673 4 227 Všimněme si ještě vztahu Adamsovy-Bashforthovy metody k původní diferenciální rovnici. U obecné jednokrokové metody jsme její kvalitu měřili velikostí lokální chyby, tj. velikostí výrazu y(x + h) — y(x) — h$(x,y(x), h) jako funkce h. U Adamsovy-Bashforthovy metody tomuto výrazu odpovídá výraz (4.29) ^» = j(In+i) - S(.n+M) - /, ^ t^V/^+h, j(í„ti-,)) = fc-1 = y(Xn + h) ~ y(xn+k-l) h E 7mVmt/(3;„+ŕ_i), který tak hraje roli lokální chyby. Za předpokladu, že přesné řešení uvažované diferenciální rovnice má k +1 spojitých derivací, platí podle věty 4.2 (p = n + k-1. 55 L OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI i — k — l, z(x) - y>(x)) (4.30) ✓ (*) = E(-1)m(r)V"lj''(K-+i-l) + (-1)*',*(ľ)í'(*+l)(í)' kde s — (x - x„+i,-i)/h. Integrací v mezích od xn+i-i *n+t odtud plyne, že je (4.31) =(-i)*/i*£-+* (~sy*+i)(o'^mfn+k-i> m=l kde koeficienty Km jsou dány integrály (4.40) B- = í-í>"/!1(™)d'' ! nebo rekurencemi m 1 (4.41) «o=2, V"—— rem-„ = 1, m = 1,2,..., n " + 1 a jejichž hodnoty jsou pro m = 0, . ,6 uvedeny v tab. 4.5. Tabulka 4.5 Koeficienty k Nystromovy metody m 0 1 2 3 4 5 6 2 0 1 3 1 3 29 90 14 45 1139 3 780 Vzorec (4.39) lze samozřejmě přepsat do tvaru, který obsahuje pouze hodnoty funkce /. Pro příslušné koeficienty se odvodí podobné vzorce jako v případě Adamsovy-Bashforthovy nebo Adamsovy-Moultonovy metody. Naproti tomu pro lokální chybu Nystromovy metody už obecně neplatí jednoduchý vzorec typu (4.32) nebo (4.38). 4.1.5 Zobecněná Milnova-Simpsonova metoda Tato implicitní metoda je pro k = 2, 3,... dána vzorcem (4.42) yn+i - y„+k-2 = h ]T C^/n+i. m=0 Pro koeficienty K*m platí (4.43) c=(-ir/°2 (;;)(x)= J>ir(-S)v"W, .,= ^|=±», který nabývá v bodech Xn+fci • hodnot j/n+jt, .-,!/«, zvolí se bod xn+],_T (0 5 í r í i) a !a derivaci v diferenciální rovnici (1.6) psané pro bod x — x„+k-r se dosadí derivace tohoto polynomu v tomto bodě. Vzniklá metoda se tedy dá zapsat ve tvaru t (4.46) £ írmVml/„+t = hfn+k_r, m=l kde (4.47) Pro r = 0 jde o metodu implicitní, jinak jsou to metody explicitní. Položíme-li oo (4.48) Dr(l)^Wm 59 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI je (4,9) ^)=ŽHri(;)Lr=^[£ (;>*>- m = l X ' Lm=0 = jL(l_t)-|. = -(l -í)"l«(l "O- CIS lí = -r Odtud snadno plyne, že platí (4.50) Dr+l(t) = {l-t)Dr(t). Dosadíme-li (4.48) do (4.50), porovnáme-li koeficienty u stejných mocnin na levé a pravé straně a položíme-li ještě Sr0 = 0 pro r = 0,1,..., dostáváme rovnici (4.51) ír+l,m trní ' Äiyn-li která platí pro r = 0,1,... a m = 1,2,.... Položíme-li v (4.49) r = 0 a vyjádříme-li funkci na pravé straně ve tvaru mocninné řady, máme (4.52) íom = ^, m =1,2,.... Z rovnic (4.51) a (4.52) však už snadno generujeme koeficienty Srm rekurentně. Prvních několik jejich hodnot je uvedeno v tah. 4.7. Tabulka 4.7 Koeficienty S metody založené na numerickém derivování 1 2 3 4 5 6 0 1 1 2 1 3 1 5 1 6 1 1 1 2 1 6 -A 1 20 1 30 2 1 3 2 1 3 12 1 30 60 3 1 5 2 7 6 17 12 1 20 1 Vzorec (4.46) lze psát také ve tvaru k (4.53) ^a^Vn+v = A/n+*-r, který neobsahuje žádné diference. V tomto případě se určí koeficienty aík) ze vzorce (4.54) = £ " = °.>-fc-jak se snadno zjistí užitím rovnice (4.4). 60 4 MNOHOKROKOVÉ METODY Pro lokální chybu Rf popsané metody, která je definována v tomto případě vzorcem k (4.55) iZf = £ ÄrmVro^„+i_r) hs/(im+*_P), m=l platí (4.56) Ař = ^,*+i*(*+1)('j)A*+1- Tento vzorec se odvodí stejně snadno jako obdobný vzorec pro Adamsovy metody. 4.2 Obecná lineární mnohokroková metoda Všechny metody vyšetřované v předešlém odstavci měly společné, že svazovaly přibližné hodnoty hledaného řešení a jeho derivací lineárně. Je proto přirozené omezit se v dalším na tento druh závislosti a za obecnou lineární k-krokovou metodu považovat metodu danou vzorcem k k (4.57) ^a„ífa+i, = h^Pvfn+*< kde ao.....ctk, @o, jsou reálné konstanty, h je integrační krok a /, je zkrá- cený zápis pro f{xs,ys). Všude v dalším budeme předpokládat, že je ctk ^ 0 a že koeficienty oro a 0q nejsou současně rovny nule. O fc-krokové metodě budeme také všude tam, kde není konkrétní hodnota parametru k podstatná, mluvit jako o mnohokrokové metodě. Na rovnici (4.57) je třeba se dívat tak, že z ní máme určit přibližnou hodnotu yn4-k řešení v bodě x — xn+j. za předpokladu, že přibližné hodnoty 3/n+i-i> ■ • -j3/n jsou známé a tento postup opakovat postupně pro n = 0,1,..., N — k, kde N — — [(b — a)h]. Je tedy především nutno předpokládat, že přibližná řešení yo,..., jft-j jsou dána. Vzorec (4.57) tak vyžaduje narozdíl od jednokrokové metody k počátečních hodnot. Na tuto skutečnost jsme už ostatně upozornili při popisu speciálních mnohokrokových metod. Aby metoda daná rovnicí (4.57) měla vůbec rozumný smysl, je třeba se přesvědčit, že veličina y„+k její (za předpokladu, že veličiny yn,yn+i, ■ ■ -íVn+k-i jsou známé) skutečně jednoznačně určena. To je zřejmé na první pohled v případě, že je 0k = — 0. V tomto případě budeme mluvit o explicitní metodě. V případě, že je /íj, ^ 0, nazveme příslušnou metodu implicitní] u ní je třeba vypočítat yn+k jako řešení obecně nelineární rovnice (4.58) kde (4.59) y = F{y), F(y) = h—f(xn+t,y) + c a* 61 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI 4 MNOHOKROKOVÉ METODY 1 (4.60) 1 / i_1 \ a je to tedy známé číslo. Předpokládáme-li, že jsou splněny předpoklady (i) a (ii) z čl. 1, je funkce F definovaná pro libovolná y a platí pTo ni (4.61) Splňuje-li h podmínku (4.62) \F(y)-F(y-)\^hLlM\y-f h < je zobrazení F kontrakce a podle Banachovy věty o pevném bodu mi rovnice (4.58) právě jedno řešení a toto řešeni lze vypočítat metodou postupných aproximací. Ať už je tedy daná metoda explicitní nebo implicitní, má — alespoň pro malá h — smysl, Pojem lokální chyby a s ním související pojem řádu lineární mnohokrokové metody bude hrát stejně důležitou roli, jako tomu bylo u jednokrokové metody. Uveďme proto přesné definice těchto pojmů. Definice 4.1. Buď dána lineární mnohokroková metoda a buď y libovolná funkce, která je v (a, 6) definovaná, spojitá a spojitě diferencovatelná. Výraz I definovaný rovnicí k k (4.63) L(y(x); h) = £ a„y{x + vh) - h £ /W(* + "h) v—O Ľ=0 nazveme lokální chybou dané mnohokrokové metody. Všimněme si, že v důsledku linearity dané metody není nutné v definici její lokální chyby vůbec mluvit o řešení dané diferenciální rovníce. Definice 4.2. Řekneme, že lineární mnohokroková metoda je řádu p, platí-li Co = Ci = ... = Cp = 0, Cp+i jí 0, kde Cp jsou konstanty, definované rovnicemi (4.64) Co = ao + ... + at, Ci = ai+2<*2+ ...!:«*-(#> + ■-.+A). C, - ^(a1 + 2'a, + ... + k*at)- -7-^(A + 2'-1& + .- + *,_1ft)> ? = 2'3 (q - 1)! Abychom objasnili důvody, které nás vedly k této definici, předpokládejme na okamžik, že funkce y je nekonečně diferencovatelná a že ji lze v okolí každého bodn 62 rozvinout v Tayolorovu radu. Pak platí * 1 (4.65) L(y(x),k) = £ «„ \y{x) + Vhy'{x) + -vWy"(x) + ...] - - \hy'(x) + vh2y"(x) + ~v2h3y"'{x) + ...] = i/ = 0 = Coj/Ot) + Cihý(x) + C2h2y"(x) + ... + Ct Wy^Xx) + .... Rovnice (4.64) tak skutečně vyjadřují intuitivně očekávanou skutečnost, totiž, že pro každou dostatečně hladkou funkci y je (4.66) L{y{x);h)=0(h?+1). Vidíme také, že linearita dané metody, která už zjednodušila definici lokální chyby, umožnila definovat její řád čistě algebraicky, tj. pouze pomocí algebraických vztahů pro její koeficienty. Vezeme-li v úvahu výsledky, k nimž jsme dospěli v případě jednokrokové metody, zdá se rozumné konstruovat lineární mnohokrokové metody tak, aby měly pokud možno vysoký řád. Předtím, než budeme tyto otázky zkoumat teoreticky, uveďme jednoduchý příklad. Příklad 4.1. Řešme diferenciální rovnici y1 = — y s počáteční podmínkou t/(0) = 1 na intervalu (0,1) metodou (4.67) + 4j/n+l - 5y„ = ri(4/„+1 + 2/„), která je řádu 3, jak se snadno vypočte z rovnic (4.64). Výsledky jsou pro h — 1/10 a 1/20 uvedeny v tab. 4.8. Protože užitá metoda je dvoukroková, je třeba kromě hodnoty ya (= 1) dodat ještě hodnotu j/i; za tu jsme zvolili hodnotu přesného řešení v bodě 0,1, resp. 0, 05. Z tabulky je na pTvní pohled vidět, že jsme dostali zcela nesmyslné výsledky. U metody (4.67) lze tedy jen stěží očekávat konvergenci. Uvedený příklad ukazuje, že skutečnost, že lokální chyba je pro malá h malá, nemusí ještě u mnohokrokové metody stačit k tomu, aby byla malá i globální chyba. Abychom uhádli, jaké podmínky kromě malosti lokální chyby je třeba klást na danou metodu, aby byla zaručena konvergence, začneme teoretické zkoumání obecné mnohokrokové metody vyšetřováním nutných podmínek konvergence. 4.2.1 Nutné podmínky konvergence Zatímco u jednokrokové metody záviselo přibližné řešení kromě na počáteční podmínce už jen na integračním kroku, u mnohokrokové metody závisí ještě na dalších počátečních podmínkách. Přibližné řešení získané fc-krokovou metodou tedy závisí na integračním kroku nejen proto, že na něm závisí daná metoda, ale také proto, že 63 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Tabulka 4.8 Numerické řešení diferenciální rovnice y' — —y metodou (4,67) h = 0,1 h = 0,05 X přibližaé řešení chyba přibližné řešení chyba 0,0 1,000000 0 1,000000 0 0,1 0,904837 0 0,904 836 -0,000 001 0,2 0,818715 -0,000015 0,818 711 -0,000 019 0,3 0,740 872 0,000054 0,740315 -0,000 503 0,4 0,669997 -0,000323 0,656 994 -0,013326 0,5 0,608200 0,001669 0,252935 -0, 353 596 0,6 0,539907 -0,008905 -8, 833877 -9, 382 689 0,7 0,543768 0,047183 -248,4746 -248, 9711 0,8 0,198971 -0,250358 -6 606,041 -6606,490 0,9 1,734617 1,328048 -175 303,9 -175 304,3 1,0 -6,677257 -7,045136 -4651 727 -4651728 na něm závisí i další počáteční podmínky. Veškeré úvahy o konvergenci r-krokové metody musí proto brát zřetel na tuto závislost. Studium konvergence proto začneme přesnou definicí tohoto pojmu. Definice 4.3. platí-li (4.68) Řekneme, že lineární jfc-kroková metoda (4.57) je konvergentní, lim y„ pro každé x £ {a, b), kde y je řešení libovolné diferenciální rovnice (1.6) s počáteční podmínkou (1.7), jejíž pravá strana splňuje požadavky (i) a (ii) z čl. 1 a yn je libovolné přibližné řešení této rovnice vypočtené metodou (4.57), určené integračním krokem h a počátečními podmínkami y, = y,(h), s = 0,..., k — 1, pro něž platí (4.69) lim y,(h) = ij, s — 0,..., k — 1. h—*0 Abychom mohli formulovat první důležité tvrzení týkající se konvergence obecné lineární fc-krokové metody, je třeba zavést ještě další pojem. Definice 4.4. Řekneme, že metoda (4.57) je stabilní ve smyslu Dahlquista1^ nebo stručně D-stabiiní, platí-li pro všechny kořeny f„ polynomu g definovaného ^ Podle švédského matematika G. Dahlquista, který je tvůrcem celé teorie, která bude následovat. 64 4 MNOHOKROKOVÉ METODY (4.70) |í„| á 1 a jsou-li ty z nich, pro něž je — 1, jednoduché. Poznámka 4.1. Polynom o se nazývá první charakteristický polynom dané metody. Zavedeme-li ještě tzv. druhý charakteristický polynom a rovnicí k (4-71) limt/s=0, s = 0, . ,k— 1, n-. 0 lim yn = 0, h — fí neboť přesné řešení uvažované diferenciální rovnice je funkce identicky rovná nule. Protože je xn = a + nh - x, můžeme rovnici (4.74) psát ve tvaru (4.75) Jim yn = 0. Buoľ nyní ^ ~ reltpv kořen polynomu g a předpokládejme, že je r > 1. Posloupnost {r"e'"lf"; n = 0,1...} řeší zřejmě rovnici (4.72) a protože tato rovnice nezávisí explicitně na h, řeší ji rovněž posloupnost {hrnemlp"}, a tedy také reálné posloupnosti {hrn cos(tiíp„)} a {hr" sm(nipu)}, neboť koeficienty dané mnohokro-kové metody jsou reálné. Protože pro obě tyto posloupnosti platí (4.73), platí pro ně také (4.75). Je však |/ir™ein^| = hr". Protože je r > 1 i Ji = (i - o)/n, platí |/ir™e"r" | —> oo pro n —► oo. Totéž tedy platí aspoň pro jednu z posloupností {Re(íír"ein^")} a {lm(hrne'n^)}. To je však ve sporu s (4.75). Je tedy ríl. 65 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Buď dále = rellp" kořen polynomu g o násobnosti větší než jedna. V tomto případě řeší rovnici (4.72) posloupnost {nrnemv>-}. Posloupnosti {Re(A.1''2Ilr"e]n oo pro n-*coah = (x — a)/n. To je však spor dokazující, že platí r < 1. Věta je dokázána. Věta 4.4. Rád konvergentní metody (4.57) je nejméně 1 (tj. konstanty Co a Ci z dennice 4.2. jsou nulové). Důkaz . Dokažme nejprve, že je Co = 0. Daná metoda je konvergentní speciálně pro diferenciální rovnici j/ = 0s počáteční podmínkou y(a) = 1, jejíž přesné řešení je funkce y(x) = 1 v (a,b). Tedy každé řešení rovnice (4.72), pro jehož počáteční podmínky platí lim^oj^ = 1 pro s -- 0,..., k — 1, musí konvergovat k jedničce. Zvolíme-li tedy speciálně ys = 1 pro s ^ 0,,.., k - 1, musí pro řešení určené těmito počátečními podmínkami platit (4.76) lim K={x-a)jn Vn — 1 Toto speciální řešení však nezávisí explicitně na h, tedy pro ně platí (4.77) lim yn — 1. Přejdeme-li tedy v rovnici (4.72) k limitě pro n —► oo, dostaneme h (4.78) £>„ = 1, i/=0 což není nic jiného než, že Co - 0, Dokažme nyní, že je C\ — 0. K tomu cíli uvažme diferenciální rovnici y' = 1 s počáteční podmínkou y(a) = 0, jejíž přesné řešení je funkce y(x) - x - a. Pro každé řešení yn rovnice (4.79) pro něž platí (4.73), musí tedy platit (4.80) lim yn ■ e (a, b) . Položme (4.81) nh, n ~ 0, ., N (= [(b-a)/h]), kde g a a jsou první a druhý charakteristický polynom dané metody. (Jde tedy o polynomy definované rovnicí (4.70) a (4.71).) Vzorec (4.81) má smysl, neboť 4 MNOHOKROKOVÉ METODY podle první části důkazu je Co = g(i) = 0; jednička je tedy kořenem polynomu g a podle věty 4.3 je tento kořen jednoduchý, takže je g'(l) 0. Funkce yn definovaná rovnicí (4.81) splňuje zřejmě požadavky (4.73). Rovnice (4.79) je rovněž splněna, neboť je (4.82) ^a„yn+u -hY^0„ - h~j^^2aw(n + v) - ha(l) - Podle (4.80) tedy dostáváme, že pro každé x £ (a, b) platí (4.83) x — a = um yn = —j—r lim nh = —r-r-ix - a). A+o " Í>'(1) A^o e'(l)v ; Odtud však plyne, že je c(l) = £>'(1), což je jen jiný zápis podmínky Ci = 0. Věta je dokázána. Poznámka 4.2. Podmínky z věty 4.4 můžeme pomocí polynomů g a o- psát alternativně také ve tvaru (4.84) o(l) = 0, e'(l) = «r(l). Protože tyto podmínky vyjadřují tu skutečnost, že lokální chyba příslušné metody se chová jako 0(h2), říkáme jim analogicky jako v případě jednokrokové metody podmínky konzistence. Z důkazů vět 4.3 a 4.4 je vidět, že jde o velmi elementární tvrzení, která vlastně neříkají nic víc než jen to, že přibližná řešení konvergují k přesným řešením v případě diferenciálních rovnic, jejichž řešení jsou postupně nula (D-stabilita), konstanta (Co = 0) a polynom prvního stupně [C\ = 0). Proto čtenáře možná překvapí, že jednoduché podmínky, které jsou obsahem těchto vět, jsou nejen nutné, ale i postačující podmínky pro konvergenci. 4.2.2 Postačující podmínky konvergence Hlavním cílem tohoto odstavce je dokázat, že D-stabilita a konzistence jsou postačujícími podmínkami konvergence. Dále pak zde sestrojíme apriorní odhad chyby. Začneme několika pomocnými tvrzeními. Lemma 4.1. Nechť ipn a ijin jsou posloupnosti reálných čísel definované pro n — 0, .., JV a nechť m je nezáporná konstanta. Nechť dále platí n-l (4.85) n + m^ip^ nrO, ,N.V ^ Součet, jehož horní mez sčítání je menší než dolní, pokládáme za rovný nule, 67 r I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Pak platí n-l (4.86) ^g^ + m^^l + m)"-1-", n = o, N Důkaz Položme n-l (4-87) ^ = 1»^^ n = 0, ,N. Podle (4.85) platí Rn+1 - R„ = rrupn g mý„ + mRn, neboli (4.88) Ä„+1 g (l + m)Ä„ + m<ŕ„, m = 0,..., .řV 1. Definujeme-li nyní funkci Zn, n = 0, .. , N, tekurencí (4.89) Zo = 0, Zn+i ~ (1 +m)Zn +m^„, n = 0, ...,JV 1, je n-l (4.90) Z„ = m^^(l + m)"-1-", n = 0,...,JV, v=a jak se snadno přesvědčíme např. úplnou indukcí. Na druhé straně, položíme-li V„ -= Z„ - iJ„, je zřejmě V0 = 0 a V„+i ž (1 + m)^ pro n = 0,.. - 1. Odtud však plyne, zeje K, ^ 0 pro n — 0,... ,N, tj. Zn^Rn.Z této nerovnosti, z rovnic (4.90), (4.87) a z nerovnosti (4.85) už tvrzení snadno plyne. Lemma 4.2. Buďdána D-stabiJn/mnohokroiová mefocřa (4.57) a buď A matice řádu k definovaná rovnicí (4.91) 1 0 _ Sil a* Pak existuje konstanta F taková, že platí (4-92) \\A"\\ ŽT, n 0,1, . . Symbolem ||. || přitom rozumíme -^„-(Čebysevovu) normu matice, tj. maticovou normu indukovanou JS^-normou vektoru (tj. normou vektoru, která je dána jeho složkou, která má maximální absolutní hodnotu). Důkaz. Charakteristický polynom matice A je zřejmě polynom g. Buď T (regulární) matice taková, že matice J = T'1 AT je v Jordánově kanonickém tvaru. 68 4 MNOHOKROKOVÉ METODY Protože je zřejmě A" - rj"7~_1, stačí dokázat omezenost n-tých mocnin matice J. Protože však J je blokově diagonální matice, stačí se dále omezit pouze na vyšetřování mocnin jednotlivých bloků. Vzhledem k podmínce stability jsou všechna vlastní čísla matice A v absolutní hodnotě menší nebo rovna jedné a ta z nich, která jsou v absolutní hodnotě rovna jedné, jsou jednoduchá. Jordánovy bloky příslušné vlastním číslům rovným v absolutní hodnotě jedné jsou tedy matice řádu jedna, tj. přímo tato vlastní čísla. Jejich mocniny jsou tedy zřejmě omezené. Bloky J, řádu r{ většího než jedna nutně přísluší vlastním číslům A, pro něž je |A| < 1. Kromě toho, úplnou indukcí se snadno zjistí, že pro ně platí (4.93) A*1 (I)*"-1 n—ri+l o 6) A-' A" Nyní zbývá už pouze uvědomit si, že jS?„j-norma matice je maximum ze součtů absolutních hodnot prvků v jednotlivých řádcích. Utvoříme-li totiž tyto řádkové součty, jsou všechny sčítance typu polynom v n krát |A|™_f*, kde ct je omezené. V důsledku toho, že je |A| < 1, konverguje každý sčítanec pro n —» oo k nule. Odtud však už lemma bezprostředně plyne. Poznámka 4.3. Lemma 4.2 platí zřejmé nejen pro Jžř^-normu, ale pro libovolnou maticovou normu. Lemma 4.3. Nechť z„ splňuje rovnici k k (4.94) Cř„zn+„ = h ^ 0ni>Zn + v + An ť = 0 pro n — 0,1,. ., kde av jsou koeficienty D-stabilní k-krokové metody a /?„„, v -= 0,..., h, n = 0,1, jsou libovolná čísla. Nechť dále Z, A, B a p jsou takové konstanty, že platí (4.95) (4.96) (4.97) \zf, \ S Z, {i = 0, -.,k-l, |A„|gA, n = 0,1,..., Vk„-—oj<.0, n = 0,1, a (4.1 |/3„i| = A n =0,1, 69 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Nechť je konečně ha číslo, pro něž je ho < (4.99) y Pak pro libovolné h á ho a libovolné n = 0,1,.. platí (4.100) |z„| 2 rZeL'nh +r*Ane-L*n\ kde r (4.101) r* (4.102) .» F je konstanta z lemmatu 4.2. I°*I(i-i£tM i* = r*s Důkaz. Přičtěme k levé i pravé straně rovnice (4.94) číslo Z/*=o A^otvzn+„. Po jednoduchých úpravách dostaneme (4.103) Odtud plyne, že pro h ^ h0 je (4.104) kde (4.105) neboť pro h í ho je výraz 1 — hfin^ja^ vzhledem k nerovnostem (4.98) a (4.95) kladný, a můžeme jím tedy dělit. Buď nyní z„ ^-dimenzionální vektor o složkách Zn,zn+i, • ■ • • zn+k-l a qn fc-dimenzionální vektor o složkách 0, 0,..., Pomocí těchto vektorů a matice A z lemmatu 4.2 můžeme rovnici (4.104) zapsat maticově takto: (4.106) neboť prvních k — l rovnic v (4.106) jsou identity a poslední rovnice je právě rovnice (4.104). Rovnice (4.106) je však ekvivalentní s rovnicí (4.107) Zn - ^zo + ^/r-1-^, 4 MNOHOKROKOVÉ METODY jak se snadno zjistí úplnou indukcí. Podle lemmatu 4.2 je tedy (4.108) Podle (4.105) je (4.109) IMšr||z„|| + r£|Mi Kl i°*i(i-fc*ř) /3 Protože je íj || pro í = 0,. . ,k — 1, dostáváme odtud, z (4.108) a z (4.95) až (4.98), že pro h 2 ho platí (4.110) ||2»||^r3 + £AL*||rr|| + r*An. Položíme-li v lemmatu 4.1 ip„ — \\zn\\, ipn = VZ + T*An a m - L*h, dostaneme z nerovnosti (4.110) nerovnost ti-i (4.111) ||zn|| ÚTZ + r*An + hL* J^{TZ + rAf)(l + hL*)™-1-" iz tak, že prc £(l + fcL* Upravme vzniklý výraz tak, že provedeme naznačené součty. Zřejmě platí (4.112) (4.113) (hL*)2 hL*' j;ili se snadno zjistí např. úplnou indukcí. Dosadíme-Ii do nerovnosti (4.111) ze vzorců (4.112) a (4.113), dostaneme po jednoduchých úpravách (4.114) hL* Požadované tvrzen! pak už plyne odtud, z nerovnosti \z„\ ú )|z„|| a z takřka zřejmých nerovností (4.115) (1 + hL*)" "1 en+v - L(y(xn};h), což je rovnice typu (4.94). K odhadu jejího řešení použijeme tedy lemmatu 4.3. Protože je zřejmě \gn\ g L, jsou předpoklady (4.95), (4.97) a (4.98) splněny, klademe-li (4.122) (I je lipschitzovská konstanta pravé strany dané diferenciální rovnice.) Protože podmínky stability jsou také splněny, zbývá odhadnout lokální chybu L (y(x„); h). K tomu použijeme stejně jako v případě jednokrokové metody modulu spojitosti u 72 4 MNOHOKROKOVÉ METODY derivace přesného řešení. Podle definice modulu spojitosti je \ý(xn+v) — y'{xn)\ £ S u(yh), a tedy existuje číslo 6„u takové, že je \8nu \ ž 1 a že platí (4.123) i/(£„+*) = s/(a;„) + r„„ui(vA). Dále, podle věty o střední hodnotě existuje číslo £„„ takové, že je xn < £„„ < z„+„ a že platí y(x„+„) = y(xn)-T-vhy'(£ni/). Existuje tedy číslo $'„„ takové, že je \6'n„\ .. + hlr(*n)(+ k k První dva sčítance na pravé straně rovnice (4.125) se rovnají nule v důsledku konzistence; platí tedy (je 0 g ui{vh) g u(kh), v= 1,2,... ,k) (4.126) kde (4.127) \L{y(xn)\h)\ £ Khu(kh), « = E(H«.I + IAI). Podle lemmatu 4.3 platí pro h < |on|/(I|ft|) a pro n takové, zeje xn e (a, b) (4.128) |e„| g [TS(h) + r*K(xn - aMfcA)]^1-—^*, kde r (4.129) r* = a V — V*B. Z nerovnosti (4.128) však už tvrzení věty ihned plyne. Věta 4.5 je dokázána. Ta část vzorce (4.128), která obsahuje funkci w, je zcela analogická obdobnému vzorci, který jsme odvodili pro Eulerovu nebo pro obecnou jednokrokovou metodu. Kromě toho však tento vzorec obsahuje navíc sčítanec, který charakterizuje chybu, které se dopouštíme nepřesným zadáním počátečních podmínek. Přítomnost tohoto členu je pro mnohokrokové metody typická, a rychlost konvergence je tedy u těchto metod dána nejen tím, jak rychle konverguje k nule lokální chyba, ale také tím, jak dobře jsou aproximovány počáteční podmínky. 73 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OLOHY S POČÁTEČNÍMI PODMÍNKAMI Z důkazu věty 4.5 je zřejmé, že lepší odhad, než je vzorec (4.128), dostaneme, odhadneme-tí lépe lokální chybu. Za předpokladu, že hledané řešení je dostatečně hladké, se to provede např. pro Adamsovu-Bashforthovu nebo pro Adamsovu-Moultonovu metodu snadno. Pro obě tyto metody totiž platí (4.130) L(y(x); h) = C^j/'+D^H-i pro vhodné f e (a, b), jak plyne ihned ze vzorců (4.32) a (4.38). Má-li tedy hledané řešení spojitou (p + l)-ní derivaci, je lokální chyba Adamsovy-Bashforthovy a Adamsovy-Moultonovy metody řádu hp+1. Vztah analogický k (4.130) sice obecně pro lineární fc-krokovou metodu neplatí, platí však následující tvrzení. Lemma 4.4. Buď dána lineární k-kioková metoda řádu pž 1 a buď y funkce mající p + 1 spojitých derivací v intervalu (a, b). Pak platí (4.131) kde (4.132) \L{y(x);h)\ŠGYh"+l, Y = max \y(p+1)(x)\, G= ľ\g(s)\ds, Jo (4.133) funkce g je dána rovnicí (4134) „(,) = £ g(„ - sf+ - j^fy - (s)+ + A ľ(x-tyy<-q+1\t)dt. Užijeme-li tento vzorec pro funkce y a y' a pro í = x + vh, máme (4.136) y(x + vh) = y(x) + vhy>(x) +...+ ^jVrhF^(x)+ J.P + 1 ŕ" + ~- / (v syV^+l1{x + hs)ds P- Jo 74 4 MNOHOKROKOVÉ METODY (4.137) t/(z + vh) = y'(x) + vhy"(x) +...+--—v^hf-^^-r (p - 1)! + j^jy jf (v - sf-'y^Hx + hs) d s. Vynásobíme-li rovnici (4.136) číslem a„, rovnici (4.137) číslem -hp„ a sečteme pro v = 0 až k, dostaneme (srov, vzorce (4.64)) (4.138) L(y(x); h) = CBy(x) + Ciy'(x)h + ...+ Cfy^{x)h?+ Metoda je řádu p; proto je Co = Ci = ... = Cp = 0. Dále je (1139) [ {^^-')p-^riy^-^-1]y v. Dosazením do (4.138) je tedy ŕ (4.140) L(y(x);h) = h''+1 g(a)y^+1^x + sh) d s. Jo Odtud však už lemma ihned plyne. Poznámka 4.4. Nemění-li funkce g v intervalu (0, k) znaménko, platí pro lokální chybu dokonce (4.141) L(y(x); h) - Cp+1^+V(p+1)(0 a (4-142) Cp+1 = ľg(s)ds, Jo jak plyne ihned z první věty o střední hodnotě integrálního počtu. Z lemmatu 4.4 a z důkazu věty 4.5 už snadno plyne, že platí následující věta. Věta 4.6. Nechť je dána D-stabilní mnohokroková metoda řádu p ž 1. Nechť jsou splněny předpoklady (i) a (ii) t 11. 1 a nechť řešení dané diferenciální rovnice máp+1 spojitých derivací v intervalu (a, b). Pak pro h < ]ak\/(L|ft |) píatí (4.143) lift, - y(xn)\ g [T6(h) 4- T'{x„ - a)GYhp]e^-^L' 70 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI pro každén takové, že je xn e (a, b). Funkce 6 je přitom definována vzorcem (4.116) a význam konstant T,V*, L*, G aY je stejný jako v lemmatech 4.3 a 4.4. Znovu připomeňme, že k tomu, aby chyba, která vznikne řešením diferenciální rovnice (1.6) mnohokrokovou metodou řádu p, byla řádu hp, nestačí jen dostatečná hladkost řešeni, jako tomu bylo u obecné jednokrokové metody. Navíc musí být i k počátečních podmínek, jimiž je přibližné řešení určeno, zadáno s přesností hp 4.2.3 Asymptotický odhad chyby Vyšetřování asymptotického chování chyby je v případě mnohokrokové metody podstatně komplikovanější než v případě jednokrokové metody. Dalo se to ostatně očekávat, neboť u mnohokrokové metody závisí přibližné řešení nejen na integračním kroku, ale i na počátečních podmínkách. Abychom získali alespoň orientační výsledky, omezíme se na jednoduchý případ diferenciální rovnice (4.144) j/ = Ay s počáteční podmínkou y(0) = 1, kde A je nenulová konstanta. Přesné řešení tohoto problému je tedy funkce y(x) = eAx. Buď dále dána D-stabilní ij-kroková metoda (4.57) řádu 1 a předpokládejme navíc, že příslušné charakteristické polynomy g a " - hAfi„)ť = e(í) - nAž = yr> r=0> ■■•k~l x — 1 pro neznámé A\,..., Aj. má při libovolných y0,..., yk-i řešení. Determinant této soustavy je však Vandermondův determinant pro čísla {i,..., fit a protože tato čísla jsou navzájem různá, je tento determinant různý od nuly. Abychom tedy vyšetřili chování řešení rovnice (4.145), musíme začít zkoumáním vlastností kořenů polynomu g. To provedeme v následujícím lemmatu. Lemma 4.5. Nechť polynomy g a cr jsou nesoudělné a nechť £s je kořen polynomu e násobnosti r. Pak existuje funkce $ komplexní proměnné t, která je holomorfní v okolí bodu t = 0 a taková, že položíme-li £s = <Ě(fr1/r), kde hltr je jedna z r (navzájem různých) hodnot r-té odmocniny z h, je toto £s pro dostatečně malá h kořen polynomu g. Důkaz. Předpokládejme nejprve, že je jednoduchý kořen polynomu g. Protože polynomy g a a nemají netriviálního společného dělitele, má funkce (4.149) h = fc(í) = -4£L A(f) = 0. Buď nyní kořen polynomu q násobnosti r > 1. Za tohoto předpokladu platí, že je fc(í) = (í — ÍjJ'vÍÍ) aipje holomorfní a různá od nuly v bodě ( — (,. Existuje tedy funkce ij>, která je holomorfní v okolí bodu f = a pro niž platí V,r(í) = (0. Tato funkce je holomorfní v okolí bodu £ = £s a platí pro ni í(íí) = 0, í'(í,) = V(6>) + 0. Existuje tedy funkce £ = 4(ť), která je holomorfní v okolí počátku a která je inverzní k funkci í = ť(£) (viz např. Černý (1967)). K dokončení důkazu už stačí uvědomit si, že funkce f = <ř(t) udává tu hodnotu £. která je při daném ŕ kořenem rovnice p(£) = trAc(^) = 0. Důkaz je hotov. Z uvedeného lemmatu plyne, že pro dostatečně malé ň leží v okolí každého jednoduchého kořene polynomu g právě jeden kořen polynomu p a v okolí každého kořene polynomu g násobnosti r právě r kořenů polynomu g. Tyto kořeny polynomu g, na něž se rozštěpí r-násobný kořen polynomu p, jsou navzájem různé, neboť vzniknou 76 77 i. obyčejné diferenciální rovnice - olohy s počátečními podmínkami 4 mnohokrokové metody dosazením r-různých hodnot r-té odmocniny z ft do holomorfní funkce, která je prostá. Kořeny polynomu q jsou tedy navzájem různé a řešení rovnice (4.145) se dá psát pro dostatečně malé h ve tvaru (4.147). Buďte £l,...,{í kořeny polynomu q (každý z nich píšeme tolikrát, kolik činí jeho násobnost) a očíslujme je speciálně. Protože daná metoda je stabilní, platí pro každé s, že Ž 1. Má-li polynom g m kořenů v absolutní hodnotě rovných jedné, přidělme jim indexy 1,..., m a speciálně položme £i = 1 (takový kořen v důsledku toho, že je p ž 1 zaručeně existuje). Tyto kořeny nazveme podsiatné. V důsledku instability o nich víme, že jsou všechny jednoduché. Zbývající kořeny (pokud existují) označíme fm+i,..., £i a nazveme je nepodstatné. Kořeny polynomu q očíslujeme tak, že pro dostatečně malé h leží kořen £Ä v okolí kořene £s, s = 1,..., k. Je-li ís kořen polynomu q, který se pro d -> 0 blíží k nepodstatnému kořenu polynomu g (tj. je-li s — m + 1, .., k), existuje konstanta t < 1 taková, že platí (4.150) lí.| = * pro s — ra + 1, ..., k a pro dostatečně malé h. To je zřejmé, neboť nepodstatné kořeny polynomu g leží uvnitř jednotkového kruhu a za číslo t lze tedy vzít např. (4.151) * = !(! + max =m+l,... ie.D- Kořeny £s závisí pro s = 1,..., m na integračním kroku h podle lemmatu 4.5 analyticky, neboť podstatné kořeny jsou jednoduché. Platí tedy (4.152) t, = a + l3h + 0(h2) pro h —í 0 a pro í = 1,,, , m. Určeme koeficienty a a /?. Zřejmě je a = neboť ía ~* ía pro h —» 0. Dosazením do rovnice ě(£) — 0 a užitím Taylorova vzorce dostaneme, ze existují čísla a £** taková, že platí (4.153) ř(í.) + [/??«+ o^Mk) + + o(fc2)] V'(č;)- - hA{o-(£,) + \fih + 0(h2)y(C')} = o, neboli (4.154) W&)- Acr(t3)]h + 0(h2)=Q., protože je ř?(fs) ~ 0. Porovnáním koeficientů u stejných mocnin h na levé a pravé straně rovnice (4.154) dostaneme, že pro s — 1,..., m platí (4.155) kde číslo (4.156) 78 í. =í,[l + A5J4/i + 0(íi2)], a, nazveme růstovým parametrem příslušným k podstatnému kořenu £,. Všimněme si, že v důsledku ÍJ-stability má definice růstových parametrů smysl a že v důsledku konzistence je Ai =: 1. Vyšetřeme nyní chování mocnin kořenů fs při h —> 0 a xn = nh = konst. Platí (4.157) [l + XsAh + 0(h2)]n e"Hi+*.Ah+o(h>)] = ^mi+í.am-oc/.1)] _ a tedy, položíme-li (4.158) 6 = tÍV-pro s = 1,..., m, máme (4.159) Č S ein<'-[eA-J*"'- + O(h)]. Speciálně pro s = 1 platí = e"*1* + 0(h). Určeme funkci O(h) v této rovnici přesněji. Podle rovnice (4.155) je (4.160) (ii=eah+t, kde t je analytická funkce h, která se pro h —* 0 chová jako 0(/i2). Abychom určili tuto funkci přesněji, dosaďme do rovnice p(£) = 0. Užitím Taylorova vzorce dostaneme (4.161) e(eAh) + Te'(eAh) + 0(r2) - hAo-(eAh) + 0(hr) = 0. Předně platí 0(r2) + 0(hr) = O(hr) pro h -» 0, neboť je r = 0(ři2). Dále, pro každou funkci t/, která má p + 2 spojitých derivací v (a, b), platí (4.162) ^2auy(x + vh)-h^2Mi* + vh) i = Cf,+i^"+1J(jr)ftf,+1 + O^2), neboť daná metoda je řádu p. Platnost vztahu (4.162) se snadno ověří analogickým postupem jako v důkazu lemmatu 4.4. Speciálně, dosadíme-li do (4.162) za y funkci e^1, dostáváme k k (4.163) av■ 0 platí (4.166) kde jsme položili (4.167) r = -C(A^+1 + 0(hp+2), Poznamenejme, že konstanta C patří k jedné z charakteristik dané metody a nazýva se konstanta chyby. Dosadíme-li do (4.160) z (4.166), máme (4.168) Či = eAh - C(Ahy+1 + 0(hp+2) = _ eAh{l - [C(Ah)'+1 + 0(hP+2)]e-Ah} - = eAh{l - [C(Ahf+1 + 0(h"+2)][l + 0(h)]} = = eAh[l - C(Ah)t>+1 + 0(hp+2)]. Odtud ihned plyne, že pro h —> 0 a xn = nh = konst. platí (4.169) $ = eAx-[\ - x^A^CW + 0{h?+l)l neboť je (4.170) [l-C(^ft)P+1 + 0(ftp+2)]"=eí^1"[1-c<'4'')'+1+0(','+2» - = e{-«.cJ4'+'ft'+o(*'+')} = fl _ xnCAp+1hp + 0(h"+1)][l + 0(h"+1)]. Nyní už máme představu, jak závisí na h mocniny kořenů £, ve vzorci (4.147). Dalším naším úkolem je vyjádřit koeficienty As v tomto vzorci pomocí počátečních podmínek. Čísla As splňují soustavu lineárních algebraických rovnic (4.148). Abychom tuto soustavu rozřešili, definujme čísla ír, r = 0,. ., k - 1, rovnicemi (4.171) Sr = yr - í[ a polynomy g„, v — 1,..., ír, rovnicemi (4.172) é„(Č) = -^t = í„0 + a„ť + + ov.t-lČ*-1 Protože je e(íľ) — O pr° " = 1> > platí (4.173) ř„í.) = ' ^ L e (v)> " = *• Dosadíme-li za pravou stranu v rovnici (4.148) podle (4.171), vynásobíme-li každou z takto vzniklých rovnic koeficientem ä„r a sečteme od r = 0 do r = i - 1, 80 dostaneme ifc (4.174) = š„(fl) + Ař, v = 1,,. ,fc, 1=1 kde fc—i (4.175) Á„ = ^ä„ír. r=0 Použijeme-li rovnic (4.173), přejdou rovnice (4.174) v (4.176) Arě'&) = ě„(Íi) + í„ v = l,...,k. Protože je é'(Čľ) ^ 0 pro v — 1,.,., Jfc (kořeny polynomu q jsou jednoduché), plyne z rovnic (4.176), že platí (4.177) Al=l+-^lT, Av=^r-;, V~2,...,k. ě'(6) Podařilo se nám tedy jednoduše vyjádřit koeficienty Av pomocí veličin A„. Koeficienty ävr, které vystupují v definici těchto A^ však závisí na h. Pokusme se tuto závislost blíže osvětlit. Definujme proto pro v — l,...,k veličiny A„ rovnicemi t-i (4.178) A. = £«„«,., r = 0 kde (4.179) ft-(fí=í?^- = «,o+ +aVjk-ie-\ takže koeficienty otVT už na h nezávisí. Zřejmě platí (4-180) lÄ.-A^á í £>,r kde (4.181) S- max Ir, I. J = 0,.„,*-i K posouzení rozdílu A„ — A„ je tedy třeba odhadnout rozdíl 5ivr — a„r. Koeficienty r+1 - a„,r+i) 81 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI pro r = fc - 1,..., 0. Protože však platí podle lemmatu 4.5, že je (4.184) ^Ofh1/*), kde s je násobnost kořene polynomu g a protože je äT = ar — hAf}r, plyne z rovnic (4.183) snadno úplnou indukcí, že platí (4.185) a„r-avr = 0(h1''), a tedy, že je i- (4.186) Ä„ - A„ + 0(Shí/s). Vyšetřeme konečně, jak závisí na h čísla Podle definice polynomu g platí (4.187) ě'(í„) = g'(Í„) - hAcrfa). Podle Taylorova vzorce platí pro každé s š k (4.188) ŕ'(í„) = e'(í„) + ^/'(Wl - ť,) + .. .+ Je-li £„ s-násobný kořen polynomu ý, plyne ze vzorcu (4.188) a (4.184), že platí (4.189) = ^-Ljjet*)^)^ - ť,)*"1 + 0(Ä). Pro jednoduchý kořen f„ polynomu g tedy odtud a z (4.187) dostáváme (4.190) ě'(í„) = r>'(6>) + 0(/O. Buď nyní kořen polynomu g násobnosti s. Holomorfní funkce <ř vystupující v lemmatu 4.5 má v bodě t — 0 derivaci od nuly různou. Platí tedy nejen (4.184), ale existuje dokonce konstanta fv ^ 0 taková, že je (4.191) tr-t^^hV'll + Oih1'')]. Použijeme-li rovnice (4.187) a (4.189), plyne odtud, že pro kořen polynomu g násobnosti s platí (4.192) é'({"„) = e^-^'ll + OÍÄ1'*)] + 0(h) = = evhl-1V'[l + 0(h1'')], kde £„ ^ 0 je vhodná konstanta. Získané odhady už umožňují posoudit závislost koeficientů Av na h. Dosadíme-li do vzorce (4.177) podle (4.186) a (4.190), dostaneme (4.193) 82 0(Sh), i/-2,...,m, 4 MNOHOKROKOVÉ METODY neboť kořeny £„ jsou pro v = 1,..., m jednoduché. Pro c = m+1,..., fc o násobnosti kořenů nic nevíme, a musíme proto vyjít ze vzorce (4.192) platného pro libovolnou násobnost. Z něj snadno plyne, že je (4.194) Pro v = tn + 1, (4.195) &{L) £<,h(-i)/>[l + 0(hU°)] , k tedy máme A, = [A„ + 0(*V/*)]o(i) =0(£)- Dosaďme konečně do vzorce (4.147) odhady (4.150), (4.159), (4.169) (4.193) a (4.195). Dostaneme (4.196) yn = [l + + 0(ž/»)]e^"[l - a^C^1*,' + 0(fcř+1)]+ »=3 LťWľJ »=m+l " Odečteme-li od levé i pravé strany rovnice (4.196) přesné řešení y(xn) = e^1", dostaneme po jednoduchých úpravách (4.197) yn-y(x„)- - x^CA^e^h" +0(h"+1)+ neboť e""/h/h2 -^Opro/i-tO. Čísla A„ jsou dána vzorci (4.178), a závisí tedy na daných počátečních podmínkách dosti nepřehledně. Vyšetřeme proto podrobněji tuto závislost, samozřejmě za vhodných doplňujících předpokladů. Předně podle (4.171) platí pro s = 0.....k — l (4.198) S.=y,~ íí = y(xs) - řf; + y, - y{xs). Pro |i však platí (4.168). Pro s = 0,..., fc - 1 tedy platí (4.199) £{ = eAsh[í - (Ahf+1C+ 0(W+2)]J = e"'* +0(np+1). Dosazení do (4.198) tedy máme (4.200) í, = !/s-i/(^) + 0(ft',+1). Předpokládejme dále, že počáteční hodnoty jfoi • • • > íte-i jsou dány s přesností hq (q je nějaké přirozené číslo) a že pro ně platí asymptotické vzorce (4.201) y. = »(*.) + i.hf + o(h"+1), s = o,..., fc -1, 83 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI kde 7, jsou konstanty. Položíme-li k-l (4.202) D„=£a»,7„ s = 1> 1 = 0 můžeme psát (4.203) A„ = Dvhq + 0(hr+1), v=l, .k, kde (4.204) r = min(p, q). Protože je za uvedených předpokladů 0(Sh) = 0(h,+1), dostáváme dosazením do (4.197) konečný výsledek, který zformulujeme do věty. Věta 4.7. Buď dána diferenciám; rovnice yf — Ay s počáteční podmínkou y(0) = 1 a buďy„ její přibližné řešení získané lineární k-krokovou metodou řádu p, které je určené počátečními podmínkami, pro něž platí (4.201). Pak píaíi (4.205) jfr, -»(*„)= -znC^+1e*"hř+ m _ + k*Y _±^ei"*,"eA-^" + 0(hr+1), fťi kde f„ = e"p" jsou kořeny charakteristického polynomu g, které jsou v absolutní hodnotě rovny jedné, C a A„ jsou konstanty dane' vzorci (4.167) a (4.156), D„ jsou funkce počátečních podmínek definované vzorci (4.202) a pro r platí (4.204). Ze vzorce (4.205) je vidět, že celková diskretizační chyba se skládá ze dvou podstatně odlišných částí. První část daná členem -i„CipWejll-/iř plně odpovídá celkové diskretizační chybě u obecné jednokrokové metody, neboť funkce -xCApJrleAx je řešením diferenciální rovnice e' = fy(x,y(x))e + p(x,y(x)), kde 1, objeví se v součtu (4.205) dodatečné oscilační členy (oscilační v důsledku přítomnosti činitele e'"""), jejichž amplituda je úměrná číslu e^"^*. Je-li X„A < A, nejsou rovněž nebezpečné. V opačném případě však jejich amplituda roste rychleji než přesné řešení, a mohou tedy velmi rychle počítané řešení úplně znehodnotit. 84 4 MNOHOKROKOVÉ METODY Na první pohled se může zdát, že všech potíží se startovní chybou se zbavíme, zadáme-li počáteční podmínky pro přibližné řešení přesně. Nehledě na to, že z praktického hlediska je takové opatření obecně těžko proveditelné, není tato úvaha ani věcně správná. Ze vzorce (4.198) je totiž vidět, že veličiny &„ nejsou v tomto případě rovny nule. Je tedy S / 0 a vrátíme-li se ke vzorci (4.197), z něhož jsme vzorec (4.205) odvodili, vidíme, že startovní chyba se tak jako tak objeví. Ani volba y„ = vedoucí k <5„ = 0 mnoho nespraví, neboť v důsledku zaokrouhlování nejsme schopni splnit tyto podmínky přesně. Ilustrujme popsané chování jednoduchým příkladem: Příklad 4.2. Uvažujme metodu (4-206) yn+2 = y„ + 2hfn+l. Tato explicitní metoda je řádu 2 a je pro ní g(£) = £2 — 1, <7(f) = 2£, fi = 1 a Í2 = — 1. Podstatné kořeny jsou tedy dva (m = 2) a příslušné růstové parametry jsou Ai = 1 a A2 = —1. Rešíme-li touto metodou modelovou diferenciální rovnici t/ = Ay s A < 0, osciluje chyba s amplitudou úměrnou ě~Al:, a tedy s délkou intervalu, v němž hledáme řešení, exponenciálně roste. Řešme metodou (4.206) nelineární diferenciální rovnici (4.207) j/ = l-J/2 s počáteční podmínkou y(0) = 5. Výsledky jsou pro h = 1/64 uvedeny v tab. 4.9, která pro srovnání obsahuje také výsledky získané dvoukrokovou Adamsovou-Bashforthovou metodou. V obou případech jsme za t/i vzali hodnotu přesného řešení. I když rovnice (4.207) je nelineární, jev, který jsme předpověděli pro modelovou rovnici, nastává i zde. Metody, které se chovají jako metoda (4.206), tj. metody, pro něž je m > 1 a některý z růstových parametrů je záporný, se nazývají slabě nestabilní. Tyto metody jsou sice D-stabilní, a tedy konvergentní (tj. při daném intervalu, ve kterém hledáme řešení, lze volbou dostatečně malého integračního kroku a dostatečně přesnou aproximací počátečních hodnot dosáhnout toho, že chyba je libovolně malá), závislost integračního kroku a přesnosti aproximace počátečních podmínek však není stejnoměrná vzhledem k intervalu, v němž hledáme řešení. Tato skutečnost je z praktického hlediska značně nepříjemná, neboť integrační krok a přesnost počátečních podmínek, které jsou dostačující v daném intervalu, nemusí stačit, objeví-li se nutnost řešit danou rovnici na delším intervalu. I když všechny zde provedené úvahy platí přísně vzato pouze pro modelovou diferenciální rovnici y' — Ay, dávají kvalitativně velmi přesnou indikaci o chování chyby v obecném případě. To je intuitivně jasné a dá se to i teoreticky dokázat. Do dalších podrobností (které jsou formálně značně složité) však nebudeme zacházet. Závěrem ještě upozorněme, že užít existenci asymptotického vzorce k získání odhadu chyby metodou polovičního kroku (podobně jako v případě obecné jedno- 85 L OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Tabulka 4.8 Řešeni diferenciální rovnice (4.207) dvěma dvoukrokovými metodami Metoda (4.206) Adamsova-B ashforthova 71 metoda Vn en Vn 0 5 000000 0 5,000000 0 1 4 652 200 0 4,652 200 0 2 4 354907 0,003373 4,355881 0,004347 63 1 159287 -0,048115 1,206 536 0,001252 64 1 246457 0,048115 1,199552 0,001210 65 1 141986 -0,049670 1,192 825 0,001170 127 0 599828 -0,425689 1,025688 0,000171 128 1 409513 0,384790 1,024888 0,000166 129 0 568993 -0, 454960 1,024114 0, 000 161 191 -1 606091 -2,609506 1,003 441 0,000 026 192 1, 827522 0,824211 1,003336 0,000025 193 -1, 679211 -2,682419 1,003 233 0,000 024 krokové metody) lze jen tehdy, je-li zaručeno, že hlavní část celkové diskretizačm chyby se chová „rozumně", tj. nenastávají-li jevy slabé nestability, 4.2.4 Problematika zaokrouhlovacích chyb V tomto odstavci si velice stručně všimneme problematiky šíření zaokrouhlovacích chyb. Zavedeme-li opět zcela analogicky jako u jednokrokové metody lokální zaok-rouhlovací chybu en, splňuje skutečně počítané přibližné řešení yn rovnici t k (4.208) ^2 avýn+w = A ^ 0vf(xn+u, jř„+„) + e„ w=0 v=C s počátečními podmínkami y0, • • ■, Št-i- Použijeme-li lemma 4.3, dostáváme ihned, že platí následující věta. Věta 4.8. Buďyn přibližné řešení vypočtené D-stabilní mnohokrokovou metodou a buď yn řešení rovnice (4.208). Buď konečně \en\ £ e pro n a 0, ..., JV. Pak 86 4 MNOHOKROKOVÉ METODY píati (4.209) |íín-2/nláír maí \v.-y,\ + T*(xn-a)jU'--^L'. L a=0,...,B —1 íl\ Vidíme tedy, že celková zaokrouhlovaní chyba bez ohledu na řád metody roste při h -+ 0 opět lineárně. O důsledcích, které z tohoto poznatku plynou, platí tak doslovně totéž, co bylo řečeno u Eulerovy metody nebo u obecné jednokrokové metody. 4.2.5 Stabilita při pevném integračním kroku Charakter vět týkajících se konvergence metod, které jsme až dosud uvedli, je asymptotický, tj. příslušná tvrzení platí pro dostatečně malá h. Jen pro dostatečně malé h je např. zaručeno, že při užití D-stabilní a konzistentní mnohokrokové metody (ale také např. Rungovy-Kuttovy metody) nedojde při rekurentním užívání příslušného vzorce ke katastrofálnímu nakupení lokálních chyb a celková diskretizační chyba zůstane přijatelně malá. Při konkrétním výpočtu však vždy pracujeme s pevným h, které nemusí být dostatečně malé. V této souvislosti je důležitý pojem tzv. intervalu absolutní stability dané metody. Zhruba řečeno, chceme, aby to byl takový interval, že leží-li v něm číslo hA, kde h je integrační krok a A je odhad pro derivace dfjdy, je více méně zaručeno, že lokální chyby, kterých se dopouštíme v jednotlivých krocích, se v průběhu výpočtu tlumí. Jinými slovy žádáme, aby přibližné řešení modelové diferenciální rovnice t/ = Ay při pevném h konvergovalo pro n —► oo k nule. Přistupme nyní k přesné definici. Zaveďme k tomu cíli tzv. třetí charakteristický polynom ir dané fc-krokové metody rovnicí (4.210) »({,*) = e(í) - M"(ť). Definice 4.5. Řekneme, že lineární fe-kroková metoda daná polynomy g a a je pro dané z absolutně stabilní, platí-li pro všechny kořeny £ä, s — 1.....k, polynomu jr nerovnosti < 1. V opačném případě říkáme, že daná metoda je pro dané z absolutně nestabilní. Intervalem absolutní stability pak rozumíme největší takový interval, že pro z v něm ležící je metoda absolutně stabilní. Poznámka 4.5. Je zřejmé, že analogickou definici lze vyslovit i pro jednokro-kovou metodu. Na základě motivace předcházející tuto definici se lze domnívat, že při užití integračního kroku h takového, že z určené rovnicí (4.211) z = hA leží v intervalu absolutní stability, nedojde v průběhu řešení k nepřípustnému růstu chyby. 87 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI 4 MNOHOKROKOVÉ METODY Interval absolutní stability dané mnohokrokové metody je určen pouze jejími koeficienty. Přípustný integrační krok je však rovnicí (4.211) vázán na konkrétní diferenciální rovnici. V případě obecné nelineární rovnice klademe, jak už jsme řekli, A — df/dy. Veličina d fjdy není samozřejmě konstantní; za A se bere v tomto případě odhad derivace df/dy nebo některá její typická hodnota, která se v průběhu výpočtu eventuálně mění. Změnám ve volbě A pak přirozeně odpovídají i změny v maximální přípustné velikosti integračního kroku. Snadno se zjistí (viz cvič. 9), že každá D-stabilní a konzistentní lineární fc-kroková metoda je absolutně nestabilní pro každé dostatečně malé kladné z, Odtud plyne, že užije-li se mnohokroková metoda k řešení diferenciální rovnice, pro níž je df/dy > > 0, chyba v průběhu výpočtu roste. To však není tak vážné, jak by se mohlo na první pohled zdát. Uvedené tvrzení platí totiž přesně pouze za předpokladu, že daná diferenciální rovnice je typu y1 = Ay 4- q(x), kde A je konstanta. Řešení této rovnice obsahuje člen eAl, který je aproximován členem f", kde {i je ten kořen polynomu ir, pro který platí {i —» 1 pro h —* 0 (srv. vzorec (4.169)). Zdá se tedy, že převládne-li v přibližném řešení tento člen, chyba sice v průběhu řešení poroste, ale tento růst bude úměrný řešení. To však je přijatelná situace. Úvahy tohoto typu vedou k vyslovení alternativní definice stability, kdy řekneme, že pro dané z je metoda relativně stabilní, platí-li pro kořeny polynomu ir nerovnosti |f, | < |£i pro s = 2,..., k. Interval relativní stability je pak maximální interval takový, že pro z v něm ležící je metoda relativně stabilní. V souvislosti s popisovanou problematikou se v literatuře vyskytuje řada mírně se navzájem lišících definic — je to např. požadavek, že je |í» | ž |{i | a ty kořeny £s, pro něž nastává rovnost, jsou jednoduché, nebo požadavek, že je \(, | S e* apod. — a vždy se přitom mluví o relativní stabilitě. Rozdíly sice nejsou většinou podstatné, je však třeba při porovnávání výsledků si vždy uvědomit příslušnou přesnou dciinici. I když se zdá, že pojem relativní stability byl zaveden pouze proto, abychom byli schopni pracovat s případem z > 0, je užitečný i v obecném případě. Existují dokonce dobré důvody domnívat se, že relativní stabilita je pro posouzení chování chyby výstižnější než absolutní stabilita. Na druhé straně je však těžší ji podrobně analyzovat. Upozorněme ještě, že přestože intervaly stability představují velice užitečnou charakteristiku dané metody, při utváření příliš kategorických soudů na jejich základě je třeba být opatrný. Veškeré úvahy, které odtud vycházejí, jsou totiž ovlivněny tím, že se vlastně předpokládá, že df/dy je konstantní. Pro silně nelineární problémy, kdy se hodnota funkce df/dy rychle mění, dává naznačená teorie jen hrubou orientaci a je nebezpečné brát velikost integračního kroku příliš blízko největší přípustné odhadnuté hodnotě. 4.2.6 Optimální metody V tomto odstavci si všimneme přirozené otázky, jak sestrojit lineární jfc-krokovou metodu, která je maximálního možného řádu. Polynomy o a cr, jimiž je metoda 88 definována, mají dohromady 1k + 2 koeficientů. Jeden z nich lze libovolně volit, neboť polynomy ctg a aer, kde a = konst. ^ 0, definují zřejmě tutéž metodu, takže podstatných koeficientů je pouze 2k + 1. Uvažujeme-li tedy pouze podmínky určující, že metoda je řádu p, je možno obecně dosáhnout, že je p = 2k (viz definice 4.2). Konvergentní metoda však musí být navíc stabilní. Tento požadavek patrně nedovolí dosáhnout výše zmíněného maximálního řádu. Abychom relaci mezi p a k blíže objasnili, začneme poněkud jiným, jednodušším problémem. Buď dán polynom g stupně k, který splňuje podmínky stability a pro nějž platí g{l) = 0. Máme sestrojit polynom tr stupně nejvýše k tak, aby ŕ-kroková metoda daná polynomy q a cr měla maximální řád. Abychom takový polynom sestrojili, definujme nejprve řád mnohokrokové metody poněkud jiným způsobem než v definici 4.2. Buď tedy dána lineární fc-kroková metoda, tj. polynomy Q a cr. Definujme funkci tp komplexní proměnné £ vzorcem (4.212) lní r(í)-*(í). přičemž jednoznačnou větev funkce ln£ zvolíme tak, že rozřízneme komplexní rovinu podél záporné reálné osy a položíme ln 1 = 0. Funkce l/ln£ má v bodě £ = 1 pól prvního řádu. Je-li daná metoda konzistentní, je g(l) = 0, a tedy funkce p({)/ln£ je holomorfní v bodě £ — 1. Totéž platí samozřejmě i pro funkci tp. Zmíněná alternativní definice řádu mnohokrokové metody se opírá o následující větu. Věta 4.9. K tomu, aby mnohokroková metoda daná polynomy g aer, byla řádu p, je nutne a stačí, aby funkce f> definovaná rovnicí (4.212) měla v bodě { = 1 kořen násobnosti p. Důkaz. Nechť daná metoda je řádu p. Pak pro každou dostatečné hladkou funkci y platí (4.213) L(y(x); h) = Cp+Ij/(f>+1>(z)ň-(p+1) + 0(h*>+2) a je Cp+i ^ 0. Tedy speciálně, položíme-li ve vztahu (4.213) y(x) = e*, máme (4.214) neboli (4.215) e1 ^ Wh hex Yjpveřh = C^h'*1 + 0(h*+2), g(eh) - h k + 1, platí-li pro koeficienty v rozvoji (4.217) c^+1 = Cjr+2 = ... = ep_x = 0. Tato poznámka, i když je triviální, bude v dalších úvahách velmi užitečná. Vraťme se nyní ke studiu fc-krokové stabilní metody mající nejvyšší možný řád. Z věty 4.10 plyne, že tato v právě uvedeném smyslu optimální metoda má řád nejméně k +1. Toto číslo však už nelze o mnoho překročit, jak vyplývá z následujících vět. Věta 4.11. Stabilní k-kroková metoda s lichým k nemůže být řádu vyššího než fc + 1. 90 4 MNOHOKROKOVÉ METODY Věta 4.12. Stabilní k-kroková metoda se sudým k je řádu nejvýše k+ 2. Rádu právě k + 2 je tehdy a jen tehdy, má-li polynom g všechny kořeny v absolutní hodnotě rovny jedné, je-li +1 a —1 mezi nimi a je-li polynom c určen podle věty 4.10, Při lichém k tedy existuje nekonečně mnoho optimálních metod. Abychom některou z nich dostali, stačí zřejmě vzít libovolný polynom g splňující podmínky stability a takový, že je g(l) — 0 a určit polynom tr podle věty 4.10. Optimálních fc-krokových metod při sudém k > 2 je sice také nekonečně mnoho, jejich množina je však podstatně užší než v případě lichého k a její struktura je zcela popsána ve větě 4.12. K důkazu vět 4.11 a 4.12 budeme potřebovat řadu pomocných tvrzení. Lemma 4.6. Buď g polynom stupně k a buď r polynom deňnovaný rovnicí (4,19) ,(„=(^,([±3, Buď dále f o ^ — 1 kořen polynomu g násobnosti m. Pak (4.220) 20 = ^1 je m-násobným kořenem polynomu r. Naopak, buď zq ^ 1 kořen polynomu r násobnosti m. Pak (4.221) je m-násobný kořen polynomu (4-222) e(0=(í + i)*r(í^i). Důkaz Je-li 7^ —1 m-násobný kořen polynomu g, platí (4-223) g(0 = Íyř('»>(ío)(í - ťoj™ + ... a g(m)(£o) ^ 0. Dosazením do (4.219) dostáváme, že je _l-Mo 1-20 (4.224) 1-20 Z vyjádření (4.224) je však vidět, že koeficient u (z — zo)m je od nuly různý. První část našeho tvrzení je tedy dokázána. Druhá část se dokáže zcela analogicky, Lemma 4.7. Buď—1 jednoduchý kořen polynomu g. Pak polynom r definovaný rovnicí (4.219) je stupně k — 1. Naopak, nechť polynom r je stupně k — 1. Pat polynom g daný vzorcem (4.222) má jednoduchý kořen -1. 91 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Důkaz Pro polynom g platí (4.225) g(0 = ie'(-l)(č +1) +.. • + lem(-m + !)*■ Je tedy (4.226) ^.(^^^^..^^(-l)^)'] Odtud však už plyne první část tvrzení. Důkaz druhé části tvrzení je stejné snadný. Lemma 4.8. Nechť polynom g splňuje podmínky stability. Pak pro kořeny Zi polynomu r definovaného rovnicí (4.219) plat/Rez,- í Oa ty kořeny Zi, pro které je Rez, = 0, jsou jednoduché. Důkaz plyne ihned z lemmat 4.6 a 4.7. Lemma 4.9. Nechť jsou splněny předpoklady lemmatu 4.8 a nechť je g(l) = 0. Pak plat/ (4.227) r(z) = aiz+ ... + atzk kde oi 5í 0 a všechny ostatní koeficienty a,- mají stejná znaménka jako ai nebojsou to nuly. Důkaz. Podle lemmatu 4.6 platí r(0) = 0, r'(0) ŕ 0, tedy platí (4.227) a aj / 0. Abychom dokázali platnost dalšího tvrzení, označme Zi kořeny polynomu r. Položíme-li Zj = — xj + ij/3, je xj ž 0 podle lemmatu 4.8 (polynom splňuje podmínky stability). Platí tedy (4.228) r(z) = a,z J[(z + x<) J[ [(z + xtf + y]}, • i kde index i probíhá hodnoty příslušné reálným kořenům polynomu r, j hodnoty příslušné párům komplexně sdružených kořenů polynomu a aj je nejvyšší nenulový koeficient v rozvoji (4.227). Všechny koeficienty v rozvoji (4.227) mají tedy stejná znaménka jako aj. Lemma 4.10. Buďte (4.229) /(í) = X>i* (4.230) í(ť) = Z)Bií* dvě mocninné řady 4 kladnými poloměry konvergence a nechť platí (4.231) f(t)g(t) - 1. 92 i MNOHOKROKOVÉ METODY Nechť dále platí At > 0 pro k = 0,1,... a Ai+iAt_i - A\ > 0 pio k = 1,2,.... Pat platí Bk < 0 pro k - 1,2,.... Důkaz. Z předpokladů Ak > 0, k = 0,1,... a A^iA^-x — A\ > 0, k = = 1,2,... plyne, že je At+j/At > Afc/Afc_i pro i: — 1,2,.... Posloupnost A^/A^ je tedy rostoucí, takže platí (4.232) An An — Jfc pro fc = 1,2,Z identity (4.231) plyne, že je A0B0 = 1, AiBo-t- AoB! — 0, ., obecně (4.233) A„B0 + An_iBi + ... + A0Bn = 0. Je tedy Bo = 1/Ao > 0, B\ = —A1B0/A0 < 0. Vynásobíme-li rovnici (4.233) číslem A„+i a rovnici, která vznikne z rovnice (4.233) záměnou n za n + 1 číslem —A„, a vzniklé rovnice sečteme, dostaneme B"+i = a \ [(Ai+iAi-i - A„A„)Bi + (A„+1An_2 - A„A„_1)fl2+ AoAn (4.234) +... + (A^A,^ - AnAn_k+1)Bh + ... + (A„+1Ao - AnA,)B„] = A„-% /An+i \ „ , , An_t /An+i An_t+:p 1_\ + j A„_). /Ai+l -fln_t+iN A0 V An An„j/ 1 "' A„ \ An An-k J Nyní už dokážeme požadované tvrzení snadno úplnou indukcí. Předpokládáme-li totiž, že platí Bi < 0 pro k = 1.....n, plyne ihned z (4.232) a (4.234), že je B„+i < 0. Lemma je dokázáno, Lemma 4.11. Pro \z\ < 1 je (4.235) a piatl (4.236) ln rpr = c0 + c2z +. c2i < o, i = 1,2, Důkaz Funkce na levé straně rovnice (4.235) je zřejmě holomorfm v okolí bodu z = 0, takže ji lze v okolí tohoto bodu rozvinout v mocninou řadu. Protože je to navíc funkce sudá, je rozvoj tvaru (4.235). Abychom dokázali nerovnosti (4.236), položme v lemmatu 4.10 (4.237) m = ^T^=2tžkhth 93 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI (4.238) ff(0 - = C0 + Cit + c4 +---- In í-HV3 Nyní už se snadno zjistí přímým výpočtem, že všechny předpoklady lemmatu 4.10 jsou splněny, takže požadované tvrzení plyne z tohoto lemmatu. Uvedená lemmata už umožní poměrně snadno dokázat věty 4.11 a 4.12, Důkaz provedeme pro obě tyto věty zároveň. Buď tedy dána lineární fe-kroková stabilní metoda řádu p Ž 1. Definujeme-li funkci / předpisem T — z\k /\ + z\ r(z) (4.239) kde (4.240) f (z): /l-z\* (l + z\ r(z) a ip je funkce definovaná vzorcem (4.212), plyne ihned z věty 4.9, že nula je p-násobným kořenem funkce /. Pro polynom s musí proto podle věty 4.10 platit (4.241) t(z) - h + biz + .., + br-i*' kde bj jsou koeficienty rozvoje funkce r(z)/ln jjj, tj. (4.242) r(z) lnl±f' Stupeň polynomu s však smí být nejvýše k. Proto, je-li p S k + 1, lze polynom s zvolit k libovolnému polynomu r. Je-li však p > k + 1, musí být polynom r takový, že platí (4.243) bk+l =ifc+2= ... = =0 (srv. poznámku 4.6). Na otázku po existenci stabilní fc-krokové metody řádu většího než k + 1 tedy odpovíme, sestrojíme-li polynom r tak, aby splňoval podmínky stability a aby pro něj platily rovnice (4.243). Vyjádřeme proto koeficienty bf pomocí koeficientů polynomu r (které označíme jako v lemmatu 4.9 a,). Položíme-li ještě o; = 0 pro i > k, platí podle lemmatu 4.9 (je p Ž 1, a tedy p(l) = 0) a podle vzprce (4.242) oo co - co (4.244) £ať+1*'XCi,''**ř = kde koeficienty p2> jsou dány rovnicí (4.235). Porovnáním koeficientů u stejných mocnin na levé a pravé straně identity (4244) dostaneme (4.245) ř>j„ = (J2í>+iC() + 020-1C2 4-... + oic2wi r 4 MNOHOKROKOVÉ METODY Podle lemmatu 4.11 je c2ť < 0 pro i = 1, 2, ... Vzhledem k lemmatu 4.9 můžeme předpokládat, že platí a\ > 0 a a,- ž 0 pro 1 = 2,3,..., neboť v opačném případě bychom místo metody dané polynomy g a '(£) a rr(f) pomocí hodnot polynomů r a s definovaných vzorci (4.219) a (4.240). Protože zřejmě platí g(í) = (1 + £)*r((£ ~ + 1)) a -= (1 + €)*»((* - l)/(f + 1)), je fá) = fc(l + Í)*-V((ť - l)/(í + 1)) + 2(1 + + Ot-2'-'((í - l)/(í + *))■ Odtud máme (4.251) k-i neboť čísla cj,- jsou záporná a a; nezáporná. Tvrzení věty nyní plyne z toho, že je c2 = —1/6, jak se snadno zjistí ze vzorce (4.235). 4.3 Užití lineárních mnohokrokových metod Užijeme-li k řešení dané diferenciální rovnice implicitní metodu, je nutné přibližné řešení počítat z obecně nelineární rovnice. Proto otázka, jak to učinit co nejefektivněji, je značně důležitá. Než se na ni pokusíme odpovědět, všimneme si poněkud podrobněji, k čemu vůbec implicitní metody potřebujeme, když u explicitních metod zmíněné problémy vůbec nenastanou. Z předchozího výkladu víme, že maximální dosažitelný řád D-stabilní Jfc-krokové metody je u explicitní metody nižší než u implicitní metody. Vypočítat více počátečních hodnot, které vyžaduje užití metody s větší hodnotou ír, však nepředstavuje žádný vážný problém. Proto není vidět žádný na první pohled patrný důvod, proč nedat přednost explicitní metodě s větší hodnotou fc, která má stejný řád jako uvažovaná implicitní metoda. Implicitní metody však mají další výhody proti explicitním metodám, než jen to, že mají při daném i: vyšší řád. Jako příklad porovnáme z několika dalších hledisek explicitní Adamsovy-Bashforthovy metody a implicitní Adamsovy-Moultonovy metody. Výsledky jsou shrnuty v tabulce 4.10, v níž p značí řád metody, Cp+i konstantu z definice 4.2 (což je v tomto případě konstanta chyby ve smyslu vzorce (4.167), neboť u Adamsových metod je f>'(l) = 1) a (a,0) je interval absolutní stability. Z tabulky je vidět, že implicitní Adamsova metoda téhož řádu jako explicitní metoda má menší konstantu chyby a větší interval absolutní stability. Tak např. tří-kroková implicitní metoda má interval absolutní stability lOkrát větší a konstantu chyby asi 13krát menší než čtyřkroková explicitní metoda, která je stejného řádu. Toto pozorování je typické i pro daleko obecnější případy a pro explicitní metody i MNOHOKROKOVÉ METODY natolik nevýhodné, že se jako samostatné metody užívají v praxi jen zřídka. Hrají však důležitou roli v souvislosti s tzv. metodami prediktor-korektor, které nyní popíšeme. Tabulka 4.10 Porovnání Adamsových explicitních a implicitních metod Adams-Bashforth Adams-Moulton 2 3 4 2 3 4 k 2 3 4 1 2 3 5 12 3 S 251 T20 l 12 1 24 19 120 a -1 S 11 3 10 —oo -6 -3 4.3.1 Metody prediktor-korektor Při užití implicitní mnohokrokové metody je třeba v každém kroku řešit rovnici (4.58) pro neznámou j/n+it, což se většinou provede postupnými aproximacemi. V každém kroku těchto iterací je třeba vypočítat hodnotu pravé strany dané diferenciální rovnice. Protože výpočet hodnoty funkce / spotřebuje většinou mnohem více výpočetního času než všechny ostatní početní operace, které je třeba v jednom kroku provést, snažíme se minimalizovat počet potřebných iterací, tj. snažíme se volit počáteční aproximaci tak přesnou, jak je to jen možné. Toho dosáhneme tak, že k jejímu určení použijeme vhodnou explicitní metodu. Explicitní metoda užitá k tomuto cíli se nazývá predikior a původní implicitní metoda, kterou užijeme v iteracích, se nazývá korektor. Postupovat můžeme dvojím způsobem. První způsob spočívá v tom, že v iteracích pokračujeme až do „konvergence", což v praxi znamená tak dlouho, až je splněno nějaké kritérium typu \y„*^ - j£+J < £, kde e je předem daná tolerance (srovnatelná nejčastěji s velikostí lokální zaokrouhlovací chyby). Získanou hodnotu Vn+P Pak pokládáme za přijatelnou aproximaci přesné hodnoty yn+k- Při tomto způsobu nelze předem udat počet hodnot funkce / potřebných k provedení jednoho kroku metody. Získaná hodnota však nezávisí na počáteční aproximaci, takže lokální chyba i charakter stability metody jsou určeny pouze korektorem. Při druhém způsobu provádíme v každém kroku vždy pevný počet iterací, takže počet funkčních hodnot potřebných k provedení jednoho kroku je předem znám. Při tomto postupu už není pravda, že stabilita a lokální chyba jsou určeny pouze korektorem, což může mít podstatný vliv na výběr dvojice prediktor-korektor. 96 97 L OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Nyní popíšeme naznačený postup podrobněji. Nechť explicitní metoda užitá jako prediktor je metoda (4.256) a implicitní metoda užitá jako korektor je metoda (4.57). Protože se často ukazuje výhodné užít prediktor stejného řádu, jako je řád korektoru a protože, jak víme, u implicitní metody lze dosáhnout při daném k vyššího řádu než u explicitní metody, je často vhodné použít prediktor s vetší hodnotou čísla k, než je příslušná hodnota u korektoru. Abychom mohli formálně jak v prediktoru, tak v korektoru užívat tutéž hodnotu čísla k, dohodneme se, že v tomto odstavci upustíme od požadavku, že čísla or0 a po nejsou současně rovna nule, takže nyní připouštíme v korektoru i případ, že je oío = A — O- Nechť dále m ž 1 je pevně zvolené číslo. Pak za přibližné řešení v bodě a:n+ifc získané užitím prediktoru a m-násobným užitím korektoru budeme pokládat číslo vypočtené pomocí rekurencí (4.257) eltfl + J2 "'Ml = £/(*«+» »£+,). Jb-l V praxi se zřídka užívá hodnoty m větší než 2. Pod metodou prediktor-korektor se většinou v literatuře rozumí právě popsaná metoda, někdy dokonce jen její speciální případ s m = 1. Žádná z těchto metod nespadá do třídy lineárních fe-krokových metod, neboť veličiny j/m) a f(x,y^) v nich nevystupují lineárně. Předchozí teorii tedy nelze bezprostředně užít a má-li mít metoda (4.257) rozumný smysl, musíme vyšetřit její konvergenci. Omezíme se přitom na případ m = 1. Věta 4.14. Bud" dána Dstabilní mnohoktoková metoda (4.57) rádu p ž 1 a explicitní metoda (4.256) řádu p" ž 0. Nechť jsou dále splněny předpoklady (i) a (ii) z cl. 1 a nechť přesné řešení jc dostatečně hladké. Nechť konečně počáteční podmínky jsou dány s přesností 0(hr), kde r = min(p* + 1, p), nebo vyšší. Pak pro pňbližné řešení j/l'-1 vypočtené metodou prediktor-korektor (4.257) s m = 1 platí pro h —* 0, x„ = x (4.258) S/W-»/K)-0(V). Důkaz Protože prediktor je řádu p* a korektor řádu p, platí pro každou 98 4 MNOHOKROKOVÉ METODY dostatečně hladkou funkci y, a tedy také pro přesné řešení (4.259) ~ hY^FJix^) = Cp*.+1^*+1^x„)^*+1 + 0(h»*+2) (4.260) X>„y(rn+„) hÝ^M{^) = Cr^1\xn)h^ + 0(h''^). v—Q v=0 Zavedeme-li veličiny e„ a e^0' rovnicemi e„ = j/S,1' - y(xn) a el°' = — y(x„), je (4.261) «íe^ + £(a„)fcp+1(*»)W+1 + 0(W+2), kde jsme položili f /c*.,*!.'')-/(»■*(» (4.263) g„ = i pro e„ # 0 pro e„ = 0 (4.264) 9ä. (0) : 0 pro eiC) = 0. Vyloučíme-li z rovnic (4,261) a (4.262) veličinu e£Jt, dostaneme & Ä — 1 .3 (4.265) ^a"e"+" ftD [A-fe+K + ^J-ffi+tí-^J + A#ff"+i')] e»+* » !/ = 0 J/=0 fc + 0(nř'*+3) + 0(h"+2) = 0(hT+'). Protože polynom daný koeficienty a„ splňuje podmínky O-stabillty a protože chyba v počátečních podmínkách je řádu 0(hr), plyne tvrzení věty ihned z lemmatu 4.3. Z právě dokázané věty vidíme, že ke konvergenci metody prediktor-korektor v námi uvažovaném případě m - 1 není vůbec třeba, aby prediktor byl £>-stabilní. I. OBYČEJNÉ DJf ERENCIALNl ROVNICE ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Dále je rovněž vidět, že k tomu, abychom dosáhli touto metodou stejnou řádovou přesnost, jako kdybychom použili pouze implicitní metodu danou korektorem (tj. kdybychom iterovali do konvergence), může být řád prediktoru o jedničku menší než řád korektoru. Poznámka 4.7. V případě obecného m zůstává věta 4.14 v platnosti, položíme-li r — min(p* + m,p). Důkaz je úplně stejný. Uvědomíme-li si, že technika, kterou jsme užili k důkazu věty 4.14, je zcela analogická, jako technika užitá v podobné situaci v případě mnohokrokové metody, je zřejmé, že pro metodu prediktor-korektor platí i tvrzení analogická k ostatním tvrzením, která jsme dokázali v případě lineární mnohokrokové metody. Speciátně aplikujeme-li metodu (4.257), opět s m = 1, na rovnici y' — Ay, dostaneme pro přibližné řešení y^ rovnici * t-i „ (4.266) 5>Ä = M£ [ä, + + hAfi)]£l,. To je opět lineární diferenční rovnice s konstantními koeficienty. Platí tedy vzorec zcela analogický ke vzorci (4.205), jen růstové parametry jsou nyní jiné. Čísla A; ve vzorci (4.205) jsou totiž definována rovnicí (4.155), kde £« je kořen charakteristického polynomu g diferenční rovnice (4.145) a & je kořen polynomu g. Růstové parametry A;1^ uvažované metody prediktor-korektor jsou tedy definovány rovnicí (4.267) $l) = &\l + )P)hA + 0(h% i = l,. .,m, kde fj1^ je kořen polynomu #W daného rovnicí (4.268) ět»(í) - g(0 - M{ff(£) -Mk + %[-ř'(í) + «íí* + l^iO]} = = e(0 - hA\-stabilní, u prediktoru podle věty 4.14 nevadí. Ze vzorce (4.269) snadno vypočteme, že růstový parametr Aj ' právě sestrojené metody je roven jedné. Přítomnost vhodného prediktoru odstranila tedy slabou nestabilitu Milnovy-Simpsonovy metody (4.270). V tabulce 4.11 jsou uvedeny výsledky konkrétního numerického řešení diferenciální rovnice y1 = 1—y2 s počáteční podmínkou y(0) = 5 metodou (4 270) a metodou prediktor-korektor (4.67) a (4.270). Tabulka 4.11 Řešení diferenciální rovnice y' — 1 — y2 MHnova-Simpsonova metoda Metoda prediktor-korektor (4.67) a (4.270) Bn yn 190 191 192 1,0034734603 1,0034671476 1,003258 502 6 -0,0000508966 0,000051 4090 -0,000 0519709 1,003 5243708 1,0034157504 1,003310486 5 0,0000000139 0,0000000118 0,0000000131 318 319 320 0,9998711821 1,000257714 5 0,999863 209 2 -0,0001932573 0,000195 2578 -0,000197325 9 1,000064 4396 1,00D062 4569 1,000 060 535 3 0,0000000003 0,0000000002 0,000 000 000 2 V obou případech byl užit integrační krok h — 1/64 a hodnota yi byla vzata z přesného řešení. Vidíme, že výsledky jsou i v nelineárním případě takové, jak jsme teoreticky očekávali. Závěrem tohoto odstavce ještě poznamenejme, že metoda daná rovnicemi (4.27i) «;p&+£oc«ftl = fcEft/í*-^";1'), ■i«£í*l) +*í>»i+), = hM(xn+k,y„Ík)+ k-\ + ^W(«™+n!/ÍT»1)). s = °. -,m-l, 101 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI se rovněž nazývá metoda prediktor-korektor. Rozdíl mezí oběma popsanými variantami je v tom, že v každém kroku užíváme v bodech, v nichž už je přibližné řešena vypočteno, v případě metody (4.257) hodnoty f(xr,yím^), zatímco v případě metody (4.271) hodnoty f{xr,yím ^). Při způsobu daném rovnicemi (4.257) je tedy nutno vypočítávat o jednu hodnotu pravé strany dané diferenciální rovnice více než při způsobu (4.271). Abychom byli schopni stručně a jednoznačně popsat, který z uvedených způsobů máme v konkrétní situaci na mysli, zavedeme následující symbolické značení (které je v literatuře týkající se problematiky řešení diferenciálních rovnic už zcela standardní). Symbolem P označíme užití prediktoru, symbolem E výpočet hodnoty pravé strany a symbolem C užití korektoru (důvody k zavedení těchto symbolů jsou mnemotechnické a pocházejí od anglických slov prediction, evaluation a correction). Postup (4.271) s m = 1 se tedy užitím této symboliky zapíše jako PEC, s m — 2 jako PECEC = P(ECf atd. obecně P(EC)m. Postup (4.257) je pak označen PECE, P(EC)2E atd. Z uvedeného zápisu je také hned vidět, kolikrát je třeba v jednom kroku vypočítávat hodnotu pravé strany dané diferenciální rovnice. Teoretické zkoumání metod pTediktor-korektor v režimu P[EC)m je obdobné, jako tomu bylo u metod P(EC)mE. 4.3.2 Volba integračního kroku Jeden z nej nesnadnějších problému, který je třeba rozřešit při konkrétní aplikaci mnohokrokové metody, je volba integračního kroku. Odhady celkové diskretizač-ní chyby neposkytují k této volbě vhodné vodítko, neboť jsou skoro vždy natolik pesimistické, že vedou k zbytečně a často také neúnosně malé hodnotě integračního kroku. Proto se většinou užívá při řešení této otázky přístup, kdy integrační krok se volí tak, aby lokální diskretizační chyba byla přijatelně malá a aby číslo z = kdf/dy leželo v intervalu stability užité metody, což zabrání nebezpečnému nakupení lokálních chyb v dalším průběhu výpočtu. Při odhadu lokální diskretizační chyby podle (4.141) vzniká značná praktická obtíž spočívající v nutnosti odhadu (p+ l)-ní derivace hledaného řešení. Užijeme-li však vhodným způsobem metodu prediktor-korektor, můžeme se nutnosti odhadu vyšších derivací vyhnout užitím postupu, který pochází od W. E. Milného. Popišme jej v případě metody PECE a za zjednodušujícího předpokladu, že hodnoty yn,..., vypočtené v pře- dešlých krocích jsou rovny hodnotám přesného řešení. Za tohoto předpokladu je přibližné řešení dáno rovnicemi Jc-l i-I (4.272) a*kyWh + ,£K)n'+1 + 0(/r+2) a (4.275) ah[y% - y(x„+k)] = - Cp+1y^+1Hxn)k"+í + 0(A"+2)+ + hfa [f(xn+h, y^J - f(xn+i, v(h = (3±i - ^±1) + 0(k'+í). Platí tedy celkem (4.277) y^(xn) = (3±i - ) "V-^ - $ J + 0{k), ak ak ' což je zmíněný Milnův vzorec. Podtrhněme ještě jednou, že rovnost řádů prediktoru a korektoru je zde podstatný předpoklad. Abychom byli schopni zvolit integrační krok tak, aby byla zaručena stabilita, potřebujeme odhadnout velikost čísla df/dy v každém kroku. To pak umožní vypočítat číslo z = hdf/dy a posoudit, zda leží v předem známém intervalu absolutní (relativní) stability. Jedna z možností, jak to provést, vychází opět z metody 103 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI 5 POROVNÁNÍ MNOHOKROKOVÝCH METOD A RUNGOVÝCH-KUTTOVÝCH METOD prediktor-korektor v režimu PECE a spočívá v užití takřka zřejmého přibližného vzorce (4.278) ~dy k „CD ZJ®-" Tento postup však nelze jednoduše přenést na případ soustav diferenciálních rovnic. 4.3.3 Změna integračního kroku V předešlém odstavci jsme stručně shrnuli požadavky, které je třeba klást na přípustný integrační krok. Aby výpočet probíhal co nejekonomičtěji, je žádoucí, aby se integrační krok volil co největší. Připomenutá kritéria však na něj mohou klást v různé fázi výpočtu nestejně přísná omezení. A nalezneme-li tedy možnost, jak v průběhu výpočtu integrační krok měnit, bude patrně výsledný algoritmus ekonomičtějším, než když se této možnosti vzdáme. U Rungových-Kuttových metod změna integračního kroku nepředstavuje žádný technický problém, neboť provést jeden krok této metody znamená vlastně řešit novou úlohu. V případě ^-krokových metod je situace odlišná, neboť k výpočtu přibližné hodnoty y„+k v bodě in+t je zapotřebí znát přibližné hodnoty hledané funkce y a funkce / v bodech x„+k-i, ■ ■ ■ ,xn. Ty mohou být už vypočteny v předchozích krocích, ale také tomu tak nemusí být. Jestliže např. před výpočtem přibližné hodnoty yn+t integrační krok zdvojnásobíme (tak sc to často dělá. dovolují-li velikost lokální chyby a požadavky stability zvětšení integračního kroku), jsou všechny potřebné hodnoty k dispozici, neboť jde o hodnoty v bodech xn+k^i,xn±i-3,..., xn_i+1 a ve všech těchto bodech se přibližné řešení v předchozím průběhu výpočtu už počítalo. Některé z těchto hodnot si však nebylo třeba pamatovat při výpočtu s pevným integračním krokem, a tedy i při zvětšování integračního kroku mohou vzniknout jisté nevelké programovací obtíže. Jestliže však integrační krok před výpočtem hodnoty yn+k rozpůlíme, potřebujeme znát hodnoty funkce y a / v bodech z„+*-i,*n+t-3/Si ■ ■ •. *n+(*-i)/2> přičemž ty z nich, kde příslušný index není celé číslo, se v předchozím výpočtu nepočítaly. V dalším výkladu naznačíme tři způsoby, jak tyto dodatečné hodnoty získat. Patrně nejjednodušší z programátorského hlediska je způsob, kdy se na tento problém díváme jako na speciální problém získání počátečních hodnot pro užití mnohokrokové metody. Pro výpočet potřebných hodnot funkce y použijeme tedy např. Rungovu-Kuttovu metodu a potřebné hodnoty funkce / pak dopočteme vypočtením hodnot pravé strany dané diferenciální rovnice. Druhý způsob spočívá v dopočítání potřebných hodnot funkce y pomocí standardní interpolace. Samozřejmě je třeba volit interpolační vzorec tak, aby chyba interpolace byla stejného řádu, jako je lokální diskretizační chyba použité metody. Upozorněme, že v případě, že dvojice prediktor-korektor je tvořena Adamsovou-Bashforthovou a Adamsovou-Moultonovou metodou, je potřebná funkční hodnota 104 funkce y vždy známá, neboť jde o hodnotu j/„+jt_i, takže lze interpolovať přímo funkci /, což ušetří počet potřebných výpočtů funkčních hodnot pravé strany dané diferenciální rovnice. Konečně se používá postup, který pochází od A. Nordsiecka a jehož základní myšlenka spočívá v tom, že místo hodnot funkce y a, f v několika bodech (které potřebujeme v dalším kroku metody) se uchovávají v paměti derivace lokálního interpolačního polynomu, který představuje přibližné řešení, v jediném bodě. Do dalších podrobností zde už nebudeme zacházet; upozorněme pouze, že tento postup je ve srovnání s předešlými z programátorského hlediska komplikovanější. 5 Porovnání mnohokrokových metod a Rungových-Kuttových metod V tomto článku se velice stručně dotkneme závažného a z praktického hlediska nepominutelného problému výběru konkrétní metody k přibližnému řešení konkrétní matematické úlohy. Tento problém prolíná celou numerickou matematikou a chceme-li řešit jakoukoliv matematickou úlohu až od konce (tj. až do získání konkrétních čísel), musíme se s ním tak či onak vyrovnat. Poněkud paradoxně na první pohled je situace svým způsobem jednodušší v těch případech, kdy je úloha natolik složitá, že jsme rádi, že máme k jejímu řešení k dispozici vůbec nějakou metodu Existuje-li však celá třída metod a to ještě pro celou třídu úloh, je otázka výběru nejvhodnější metody nesmírně složitá a v současné době zatím matematicky obecně nerozřešená. Při prakticky nezbytném výběru konkrétní metody jsme tedy nuceni se řídit pouze určitými vodítky, která se budou ovšem opírat o matematicky přesně definované pojmy a rigorózně dokázaná tvrzení. To také je důvod důležitosti podrobného teoretického zkoumání přibližných metod a tomuto účelu je také podřízen obsah této knihy. Následující porovnání Rungových-Kuttových metod a metod prediktor-korektor užitých v režimu PECE je proto nutno chápat pouze jako příklad postupu při praktické interpretaci teoretických výsledků, který ani zdaleka nevyčerpáva zmíněnou problematiku. Metody obou zmíněných skupin budeme porovnávat z hlediska lokální přesnosti (k jejíž hrubé charakteristice slouží řád metody), z hlediska charakteru stability, z hlediska pracnosti (měřené množstvím výpočtů hodnot pravé strany) a z hlediska složitosti algoritmu, a tím také složitosti programování. Všimněme si nejprve lokální přesnosti metod, které mají stejný řád p. Má-li pre-diktor a korektor řád p, je hlavní část lokální diskretizační chyby metody prediktor-korektor dána výrazem (5.1) kde C = Cp+i/gfl) je konstanta chyby korektoru. Hlavní část lokální diskretizační 105 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI chyby Rungovy-Kuttovy metody je tvaru (5.2) v>(«», »(*»)) přičemž

y a"1/ am/ o™ f . dly d'2y 8my . Protože tato matice není obecně symetrická, mohou být její vlastní čísla i komplexní a za parametr z v definici intervalu stability je nyní třeba vzít komplexní číslo. V souvislosti se soustavou diferenciálních rovnic tedy mluvíme o oblastech stability, které se zavádějí obdobně jako intervaly stability. Kromě případu nejjednodušších metod nelze většinou popsat oblast stability jinak než obrázkem. Jako příklad může sloužit obr. 6.1, v němž je znázorněna oblast absolutní stability Adamsovy-Moultonovy metody čtvrtého řádu. 6 SOUSTAVY DIFERENCIÁLNÍCH ROVNIC A PROBLEMATIKA SILNÉHO TLUMENI Obr. 6.1 Oblast stability Adamsovy-Moultonovy metody čtvrtého rádu 6.2 Rungovy-Kuttovy metody Metody této třídy lze rovněž aplikovat úplně beze změny i v případě soustavy diferenciálních rovnic. Je jen třeba pokládat veličiny íalrve vzorcích (3.17) a (3.18) za m-dimenzionální vektory. Upozorněme však na to, že řád některých Rungových-Kuttových metod může být v případě soustavy rovnic nižší než v případě jedné rovnice. Tento jev nastává pouze pro některé metody řádu vyššího než 4, a ty se v praxi málo užívají. U všech metod vyššího řádu než 4, které jsme uvedli v odst. 3.1, však tento jev nenastává a jejich řád nezávisí na tom, zda jsou užity v případě jedné nebo více diferenciálních rovnic. Pokud jde o stabilitu při pevném integračním kroku, platí totéž, co bylo řečeno v souvislosti s lineárními Jb-krokovými metodami. Ve shodě o tom, co víme o intervalech stability Rungových-Kuttových metod prvního až čtvrtého řádu, které užívají jednu až čtyři hodnoty pravé strany, jsou pro tyto metody i oblasti stability nezávislé na konkrétní metodě. Tyto oblasti jsou znázorněny na obr. 6.2. 6.3 Problematika řešení diferenciálních rovnic se silným tlumením V mnoha oblastech aplikací, zejména v problémech chemického inženýrství a v problémech regulace, vznikají soustavy diferenciálních rovnic, které vykazují jev, který je v anglicky psané literatuře znám pod jménem „stiffhess". Doslovný překlad tohoto termínu „tuhost" se nám v češtině příliš nelíbí a budeme jej většinou opisovat tak, že budeme mluvit o soustavách diferenciálních rovnic se silným tlumením. Podstatu tohoto jevu objasníme na následujícím jednoduchém příkladě, 108 109 OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Obr. 6.2 Oblasti stability Rungových-Kuttových metod Mějme soustavu (6.5) y' = Ay + b(x) m lineárních diferenciálních rovnic, kde A je čtvercová konstantní matice řádu m s navzájem různými vlastními čísly Á; a odpovídajícími vlastními vektory u;. Obecné řešení této soustavy se dá v tomto případě psát ve tvaru (6.6) /O) =£eieiiaruť + p(z), kde p(x) je partikulární řešení nehomogenní soustavy (6.5). Předpokládejme, že je ReA,- < 0 pro i = 1,..., m. Pak platí (6.7) ^cjeAii5Uj —» O pro x —» co. Z tohoto důvodu mluvíme o kombinaci ve vzorci (tí.7) jako o přechodovém řešení a o vektoru p(x) jako o ustáleném řešení. Buďte dále Amax a \miri taková vlastní čísla, že platí (6.8) |ReAraax| ž |ReA,| ž |ReAmin|, i = l,...,m. Je-li naším úkolem vypočítat ustálené řešení, je třeba řešit soustavu (6.5) nejméně 110 6 SOUSTAVY DIFERENCIÁLNÍCH ROVNIC A PROBLEMATIKA SILNÉHO TLUMENI až do toho bodu, v němž je nejpomaleji klesající exponenciála v přechodovém řešení už zanedbatelná. Cím menší je tedy |ReAmin |, tím na delším intervalu je třeba soustavu (6.5) řešit. Na druhé straně z důvodu zachování stabilního průběhu výpočtu je žádoucí volit integrační krok h tak, aby číslo z = ftAmax leželo v oblasti absolutní stability užité metody. Je-li tato oblast omezená, je omezení, které zmíněný požadavek klade na velikost integračního kroku tím přísnější, čím větší je |ReAmax|. Je-li |ReA max I podstatně větší než |ReAmin|, můžeme se tedy dostat do obtížné situace řešit na dlouhém intervalu diferenciální rovnici a užít při tom integrační krok, který je v kterékoliv fázi výpočtu velice malý vzhledem k délce příslušného intervalu O soustavě, která vykazuje právě popsané chování, mluvíme jako o soustavě se silným tlumením. Poměr (6.9) s=|m=s| zvaný S-poměr dané soustavy přitom slouží za míru zmíněných obtíží. Cím je číslo S větší, tím hůře se soustava chová. V případě, že soustava (6.5) je nelineární, je třeba vlastní čísla matice A nahradit vlastními čísly Jacobiovy matice (6.4). Protože ta už nejsou konstantní, může se charakter uvažovaného jevu měnit v závislosti na nezávisle proměnné x. Za předpokladu, že pravá strana dané soustavy diferenciálních rovnic má v nějaké vhodné oblasti omezené všechny parciální derivace podle proměnných 1y.....my, lze za její Lipschitzovu konstantu vzít číslo L — \\df/dy\\. Tato konstanta bude při velkém čísle |ReAmax| rovněž velká. Proto se o soustavě se silným tlumením mluví také jako o soustavě s velkou Lipschitzovou konstantou. Je třeba podtrhnout, že v uvedené definicí jsme se záměrně vyhnuli tomu, abychom udali, co přesně kvantitativně znamenají slova „ |ReAmax| je podstatně větší než |ReAmm|". Jinými slovy neuvedli jsme žádnou konkrétní hranici, kdy se už soustava chová špatně a kdy ještě ne. To vzhledem k heuristické povaze zmíněné definice není ani možné; je jen jasné, že Čím je větší S-poměr, tím je popsaný jev závažnější, Uveďme pou2e, že soustava s 5-poměrem 20 se pokládá ještě za velmi rozumnou, a že se nezřídka v praxi vyskytují soustavy, kde je toto číslo 106. Následující příklad ukazuje, že obtíže spojené s řešením soustav diferenciálních rovnic se silným tlumením se mohou drasticky projevit už ve velmi jednoduchém případě. Příklad 6.1. Řešme soustavu diferenciálních rovnic y1 — z, z' — — 106jř — - (106 4- l)z s počátečními podmínkami y(0) — 1, z(0) = -1 » s presnýmřešením y(x) =,e~x a z(z) = —e~x EuIětovou metodou. Interval absolutní stability této metody je (—2,0), iterační krok je tedy třeba volit menší než 2.10-6 (vlastní čísla matice uvažované soustavy jsou —1 a —106). Tak např. při výpočtu s integračním krokem h = 10~5 dostaneme zcela nesmyslné výsledky už po provedení pouhých několika desítek kroků a to v situaci, kdy se přesné řešení chová jako e-1. Stejné přesné řešení má i diferenciální rovnice y1 =t —y s počáteční podmínkou j/(0) - 1. 111 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI 6 SOUSTAVY DIFERENCIÁLNÍCH ROVNIC A PROBLEMATIKA SILNÉHO TLUMENÍ Řešíme-li však tuto rovnici Eulerovou metodou, není v intervalu (0,1) celková dis-kretizační chyba větší než 2.10-5, použijeme-li dokonce podstatně větší integrační krok h = ÍO-4. Zvolíme-li na druhé straně k řešení dané soustavy tzv. implicitní Eulerovu metodu yn+i = yn + hf{xnjr\, j/n+i)> která má interval absolutní stability (—oo,0) a položíme-li h = 10-4, vypočteme řešení na intervalu (0,1) s přesností na 4 desetinná místa, tedy stejnou, jako v případě explicitní Eulerovy metody a rovnice y1 — —y. Řešíme-li soustavu diferenciálních rovnic se silným tlumením, je tedy žádoucí užít k tomu takovou metodu, že omezení, která z ní plynou pro integrační krok z důvodu zachování stability, nejsou pokud možno příliš vážná. Z tohoto hlediska se zdá rozumné omezit se v této situaci na takové metody, jejichž oblast absolutní stability obsahuje celou levou polorovinu komplexní roviny. V tomto případě požadavky stability nekladou na velikost integračního kroku žádné omezení bez ohledu na to, jak velké je číslo |ReAmax|. Metody mající tuto vlastnost se nazývají A-stabilní a pro jejich zřejmou důležitost si jich všimněme poněkud podrobněji. Vzpomeneme-li si, že interval stability byl definován na základě chování přibližného řešení modelové diferenciální rovnice (6.10) V1 - Ay při n —> oo, je skoro na první pohled patrné, že žádná Rungova-Kuttova metoda nemůže být j4 stabilní. Skutečně, přibližné řešení diferenciální rovnice (6.10) libovolnou Rungovou-Kuttovou metodou je totiž dáno vzorcem (6.11) kde z = hA a P(z) je polynom stupně nejméně 1. Nutná a postačující podmínka A-stability této metody je tedy platnost nerovnosti \P(z)\ < 1 pro všechna z, pro než je Rez < 0. To však není možné, neboť funkce P je polynom, a má tedy v nekonečnu pól. Komplikovanější situace je v případě lineární fc-krokové metody. Podle definice 4.5 je tato metoda .A-stabilní právě tehdy, má-li třetí charakteristický polynom (6.12) «<*,£) = e(É)-*»(ť) při libovolném z takovém, že Rez < 0 všechny kořeny uvnitř jednokrokového kruhu. K dalšímu vyšetřování A-stability mnohokrokových metod bude užitečná jiná nutná a postačující podmínka. Její formulace je obsahem následujícího pomocného tvrzení. Lemma 6.1. Buď dána lineární k-kioková metoda, jejíž charakteristické polynomy g a rr nemají společné činitele. Buď dále R racionální funkce definovaná 112 (6.13) Pak je daná metoda A-stabilní tehdy a jen tehdy, je-li funkce R holomorfní vně jednotkového kruhu a platí-li pro ni (6.14) ReÄ(í) g 0 pro |£| > 1. Důkaz. Předpokládejme nejprve, že daná metoda je A-stabilní a buď fa takový bod ležící vně jednotkového kruhu, v němž je funkce R regulární. Pak v důsledku toho, že polynomy g a u nemají společné činitele, platí c(£o) ^ 0. Položíme-li z — iž(fo) = e(£o)/ li je v důsledku A-stability Rez ž 0. Buď dále > 1 takový bod, že Je (£i) ^ 0 a funkce R se tedy chová v okolí bodu f = íi jako a(f - íi)~m, kde o^Oamje přirozené číslo. V okolí bodu í = íi tedy existují body, které stále ještě zůstávají vně jednotkového kruhu a v nichž nabývá funkce Reň jak kladných, tak záporných hodnot. To je ale ve sporu s právě dokázanou nerovností Reií(£) ž 0, která platí ve všech zmíněných bodech. Funkce H je tedy regulární pro každé |£| > 1 a platí (6.14). _ Nechť naopak podmínka (6.14) je splněna a nechť existuje pro nějaké z, pro něž je Rez < 0 kořen £i polynomu (6.12), pro který platí |fi| ^ 1. Pak je 1, dostáváme spor s (6.14). Je-li = 1, plyne ze spojitosti funkce Rei? v bodě £ = f i existence bodu £2, pro který platí |f2| > 1 a Refí(f2) < 0. Došli jsme tedy opět ke sporu. Lemma je dokázáno. Pomocí tohoto lemmatu už snadno dokážeme základní a typickou vlastnost A-stabilních mnohokrokových metod zformulovanou v následující větě. Věta 6.1. A-stabilní lineární k-kroková metoda je implicitní (tj. platí pro ni & * o;. Důkaz Buď dána explicitní lineární &-kroková metoda. Je tedy /?j = 0 a pro funkci R definovanou rovnicí (6.13) platí ontk + - ■ ■ + <*o (6.15) «(í) kde ctk ^ 0, / 0 a s í 1. V okolí bodu v nekonečnu se tedy chová funkce R jako f * a nabývá tak hodnot jak z levé, tak z pravé poloroviny. Podle lemmatu 6.1 není tedy uvažovaná metoda A-stabilní. K tomu, abychom dokázali ještě závažnější vlastnost A-stabilních mnohokrokových metod, totiž že jejich řád je silně limitován, budeme potřebovat jedno pomocné 113 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI 6 SOUSTAVY DIFERENCIÁLNÍCH ROVNIC A PROBLEMATIKA SILNÉHO TLUMENI tvrzení, které pojednává o integrální reprezentaci holomorfní funkce s hodnotami v pravé polorovině komplexní roviny. Lemma 6.2. Buď funkce ip holomorfní v polorovině Rez > 0, a nechť platí (6.16) s\ip{\xip(x)\; 0 < x < co] < cc a (6.17) Re 0. z — iť Důkaz lemmatu přesahuje elementární rámec této knihy a lze jej nalézt např. v knize Achiezer, Glazman (1950), str. 206. Věta 6.2. Maximální řád a-stabilní a D-stabilní lineární k-krokové metody takové, že polynomy q a a nemají společné činitele, je 2, Důkaz. Buď dána lineární i-kroková metoda řádu 2. Podle věty 4.9 má funkce g(£) — a(£) lnf v bodě ( — 1 kořen násobnosti p +1, tj. pro £ —» 1 platí (6.19) P(£) - «r({) ln í = -C(í - lf+1 + O ((£ - lf+2). V důsledku D-stability a konzistence je 1 (6-20) í(ěj" ^(i) + jV(i)(£ -!) + .■■ + át»<*>(i)(e -1)* = = ^[1 + 0(Í-1)]. Dělíme-li rovnici (6.19) funkcí cr, dostáváme odtud, že pro £ —» 1 platí 0«) (6.21) ■ c-(£-~i)>«+o((f-ir+2)) kde jsme položili c* = c/ 0 a má-li tam nezápornou reálnou část. Dále, protože je g(l) = 0, je polynom r v (6.23) stupně nejvýše k — 1 a protože je tr(l) ^ 0, je polynom s stupně Ir. Funkce xr(x)/s(x) je proto na intervalu (0, oo) omezená. Je-li navíc daná metoda A-stabilní, jsou pro funkci rjs splněny předpoklady lemmatu 6.2. Platí tedy (6.24) «(*) -r ■t — c Z — iť pro Rez > 0, kde u je vhodná ohraničená a neklesající funkce. Pro kladná x je však výraz xr(x)j s(x] reálný, neboť daná metoda má reálné koeficienty. Podle (6.24) tak dostáváme , , xr(x) [°° du(i) !x x(x + ít) , . . [°° x2 (o. Při pevném t je funkce x x2/(x2 + ť2) neklesající, a tedy také funkce x —i- ir(i)/s(a:) je neklesající. Přejděme konečně ve vzorci (6.21) k proměnné z. Dostaneme 2-1 SÍZ) \zJ \zP+2J (6.26) pro z —> oo. Protože je zřejmě (6.27) 2 2 'z - 1 """ 1 - i ,z 3*3 pro 2 —> oo, plyne z (6.26), že pro z —» oo platí »(f) (6.28) kde (6.29) s(z) z K3 'z3 \z5/ U je-li p = 2 je-li p > 2, Je-li daná metoda A-3tabilní, je funkce ir(a;)/s(í;) neklesající. Funkce 2 -I- (2/3 -— Sč)/x2 musí být tedy vzhledem k rovnici (6.28) také neklesající. To však pro p > 2 není možné a pro p = 2 je to možné právě tehdy, je-li koeficient u x~2 nekladný, tj. je-li c* ž 1/12. Věta je dokázána. Pro Adamsovu-Moultonovu metodu řádu 2 (6.30) y„+i - Vn + ih(/„+i 115 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI CVIČENÍ která se nazývá lichoběžníkové pravidlo, je c* = 1/12. Protože pro tuto metodu je r(z)/s(z) = 2/z, je A-stabilní. Adamsova-Moultonova metoda je tedy příkladem A-stabilní metody řádu dvě. Věta 6.2 říká, že žádná z eventuálně dalších A-stabilních metod nemá vyšší řád a z jejího důkazu dokonce plyne, že metoda (6.30) má mezi těmito metodami nejmenší konstantu chyby. Omezení na řád plynoucí z A-stability je velmi závažné a proto byla navržena řada dalších méně omezujících definic stability. Jeden z těchto pojmů je např. tzv. A(ct)-stabihia, kdy se požaduje, aby oblast stability obsahovala nekonečný úhel Ua = {z; —cv < t — argz < a}. A(a)-stabilita sice pořád ještě vyžaduje impli-citnost dané metody, omezení na její řád však není tak přísné jako u A-stability. Do dalších podrobností nebudeme zacházet a spokojíme se konstatováním, že ve speciálních případech mohou prokázat A(a)-stabilní metody stejně cennou službu jako A-stabilní metody. Na druhé straně nelze zamlčet, že ani požadavek A-stability není v jistém smyslu dostačující. Přibližné řešení yn modelové diferenciální rovnice (6.10) získané libovolnou jednokrokovou metodou, kterou jsme až dosud zavedli, je tvaru R"(z)y(a), kde z — hA a R je racionální funkce aproximující funkci e". Požadavek A-stability proto znamená, že tato funkce musí splňovat podmínku (6.31) |fí(z)| < 1 pro Rez < 0. Např. pro lichoběžníkové pravidlo (6.30) je funkce R dána rovnicí (6.32) R(z). Podmínka (6.31) je sice pro tuto funkci splněna, pro Rez —+ —oo však platí R(z) —» —» 1. Silně tlumené složky tedy klesají k nule, ale velmi pomalu Právě provedená úvaha vede k zavedení pojmu L-stability jednokrokové metody, kdy kromě A-stability požadujeme, aby pro funkci R platilo (6.33) R(z) —* 0 pro Rez —* —oo. Příkladem L-stabilní metody je implicitní Eulerova metoda (6-34) Vn+l = Vn + hfn+l- Zakončeme tento odstavec a vůbec celou kapitolu o obyčejných diferenciálních rovnicích užitečným a důležitým upozorněním. V souvislosti s řešením soustav diferenciálních rovnic se silným tlumením jde vždy o metody implicitní, takže v každém kroku je třeba řešit soustavu (6.35) Yn+k ■ h—f(xn+t,yn+k) ■ &k Postupy prediktor-korektor P(EC)rn nebo P(EC)mE s konečným m, které jsme doporučili v případě „normálně" se chovajících diferenciálních rovnic, zde nepřicházejí v úvahu, neboť nepřípustně mění oblast stability použité metody. Rovněž tak iterování do konvergence zde není vhodné, neboť k tomu, aby tento proces skutečné konvergoval, je třeba splnění podmínky 1.36) ft|-|i+1-rO(h<>+2) = -- [<ř{x,y(x))+0(h)](2hY+1 + 0(hf+1) = = ^{x^x^^hP^ +0(hp+2). Odtud vyloučením přesného řešení dostanete L{y(x), h) = SÍJ_T(IM.1 - y*+1) + 0(h"+2). 13. Ukažte, že interval absolutní stability Rungovy-Kuttovy metody řádu p, která užívá p hodnot pTavé strany, nezávisí na její konkrétní podobě. Návod: Tvrzení plyne z toho, že přibližné řešení diferenciální rovnice y' — Ay vypočtené zmíněnou Rungovou-Kuttovou metodou řádu p je dáno vzorcem yn = (1 + z + + z2/2\ +... + zr/p\)nyo, kde z = hA. POZNÁMKY K LITERATUŘE Cl. 1. Publikací, které pojednávají o teorii obyčejných diferenciálních rovnic je celá řada. K velmi dobrým a pro českého čtenáře dostupným pramenům patří kniha Coddingtona a Levinsona (1955). Literatura věnovaná problematice numerického řešení obyčejných diferenciálních rovnic je rovněž neobyčejné obsáhlá. Základní informace čtenář získá v celé řadě příruček: viz např. Collatz (1951), Henrici (1964), Beiezin, Židkov (1966), Isaacson, Keller (1966), Shampine, Allen (1973), Dahlquist, Bjôrck (1974), Stoer, Bulirsch (1980), Vitásek (1987). Z celé řady specializovaných knih, z nichž některé jsou uvedeny v seznamu literatury bez dalšího komentáře, jmenujme knihu Henriciovu (1962), patrně jeden z nejlepších a nejúplnějších pramenů zejména v teoretických otázkách souvisejících s numerickým, řešením obyčejných diferenciálních rovnic. Většina materiálu první kapitoly je na ní také založena a čtenáři hledajícímu hlubší porozumění této problematice ji lze co nejvřeleji doporučit. Rovněž kniha Stetterova (1973) i když pro čtenáře dosti náročná, zaslouží 118 být jmenována. Praktičtěji než uvedené dvě publikace je zaměřena vynikající kniha Lambertova (1973), která nepomíjí snad žádný aspekt spojený s praktickou realizací popisovaných metod. Na mnoha místech této kapitoly jsme z ní vydatně čerpali. Podobný charakter má také kniha Lapiduse a Seinfelda (1971). Konečně upozorněme na sborník vydaný Mailem a Wattem (1976), v němž nalezne čtenář popis a hodnocení celé řady algoritmů založených nejen na metodách popisovaných v této knize, ale i na tzv. extrapolačních metodách, které jsou rovněž dosti populární. Cl. 2. Nejlepším pramenem k obsahu tohoto článku je kniha Henriciova (1962). Cl. 3. Rungovy-Kuttovy metody jsou klasické a základní informace o nich je v každé učebnici. Většinu materiálu zde uvedeného nalezne čtenář v už zmíněné knize Lambertově (1973), která také obsahuje odkazy na originální literaturu o jednotlivých metodách. Kniha Forsytha, Malcoma a Molera (1977) obsahuje velmi dobře implementovaný program pro tzv. Rungovu-Kuttovu-Fehlbergovu metodu. ČI. 4. Všechny otázky spojené s problematikou konvergence a konstrukcí většiny základních tříd mnohokrokových metod jsou vyčerpávajícím způsobem řešeny v knize Henriciově (1962). Problémy stability při pevném integračním kroku jsou v souvislosti s mnohokrokovými metodami a s metodami prediktor-korektor podrobně studovány v knize Lambertově (1973). Výhradně metodám Adamsova typu je věnována velmi přístupně psaná kniha Shampinova a Gordonova (1975), která obsahuje mimo jiné dobře osvědčený program užívající Adamsovy metody proměnného řádu a automatickou volbou integračního kroku. Na Adamsových metodách proměnného řádu je založen také program publikovaný Gearem (1971b), který realizuje změnu integračního kroku na základě Nordsieckovy (1962) myšlenky. Cl. 5. Tento článek se opírá hlavně o Lambertovu knihu (1973). Cl. 6. Průkopnická práce o problematice řešení soustav diferenciálních rovnic se silným tlumením je práce Dahlquistova (1963). Velmi mnoho materiálu o této problematice obsahuje sborník vydaný Willoughbym (1974). Gearův (1971b) program, o němž jsme se už zmínili, obsahuje opci pro integraci stiff systémů. Příslušné metody jsou založeny na metodách numerického derivování. LITERATURA ACHIJEZER, N.I. - GLAZMAN, I.M.: Teorija linejnych operátorov. Moskva, GIT-TL 1950. BABUŠKA, I. - PRÄGER, M. - VITÄSEK, E.: Numerical Processes in Differential Equations. Praha-London-New York-Sydney, SNTL + Interscience Publishers 1966. (Překlad do ruštiny: Moskva, Mir 1969.). BACHVALOV, N.S.: Cislennyje metody. Moskva, Nauka 1975. CODDINGTON, E.A. - LEVINSON, N.: Theory of Ordinary Differential Equations. New York, McGraw-Hill 1955. (Překlad do ruštiny: Moskva, IL 1958.) COLLATZ, L.: Numerische Behandlung von Differentialgleichungen. Berlin- 119 I. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Göttingen-Heidelberg, Spiingei-Verlag 1951. (Překlad do ruštiny: Moskva, IL 1953.) ČERNÝ, I.: Základy analýzy v komplexním oboru. Praha, Academia 1967. DAHLQUIST, G.: A Special Stability Problem for Linear Multistep Methods. BIT, 3, 1963, s. 27 - 43. DAHLQUIST, G. - BJÖRCK, A.: Numerical Methods. Englewood Cliffs, N.J., Prentice-Hall 1974. DANIEL, J.W. - MOORE, R.E.: Computation and Theory in Ordinary Differential Equations. San Francisco, W.H. Freeman and Co. 1970. FORSYTHE, G.E. - MALCOLM, M.A. - MOLER, OB.: Computer Methods for Mathematical Computations. Englewood Cliffs, N.J., Prentice-Hall 1977. (Překlad do ruštiny: Moskva, Mir 1980.) FOX, L.: Numerical Solution of Ordinary and Partial Differential Equations. Oxford, Pcrgamon Press 1962. GEAR, C.W: Numerical Initial Value Problems in Ordinary Differential Equations. Englewood Cliffs, N.J., Prentice-Hall 1971a. GEAR, C.W.: Algorithm 407, DIFSUB for Solution of Ordinary Differential Equations. Com. ACM, 14, 1971b, s. 185 - 190. GRIGORIEFF, R.D.: Numerik gewöhnlicher Differentialgleichungen. Stuttgart, B.G. Teubner 1972 - 1977, 2 sv. HALL, G. - WATT, J.M. (ed.): Modern Numerical Methods for Ordinary Differential Equation. Oxford, Clarendon Press 1976. (Překlad do ruštiny: Moskva, Mir 1979.) HAMMING, R.W.: Numerical Methods for Scientists and Engineers. New York, McGraw-Hill 1962. (Překlad do ruštiny: Moskva, Nauka 1968.) HENRICI, P.: Discrete Variable Methods in Ordinary Differential Equations. New York-London, J. Wiley and Sons 1962. HENRICI, P.: Error Propagation for Difference Methods. London, J. Wiley and Sons 1963. HENRICI, P.: Elements of Numerical Analysis. New York, J. Wiley and Sons 1964. ISAACSON, E. - KELLER, H.B.: Analsysis of Numerical Methods. New York-London-Sydney, J. Wiley and Sons 1966. LAMBERT, J.D.: Computational Methods in Ordinary Differential Equations. London-New York-Sydney-Toronto, J. Wiley and Sons 1973. LAPIDUS, L. - SEINFELD, J.H.: Numerical Solution of Ordinary Differential Equations. New York-London, Academic Press 1971. NORDSIECK, A.: On Numerical Integration of Ordinary Differential Equations, Math. Comp., 16, 1962, s. 22 - 49. RICE, J.R. (ed.): Mathematical Software. New York-London, Academic Press 1971. SHAMPINE, L.F. ALLEN, R.: Numerical Computing. Philadelphia, Saunders 1973. LITERATURA SHAMPINE, L.F. - GORDON, M.K.: Computer Solution of Ordinary Differential Equations. San Francisco, W.H. Freeman and Co. 1975, STETTER, H.J.: Analysis of Discretization Methods for Ordianary Differential Equations. Beriin-Heidelberg-New York, Springer-Verlag 1973. (Překlad do ruštiny: Moskva, Mir 1978.) STOER, J. - BULIRSCH, R.: Introduction to Numerical Analysis. New York-Heidelberg-Berlin, Springer-Verlag 1980. VITÁSEK, E.: Numerické metody. Praha, SNTL 1987. WILLOUGHBY, R.A. (ED.): Stiff Differential Systems, New York-London, Plenum Press 1974. 120 121 1 ÚVOD Kapitola II. Obyčejné diferenciální rovnice - okrajové úlohy 1 Úvod V této kapitole popíšeme některé základní metody pro numerické řešení okrajových úloh pro obyčejné diferenciální rovnice. Okrajovou úlohou nebo podrobněji dvoubodovou okrajovou úlohou pro soustavu diferenciálních rovnic prvního řádu (1.1) kde (1.2) y = f{*,y) = 7(*,ly, Ví*.1*, nv) "/(*,V--,ms/) rozumíme úlohu nalézt takové řešení soustavy (1.1), pro něž platí (1.3) r{y(a),y(b)) = 0, kde r je m-složková vektorová funkce 2m proměnných a a a b jsou dva navzájem různé body intervalu, v němž hledáme řešení. Nejčastěji to jsou jeho krajní body. Dají-li se podmínky (1-3), které nazýváme okrajovými podmínkami, psát ve tvaru (1.4) n(y(a)) = 0, r2(y(t))=0; kde ri, resp. r2 jsou mi-, resp. m2-složkové vektorové funkce m proměnných (m = = mi + m2), mluvíme o separovaných okrajových podmínkách. Ještě speciálnější typ okrajových podmínek jsou lineární okrajové podmínky (1.5) Uy(a)+Vy(b) = c, kde U a V jsou čtvercové matice řádu jtí a c je m-dimenzionální vektor a lineární separované okrajové podmínky (1.6) 122 viy(a) = vi, V2y(b) = v2, kde V\, resp. Ví, jsou obdélníkové matice typu mi x m, resp. m2 X m, a v%, resp. v2 jsou mi-, resp. m2-dimenzionální vektory. Protože každou diferenciální rovnici m-tého řádu lze psát zavedením nových neznámých funkcí jako soustavu rovnic prvního řádu (srv, vzorec (1.4) a (1.5) z kap. 1), je zřejmé, co rozumíme dvoubodovou okrajovou úlohou pro rovnici m-tého řádu. Položíme-li v rovnici (1.5) U = / a V = 0, vidíme, že úloha s počátečními podmínkami je speciálním případem okrajové úlohy. Tedy už nejjednodušší separované okrajové podmínky jsou značně obecnější než počáteční podmínky. To má velmi závažné důsledky. Zatímco řešení úlohy s počátečními podmínkami existuje a je jediné pro značně širokou třídu nelineárních rovnic typu (1.1), u okrajové úlohy se může i v případě jednoduché lineární rovnice snadno stát, že řešení neexistuje, nebo naopak, že řešení je nekonečně mnoho. Tuto skutečnost si dobře uvědomíme na příkladě jednoduché diferenciální rovnice 2. řádu (1.7) y" + y-0 nebo ekvivalentní soustavě prvního řádu (1.8) která se dostane z rovnice (1.7) standardní substitucí. Každé řešení rovnice (1.7) se dá psát ve tvaru [V ' 0 1" \ly~\ -1 0_ V (1.9) y(x) — Cl cos x 4- C2 sin x, kde Ci a Ci jsou libovolné konstanty. Odtud ihned plyne, že každá funkce tvaru A síni, kde A je libovolné číslo, je řešením diferenciální rovnice (1.7) s okrajovými podmínkami (1.10) y(0) = O', y(w) = 0. Okrajová úloha (1.7), (1.10) má tedy nekonečně mnoho řešení. Zaměnírne-li naproti tomu okrajové podmínky (110) okrajovými podmínkami (1.11) 3,(0) = 0, ?(*■) = 1, neexistuje vůbec žádné řešení. Uvedený jednoduchý příklad napovídá, že teorie existence a jednoznačnosti řešení okrajových úloh je značně komplikovanější než odpovídající teorie úloh s počátečními podmínkami. Odrazem této skutečnosti v numerických metodách pro řešení okrajových úloh je pak to, že pro ně doposud nebyla vypracována natolik univerzální teorie, jako tomu bylo u metod pro řešení úloh s počátečními podmínkami. Proto také popis jednotlivých konkrétních metod bude mít v této kapitole znaíně jiný charakter, než tomu bylo v kap. I. Tam jsme vlastně všude vystačili s tím, že 123 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI m y fy jsme se zabývali jedním obecným problémem, totiž diferenciální rovnicí (1.1) s příslušnou počáteční podmínkou a v podstatě všechny uváděné metody měly pro tuto úlohu smysl. Zde je tomu z naznačených důvodů jinak, a proto další text bude vlastně do značné míry souhrn jednotlivých více méně konkrétních úloh a příslušných algoritmů pro jejich řešení. Jednou z nejvíce frekventovaných úloh v této kapitole bude úloha řešit lineární samoadjungovanou diferenciální rovnici 0-12) -(p(x)y,)' + q(x)y=f(x) se separovanými lineárními okrajovými podmínkami (1.13) -*itía)ý{a) + j3iy(af= 7l, Většinu výsledků, které dostaneme pro tuto okrajovou úlohu, lze bez podstatných obtíží přenést na diferenciální rovnici čtvrtého řádu (114) {P(*)y")" + q(x)y = f(x) s okrajovými podmínkami např. (115) äfa) =71, VW = «i, m=72, s/(fr) = ŕ2. Rovněž touto úlohou se budeme v dalším zabývat. Konečně si také všimneme, zejména proto, abychom ilustrovali problémy, které vznikají při řešení nelineárních úloh, diferenciální rovnice (1.16) s okrajovými podmínkami (1.17) y" = f(*,v) y(<*)-7i, S/(6) = 72, Většinu prostoru budeme tedy věnovat lineárním úlohám, které jsme v případě úloh s počátečními podmínkami ani separátně neprobírali. Důvody pro to jsou v podstatě dva. 0 jednom z nich — teoretických obtížích spjatých S nelineárními okrajovými úlohami —jsme se už zmínili. Druhý důvod je ten, že nelineární úlohy se často, opět na rozdíl od úloh s počátečními podmínkami, řeší iteračně tak, že se konstruuje posloupnost lineárních úloh, jejichž řešení konvergují k řešení původní úlohy. K provedení tohoto postupu je uspokojivé a efektivní řešení lineárních úloh nezbytným předpokladem. Z konkrétních jednotlivých metod pro řešení výše popsaných problémů se všimneme metod, které převádějí řešení okrajové úlohy na řešení úloh s počátečními podmínkami, dále pak metody sítí a konečně velmi stručně variačních metod, zejména jejich důležitého speciálního případu, totiž metody konečných prvků. 2 Metody založené na převodu na úlohy s počátečními podmínkami V kapitole 1 jsme viděli, že úlohy s počátečními podmínkami pro obyčejné diferenciální rovnice umíme celkem uspokojivě řešit. Je proto přirozené snažit se převést řešení okrajové úlohy na řešení úloh s počátečními podmínkami. V tomto článku si všimněme několika způsobů, jak toho lze docílit. 2.1 Metoda střelby Základní myšlenka této metody je velmi jednoduchá a nabízí se na první pohled. Popíšeme ji nejprve na příkladě diferenciální rovnice druhého rádu. 2.1.1 Okrajová úloha pro lineární rovnici druhého řádu Uvažujme diferenciální rovnici (1.12) s okrajovými podmínkami (1.17), které jsou zřejmě speciálním případem podmínek (1.13). Často se jim také říká Dirichleto-vy okrajové podmínky. Předpokládejme přitom, že funkce p, p', q f jsou spojité v intervalu (a, i), že existuje kladná konstanty po taková, že platí (2.1) p(x) g po (> 0), xe{a,b), a že je (2.2) ?0)š°. xĚ{a,b). Později uvidíme, že tyto předpoklady zaručují existenci a jednoznačnost řešeni úlohy (1.12), (1.17). (Ve skutečnosti je možno tyto předpoklady ještě podstatně zeslabit, nám však nejde o to vyslovit příslušná tvrzení za co nej obecnějších předpokladů, ale o to ukázat základní myšlenku a použít přitom pokud možno co nejelementár-nějšl matematický aparát.) Z věty 1.1 z kap. I (vyslovené pro případ soustav diferenciálních rovnic) a z výše zformulovaných předpokladů o koeficientech diferenciální rovnice (1.12) plyne, že existuje právě jedna funkce y(x) = ylx\ aj, která je v intervalu (a,b) řešením diferenciální rovnice (1.12) a pro niž platí Ca (2.3) y(a) = 7i, j/(o)=a, kde a je libovolné pevně zvolené reálné číslo. Funkce y splňuje tedy danou diferenciální rovnici, jednu z okrajových podmínek (1.17) (v bodě x — a) a závisí na parametru a. Podaří-li se určit takovou hodnotu a" parametru a, aby platilo (2.4) y(*l«*) = 72, bude funkce y(x; a") řešením okrajové úlohy (1.12), (1.17). Hodnoty funkce y(b; a*) proměnné a jsme schopni určovat pomocí řešení diferenciální rovnice (1.12) a počátečními podmínkami (2.3) a převedli jsme tedy původní úlohu na řešení úloh 124 125 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY s počátečními podmínkami a na řešení rovnice (2.4) pro a*. Je také dostatečně jasné, proč jsme tuto metodu nazvali metodou střelby. Všimněme si nyní řešitelnosti rovnice (2.4). Označme symbolem z(x) řešení diferenciální rovnice (2.5) -(p(*)*0' + s(*)* = 0 (tj. homogenní rovnice příslušné k rovnici (1.12)) s počátečními podmínkami (2.6) z{a) = 0, z'(a) = 1. Pak platí pro libovolné a (2.7) c>r''r<>- y(x;a) = y(ii;Q) + az(x) ' * a speciálně pro x — b máme y(b;at) — y(b)0) + az(b). Rovnice (2.4) pro určení a* je tedy lineární a za předpokladu, že je z(b) ^ 0, platí (2.8) "' = ^j [■»-»(*; 0)]. Dosadíme-li konečně do rovnice (2.7) podle (2.8), dostáváme pro řešení y(x;a*) dané okrajové úlohy vzorec (2.9) y{x;a*) = y(x;0) + a'z(x) platný samozřejmě za předpokladu, že je z(b) ^ 0. O něco později ukážeme, že předpokládáme-li o koeficientech diferenciální rovnice (1.12) nerovnosti (2.1) a (2.2), je tento požadavek skutečně splněn. Řešit lineární okrajovou úlohu (1.12),' '(117) metodou střelby tedy znamená vyřešit jednu homogenní rovnici, jednu nehomogenní rovnici, obě s počátečními podmínkami a získané funkce zkombinovat podle rovnice (2.9). Takřka na první pohled je vidět, že metoda střelby je použitelná i při obecných okrajových podmínkách (1.13). Je-li např. /?i ^ 0, stačí Za funkci j/(ar; ct) vzít řešení diferenciální rovnice (1.12) splňující počáteční podmínky i -;c á ti n (2.10) y{a) = —fa + alP(a)c,], i/(a) = á. Pl Pak tato funkce splňuje při libovolném a první okrajovou podmínku (1.13) a k tomu, aby daná okrajová úloha byla vyřešena, stačí vypočítat a" z rovnice (2.11) a2P(b)y(b;a") + /32y(b; a") = jí. Tato rovnice je podobně jako rovnice (2.4) opět lineární, neboť funkce j/(a?; a) se dá psát ve tvaru (2.12) 126 y(x;a) = y(x;0) + á^-z{x), r 2 METODY ZALOŽENÉ NA PŘEVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI kde z je řešením homogenní rovnice (2.5), tentokrát s počátečními podmínkami (2.13) z(a) = a1,'2 p(a)z'(a) = &. 1 Rovnice (2.11) tedy přejde v rovnici (2.14) a2p(b) [y'ib; 0) + a ^z'(i)] + [y(b; 0) + iP-^z{b)\ = ^ a je-li 0J2í>(6)z'(6) + ^2(i) ^ 0 (což opět později za vhodných předpokladů dokážeme), můžeme odtud a* vypočítat. 2.1.2 Obecná okrajová úloha Podobně jako v případě modelové rovnice druhého řádu lze postupovat i při řešení soustavy diferenciálních rovnic (1.1) s okrajovými podmínkami (1.3). Zvolíme libovolný m-dimenzionální vektor a = (ai,.. .am)T a řešíme soustavu (1.1) s počátečními podmínkami (2.15) y (o) - a. Získané řešení je opět jako v případě rovnice druhého řádu funkcí parametru a a označíme je y (x; a). Další krok spočívá v řešení soustavy m (obecně nelineárních) rovnic (2.16) F(a) = 0, kde vektorová funkce F je definována předpisem (2.17) F («) = r (a, y (6; a)). Označíme-li a* řešení soustavy (2.16), nalezneme řešení dané okrajové úlohy řešením soustavy diferenciálních rovnic (1.1) s počáteční podmínkou (2.18) y(o) = a*. Jsou-li okrajové podmínky dané okrajové úlohy separované, tj. tvaru (1.4), volíme parametr a apriori tak, aby pro něj platila rovnice (2.19) fl(a) = 0. Funkce F na levé straně rovnice (2.16) je pak definována vztahem (2.20) F(a) = r2(y(t;a)), takže soustava, kterou je třeba řešit, má méně rovnic a také méně neznámých než v obecném případě. Jedním z kroků, který je třeba provést při užití této metody, je tedy řešení soustavy nelineárních rovnic (2.16), což je obecně značně obtížný problém. Tento problém odpadá v případě soustavy lineárních rovnic (2.21) y' = Ay + f 127 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY s lineárními okrajovými podmínkami (1.5). Zde A je čtvercová matice řádu m, jejíž prvky jsou spojité funkce a f je m-dimenzionální vektor se spojitými složkami. V tomto případě je funkce F tvaru (2.22) F(a) = Ua + Vy (&; a) - c, kde vektor y(x\a) je řešením diferenciální rovnice (2,21) s počáteční podmínkou (2.15). Tento vektor však lze psát ve tvaru (2.23) y (x; a) — $(x)a + y (x; 0), kde matice <ř je tzv. fundamentální matice soustavy diferenciálních rovnic (2.21) v bodě x = a, tj. je to matice, jejíž i-tý sloupec je řešením homogenní diferenciální rovnice (2.24) y'=Ay s počátečními podmínkami (2.25) 'y(a) =1, Ma)=0, j # i. Řešení rovnice (2.16) je tedy dáno vzorcem (2.26) o* = [t/ + V«ř(6)]-l[c - Vy (b; 0)] (samozřejmě za předpokladu, že příslušná inverzní matice existuje) a k jeho získání stačí řešit jednu soustavu lineárních algebraických rovnic. Sloupce matice * lze vypočítat řešením m úloh s počátečními podmínkami. Požadované řešení y{x;d) dané okrajové úlohy pak už není třeba získávat řešením rovnice (2.21) s počáteční podmínkou y (a) = a*, ale obdobně jako v případě rovnice druhého řádu lze použít vzorec (2.27) y(x;a*) =#(x)a*+y(x;0), neboť funkce, které se v něm vyskytují, jsme už v předchozím průběhu museli stejně počítat. 2.1.3 Obtíže spojené s metodou střelby V předchozích odstavcích jsme viděli, že metoda střelby je aspoň formálně použitelná i v případě velmi obecných okrajových úloh. Upozornili jsme již, že řešení nelineární soustavy (2.16), které je při jejím užití nezbytné, může být neobyčejně obtížné. I když však od tohoto problému odhlédneme (to je možné například, řešíme-li lineární úlohu), mohou se při provádění metody střelby objevit další vel mi vážné obtíže vyplývající z toho, že aritmetické operace nejsme schopni provádět přesné. Jejich podstatu nejlépe pochopíme na jednoduchém příkladě. 128 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Příklad 2.1. Řešme metodou střelby diferenciální rovnici druhého řádu (2.28) -y" + 100y = 0 s lineárními separovanými okrajovými podmínkami (2.29) y(0) = y($ = 1. Řešení této jednoduché okrajové úlohy lze tedy nalézt ze vzorce (2.9), kde je (2-30) y(x;0) = £e10* + ie"10*, (2.31) (2.32) .//o; r= a* — —10 -I- 20 1-e- /č>f (jde o řešení diferenciální rovnice (1.12) s počátečními podmínkami (2.3) s ct — 0, o řešení diferenciální rovnice (2.5) s počátečními podmínkami (2.6) a o určení a* z rovnice (2.8)). Vypočteme-li a* s relativní chybou £, dostaneme jako aproximaci hledaného řešení funkci *)*/• (2.33) yc(x) = -lee101 + (1 + Jeje"11*. Položíme-li zde např. e = 10-10, nabývá toto přibližné řešení v bodě 2 = 10 hodnotu (2.34) yc0 « - i 10-10e10° w -1, 34.1033. Z uvedeného jednoduchého příkladu vidíme, že i když vypočítáme hledanou počáteční hodnotu na plnou strojovou přesnost, ještě zdaleka odtud neplyne, že je možné vypočítat i přibližné řešení s přijatelnou přesností. Zároveň také vidíme, že vzniklé obtíže budou v^ašemjednpduchém příkladě tím větší, čím větší bude koeficient u y v rovnici (2.28) nebo čím delší bude interval, v němž hledáme řešení. Konečně je z tohoto příkladu patrné, že podstata obtíží spočívá v tom, že malá změna v počáteční podmínce způsobuje velkou změnu v řešení. Jev, který jsme pozorovali v uvedeném příkladě, je naneštěstí pro „rozumné" okrajové úlohy typický. „Rozumnou" úlohou zde rozumíme úlohu, v níž malé změny ve vstupních datech mají malý vliv na řešení. Úlohy vzniklé správnou aplikací fyzikálních zákonů většinou tuto vlastnost mají. Praktická zkušenost přitom ukazuje, že je-li pro danou rovnici „rozumná" okrajová úloha, je pro tuto rovnici úloha s počátečními podmínkami nepřirozená, a proto se tato úloha chová většinou „nerozumné". Obtíže metody střelby, které jsme právě popsali, i když jsou značné a mohou často její užití úplně znemožnit, nejsou jediné. V případě nelineární okrajové úlohy, i když její řešení existuje (a soustava (2.16) musí mít tedy řešení), může metoda střelby selhat z toho důvodu, že řešení diferenciální rovnice (1.1) s počáteční podmínkou y {a)— a existuje v celém intervalu (a, b) pouze pro ty hodnotu parametru a, které ľ. v<^ 139-í.-' II. OBYČEJNĚ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ CLOHY leží v nějakém — často velice malém — okolí bodu a*. Určení tohoto okolí však představuje většinou velmi vážný problém, takže lze jen těžko odhadnout přesnost, s níž je třeba řešit soustavu (2.16), abychom byli schopni nalézt vůbec nějaké řešení. Důvody, které jsme uvedli, nemají čtenáři vnutit představu, že metoda střelby je v zásadě špatná. Chtěli jsme jen upozornit na některé typické problémy, které se při jejím užití mohou vyskytnout a které také vedly k tomu, že byl navržena řada jiných postupů převádějících okrajovou úlohu na úlohu s počátečními podmínkami, které si kladou za cíl aspoň některé ze zmíněných obtíží odstranit. Jeden takový postup, který navazuje přímo na metodu střelby, popíšeme v následujícím odstavci, dalších si pak všimneme v odst. 2.2 a 2.3. 2.1.4 Střelba na více cílů V předešlém odstavci jsme ukázali, že při metodě střelby může docházet k podstatným obtížím, které jsou způsobeny často tím, že jsme nuceni řešit úlohu s počátečními podmínkami pro danou diferenciální rovnici na příliš dlouhém intervalu. Metoda, kterou popíšeme v tomto odstavci, možnost vzniku těchto obtíží většinou dosti podstatně snižuje. Její základní myšlenka spočívá v tom, že se hodnoty hledaného řešení počítají ne v jednom bodě, ale v několika bodech najednou. Buď tedy dána okrajová úloha (1.1), (1.3) a buďte xq,.. .,xn takové body intervalu {a, b), pro něž platí (2.35) a = x0 -r /.'■■, i,. > (2.44) «pKoy(£o) + /3j/(£o)=7. ^ ■ * ■ Nechť konečně funkce z je v intervalu (£1,^2) řešením diferenciální rovnice (2.5) s počátečními podmínkami ^ (2-45) *«<>) = -«, p((0)A(o) = P a funkce c řešením diferenciální rovnice (2.46) c'-fz s počáteční podmínkou (2-47) c(£0) = 7. Pat platí (2.48) -«(i)p(x)»/'(i) + p(z)2'(*)í/(*) = c(x) pro každé x G ((1,(2). Důkaz. Funkce z, resp. c jsou diferenciálními rovnicemi (2.5), resp. (2.46) a počátečními podmínkami (2.45), resp. (2.47) jednoznačně určeny, jak plyne z modifikace věty 1.1 kap. I pro soustavy diferenciálních rovnic prvního řádu. Vynásobíme-li tedy rovnici (1.12) funkcí z a dosadíme-li do vzniklé rovnice z rovnic (2.5) a (2.46), máme (2.49) -lp(*y(*)]'2(*) + y(x)\p(x)z'(x)]' ~ ''(*) = 0 :>0 "/j'''.K pro x £ (£i,£2). Položíme-li Jj h ^ V' (2.50) n(x) - -z(x)p(x)yJ(x)+p(x)z'(x)y(x) - c(x), plyne z rovnice (2.49), že pro každé x 6 (£i,£j) Je l'(x) — Oí^Funkce n je tedy v intervalu (£i,£2) konstantní. Protože platí n(£o) = 0, jak plyne z rovnic (2.44), (2.45) a (2.47), je j)(x) = 0. Lemma je dokázáno. Jf Vzhledem k tomu, že diferenciální rovnice prvního řádu (2.48) je obdobného tvaru jako podmínka (2.44), můžeme tvrzení lemmatu 2.1 interpretovat také tak, že lineární podmínku (2.44) platnou v jednom bodě intervalu, v němž je splněna daná diferenciální rovnice, lze přesunout do libovolného jiného bodu tohoto intervalu, přičemž přesunutá podmínka bude mít tvar (2.48). Lemma 2.1 nabízí postup řešení okrajové úlohy (1.12), (1.13): Každou z podmínek (1.13) přesuneme do téhož bodu intervalu (o, í>). Dostaneme tak dvě rovnice, které svazují lineárně hodnotu hledané funkce s hodnotou její derivace v tomtéž bodě. Z těchto rovnic můžeme, alespoň za vhodných předpokladů, vypočíst funkční hodnotu a hodnotu první derivace, a získat tak počáteční podmínky pro rovnici (1.12). V následující větě zformulujeme základní vlastnosti právě popsané metody. Veta 2.1. Nechť funkce p, p', q a / jsou spojité na intervalu (o, b) a nechť platí (2.1). Nechť dále funkce z, resp. z jsou řešením diferenciální rovnice (2.5) s počátečními podmínkami (2.51) *(<")=<*!, p(a>'(") = A, resp, (2.52) !(») = -«,, P(b)-z'íb) = 02 a funkce c, resp. č řešením diferenciální rovnice (2.46), resp. diferenciální rovnice (2.53) č' = f ž s počáteční podmínkou (2.54) c(o) = 7l, resp. (2.55) č(b) = y,, Pak lze pro každé ij £ (a, b) sestavit soustavu lineárních algebraických rovnic (2.56) pro niiplatí: Má-Ji okrajová úloha (1.12), (1.13) řešeníy,je vektor (y(xa),y'(xo))T řešením soustavy (2.56), a naopak, má-li soustava (2.56) řešení (k±, k2)T, je funkce y, kterou získáme řešením diferenciální rovnice (1.12) s počátečními podmínkami y(xo) = fci, y'(xo) — k2, řešením okrajové úlohy (1.12), (1.13). Má-li okrajová úloha (1.12), (1.13) jediné řešení, má i soustavy (2.56) jediné řešení a naopak. Důkaz. Existence řešení soustavy (2.56) za předpokladu existence řešení okrajové úlohy (1.12), (1-13) plyne ihned z lemmatu 2.1, neboť první rovnice soustavy (2.56) je první podmínka (1.13) přesunutá do bodu x — x0 a druhá rovnice této soustavy je druhá podmínka (1.13) přesunutá do téhož bodu. Naopak, nechť soustava (2.56) má řešení (ki,k2)T. Pak existuje funkce y, která je řešením diferenciální rovnice (112) a pro niž platí y(xo) — ti, »/(*o) = k3. Pro tuto funkci platí dále (2.57) p(x0)z'(xa) -p(x0)z(x0) v C(xa) p(x0)ž'(x0) -p(x0)ž(xa) Axo). -z(x0)p(x0)ý{x0) + p(x0)z'(xo)y(x0) ~ c(io) (2.58) -z(x0)p(x0)y'(xl)) + p(x0)ž'(xo)y(xa) - čfxo) 132 133 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY Přesuňme podmínku (2.57) do bodu a. Podle lemmatu 2.1 platí (2 59) -p(«)f(«)!/(«)+P(«y(«)j(!/) " s(a), kde r je řešením diferenciální rovnice (2.5) s počátečními podmínkami (2.60) a s řešením diferenciální rovnice r(x0) = z(x0), r'(x0) = ' \ ■'- = z'(x0) P(xo) (2.61) s' = fr s počáteční podmínkou (2-62) s(x0) ~ c(x0). Protože funkce r splňuje tutéž diferenciální rovnici jako funkce z a protože pro ni platí (2.60), plyne z věty o jednoznačnosti řešení úlohy s počátečními podmínkami pro obyčejné diferenciální rovnice, že je rix) = z(x). Odtud však už plyne, že je také &(x) = c(x). Námi sestrojená funkce y splňuje tedy vzhledem k podmínkám (2.51), (2.54) levou okrajovou podmínku. Splnění pravé okrajové podmínky se dokáže úplně stejně. Za předpokladu řešitelnosti soustavy (2.56) se nám tedy skutečně podařilo sestrojit řešení okrajové úlohy (1.12), (1.13). Nechť nyní má okrajová úloha (1.12), (1.13) jediné řešení a předpokládejme, že soustava (2.56) má dvě různá řešení (k\, kz)7 a (kít k2)T. Sestrojme funkce y\, resp. j/2 jako řešení diferenciální rovnice (1.12) s počátečními podmínkami yi(x), může být výhodnější (tj. ekonomičtější) takový postup, že žádanou hodnotu nebo hodnoty vypočteme přímo ze soustavy (2.56). Řešení původní diferenciální rovnice pak odpadá. I tuto variantu nazveme metodou přesunu. 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Upozorněme ještě, že při řešení okrajové úlohy (1.12), (1-13) metodou přesunu okrajových podmínek založeném na větě 2.1 se předem nemusíme starat o její řešitelnost. Soustavu (2.56) lze sestavit vždy a má-li řešení, nalezneme též řešení původní okrajové úlohy. Nemá-li soustava (2.56) řešení, nemá ani okrajová úloha (1.12), (1-13) řešení. Tato skutečnost také umožní nalézt elementárně podmínky, za kterých je úloha (1.12), (1.13) řešitelná při libovolných 71 a 72. K tomu cíli dokážeme nejprve následující lemmata. Lemma 2.2. Nechť funkce p, p' a q jsou spojité a nechť platí nerovnosti (2.1) a (2.2). Nechť dále ct-, a 0\ jsou nezáporná čísla, pro něž platí (2.63) «!+/?! >0. Buď konečně funkce z definovaná diferenciální rovnicí (2.5) a počátečními podmínkami (2.51). Pak pro každé x 6 (a, b) platí (2.64) *(*)Žai+ftjf ^ (2.65) p(x)z'(x) ^ /?1 + Ofl dí. Důkaz Dokažme nejprve, že platí z(x) ž 0a z'(x) ž 0 pro x £ (a, i). Důkaz tohoto tvrzení provedeme sporem. Položme k tomu cíli 9Jt = {x\ a < x á 6, z(x) < < 0} a předpokládejme, že množina 9Tt je neprázdná. Za tohoto předpokladu je io = inf2Jt reálné číslo ležící v intervalu (a, b). Dále z počátečních podmínek pro funkci z ihned plyne, že je a < xq ž 6. Skutečně, je-li ai > 0, plyne to ze spojitosti funkce z; je-li ai = 0, je v důsledku předpokladu (2.63) ft>0a funkce z je v bodě x = o rostoucí. Existuje tedy S > 0 takové, že je z(x) > 0 pro x 0, byla by funkce z v bodě ar. = Xg rostoucí, což odporuje definici čísla xg. Celkem je tedy z(x0) = z'(xa) = 0. Odtud ale plyne, že je z(x) = = 0, neboť funkce z je řešením lineární diferenciální rovnice (2.5), pro niž platí věta o jednoznačnosti. To je však ve sporu s předpokladem ct\ ž 0, /3i ž 0, ai + Pí > 0. Obdržený spor dokazuje, že množina 971 je prázdná, a tedy je skutečně z(x) ž 0 pro x £ (a, b). Z rovnice (2.66) pak plyne, že na tomto intervalu je také z'(x) ž 0. Protože je z'(i) ž 0, je funkce z neklesající a platí tedy (2.67) z(x) ^ Ct\. 134 135 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY Použijeme-li tuto nerovnost v (2.66), dostáváme nerovnost (2.65), Z nerovnosti (2.65) však plyne, že je (2.68) p(x) neboť funkce g je nezáporná. Z této nerovnosti dostáváme integrací ihned nerovnost (2.64). Lemma je dokázáno. Ě Lemma 2.3. Nechť funkce p, p' a q splňují tytéž předpoklady jako v lemmatu 2.2 a neciť «2 a fa jsou nezáporná čísla, pro něž platí (2.69) C-2 + fa > 0. Pai pro řešení ž diferenciální rovnice (2.5) s počátečními podmínkami (2.52) platí pro každé x £ (o, o) nerovnosti (2.70) t(x) g -0,2 -fa J 6ii P(í) (2.71) p(x)z'(x) ž fa + a2 /' í(í) d í. Důkaz se provede zcela analogicky jako důkaz lemmatu 2.2. Lemma 2.4. Nechť jsou splněny předpoklady lemmat 2.2 a 2.3. Pat platí implikace (2.72) (2.73) det det p(b)z'(b) _»(») Ä «2 p(a)z'(a) -ž(a) = 0 => A=A=0a 9(i) = 0 = 0 =*• fa = A = 0 a }(») = 0. (2.74) det = <*jpW*'(») + A*W2 Důkaz. Pro determinant na levé straně implikace (2.72) platí podle lemmatu 2.2 p(b)z'(b) -z(bY fa <*2 š«aA+aiA+<*iasjí q(t)dt + fafaj^ což je součet nezáporných čísel. Je-li tedy determinant na levé straně nerovnosti (2.74) roven nule, rovnají se nule všechny sčítance na pravé straně, tj. platí (2.75) a2fa = aifa = alQ2 J q(t)dt - fafa -iydi = 0. 136 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Podle (2.63) a (2.69) je 0 < (0aor2>0az rovnic (2.75) plyne, že fa — fa = 0 a J q(t)dt = 0. Z poslední rovnosti však plyne, že je q = 0, neboť funkce q je nezáporná a spojitá. Implikace (2.73) se dokáže stejně snadno. Lemma je dokázáno. Veta 2.2. Nechť funkce p, p', q a / jsou spojité v intervalu (o, b) a nechť platí nerovnosti (2.1) a (2.2). Nechť koeňcienty a,- a $ jsou nezáporné a nechť pro ně platí nerovnosti (2.63) a (2.69). Konečně nechť není současně fa = fa = Q aq = Q Pak okrajová úloha (1.12), (1.13) má při libovolných yi a y2 právějednoře&ní. Důkaz. Podle věty 2.1 je řešitelnost dané okrajové úlohy ekvivalentní s řešitelností soustavy (2.76) (Ve větě 2.1 jsme položili x), resp. ai2p(b)z'(b) 4-+ faz{b), kde funkce z byla v intervalu (a,b) řešením diferenciální rovnice (2.5) 137 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY s počátečními podmínkami (2.6), resp. (2.13). Jsou-li však splněny předpoklady věty 2.2, plyne tato skutečnost ihned z lemmatu 2.4. Z této úvahy také vidíme, že metoda střelby a metoda přesunu okrajové podmínky jsou si značně blízké, neboť v obou případech počítáme podobné veličiny. K této poznámce se ještě vrátíme v odst. 2.2.4. 2.2.2 Obecná soustava lineárních diferenciálních rovnic V tomto odstavci si všimneme, jak lze jednoduše formulovat metodu přesunu okrajových podmínek pro soustavu lineárních diferenciálních rovnic (2.21) se separovanými lineárními okrajovými podmínkami (1.6). O prvcích matice A a o složkách vektoru f budeme přitom předpokládat, že jsou to funkce spojité v intervalu (a, b), takže jsme oprávněni užívat vetu o existenci a jednoznačnosti pro úlohu s počátečními podmínkami pro tuto soustavu. Kromě toho budeme předpokládat, že okrajové podmínky jsou nezávislé, což znamená, že hodnosti matic Vi a V? (typů mi x m a m2 x m s mi + = m) jsou rovny počtu jejich řádků. Metoda přesunu okrajových podmínek se opírá o následující lemma, které je přímým zobecnění lemmatu 2.1. Lemma 2.5. Nechť vektor y splňuje v intervalu (íi.ía) C (a, 6) diferenciální rovnici (2.21) a neciť v nějakém bodě £o € (ťi,íä) platí (2.80) Voy(ío) = vo, ide Vo je obdélníková matice typu mo x m (raj á m) a vo je daný mo-dimenzíoná/ní vektor. Buď dále R (x), x € (íi,Í2), matice typu mo x m, která je definovaná v intervalu (íi,íj) (maticovou) diferenciální rovnici (2.81) R' = -RA(x) s počáteční podmínkou (2.82) ŕ?(ío) = Vo. Buďkonečně r (x) mo-dimenzionální vektor definovaný v intervalu {fi,fa) diferenciální rovnicí (2.83) r'= R (x) f (x) s počáteční podmínkou (2.84) r(eo) = v0. Pak pro každé x e (f i, f 2) platí (2.85) R(x)y(x) = r (x). Důkaz. Předně rovnice (2.81) s podmínkou (2.82) skutečně jednoznačně definuje matici 17, neboť jde vlastně o soustavu m0m lineárních diferenciálních rovnic 138 2 METODY ZALOŽENÉ NA PŘEVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI prvního řádu pro mam neznámých prvků této matice. Totéž platí i o vektoru r. Vynásobíme-li rovnici (2.21) maticí R a použijeme-li rovnic (2.81) a (2.83), dostaneme (2.86) [R{x)y{x)-r{x)}, = 0. Vektor R (x)y (x) — r (x) je tedy v intervalu (f i, &) konstantní a vzhledem k podmínce (2.80) je nulový. Lemma je dokázáno. Postupem zcela analogickým, jakým jsme dokázali větu 2.1, se na základě lemmatu 2.5 dokáže i následující věta. Věta 2.3. Nechť prvky matice A a složky vektoru f jsou spojité na intervalu (a, 6). Nechť dále matice R (x), resp. R (x) typu miXm, resp. »712 x m jsou definovány diferenciální rovnicí (2.87) s počáteční podmínkou (2.88) resp. diferenciální rovnicí (2.89) s počáteční podmínkou (2.90) R' = -RA(x) R (a) = Vu Ŕ' - -RA(x) 6(6) = V2. Nechť konečně r (x), resp. r (x) jsou nu-, resp. m^-dimenzionální vektory definované diferenciální rovnici (2.91) r' = R(x) f (x) s počáteční podmínkou (2-92) r(a) = Vl, resp. diferenciální rovnicí (2.93) f = R (x) f (x) s počáteční podmínkou (2.94) ř(b) = V2. Utvoříme-Ii pak pro libovolné Xq 6 (a, b) soustavu m lineárních algebraických rovnic (2.95) R(x0y k = r(x0)' 139 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY platí: má-Ii okrajová úloha (2.21), (1.6) řešení y (x), je vektor y (x0) řešením soustavy (2.95), a naopak, je-li vektor k řešením soustavy (2.95), je vektor y (x), který získáme řešením soustavy (2.21) s počáteční podmínkou y (xq) = k, řešením okrajové úlohy (2.21), (1.6). Má-íi okrajová úlohy (2.21), (1.6) jediné řešení, má i soustava (2.95) jediné řešení a naopak. Poznámka 2.2. Z právě uvedené věty plyne následující jednoduché, často však velmi užitečné tvrzení: Nechť okrajová úloha (2.21), (1.6) má při libovolném f a při libovolných vi a v2 nanejvýš jedno řešení a nechť je rm + m2 - m. Pak má tato úloha při libovolných /, v\ a v3 právě jedno řešení. Skutečně, podle věty 2.3 stačí ukázat, že determinant soustavy (2.95) je od nuly různý. Kdyby však byl tento determinant roven nule, měla by homogenní soustavy příslušná k soustavě (2.95) netriviální řešení a okrajová úloha (2.21), (1.6) s f = 0 a vi = v2 = 0 by měla kromě triviálního řešení ještě také netriviální řešení. Na základě věty 3.2 se dají formulovat algoritmy pro řešení okrajové úlohy (2.21), (1.6), které jsou zcela paralelní k algoritmům pro rovnici druhého řádu popsaným v odst. 2.2.1. 2.2.3 Svázané a integrální okrajové podmínky V tomto odstavci ukážeme, jak lze některé úlohy s obecnějšími okrajovými podmínkami, než jsou lineární separované podmínky, převést na úlohu vyšetřovanou v předešlém odstavci. Nejprve si všimneme diferenciální rovnice (2.21) s obecnými lineárními okrajovými podmínkami (1.5). Tato úloha se převede na úlohu se separovanými podmínkami následujícím jednoduchým obratem. Řešíme v intervalu (a, (a + b)/2) soustavu 2tn diferenciálních rovnic (2.96) A(x) 0m -A(a + b-x) f{x) -f(a + b kde u je 2m-dimenzionální vektor a Om je čtvercová nulová matice řádu m, se separovanými lineárními okrajovými podmínkami (2.97) [U, V]u(a)-c, [lm,-lm]u{(a + b)/2) = 0, kde lm značí jednotkovou matici řádu m. Hledaný vektor y(x) = [1y(i), . ,mj/(z)]T je pak dán rovnicemi (2.98) 'y(x) = 'u(x), i=l,...,m, pro x e (a, (a + b)/2) a rovnicemi (2.99) 'Ví*) = m+iu(a + b-x), i = l,...,m, pro x e ((a + 6)/2, b). 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Okrajovou úlohu se svázanými okrajovými podmínkami se tedy podařilo převést na okrajovou úlohu se separovanými okrajovými podmínkami. Počet rovnic však přitom vzrostl na dvojnásobek. Jak druhý příklad uvažujme okrajovou úlohu, kdy kromě okrajových podmínek typu (1.6) je zadána ještě podmínka tvaru (2.100) J a (x)y(x)ix ■■ kde D (x) je daná obdélníková matice typu raj x m se spojitými prvky a c je daný konstantní mo-dimenzionáln! vektor. Doplňující podmínka tohoto typu se praxi vyskytuje např. při úlohách na vlastní čísla. Nalezneme-li řešení soustavy mo + m diferenciálních rovnic A(x) D(x) + (2.101) se separovanými lineárními okrajovými podmínkami (2.102) ' V: 0 >(<*)' 0 1 .»(■). 0 V2 0 rv2 0 1 .»(*). c kde y je m-dimenzionální vektor, u je mo-dimenzionámí vektor a typy nulových a jednotkových matic 0 a / jsou zřejmé ze souvislosti, je složka y nalezeného řešení řešením původní diferenciální rovnice (2.21), které splňuje okrajové podmínky (1.6) a integrální podmínku (2.100). 2.2.4 Obtíže spojené s metodou přesunu okrajové podmínky Metoda přesunu okrajových podmínek je jednoduchá, elegantní a má, alespoň teoreticky, významnou přednost v tom, že zároveň dává odpovědna otázku, zda řešení dané okrajové úlohy existuje. Praktické zkušenosti však ukazují, že při její konkrétní realizaci dochází často k značným obtížím. Kořen těchto obtíží je stejný, jako tomu bylo u metody střelby, jak je vlastně více méně zřejmé, neboť při metodě přesunu okrajových podmínek řešíme v podstatě tytéž úlohy s počátečními podmínkami jako u metody střelby. Ilustrujme typické jevy, které mohou nastat při metodě přesunu na následujícím jednoduchém příkladě, Příklad 2.2. Řešme v intervalu (0,1) diferenciální rovnici (2.103) — [(1 + z)j/]' + qy = [q + 7r2(l + x)] smwx - jr cos Tra: s Dirichletovými okrajovými podmínkami y(0) — y(l) = 0. Předpoklady existenční věty 2.2 jsou zřejmě splněny a přesné řešení této okrajové úlohy je funkce sin7rx. 140 141 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE OKRAJOVÉ ÚLOHY 2 METODY ZALOŽENÉ NA PS.EVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI V tab. 2.1 jsou uvedeny výsledky výpočtu pro q = 100 a q = 500. Potřebné úlohy s počátečními podmínkami byly řešeny standardní Rungovou-Kuttovou metodou s integračním krokem h = 0,0025. Z tabulky vidíme, že zejména v případě q = 500 jsou výsledky zcela neuspokojivé. Pro srovnání uvádíme v tab. 2.2 ještě řešení téže okrajové úlohy metodou střelby. I touto metodou dostáváme výsledky stejně špatné. Tabulka 2.1 Řešení okrajové úlohy pro diferenciální rovnici (2.103) metodou přesunu 1 - 100 ? = 500 X přibližné chyba přibližné chyba řešení řešení 0,0 0,000275 0,000275 163,484000 163,484000 0,1 0,309114 0,000097 18,324700 18, 015 700 0,2 0,587819 0,000 034 2,779730 2,191950 0,3 0,809028 0,000011 1,099890 0,290869 0,4 0,951059 0,000003 0,992 730 0, 041 673 0,5 1,000000 0,000000 1,006387 0,006387 0,6 0,951056 0,000000 0,952 091 0, 001 034 0,7 0,809017 0,000000 0,809189 0,000172 0,8 0,587785 0,000000 0,587813 0,000 028 0,9 0,309017 0,000000 0,309021 0,000003 1.0 0,000000 0,000000 0,000000 0,000 000 V následujícím odstavci ukážeme, jak lze neuspokojivé chování metody přesunu, které jsme ilustrovali v právě uvedeném příkladě, podstatně zlepšit. 2.3 Metoda normalizovaného přesunu Jde o modifikaci metody přesunu okrajové podmínky, která je motivována snahou odstranit obtíže spojené s praktickou realizací této metody. Při jejím popisu začneme opět s diferenciální rovnicí druhého řádu. 2.3.1 Diferenciální rovnice druhého řádu Buď dána okrajová úloha (1.12), (1.13). V odst. 2.2.1 jsme ukázali, že přesuneme-li levou a pravou okrajovou podmínku pomocí rovnic (2.56) do téhož bodu intervalu (a, 6), jsme schopni získat počáteční podmínky hledaného řešení řešením soustavy dvou rovnic o dvou neznámých. Máme-li na mysli jako konkrétní příklad okrajovou úlohu (2,28), (2.29), kterou jsme užili v odst. 2.1.3 k ilustraci potíží spojených Tabulka 2.2 Řešení okrajové úlohy pro diferenciální rovnici (2.103) metodou střelby 6 = 100 b = 500 X přibližné řešení chyba přibližné řešení chyba 0,0 0 0 0 0 0,1 0,309016 -0,000 001 0, 309012 -0,000005 0,2 0,587781 -0,000 004 0, 587774 -0,000011 0,3 0, 809011 -0,000005 0,809006 -0,000011 0,4 0,951039 -0,000017 0,950 562 -0,000495 0,5 0, 999936 -0,000064 0,997559 -0,002441 0,6 0,950 989 -0,000068 0,953125 0,002068 0,7 0,808945 -0,000072 0,710938 -0,098080 0,8 0, 587387 -0,000398 0,625 000 0,037 215 0,9 0,307861 -0,001156 0 -0,309018 1,0 -0,000 244 -0,000224 -1,000000 -1,000000 s metodou střelby, a přesouváme-li např. pravou okrajovou podmínku, jsou příslušné funkce f a č dány vzorci ž{x): J_„10(iC-10)__Le"1^*-10) 20B 20K (2.104) a (2.105) Č(x}=l. Soustava (2.56) (s xo = a - 0) je tedy tvaru 1 0 V i i (2.106) L 2" '2" 20" 20- Neznámé ki a k?, tj. hodnoty přesného řešení dané okrajové úlohy a jeho derivace v bodě 1 = 0 vypočteme z této soustavy sice v rámci běžné strojové přesnosti přesně (í?i = 1 a íľ2 — —10 dokonce na více než 42 platných dekadických cifer), tato přesnost však ani zdaleka nestačí k výpočtu uspokojivé aproximace, užijeme-li je jako počáteční podmínky pro rovnici (2.28) (srv. příklad 2.1 na str. 129). Čtenář se už sám může snadno přesvědčit, že obtíže zůstanou stejné, budeme-li přesouvat levou okrajovou podmínku. Je zde však ještě další okolnost, která může realizaci metody přesunu okrajové podmínky (a ostatně i metodu střelby, protože se v ní řeší tytéž rovnice) znemožnit ještě dříve, než sestrojíme soustavu (2.56). Tato okolnost spočívá v tom, že prvky matice této soustavy mohou být značně velké (u soustavy (2.106) jsou řádu 1043), 142 143 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE OKRAJOVÉ ÚLOHY 2 METODY ZALOŽENÉ NA PftEVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI takže může dojít k přeplnění dříve než dospějeme s řešením příslušných rovnic do žádaného bodu. Následující věty udávají vodítko, jak se těchto obtíží zbavit. Navíc pak nabídnou možnost, jak obejít nutnost řešit úlohu s počátečními podmínkami pro rovnici (1.12), která může být neúnosně citlivá na malé chyby ve vstupních datech. Věta 2.4. Nechť p, p', q a f jsou spojité funkce v intervalu (a, b) a nechť platí (2.1) a (2.2). Nechť funkce y splňuje v intervalu (a, b) diferenciální rovnici (1.12) a první' okrajovou podmínku (1.13) a nechť platí cti í 0, ž 0 acti + ft > 0. Pak platí: (i) Je-li cti > 0, je (2.107) -p(x)y'(x) + 0, je (2.112) -i>{x)p(x)y'(x) + y(x) = u(x) pro každé x € (a, b), kde funkce ij> je řešením diferenciální rovnice v(a) = p-. t»l />' - -q(x)ip2 + 1 p(x) (2.113) s počáteční podmínkou (2.114) a funkce u řešením diferenciální rovnice (2.115) u' - -q(x)i,(x)u + f{x)iji{x) 144 s počáteční podmínkou (2.116) Důkaz. Buď z řešení diferenciální rovnice (2.5) s počátečními podmínkami (2.51) a c řešení diferenciální rovnice (2.46) s počáteční podmínkou (2.54). Je-li ari > 0, pak podle lemmatu 2.2 je z(x) ž ai > 0 pro každé x 6 (a, b), a je tedy možno rovnici —z(x)p(x)y'(x) + p(x)z'(x)y(x) - c(x) platnou podle lemmatu 2.1 pro každé x G (a, 4) dělit funkcí z. Položíme-li tedy 0, dává lemma 2.2 nerovnost p{x)z'(x) ž p\ > 0. Položíme-li il>(x) — = z(x)/\p(x)z'(x)] a u(x) = c(x)/\p(x)z'(x)], dokážeme stejně snadno jako výše platnost tvrzení (ii). Věta je dokázána. Věta 2.5. Nechť p, p', q a f jsou spojité funkce v intervalu (a, b) a nechť platí (2.1) a (2.2). Nechť funkce y splňuje v intervalu (a, i) diferenciální rovnici (1.12) a druhou okrajovou podmínku (1.13) a nechť cti ž 0, p\ ž 0, cti + Pl > 0. Pai plat/ (i) Je-Ji a 2 > 0, je (2.117) -p{x)v'(x) + (x)y(x) = v{x) pro každé x £ [a, b), kde funkce ip je řešením diferenciální rovnice (2.118) s počáteční podmínkou (2.119) m = «2 a fiintce v je řešením diferenciální rovnice VÍ*) (2.120) s počáteční podmínkou (2.121) 6(6) = (ii) Je-li p2 > 0,je (2.122) -4{x)p{x)^(x) + 7rt» = ú(x) pro každé x £ (a, i>), kde funkce ý je řešením diferenciální rovnice 72 Qí2 ' (2.123) í>' = -q(x)ý2 + p(x) 145 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI s počáteční podmínkou (2.124) "2 a funkce ň je řešením diferenciální rovnice (2.125) ů' - -q{x)^x)ú + f(x)ý{x) s počáteční podmínkou (2.126) Důkaz Větu 2.5 dokážeme pomocí lemmatu 2.3 stejně snadno, jako jsme dokázali větu 2.4 pomocí lemmatu 2.2. Z věty 2.4 je vidět že lineární okrajovou podmínku typu (1.13) lze přesouvat pomocí rovnice (2.107), resp. (2.112), v ní? je koeficient u p(x)y'(x), resp. u y(x) roven minus jedné nebo jedné. Tento tvar přesunuté podmínky vznikl normalizací rovnice —z(x)p(x)y'(x)+p(x)z'(x)y(x) = c(z), a dá se proto očekávat, že koeficient 0. Pak podle věty 2.4 platí pro řešení dané okrajové úlohy speciálně (2.127) -p(b)y'(b) + 0. Z rovnice (2.112) psané pro x = b a z druhé okrajové podmínky (1.13) dostaneme Tij>{b) +aiu{b) MQ>) + «2 Použít tuto hodnotu jako počáteční podmínku přímo pro rovnici (2.112) je sice v zásadě možné, mohou však přitom vzniknout jisté problémy, protože na základě dosud uvedených tvrzení není jasné, zda nemůže nastat degenerace rovnice (2.112) v důsledku anulování koeficientu i}>. Proto je rozumnější počítat místo funkce y funkci (2.130) P(x)y'(x) = w(x) % diferenciální rovnice (2.131) -w' + q(x)il>(x)w = f(x) - q(x)u(x) s počáteční podmínkou 72 - /?2ti(fr) (2.132) w(b) = OC-2 + M(b) a funkci y pak vypočítat z rovnice (2.133) j/(i) = u(r) + rí>(x)w(x). Diferenciální rovnice (2.131) vznikla z diferenciální rovnice (1.12) dosazením za p(x)z'(x) podle (2.130) a za y podle (2.133) a počáteční podmínka (2.132) vznikla řešením rovnice (2.112) psané pro x = b a druhé rovnice (1.13) pro neznámou p(6)j/(i) = 11,(6). Následující věta právě popsanou metodu ospravedlňuje. Věta 2.6. Nechť jsou splněny předpoklady věty 2.2. Buďcti > 0 a buď funkce ip definovaná diferenciální rovnicí (2.108) s počáteční podmínkou (2.109), funkce v diferenciální rovnicí (2.110) s počáteční podmínkou (2.111) afunice y diferenciální rovnicí (2.107) s počáteční podmínkou (2.128). Pak y je řešením okrajové úlohy (1.12), (1.13). Buď 0i > 0 a buď funkce vj deňnovaná diferenciální rovnicí (2.113) s počáteční podmínkou (2.114), funkce ti diferenciální rovnicí (2.115) s počáteční podmínkou (2.116) a funkce w diferenciální rovnicí (2.131) s počáteční podmínkou (2.132). Pat funkce y deňnovaná rovnicí (2.133) je řešením okrajové úlohy (1.12), (1.Í3). Důkaz. Vyšetřujeme nejprve případ oři > 0. Podle věty 2.2 existuje jediné řešení problému (1.12), (1.13). Označme je pro potřeby tohoto důkazu y. Podle věty 147 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI 2.4 platí (2.134) a zároveň -p(b)y'(b) + v(b)y(b) = (2.135) c*2í>(W) +&£(*) = 72 Vypočteme-li z těchto dvou rovnic y(b), dostaneme (2.136) 72 + C12V{<>) ... 02 + a2 0. Je-li § opět řešení problému (112), (113), platí znovu podle věty 2.4 (2.138) -wmw)+$(*) = «(») a zároveň (2.135). Z těchto dvou rovnic však ihned plyne, že je (2.139) P(b)y'(b) = w(b). Píšeme-li však rovnici (2.133) pro x = b a dosadíme-li do rovnice (2.138) podle (2.139) a vzniklé rovnice odečteme, dostáváme, že je (2.140) Derivováním rovnice (2.133) a dosazením podle (2.115), (2.113) a (2.131) dostaneme, že platí (2.141) p(x)y'{x) = w(x). Odtud dalším derivováním plyne, že funkce y splňuje diferenciální rovnici (1.12). Toto zjištění spolu s podmínkami (2.140) a (2.139) však dává, že je y(x) = y(x). Věta je dokázána. Metodou popsanou ve větě 2.6, která tedy spočívá v tom, že okrajová podmínka se přesouvá v normalizovaném tvaru a že hledané řešení se dostane řešením diferenciální rovnice nižšího řádu, než je řád původní diferenciální rovnice, nazveme metodou normalizovaného přesunu okrajové podmínky. 148 Při metodě normalizovaného přesunu okrajové podmínky tedy řešíme nejprve zleva doprava dvě rovnice prvního řádu, z nichž jedna je nelineární (Ricattiova) a druhá lineární (v případě a i > 0 jsou to rovnice (2.108) a (2.110)), ahledané řešení dostaneme řešením lineární diferenciální rovnice zprava doleva. Řešení příslušných úloh s počátečními podmínkami přitom provedeme některou z metod popsaných v kap. I. Tam jsme sice všude předpokládali, že počáteční podmínka je zadaná v levém krajním bodě intervalu, v němž hledáme řešení, metody, které jsme uvedli, však lze beze změny užiti k řešení úloh, v nichž počáteční podmínka je zadaná v pravém krajním bodě daného intervalu. Stačí k tomu pouze předpokládat, že příslušný integrační krok je záporný. V popsaném postupu lze samozřejmě zaměnit roli krajních bodů intervalu (a, b). Postup je zřejmý, je jen třeba užít místo věty 2.4 větu 2.5. Tak za předpokladu, že je ot2 > 0, se řešení okrajové úlohy (1.12), (1.13) dostane řešením diferenciální rovnice (2.118) s počáteční podmínkou (2.119), diferenciální rovnice (2.120) s počáteční podmínkou (2.121) (obě tyto rovnice se řeší zprava doleva) a diferenciální rovnice (2.117) s počáteční podmínkou (2.142) Yl — ai0(a) V případě, že je 02 > 0, se řeší diferenciální rovnice (2.123) a (2.125) s počátečními podmínkami (2.124) a (2.126) zprava doleva, pak se řeší diferenciální rovnice (2.143) -w' + q(x)$(x)w - f(x) - q(x)ú(x) s počáteční podmínkou 71 ~ /?!"(") (2.144) w{a)-. -ai +0ií>(a) a hledané řešení se dostane z rovnice (2.145) y(x) = ů(x) + ij>(x)w(x). V případě, že nás zajímá řešení dané okrajové úlohy jen v jednom nebo několika málo bodech, je obvykle výhodnější postupovat obdobně jako u metody prostého přesunu. Řešením rovnic (2.108) a (2.110), resp. rovnic (2.113) a (2.115) přesuneme levou okrajovou podmínku do žádaného bodu xq a pomocí rovnic (2.118) a (2.120), resp. (2.123) a (2.125) přesuneme pravou okrajovou podmínku do téhož bodu. Hodnotu y(x0) a p(xa)y'(xo) pak vypočteme ze vzniklé soustavy. I tuto variantu nazveme metodou normalizovaného přesunu. O metodě normalizovaného přesunu bychom rádi tvrdili, že se v nějakém smyslu chová lépe než metoda střelby nebo metoda prostého přesunu. Doposud ovšem víme pouze, že tato metoda odstraňuje jen ten menší problém spojený s metodou prostého přesunu nebo metodou střelby, totiž přílišný růst veličin, s nimiž jsme nuceni počítat. Daleko vážnější nedostatek zmíněných metod spočívající v neúnosné 149 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE.- OKRAJOVÉ ÚLOHY vysoké citlivosti výchozí rovnice na počátečních podmínkách jsme zatím odstranili pouze tak, že jsme příslušnou úlohu z algoritmu normalizovaného přesunu prostě vyřadili a nahradili ji úlohou s počátečními podmínkami pro jinou diferenciální rovnici. Snažme se proto nalézt nějaké matematické důvody, které by vhodnost tohoto postupu podepřely. Začněme následující definicí: Definice 2.1. Řekneme, že řešení y diferenciální rovnice (2.146) ý = f(x,y) je stabilní vzhledem k trvale působícím poruchám, jestliže ke každému s > 0 existuje A > 0 tak, že pro každé řešení diferenciální rovnice (2.147) pro něž platí (2.148) Šř* = f (x, 9) + *(*). r £ (a, co), |iŕ(a) - y(a)\ S A (2.149) platí (2.150) pro každé x g (a, oo). sup \Ó(x)\ 5= A, \y(x) - y(x)\ < e Je zřejmé, že stejně dobře můžeme mluvit o stabilitě vzhledem k trvale působícím poruchám i v případě diferenciálních rovnic vyšších řádů nebo soustav diferenciálních rovnic. Stačí k tomu pouze pokládat v předchozí definici veličiny y a / nikoli za skaláry ale za vektory. Definice 2.1 postihuje zejména to, že řešení diferenciální rovnice, které je stabilní vzhledem k trvale působícím poruchám, závisí spojitě na malých změnách počáteční podmínky a pravé strany stejnoměrně vzhledem k délce intervalu, v němž je uvažujeme. Stabilita vzhledem k trvale působícím poruchám tedy vylučuje chování, které je při metodě střelby nebo metodě prostého přesunu typické, totiž že chyby podstatně závisí na délce intervalu, v němž hledáme řešení. Proto kdyby se nám podařilo dokázat, že rovnice normalizovaného přesunu jsou stabilní vzhledem k trvale působícím poruchám, byl by to velmi významný matematický argument v jejich prospěch. V dalším textu ukážeme, že za určitých doplňujících předpokladů tomu tak skutečně je. Nejdříve však zformulujeme a dokážeme pomocné tvrzení citované obvykle jako Bellmanovo nebo Gronwallovo lemma. 150 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Lemma 2.6. Nechť funkce ip, V> a x jsou spojité v intervalu (a,b) a nechť x je v tomto intervalu nezáporná. Nechť dále platí (2.151) y*.) i V(x) + f x{tMt)At pro každé x g (a, b). Pak platí (2.152) {rW"x^didT J a pro každé x g (a, b). Důkaz. Položme (2.153) R(x) = ľ X(t)(x) s počáteční podmínkou (2.156) V (a) = 0, je (2.157) R(x) g V(x) pro každé x £ (a, 6). Skutečně, položíme-li Z{x) = V(x) — R(x), je (2.158) Z'(x)-x(x)Z(x) = j(x), kde 7 je nezáporná funkce; rovnice (2.158) plyne ihned odečtením nerovnosti (2.154) od rovnice (2.155). Řešení diferenciální rovnice (2.158) s počáteční podmínkou Z{a) = 0, která je zřejmě splněna, však lze psát vzorcem (2.159) Z{x)- ľ y(r)el' *Wd< d r, Ja jak se snadno zjistí přímým výpočtem. Ze vzorce (2.159) je však patrno, že funkce Z je nezáporná v intervalu {a, b). Použijeme-li vzorec (2.159) ještě jednou, tentokrát na funkci V, dostáváme tvrzení lemmatu z nerovnosti (2.157). Věta 2.7. Nechť funkce p, p', q a / jsou spojité v intervalu (a,oo) a nechť v tomto intervalu platí (2.160) 0 < po S p(x) § Po 151 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI .t (2.161) 0 < 3o š q(x), kde po, qo a Po jsou konstanty. Nechť dále platí cn > 0 a f}\ > 0. Pale řešení diferenciální rovnice (2.108) a (2.110) s počátečními podmínkami (2.109) a (2.111) jsou stabilní vzhledem k trvale působícím poruchám. Důkaz Začneme rovnicí (2.108). Buď tedy

0 taková, že pro řešení ^ diferenciální rovnice (2.108) s počáteční podmínkou (2.109) platí (2.165) ip{x) ž po pro každé x ě (a, oo). Definujme k tomu cíli v intervalu (a, oo) funkci ip diferenciální rovnicí 1 Po (2.166) s počáteční podmínkou (2.167) Ví(a) = y(a) Přímým výpočtem se zjistí, že je 9n (2.168) 1/2y(tt) + (w/2tgM(£r >-■»)] PÍ«)t*[(ft)1/,(»-«)]+(Poío)1/í' Položíme-li w{x) = tp(x) — ij>{x), zjistíme snadno, že platí (2.169) J(x) + i"(a) + *(*)ul(«) = q(x) - ,o + (- - -fr) ž 0. P(x) \po P[x)J 152 Odtud a ze vzorce (2.167) však plyne, že je (2.170) (a) < (po^o)1'2, je zřejmě tp2(a) < po9o, a tedy (2.175) ^2(a)tgh " a)] + (poío)1/2řW š ŽPoíotgh [(^)!/% - °)] + (poíoJ^Vfa) - = (poSc)1/2{(po4o)1/2tgh [(g)I/S(* «)] +**.)} Z nerovnosti (2.175) už snadno plyne, že je (2.176) i>(x) ^ ip(a). Za číslo 0 je p(a) > 0. Za předpokladu, že rovnice (2.164) má řešení, platí (2.177) e(*)-=:e(a)exp[-£^dí] + Zde jsme použili vzorce analogického ke vzorci (2.159) pro řešení lineární diferenciální rovnice s nenulovou počáteční podmínkou. Položme dále (2.178) takže platí (2.179) 0 < dostaneme po snadných úpravách, že je (2.183) |e(i)|e'(í'-a) g |e(a)| + -[e"^-"5 - 1] + — T Kr)^—' d r. Použijeme-li na nerovnost (2.183) lemma 2.6, dostaneme. (2.184) |e(x)|e°(*-,I> š |e(o)| + -[e**-) - 1]+ O" + — T j|e(o)| + -ľe"^-"' - l])e» ("-T) d r. Po J« L 0 a l/(cr - e/po) í 2/o\ Tedy pro x £ (a,/?(s)) a pro \S(x)\ í 5 platí (2.186) Buď konečně (2.187) a nechť platí (2.188) a (2.189) 154 |e(*)|S|«(a)| + ^. A = min g, ^) \ + -[1 - e"^-")], kde Ä = max|ó"(z)|. Odtud však už požadované tvrzení plyne bezprostředně. Věta je dokázána. Snadno lze též dokázat, že za předpokladů analogických jako ve větě 2.7, ovšem tentokrát formulovaných pro interval (—oo, b), je i rovnice (2.107) stabilní vzhledem k trvale působícím poruchám, Na závěr tohoto odstavce ilustrujme metodu normalizovaného přesunu řešením téže okrajové úlohy jako v příkladě 2.2. Výsledky, které byly získány za stejných podmínek jako v citovaném příkladě, totiž užitím standardní Rungovy-Kuttovy metody s integračním krokem h — 0, 025, jsou shrnuty v tab. 2.3. Vidíme, že jsou podstatně uspokojivější než u metody střelby nebo prostého přesunu. 155 I II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY Tabulka 2.3 Řešení okrajové úlohy pro diferenciální rovnici (2.103) metodou normatiaovaného přesunu 9 = = 100 i = : 500 X přibližné řešení chyba přibližné řešení chyba 0,0 0,000000 0,000 000 0, 000000 0,000 000 0,1 0,309012 -0,000005 0,309007 -0,000 010 0,2 0,587778 -0,000007 0,587770 -0,000 015 0,3 0,809009 -0,000008 0,808999 -0,000018 0,4 0,951048 -0,000 009 0, 951037 -0,000019 0,5 0,999989 -0,000 011 0,999979 -0,000021 0,6 0,951045 -0,000012 0,951038 -0,000018 0,7 0,809009 -0,000 008 0,809007 -0,000010 0,8 0, 587784 -0,000001 0,587780 -0,000 005 0,9 0, 309018 0,000 001 0,309016 -0,000 001 1,0 0, 000000 0,000 000 0,000000 0,000 000 2.3.2 Obecná soustava lineárních diferenciálních rovnic V tomto odstavci stručně ukážeme, jak lze přenést myšlenku normalizovaného přesunu na případ obecné soustavy lineárních diferenciálních rovnic. Začneme několika pomocnými tvrzeními. Lemma 2.7. Buď (x) = {pij(x)} čtvercová matice řádu m, jejíž prvky jsou diferencovatelné funkce v intervalu I. Pak platí (2.197) [det$(x)]' = tr[$'(x)&(x) pro každé iěí, ide * = {'Pij) a pij je algebraický doplněk prvku ipj, matice tj. determinant matice řádu m — 1, která vznikne z matice * vypuštěním j-tého řádku a i-toho sloupce opatřený znaménkem (—1)'+J a tr(.) značí stopu matice, tj. součet jejích diagonálních prvků. Důkaz. Z definice determinantu plyne, že platí (2.198) [det*(s;)]' = det Vál P12 ^22 Pln P2n Vml Vm2 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI + det Vil Vl2 V21 iiVi* + ^vS^-r fc=i t=ij=i což dokazuje lemma. Lemma 2.8. Buď4?(x) ~ {ípij(x)} čtvercová matice, jejíž prvky (x) čtvercová matice řádu m definovaná maticovou diferenciální rovnicí (2.201) s počáteční podmínkou (2.202) #' = A(x)$, x e I, 0 takové, že matice Ri{x) je regulárni na intervalu (a, a + í). Předpokládáme-li, že matice /?i(x) je regulární na celém intervalu (a, b), lze přesunutou podmínku (2.217) psát ve tvaru (2218) yi(x) - G(x)y2(x) = 3(x), kde matice G(x) je dána rovnicí (2.219) G(x) = -[R1(x)]-1R2(x) a vektor j(x) rovnicí (2.220) g(x) = [R1{x)]-1r(x). Podmínka (2.218) už je v normalizovaném tvaru v tom smyslu, že koeficienty vystupující u prvních mi složek vektoru y(x) tvoří v celém intervalu (a, 4) jednotkovou matici. Abychom tedy mohli přesouvat danou okrajovou podmínku v normalizovaném tvaru, musí být především matice Ri(x) regulární pro každé x £ (a, 6) a musí být 159 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY možné počítat prvky matice G(x) a složky vektoru g(x) přímo a nikoliv pomocí matice R(x) a vektoru r(x) z metody prostého přesunu. Položíme-li (2.221) a (2.222) kde (2.223) A(x) = Au(x) Au(x)l *n(x) A22(x)\ ' M = I/i(»),/»(*)]*■, ' a„(i) ... almi(x) An(x) = An(x) ■ An{x) = A22{x) = ai,mi+i(x) .am1,m,+l(x) ami+i,i(a;) .. "mi(x) amí+l,mi+l(x) (*) aim(x) •■ amim(x) am1+l,m1(x) "mnv, (z) am1+l,m(x) ^mmííc) =[1/(í),...,mi/(ir)]T, =ri+7(«),...,"/w]T, určí se matice G(x) řešením maticové diferenciální rovnice (2.224) e« = ^u(a)G _ G^22(x) _ GA21(x)G + Au(x) s počáteční podmínkou (2-225) 6(a) = Gb a vektor g řešením diferenciální rovnice (2.226) j' = [An(x) - G(x)A2l(x)]g + - G(x)f2(x) s počáteční podmínkou (2-227) g(a) = gQi jak se snadno zjistí. 160 2 METODY ZALOŽENÉ NA PREVODU NA ÚLOHY S POČÁTEČNÍMI PODMÍNKAMI Maticová diferenciální rovnice (2.224) je nelineární (viz člen GA2\G), takže její řešení nemusí existovat v celém intervalu (a, 4). Předpoklad, že matice Rf 1(x) existuje pro každé x 6 (a, i), je vlastně totožný s předpokladem, že soustava diferenciálních rovnic (2.224) má řešení v celém intervalu (a,fc). O opatřeních, která je třeba učinit, je-li tento předpoklad porušen (což se pozná podle toho, že se nepodaří dojít s řešením rovnic (2.224) až do bodu b), se zmíníme později. Pomocí rovnic (2.218) přesuneme tedy okrajovou podmínku až do bodu b. Dostaneme tak rovnice (2.228) yi{b)-G{b)n{h) = g{b). Přidáme-li k těmto rovnicím druhou okrajovou podmínku (1-6), kterou zapíšeme pro názornost ve tvaru V2^[V2wm\ (2.229) kde jsme položili (2.230) dostaneme řešením takto vzniklé soustavy rovnic počáteční podmínku y{b) = = [yi(',)>>r2('l)]T hledaného řešení. Abychom utvořili úplnou analogii metody normalizovaného přesunu z odst. 2.3.1, nesmíme použít tuto počáteční podmínku pro původní soustavu diferenciálních rovnic, ale použijeme pouze její složku y2(6) jako počáteční podmínku pro soustavu diferenciálních rovnic (2.231) y'2 = [^22(x) 4- A21G(x)]y2 + f2+A21g. Tato soustava diferenciálních rovnic vznikla vyloučením složky y\ (x) hledaného řešení z původní soustavy (2.11) užitím rovnic (2.218). Řešením diferenciální rovnice (2.231) dostaneme složku y2 hledaného řešení. Potřeb ujeme-li znát i složku yi, určíme ji z (2.218). Metoda normalizovaného přesunu spočívá i pro uvažovanou obecnou okrajovou úlohu v řešení dvou úloh s počátečními podmínkami v bodě a, z nichž jedna je nelineární, a lineární úlohy s počátečními podmínkami v bodě b. Není-li splněn předpoklad regularity matice ŕ?i(x) v celém intervalu (a, b), za něhož jsme metodu normalizovaného přesunu okrajové podmínky odvodili, projeví se to tak, že uvnitř intervalu (a, b) existuje bod, v němž absolutní hodnoty některých prvků matice G(x) rostou nade všechny meze. Z lemmatu 2.10 však plyne, že matice R{x) = [rři(x), /?2(x)]r má hodnost mi pro každé x e (a, b), a tedy má vždy některých mj sloupců lineárně nezávislých. Můžeme tedy postupovat tak, že v tom bodě intervalu (a, b), v němž absolutní hodnota některého prvku matice G(x) převýší nějakou předem danou toleranci, provedeme nový výběr lineárně nezávislých sloupců matice R(x). V dalším výpočtu pak bude roli matice Ri(x) hrát matice sestavená z těchto sloupců. Příslušné diferenciální rovnice se samozřejmě změní, neboť nový výběr lineárně nezávislých sloupců znamená nové přečíslování složek 161 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY hledaného vektoru. Do dalších podrobností, které mohou být značně komplikované, už nebudeme zacházet, naším cílem bylo ukázat pouze základní myšlenku možného postupu. Pravou okrajovou podmínku lze samozřejmě také přesouvat v normalizovaném tvaru pomocí diferenciálních rovnic, které jsou analogické k rovnicím (2.224) a (2,226). Přesuneme-li tedy levou okrajovou podmínku a pravou okrajovou podmínku do téhož bodu £, můžeme vypočítat složky hledaného vektoru řešení v tomto bodě řešením soustavy lineárních algebraických rovnic. Dostaneme tak modifikaci metody normalizovaného přesunu, při níž řešení soustavy diferenciálních rovnic typu (2.231) odpadá. Praktické zkušenosti ukazují, že popsaná metoda normalizovaného přesunu okrajové podmínky vykazuje např. ve srovnání s metodou střelby většinou podstatně stabilnější chování. Je však dosti náročná na paměť počítače a kromě toho soustavy diferenciálních rovnic, které se v ní vyskytují, jsou často soustavami se silným tlumením, z čehož mohou vzniknout určité problémy při jejich řešení. Toto vše spolu s tím, že jde o metodu určenou výhradně k řešení lineárních problémů, může představovat v některých případech její citelný nedostatek. 3 Metoda sítí y^'f -„ Základní myšlenka metody sítí, zvané také diferenční metoda, je velice jednoduchá. V intervalu {a, b), v němž hledáme řešení dané okrajové úlohy, se zvolí konečná množina bodů zvaná síť — může to být např. množina ekvidistantních bodů k - 0,..., n}, tj. množina bodů daných předpisem (3.1) xh = a + kh, k = 0,...,n, kde a n je přirozené číslo — a v bodech této množiny se splní daná diferenciální rovnice (eventuálně i okrajové podmínky) přibližně, a to tak, že derivace, které se v nich vyskytují, se nahradí diferenčními podíly (tj. lineárními kombinacemi funkčních hodnot v okolních bodech), které je aproximují. Zanedbáme-li chyby, které přitom vzniknou, dostaneme pro hodnoty v bodech sítě soustavu konečně mnoha rovnic (v případě lineárního problému lineárních). Abychom mluvili konkrétně, uvažujme jako příklad jednoduchou diferenciální rovnici (3.3) ý"~f{x,y), xe(a,b), s okrajovými podmínkami (3.4) y(a) = 71, y(b) - 72. 162 3 METODA SlTl V odst. 3.4 ukážeme, že tato okrajová úlohy má za předpokladu dostatečné hladkosti funkce / a za předpokladu, že platí fv(x,y) ž 0, právě jedno řešení. Provedeme-li postup, který jsme naznačili, tj. aproximujeme-li druhou derivaci funkce y v bodě Xk podílem [j/(a:fc_i) — "íy(xk) + y(xk+i)]/h?, dostaneme, že pro i; = 1,.. .,n - 1 platí (3.5) -p-= f{Xk,yk) + £t, kde £t je chyba, které jsme se dopustili náhradou druhé derivace zmíněným podílem. Hodnoty přibližného řešení v bodech Xk, k = 0,..., n, které označíme yk, budeme tedy hledat ze soustavy (3.6) 3/jfc-i - tyk + Vk-i = h2f(xk,yi), k = 1, ,n-l, Vo - Ti, yn - ti- Vidíme, že soustavu rovnic (3.6), která nahrazuje původní okrajovou úlohu (3.3), (3.4) konečnědimenzionálním problém, jsme získali formálně velice jednoduše. Abychom však mohli mluvit o skutečné numerické metodě pro řešení dané okrajové úlohy, musíme ještě dát odpověďna tři otázky: (i) Musíme zjistit, zda soustava (3.6) má vůbec nějaké řešení, (ii) Musíme určit numerickou metodu pro řešení této soustavy a vyšetřit její vlastnosti (např. otázku konvergence iterací apod.). (iii) Musíme vyšetřit vztah mezi veličinami yk získanými řešením soustavy (3.6) ahodnotami y(xk) přesného řešení při h —> 0; jinými slovy, je třeba vyšetřit konvergenci popsaného postupu. Dát univerzální návody na řešení bodů (i), (ii) a (iii) není za současného stavu našich znalostí možné, upozorňujeme pouze na nutnost provedení patřičných úvah pro každý jednotlivý případ zvlášť. Z předchozího textu by mohl vzniknout dojem, že „nultý" bod při užití metody sítí, tj. postup, kterým získáme soustavu typu (3.6), je natolik jednoduchý, že se jím není třeba už dále zabývat. Není však tomu úplně tak, neboť je známo, že zdánlivě nepatrné modifikace mohou mít dosti podstatný vliv na vyšetřování problémů (i), (ii) a (iii). Proto si v dalších odstavcích, v nichž popíšeme metodu sítí pro některé konkrétní úlohy, všimneme všech čtyř zmíněných aspektů. Ještě předtím však věnujeme zvláštní odstavec tzv. monotónním maticím, neboť tato třída speciálních matic hraje v souvislosti s metodou sítí značně důležitou roli. 3.1 Monotónní matice Definice 3.1. Řekněme, že čtvercová matice A = {a,3} řádu n je monotónní, platí-li implikace (3.7) Ax^0=^x^0. Nerovnostem mezi vektory, případně maticemi, zde rozumíme tak, že příslušné nerovnosti platí pro všechny složky, případné prvky. Podobně symbolem |x| rozumíme, vektor, jehož složky jsou absolutní hodnoty složek vektoru x. 163 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE OKRAJOVÉ ÚLOHY Monotónní matice je tedy taková matice A, že z nezápornosti všech složek vektoru Ax plyne nezápornost všech složek samotného vektoru x. V několika následujících tvrzeních ukážeme některé základní vlastnosti monotónních matic, které v dalším textu použijeme. Lemma 3.1. Matice A je monotónní tehdy a jen tehdy, je-li regulární a je-li inverzní matice A'1 nezáporná (tj. má-li všechny prvky nezáporné). Důkaz. Předpokládejme nejprve, že matice A je monotónní a nechť vektor x je řešením soustavy Ax = 0. Z definice 3.1 pak ihned plyne, že je x = 0 (Ax ž ž 0 a A(—x) ž 0). Homogenní soustava Ax = 0 má tedy pouze triviální řešení, což dokazuje regulárnost matice A. Nezápornost matice A-1 plyne ihned z rovnice AA~X = / a definice 3.1. Obrácené tvrzení je zřejmé na první pohled. Lemma je dokázáno. Lemma 3.2. Nechť A je monotónní matice a nechť pro vektory y a z platí (3.8) \Ay\š Az. Pak platí (3.9) |y| í z. Důkaz Z nerovností (3.8) ihned plyne, že pro vektory z — y a. z + y platí A(z — y)~_\ 0 a A(z + y) ^ 0. Použijeme-li nyní implikaci (3.7), dostaneme ihned požadované tvrzení, Lemma 3.3. Nechť pro monotónní matice A a B platí nerovnost (3.10) A^B. Pak platí (3.11) A-XZB-1. Důkaz Tvrzení plyne ihned z identity A'1 - B'1 = A~1(B — A)B~1, na jejíž pravé straně je součin tří nezáporných matic, tj. nezáporná matice. Z uvedených lemmat vidíme, že monotónní matice mají řadu sice jednoduchých, ale, jak uvidíme, velmi důležitých vlastností. Podtrhněme zejména lemma 3.2, které dává možnost odhadnout řešení soustavy lineárních rovnic s monotónní maticí řešením soustavy, jejíž pravá strana majorizuje pravou stranu původní soustavy, a které tak představuje účinný aparát ke konstrukci nejrůznějších odhadů. Vzhledem k tomu, že zkoumání monotonie dané matice přímo z definice 3.1 je většinou nepohodlné (a často také vůbec prakticky neproveditelné) a ani ekvivalentní podmínka vyjádřená v lemmatu 3.1 obecně také mnoho nepomůže, uvedeme jednoduchou postačující podmínku uváděnou v literatuře pod názvem Collatzovo lemma. Před jeho formulací je třeba zavést ještě některé další pojmy. 3 METODA SlTf Definice 3.2. Řekněme, že čtvercová matice A = {clíj} řádu n je reducibilní, je-li možné přerovnat indexy l,...,n v posloupnost ri,...,ív, 1 á r < n. Zbývající indexy označme tri,..., on-r. Tvrdíme, že platí arlJÍr(J - 0 pro v — 1,..., r a fi = 1,..., n — r. Kdyby to totiž nebyla pro některé íi, fí pravda, platilo by aetajl ^ 0. Podle definice množiny ^ však existuje posloupnost ..., im taková, že platí a,-,,^ ^ 0, a,^,-, ^ 0,..., Ojmŕs ^ 0. Celkem by tedy platilo Oí0íl ^ 0, Oj,ť3 ^ 0,..., a,-mei! £ 0, aeeVf ^ 0, tj. o-ji £ f. To je však spor dokazující, že skutečně platí ae>ff = 0 pro ľ = l,...,ra/i = = 1,..., n — r. Odtud však plyne, že matice A je reducibilní. Nechť naopak A je reducibilní. Pak tvrzení lemmatu neplatí pro libovolnou dvojici indexů qv, cr^. Lemma je dokázáno. Tvrzení lemmatu 3.4 se nejsnáze pamatuje a také prověřuje pomocí pojmů teorie grafů. Pojem graf je značně obecný topologický pojem a je základem velmi obsáhlé teorie. My se zde omezíme na konečné orientované grafy. Konečným orientovanými grafem rozumíme uspořádanou dvojici konečných množin V a H, kde množina H je tvořena některými uspořádanými dvojicemi bodů z množiny V (je tedy H C V x V). Prvky množiny V se nazývají uzly nebo vrcholy grafu a prvky množiny H hrany daného grafu. Je-li počet uzlů grafu malý, můžeme jej znázornit diagramem tak, že uzly znázorníme body v rovině a hrany oblouky označenými šipkami. Tyto oblouky vycházejí z uzlu, v němž hrana začíná a směřují do uzlu, v němž hrana končí. Posloupnost neopakujících se uzlů u%, - ■ -, "Jc taková, že dvojice (ui,U2), («2, U3),..., (nfc_i, u*) jsou hrany grafu, se nazývá dráha. Existuje-li z každého uzlu daného grafu dráha do libovolného dalšího uzlu, nazveme graf silite souvislým. Přiřaďme dané matici A = {ay} řádu n orientovaný graf tak, že za uzly vezmeme množinu indexů {1, 2,..., n} a za jeho hrany ty dvojice indexů (i, k), po něž platí 164 165 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY a,j ^ 0. Nyní se dá lemma 3.4 parafrázovat takto: Matice A je ireducibilní tehdy a jen tehdy, je-li její graf silně souvislý. Pravdivost tohoto tvrzení je zřejmá. Definice 3.3. Řekněme, že čtvercová matice A = {ay} řádu n je diagonální dominantní, platí-li pro i = 1,... ,n (3.12) la«l ž ^2\aal J5*>" řekneme, že je ostře diagonálně dominantní, platí-li v (3.12) ostrá nerovnost pro každý index i a konečně řekneme, že je ireducibilně diagonálně dominantní, je-li ireducibilní, diagonálně dominantní a platí-li v (3.12) ostrá nerovnost alespoň pro jeden index i. Nyní máme vše připraveno k formulaci Collatzova lemmatu. Lemma 3.5. Nechť matice A — {a^} řádu n má kladné diagonální prvky a nekladné nediagonální prvky a nechť je ostře diagonálně dominantní nebo ireducibilně diagonálně dominantní. Pak je monotónní. Důkaz. Tvrzeni dokážeme sporem, a to pro případ ireducibilně diagonální matice. V průběhu důkazu uvidíme, že je tím pokryt i případ ostře diagonálně dominantní matice. Předpokládejme tedy, že matice A s kladnými diagonálními prvky a nekladnými nediagonálními prvky je ireducibilně diagonálně dominantní, ale není monotónní. Pak existuje vektor x takový, že je Ax ä o a přitom aspoň jedna jeho složka je záporná. Položíme-li Xj — min(a;i, ..,xn), je Xj < 0. Nechť pro tento index platí za prvé, že je (3.13) Pak platí (3.14) lajjl - ~Y^a>k >0- *=1 tjtj á ajjXj + ^ ajkXj = Xj ^ ajk < 0. t=i To je však spor dokazující v tomto případě lemma. Nechť za druhé pro výše definovaný index j platí (3.15) k = l k?j 166 3 METODA SlTl Pak je (3.16) 0 í ]T « -■ 53 o.jk{xh - xj) + x} ]T ajh = J2 aAXi ~ xi) kssl i=l k-1 l=J součet vesměs nekladných čísel ajk(xk — xj), * — 1,. -., u, má být tedy nezáporný. To je možné jen tak, že platí ajk{xk — Xj) — 0 pro k = 1, .., n. Je tedy zj. = x j pro každý takový index k, pro který je 0. Bud* ia index, pro který pla- tí v (3,12) ostrá nerovnost. Protože matice A je ireducibilní, existuje posloupnost indexů ij,..., i, taková, že je oy,-, ^ 0, aiíi2 £ 0,..., Oi,ia £ 0. Podle právě dokázaného je tedy Kj, = Xj a celý postup můžeme zopakovat pro index pro který také platí, že je — min(ii,..., *n). Platí-li pro tento index ostrá nerovnost (3.12), jsme hotovi, v opačném případě dostaneme, že je x^ = Xil = Xj. Pokračujeme-li v tomto postupu dále, nutně dojdeme k indexu, pro který už platí (3.12) ostře. Důkaz je hotov. Po této krátké exkurzi do teorie speciálních matic se vraťme znovu k vyšetřování metody sítí. 3.2 Lineární diferenciální rovnice druhého řádu V tomto odstavci podrobně probereme problematiku užiti metody sítí k řešení okrajové úlohy (1.12), (1.13). Aby nedocházelo k zbytečným obtížím a nedorozuměním, dohodneme se, že budeme předpokládat, aniž to vždy budeme znovu opakovat, že jsou splněny předpoklady existenční věty 2.2. 3.2.1 Sestavení diferenčních rovnic Základní myšlenka metody sítí vychází, jak vidíme, z náhrady derivací v daných rovnicích diferenčními podíly. Začneme proto tím, že uvedeme několik nejednodušších příkladů takových podílů. Lemma 3.6. Nechť funkce z má v intervalu I derivace do řádu dvě včetně a nechť platí (x,x + h) Cl. Pak existuje bod £ e (x, x + h) takový, že platí (3.17) Z(X + h)~*{x)- = z'(x) + lhz"(i). Důkaz Vztah (3.17) je speciálním případem Taylorova vzorce. Lemma 3.7. Nechť funkce z má v intervalu I spojité derivace až do třetího řádu včetně a nechť platí (x - h, x + h) C I. Pak existuje bod f £ (x - h, x + h) takový, žc platí (3.18) z(x + h)-z(x-h) _ k 2h 167 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE OKRAJOVÉ ÚLOHY Důkaz. Za uvedených předpokladů zaručuje Taylorův vzorec existenci bodů £1 e (x, x + h) a £2 £ {x - h, x) takových, že platí (3.19) a (3.20) z{x + h) = z(x) + z'(x)h + \z"{x)h2 + \z'"{íy)h3 z(x -h) = z(x) - z'(x)h + ±z"(x)h2 - y"(Í2)h3. Odečtením rovnice (3.20) od rovnice (3.19) a dělením činitelem 2/í dostaneme (3.21) z{x + h)-z(x-h) = z,{x) + + /(/(6)]ft3 Funkce z'" je však spojitá v uzavřeném intervalu (x — h,x + h) a číslo [z"'(£i) + +^'"(Í2)]/2 leží zřejmě mezi jejím maximem a minimem. Z darbouxovské vlastnosti funkcí spojitých na uzavřeném intervalu plyne existence bodu £ 6 {x — k, x+ h) takového že platí Dosadíme-li (3.22) do (3.21), dostaneme požadovaný výsledek, Lemma 3.8. Nechť funkce z má v I čtyři spojité derivace a nechť platí {x - h, x + h) C /• Pak existuje bod £ e {x — h, x + h) takový, že platí z(x + h)- 2z(x) + z(x — h) (3.23) h2 z»(x)+±z»»(t)h* Důkaz je zcela analogický důkazu lemmatu 3.7, a proto jej přenecháme čtenáři. Zanedbaním chybových členů v uvedených lemmatech dostaneme výrazy, které aproximují první a druhou derivaci uvažované funkce. Tyto a podobné výrazy jsme také měli na mysli, když jsme v dřívějším textu hovořili o diferenčních podílech. Vzhledem k tomu, že na vznik aproximace první derivace dané např. vzorcem (3.21) se lze dívat také tak, že se sestrojí polynom P(t) stupně dvě, který v bodech i — x — h, x a x + h nabývá hodnot z(x — h), z(x) a z(x + h) a vypočte se derivace tohoto polynomu v bodě t = x a vzhledem k tomu, že podobná tvrzení platí i pro aproximace z ostatních lemmat, je zřejmé, jak by se sestrojily další diferenční podíly, které by aproximovaly příslušné derivace eventuálně s vyšší přesností. Rozdělme nyní interval (a, i) na n dílů délky h dělicími body (3.1) a pokusme se aproximovat diferenciální operátor vystupující na levé straně rovnice (1.12), Použijeme-li přímočaře lemmat 3.7 a 3.8, tj. provedeme-li v diferenciálním operátoru (3.24) (Ly)(x) - -Ipix)^(x)]' + q(x)y(x) 3 METODA SlTl naznačené derivování a derivace ý, resp. y" v bodě x — xk nahradíme diferenčními podíly ze vzorců (3.21) a (3.23), dospějeme k operátoru Lff \ který (n + 1)-dimenzionálnímu vektoru y = (j/o, ■ - •, yn)T přiřazuje (n + l)-dimenzionální vektor í.(°Vi který je definován předpisem (3.25) (tj|0)/)i = ^{ - [pír*) - íhp'(xk)]yt.1+ + [2p(xt) + h2q(xk)]yk - \p(xk) + \hp\xk)]yí+i}. Tento operátor aproximuje diferenciální operátor L ve smyslu následující věty. Veta 3.1. Nechť funkce p má v (a, b) spojitou derivaci a nechť funkce q je spojitá. Nechť dále funkce y má v (0,6) čtyři spojité derivace. Položme y(pr) = = [y(xo) 1 , yc1" )F ■Pak P1&tí (3.26) (LÍ0)yM)k = (Ly)(xk) + O(h% k^l,...,n-l. Důkaz plyne ihned z lemmat 3.7 a 3.8. Nahradíme-li derivace v okrajových podmínkách (1.13) diferenčními podíly podle lemmatu 3.6 dostaneme operátory 1^ a které vektoru y = (j/o,; ■ •, !/n)T přiřazují čísla ij^y a l^y definované předpisem (3.27) /„(1)y = -alP(a)^^. + Ay0i '» y ~ «2p(6) yn - yn-i Užitím lemmatu 3.6 dostaneme snadno následující větu. Věta 3.2. JVechť koeficient p je spojitý v (a, b). Pak pro každou funkci y, která má v (a, 6) spojité dvě derivace, platí (3.28) f/W^/Wj + OIÍ.), Zde y(pr' značí stejně jako ve větě 3.1 vektor o složkách y(xk) a l^y, resp. I^y je stručný zápis levých stran okrajových podmínek (1.13). Jsou-li nyní splněny předpoklady věty 2.2 a předpokládáme-li navíc, že funkce p má v intervalu (a, b) tři a funkce q a f dvě spojité derivace, existuje nejen jediné řešení okrajové úlohy (1.12), (1.13), ale toto řešení má dokonce čtyři spojité derivace v (a, b). Pro vektor y(pr\ jehož složky jsou nyní hodnoty přesného řešení v bodech xk, k = 0,..., n, tedy podle vět 3.1 a 3.2 platí (3.29) (ífV(pr))t = /(**) + 0(ft2), k 1,..., n - 1, 168 169 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY a (3.30) tfV^-Ti + CW, /Wy(Pr) = 72 + 0(A) Je tedy přirozené hledat přibližné řešení y — (jfo, ■ - ■, 2/n)T ze soustavy rovnic (3.31) . Úvaha, která nás přivedla k soustavě (3.31) (na níž je zatím třeba dívat se pouze formálně, neboť doposud nevíme vůbec nic o její řešitelnosti), není zdaleka jediná možná a dokonce není asi ani nepřirozenější. Praktické zkušenosti ukazují, že při aproximaci nekonečnědimenzionálních problémů konečnědimenzionálními je žádoucí zachovat co nejvíce vlastností původního problému. V našem případě je diferenciální operátor (3.24) vystupující v diferenciální rovnici (1.12) samoadjungovaný, což by mělo vyústit v symetrii matice aproximující soustavy lineárních rovnic. Tuto vlastnost však matice soustavy (3.31) nemá. K její symetrii je totiž třeba, aby koeficient p(x*) + (h/2)p'{xk) = p(xk + A/2) + 0{h2) u neznámé jfe+i v i-té rovnici (3.31) se rovnal koeficientu p{xk+1) - (A/2)p'(xi+1) = p(xk + h/2) + 0(h2) u neznámé ji v (H l)-ní rovnici. Tato čísla se však sobě rovnají pouze přibližně. Matice soustavy (3.31) je tedy sice blízká symetrické matici, ale obecně symetrická není. Při odvození rovnic (3.31) jsme postupovali tak, že jsme naznačené derivování v operátoru L provedli, a tím jsme vlastně vůbec jeho samoadjungovanost nezužitkovali. Položíme-li v tomto operátoru p(x)i/(x) = z(x), apioximujeme-li derivaci \p(x)y'(x)Y — z'{x) v bodě x = xk podílem [z(xk + h/2)-z(xk — h/2)]/h — [p(xi + + fc/2y(i* + h/2) - p(xj, - h/2)ý{xk - h/2)]/h (ve vzorci (3.21)jsme užili h/2 místo h) a hodnotu funkce py1 v bodě x — xt + A/2, resp. x = x* — ft/2 podílem p(*k + h/2)[y(xk+1) - y(xk)]/h, resp. p{xk - h/2)[y(xk) - y(xi-1)]/h, dostaneme operátor L^y (y = (jfo, • ■ •, J/n)T), definovaný předpisem (3.32) (Lhy)k = i{ -p(xk - h/2)yk-i+ + \p(xt - h/2) + p(xh + ň/2) + A25{xt)]lft--p(xi + h/2)yk+1}. Aproximační vlastnosti tohoto operátoru jsou popsány v následující větě. Věta 3.3. Nechť koefícient p má v intervalu (a, b) tři spojité derivace a nechť koefícient q je v tomto intervalu spojitý. Pak pro každou funkci y, která má v intervalu (a, b) čtyři spojité derivace, platí (3.33) (i»y(pr))i = (Í!/)(*t) + 0(A2), t = l,...,n-l. 170 3 METODA SlTl Důkaz Přímočaré použití lemmatu 3.7, které se nabízí, vede pouze k slabšímu tvrzení (Lhy^)k = (Ly)(xh) + 0(h). Proto je třeba provést důkaz podrobněji. Položme p(x)y'(x) = z(x). Pak funkce z má v intervalu (a, 6) tři spojité derivace a podle lemmatu 3.7 dostáváme, že pro každé x £ (a + h, b — h) platí z{x + h/2) — z(x — h/2) (3.34) Z Taylorova vzorce plyne, že je = z'(x) + 0(A2). (3.35) y(x + h) = y(x + h/2) + j/(x + h/2)-+ + tf(x + h/2)~ + y"{x + fc/2)y + 0(h*) (3.36) y(x) = y{x + h/2) y'(x + h/2)-+ + íy"(x + h/2)^ - W'{x + A/2)£ + 0(fc*). Odečtením rovnice (3.36) od rovnice (3.35) dostáváme, že platí (3.37) V{X + hl V[X) = y\x + h/2) + ±y"'(x + h/2)h2 + 0(A3). Podobně se dokáže, že je (3.38) »(')->('-*) : fr(x - h/2) + ±ý"{z - h/2)h2 + 0(h3). Vynásobíme-li rovnici (3.37) číslem p(x + h/2)/h, rovnici (3.38) číslem —p{x — h/2)/h a vzniklé rovnice sečteme, dostaneme (3.39) i [p{x + h/2)y{x + h)h-y{-x) - P(x - A/2)yW-f = _ z(x + h/2) - z(x - h/2) _ A + + i[p(x + h/2)y"'{x + h/2) - p(x - h/2)y"'(x - h/2)]h + 0(h2). Protože však funkce py"' má v intervalu (a, 6} spojitou derivaci, plyne tvrzení (3.33) ihned z (3.39), z včty o střední hodnotě a z (3.34). Věta je dokázána. Aproximační vlastnosti operátoru í.;, jsou tedy stejné jako u operátoru 1^ a navíc přidáme-li k rovnicím (3-40) (Lhy)k = f(xk), t=l,.r,fi-l, okrajové podmínky (3,41) 171 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY vynásobené vhodnými konstantami, dostaneme soustavu rovnic se symetrickou maticí. Až dosud jsme generovali diferenční rovnice tak, že jsme nahrazovali derivace v diferenciální rovnici (1.12) a v okrajových podmínkách (1.13) diferenčními podíly. Velmi užitečný, v některých případech asi dokonce lepší postup je založen na tzv. Marčukově integrální identitě, která je obsahem následujících věty. Veta 3.4. Nechť funkce y splňuje v intervalu (a,b) diferenciální rovnici (1.12) a nechť koeficienty této diferenciální rovnice splňují předpoklady zformulované v existenční větě 2.2. Nechť Xk-i, xk-i/2, xk, xk+i/2, xk+l jsou libovolné body z intervalu (a, i), pro něž platí xk-± í= Xk-x/v < Xk < %k+i/2 = xfc+i- Pak platí (3.42) y(xk+1) - y(xk) y(xk) - j/fxjt-i) [q{x)y(x) - f(x)]dx+ *i^=k^L {mí. ww-nw>y.+ (3.43) p(xk--L)y'{xk-1) = —\ »(*t-i-a (3.44) p(Kit+i)j/(3:*+i) = r^1! , \v(xk+i) ~y{xk)+ Důkaz. Položme z(x) = p(x)y'(x). Integrací diferenciální rovnice (1.12) v intervalech (zt-i/ž,2*4.1/2), (xk-i/2,x) a (Zj^h-i/í) dostáváme postupně (3.45) z(xk+1/2) - z(xk_1/2) = / [q(x)y(x)-f(x)]dx, (3.46) p(*y(*) = *(**-i/2)+ f [«(*)»(*) -/(Ol dť 172 3 METODA SlTl (3.47) P(x)l/(x) = z(xi+1/2) - j '+1/2 [q(t)y(t) - /(*)] d ť. Dělením rovnice (3.46) funkcí p a integrací v intervalu (zfc-i, xk) nalezneme (3.48) y(xk) - y{xk-x) = 2(^-1/2) / -j-^di-r- +£{^0(ťMí)-/(i)]díld* neboli (3.49) z(xk.1/2) = y(*k) - y(xk-i) ~r ^dxľ {i) f bw»(o-/(0]dí}d«. Podobnými manipulacemi odvodíme z rovnice (2.47) vztah (3.50) z(xk+Ui)=^2ŕŕ + Položíme-li nyní v rovnici (3.49), resp. (3.50) Xjr-i/2 = resp. aľfc+i/2 = «fr+i, dostáváme ihned identity (3.43) a (3.44). Dosazení do rovnice (3.45) podle rovnic (3.49) a (3.50) pak dává identitu (3.42). Věta je dokázána. Položíme-li v identitě (3.42) xk = a + kh, xk+I/2 — xk + hjl a aproximujeme-li integrály následujícími jednoduchými kvadraturními vzorci (3.51) / —-dxnh--- + h/2)' ľ" S . Ó.X h —,-, ■■ —. x) P(xk-h/2)' / liíx)y(x) - f(x)]dxm h[q(xk)y(xh) - f(xk)]. 173 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 3 METODA SlTÍ o a chyby, kterých se přitom dopustíme, zanedbáme, dostaneme rovnice (3.40), tj. rovnice, v nichž vystupuje už dříve definovaný operátor Lh- Podobně, nahradíme-li integrály ve vzorci (3.43) s k = 1 a ve vzorci (3.44) s k - n — 1 kvadraturnämi vzorci (3.52) x0) 1 f —L-dasa/i-r- 4« pw nx ľ" — dx~ 7»,-! p(x) ~"p(*»)' r{^£[^(^/(r)idi}di!B dx «ä 0. a užijeme-li vzniklé aproximace v okrajových podmínkách studovaného problému, dostaneme operátory Z^1' a Užijeme-li v těchto vzorcích první dva kvadraturní vzorce (3.51) a vzorce (3.53) i p(x0 + V2)[?(a:°Wa:o)"/(3:o)1' * ^2p(xn-n/2)[^")!/(X^ -dostaneme operátory /íl'1,d' a /^2,d^ dané rovnicemi (3.54) ť'd)y = -<*ip(x<, + h/2)^^- + [^^(xo) + p\)yn, 'i5,dV = <*2P(*n - h/2) h Vn - !/n-l Pro tyto operátory platí následující věta. 174 Věta 3.5. NecM funkce p má v intervalu (o, í>) dvě spojité derivace a nechť funkce q je v (a, b} spojitá. Pak pro každou funkci y, která má v (a, b) tři spojité derivace, piati (3.55) z^ypr) = /(»„ + íaih(Ly){x0) + 0{h\ ,ft(2.d)y(pr, = ,Wy + ia3ft(iJ,)(a.n) + 0(fci)i ide y (pr^ je veitor o složkách t/(xo), - • ■, Jř(*n). Důkaz. Za učiněných předpokladů platí podle Taylorova vzorce (3.56) p(„ + h/2)**l):''(gB) = n =[p(x0) + |fcp'(»o) + O(/.2)][y(x0) + £k»"(*o) + 0(h2)] = =p(*o)ir>o) + |ftp'(x0)3/(x0) + %hp(x0)y"(xo) + 0(h2) s= =PÍ*oyt>o) + ^ft[p(*o)!/'(*o)]' + 0(A3) = =p(x0)j/(x0) + ift[9(x0)!/(ro) - (ÍJŕ)(xo)] + 0(h2). Je tedy (3.57) (MyW = - «iP(xD)3/(x0) - iai%(x0M*o) - (i»)(z0)]+ + [|aifc?(*0) + A]lrt>o) + 0(A2). Z rovnice (3.57) však už plyne první rovnice (3.55). Druhá rovnice (3.55) se dokáže úplně analogicky. Věta je dokázána. Nahradíme-li okrajové podmínky rovnicemi (3.58) l^'d)y = 7i + £«iA/(«o), /fd)y = 72 +W*/(x„), (y = (j/o.....yn)T)j dopustíme se tedy na rozdíl od rovnic (3.41) chyby velikosti 0(h2). Rovnice (3.58) přitom nejsou o nic složitější než rovnice (3.41). V následujícím odstavci uvidíme, že lepší aproximační vlastnosti rovnic (3.58) oproti rovnicím (3.41) se projeví tak, že jejich užití jako okrajových podmínek pro operátor t* vede k celkové chybě velikosti 0(h2), zatímco užití rovnic (3.41) pouze k chybě řádu 0(h). Intuitivně není tento výsledek překvapující, neboť při odvození operátorů a '*2'i a'' u^ užitím diferenčních podílů nebo kvadraturních vzorců v integrální identitě z věty 3.4, jsme užili méně kvalitní aproximace než při konstrukci operátoru a operátorů //ld' a ';[2'd'. Z tohoto hlediska je tedy odvození rovnic (3.58) z integrální identity pomocí kvadraturních vzorců (3.51) a (3.53) dokonce přirozenější, než odvození rovnic (3.41) pomocí kvadraturních vzorců (3.52), neboť vzorce (3.53) aproximují příslušné integrály se stejnou řádovou chybou jako vzorce (3.51). Zakončeme stručný výklad o generování konečnědimenzionálních aproximací daného diferenciálního operátoru poznámkou, že užitím přesnějších kvadraturních vzorců v integrálních identitách z věty 3.4, než které jsme dosud užili, lze dosáhnout 175 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY aproximací daného operátoru, které jsou vyššího řádu, než tomu bylo u operátoru Lh. K této otázce se v odst. 3.2.2 ještě vrátíme. Až dosud jsme sestrojovali konečnědimenzionální soustavy, jejichž řešení má být přibližným řešením dané okrajové úlohy formálně, aniž bychom studovali, zda tyto soustavy mají vůbec rozumný smysl, tj. zda jejich matice jsou regulární. Nyní si všimneme této otázky. Při jejím řešení a i při studiu konvergence v dalším odstavci nám prokáže velmi cenné služby následující lemma. Před jeho formulací se však ještě dohodněme, že o integračním kroku h = (6 — a)/n budeme všude v odst. 3.2 předpokládat, že je volen v případě, že je q(x) = 0 v {a,b) libovolně a v opačném případě tak, aby existoval bod xj = a + kh, 0 < k < n, takový, že platí g(xj) > 0. K splnění tohoto požadavku stačí v důsledku spojitosti funkce q zřejmě, aby toto h bylo dostatečně malé. Lemma 3.9. Neciť funkce p a q jsou spojité a nechť platí nerovnosti (2.1) a (2.2). Nechť dále rj — (f/o,..., nn)T je libovolný vektor, pro který platí (3.59) (Ía>|)^0, fc = l,...,n-l. Nechť konečně je. (3.60) M - max nk > 0. k=0,...,n Pak platí (3.61) M — max()jo, In) a existuje-li index fco, 0 < fco < n takový, že je nka = M, je q(x) = 0 v (a,b) .i j;* = M pro k = 0,..., n. Důkaz. Předpokládejme, že existuje index fco, 1 ^ fco ^ n — 1, takový, že platí r)k0 = M. Pak je (3.62) 0§ -p{xka-h/2)r,k^i + \p(xko- h/2) + p(xko + h/2) + h2q(xto)]M- - p(xko + ň/2)Wo+i ž h2q(xk„)M ž 0. Protože M je kladné a q(xka) nezáporné, plyne z nerovnosti (3.62) především, že je q(xko) - 0. Kdyby platilo n^-i < M nebo nko+1 < M, bylo by tedy (3.63) 0 ^ - p(xio - ft/2)fíi0-i + [p(*i„ " fc/2) + p(xio + h/2)]M- - p(xka + h/2)r)ko+1 > 0, což není možné. Platí proto nj^-i = 7)k0+i = M a celou úvahu je možno zopakovat pro indexy ko — 1 a k0 + 1. Postupně tak dostaneme, že platí (3.64) q(xt) = 0, fc = l, ■•■«-!, a (3.65) ijt = Af, fc = 0,..., n. 176 3 METODA SlTl Není-li funkce q identicky rovna nule v intervalu (a, 6), není rovnice (3.64) pro k = k splněna. Tento spor dokazuje, že v případě, že funkce q není rovna nule identicky, platí nk < M pro k — 1,..., n — 1. V tomto případě je tedy lemma dokázáno. V případě, že je q(x) s 0 v (a, b), však plyne tvrzení lemmatu z rovnic (3.65). Stručně můžeme vyjádřit podstatu tvrzení lemmatu 3.9 tak, že funkce r/k definovaná na diskrétní množině bodů xk a splňující nerovnosti (3.59) nabývá kladného maxima v krajním bodě. To je také důvod, proč se toto tvrzení nazývá princip maxima. Pomocí něj už snadno dokážeme regularitu matic námi sestrojených soustav. Jako příklad uveďme následující větu. Věta 3.6. Nechť jsou splněny předpoklady existenční věty 2.2 anechťh je dostatečně malé. Pak soustava (3.40), (3.41) má při libovolné' funkci f a při libovolných Ti a 72 právě jedno řešení. Důkaz Buď nk, k = 0,..., n, řešením příslušné homogenní soustavy, tj. (3.66) (i»Ti)fc = 0, *=l,...,n-l, a (3.67) = '„(3)f=0. Položme M = maxj;=ol.,.,n % a předpokládejme, že je M > 0. Pak podle lemmatu 3.9 platí, že M = max(r]B, 7]„) a zřejmé bez újmy na obecnosti můžeme předpokládat, že je tjo § n„, takže je M = no. Píšeme-li první rovnici (3.67) podrobněji, máme (3.68) [cvip(a) + h0i]rjo - aií>(a)7;i = 0- Je-li nyní a\ - 0, je 0i > 0 a z rovnice (3.68) plyne, že je ij0 = 0. To však znamená, že je M = 0 a to je spor dokazující, že je M ž 0. Je-li cti > 0, je též 0i > 0. Kdyby tomu tak totiž nebylo, plynulo by z rovnice (3,68), že je i)i = íjq, a tedy podle lemmatu 3.9 by bylo rjk = M pro k = 0,..., n a q(x) 5 0 v (a, b). Z druhé rovnice (3.67) by tedy plynulo, že je (3.69) 0 = [ct2p{b) + hp2]M - ct2p(b)M = hfaM. a tedy 02 — 0. To však není možné, neboť případ /3i = 02 = 0 a q(x) = 0 je předpoklady věty 2.2 vyloučen. Při cti > 0 je tedy skutečně 0i > 0 a z rovnice (3.68) dostáváme (3.70) 0 = [aip(ffl) + hfa]M - alP(a)r}i ^ h0tM > 0, tedy opět spor, dokazující, že je M ^ 0. Celkem jsme tak dostali, že je nk íS 0 pro i: = 0,..., n. Zopakujeme-li celou úvahu pro funkci ~nk, dostaneme, že je i\k ~í ž 0 pro k = 0,..,, n. Celkem tedy platí nk — 0 pro k — 0,..., n. Soustava (3.66) a (3.67) má tedy pouze triviální řešení, což dokazuje větu. 177 H. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 3 METODA SlTl Poznámka 3.1. Pfedpokládáme-li, že místo rovnic (3.66) a (3,67) platí nerovnosti (LhTj)k S 0, k — 1,..., n — 1, I^ti ÍOa ty^i} ~ 0, dokážeme úplně stejným postupem jako v důkazu věty 3.6, že je nk á 0, k = 0,.. .,n. Matice soustavy (3.40), (3.41) je tedy zřejmě monotónní (implikace Ax > 0=> x ž 0 je zřejmě ekvivalentní implikaci Ax < 0 0). Monotónnost matice soustavy (3.40), (3.41) (a tedy speciálně její regularitu) je možno také dokázat pomocí Collatzova lemmatu 3.5. Zde je však třeba projevit určitou opatrnost. Uvažovaná matice má sice diagonální prvky kladné a nediagonální prvky nekladné, ostře diagonálně dominantní však obecně není, takže je třeba zkoumat její ireducibilní diagonální dominanci. Podle lemmatu 3.4 je třídiagonální matice ireducibilní právě tehdy, jsou-li její nediagonální prvky nenulové. To je však pro uvažovanou matici splněno pouze v případě, jsou-li oba koeficienty ctt á a2 nenulové. Diagonální dominance se v tomto případě už prověří snadno: Všechny řádkové součty jsou nezáporné, jak je vidět na první pohled a kladné jsou v nultém nebo n-tém řádku podle toho, je-li nebo /?2 různé od nuly. Jsou-li obě tato čísla nulová, nesmí se koeficient q rovnat nule identicky a ostrá nerovnost pak platí pro k-tý řádek, kde k je určeno tak, že přo něj je q(xk) > 0. Je-li cti nebo a2 rovno nule, je matice soustavy reducibilní. V tomto případě je však /?i nebo fa nenulové a nultá nebo n-tá rovnice udává přímo hodnotu nulté nebo n-té neznámé. Dosadíme-li tuto hodnotu do první nebo (n — l)-ní rovnice, dostaneme soustavu, jejíž matice je řádu n nebo n — 1 a je zřejmě ireducibilně diagonálně dominantní. Collatzovo lemma pak aplikujeme na tuto redukovanou matici. Monotónnost matice soustavy (3.31) se dokáže stejně snadno. Rovněž tak snadno se dokáže monotónnost soustavy, která vznikne tak, že se okrajové podmínky (3.41) nahradí okrajovými podmínkami (3.58). Lze k tomu použít opět Collatzovo lemma nebo princip maxima, který platí i pro operátor 3.2.2 Konvergence V předešlém odstavci jsme na základě rovnic (3.33) a (3.30) usoudili, že je rozumné počítat přibližné řešení j/t>, ■••>!/« dané okrajové úlohy z rovnic (3.40) a (3.41) a ukázali jsme, že tento postup má smysl, neboť vektor yo,...,Vn je rovnicemi (3.40), (3.41) jednoznačně určen. V tomto odstavci ukážeme konvergenci popsaného postupu, tj. ukážeme, že rozdíl r\k = yk — y(xk) (který se i zde podobně jako v kap. I nazývá celková iiskreiizační chytá) lze volbou dostatečně malého h učinit libovolně malý. Nechť jsou splněny předpoklady věty 2.2 zaručující existenci a jednoznačnost přesného řešení a položme (3.71) (Lhr,)t = ek, k - l,...,n-l, 178 a (3.72) /4(1)fl = «o, Právě zavedené veličiny ek se nazývají lokální chyby metody sítí a vlastně udávají, jaké chyby se dopouštíme aproximací daných diferenciálních operátorů konečnědi-menzionálními operátory. Předpokládáme-li navíc, že funkce p, q a / jsou dostatečně hladké, plyne z vět 3.3 a 3.2 existence konstanty M takové, že pro dostatečně malé h platí (3.73) \sk\^Mh2, t = l,...,n-l, a (3.74) |e0| š Mh, \e„\^Mh. Z důvodu dalšího zestručnění zápisu se dohodneme, že konstantu M zde a v podobných případech pokládáme za tzv. generickou konstantu, tj. za konstantu, kteTá v jednotlivých případech může nabývat různých hodnot. Ze vztahů (3.71) až (3.74) vidíme, že chyba splňuje soustavu lineárních algebraických rovnic s malou pravou stranou. V následující větě ukážeme, že to má za následek i malost příslušného řešení. Věta 3.7. Nechť jsou splněny předpoklady věty 2.2 a nechť navíc funkce p má v intervalu (a, 6) tři spojité derivace a funkce q a f dvě spojité derivace. Buď dále yk přibližné řešení vypočtené ze soustavy (3,40), (3.41). Pak existují konstanty M a h0 > 0 tátové, že platí (3.75) \yk - y{xk)\ < Mh pro k — 0,..., n a k ^ ho. Důkaz. Bud" z funkce, která je v intervalu (a, b) řešením diferenciální rovnice (3.76) -(p(*)z')'+ !(*)* = ! s okrajovými podmínkami (3.77) -alP(a)z'(á) + p\z(a) - 1, CX2P(b)z'(b) + 0iz{b) - 1. Z předpokladů plyne, že tato funkce nejen existuje a je jediná, ale má v intervalu (a, b) čtyři spojité derivace. Podle vět 3.3 a 3.2 tedy existuje konstanta K taková, že platí (3.78) \{Lhz)k l|gÄ'/i2, fc = l,...,n- 1, 178 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY (3.79) - 1| 5 Kh, \lj,2)z-l\%Kh. (Položili jsme z = (z(x0), ■..,z(xk))T.) Z nerovností (3.78), (3.79) plyne existence čísel 9k, k = 0,..., n, takových, že platí \6k | á 1 pro £ = 0,..., n a že je (3.80) (Lhz)k = l + 9kKh2, *=l,...,n-l, /„(1)z = 1 + 6„Kh, Zvolme nyní h0 pevně tak, aby platilo a (3.81) /A(2)z = 1 + 6nKh. ho < min (—, — (3.82) a položme M (p5s-i3kj). kde M je konštanta z nerovností (3.73) a (3.74). Pak pro /i á ňo platí (3.84) 0 < 1 - Kh0 S 1 + flotíl, a tedy je (3.85) JV/i(l + So-K/i) ž N{1- Kho)h~ÍMh. Analogicky se dokáže, že je též (3.86) Nh(l + 9nKh)^Mh a (3.87) Nh(l + ehKh2)ŽMh2, Jb = 1,. ,«-1. Položíme-li tedy (3.88) vk = Nhz(xk), plyne z (3.71) až (3.74), (3.80), (3.81) a (3.85) až (3.87), že pro h g h0 platí (3.89) l(ÍÄí?)tlš(^ľ)t, t = l,...,n-l, (3.90) 180 3 METODA SÍTÍ Protože matice soustavy (3.71), (3.72) je podle poznámky 3.1 monotónni, plyne z nerovností (3.89) a (3.90) a z lemmatu 3.2, že platí \r)i.[ á vk pro k = 0, ...,n. Protože pomocná funkce z je v intervalu (a, 6) omezená, plyne odtud tvrzení věty. Právě dokázaná věta dává tedy odpověď na otázku po konvergenci metody sítí (3.40), (3.41). Konvergence metody sítí (3.31) by se dokázala úplně stejně. Podtrhněme tu skutečnost, že k důkazu tvrzení věty 3.7 bylo třeba předpokládat větší hladkost hledaného řešení, než kterou zajišťuje existenční věta. To je v situaci, kdy dokazujeme vlastně tvrzení o rychlosti konvergence, a tedy více, než pouhou konvergenci, typické a není na tom nic překvapivého. S podobnými jevy jsme se setkali i v případě řešení úloh s počátečními podmínkami. Stejně jako tam pouhá konvergence se dá dokázat za podstatně slabších předpokladů o hladkosti hledaného řešení. Zde je však příslušný postup výrazně složitější, než tomu bylo v důkazu věty 3.7, a to je také důvod, proč jsme se omezili pouze na hladký případ, Vzhledem k tomu, že při sestavování n— 1 rovnic (3.40), jejichž počet se při h —» 0 bez omezení zvětšuje, jsme se dopustili lokální chyby velikosti 0(h2) a pouze ve dvou rovnicích chyby 0(h), může vzniknout dojem, že lepší odhad celkové diskretizační chyby než pouze O(h) nebyl odvozen pouze proto, že jsme užili ne dosti důmyslnou důkazovou techniku. Následující jednoduchá věta však ukazuje, že tomu tak není. Věta 3.8. Odhad chyby metody sítí (3.40), (3.41) daný vzorcem (3.75) nelze zlepšit. Důkaz. Buď y řešením diferenciální rovnice (3.91) y" = 2 v intervalu (—1,1) s okrajovými podmínkami (3.92) -!/(-!) + y(-l) = 3, y'(l)4-S/(l) = 3, takže jsou splněny předpoklady existenční věty a přesné řešení je funkce y(x) — x2 ■ Přibližné řešení metodou (3.40), (3.41) se vypočte z diferenční rovnice (3.93) -j/it_i + 2yh -ste+i = -2h2, k = 1,...,n- 1, s okrajovými podmínkami V\ -yo (3.94) h + yo = 3, + yn — 3. Z teorie lineárních diferenčních rovnic s konstantními koeficienty (nebo také přímým dosazením) ihned plyne, že řešení těchto rovnic je dáno vzorcem (3.95) yk ~ (-l + khf+ h = x2k + h. 181 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY Pro chybu 17», tedy platí rjj. = h, což dokazuje větu. Návod, jak sestrojit metodu sítí, jejíž chyba je řádu 0(ft2), je vlastně obsažen v důkazu věty 3.7. Z něj je vidět, že žádaný výsledek se dosáhne, podaří-li se volit funkci ve tvaru Nz(xk)h2 a nikoliv pouze ve tvaru Nz(xt)h. K tomu však zřejmě stačí, aby okrajové podmínky byly aproximovány s přesností 0(h2) a aby přitom nebyla porušena monotónnost příslušné matice. Okrajové podmínky, které mají tuto vlastnost, jsou dány operátory a VJ[2'd'' z předešlého odstavce. Připojením okrajových podmínek (3.58) k rovnicím (3.40) dostaneme tedy metodu sítí, jejíž celková chyba je řádu 0{h2). Důkaz tohoto tvrzení se provede úplně stejně jako důkaz věty 3.7. My zde zmíněné tvrzení dokážeme ještě jednou jiným postupem, který bude sice formálně komplikovanější, ale vzhledem k tomu, že se v něm nebude užívat princip maxima (a tedy ani s ním související teorie monotónních matic), bude jej možné přednést na vyšetřování rovnic vyšších řádů, kde princip maxima neplatí, Základní idea vlastně všech konvergenčních důkazů, které jsme až dosud v celé knize prováděli, je i zde samozřejmě stejná: vždy sestrojujeme apriorní odhad pro přibližné řešení v závislosti na pravých stranách rovnic, které je definují, neboť celková diskretizační chyba splňuje rovnice tohoto typu. Ve větě 3.7 jsme takový odhad konstruovali na základě principu maxima. Zde to provedeme pomocí tzv. energetických nerovnosti. Základní myšlenku příslušného postupu ukážeme nejprve na spojitém případě, kde je méně zastřena komplikovanou symbolikou. Nechť funkce p, í a y jsou dostatečně hladké a nechť platí nerovnosti (2.1) a (2,2), Buď dána funkce y a položme (3.96) (3.97) (Ly)(x) = -\p(x)y'(x)]' + q{x)y(x) = -ovip(a)j/'(a) + piy{a), iWy = <*Mb)y'(b) + Mb)- Naším úkolem je odhadnout nějakou normu funkce y pomocí vhodné normy funkce Ly a pomocí čísel l^y a l^y. Pro určitost předpokládejme, že koeficienty oti a v rovnicích (3.97) jsou vesměs kladné. Tento případ lze pokládat za modelový a modifikace uvedeného postupu, které je nutno provést v jiných případech, jsou snadné. Čtenář si je provede podle návodu, který uvedeme později, bez problémů sám. Vynásobme rovnici (3.96) funkcí y a integrujme v mezích od a do b. Užitím integrace per partes a dosazením za p(o)i/(a) a p(b)y'(b) z rovnic (3.97) dostaneme (3.98) f\iy)(x)y(x)dx = ^y\b) - -L(/C»B)j,(fr)+ Ja a2 Ot2 + ^-y\a) -—(iWy)y(a) + í p^y1^)]2 d x + f q(x)y2(x)dx. «1 Cti Ja Ja 3 METODA SÍTl Odtud vzhledem k předpokladům (2.1) a (2.2) ihned plyne, že platí (3.99) — y{a)l^y+— y{b)l^y+ / (Ly)(x)y(x) á x ä evi «2 Ja > ^V(a)+^V(&)+Po Íw(x)?áx. cti <*2 Ja Pokusme se nyní odhadnout hodnoty funkce y pomocí výrazu na pravé straně nerovnosti (3.99) (který je v podstatě kvadrátem tzv. energetické normy funkce y; tato norma hraje významnou roli ve funkcionálně analytické teorií diferenciálních rovnic). Zřejmě platí (3.100) »(»)■= \y(a) + \y{b) + \ f 0 pro i = 1,2 a h je kladné číslo. Pak pro libovolný vektor tj = (»;o 1 ■ ■ -, Vn)T phití (3.111) h-n4l%+h-n42A\ + h^(Lyrj)km > al #2 r""~ «1 «2 £í Důkaz Podle definice operátoru Ln a podle lemmatu 3.10 je n-l (3.112) /i3 ^(UiiJuft = t = i - X^M** + 'i/2)('?*+l ~ "») - P(xk - h/2)(Vk ~ •ř*-l)]»Jt+ *=1 n-l + ft2^9(x*)^ = 184 3 METODA SÍTÍ = - p(x„ - h/2)(r)n - r)„_!)í)„_i + p(x0 + ft/2)(?yi - 170)170+ n — l n—l + £ p(zt - fc/2)(ijj - "t-i)2 + h2 ifaWk = t = l fc=l = ■ p(i„ - A/2)(i)„ - J7n-i)»)n + p(zo + h/2)(ni - 170)%+ n n — l + ^ p(a:fc - A/2)(»ft - íři-O2 + A2 Použijeme-li rovnic (3.54) k vyjádření výrazů p(io+'í/2)(')i —f)o) ap(a!„-ft/2)(r7„ — - >7n-i) pomocí operátorů /jf1'^ a /^2,d' a dosadíme-li do (3.112), dostaneme (3.113) fc'= -A—\h\{*n)vl +A—»7™- ř^í «2 ^ <*2 ■ A-fc^-H- ^2?(x0)%2 + /'-'řo2+ n n — l + £>(x* - A/2)(rfc - í?*-i)2 + ^2 Y, íW)^ Jr = l fc=l Užijeme-li ve vztahu (3.113) nerovnosti (2.1) a (2.2), dostáváme už tvrzení lemmatu. Lemma 3.12. Nechť platí cti > 0 a > 0 pro i = 1,2. Pak existuje konstanta 7 > 0 taková, že pro libovolný vektor rj = (r/o,..., ?7n)T plat/ (3.1H) NIL g tt[/A„2 + ^„ +I*X>->J*-i)s]1 We IMI*c„ - maxfc=0,...,n |nt|. Důkaz . Přímým výpočtem se zjistí, že pro k - 0, ..., n platí fc n (3.115) ijt = |»ír> +5^ + 5 - %-0 "5 E ~ j=i ;'=*+i (činíme obvyklou konvenci, že součet je roven nule, pokud jeho dolní mez je větší než horní). Užijeme-li nerovnost (3.101), dostaneme odtud, že je (3.116) í7iši)2 + »ř2 + j=l J L;=)=+l Podle Schwarzovy nerovnosti platí (3.117) fc n 2 Je n ^(rjj - íJjf-i) á fc £(ife - T7j-l)2 š i " ^'-^2 j=i J j=i j=i 185 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 3 METODA SlTl (3.118) 53 fa ~ ty-J š (n - *) 53fa " j=*+l J í=l Dosadíme-li odhady (3.117) a (3.118) do nerovnosti (3.116), dostaneme, že pro k = 0,..., n platí (3.119) 4 š '"Jo + fc>?n + (í- " «) X>i " ^-i)2 Abychom dostali tvrzení lemmatu, stačí už jen zavést číslo y rovnicí (3.107). Lemma 3.13. Nechť platí cť; > 0 a /?,■ > 0 pro i — 1,2, nechť koeňcienty p a g jsou spojité a nechť jsou splněny nerovnosti (2.1) a (2.2). Pak pro libovolný vektor i)=(n0,...,nny platí (3.120) MU. š 7 -ľCM)ll + -|/tM)ll + ÄX;i(i^)t| Důkaz . Tvrzení lemmatu plyne ihned spojením nerovností (3.114) a(3.111). Důkaz konvergenční věty pro metodu sítí (3.40), (3.58) je nyní už snadný. Věta 3.9. Nechť íunkce p má v intervalu (a, 4) tri spojité derivace a funkce q a f dvě spojité derivace. Nechť dále platí nerovnosti (2.1) a (2.2) a nechť je cti > 0, 0i > 0 pro« = 1,2. Nechť konečně yk je přibližné řešení získané metodou sítí (3.40), (3.58). Pak existuje konstanta M taková, že pro každé dostatečně malé h platí (3.121) 1» - !/(*»)! š Mh2 Důkaz. Za uvedených předpokladů existuje podle vět 3.3 a 3.5 konstanta K taková, že platí (3.122) (i»yCpr))l =st, k=l,...,n 1, (3.123) |£jfe|S/Uí?W = k=a = [p(x0 + h/2) + \h2q(x0) + h^-] ijg - p(i0 + ft/2)ij0iji+ n-l 4- [f>(ar„ - h/2) + hh2q(xn) + A—] t?„ -p(x„ - h/2)r,n^rjn = = -p(*o - A/2)(i)i - ijo)i/0 4- [|fc2?(*o) 4- ä^-] í?o+ n-l + h2^{Lhr))kr]k+ fc=3. + p(a;„ - A/2)(J)„ "n-iK + [^g(in) + h^\nl = Odtud a z lemmatu 3.11 a 3.12 však plyne, že platí (3.128) 7 Z poznámky 3.2 plyne jednoznačná řešitelnost soustavy (3.40), (3.58) (nebo (3.126)), aniž je zapotřebí užít monotonie matice A\. 187 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY V právě popsané technice vyšetřování metody sítí (3.40), (3.58) jsme se omezili na typický případ, že je cti > 0 a fa > 0 pro i = 1,2. Zmiňme se nyní stručně o modifikacích postupu v případě, že některá z těchto podmínek není splněna. Je-li jedno nebo obě z čísel ai a a2 rovno nule, udává příslušná okrajová podmínka přímo hodnotu hledaného řešení. Při přepisu této okrajové podmínky se tedy nedopustíme žádné chyby a příslušnou složku vektoru chyby lze položit rovnu nule. Nerovnosti (3.111) a (3.114) pak platí s tím, že je v nich třeba vypustit členy obsahující nulové c«l nebo a2. V případě, že je jedno z čísel fa a fa rovno nule, stačí při konstrukci maxima ve vzorci (3.107) příslušný člen vypustit. Je-li konečně fa — fa — 0, není funkce g identicky rovna nule a při odhadování členů na pravé straně rovnice (3.113) je třeba zachovat nenulovou část součtu q(xk)ll< Zakončeme tento odstavec několika poznámkami o možnostech zlepšení rychlosti konvergence popsané metody sítí. Toho lze podle předešlého výkladu dosáhnout tak, že nalezneme konečnědimenzionální náhradu příslušných diferenciálních výrazů takovou, že její chyba je řádově menší než u těch, které jsme až dosud užili. V literatuře se většinou doporučuje takový postup, že se derivace v dané diferenciální rovnici aproximují s větší přesností, než které je možno dosáhnout námi užitými prostými diferenčními podíly. Tak např. lc náhradě druhé derivace lze užít vzorec (3.129) y"(xk) = _ -y(xk-i) + 16y(a;r_i) - 30y(xk) + Uy{xk+1) -12ft2 y(*k+-i) který platí pro každou dostatečně hladkou funkci a který vznikl derivováním in-terpolačního polynomu čtvrtého stupně pro funkci y. Užijeme-li k sestavení diferenčních rovnic vzorce tohoto typu, je na první pohled patrné, že matice vzniklé soustavy bude pětidiagonální, a že tedy řešení této soustavy bude pracnější než v předešlých případech. Kromě toho, každou z takto vzniklých rovnic lze užít pouze pro k = 2,... ,n — 2, takže je třeba přidat celkem čtyři další rovnice, zatímco okrajové podmínky dávají přirozenou možnost k sestrojení pouze dvou takových rovnic. Tento problém zřejmě vznikne i v jednoduchém případě, kdy pTo koeficienty ai a «2 v okrajových podmínkách platí ai = a.2 = 0. Konečně je třeba také upozornit, že matice takto vzniklé soustavy ztrácí některé pro její vyšetřování příjemné vlastnosti, např. monotónnost. Mnohým z těchto problémů se lze vyhnout, vycházíme-li i zde z Marčukovy integrální identity. Tak např. položíme-li (3.130) / Jx l p(x) dx ; 1 + + 1 P(zi) p(xk + h/2) p(xk+1) [q(x)y(x) - f(x)]dx K h{q(xk)y(xk) - f(xk)+ + jihO^+iM^+i) ~ 2i(xk)y(xk) + q{zk-i)y{zk-i))- 3 METODA SlTl -jí[f(xh+1)-2f(xk) + f(xk^)]}, - p(J^+1){fa(a!tMa!*) " ^í1*)] + ^íO^+iM^+O - /0*+i)]}) a užijeme-li analogické vzorce také pro aproximaci ostatních integrálů v identitě (3.42), dostaneme soustavu (3.131) {-Ä-1/2 + ^A^i-iH + i^Pt-l/aítast-l) [-7-^—r -7^rl)fflb-l+ Lpííjb-i) p(xt)ÍJ + {pVl/2 + Pt+1/2 + ^h2q(xk)-r + ^-v^)[^-~y] + + { - Pi+1/2 + Jih2q(xk+l)-r + M2P.+W^+i)[-^--^y]} = /l2{á+48-p"*-l/2[- lp(xk-i) p(xk +hi{^^-Apih)-M+ +^hMP7xbr)-J^\}f{Xk)+ + fe2{íi + 48^+1/2 [ kde (3.132) Pt-1/2 — p{xk+l) p(xk) 6 1 , 4 , 1 P(*i-i) P^k-h/2) t* p7ř^ a analogický vzorec platí pro Pi+i/a- Přidáme-li k této soustavě (jejíž matice je pro dostatečně malá h monotónní) vhodné okrajové podmínky (např. v případě, že je ai = c«2 = 0, je to jednoduché, neboť pak známe krajní hodnoty hledaného řešení přesně), dostaneme soustavu rovnic s třídiagonální maticí. Její řešení je tedy 188 189 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE OKRAJOVÉ ÚLOHY 3 METODA SlTl stejně pracné jako dříve, přesnost však je řádu 0(/t4). Je však poctivé upozornit, že přepis okrajových podmínek obsahujících derivace tak, aby se vysoká přesnost uvedené metody neznehodnotila, představuje dosti vážný problém. 3.2.3 Řešení vzniklých soustav lineárních rovnic V tomto odstavci si stručně všimneme problematicky řešení soustav lineárních rovnic, které vznikají při řešení dané okrajové úlohy metodou sítí. Omezíme se opět na případ eťj > 0, pi > 0 pro i = 1,2 a přepis okrajových podmínek pomocí operátorů ř(f1,d^ a '/2,d'- Řešíme tedy soustavu (3.126) z předešlého odstavce. Zapišme ji ve tvaru (3.133) Je tedy (3.134) = h2f(xk), fc = l,...,n-l, 90 fft = h2f(xk ffn = A* + 9 -■(go,--- \h2) Matice je symetrická a pozitivně definitní. Pišme ji ve tvaru (3.135) ao ba 0 0 a bn„! a o bn-l Pak je (3.136) a0 = p(xa + h/2) + ih2q(xa) + —h, cti at = p(xh - h/2) + p(xt + h/2) + h2q(xk), i„ = p(x„ - h/2) + \h2q(x„) + ^h k — 1, - -, ,n — 1, (3.137) bk = -p(xk + h/2), fc = 0,...,n-l. Řešme nejprve soustavu (3.133) eliminační metodou. Snadno se zjistí přímým 190 výpočtem, že jsou-li čísla dk definována rekurencí (3.138) platí (3.139) kde (3.140) do — ao, dk — ak- dk-i' k=l,...,n, 1 0 0 0 . (3.141) do bn 0 'v 0 .. o f>n-l d„ Rovnice (3.139) platí samozřejmě pouze za předpokladu, že definice čísel dk má smysl, tj. za předpokladu, že je dk ^ 0 pro k = 0,. ., n 1. V následující větě ukážeme, že tomu tak skutečně je. Věta 3.10. Nechť funkce p, p' a q jsou spojité, nechť platí nerovnosti (2.1) a (2.2), nechť je c 0, /?,■ > 0 pro i — 1, 2 a nechť akt bk jsou definována vzorci (3.136), (3.137). Pat pro čísla dk definovaná rekurencí (3.138) platí pro dostatečně malá h (3.142) dk ž po, k = 0,..., n — 1. Důkaz Bud!

(xic) —► 0 pro /i^O, xjc = a + kh = konst. Přesně vzato, toto tvrzení ze zmíněné věty přímo neplyne, neboť v ní se předpokládá, že počáteční podmínka přibližného řešení je rovna přesné počáteční podmínce. Zde tomu tak není, neboť počáteční podmínka pro přibližné řešení k přesné počáteční podmínce pouze konverguje pro k —► 0. Je však naprosto zřejmé, jak modifikovat větu 3.1 z kap. I, aby pokrývala i tento případ, Ze vztahu (3.145) plyne, že pro všechna dostatečně malá A jsou čísla tpk nezáporná (funkce if> je kladná). Položíme-li tedy (3.146) J* =p{xl + A/2) +Apj,, k = 0,..., n -1, platí pro k = 0,..., n — 1 (3.147) ďh^pa. Z rekurence (3.144) dostáváme ihned, že je (3.148) ďB = p(x0 + A/2) + \h2q{x0) + h^- = a0 a (3.149) dk = p(xk + A/2) + hipk = = p(it+A/2) + A^_i-A2 ■ + h2q(xh) p(xk - h/2) + hipk-i ■ p(xk - A/2) +p(xk + A/2) + h2q{xk) + h 0, jak plyne ihned přímo z rovnic (3.138) (nebo také. chceme-li, ze skutečnosti, že matice je regulární), lze řešit soustavu (3.133) tak. že nejprve vypočteme vektor c — (co,..., cn)T ze soustavy (3.150) Lhc = g a pak hledaný vektor y = (y0, ■.., yn)T ze soustavy (3.151) Rhy = c. Vzhledem k speciálnímu tvaru matic a zřejmě platí (3.152) co = go, h-iCk-i , , Ck=9k--j-, *=1, dk-i (3.153) Vk ■ (ck-hyt+i), k = n-l,. ,0. Soustavu (3.133) lze tedy řešit eliminační metodou bez výběru hlavního prvku a znamená to vypočítat veličiny dt a c* z rekurencí (3.138) a (3.152) a hledané řešení z rekurence (3.153). Pokud jde o jiné metody pro řešení soustavy (3.133), dá se jistě užít Gaussova-Seidelova metoda nebo optimalizovaná superrelaxační metoda, neboť matice Ah je pozitivně definitní. Všeobecně však nelze užití iteračních metod v tomto případě doporučit. Z rekurencí (3.138), (3.152) a (3.153) je totiž ihned vidět, že k provedení eliminační metody je třeba řádově pouze 0(n) operací, tj. řádově pouze tolik operací, kolik je neznámých. Žádná iterační metoda nemůže tedy eliminační metodě co do výpočetní ekonomie konkurovat. Všimněme si ještě jedné zajímavé okolnosti spojené s eliminační metodou. Z důkazu věty 3.10 je vidět, že defmujeme-li pro k = 0,..., n — 1 posloupnost ipt rovnicí dk = p[xk + A/2) + htpk, kde posloupnost dk je definovaná rekurencí (3.138), představuje tato posloupnost přibližné řešení rovnice (2.108) z metody normalizovaného přesunu. Tak je tomu i pro ostatní rekurence, podle nichž se v eliminační metodě počítá. Skutečně, definujeme-li posloupnost vk rovnicí - hvk, kde Ck jsou dány rekurencí (3.152), snadno vypočteme, že platí (3.154) «0 = ^ + ifc/ízo), Vk = Vk-i + A J ■ Wfc-l"*-! f(xk) p(xk - A/2) + hifk-i takže posloupnost vk aproximuje řešení diferenciální rovnice (2.110) s počáteční podmínkou (2.111). Vyjádříme-li konečně tft definované rekurencí (3.153) pomocí 193 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 3 METODA SlTl veličin n-\ + 0(A), Sft = í/t+i 1P*Wt+l — »i p(xk + A/2) + hVk' takže posloupnost yk představuje přibližné řešení rovnice (2,107) s počáteční podmínkou (2.128). Právě zjištěná souvislost eliminační metody s metodou normalizovaného přesunu opravňuje domnívat se, že i eliminační metoda se chová stejně jako metoda normalizovaného přesunu numericky uspokojivě. Praktické zkušenosti to také plně ^^P-Pfeszují. •C. " Zakončeme celý odstavec věnovaný problematice metody sítí pro rovnice druhého řádu dvěma jednoduchými příklady. Tabulka 3.1 Řešení okrajové úlohy (3.156), (3.157) metodou sítí Užitá metoda Přesné X (3.40) (3.40) (3.131) řeaení h = 1/20 h = 1/40 h= 1/20 0,10 1.005 181 88 1,00506131 1,005020 25 1,005 020 91 0, 20 1,02065127 1,020 41730 1,020 33752 1,02033883 0,30 1,047205 57 1,04686562 1,046 74961 1,04675159 0,40 1,086 28794 1,085 85099 1,085 70174 1,085 70442 0,50 1,140 190 24 1,13966880 1,139490 55 1,13949391 0,60 1,212 41116 1,21182488 1,211624 28 1, 21162030 0,70 1,308 28355 1,30766627 1,30745466 1,30745925 0,80 1,43610636 1,435 52074 1,435 31938 1,43532420 0,90 1,609 29885 1,608 86991 1,608 72101 1,608 725 79 Příklad 3.1. Řešme v intervalu (0,1) diferenciální rovnici (3.156) -y" + (í + 2tg2x)y = a s okrajovými podmínkami 1 [!]■ ľ (3.157) y(0) = l, y(i)- cos 1 a s přesným řešením y(x) = 1/cosa;. V tab. 3.1 jsou uvedeny hodnoty přibližného řešení získaného pomocí rovnic (3.40) s h — 1/20 a s h = 1/40 a hodnoty přibližného řešení získaného pomocí rovnic (3.131) s h = 1/20 spolu s hodnotami přesného 194 řešení. Z tabulky je vidět, že podstatné méně pracná metoda (3.131) s h — 1/20 dává skutečně dosti lepší výsledky než metoda (3.40) s h = 1/40. Příklad 3.2. (3.158) Řešme diferenciální rovnici (3.156) s okrajovými podmínkami 1/(0) Přesné řešení této úlohy je opět funkce y(x) — 1/cosar. Tab. 3.2 uvádí příslušné výsledky získané ze soustavy (3.40), (3.41) a (3.40), (3.58). Vidíme z ní, že nevhodný přepis okrajových podmínek se může projevit dosti dramaticky. Tabulka 3.2 Řešení okrajové úlohy (3.156), (3.158) metodou síti ar Užitá metoda Přesné řešení (3.40), (3.41) h = 1/40 (3.40), (3.58) h = 1/40 0 00 1,06053663 0,99911825 1 000 000 00 0 10 1,064 53236 1,00413347 1 005 02091 0 20 1,07943178 1,019433 84 1 02033883 0 30 1,10606484 1,045 815 84 1,046 75159 0 40 1,14594359 1,084722 28 1,080 704 42 0 50 1,201475 20 1,138445 72 1 139 493 91 0 60 1,27633903 1, 21048776 1 21162030 0 70 1,376148 32 1,30618892 1 307 459 25 0 80 1,509 646 22 1,43386691 1 435 32420 0 90 1,690986 79 1,60698715 1 608 725 79 1 00 1,944423 37 1,848623 70 1 850815 72 3.3 Lineární diferenciální rovnice čtvrtého řádu V tomto odstavci si všimneme užití metody sítí k řešení okrajové úlohy (1.14) s okrajovými podmínkami (1.15). Začneme tím, že vyslovíme a dokážeme základní existenční větu. Věta 3.11. Nechť funkce p je dvakrát spojitě diferencovatelná v intervalu (a, b), nechť funkce q a f jsou spojité v (o, b) a nechť platí (3.159) p(i)^po>0, }(i)ŽO, ze(a,ó), kde po je konstanta. Pak existuje právě jedno řešení úlohy (1.14), (1.15). 195 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY Důkaz. Podle poznámky 2.2 na str. 140 stačí ukázat, že příslušná homogenní úloha má pouze triviální řešení. Buď tedy n řešen! diferenciální rovnice (3.160) (i«í)W = (ľW)" 4-í(*)<7 -0, x e (a,i) s okrajovými podmínkami (3-161) ,(<,) = rf(a) = V(b) = t/(6) = 0. Máme dokázat, že funkce tj je rovna v intervalu (a, i) identicky nule. Vynásobme rovnici (3.160) funkcí tj a integrujme v mezích od a do 6. Dvojí integrací per partes a užitím okrajových podmínek (3.161) dostaneme (3.162) / {Wx)r,"(x)]" + q(x)i,(x)}Ti(x)ix = J a = fp(x)W'(x)]2dx+ f q(x)n\x)dx. J a J a Použijeme-H nerovnosti (3.159), máme (3.163) £ + ff(*)iR»}ij(*) dx ^ p0 j\rf'(x)]> d x. Na druhé straně vzhledem k okrajovým podmínkám (3.161) zřejmě platí (3164) iK*) = jT"^V,Wdí)dí. Zaměníme-li ve vzorci (3.164) pořadí integrace, dostaneme (3165) n(x)= ľ(x-s)t]"(s)ds. Ja Odtud užitím Schwarzovy nerovnosti vypočteme, že platí (3.166) v2(x)Z Jjx-sýds jjV"(s)]2dsg i(b-af j\n"(s)ťds. Dosadíme-li z této nerovnosti do nerovnosti (3.163), dostáváme celkem, že pro každé x e (a, 6) platí (3.167) ns(*)š s(fr-°)3^/ {|p(«)?"W]" + í(íWí)}il(«)di. Pravá strana této nerovnosti je však nulová; je tedy nulová i levá strana a tj(x) = 0 v (a,b). Věta je dokázána. 196 3 METODA SlTl 3.3.1 Sestavení diferenčních rovnic Položíme-li p{x)y"{x) = z(x) a aproximujeme-li derivaci z"(x) v diferenciální rovnici (1.14) podílem [z(x + h) - 2z{x) 4- z(x - h)]/h2 a chybu, které se přitom dopustíme, zanedbáme, jsme přirozeně přivedeni k zavedení operátora (užití téhož symbolu jako v předešlém odstavci nepovede k nedorozumění), který (n 4-1)-dimenzionálnímu vektoru y = (j/o> ■ ■ •, Un)T přiřazuje (n — 3)-dimenzionální vektor Lky předpisem (3.168) h\Lhy )t = p(i*-i)í/jfc-2 - 2[p(*t_i) + p{xk)]yk-i+ + \p(xí-i) + 4p(xt) +p(xk+i) + A4g(«t)]!ft- - 2[p(xt) +p(xk+i)]yk+i+ + p(xk+\)yk+2, k = 2, ...,n-2. Tento operátor aproximuje operátor i na levé straně diferenciální rovnice (1.14) ve smyslu následující věty. Věta 3.12. Nechť funkce p má v intervalu (a, 6) čtyři spojité derivace a nechť q je spojitá. Pak pro každou funkci y, která má v intervalu (a, 6) šest spojitých derivací, plat! (3.169) (Lhy^)k = (Ly)(xk)-rO(h2), ŕ = 2,..., n-2, kdeyW = (y(x0),...,y(xrL)f. Důkaz. Buď x € (a,b) a položme z(x) -p(x)y"(x). Funkce z má v intervalu (o, 6) čtyři spojité derivace a podle Taylorova vzorce (nebo podle lemmatu 3.8) platí (3.170) z(* + A)-2z(x) + z(*-ft) = z"(x) + 0(h2). Užijeme-li znovu Taylorův vzorec, máme y{x 4 h)- h2 2y(x) 4- y(x -h) h2 I/(a:)- 2y(x -h) + y(x - 2h) h2 (x-h) + i^"'(x-A)ft3 + 0(/i4), neboť funkce y má podle předpokladu šest spojitých derivací. Vynásobíme-li první rovnici v (3.171) číslem p(x + h)/h2, druhou číslem -2p(x)/h2, třetí číslem p(x -— h)/h2 a sečteme, dostaneme (3.172) ^{pís + h)[y(x 4- 2h) - 2y(x + h) + y(x)]- ■ 2p(x)[j/(x + h)- 2y(x) 4- y(x - h)]+ + p(x - h)[y(x) - 2y[x - h) + y(x - 2h)}} = 197 H. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY _ z(x + h)- 2z(x) + z(x - h) h2 + + + h)y""(x + h) — 2p{x)y""(x) + p(x - h)y""(x - h)}+ + 0(h2). Výraz v hranaté závorce na pravé straně rovnice (3.172) je však velikosti 0(/i2), neboť funkce p(x)y""(x) má v intervalu (a,í>) dvě spojité derivace. Tvrzení věty tedy plyne z rovnic (3.172) a (3.170). Na základě této věty je přirozené hledat přibližné řešení ya,. úlohy z rovnic ., yn dané okrajové (3.173) (Lhy)k=f(xt), k = 2, i-2. Počet těchto rovnic je n — 3, zatímco neznámých je n + 1. Je tedy třeba připojit k nim ještě čtyři rovnice, které se získají z okrajových podmínek. Dvě z nich dostaneme ihned tak, že položíme yo — 7i a yn = j2. Další dvě rovnice lze získat snadno tak, že ve zbývajících okrajových podmínkách se nahradí derivace prostými diferenčními podíly (srv. odvození rovnic (3.27) v odst. 3.2.1). Tím se však dopustíme chyby řádu 0(h), zatímco v rovnicích (3.173) děláme chybu řádu 0(h2). Proto použijeme postup, který se v podobných případech často doporučuje (a který jsme už vlastně mohli užít i v odst. 3.2.1). Derivace v příslušných okrajových podmínkách nahradíme výrazy (yx - j)_1)/(2/i), resp. (yn+1 - yn_1)/(2h), kde-y_i, resp. yn+1 značí aproximaci prodloužení hledaného řešení do bodů z_i — xq — h, resp. r„+i = = x„ + h, neboť tyto podíly aproximují odpovídající derivace s přesností 0(h2). Protože však hodnoty y_ľ a i/„+i se v nich vyskytují oproti rovnicím (3.173) navíc, je třeba požadovat platnost těchto rovnic i pro k = lak = n — í. Přidané hodnoty a yn+i pak můžeme vyloučit, takže zůstanou zachovány původní neznámé VOf-iVn- Výsledky naznačeného postupu jsou shrnuty v následující větě. Věta 3.13. Nechť funkce p, p' a q jsou spojité v nějakém okolí bodu a a b. Pak pro každou funkci y, která má v okolí bodu a a b tři spojité derivace, platí (3.174) ,Wy(pr) = 2hp(a)y'(a) + 0(h3), /«y(pr) = -2hp(b)y'(b) + 0(h3): kde y (pr) s [s/(a;o), ■ y{xn)]T a operátory a /^2' jsou definovány předpisem (3.175) /„(Vpr) = - 2[p(*o)+p(*i)]l/(ao)+ + [2p(z0) + 4p(zi) + p(x2) + ft49(*0M*i)- - 2\p(xx) + P(x2)]y(x2) + p(x2)y(x3}, /P)y(pr) - p(Xn_I)y(z„_3)-2\p(xn-2)+p{xn-1)]y{xn-3)+ + [pfan-a) + 4p(x-„_i) + 2p{x„) + /í4í(rn_i)]j/(j;„_i)- - 2[p(»„_i) + p(xn)]y(xn). 3 METODA SlTÍ Důkaz Za uvedených předpokladů zřejmě platí (3.176) y(zi) - lííz-i) = 2hy'(x0) + 0(h3) (srv. lemma 3.7). Rovněž snadno se zjistí, že je (3.177) p(*o)ir{*-i) - 2[p(i0) +-p(*i)]»(*o) + b(*o) + 4p(iEi) + K*2)M*i)- - 2]p(xi) + p(x2)]y(x2) + p{x2)y(x3) + A4g(xi)y(ii) = = p(x2)[y(x3) - 2y(x2) + yfa)] - 2p(x1)[y(x2) - 2y(x1) + y(x0)] = + P(xo)[y{xi) - 2y(x0) + y(x-i)] + k43(xi)í/(x1) = = h2]p(x2)y"(x2) - 2p(x1)y"(x1) + p(x0)y"{x0)] + 0(h4) = 0(hs), neboť funkce y má v okolí bodu x = xq = a tři spojité derivace, a tedy funkce py" má v okolí téhož bodu spojitou derivaci. Vyloučíme-li y(x^i) z rovnic (3.176) a (3.177), dostaneme první rovnici (3.174). Druhá rovnice (3.174) se dokáže úplně stejně. Důkaz věty 3.13 je hotov. Přibližné řešení okrajové úlohy (1.14), (1.15) budeme tedy počítat ze soustavy (3.173) doplněné rovnicemi (3.178) yo ■ Fy- ■n, y* =72, : 2hp(x0)6: '(3) 1^'y = -2hp{x„)S2. Vzhledem k speciálnímu tvaru prvních dvou rovnic (3.178) jsou neznámé vlastně pouze složky yi,..., j/„_i. Značí-lí nyní y vektor o složkách in,..., 2M-l> Je třeba jej vypočíst ze soustavy (3.179) Ahy = g, kde Ah je pětidiagonální symetrická matice řádu n dimenzionální vektor. Položíme-li ještě A^ — {ay} a 3 = (gi (3.180) au - 2p(x0) + 4p(Xl) + p(x2) + ^qixi), ctkk = p(tfjb-i) + 4p(zt) + p(a:»+l) + h*q(xk), k — 2 Ctfi— l,n— 1 - p(xn-2) + 4p(z„_i) + 2p(i„) + ň4í(a;n_i), ak,k+i = -2[p(sit) + p(xjt+1)], * = 1,..., n - 2, a*,i+2 = p(z*+i), fc = !,...,«-3, 1 a g je daný (n - 1)- i9n-l)T, a (3.181) 31 = 2{p(x0) + p(xi)hi + 2hp(xQ)ó1. Í2 ~ -PÍxifa + lrffa), qk = kVí^s), fc = 3,...,n —3, 9n-a = -p(ain-i)72 + hif(xn-2), 3„_i = 2[p(x„_i) + p(a;„)]r2 - 2hp(xn)62, 198 199 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY jak plyne ihned z rovnic (3.173) a (3.178). Chceme-li, aby právě sestrojená metoda sítí měla rozumný smysl, je třeba především ukázat, že soustava (3.179) má právě jedno řešení. To bude snadným důsledkem lemmatu, které představuje paralelu z lemmatu 3.13 a které bude hrát klíčovou roli v důkazu konvergence popsané metody. Proto úvahy o regularitě matice A;, odsuneme až do následujícího odstavce. 3.3.2 Konvergence Základem všech úvah, které budou prováděny v tomto odstavci, je následující lemma. Lemma 3.14. Necht funkce p a q jsou spojité v (a, b) a nechť platí nerovnosti (3.159). Pak existuje konstanta y > 0 taková, že pro každý (n - l)-dimenzionální vektoz n = (iji.....Vn~i)T platí (3.182) kde (3.183) IHk-SS. = max (|fji|n-3^2, jfe=max_j \r,„\, i|A~3/=) Důkaz Buď tj = ..., t)„_i)t libovolný (n — l)-dimenzionální vektor. Položíme-li n0 = ijn = 0, = ^ a 7}n+1 = r]n-i, plyne z rovnic (3.180), že je (3.184) Zavedeme-li ještě čísla zk rovnicemi (3-185) zjt = ni+1 - 2r/fc + nk-1, k = 0, ,n, lze rovnici (3.184) psát ve tvaru (3.186) kde {Ahv,-n) = Sn + /í4^4(xí)í?í, (3.187) 5„ = J]{[p(^Jb+i)2*+i - p(xk)zk] \p{xk)Zk - p(xk-i)zh-i]}rik- 200 3 METODA SÍTl K úpravě posledního součtu užijeme dvakrát lemma 3.10; dostaneme (3.188) Sn = \p(xn)zn -p(a:B_i)íB-i]i)a-i- n-l - 53[p(art)«i - p(xk-i)zi-i\(w> - *lk-i) = k=i - p(»n)2n»?n-l - p(zn-l)zn-l»Jn-l- n-1 - pfln-ljin-ltíjn-l - ^-2) - p(xo)zoVl + ^2^-1)4-1 = 1=1 = P(*n)-íní?n-l ~ p(En-l)-Zn-l(2j?r.-l - í?n-2) - p(*o)2oí?l+ n-1 + X)p(*í)** +pí*o)*Ž -p(*»-i)*n-i- Protože je však 2jj„_i — i^-2 — -a (3.189) jak plyne ihned z definice čísel 2*, dostáváme celkem, že platí (3.190) k=1 Dosadíme-li tento výsledek do rovnice (3.186) a použijeme-li nerovnosti (3.159), máme f n — 1 (3.191) (Ah-n, n) ž po ( Y 4 + iz° ^ 1,»))ŠPo(l^^ + ^0 + bn)' Odtud a z rovnic (3.189) plyne speciálně, že je (3.192) (Ahrilrj)ž2pBr)l (AhV,v) š 2poij„_i; je tedy (3.193) (/A„i7,ri) Ž 2p0fc3[max(|n1|ft-3/2,|í?„-i|íi-3/s)]2. Píšeme-li rovnice (3.185) ve tvaru zk - (ijt+i - n*) - (n* - rjk-\) a sečteme je pro k — !,...,!/, dostaneme, že je (3.194) Sečtením rovnic (3.194) s u = 1, ., j - 1 dostáváme dále, že platí (3.195) li ~ li ~ U - l)>7i =53** 201 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY pro j = 2, 3,. .., n neboli, zaměníme-li pořádek sčítání a dosadíme-li za r/i podle rovnice (3.189), (3.196) Použijeme-li nyní nerovnost (3.101) s Schwarzovu nerovnost, plyne z rovnice (3.196) , že pro j = 2,..., n platí (3.197) tfšJj»*3+aĎj *)2I>ÍŠ«3*o2 + 2«3&2 + n3^ fc = l fc = l i=l Z nerovností (3.197) a (3.191) však už bezprostředně plyne, že je (3.198) 2(í>- 1 l i i\2 2(&-a)3 1 . PO 1 h3 po pro j = 2, ., rt, neboť je n = (i — n)/fc. Je tedy také (3.199) Položíme-li konečně (3.200) 7 =Pomin[2,2(6_a)3 plyne z tvrzení lemmatu už snadno z nerovností (3.199) a (3.192), Z lemmatu 3.14 plyne bezprostředně, že jsou-li funkce p a q spojité a platí-lí nerovnosti (3.159), je matice Ah pozitivně definitní, a soustava (3.179) má tedy při libovolné pravé straně právě jedno řešení. Skoro stejně snadno umožňuje lemma 3.14 dát odpověď i na otázku po konvergenci uvažované metody sítí. Věta 3.14. Nechť funkce p má čtyři spojité derivace funkce q a / dvě spojité derivace v intervalu (a, b) a nechť platí nerovnosti (3.159). Pak existuje konstanta M taková, že platí (3.201) \\y-y (pO|| < Mh3'2, kde y = (jft,..., yn-l)T je řešení soustavy (3.179) a y ÍPr) je veitor, jeiiož složky jsou hodnoty přesného řešení y okrajové úlohy (1.14), (1.15) v bodech ajfc. Důkaz. Za uvedených předpokladů řešení y okrajové úlohy (1.14), (1.15) nejen existuje a je jediné, ale má mimo to v intervalu (o, b) šest spojitých derivací. Položíme-li (3.202) 202 3 METODA SlTl existuje podle vět 3.12 a 3.13 konstanta K taková, že pro složky et vektoru e platí odhady (3.203) \a\SKh3, \ek\%Kh\ k = 2,... ,n - 2, |«„_i| S Kh3. Pro vektor t) = y (pr' — y tedy máme (3.204) Aj,r) a e. Podle lemmatu 3.14 platí pro libovolný vektor tj nerovnost (3.182). Dosadíme-li do této nerovnosti speciálně podle (3.204) a použijeme-li nerovnosti (3.203), snadno odvodíme, že platí (3.205) 7h3\\V\\l^ g (e,„) á X>|M g + £|£i|l')i|+kn-l|ň3/3|^-l|A-3/3š fc=2 á |HlfcA (|ei|ft8/a+£|e»| + k-il*^a) š g 7Í«3[^2 + (b - a)h2 + A^lNk^ . Odtud již požadovaná nerovnost (3.201) ihned plyne. Zcela stejně se dokáže konvergence metody sítí i v případě obecné samoadjungo-vané diferenciální rovnice 4. řádu. (3.206) {p(x)y")"-(s{x)i/)'+ q{X)y = f{x). Na vyšetřovaný speciální případ jsme se omezili hlavně z důvodu zjednodušení zápisu. Analogicky by se také vyšetřovaly jiné typy okrajových podmínek. Upozorněme závěrem ještě na jednu okolnost. Rychlosti konvergence, které jsme uvedli v případě rovnic druhého řádu, se nedaly zlepšit. Numerické experimenty naznačují, že zde tomu patrně tak není a že exponent 3/2 v odhadu (3.201) lze pravděpodobně zlepšit na 2. Dokázat se to však doposud nepodařilo. 3.3.3 Řešení vzniklých soustav V tomto odstavci uvedeme vzorce pro řešení soustavy (3.179) Gaussovou eliminační metodou bez výběru hlavního prvku. V případě rovníce druhého řádu jsme tento postup ospravedlnili tak, že jsme ukázali jeho souvislost s metodou normalizovaného přesunu. Zde nemáme vybudován potřebný aparát; pTotože však matice soustavy (3.179) je symetrická a pozitivně definitní, odvoláme se na obecné tvrzení o proveditelnosti Gaussovy eliminace bez výběru hlavního prvku pro tuto třídu matic (viz např. Wilkinson (1965)). 203 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY Řešit soustavu (3.179) Gaussovou eliminací znamená vzhledem k pětidiagonál-nosti její matice vypočítat čísla s; a ť, z rekurencí (3.207) Sl = au tl= i = n - 3,. .., 1. Eliminační metoda je v tomto případě sice pracnější než v případě okrajové úlohy pro rovnici druhého řádu, počet potřebných operací je však opět úměrný počtu rovnic, takže patrně žádná jiná metoda nebude efektivnější. 3.4 Nelineární diferenciální rovnice V tomto odstavci zakončíme studium metody sítí pro řešení okrajových úloh pro obyčejné diferenciální rovnice tím, že na příkladě diferenciální rovnice (3.3) s okrajovými podmínkami (3.4) ukážeme, s jakými problémy se můžeme setkat při řešení nelineárních okrajových úloh. Začneme tím, že zformulujeme předpoklady, které stačí k tomu, aby výše zmíněná úloha měla právě jedno řešení. Věta 3.15. Nechť platí (i) funkce f je definovaná a spojitá v pásu R = {(x, y); a S x í= 6, —oo < y < < oo}; (ii) existuje konstanta L taková, že platí (3.210) \f{x,y)-f{x,z)\ÚL\y-z\ pro libovolnou dvojici (x, y) £ R a (x, z) £ R; (iii) pro každé (x, y) £ R existuje derivace f3 a je spojitá a nezáporná v R. Pak okrajová úloha (3.3), (3.4) má pň libovolných fi a j2 právě jedno řešení. 204 3 METODA SÍTÍ Důkaz. K důkazu použijeme myšlenku metody střelby. Buď tedy y{x; a) řešení diferenciální rovnice (3.3) s počátečními podmínkami y(x; a) = 71 a y'(x; a) = ~ a (čárkou zde i v dalších částech důkazů se rozumí derivace podle proměnné x). Podaří-li se dokázat, že rovnice (3.211) y(fc;a) = 72 má při libovolném 72 právě jedno řešení, bude existence a jednoznačnost řešení dané okrajové úlohy dokázána. Abychom to dokázali, uvědomme si předně, že za našich předpokladů funkce y[x; a) nejen existuje a je dvakrát spojitě diferencovatelná podle proměnné x při libovolném (pevném) a — tento fakt plyne ihned z věty 1.1 kap. I — ale je to dokonce spojitá funkce proměnných sána její parciální derivace ya(x; a) podle a existuje a je spojitá pro 35 £ (a, b) a pro libovolné a. Toto tvrzení plyne snadno z lemmatu 2.6. Položme (3.212) ' : n{x) = ya{x\a) a dokažme, že při pevném a platí (3.213) j](x) > x - a; xe(a,b). Důkaz tohoto tvrzení provedeme sporem. Předpokládejme tedy, že (3.213) neplatí. Pak existuje bod /; € (a, b) takový, že je (3.214) !»(£)<*-o. Derivujeme-li identitu (3.215) y"(x;a) = f.(x,y(x;a)) platnou pro libovolné x £ (a, b) a pro libovolné a podle a, dostaneme (3.216) n"{x) = fy{x,y{x;a))n(x). Protože platí y(a; a) = 71 a y'(a; a) = or, platí dále (3.217) ij(o) = 0, 7j'(a) = 1. Odtud plyne předně, že pro bod £ v nerovnosti (3.214) platí f > a. Dále tvrdíme, že tento bod lze zvolit dokonce tak, aby platilo (3.218) tj(x) > 0 pro o < 1 í Položíme-li totiž £0 = inf{:c;a <«íi, n(x) «, protože platí (3.217). Dále je n(x) > 0 pro x £ (a,£o) a íj(Ío) = 0, jak plyne ihned z definice čísla {0. Nyní mohou nastat dva případy: 1) £ < £0; pak (3.218) platí. 2) f > £0; v bodě £o platí »j(ío) = 0 < £0 — a. Funkce r)(x) — (x — a) je tedy v bodě x = £0 záporná. Protože jde o spojitou funkci, je možno nalézt bod fi, £1 < £0 tak, že platí (3.219) >?(íi)<íi-a. 205 r II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE OKRAJOVÉ ÚLOHY Protože je však £j < fo, platí (3.220) r){x) > 0 pro a < x g fi a za bod £ lze vzít bod £1. Není-li tedy tvrzení (3.213) pravda, existuje skutečně bod í G (o,i) tak, že platí (3.214) a (3.218). Podle věty o střední hodnotě existuje bod & € (a, £) tak, že platí (3.221) r,(£) = (í - a),j'(6). V důsledku nerovnosti (3.214) je tedy (3.222) tj'Cía) < 1. Aplikujeme-li znovu větu o střední hodnotě, tentokrát na funkci r/ a na interval (a.Í2). dostaneme, že existuje bod £3 E («,£2) takový, že platí (3.223) «/(&)-! = (Ca-a)iř"(ťs)- Z rovnice (3.223) a z nerovnosti (3.222) plyne, že v bodě £1 platí tJ2'(Í3) < 0. To je však ve sporu s rovnicí (3.216), neboť je fy(x, Jí) ž 0 podle předpokladu (iii) a 'ífo) > 0 podle (3.118). Tento spor dokazuje platnost nerovnosti (3.213). Z nerovnosti (3.213) plyne speciálně, že je (3.224) ya{b; a) ž b- a > 0, takže funkce y(b,a) je v intervalu -00 < a < 00 rostoucí. Zvolíme-li cti pevně, plyne z nerovnosti (3.224) ihned, že pro a ž tví platí (3.225) y(b;a) = y(b;ai)+ f ya(b;t)dt^ Jůi ž y{b;ai) + (a — tvi)(4 -a). Platí tedy (3.226) lim i/(4; a) = 00. a—t-oo Úplně stejně se dokáže, že platí také (3.227) lim y(b; a) = -00. a—*-oo Funkce j/(i>; uť) je tedy rostoucí funkce proměnné a, která zobrazuje interval (-00,00) na interval (-00,00), Rovníce (3.221) má tedy při libovolném 72 právě jedno řešení. Věta je dokázána. Důkaz věty 3.15 je konstruktivní v tom smyslu, že udává současně postup, kterým lze hledané řešení sestrojit. Protože jsme však viděli, že už v lineárním případě může docházet při metodě střelby k nežádoucí ztrátě přesnosti, ukážeme v dalších dvou pododstavcích, jak lze danou okrajovou úlohu alternativně řešit metodou sítí. 206 3 METODA SÍTÍ 3.4.1 Sestavení diferenčních rovnic a jejich řešitelnost Řešit okrajovou úlohu (3.3), (3.4) metodou sítí značí, jak už víme z úvodu k tomuto článku, hledat přibližné řešení 1/1,..., ji„-i ze soustavy rovnic (3.6). Položíme-li y = — (j/l, ■ • - > Vn-l)T, lze tuto soustavu psát ve tvaru (3.228) Ay + h2f(y) = 9, kde A je čtvercová matice řádu (n — 1) daná vzorcem (3.229) A = 2-10 0 -1 '♦. 0 0 ; -1 0 .,. 0 -1 2 f je vektorová funkce (n — 1) proměnných daná předpisem (3.230) f(y) = [/(si, ih),.. ■, /(*„_!, yn-i)f a g = (71,0,..., 0,72)T je daný (n — l)-dimenzionální vektor. Poznamenejme, že vektorová funkce, která je tvaru (3.230), tj. funkce, která (n — 1)-dimenzionálnímu vektoru přiřazuje (n — l)-dimenzionální vektor takový, že jeho i-tá složka závisí pouze na i-té složce argumentu, se nazývá diagonální zobrazení. Stejně jako dříve je první otázka, na kterou je třeba odpovědět, otázka po existenci řešení soustavy (3.228). Má-li však soustava, na kterou vede metoda sítí, popisovat algoritmus pro řešení dané úlohy, je nutno nejen vědět, že její řešení existuje, ale i udat postup, kterým lze toto řešení vypočítat. Proto na otázku po existenci řešení soustavy (3.228) odpovíme konstruktivně, a to tak, že existenční důkaz provedeme pomocí konstrukce určité iterační metody pro řešení této soustavy. K tomuto cíli vyslovíme a dokážeme několik pomocných tvrzení. Lemma 3.15. Buď B matice, jejíž spektrální poloměr g(B) je menši než 1. Pak rada (3.231) konverguje. Důkaz Buď J — I ~lBT Jordánův kanonický tvar matice B. Protože zřejmě platí (3.232) t—n U-n ' 207 IL OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY stačí tvrzení dokázat pro matici v Jordánově kanonickém tvaru. Protože však taková matice je blokově diagonální, stačí se omezit najeden Jordánův blok. Obecný prvek matice J*, kde J, jě Jordánův blok řádu s, je tvarů P(k)Xl~r, kde P je polynom stupně nejvýše s — 1 a pro číslo r platí nerovnosti 0 á r í s-1 (srv. důkaz lemmatu 4.2 v kap. T). Konvergence řady £3 P(fc)Al_'' pak plyne ihned napr. z podílového kritéria, neboť A je vlastní číslo matice 8 a pro ně platí J A| < 1 podle předpokladu. Lemma 3.16. Položme (3.233) A= D-L- U, kde D je diagonální matice, L dolní trojúhelníková matice, U horní trojúhelníková matice, obě s nulami na diagonále a A je matice daná vzorcem (3.229). Pak platí (3.234) Důkaz Je zřejmě Qp-^L + U)) <1. (3.235) 0 1/2 0 1/2 0 '•■ ' ■ 1/2 L 0 .. 0 1/2 .0 Přímým výpočtem se snadno přesvědčíme, že soustava vektorů i/W = (t>í"^ "Í"20T, ľ = l,-.-,«-l.kdB (3.236) O) kw -> k-l,. ,n- 1. tvoří úplnou soustavu vlastních vektorů matice D~1(L+U) a že odpovídající vlastní čísla A'"' jsou dána vzorcem vis (3.237) 1, ...,n-l. Odtud už tvrzení lemmatu plyne. Lemma 3.17. Nechť jsou splněny předpoklady (i) až (iii) věty 3.15 a nechť R = (jRi, ..., R„-\)T je vektorová funkce (n - 1) proměnných j/i,..., yn_i daná předpisem (3.238) R(y)=y + Sf(y), kde S je diagonální matice s nezápornými diagonálními prvky a f (ý) je vektor ze vzorce (3.230). Pak rovnice (3.239) /?(/) = r, 3 METODA SÍTÍ kde r = (n, . rn_!)T je libovolný (n - l)-dimenzionáJni vektor, má právě jedno řešení. Důkaz Protože je (3.240) «l(y) = S«+ *(/(**,.!«). i = n 1, kde Si jsou diagonální prvky matice 5, je R diagonální zobrazení a každá složka vektoru y je řešením skalární rovnice (3.241) Äí(í«) = Vi + Sif(xi, Vi) - r; Tato rovnice má však při libovolném r; právě jedno řešení, neboť funkce Ri(yi) je rostoucí funkce proměnné yi a zobrazuje interval (—00,00) na interval (—00,00). Je tomu tak proto, že platí dRi(yi)/dyi = 1 + Sify(xi,yi) a čísla s; a fy{xi,yi) jsou vesměs nezáporná (srv. důkaz věty 3,15). Věta 3.16. Nechť jsou splněny předpoklady (i) až (iii) z věty 3.15 a nechť je libovolný (n — l)-dímenzionáh>( vektor. Definujme posloupnost veJctorn y M předpisem (3.242) y^ + h2D-lf(y^) = D-'(L+U)y^ + D-1g, v = 0,l,..., kde matice D, L a U jsou definovány rovnicí (3.233). Pat posloupnost y W konverguje k jedinému řešení soustavy (3.228). Důkaz . Položme speciálně (3-243) R{y) = y + h2D-1f(y). Protože matice D _1 má nezáporné prvky, jsou splněny předpoklady lemmatu 3.17 a posloupnost vektorů y W je tedy rovnicemi (3.242) skutečně definována. Buďte y a ý dva libovolné (n — l)-dimenzionální vektory a vyšetřujme rozdíl R (y) — R(ý ). Je (3.244) Ri(yi) - iiííšfc) = j/, + —/(«,,») - fc - —/(«,,*) - A2 = & - Si + —[f(xi, yi) - f(xi,yi)\ aii (a,,- jsou diagonální prvky matice A). Protože podle předpokladu (iii) je /(ar,-, yi) ž š? f{xi, yi) pro j/,- ž j/,-, plyne odtud, že platí (3.245) lífi - Äl š « = l,.-.,n 1. Nerovnosti (3.245) můžeme stručně zapsat ve tvaru (3-246) |y-ý|g|ff(y) /?(ý)|. 208 209 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY Položíme-li v této nerovnosti y — y a y — y dostáváme (3.247) t/("+1)-y(v)\ S ľ?(y("+1>) - R(y w)l = = \D~\L + U)(yW -yC""1))! ^ D_1(i + -y'""1^. Poslední nerovnost plyne z toho, že prvky matice D-1(L + f) jsou nezáporné. Z nerovnosti (3.247) však plyne okamžitě úplnou indukcí, že je (3.248) |y(.<+i)_y(,)|š[D-i(i+ly)ny Protože však je g(D ~1(L + U)) < 1 (viz lemma 3.16), je podle lemmatu 3.15 řada CO (3.249) £|yCH-i)_y<»)| konvergentní. Konverguje tedy také řada JZ^L0(y^r+^ - y W)> tj- také posloupnost y ("5. Limitní vektor y je řešením soustavy (3.228), jak plyne ihned limitním přechodem v rovnici (3.242), neboť obě její strany jsou spojité. Zbývá dokázat jednoznačnost řešení. Důkaz provedeme sporem. Nechť tedy existují dvě řešení y a z soustavy (3.228). Pro ně platí (3.250) Ay + h,2f(y}^ Az+h2f(z) neboli (3.251) A(y-z) + hí[f(y)-f(z}] = 0. Podle věty o střední hodnotě však existují čísla 9,-, i = 1,. , n — 1, taková, že je (3.252) f{y)~f{z) = H{y-z) a H je diagonální matice s čísly fy(xi, (?j) na diagonále. Tato čísla jsou však nezáporná a matice A + h2H je tedy podle Collatzova lemmatu 3.5 monotónní. To však dokazuje, že je y — z — 0. Tím jsme dokončili důkaz věty. Metoda sítí pro řešení problému (3.3), (3.4) má tedy skutečně smysl a věta 3.16 dává navíc návod, jak přibližné řešení nalézt. K řešení (n — 1) skalárních nelineárních rovnic, na něž se rozpadá konstrukce každé iterace ve vzorci (3.242), lze užít kteroukoliv metodu pro řešení nelineárních rovnic; jako příklad vhodné metody může sloužit Newtonova metoda. Poznamenejme, že Newtonovu metodu lze užít na soustavu (3.228) také přímo. V tomto případě se posloupnost aproximací řešení sestrojuje podle vzorce (3.253) yWiUyW + [G(y(»))]-V()rW), v = 0,1, ., kde jsme položili (3.254) *)l š Mh2 Důkaz. Za uvedených předpokladů má přesné řešení y dané okrajové úlohy v intervalu (a, b) čtyři spojité derivace. Podle lemmatu 3.8 tedy platí (3.265) ■ + 2y(xk) - y(xk+1) + h2f(xk,yk)\ á ±Zh4 Z- max \y""(x k - 1,. ..,n- 1, kde (3.266) Z nerovností (3.265) vsak plyne, že existují čísla 9k, \9k\ á 1, taková, že je (3.267) -y(,xi^1) + 2y(xk)-y{xk+1)-rh2f{xi,yk) = ±0kZhA. Položíme-li jjj. — y(xk) — yk, odečteme-li fc-tou rovnici (3.228) od rovnice (3.267) a užijeme-li větu o střední hodnotě, dostaneme (3.268) - vt-i + 2r)k - Tjt+i + h2ghr!h e ^ŕ^/i4, t = l,.„,n-l: >?0 = f?n = 0, kde gk jsou hodnoty funkce fy(xk,y) ve vhodných bodech y — yk, tedy nezáporná čísla. Položíme-li jako obvykle rj — (iji,..., »?ii-i)T, můžeme rovnice (3.268) zapsat maticově jako (3.269) 212 (A+h2H)r)= ±Zh4P< kde H a P jsou diagonální matice s čísly gk, resp. 6k na diagonále. Matice H je tedy nezáporná a matice A + h2H je podle Collatzova lemmatu monotónní. Podle lemmatu 3.3 tedy platí (3.270) (A+h'H)-1 ZA-1. Maticová norma, která je indukována JSfoo-vektorovou normou, je rovna maximu ze součtů absolutních hodnot prvků v jednotlivých jejích řádcích. Užijeme-li tedy tuto maticovou normu, platí (3.271) ll^ + Ä'wr'IIŠIIA-1!!, protože matice A + h2H a A jsou monotónní, a tedy matice (A + h2H)~y a A~l jsou podle lemmatu 3.1 nezáporné. Je však n-i (3.272) ll^_1ll»..= m« X0-^? (n — i)i n2 (b — a)2 1 = max--— S — S--— t^7 ■=i,...,n-i 2 - 8 ~ 8 h2 Z nerovností (3.270), (3.271) a z rovnice (3.272) už tvrzení věty plyne bezprostředně. 4 Variační metody V tomto článku si všimneme velice stručně takových metod pro řešení okrajových úloh, které souvisí s variačním počtem. Tyto metody vycházejí ze skutečnosti, že velmi mnoho fyzikálních zákonů lze vyjádřit pomocí minimálních principů. Tak např. rovnovážný stav mechanické soustavy je takový stav, který odpovídá minimu její potenciální energie. Z toho důvodu je okrajová úloha pro diferenciální rovnici popisující rovnováhu mechanické soustavy obecně ekvivalentní s úlohou nalezení funkce, pro níž integrál vyjadřující potenciální energii této soustavy nabývá minima. Matematicky řečeno to znamená, že řešení okrajové úlohy pro diferenciální rovnici je ekvivalentní úloze variačního počtu, tj. úloze nalézt extrém integrálu, jehož Eulerovou rovnicí je daná diferenciální rovnice. K řešení úloh variačního počtu lze užít metody, kdy se přímo sestrojuje aproximace extrému daného integrálu, aniž by se napřed přecházelo k jeho Eulerově rovnici. V důsledku naznačené ekvivalence jsou tyto metody zároveň přibližnými metodami řešení okrajových úloh pro diferenciální rovnice. Z důvodů, které byly naznačeny výše, se variační metody řešení okrajových úloh nazývají také přímé metody. Dříve než popíšeme nej důležitější z nich, totiž Ritzovu a Galerkinovu metodu, ukážeme souvislost některých důležitých okrajových úloh s variačními úlohami. Protože variační metody velmi úzce souvisí s funkcionálně analytickou teorií okrajových úloh pro diferenciální rovnice, budeme v celém tomto článku předpokládat znalosti základních pojmů funkcionální analýzy, zejména pak teorie Hilbertových prostorů. 213 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 4.1 Variační formulace okrajových úloh 4.1.1 Lineární diferenciální rovnice druhého řádu Bud dána diferenciální rovnice (1.12) s jednoduchými okrajovými podmínkami (4.1) a nechť jsou splněny předpoklady věty 2.2, takže okrajová úloha (1.12), (4.1) má právě jedno řešení. Položíme-li v(x) — y(x) — l(x), kde funkce í je dána vzorcem (4.2) 1(x): b — x a — x 7it—- + 72-—r (graf této funkce je přímka spojující body (a, 71) a (6,72)), je funkce v řešením diferenciální rovnice — (p(x)v') + q(x)v — g(x) s okrajovými podmínkami u(a) = = v(b) = 0. Protože tato diferenciální rovnice je stejného typu jako diferenciální rovnice (1.12), jen její pravá strana je jiná, lze v dalším výkladu bez újmy na obecnosti předpokládat, že řešíme diferenciální rovnici (1.12) s homogenními okrajovými podmínkami (4.3) íř(o) = 0, y(b) = 0. Zaveďme operátor I předpisem (4.4) Lv — — (pu')' + qv. Tento operátor zobrazuje množinu což je množina funkcí, které mají v intervalu (a, 6) dvě spojité derivace a které splňují podmínky v(a) = v(b) = 0, do množiny *íř((íi,f>)) funkcí spojitých na intervalu {a,b). Řešit okrajovou úlohu je tedy totéž, jako řešit rovnici (4.5) v množme 2?^. Následující pomocná tvrzení umožní formulovat variační úlohu, jejíž řešení je řešením dané okrajové úlohy. Lemma 4.1. Operátor L definovaný na množině rovnicí (4.4) je symetrický operátor, tj. pro každé dvě funkce u,v £ @i platí (4,6) J (Lu)(x)v(x)dx - j u(x)(Lv)(x)dx. Důkaz . Tvrzení lemmatu dostaneme ihned dvojí integrací per partes. 214 4 VARIAČNÍ METODY Lemma 4.2. Nechť funkce p, p' a q jsou spojité a nechť platí nerovnosti (4.7) p{x) g po > 0, q(x) g 0, xě (a, 6), Pat pro každou funkci u £ piatj (4.8) r(Lit)(x)v(x)áx^T^-\\u\ J a <>-a kde symbol IIuUjí,, značí normu funkce v. v prostoru Sč^, tj.\\u\\tg^ - max |u(x)|. Důkaz. Tvrzení bylo už v podstatě dokázáno v odst. 3.2.2, když jsme studovali konvergenci metody sítí pomocí energetických nerovností (srv. vzorce (3.98), (3.99) a (3.106)). Protože však tam vyšetřovaná rovnice má jiné okrajové podmínky, zopakujeme příslušný důkaz ještě jednou. Pro každou funkci u ě &t platí pro každé x £ (a, b) (4.9) «(*)= r«'(í)df, J a protože je u(a) = 0, Odtud pomocí Schwarzovy nerovnosti dostáváme (4.10) tia(z) g (*-<•) /V(Oj2d£S(&-a) /V(Č)]2 + q(x)u2(x)}dx-2 f f{x)u(x)dx. Ja Ja kde vztah (4.14) vznikl ze (4.13) integrací per partes. Zavedené označení dovoluje zformulovat následující větu. 215 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE OKRAJOVÉ ÚLOHY Věta 4.1. Nechť funkce p,p', q a / jsou spojité v intervalu {a, b) a nechť jsou splněny nerovnosti (4.7). Nechť dále funkce y G 3iL je řešením rovnice (4.5). Pak platí (4.15) F(u) > F(y) pro každou funkci u & @l, y. Naopak, nechť existuje funkce y€.9i_ íaJtová, že pro každou funkci u € &i, u ^ y, platí nerovnost (4.15). Pak y je řešením rovníce (4.5). Důkaz . Buď za prvé y G &i řešením rovnice (4.5) a buď u libovolná funkce taková, že je ti 6 u ^ y. Pak podle lemmatu 4.1 platí (4.16) F(u) = / (í«)(i)u(i)di -2 f f(x)u(x)dx = J a J a = í (Lu)(x)u(x)dx-2 í (Ly)(x)u(x)dx+ J a J a + í {Ly)(x)y(x)dx~ f {Ly)(x)y(x) d x - J a Ja — / L(u-y)(x)[u(x)-y(x)]dx - f (Ly)(x)y(x)dx. Ja Ja Podle lemmatu 4.2 však pro v. jí y platí (4.17) í L{u-y)(x){u(x)-y{x)]dx>0, Ja takže odtud a z rovnice (4.16) plyne, že je (4.18) F(u) > - f{Ly)(x)y{x)dx = F(y). Ja Nechť naopak je y funkce, ve které nabývá funkcionál F absolutního minima v množině Buď u libovolná pevně zvolená funkce z množiny &i a položme (4.19) 0 pro každou funkci u £ u / 0. Definujeme-li tedy na @i bilineární formu [ti, v] (tj. funkci dvou proměnných u a v, která je lineární v každé proměnné zvlášť) rovnicí (4.26) [u,v] = (Lu,v) nebo alternativně vzhledem k možnosti integrace per partes rovnicí (4.27) W,v]= f \p(x)u'(x)v'(x) + q(x)u(x)v(x)]dx, Ja je tato forma skalárním součinem. Zavedeme-li ještě normu rovnicí (4.28) \\u\\L = [u,uf'\ stane se vektorový prostor @i lineárním normovaným prostorem, který není obecně úplný. Jeho úplný obal označíme @; je to Hilbertův prostor, pro nějž je zřejmě @ 3 D a množina &i je v něm hustá v metrice dané normou (4.28). Prvky prostoru 9 jsou tvořeny právě těmi funkcemi z tzv. Sobolevova prostoru Jť1 které splňují okrajové podmínky (4.3). Sobolevovým prostorem Jťk (běžné značení je také W*) se přitom rozumí Hilbertův prostor funkcí, které mají v daném omezeném intervalu absolutně spojitou (k — l)-ní derivaci takovou, že platí (4.29) a v němž je skalární součin dán rovnicí /V*>(*)] J a 2 áx < oo, (4.30) 3=0 Rozšíříme-li definici funkcionářů F na funkce ti £ & rovnicí (4.31) FH = [«,«.]-2(/,«), což má smysl, neboť skalární součin [u,v] je pro prvky z prostoru & dán rovnicí (4.27), zůstává věta 4.1 v platnosti, bereme-li v ní funkce u z množiny & místo z množiny Až dosud jsme předpokládali, že koeficient p v diferenciálním operátoru L je spojitě diferencovatelná funkce v intervalu (a, 6). K tomu, aby integrál na pravé straně rovnice (4.27) měl smysl, je tento požadavek příliš přísný a lze jej podstatně zeslabit, stačí např. předpokládat, že koeficient je omezená měřitelná funkce, pro niž platí nerovnost p(x) ä po > 0. Podobně k tomu, aby měl smysl výraz (/,«), není třeba předpokládat, že funkce / je spojitá; stačí např., aby platilo / £ -£i(p, b). Pro funkce / a p právě zmíněných vlastností a pro u £ 3> nemá rovnice (4.5) obecně vůbec smysl, nicméně funkcionál F je rovnicí (4.31) stále dobře definován a nadto, jak hned uvidíme, nabývá v množině & svého minima. V tomto 218 r 4 VARIAČNÍ METODY případě je rozumné pokládat toto minimum za zobecnené řešení úlohy, která není nyní charakterizována operátorem L (ten nemá obecně smysl), ale bilineární formou (4.27). Zobecněné řešení lze charakterizovat také tak, že je to takový prvek y prostoru pro který platí rovnice (4.32) [V, v] = (/> v) pro každou funkci u £ V této souvislostí se zobecněné řešení dané okrajové úlohy nazývá také slabé řešení. Důvod je ten, že v případě, že řešení y leží v množině @l a že jak koeficient p, tak pravá strana / jsou dostatečně hladké, takže jde o klasické řešení rovnice (4.5), lze rovnici (4.32) psát ve tvaru (4.33) J (Ly)(x)v(x)dx = j /(i)i;(a:)da!. Tato rovnice vznikla vynásobením obou stran rovnice (4.5) funkcí v £ 9\_ a integrací v mezích od a do b. Vzorec (4.33) tedy vyjadřuje splnění rovnice (4.5) v integrálním, tj. slabém smyslu. Závěrem uveďme existenční větu pro takto přeformulovanou okrajovou úlohu. Veta 4.2. Buď Jír reálný Hilbertův prostor se skalárním součinem (u, v) a normou ||u||. Buď dále [u,v] symetrická bilineární forma definovaná na vektorovém prostoru C Jřkterá je pozitivně definitní, tj. pro niž existuje konstanta 7 > 0 taková, že platí (4.34) [u, u] 2í 7(u, u), u £ $l, takže [u, v] je skalární součin na&i-Buď konečně @) úplný obal prostoru f&i v normě \\u\\i = [u, u]1'2 a / 'ibovoJný prvek z Jť. Pak existuje právě jeden prvek y £ ® takový, že platí (4.35) F(y) = minimu), kde funkcionál F je definován rovnicí (4.31) Důkaz. Za uvedených předpokladů je výraz (/, u) lineární ohraničený funkcionál na Hilbertově prostoru 0, neboť ze Schwarzovy nerovnosti a z nerovnosti (4.34) plyne, že je (4.36) K/.^IŠII/IIIHIŠ-ttíII/IINIl. Podle Rieszovy věty o reprezentaci lineárního spojitého funkcionálu existuje tedy právě jeden prvek y £ & takový, že platí (4.37) 219 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY Dosadíme-li do (4.31) podle (4.37), máme (4.38) F(u) = [u,u] - 2[y, u] = [ti, u] - 2[y, u] + [y, y] - [y, y] - = [u-y,u-y]-[y,y\. Protože však je [u — y, u — y] > 0 pro u^y podle (4.34), plyne požadovaná tvrzení z identity (4.38). Poznámka 4.1. Rovnice (4.37), kterou jsme odvodili v průběhu důkazu věty 4.2, je totožná s rovnicí (4.32). Zobecněné řešení je tedy skutečně zároveň slabé řešení úlohy charakterizované bilineární formou [«, v]. V předešlém textu jsme ukázali, jak lze definovat bilineární formu z věty 4.2 v případě okrajové úlohy (1.12), (4.3). V dalším odstavci ukážeme, že i v případe diferenciálních rovnic vyšších řádů je postup principiálně stejný, 4.1.2 Lineární diferenciální rovnice vyšších řádů Uvažujme nejprve okrajovou úlohu (3.206), (1.15). Ze stejných důvodů, jako jsme uvedli v odst. 4.1.1, můžeme předpokládat, že dané okrajové podmínky jsou homogenní, tj. že jsou tvaru (4.39) y(a) = 0, y'{a) = 0, !/(*)= 0, j/(fc) = 0. Kdyby totiž tomu tak nebylo, sestrojíme snadno polynom třetího stupně, který splňuje podmínky (1.15) a pomocí něj převedeme řešení dané okrajové úlohy s nehomogenními okrajovými podmínkami na řešení okrajové úlohy s homogenními okrajovými podmínkami a jinou pravou stranou. Značí-linyní množinu funkcí čtyřikrát spojitě diferencovatelných v intervalu (a, b) a splňujících okrajové podmínky (4.39) a označíme-li L operátor definovaný na množině 2*/_ rovnicí (4.40) Lv = (pv")" - (st/)' + qv: lze okrajovou úlohu (3.206), (4.39) zapsat jako rovnici (4.41) Lu = f, jejíž řešení hledáme v množině Zavedeme-li v množině ®^ skalární součin [u, v] rovnicí ŕ (4.42) [u,v}= i (pu"v" + su'v' + quv) d x Ja a funkcionál F opět rovnicí (4.31), je úloha (4.41) ekvivalentní úloze nalezen! minima funkcionálu F v množině která vznikne zúplněním vektorového prostoru %>i v normě dané skalárním součinem (4.42). Množina S je tvořena právě těmi funkcemi ze Sobolevova prostoru Jť2, které splňují okrajové podmínky (4.39). Úlohu i VARIAĎNl METODY (4.41) lze opět jako v případě rovnice druhého řádu zobecnit na případ, že koeficienty p, s a q jsou omezené nezáporné měřitelné funkce, že platí p(x) ž po > 0 a že pravá strana / je z prostoru Sfj. Stačí k tomu pokládat rovnici (4.42) za definici bilineární formy z věty 4.2 a za řešení vzít takovou funkci y £ 0, pro niž funkcionál (4.31) nabývá minima nebo pro niž platí rovnice [y, v] = (/, v) pro každou funkci o € 3>L. Popsaný postup lze snadno zobecnit na okrajovou úlohu 2m-tého řádu, kde m je přirozené číslo. Bud' dáno m + 1 nezáporných měřitelných omezených funkcí aj (j = 0,..., m) a nechť platí am(x) ž a > 0. Označme @i množinu funkcí, které jsou v intervalu (a, 6) 2m-krát spojitě diferencovatelné a které splňují homogenní okrajové podmínky (4.43) j(('''(a) = 0, i - 0,...,m- 1, i,M(6) = 0, i-0, ...,m 1. Definujme na množině 9i bilineární formu [u, v] rovnicí (4.44) [u,v] = Yi aj{x)u^i\x)vi v normě dané tímto skalárním součinem, je tvořen právě těmi prvky Sobolevova prostoru m, které splňují okrajové podmínky (4.43). Zobecněná okrajová úloha příslušná k bilineární formě (4.44) je pak stejně jako výše úloha nalézt takový prvek y prostoru ®, který minimalizuje funkcionál (4.31). Podle věty 4.2 řešení této úlohy existuje a je jediné pro každou pravou stranu / £ Jžf2. Jsou-li koeficienty aj(x) dostatečně hladké a pravá strana / je spojitá, leží toto zobecněné řešení dokonce v je tedy klasickým řešením diferenciální rovnice m (4.45) (iy)(*)*£(-iy>i(*)^H*)]U) = /{«), *eM) j=o s okrajovými podmínkami (4.43). 4.1.3 Jiné typy okrajových podmínek Variační formulace okrajových úloh není vázána pouze na okrajové podmínky typu (4.3) nebo (4.43). Je-li např. dána okrajová úloha (1.12), (1.13), můžeme stejně jako v odst. 4.1.1 bez újmy na obecnosti předpokládat, že okrajové podmínky jsou homogenní, tj. že jsou tvaru (4.46) ~alP(a)y'(a) + 0iy(a) = 0 <*2P(b)ý(b) + foy(b) = 0. 220 221 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY V opačném případě snadno sestrojíme funkci l, která splňuje okrajové podmínky (1.13); funkce v = y — l pak splňuje diferenciální rovnici typu (1.12) s homogenními okrajovými podmínkami. Předpokládáme-li, že je > 0 a ct2 > 0, je okrajová úloha (1.12), (4.46) ekvivalentní s úlohou nalézt v prostoru Jf1 minimum funkcionářů (4.31), kde bilineární forma [u, v] je dána rovnicí (4.47) [u,v]=j \p(x)u'(x)v'(x) + q(x)v(x)v(x)] d x+ + ^-u(a)v(a) + fou/b)v{b). Cti 012 Protože pravá strana vzorce (4.47) vznikla z výrazu ŕ (4.48) / { - \p(x)u'(x)]'v(x) + q(x)u(x)v(x)} d x Ja integrací per partes za využití podmínek (4.45), je také naznačeno, jak se postupuje v případě jiných okrajových úloh. 4.2 Základní přibližné metody 4.2.1 Ritzova metoda V odstavci 4.1 jsme ukázali, že řešení mnoha okrajových úloh pro diferenciální rovnice je ekvivalentní s hledáním minima jistého funkcionálu. Tak např. řešit lineární diferenciální rovnici (112) s okrajovými podmínkami (4.3) je totéž jako nalézt minimum funkcionálu F daného rovnicí (4.14) na prostoru funkcí 0, které patří do Sobolevova prostoru Jř1 a které splňují okrajové podmínky (4.3). Princip Ritzovy metody spočívá v tom, že se zvolí konečnědimenzionální podprostor 3>n prostoru ^ a za aproximaci řešení dané okrajové úlohy se pokládá funkce j/jv, která minimalizuje funkcionál F na tomto konečnědimenzionálním prostoru. Tvoří-lifunkce $i, -.. bázi prostoru 0« (funkce $lt..., <řjv jsou tedy takové lineárně nezávislé funkce z prostoru @j\r, že každá jiná funkce z tohoto prostoru se dá psát jako jejich lineární kombinace), je hledaná aproximace tvaru (4.49) vn Koeficienty c* — (e*,... , cj,)1* je přitom třeba určit tak, aby funkce F ti proměnných Ci,..., cti definovaná rovnicí (4.50) FN(cu . .,cN) - Fl J2ck I VARIAČNÍ METODY nabývala v bodě (c*, .., c*N) svého minima. Protože zřejmě platí n n n (4.51) FN(Cl, ..,<;„) = ££2£*(/,*<)■ i=l 1=1 i = l je funkce FN jako funkce proměnných ci.....cN diferencovatelná. Pokud tedy funkce Fff nabývá v nějakém bodě extrému, musí v tomto bodě platit rovnice dFN (4.52) 8cj = 0, j=l,...,N. Dosadíme-li však do rovnic (4.52) podle definice funkce F^, dostáváme, že tyto rovnice představují soustavu lineárních algebraických rovnic (4-53) Ac = g, kde A je čtvercová matice řádu JV, jejíž prvky ay jsou dány rovnicemi (4.54) ay = [*,,*,], i,j- l....,.V: a g je JV-dimenzionální vektor o složkách gi daných vzorci (4-55) 9, = (/,*.), i=l,...,N. Soustava (4.53) tedy představuje nutné podmínky pro existenci extrému funkcionálu F na podprostoru Qjq. V následující větě dokážeme, že tyto podmínky jsou také postačující. Veta 4.3. Nechť jsou splněny předpoklady věty 4.2, nechť !zV je konečnědimenzionální' podprostor prostoru & a nechť funkce <řj,..., (řjy tvoří jeho bázi. Pak soustava (4.53) má při libovolném vektoru g právě jedno řešení a navíc toto řešení minimalizuje funkci Ftt definovanou vzorcem (4.50). Důkaz. Matice A, jejíž prvky jsou dány rovnicemi (4.54), je zřejmě symetrická. Dokážeme, že je také pozitivně definitní. Buď tedy e = (ci,,.., c;v)T libovolný nenulový vektor, takže funkce u = YliLi představuje nenulový prvek prostoru Je tedy N N (4.56) cTAc = EEc'cj[$í.$j] = K"! > 0. i=l 3=1 neboť bilineární forma [«, v] je pozitivně definitní. Soustava (4.53) má tedy právě jedno řešení c *. Protože je Fjv(c ) = cT Ac—2gT c, je (4.57) FN(c) = cTAc - 2(c*)TAc = = cTAc-2{c*)TAc+{c')TAc' - (c')TAc' = = (c - c*)TA(c ■ c*) {c*)TAc* > -{c*fAc* - FN(c") 222 223 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 4 VARIAČNÍ METODY pro c ^ c". Tato nerovnost však dokazuje, že funkce Jľjv skutečně nabývá v bodě c = c * svého minima. Věta je dokázána. Vypočíst Ritzovou metodou přibližné řešení okrajové úlohy charakterizované bi-lineární formou [u, v] a pravou stranou / značí tedy utvořit funkci yw tvaru (4.49), kde vektor c* je řešením soustavy lineárních algebraických rovnic (4.53). Matice této soustavy se v matematické literatuře nazývá Gramová matice. V technické literatuře, zejména pak v souvislosti s metodou konečných prvků, se matice A nazývá většinou matice tuhosti příslušná k bázi $i,...,4j\r a vektor g na pravé straně soustavy (4.53) se nazývá vektor zatížení. Abychom mohli posoudit velikost chyby, dokážeme ještě následující větu. Věta 4.4. Nechť jsou splněny předpoklady věty 4.3. Pak funkce yx tvaru (4.49), kde vektor c* je řešením soustavy (4.53), je ortogonédní projekcí v prostoru & přesného řešení dané okrajové úlohy do podprostoiu ®jv ■ Důkaz. Buď y přesné řešení okrajové úlohy charakterizované bilineární formou [u, v] a funkcí /. Z identity (4.38) platné pro libovolný prvek u E & plyne speciálně, že je (4.58) \\yN - y\\l = {yN -y,yN-y] = F(yN) + [y, y] - = min F(u) + [y,y] = min [u-y,u-y]= min ||ti - y\\2L. UĚ^U líĚ^í UÉ^V Přibližné řešení t/jv je tedy prvek podprostoru který leží nejblíže přesnému řešení. Odtud a ze známých vět o nejlepší aproximaci v Hubertově prostoru už tvrzení plyne. Ze vzorce (4.58) vyplývá, že každý horní odhad výrazu min,^^ ||u — y\\i dává odhad chyby přibližného řešení získaného Ritzovou metodou. Chyba Ritzovy metody tedy závisí na tom, jak dobře jsme schopni aproximovat přesné řešení prvky konečnědimenzionálního podprostoru &tf. Volba prostorů S>jv a bázových funkcí ä>i,... ,<řjv má tedy zřejmě při užití Ritzovy metody zásadní důležitost. V odst. 4.3 popíšeme jednu zejména v poslední době populární strategii pro systematickou konstrukci bázových funkcí. Tato metoda je známá pod názvem metoda konečných prvků a má pro efektivní užití variačních metod prvořadou důležitost, 4.2.2 Galerkinova metoda Základní myšlenka této metody je ještě jednodušší, než je tomu u Ritzovy metody. Vychází z toho, že zobecněné řešení okrajové úlohy se dá definovat rovnicí (4.32). Opět, jako u Ritzovy metody, se zvolí konečnědimenzionální podprostor ®jv prostoru ® a za přibližné řešení se pokládá taková funkce j/jv G ®iv, pro niž platí (4.59) [yN,Vfí]-(f,vN) pro každou funkci wjv G Tvoří-li funkce 3>i,.. bázi v prostoru í^v, je přibližné řešení t/jv dáno úplně stejnými vzorci jako u Ritzovy metody. V případě, že okrajovou úlohu lze interpretovat jako minimalizační úlohu, jsou tedy metody Ritzova a Galerkinova totožné. Proto se často v této souvislosti mluví □ Ritzově-Galerkinově metodě. Galerkinova metoda je však obecnější než Ritzova metoda, neboť je ji možné užít i v případě zobecněné úlohy typu (4.32), kde výraz [v, v] je bilineární forma, která nemusí být nutně symetrická. V tomto případě obecně nelze udat funkcionál typu (4.31), jehož extrém by bylo možno interpretovat jako zobecněné řešení. Úloha (4.32) však přesto může mít rozumný smysl. 0 volbě bázových funkcí Galerkinovy metody platí samozřejmě totéž, co bylo řečeno u Ritzovy metody. 4.3 Metoda konečných prvků Při popisu Ritzovy a Galerkinovy metody v odst. 4.2 jsme neudali žádný systematický způsob konstrukce konečnědimenzionálních podprostoru 0 tak, že pro chybu interpolace fh 6 &hi platí odhady (4.64) H/-ÄH, š A""1"-'ll/^ľ kde r= 1,2, p = 0,...,r-l, (4.65) h — max (x,-|_i — Xj) i=0,...ln — l a index 0 značí, že jde o normu v prostoru Jf2. Důkaz. Zvolme pevně interval (xj, xj+i), položme x;+i - x< = hi a buď nejprve / G Jf1. Definujeme-li funkci ip proměnné f na intervalu (0,1) předpisem (4.66) í>(e) = /W + *0, je zřejmě

í. (4.70) rtí)-p*(o= ľ' m,r) T) dr / W)]2 ir. jo jo Integrací obou stran nerovnosti (4.71) podle £ v mezích od £ = 0 do £ = 1 dostáváme odhad (4.72) /V«) - Mí)? d€ š 7 / W)]adr. Jo Jo kde (4.73) 7 = [ /1/í2(€,r)d£dr, jo jo a je to tedy absolutní konstanta. Dosaďme konečně do odhadu (4.72) za funkce ip a ph z rovnic (4.66) a (4.67). Protože je zřejmě 0 k přesnému řešení. Tvrzení poznámky plyne ihned z nerovnosti (4.61), v níž je k = 1, yjv je přibližné řešení, y přesné řešení a u je libovolný prvek z prostoru Pravou stranu této nerovnosti lze totiž majorizovat výrazem M(||t/e — + ||j/s„ — j/£||i), kde ye € € Jť2 a ysh je interpolace funkce ys. Normu prvního rozdílu lze učinit libovolně malou, neboť prostor Jť2 je hustý v prostoru Jť1 a norma druhého rozdílu je malá v důsledku věty 4.5. O rychlosti konvergence se nedá obecně nic říci; v případě, že je y £ Jť2, je rychlost konvergence (v normě prostoru Jť1) ovšem O(h). Sestrojme ještě bázi v prostoru &h\- Tento prostor má dimenzi rovnou zřejmě počtu uzlových parametrů, tj. číslu n + 1. Jednu z možných (a jak hned uvidíme také vhodných) bází tvoří soustava funkcí <řj, které vzniknou tak, že j-tý uzlový 229 i II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY parametr položíme rovný jedné a ostatní uzlové parametry rovné nule. Provedeme-li naznačený postup, jsou prvky báze dány rovnicemi (4.83) *o(i) = *i(z) ; :t + l-3? I ^ x ^ xn, ; a <&j jsou pro \i — j\ ž 2 disjunktní, takže integrály ve vzorci (4.27) jsou pro tato i a j rovny nule. Složky vektoru řešení soustavy (4.53) mají přitom přímo význam hodnot přibližného řešení, neboť každá bázová funkce je rovna jedné v právě jednom uzlu a v ostatních uzlech je rovna nule. Přibližné řešení modelové úlohy (1.12), (4.3) Ritzovou-Galerkinovou metodou při užití právě sestrojeného prostoru konečných prvků vede tedy na řešení soustavy lineárních algebraických rovnic s třídiagonální maticí podobně jako v metodě sítí. Kdybychom k přibližnému výpočtu integrálů, které je nutno počítat při výpočtu prvků matice soustavy (4.53), zvolili vhodné kvadraturní vzorce, byly by dokonce obě tyto metody totožné. Metodu sítí lze tedy uvést do velmi úzké souvislosti s variačními metodami. Stejným způsobem jako výše lze užít metodu konečných prvků užívající lineární prvky S^i i k řešení jiných okrajových úloh druhého řádu. Předpoklad, že problém je druhého řádu, je zde podstatný, neboť prostor !@hi je podprostorem Sobolevova prostoru Jť1, v němž je přirozené hledat řešení rovnic druhého řádu. Protože první derivace funkcí z Sfoi nejsou obecně spojité, tím méně absolutně spojité, není tento prostor podprostorem žádného prostoru JPl pro k > 1; k řešení úloh vyššího řádu jej tedy nelze užít. 4.3.2 Aproximace Hermitova typu Jedna z možností konstrukce prostorů konečných prvků, které jsou podprostory Sobolevova prostoru Jířk pro libovolné k, vychází z myšlenky Hermitovy interpolace. Z teorie této interpolace plyne, že jsou-li Cjj, i — 0,..., n, j — 0,..., k — 1, libovolná čísla, existuje právě jedna funkce u, která je na každém podintervalu (;eí_i, xí) 230 polynomem stupně nejvýše 2k - 1 a pro niž platí (4.84) uU\xí) - dj, i = 0,...,n, j = 0, ■i VARIAČNÍ METODY 1. Každá taková funkce má spojité derivace až do řádu k — 1 a fc-tá derivace má nespojitosti pouze v uzlech z,-; patří tedy do prostoru Jľk. Vezmeme-li krajní body podintervalu, na něž jsme rozdělili interval (a,b), za uzly a hodnoty funkce spolu 5 hodnotami jejích derivací až do řádu i: —1 za uzlové parametry, dostaneme prostor konečných prvků C Jř'. Každou funkci / £ Jťk můžeme opět jako v odst. 4.3.1 aproximovat funkcí fa £ &hh, která je jednoznačně určena rovnicemi (4.85) fH\xi) = f<»{xl), i = 0.....n, J =0, 1. V dalším se zejména pro zjednodušení zápisu omezíme na ekvidistantní uzly, tj. na uzly dané vzorcem (4.86) Xí = a + ih, i = 0,,.,, n, h = (b — a)/n. Následující věta popisuje aproximační vlastnosti prostoru 9\k- Věta 4.6. Nechť je f £ Xr pro re{i,.:., 2k}. Pak pro chybu aproximace fa určené rovnicemi (4.85) platí odhad (4.87) \\f - fa\\p % Mhr-"\\f^\\0< r =*,.., ,2fc, p = 0,... ,mm(r - 1, *). Důkaz provedeme pouze pro případ k = 2. Budeme vycházet stejně jako v důkazu věty 4.5 z integrálního vyjádření chyby interpolace. Definujme funkce ip a iph opět rovnicemi (4.66) a (4.67). Funkce (0)(1 + 2Í)(1 - í)s + ř(l)(3 - 2Í)Í2+ + ^'(O)f(l-Í)2+ ¥■'(!)(£-l)í2. Dosadíme-li do tohoto vzorce ze zřejmých identit rt (4.89) P(0) = í>(0-Mí) + f tv"(t)At, Jo řKl) = Í. Další postup je identický jako v důkazu věty 4.5, jen případů, které je třeba vyšetřit, je více. Z identity (4.91) ihned plyne odhad (4.93) r+1[f(x)-fh(x)fdx^ Tlft4 r+í[f"(x)]2dx: kde Ti je absolutní hodnota. Z nerovnosti (4.93) však už plyne tvrzení věty pro v = 2 a p — 0. Derivováním identity (4.91) odvodíme nerovnost (4.94) r^[f(x) ~ í>h{-x)]2áx = J2k2 J^Wi*)?**. která spolu s tím, co už jsme dokázali výše, dokazuje nerovnost (4.87) pro r = 2 a p — 1. Abychom vyšetřili případ / 6 Jř"3, uvažme, že je

»«)= f m,T)^\T)di Jo platné pro ip £ Jťk. Odvození toto identity je však dosti komplikované, a proto jsme se omezili na uvedený speciální případ. Prvky prostorů Shis se nazývají Hermitovy spline-funkce stupně 2k— 1. Abychom mohli těchto prostorů efektivně využívat k variačnímu řešení okrajových úloh, je třeba v nich zavést vhodné báze. Všimněme si proto nyní této otázky. Začneme případem k = 2. V tomto případě je dimenze prostoru 9h2 rovna 2{n + 1), neboť v fi+1 uzlech zadáváme vždy dva uzlové parametry, totiž hodnotu funkce a hodnotu její derivace. Je tedy třeba sestrojit 2(n + 1) bázových funkcí 3>o, • ■ •, $2n-t-l- Jedna z možností, jak je získat, je zcela analogická jako v případě aproximace po částech lineárními funkcemi. Funkci *2i, i = 0,..., n, sestrojíme tak, že uzlový parametr, který udává funkční hodnotu v i-tém uzlu, položíme rovný jedné a všechny ostatní uzlové parametry položíme rovny nule; u funkcí *2i+i. i = 0,..., n, to provedeme obráceně v tom smyslu, že uzlový parametr, který udává hodnotu první derivace v í-tém uzlu, položíme rovný jedné a všechny ostatní uzlové parametry rovny nule. Abychom mohli takto vzniklé bázové funkce snadno zapsat, položme (4.100) tpB(x) f 0, 1 - 3x2 - 2x3, l-3x2 + 2x3, 1.0, x ú -1, -líiíO, Oíií 1 1 < x 233 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 4 VARIAČNÍ METODY (4.101) o, x + 2x2 + i3, 2x2 0, * á -1. -líiíO, 0 g Z g 1, 1 < x. Funkce 9?o je tedy v bodě nula rovna jedné a má tam nulovou derivaci a ve všech ostatních bodech o celočíselných souřadnicích je spolu se svou první derivací rovna nule. U funkce ipi Je oproti funkci ipo role funkčních hodnot a hodnot první derivace obrácená. Užijeme-li právě zavedené funkce, jsou bázové funkce $j dány jednoduchými vzorci (4.102) «M*): *2i+l(z) : $2n, $2n+i, dostaneme prostor konečných prvků který je podprostorem prostoru & = Jt?a2 těch funkcí ze Sobolevova prostoru Jť2, které splňují okrajové podmínky (4.39). Užijeme-li tuto bázi k přibližnému řešení okrajové úlohy čtvrtého řádu (3.206), (4.39), bude matice příslušné soustavy lineárních rovnic pásová se sedmi nenulovými diagonálami, neboť z toho, že každá bázová funkce $2>, $2í+i je různá od nuly pouze v intervalu {asj-i, x;+i), plyne, že platí [<řj, <ř,-] = 0 pro ji — j\ § 4. Prostor konečných prvků %3 lze užít i k řešení úloh druhého řádu, neboť podmínka, aby byl podprostorem prostoru Jť1, je samozřejmě splněna. V tomto případě plyne ze vzorců (4.61) a (4.87), že za předpokladu dostatečné hladkosti řešení lze dosáhnout rychlosti konvergence měřené v normě prostoru Jť1 až 0(h3). Cena, která se za to zaplatí, je však ta, že matice soustavy (4.53) je nyní sedmidiagonální a je zhruba dvojnásobného řádu než v případě prostoru Při konstrukci báze v prostoru &hk při obecném k lze postupovat obdobně. Za bázi lze vzít soustavu funkcí <řo, ■ ■ ■, ^A(n4-i)-i> z nichž každá vznikne tak, že je pro ni právě jeden z uzlových parametrů rovný jedné a ostatní jsou rovny nule. Je-li funkce tpj (j = 0.....k — l) rovna v intervalu (-1,0) a v intervalu (0,1) polynomu (2k — l)-ního stupně (v každém intervalu jinému) určenému podmínkami ^'(O) = = 1, pjr)(0) = 0 pro r = 0,..., k - 1, r =/4 j a (±l) = 0 pro r = 0,..., k - 1 a všude jinde na reálné ose je rovna nule, jsou bázové funkce <&,- dány vzorci 00/ (4.103) (*) = i = 0,1, i = 0, Vypustíme-li v soustavě bázových funkcí (4.103) funkce <řo, ■ ■ ■, ^t-i a funkce $„it,..., $(n+i)je-i, dostaneme prostor konečných prvků ^jy,, který je podprostorem těch funkcí ze Sobolevova prostoru Jťk, které splňují okrajové podmínky 234 (4.43) s m = Jfc. Tento prostor je tedy vhodný k přibližnému řešení diferenciální rovníce (4.45) s okrajovými podmínkami (4.43). Prostor konečných prvků f8\t lze také užít k řešení okrajových úloh pro diferenciální rovnice řádů nižších než 2k. Vhodnou volbou parametru k (tj. stupně aproximačních polynomů) lze dosáhnout, že rychlost konvergence je řádu 0(/V), kde p je libovolně vysoké číslo (samozřejmě za předpokladu dostatečné hladkosti řešení). Tento vzrůst v přesnosti je však zaplacen komplikovanější strukturou matice soustavy (šíře jejího pásu je větší) a větší počtem rovnic. 4.3.3 Některé praktické otázky spojené s metodou koneĚných prvků V předchozích odstavcích jsme popsali základní myšlenky užití metody konečných prvků k řešení okrajových úloh pro obyčejné diferenciální rovnice. Zde si všimneme některých aspektů praktické realizace popsaných algoritmů. Pro určitost budeme mít v tomto odstavci na mysli diferenciální rovnici (1.12) s okrajovými podmínkami (4.3), protože i na tomto jednoduchém příkladě budou patrné všechny jevy, které jsou důležité a podstatné v obecném případě. Při řešení dané okrajové úlohy metodou konečných prvků musíme vždy provést čtyři kroky: (i) zvolit prostor konečných prvků a jeho bázi, (ii) sestavit příslušnou matici tuhosti (Gramovú matici) a vektor zatížení, (iii) řešit vzniklou soustavu rovnic a (iv) vypočítat hodnoty přibližného řešení v bodech, v nichž nás zajímá. Začneme bodem (iv) jako nejsnazším. Už dříve jsme konstatovali, že báze v prostorech konečných prvků je žádoucí volit tak, aby aspoň některé neznámé, které dostaneme řešením soustavy z bodu (iii), byly už přímo hodnoty hledaného řešení. Pokud tento požadavek splníme — v případech prostorů konečných prvků, které jsme uvedli, tomu tak vždy bylo — krok (iv) vlastně odpadá. Poznamenejme, že v některých případech nás zajímají spíše hodnoty některých derivací hledaného řešení než hodnoty samotného řešení. V tomto případě může být užít! Hermíto-vých prvků výhodné, protože při něm část vypočítaných neznámých udává přímo hodnoty derivací řešení. Probereme nyní body (i) až (iii). Pokud se týká bodu (i), k problematice volby prostoru konečných prvků se dá říci obecně jen velmi málo. Udat nějaká matematicky podložená exaktní kritéria, která by udávala, jaký konkrétní prostor konečných prvků v daném případě zvolit, je obtížné. Zkušenost s řešením problémů podobného typu zde může být velmi užitečná. Zdůrazněme, že při volbě báze v už zvoleném prostoru konečných prvků je třeba postupovat tak, aby vzniklá matice tuhosti měla co možná nejmenší šíři pásu. Tento požadavek je pro ekonomii výpočtu natolik důležitý, že může ovlivnit zpětně i volbu samotného prostoru konečných prvků. Všimněme si dále bodu (ii), tj. problematiky sestavení matice tuhosti a vektoru zatížení. Pro určitost zvolme za příslušný prostor konečných prvků prostor ®£i z odst. 4.3.1 s bází tvořenou po částech lineárními funkcemi <řj,..., definovanými rovnicemi (4.83). Píšeme-li v případě modelové úlohy integrál udávající prvky 235 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY matice tuhosti A jako součet integrálů přes jednotlivé intervaly dělení, dostaneme (4.104) °ij = Í2a = í T \p(x)9'i(x)^'j(x) + q(x)^i(x)^j(x)]dx, r=l,...,n. Matici A^ = \a\ý) nazveme elementární maticí tuhosti příslušnou k podintervalu (acr-ii xr). Pro vektor zatížení (tj. pro pravou stranu soustavy (4.53)) platí podobně (4.106) kde (4.107) g\r) = í ' *.-(*)/0Od ,(0 I, r — 1, -.,fi, přičemž vektor - (g^\ ..., g„li)T nazveme elementárním vektorem zatížení pro podinterval (xr-i,xr). Prvky matice tuhosti a složky vektoru zatížení můžeme tedy vypočítat jako součet příspěvků od jednotlivých podintervalu rozkladu. Tato okolnost, přestože je zcela elementární, má pro efektivní užití metody konečných prvků zásadní význam. Vzhledem k tomu, že bázové funkce se na jednotlivých prvcích rovnají jen několika málo velmi jednoduchým funkcím (ve všech příkladech prostorů konečných prvků, které jsme uvedli, jsou tyto funkce polynomy nízkých stupňů), je možné sestrojit matici A a vektor g tak, že se v podstatě vypočítá elementární matice A (r) a elementární vektor g(r' jen pro typický prvek a pak se užijí vzorce (4.104) a (4.106). V našem konkrétním případě je každá bázová funkce na podintervalu {xr-i,Xr) rovna buď přímce (x — xr)/h, nebo přímce (xr — x)/h, nebo je nulová. K sestavení elementární matice tuhosti je tedy třeba vypočítat integrály pouze tří typů: (4.108) £ [±TP(x) + „(x)(X^^-)2}dx = = h j |^p(arr_i + hs) + g(av-1 + h«)«2] ds, (4.109) jf" [ - ±M + »(»)' 'I''1 XrHX]Ax = = h j [ - -^p(xr-i + hs) + q(xT-1 + hs)s(l - *)j d« 236 CVIČENI (4.110) jí" [^PÍx) + g(x)(X^y]dx = - h j [jjP(xr - hs) + q(xr - hs)s2^ d s. Podobně k výpočtu elementárního zatížení je třeba počítat pouze integrál (4.111) / ' f(x)X~Xr~i dx = h í f(xr-i-rhs)sds Ar_, h Ja a integrál (4.112) / ' /(x)1—^- dx = h í f(xr-hs)sds. Jxr-i h Jo Pravé strany vzorců (4.108) až (4.112) ukazují, že výpočet prvků elementární matice tuhosti a elementárního vektoru zatížení, se vlastně provádí na referenčním prvku (0,1). Upozorněme také, že integrály uvedených typů nelze v obecném případě počítat analyticky. K jejich výpočtu je tedy třeba užít kvadraturu! vzorce. Přitom je třeba si uvědomit, že tento postup zavádí do výpočtu další chybu. Provedení kroku (iii) nepředstavuje při užití metody konečných prvků k řešení jednodimenzionálních problémů principiálně žádný příliš závažný problém. Vzniklé soustavy rovnic totiž mají pásové matice, jejichž šíře pásu nezávisí na počtu rovnic. Užijeme-li k řešení takových soustav Gaussovu eliminaci bez výběru hlavního prvku (a to je možné, neboť příslušné matice jsou pozitivně defínitní), je počet potřebných operací úměrný počtu rovnic. Z tohoto důvodu nelze očekávat, že by některá iterační metoda mohla být výhodnější než eliminační metoda. CVIČENÍ 1. Odvoďte rovnici (2.48) tak, že napíšete obecné řešení rovnice (1.12), jednu konstantu vyloučíte 7. podmínky (2.45) a druhou derivováním. 2. Dokažte lemma 2.3 (viz str. 136). 3. Dokažte implikaci (2.73). 4. Ukažte, že (2.79) je nutná a postačující podmínka řešitelnosti okrajové úlohy (2.77), (2.78). 5. Dokažte podrobně větu 2.3 (viz str. 139). 6. Ukažte, že okrajové úlohy (2.21), (1.5) a (2.96), (2.97) jsou ekvivalentní. 7. Dokažte ekvivalenci okrajových úloh (2.21), (1.6), (2.100) a (2.101), (2.102). 8. Proveďte podrobný důkaz věty 2.5 ze str. 145. 237 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY 9. Dokažte lemma 3.8 (viz str. 168) 10. Odvoďte řády chyb kvadraturních vzorců (3.51), (3.52) a (3.53) užitých v Mar-čukově identitě a zformulujte potřebné hladkostní požadavky, 11. Proveďte podrobný důkaz poznámky 3.1 (viz str. 178). 12. Dokažte princip maxima pro operátor ř.^0' definovaný rovnicí (3.25). 13. Prověřte monotónnost matice soustavy (3.31). Návod: Užijte výsledku cvičení 12. 14. Dokažte konvergenci metody sítí (3,31). Návod: Postupujte obdobně jako při důkazu věty 3.7 na str. 179. 15. Buď íj = (rjo,..., r)n)T vektor, pro kteTý platí r]o = rjn = 0. Dokažte, že platí nerovnosti n—l n h2 Yl(Lhrl)*1í ž Po YsiV* - Vt-i)2 1 ™ Návod: Postupujte analogicky jako v důkazu lemmat 3.11 a 3.12 na str, 184 až 186. 16. Dokažte, že metoda sítí (3.131) má v případě řešení okrajové úlohy (1.12), (1.13) s tx\ — ct2 = 0 chybu řádu 0(n4). Návod: Ukažte, že operátor definovaný levou stranou rovnic (3.131) splňuje princip maxima. 17. Zformulujte metodu sítí pro řešení diferenciální rovnice (1.14) s okrajovými podmínkami y(a) = -fa, y"(a) = íi, y(b) = j2, y" = S2. 18. Dokažte konvergenci metody sítí z předešlého cvičení. 19. Ukažte, že operátor L definovaný na množině &i_ C %2 rovnicí (4.40) je symetrický a pozitivně definitní. 20. Dokažte symetrii a pozitivní definitnost operátoru L daného rovnicí (4.45) na množině SIL dostatečně hladkých funkcí, které splňují okrajové podmínky (4.43). Návod: Vyjádřete y(x) pomocí integrálu z m-té derivace. 238 POZNÁMKY K LITERATUŘE POZNÁMKY K LITERATUŘE ČI. 1. Základy teorie okrajových úloh pro obyčejné diferenciální rovnice lze nalézt např. v knize Reidově (1971) a v řadě dalších standardních příruček o obyčejných diferenciálních rovnicích (viz např. Coddington, Levinson (1955)). Literatura pojednávající o numerických aspektech této problematiky je skoro stejně rozsáhlá jako literatura o úlohách s počátečními podmínkami. Kromě příslušných kapitol v obecných příručkách o numerické matematice, viz např. Collatz (1951), Babuška, Práger, Vitásek (1964), Berezin, Zidkov (1966), Babuška, Práger, Vitásek (1966), Stoer, Bulirsch (1973), Vitásek (1987), existuje řada monografií věnovaných této problematice. V seznamu literatury se tato díla poznají většinou už podle názvu; proto uvedeme jmenovitě pouze sborník redigovaný Azizem (1975), protože obsahuje velmi obsáhlou bibliografii. ___ Cl. 2. O metodě střelby pojednává už např. (Foiti(1957) 33eJler/(1960). Metoda střelby na více cílů pochází od Odborná (1969) a spolu s ostatními variantami metody střelby ji podrobně popisuje Stoer a Bulirs£h^(1980). ŘsljCTÍsora^SJÚ£rnan^ova (1972) monografie je věnována výhradne metodě střelby. Metoda přesunu a normalizovaného přesunu okrajové podmínky v podobě, jak ji uvádíme, pochází od Taufera (1973). Tyto metody velice úzce souvisí s metodami invariantního vnoření," kterým je věnována poměrně rozsáhlá literatura; viz např. Meye^ (1973) a,jä£ajyt_ (1977). V ruské literatuře se podobné metody nazývají „metod progonki" (viz např. Babuška, Práger, Vitásek (1964)). Cl. 3. Metoda sítí patří k základním metodám pro numerické řešení okrajových úloh a aspoň její princip je vyložen ve většině příruček zabývajících se přibližným řešením diferenciálních rovnic. O monotónních maticích, jakož i o dalších důležitých třídách matic, které vznikají při metodě sítí, nalezne čtenář poučení např. v knize Vargově (1962) a Fiedlerově (1981). Myšlenka užití integrálních identit k sestavení diferenčních schémat pochází od Marčuka (1961) a byla dále rozpracována Babuš-kou, Prágerem a Vitáskem (1966) a Marčukem (1980). Jiné integrální identity než ty, které jsou zde uvedeny, užívá Varga (1962). Mnoho materiálu o metodě sítí lze nalézt v obsáhlé monografii Samařského (1971). Velmi přístupný výklad o řešení nelineárních úloh metodou sítí podává Isaacson a Keller (1966). Cl. 4. Teoretický základ, na němž spočívají variační metody řešení okrajových úloh, je podrobně a hlavně také s ohledem na čtenáře nespecialistu vyložen v knize Rektorysově (1974). Nezbytná funkcionálně-analytická teorie okrajových úloh pro obyčejné i parciální diferenciální rovnice je vyložena také v knize Strangově a Fixově (1973) , kterou lze čtenáři, který chce hlouběji proniknout do teorie metody konečných prvků, co nejvřeleji doporučit. Rovněž tak Michlinovy knihy (1957 a 1966) mohou být pro čtenáře, který se zajímá o problematiku tohoto článku, velmi užitečné. Metoda konečných prvků prodělala v posledním dvacetiletí bouřlivý rozvoj a v současné době je jí věnována už značně rozsáhlá literatura. Protože však její hlavní uplatněn! je zejména při řešení parciálních diferenciálních rovnic, uvedeme hlavní prameny pro její studium v následující kapitole a zde se zmíníme jen o ně- 239 II. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE - OKRAJOVÉ ÚLOHY kterých příručkách, které obsahují elementární úvod do této problematiky. Takový přístupný výklad se nalezne kromě v už zmíněné knize Strangově a Fixově (1973), např. také v knize Stoerově a Bulirschově (1980), Beckerově, Careyově a Odenově (1981), která uvádí čtenáře také do problémů spojených s implementací metody konečných prvků na počítači a v knize Axelssonově a Barkerově (1984). LITERATURA AXELSSON, O. BARKER, V.A.: Finite Element Solution of Boundary Value Problems, Theory and Computation. New York-San Francisco-London, Academic Press 1984. AZIZ, A.K., ed.: Numerical Solution fo Boundary Value Problems for Ordinary Differential Equations. New York-San Francisco-London, Academic Press 1975. BABUSKA, I. - PRÄGER, M. - VITÄSEK, E.: Numerické řešení diferenciálních rovnic. Praha, SNTL 1964. BABUSKA, I. - PRÄGER, M. - VITÄSEK, E.: Numerical Processes in Differential Equations. London-New York-Sydney, Interscience Publishers 1966 (Překlad do ruštiny: Moskva, Mir 1969 ). BAILEY, P.B. - SHAMPINE, L.F. - WALTMAN, P.E.: Nonlinear Two Point Boundary Value Problem. New York, Academic Press 1968. BECKER, E.D. - CAREY, G.F. ODEN, I.T.: Finite Elements. An Introduction, Vol. I. Englewood Cliffs, N.J., Prentice-Hall 1981. BEREZIN, I.S. - ŽIDKOV, N.P.: Metody vyčislenij. 3. vyd. Moskva, Nauka 1966, 2 sv. CODDINGTON, E.A. - LEVINSON, N.: Theory of Ordinary Differential Equations. New York, McGraw-Hill 1955. (Překlad do ruštiny: Moskva, IL 1958.) COLLATZ, L.: Numerische Behandlung von Differentialgleichungen. Berlin-Göttingen-Heidelberg, Springer-Verlag 1951. (Překlad do ruštiny: Moskva, IL 1953.) FIEDLER, M.: Speciální matice a jejich použití v numerické matematice. Praha, SNTL 1981. -——FOX, L.: The Numerical Solution of Two Point Boundary Value Problems. Oxford, Clarendon Press 1957. v-l\ ISAACSON, E. - KELLER, H.B.: Analysis of Numerical Methods. New York-London-Sydney, J. Wiley and Sons 1966. "^KELLER, H.B.: Numerical Methods for Two Point Boundary Value Problems. Waltham, Mass., Blaisdell 1968. MARCUK, G.I.: Metody rasčota jaderných reaktorov. Moskva, Gosatomizdat 1961. MARCUK, G.I.: Metody vycislitel'noj matematiky. 2 vyd. Moskva, Nauka 1980. (Překlad do češtiny: Praha, Academia 1987.) LITERATURA \ —MEYER, G.H.: Initial Value Methods for Boundary Value Problems: Theory and Application of Invariant Imbedding. New York, Academic Press 1973. MICHLIN, S.G.: Variacionnyje metody v matematičeskoj fizike. Moskva, Gostechiz-dat 1957. MICHLIN, S.G.: Cislennaja realizacija variacionnych metodov. Moskva, Nauka 1966. ."-"--OSBORNE, M.R.: On Shooting Methods for Boundary Value Problems. J. Math. Anal. Appl., 27, 1969, s. 417 - 433. REID, W.T.: Ordinary Differential Equations. New York-London-Sydney-Toronto, Interscience Publishers 1971. REKTORYS, K.: Variační metody v inženýrských problémech a v problémech matematické fyziky. Praha, SNTL 1974. ROBERTS, S.M. - SHIPMAN, I.S.: Two Point Boundary Value Problems: Shooting Methods. New York, American Elsevier 1972. 1 íťt6t>& é-^A.~'-^x,. ^ SAMARSKIJ, A.A.: Vvedenije v teoriju raznostnych schem. Moskva, Nauka 1971. " ' SCOTT, M.R.: Invariant Imbedding and its Applications for Ordinary Differential Equations: An Introduction. Reeding, Mass., Addision-Wesley 1977. ^STOER, J. - BULIRSCH, R.: Introduction to Numerical Analysis. New York-Heidelberg-Berlin, Springer-Verlag 1980. / - * STRANG, G. - FIX, G.J.: An Analysis of the Finite Element Method. Englewood Cliffs, N.J., Prentice-Hall 1973. (Překlad do ruštiny: Moskva, Mir 1977.) TAUFER, J.: Lösung der Randwertprobleme von linearen Differentialgleichungen. Praha, Rozpravy ČSAV, Rada mat. přír. věd, 83, Academia 1973. (Překlad do ruštiny: Moskva, Nauka 1981.) -VITÄSEK, E.: Numerické metody. Praha, SNTL 1987, VARGA, R.S.: Matrix Iterative Analysis. Englewood Cliffs, N.J., Prentice-Hall 1962. WILKINSON, J.H.: The Algebraic Eigenvalue Problem. Oxford, Clarendon Press 1965. 240 241 Kapitola III. Parciální diferenciální rovnice eliptického typu 1 Úvod Základní úloha pro parciální diferenciální rovnici eliptického typu je okrajová úloha, tj. úloha při níž je třeba nalézt funkci, která splňuje uvnitř dané oblasti danou diferenciální rovnici a na celé hranici této oblasti ještě další doplňující podmínky, zvané okrajové podmínky. Typickým příkladem okrajové úlohy pro eliptickou lineární parciální diferenciální rovnici druhého řádu je úloha nalézt funkci u (m reálných proměnných x = (xi,.. .,xm)), která v dané omezené oblasti Í2 C Em (Em je m-dimenzionální euklidovský prostor) splňuje diferenciální rovnicí (1.1) a pro niž na hranici T této oblasti platí (1.2) . . du .. . , . Zde a,ij = dji, q a / jsou funkce zadané v oblasti fž, funkce a, /? a 7 na její hranici a symbol du/9nc značí derivaci ve směru tzv. konormály a je definován rovnicí (1.3) du kde cos(i>, Xj) je kosinus úhlu, který svírá vnější normála k hranici v příslušném bodě s osou Xj. Eliptičnost diferenciální rovnice (1.1) je charakterizována zpravidla nerovností (1.4) i,j = l i=l kde jpo je předem daná kladná konstanta a £ — (íi,... íím)*" je libovolný m-dimenzionální vektor. Platnost nerovnosti (14) se přitom požaduje pro každý bod x e fí. 242 1 ÚVOD O koeficientech aa^v okrajové podmínce se většinou předpokládá, že splňují nerovnosti (1.5) a(x) ž 0, /?(x) ž 0, . a(x) + /?(x) > 0. V případě, že je III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU k jednoznačnému řešení zapotřebí dvou okrajových podmínek; za příklad mohou sloužit okrajové podmínky u = <ři(x) a du/dn = Qí{x) pro x£í, které jsou v jistém smyslu obdobou Dirichletových okrajových podmínek pro rovnici druhého rádu. Jako příklad eliptické soustavy diferenciálních rovnic druhého řádu mohou sloužit v dvoudimenzionálním případě rovnice d fduľ du2\ 92«i dV d /duí du2\ d2u2 d2u2 _ r , . které se vyskytují v matematické teorii pružnosti. Z metod pro přibližné řešení eliptických parciálních diferenciálních rovnic si zde všimneme dvou základních skupin. Především to budou metody založené na aproximaci derivací diferenčními podíly. Nahradíme-li všechny derivace, které se v rovnici vyskytují, těmito podíly, dostaneme metodu sítí, ponecháme-li derivace podle jedné z proměnných a pouze derivace podle zbývajících proměnných nahradíme diferenčními podíly, dostaneme metodu, jejíž běžný název je metoda přímek. V této metodě se tedy řešení dané okrajové úlohy aproximuje okrajovou úlohou pro soustavu obyčejných diferenciálních rovnic. Metodou přímek se nebudeme v dalším detailně zabývat, pokládáme však za užitečné, aby se čtenář seznámil aspoň s její základní myšlenkou. Další skupina metod, jichž si také stručně všimneme, je tvořena variačními metodami založenými na stejném principu jako metody v čl. 4 z kap. II. Zde je důležitý zejména speciální případ, totiž metoda konečných prvků. Je užitečné upozornit, že metody všech zmíněných skupin spolu úzce souvisí. Tak např. metoda přímek přechází ve variantu metody sítí, řešíme-li aproximující soustavu obyčejných diferenciálních rovnic znovu metodou sítí. Podobně metoda konečných prvků při určité volbě bázových funkcí přechází v metodu sítí. Pokud jde o konkrétní realizaci zmíněných metod na počítači, má zde podstatný význam rychlost a kapacita paměti stroje. Současný stav je takový, že řada trojdi-menzionálních úloh přesahuje praktické možnosti. Proto se v této kapitole, v níž si postupně všimneme zmíněných metod, omezíme na dvoudimenzionální a lineární problémy. Přitom budeme také věnovat pozornost problematice řešení náhradního problému, který aproximuje původní problém. Pokud jde o nelineární úlohy, nebudeme se jimi zabývat, neboť tyto problémy přinášejí často už i teoretické těžkosti při důkazu existence a jednoznačnosti řešení a je nutno většinou vyšetřovat každý případ jednotlivě. Jejich byť jen částečné pojednání by tedy neúnosně zvětšilo rozsah příručky. 2 METODA SlTl 2 Metoda sítí Metoda sítí je velmi oblíbená metoda pro numerické řešení nejen parciálních diferenciálních rovnic eliptického typu, ale parciálních diferenciálních rovnic vůbec. Popularita metody konečných prvků, která v současnosti stále roste, její význam v poslední době sice poněkud zmenšila, přesto však řada důležitých fyzikálních a technických problémů, které vedou na parciální diferenciální rovnice, se dodnes pomocí ní řeší. Oblíbenost metody sítí má zřejmě své kořeny v tom, že její základní myšlenka je velice prostá. Spočívá v tom, jak už bylo ostatně řečeno v čl. 3 z kap. II. a v úvodu k této kapitole, že v oblasti, ve které hledáme řešení, zvolíme nějakou konečnou množinu bodů, kterou nazveme sítí a příslušné body jejími uzly, a nahradíme derivace, které se vyskytují v dané diferenciální rovnici a v jejích okrajových podmínkách, diferenčními podíly (tj. lineárními kombinacemi funkčních hodnot), které je aproximují. Tím dostaneme místo původního problému soustavu konečně mnoha rovnic pro hodnoty hledané funkce v uzlech. Zde se hned setkáváme s podstatnou odchylkou od jednodimenzionálního případu. Zatímco v jedné dimenzi bylo možno volit uzly v podstatě pouze dvěma způsoby, a to ekvidistantní a ne-ekvidistantní, ve dvou- a vícedimenzionálním případě i při zachování pravidelnosti v rozmístění uzlů je zřejmě možná podstatně větší rozmanitost. Tak např. v rovině lze vzít za uzly sítě vrcholy čtverců, rovnostranných trojúhelníků, pravidelných šestiúhelníků apod. Z uvedeného výkladu je vidět, že metoda sítí je v principu použitelná pro libovolný typ diferenciální rovnice, ať už lineární nebo nelineární. V dalším textu se však z důvodů, o nichž jsme se zmínili v úvodu, omezíme na některé příklady lineárních dvoudimenzionálních problémů. 2.1 Lineární rovnice druhého řádu 2.2.1 Sestavení diferenčních rovnic V tomto odstavci popíšeme různé možnosti odvození diferenčních rovnic pro lineární rovnice druhého řádu ve dvou prostorových proměnných. Většinou se přitom omezíme na speciální případ lineární samoadjungované rovnice, totiž na rovnici í2-1) Lu = ~í(p(x'y)ii:) ~ ^(rt*>¥)Sj) += /(*.») v omezené oblasti fí, jejíž hranice ľ je tvořena konečným počtem po částech hladkých oblouků. O funkcích p, q a / budeme přitom předpokládat, že jsou dostatečně hladké v nějaké oblasti Q takové, že pro ni platí Q C ň (pruhem značíme uzávěr příslušné množiny), a navíc, že koeficient p je v této oblasti kladný a koeficient q nezáporný. O jaký konkrétní stupeň hladkosti jde, bude v jednotlivých situacích buď specifikováno, nebo to bude patrné ze souvislosti. 244 245 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU Podrobně probereme zejména případ pravidelné čtvercové sítě JfW. Tato síť vznikne tak, že se sestrojí soustava rovnoběžek a; — xk — Xa + kh, y = y, = J/o + + sh, k,s = 0, ±1,±2,kde (xo,yo) je libovolný pevně zvolený bod v rovine [x,y) a h > 0 je parametr zvaný integrační krok nebo oko síti, a za uzly sítě se vezmou všechny průsečíky těchto rovnoběžek, tj. body o souřadnicích (xk,ys) = = (xc + kh,y0 + sh). Při zavádění metody sítí v jednodimenzionálním případě jsme postupovali tak, že v uzlech, které ležely uvnitř daného intervalu, jsme příslušné lineární rovnice získali z dané diferenciální rovnice a v krajních bodech jsme využili okrajové podmínky. Totéž je třeba provést i ve dvou dimenzích. Abychom mohli příslušný postup snadno popsat, zavedeme nejprve několik pojmů a označení. Uzly sítě budeme značit buď jejich souřadnicemi, tj. (xk,ys), nebo také, zejména tam, kde na konkrétních hodnotách souřadnic nezáleží, pouhými velkými písmeny. Dva uzly sítě nazveme sousedními, je-li jejich vzdálenost ve směru osy x nebo ve směru osy y rovna oku sítě h. Každý pevně zvolený uzel sítě má tedy právě čtyři sousední uzly. Uzel (xt, y3) nazveme vnitřním uzlem sítě vzhledem k množině íi, leží-li všechny čtyři k němu sousední uzly v množině Q. Množinu všech vnitřních uzlů (vzhledem k množině Q) označíme fiCO. Uzel (xlíSt) € £J\fiW takový, že aspoň jeden jeho soused je vnitřním uzlem, nazveme hraničním uzlem. Množinu všech hraničních uzlů označíme ľ(h\ Kromě toho budeme pro množinu £)(*) U rW užívat označení ílW. Dále budeme předpokládat, že integrační krok h je zvolen tak malý, že ke každým dvěma vnitřním uzlům P a Q existuje konečná posloupnost vnitrních uzlů Po, Pl, - ■ ■, Pr taková, že Pq = P, Pr = Q a libovolné dva uzly P,_i a P,- jsou sousední. To je vzhledem k souvislosti množiny fi možné. O této souvislosti budeme mluvit jako o souvislosti množiny fiC1). Nyní už můžeme snadno sestavit diferenční rovnice, které aproximují diferenciální rovnici (2.1). Proveďme v rovnici (2.1) naznačené derivování a nahraďme derivace d2u/dx2, d2u/dy2, du/dx a du/dy podíly [u(xk — h,ys) — 2u(xt,ys) + + v(xk + h,y„)]/h2, [u{xk,ys - h) - 2u(xk,ys) + u(xk,yt + h)]/h2, [u(xk+h,ys) -— u(xk — h,y,)]/(2h), [u(xk,y, + h) — u(xk,y, — h)]/(2h), které aproximují příslušné derivace s přesností 0(fcs). Dostaneme tak operátor LJ^, který funkci u definované na množině fi^1' (tedy vlastně vektoru, který má tolik složek, kolik prvků má množina ň^) přiřazuje funkci L^u definovanou na množině fiW a který je dán předpisem (2.2) fc^i^ti)*, = [4p(xk, y.) + h2q(xk, y,)]ukt- - [p(äSr, y.) + í/«)]u*+i,<- &p - \p{*i,,y.) - ?hfa(x>"!*»)]«*-!,*- - b>{xk, y,) + \h—(xk,y,))uki$+í- - bim,!/.) - 3*3£v**> »*)]°m-ii (■«■■ y>)e qW 246 2 METODA SlTl Všimněme si, že operátor definovaný touto rovnicí svazuje funkce u v uzlu (xk,ys) a ve všech jeho sousedech. Zavedení pojmu sousedního uzlu bylo touto skutečností motivováno. Z Taylorova vzorce ihned plyne následující věta popisující aproximační vlastnosti operátoru . Věta 2.1. Nechť funkce p má v Ú spojité první parciální derivace podle obou proměnných a nechť funkce q je v Q spojitá. Nechť dále funkce u má v ČI spojité parciální derivace podle x a y až do Čtvrtého řádu včetně. Pak platí (2.3) (LÍ%^)k, ={Lu){xk,ys) + 0(h\ (*»,»,) e Í.M kde «(pr) je funkce definovaná na množině ú^h~> předpisem ukp^ = u(xk, y,) a operátor L je definovaný v rovnici (2.1). Položíme-li p(x, y)(du/dx) — z(x. y), aproximujeme-h derivaci d(p(x,y)du/8x)/ /dx = dz(x,y)/dx v uzlu (xk,y,) podílem [z(xk + h/2,y,) - z(xk - h/2,y,)]/h a hodnotu funkce z, tj. hodnotu funkce p(du/dx) v bodě (xk -řh/2,ys), resp. (xk — - h/2,y,) podílemp(xk + h/2)[u(xk + h, yt) - u(xk,y,)]/h, resp. podílem p(xk -—h/2,ys)[u(xk,ys)—u(xk—h, ys)]/h a provedeme-li analogické operace i pro derivaci padle proměnné y, dostaneme operátor LJ^ definovaný rovnicí (2.4) h2(L{2)u)k,~ [p(xk + h/2,y,)-rp(xk-h/2,y,)+ + P(xk,ys +h/2} + p(xk,y, -h/2)-rh2q(xk,yí)]u*,--p(xk + h/2,ys)uk+ltB -p(xk - A/2, j/„ )«*_!,,--p{xk,ys + h/2)ukiS+í -p(xk,ys - ft/2)ul>,_i. Aproximační vlastnosti operátoru ' jsou podobné jako aproximační vlastnosti operátoru LJ^ a jsou popsány v následující větě. Věta 2.2. Nechť koeficient p má v Ci spojité parciální derivace až do třetího řádu včetně a nechť koeficient q je v Q spojitý. Pak pro každou funkci u, která má v Ô spojité' parciální derivace až do čtvrtého řádu, platí (2.5) (Lla)uW)k. = (£«)(**,*) + 0(h2), (■», y.) e |J(»), kde uípr' je funkce definovaná na množině fž'*' předpisem u^F^ — u(xk, ys) a L je operátor z rovnice (2.1). Důkaz je podobný důkazu věty 3.3 z kap. II a plyne ihned z Taylorova vzorce. í 21 Operátor svazuje opět hodnoty funkce u v uzlu (xk,ys) a v jeho čtyřech sousedech a splňuje stejně jako operátor princip maxima. Užití operátoru L^ však vede ve spojení s vhodným předpisem okrajových podmínek (o těchto otázkách budeme hovořit v dalším odstavci) k soustavě lineárních algebraických rovnic 247 III. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU se symetrickou maticí. Vzhledem k tomu, že původní diferenciální rovnice je sa-moadjungovaná, je třeba dát operátoru Lf^ přednost před operátorem L^, který vede k soustavě, jejíž matice je pouze „skoro" symetrická (srv. také odst. 3.2.1 v kap. II). Proto také přesně zformulujeme a dokážeme zmíněný princip maxima pouze pro operátor ijj2'. Dříve se však ještě dohodněme, že o integračním kroku, jehož velikost jsme už omezili požadavkem souvislosti množiny Q(h\ budeme navíc předpokládat, že je tak malý, že v případě, že funkce q není v íí identicky rovna nule, existuje uzel (a^, ys) 6 íž 0. To je vzhledem k spojitosti funkce q jistě možné. Lemma 2.1. Nechť funkce p a q jsou spojité v Ú a nechť je p kladná a q nezáporná. Nechť dále u je libovolná funkce definovaná na množině Ú^h\ pro niž platí (2-6) UÍ'Mf š 0 pro každý uzel (xk, ys) 6 fiW Nechť konečně je (2.7) M = max_ iik, a buď M > 0. Pak piati (2.8) M — max uks (*i,í.)er<»> a existuje-li uzel (xt^^h,,) e fi^ takový, že je uÍBl,a = M, je q(x) 0 v Í2 a Uk, = M pro každý uzel (xk,ys) € ÉJW. Důkaz. Při důkazu tohoto tvrzení budeme postupovat stejně jako při důkazu lemmatu 3.9 z kap. II. Předpokládejme tedy, že existuje uzel (xk0,y!o) £ íi^1' takový, že platí uí0ij,, = M. Pak je (2.9) 0 g \p(xk, + A/2, y.0) + p{xia - A/2, y„)+ + P(xka,ys„ + h/2) + p(xk„,ySB - h/2) + h2q(xka,y,0)]M--p{xk0 + h/2,ySo)nk0+íiS„ -p(xkí, - h/2,ySa)uk0-\,So- - p(xk0,ys0 + h/2)ukOi,0+i - p(xko,y80 - h/2)uka,So-i g ^h2q(xk„,y,0)MZG- Protože M je kladné a q(xk0, yao) nezáporné, plyne z nerovnosti (2.9) především, že je q(xk0,y,0) = 0. Kdyby aspoň jedno z čísel «*„_!,,„, wfc„+i,*,„ ti*„,Jo-i, "fc0,s„+i bylo menší než M, platilo by (2.10) 0g [p(^0 + A/2,^J+p(z6o + A/2,^+ + p(xk0,y,0 - A/2) + p(xk„,y,0 + h/2)]M- - p(xk0 - A/2, yBo)uka-ilSo - p{xko + A/2, j/,0)«t0+i,so--p(,xio,ySo - A/2)ui|llJ0_i -p(xka,ysi, + A/2)uS:o,J,n+1 > 0. 248 2 METODA SlTl což není možné. Platí tedy u*0-i,Jo = «t0+i,So = «*n,j„-i ~ «k0,sa+i = M a celou úvahu je možno zopakovat pro uzly Xka-i]So, xk„+i,sa, at„,jn-i a Xk0i,0+i. Protože množina £1^ je souvislá, dostaneme tak postupně, že platí (2.11) q(x*,V.) = 0 pro (a*, j/s) e fiW a (2.12) u*5=M pro (iit,ir,)'eň« Není-li funkce 4 identicky rovna nule, není rovnice (2.11) splněna pro uzel [xk, tfe). Tento spor dokazuje, že v případě, že funkce q není rovna nule identicky, platí uks < < M pro (xk, ys) S fiC1). V tomto případě je tedy lemma dokázáno. V případě, že je q(x) = 0 v Q, však plyne tvrzení lemmatu ihned z (2.12). Při zavedení operátorů LJp a LJ^ jsme postupovali tak, že jsme derivace, které se vyskytují v aproximovaném operátoru nahradili diferenčními podíly. Odtud také pocházejí názvy diferenční meiody a diferenční rovnice, které často v souvislosti s metodou sítí užíváme. Vyskytuje-li se v dané diferenciální rovnici kromě derivací d2u/dx2 a d2u/8y2 i smíšená derivace d2u/(dxdy), lze ji aproximovat pomocí rovnice d2,u 1 (2.13) ^^(;B*'ľJ) ~ 2h2^Xk + h'y' + h) ~ u^Xk ~ h'y' + ^+ + u(xk - h,y, - h) - u(xk + h,ys- A)] + 0(A2). Tuto rovnici dostaneme tak, že položíme z = du/dy, derivaci dz/dx v bodě (xk, ys] aproximujeme podílem [z(xk + h, y,) — z(xk — h, ys)]/(2h) a hodnoty funkce z v bodě (xk+h, ys) a (xk — A, y,), tj. hodnoty derivace du/dy v těchto bodech, podíly [íifzfc-t-+ h,y,+h) — u(xk + h,y, — A)]/(2A) a [u(xh - A,y, + A) - u(xt-h,ys - A)]/(2A). V tomto případě pak vzniklý operátor svazuje hodnoty přibližného řešení nejen v uzlu (xjt.j/.,) a v uzlech (xk+i,ys), (zjt-i, ?/«), (z*, 2/s+i) a (a:*, J/s-i), ale navíc ještě v uzlech (xj,+i,2/>+i), (i*_i, j/j+i), (^it+i, !/í-i) a 2/a_i). Všechny tyto uzly je tedy třeba pokládat za sousedy uzlu (xk, ys). Samozřejmě, že se pak změní množina vnitřních uzlů íl^ i množina hraničních uzlů , neboť obě tyto množiny jsou definovány pomocí pojmu sousedního uzlu. Operátory íjp a lze také sestrojit následujícím postupem, zvaným metoda neurčitých koeficientů. Tento postup je obecnější a je použitelný v podstatě pro libovolnou síť, ať pravidelnou či nepravidelnou. Při tomto postupu stanovíme ke každému uzlu P skupinu uzlů <3,, i = 1,..., rp, které nazveme sousedními k uzlu P. Dále hledáme operátor Lh jako výraz tvaru rp (2.14) (ifc«)i. = ^.r(P,0i)«(<3í)1 (Qo = P), i=i přičemž koeficienty c{JP, Qi) určíme tak, aby Taylorův rozvoj výrazu na pravé straně rovnice (2.14) vzhledem k bodu P souhlasil až na členy vyššího řádu s hodnotou 249 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU daného diferenciálního operátoru v bodě P. Je-li např. diferenciální operátor, který chceme aproximovat, dán rovnicí ,01S, , a2u d2u d2u (2.15) Lu = _au___2ai2— -a21} mají-li uzly Q, souřadnice (xi,jrí) a předpokládáme-li, že uzel P má souřadnice (0, 0) (což zřejmě není na újmu na obecnosti), platí (2.16) u(Q;) _ u(xi,yi) = u(P) + xi^{P) + yi^{P)+ . du . du '' dx2 dxdy takže po dosazení do rovnice (2.14) máme aý (2.17) (tfcU)(P) = (J :(-)U(P) + ^£(P) + ^|(P)-VP^(Pj 2a{P>~rPV kde (2.18) t=0 i=0 4P)=EV"*P> = -l E i=0 í=0 r, r, IE"wC.(p!/•)> (xk,y,+i)> (xk,y,-i), (xt+i,sf,+1), (xí-i,J/»+i), (íc*-i,!/.-i) a (xk+i,ys-i), tj. všechny uzly, které mají od uzlu (xt,ys) vzdálenost menší nebo rovnu číslu 2^2A. Při řešení okrajových úloh pro obyčejné diferenciální rovnice metodou sítí jsme pro sestavování diferenčních rovnic doporučovali také postup opírající se o integrální identity platící pro řešení dané diferenciální rovnice. I zde je analogický postup možný, příslušné identity jsou však formálně podstatně komplikovanější. Jako příklad uveďme takovou identitu pro diferenciální rovnici (2.1). Věta 2.3. Nechť funkce u splňuje v oblasti f! diferenciální rovnici (2.1) a nechť pro uzavřený čtverec Rks o vrcholech (xj,+i, !/,+l)> (zi-i, y»+i), (*t-i,ífc-l)i (xk+i, y>-i) platí Rks C Cl. Pak platí ,„„ ľ'+1 (Q(x*-i,v)u(xk~i,v) Q(zk+i,vM Js.-i Jit.! WS) ří^i - Q(«t, y)u(xtly) [ _\ 4- p,, \ dJ } dlH-j-P(jE,y,-i)u(x,yt-i) P(a,ď.+i)u(g,i/«+i) /•»■ i d« r+'-r^dy / -P(x,y,M«.y,)[r \ d + r„ \ d ]}dx+ 251 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU + Jj[f(z,y)-q(x,y)u(x,y)]P(x,y)Q(z,y)dxdy = + / ry-+i i J7 / —^—«(*,y)dy- 1 /*' 3P(s,y) , v , 1 - r»» i — / —5-u{x,y)Ax dy, kde funkce P a Q jsou definovány vzorci (2.24) P(x,y) Q(x,y) = i J*S-1 f* xk _ x g o:j;+1, !/„_] g i/ g Xk-i í ií ii, í/,-i g s/ g j/s+i, ar*_l g s g xk+u y, g y g li-i g a; g xj,+1, y,_L S y g y,. Důkaz Vynásobíme-li rovnici (2.1) funkcí u definovanou vzorcem (2.25) „(z, j,) = Pi*, ») V) - l(x< V)u(x< y)]v(x,y) dxdy. 252 2 METODA SlTl Abychom dostali identitu (2.23), stačí v rovnici (2.26) dvakrát integrovat per partes a uvědomit si, že funkce definovaná vzorcem (2.25) je rovna nule na hranici čtverce Pjtj a že její derivace mají skoky na úsečkách x = xk, ys-i g y g yj+i a y — ya, xic-i g a; g It+i- Výpočty jsou sice zdlouhavé, ale natolik triviální, že je není třeba podrobně provádět. 2.1.2 Přepis okrajových podmínek a konvergence vzniklých metod V předešlém odstavci jsme ukázali několik možností, jak sestrojit konečnědimen-zionální operátory, které aproximují lineární diferenciální operátory druhého řádu. Z úvah tam provedených se ukázalo rozumné hledat přibližné řešení modelové diferenciální rovnice (2.1) ze soustavy rovnic (2.27) kde operátor je definován rovnicí (2.4). Těchto rovnic je tolik, kolik je vnitřních uzlů, zatímco počet neznámých je roven počtu vnitřních a hraničních uzlů dohromady. K soustavě (2.27) je tedy třeba přidat ještě tolik rovnic, kolik prvků má množina hraničních uzlů , a tyto rovnice je nutno získat z okrajových podmínek. Symbolicky je budeme zapisovat ve tvaru (2.28) (M*. = (AkT)*- (**,y.)er<*>. Zde /fc je operátor, který funkci definované na množině přiřazuje funkcí definovanou na množině T(h\ 7 je pravá strana okrajové podmínky 1.2 a Aj, je operátor, který funkci definované na T přiřazuje funkci definovanou na . Některé způsoby, jak konkrétně sestrojit tyto operátory /j, a A^ ukážeme v tomto odstavci. Začneme Dirichletovou okrajovou podmínkou, tj. podmínkou tvaru (2.29) »(*,!/) = y(z,y), (x,y)eľ. Okrajová podmínka tohoto typu nepředstavovala v jednodimenzionálním případě žádný problém, neboť v hraničních uzlech jsme znali přibližné řešení přesně. Zde tomu obecně tak není, neboť hraniční uzly nemusí ležet na hranici oblasti ú. V každém případě však leží blízko hranice v tom smyslu, že ke každému hraničnímu uzlu existuje bod na hranici oblasti Q, jehož vzdálenost od uvažovaného uzlu je nanejvýš h. Tato skutečnost nabízí elementární způsob přepisu Dirichletových okrajových podmínek, při němž položíme (2.30) (2.31) (/*«)*> = «*» pro (xh,ys)eTw {&hl)ks - v{xk,ys) pro (xh,ys) 6 r(íi>, 253 III. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU kde f je libovolná spojitá a spojitě diferencovatelná funkce v Ô a taková, že pro ni platí (2.32) 0 takové, že platí (2.37) \uk. ~ u(xk,y,)\ g M h pro každé h g ho a pro každý uzel [xk,ys) G Q(hK Důkaz . Položíme-li r]ks = uks — u(xk, y3), existuje za uvedených předpokladů podle věty 2.2 konstanta Ki taková, že platí (2.38) (£]PM** = (^k,y,)en(h\ 254 r 2 METODA SlTl (2.39) \ek,\ g Kih2. Podle (2.30) je (2.40) {k*i)kS = >p{xi,y>)-u{xk,y,), (xk,y,)er™. V důsledku definice hraničních uzlů existuje ke každému uzlu [xk,y,) € bod (ž, y) €: ľ takový, že jeho vzdálenost od uzlu (xk,y,) je nanejvýš h. Protože však funkce u a

, (/^(pr))^ = i + £tJ, (xk,y,)erw, kde z(pr) je funkce definovaná na množině ÍJW předpisem z^f* = z(a;fc, J/S) a (2.46) \ii.\^K2h3, (zi.j/.JeflW léi.lš^, (i,,!/,)erw, Postupem úplně stejným jako v důkazu věty 3.7 z kap. II (viz str. 179) nyní už snadno dokážeme, že existuje konstanta N taková, že pro funkci vks = Nz(xk, ys)h platí (2.47) (LÍ2)v)ks > K.h2 g 1(4*^.1, («»,».) e nW, (Ikv)i. ž Ärfc ž |(/^)t,|, (**,&) e rw: pro každé dostatečně malé h. Z těchto nerovností a z lemmatu 2.2 (srv. také lemma 3.2 z kap. II) však už plyne, že funkce vka majorizuje funkci rjkl. Protože funkce z je za uvedených předpokladů omezená v Í2, plyne odtud tvrzení věty. Poznamenejme, že existence funkce z ve větě požadovaných vlastností není podstatná pro tvrzení této věty a váže se pouze na zvolenou techniku důkazu. Jiným postupem, podstatně však komplikovanějším, by bylo možno dokázat větu 2.4 i bez funkce z. 255 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU Aproximace řešení dané okrajové úlohy získané popsaným postupem tedy konvergují při h —> 0 k přesnému řešení, rychlost konvergence je však obecně pouze 0(h) a chyba může navíc dosti podstatně záviset na charakteru prodloužení funkce 7. Z těchto důvodů se tento postup užívá jen zřídka. Když už je použit, doporučuje se volit množinu O^1' ne striktně tak, jak jsme ji definovali v odst. 2.1.1, ale připustit do ní ještě některé další body ležící v oblasti íí. Příslušné hraniční uzly pak mohou samozřejmě ležet i vně množiny fi, můžeme však dosáhnout toho, že množina r^1' lépe vystihuje hranici T dané oblasti. Následující příklad ukazuje, že to může přinést až překvapivý efekt. Příklad 2.1. Řešme Dirichletův problém pro rovnici Au = 0 na jednotkovém kruhu Q = {(x, y); x2 + y2 < 1} pro okrajovou podmínku 7(cos(?,sin0) = sin40, 0 < 9 g 27T. Přesné řešení této okrajové úlohy je funkce u(x, y) = 4xy(x2 — y2). Protože v tomto případě je d^u/dx4 = diu/dy* = 0, jsou veličiny ej., pro (ij,, ys) £ rovny nule a celková chyba přibližného řešení je způsobena pouze nepřesným splněním okrajových podmínek. Funkci 7 prodloužíme do bodů blízkých k hranici předpisem j?(rcosť', rsinfl) = sin49, 0 < f S 2f s množiny a zvolíme podle obr. 2.1a, 2.1b a 2.1c, v nichž jsou body z rW označeny křížky. Výsledky v bodech, které jsou v obrázcích označeny čísly 1 až 10 jsou uspořádány v tab. 2.1. Pro porovnání jsou uvedeny také hodnoty přesného řešení a hodnoty přibližného řešení s množinou fi'A' zvolenou podle obr. 2.1a a přepisem okrajových podmínek podle Collatze, který bude popsán v dalším textu. Tabulka 2.1 Závislost řešení na volbě hraničních uzlů r 2 METODA SÍTÍ Bod Užitá metoda Přesné řešení Přibližné řešení s přepisem okrajových podmínek dle Collatze a b c 1 0,002 046 0 0,001446 7 0,0018014 0,001639 2 0,0004648 2 0,0204759 0,0144711 0, 018018 2 0,016392 3 0,015 2682 3 0,0722098 0,050 7785 0,063196 7 0,0573731 0,058 8973 4 0,010213 6 0,0072297 0,0090023 0,008196 2 0,0069724 5 0,0715117 0,0506118 0, 063039 0 0,0573731 0,058565 6 6 0.2161745 0,152 2059 0,1901021 0,1721194 0,1772701 7 0,0284809 0,0202160 0,025155 4 0,022 9483 0,0233160 8 0,1643993 0,116 8746 0,145 5464 0,132 7778 0,1365299 9 0,0606202 0,0432254 0,0535307 0,049177 0 0,050 5218 10 0,3094698 0,2215432 0, 273353 2 0,252 4418 0, 2597308 Obr. 21a Speciální volba množiny V(h*> pro příklad 2.1 Obr. 2.1b Speciální volba množiny T^h^ pro příklad 2.1 i v í3 Z důkazu věty 2.4 je zřejmé, že platí-li speciálně rC1' C T, je možno volit funkci z tak, že pro ni platí z(x, y) = 0 pro (x, y) £ T. Tato volba pak umožní brát funkci v ve tvaru JVz(xj.,ys)h? a dokázat tak rychlost konvergence 0(h2). Nepříznivější výsledek, který jsme obdrželi v obecném případě, je tedy způsoben ne dosti přesným předpisem okrajových podmínek. Zároveň je také vidět, že k rychlosti konvergence 0(h2) vede každý takový přepis okrajových podmínek, který nenaruší monotónnost matice vzniklé soustavy a jehož lokální chyba (jak se veličina et, zavedená v dů- 256 257 III. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU Obr. 2.1c Speciální volba množiny ľ^h^ pro příklad 2.1 4\ \\\ _\— TI 1 1 ľvL 1 1 1 JMJJ'b ~ľU rlPi S 3 K — 6 'aA \ \ n III 1 1 1 / ] rJ U -f 1 r J i v i-i \ m M 1 I r M M kazu věty 2.4 nazýva) je nejméně řádu 0(h2). V dalším textu uvedeme dvě takové možnosti. Nejprve popíšeme nejběžnější a nejčastěji používaný přepis Dirichletových okrajových podmínek, který je založen na lineární interpolaci a bývá spojován se jménem Collatzovým. Buď tedy A hraniční uzel. Pak musí existovat aspoň jeden uzel B, který je sousední k uzlu A a který je vnitřní a uzel C", který je sousední k uzlu A a který leží vně oblasti Í2. Uvedené uzly můžeme přitom zřejmě vybrat tak, že leží na přímce, a bez újmy na obecnosti můžeme předpokládat, že tato přímka je rovnoběžná s osou x. Buď dále C průsečík úsečky CA s hranicí Y dané oblasti a položme trh = CA, takže je 0 g c < 1 (viz obr. 2.2a). Nechť konečně u je dostatečně hladká funkce v íl. Položíme-li počátek souřadnic do bodu A a osu x orientujeme kladně ve směru od bodu A k bodu B, je funkce u(A)(A — x)jh + v.{B)xjh Lagrangeovým interpolačním polynomem pro funkci u. Platí tedy (2.48) u(Xiy)-vrA)^-l + u(B)Z+rA a je (2.49) |ru| á M/i2 pro body ležící na úsečce C'B. Speciálně je tedy (pro x ~ —trh v našem souřadném systému) (2.50) u{C) = {í + o-)u{A)-(Tu{B)-rrA. 2 METODA SlTf Obr. 2.2a Přepis Dirichletových okrajových podmínek ť c E B xh 2 h D ah' h ' si Vyjdeme-li z této rovnice, je přirozené definovat operátory l£ a A£ předpisem (2.51) (k°u)A = uA - j^ug a (2.52) (ASt)> - rT^(c). Při Collatzově přepisu okrajových podmínek tedy doplníme soustavu (2,27) rovnicemi typu (2.53) (lhcu)A = y^7(C), které zapíšeme pro každý hraniční uzel. Z lemmatu 2.2 opět plyne, že matice metody sítí dané rovnicemi (2.27), (2.53) je monotónní, takže tato metoda má smysl. Její rychlost konvergence je příznivější než u metody sítí, kdy okrajové podmínky přepisujeme na základě pouhé spojitosti, a je popsána v následující větě, Věta 2.5. Nechť řešeni u diferenciální rovnice (2.1) s okrajovou podmínkou (2.29) existuje a má čtyři spojité parciální derivace v Ci. Nechť dále existuje funkce z vlastnosti popsaných ve větě 2.4. Buďionečně uks řešeni soustavy (2.27), (2.53). Pak existují konstanty M a hB > 0 takové", že pro každý uzel (xk, ys) e fi^ a pro každé h á ho platí (2.54) \uks-u(xk,yc)\^Mh2. Důkaz je přesným opakování důkazu věty 2.4 s tím jediným rozdílem, že pro 258 259 1676 iii. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU 2 METODA SlTl operátor 1^ platí rovnice (2.43) s lepším odhadem (2.55) M á M h2 Tato skutečnost umožňuje brát funkci u*, splňující nerovnosti (2.47) ve tvaru Nz(xk,y,)h2. . Postulování existence funkce z požadovaných vlastností opět není nutné a důmyslnější důkazovou technikou se mu lze vyhnout. Přepis Dirichletových okrajových podmínek založený na lineární interpolaci je tedy z hlediska řádové přesnosti výhodný a ve srovnání s přepisem založeným na spojitosti není o mnoho komplikovanější. Proto se jej v praxi také velice často užívá. Přesto má však podle našeho názoru určité nevýhody. Předně při sestavování rovnic typu (2.53) není v některých případech jasné, jak vybrat směr, v němž máme inter-polovat. Tak např. nastává-li situace jako na obr. 2.2a, můžeme stejně oprávněně jako rovnici (2.53) užít rovnici (2.56) uA - -1-uo = ~y(E), I + t 1 -+- r která svazuje uzly Au D. Kromě toho, už vícekrát jsme zdůraznili, že při diskretiza-ci kteréhokoliv problému je žádoucí zachovat co nejvíce jeho původních vlastností. a jsme v předchozím odstavci sestrojili tak, aby byla kte- Tak např. operátory i^1' zachována platnost principu maxima. Přednost jsme však dali operátoru L^, rý vedl na symetrickou soustavu lineárních rovnic, takže lépe odpovídal tomu, že původní rovnice je samoadjungovaná. Připojíme-li však k rovnicím (2.27) rovnice typu (2.53), je matice takto vzniklé soustavy nesymetrická. Proto se zdá přirozené vyjít sice z myšlenky lineární interpolace, a tím dosáhnout i stejné řádové rychlosti konvergence jako výše, modifikovat však užitý postup tak, abychom získali symetrii matice soustavy pro určení neznámých u)-s. Takový postup nyní popíšeme. Rozlišujme přitom tři případy charakteru hraničního uzlu tak, jak jsou vyznačeny na obr. 2.2a, 2.2b a 2.2c. (a) Charakter hraničního uzlu podle obr. 2.2a: V tomto případě užijeme rovnici (2.57) 1 (A + B l + £r (A + B\ , l + i- fA + D\] )*KC) + ip(^)^, kterou dostaneme užitím rovnice (2.53) vynásobené činitelem (l+k{C) 1 + WČk{C) 1 + B'Ck{C) jejíž lokální chyba je opět 0(h). Postup pro přepis okrajových podmínek obsahujících derivace, který jsme právě popsali, vede (samozřejmě za předpokladu dostatečné hladkosti přesného řešení) k rychlosti konvergence řádu 0(h). Důkaz příslušných tvrzení, jejichž přesnou formulací si snadno provede čtenář sám, je úplně analogický jako důkaz věty 2.4; a proto jej nebudeme detailně provádět. Pokud jde o postupy, pomocí nichž lze 264 2 METODA SÍTl docílit rychlosti konvergence řádu 0(h2), není současná situace plně uspokojivá. Je známa sice řada formulí, pomocí nichž se této rychlosti konvergence dosáhne (je-li např. hranice složená z úseček sítě, vychází se obvykle z faktu, že výraz [u(x + h) — - u(x — h)]/(2h) aproximuje první derivaci s přesností 0(/i2)), univerzální předpis však není v případě obecné křivočaré hranice dosud znám. 2.1.3 Metody zvýšené přesnosti, jiné tvary sítí Zatím jsme při náhradě okrajové úlohy konečnědimenzionálním problémem postupovali tím nejjednodušším způsobem. K aproximaci diferenciálního operátoru jsme totiž používali diferenční operátory svazující hodnoty přibližného řešení v nejmen-ším možném počtu bodů. Použijeme-Ii k této aproximaci více bodů než je nezbytně nutné, dosáhneme přesnější aproximace daného operátoru. Metody, které takto vzniknou, se nazývají metody zvýšené přesnosti. Za příklad takové metody může sloužit náhrada Laplaceova operátoru operátorem Ah definovaným rovnicí (2.21), při níž se dopouštíme chyby řádu 0(h®). Aby celková diskretizační chyba byla rovněž řádu 0(ft6), je třeba i okrajové podmínky aproximovat se zvýšenou přesností. Zde však vznikají obtíže, zejména pak v případě, že hranice je křivočará a že okrajové podmínky obsahují derivace. Obtíže tohoto druhu jsou pro metody zvýšené přesnosti typické a protože otázky s nimi související nejsou dosud uspokojivě řešeny, užívají se tyto metody dosti zřídka. Druhá otázka, které je třeba se alespoň stručně dotknout, je problematika tvarů sítí užívaných pro řešení eliptických parciálních diferenciálních rovnic. Daleko nej-běžnější jsou čtvercové sítě, jimiž jsme se zabývali až dosud. Kromě nich se někdy užívají, zejména v případech speciálních tvarů oblasti íí, jiné pravidelné sítě jako např. trojúhelníkové, šestiúhelníkové apod. Tak např. Poissonovu rovnici (2.70) dx2 + dy2-n*,y), (která je zřejmě speciálním případem diferenciální rovnice (2.1)) lze aproximovat na trojúhelníkové síti znázorněné na obr. 2.5 diferenční rovnicí Obr. 2.5 Trojúhelníková síť 265 III. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU (2.71) ua - i(ug + uc + uo + ub + tip + uq) -= -\h?f(A) - ±k*m(A) s přesností 0(h4) a na šestiúhelníkové síti z obr. 2.6 rovnicí (2.72) uA - Í(iífl 4- uc + uD) = -\h2f{A) s přesností 0(h). Nepravidelné sítě (kosoúhlé, eventuálně křivočaré) se používají nesmírně zřídka; jejich užití může být někdy ospravedlněno zjednodušením diferenčních rovnic. Obr. 2.6 Šestiúhelníková síť 2.2 Lineární rovnice čtvrtého řádu Problematiku užití metody sítí pro řešení okrajových úloh pro diferenciální rovnice vyšších řádů budeme ilustrovat na příkladě biharmonické rovnice (2.73) AA„ S g + 2^+0 = /(■.») ve čtverci O = {(x, g/); 0 < a: < 1, 0 < s < 1} s okrajovými podmínkami (2.74) u(x,y) tf>i(x,y), ■£{x,y) = i(x,y) na hranici ŕ tohoto čtverce (i/ je vnější normála). Sestrojme stejně jako v odst. 2.1 v oblasti fi čtvercovou síť a položme h — 1/n, kde n je přirozené číslo, což zaručí, že hranice ľ splyne s některými vlákny sítě. Protože operátor Lj, definovaný předpisem (2.75) h2(Lh.u)n, = iUk, - ttk+i,s - «it-i,j - uk,i+i - Ujt,»-i 266 2 METODA SlTl ŕ 2") aproximuje Laplaceův operátor —A (jde o speciální případ operátoru í.^ z odst. 2.1), dá se očekávat, že operátor L^Lj, — L2, který je tedy definován rovnicí (2.76) h\ilu)hs = 2Quk, - 8(«i+i,, + ut-i,, + ullJ+i 4- tit,,-i)+ + 2(uj.+iij+i + uj,_ii<+i + m+i,j-i + «*-i,t-i)+ + («ifc+2,ä + «*-2,s + «»,,+2 + "*,j-3)i aproximuje biharmonický operátor. Z následující věty plyne, že tomu tak skutečně je- Veta 2.6. Buď u funkce, která má v nějakém okolí U bodu (x, y) šest spojitých parciálních derivací podle obou proměnných a buď h tak malé, že body (x + h, y), (x-h,y), (x,y+h), x,y—h), (x-rh,y+h), (x-h,y+h), (x+h,y-h), (x-h,y-h), (x + 2h, y), (x — 2h,y), (x, y + 2n) a [x, y — 2h) leží v U. Pak platí (2.77) 20u(x, y) - S[u(x + h, y) + u{x - h, y) + u(x, y + h) + u(x,y - h)]+ + 2[u{x + h,y + h) -f- u(x - h,y + h) + u(x + h,y - h) + v(x - h,y - h)}+ + [u(z + 2h, y) + u(x - 2h, y) + u(x,y + 2h) + u{x, y - 2h)} -= r»4(AA)«(a;,j/) + 0(ri6). Důkaz tohoto tvrzení plyne ihned z Taylorova vzorce, a nebudeme jej proto podrobně provádět. Obr. 2.7 Sírové schéma pro biharmonickou rovnici C L D A S J H M Přibližné řešení uk, budeme tedy počítat z rovnic (2.78) (L2u)hs = f(xk,ys), kde uzel (xk, ys) probíhá jako dříve množinu vnitřních uzlů ííW, doplněných rovnicemi psanými pro každý hraniční uzel (xk, y„) 6 ľ^h\ které se získají z okrajových 267 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU podmínek. Množiny 0« a se přitom definují stejně jako v odst. 2.1 pomocí pojmu sousedních uzlů. Je však třeba mít na paměti, že za sousedy uzlu A z obr. 2.7 je třeba pokládat dvanáct uzlů B,... ,M (srv. vzorec (2.76)). V našem speciálním případě je tedy množina 0,^ tvořena uzly (xk, ys), pro něž je k,s = 2,..., n — 2, a pro množinu platí rW = rjh^urjh\ kde AW obsahuje uzly ležící na hranici ľ čtverce íí a obsahuje uzly, jejíchž vzdálenost od F je právě h. Vzhledem k první okrajové podmínce (2.74) hodnoty přibližného řešení v uzlech z ľ[h^ známe. V uzlech z 7*2*' zužitkujeme druhou okrajovou podmínku úplně stejně, jako jsme to učinili u okrajové úlohy pro obyčejnou diferenciální rovnici čtvrtého řádu v předešlé kapitole. Tak např. v uzlu {x\, ys) píšeme rovnici (2.79) = «1,1 + 2^2(2:0, !/>) a hodnotu u_i,s vypočtenou z této rovnice dosadíme do rovnice (2.78) psané pro uzel (a;i,sřf). Tímto postupem dostaneme zřejmě soustavu (n — l)2 rovnic o (n — - I)2 neznámých uk, v uzlech (xk,y,) 0 taková, že pro libovolný (n - l)2-dimenzionální vektor t) o složkách r]k, platí (2.82) Arie (e»»i,»i)ž7ä2Nk*,, (2.83) Nk.su =max[ max |»)t,|, max \nkí\h 1], 268 2 METODA SlTl a kulaté závorky v (2.82) značí skalární součin v (n -1)2-dimenzionálním euklidovském prostoru. Důkaz Podle vzorce (2.80) je (2.84) (BhVtV) = h4 £ (^ = ft4ELV^W,. Dvojím užitím lemmatu 3.10 z kap. II na každý z dvojnásobného součtu na pravé straně (2.84) snadno zjistíme (srv. také důkaz lemmatu 3.14 z kap. II), že platí (2.85) (ftr,, „) = /■* £ [(iÄlJ)*,]2 + 2 £ + 2r,lx + 2n2_11 + 2r,?i„_1 + 2^_ln_1. Čísla (iníj)t, jsou však zřejmě složky vektoru AHr,, kde Ah je matice soustavy rovnic (286) A2(i^)i5 = st5, (.»,»,) €flÍ»). Je tedy (2.87) (Bhv,v) = (AnV,AhV) + 2 £ %2J+ + Wu + 2f)2_i,i + 2v?,„_i + 2Í)2_1,„_1. Z rovnice (2.87) však ihned plyne, že platí (2.88) {BhV,V)Ž2 £ = % max |%,|]2 = 2h2[ max ^h^. Buď nyní e(?>»), p,« = 1,... ,n - 1, vektor, který má (p, ?)-tou složku rovnu jedné a všechny ostatní složky rovny nule. Pak zřejmě platí (2-89) VPt = {n^M). Buď dále aď'ti vektor, který je řešením soustavy (2.90) Aha^ = .i4"v = 2nsin-siní-—, k,s = 1,... n - í n n Přímým výpočtem snadno zjistíme, že vektory v ("''O tvoří úplnou ortonormovanou soustavu vlastních vektorů matice Ah a že příslušná vlastni čísla A„„ jsou dána 269 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU 2 METODA SlTl f vir (2.92) XUII = 4-2^cos — + cos^-J = ,4(sm2- + sm2-), ,,„=!,....n-1. Odtud mimo jiné plyne, že existují konstanty eířji^ takové, že platí (2.93) <*<'•»>= E cí™M"'">. Vynásobíme-li rovnici (2.93) zleva maticí Ah, dostaneme (2.94) 4^«) = E A^c^v^"). Čísla A„ŕcí,l'fi,), ľ, Ai = 1..., n - 1, jsou tedy Fourierovy koeficienty vektoru e-lJ L«n-1 9i . 9n-l -1 budeme manipulovat přesně tak, jako kdyby veličiny Aj, B;, resp. u,, gt nebyly matice, resp. vektory, ale čísla. Tento postup vede k následujícím rekurencím (srv. vzorce (3.138), (3.152) a (3.153) z kap. II). Nejprve vypočteme matice Dk (řádu n — 1) z rovnic (2.117) Di = Au Dt=Ak- Bt-iD^St-i, k.= 2.....n - 1, pak (n - l)-dimenzionální vektory ck z rovnic (2.118) c0 = g0, ck — gt — Si-iD^jCjj-i, a konečně neznámé vektory uk z rovnic k = 2,.. (2.119) "n-l = D„_1C„-l, 1-1 uk = Dk l(ck - Bkuk+1), fc = R-2,...,l. Postup popsaný rovnicemi (2.117) je co do počtu operací ekvivalentní Gaussově eliminační metodě a lze jej bez obtíží provést, neboť postupně vznikající matice Dk jsou pozitivně definitní, takže matice k nim inverzní lze konstruovat trojúhelníkovým rozkladem bez výběru hlavního prvku. Zároveň je také vidět, že tento postup lze s mírnými modifikacemi užít i u obecnějších úloh druhého řádu. V případě rovnic čtvrtého řáduje přirozeně třeba užít rekurence typu (3.207) až (3.209) z kap. II. 274 Užití eliminační metody k řešení velkých soustav typu (2.111) často usnadní, lze-li matici A psát blokově ve tvaru (2.120) A = P\ 0 0 \ 0 L Oi Qí 0 Pn-2 Ql_ Qn-2 kde Pk jsou symetrické pozitivně definitní matice. Pro matici A pak platí (2.121) A = MM7, kde M je dolní trojúhelníková matice tvaru (2.122) M-i. 0 0 ••- 0 L Ni M„_2 /V„-2 0 Mn-1 a matice Mk a Nk splňují rovnice (2.123) (2.124) NkM? = Qh, fc = l,...,n-2, fc = l,. .,n-2, (2.125) = P„_, - A/iň/r - ... - A/„_2/VnT_2. Matice Mk lze tedy pro k = 1,..., n - 2 sestrojit Choleského metodou nezávisle jednu na druhé. Z rovnic (2.124) se pak určí matice N], pro k = 1,..., n—2 akonečně z rovnice (2.125) — opět Choleského metodou — matice M„_t. Řešení původní soustavy se pak zřejmě (viz rovnici (2.121)) dostane řešením rovnic (2.126) Mv = g, = v. Popišme jednu z možností, jak očíslovat uzly sítě tak, aby matice A soustavy (2.111) byla tvaru (2.120). Tento postup lze užít i v případě obecného pětibodového schématu (2.4). Předpokládejme, že platí n - 1 = rm, kde r a m jsou celá čísla, a rozdělme nejprve všechny vnitřní uzly do r2 + 1 skupin takto: Do první skupiny 275 T III. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU dáme uzly (kh, sh), pro něž je k = 1,..., m-1 a s = 1,..., m- 1; do druhé skupiny dáme uzly, pro něž je * = 1,..., m - 1 a s ~ m + 1,..., 2m - 1 atd. až do r-té skupiny dáme uzly, pro něž je k = 1.....m— ls» = (r - l)m + 1,..., rm — 1; do (r + l)-ní skupiny dáme uzly, pro něž je * = m + 1,.... 2m — 1 a s = 1,..., m — 1 atd. až do (2r)-té skupiny dáme uzly, pro něž je fc = m + 1,..., 2m - 1 a s — (r- - l)m + 1.....rm - 1 atd. až do r2-té skupiny dáme uzly, pro něž je k = (r - - l)m + 1,..., rm - 1 a a = (r- l)m + 1,..., rm - 1; do (r2 + l)-ní skupiny dáme všechny zbývající uzly. Uzly z první skupiny očíslujeme prvními (m - l)2 indexy, uzly z druhé skupiny druhými (m — l)2 indexy atd. Za předpokladu, že platí A* - D a Bt - - T pro k = 1.....n - 1, kde D a T jsou třídiagonálnf matice, že je n = 2,+1 a že matice D a T komutují, lze soustavu (2.111) řešit velmi efektivně metodou zvanou metoda cyklické redukce. Postup je následující: Položme pro i — 0,. ., e (2.127) Di = n[D-2cosí^lT], T = l Ti = T2' a vypočtěme pro i = 1,..., s rekurentně vektory g^ (2.128) s/ť) = t,^z\} + Di-i^-15 + 7;_1?£;i>, i = l,...,2'+1-'-l, přičemž klademe jí°' = pro i = 1,..., 2*+1 — 1. Dále řešme soustavu (2.129) D,Ulw==Sl(,) Konečně pro i = s — 1,. ., 0 položme (2.130) «iť) = "/í+1). j = l,...,2*-'-l, „(0 _ „CO _ n a řešme soustavy (2.131) DiU^^TiU^ + g^+TiU^, j = 0,...,2'-i-l. Výsledné vektory u^°\..., o^ľ+i.i jsou řešením soustavy (2.111). Provádíme-li součiny matic a vektorů na pravé straně rovnic (2.128) a (2.131) opakovaným násobením třídiagonálními maticemi D — 2 cos ((2r - l)7r/2'+1) T a T a řešíme-li soustavy (2.131) tak, že opakovaně řešíme soustavy s třídiagonálními maticemi O — 2 cos ((2r - 1)tt/2'+1)T, je počet potřebných operací řádově roven číslu (n - l)2 ln(n - 1), tedy až na faktor ln(n - 1) počtu rovnic. Popsaný postup 276 2 METODA SÍTÍ redukuje tedy počet potřebných operací ve srovnání např. s Gaussovou eliminací velice výrazně. Upozorněme, že uvedené vzorce jsou správné i v případě, že D a T jsou libovolné, ne nutně třídiagonální matice řádu (n — 1), jen když komutují. V tomto případě už však nebude počet potřebných operací tak výhodný jako výše. Jedna z obtíží spojených s užitím přímých metod k řešení rovnic vznikajících v metodě sítí spočívá v potřebě vysokého počtu paměťových míst i v případě, že příslušná matice má velmi mnoho nulových prvků. Při těchto metodách se totiž, ať už přímo nebo nepřímo, konstruuje trojúhelníkový rozklad dané matice, a vzniklé trojúhelníkové matice mohou obsahovat nenulové prvky i v těch místech, kde výchozí matice nuly měla. Stoneova metoda neúplného rozkladu redukuje podstatně počet potřebných paměťových míst. Vychází z toho, že se postupuje přesně podle vzorců pro trojúhelníkový rozklad obecné matice, prvky příslušných trojúhelníkových matic se však počítají pouze v těch polohách, které odpovídají polohám nenulových prvků původní matice, a jinde se kladou nuly. Součin takto vzniklých matic se pak přirozeně nerovná původní matici, přesto však mohou tyto matice sloužit za východisko k velmi efektivním algoritmům. Do dalších podrobností nebudeme zacházet a odkazujeme čtenáře na specializovanou literaturu (viz např. Stone (1968)). Nakonec se zmíníme ještě o jedné skupině přímých metod, které se v poslední době intenzivně vyvíjejí a které se snaží zužitkovat tu skutečnost, že jednoduché rovnice vznikající v metodě sítí umíme velmi efektivně řešit, je-li i daná oblast jednoduchá (viz např. metoda cyklické redukce). Základní myšlenku těchto metod popíšeme jen ve velmi hrubých rysech. Nechť je např. třeba řešit soustavu (2.110), avšak na složitější oblasti, než je čtverec. Pak tuto oblast vnoříme do vhodného čtverce a v uzlech, které přitom přibudou, dodáme další rovnice typu (2.110). Pravé strany pro ně získáme řešením vhodné soustavy lineárních rovnic, která sice bude mít plnou matici, ta však bude nízkého řádu. Řešení původního problému se tak převede na řešení malé soustavy s plnou maticí a na řešení soustavy, kteTá má zhruba tolik neznámých (ve skutečnosti o něco více) jako původní soustava, avšak kterou je možné vyřešit velice rychle. Podrobnější poučení o metodách tohoto typu nalezne čtenář např. v článku Proskurowského a Widlunda (1976). 2.3.2 Iterační metody Přímé metody jsou pro řešení diferenčních rovnic většinou uspokojivé, jsou-li vůbec proveditelné, tj. zejména tehdy, nezabrání-li jejich užití nedostatečná paměťová kapacita počítače, který máme k dispozici. Proto se v souvislosti s metodou sítí (a také v souvislosti s metodou konečných prvků, jak uvidíme) užívají podstatně častěji než v případě jednodimenzionálních úloh iterační metody. Ze skupiny tzv. maticových iteračních metod jsou nejběžnější Gaussova-Seidelova metoda, superrelaxační metoda (metoda SOR) a různé varianty metod střídavých směrů. Z gradientních metod. 277 - III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU tj. metod, které vycházejí z myšlenky minimalizace kvadratické formy (2.132) Q(u) = \uTAu- uTg, (jejíž minimum je v případě, že matice A je symetrická a pozitivně definitní, řešením soustavy (2.111)), je to pak zejména metoda sdružených gradientů, která je v poslední době značně populární. Všimněme si proto zmíněných metod poněkud podrobněji. Připomeňme, že superrelaxační metoda je dána vzorcem (2.133) u<*+1> =/ki/W+Cs, s maticemi K,aQ, definovanými rovnicemi Hu = (D-uL)-1[(l~w)D+uU] (2.134) (2.135) přičemž je (2.136) du = u(D — uĽ)~ A = D-l-U, kde D je diagonální matice, i dolní trojúhelníková a U horní trojúhelníková matice, obě s nulami na hlavní diagonále au je číselný paTametr zvaný relaxační faktor. Gaussovou-Seidelovu metodu dostaneme pak pro 0) = 1. Matice soustavy (2.111) má v každém řádku kromě diagonálního prvku už jen nanejvýš čtyři nenulové prvky. K výpočtu jedné iteTace je tedy zapotřebí řádově tolik operací, kolik složek má hledaný vektor. Protože pracujeme stále s toutéž původní maticí, počet potřebných paměťových míst je dán počtem jejích nenulových prvků a přirozeně dimenzí hledaného vektoru. To je také hlavní výhoda nejen superrelaxační metody, ale vlastně všech iteračních metod oproti přímým metodám. Připomeňme také, že je-li 0 < w < 2 a je-li matice A symetrická a pozitivně definitní, je superrelaxační metoda konvergentní. Dále připomeňme, že je-li matice A dvoucyklická (tj. existuje-li permutační matice P taková, že matice PTD"1(L + + U)P je tvaru (2.137) 0 S21 r?i2 0 kde nuly znamenají čtvercové nulové matice) a konzistentně uspořádaná (tj. nezávisí-li vlastní čísla matice B(a) — aD~xL + a~1D~1U, a ^ 0 na parametru a), je možno superrelaxační metodu optimalizovat, tj. je možno nalézt takové číslo w0pt, 0 < uopt < 2, že platí (2.138) 278 2 METODA SÍTÍ přičemž optimální relaxační faktor je dán vzorcem (2.139) u, 1 + [i-e2(D-i(i + (y))]1/2' Konečně připomeňme, že platí (2140) e!(D-1(i+y)) = e(Hi), takže číslo £2(D_1(/. + U)) je spektrální poloměr Gaussovy-Seidelovy iterační matice a že pro spektrální poloměr optimalizované superrelaxační metody je (2.141) 0(H ,_i-[i-g2(D-1q + ^))]1/3 Ukažme, že v případě naší modelové úlohy příslušná matice (tj. matice soustavy (2.111)) do výše popsané třídy patří. Matice D ~1(L+ U) vznikne z matice A zřejmě tak, že se její diagonální prvky nahradí nulami, u nediagonálních prvků se změní znaménko a vydělí se čtyřmi. Vynásobit matici D ~1(L+ U) zleva maticí PT a zprava maticí P, kde P je permutační matice, znamená přečíslovat neznámé v příslušné soustavě rovnic a změnit odpovídajícím způsobem pořadí rovnic. Přečíslujme neznámé „šachovnicově", tj. v případě, že n je liché, číslujeme ty neznámé, kde součet k+s je lichý, postupně zleva doprava a shora dolů indexy 1,2,..., (n-l)2/2 a ty neznámé, kde součet k+s je sudý, indexy (ra — l)2/2+l,..., (n —l)2; v případě, že n je sudé, užijeme pro ty neznámé, kde součet k + s je sudý, indexy 1,..., [(n —1)2 +1]/2 a pro ty neznámé, kde součet k + s je lichý, indexy [(n — l)2 + l]/2-rT,..., (n — l)2. Přerovnáme-li odpovídajícím způsobem i rovnice, dostaneme soustavu, jejíž matice je zřejmě tvaru (2.137). Matice A je tedy dvoucyklická. Abychom dokázali konzistentní uspořádanost matice A, uvažujme libovolné vlastní číslo A matice D~1(L+U). Je-li i>£, jemu odpovídající vlastní vektor apoložíme-li "Oj = Vni = 0 pro ■ = 1,..., n — la vito. = «kn = 0 pro k = 1,..., n - 1, platí (2.142) + «4+1,« + "M+i + «M-l = 4A"*« pro k, s = 1,..., n—1. Vynásobíme-li každou z těchto rovnic číslem a*""', dostaneme (2.143) í(i-1)-'.t.1]1 + ra'-<,+%í,!+1+ a a Číslo A je tedy také vlastním číslem matice B(ct) = aD~1L + a~lD~lU (a odpovídající vlastní vektor je ct*-'ujfc,). Snadno se už zjistí, že každé vlastní číslo matice B(a) se dostane popsaným způsobem. Vlastní čísla matice B(ce) tedy skutečně nezávisí na a a matice A je konzistentně uspořádaná. Při řešení soustavy (2.110) superrelaxační metodou platí tedy vzorce (2.139) a (2.141). Speciální případ této soustavy umožňuje také ilustrovat, co se skutečně získá na rychlosti konvergence užitím optimalizované superrelaxační metody. 279 III. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU Rychlost konvergence budeme přitom měřit, jak je zvykem, velikostí spektrálního poloměru příslušné iterační matice. Snadno se zjistí, že čísla A„M daná vzorcem (2.144) — k\ cos--Hcos— i v,u — 1,... ,n - 1, * \ n n J jsou všechna vlastní čísla matice D_1(í. + U). Plyne to totiž z toho, že vektory ir("''í), jejichž souřadnice jsou dány vzorci (2.91) a které tvoři úplnou soustavu vlastních vektorů matice z odst. 2.2, jsou zároveň vlastními vektory matice D"1(/.+ U). Je tedy (2.145) a tedy také (2.146) g(D~l(L + U)) =cos- = costt/i = 1- 0(h2), g(H1) = g2(D-\L+ U)) = í-0(h2). Odtud a ze vzorce (2.141) však plyne, že platí (2.147) ?(W^P.) = 1 - O(h). Spektrální poloměr optimalizované superrelaxační metody je tedy pro malá h skutečně podstatně menší než spektrální poloměr Gaussovy-Seidelovy metody. Při praktickém užití superrelaxační metody se postupuje obvykle tak, že se výpočet zahájí Gaussovou-Seidelovou metodou a po výpočtu několika iterací se odhadne spektrální poloměr příslušné iterační matice H\ mocninnou metodou. Tato aproximace se pak užije ve vzorci (2.139), do něhož se dosadí ze vzorce (2.140). Rešíme-li obecnější eliptickou rovnici druhého řádu na čtverci nebo obdélníku, jehož strany jsou tvořeny přímkami sítě, je příslušná matice rovněž dvoucyklická a konzistentně uspořádaná, takže vzorec (2.141) lze užít i v tomto případě. Tohoto vzorce se však v praxi užívá i v těch případech, kdy nevíme, zda skutečně vede k minimální hodnotě spektrálního poloměru. Alternativně se při užití superrelaxační metody postupuje také tak, že se v situaci, kde se řeší celá velká skupina problémů podobného charakteru, určí optimální relaxační faktor experimentálně v jednom případě a v dalších případech se užije takto získaná hodnota. Gaussovu-Seidelovu i superrelaxační metodu (a i mnohé další maticové iterační metody) lze realizovat v tzv. blokové podobě.. Stručně řečeno to znamená, že matice dané soustavy se rozdělí na bloky tak, aby diagonální bloky byly regulární čtvercové matice a iterace se konstruují podle stejných vzorců, jaké byly uvedeny výše s tím, že skaláry, které se v nich vyskytují, je třeba pokládat za vektory, resp. matice. To mimo jiné znamená, že kdekoliv se v těchto vzorcích vyskytuje dělení, je třeba je chápat jako násobení příslušnou inverzní maticí. Tyto blokové iterační metody mohou být v naší speciální situaci výhodné, neboť bloková struktura matice A soustavy (2.111) je velice jednoduchá. Předpokládáme-li, že tato soustava je zapsána ve tvaru (2.116), Gaussova-Seidelova bloková metoda dána vzorcem (2.148) = V(w-ft-i«£í (i+l) . k= l,...,n r 2 METODA SlTl Podobně bloková superrelaxační metoda je dána vzorcem (2.149) u^+1^uAh-\3k Bk.lU^-Bku^) + (l-U)u^, k ~ 1,..., n — 1. Pro výpočet je výhodnější přepsat rovnice (2.149) v ekvivalentním tvaru (2.150) Akú^ = (>+i) /-fi+i) (0\ , (0 Je-li bloková matice A dvoucyklická a konzistentně uspořádaná tyto pojmy se definují úplně stejně jako dříve — platí pro optimální relaxační faktor vzorec (2.139). Matice D, í. a U v tomto vzorci jsou samozřejmě matice dané vztahy (2.151) D = Ax 0 0 0 An- L = 0 ... Si • 0 0 B„-2 0\ 0 0 Vzhledem k tomu, že popsané blokové metody lze upravit tak, že provedení jedné iterace u nich nevyžaduje více početních operací než výpočet jedné iterace u dřívějších metod (kterým se v této souvislosti říká bodové iterační metody), a vzhledem k tomu, že konvergují většinou rychleji než metody bodové, jsou dosti vážnými kandidáty na univerzálně použitelné metody pro řešení rovnic, které vznikají při metodě sítí. Další metoda, která se zdá vhodná pro řešení diferenčních rovnic, je Peacemanova-Rachfordova metoda střídavých směrů. Abychom ji popsali v případě modelové soustavy (2.110), pišme matici A této soustavy ve tvaru (2.152) A= H+ V, 280 281 III. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU kde H a. V jsou matice řádu (n — l)2 definované vzorci í (2.153) (2.154) V = C 0 ...... o o '■■ ■ : 0 0 ...... 0 c 2lr -L 0 ... -Ir 0 0 -Ir 0 -lT 2/r v nichž lr je jednotková matice řádu n — 1 a « + g, (uil+V)i/ = {u>il - H )uV+1M + g, i = 0,1,..., kde / je jednotková matice řádu (n — l)2 a na vektor u í'+1/2) je třeba se dívat jako na mezivýsledek. Rozklad (2.152) vznikne tak, že píšeme levou stranu rovnice (2.110) ve tvaru (-«i-i,. + 2ut< —uj,+ljJ)+(-«n,,_i+2«t,—«i,,+i), matici H vytvoříme z prvního sčítance a matici V z druhého sčítance. 2 METODA SlTl Pro matici ;/ + H. Druhá soustava ve vzorci (2.156) se tedy rozpadne na n — 1 soustav (2.161) M+0<Í+1>: w*, * s 1, 1, s třídiagonálními maticemi a výpočet vektoru vede opět na řešení n 1 soustav o n — 1 neznámých s třídiagonálními maticemi. Zdůrazněme však ještě jednou, že vektor uí!+1) je rozdělen na bloky jinak než vektor u^'*1/2) a jeho složka Ujji+1' značí nyní hodnoty přibližného řešení na přímce x — kh rovnoběžné s osou y. Složky vektoru přibližného řešení tedy počítáme v prvním půlkroku metody (2.156) postupně po přímkách rovnoběžných s osou isv druhém půlkroku po přímkách rovnoběžných s osou y. Odtud také pochází název metody, 282 283 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU 2 METODA SlTl Vezmeme-li v úvahu způsob, kterým jsme došli k maticím V a H v rozkladu (2.152), je snadné zobecnit metodu střídavých směrů i na podstatně obecnější diferenciální rovnici (2.1) s okrajovou podmínkou (2.68) v obecné oblasti íí. Dokonce není ani nutné omezit se na rovnoměrnou síť. Matice C a lr v rovnicích (2.153) a (2.154) nebudou ovšem konstantní a v případě obecné oblasti nebudou dokonce ani stejných řádů, jejich třídiagonální, resp. diagonální struktura však zůstane zachována. Z algoritmického hlediska bude tedy výpočet jednotlivých iterací probíhat stejně jako v popsaném příkladě. Rovnice (2.156) představují nestacionární iterační metodu, kde čísla (zvaná iterační parametry) se mohou od iterace k iteraci měnit a je třeba je volit tak, aby konvergence byla co možná nejrychlejší. Obvykle se postupuje tak, že pro každých m po sobě jdoucích iteracích se za ně bere konečná posloupnost čísel u>;, i = — 0,..., m — 1. Iterační parametry se tedy periodicky opakují. Pro ilustraci uveďme bez zdůvodnění některé volby iteračních parametrů, které byly v literatuře navrženy. Položíme-li m = 1, je u,- = o> pro každé i a optimální hodnota iteračního parametru je dána vzorcem (2.162) "opt — 4 sin — eos —. In 2n Metoda střídavých směrů konverguje v tomto případě asi tak rychle jako optimalizovaná superrelaxační metoda. Protože však její provedení vyžaduje více početních operací, než je tomu u superrelaxační metody, nelze tuto její variantu příliš doporučit. Podstatné zlepšení rychlosti konvergence Peacemanovy-Rachfordovy metody střídavých směrů lze dosáhnout až teprve tehdy, připustíme-li m > 1, tj. užijeme-li více iteračních parametrů než jeden. Byla navržena celá řada postupů, jak tyto parametry volit, a v současné době je této problematice věnována už rozsáhlá literatura. Jedna z možností, jak určit nejen dobré parametry, které jsou v případě výše uvažované modelové úlohy blízké optimálním parametrům, ale i jejich počet, tj. číslo m, pochází od Douglase. Číslo m se při tomto postupu určí jako nej větší celé číslo, pro něž platí nerovnost (2.163) /2'/2 + l I2V2 l\m . 2 7t l) Sm Yn S cos —, 2n' a iterační parametry oij se pro i = 0.....m — 1 počítají ze vzorců (2.164) nebo ze vzorců (2.165) 2l/2 + lV , 4 ľľ'* + 1\ U* ~ 2l/2_ll21/2-lJ 2n 4 /21/2-ly 2 tv W' = 5T7ŠTlV2WlJ C°S 2r7 Ačkoliv z teoretického hlediska jsou obě tyto možnosti rovnocenné, praktické zkušenosti naznačují, že druhá volba vede k větší rychlosti konvergence. 284 Jiná posloupnost iteTačních parametrů pochází od Wachspresse a je dána vzorcem 4cos2f- kde m je nejmenší celé číslo, pro něž platí nerovnosti (2.167) m>2, (21/2 - l)"-1 < tg^-. 2n Příznivé vlastnosti všech uvedených voleb iteračních parametrů jsou dokázány za předpokladu, že matice H a V v rozkladu (2.152) komutují. Je-li tento předpoklad porušen (napr. proto, že daná oblast není čtverec, nebo že koeficienty dané rovnice nejsou konstantní), bere se často za posloupnost iteračních parametrů posloupnost, která se získá pro modelovou úlohu na nejmenším čtverci obklopujícím danou oblast. I když teoretické zdůvodnění zde není k dispozici, dochází při tomto postupu ve srovnání např. se superrelaxační metodou k podstatnému urychlení konvergence. Poznamenejme ještě, že existuje celá řada variant metody střídavých směrů. Tak např. poměrně častá je tzv. lokálně jednorozměrná metoda, která vychází opět z rozkladu (2.152) a v níž se iterace počítají z dvojic vzorců {uil + r/)u(,+1/2> - (u>il - H)u« + 3l, ((*/ + V)u(,+1) ( 2. V tomto případě se rozkládá matice na m sčítanců, z nichž každý odpovídá náhradě derivací ve směru jedné souřadnicové osy, a jedna iterace se skládá z m dílčích kroků. Uveďme končené ještě dvě iterační metody, jejichž teoretický výzkum je v současné době velmi intenzívní a není ani zdaleka ještě ukončen, pro něž však existuje řada indikací, že by mohlo jít o vůbec nej efektivnější metody pro řešení soustav lineárních rovnic, které vznikají v metodě sítí nebo v metodě konečných prvků. První z nich, metoda sdružených gradientů, slouží k přibližnému řešení soustavy Au = g se symetrickou pozitivně definitní maticí. Je to, jak už jsme uvedli výše, gradientní metoda, v níž se kvadratická forma Q daná rovnicí (2.132) minimalizuje postupně ve směrech v^'\ které vzniknou A-ortogonalizací vektorů reziduí. Příslušné vzorce jsou (2.169) = 9 AUW, vCYTAvW + ohv CO 285 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU v(i)TAr(,+l) Tato metoda má pozoruhodnou vlastnost, že za předpokladu, že se nedopouštíme zaokrouhlovacích chyb, vede po N krocích (N je řád matice A) k přesnému řešení. Nejde tedy v přesném slova smyslu o iterační metodu, přesto se však jako taková užívá, neboť ve speciálních případech, zejména při užití na diferenční rovnice vznikajících v metodě sítí a v metodě končených prvků, dává často řešení s požadovanou přesností mnohem dříve než po N iteracích. Efektivitu metody sdružených gradientů je možné podstatně zvýšit úpravami matice A, které mají zhruba řečeno za cíl vhodně modifikovat její spektrum. V tomto případě se pak mluví o před-podmíněné metodě sdružených gradientů. Jde však o postupy dosti komplikované, takže do podrobností nelze v tomto elementárním textu zacházet. Další iterační metoda, o níž se zde chceme zmínit, je metoda více sítí (multigrid method). Tuto metodu nelze jednoduše zařadit do žádné z výše zmíněných skupin iteračních metod a ani její teoretické fundování není dosud zdaleka ukončeno a v mnoha jejích variantách se zatím postupuje intuitivně. Proto naznačíme její základní myšlenku jen v těch nejhrubších obrysech, aniž bychom se sebeméně snažili udat nějaký konkrétní návod ke skutečnému počítání. Důvod, proč o ní vůbec mluvíme, je ten, že chceme čtenáře upozornit, že vůbec nějaká taková metoda existuje. Metoda vychází z toho, že řešení soustavy (2.111) představuje přibližné řešení dané diferenciální rovnice na síti JfW, které pro h —> 0 konverguje k přesnému řešení. Proto, je-li h malé, jsou řešení této soustavy při integračním kroku h, 1h,... v těch uzlech, které jsou společné sítím KW, JrW.....blízká. Této skutečnosti metoda více sítí využívá tak, že ke konstrukci zlepšené aproximace na síti se užije kombinace nějaké jednoduché iterační metody (např. Gaussovy-Seidelovy metody nebo metody sdružených gradientů) a oprav, které se vypočtou interpolací přibližného řešení z hrubší sítě na jemnější síť. Přibližné řešení na hrubší síti se získá snáze a lze to učinit např. zase tak, že se naznačeným způsobem užije ještě hrubší síť. Zakončeme tuto stručnou poznámku o metodě více sítí, že k tomu, aby byla skutečně efektivní, je třeba její dobrá implementace na počítači. 2.4 Obecné otázky konvergence a odhadů chyb při metodě sítí V tomto odstavci popíšeme stručně princip konvergenčních důkazů pro metodu sítí. Začneme tím, že zformulujeme problém řešení okrajové úlohy metodou sítí abstraktně. 2.4.1 Základní pojmy teorie diferenčních schémat Buď dána oblast Q s hranicí ľ. Vyšetřujme diferenciální rovnici (2.170) Lu = / vň, 286 2 METODA SlTl kde u je hledaná funkce, / daná funkce a L lineární diferenciální operátor, s okrajovými podmínkami (2.171) tu = (pi na ľ{, 1 = 1,..., s. Zde ľ{ jsou nějaké části hranice F, 0 dána v uzavřené oblasti Ú nějaká konečná množina bodů, kterou nazveme sítí a označíme fiW, a buď L\ lineárni operátor, který funkci vfJ1) definované na síti přiřazuje funkci L^vW definovanou na nějaké podmnožině fiW množiny Í)W Množinu ííW nazveme množinou vnitřních uzli sítě fiM. Buď konečně lf-h\ i = 1,..., s, operátor, který funkci uW definované na fi(*> přiřazuje funkci /ťWtí« definovanou na množině lih) C ňw, lf°nííW = 0, operátor, který funkci ipt uvažované na množině F^\ což je konečná podmnožina množiny ľi, přiřazuje funkci A^ipi definovanou na množině r^h\ Uzly z množiny Uí=i ^í*^ nazveme hraničními uzly. V dalším budeme předpokládat, že platí uf=1 r/*5 u n(*> = {*(*>. Uvažujme nyní diferenční rovnici (2.172) = /, jejíž pravá strana je definována na množině fiW vnitřních uzlů a je tam rovna hodnotám pravé strany diferenciální rovnice (2.170), s okrajovými podmínkami (2.173) //Mui £ £ íi platí UuW 6 FW, //^uW £ *ÍÄ) a A^Vi £ *[A). Předpokládejme, že každá funkce u £ U, resp. / £ F je jako funkce definovaná pouze na množině ÍJM, resp. íiW prvkem prostoru U(-h\ resp. fW, Pak mají smysl výrazy LhU a //'"'u. Předpokládejme dále, že normy zavedené v prostorech, které jsme právě definovali, jsou takové, že pro každou funkci u £ U, f E F a ipi £ $; platí (2-175) MifW HMltr, ll/bw-» II/IIf, II^VíIIjw — INk pro ň; —ř 0. Následující definice shrnují požadavky, které je nutno klást na danou metodu sítí, aby bylo možné odvodit základní informace o její konvergenci. Definice 2.1. Řekneme, že diferenční rovnice (2.172) s okrajovými podmínkami (2.173) aproximuje diferenciální rovnici (2.170) s okrajovými podmínkami (2.171), platí-li pro každou funkci u £ (7 (2.176) \\Lu - M|FW -> 0, ||AÍft)(ííU) - //Ä)U||4,.) - 0 pro h —s- 0. Výrazy na levé straně rovnic (2.176) se nazývají lokální chyby dané metody. Definice 2.2. Řekneme, že aproximace diferenciální rovnice (2.170) s okrajovými podmínkami (2.171) diferenční rovnicí (2.172) s okrajovými podmínkami (2.173) je řádu p, exietují-li pro každou funkci u £ U konstanty M a M; tak, že platí (2.177) ||líí - U«||fw š MhP-, NM(H - 'íW«ll.jH- š Mih? 288 pro každé dostatečně malé h. Definice 2.3. Řekneme, že diferenční rovnice (2.172) s okrajovými podmínkami (2.173) je korektní (nebo stabilní vzhledem k vstupním datům), má-lí při libovolných pravých stranách / a - • = 1 Korektnost diferenční rovnice (2.172) s okrajovými podmínkami (2.173) tedy vlastně značí spojitou závislost jejího řešení na pravé straně rovnice a okrajových podmínek. Poznamenejme, že uvažujeme-li diferenční rovnici (2.173) s homogenními okrajovými podmínkami (2.179) 4wuW = o a platí-li nerovnost (2.180) \\u^\\uM^N\\LhuW\\FW, mluvíme o stabilitě vzhledem k pravé' straně; podobně, uvažujeme-li homogenní tov-nici (2.181) LtuW = 0 s nehomogenními okrajovými podmínkami (2.173) a platí-li nerovnost (2-182) Il^lli/WŠÉ^H^^II*!1'- mluvíme o stabilitě vzhledem k okrajovým podmínkám. Analogicky lze také zavést pojem stability pouze vzhledem k některé okrajové podmínce. Diferenční rovnice je tedy korektní, je-li stabilní vzhledem ke všem okrajovým podmínkám a vzhledem k pravé straně. Zavedené pojmy dávají možnost zformulovat konvergenční větu pro abstraktní metodu sítí. Veta 2.8. Nechť u £ U je řešení diferenciální rovnice (2.170) s okrajovými podmínkami (2.171). Nechť diferenční rovnice (2.172) s okrajovými podmínkami (2.173) aproximuje diferenciální rovnici (2.170) s okrajovými podmínkami (2.171). Konečně nechť diferenční rovnice (2.172) s okrajovými podmínkami (2.173) je korektní. Pak platí (2.183) lim ||tí<*> - ullrjw = 0. h—*0 289 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU 2 METODA SÍTl Je-íi navíc řád aproximace roven číslu p, platí pro chybu přibližného řešení odhad (2.184) ||„W - ulítej g tf (MN + p MiN^j. Důkaz Z rovnic (2.170) až (2.173) plyne, že je (2.185) Lh(u(h) -u) = iAuW _ Lhu + Lu~Lu-Lu- Lhu a (2.186) t«(««-i0 = tW«W-4w«+Aří(4«)-AÍ*)(4«) = Ař>(4ii)-í*>ii. Odtud vzhledem ke korektnosti dané diferenční rovnice s danými okrajovými podmínkami dostáváme (2.187) ||Ui nezávislé na h tak, že pro dané řešení diferenciální rovnice (2.170) s okrajovými podmínkami (2.171) platí (2.188) lim \\h-"(Lu - Lhu) - J,\\fW tt 0, h—>0 lim \\h-»U4%u) - /,.(A)«] - A^iWtV = 0. Nechť dále v nějaké třídě V, na které diferenční rovnice (2.172) s okrajovými podmínkami (2.173) aproximuje diferenciální rovnici (2.170) s okrajovými podmínkami (2.171), existuje řešení okrajové úlohy (2.189) Lw - i>, liw = ýi, i = l,...,í. Paíc platí (2.190) lim ||n-',(uW u) w\\u[h) = o. h—*0 Důkaz. Za uvedených předpokladů platí pro d->0 (2.191) ||ia[a-p(uW - u) - HIIíW = \\h-"Lh(uW - u) _ Lhw +Lw- Lw\\FW g g \\k-rih(uW -u)- V-Hfw + \\Lw - Lhw\\FW = = \\h-r(LhuM - Lhu +Lu- Lu) - tP\\fM + \\Lw - Í-HIfím s \\h-"{Lu - Lhu) - VIIíw 4- ||líí) - Lhw\\FW -» 0 a (2.192) MW[fc-'(u«-«)-w]||.w = = \\h-"l^h\UW _ „) _ i.Ww + A^h\hw) - JvW(t«B)||,ř) á S [|fc-*4<*>(«tfcí - «) - ASfc)^||#{M+ + \\^h\liv>)-l}h)w\\^) = = \\h-"[l}h)uW - líh)u + 4h\l;u) - AÍ*>(4«)] - AÍhVi||^)+ 4- \\4h\li">) ~ tW»ll#fM = = Hh-^iliu) - l^u] - A(«*||#ř,+ 4- ||AÍ«(4w) - kW«hfl - 0 Z těchto rovnic a z korektnosti vyšetřovaného diferenčního schématu však už tvrzení věty ihned plyne. 291 III. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU Předpoklady této věty jsou obvykle splněny, je-li řešení daného diferenciálního problému dostatečně hladké. Vyjdeme-li z rovnice (2.190) a jsou-li u(Ä») a u(h*> dvě řešení diferenční rovnice (2.172) s okrajovými podmínkami (2.173) získaná užitím sítí c fiC"), kde hx = chi a c > 1, platí (jsou-li splněny předpoklady věty 2.9) (2.193) - u = wh? + cih*) a (2.194) -u = c-*wh\ + o(h{). VylouČíme-li z těchto rovnic přesné řešení u tak, že odečteme rovnici (2.194) od rovnice (2.193), dostaneme (2.195) U(M - = + "(K). Platí tedy (2.196) i/fcl> - u = -^—[„{äO u(M] + 0{h\). Zanedbáme-Ii ve vzorci (2.196) člen o{h\), který je vyššího řádu, než je řád chyby, dostáváme odhad chyby metodou polovičního kroku. K jeho získání je tedy třeba řešit daný problém dvakrát se dvěma různými hodnotami parametru k. Alternativně lze vzorce (2.196) užít také tak, že za přibližné řešení se bere funkce i/e) daná vzorcem (2.197) = _íL__u(A,) _J_u(*i). k ' cf - 1 cf - 1 Vzorec (2.197) dostaneme tak, že z rovnice (2.196) vypočteme přesné řešení ti a zanedbáme člen o(ftf). Tato funkce dá patrně přesnější aproximaci než kterákoliv z funkcí uC*1) a u(h*\ zbavíme se však možnosti odhadu chyby. Poznamenejme ještě, že postup, který vedl k rovnici (2.197), představuje první krok tzv. Richardsonoíiy extrapolace, jíž se někdy užívá v případě, že pro přibližné řešení lze odvodit asymptotický vzorec typu (2.198) tíW = u + uji/ip + w2h2p + ... 3 Variační metody Variační metody, které stručně popíšeme v tomto článku, jsou založeny na úplně stejných principech jako metody v čl. 4 z kap. II. Stejně jako tam se vychází ze skutečnosti, že řešení mnohých okrajových úloh pro parciální diferenciální rovnice eliptického typu je ekvivalentní úloze nalezení extrému integrálu, jehož Eulerovou rovnicí je daná diferenciální rovnice. Proto si nejprve stručně všimneme souvislosti [ 3 VARIAČNÍ METODY některých základních úloh pro eliptické parciální diferenciální rovnice s variačními úlohami. Omezíme se přitom převážně na dvoudimenzionální problémy. 3.1 Variační formulace okrajových úloh 3.1.1 Diferenciální rovnice druhého řádu Nechť je dána diferenciální rovnice (2.1) s Dirichletovou okrajovou podmínkou (2.29). Předpokládejme přitom, že koeficient p je kladný, koeficient q nezáporný a že hranice oblasti a funkce p, q, f a 7 jsou tak hladké, že existuje klasické řešení úlohy (2.1), (2.29). Při hledání funkcionálu, jehož extrémem je řešení této okrajové úlohy se opět jako v odst, 4.1.1 z kap. II omezíme na homogenní Dirichletovu okrajovou podmínku, tj. na podmínku (3.1) u(x,y) = o, (x,y)er. Okrajová úloha s obecnou Dirichletovou okrajovou podiriínkou 6e převede na úlohu typu (2.1), (3.1) stejně jako v případě okrajové úlohy pro obyčejnou diferenciální rovnici, a to tak, že se nalezne dostatečně hladká funkce w, která splňuje podmínku (2.29), a místo funkce tí hledáme funkci ti — w. Tato funkce pak splňuje diferenciální rovnici (2.1) s jinou pravou stranou a s homogenní okrajovou podmínkou. Funkce vj se většinou nazývá přípustná funkce. Upozorněme, že zatímco v případě obyčejné diferenciální rovnice bylo určení přípustné funkce triviální, v případě více proměnných to už může být podstatně složitější problém. Dostatečnou hladkostí přípustné funkce zde rozumíme takovou hladkost, která dovoluje dosadit ji do dané diferenciální rovnice. Z dalších úvah vyplyne, že se lze spokojit s hladkostí menší a že stačí, aby přípustná funkce byla prvkem prostoru, v němž je přirozené hledat zobecněné řešení dané okrajové úlohy. Zaveďme diferenciální operátor L předpisem (3.2) ^-U^'^-U^9^)^''^ a buď 9l množina funkcí spojitých v Q, které mají v íí spojité parciální derivace až do druhého řádu včetně a které splňují podmínku (3.1). Operátor L pak zřejmě zobrazuje tuto množinu do množiny funkcí spojitých v U. Při zavedení tohoto označení je řešení okrajové úlohy (2.1), (3.1) totéž, jako řešení rovnice (3.3) Lv = f v množině Definujme dále na množině $>l funkcionál F předpisem (3.4) F(u) = / (Lu)(x, y)u(x, y) dxdy — 2 / f(x, y)u(x, y) dx d y Jsi Jsi 292 293 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU nebo alternativně předpisem (3.5) F(u)=j^{p(x,y)[{^)\{^y]+q(X,yy}dxdy- — 2 / f(x, y)udx dy, Jn přičemž vyjádření funkcionálu F ve tvaru (3.5) vzniklo z vyjádření (3.4) užitím Greenova vzorce. Nyní už můžeme zformulovat následující větu. Věta 3.1. Buď u £ &i řešení rovnice (3.3). Pak platí (3.6) F(v) > F(u) pro každou funkci v € v ý= u. Naopak, nechť existuje funkce u £ 9\_ taková, že pro ni nabývá funkcionál F minima v množině @\_. Pak je tato funkce řešením rovnice (3.3). Tato věta je obdobou k větě 4.1 z kap. II a její tvrzení plyne stejně snadno ze symetrie a pozitivní definitnosti operátoru L, jako tomu bylo u zmíněné věty. Symetrie operátoru L se bez obtíží dokáže užitím Greenova vzorce. Jeho pozitivní definitnost plyne z nerovnosti (3.7) / (Lu)(x,y}u(x,y)dxdy ž 7lNlis . kde 7 je kladná konstanta a symbol \\u\\_% značí normu funkce u £ @i v prostoru Jžfa(íí) funkcí integrovatelných s kvadrátem v oblasti fi. Důkaz této nerovnosti však už není zdaleka tak elementární, jako tomu bylo u analogické nerovnosti v jednodimenzionálním případě. Nebudeme jej proto provádět a odkazujeme čtenáře na specializovanou literaturu (viz např. Nečas (1967)). Věta 3.1 ukazuje ekvivalenci mezi řešením okrajové úlohy (2.1), (3.1) a hledáním extrému funkcionálu F definovaného rovnicí (3.4) nebo (3.5). Situace je zde tedy stejná jako v odst. 4.1 v kap. II. Tato paralela jde však i dále a variační formulace okrajové úlohy tvoří stejně jako v jednodimenzionálním případě podklad k zobecnění pojmu okrajové úlohy. Myšlenkový postup je v podstatě stejný jako ve zmíněném jednodimenzionálním případě a uvedeme jej bez důkazů s odvoláním např. na už zmíněnou knihu Nečasovu (1967). Množina která zřejmě tvoří vektorový prostor, se pokládá za podprostor Hilbertova prostoru JS^(íi) a operátor L definovaný rovnicí (3.2) představuje tak v JŽ2(£5) lineární symetrický operátor s definičním oborem Protože platí pro každé u £ také nerovnost (3.7), kterou lze stručně psát jako (3.8) (Lu, u) ^ f(u, u) (kulaté závorky zde i v dalším značí skalární součin y prostoru Jž?2(f2)), je možné 3 VARIAČNÍ METODY ve vektorovém prostoru Z&l zavést nový skalární součin rovnicí (3.9) [u,v] = (Lu,v), nebo, vzhledem ke Greenově vzorci, alternativně rovnicí (3.10) [u,v] = Jjp(x,v)(^ + ^)+q(x,y)uV] dxdy. Zavedeme-li ještě ve vektorovém prostoru % normu obvyklým způsobem, tj. rovnicí (3.11) \\«\\l = [vM1", stane se vektorový prostor ^£ lineárním normovaným prostorem. Poznamenejme, že právě zavedená norma se nazývá energetická norma a příslušný skalární součin energetický skalární součin. Zúplněním prostoru S>i v této normě dostaneme Hilbertův prostor @, v němž je zřejmě podprostor hustý. V jednodimenzionálním případě byl prostor S tvořen právě těmi funkcemi ze Sobolevova prostoru Jť1, které splňovaly dané homogenní okrajové podmínky. Ve vícedimenzionálním případě je situace složitější a platnost obdobného tvrzení závisí na topologických vlastnostech hranice ľ dané oblasti. Důležitá třída oblastí, pro níž zmíněné tvrzení platí, tj. pro niž je prostor & tvořen právě těmi funkcemi ze Sobolevova prostoru Jťírct), které splňují okrajovou podmínku (3.1) ve smyslu stop (tento podprostor prostoru Jíří(Q) se značí Jťgfä)), je tvořena oblastmi s tzv. lipschitzovskou hranicí. Přitom řekneme, že hranice P dané oblasti je lipschitzovská, jestliže existuje m kartézských soustav souřadnic, čísla Cť>0a/9>0am funkcí ar definovaných a lipschitzovských v intervalech (-a, a) tak, že platí (a) každý bod hranice ľ lze psát aspoň v jedné z uvedených soustav souřadnic ve tvaru (xr, ar(xr)); (b) body (xr,yr), pro něž platí nerovnosti —a < xr < a, ar(xr) < yr < ar(xr) + /?, leží v f! a body (xr,yr), pro něž platí nerovnosti —cť < xr < a, ar(xr) — 0 < yr < ar(xr), leží vně množiny Í2 (viz obr. 3.1). V dalším budeme předpokládat, že uvažovaná oblast do této třídy patří. Samotný pojem Sobolevova prostoru Jťk(Cl) není také možno definovat tak jednoduše jako v případě jedné dimenze, kdy k jeho zavedení stačil pojem absolutní spojitosti a běžný pojem derivace. Ve vícedimenzionálním případě se prostor Jťk(Q) nejobvykleji definuje (definici vyslovíme pro obecný případ funkcí m proměnných) jako množina měřitelných funkcí definovaných v oblasti Sí C Em (přesněji řečeno jako množina tříd funkcí, které se navzájem liší na množině míry nula), které mají zobecněné derivace až do r-tého řádu včetně, přičemž tyto derivace jsou integrovatelné s kvadrátem, a v níž je skalární součin definován rovnicí (3.12) (u, v) E ( «1 + - +«mí' dx? ...dxZr' dx?1 ...d, xZrJ Přitom řekneme, že funkce g definovaná a lokálně integrovatelná na množině ST. 294 295 HL PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU Obr. 3.1 Oblast s bpschitsovskou hranicí je zobecněnou derivací ôai+"+am/9i"1 . platí-li . dx%" lokálně integrovatelné funkce /, (3.13) Jíi dal+...+a„

.+■•■+<*- [ g »)««] d x d y + k{s)uv d *, na celém prostoru Jť1(Q). Protože integrály na pravé straně identity (3.23) vznikly úpravou vzorce (Lu, v) pomoci Greenova vzorce při využití okrajových podmínek (3.22), je naznačeno, jak postupovat i v případě jiných okrajových podmínek. Úlohy s nehomogenními okrajovými podmínkami jsme převedli na homogenní případ pomocí přípustné funkce. Lze však také postupovat přímo. Tak např. řešení diferenciální rovnice (2.1) s nehomogenní Dirichletovou okrajovou podmínku lze nalézt minimalizací funkcionálu (3.5) ve třídě funkcí, které patří do Sobolevova prostoru Jť1(Sl) a které splňují tuto nehomogenní podmínku. K tomu, abychom dostali řešení rovnice (2.1) s nehomogenní Newtonovou podmínkou (2.68), je třeba minimalizovat funkcionál (3.24) F(u)=Jn{p(x,y)[{^y + ^y]+q(x,y)u2}dxdy+ + / k(s)[u2-2uy(s)]ds-2 / fudxdy Jr Jet na celém prostoru Jř?1(fi). Z předchozích příkladů je vidět, že Dirichletovy okrajové podmínky a Newtonovy okrajové podmínky se chovají podstatně odlišně, Dirichletovy podmínky je třeba při minimalizaci příslušného funkcionálu předem splnit. Naproti tomu Newtonovy podmínky vedou sice k nutnosti modifikace funkcionálu, který minimalizujeme, členem obsahujícím integraci po hranici dané oblasti, při volbě množiny funkcí, na níž hledáme minimum, k nim však nemusíme přihlížet a nalezené minimum už je splní automaticky. Toto odlišné chování souvisí s tím, jaký Hilbertův prostor vznikne při zúplnění množiny S>i v energetické normě. Zatímco v případě (homogenní) Dirichletovy podmínky prvky výsledného prostoru tuto podmínku splňují, v případě Newtonovy podmínky tomu tak není. Proto se také, a to i v případě obecnějších eliptických diferenciálních operátorů, podmínky, které se chovají jako Dirichletovy okrajové podmínky v našem příkladě, nazývají stabilní okrajové podmínky, a ty je tedy třeba při hledání minima splnit. Okrajové podmínky, které se chovají jako Newtonovy podmínky, se nazývají nestabilní nebo přirozené okrajové podmínky. Ty mají vliv na tvar příslušného funkcionálu, při hledání minima však k nim není třeba přihlížet. Do dalších podrobností nebudeme zacházet a odkazujeme čtenáře opět na příslušnou speciální literaturu. 3.2 Základní přibližné metody V tomto odstavci popíšeme velmi stručně Ritzovu a Galerkinovu metodu řešení eliptických okrajových úloh, neboť jde o takřka doslovné opakování toho, co bylo o těchto metodách řečeno v odst. 4.2. kap. II. 3.2.1 Ritzova metoda V odst. 3.1 jsme ukázali, že celá řada okrajových úloh pro parciální diferenciální rovnice eliptického typu je ekvivalentní úloze na hledání minima funkcionálu F typu F(u) = [u, u]—2(/, u) ve vhodném prostoru ® (např. v Sobolevově prostoru J^i(Q.) nebo jeho podprostoru Jť0t(Q)). Výraz [.,.] přitom znamená skalární součin, který je ekvivalentní se skalárním součinem ve zmíněném Sobolevově prostoru a který souvisí s daným diferenciálním operátorem a eventuálně i s okrajovými podmínkami způsobem, který byl naznačen v předchozím textu. 298 299 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU Základní myšlenka Ritzovy metody spočívá v tom (srv. odst. 4.1.1 z kap. II), že se zvolí konečnědimenzionální podprostor @jv prostoru f aza aproximaci řešení dané okrajové úlohy se pokládá funkce ujv, pro kterou nabývá funkcionál F svého minima v tomto konečnědimenzionámím prostoru. Zvolíme-li za bázi v prostoru Djv funkce <řj,..., je hledaná aproximace ujv dána vzorcem (3.25) ECÄ' přičemž vektor koeficientů c — (ci,..., C[f)'r je řešením soustavy lineárních rovnic (3.26) Ac = g, kde A je čtvercová matice řádu JV, jejíž prvky a,j se určí ve vzorců (3.27) aij = [*;,*,], a 9 = • • i 9n)t je JV-dimenzionální vektor o složkách daných rovnicemi (3.28) íf = (/,*•■)■ Matice A se stejně jako v jednodimenzionálním případě nazývá Gramová matice nebo matice tuhosti příslušná k bázi <&i, ...,$„ a je v námi uvedených příkladech symetrická a pozitivně definitní. Vektor g se nazývá vektor zatížení. 3.2.2 Galerkinova metoda Základní myšlenka Galerkinovy metody vychází z toho, jak už bylo ostatně řečeno v odst. 4.2.2 v kap. II, že řešení dané okrajové úlohy vyhovuje rovnici [u, v] = (/, v) pro každou funkci «6^. Je-li @tf konečnědimenzionální podprostor prostoru @, je galerkinovské přibližné řešení taková funkce »íjv £ $n, pro niž platí (3.29) [uN,VN\ — (/, Djv) pro každou funkci Vn E %>n- Tvoří-li funkce $1,..., <řjv bázi v prostoru ízVi je toto přibližné řešení dáno stejnými vzorci jako u Ritzovy metody. Galerkinova metoda je tedy totožná s Ritzovou metodou, jsou-li obě realizovatelné, a stejně jako v jednodimenzionálním případě je Galerkinova metoda obecnější, neboť se dá užít i v těch případech, kdy danou okrajovou úlohu nelze formulovat jako minimalizační úlohu. Kvalita aproximace získané jak Galerkinovou, tak Ritzovou metodou je dána volbou konečnědimenzionálního prostoru !zV, tj. volbou bázových funkcí $1,..., <3>jv. Zejména v předpočítačové éře numerického počítání byla navržena řada postupů, jak tyto bázové funkce volit hlavně s ohledem na to, aby v součtu (3.25) stačilo k přijatelné představě o chování řešení vzít jen několik málo sčítanců. Tato snaha byla diktována zejména tím, že na mechanických stolních kalkulátorech nebylo možné 300 4 METODA KONEČNÝCH PRVKŮ a únosné provádět příliš velký počet početních operací. Tak např. se doporučovalo vzít za bázové funkce vlastní funkce „podobného" problému, přičemž podobný problém znamenal problém, v němž se např. místo proměnných koeficientů vzaly konstantní koeficienty, daná oblast se vnořila do nějaké kanonické oblasti apod. Je zřejmé, že univerzálnost těchto postupů byla značně omezená a že problémy, které bylo možno takto uspokojivě řešit, byly jen velice speciální. V současné době se Ritzova a Galerkinova metoda užívá takřka výhradně v souvislosti s metodou konečných prvků. V této metodě byl nalezen značně univerzální způsob konstrukce konečnědimenzionálních podprostorů prostoru, v němž hledáme řešení. Metoda konečných prvků tak umožňuje řešit s velkou přesností i značně obecné problémy. Pro její důležitost jí budeme věnovat samostatný článek i přesto, že spadá pod obecné schéma variačních metod. 4 Metoda konečných prvků Při popisu Ritzovy a Galerkinovy metody v odst. 3.2 jsme uvedli, že tyto metody mají v současné době největší význam ve spojitosti s metodou konečných prvků jako systematického způsobu konstrukce konečnědimenzionálních prostorů, v nichž hledáme příslušné aproximace. V tomto článku popíšeme důležité základní typy prostorů konečných prvků vhodných k řešení dvoudimenzionálních problémů a ukážeme teoretické problémy, které je třeba při jejich užití řešit. Všimneme si také, velice stručně, některých aspektů početní realizace metody konečných prvků. Začneme rekapitulací základních hledisek, která je záhodno respektovat při konstrukci konečnědimenzionálních prostorů nutných k užití Ritzovy-Galeikinovy metody. Tato hlediska jsou do značné'míry podobná těm, která jsme uvedli už v jednodimenzionálním případě, a proto je připomeneme jen velice krátce. Pro určitost a jednoduchost budeme mít zde na mysli úlohy druhého řádu. Pro rozdíl přibližného řešení ufi získaného Ritzovou-Galerkinovou metodou a přesného řešení u dané úlohy platí i zde nerovnost typu (4.1) ■ "Jvljjři(fi) á M inf ií||#(n) ■ Jde-li o Ritzovu metodu, tj. je-li daná okrajové úloha definovaná jako minimalizační úloha a je-li příslušná energetická norma ekvivalentní s normou v Sobolevově prostoru Jťl, plyne tato nerovnost z faktu, že i ve dvoudimenzionálním případě je přibližné řešení ortogonální projekcí (v energetickém skalárním součinu) přesného řešení do příslušného podprostorů. Nerovnost (4.1) však platí pro podstatně širší množinu problémů čítaje v to i okrajové úlohy, které nelze formulovat jako úlohy na hledání minima funkcionálu F a u nichž lze hovořit pouze o slabém řešení. V této souvislosti se nerovnost (4.1) spojuje se jménem Céovým (viz např. Ciarlet (1978)). Otázka přesnosti Ritzovy-Galerkinovy aproximace je tedy opět jako v jedné dimenzi otázkou, jak přesně lze aproximovat funkci z prostoru @ (což je většinou prostor 301 - III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU Jř^íí) nebo jeho podprostor) funkcí z prostoru S>y. První požadavek, který je tedy při konstrukci podprostoru 0jv žádoucí respektovat, je, aby měl dobré aproximační vlastnosti. Druhé, stejně důležité hledisko při konstrukci prostoru &n je požadavek maximální efektivnosti vzniklého algoritmu. Z rovnic (3.25) až (3.28) je vidět, že při realizaci Ritzovy-Galerkinovy metody je třeba vypočítat prvky matice A a složky vektoru g, řešit soustavu lineárních rovnic (3.26) a konečně provést součet (3.25). Zvolený prostor &n musí tedy umožňovat takovou volbu báze, aby se prvky matice A a složky vektoru g počítaly co nejsnáze a aby matice soustavy (3.26) byla pokud možno řídká nebo ještě lépe pásová. Posledního požadavku se dosáhne tehdy, mají-li bázové funkce malé nosiče ve srovnání s oblastí íž. Skalární součin ve vzorci (3.27) je totiž dán pomocí integrálů přes oblast fi a zmíněná vlastnost má pak za následek, že většina prvků matice A je rovna nule. Je tedy žádoucí volit bázové funkce tak, aby měly i tuto vlastnost. Konečně zmenšení počtu potřebných operací se dosáhne také tehdy, mají-li některé (nebo všechny) koeficienty ct přímo význam hodnot přibližného řešení v některých bodech dané oblasti, neboť pak odpadne nutnost počítat hodnoty součtu (3.25). Metoda konečných prvků tyto požadavky do značné míry splňuje. Její základní myšlenka je založena na interpolaci a představuje přímé, nikoliv však triviální rozšíření myšlenek, z nichž jsme vycházeli v jednodimenzionálním případě. Při konstrukci prostoru 0jv je tedy třeba rozdělit danou oblast Q na konečný počet geometricky jednoduchých podoblastí a interpolaci provést pomocí funkcí, které jsou po částech rovny polynomům v těchto jednotlivých podoblastech. Každý polynom definovaný na určité podoblasti budeme charakterizovat funkčními hodnotami, eventuálně hodnotami některých derivací v nějakých pevně zvolených bodech této podoblasti tak, aby byl těmito podmínkami jednoznačně určen. Tyto body nazveme stejně jako v jednodimenzionálním případě uzly a příslušné veličiny, které v nich zadáváme, uzlovými parametry. První problém, kterým se tedy musíme zabývat, je volba rozkladu oblasti fi. Tento rozklad by mčl být najedná straně tak obecný, aby dovoloval modelovat nepravidelné oblasti, na druhé straně tak jednoduchý, aby příliš nenarůstala výpočetní složitost. Praktické zkušenosti ukazují, že těmto do jisté míry protichůdným požadavkům velmi uspokojivě vyhovují jednoduché trojúhelníky nebo čtyrúhelníky. Při konstrukci konečnědimenzionálních prostorů metodou konečných prvků budeme tedy v dalším výkladu předpokládat, že daná oblast je sjednocením konečně mnoha trojúhelníků nebo čtyřúhelníků, přičemž kombinace obou útvarů současně nebudeme připouštět. Dále pak budeme předpokládat, že pro libovolné dva útvary rozkladu nastává právě jeden z těchto případů: (a) útvary jsou disjunktní; (b) útvary mají společnou celou jednu stranu; (c) útvary mají společný jeden vrchol (viz obr. 4.1 a 4.2). O útvarech, pro něž na stává případ (b) nebo (c) budeme mluvit jako o sousedních útvarech. Za uzly, v nichž zadáváme uzlové parametry, tj, funkční hodnoty a hodnoty derivací, připouštíme kromě vrcholů ještě i některé další body ležící v daném 302 4 METODA KONEČNÝCH PRVKŮ Obr. 4.1 Rozklad oblasti na trojúhelníky Obr. 4.2 Rozklad oblasti na čtyrúhelníky trojúhelníku nebo čtyřúhelníků (např. středy stran, těžiště apod.). Protože některé uzly jsou společné pro více útvarů rozkladu, užijí se hodnoty odpovídajících uzlových parametrů pro interpolaci na všech těchto sousedních útvarech. Útvar rozkladu, na něm definované uzlové parametry a příslušný interpolační polynom nazveme konečným prvkem. Často také, zejména tam, kde nebude hrozit nedorozumění, budeme termín prvek užívat pro samotný útvar rozkladu. Souhrn všech funkcí, které jsou polynomiální na jednotlivých prvcích rozkladu, mají v sousedních prvcích stejné uzlové parametry a jsou dostatečně hladké, tvoří při všech možných hodnotách uzlových parametrů konečnědimenzionální podprostor ®\ Sobolevova prostoru Jz,*(f2). Prostor @£ budeme nazývat prostorem konečných prvků a jeho dimenze je zřejmě rovna počtu všech uzlových parametrů. Index h, kterým jsme opatřili jeho označení, udává závislost tohoto prostoru na velikosti jednotlivých prvků rozkladu použitých k jeho konstrukci a můžeme jej pokládat za rovný délce největší strany užitých prvků. 303 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU Při numerické realizaci Rítzovy-Galerkinovy metody je třeba sestrojit v prostoru 0* vhodnou bázi. Ve všech konkrétních případech prostorů konečných prvků, které v tomto článku zavedeme, je možno za bázi vzít množinu funkcí , které sestrojíme tak, že j-tý uzlový parametr položíme rovný jedné a všechny ostatní rovny nule. Takto sestrojená bázová funkce bude nenulová jen na těch prvcích rozkladu, které obsahují j-tý uzlový parametr. Bude mít tedy malý nosič, takže jeden ze zformulovaných požadavků na prostor, v němž hledáme řešení, je splněn. Protože některé nebo všechny uzlové parametry budou mít, jak uvidíme později, význam hodnot aproximované funkce, bude při popsané konstrukci báze splněn i další požadavek, totiž, že řešením soustavy lineárních rovnic (3.26) už dostaneme přímo veličiny, které nás zajímají. Tím, že jsme se omezili na trojúhelníkové a čtyřúhelníkové prvky, dopouštíme se při obecné křivočaré hranici vždy jakési chyby, neboť sjednocení všech prvků rozkladu tvoří polygon, který se nemůže přesně rovnat nepolygonální oblasti. Zjemněním rozkladu lze však danou oblast aproximovat s libovolnou přesností. Kromě toho se k lepšímu vystižení hranice oblasti užívají také křivočaré prvky (např. trojúhelníky, jejichž některé strany jsou parabolické oblouky apod.). Příslušné prostory konečných prvků se přitom konstruují na zcela stejných principech, jak bylo naznačeno. V dalších několika odstavcích si všimneme některých nejdůležitějších speciálních případů konstrukce prostorů konečných prvků. 4.1 Trojúhelníkové prvky V tomto odstavci popíšeme konstrukci takových prostorů konečných prvků, kdy základním prvkem rozkladu je trojúhelník. 4.1.1 Lineární Lagrangeův prvek Tento konečný prvek je založen na myšlence Lagrangeovy interpolace a jeho konstrukce se opírá o následující větu: Věta 4.1. Bud* K trojúhelník o vrcholech Pj = (xj,yj), j = 1,2,3, a buďte Uj, j — 1,2,3 libovolná reálná čísla,. Pale existuje právě jeden polynom IIi(x,y) prvního stupně, pro který platí (4.2) /ri(xilW) = iij, j = 1,2,3. Důkaz. Geometricky je tvrzení věty zřejmé, neboť každé tři body, které neleží v přímce, určují v trojrozměrném euklidovském prostoru právě jednu rovinu. Proveďme nicméně příslušný důkaz podrobně, abychom ukázali, jak postupovat později v komplikovanějších případech. Hledaný polynom je tvaru (4.3) JI1(x,y) = a + px + yy, 304 4 METODA KONEČNÝCH PRVKŮ kde a, 0 a 7 jsou konstanty, které je třeba zvolit tak, aby platilo (4.4) a + fixj+yyJ = ui, j = 1,2,3. Tato soustava tří rovnic o třech neznámých má při libovolné pravé straně právě jedno řešení tehdy a jen tehdy, má-li příslušná homogenní soustava rovnic pouze triviální řešení, neboli, jinými slovy, je-li každý polynom prvního stupně, který se anuluje ve vrcholech trojúhelníku K, identicky roven nule. Uvažovaný polynom je polynomem prvního stupně na každé úsečce ležící v trojúhelníku K. Odtud především plyne, že se anuluje na každé straně tohoto trojúhelníku, neboť je podle předpokladu roven nule v jejích koncových bodech. Odtud však už bezprostředně plyne, že se anuluje i v každém dalším bodě v K. Abychom to dokázali, stačí vést takovým bodem libovolnou přímku a uvažovat zkoumaný polynom na ní. Věta je dokázána. Často je výhodné psát polynom Tli ve tvaru 3 (4.5) Ili(x,y) = YlujPi(x>y)' 3=1 kde pj, j = 1,2,3 jsou polynomy, pro něž platí (4.6) r i, i = j, Pi(xj,yj) = i . ... i,j = 1,2,3. 16, i^li Z Cramerova pravidla ihned dostáváme, že je (4.7) P\{x,y) - det T[{X2V3 - x3y2) - (ife — y2)x + (s3 - x2)y], P2(x,y) - detT^391 ~ xiy3) - (ä/l yí)x + (*i - x3)y], P3{x,y) = detT[{XlV2 -X2Vl) - {V2 - yi)x + (x2 -xi)y], kde 7~ je matice soustavy (4.4), tj. (4.8) = 1 Xl Jíl 1 x2 tfe .1 xs ys Poznámka 4.1. Rovnice (4.9) Pj{x,y) = 0 je rovnice přímky, v níž leží strana trojúhelníku K protější k vrcholu (xj, yj). Tato poznámka je sice úplně elementárni, bude však důležitá pro vyšetřování prostorů konečných prvků založených na polynomech vyšších stupňů než jedna. Věta 4.1 dovoluje zavést Lagrangeův trojúhelníkový prvek jako polynom prvního stupně na příslušném trojúhelníku, který interpoluje funkční hodnoty v jeho 305 in. parciální diferenciální rovnice eliptického typu vrcholech. Uzlové parametry jsou tedy v tomto případě funkční hodnoty a uzly vrcholy trojúhelníku rozkladu. Prostor konečných prvků sestrojený pomocí popsaného prvku označíme symbolem . Každá funkce z tohoto prostoru je na každém trojúhelníku rozkladu lineární a protože v společných uzlech jsou uzlové parametry stejné, je také spojitá. Jej! parciální derivace jsou tedy po částech konstantní, z čehož plyne, že prostor J^1 je podprostorem Sobolevova prostoru Jť1. Je proto vhodný k řešení problémů druhého řádu. Bázi v prostoru vytvoříme postupem zmíněným výše, tj. za j'-tou bázovou funkci bereme funkci <ř3, která je v j-tém uzlu rovna jedné, ve všech ostatních uzlech rovna nule a na každém trojúhelníku je lineární. Každá bázová funkce je tedy v každém trojúhelníku rozkladu tvaru r-bokého jehlanu, kde číslo r udává počet trojúhelníků, které obsahují tento uzel (viz obr. 4.3). Obr. 4.3 Bázové funkce v prostoru ^} Bázová funkce příslušná k uzlu, který leží na hranici oblasti, je přirozeně tvořena pouze částí tohoto jehlanu. Chceme-li sestrojit prostor konečných prvků, který je podprostorem prostoru Jť0l (a který je tedy vhodný k řešení problémů druhého řádu s homogenní Dirichletovou okrajovou podmínkou), vypustíme z popsané soustavy bázových funkcí ty funkce, které jsou rovny jedné v uzlu ležícím na hranici. Z nerovnosti (4.1) plyne, že rychlost konvergence Ritzovy-Galerkinovy metody je dána přesností, se kterou je možno aproximovat přesné řešení prvkem užitého koneč-nědimenzionálního prostoru. Abychom byli schopni učinit si představu o rychlosti konvergence, musíme mít dispozici nějaké poznatky o aproximačních vlastnostech prostoru konečných prvků 3£ . V jednodimenzionálním případě jsme mohli každou funkci z prostoru Jt1(a,b) jednoduše aproximovat po částech lineární funkcí pomocí interpolace. Zde je situace složitější, neboť obecná funkce z prostoru Jf1(í2) nemusí být nejen spojitá, ale dokonce ani omezená (přesněji řečeno, není možné dosáhnout této vlastnosti změnou její definice na množině míry nula, neboť prvek prostoru Jř,1(í2) není jedna funkce, ale třída funkcí lišících se na množině míry nula), takže o její hodnotě nemá obecně smysl mluvit. Aproximaci dané funkce / £ Jř^flJ) funkcí fh £ áj,1 nelze tedy sestrojit přímo pomocí interpolace. Je však 306 4 metoda konečných prvku možné postupovat např. tak, že se nejprve sestrojí funkce / £ Jť2(Q), která funkci / aproximuje ve smyslu normy prostoru Jť1. To je možné, neboť množina Jť2(íí) je hustá v prostoru Jť1. K funkci / se pak sestrojí funkce f h jako její interpolace, což má smysl, neboť funkce / je už spojitá (tato skutečnost plyne z tzv. Sobolevo-vých vět o vnoření, viz např. Nečas (1967)). Pokud o aproximované funkci nemáme žádné další informace než jen ty, že leží v prostoru Jť1{CÍ), nelze o řádu chyby takto i jakkoliv jinak sestrojené aproximace nic říci. Aby bylo možné rozdíl f - fh nějakým použitelným způsobem odhadnout, je třeba zpřísnit požadavky na hladkost aproximované funkce. Jako příklad tvrzení tohoto typu uveďme následující větu. Veta 4.2. Nechť K je uzavřený trojúhelník o vrcholech P, = (xj, j/y), j = 1,2,3. Nechť u 6 ^2(K) a nechť ITu je polynom prvního stupně určený podmínkami {Hu)(P}) - u(Pj), j - 1, 2,3. Pak platí (4.10) ||u-/7u||^mš2^amax=J|£^" (4.11) max dai+°3(u - nu) < p K kde (4.12) a hic je nejdelší strana a qk průměr kružnice vepsané trojúhelníku K. Důkaz Zřejmě je IMI-sSoCK-) = max \u(x,y)\ (4.13) (IIu)(x,y) = Y^u(.>ci>yj)Pi(.!E>v)i kde pj jsou polynomy (4.7). Podle Taylorova vzorce platí ďu dtt (4.14) u(f, rj) - u(x, y) + fa(x, y)(t ~x> + fy(x< Mi -y) + R(xZ> i)> kde (4.15) R(x,y;Cv)-^(Lm-ri)2+ d2u dxdyv m-*)(n-y) + \d^(lň){n-y? a bod (£, íj) leží na úsečce spojující body ({, n) a (x, y). Položíme-li speciálně (£, rf) = (Xj,yj), máme pro j - 1,2,3 (4.16) "(zj.ľj) = u{x,y) + °Ax v\ j=l Pro libovolná reálná 7 a ä tedy platí 3 (4.25) -x) + Kvs - y)]pi(x y) 3=1 u(x,y)^{nu)(x,y) = - ^2Rj(x,y)pj(x,y). i=i (4.26) neboli (4.27) Protože pro (x,y) G K platí 0 í Pj(x, y) S 1, je 3 (4.28) \u{x,y) (iTii)(a!,»)|š$3|Ä<(*.»)l«{«.I/)š 3=1 3 ^ max lÄjfx, y)| Vpj(i,y) = max |1Íj-(jí,i/)|. Odtud a z nerovnosti (4.19) už bezprostředně plyne nerovnost (4.10). Abychom dokázali nerovnost (4.11), derivujme rovnici (4.13) podle x; dostaneme (4.29) 3=1 Dosadíme-li do této rovnice z rovnice (4.16), máme (4.30) dnu dx fy, 3=1 + '£Rj(x,y)^l(xP2) — v3 + (yi - yí)pi + (j/2 - y• i 0, j + k, Elementární polynomy p|-3' se přitom dají vyjádřit pomocí elementárních polynomů lineární interpolace. Prostor konečných prvků vytvořený pomocí polynomů II3 označíme Je opět podprostorem Sobolevova prostoru Jř1. Vytvoříme-li v něm bázi standardním postupem popsaným výše, je složena z funkcí, které jsou na jednotlivých trojúhelnících rovny některé elementární funkci pí3' a které mají malý nosič. Označíme-li opět fh interpolaci funkce / e Jľr, kde za číslo r připouštíme nyní hodnoty 2, 3 a 4, platí pro chybu nerovnost (4.58). Tento odhad už nelze dále zlepšit zvětšováním čísla r, tj. dalším zvyšováním hladkosti interpolované funkce. Měříme-li tedy velikost chyby normou Sobolevova prostoru Jťl(fí), vede Ritzova-Galerkinova metoda při použití prostoru k rychlosti konvergence řádu 0(h3), samozřejmě stejně jako dříve za předpokladu dostatečné hladkosti hledaného řešení. 316 4 METODA KONEČNÝCH PRVKO 4.1.4 Obecný Lagrangeův prvek V tomto odstavci popíšeme stručně bez jakýchkoliv důkazů, jak lze sestrojit obecný Lagrangeův prvek založený na interpolaci obecným polynomem stupně m. Polynom IIm stupně TU má Srn - (m-)-l)(m-(-2)/2 koeficientů, a lze jej tedy užít k interpolaci v sm uzlech umístěných v uvažovaném trojúhelníku. Uspořádáme-li jednotlivé sčítance v obecném polynomu stupně m do schématu znázorněného v tab. 4.1, máme v něm návod, jak potřebné uzly rozmísti symetricky: Každou stranu trojúhelníku P1P2P3 rozdělíme na m stejných dílů a takto vzniklé dělicí body spojíme přímkami rovnoběžnými se stranami trojúhelníku. Tímto postupem rozdělíme daný trojúhelník na ro2 podobných trojúhelníků, jejichž vrcholy, kterých je pravé sm, vezmeme za uzly. Popsaným návodem jsme se ostatně už řídili ve speciálních případech uvedených v odst. 4.1.1 až 4.1.3. Tabulka 4.1 Schéma obecného polynomu ve dvou proměnných X 1 y X2 xy v2 xa X2y xy2 V3 x* *3y xy' v1 Označíme-li Uj, j = 1,..., sm, hodnoty interpolované funkce v právě sestrojených uzlech, lze polynom i7m psát ve tvaru (4.65) nm{x, y) = Yl UMi (*• y) kde každá funkce p^-7™' je polynom stupně m, který nabývá v právě jednom uzlu hodnoty jedna a v ostatních uzlech hodnot nula. Každý z těchto elementárních polynomů py"1' lze opět složit z lineárních polynomů pi, P2 ap3. Pro příslušný prostor konečných prvků J^"1 platí C -Jť1 a jeho aproximační vlastnosti jsou popsány opět nerovností (4.58), v níž předpokládáme / G Jf' a za r připouštíme hodnoty 2,..., m + 1. Bázové funkce v prostoru Syf- mají opět malé nosiče a na jednotlivých trojúhelnících rozkladu jsou rovny elementárním polynomům pjm\ Prostor je možno užít opět pouze k řešení problémů druhého řádu, neboť není podprostorem žádného Sobolevova prostoru X'k s k > 1. Maximální dosažitelná rychlost konvergence je 0(hm). 317 III. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU I METODA KONEČNÝCH PRVKU 4.1.5 Hermitův prvek Jako alternativu k interpolaci funkčních hodnot v mnoha uzlech je možné uvažovat interpolaci hodnot dané funkce a hodnot některých jejích derivací, tj. interpolaci Hermitova typu, v menším počtu uzlů. Jedna z možností tohoto postupu v případě polynomů třetího stupně je založena na následující větě. Věta 4.6. Polynom třetího stupně je jednoznačně určen svými funkčními hodnotami a hodnotami prvních parciálních derivací podle x a y ve vrcholech trojúhelníku PiP2P3 a funkční hodnotou v jeho těžišti. Důkaz. Protože i v tomto případě je počet podmínek roven počtu koeficientů uvažovaného polynomu, stačí dokázat, že polynom u, pro který platí (4.66) ■ľ(xj,yj)=^(xj,yj) = ~{xhyj)-0, j = 1,2,3, «(14,5/4) = 0, kde (xj , yj), j = 1,2,3, jsou souřadnice vrcholů trojúhelníku PiP2P3 a Pa - (*4, Sto) je jeho těžiště, je nulový polynom. Z rovnic (4.66) plyne, že je t. ^ 9u. . du du. (4.67) fo(Xj,y^ = dx~(Xi'y^Sl + ~tTyi-x''V^ = °' kde d/ds je derivace ve smeru s = (si, s2). Speciálně je tedy (4.68) ^(*2,Ih) = £(ea,lft) = 01 kde s je směr od bodu P2 do bodu P3. Protože je také «(3:2, J/2) = v(x3,y3) = = 0 a protože funkce « je podél úsečky P2P3 polynomem třetího stupně, je funkce u rovna na této úsečce identicky nule. Podobně se dokáže, že u se anuluje i na zbývajících dvou stranách trojúhelníka. Důkaz věty se nyní už zakončí za užití podmínky «(14, j/4) = 0 stejně jako důkaz věty 4.5. Kubický Hermitův prvek dostaneme tak, že za uzly vezmeme vrcholy P\, P2 a P3 daného trojúhelníka a jeho těžiště P4 a za uzlové parametry funkční hodnoty v uzlech Pi až P4 a hodnoty prvních parciálních derivací podle x a y v uzlech Pi až P3. Prostor konenčných prvků vytvořený právě popsaným kubickým prvkem označíme Vytvoříme-li jeho bázi naším standardním postupem, tj. položíme-li vždy právě jeden uzlový parametr rovný jedné a ostatní parametry rovny nule, mají bázové funkce opět malé nosiče. Prostor Jfj? je stejně jako prostor pouze podprostorem Sobolevova prostoru Jťl, takže je vhodný pouze k řešení problémů druhého řádu. Jeho aproximační vlastnosti jsou popsány nerovností (4.58) s r = 3 a 4, a jsou tedy stejné jako aproximační vlastnosti prostoru Za číslo r v nerovnosti (4.58) zde však nepřipouštíme hodnotu 2, jako tomu bylo v případě prostoru 5^3. Důvod je ten, že ke konstrukci interpolace v prostoru nestačí užít pouze hodnoty interpolované funkce, ale jsou zapotřebí hodnoty jejích derivací, a ty pro funkci z prostoru JŠ?2 nemusí mít smysl. Podobně jako jsme vytvořili kubický Hermitův prvek a prostor konenčných prvků , dají se vytvořit prostory S"^"^1 pro libovolné v = 1,2,____Stačí k tomu vzít za uzly stejně jako v kubickém případě vrcholy daného trojúhelníku a jeho těžiště a za uzlové parametry hodnoty interpolované funkce a jejích všech parciálních derivací až do řádu v včetně ve vrcholech trojúhelníku a hodnoty interpolované funkce a jejích parciálních derivací až do řádu v — 1 včetně v těžišti. Prostor ^j2""1"1 je stále vhodný pouze k řešení rovnic druhého řádu, neboť je podprostorem pouze prostoru Jť1 a není podprostorem žádného Sobolevova prostoru Jťk pro jfc > > 1. Lze však pomocí něj, stejně jako pomocí obecného Lagrangeova prvku, docílit rychlosti konvergence Ritzovy-Galerkinovy metody libovolně vysokého řádu, neboť jeho aproximační vlastnosti jsou dány nerovností (4.58) s r = 1/ + 2,..., 2ľ + 2. 4.1.6 Prostory konečných prvků pro řešení diferenciálních rovnic čtvrtého řádu Prostory konečných prvků, které jsme až dosud sestrojili, obsahují funkce, jejichž první parciální derivace mohou být podél straň trojúhelníků rozkladu nespojité. Takové funkce proto patří pouze do Sobolevova prostoru JŽ°1(Í2), Abychom sestrojili prostory, které jsou podprostory Sobolevova prostoru Jf2(Sl) a které jsou tak vhodné k řešení problémů čtvrtého řádu, je třeba, aby byly spojité nejen příslušné funkce samotné, ale i jejich první parciální derivace. Nejjednodušší prvek, pomocí něhož to lze dosáhnout, je založen na interpolaci polynomy pátého stupně. Při volbě uzlů a uzlových parametrů, kterých je zapotřebí 21, je však třeba postupovat jinak, než jsme postupovali při konstrukci prostoru S^jf založeného také na polynomech pátého stupně. Požadované spojitosti prvních parciálních derivací se dosáhne, jak hned uvidíme, tak, že za uzly se zvolí vrcholy Pi, P2 a P3 daného trojúhelníku a středy jeho stran P4, Pg a Pg a zá uzlové parametry se berou funkční hodnoty prvních a druhých parciálních derivací ve vrcholech a hodnoty derivace podle normály ve středu stran. Nejprve však ukážeme, že polynom pátého stupně je zvolenými uzlovými parametry skutečně jednoznačně určen. Veta 4.7. Polynom II5 pátého stupně je jednoznačně určen svými hodnotami a hodnotami parciálních derivací až do řádu dvě ve vrcholech trojúhelníka a hodnotami derivací podle normály ve středech jeho stran. Důkaz. Zřejmě stačí podobně jako při důkazu napr. věty 4.6 dokázat, že polynom u pátého stupně, pro který platí (469) ftť.iair.fo-»> = 0- «i + «3Í2, aigo, «2^o, j = 1,2,3, ^(*3,5/j)-0, j- 4,5,6, 318 319 [II. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE ELIPTICKÉHO TYPU 4 METODA KONEČNÝCH PRVKU je nutné nulový polynom (je samozřejmě Pj = (x j, j/j), j = 1,..., 6, a body P, jsou rozmístěny jako na obr. 4.4). Abychom to nahlédli, všimneme si především, že pro j = 2,3 platí (4.70) kde s značí směr úsečky P2P3. Protože funkce ti je na úsečce P2P3 polynom stupně nejvýše pět, plyne z podmínek (4.70), že je na ní identicky roven nule. Protože funkce dujdn je na této úsečce polynom stupně nejvýše čtyři a protože pro j = 2, 3 platí (4-Tl) £(*i.W) = ž(S^W)*Í0 a samozřejmě také (4.72) du dn (»5,2/5) = 0, je funkce dujdn identicky rovna nule na úsečce P2P3. Protože tedy obě funkce u a dujdn se anulují na P2P3, dá se polynom u psát ve tvaru (4.73) u{x, y) = [pi(x, y)]2u3(x, y), kde U3 je polynom nejvýše třetího stupně. Poslední tvrzení platí ovšem i pro další dvě strany trojúhelníku P1P2P3; platí tedy (4.74) v) = 7b>i(z, y)]2b>2(x, y)Ý\p4*, y)Ý Protože však u je polynom stupně nejvýše pět, je nutně 7 = 0. Je tedy u = 0 a věta je dokázána. Buďte nyní Kí a K2 dva trojúhelníky se společnou stranou S, buďte «1 a u2 polynomy pátého stupně definované na K\, resp. K2 a předpokládejme, že platí (4.75) dx^dy"* dx^dy** , v koncových bodech S, Sui _ ô«2 ^ stře1), (0,0) a (1,0). Podobně lze také vyjádřit funkce 4>^ 4.2.2 Obdélníkové Hermitovy prvky Tyto prvky jsou založeny na Hermitově interpolaci a formálně je sestrojíme jako součin jednorozměrných Hermitových spline-funkcí (viz odst. 4.3.2 z kap. II). Vzniklý prostor konečných prvků označíme JŽ2"-1. Tento prostor je tvořen funkcemi, které se na každém obdélníku rovnají funkci U, která je součinem polynomů naj stupňů Iv - 1, a je tedy tvaru 2ľ-12ľ-l (4.83) U(x,y) = £ £° 0 a dujdnc je derivace ve směru konormály. 330 Podmínka (1.4) je počáteční podmínka a podmínka (1.5) okrajová podmínka. Pro okrajovou podmínku (1.5) se také užívá při a = 0 (podobně jako v případě okrajové úlohy pro eliptickou parciální diferenciální rovnici) název Dirichletova podmínka, při 0 = 0 Neumannova podmínka a v obecném případě Newtonova podmínka. Otázkami řešitelnosti právě zformulované úlohy se nebudeme zabývat a odkážeme čtenáře na obsáhlou specializovanou literaturu (viz např. Petrovskij (1952) nebo Friedman (1964) pokud jde o klasickou teorii, nebo Lions (1961) pokud jde o moderní funkcionálně analytickou teorii.) Důvody pro to jsou podobné, jako tomu bylo v kap. III, a nebudeme je proto znovu opakovat. Všimneme si však jiné okolnosti patrné ostatně na první podhled. Z rovnice (1.1) a z doplňujících podmínek (1.4) a (1.5) je vidět, že proměnná i, jejíž fyzikální význam je obvykle čas, má mezi všemi nezávislými proměnnými výjimečné postavení a že vzhledem k této proměnné má daná úloha charakter úlohy s počátečními podmínkami, zatímco vzhledem k ostatním proměnným, nazvěme je prostorovými proměnnými, jde o okrajovou úlohu. Dá se proto očekávat, že algoritmy pro řešení dané úlohy budou mít vzhledem k proměnné í rekurentní charakter, a že tedy metody pro numerické řešení parabolických problémů budou vykazovat současně rysy metod pro řešení úloh s počátečními podmínkami i okrajových úloh. Tato skutečnost bude v dalším výkladu zřetelně patrná a přinese také některé specifické zvláštnosti. Z metod pro přibližné řešení parabolických parciálních diferenciálních rovnic popíšeme podrobně zejména metodu sítí čítaje v to důležitý speciální případ metody střídavých směrů. Dále pak si všimneme tzv. semidiskrétních metod. Tyto metody jsou obdobou metody přímek, o níž jsme se zmínili v kap. III, a spočívají v tom, že diskretizace se provede pouze vzhledem k prostorovým proměnným ati,..., xm a proměnná ť (čas) se ponechá spojitá. U těchto metod se tedy řešení původní úlohy aproximuje řešením soustavy obyčejných diferenciálních rovnic. Pokud se při zmíněné diskretizaci vychází z myšlenky metody sítí, vznikne klasická metoda přímek, užijeme-li metodu konečných prvků, dostaneme semidiskrétní metodu Galerkinova typu. Podobné semidiskrétním metodámjsou metody Rotheovy, kdy se diskretizace provádí pouze vzhledem k proměnné í. Náhradní úloha je pak okrajová úloha pro eliptickou soustavu diferenciálních rovnic. I o těchto metodách se stručně zmíníme. 2 Metoda sítí Metoda sítí vychází i zde z úplně stejných principů, jak jsme o nich hovořili v kap. II a III, a je to jedna z nejpopulárnějších metod pro řešení parabolických diferenciálních rovnic. Užití metody sítí k řešení okrajových úloh pro obyčejné diferenciální rovnice a pro eliptické parciální diferenciální rovnice vede, jak víme, na soustavy lineárních algebraických rovnic. Zde je tomu v principu také tak, v důsledku zvláštního postavem proměnné t však budou tyto soustavy speciálního charakteru, což přinese některé další jevy, zejména problém stability, s nimiž jsme se až dosud ne- 331 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU setkali. Abychom tyto problémy co nejjednodušeji objasnili, vyšetříme metodu sítí nejprve v jednoduchém speciálním případě. 2.1 Rovnice pro vedení tepla v jedné prostorové proměnné V tomto odstavci se budeme zabývat rovnicí du 82u (2.1) i„=^_^_ = o, £ e (0,1), te(0,r) s počáteční podmínkou (2.2) u(x,0) - g(x), x e (0,1) a okrajovými podmínkami (2.3) U(0,í) = u(l,ť) = 0, í€(0,r), která je zřejmě speciálním případem rovnice (1.1) a která se vzhledem ke své nej-běžnější fyzikální interpretaci nazývá rovnicí pro vedení tepla. Začneme dvěma nej-jednoduššími variantami metody sítí pro řešení této rovnice. Předtím však ještě poznamenejme, že existence a jednoznačnost řešení úlohy (2.1) až (2.3) je zaručena např. spojitostí a omezeností funkce g. 2.1.1 Explicitní a implicitní metoda V případě úlohy (2.1) až (2.3) je množina R obdélník (0,1) x (0,T). Sestrojme v něm síť složenou z přímek x = xk a í = íj, kde xk = kh, k — 0,...,n, h = 1/n, ti = ít, i = 0,..., r, T = T jr a n ar jsou přirozená čísla. Skutečnost, že proměnné x a ť nemají v rovnici (2.1) stejnou roli tedy respektujeme tím, že uvažujeme síť obdélníkovou nikoliv čtvercovou. Znakem Äj,lT označme množinu všech uzlů (xk,ti) ležících v Ř, znakem fíj,T označme ty uzly (xk,t{), pro něž je fc = 1,... ,n — 1 a f = = 1,..., r, a Th.r uzly, které leží na úsečkách t = 0, 0 g as g 1, ac = 0, 0 )jj.° - u(xk,U), jak se snadno zjistí pomocí Taylorova vzorce. 332 2 METODA SÍTÍ Vzhledem k této rovnici je přirozené hledat přibližné řešení ze soustavy rovnic (2.6) = 0, * = l,...,n-l, í=l.....r. Protože těchto rovnici je zřejmě méně než neznámých, jek nim třeba ještě připojit rovnice (2.7) ui0)=g(xk), t = 0, a (2.8) = /=1) ,.jPi získané z počáteční podmínky a z okrajových podmínek. Všimněme si, že jsme se zde přiklonili k možnosti předepsat hodnoty přibližného řešení v rohových uzlech (0,0) a (1,0) z počáteční podmínky. Stejně oprávněně jsme mohli také užít okrajové podmínky. Zádáme-li totiž, aby řešení úlohy (2.1) až (2.3) bylo alespoň spojité v R, je nutné, aby pro funkci g platily podmínky g(0) = g(í) = — 0. Tyto podmínky se nazývají podmínkami souhlasu, a nejsou-li splněny, je nutně řešení dané okrajové úlohy v bodech (0,0) a (1,0) nespojité. V tomto případě je pak jedno, kterou z uvedených možností zvolíme. Soustava (2.6) až (2.8) představuje soustavu (n + l)(r + 1) rovnic pro (n + l)(r + 4- 1) hodnot hledaného řešení v uzlech sítě ležících v Ř\T. Tato soustava je však velice speciální. Každá z rovnic (2.6) obsahuje pouze jednu hodnotu přibližného řešení v čase t = i( a rovnice (2.7) a (2.8) pak přímo udávají hodnoty některých neznámých. Vynásobíme-li rovnice (2.6) číslem r, dostaneme po elementární úpravě (2.9) 40 = (hj'-u+(1 _ 2/j)«r >+p4;1\ k = 1,. ., ři - 1, / = 1, ,., r, kde (2.10) Protože přibližné řešení 4°'' pro k = 0,..., u známe, můžeme použitím rovnic (2.9) s 1 = 1 vypočítat hodnoty pro k = 1,..., n — 1; hodnoty uk^ °pět známe (v našem případě jsou to nuly), můžeme tedy vypočítat pro k = 1,..., n — — 1 atd. Přibližné řešení počítáme tedy rekurentně postupně pro přibývající časové řádky sítě. Žádný problém s řešením odvozené soustavy vlastně nevzniká a rovnice (2.9), (2.7) a (2.8) popisující diferenční schéma udávají přímo algoritmus přibližného řešení uvažované úlohy. Z tohoto důvodu se právě popsaná varianta metody sítí nazývá explicitní metoda nebo explicitní schéma. Lokální chyba, tj. chyba, která vznikne náhradou derivací v původní diferenciální rovnici diferenčními podíly, je u explicitní metody za předpokladu dostatečné hladkosti přesného řešení velikosti 0(r + h2) (srv. rovnici (2.5)). Je tedy při dostatečně jemné síti libovolně malá, V eliptickém případě měla tato skutečnost většinou za 333 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU 2 METODA SlTl následek konvergenci, neboť diferenční rovnice vzniklé na základě zmíněného jednoduchého principu náhrady derivací diferenčními podíly byly už v podstatě vždy korektní, tj. jejich řešení spojitě záviselo na vstupních datech úlohy. Abychom posoudili platnost tohoto závěru v případě parabolické rovnice, začneme jednoduchým příkladem. Příklad 2.1. Řešme rovnici (2.1) s okrajovými podmínkami (2.3) a s počáteční podmínkou g(x) — sinu. V tomto jednoduchém příkladě je přesné řešení dáno vzorcem (2.11) u(x, t) — e * i sin 7rx. takže lze snadno posoudit chybu vypočteného přibližného řešení. Protože lokální chyba je řádu 0(r + A2), zvolili jsme časový integrační krok t řádově rovný druhé mocnině prostorového integračního kroku h. Přibližné řešení a jeho chyba v bodě x = 1/2 je pro dvě alternativy sítě uvedeno v tab. 2.1 (symbol co v ní značí, že došlo k přeplnění). Tabulka 2.1 Řešeni rovnice (2.1) explicitní metodou T .10000 T = 10-4 h = 10-2 T = 10"4, h = 2.10-2 přibl. řeš. chyba přibl. řeš. chyba 1 0,999 013 2 0,0000004 0,999012 9 0,0000006 2 0,998 0271 0,0000009 0,998 0273 0,000 000 7 3 0,997042 5 0,000 0010 0,997042 4 0,000 0011 4 0,9960578 0,000 0021 0,996 058 2 0,000 001 7 5 0,995 076 7 0,000 000 7 0,995 075 0 0,000002 4 6 0,994 089 9 0,000 005 8 0,994 093 2 0,000002 6 7 0,9931213 -0,000 006 2 0,9931121 0,000 002 9 8 0,992107 9 0,000 0275 0,992 1319 0,000003 5 9 0,9912201 -0,000063 4 0,991153 0 0,000 003 7 10 0,989 9864 0,000192 6 0,990 1 74 8 0,000 004 4 96 -2,83.1037 2,83.1037 0,909 562 3 0,000 0396 97 8,52.1037 -8,52.103T 0,908664 7 0,0000400 98 -2,56.1038 2,56.1038 0,907 768 2 0,0000401 99 7,72.1038 -7,72.1038 0,9068723 0,000 040 5 100 -2,32.1038 2,32.103S 0,905 9775 0,0000406 10 000 co oo 0,000 051 5 0,000 0002 334 Z této tabulky vidíme, že v případě sítě r - 10~4, h = 10-2 dostáváme úplně nesmyslné výsledky, zatímco v druhém případě, i když užitá síť je hrubší, jsou výsledky přijatelné. Pokusme se vysvětlit, proč tento na první pohled jistě překvapivý jev nastal. Položíme-liuM podmínkami (2.8) psát ve tvaru fl'li)Ti můžeme rovnici (2.9) s příslušnými okrajovými (2.12) kde (2.13) ul» = AEuV-1\ 1 = 1,....r, 1-2/3 fi 0 0 fi 0 •• '•■ o ■■, ■•. fi 0 6 1-2/? je matice řádu n—1 a t/°) je známý vektor určený počátečními podmínkami. Matice Ag charakterizuje operaci přechodu od (/ — l)-ního časového řádku sítě k /-tému řádku, a nazývá se proto matice přechodu. Z rovnice (2.12) ihned plyne, že platí «('> = AÍuC°> (2.14) í = 0,. Chování složek vektoru o W v závislosti na / je tedy určeno chováním prvků matice AE. Vlastní čísla A„ matice Ae a příslušné vlastní vektory v M -— (v[ jsou však dány jednoduchými vzorci ľ7T „O) JT (2.15) A„ = l-4/?sin'! 2n' v= l,...,n- 1, (2.16) visk k = 1,. 1, jak se snadno zjistí přímým výpočtem. Ze vzorce (2.15) plyne, že vlastní číslo A„_i je pro velká n přibližně rovno číslu 1 — 4/5. Některé prvky matice AE se tedy chovají jako {1 - 4/?)'. Je-li však fi > 1/2, je 1 - 4/3 < -1, a tedy alespoň jeden prvek matice AB musí při rostoucím l exponenciálně růst. Tato situace právě nastala pro první síť užitou v příkladě 2.1, neboť pro ni je fi = 1. Platí-li však, že je (2-17) fi g i, plyne ihned ze vzorce (2.15), že všechna vlastní čísla matice Ag js0u v absolutní hodnotě menší než jedna, Prvky matice A^ jsou tedy omezené konstantou nczávis- 335 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU 2 METODA SlTÍ lou na r a n. Tento prípad nastal pro druhou síť v uvedeném příkladě, neboť pro ni je /» = 1/4. Na základě uvedeného rozboru je zřejmé, že podmínka (2.17) je v případě uvažované diferenciální rovnice nutnou podmínkou konvergence. Následující věta ukazuje, že jde i o podmínku postačující. ^ Věta 2.1. Nechť tešení problému (2.1) až (2.3) existuje a má\yR dvě' spojité derivace podle t a čtyři spojité derivace podle x. Nechť dále platí (2.17). Pak existují konstanty M a ho > 0 takové', že pro h £ h0 a pro každý uzel (xk,ti) £ Ěh,r platí (2.18) I"!0-«(**,*()l = M(r+h2). Důkaz Pro přesné řešení platí za uvedených předpokladů (2.19) (c)u(pr))*° = -4°, (».*•) 6 *,„ kde funkce u'pr) je definována stejně jako ve vzorci (2.5) a kde (2.20) |4'}| ÍK(T + h2). Pro chybu rfp = u1^' - u(xt,,ti) tedy platí (2.21) neboli (2.22) =0, Jr = 0,. 1,..., n — 1, í = 1,..., r, ,«=,(0 = 0, | = 1,; k = 1,... ,n — 1, / = 1,..., r s příslušnými počátečními a okrajovými podmínkami. Z rovnic (2.22) a z nerovností (2.20) však snadno indukcí dokážeme, že platí (2.23) \nT\SirK(t + h2) pro ř = 1,..., r, neboť koeficienty v lineární kombinaci na pravé straně rovnice (2.22) jsou v důsledku splnění nerovnosti (2.17) nezáporné. Je tedy (2.24) S ttK{t + h2) = TK(r + h2), což dokazuje větu. Užití operátoru vede tedy ke konvergentní metodě, při limitním přechodu jsou však parametry sítě vázány nerovností (2.17). Z právě dokončeného důkazu věty 2.1 však plyne, že podmínka (2.17) zaručuje nejen konvergenci uvažované metody při h —» 0, r —► 0, ale i její uspokojivé chování vzhledem k zaokrouhlovacím 336 chybám. Při splnění této podmínky je tedy explicitní metoda v tomto smyslu stabilní. Naopak rozumné chování metody, u níž je podmínka (2.17) porušena, se nedá očekávat ani ve speciálním případě. Tak např. při užití první sítě v příkladě 2.1 jsou přesné hodnoty přibližného řešení ujj.^ dány vzorcem (2.25) «1° = (l ■ Z tohoto vzorce je vidět, že v případě speciální počáteční podmínky «(i, 0) = sin tsx přesné hodnoty přibližného řešení nejen že nejsou nesmyslné, ale dokonce uspokojivě aproximují přesné řešení. Jelikož však mocniny matice přechodu užitého schématu nejsou omezené, rekurentní výpočet přibližného řešení se v důsledku zaokrouhlování zhroutí, a to, jak je vidět z tab. 2.1, velmi rychle. Explicitní schéma, které jsme právě popsali, je tedy stabilní ve výše zmíněném smyslu, je-li splněna podmínka (2.17); v opačném případě je nestabilní. Protože jeho stabilita závisí na splnění podmínky, která podřizuje časové dělení sítě prostorovému dělení, mluvíme o relativně stabilním schématu. Podmínku stability (2.17) musíme samozřejmě respektovat i při zjemňování sítě. V tomto případě se tato podmínka může ukázat značně restriktivní, neboť rozpůlíme-li např. prostorový integrační krok, je třeba za časový krok brát čtvrtinu původního; počet potřebných časových řádků tak může neúnosně růst. Proto vzniká přirozená otázka, zda neexistuje diferenční schéma pro řešení úlohy (2.1) až (2.3), které by ke své stabilitě nevyžadovalo splnění žádné podmínky typu (2.17). Pokusme se takové schéma, které nazveme absolutně stabilní, nalézt. K explicitnímu schématu jsme došli tak, že jsme derivaci du/dt v uzlu (xt, ti-i) aproximovali podílem [u(eí, ťj) — «(sj,, r|_i)]/r. Tento podíl však aproximuje stejně dobře uvedenou derivaci i v uzlu (ij., t\). Stejně oprávněně můžeme tedy dojít místo 2 7t \ 1 . kw 1 2Ôô) Smiôô- k operátoru k operátoru L' danému rovnici (D (2.26) 2ul')+u (0 i ■*+lJ r1 * 1 ' h}[ neboť opět pro každou dostatečně hladkou funkci u platí (2.27) a£T)u(pr))í° = . *') + °(t+*2) (jak ihned plyne z Taylorova vzorce). Funkce i/pr' je přitom definována stejně jako ve vzorci (2.5). Přibližné řešení ti^ se tedy můžeme pokusit hledat z rovnic (2-28) aíM° = 0' * = !.■■■.n-1, í = l.....r, s počáteční podmínkou (2.7) a okrajovými podmínkami (2.8). Přepíšeme-li rovnice (2.28) podobně jako v případě explicitní metody, dostaneme -^1 + (l + 2/?)«íi)-M'l1 = 4'-1), k = 1, í= l,...,r, (2.29) 337 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU s příslušnými počátečními a okrajovými podmínkami. Použijeme-li znovu dříve zavedeného vektorového označení u'') = (u['\ ..., un^_1)T, lze rovnici. (2.29) spolu s okrajovými podmínkami (2.8) přepsat maticově do tvaru (2.30) kde (2.31) Am» = „('-D, igi.....r 1 + 2/3 -0 0 -P '■■ 0 '■. '-. 0 -P 0 -p 1 + 2/3. je opět třídiagonální matice řádu n 1 a ií'0' je známý vektor určený počáteční podmínkou. Řešení probíhá opět rekurentně od jednoho časového řádku k druhému, k získání přibližného řešení v /-tém časovém řádku za předpokladu, že v (/ — l)-ním časovém řádkuje už známe, je však třeba řešit soustavu n—1 lineárních rovnic o n—1 neznámých s třídiagonální maticí (2.31). Z tohoto důvodu se metoda (2.28) nazývá implicitní metoda nebo implicitní schéma. Výpočet je proveditelný při libovolné hodnotě P, neboť matice A\ je zřejmě regulární. Dá se to zjistit např. pomocí lemmatu 3.5 z kap. II (viz str. 166), neboť matice A\ je ireducíbilně diagonálně dominantní při libovolném kladném p, má kladné diagonální prvky a nekladné nediagonální prvky. Roh matice přechodu implicitní metody hraje matice A^1. Vlastní čísla jiv této matice jsou dána vzorcem (2.32) uu--!—=-, v = l,...,n-l, y ' F l+4/W§£' ' ' takže jsou při libovolném p > 0 v absolutní hodnotě menší než 1. Přechod od (/ — l)-ního časového řádku k /-tému časovému řádku je tedy stabilní při libovolném poměru prostorového a časového dělení sítě a v implicitní metodě tak máme příklad absolutně stabilní metody. Obraťme se nyní ke studiu její konvergence. Stejně jako v případě explicitní metody, platí pro chybu t;® = ujj.'' — "(*t,ť/) této metody rovnice (2.33) n£O) = 0, i = 0,...,n, (') i-l, i = 1, 0, í = l.....r, a existuje konstanta K taková, že je (2.34) 338 2 METODA SlTl Rovnice pro chybu implicitní metody jsou tedy také implicitní, takže už nejsme schopni tak snadno jako v případě explicitní metody odhadnout na jejich základě velikost chyby. Dokážeme proto nejprve několik pomocných tvrzení. Lemma 2.1. Nechť pro funkci definovanou na množině JŠjíiT platí (2 35) ž 0, (**,*!) € Pat pro každý uzel (xk,t\) £ S^, platí (2.36) nf° < (0 ní S max rň'. B ů k a z . Buď M — max r$ a nechť existuje uzel (ej„, tjB) e Rh,r, pi° který je = M. V tomto uzlu platí nerovnost (2.35), kterou můžeme psát ve tvaru (2.37) (i + - pn^l, - (hfcl - nll;-v š o. Předpokládáme-li nyní, že aspoň v jednom z uzlů (zi,,, 0), že je (2.38) 0 = (1 + 20)M - pM - pM - M < < (1 + 2/J)^-/^, a to je spor. Je tedy ijj^Zj = li'°+i = = M- Pokračujeme-li tímto způsobem dále, dospějeme nutně k uzlu z th,r, ve kterém funkce n nabývá hodnoty M. Lemma je dokázáno. Právě dokázané lemma ukazuje, že operátor splňuje princip maxima. Lemma 2.2. Nechť pro funkci r/^ definovanou v Ři,tT platí rovnice (2.33) a buď (2.39) E = max |e co. Pat existuje konstanta M (nezávislá na h ar) taková, že platí (2.40) Irj^l^Afe, k = 0.....n, / = 0,...,r. Důkaz . Položme rj^ == 1 - e**-1 pro ír = 0,..., n a / = 0,. Taylorova vzorce je 1 , r. Podle (2.41) e*H-i-l _ 2eJ"-1 +ea:*+1-1) = (eXl-1 -2e"k + eXk+1) - = e-1(e'' + i/iV')že-1. 339 iv. parciální diferenciální rovnice parabolického typu 2 metoda sítí Položme dále (2.42) takže je Protože podle (2.41) je e(Z.,^r)j' ^ 1, plyne z rovnice (2.39), že platí (2.44) neboli £<° = -eer® ± fc = 0.....n, / = 0, (2.45) Platí tedy (2.46) a z lemmatu 2.1 dostáváme (2.47) -e<>r)«±4°i0. max ŕj\ (ik,*i)ern,r Funkce f je však na množině Tat zřejmě nekladná, a je tedy nekladná v celé množině Řh,r- Protože funkce rj^ je v Äj|T omezená, plyne tvrzení lemmatu z rovnice (2.42). ' Důkaz následující konvergenční věty pro implicitní metodu už nyní nepředstavuje žádný problém. Věta 2.2. Nechť řešeni' problému (2.1) až (2.3) má v R dvě spojité derivace podle t a čtyři spojité derivace podle x a nechť ujj.'' je přibližné řešení vypočtené implicitní metodou (2.29). Pak existuje konstanta M taková, že pro dostatečně male h a r platí (2.48) \uT platí (2.50) (i£.Vpr3)i° =oi(Lu)(xk,!,) + (! " ^(Lu^t^-řOir + h2) při obecném a a (2.51) aiíVW)? = \(L*)fa,t,) + \{Li.){xk,tl-1)+0(-r' + h*). Důkaz. Pomocí Taylorova vzorce snadno vypočteme, že platí (2.52) (tW«W)[" = = a[w(xh,t,)~ -^(xk,t,) \t-^(xk,t,) + 0(rs + h2)\ + + 0(r2 + h2)\ = = a(Lu)(xk,t,) +(1 - a)(iu)(a!i,íi_i)- - ¥(**■*«) " í1 - *I-0] + 0(r2 + h2). Z rovnice (2.52) však už tvrzení věty plyne snadno. 340 341 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU Z důkazu věty 2.3 je zrejmé, že v prípade a ^ 1/2 není třeba předpokládat spojitost třetí derivace podle t, ale stačí pouze spojitost druhé derivace, stejně jako tomu bylo u explicitní a implicitní metody. Přibližné řešení ujj.'' budeme nyní hledat z rovnice (2.53) (tí"r«)i°=0, * = 1.....n-1, í=l.....r, s počáteční podmínkou (2.7) a okrajovými podmínkami (2.8). Použijeme-li už vícekrát užitou vektorovou symboliku, můžeme rovnice (2.53) spolu s příslušnými okrajovými podmínkami zapsat ve tvaru (2.54) Auu(i) = W_1), í=l,...,r, kde u je daný vektor a matice Au a A^ jsou třídiagonální matice dané vzorci (2.55) Av = 1 + 2«/? -<*/? 0 -a(3 0 0 -ap 0 -ap l + 2a/3. (2.56) Al ■- l-2(l-a)r? (l-a)t3 0 (l-a)8 0 0 o (1-«)/? 0 (1-<*)/? l-2(l-a)jrí, Matice /lu je zřejmě regulární, neboť je podle Collatzova lemmatu (viz lemma 3.5 z kap. II) monotónní, takže rovnice (2.53) s příslušnými počátečními a okrajovými podmínkami definují skutečně metodu. Při a ý- 0 je tato metoda implicitní v tom smyslu, že k tomu, abychom vypočetli přibližné řešení na nějakém časovém řádku, je třeba řešit soustavu lineárních algebraických rovnic. Jak je to s konvergencí zavedené třídy metod? V případě a = 0 byla situace velice jednoduchá a konvergence této metody byla takřka zřejmá (ovšem za splněni podmínky (2.17)). V případě a — 1 jsme rovněž bez podstatných obtíží dokázali konvergenci užitím lemmatu 2.2, tj. pomocí principu maxima. Tento princip ostatně platil i v případě a = 0. V obecném případě lze sice také dosáhnout platnosti principu maxima, je však k tomu třeba klást na poměr /? = r/k2 nepřirozené požadavky. Proto budeme postupovat poněkud jinak, abychom se vyhnuli nutnosti užití principu maxima. 2 METODA SÍTl Pro chybu rfp všech uvažovaných metod platí zřejmě (2.57) (1 W,)P> = e", k = 1,. ...n - 1, / = 1,.. s počáteční podmínkou (2.58) n<0)=0, k = 0,...,n, a okrajovými podmínkami (2-59) ^ -^° = 0, Z-l, ...p. Přepíšeme-li tyto rovnice maticově, dostaneme (2.60) Avt}W = AlijC-1)+ tcW, 1=1, .p, kde (2.61) ^={1?.....tf-ď (2.62) tei > ■ • • ! £l (0 a matice /4u a /4l jsou definované rovnicemi (2.55) a (2.56). Z věty 2.3 víme, že pravé strany rovnic (2.57) jsou (za předpokladu dostatečné hladkosti přesného řešení) malé. Rádi bychom usoudili, že tento fakt má za následek i malost příslušného řešení. Je tedy třeba dokázat, že řešení uvažovaných diferenčních rovnic spojitě závisí na pravých stranách, neboli, užijeme-li terminologie z odst. 2.4 kap. III, že uvažované diferenční rovnice jsou stabilní vzhledem k pravým stranám. Pro pohodlí čtenáře vyslovíme zde nezbytné definice specializované na náš případ ještě jednou. Definice 2.1. Řekneme, že diferenční schéma dané operátorem 1^" je stabilní vzhledem k pravé straně, existuje-li konstanta M (nezávislá nafiar) taková, že pro každé řešení »7''' rovníce (2.60), pro které je j|eO|| 5 £ pro l — 1,.. .,r, platí (2.63) ||íjW[| S Jf£. Zde se rozumí, že symbol ||.|| značí nějakou vhodnou pevně zvolenou normu v (n — l)-dimenzioná]ním vektorovém prostoru. Např. pří vyšetřování implicitní metody jsme vlastně konstruovali odhad typu (2.63) na základě principu maxima a za vektorovou normu jsme přitom brali jSfoo normu (tj. ||x|| = max|ar,-j). i Z definice 2.1 je vidět, že je-li dané schéma stabilní vzhledem k pravé straně a jsme-li schopni odhadnout lokální chyby — to není většinou velký problém — je metoda konvergentní. Stabilita vzhledem k pravé straně se však neověřuje vždy pohodlně, a proto zavedeme ještě jeden pojem a zformulujeme další pomocné tvrzení, které její studium podstatně usnadní. 342 343 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU Definice 2.2. Řekneme, že diferenční schéma dané operátorem LJ^ je stejnoměrně stabilní vzhledem k počátečním podmínkám, existuje-li konstanta M (nezávislá na h a t) taková, že pro každé celé s z intervalu (0, r) a pro každou soustavu vektorů »/'), / = s, s + 1,..., r, která je řešením rovnic (2.64) Avt,V = AL^'-11 pro í = s + 1, .., r, platí (2.65) 111,(0(1 ^ M||r,W|j, i = s,. ,r. Lemma 2.3. Nechť pro diferenční schéma, dané operátorem platí (i) existuje konstanta M (nezávislá na h a t) taková, že je \\A^l\\ š M; (ii) schéma je stejnoměrně stabilní vzhledem k počátečním podmínkám. Pak schéma je stabilní vzhledem k pravé straně. Důkaz . Buď rfi^ řešením rovnic (2.60) a buď ||eW || á e pro / = 1.....r. Přiřaďme každému celému číslu m, 0 á m S r, soustavu vektorů £^\rn), l = = 0, ...,r, takto: £('>(m) = fl pro / = 0,..., m a pro l = m + 1,..., r jsou vektory r;«(rn) řešením rovnic (2.66) Avé'Hrn) - i4Lí('-1)(m) + re« Zvolme nyní pevně m, 1 í m $ r a položme (2.67) *-<'>=íw(m-l)-£<'>(„,). Předně je v « = 0 pro í - 0,..., m - 1 a v M = É(m)(m 1). Dále je (2.68) AVVW = Alv'-'-1'! pro i = m + 1,.. .,r. V důsledku stejnoměrné stability vzhledem k počátečním podmínkám existuje konstanta M\, taková, že platí (2-69) lk(0II^Afi||*Cm)ll pro l = m..., r. Protože však pro l < m je v'1' = 0, platí vztah (2,69) pro / = = 0,...,r. Platí tedy (2.70) \\é'\m - 1) - á lix\£m\m - 1)|| pro / = 0,...,r. Odhadněme nyní normu vektoru ^m\m - 1). Tento vektor je podle své definice řešením rovnice (2.71) Av^m\m - 1) = AU^^Hm - 1) + re(m>. Protože však vektor ^m-1-'(m — 1) je nulový, je podle předpokladu (i) (2.72) l|Č(m)("i - 1)|| š tMc. 344 Odtud a z nerovnosti (2.70) tedy dostáváme, že platí (2.73) llí(0(t" " 1) - e(0("i)|| S riAM\t pro / = 0,..., r. Pišme nerovnost (2.73) postupně pro m = 1, (2.74) ||í«(o) -{«(1)11 árMM,£, ||ť«(l)-(«(2)||áTMMie, 2 METODA SlTÍ , r; dostaneme ||Čw(r - 1) - Čw(r)|| g rAÍMií. Spojením těchto nerovností máme (2.75) Ilíí0(°) - Í^MII S rrMMl£ = TMMxt pro / = 0.....r. Vektor £^(r) je však pro l = 0,..., r nulový vektor a {'''(O) splňuje tytéž rovnice jako vektor ijW. Je tedy £*■''(()) — rjW pro / = 0,...,ra nerovnosti (2.75) dokazují lemma. Upozorněme, že v definicích 2.1 a 2.2 a v právě dokázaném lemmatu není nikterak podstatné, že se konkrétně jednalo o operátor íj^j daný rovnicemi (2.49). Příslušné pojmy lze zřejmě zavést pro libovolný diferenční operátor, jen vede-li na soustavu rovnic, kterou je možné psát ve tvaru (2.54). Chceme-li dokázat konvergenci studované metody, stačí v důsledku lemmatu 2.3 prověřit jeho předpoklady. Protože jsme se rozhodli, že se chceme vyhnout principu maxima, užijeme tzv. metodu separace proměnných, zvanou také Fourierova metoda. Začneme zavedením vhodné normy (n — l)-dimenzionálních vektorů, které v našich úvahách vystupují. Vzhledem k postupu, který chceme užít, je přirozené požadovat, jak uvidíme, aby uvažovaný (n — l)-dimenzionální vektorový prostor byl Hilbertův prostor. Normu budeme proto definovat pomocí skalárního součinu. Obyčejný euklidovský skalární součin zde není vhodný, neboť složky vektorů, s nimiž pracujeme, aproximují hodnoty funkcí definovaných ve všech bodech intervalu (0,1), a je tedy žádoucí, aby námi zavedený skalární součin konvergoval pro /i-+0 k Sfi(0, l)-skalárnímu součinu (srv. požadavky (2.175) z kap, III.). Tuto vlastnost má jednoduchá modifikace euklidovského skalárního součinu, kdy za skalární součin vektorů v, w bereme číslo (v, w)^ dané vzorcem (2.76) (v, w)h - h^jTvkWk. Norma vektoru v je tedy dána výrazem 1/2 / V (2-77) IMk=(fc5>ž ■ ^ *=l ' Označme ještě vektorový prostor opatřený normou (2.77) symbolem 345 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU Stabilita diferenčních schémat LJfJ v právě zavedené normě je popsána v následující větě. Věta 2.4. Buď dán diferenční operátor íj^ sOSaí la nechť v případě, že je 0 ú a< 1/2 platí (2,78) 1 2(1-2«)' Pak diferenční schéma dané tímto operátorem je stejnoměrně stabilní vzhledem k počátečním podmínkám. Důkaz-. Pišme matice A\j a Ai, dané vzorci (2.55) a (2.56) ve tvaru (2.79) Av = l + a/3P0 a (2.80) AL= /-(l-a)/?P0l kde / je jednotková matice a trídiagonálnt matice Prj rádu n — 1 je dána vzorcem (2.81) 2 -1 -1 '■■ 0 0 0 0 : % , -i 0 ... 0 -1 2 _ Snadno zjistíme, že vektory v^"\ v = 1,.. .,n — 1, jejichž složky jsou dány rovnicemi (2.16), tvoří ortogonální soustavu vlastních vektorů matice (2.81), a to jak v obyčejném euklidovském, prostoru, tak v prostoru E^"-1', a že příslušná vlastní čísla jsou (2.82) A„ = 4 sin In v = l,...,n- 1. Vzhledem k rovnicím (2.79) a (2.80) jsou vektory v také vlastními vektory matice ^lui resp. A\, s odpovídajícími vlastními čísly A(.u> = 1 + K = l,...,n-1, - i_ (i _ a)pX„, v-\.....n-1. (2.83) resp. (2.84) Abychom dokázali tvrzení věty, je třeba odhadnout řešení soustavy (2.64) pomocí počáteční podmínky. Vzhledem k právě zjištěné skutečnosti, že matice Au a Ai, mají tytéž vlastní vektory, se pokusíme splnit rovnici (2.64) soustavou vektorů tvaru (2.85) z« =c(i>w... 346 2 METODA SlTl kde c(!) je skalární veličina závisející pouze na indexu /. Funkci ijj', která řeší rovnici (2.64), se tedy snažíme nalézt ve tvaru součinu dvou funkcí, z nichž jedna je funkcí pouze proměnné / a druhá funkcí pouze proměnné k. Odtud také pochází název metoda separace proměnných. Má tedy platit rovnice (2.86) c(/)Auv W = c(l - 1)ALv Odtud plyne, že funkce c(/) musí splňovat rovnici A™ (2.87) Každá soustava vektorů z O tvaru (2.88) z('> = c|TmrJ v c-) kde c je libovolná konstanta a rS libovolné celé číslo, tedy řeší rovnici (2.64). Vzhledem k tomu, že vektory v'"' tvoří ortogonální bázi v prostoru E^1-1', existují k libovolnému vektoru r) = g E^n_1' čísla c\, .., cn_i taková, že platí n-l (2.89) „(0 = ^0^«. i/=i Z ortogonality vektorů v W přitom plyne, že je (2-90) ll^lll = ECÍH,'(")IIÍ- Z rovnic (2.89) a (2.88) tedy dostáváme, že řešení soustavy (2.64) určené počáteční podmínkou lze psát ve tvaru (2.91) Přitom platí (2.92) "(° = I>[^>] ^0lll = £í Tib)! H"M|I?- lí = l A„ jak plyne opět z ortogonality vektorů Podle rovnic (2.83) a (2.84) je A(„L) _ l-(l-«)/?A„ (2.93) Platí-li (2.94) 1 + a/3A„ ^ l-(l-a)^A, 1 + a/?A„ - ' 347 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU je (2.95) \\ffi% 5 ||r/s>|k jak plyne ihned ze vzorcu (2.92) a (2.90). Splnění nerovností (2.94) tedy stačí ke stabilitě. Pravá z těchto nerovností je splněna vždy, nebol! je 0 í a í 1, /J > > 0 a A„ > 0. Je-li a ä 1/2, je splněna i levá z těchto nerovností bez dalších doplňujících podmínek, neboť v tomto případě je (1 — 2a)p\v í 0, a tedy tím spíše platí nerovnost (2.96) (1 - 2a)/3Xv < 2 neboli (2.97) -l-a0\u <* = 1/2- Důkaz je hotov. Výsledek, který jsme dostali, je tedy poněkud slabší, než tomu bylo v případě explicitní a čistě implicitní metody, a to v tom smyslu, že jsme užili horší normu než normu užitou v odst. 2.1.1. Toto zhoršen! není příliš podstatné a navíc je lze důmyslnějším postupem, jak uvidíme, odstranit. Hlavního výsledku, tj. sestrojení absolutně stabilního diferenčních schématu s celkovou chybou řádu 0(r2 + h2) jsme však dosáhli. Takové schéma je dáno operátorem í-j1/2' a příslušná metoda se nazývá Crankova-Nicolsonova metoda. Tato metoda je velmi populární a v praxi se často užívá. Důvod je ten, že její užití je podstatně ekonomičtější, než je tomu např. u explicitní metody. Čtenáře možná toto tvrzení na první pohled poněkud překvapí, neboť při užití Crankova-Nicolsonova schématu je třeba navíc ve srovnání s explicitní metodou řešit v každém kroku soustavu lineárních algebraických rovnic. Tato soustava má však třídiagonální matici, takže počet potřebných operací je řádově roven počtu neznámých, tj. veličině 0(l/h). Protože celková diskretizační chyba je 0(r2 + h2), je rozumné volit t = 0{h). Počet potřebných časových řádku je tedy 0(l/h) a celkový počet operací je řádově roven 0(l/h2), což je pro malá h podstatně méně než u explicitní metody, kde je toto číslo rovno 0(l/h3). Zakončeme tento odstavec ještě jedním postřehem. Z toho, co jsme až dosud uvedli, by mohl vzniknout dojem, že všechna schémata pro řešení rovnice pro vedení tepla, která jsou sestavena „přirozeným" způsobem, jsou buď absolutně stabilní, nebo v nejhorším případě relativně stabilní. Tak tomu však není. Abychom to uká- 348 349 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU 2 METODA SlTl žali, uvažujme schéma (2.104) 0+i) k_' 0-i) „0) 0) , „0) - 2u"> + u' 2r h2 f = l,...,r- 1, které vznikne tak, že derivaci du/dt v uzlu (ii, i;) nahradíme podílem [u(ící, ír+i) — — tí(;Efc,ií_i)]/(2r), který ji aproximuje s přesností 0(t2). Schéma (2.104) je tedy odvozeno zcela v duchu metody sítí a jeho lokální chyba je jako u Crankova-Nicolsonova schématu řádu 0(r2 + h2). S Crankovým-Nicolsonovým schématem dokonce souvis! ještě těsněji, neboť nahradíme-li v něm veličiny iJp průměry ']/2 a užijeme-li je jen v sudých časových řádcích, dostaneme přímo Crankovo-Nicolsonovo schéma. V podobě, jak je schéma (2.104) zapsáno, je to však schéma třívrstvové, takže je nutné k němu připojit kromě okrajových podmínek (2.8) a počáteční podmínky (2.7) ještě další počáteční podmínku v čase t = t, kterou je třeba vypočítat jiným vhodným způsobem. Rovnice (2.104) s příslušnými okrajovými podmínkami lze zapsat maticově ve tvaru (2.105) kde Pq je matice daná vzorcem (2,81). Zavedeme-li (2n -i/0) rovnicí 2)-dimenzionální vektory (2.106) : „(0 u 0+1) lze třívrstvové schéma (2.105) psát jako dvouvrstvové schéma (2,107) vW = Pi/0-1), í = l,...,r-l, kde matice R je řádu 2n — 2 a je daná vzorcem / -WPo (2.108) R = Přímým výpočtem se snadno zjistí, že všechna vlastní čísla matice R se určí řešením n — 1 kvadratických rovnic £2 + 2/?A„£ — 1 = 0, v = 1,..., n — 1, kde čísla X„ jsou vlastní čísla matice Po, a jsou tedy dána vzorci (2.82). Z uvedených rovnic je však vidět, že ať zvolíme síť jakkoliv, vždy existují vlastní čísla matice R, která jsou v absolutní hodnotě větší než 1. Schéma (2.104) je tedy absolutně nestabilní. 2.2 Obecná parabolická rovníce v jedné prostorové proměnné V tomto odstavci se budeme zabývat metodou sítí pro řešení diferenciální rovnice (2.109) Lu = f(x,t) v R, 350 kde R je opět množina {(x, ť); 0 < as < 1, 0 < < < T} a (2.110) Ltt = c(x,t)^ - ^-{p(x,i)~^+q(x,ť]u, s počáteční podmínkou (2.111) u(x,0) = g(x), 0)(t), (/(%)(*) = 7(1)(0> 0ii)(t) = -pío,ť)^(o,o + /*0H*)«(]«Sí-lí + p(** + A/2,íi-i)«ř;í)}+ + ajfxt.í.Jujj,0 + (1 - a)g(^,*i-i)4'_I). í1*.*') € Rh.r a (0 P-i) (2.118) (lta;a)uf) = Jfc[ae(*l>,ťí) + (1 - a)c(xo,ť,-t)P-^-- r - [p(x0 + Ä/2, i definované a spojitě diferencovatelné v intervalu (0,T) a takové, ie platí (2.121) (Ll]í2)uW)ľ = }(fai)(x»,f,) + l(l«X*i.*i-0 + °(t2 + ft2). i = 1,..., n — 1, i = 1,... ,r, a (2.122) (^^.WjtO = lA[I(/.„)(i,ťi) + |(l„)(,,tl-i)]+ + l(/Wu)(ť,)+i(ř(Ou)(t,_1)- - iK(i,) + ^(ií-OJA2 + 0(r2A) + 0(h3), 1=1.....r, i = 0,1. Důkazy obou těchto vět se provedou přímočaře pomocí Tayolorova vzorce. Vyžadují však dosti zdlouhavé psaní a protože jsme už řadu podobných důkazů podrobně prováděli, přenecháme je čtenáři. V právě uvedených větách jsme nespecifikovali přesně hladkostní předpoklady, které je třeba klást na koeficienty daných diferenciálních operátorů a na funkci u. Zformulovat tyto požadavky není samozřejmě žádný problém; že jsme tak neučinili, je motivováno zejména tím, že jsme nechtěli těmito pro další úvahy nepodstatnými podrobnostmi snižovat přehlednost citovaných vět. Na základě vět 2.6 a 2.7 se zdá rozumné nahradit danou okrajovou úlohu rovnicemi (2.123) UftMÍ0 = <*/(**.*r) + (1" «)/(**.<<-i). k = 1,... .n — 1, / = 1,.. . ,r, 352 353 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU 2 METODA SlTl s počátečními podmínkami (2.124) "S? = »(»»). * = 0,...,», a okrajovými podmínkami (2.125) = 7(«(ŕ|), «SP = ^Dfo), i = 1,...r, v případě Dirichletovy okrajové úlohy a podmínkami (2.126) (l£a)u)W = íhaf(v0,t,) + |A(1 - «)/(«o,*l-i)+ + aT«(i,) + (1 - a)7<°>(f|-i), i = 1,.... r, (C'a)u)(° = k^f(*n,t,) + §A(1 - «)/(*„,ť|_i)+ + a7(1)(í;) + (l-«)7(1)(<í-i), í = l> .r. v případě druhé a třetí okrajové úlohy, neboť se přitom dopustíme lokálně malé chyby. Především je třeba se přesvědčit o tom, že rovnice (2.123) spolu s příslušnými počátečními a okrajovými podmínkami definují skutečně algoritmus, neboli jinými slovy jednoznačně určují veličinu Provedeme to analogicky jako dříve. Buď opět i/G) vektor, jehož složky jsou hodnoty přibližného řešení v ř-tém časovém řádku. Vynásobíme-li rovnice (2.123) integračním krokem r a rovnice (2.126) číslem r/A, dostaneme (2.127) ^Ou(0=^Wu(i-i) + ^[af(0 + (1._lB)f ('-D], /=l,...,r, kde (2.128) A$ = aC<'> + (1 - oOCC-1) + oiIpW, A® = «C« + (1 - «)CC-l3 - (1 - ^)^P(Í_1). ' - L - - .r, C(') je diagonální matice, P V) je symetrická třídiagonální matice, obě řádu n — 1 nebo ra + 1 podle druhu okrajových podmínek a f"> je (n — l)-dimenzionální, resp. (n + l)-dimenzionální vektor, (2.129) = {cil}, c^c(xk,t,), k = l,...,n-l, resp. coo = H^ď*'). ckl—c(xk,tl), t=l.....<%l = lc(x„,t,), (2.130) PO = {p« }, Pkll^VÍXk-hl2,t,)+p{xk + hl2,tl)-rh2q(xk,t,), k = 1, ...n-l, PM+i = P*+i,t = -P(*» + ft/2>r'). * = 1.....» - 2- 354 resp. p(x0 + A/2, í,) + /!/?<°>(í|) + §fc2?(*o, ť,), p(xk - A/2, ťi) + pí** + A/2, *)) + h2q(xk, t,), p(xn - A/2,t,) + ft/?W(ťi)+ áA2g(in,í,), -p(it + A/2,ť|), t=l,...,n-2, k = 1, ...,n - 1, „CO (2.131) resp. /{'í = h2^, i,) + p(*„ + ň/2, i,)7(0)(*í), ŕ = 2,..., n-2, /<'>, - A2/(a;n_i,íi) + p(*„ - ft/2,ť,)-^(ít), yí,) = |Aa/<»o,íi) + fc7tfl)(*i). /£'> = h2f{xk,h), k = \,...,n-l, /W = I„2/(ÍCn,íI) + ň7W(ii). Matice >4u je podle lemmatu 3.5 z kap. 2 monotónní. Je proto regulární a rovnice (2.123) s příslušnými počátečními a okrajovými podmínkami tvoří tedy skutečně metodu. Je-li u)p přibližné řešení dané úlohy vypočtené z rovnic (2.123) s počáteční podmínkou (2.124) a okrajovými podmínkami (2.125), resp. (2.126) a jsou-li koeficienty a přesné řešení dané úlohy dostatečně hladké, platí pro chybu l^'' — — ujj.1' — u(xk, *=!,■■■.""L Z = l,...,r, s počáteční podmínkou (2.133) a okrajovými podmínkami nj-0) = 0, jb = 0,...,n, (0 16 = ^»0, 1=1, .. (2.134) resp. (2.135) = 4» + ««<'> + (1 - = «S> + ««1° + (1 - ^íí'"1'. i=l.....r, kde (2.136) e^ = 0(r+fc2), t = 1.....n - 1, / = 1.....r 355 iv. parciálni diferenciální rovnice parabolického typu a (2-137) 42 = 0(rÄ) + 0(A3), «í0 = fí(*f)ft3, • = 0,1, 1=1,..., r, v obecném případě a (2.138) 4° = C(r2 + A2), fc = l,...,n 1, í=l,...,p, a (2.139) $ = 0(r2A) + O(ft3), *f> = t);(í;)fc2, i = 0,1, i =1,...,r, v případě, že je a = 1/2. Pravé strany rovnic pro chybu jsou tedy malé a abychom dokázali konvergenci, je třeba dokázat, že z toho plyne i malost příslušných řešení. Tyto otázky vyšetříme v následujících dvou odstavcích. 2.2.2 Konvergence, speciální případy Vzpomeňme si, jak jsme postupovali při vyšetřování konvergence u rovnice pro vedení tepla. V případě explicitní metody (a = 0) byl postup přímočarý vzhledem k jejímu rekurentnímu charakteru. V případě čistě implicitní metody (a = 1) jsme užili principu maxima. Konečně v případě obecného a jsme užili metody separace proměnných. Je přirozené položit si otázku, zda lze tyto postupy přenést na zde vyšetřovaný obecný případ. Pro explicitní a implicitní metodu to zřejmě možné je, Nám však jde zejména o obecnou metodu, protože při a = 1/2 je její lokální chyba minimální. Pokusíme se tedy užít metodu separace proměnných. Při jejím užití bude patrně vadit proměnnost koeficientů a hlavně pak jejich závislost na t. Předpokládejme tedy, že koeficienty dané diferenciální rovnice a okrajových podmínek jsou nezávislé na čase a uvažujme pro jednoduchost Dirichletovu úlohu. Jiné okrajové podmínky by totiž působily rovněž určité obtíže vzhledem k tomu, že rovnice (2.135) nejsou homogenní. Pro chybu rf^ přibližného řešení tedy platí rovnice (2.132) s podmínkami (2.133) a (2.134). Přepíšeme-li tyto rovnice pomocí vektorové symboliky, dostaneme (2.140) 4V> = ač'V'-15 (0 kde matice A$ a nezávisí na indexu í. Horní index budeme tedy v dalším vypouštět. Vzhledem k předpokladu (2.115) o koeficientu c můžeme bez újmy na obecnosti předpokládat, že je c(x) = 1, a žc matice Atj a Aj_ lze tedy psát takto: (2.141) Al = / — (! — a)/3P, 2 metoda sítí kde P je třídiagonáln! matice s prvky (2.142) m^K^-^l+řťí + ^l + ^í), fc=l,...,n-l, Pk,k+i = Pk+i,k - ~p(xk + h/2), k = 1,.,., n - 2, a kde jsme opět položili r/h2 =. 0. Dostali jsme se tedy do úplně stejné situace, jako když jsme vyšetřovali konvergenci obecné metody pro rovnici pro vedení tepla. Budeme proto postupovat stejně jako v odst. 2.1.2. Konvergenci dokážeme, dokážeme-li, že dané schéma je stabilní vzhledem k pravé straně. Tuto poslední skutečnost pak dokážeme použitím lemmatu 2.3. Ověříme proto jeho předpoklady. Odhadněme nejprve velikost normy matice A^1 v prostoru E^"-1'. Protože je to obyčejná spektrální norma, jak už víme, a protože matice A{j1 je zřejmě symetrická, stačí k tomu nalézt její vlastní čísla. Matice P je samozřejmě také symetrická. Označme její navzájem ortogonální vlastní vektory w^"\ v = 1,..., n — 1, a jim odpovídající vlastní čísla A„. Kromě toho, že matice P je symetrická, je navíc diagonálně dominantní. Odtud a z Geršgorinovy věty o lokalizaci vlastních čísel plyne, že její vlastní čísla jsou nezáporná. Z Collatzova lemmatu však plyne, že matice P je monotónní, a tedy regulární. To vše dohromady dává, že matice P je pozitivně definitní. Z první rovnice (2.141) plyne, že vektory w 00 jSOu také vlastními vektory matice A\j a že příslušná vlastní čísla AÍU-* jsou dána vzorci (2.143) = l + a/?A„, n = l,...,n-l. Odtud máme, že je AÍU' ž 1 pro v — 1.....n — 1, což dává (2.144) První podmínka lemmatu 2.3 je tedy splněna. Zkoumejme dále stejnoměrnou stabilitu daného schématu vzhledem k počátečním podmínkám. To znamená odhadnout normu vektorů »j(') , které jsou řešením soustavy (2.145) I = s+1, ...,r, normou vektoru i/*). Abychom toho dosáhli, stačí opět opakovat úvahy, které jsme už prováděli v odst. 2.1.2. Vektor w (*Ô je totiž nejen vlastním vektorem matice A\j s odpovídajícím vlastním číslem daným rovnicí (2.143), ale je samozřejmě i vlastním vektorem matice Ar, s vlastním číslem AÍ,L' daným vzorcem (2.146) \<ť> = l-(l-a)p\v. Řešení rovnice (2.145) je tedy možné opět psát ve tvaru (2.147) Au 00 356 357 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU kde (2.148) Odtud už stejnoměrná stabilita vzhledem k počátečním podmínkám snadno plyne, platí-li, že je (2.149) -™y|gl, v=l, ..,n-l. Au Tato podmínka je však stejně jako v odst. 2.1.2 splněna v případě, že je 1/2 á a í g 1, bez jakýchkoliv doplňujících podmínek, neboť matice P je pozitivně definitní. V případě, že je 0 S a < 1/2, k jejímu splnění je nutné a stačí, aby platila nerovnost (2.150) 0 = — <_-_ 1 ' P h* = (l-2a)Amax! kde Ama„ je největší vlastní číslo matice P. Dokázali jsme tedy následující větu. Věta 2.8. Nechť řešení Dirichletovy úlohy pro rovnici (2.109), jejíž koeficienty nezávisí na t, je dostatečně hladké a necnť při 0 g a < 1/2 platí navíc nerovnost (2.150). Pak existuje konstanta M taková, že pro chybu rf^ přibližného řešení vypočteného pomocí operátoru platí (2.151) m = \M(r2 + fc2) pro q = 1/2. Metoda daná operátorem L^3^ se opět nazývá Crankova-Nicolsonova metoda a vede mezi všemi metodami danými operátory i[a^ k nejekonomičtějšímu algoritmu. Pokusme se ještě zkonkretizovat nerovnost (2.150), tj. odhadnout maximální vlastní číslo matice P. Použijeme k tomu, že pro symetrickou pozitivně definitní matici platí (2.152) (Pv,f)h Amax - SUp . »#0 (w,u)* Buď tedy v = («i,... ,t>„_i)T a vypočtěme veličinu (Pv,v)h. Položíme-li ještě v0 = = v„ = 0, je zřejmě (2.153) (Pv, v)h = h ^{-ptx,, - &/2)«*-i + [p(z* - A/2) + p(x* + A/2)+ + ft2g(xjt)]iii - p(xt + Ä/2)tit+i}t)jfc. 358 2 METODA SÍTI Odtud však sumací per partes (srv. lemma 3.10 z kap. II) snadno dostaneme, že je (2.154) {Pv,v)h =ft£p(xt-V2)K-^-i)2 + '«£'í2g(*i)í'l- *=i *=i Použijeme-li nyní nerovnosti (2.115), dostáváme odtud, že platí (2.155) (Pv,v)h á (Pv,v)h, kde (2.156) P — PiPo + h2q\l a matice P0 je dána vzorcem (2.81). Je tedy AÍSt á AÍ£?X = PiAÍS +ft29i. V odst. 2.1.2 jsme však zjistili, že je AÍSí) í 4' K splnění nerovnosti (2.150) tedy stačí, aby platila nerovnost (215?) P ~ (l-2a)(2pl-rií23l/2)- 2.2.3 Konvergence, obecný případ Začneme obecnou rovnicí (2.109) a explicitní metodou a omezíme se jako na nejslo-žitější na třetí okrajovou úlohu. U tohoto omezení zůstaneme i v dalším vyšetřování. Případy ostatních okrajových úloh by se studovaly analogicky; navíc by většinou došlo ještě k dalšímu zjednodušení. V tomto případě tedy pro chybu nj^ platí (operátory L$, /Ä(r,0) a /A(1;0) jsou dány vzorci (2.117) a (2.118)) (2.158) (C')ř>=e-I)- h=l,...,n-l,l=l,...,r, a za předpokladu dostatečné hladkosti je (2.159) 4° = 0(r + ft2), fc = l,. ,n-l, í= l,...,r, 42 = 0(TA) + 0(h3), *í,_1> = «fC*i-i)^2. « = 0,1, I = 1> >r< kde funkce Ví mají spojitou derivaci v intervalu (0, T). Abychom dokázali konvergenci, je třeba odhadnout řešení soustavy (2.158). Prepíšme je proto tak, že první rovnici vynásobíme číslem t/c(xii, ŕi_i) a druhé dvě 359 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU čísly 2T/[hc(j!o,íí-i)] a 2r/[ňc(xrl,íj_i}]. Dostaneme (2.160) vO)=ŕ^-h/2,tll) v C(»i,íl-l) + N _ ^(xŕ - ft/2,i,-i) + p(xt + h/2,ti.1) + /t2j(xt,ŕ|-Ql 4-A/2, tref**,íi-i) i fJ<«* + Vg.«r-i _ro) „(0_f, a2p(x0 + V2, ■■■'»■ 1 = 0,....r. Důkaz tohoto tvrzení plyne ihned z analogického rozpisu jako v rovnici (2.160). Poznamenejme také, že tvrzení lemmatu 2.4 je v podstatě ekvivalentní principu maxima pro operátor lh t. Lemma 2.5. Nechť pro koeficienty dané diferenciální rovnice a okrajových podmínek platí nerovnosti (2.115) a (2.116) a nechť při pevném l je ý\ íesenim soustavy (2.165) p{xk -h/2, í,)^-! " W* ~ k/2, U) + P(*h + h/2, t,)] = bf. Pak existuje konstanta M (nezávislá na kal) taková, že platí (2.166) max I^I^Mmaxdíž0!,^0!), t=0,...,n max l=l,...,n I l^-^il max k-0,...,n \l*í'-1)l> t ' t ) Důkaz. Tvrzení lemmatu plyne snadno ze skutečnosti, že řešení soustavy (2.165) se dá psát vzorcem h (2.167) ^^[l + ^jCjlí • h/2,t,) kde (2.168) ♦4+^>£i5™]}' jak se snadno ověří dosazením do rovnic (2.165). Pomocí těchto dvou lemmat už snadno dokážeme následující větu. 361 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU Věta 2.10. Nechí koeficienty dané diferenciální rovnice a okrajových podmínek splňují nerovnosti (2.115) a (2.116) a nechť platí nerovnost (2.161). JVechť dále je í)['* řešením soustavy (2.158) s nulovou počáteční podmínkou a s = 0 pro k = =; 0,..., n a i - 1,..., r. Pak existuje konstanta M taková, že pro l - 1,..., r platí (2169) Än1^^^^-!^^1'1^15-Důkaz Zvolme pevně /, 1 S I S ľ, položme (2.170) ť><'> = max |íj')|, ép= max |íj">| ľ=o,...,í-i1 u ' 1 i/=o,...,r-i1 1 1 a buď jfj"^ řešením soustavy (2.171) Uffxjlr^O, * = 1. -."-L ľ = l,-,l, (/)(<;o)x)W=9(Oi í = 0ili„ = 1..... xľ'-O, k = 0.....n. Protože v důsledku lemmatu 2.4 je |n^"'| S Xt"' P™ v = 0,..., í, stačí odhadnout řešení soustavy (2.171). Odhadujme xí"^ ve tvaru součtu (2.172) xľ = i+i = °. t = 1, n - 1, s okrajovými podmínkami „("> _ ,„« (2.174) -p(*o + h/2,tv).) W (") Funkci Vj"' umíme odhadnout pomocí lemmatu 2.5 a funkce fří"' řeš resi rovnice (2.175) (í.<°>)<"> = - ^.í,-.)^--9(-»,í,-!)^*-15■ fc = l,...,n-l, i/= 1,...,/, -IM*™,^-!)^"1'. * = 0,1, V =1.....i, 362 2 METODA SÍTÍ Řešení posledně napsané soustavy umíme odhadnout pomocí pravých stran užitím věty 2.9, přičemž pravé strany rovnic (2.175) umíme odhadnout užitím lemmatu 2.5. Protože však pravé strany rovnic (2.174) nezávisí na běžném indexu ľ, redukuje se pravá strana poslední nerovnosti v (2.166) na výraz Mmax(|ff£O|,|0iO|). Odtud však už tvrzení věty plyne. Z vět 2.9 a 2.10 dostáváme už ihned nejen konvergenci explicitní metody v případě obecné parabolické rovnice, ale i odhad chyby 0(t + h2). Obraťme se nyní ke studiu schématu LJ^ s příslušnými okrajovými podmínkami v případě, že je 1/2 í «í 1. Případ 0 < a < 1/2 vyžaduje, jak jsme viděli v příslušném odstavci ve speciálním případě, omezení na poměr r/h2, a proto jej jako méně zajímavý vyšetřovat nebudeme, i když by to bylo následující metodikou dobře možné. Pokusíme se postupovat paralelně k explicitnímu případu, tj. zkusíme odhadnout řešení rovnice (2.132) s okrajovými podmínkami (2.135) zvlášť pro případ íf' = 0 a 4'' - 0. K tomu cíli použijeme postup, který, pokud je nám známo, užil k odhadu řešení parabolické rovnice v závislosti na její pravé straně jako první Lees (1960). Základní myšlenku tohoto postupu ukážeme na příkladě diferenciální rovnice (2.176) s okrajovými podmínkami (2.177) du d2u , ,. « 5P = e u(0,t) = ii(i,t) = 0. Budeme přitom předpokládat, že všechny operace, které budou následovat, jsou oprávněné, aniž bychom podrobně zkoumali potřebné předpoklady, neboť nám nejde v daný okamžik o získání přesného tvrzení, ale pouze o vysvětlení základní myšlenky. Vynásobme rovnici (2.176) výrazem du/dt a integrujme podle i od 0 do 1. Dostaneme (2.178) Je však (2.179) ŕ(9u\2A ť &udu f1 du Jo d2udu dx2 dt ' [řa1+/1 idx dt J o J0 du d2u dx dxdt d x. = neboť platí (2.177). Platí tedy « i (*) Ax + Í2TtJB (fa) ix = l^-dldx- 363 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU Vzhledem k zrejmé nerovnosti || ^ ^u2 + |&2, platné pro libovolná reálná a, b, kterou jsme už vícekrát užili, platí (2.181) a tedy (2.182) Odtud však plyne (2.183) a tedy, položíme-li (2.184) (2.185) Je však (2.186) šjjf^.,*)d.+*j[1(5)ld,. EM2**- fl(()ÍD(0) + | [jí ea(s,r)dí d r. u(i'í)=/£(í,í)dí; odtud pomocí Schwarzovy nerovnosti dostáváme (2.187) «»(.,<) š » jí" [£(£>ť)fd£ ž £><*)■ Z (2.185) tedy máme (2.188) |«0M)lš {D(°)+/< [^^(^'-Jdij dT-j ' . Odhad tohoto typu bychom rádi získali pro řešení soustavy (2.132), (2.135). Jak už jsme řekli, budeme postupovat opět dvoufázově, tj. odhadneme zvlášť případ í,.'^ = 0 a případ e^' = 0. Dříve než zformulujeme tvrzení, která budou paralelní k větám 2.9 a 2.10, dokážeme ještě tři pomocná tvrzení, se dvěma z nichž jsme se už v podstatě setkali v kap. II. Lemma 2.6. Buď p libovolná funkce definovaná v intervalu (0,1) a buďte j/* 364 r 1 METODA SlTl a z\ libovolné funkce definované pro k — 0,... ,n. Pak platí n-l (2.189) „^-{p^-fc/^jfc.,- - \p(xk - A/2) + p(Xk + fc/2)]j* + p(xh + h/2)yt+1}zt = n + PÍX, - h/2)V" - p(xB + h/2)^-^-z0. Důkaz tohoto lemmatu je analogický jako důkaz lemmatu 3.11 z kap. II (viz str. 184), a přenecháme jej proto čtenáři. Lemma 2.7. Nechť koeficienty p a dané diferenciální rovníce a okrajových podmínek splňuji nerovnosti (2.115) a (2.116). Pak existuje konstanta M taková, že pro libovolnou funkci definovanou na síti Řh,jT platí nerovnost (2.190) kde (2.191) [xL0]2 š MD{X[\ " C) O , Ptá0) = *Erf'»-*/V')[- ,**-'] -+ ^0>(ť()[xo°]2 + ^1)(tOtó')]2. Důkaz Tvrzení tohoto lemmatu je v podstatě identické s tvrzením lemmatu 3.12 z kap. II (viz str. 185). Lemma 2.8. Buď g funkce definovaná a spojitě diferencovatelná v intervalu (0,T) a nechť pro ni v tomto intervalu platí g(t) ž go > 0, |ff'(í)| 5 g\. Pak pro libovolnou funkci i/') definovanou pro l — 0,..., r a pro libovolné a, 1/2 í mí 1, platí (2.192) |[aj(f,) - (1 - a)í(ij-i)]»< g š J Í2o, - 1 + o^r)^,)^]2 + fííi-i)!^-15]1}. Důkaz Z učiněných předpokladů plyne především, že platí (2.193) Protože je g(tt) ž}0a g(h-i) ž go, je (2-194) [ff(íí)]1/2[s(t|-l)]1/:! š so, 365 |ď(<>)-9(t»<1-15|. Odhadneme-li pravou část poslední nerovnosti podle známého vzorce |a6| S |a2 + + ^i2, dostaneme požadovanou nerovnost. Lemma je dokázáno. Nyní už můžeme zformulovat a dokázat větu, která je analogická k větě 2.9. Věta 2.11. Nechť koeficienty dané diferenciální rovnice a okrajových podmínek jsou dostatečně hladké a nechť splňují nerovností (2.115) a (2.116). Nechť dále ijj^ je řešeni soustavy (2.132) s okrajovými podmínkami (2.135) s í('^ = 0 a nechť je 366 2 METODA SlTÍ 1/2 í a í 1. Pat existují konstanty M a rB > 0 tátové, že pro t á to platí (2-201) ^maxJijjPlŠ g m W>)+í>[f i^i2+ä£ i^i2 + si£- 3i2l f'- l. y=1 L J J Důkaz . Vynásobme každou z rovnic (2.132) při pevném í výrazem h[rj — «j a vzniklé rovnice sečtěme od k — 1 do k — n — 1. Dostaneme n-l (!) _ (I-l) 2 (2.202) rA U) + (1 - ar)e(j!», *,_,.)] p-&-] - *=i T n-l _ afc E 12 WXfc - V2,i;)4-i " M** " A/2,íl) +P(^ + h/2,t,)]r,W+ +K^ + ft/2,íí)')í'i1}['?í0-^"1)]- - (1 - a)hj^^{p(xk - A/S.íi-i)^-!4 " W** " V2,íi-i)+ t=i + p(zt + A/2,í,-!)]^-1' + P{*k + A/2, ti-ifol+íW - iř"'V + aft£g(I)t,íI)»7Í0[»)i0-^-1)]+ fc=l + (i - or)A 2 . hÍ° - = í=l Upravíme-li tuto rovnost pomocí lemmatu 2.6, máme "-i (0 _ 0-0,a (2.203) TA^Iac^íO+íl-aJe^.ťi-Ojp*-^-j + + aft^H^-V2,(ír)i)S0 + (1 " cO^Cír-Oflř"1^ + iAa^xcí,)^0 + |A(1 - a)9(*o,íf-i)i?0'~1) -4° (2.205) - [ap(x„-A/2,r,)''" ^S=í+ + (l-a)p(x„-h/2,t]_i) J'-1) _ „0-0 (1) _ ((-1) = lA[tvc(x„,ťr) + (1 - ) + (1 - a)c(*i,i,-i)] [ t=l " r„(0 „(0 + aA^p(xt-A/2,f,)[^^] - C) ('-i) i + 368 2 metoda sítí n -(l-a)A h/2, li %-l - AX>p(** - A/2,ťf) (1 - a)p(x* - A/2,t,_1)]. .(') _ _0-i) „«_„(') „('-!)_„('-!) A A r„0) _„('-!), 2 + irA[aC(xn,í,)-t-(l-a)c(xTl, *,_x)] [*_5f_] + + ^OOtá0]2 + (1 - ^^(tr-i)^^-1'-- a/JÍ^^O^O-D - (1 - «/VSÍ1>(«,-,)[flff-1)p+ + S^M*.,*!)^ + (1 - íl-l)!/?-1'] (0 C-i) rnW_n0-l)l3 + irA[ac(x0,í,) + (1 - totíP>t1) - u - «)^°'(*>-o[iř-1)i,+ (0 _ (J-i) + irAIa^xo.ťO-ío0 + (1 - cjg^o,^!)^'"^]^-^-- __0) ^0 1o , re0---r + 1"A^[tv4(x|:,ŕ()40 + (1 - «)9(^i,,ti-i)»í ri}- Poslední rovnost pišme ve tvaru (2.207) 5« + n-l (i) (I) (i-l)n +h y: c^lV-ý + 4,) &-ý Jj + r (0 (1-1) "-1 (0 (1-1) (0 (I-l)n (2.210) Ä« = A £[<*?(** - A/2, t,)- - (i - - A/2, *,_,)] "* ^-l7t + + [o/9<0J(í,) - (1 - o)/J<0»(t|-i)]«í00iji,"1)+ + [«/?«(*,) - (1 - »)^»(*i-i)]iiíPiiff-1>. Odhadněme nyní shora pravou stranu výrazu (2.207). Začněme s ijO), Vzhledem k předpokladu o dostatečné hladkosti koeficientů a vzhledem k nerovnostem (2.115) a (2.116) splňují funkce p a /?0) předpoklady lemmatu 2.8. Platí tedy (2.211) |(ap(i*-A/2,í,)- „0) _ „(0 „('-D _ _('-i). -(1-«)*«, ft/2,«,-!)]^ j^=± |g g i(2« - 1 + «M,r){P(It - A/2, t,) P"^*"1] 2+ (i-i) (i-i) H } a (2.212) + p(a!i-A/2,ťi_i)[ lM0(tl) _ (i _ a)/3W(e(_l)]l7«^-i)| g pro i = 0,1, kde Mi je kladná konstanta. Z nerovností (2.211) a (2.212) však už plyne, že platí (2.213) 370 á i(2a - 1 + <*Mir)[D« + X^'-1)]. 2 METODA SlTl Zde jsme položili pro stručnost £>0) = DOjI'-1) Obraťme se dále k odhadu veličiny . Abychom to provedli, uvědomíme se především, že nerovnost (2.214) platí pro libovolná reálná a a i a pro libovolné 7 > 0. Skutečně, tato nerovnost plyne ihned ze zřejmé nerovnosti (2.215) Užitím nerovnosti (2.214) snadno zjistíme, že platí (2.H6) |,K-».*)rf>a£^=^| s 4eťaÄlfc)[!í£^^]"i * = (),..., n, (0 C-1) (2.217) l^,^'-')"* * | = v (0 O-i) 1 (2.218) (2.219) 0) _ „0-1), š f [4!>]2+ (I) _ (1-1) J + iHíi,!,) + (1 - a)e(,i,*,_!)][Ä—Ji—] . t = l,...,n-l, 0) O-i) 1 T I r I co n rn0) _0-iha + JAMío.íi) + (1 - «)e(«o, Í1-1)] f° ^ ] (2.220) Lg)*_Z*U_ g lí[í«]2+ r„0) _„('-!),2 + iAM^n.ť,) + (1 - «)c(i„fc,í,_i)] ['" J" J - 371 1 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU Použitím nerovností (2.216) až (2.220) dostávame (2.22i) |g(')| š Tká YMnľÝ + (i - a)[ví'-l)]2H c° *=i "-1 (í) _ (í-1) 2 + IrA^tore^, í,) + (1 - a)c{xk, *,_!>] [5i__5i_] + + lrA2iWI)m]2 + (l-a)[rí(,-1)]2}+ co (í) _ (1-1) 2 + |Tfci[ae(*o, *i) + (1 - <*)c(x0, í,_i)] [-?—-] + + lrh^{alT,Wť+(l-aM-V]2}+ Co + lTAj[«c(»B,ť,) + (i - «)<<*„,*,_!)] [2l_2s_] + (0 _ (i-i) ,, + |rh[ac(0o, íl) + (1 - «)c(íd, íi-i)] [—^-] + »-i (i) _ O-i) 2 + Jrfc í,) + (1 - «)e(*»1(|.i)HU-] + *=i r + JrAMxn.íO + fl »)eí>,,ti-1)][1'" ^" ] Tuto nerovnost však můžeme přepsat do tvaru (2.222) |Q«| š 15(0 + r|ia|lM^)]2 + fcgfeWfi + iM,(0]2J + ^ i=i j kde jsme položili (2.223) Efi> = + h g[£(0f + 2 [£(0]2 t=i Podle lemmatu 2.7 je (2.224) 1 A[„W]2 + A £><'>]= + IA[n(0]2 g M/jW *=i 372 2 METODA SÍTl Dosadíme-li z této nerovnosti do nerovnosti (2.222), máme (2.225) |Q(0|Š i5(0 + Ta?lM£,(0+ CŕJ «2 + r(l-rt)?lM£lC'-1) + -i^(,). Co Co Použijeme-li nyní v rovnici (2.207) nerovnosti (2.213) a (2.225) a vezmeme-li v úvahu, že je SW 5 0 pro každé í, dostaneme (2.226) §{l - [aMi + ^.aMJrJDW S g i{l + [aMi + M(i _ aJMJrJDC'-1) + I-iffi, neboli, protože je a ž 1 /2, (2.227) kde (2.228) Pro r í ro < l/(arAf2) plyne z nerovnosti (2.227) nerovnost (2.229) kde (2.230) M3: (1 - raM2)D<'> S (1 + raiVMi}''-1) + —£('), co M2 = Mi + —M. co fl(0) + rM3f (i±I^),-"^)1 v=i jak se snadno přesvědčíme úplnou indukcí. Pro t í ro je však (1 + TaMi)j(l — TaM-í) > 1, a tedy platí U-roAfJ = V1-tojM2/ (2.232) pro s = 0,,,., r. Konečně pro dostatečně malá r platí Vl-T-aM,-' Vl-raM,/ = 3 (2.233) neboť je (2.234) lim (i + W^ = e^- 373 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU Dosadíme-li konečně odhad (2.232) a (2.233) do nerovnosti (2.231) a použijeme-li lemmatu 2.7, dostaneme nerovnost (2.201). Věta je dokázána. Dále je třeba dokázat ještě větu, která je paralelní k větě 2.10. Věta 2.12. Nechť koeficienty dane' diferenciální rovnice a okrajových podmínek jsou dostatečné hladké a nechť jsou splněny nerovností (2.115) a (2.116). Nechť dále rfip je řešením soustavy (2.132) s nulovou počáteční podmínkou a s okrajovými podmínkami (2.135) s = 0. Pak existuje konstanta M (nezávislá na h a r) taková, že pro každé dostatečně malé r platí (2.235) g M j max [|í 4M^M'}-(i»>)i0 = = -[cec(xi,,í|) + (1 - a)c(xk,íi_i)] (0 (l-i) - a^xt.írVt0 - U - «)9(a!*>*i-i)*>* 1}> fc = l,...,n-l, 374 2 METODA SlTl (2.240) e0'U(ř^)(0_(,^V)(0 = „(0 = -±h[ac(xBlt,) + (1 - oJiKso.ť,.!)]^-£8 (1-0 - §ftaf(x0,ťi)¥>b - |A(1 - ají^o.ťf-i)^ a analogická rovnice platí pro e^'. Položíme-li tedy (2.241) ^0 =max[|5(')|2i|í«|2j|r('-i)|2|5(--i)|2i (1-1) je znovu podle lemmatu 2.5 (2.242) |ei°l š Af [JB(I)]1/a, * = 1,. , n - 1, ř = 1,..., r, a (2.243) \e^\^hM[^]1'2, ^hM[E^]l'\ Použijeme-li k odhadu funkce \j>^ větu 2.11, máme (2.244) ^axj^lg < M J, i1/2 1/2 D(9f) + r Na druhé straně podle definice čísla D(ip^) a podle lemmatu 2.5 je (2.245) 7J(^0))gMmax[|í(0'|2,|ÄÍ0)|2]. Nerovnosti (2.237), (2.244) a (2.245) však už dokazují větu. Závěrem tohoto odstavce zformulujme ještě konvergenční větu pro obecnou parabolickou rovnici a pro 1/2 g a g 1. Věta 2.13. Nechť přesné řešení u okrajové úlohy (2.109), (2.111), (2.114) je dostatečně hladké, nechť jsou splněny nerovnosti (2.115), (2.116) a nechť je přibližné řešení vypočtené pomocí operátorů LJ^J, 1^"\ 1^"^ s 1/2 g a ^ 1. Pak existuje konstanta M taková, že platí -u(xk,t,)\<,M(r+h2) (2.246) v obecném případě a (2.247) 4>-u(Xk,t,)\^M(r2-rh2) 375 I IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU v případě, že je ct= 1/2. Důkaz plyne bezprostredne z vět 2.11 a 2.12. Stačí si pouze uvědomit, že chyba vfp — u(xk,t}) splňuje rovnici (2.132) s okrajovými podmínkami (2.135), pro jejichž pravé strany platí odhady (2.136) a (2.137), resp. (2.138) a (2.139) a že v důsledku spojité diferencovatelnosti funkcí Vi jsou výrazy [ť(0 _ ř(f-i)]/r řadu 0(ft2). Crankova-Nicolsonova metoda vede tedy i v obecném případě k nejefektivnějšímu algoritmu, neboť její celková diskretizační chyba je řádu 0(r2 + h3), takže lze opět volit t = O(ft). Upozorněme také na to, že věta 2.13 je obecnější než věta 2.8 nejen proto, že se v ní vyšetřuje obecná parabolická rovnice, ale také proto, že chyba se v ním měří -normou. 2.3 Dvou- a vícedimenzionální parabolické rovnice V předchozích odstavcích jsme viděli, že problematika metody sítí při řešení parabolických parciálních diferenciálních rovnic v jedné prostorové proměnné je dosti úzce svázána s problematikou řešení okrajových úloh pro obyčejné diferenciální rovnice. Tak např. otázky spojené s přepisem okrajových podmínek se řešily zcela stejně jako v případě obyčejných diferenciálních rovnic. Nové byly pouze problémy vyvolané přítomností význačné proměnné, času. Dá se očekávat, že analogická situace nastane i v případě řešení parabolických diferenciálních rovnic ve dvou (a více) prostorových proměnných. Komplikace proti prostorově jednodimenzionálnímu případu budou souviset tedy zejména s přepisem okrajových podmínek, což je problematika, jíž jsme se zabývali ve třetí kapitole, zatímco parabolický charakter úlohy (tj. přítomnost proměnné t) přinese patrně již jen takové problémy, se kterými jsme se setkali v předchozích odstavcích. Proto budeme postupovat stručně a omezíme se vlastně jen na jednoduché ilustrativní příklady. 2.3.1 Základní metody Způsob, jakým lze řešit metodu sítí parabolickou parciální rovnici ve dvou a více prostorových proměnných, si ukážeme na Dirichletově úloze pro dvoudimenzionální rovnici pro vedení tepla. Budeme tedy řešit rovnici (2.248) iu=*i_^_^ = n [ ' dt dx2 čV v íí x (0,T), kde Í2 je omezená oblast v E2, s počáteční podmínkou (2.249) u(x,y,0)=g(x,y), (x,y)eÚ, a s okrajovými podmínkami (2.250) u(x,y,t) = y(x,y,t), (x,y) G ľ, ť g (0,T). T 2 METODA SlTl Vzhledem k úvahám, které jsme prováděli v kap. III a vzhledem k postupu v předchozích odstavcích budeme přibližné řešení v bodech (xk,y,,t\), kde (xk, ys) 6 a ť| == lr, l — 0,..., r, t = T/r, hledat ze soustavy (2.251) (4"'»)*? = 0, (**,lf.) £ ÍÍ(Ä), í = 1, • -.r, s počátečními podmínkami (2-252) u<°> = g(xk,y,), (xk,y.) e Ď<*>, s okrajovými podmínkami (2.253) {k,ru)[l] =AhAr,Xk,y„h), (xk,y,) 6 r« / = !,...,r. Množiny ílC*> &h\ rW zde mají samozřejmě stejný význam jako v odst. 2.1 kap. III a í.^™ je operátor, který funkci ukl definované pro (aijfcjj/j) é a pro / = 0,..., r přiřazuje funkci (LJ^úfP definovanou pro (xk, y,) £ Q(h\ / = 1,..., r a danou předpisem (0 ('-i) (2.254) affU)<'>="*' > - 1-, ■IV ^2 + "f" "fc-l,í + "fc,s + l T "fc,j-Í - ""*J;i J- Symbol lh]T v okrajové podmínce (2.253) je pak lineární operátor tvaru (2.255) (V«)« = «2 - xx*Zl ~ X**Z,- -xAL-x^, («»,».) 6r<"), kde uzly {xki,y,t) jsou sousední k uzlu (xk,y,) a platí-li {xki,yai) £ ň«, je příslušné Xi rovno nule (vzhledem k definici množiny existuje aspoň jedno takové ŕ) a ostatní koeficienty jsou (stejná) nezáporná čísla, přičemž platí 4 (2.256) £xí-3Xo<1, i=i kde xo je konstanta nezávislá na h a r. Konečně operátory A;,iT jsou dány vzorcem (2.257) A.h,T(T,xk, y,,ti) = íi7(it;, Z/,;,ii) + Í27(z*;, y^Ji)+ + (ay(xk>s, y,'3, ti) + ^TÍ**; ,y>'t,U), («*,y.)er<*), / = i,...,r, kde í; jsou jistá čísla, body (xki,y,i) jsou průsečíky přímek sítě procházející uzlem (xk,ya) s hranicí T, jejichž vzdálenost od bodu (xk,y,) je menší než h a = 0, jestliže takový průsečík neexistuje. Upozorněme, že to jsou právě ta i, pro něž je koeficient Xi v (2.255) od nuly různý (srv. odst. 2.1.2 z kap. III.). 377 0-1) + u (f-l) C-i)i 376 IV. PARCIÄLNl DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU Pro a = 0 dostaneme explicitní metodu, ve které se hodnoty přibližného řešen! v i-tém časovém řádku vypočítávají přímo jako lineární kombinace hodnot přibližného řešení v (/— l)-ním časovém řádku. To je sice z numerického hlediska příjemné, hned však uvidíme, že za to musíme zaplatit dosti vážným omezením na velikost časového integračního kroku. Implicitní metoda, která vznikne při a = 1, touto nevýhodou netrpí, abychom však při její užití dostali přibližné řešení v /-tém časovém řádku, je třeba řešit soustavu 0(l/h2) rovnic o 0(l/k2) neznámých. Podobně je tomu i u ostatních schémat m^O. Vyšetřeme nyní konvergenci uvedených metod. Začneme explicitní a implicitní metodou, které pojednáme najednou. Užitím Taylorova vzorce se snadno zjistí, že pro každou dostatečně hladkou funkci u platí (2.258) (ti"Vpr>)(t'> = «(l«)(xiIs(Mt,) + (l-«)(lti)(«t,».,íí-i)+ + 0(T + k2), (»*,»,) e OW, /=!,...,r, (2.259) (LÍ"mPT))k! = A*.r(«i «»,»., *i) + 0{h2), (xk,y,)eT* 2 METODA SlTl kde Tp1^ je množina bodů (xk, ya, í[) takových, že je (xk,ys) € r^*) a 1 = 0,..., r nebo (xk,ys) £ a 7 = 0. Důkaz je zcela analogický důkazu lemmatu 2.1, a proto jej přenecháme čtenáři. Lemma 2.10. Nechť při a = 0 nebo a = 1 platí (2.264) ■|(tí?D)2|á(tír,V)S, (**,y,)£fi(*J, i*l,...,r, ' 1^1 (*.,».) e fiW I(4,rlj)£l š (fc,rlŕ)i? , (*», V.) £ rW, / = 1, i.., r, a nechť v případě, zeje a = 0, platí navíc nerovnost (2,262). Pak platí (2.265) . lifSl^^g, (**,«,) e 0«, 1 = 0.....r. Důkaz, Lemma je bezprostředním důsledkem lemmmatu 2.9. Na základě právě zformulovaných pomocných tvrzení je už snadné dokázat kon-vergenční větu pro případ cv =. 0 a ct =. 1. Věta 2.14. Nechť řešení u(x,y,t) diferenciální rovnice (2.248) s počáteční podmínkou (2.249) a okrajovými podmínkami (2.250) je dostatečně hladké. Dále nechť existuje dostatečně hladké řešení w(x, y, i) diferenciální rovnice (2.266) (Lw)(x,y,t) = l, (x, y) £ fi, ť £ (0,T), s okrajovou podmínkou (2.267) «(«,!,,*) = 1, (*,í)6r, t£(0,r), a s nezápornou počáteční podmínkou. Buď konečně u^} řešení soustavy (2.251) s počáteční podmínkou (2.252) a okrajovými podmínkami (2.253) při ct = 0 nebo ot = 1 a nechť platí (2.262), je-li a = 0. Pak existuje konstanta M taková, že je (2.268) 14? " u(xt,V„ti)\ ^M(r+h2) pro (xt,y.) £ ň« a/ = 0,...,r, Důkaz. Položme nk^ = 4's — u(xk,ys,ti). Na základě úvah úplně analogických jako v důkazu věty 3.7 z kap. II nebo věty 2.4 z kap. III (viz str. 179 nebo 254) snadno zjistíme, že lze nalézt konstantu M tak, aby pro funkci t/^ = = Mw(xk,ys,t{)(T + h2) platily nerovnosti (2.264). Tvrzení věty pak plyne ihned z lemmatu 2.10 a omezenosti funkce to. Analogická tvrzení se dokáží i pro ostatní okrajové podmínky, pokud jsou formulovány tak, aby platilo lemma 2.10. Obraťme se konečně k vyšetření konvergence metod daných operátorem při obecném a. Zde je situace komplikovanější než u explicitní nebo čistě implicitní 379 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU metody, neboť při 1/2 S a < 1 je princip maxima splněn jen za dodatečných omezení na poměr časového a prostorového integračních kroku, což je v jistém smyslu nepřirozené. Ani postup užitý v odst. 2.2.3 sem nelze bezprostředně přenést, neboť ve dvou (a více) dimenzích neplatí nerovnost (2.190). Pokud se spokojíme při vyšetřování operátorů LJ^ s normou analogickou normě dané vzorcem (2.77) a omezíme se na případ, že okrajové podmínky jsou splněny přesně, lze se opřít o lemma 2.3 a postupovat analogicky jako v odst. 2.1.2. K důkazu konvergence v tomto případě bude tedy stačit zjištění, že užité schéma je stejnoměrně stabilní vzhledem k počátečními podmínkám. Zformulujeme a dokažme příslušné tvrzení pro případ okrajové úlohy (2.248) až (2.250), kde oblast íí je čtverec (0,1) x (0,1). Položíme-li v tomto případě h = — l/n, kde n je přirozené číslo, tvoří funkce definované na množině £)M (n — l)2-dimenzionální vektorový prostor. Zaveďme v tomto prostoru normu analogickou normě (2.77), tj. za normu vektoru v o složkách v^,, (xj, u,) £ £jW berme číslo (2.269) mu. = [ft2 £ 1 («j,,s.)€n = 0, (xi.ff.JerW, l = m,...,r, platí (2.273) ||t,«||äí g M||,/m>|U,, pro každé m = 0,..., r — 1 a pro / = m.....r, kde ní'> je vektor o složkách ijj^, (xk,ys) £ flW. Abychom toho dosáhli, užijeme stejně jako v odst. 2.1.2 metodu separace proměnných, která nám dovolí psát řešení soustavy (2.271), (2.272) v uzavřeném tvaru. Buď tedy m libovolné pevně zvolené celé číslo, pro něž je 0 S m < r, a buď 380 2 METODA SlTl r/m> libovolný vektor z prostoru e£? ^'. Protože soustava vektorů v^'^, u,u = = 1,..., n 1, o složkách t)^'ř<) daných vzorci v it ,w =8111-sin-—, k,s = l.....n— 1. (2.274) tvoří zřejmě ortogonální bázi v prostoru e^""1^ (srv. také vzorec (2.91) z odst. 2.2 kap. III), dá se vektor t/"1) psát ve tvaru (2.275) „(»> = J2 «ft)"("''0. kde ai™1 jsou vhodné konstanty, a přitom platí (2.276) l|n(m)iu* = E tfďľh1' Hledejme řešení soustavy (2.271), (2.272) ve tvaru (2.277) i# = E <0«r)- Dosazením do rovnic (2.271), (2.272) snadno zjistíme, že k jejich splnění je třeba, aby pro funkci c(í) platilo (2.278) c(m) = 1, (1 + a/JA^Mí) = (1 - (1 - c)pX^)c(l - 1), ( = m + 1,... ,r, kde (2.279) Je tedy (2.280) A„, = 4(sin2^ + sin2g). v,p-\.....n - 1. ,n ri-(i-«)/?W-" a z rovnic (2.277) plyne, že platí (2.281) «,= s i^^r^yik^ie,. Vyšetřované schéma bude tedy stejnoměrně stabilní vzhledem k počátečním podmínkám právě tehdy, budou-li platit nerovnosti (2.282) l ^ 1 - (1 - a)/?A,„ L - 1 + ot/W,,,, ~ Pravá z těchto nerovností je splněna vždy, neboť podle vzorce (2.279) je Xrll S j> 0. Je-li 1/2 _ a á 1, platí i levá nerovnost (2.282) bez jakýchkoliv doplňujících 381 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU idmínek, neboť v tomto prípade je (1 — 2a)pXwll á 0, a tedy tím spíše platí rovnost po nerovnost (2.283) neboli (2.284) (1 - 2<*)j8A„íl < 2, -1 -ap\vfl < 1-(1 -a)p\ulí. Je-li naopak l í a< 1/2 a platí-li navíc nerovnost (2.270), platí opět (2.283), neboť je \vv. < 8. Tím je věta dokázána. Schéma dané operátorem LJ^ pri obecném a vede tedy v normě (2.269) k rychlosti konvergence 0(r + h2). Protože ve vzorci (2.258) lze zřejmě při a = 1/2 zaměnit sčítanec 0(t + h2) sčítancem 0(t2 + h2), má metoda daná operátorem t-h"t i zvaná i zde Crankova-Nicolsonova metoda, celkovou diskretizační chybu řádu 0(t2 + h2), V prostorově jednodimenzionální případě vedlo Crankovo-Nicolsonovo schéma k algoritmu s minimálním počtem operací mezi všemi metodami vycházejícími z operátorů i^™'. Zde tomu už tak není. Při užití Crankova-Nicolsonova schématu musíme totiž stejně jako u čistě implicitní metody řešit v každém časovém řádku soustavu 0(l/h2) rovnic o 0(l/h2) neznámých. Matice této soustavy je sice pásová (srv. odst. 2.1 z kap. III), šíře pásu je však 0(l/h), takže k řešení zmíněné soustavy např. Gaussovou eliminační metodou je třeba řádově 0(1/A4) operací. Položíme-li t = 0{h), je celkový počet operací 0(l/ři5) a toto číslo je dokonce větší než u explicitní metody. To je také důvod, proč se zavádějí tzv. metody střídavých směrů a lokálně jednorozměrné metody. Tyto metody jsou co do velikosti celkové chyby v podstatě ekvivalentní Crankově-Nicolsonově metodě, vedou však k podstatně ekonomičtějším algoritmům. Některé z nich si nyní stručně popíšeme. 2.3.2 Metody střídavých směrů Hlavním důvodem zavedení těchto metod je, jak už jsme uvedli, snaha po dosažení maximální výpočetní ekonomie. Základní myšlenka, která se sledovala při jejich vzniku, byla spojit výhody implicitních metod spočívající v nezávislosti jejich stability na poměru časového a prostorového integračního kroku, s tou skutečností, že soustavy lineárních algebraických rovnic s třídiagonální maticí lze velmi ekonomicky řešit Gaussovou eliminační metodou (neboť v této situaci je počet potřebných operací úměrný počtu rovnic). Princip těchto metod ukážeme na příkladě okrajové úlohy (2.248) až (2.250), kde fi je čtverec (0,1) x (0,1). Kromě přibližného řešení Uj.'*1' v čase t = se v těchto metodách počítá ještě pomocná hodnota ujj.j v mezivrstvě í = íi+1/2 = *i + r/2, a to tak, že k výpočtu hodnot Uj's+1'2' se za předpokladu, že hodnoty ujj.'' jsou už známé, použijí jiné vzorce než k výpočtu hodnot tíjj*"1^. Jedna z historicky prvních metod tohoto typu pochází od Peacemana 2 METODA SlTÍ a Rachforda a je dána dvojicí vzorců (2.285) „(1+1/2) „C+1) _ „C+1/1) +ô^[«í?.-i-H,íj+«.ľ.+j. (0 ^.,(') Zií. 2h 2h2' „C+l/2) . + 2^|U (i+i) k, s ■■ l,...,n .0+1) ''ti ■1,1 = 0,. (1+1/2) t+1 ľ'] + (1+1) 1 *,»+!)> První z rovnic (2.285) tedy vznikla tak, že v intervalu (řj, ri-1-1/2) jsme aproximovali derivaci d2v./dx2 příslušným diferenčním podílem v horní (tj. počítané) časové vrstvě a derivaci d^u/Oy2 v dolní (tj. známé) vrstvě. V druhém vzorci (2.285) jsme tento postup prohodili, Přepíšeme-li rovnice (2.285) ve tvaru (2.286) -^4'-+í,í2, + (i+^^1/2) ¥-U\T- = Í/J«.0-i,. + (i-M'.) + ^«&i... „C+l/2) k,S = 1, . -1, 1 = 0,. (1+1/2) ,r- 1 (položili jsme opět jako obvykle 0 = r/h2), je ihned vidět, že hodnoty přibližného „(1+1/2) ,0+1/2) '2i „(1+1/2) v čase f = ťi+1/2 dostaneme při pevném s řešením soustavy (n — 1) lineárních rovnic (n — 1) neznámých s třídiagonální regulární maticí a hodnoty přibližného řešení u^1', i'i'2"1' 1 ■ ■ ■ > ul'T.-i v ^ase ' ~ ''+1 P" pevném k rovněž řešením (n — 1) lineárních rovnic o (n — 1) neznámých s třídiagonální maticí (v našem speciálním případě budou dokonce všechny zmíněné třídiagonální matice stejné). Příslušný algoritmus tedy probíhá tak, že hodnoty přibližného řešení v mezivrstvě t = <[+i/2 počítáme postupně na přímkách y — yt rovnoběžných s osou x a hodnoty přibližného řešení ve vrstvě í = ť[+1 postupně na přímkách x = Xt rovnoběžných s osou y. Z tohoto charakteru algoritmu také pochází název metoda střídavých směrů. K tomu, abychom vypočítali přibližného řešení (1 + l)-ní časové vrstvě za předpokladu, že přibližné řešení v ř-té časové vrstvě je už vypočteno, je tedy třeba řešit dvakrát (n — 1) soustav lineárních rovnic o (n — 1) neznámých s třídiagonálními maticemi. Celkový počet operací potřebných k získání přibližného řešení v jedné časové vrstvě je tedy řádově roven číslu 0(l/h2). Při dalším vyšetřování Peacemanovy-Rachfordovy metody budeme už velice struční. Její lokální chyba (tj. chyba, se kterou se vypočte přibližné řešení v (i +■ + l)-ní časové vrstvě za předpokladu, že řešení v 1-té vrstvě je přesné) je řádu 382 383 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU 0(r2 -I- h2), jak se snadno zjistí standardním užitím Taylorova vzorce. Že i celková diskretizační chyba je téhož řádu (v normě prostoru EJ£_1) ) plyne pak už v podstatě z lemmatu 2.3 a z následující věty. Věta 2.16. Peacemanova-Rachfordova metoda střídavých směrů je v normě (2.269) stejnoměrně stabilní vzhledem k počátečním podmínkám. Důkaz. Podobně jako v důkazu věty 2.15 máme dokázat, že pro každé řešení soustavy (2.285) s nulovými okrajovými podmínkami platí odhad (2.287) HtfCOUn, g M||U(m>||„= pro m = 0,..., r — 1 a pro 1 = m, .., r. Funkci hledejme opět ve tvaru (2.288) 4'j= £■ c(l)a^vir\ kde funkce v ("■'') jsou dány vzorcem (2.274) a čísla ctí^ jsou Fourierovy koeficienty počátečního vektoru, tj. platí (2.289) u (0 _ v kt — / . Dosadíme-li (2.288) do (2.285), snadno zjistíme, že musí platit (2.290) T c(l + 1) - c(l + 1/2) 2^e,C(i + i)-^e,c(í + l/2), kde (2.291) Položíme-li znovu /? = rjh2 a vyloučíme-li c(l + 1/2) z rovnic (2.290), dostaneme g„ = 4sin2 v = 1, , n — 1. 2n (2.292) c(i i l)=^-iM(i-kM c(l). (l+i/?e„)(l + i^) Zopakujeme-li nyní doslova úvahy z důkazu věty 2.15, dostaneme, že podmínka (2.293) I(i+í^)(i+í^)I- je nutná a postačující podmínka požadované stability. Tato podmínka je však vzhledem k (2.291) splněna pro libovolné (i > 0. Věta je dokázána. Peacemanova-Rachfordova metoda je tedy absolutně stabilní a je při ní rozumné klást r = 0(h). Výpočet pak vyžaduje 0(l/h3) operací, což je výsledek podstatně příznivější než u kterékoliv z metod popsaných v odst, 2.3.1, 384 2 METODA SlTl Metod střídavých směrů byla navržena celá řada. Uveďme z nich ještě velmi známou metodu D'Jakonovovu, která je dána dvojicí vzorců (2.294) (/ - tf6W*m = (! + + i/?í>W (/-I/3Í2S,)U<<+1)= „0+1/2). Zde jsme použili stručný zápis diferenčních schémat pomocí identického operátoru/a operátoru centrální diference. Centrální diferenci přitom definujeme, jak je obvyklé, jako operátor, který funkci / přiřazuje funkci S f předpisem (í/)(x) — = f{x + h/2) — f(x — h/2). Mocninou operátoru S pak rozumíme operátor 5* definovaný rekurentně vztahem (Skf)(x) = (č*-1/)^ + h/2) - (5k~lf)(x - h/2). Pokud užijeme tuto operaci na funkci více proměnných, pak připojený index označuje proměnnou, které se operace týká. I pro D'Jakonovovu metodu platí věta 2.16, jak se snadno zjistí, a její lokální chyba je opět 0(r2 + A2). Poznamenejme, že zapíšeme-li Peacemanovu-Rachfordovu metodu analogickým způsobem jako metodu D'Jakonovovu, dostaneme dvojici vzorců (2.295) (/-í^V+^^z + i^V), V souvislosti s metodami střídavých směrů je ještě třeba upozornit na jednu velmi závažnou skutečnost. Údajům o velikosti chyb, které jsme uvedli, je nutno rozumět tak, že se týkají přibližného řešení pro celá l a že tato přibližná řešení jsou dána jak v případě Peacemanovy-Rachfordovy metody, tak v případě D'jakonovovy metody vzorcem (2.296) (' - »(' " =(' + »(' + l/M?)"1 CO s počátečními podmínkami " g(xk,ys) a okrajovými podmínkami iijj - f(xi, ya,ŕ|), (ajfc.y,) e ľ(h\ l = 0,...,r. Veličiny «('+1/2) s lomenými indexy přitom pokládáme za pomocné. Tyto pomocné veličiny nemusí aproximovat řešení v žádné časové vrstvě a zavádějí se jen proto, abychom řešení soustav rovnic, které je nutno při užití schématu (2.296) řešit, získali ekonomicky. Veličiny u('+1/2) jsou tedy vlastně definovány vzorci (2.297) a0+i/2) = i(/ _ ^5i)u<»+i) + i(/ + ipsfy (0 (Peacemanova-Rachfordova metoda) a (2.298) (/-i^V+i) (D'jakonovova metoda). Odtud však plyne, že i okrajové podmínky, které pro tyto veličiny potřebujeme při počítání podle vzorců (2.294), (2.295), je třeba volit 385 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU 3 SEMIDISKRÉTNl METODY v souladu s rovnicemi (2.297) a (2.298), tj. je třeba je počítat ze vzorců (2.299) 4',+,/2) = |(/ - 2-f362)J(xk,ys,tm)+ (Peacemanova-Rachfordova metoda) a (2.300) u^1/2) = (I - \pS2)y(xk,y„tw) (D'jakonovova metoda). Kdybychom kladli zdánlivě přirozeně Uj.'*1^ = = l{xh, S/j,í(+i/2), narušili bychom odhady chyb, které jsme uvedli. Závěrem tohoto odstavce upozorněme ještě na jednu zajímavou a důležitou souvislost. V odst. 2.3.2 z kap. III jsme zavedli Peacemanovu-Rachfordovu metodu střídavých směrů jako iteračm metodu pro řešení soustav lineárních rovnic, které vznikají při řešení okrajových úloh pro eliptické parciální diferenciální rovnice metodou sítí. Tato metoda vznikla Ve skutečnosti tak, že řešení eliptické rovnice se pokládá za ustálené řešení parabolické rovnice a tato parabolická rovnice se pak řeší metodou (2.285). 2.3.3 Lokálně jednorozměrné metody Tyto metody jsou velmi podobné metodám střídavých směrů. I zde se přibližné řešení u',+1) v čase í = t;+i za předpokladu, že přibližné řešení i»W v čase t = t; je už vypočteno, počítá tak, že se nejprve vypočte pomocná hodnota u('+1/2) pomocí jednoho vzorce a pak teprve konečná hodnota pomocí jiného vzorce. Nejběžnější metoda tohoto typu pochází od Janenka a je dána dvojicí vzorců (2.301) (/ - $pfyfl+w ~ (, + ipSi)um _ (í-^>(,tl)=(í + ^>|,+1'!). Přibližné řešení se tedy počítá tak, jako kdyby v časovém úseku mezi časy ť — íj a i = r|+i/2 vedl materiál teplo jen ve směru osy x a v časovém úseku {íi+1/2, U+i) pouze ve směru osy y. Odtud také pochází název metody. Je zřejmé, že jeden dvou-krok uvedené metody se realizuje stejně jako u metod střídavých směrů řešením soustav s třídiagonálními maticemi a že je řádově stejně pracný. Rovněž je zřejmé, jak lze tuto metodu přenést na případ více prostorových proměnných. Je k tomu pouze třeba rozdělit časový úsek (ťj, íj+i) na m mezivrstev, kde m je počet prostorových proměnných, a v každé mezivrstvě aproximovat pouze derivaci podle jedné prostorové proměnné. Metoda (2.301) je v normě (2.269) opět stejnoměrně stabilní vzhledem k počátečním podmínkám bez jakéhokoliv dalšího omezení na parametry raiav případě homogenních okrajových podmínek vede k rychlosti konvergence 0{r2 + h2). V případě nehomogenních Dirichletových okrajových podmínek se obvykle doporučuje brát za okrajové hodnoty pomocné veličiny u',+1/2) hodnoty okrajové funkce, tj. klást ukí = y(xk,ys, tl+i/i) Tato volba však vede podobně jako u metod střídavých směrů ke ztrátě přesnosti. Na rozdíl od tamní situace je však zde obtížné udat korekční vzorce typu (2.299) a (2.300), které by tuto obtíž odstraňovaly. To je také důvod, proč jsou lokálně jednorozměrné metody podstatně méně populární než metody střídavých směrů, 3 Semidiskrétní metody Již vícekrát jsme v této kapitole upozornili na to, že základní úloha pro parciální diferenciální rovnice parabolického typu má vzhledem k proměnné t charakter úlohy s počátečními podmínkami pro obyčejnou diferenciální rovnici a vzhledem k prostorovým proměnným charakter okrajové úlohy pro obyčejnou diferenciální rovnici, resp. pro parciální diferenciální rovnici eliptického typu. Metody, které v tomto článku popíšeme, si kladou za cíl této skutečnosti využít, a to tak, že diskre-tizace se provádí pouze vzhledem k prostorovým proměnným nebo pouze vzhledem k proměnné t. Nejdůležitějšími reprezentanty metod první skupiny jsou metoda přímek a semidiskrétní metody Galerkinova typu. V metodě přímek se diskretizace prostorových proměnných provádí na základě metody sítí, u semidiskrétních metod Galerkinova typu se vychází z Ritzovy-Galerkinovy metody pro řešení eliptických úloh a postup se většinou spojuje s metodou končených prvků. Metody druhé skupiny, kdy se diskretizace provádí pouze vzhledem k proměnné ť, se nazývají Rotheovy metody. Je třeba upozornit, že metody obou zmíněných skupin jsou odlišného charakteru než metoda sítí, jejíž různé varianty jsme popsali v předešlém článku- Zatímco výsledkem algoritmů založených na metodě sítí jsou přibližné hodnoty hledaného řešení v nějaké konečné množině bodů zadané oblasti, tedy veličiny, které nás už bezprostředně zajímají, za aproximaci přesného řešení v případě semidiskrétních metod slouží stále ještě nekonečnědimenzionální problémy, i když jednodušší než původní. Konkrétně jde v případě metod první skupiny o soustavy obyčejných diferenciálních rovnic s počátečními podmínkami, v případě Rotheovy metody o okrajové úlohy pro obyčejné nebo parciální eliptické diferenciální rovnice. K řešení těchto úloh se pak dají užít metody, které byly popsány v kap. I, II a III. Abychom se mohli v dalším výkladu soustředit na základní myšlenku vyšetřovaných metod a nezastreli ji množstvím technických podrobností, omezíme se v tomto článku prakticky výhradně na prostorově jednodimenzionální rovnici pro vedení tepla (2.1) s počáteční podmínkou (2.2) a s homogenními Dirichletovými okrajovými podmínkami (2.3) a možnosti rozšíření na obecnější úlohy jen stručně okomentujeme. 386 387 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU 3.1 Metoda přímek Tato metoda vychází, jak už jsme uvedli, z myšlenky metody sítí. Na rozdíl od ní se však síť sestrojí jen v oblasti prostorových proměnných a diferenčními podíly sc nahradí pouze derivace podle těchto proměnných. Přesné řešení daného problému je pak aproximováno řešením soustavy obyčejných diferenciálních rovnic s počátečními podmínkami. V odst. 3.1.1 popíšeme klasickou variantu této metody a v odst. 3.1.2 si stručně všimneme Numerovovy metody, v níž se uvedená základní myšlenka realizuje dosti důmyslně, a která má proto jistou popularitu. 3.1.1 Klasická metoda přímek Buď ti řešením problému (2.1) až (2.3), buď n přirozené číslo a rozdělme interval (0,1} na n dílků délky h = 1/n dělicími body xk — kh, k = 0,..., n. Nahradíme-li drahou derivaci d2u/dx2 v bodě ť) podílem [u(zi-i,r) - 2u(a;j;,i) + + u(x);+i,t)]/h2 a chybu, které se přitom dopustíme, zanedbáme, dostaneme pro přibližné řešení Ujt(í) na přímce í = íj, 0 ž í í t, soustavu obyčejných diferenciálních rovnic (3.1) ůi(t) = i[ui-i(i)-2u»(i) + ut+i(ť)], k = 1, ...,n- 1, t e (0,T), kde (3.2) (3.3) Uo(í) = Un(t) = 0, «*(0) - g(xk), fc=l, 1, a tečku užíváme jako stručné označení derivace podle proměnné t. Je zřejmé, že stejně jednoduše se dá postupovat i v případě složitějších parabolických rovnic. Chceme-li provést úplnou diskretizaci daného problému, je třeba řešit soustavu (3.1) vhodnou numerickou metodou. Užijeme-li např. nejprostší Eulerovu metodu, dostaneme explicitní metodu sítí. Podobně řešení této soustavy lichoběžníkovým pravidlem vede ke Crankově-Nicolsonově schématu. Souvislost mezi klasickou metodou přímek a metodou sítí je tedy skutečně velice úzká. V této souvislosti je také třeba upozornit na jednu důležitou a pro metodu přímek a pro semidiskrétní metody, v nichž se ponechává čas spojitý, vůbec typickou okolnost. Matice soustavy diferenciálních rovnic (3.1) je matice — (l/h2)Pa, kde P0 je matice (2.81). Její vlastní čísla jsou tedy dána vzorcem (3.4) Vv = -t? sin —, w = l,...,n-hl 2n (srv. vzorec (2.82)). Z tohoto vzorce však plyne, že absolutní hodnota vlastního čísla p\ konverguje pro h —» 0 k — jt2> zatímco absolutní hodnota vlastního čísla tin-i roste při h —+ 0 nade všechny meze. Soustava (3.1) tvoří tedy soustavu diferenciálních rovnic se silným tlumením (srv. odst. 6.3 z kap. I) a tento její charakter 388 3 SEMIDISKRÉTNÍ METODY je tím výraznější, čím je integrační krok h menší. Prakticky to má za následek, že řešení této soustavy obecnou metodou pro řešení úloh s počátečními podmínkami pro obyčejné diferenciální rovnice vede obecně pouze k relativně stabilním diferenčním schématům a že absolutní stabilitu lze očekávat pouze při užití A-stabilních nebo aspoň A(0)-stabilních metod. Konvergenční vlastnosti klasické metody přímek jsou uvedeny v následující větě. Věta 3.1. Nechť řešení problému (2.1) až (2.3) existuje — označme je ti — a nechť má v množině R = {(x, i); Oí iSl, 0 S ť ^ T) spojitou čtvrtou derivaci podle x. Nechť dále ut je přibližné řešení vypočtené z rovnic (3.1) až (3.3). Pak existují konstanty M a ho > 0 takové', že pro každé h ž /io a t e (0, T) platí (3.5) kde (3.6) (3.7) \\uM(t)-u(t)\\hŠMh3, uW(ť) = [„1(ť),...,un_1(í)]T u(t) = [u(asi,t)l...1ut>„-i,í)]T. Důkaz. Připomeňme především, že norma užitá ve vzorci (3.5) je norma v prostoru EÍ;n"13, tj. je to obyčejná euklidovská norma vynásobená činitelem h1 {viz vzorec (2.77))'. Užijeme-li označení (3.6), dá se soustava (3.1) psát maticově ve tvaru uM(ť)s-.lPoUW(t)i (3.8) »--w--fcj' kde Po je už výše zmíněná matice (2.81). Položme dále (3.9) •(*) » »WM - "(*) r(ť) = -prW*H*) -«■(*). (3.10) r(t) = [^(x1,t), ,^(--i,*)]T. takže je (3.11) Z předpokladů věty plyne, že platí (3.12) ^(■i,*)=0(«i,í) = ^[«(*i-i.O-2»(*».O-r «t>*+i,01 +«*(*). přičemž je pro h < ho, t £ (0,7*) a k = 1,... ,n 1 (3.13) \eh{t)\ÚMh2 389 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU a M a ha > 0 jsou vhodné konstanty. Položíme-li (3-H) .(t) = en-i(*)]T, plyne ze vzorců (3.10) a (3.12), že pro vektor r platí rovnice (3.15) Celkem tedy dostáváme, že vektor e(ť) splňuje soustavu diferenciálních rovnic 1 (3.16) s počáteční podmínkou (3.17) Je tedy (3.18) e(ť) Odtud však plyne, že je (3.19) ||e(t)|U í •»(*> = —Sä^eCO - =(*> e(0) = 0. Jo Jo Matice exp [ — (l//j2)(ť — r)Po] je symetrická a všechna její vlastní čísla jsou dána vzorcem exp [ — (l/k2)(t — r)A„], v = 1,..., n — 1, kde A„ jsou vlastní čísla čísla matice P0 (viz vzorec (2.82)). Všechna vlastní čísla matice exp [ —(l//»2)(ť — t)P0] jsou tedy pro r € (0,ř) menší než jedna. Protože maticová norma indukovaná vektorovou normou ||. ||Ä je zřejmě obyčejná spektrální norma, plyne odtud, že platí (3.20) \\e-b{t-T)Po\\h š 1, r€{0,t). Z nerovnosti (3.13) plyne, že pro í e (0,T) platí (3.21) ll«(*)ll* 1/2 § (AnM2ft4)l/S = M h". L i=l Z nerovností (3.19), (3.20) a (3.21) však už snadno dostáváme, že je (3-22) ||e(ť)|U š MTh\ což dokazuje větu. 3 SEMIDISKRÉTNl METODY 3.1.2 Numerovova metoda Tato metoda vychází z pozorování, že pro každou dostatečně hladkou funkci y platí (3.23) y{x - h) - 2y(x) + y(x + h) = - ift%"(* - h) + I0y"(x) + y"(x + h)) + 0(h6). Máme-li na mysli opět úlohu (2.1) až (2.3) a píšeme-li v této rovnici dv(x, t)/dt místo y"(x), dostaneme po zanedbání chybového členu pro přibližné řešení ut(t) soustavu rovnic (3.24) íV["*-i(ť) + 10"*W + »*+i(í)J = - 2u*(ť) + «t+i(*)]. fc = 1,..., n - 1, u0(í) - «„(ť) = 0 s počátečními podmínkami (3.3). Právě popsaná metoda se nazývá Numerovova metoda. O její konvergenci platí následující věta. Věta 3.2. Nechť řešení problému (2.1) až (2.3) existuje a má v R šest spojitých derivaci podle x. Nechť u^(i) je vektor přibližného řešení vypočteného Numero-vovou metodou a nechť u(í) je vektor přesného řešení. Pak platí (3.25) ||«iW(í) - «,(í)||, = 0{h% Důkaz je skoro totožný s důkazem věty 3.1, a proto budeme postupovat velmi rychle. Označíme-li matici na levé straně soustavy (3.24) symbolem B, zjistíme snadno, že pro vektor chyby e definovaný opět rovnicí (3.9) platí (3.26) 6 «(Í) = -Tí M0 -«(*). přičemž složky vektoru c jsou řádu 0(ři4). Pro matici S zřejmě platí B = = (1/12)(12/ — Po). Z tohoto vyjádření a ze znalosti vlastních čísel matice Po (viz znovu vzorec (2.82)) však ihned plyne, že matice B je pozitivně definitní a že pro ni platí ||B||a = 0(1) a (|B_1||a = 0(1). Vynásobíme-li tedy rovnici (3.16) zleva maticí B~íl dostaneme soustavu rovnic, jejíž řešení odhadneme úplně stejným způsobem jako řešení soustavy (3.16) v důkazu věty 3.1. Důkaz je hotov. Numerovova metoda tedy konverguje s rychlostí řádu 0(h4). Protože matice 6 je třídiagonální, vede numerické řešení soustavy (3.24) k řešení soustavy lineárních rovnic s třídiagonální maticí pro každý časový řádek. Numerovova metoda není tedy o nic pracnější než implicitní metoda sítí, která má ovšem řádově větší diskretizační chybu. To jej jistě pozoruhodné a pramení odtud i určitá popularita Numerovovy metody. 390 391 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU 3.2 Semidiskrétní metody Galerkinova typu Základní myšlenka tohoto postupu je obdobná jako u Galeikinovy metody pro řešení okrajových úloh pro obyčejné diferenciální rovnice, resp. pro parciální rovnice eliptického typu. Protože Galerkinova metoda v eliptickém případě vychází z pojmu slabého řešení, musí náš první krok spočívat v zavedení podobného pojmu pro parabolický případ. Postup je zcela analogický jako v eliptickém případě, a popíšeme jej proto jen velmi stručně, a to na příkladě modelové úlohy (2.1) až (2.3). Buď JPq podprostor těch funkcí u ze Sobolevova prostoru Jť1, které splňují okrajovou podmínku u(0) = «(1) = 0. Řekneme, že funkce ti: (0,T) —> jťal je slabým řešením úlohy (2.1) až (2.3), platí-li pro každé i 6 (0, T) a pro každé v £ £ JPq identita (3.27) (ú(ť),tí) + [u(ť),„] = D a pro t = 0 a pro každé v 6 Jťg identita (3.28) («(0), «) = («,*) (počáteční podmínka). Zde kulaté závorky značí skalární součin v prostoru -2a(0,1): [«, v] je bilineární forma definovaná vzorcem (3.29) (a je to tedy skalární součin v prostoru JrJ1) a tečka označuje stejně jako výše derivaci funkce u podle i. Buď dále % konečnědimenzionální podprostor prostoru JÄg1. Semidiskrétní Galerkinovu aproximaci řešení úlohy (3.27), (3.28) pak definujeme jako funkci "h '■ (0, T) —* pro niž platí (3.30) (úh{t),v) + [uh(t),v]--0, í£(0,T> .i (3.31) M, N 1=1 Hledané koeficienty íj = [iji(ť), .., t}n-i{t)]T tedy splňují soustavu diferenciálních rovnic (3.34) Bii(t) + Ari(t) = 0, í e (0, T), s počáteční podmínkou (3.35) 0,(0) = tf°\ kde A a. B jsou symetrické matice řádu N dané vzorci (3.36) A= {[*,, *j]} = {£*'i(x)ťi{x)dxy B = {(**, - { jf d* J a »/0' je iV-dimenzionální vektor o složkách (3,$,). Matice A a, B jsou zřejmě symetrické a pozitivně defmitní, soustavu diferenciálních rovnic (3.34) lze tedy psát ve tvaru (3.37) i7(í) + Av{t) = 0, kde (3.38) A = B~1A. Za prostor &h se většinou volí prostor konečných prvků, neboť pak je zaručeno, že matice A i B jsou pásové, což podstatně usnadňuje řešení soustavy (3.34). Poznamenejme v této souvislosti, že v důsledku přítomnosti matice B v soustavě (3.34) nemá smysl řešit tuto soustavu explicitní metodou, neboť tak jak tak musíme v každém kroku řešit soustavu lineárních rovnic. V tomto smyslu je zde tedy situace podobná jako u Numerovovy metody vyšetřované v odst. 3.1.2. V dalším textu se omezíme na případ, že za prostor Sfy, bereme prostor po částech lineárních funkcí, které splňují nulové Dirichletovy okrajové podmínky a že příslušné dělení intervalu (0,1) je ekvidistantní s podintervaly délky h. Na tomto speciálním případě pak ukážeme jeden z možných způsobů vyšetřování konvergence studované metody. Uvidíme, že už i v této jednoduché situaci nebude ani zdaleka vše tak elementární, jako tomu bylo u metody sítí nebo u klasické metody přímek. Než zformulujeme a dokážeme příslušné tvrzení, uvedeme několik lemmat, která při 393 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU jeho důkazu použijeme. Abychom však nemuseli psát příliš mnoho indexů, umluvíme se ještě předtím, že pod symbolem absolutní hodnoty budeme v dalším rozumět euklidovskou normu vektoru nebojí indukovanou normu matice a že obyčejný symbol normy bez jakéhokoliv indexu bude značit normu v prostoru JSfa(0,1). Lemma 3.1. Buď 9^ C prostor po částech lineárních funkcí s ekvidistant-nún dělením o délce dílku h — 1/(N + 1) a bud'$i,..., <Ějf jeho standardní báze. Pak pro matice A a B definované vzorci (3.36) platí A=^Po, B = iA(6/-P0), (3.39) kde Po je matice (2.81) a (3.40) W = 0G)> lfll = °(A)- l8_1l = °(ä- Důkaz Vzorce (3.39) odvodíme přímým výpočtem za použití konkrétního tvaru bázových funkcí (viz vzorec (4.83) z kap. II). Z těchto vzorců a ze znalosti vlastních čísel matice Po (viz vzorec (2.82)) však plyne, že vlastní čísla A^ a XÍB^ matice A a B jsou dána vzorci 4 (3.41) (3.42) A(") = rin"2(iv+i)' Odhady (3.40) pak plynou odtud a z toho, že je \A\ Amáx, \B\ ~ Anfáx a \B 1| — Lemma 3.2. Existují kladné konstanty c a C takové, že pro každou funkci N (3.43) rí=^iK*,-G^ c%|2 g |M|2 $ ChW2. platí (3.44) Důkaz. Je (3.45) ||n|p = EE *■&<*«•*') = ^ i=l ;=1 Protože pro symetrickou a pozitivně definitní matici B platí (3-46) AffiMašVB?gAÍ&Í«l|a. plyne tvrzení ze vzorce (3.42). r 3 SEMIDISKRÉTNl METODY Lemma 3.3. Nechť je dána množina matic Ct, kde t probíhá libovolnou množinu indexů I, a nechť pro každé t e I je matice Q symetrická a pozitivně semideňnitní. Pak existuje konstanta M taková, že pro každé t € I platí (3.47) |Ge-c'|gM. Důkaz . Vlastní čísla symetrické matice Cte~c' jsou tvaru A příslušné semidiskrétní řešení. Pak existují konstanty M a ho > 0 takové', že platí (3.52) max \\u(t)-uh(t)\\,,(«), v], 5 6(0, i), vE&h, s „koncovou" podmínkou (3.54) {s). Dostaneme (3.60) -(*(0)) + («(0)~iii(0)ltP»(0)) - (e»(0),V»(0)), přičemž poslední rovnost platí v důsledku počátečních podmínek, které splňují funkce « a Uh - Dosadíme-li poslední dva vztahy do rovnice (3.63), máme (3.67) ||e„(i)||2 = (9(0), M°)) + /' { (*(»). WkW) + PM, P» Wl} «!*• JO Provedeme-li v prvním integrálu na pravé straně rovnice (3.67) integraci per partes a užijeme-li toho, že podle definice funkce íj, je [9(s), tpk(s)} = [«(*) -— úji(s), í(í) = ^(ť - sJÄe-í'-^ífť). (3.73) Odtud použitím lemmatu 3.3 dostáváme (3.74) Pišme dále (3.75) /*lé(»)|d.= /' " |{(»)|d*+ f \k{s)\ás. JO JO Jl-h3 Podle (3.74) je (3.76) j~ |í(s)|dsSM|í(i)|jí" - ~ = MjS(í)|lnp. Dosadíme-Ii do druhého integrálu na pravé straně rovnice (3.75) za £(s) /. rovnice (3.59) a normu vektoru £(s) odhadneme podle (3.72), dostáváme (3.77) Jt-h? j)|df £|í(í)||>*|Äa Podle lemmatu 3.1 je však \A\ - 0(l/h2): takže celkem dostáváme z rovnice (3.75) a nerovností (3.76) a (3.77) (3.78) /jťM|d«SM|É(Ol(l + lnj£)-Z lemmatu 3-2 a z nerovnosti (3.72).plyne, že je (3.79) llpíMH* ž Ch\í(s)\2 á Ch|€WI2 š flMOlP 398 3 SEMIDISKRÉTNl METODY Platí tedy (je ^(ť) = eh(í)) (3.80) \\Vh(t)\\ S M\Mt)\\. (Konstanta M je zde i dále samozřejmě generická.) Zcela analogicky odvodíme z nerovnosti (3.78) nerovnost (3.81) jT* \\M*)\\ i" š M||eh(i)|] (l + ln ±). Nyní jsme už skoro hotovi. Z vyjádření (3.68) plyne (3.82) |Mt)||2 š\W)\\ IM0II + í'\\0(*)\\ \\M')\\i'- Jo Dosadíme-Ii do této nerovnosti odhad (3-81), dostáváme (3.83) IMOH2 S (m^ ||«(«)||)||ek(í)|| [l + Af (l + ln-)], a tedy celkem (3.84) IMOII ú M(l + ln 1) max Píšeme-li nyní celkovou diskretizační chybu u — uj, ve tvaru (3.85) u — Uh — u - Ub 4- «» — u/i = 9 - e/,, dostáváme pro ni z odhadu (3.84) nerovnost (3.86) ||«-u»|| ^ M(l 4-ln^) max ||(?(S)||. Abychom dokázali nerovnost (3.52), stačí už jen odhadnout normu funkce 6. Řešme k tomu cíli pro tuto funkci okrajovou úlohu zformulovanou v lemmatu 3.4. Funkce 9 patří podle (3.64) nejen do prostoru Jžŕji ale dokonce do JČq1, takže ji lze dosadit do identity (3.49). Dostaneme tak rovnici (3.87) |l«||a = l»,fl = (»-ini,«]1 kde j/;, je interpolace funkce & v prostoru &f,. Je tomu tak proto, že podle definice funkce 6 je [8, v] — 0 pro každou funkci v £ &h- Z rovnice (3.87), z věty 4.5 z kap. II (viz str. 227) a z lemmatu 3.4 postupně dokážeme, že platí (3.88) \\e\\2 š \\y - yh\\^ á MhM\^ á Mih\\0\\ ||«||# Odtud však plyne, že je (3.89) \]9\\ í MhWBWjp . Na druhé straně však je (3.90) ||j(t = ||u - «k||jť« Sllu-tJ[|jr' 399 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU pro každou funkci v G &h, neboť Uh je ortogonální projekce na podprostor 3\. Tedy speciálně, opět podle věty 4.5 z kap. II, máme (3.91) Celkem tedy platí (3.92) IIjc ^Mh\\u\\ ||0(«)|| ŠMA2||„(S)||^ Odtud a z nerovnosti (3.86) však už plyne nerovnost (3.52) bezprostředně. Věta je dokázána. 3.3 Metody Rotheova typu V předchozích odstavcích jsme popsali ty semidiskrétní metody pro numerické řešení parciálních diferenciálních rovnic parabolického typu, které vznikly tak, že diskretizace se prováděla pouze vzhledem k prostorovým proměnným. Řešení původního problému pak bylo aproximováno úlohou s počátečními podmínkami pro soustavu obyčejných diferenciálních rovnic. Obrácení tohoto postupu, tj. provedení diskretizace pouze vzhledem k proměnné í, tvoří základní myšlenku metod Rotheova typu. Podrobněji se budeme zabývat jen nejjednodušší z nich a omezíme'se opět na modelovou úlohu (2.1) až (2.3). Položíme-li í[ — Ir, kde t = T/r, nahradíme-li derivaci dujdt v bodě (x,ti) podílem \u{x,ti) — u(x, ŕ/_i)]/r a chybu, které se přitom dopustíme, zanedbáme, je přibližné řešení uW(x), 1 — 1,..., r, v čase í = t; dáno řešením diferenciální rovnice (3.93) d V) 1 d z2 s okrajovými podmínkami (3.94) (0 . 1 í= 1, „(0 (0): (i) = o- Popsaná metoda tedy vznikne tak, že se na danou diferenciální rovnici díváme jako na obyčejnou diferenciální rovnici vzhledem k proměnné í a tu řešíme implicitní Eulerovou metodou. Náhradní problém je tedy okrajová úloha pro obyčejnou diferenciální rovnici, k jejímuž řešení lze většinou bez podstatných obtíží užít kteroukoliv z metod popsaných v kap. II. Často přitom vznikne některá z variant metody sítí. Při vyšetřování konvergence Rotheovy metody vyjdeme ze dvou elementárních lemmat, která vyjadřují některé jednoduché vlastnosti diferenciální rovnice typu (3.93). Lemma 3.5. Buď y funkce spojitá v intervalu (0,1), která je navíc dvakrát spojitě diferencovatelná v (0,1). Buď dále q kladná konstanta a nechť platí (3.95) 400 -y"(x) + qy(x)ÚO M — max y(x) 3 SEMIDISKRÉTNÍ METODY pro každé x e (0,1). Položme konečně (3.96) a předpokládejme, že je M > 0. Pak platí (3.97) M = max[j/(0),!í(l)]. Důkaz. Buď M = y(xo) a předpokládejme, že je x0 e (0,1). Protože funkce y nabývá v bodě xo svého maxima a je v něm dvakrát spojitě diferencovatelná, platí y'(xa) - 0 a y"(x0) - 0. Podle (3.95) v tomto bodě platí (3.98) 0 ž -y"(x0) + qy{x0) ž qy{xB) = qM > 0, což není možné. Proto je Xo = 0 nebo z o = 1 a důkaz lemmatu je hotov. Diferenciální operátor na levé straně nerovnosti (3.95) splňuje tedy princip ma- Lemma 3.6. Buďte u a rf dvě funkce spojité v intervalu (0,1) a dvakrát spojitě diferencovatelné v otevřeném intervalu (0,1). Nechť dále pro každé x £ (0,1) piati (3.99) | - u"{x) + qu{x)\ g -n"(x) + qr){x), kde q je kladná konstanta. Nechť konečně je |u(0) | á í)(0) a |tí(l)| á »j(l). Pak platí (3.100) |ií(z)| S r)(x) pro každé x £ (0,1), Důkaz. Položme ip = ±u — n. Z nerovnosti (3.99) ihned plyne, že pro každé x £ (0,1) platí (3.101) -p{x) - =Fu"(i) ± qu(x) + rr"(x) - 917(1) á 0. Buď nyní (3.102) M = max ľ±ti(z) - n(x)} a předpokládejme, že je M > 0. Pak je podle lemmatu 3.5 (3.103) M - max[±u(0) - n(0), ±«(1) - n(l)] g 0. To je však spor dokazující, že je M ^ 0, Odtud už tvrzení lemmatu plyne bezprostředně Veta 3.4. Nechť řešení úlohy (2.1) ai (2.3) existuje a má v množině R = = {(x, t); 0 í í í 1, 0 š t í t} dvě spojité derivace podle proměnné t. Nechť dále j/!'(a:) je přibližné řešení vypočtené Rotheovou metodou (3.93), (3.94). Pak existují konstanty M a tq > 0 takové, že pro r To píafcí (3.104) \uV)(x)-u(x,ti)\ ÍJÍT, i = l, 401 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU Důkaz Chyba ij(0(i) = u^(x) - u(x,ti) Rotheovy metody splňuje rovnice (3.105) a (3.106) d r2 + -tŕ'> = -v' ,(0(o) = fJW(i) = o, 1 = 1, ...r, ^ - 0.. přičemž existuje konstanta M taková, že pro každé x £ (0,1) a pro každé dostatečně malé t platí (3.107) |e0)(z)| g Mt. Položme v rovnici (3.105) nejprve / = 1. Pak pro chybu v prvním časovém řádku platí (3.108) dVl> + -n (i) - M) d z2 r/W(0) = ijWíl) = 0. Podle lemmatu 3.6 je však řešení této okrajové úlohy majorizováno funkcí (3.109) (x), kde funkce ip jc řešením pomocné okrajové úlohy (3.110) yj" + -ip = 1, 4>(o) = V(i) = o. Pro funkci ip totiž platí vzhledem k nerovnosti (3.107) (3.111) -V'(*) + -*>(*) = Mr > I - d fy + V>04 r I d aľ1 r I Funkce -i/i, která řeší okrajovou úlohu (3.110), je však dána vzorcem (3.112) t/>(x) r — r- cosh jak se snadno zjistí přímým výpočtem. Odtud však plyne, že pro každé x £ (0,1) platí (3.113) 0 g ip(x) % r. (Abychom to nahlédli, stačí vypočíst maximum funkce (3.112) v intervalu (0,1).) Je tedy (3.114) 402 \ri(1)(x)\ a Mr\f(x) <| Mr2 CVIČENI Nyní již snadno dokážeme úplnou indukcí, že platí (3.115) lijWfi)! g M/r2. Skutečně, předpokládáme-li, že nerovnost (3.115) platí pro i — 1, dostaneme z (3.105), (3.107) a z indukčního předpokladu, že je I dVor*) (3.116) dx2 ■ + -'/''(z)! š M(í- l)r+ Afr = Mír. Odtud však úplně stejnou úvahou, jako jsme dospěli k nerovnosti (3.114), dokážeme, že platí (3.115). Věta je dokázána. CVIČENÍ 1. Formulujte přesně hladkostní předpoklady, které stačí k platnosti vzorce (2.5). 2. Odvoďte vzorec (2.25). 3. Proveďte příslušné numerické výpočty dokazující komentář pod vzorcem (2.25). 4. Prověřte platnost vzorce (2.32). 5. Dokažte platnost principu maxima pro operátor daný vzorcem (2.4) (tj. pro explicitní schéma). 6. Dokažte, že maticová norma indukovaná normou prostoru E^"1-1' je obyčejná spektrální norma. 7. Na základě rovnic (3.40) a (3.58) z kap. II odvoďte tvar operátorů a l^'^ daných vzorci (2.117) a (2.118). 8. Formulujte přesně hladkostní předpoklady ve větách 2.6 a 2.7 (viz str. 353) a dokažte jejich tvrzení. 9. Dokažte konvergenci explicitní metody pro rovnici (2.109) s Dirichletovou okrajovou podmínkou. Nalezněte podmínku stability. 10. Proveďte podrobně výpočty potřebné k důkazu lemmatu 2.4 ze str. 360. 11. Dokažte, že splnění podmínky (2.161) implikuje platnost principu maxima pro operátor LJfl daný vzorcem (2.117). 12. Formulujte a dokažte pro D'Jakonovovu metodu střídavých směrů větu analogickou k větě 2.16 (viz str. 384). 13. Dokažte stejnoměrnou stabilitu vzhledem k počátečním podmínkám Janenkovy metody (2.301). 14. Dokažte platnost odhadu (3.23). 403 IV. PARCIÁLNI DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU POZNÁMKY K LITERATÚRE Cl. 1. Teorii parciálních diferenciálních rovnic parabolického typu je věnována skoro stejně rozsáhlá literatura jako teorii eliptických rovnic, viz např. Petrovskij (1960), Friedman (1964), Ladyženskaja, Solonnikov a Uralceva (1967), pokud jde o klasickou teorii, Lions (1961) a Lions-Magenes (1968), pokud jde o funkcionálně analytické metody. Dobrými obecnými prameny k problematice této kapitoly jsou např. Collatz (1951), Forsythe, Wasow (1960), Babuška, Práger, Vitásek (1964), Berezin, Zidkov (1966), Babuška, Práger, Vitásek (1966), Mitchell (1969), Ansorge (1978) a Marčuk (1980). Cl. 2. Základy metody sítí jsou vyloženy ve všech obecných pramenech uvedených k čl. 1; kniha Sauljevova (1960) je věnována speciálně řešení parabolických rovnic metodou sítí. Ke studiu problémů stability jsou velmi dobrými prameny Richtmyer (1957), Richtmyer, Morton (1967) a Samarskij (1971). Obsáhlou bibliografii metody sítí jakož i ostatních metod pro řešení parabolických rovnic nalezne čtenář ve sborníku Jacobsově (1977). Speciálně metodami střídavých směrů a lokálně jednorozměrnými metodami se zabývá Janenko (1966). Cl. 3. Klasická metoda přímek je populární zejména v sovětské literatuře a zabývá se jí např. Berezin, Židkov (1966). Základní poučení o ní lze nalézt také ve sborníku vydaném Hallem a Wattem (1976). Semidiskrétní metody Galerkinova typu se zejména v poslední době dosti intenzívně studují a poučení o nich lze nalézt už v celé řadě knižních publikací. Uveďme z nich jmenovitě knihu Strangovu a Fixovu (1973), Mitchellovu a Waitovu (1977), Thoméovu (1984), Goeringovu, Roosovu a Tobiskovu (1988) a zejména pak knihu Johnsonovu (1988), z níž jsme také vydatně čerpali. Rotheova metoda se už dlouho užívá k teoretickým úvahám, viz např. Ladyženskaja, Solonnikov, Uralceva (1967). Kniha Rektorysova (1982) je monografií, která je v podstatě celá věnována této metodě, LITERATURA ANSORGE, R.: Differenzenapproximationen partieller Anfangsweraufgaben. Stuttgart, Teubner 1978. BABUŠKA, I. - PRÁGER, M. - VITÁSEK, E.: Numerické řešení diferenciálních rovnic. Praha, SNTL 1964. BABUŠKA, I. - PRÄGER, M. - VITÁSEK, E.: Numerical Processes in Differential Equations. London-New York-Sydney, Interscience Publishers 1966. BEREZIN, LS. - ŽIDKOV, N.P.: Metody vyčislenij. 3. vyd. Moskva, Nauka 1966, 2 sv. COLLATZ, L.: Numerische Behandlung von Differentialgleichungen. Berlin-Göttingen-Heidelberg, Springer-Verlag 1951. (Překlad do ruštiny: Moskva, IL 1953.) LITERATURA D'JAKONOV, E.G.: Raznostnyje Bchemy s rasščepljajuščimsja operatorom. Ž. Vyčísl. Mat. i Mat. Fiz. 2, 1962, s. 549 - 568. FORSYTHE, K.E. - WASOV, W.R.: Finite Difference Methods for Partial Differential Equations. New York-London, J. Wiley and Sons 1960. (Překlad do ruštiny: Moskva, IL 1963.) FRIEDMAN, A.: Partial Differential Equations of Parabolic Type. Englewood Cliffs, N.J., Prentice-Hall 1964. GOERTNG, II. - ROOS, H.G. - TOBISKA, L.: Finite-Element-Methode. Berlin, Akademie-Verlag 1988. HALL, G. - WATT, J.M. (eds.): Modern Numerical Methods for Ordinary Differential Equations. Oxford, Clarendon-Press 1976. (Překlad do ruštiny: Moskva, Mir 1979.) JACOBS, D.A.H. (ed.): The State of the Art in Numerical Analysis. London-New York San Francisco, Academic Press 1977. JANENKO, N.N.: Metod drobných šagov. Novosibirsk, Iz. NGU 1966. (Překlad do angličjtny: New York-Geidellierg-Kerlin, Springcr-Vcrlag 1971.) JOHNSON, C: Numerical Solutions of Partial Differential Equations by the Finite Element Method. Cambridge, Cambridge University Press 1988. LADYŽENSKAJA, O.A. - SOLONNIKOV, V.A. - URALCEVA, N.N.: Linejnyje i kvazilinejnyje uravnenija paraboličeskoho tipa. Moskva, Nauka 1967. LEES, M.: Apriori Estimates for the Solution of Difference Approximations to Parabolic Equations. Duke Math. J. 27, 1960, s. 297 - 311. LIONS, J.L.: Equations differentielles operationelles et problěmes aux limites. New Vork-Heidclbcrg-Bcrlin, Springer-Verlag 1961. LIONS, J.L. - MAGENES, E.: Problěmes aux limites non homogěnes et applications. Vol. 2. Paris, Dunod 1968. MARČUK, G.I.: Metody vycislitel'noj matematiki. 2. vyd. Moskva, Nauka 1980. (Překlad do češtiny: Praha, Academia 1987.) MITCHELL, A.R.: Computational Methods in Partial Differential Equations. London-New York-Sydney-Toronto, J. Wiley and Sons 1969. MITCHELL, A.R. WAIT, R: The Finite Klement, Method in Partial Differential Equations. Chichester-New York-Brisbane-Toronto, J. Wiley and Sons 1977. (Překlad do ruštiny: Moskva, Mir 1981.) PEACEMAN, D.W. - RACHFORD, H.H.: The Numerical Solution of Parabolic and Elliptic Differential Equations. J. Soc. Indust. Appl. Mat. 3, 1955, s. 28 - 41. PETROVSKIJ, I.G.: Lekcii ob uravnenijach s častnymi proizvodnymi. Moskva-Leningrad, Gostechizdat 1950. (Překlad do češtiny: Praha, Přírodovědecké vydavatelství 1952.) REKTORYS, K.: The Method of Discretization in Time and Partial Differential Equations. Dordrecht, J. Reidel 1982. (České vydání: Praha, SNTL 1985.) 404 405 IV. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE PARABOLICKÉHO TYPU RICHTMYER, R.D.: Difference Methods for Initial Value Problems. New York- REJSTŘÍK London, Interscience Publishers 1957. (Překlad do ruštiny: Moskva, IL I960.) RYCHTMYER, R.D. - MORTON, K.N.: Difference Methods for Initial Value Problems. New York-London-Sydney, J. Wiley and Sons 1967. SAMARSKIJ, A.A.: Vvedenije v teoriju raznostnych schein, Moskva, Nauka 1970. SAULJEV, V.K.: Integrirovanije uravnenij paraboliceskoho tipa metodom setok. Moskva, Fizmatgiz I960. STRANG, G. - FIX, K.J.; An Analysis of the Finite Element Method. Englewood Cliffs, N.J., Prentice-Hall 1973. (Překlad do ruštiny: Moskva, Mir 1977.) THOMÉE, V.: Galerkin Finite Element Methods for Parabolic Problems. Berlin-New York-Heidelberg, Springer-Verlag 1984. aproximact: Picardovy 14 - postupné 14 - semidiskrétní Galerkinova 392 - v metodě sítí 288 A-stabilita 112 A(a)-stabilita 116 část hlavní diskretizační chyby celkové 29 ----lokální 46, 84 derivace distributivní 296 - zobecněná 296 diference centrální 385 - zpět 51 dráha v grafu 165 D-stabilita 64 extrapolace Richardsonova 292 funkce přípustná 293 graf konečný orientovaný 165 - silně souvislý 165 hrana grafu 165 hranice hpschitzovská 295 chyba diskretízační celková 16, 178 - lokální 17 ---Adamsovy-Bashforthovy metody 55 ---Adamsovy-Moultonovy metody 57 ---metody numerického derivování 61 --metody sítí 179, 257, 288 ---mnohokrokové metody 62 ---obecné jednokrokové metody 33 zaokrouhlovací celková 17, 30 - - lokální 30 identita integrální Marčukova 172 interpolace při ekvidistantních argumentech 51 interval stability absolutní 87 --relativní 88 konormála 242 konstanta chyby 80 konvergence abstraktní metody sítí 289 - Eulerovy metody 21 - obecné jednokrokové metody 41 - obecné mnohokrokové metody 64 - prostá 16 konzistence 40, 67 korektnost metody sítí 289 korektor 97 kořeny charakteristického polynomu nepodstatné 78 - — — podstatné 78 krok integrační 14, 246 lemma Bellmanovo 150 - Collatzovo 166 - Gronwalovo 150 L- stabilita ] 16 matice diagonálně dominantní 166 - dvoucyktická 278 - fundamentální 128, 157 - Gramová 224, 300 - ireducíbilně diagonálně dominantní 166 - íreducibilní 165 - konzistentně uspořádaná 278 - monotónní 163 - nerozložitelná 165 - ostře diagonálně dominantní 166 - přechodu 335 - reducibilní 165 - rozložitelná 165 407 REJSTŘÍK REJSTŘÍK tuhosti 224, 300 - elementární 236 metoda Adamsova-Bashforthova 53 - Adamsova^Moultonova 56 cyklické Tedukce 276 - diferenční 162, 249 - Eulerova 15, 21 - modifikovaná 37 - Fehlbergova 38 - Fourierova 345 - Galerkinova 224, 300 - Gaussova-Seidelova 277 - - bloková 280 - Heunova 37 - Huíova 39 - jednokroková obecná 33 ---konzistentní 40 - - regulární 39 - k-kroková 61 - absolutně stabilní 87 - - D-stabilní 64 - explicitní 56, 61 - implicitní 56, 61 - konzistentní 67 - optimální 88 --relativně stabilní 88 - konečných prvků 226, 301 - lokálně jednorozměrná 285, 386 - Milnova-Simpsonova 58 - mTiňhokroková Gl --absolutné stabilní 87 - - £>-stabilní 64 --explicitní 56, 61 --implicitní 56, 61 - konzistentní 67 --optimami 88 - relativně stabilní 88 - neúplného rozkladu (Stoneova) 277 - neurčitých koeficientů 249 - Numerovova 391 - Nyatrômova 58 - polovičního kroku 29, 290 - přesunu okrajové podmínky 131 ----normalizovaného 148 - pfímek 244, 387 - - klasická 388 - Ritzova 222, 299 - Rítzova-Galerkinova 225 - Rotheova 387, 400 - Rungova-Kuttova 35 —- obecná 36 - standardní 38 - ^družených gradientů 278, 285 - - - předpodmíněná 286 - separace proměnných 345 - sítí 162, 245, 331 - Crankova-Nicolsonova 349 - - explicitní 333, 378 - - implicitní 333, 378 - zvýšené přesnosti 265 - střelby 125 --na více cflů 130 - Střídavých směrů 277, 382 —■ ™ D'jakonovova 385 ---Peacemanova-Rachfordova 282, 382 - supertelaxační 277 --bloková - Taylorova rozvoje 35 - více sítí 286 metody A stabilní 112 - diskrétní 14 - gradientní 277 - iteraČní 277 --bodové 281 - - blokové 280 - lokálně jednorozměrné 285, 386 - mnohokrokové 50 --optimami 88 - numerického derivování 51, 59 - numerické integrace 50 - prediktor-korektor 97 - přímé 213 - Rotheova typu 387, 400 - Rungovy-Kuttovy 35 - sernidiskrétní 331, 387 --Galerkinova typu 387 - střídavých směrů 277, 382 - variační 213 - zvýšené přesnosti 265 modul spojitosti 22 nerovnost Céova 301 nerovnosti energetické 182 nestabilita slabá 85 norma energetická 183, 295 oblast stability 108 odhad chyby 16 --aposteriorní 30 --apriorní 31 --asymptotický 16, 27, 76 --Bieberbachův 44 oko sítě 246 parametr růstový 79 - uzlový 226, 302 parametry iterační 284 - uzlové 226, 302 podmínka Lipschitzova 15 - okrajová 242, 330 - - Dirichletova 243, 331 --Neumannova 243, 331 --Newtonova 243, 331 - počáteční 13, 330 podmínky konzistence 67 - okrajové 122, 242 --Dtrich letový 128 --lineární 132 408 - nestabilní 299 - Neumannovy 137 --separované 122 --stabilní 299 - počáteční 13 - souhlasu 333 pole směrové 16 polynom charakteristický druhý 65 ■— první 65 - - třetí 87 posloupnost rozkladů regulární 311 pravidlo tříosminové 38 prediktor 97 princip maxima 177 prostor konečných prvků 226, 303 - Sobolevův 218, 295 prvek konečný 226, 303 - obdélníkový 321 ---Hermitův 323 - Lagrangeův 321 - trojúhelníkový 304 ---Hermitův 318 ---Lagrangeův kubický 315 - — kvadratický 312 ----lineární 304 ■----obecný 317 přepis okrajových podmínek Collatzův 258 přesnost mezní 31 rovnice biharmonická 243 - diferenční 243 - Poissonova 265 - pro vedení tepla 332 rychlost konvergence 16 řád lineární mnohokrokové metody 62 - metody sítí 288 - obecné jednokroková metody 34 řešení slabé 219, 297 - parabolické rovnice 392 - zobecněné 219, 297 explicitní 333 - implicitní 338 sí£ 245, 287 splinořunkre Hermitovy 233 S-poměr 111 součin skalární energetický 295 soustava cliferentiálních rovnic se silným tlumením 111 stabilita absolutní 87 - metody sítí 289, 337 - ■ absolutní 337 ---relativní 337 ---vzhledem k okrajovým podmínkám 289 -----počátečním podmínkám 344 -----pravé straně 289, 343 -----vstupním datům 289 - podle Dahlquista 64 - při pevném integračním kroku 87 - relativní 88 - vzhledem k trvale působícím poruchám 150 stopa funkce 296 trojúhelník referenční 313 úloha okrajová 122, 242 - s počátečními podmínkami 13 uzel grafu 165 - sítě 245 --hraniční 246, 287 --vnitrní 246, 287 uzly sousední 246 - v metodě konečných prvků 226, 302 vektor zatížení 224, 300 --elementární 236 vrchol grafu 165 vzorec Milnův 103 - asymptotický 27, 45 semmorma 229 schéma CrankovoNicolsonovo 349 změna integračního kroku 104 zobrazení diagonální 207 409