U y) a hledejme přibližné řešení uvažovaného problému jako funkci minimalizující funkcionál (1.6) nikoli na množině N, ale na ,,«-dimenzionální" podmnožině P, jejíž prvky tvoří všechny lineární kombinace funkcí (1.7), tedy všechny funkce tvaru (1.8) h% •) + ... + hn!,..,,£>„) těchto koeficientů. Máli pak funkcionál (1.6) nabývat pro některou funkci (1.9) u„(x, y) = Ct 9t(x, y) + ... + c„ 7. Uvažujme nyní lineál L z příkl,'2.1. Pro libovolné dvě funkce u(x) e L, v(x) e L definujeme: í. Definice 2.2. Skalárním součinem funkcí m(x), v(x) z lineálu L rozumíme integrál «(x) v(x) ůx. Skalární součin funkcí «(x), v(x) značimé (a, i>), tedy (2.2) (a, v) é í «(•*) o(x) dx . Skalární součin funkcí u(x), v(x) je tedy určité reálné číslo, dané hodnotou integrálu (2.2). Příklad 2.3. Nechť S je čtverec 0 < x < 1, Oájíl, u{x, y) = x1 + yz, v(x, y) - 2. Pak (u, i?), = j" j" (x1 + y2) .2dxáy=~. Ze známých vlastností integrálu plynou ihned tyto vlastnosti skalárního součinu: Věta 2.1. Pro skalární součin z definice 2.2 platí [u(x), u(x), u^x), u2(x) jsou libovolné funkce z lineálu L, au a2 jsou libovolná reálná čísla]: (2.3) (2.4) (2.5) (2.6) (u, v) = (v, u) , (a1ui + a2u2, v) = a,(Wl, v) + a2(u2, v) , («, «) ž 0 , (u, u) = 0 u(x) s 0 v G. Vztah (2,3) vyjadřuje symetrii skalárního součinu, vztah (2.4) jeho aditivnost a homogennost. Vztahy (2.5) a (2.6) znamenají, že násobíme-li funkci u(x) skalárně jí samou, je tento skalární součin vždy nezáporný, přičemž je roven nule právě tehdy, je-li «(x) s 0. Důkaz věty 2.1 jc snadný. Vlastnost (2.3) plyne z rovností J* w(x) v(x) dx = f í)(x) u(x) dx , 24 I. HILBERTŮV PROSTOR vlastnost (2.4) z rovnosti i \ax + a2 w2(x)] v(x) dx — a, i ut(x) v(x) dx + a2\ u2(x) u(x) dx , Je jg jg Dále (H,«)=jV(x) je-li u(x) — 0, je zřejmě (u, u) = 0; je-li u2(x) dx a 0 í. pak w(x) = 0, jak je známo z integrálního počtu, neboť funkce u(x) je podle předpokladu spojitá v G1). Všimněme si, že z (2.4) a (2.3) ihned vyplývá (u, a1ví + a2»2) = tijfa, vt) + az(u, v2) , kde w(x), Vj(x), v2(x) jsou funkce z lineálu Ĺ, a„ a2 jsou reálné konstanty, neboť («, íí^j + a2t>2) = (a^! + a2v2, u) = a^v^ u) + a2(v2, u) = a^u, + a2(u, o2). Také tohoto vztahu budeme Často používat. Z (2.4) a (2.7) pak již snadno plyne (2.8) (a1uí + a2u2, asu3 + a4u4) = a^íu,, m3) + a3a3(u2l h3)'+ + ii«4("i» «4) + a2a4(u2, «4) (tj. postup při skalárním násobení funkcí je formálně stejný jako při násobení mnohočlenů). Speciální pro libovolné funkce u(x), v(x) z lineálu L a libovolné reálné konstanty a, b platí (2.9) (au, bv) = ab(u, v). Skalární součin a jeho vlastností umožňují definovat další pro nás velmi užitečný pojem normy funkce. Definice 2.3. Normou funkce u(x) z lineálu L rozumíme nezáporné číslo (2.10) H = V(">") = ^[ w2(*)dx. *) Čtenář si jistě všiml, že s výjimkou tohoto posledního kroku jsme nikde nepotřebovali předpoklad o spojitosti funkcí u{x) a v{x) v G, stačilo, aby příslušné integrály měly smysl. Proto v příští kapitole, kde rozšírime pojem skalárního součinu na obecnější třídu funkci, bude přenesení základních vlastností skalárního součinu na tento obecnější případ velmi snadné. 2, SKALÁRNÍ SOUČIN FUNKCÍ. NORMA, METRIKA 25 Např. pro normu funkce u = sin irx sin Jty na čtverci 0 á x í 1, 1 dostáváme jjiť[| = ^^J" J* sm2 nx smZ ny dy^ — ^^J" smZ KX ^x • j" sin2 71 y dy*j — -,/(*-*) = *■ "Věta 2.2. Norma z definice 2.3 má tyto vlastnosti [u(x), v(x)jsou libovolné funkce z lineálu L, a je libovolná reálná konstanta]: (2.11) Mžo, (2.12) \\u\\ = 0-»u(x) s 0 f G, (2.13) HI=H-N> (2-14) \(u,v)\ á H- N- (2.15) 1« + u I g |u| + [j p J (tzv. trojúhelníková nerovnost) , (2.16) Hl»i! - Iklll ^ II" - ^lí ■ Důkaz:1) Vlastnosti (2.11) a (2.12) plynou přímo z definice normy a z vlastností (2.5), (2.6) skalárního součinu. Dále z definice normy a z (2.9) plyne |a«|2 = {au, au) — a2(«, u), odkud ihned dostáváme (2.13). Důkaz nerovnosti (2.14): Nechť u e L, v e L. Pro každé reálné číslo X platí podle (2.5) (h + Iv, u + Xv) ^ 0 čili podle (2.8) (u, u) + X(v, u) + a(u, o) + Xz(v, d)ž0, a tedy, protože (u, u) = (m, u), (2.17) (m, u) + 2(w, o) 1 + (u, v) X2 0 . Funkce u a t) jsou sice libovolné, ale pevně dané funkce z lineálu L, takže (u, u), [u, v) a (u, y) jsou pevná čísla. Kvadratický výraz v 1 na levé strane nerovnosti (2.17) má být nezáporný pro všechna reálna X, což je možné jen tehdy, není-li jeho diskriminant kladný, tj. platí-li («, jj)2 - (u, u) (v, »)á0, 1) Jak vyplyne z důkazu, jsou vlastnosti normy bezprostředními důsledky vlastností (2.3) až(2.6) skalárního součinu. V dalších kapitolách zobecníme pojem skalárního součinu, a to tak, aby jeho základní vlastnosti zůstaly zachovány; Proto také vlastnosti príslušné normy, definované vztahem obdobným vztahu (2.10), zůstanou nezměněny. Totéž se týká i vlastnosti metriky, uvedených ve včte 2.3. 26 čili i. hilbertův prostor ľ)2 á (", «) (v, v) Uvážíme-li, že podle definice normy je (u, u) = ||«|J2, (v, v) = |j«|j2, plyne z předcházející nerovnosti okamžitě nerovnost (2.14). Důkaz nerovnosti (2.15): Je (2.18) \\u + vj1 = (u + v,u + v) = (h, u) + 2(u, v) + (v, v) = = ||«f + 2{u, v) + M> . Z (2.14) plyne (u, v) g ||m[| . ||»|[. Nahradíme-H v (2.18) výraz 2(«, v) větším (nebo stejně velkým) výrazem 2||w|[ . dostaneme l« + 42íbV + zM-\n + \n2-(\\4 + \HY> odkud ihned vyplýva (2.15). Abychom dokázali nerovnost (2.16), uvažujme s prvky u, v zároveň prvky u - v, v. Pro tyto prvky platí podle (2.15) \\(u-v) + 4é\\u-4 f H| čili odkud plyne H ^ h - ,i + |[„|i, H - Ml á h - 4 ■ Obdobně, uvažujeme-li prvky v — u, u, dostaneme Z obou posledních nerovností plyne nerovnost (2.16). Príklad 2.4. Uvažujme na intervalu <0,7t> funkce u - cos x, o — x. Je í. cos x áx = - , o 2 úx = (u, v) — I x cos xdx — —2, Jo f \ \i j n3 n , t (cos x + x)^ =--h--4 Jo 3 2 2. SKALÁRNÍ SOUČIN FUNKCÍ. NORMA, METRIKA Zřejmě rK^sM,W-^)-^)-^-M-. - - 4 ) - ; < -:- fll < IMI ' ÍÍH - = 2,82 ve shodě s (2.14) a (2.15). 3%§ = 4,47 27 Poznámka 2.1. Pojmy skalárního součinu a normy funkcí jsou přímou analogií známých pojmů z elementární vektorové algebry. Zejména vlastnosti normy jsou analogické velmi názorným vlastnostem délky vektoru: Uvažujme v rovině vektory první sauŕadnke Obr. 1. u a v s počátečními body v počátku souřadnic (obr. 1). Jejich skalární součin je definován, jak známo, vztahem u . y — uv cos

jc úhel sevřený těmito vektory. Pro délku vektoru zřejmě platí vztahy obdobné vztahům (2.11) až (2.16) pro normu funkce; a) u >. 0, přičemž w = 0 platí právě tehdy, je-li u nulový vektor [srov. (2.1i) a (2.12)]; b) délka vektoru au je |a]-násobkem délky vektoru u [srov. (2.13)]; c) platí |u . vj á uv [srov. (2.14)], neboť jcos q>\ £ 1; d) délka vektoru u + v nemůže být větší než součet délek vektorů u a v [srov. (2.15)]; viz trojúhelník OAB v obr. 1; e) rozdíl délek vektorů (popř. absolutní hodnota tohoto rozdílu) nemůže být větší než délka rozdílu těchto vektorů [srov. (2.16)]; viz trojúhelník OAC v obr. 1. Vidíme tedy, žc skalární součin funkce i norma funkce jsou definovány velmi přirozeným způsobem, odpovídajícím elementárním geometrickým představám, na jejichž podkladě také ve svých počátcích skutečně vznikaly. 28 I. I ItLHFvRTŮV PROSTOR 2. SKALÁRNÍ SOUČIN FUNKCÍ. NORMA, METRIKA 29 Dalším geometricky názorným pojmem je pojem vzdálenosti dvou funkcí: Definice 2.4. Vzdáleností dvou funkcí u(x), v(x) z lineálu L rozumíme číslo (2.19) q(u, »)=!«- t-fi , tj. normu rozdílu těchto funkcí. Příklad 2.5. Pro vzdálenost funkcí u, v z příkl. 2.4 dostáváme q2{u, v) (cos x — x) dx = — -\---h 4. o '32 tedy ») = + * + 4) « 3,98 Z definice vzdálenosti dvou funkcí a z vlastností (2.11), (2.12), (2.13) a (2.15) normy, uvedených ve větě 2.2, vyplývají okamžitě tyto základní vlastnosti vzdálenosti funkcí: Věta 2.3. Pro libovolné funkce u(x), v(x), z[x) z L platí (2.20) q(u, ti)ž0, (2.21) 0(u,v) = 0o u(x) = , (2.22) e(".») = e(«, ") , (2.23) q(u, z) £ q(u, v) + q(v, z) . Důkaz: Vlastnosti (2.20) a (2.21) vyplývají přímo z definice vzdálenosti (2.19) a z (2.11) a (2.12). Dále z definice vzdálenosti a ze vztahu (2.13) pro a = -1 plyne e(u, v) = \\u- v\\ , #, a) = \\v - «1 = [[-(« - v)i = |-1| f« - t>|| * [1« - v\, odkud ihned dostáváme (2.22). Dále (2.24) e(u, z) = 1« - z|| = |(ti -v)+ {v - z)jj S 1« - «1 + j]*, - zj| podle (2.15), odkud plyne (2.23), neboť součet posledních členů v (2.24) je podle definice vzdálenosti roven Číslu q(u, v) + o{v, z). Poznámka 2.2. Také vlastností (2.20) až (2.23) vzdálenosti funkcí mají jednoduchou geometrickou analogii (viz obr. 2): Označíme-li g(u, v) vzdálenost koncových bodil vektorů u, v s počátečními body v počátku souřadnic, pak je za prvé q(u, v) — q(v, u) [srov. (2.22)"], neboť q(u, v) je dáno délkou vektoru u - v, resp. vektoru v — u, což je totéž. Za druhé je zřejmě q{u, v) ž 0, přičemž g{u, v) = 0 právě tehdy, když vektory u a v splývají [srov. (2.20) a (2.21)]. Analogií nerovnosti (2.23) je nerovnost q(u, z) á q(u, v) + gfv, z), jejíž geometrický význam je zřejmý z obr. 2. Tedy i v případě pojmu vzdálenosti dvou funkcí je příbuznost s elementárními geometrickými pojmy a jejich vlastnostmi velmi názorná. - první souřadnice Obr. 2. Poznámka 2.3. Dcf. 2.4 nám umožňuje podle (2.19) „měřit" vzdálenost dvou funkcí, patřících do lineálu L. Říkáme také, že předpisem (2.19) je na lineálu L dána metrika a lineál L (popř. jinou množinu, v niž je dána metrika) pak nazýváme metrickým prostorem. V obecném případě definujeme: Definice 2.5. Množinu M nazýváme metrickým prostorem, jestliže pro každou dvojici u, o jejích prvků je definováno Číslo g(u, v), tzv. vzdálenost prvků u, v, mající vlastnosti (2.20) až (2.23). Všimněme si, že v této definici nikterak nepožadujeme, aby prvky množiny M byly funkce; jak uvidíme, je často výhodné mít k dispozicí metrické prostory, jejichž prvky jsou jiného charakteru. V def. 2.5 také nepředpokládáme, že by množina M musila být Iincálem, Řekneme-li v dalším textu, že na množině M zavedeme metriku, budeme tím rozumět, že pro dvojice prvků této množiny definujeme vhodným způsobem vzdálenost splňující požadavky (2.20) až (2.23), čímž se množina M stane metrickým prostorem. Požadavky (2.20) až (2.23) kladené na vzdálenost g{u, v) se nazývají axiómy metriky. Obdobně požadavky (2.11), (2.12), (2.13) a (2.15), charakterizující normu, nazýváme axiómy normy. Je-li vzdálenost definována pomocí normy vztahem (2.19), pak, jak jsme dokázali vc větě 2.3, plyne ze splnění axiómů normy i splnění axiómů metriky. V námi dosud uvažovaném lineálu L jsme zavedli metriku předpisem (2.19), kde norma |[ || je definována vztahem (2.10)'). Na tomto lineálu je možno definovat l) V takovém případě často říkáme, že norma jc indukována nebo generována skalárním součinem. 30 I. HILBERTŮV PROSTOR vzdálenost i jiným způsobem tak, aby byly splněny axiómy metriky. Definujme například normu na lineálu L předpisem (2.25) max (u(x)| (Proč jsme tuto normu odlišili od předcházející normy právč připsáním indexu C, vyplyne z dalšího textu.) Tedy normu ||u||c funkce u e L dostaneme tak, že sestrojíme funkci |«(x)|, která bude v uzavřené oblasti G spojitá [neboť a(x) jc podle předpokladu spojitá], a vezmeme její maximální hodnotu v G. Lze bez obtíží ukázat, což nebudeme na tomto místě podrobně dokazovat, žc jj«|c splňuje všechny čtyři axiómy normy, takže jsme skutečně oprávněni nazvat ji normou. Defmujeme-íi nyní vzdálenost dvou funkcí m(jc), r(x) z lineálu L předpisem (2.26) čilí (2.27) qc(u, v) q^u, v) = max \u(x) - y(x)| , bude, jak jsme právě poznamenali, splňovat takto definovaná vzdálenost i axiómy metriky (2,20) až (2.23). Lineál L opatřený metrikou (2.27) se nazývá metrický prostor C. Příklad 2.6. Pro vzdálenost qc funkcí u(x) v prostoru C(0, n) dostaneme cos x, v(x) — x z příkl. 2.4 a 2.5 qc{u, v) = 1 + ľt = 4,14 ; funkce w(x) = cosx je totiž v intervalu <0,7t> klesající, funkce v[x) ~ x rostoucí a funkce 'u(jc) — v(x)\ - |cos x — x\ nabývá v intervalu (0, jc) maxima zřejmě v bodě x = %, kde je |w(rc) — c(ti:)| = Jcos n — juj = 1 + n. Všimněme si, že v prostoru C je vzdálenost uvažovaných funkcí jiná než v prostoru s metrikou (2.19) (viz příkl. 2.5). Totéž ovšem platí i pro normu; doporučujeme čtenáři, aby na příkladě funkcí u(x) — cos x, ť(x) = x, x e <0,7t>, ověřil, že norma [j |c má vlastnosti (2.11), (2.12), (2.13) a (2.15). Poznámka 2.4. Jsou-li funkce u(x), «(x) sobě „blízké" ve všech bodech uzavřené oblasti G, pak je v prostoru C i jejich vzdálenost malá, neboť když v G platí \u(x) — - v(x)\ < P3^ podle (2.27) je také gc(u, v) <, c. Naopak, je-li v prostoru C vzdálenost funkcí u(x) a v(x) malá, je v G rozdíl funkcí u(x) a v(x) malý v absolutní hodnotě, neboť ze vztahu gju, v) g e plyne podle (2.27), že všude v G je \u(x) — - i>(x)| < e. 2. SKALÁRNÍ SOUČIN FUNKCÍ. NORMA, METRIKA V prostoru s metrikou (2.19) je situace poněkud rozdílná. Je-li rozdíl funkcí u(x) a v(x) všude v G malý (v absolutní hodnotě), pak vzdálenost q(u, v) je také malá, neboť je-li v G všude \u(x) — v[x)\ g e, pak podle (2.19) je (2.28) q(u, v) = ||« - v\\ = J j [«(x) - v(x)Y dx á /f b2 dx = j{ŕP) = z ^/J*. kde P = Jc dx jc objem (JV-rozměrný) oblasti G. Je-li však q{u, v) malé, neplyne odtud, že rozdíl |u(x) — v(x)\ je v G všude malý. Jako příklad uvažujme dvojici funkcí #| - { ť(x) s 0 10 sin 1 000 jtx pro 0 i x S 0,001, 0 pro 0,001 S x g 1 , pro 0 g x S 1 ■ \ulx) O 0.001 1 x Obr. 3. Funkce u(x) (zřejmě spojitá v intervalu (0, 1)>) je graficky znázorněna na obr. 3. Podle (2.19) a (2.10) je q{u, v) = \\u(x) - v(x)\\ = /(£[«(*) " <*w d* ) = = 1 ,001 100 sin2 1 000 wc dx = ^0,05 = 0,224 . "Vzdálenost funkcí u a v podle def. 2.4 je zde malá, zatímco rozdíl funkčních hodnot je v bodě x — 0,000 5 roven deseti, takže qc(u, v) = 10. Jestliže místo uvažované funkce u(x) vezmeme funkci *9 - {» sin 100 000 nx pro 0 g x g 0,000 01 , pro 0,000 01 < x g 1 , 32 I. HILBERTŮV PROSTOR dostaneme q{u, v) = 0,022 4, přičemž v bodě x = 0,000 005 bude rozdíl ftuikčních hodnot opět roven deseti. Vhodným zkrácením intervalu, na němž je funkce u(x) právě uvažovaného tvaru různá od nuly, a odpovídajícím zvýšením frekvence sinové funkce je možno učinit poměr mezi maximem hodnot |"(x) — v(x)\ a vzdáleností q(u, v) funkcí wac libovolně velkým. Je jistě otázka, proč jsme na lineálu L zavedli metriku (2.19), když metrika (2.27) je, jak jsme právě ukázali, do určité míry přirozenější, neboť je-li všude v G rozdíl funkcí u a v malý, je i vzdálenost funkcí podle metriky (2.27) malá, a naopak. Přesto v celé knize budeme převážně pracovat právě s metrikou (2.19), popř. s metrikami příbuznými. Hlavní důvody, proč tak Sníme, jsou dva r Metrika (2.19) byla zavedena pomocí normy (2.10), „indukované" skalárním součinem (2.2); skalární součin — v různých modifikacích — bude pro nás v této publikaci základním kamenem a bude vždy pro nás podstatné, abychom mohli pracovat s metrikou indukovanou určitým skalárním součinem s vlastnostmi (2.3) až (2.6). V prostoru C s metrikou (2.27) nelze definovat skalární součin s „rozumnými" vlastnostmi (víz například [24]). To je tedy první podstatný důvod, proč dáváme přednost metrice (2.19). Dále, jak uvidíme, setkáme se s řadou úloh, a to jak u teoretických problémů, tak u problému aplikovaných, např. inženýrských, kde zdaleka nevystačíme jen se spojitými funkcemi. Ukazuje se, že je obtížné rozšířit vhodným způsobem metriku (2.27) na obecnější třídu funkcí, než jsou spojité funkce, zatímco rozšíření metriky (2,19) na dostatečně obecnou třídu funkcí je velmi jednoduché a vede přirozeným způsobem k vytvoření tzv. prostoru L2. K tomuto rozšíření nyní přistoupíme. Později bude pro nás metrika (2.19) užitečná i při konstrukci obecnějších prostorů. Kapitola 3 Prostor L z Skalární součin, normu a vzdálenost ftmkcí, zavedené v předcházející kapitole pro funkce z lineálu L, rozšíříme nyní na Iineál tzv. funkcí integrovat ctných s druhou mocninou na oblasti G. Definice 3.1. Řekneme, že reálná funkce u(x) je integrovatelná v oblastí G s druhou mocninou (s kvadrátem), jsou-li konvergentní [tj. existují-li1) a jsou-li konečné] integrály (3.1) jc) dx , u2(xj dx . i) V LcbcsgueovS smyslu, viz pozn. 3.1, Srov. také pozn, 28.4, sir, 340. 3. prostor L, 33 Poznámka 3.1. Z definice plyne, že každá funkce, spojitá v uzavřené oblasti G, je integrovatelná s druhou mocninou, neboť pro spojitou funkci jsou zřejmě oba integrály konvergentní. Tedy každá funkce z lineálu L, uvažovaného v kap. 2, je integrovatelná s druhou mocninou. Do třídy funkcí integrovatelných s druhou mocninou však patří i funkce mnohem obecnějši (viz také příkl. 3.1). Čtenáře upozorňujeme zde na to, že pro správnost některých výsledků, které získáme s použitím právě zavedeného pojmu, zejména výsledků, které jsou založeny na pojmu úplnosti prostoru L2 (viz kap. 4), je třeba uvažovat integrály (3.1) v tzv. Lebesgueově smyslu. O Lebesgueově definici integrálu a o základních vlastnostech tohoto integrálu je stručné pojednáno v kap. 28. Pro pochopení dalšího textu však není nutné, aby se čtenář s Lcbesgueovou teorií na tomto místě seznamoval: Funkce, s kterými se ve svých inženýrských nebo přírodovědných problémech setká a které nemají „příliš vysoké" singularity v případě, že jde o neohraničené funkce (srov. příkl. 3.1), jsou integrovatelná v uvažované oblasti G s druhou mocninou jak v Lebesgueově, tak i v klasickém Riemannově smyslu a hodnoty integrálů i základní metody jejich výpočtu jsou v obou případech stejné. Z teoretického hlediska je ovšem třeba uvažovat integrály v dalším textu této knihy jako integrály v Lebesgueově smyslu. V tomto smyslu jsou také uvažovány integrály (3.1) a. funkcemi integrovatelnými s druhou mocninou v dané oblasti budeme vždy rozumět funkce integrovatelně s druhou mocninou v Lebesgueově smyslu. Pokud jde o ohraničené funkce, patří mezi funkce integrovatelná s druhou mocninou zejména funkce spojité a po částech spojité v oblasti G. Pokud jde o neohraničené funkce, uveďme dva příklady pro případ N = 1, tj. pro funkce jedné proměnné: Příklad 3.1. Funkce je funkce integrovatelná v intervalu (0, 1) s druhou mocninou, neboť oba integrály (3.1) jsou konvergentní:' j(x) dx Na druhé straně, funkce dx 3 11 « dx = -—-o J o X/*2 - 3 1 V* není integrovatelná s druhou mocninou v intervalu (OJ), neboť první z integrálů (3.1) je konvergentní, druhý však-nikoli: u(x) dx ~ — = 2 , u (x) dx = — — o ■ Jo \x Jo Jo x + oo . I. HILBERTtJV prostor Z teorie Lebesgueova integrálu je známo (viz kap. 28): a) Jsou-li funkce «(x) a »(x) integrovatelné v oblasti G s druhou mocninou, je i funkce a^ix) + a2v{x) , kde at, a2 jsou libovolné reálné konstanty, integrovatelná s druhou mocninou. b) Jsou-li u(x), v(x) integrovatelné s druhou mocninou, pak integrál i u(x) ť(x) áx je konvergentní. Přitom platí běžná pravidla: w(x) o(x) dx = v(x) t*(x) dx , g Jo f I>i»i{*) + flzMi(*)] v(x) dx = ai J/1^) dx + a2 jBaÁ*) "00 dx ■ Vlastnost a) ukazuje, že množina funkcí integrovatelných s druhou mocninou na uvažované oblasti G tvoří lineál1). Vlastnost b) dává možnost definovat na tomto lincálu skalární součin: Definice 3.2. Nechť u(x), v(x) jsou dvě funkce integrovatelné s druhou mocninou v oblasti G. Jejich skalárním součinem rozumíme číslo (3.2) (w, v) = u(x) v(x) dx . Obdobným způsobem jako v kap. 2 definujeme pro funkce integrovatelné s druhou mocninou i normu a vzdálenost: Definice 3.3. Normou funkce w(x), integrovatelné s druhou mocninou v oblasti G, rozumíme nezáporné číslo (3.3) |j„fl=V(«,w)= I\u%X)áx Definice 3.4. Vzdáleností dvou funkcí «(x), v(x), integrovatelných s druhou mocninou v oblasti G, rozumíme normu jejich rozdílu, (3.4) ^0=!«-^= / [«(*)-„(x)]2dx x) Později (viz str. 36) se ještě podrobněji zmíníme o otázce rovnosti dvou prvků ca tomto lineálu. 3. prostor L2 35 Z právě uvedených definic skalárního součinu, normy a vzdálenosti funkcí integrovatelných s druhou mocninou v oblasti G jc zřejmé, že tyto pojmy jsou zobecněním obdobných pojmů, definovaných v předcházející kapitole pro poměrně speciální třídu funkcí, tj. pro funkce z lineálu L. Lze očekávat - a věta 3.1 nám to potvrdí — že se u těchto pojmů setkáme s obdobnými vlastnostmi, s jakými jsme se setkali v předcházející kapitole. Speciálně se ukáže, že vzdálenost (3.4) splňuje axiómy metriky (2.20) až (2.23). To nás opravňuje k této definici: Definice 3.5. Lineál funkcí integrovatelných s druhou mocninou v oblasti G, s metrikou danou předpisem (3.4), nazýváme metrickým prostorem L2{G). Skalární součin a norma v tomto prostoru jsou dány vztahy (3.2) a (3.3). Vc speciálním případě N = 1, kdy tedy jde o interval (a, b), píšeme L2(a, b) místo L2{G). Pokud je z výkladu jasné, o jakou oblast jde, mluvíme často jen o prostoru L2. Prostor L2(G) je tedy metrický prostor (def. 2.5, str. 29), jehož prvky1) tvoří funkce integrovatelné s druhou mocninou v oblasti G a v němž skalární součin, norma a vzdálenost jsou definovány předpisy (3.2), (3.3) a (3.4). Zejména do prostoru L2{G) patří všechny funkce spojité v uzavřené oblasti G, tedy funkce z lineálu L, o němž jsme mluvili v kap. 2. Jak jsme již předeslali, přenášejí se vlastnosti skalárního součinu, normy i vzdálenosti, odvozené v kap. 2 pro funkce z lineálu L, téměř beze změny na případ funkcí z prostoru L2(G). Pouze vztahy obdobné vztahům (2.12) [resp. (2.6) a (2.21)] potřebují pro tento případ podrobnější vysvětlení: Je-li funkce u(x) spojitá v G, pak ze vztahu (3.5) )dx = 0 Ol 1 x Obr. 4. plyne u(x) = 0 v G, a tedy i v G. Je-li pouze u(x) e L2(G), pak ze vztahu (3.5) nelze usoudit, že u(x) je rovna nule všude v G. Uvažujme např. JV = 1 a (a, b) = (0, 1). Funkce «1(x), rovná nule v intervalu (0, l), s výjimkou bodu x = 0,5, kde platí «j = 1 (viz obr. 4), je zřejmě integrovatelná v intervalu (0, l) s druhou mocninou ') Viz však def. 3.6 a text, který jí předchází. 36 I. hilus rtů v prostor 3. prostor L 37 a plaíí pro ni rovnost (3.5). Tato rovnost je splněna např. i pro funkci u2{x), rovnou nule v intervalu (0, 1), s výjimkou spočetné množiny bodů x1 = 1, x2 = j, x3 = x$ = 4, ... , v nichž může nabývat libovolných konečných hodnot, popř. nemusí být v některých z těchto bodů definována. Totéž platí dokonce pro libovolnou funkci, rovnou nule v intervalu (0, 1), s výjimkou bodů tvořících množinu (Lcbcsgueovy) míry nula, v nichž nabývá libovolných konečných hodnot, popř. v nichž (nebo v některých z nich) není definována.1) Abychom odstranili tuto potíž a také další potíže, které by vznikly, kdybychom neučinili následující „úmluvu", definujeme: Definice 3.6. Nechť funkce u(x), i.-(x) jsou v oblasti G integrovatelné s druhou mocninou a nechť jsou si v oblasti G rovny skoro všude, čímž rozumíme to, že se liší v oblasti G nejvýše v bodech tvořících množinu míry nula (v některých z bodů této množiny nemusí být popř. některá z těchto funkcí definována). Pak řekneme, že tyto dvě funkce jsou v prostoru L2{G) ekvivalentní. Píšeme u = v v L2(G). Funkce u(x), v(x) jsou tedy v tomto prostore pokládány za sobe rovné. Říkáme také, Že všechny navzájem ekvivalentní funkce představují v prostoru L2(G) jediný prvek. Dvě funkce u(x), v(x), ekvivalentní v prostoru L2(G), jsou charakterizovány vlastností ^[u(x)-v(x)fdx = 0. Funkce u(x), v{x), které nejsou ekvivalentní v prostoru L2(G) [píšeme u #= v v Í2(G)], jsou charakterizovány vlastností [ u(x) - v(x)]2 dx + 0 . Mezi funkcemi navzájem ekvivalentními v L2(G) může být jen jediná funkce spojitá v G. Například mezi funkcemi ekvivalentními nulové funkci [píšeme u — 0 v L2(GJ] je jediná funkce spojitá v G, a tou je funkce identicky rovná nule v G. Napíšeme-1 i, že ze vztahu (3.6) dx = 0 *) Čtenář se nemusí obávat pojmu množina míry nula. V aplikacích, s nimiž se setká, jde v jednorozměrném případě zpravidla o množinu skládající se z konečného počtu bodů nebo v případě N = 2, resp. JV = 3 o velím jednoduché množiny (hladké nebo po částech hladké křivky, resp. plochy, apod,) v dvojí oz mě mé, resp, třírozměrné oblasti. Bližší informace o tomto pojmu najde čtenář v kap. 28. plyne 0 v L2(G), znamená to tedy, že u(x) je funkce ekvivalentní v prostoru L2{G) nulové funkci [říkáme také stručně, že u(x) je v L2{G) ekvivalentní nule\ tj. že u(x) = 0 v G, popř. s výjimkou bodů tvořících v oblasti G množinu míry nula. Po tomto úvodu již můžeme vyslovit tuto větu: Veta 3.1. Pro skalární součin (3.2), normu (3.3) a vzdálenost (3.4) platí tyto vztahy [a, au a2 jsou libovolná reálná čísla, u,v,z,u{, u2 libovolné prvky z L2(ú)]: (3.7) (u, v) = (t>, «) , (3.8) (a1ul + atu2, v) = #,(«,, n) + a?{u2, v) , (3.9) (li, u) a 0 , (3.10) (u, u) = 0 u = 0 v L2(G), (3.11) (3.12) jjií[| = ()^u = 0 v L2(G), (3.13) íml = M II"íl > (3.14) m ty s H. Hl, (3.15) 11" + 4 š M + 1*1, (3,16) IMI-Hl (3.17) 4m 4 £tt* (3.18) q{u, v) = Oou — v v L2(G) , (3.19) q{u, v) = q(v, u) , (3.20) q(u, z) £ q(u, v) + £>(?:, z) . Důkazy všech těchto tvrzení jsou zcela analogické důkazům příslušných tvrzení, provedeným podrobně v kap. 2 (srov. také poznámky pod čarou na str. 24 a 25) a nebudeme je zde znovu uvádět. Význam vztahů (3.10), (3.12) a (3.18) byl vysvětlen před právě vyslovenou větou. Také jednoduché pravidlo pro počítání sc skalárním součinem, (3.21) («.«, + a^^a^i + aAu4) = = aiaÁu^ «s) + a2a3(u2, w3| + ala4(nu u4) + a2a4(u,, u4) , odvozené v kap. 2, zůstává v platnosti. Nerovnost (3.14) je známa v literatuře pod 38 I. HI LBE RTŮ V PROSTOR názvem Schwarzova (Hôlderova nebo také Cauchyova - Buňakovského) nerovnost. Podrobně vypsána pro prostor LZ(G) zní takto: |j* u{x)v(x)áx É JU $Ä . v\x)áx V dalším textu budeme skalární součin, resp, normu, resp. vzdálenost funkcí z prostoru LZ(G) značit tak, jak jsme to vyznačili v příslušných definicích, tj. symbolem (w, v), resp. !«! , resp. g(u, v) . Jen tam, kde by mohlo dojít k záměně s obdobnými pojmy, resp. symboly v jiném metrickém prostoru, budeme psát podrobněji ("> ^(c) , 1«l(G), ě?(m'"w) ■ Přistoupíme nyní k definicí dalšího důležitého pojmu, a to pojmu konvergence v prostoru L2(G). Kapitola 4 Konvergence v prostora L2(G) (konvergence v průměru). Úplný prostor. Scparabilní prostor a) Konvergence v prostoru L2(G) Prostor L2(G) j c, jak víme z předcházející kapitoly, metrický prostor s metrikou (4.1) e(u, v)=\\u - v\\ = /f m v L2(G). Funkci u(x) nazýváme limitou (limitní funkci) posloupnosti {u„(x)} v prostoru L2(G). Definici 4.1 lze vyslovit v této zřejmě ekvivalentní formě: Definice 4.2. Posloupnost funkci ua e ľ.,(G) konverguje v prostoru L2(G) (v průměru) k funkci u e L2(G), jestliže ke každému e > 0 lze najít číslo n0 ták. že pro všechny funkce ujx) s indexem n větším než n0 platí (4.4) tj. e(«„, u) < c, /j [»„(*) ~ u(x)Y ÔX < £ 1 X Obr. 5. Příklad 4.1. V intervalu (a, b) = (—1, I) uvažujme posloupnost funkcí (4.5) u„{x) - ém"K tj. posloupnost funkcí (4.6) X, ijx, yx, yx..... 40 ľ. HUBERTŮV PROSTOR Každá z funkcí (4.5) je spojitá v intervalu ( — 1, í>, tedy pro každé n je w„e e L2(— 1, l). Z názoru lze očekávat (viz obr. 5), že funkce (4.7) 1 pro — 1 £ x < 0, u(x) = 0 pro x = 0 , 1 pro 0 < x í 1 [pro kterou zřejmě také platí uel2(-l, 1)], bude v prostoru L2(—1,1) limitou posloupnosti (4.5). Dokážeme, že tomu skutečně tak je: Máme dokázat (viz def. 4.1), že lim g(u„, u) = 0, n-* co čili, což je totéž, že lim Q2(u„, u) - 0 . n-* co Ale podle (4. l) a protože funkce u„(x) a w(x) jsou liché, je ^(„nJ „) = j' [xi/(^-D _ u(x)fdx = 2 JV^""1' \2n + 1 2ři 7 íi(2/j + 1) i)2 d> = 21 Zřejmě je takže skutečně lim q2(u„, u) = lim —-------~ = 0, n->Q0 n[2n 1 1) lim w„(x) = h(x) v L2(-l, 1), což jsme měli dokázat. Všimněme si, že zatímco funkce w„(x) jsou funkce spojité v intervalu < —1, 1), limitní funkce v tomto intervalu spojitá není. Poznámka 4.1. Definici konvergence, uvedenou na začátku této kapitoly, lze zcela analogicky vyslovit pro obecný metrický prostor, tedy pro prostor s metrikou v obecném případě jinou, než je metrika prostoru L2(G): Řekneme, že posloupnost {«„} prvků metrického prostoru P s metrikou qp konverguje v tomto prostoru k prvku ueP, jestliže lim QP{u„, u) ~ 0. (Srov. def. 7.2, str. 85.) Totéž platí ovšem i pro některé další pojmy a výsledky, s kterými se v této kapitole setkáme. Definovali jsme zde konvergenci zatím jen pro prostor L2(G), abychom mohli pojem konvergence v metrickém prostoru, který zpravidla činí čtenáři — — nematematikovi určité potíže, osvětlit na pokud možno ncjjednodušŠím případě. 4. KONVERGENCE V PROSTORU li f 1 V předcházejícím příkladě jsme dokázali, že funkce (4.7) je v prostoru L2( — 1,1) limitou posloupnosti (4.5). Je otázka, nemá-li posloupnost (4.5) v tomto prostoru ještě jinou limitu. Na tuto otázku odpovídá tato věta: Věta 4.1. Posloupnost funkcí u„ e L2(G) může mít v prostoru L2(G) nejvýše jednu limitu. Důkaz: Nechť posloupnost funkcí uneL2{G) má v tomto prostoru dvě limity u e L2(G), v e L2(G) a nechť w H= v v L2(G), takže (4.8) t>(u, v) — a > 0 . Označme aj2 = e > 0. Podle def. 4.2 existuje k tomuto e takové n0, že pro všechna n > n0 platí (4.9) q[u„, u) < ĺ a zároveň q(u„, v) < e . Použijcme-li (3.20) a (3.19), dostaneme podle (4.9) q{u, v) g q(u, u„) + g(u„, v) = #(«„, w) + q(u„, v) <2z, což je ve sporu s (4.8), neboť 2s = a. Poznámka 4.2. Věta 4.1 tvrdí — a z jejího důkazu je zřejmé —, že posloupnost. (w„(x)} má v prostoru L2{G) nejvýše jednu limitu ve smyslu, o němž jsme mluvili v předcházející kapitole, tj. v tom smyslu, že dvě funkce, které se v oblasti C liší nejvýše na množině míry nula, jsou v prostoru L2{G) sobě rovné. Je zřejmé, že limitou posloupnosti (4.5) v metrice prostoru L2(G) je také funkce t posloupnost funkcí (4.10) Tvrdime, že (4.11) 10 sin (J02"+1 itx) pro OáxS i0-<2" + 1>, 0 pro 10-(2"+1) |xál, lim «B(x) = 0 v L2(0, 1) . 4!^ i. hilbertův prostor Skutečně, označímc-li u(x) funkci identicky rovnou nule v intervalu <0,1>, je q\u„, u) = [u„(x) - O]2 dx = «„2(x) dx = 100 sin2 (102" + 1 kx) áx = Jo Jo Jo = 50. KT(2" + ,\ odkud lim q2(u„, u) = O, a tedy také lim q(u„, u) - 0 , it-* 00 což je tvrzení (4.11). Na tomto příkladě jc dobře vidět (srov. obr. 3 na str. 31), že i když posloupnost {«„(x)} konverguje v prostoru L2(G), tj. v průměru, k funkci w(x), neznamená to nikterak, že pro dostatečně velká n se funkce «„(%) a u(x) v oblasti G všude „málo" liší. V našem příkladě je max Ju„(x) - w(x)j = ÍO dokonce pro každé n. Zároveň se však funkce «„(x) a u(x) z tohoto příkladu liší s rostoucím n na množínč stále menší míry. Pro informaci čtenáře uvedeme ještě toto tvrzení, i když je v dalších kapitolách nebudeme potřebovat: Konverguje-li posloupnost h„(x) k funkci u(x) stejnoměrně v G, konverguje k ní i v prostoru L2(G), tj. v průměru. Důkaz je snadný a plyne téměř okamžitě z definice konvergence v průměru. Z obyčejné bodové konvergence (v obecném případě nestejnoměrné) však neplyne konvergence v průměru. Ani naopak z konvergence v průměru neplyne bodová konvergence (a tím méně stejnoměrná). Srov. příklady v [35], str. 576. b) Úplnost Obraťme se nyní k hlubšímu zkoumání pojmu konvergence a některých jeho vlastností. Z klasické analýzy je dobře známé Bolzanovo - Caucbyovo kritérium konvergence číselné posloupnosti: Posloupnost {a„} reálných čísel jc konvergentní právě tehdy, platí-li (4.12) lim\am-a„\=0. n~* co Přitom symbol (4.12) znamená, že ke každému s > 0 lze najít číslo «0 tak, že platí-li zároveň m > n0, n > n0, pak platí \aK — a„| < s. 4. konvergence v prostoru L2 4d Definice 4,3. Posloupnost funkcí w„ e L2(G) se nazývá cauchyovská (fundamentální) v prostoru L2(G), platí-li (4.13) lim Přitom opět význam symbolu (4.13) je ten, že ke každému e > 0 lze najít n0 tak, že je-li zároveň m > n0, n > n0, pak je g(u„, u„) < e. Definice cauchyovské posloupnosti zůstává nezměněna i v metrických prostorech s jinou metrikou, než je metrika prostoru L2(G): Definice 4.4. Posloupnost prvků u„ metrického prostoru P s metrikou qp se nazývá cauchyovská (fundamentální) v prostoru P, platí-li (4.14) lim qfei* «„) = 0 . m-*oo ji —► on Speciálně v euklidovském prostoru ex, v němž je metrika dána vztahem qEl(am, an) = \am - a„\ (tj. vzdáleností bodů am a a„ na číselné ose), je cauchyovská posloupnost charakterizována vztahem (4.12). V libovolném metrickém prostoru platí (důkaz, jc zcela obdobný jako v klasické analýze): Věta 4.2. Každá posloupnost konvergentní v daném metrickém prostoru Pl) je cauchyovská v tomto prostoru. Každá cauchyovská posloupnost však nemusí být v prostoru P konvergentní. Definice 4.5. Metrický prostor P se nazývá úplný, jestliže každá cauchyovská posloupnost je v tomto prostoru konvergentní, tj. jestliže ke každé cauchyovské posloupnosti {«„} lze najít prvek «, ležící v prostoru P, který je v tomto prostoru limitou této posloupností. Z právě uvedeného Bolzanova - Cauchyova kritéria plyne, že euklidovský prostor £i je úplný prostor. Lze ukázat, že totéž platí pro libovolný euklidovský prostor en. Pro naše pozdější úvahy má základní význam tato věta: Věta 4.3. Prostor L2(G) je úplný prostor. Důkaz tohoto tvrzení je poměrně obtížný a je podrobně uveden např. v [26]. Poznamenejme, že v důkazu věty 4.3 se podstatně využívá toho, že prvky prostoru L2(G) jsou funkce integrovatelné s druhou mocninou v Lebesgueově smyslu.- J) Viz poza. 4.1. 44 I. HiLBERTĎV PROSTOR 4, konvergence v prostoru L 45 Poznámka 4.3. Ne každý metrický prostor je úplný. Uveďme jednoduchý příklad: Nechť M je některý lineál prvků z prostoru L2(G). Definujme na tomto lineálu skalární součin stejným předpisem jako pro prvky prostoru L2{G), tedy vztahem («, v) = «(x) t(x)áx , u e M , ve M . Ja Na základe tohoto součinu definujme na M obvyklým způsobem normu a vzdálenost. Tím tedy dostaneme určitý metrický prostor, označme jej Mll, v němž je definována metrika shodná s metrikou prostoru L2[G). [Je-li speciálně prostor Míj(C) úplný, je zvykem nazývat jej lineárním podprostorem prostoru LZ{G)\ srov. def. 5.11, str. 63.] Na rozdíl od prostoru L2{G) nemusi být prostor Mij(0) úplný. Jako příklad uvažujme lineál M všech funkcí spojitých v uzavřeném intervalu < — 1, ľ}. Ukážeme, že příslušný prostor JWř.2(-i,)) není úplný. Posloupnost (4.5) funkcí u„(x) z příkl. 4.1 patří totiž zřejmě do tohoto prostoru, neboť funkce (4.5) jsou v intervalu ( — 1, 1) spojité. Posloupnost (4.5) je v prostoru Mt2r • cauchyovská, neboť (viz příkl. 4.1) je konvergentní, a tedy cauchyovská, v prostoru L2(—1, l) a prostory L2(—1, 1) a ML2Í-ltV) mají shodnou metriku. Přesto posloupnost (4.5) není v prostoru -ml2(-i,i) konvergentní. Předpokládejme naopak, že konverguje v tomto prostoru k určité funkci ľ e Aíij(_ která je tedy (neboť patří do tohoto prostoru) spojitá v intervalu <-i, 1>, a dojdeme ke sporu. K této funkci by pak totiž konvergovala posloupnost (4.5) i v prostoru L2( —1, 1), který má s prostorem MLlí_i >1} shodnou metriku. V příkl. 4.1 jsme však viděli, že posloupnost (4.5) konverguje v L2(—1, l) k funkci w(x), dané předpisem (4.7), která není v intervalu < — 1, 1 > spojitá; není dokonce ani ekvivalentní v L2(— 1, l) nějaké spojité funkci, neboť ji nelze učinit v intervalu < — 1,1 > spojitou tím, že bychom změnili její hodnoty na množině nulové míry. Tedy je u 4= v v L2{— 1,1), takže z učiněného předpokladu o tom, že funkce v[x) je v prostoru MU(_íU limitou posloupnosti (4.5), jsme dospěli k závěru, že posloupnost (4.5) má v prostoru L2{ —1,1) dvě různé limity, což je ve sporu s větou 4.1, str. 41. Posloupnost (4.5), cauchyovská v prostoru Mt3(_nemá tedy v tomto prostoru limitu, takže tento prostor není úplný [a tedy není ani lineárním podprostorem prostoru L2(— 1, 1)]. Poznámka 4.4. V dalších kapitolách poznáme, že vlastnost úplnosti uvažovaných prostorů má v mnohých úvahách rozhodující význam. Prostor, který není úplný, lze „doplnit" tzv. ideálními elementy tak, aby takto doplněný prostor byl úplný. Tento proces je podobný procesu „zúplnění" prostoru racionálních čísel doplněním o čísla iracionální a je podrobně popsán např. v [26]. V obecném případě však bývá obtížné určit blíže charakter zmíněných ideálních elementů. S poměrně jednoduchým a názorným „zúplněním" metrického prostoru se setkáme v kap. 10. c) Hustota. Separabilnost Čtenáři je jistě dobře znám pojem okolí bodu v euklidovských prostorech £, (na přímce), E2 (v rovině) atd. Zavedení metriky v prostoru L2(G) dovoluje definovat okolí i v tomto prostoru a na základě pojmu okolí zavést a aplikovat i některé další běžné pojmy, analogické pojmům známým z klasické analýzy: Definice 4.6. Buď ô > 0. S-okolím (S-sférou) funkce u(x) v prostoru L2(G) rozumíme množinu všech funkcí v e. L2(G), pro něž je (4.15) £?(«, v) < (5 Příklad 4.3. V prostoru L2(0, 1) leží v á-okolí funkce u(x) = 0 zřejmě funkce tvaru v(x) = k, kde pro konstantu k platí \k] < 5, neboť pro tyto funkce je o{u, v) = Jf íí) - kf dx = J^k2 dx = \k\. Pak funkce (4.7) z příkl. 4.1 je v L2(-J, l) hromadným bodem této množiny, neboť jc limitou posloupnosti funkcí (4.5) z této množiny. Podle uvedené definice hromadný bod množiny M nemusí nutně být prvkem této množiny. V obou uvedených příkladech hromadný bod není prvkem uvažované množiny. 46 I. hilbertův prostor Definice 4.8. Množina M, která vznikne sjednocením množiny M a všech jejích hromadných bodů, se nazývá uzávěr množiny M v prostoru L2(G). Je-li M = M, nazývá se množina M uzavřená v prostoru L2(G). Uzávěr množiny M tedy dostaneme, „přidáme-Ii" k této množině všechny její hromadné body. Uzavřená množina je taková, k níž patří všechny její hromadné body. Příklad 4.6. Lineál L všech funkcí spojitých v intervalu <( —1, 1) není uzavřená množina v L2(— 1, l)- Podle príkl. 4.1 je totiž funkce (4.7) v prostoru L2(—1, l) hromadným bodem tohoto lineálu a přitom není spojitou funkcí, takže do lineálu L nepatří. Definice 4.9. Množina M [funkcí z prostoru L2(G)] se nazývá hustá v prostoru L2(G), jestliže každá funkce z prostoru L2(G) je jejím hromadným bodem [tj., viz dcf. 4.8, jestliže M = L2(C)]. Užijemc-li výsledku věty 4.4, lze def. 4.9 vyjádřit v této ekvivalentní formě: Definice 4.10. Množina M sc nazývá hustá v prostoru L2(G), jestliže ke každé funkci u e L2(G) lze najít posloupnost funkcí u„ b M, konvergující v L2(C) k funkci u(x) Protože podle definice konvergence v prostoru L2{G) znamená, že funkce u(x) a «„(x) jsou v metrice prostoru L2{G) libovolně blízké, je-li n dostatečně velké [srov. (4.2), resp. (4.4)], je množina M hustá v prostoru L2(G) právě tehdy, lze-li každou funkci z prostoru L2(G) s libovolnou přesností aproximovat v metrice tohoto prostoru funkcemi z množiny M; podrobněji, lze-li ke každé funkci u e L2(C) a ke každému c > 0 najít funkci v e M tak, že platí II" - Hkí") < £ • Čtenáři je jistě známa Weierstrassova věta, tvrdící, že každou funkci spojitou v uzavřeném intervalu ): K dané funkci u e L2(a, b) a ke každému £ > 0 lze najít mnohočlen P(x) tak, že q(u, P) < e. Lze ukázat, že za předpokladů, které jsme učinili o oblasti G (viz kap. 2; srov. také kap. 28), platí toto tvrzení i pro JV > 1, tj. že platí věta, kterou zde uvedeme bez důkazu (viz napr. [46]): Věta 4.5. Množina všech mnohočlenů je hustá v prostoru L2(G). Je zřejmé, že v případě N > l jde o mnohočleny v N proměnných, tedy např. pro JV = 2o funkce tvaru p q kde aik jsou koeficienty mnohočlenu a p, q jsou celá nezáporná čísla. 5. ORTOGONÁLNÍ SYSTÉM V V PROSTORU L2 4 / Každý mnohočlen je spojitá funkce v uzavřené oblasti G. (A ovšem nikoli naopak, neboť funkce spojitá v G nemusí být mnohočlenem.) Protože platí věta 4.5, platí tedy tím spíše: Věta 4.6. Lineál L všech funkcí, spojitých v uzavřené oblasti G, je hustý v L2(G). V kap. 8 ukážeme některé další užitečné příklady množin hustých v L2(G). Nakonec uvedeme ještě jeden důležitý pojem. Jak známo, množina M se nazývá spočetná, lze-li její prvky sestavit v posloupnost, tj. přiřadit je vzájemně jednoznačně přirozeným číslům. Například lze ukázat, že množina všech racionálních Čísel je spočetná, zatímco množina všech reálných čísel je nespočetná. O množině M řekneme, žc je nejvýše spočetná, je-li spočetná, nebo obsahuje-li jen konečný počet prvků. Definice 4.11. Metrický prostor se nazývá separabilní, existuje-li v něm nejvýše spočetná množina, hustá v tomto prostoru. Lze ukázat, což zde dokazovat nebudeme ), že v prostoru L2(G) je takovou spočetnou a hustou množinou množina všech mnohočlenů s racionálními koeficienty. Tedy: Věta 4.7. Prostor L2(G) je separabilní. Kapitola 5 Ortogonální systémy v prostoru L2(G) a) Lineární závislost a nezávislost v L2(G) Nejprve uvedeme některé základní pojmy a výsledky, týkající sc lineární závislosti a nezávislosti funkcí. Pokud budeme v této kapitole mluvit o funkcích, budeme jimi vždy rozumět funkce z L2(G) a v tom smyslu budeme také chápat rovnost mezi nimi [tj. u(x) = ť(x) v L2(G) právě tehdy, jsou-li u(x) a v(x) funkce ekvivalentní v L2(G)]. Definice 5.1. Řekneme, že funkce »(x) je v prostoru L2(G) lineární1) kombinací 1) Toto tvrzení je jednoduchým důsledkem věty 4.5 a textu, který následuje za def. 4.10. 2) Prvky prosíoru T-2(G) tvoří lineál — označme jej M — funkcí integrovalelných s druhou mocninou v oblasti G, přičemž rovnost mezi těmito funkcemi je definována ve výše uvedeném smyslu. V definici lineární kombinace funkci a později jejích lineární závislosti zcela stačí mluvit o lineálu M — tedy mluvit o lineární kombinaci, resp. lineární závislosti prvků v lineálu Ař, nikoli v prostoru L2{G) — neboť vlastnosti tohoto prostoru (metriku apod.) v těchto definicích nepotřebujeme. Přesto však dáváme přednost uvedené terminologii, neboť nám umožní jednoduchou formulaci některých výsledků (viz např. větu 5.2). 'to I. hilbertův trostor funkcí (5.1) Vl(x), ..., vr(x) , kde Vj e L2{C), i ={,.,., r , lze-li ji v tomto prostoru vyjádřit ve tvaru (5.2) u(x) = a,t>,(x) +-... + arvr(x), kde «1, t/, jsou vhodné reálné konstanty. Funkce u(x) je tedy v L2(G) lineární kombinací funkcí (5.1), lzedi ji napsat jako součet těchto funkcí, násobených vhodnými konstantami. Definice 5.2, O funkcích (5.3) u^x), uk(x), Ui e L2(G), i - ],..., k, říkáme, že jsou v prostoru L2(G) lineárne závislé, lze-li aspoň jednu z nich vyjádřit v tomto prostoru jako lineární kombinací ostatních fc — 1 funkcí. Nelze-li žádnou z těchto funkcí vyjádřit v L2{G) jako lineární kombinaci ostatních, řekneme, že funkce (5.3) jsou v prostoru L2{G) lineárně nezávislé. \ Stručně také říkáme, že systém funkcí (5.3) je v prostoru L2(G) lineárně závislý, resp. lineárně nezávislý. Téměř přímo z definice plyne následující věta, která je obdobou známé věty z kursu analýzy: Věta 5.1. Funkce (5.3) jsou v L2(G) lineárně závislé právě tehdy, lze-li najít konstanty bu bk, z nichž aspoň jedna je různá od nuly, takové, že v L2(G) platí (5.4) M^x) + ... + Ku.£x) = 0. Funkce (5.3) jsou v L~(G) lineárně nezávislé právě tehdy, je-li možno rovnost (5.4) splnit, jen když všechny konstanty blt bkjsou rovny nule. Poznamenejme znovu, že máme stále na mysli funkce integrovatelné v oblasti G 1 s druhou mocninou a že rovnosti (5.2), (5.4) chápeme v L2(G), tj. že tyto rovnosti jako rovnosti mezi funkcemi jsou splněny v oblasti G popř. s výjimkou bodů tvořících množinu míry nula. Pokud ovšem v těchto rovnostech se vyskytují jen spojité funkce [viz následující příklad; funkci w(x) ekvivalentní nule můžeme vždy pokládat za spojitou, položíme-li n(x) = 0 v G], jde o rovnosti v obvyklém smyslu, tj. splněné všude v G. Příklad 5.1. Funkce i ut = sin2 xy , u2 — cos2 xy , u3 = 4 5. ortogonální systémy v prostoru L2 \ jsou v LjG), kde g je libovolná oblast roviny xy, lineárně závislé, neboť v jl2(g) platí 4«, -1- 4u2 — m3 = 0. Za konstanty hu b2, b3\ (5.4) stačí tedy zvolit Čísla 4, 4, -1. Funkce k, = x2 , u2 == x , «3 = 1 jsou v L2(«, b), kde a, b jsou libovolná reálná čísla, a < b, lineárně nezávislé, neboť, jak je známo z algebry, je rovnost bix2 + b2x + »3.1 = 0 možno splnit pro všechna x z některého intervalu jen tehdy, je-li b, = b2 = />3 = 0. Rozhodnout přímo na základě def. 5.2 nebo věty 5.1 o tom, jsou-li dané funkce v L2(G) lineárně závislé nebo lineárně nezávislé, je v obecném případě obtížné. Poměrně jednoduché kritérium lineární závislosti, resp. nezávislosti funkcí v prostoru L,(g) podává tato věta: Věta 5.2. Funkce (5.5) u, (x), uk(x), u , € L2(G), i = 1, ...,k, jsou v L2{G) lineárně závislé právě tehdy, je-U tzv. Gramův determinant d(uj, uk) = («,, ut), (ííj, u2), (ultuk) , j (u2l «,), (lř2, u2), («2, uk) [(«*. «l)> («*> "zX ■■•>(«!» "*) sestavený ze skalárních součinů těchto funkci, roven nule. Důkaz: 1. Nechť funkce (5.5) jsou v L2(g) lineárně závislé. Podle věty 5.1 existují konstanty bu b2, bk, nikoli všechny rovné nule, tak, že v L2(g) platí (5.6) Mi + b2u2 + ... + bkuk = 0 . Násobme postupně tuto rovnicí skalárně funkcemi ut, w2, —uk „zleva".1) ') Podrobně: Rovnici (5.6) násobíme funkcí u^x). Dostaneme bífti(,x) u((x) + b^íi-x) k20) -|- ... -1- rtii[W iíjíw = 0 . Intcgrujcme-li tuto rovnici přes oblast C a podle definice skalárního součinu píšeme jff .7. (V) «j(.x)d.V ■ (UL, k,), Jo- UL(X) U2(X) ÓX — (H;, ií2) atd., dostaneme první z rovnic (5.7). Formálně tedy vznikne tato rovnice z rovnice (5.6) „násobením funkcí u-, skalárně zleva". Ostatní rovnice (5,7) vzniknou obdobně „skalárním násobením funkcemi u2,..., uk zleva". 50 j. h ílu c rtu v prostor Dostaneme rovnice (5.7) (uu u,) b, + («., u2) b2 -t- ... 4- («l5 U]t) ^ = 0, ("i. "0 *>i + («2= u2)b2 + ... + (u2, uk) bk = 0, ("*> «i) h + |k> "0 í>2 4- ... + («t, H(f} í?s = 0 . Na soustavu (5.7) se můžeme dívat jako na soustavu k rovnic pro fc neznámých by, bk. Tato soustava má mít nenulové řešení, neboť podle předpokladu čísla bu ...,bk nejsou všechna rovna nule. To je, jak známo, možné jen tehdy, jc-H determinant soustavy roven nule. To však je právě Gramův determinant D. Tím je dokázáno první tvrzení věty 5.2. 2. Nechť D = 0. Napišme soustavu (5.7). Pak tato soustava má nenulové řešení (májích dokonce nekonečně mnoho). Vyberme jedno z nich, označme je í>,, ..., bk, a utvořme funkci (5.8) <"(*) = Mi(*) + ... 4- bkuk(x). Dokážeme, že (v. v) = 0, takže v = 0 v L2(G). Tím bude dokázáno (podle věty 5.1), že funkce u^x), ..uk(x) jsou v L2(G) lineárně závislé, neboť podle (5.8) bude v L2(G) splněna rovnost 0 - b,u:(x) + ... + bkuk(x) s konstantami b},bk, které nejsou všechny rovny nule. Dokažme tedy, že (v, v) - 0. K tomu účelu násobme (5.8) postupně funkcemi «!, ..., uk skalárně zleva. Dostaneme (5.9) («!, v) = lifei., «.) + b2{uu u2) + ... + bk(uuuk), (tt2, v) = b±{uZl u.i) + b2(u2, n2) + .... + bk(u2, uk), (uk, v) = b.(uk, ut) ě b2(uk, u2) + ... + bk(uk, uk) . Protože čísla bt, bk jsou podle předpokladu řešením soustavy (5.7), jsou v (5.9) YŠechny pravé strany rovny nule, a tedy (5.10) («!, V) = 0, (u2, V) = 0, . . ., (uk, V) ■ ■ 0 Násobíme-Ii jednotlivé rovnosti v (5.10) postupně čísly bk a vzniklé rovnosti sečteme, dostaneme [podle vlastnosti (3,8) skalárního součinuj (&!«! + b2u2 + ... + bkuk, v) — 0 (v, v) = 0, 5. ortogonální SYSTÉMY v pkoetoru £2 čili podle (5.8) což jsme měli dokázat. Z věty 5.2 okamžitě plyne: VĚťa 5.3, Funkce u,(.v),«*(*), UjGL2(G), i = f,fc, jsou v L2(G) lineárně nezávislé právě tehdy, je-li jejich Gramův determinant D různý od nuly. Příklad 5.2. Funkce ul = sin x , u2 — cos x , u3 = 1 jsou v L2(0, n) lineárně nezávislé, neboť x*j4 - 2n 4= 0 .*) D = («!, «l)- («1. «2)> "3) = nj2, o, 2 "))> ("2,1*2). («2. «3) o, tr/2 0 (»3, U t), (u3iu2), (w3, «3) 2, 0, Tí b) Ortogonální a ortonormální systémy yz2(g) Definice 5.3. Dvě funkce u e L2(G), v e Z-2(G) se nazývají ortogonální v prostoru L2(G), je-lí jejich skalární součin roven nule, tj. je-li (5.11) (h,d) = 0. Píšeme u j. v y L2(G). Definice 5.4. Funkce u e L2(G), jejíž norma je rovna jedné, (5.12) \\u\\ = 1 , nazývá se normovaná v prostoru L2(G\ Definice 5.5. Systém (posloupnost) funkcí (5.13) cp^x), , jt). Neboť, jak známo, pro libovolná přirozená čísla j + k platí . 2 C" . ((pj, k{x), 'vypočteme snadno její normu. Neboť z předpokladu ortonormálnosti , v 11, je-li i = j , (0, je-li j + j , plyne pro normu ||í/|| uvažované funkce w(x) ihned <5.15) |j«||2 -(",")=( E am* E £(,k- n, jinak bychom obrátili pořadí sčítanců) ť?2(sm, s„) = \\s„ - s„\\2 = || £ ak0k - V ak m, dostaneme q^řoo s") = a* ~ °™ - V každém případě tedy je (5-20) e2(sm, s„) = |cr„ - $j, odkud je zřejmé, že posloupnost {s„(x)} je v L2(G) cauchyovská právě tehdy, je-li cauchyovská číselná posloupnost {o~„}. Tím je důkaz věty 5.4 proveden. Čtenáře upozorňujeme, aby měl stále na zřeteli, že jde o konvergenci řady (5.17) v prostoru L2(G), tj. o konvergenci v průměru, tedy nikoli o konvergenci bodovou. c) Fourierovy řady. Úplné systémy. Schmidfův ortonormalizační proces Definice 5,7. Nechť jsou dány ortonormální systém (5.13) a funkce ueL2(C). Čísla (5.21) afc - («, (pk) = u(x) tpk(x) dx, k = 1,2,. J a se nazývají Fourierovy koeficienty funkce u(x) vzhledem k systému (5.13). Řada Z aJťP*(*) * = i se nazývá Fourierova řada funkce u(x) vzhledem k systému (5,13). 5. ortogonální systémy v prostoro 1*2 55 Příklad 5.4. V L2(Q, n) jsou Fourierovy koeficienty funkce u(x) vzhledem k systému (5.14) dány integrály ak = J^-J j* «(x) sin kx dx . Příslušná Fouricova řada je sin kx = J] A sm kx . kde — í u(x) sin fcx * Jo dx. Fourieovy koeficienty funkce «(x) i příslušná Fourierova řada mají mnoho zajímavých, a jak uvidíme, pro aplikace užitečných vlastností. První z nich je, že mezi OD 00 všemi řadami tvaru £ ok(pk(x) právě Částečné součty řady £ *(*) aproximují * = t nejlépe funkci m(x) v průměru: Věta 5.5. Nechť systém (5.13) je ortonormální a nechť u{x) je funkce z L2(G). Nechť n je libovolné, ale pevné přirozené číslo. Označme a (5.22) m„(x) = £ a^x) , /tííe a,, Fourierovy koeficienty funkce u(x) vzhledem k systému (5.13) a TI (5.23) s„(x) = £ ar«) ~ 2 E fl*(": 9>*) + * = i * = i t=i + É É 2(«„, m) > 0, piyne odtud (5.26) pro libovolné přirozené n. Tedy všechny částečné součty řady £ a2 jsou shora t= i ohraničené Číslem |«|2- Protože uvažovaná řada je řada s nezápornými členy, plyne odtud, zeje konvergentní a z (5.26) zároveň plyne, že její součet není větší než |u||2. Platí tedy: co Věta 5.6. Pro každou funkci u e L2(G) je řada £ al čtverců Fourierových koeficientů této funkce vzhledem k libovolnému ortonormálnímu systému z prostoru L2(G) konvergentní. Přitom platí (5.27) Nerovnost (5.27) se nazývá Besselova nerovnost. Z uvedené vely plyne okamžitě podle věty 5.4: Věta 5.7. Nechť (5.13) je ortonormální systém v L2{G) a nechť u e L2(G). Pak co Fourierova řada 2j cc^tp^x), příslušná této funkci, je konvergentní v prostoru L2(G). CO Na tomto místě opět připomínáme čtenáři, že jde o konvergenci řady £ ak(pk(x) v průměru, nikoli o bodovou konvergenci. k°1 Poznámka 5.3, Z rovnosti (5.25), (5.28) o\sn, u) „ fíf - | a2 + Í (ak - akf , k=l k=l 5. ORTOGONÁLNÍ SYSTÉMY V PROSTORU L2 57 platné pro každé přirozené n, plyne také tento důsledek: Nechť řada V akq>k{x)t k= 1 jejímiž částečnými součty jsou součty (5.23), konverguje v L2(G) k funkci u(x). To znamená, že lim g(s„, a) = 0 , čili, podle (5.28), že (5.29) lim [||W[|2 - £ ^ 4- Z - = 0 • n-* co k= 1 k= 1 Přitom cck jsou Fourierovy koeficienty funkce u{x) vzhledem k systému (5.13). Podle n (5.26) je rozdíl []u||2 - £ pro každé n nezáporný, takže (5,29) může být splněno (1=1 to jen tehdy, když žádný ze sčítanců řady Y. (a* — ak)2 nen' kladný, tj. když ak —. xk pro každé k. Platí tedy: 1=1 Věta 5.8. Nechť (5.13) je ortonormální systém v L2(G). Konverguje-U řada co Y ak(pk(x) v L2(G) k funkci u(x), pak ak jsou nutně Fourierovy koeficienty teto funkce vzhledem k systému (5.13). Podle věty 5.7 je Fourierova řada libovolné funkce u e i-2(G) v prostoru L2(G) konvergentní. Odtud však nikterak neplyne, že tato řada konverguje v L2(G) právě k funkci u{x). Uvažujme např. systém (5.30) ®i = sil1 x::-> 92 = J(^j sin 3* , m ~ sin 5* p 4 = ysin 7x, ... , který je zřejmě v prostoru L2(0, n) ortonormální. Budiž w = sin 2x. Protože tato funkce je ortogonální v prostoru L2{f), ti) kc všem funkcím systému (5.30) [srov, str. 52], jsou všechny její Fourierovy koeficienty ä3, dí2j.a3,.......... vzhledem k systému (5.30) rovny nule. Příslušná Fourierova řada 0. sin x + 0. sin 3x + 0. sin 5x. ... je ovšem podle věty 5.7 konvergentní, nekonverguje však v £<2(0, tz) k funkci u — sin 2x, nýbrž k funkci w = 0. Tato okolnost by nemohla nastat, kdyby systém (5.30) obsahoval také funkci ^ '(//~) sin 2x. V systému (5.30) tedy „něco chybí", je „neúplný". Definice 5.8. Ortonormální systém (5.13) se nazývá úplný v prostoru L2(G), jestliže pro každou funkci u e L2(G) konverguje příslušná Fourierova rada k této funkci v průměru, 58 I. KILBERTŮV PROSTOR Snadno najdeme podmínku pro to, aby daný ortonormální systém byl v prostoru L2(G) úplný: Podle def. 5.6 konverguje posloupnost částečných součtů (5.22) Fouríerovy rady funkce w(x) v L2(G) k funkci u(x) právě tehdy, když lim , tj. když (5.31) Tato rovnost, vyjadřující nutnou a postačující podmínku, aby Fouricrova řada funkce u(x) konvergovala v L2(G) k této funkci, se nazývá Parsevalova rovnost, často též rovnice úplnosti, nebo rovnice uzavřenosti. Najdeme ještč jiné poměrně jednoduché kritérium pro úplnost daného systému: Definice 5.9. Ortonormální systém (5.13) sc nazývá uzavřený v prostoru L2(G), jestliže neexistuje žádná funkce vcL2(G), ortogonální ke všem funkcím tohoto systému, s výjimkou funkce rovné nule v L2(G) (tj. rovné nule skoro všude V oblasti G). Věta 5.9. Ortonormální systém je v L2[G) úplný právě tehdy, je-li v L2(G) uzavřený. Důkaz: 1. Nechť systém (5.13) je úplný. To znamená, že Fouricrova řada, příslušná libovolné funkci z L2{G), konverguje v průměru k této funkci. Máme dokázat, že systém (5.13) je uzavřený, tj. že neexistuje funkce u #0v L2(G), ortogonální ke všem funkcím systému (5.13). Důkaz provedeme sporem. Nechť existuje funkce m 4= 0 v L2(G) a nechť je ortogonální ke všem funkcím systému (5.13). To tedy znamená, že všechny její Fourierovy koeficienty jsou rovny nule. Její Fourieiova řada konverguje tedy v L2(G) k funkci v = 0, a nikoli k funkci u =t= 0. To je ve sporu s předpokladem, že systém (5.13) je úplný. Tedyje-li systém (5.13) úplný, je i uzavřený. 1. Nechť systém (5.13) je uzavřený, tj. nechť neexistuje S výjimkou funkce u = 0 v L2(G) žádná funkce ortogonální ke všem funkcím systému (5.13). Máme dokázat, že systém (5.13) je úplný, tj. že Fonrierova řada, příslušná libovolné funkci z L2(G), konverguje v průměru k této funkci. Důkaz opět provedeme sporem. Nechť f s L2(G) a nechť její Fourierova řada V xk0k{x) konverguje') k funkci w(x) =|= v(x) v L2(G). 1) Podle věty 5.7 je zaručeno, žc taío řada jc v L2{G) skutečně konvergentní. 5. ORTOGONÁLNÍ SYSTÉMY V PROSTORU L, 59 Z věty 5.8 plyne, že ak jsou také Fourierovy koeficienty funkce w(x). Tedy funkce z{x) = n(x) — w(x) má všechny své Fourierovy koeficienty rovny nule, takže je ortogonální ke všem funkcím systému (5.13). Přitom však je z =j= 0 v L2(G), neboť v L2(G) je v(x) 4= w(x), což je spor s předpokladem, že (5.13) je uzavřený systém. Tedy je-li systém (5.13) uzavřený, je i úplný, čímž je věta 5.9 dokázána. Příklad 5.5. Okolnost (nám již známá), že systém (5.30) není úplný v L2(0, n), je nyní přímým důsledkem včty 5.9, neboť funkce u(x) = sin 2x je ortogonální v L2(0, rt) ke všem funkcím systému (5.30) a přitom není v L2(0, tc) nulová. Rozhodnout v obecném případě o tom, je-li daný ortonormální systém úplný, bývá obtížné. Lze však ukázat (viz např. [25]), že systém (5.14) je úplný ortonormální systém v prostoru L2(0, %), obecněji, žc systém (5.32) Hir(x — a) sm —i-'- , n — 1, 2, b — a je úplný ortonormální systém v L7{ti, i). Analogická tvrzení platí i ve speciálních Ar-rozměrnýcb oblastech (N > 1). Např. je-li G obdélník 0 < x, < a, 0 < x2 < b, pak systém funkcí (5.33) —--S!n- x/(ab) a sin , m s= 1, 2, n = 1. 2, je úplný ortonormální systém v LS(G). Je-li (5.13) úplný ortonormální systém v L2(G), lze podle předcházejícího textu funkci u e L2(G) vyjádřit příslušnou Fourierovou řadou, (5.34) u(x) = V ak 0 lze najít přirozené n a čísla a["\ ..., a{l\ tak, žc platí 60 L HILBKRTŮV PROSTOR Je-li mimo to systém (5.35) v L2(C) lineárně nezávislý (pozn. 5.1), řekneme, že tvoří v L2(G) bázi. Poznámka 5.4. Bází v prostoru L2(G) rozumíme tedy každou lineárně nezávislou posloupnost prvků z L2(G), úplnou v tomto prostoru. Připomeňme, že pokud jde o pojem báze, může se čtenář v literatuře setkat i s jinými definicemi. Důležitý je zejména pojem tzv. Schauderovy báze: O systému (5.35) řekneme, že tvoří v prostoru L2(G) Schauderovu bázi (nebo bázi v Schauderově smyslu), lze-li každý prvek u e L2(G) vyjádřit v tomto prostoru, a to jednoznačně, ve tvaru (5.36) «(*) - Z ak ýk(x) ■ Zřejmě je-li (5.35) Sc h a úderová báze v L2(G), je v L2(G) i bází ve smyslu definice 5.10 [neboť z jednoznačnosti vyjádření (5.36) plyne lineární nezávislost systému (5.35)], přičemž však báze podle definice 5.10 nemusí být vždy bází Schauderovou. Báze podle naší definice je tedy „slabší" [klade na systém (5.35) slabší požadavky než definice Schaudcrova]. Proto jsme také v naší knize tuto definici zvolili, neboť, jak uvidíme, nebudeme ani v teorii ani v aplikacích variačních metod potřebovat vlastnosti Schauderovy báze, ale stačí nám zcela vlastnosti báze podle naší definice, tj. její úplnost a lineární nezávislost jejích členů. V dalším textu rozumíme tedy bází bázi podle definice 5.10. Poznámka 5.5. Je-li systém (5.35) v L2(G) ortonormální (pak je ovšem i lineárně nezávislý), pojem úplnosti podle def. 5.8 splývá s pojmem úplnosti podle dcf. 5.10: Nechť systém (5.35) je úplný podle def. 5.8. To znamená, že každou funkci u e L2[G) lze v L2(G) vyjádřit (a to jednoznačně, viz větu 5.8) jako součet příslušné Fourierovy řady. Pak je tedy systém (5.35) Schauderovou bází, a tím spíše bází podle def. 5.10, a je tedy ve smyslu této definice úplný. Naopak, je-li systém (5.35) úplný ve smyslu def. 5.10, lze každou funkci u e L2(G) s libovolnou přesností aproximovat v tomto prostoru vhodnou lineární kombinací t- 1 prvků tohoto systému, a podle věty 5.5 tím spíše lineární kombinací kde ak jsou Fourierovy koeficienty funkce u(x) vzhledem k systému (5.35). Tedy Fourierova řada každé funkce w e L2(G) konverguje v L2(G) k této funkci, takže systém (5.35) je úplný podle def. 5.8. 5, ORTOGONÁLNÍ SYSTÉMY V PROSTORU L2 61 Zároveň je vidět, že když systém (5.35) je v L2(G) ortonormální, splývá pojem Schauderovy báze s pojmem báze, zavedené def. 5.10. Jak jsme již předeslali, mluvíme v tomto případě o ortonormální bázi v L2(G). Příkladem neortonormálni báze v prostoru L2(a, b) je, jak lze ukázat, posloupnost funkcí (5.37) í X, X X™ I , «Vj A j . . A ,---5 obdobně v prostoru L2(G) tvoří bázi (nikoli ortonormální) odpovídající systém mnohočlenů, např. pro N = 1 systém funkcí (5.38) \, x, y, x2, xy, y2, Poznámka 5.6. Z úplného systému (5.35), který je v obecném případě vytvořen z funkcí, které nejsou ani ortogonální, ani normované, lze získat ortonormální bázi tzv. Schmidtovým ortogonalizačním, přesněji orlonormalizačnim procesem: Nechť je dán v L2(C) úplný systém (5.35). Je-li některá z funkcí (5.35) lineární kombinací ostatních, můžeme ji ze systému (5.35) vypustit, aniž bychom tím narušili úplnost tohoto systému. Můžeme proto předpokládat, že systém (5.35) tvoří v LZ(G) bázi. Zejména tedy žádná z funkcí tohoto systému není nulová, takže každá z nich má kladnou normu. Z uvažovaného systému utvoříme ortonormální bázi takto: Předně položíme i(x) je normovaná. Položme dále (5.40) g2(x) = irz (*) + ^ u\p2) . mi.aLH.Juv ťKUSTOK Poznamenejme, že \\g2\\ + 0. Kdyby totiž bylo g2 = 0 v L2(G), dostali bychom podle (5.40) Wě což by znamenalo, že funkce ýx a ^2 jsou v L2(C) lineárně závislé, a to ve sporu s předpokladem, že (5.35) je v L2(G) báze. Můžeme tedy položit 2(x) je normovaná a podle (5.41) je v L2(G) ortogonální k funkci 2, V;t) = 0 . Protože je (tp^ 3(t) Nil Funkce o3(x) je normovaná a podle (5.43) je ortogonální k funkcím pjfx) a r/)2(x). Tak postupujeme dále, až dospějeme k ortonormálnímu systému (5.46) Piv*') > 9i(x),---, Snadno se přesvědčíme, že systém (5.46) tvoří v L2(G) ortonormální bázi. Orto-normálnost tohoto systému je zřejmá z jeho konstrukce, stačí tedy dokázat jeho úplnost. Avšak z uvedeného procesu ortonormalizace je vidět, že n-tý člen systému (5.46) je lineární kombinací prvních n členů systému (5.35), a naopak. Je-li tedy možno každou funkci u e L2(G) s libovolnou přesností aproximovat v L2(G) vhodnou lineární kombinací funkcí systému (5.35), lze to učinit i pomocí funkcí systému (5.46), z čehož snadnou úvahou vyplývá (viz pozn. 5.5), že systém (5.46) je v L2(G) úplný. 5. ORTOGONÁLNÍ SYSTÉMY V PROSTORU L2 f>5 Uvedeným ortonormalizačním procesem dostáváme tedy skutečně ortonormální bázi v L2(G). Příklad 5.6. Čtenáři doporučujeme, aby aplikoval pro případ intervalu (—1, 1) právě popsaný ortonormalizační proces na bázi (5.37). Dostaneme v L2(—1, 1) úplný ortonormální systém mnohočlenů f- M-Áty*-*..... lišících se jen konstantami od Legendreových polynomů. d) Rozklad prostoru L2(G) na ortogonální podprostory Jíž v pozn. 4.3, str. 44, jsme se zmínili o pojmu tzv. lineárního podprostoru: Nechť M je lineál nějakých prvků z L2(G). Zaveďme na tomto Iineálu skalární součin a tím i metriku prostoru L2(G], čímž se lineál M stane metrickým prostorem. Tento prostor budeme značit symbolem MLAG) nebo prostě symbolem M. Definice 5.11. Je-li prostor M úplný, nazýváme jej lineárním podprostorem prostoru L2(G). Příklad 5.7. Uvažujme v prostoru L2(0,1) množinu M všech funkcí konstantních v intervalu (0, l). M je zřejmě lineál, neboť lineární kombinace konstantních funkcí je opět konstantní funkce. Označme stejným symbolem M příslušný metrický prostor s metrikou prostoru L2(0, l). Tvrdíme, že M je úplný prostor: Podle definice máme dokázat, že každá cauchyovská posloupnost má v M limitu, tj. že existuje prvek, ležící v M, který je v M limitou této posloupnosti. Nechť (5.47) t>i(x) = fc,, v2(x) = k2,..., v„(x) s k„ ..., kde fej:, k2,... jsou reálné konstanty, je cauchyovská posloupnost funkcí v tomto prostoru. Je Q(vm, v„) = J (k„ - kn)2 dx = \k,„ - fc„f = qEÁkm, K) , takže (5.47) je cauchyovská posloupnost v prostoru M právě tehdy, je-li {k„) cauchyovská číselná posloupnost v euklidovském prostoru JSj [kde, jak známo, je vzdálenost g£l(a, b) prvků a, b dána číslem \a - fej}. Ale podle Bolzanova - Cau-chyova kritéria má cauchyovská posloupnost {kn} v prostoru limitu; označme ji k. 64 1. hii.BERTÚV PROSTOU. 5. ortogonální systémy v prostoru L2 65 Odtud okamžitě plyne, že posloupnost (5.47) má v prostoru M za limitu funkci u(x) s k, neboť lim q(v, p„) = lim / (fc — fc„)2 dx = lim |fc — k„\ — 0 . JJ-*OJ B-»ŮO y Jo Tedy každá cauchyovská posloupnost má v prostora M limitu. Prostor M je úplný, a je tedy lineárním podprostorem prostoru L2(0, 1). Příklad 5.8. Uvažujme lincái L funkcí spojitých v uzavřenóm intervalu < — 1, 1>. Metrický prostor, který vznikne, zavedeme-li v tomto Iineálu metriku prostoru L2(—1, 1), označme Mtl(_ltI). Prostor ML^_tl) není lineárním podprostorem prostoru L2(—1, l), neboť není úplný (viz pozn. 4.3, str. 44). Pro informaci čtenáře uveďme ještě následující vetu, i když ji v dalším textu nebudeme potřebovat (označení viz před def. 5.11, str. 63): Věta 5.10. Prostor MLl(G) je lineární podprostor prostoru L2(G) právě tehdy, je-li lineál M uzavřená množina v L2(G). Důkaz je poměrně snadný a přenecháváme jej čtenáři. Bude pro něho užitečným procvičením zavedených pojmů. Uvažujme nyní v prostoru L2{G) určitý lineární podprostor, který stručně označíme N. Platí tato důležitá věta: Věta 5.11. Nechť w(x) je libovolná funkce z prostoru L2(G). Pak u{x) lze, a to jednoznačně, rozložit v součet (5.48) u(x) = v(x) + w(x) , kde v e N a funkce \v(x) je ortogonální ke každé funkci z N. Funkce ii(x) se nazývá ortogonální projekce funkce u(x) do podprostoru N. Okolnost, že funkce w(x)je ortogonální ke každé funkci z podprostoru Ar, zapisujeme stručně symbolem w JL jv a říkáme, že funkce w(x) je ortogonální k podprostoru N. Důkaz věty 5.11 najde čtenář např. v [26]. Záleží v tom, že funkci v(x) urěímc jako funkci, která realizuje minimum vzdálenosti g(u, z) funkce u(x) od všech funkcí z(x) podprostoru N. Přitom se podstatně využívá toho, že L2(G) i JV jsou úplné prostory. Příklad 5.9. Uvažujme v prostoru L2(0, 1) lineární podprostor M z příkl. 5.7. Jde tedy o podprostor všech funkcí konstantních v intervalu •(O, 1>. Rozložme funkcí v součet (5.48). Funkce v(x) bude rovna zatím neznámé konstantě, označme ji a. Rozklad (5.48) bude tedy tvaru xz = a + (x2 - a) . Konstantu a určíme z podmínky, aby funkce w(x), v našem případě funkce w(x) = = xz — a, byla v L2(0, l) ortogonální k podprostoru M, tj. ke každé funkci tvaru z(x) = k, kde k je konstanta. Zapíšeme-li podmínku ortogonality, dostaneme čili (z, w) = | k{x2 - a) dx = 0 odkud v důsledku toho, že konstanta k je libovolná, plyne a = ^. Tedy projekcí funkce (5.49) do podprostoru Af je funkce v(x) — Zároveň je x2 - 1 1 M . Lze ukázat, že množina K všech funkcí, ortogonálních k danému podprostoru N [přesněji: prostor K těchto funkcí, s metrikou prostoru L2(G)], je opět lineární podprostor v L2(G). Říkáme, že prostor L2{G) je ortogonálním součtem (ortogonálních) podprostoru N a Jí", a píšeme (5.50) L2(G) = N © K (5.49) H (x) = x1 xe<0, 1>, Význam tohoto symbolu vysvětluje věta 5.11: Každou funkci ueL2(G) lze jednoznačně zapsat jako součet dvou funkcí v{x) e N a w(x) e K (přičemž ti i. K a w X N). Podprostoru K říkáme ortogonální doplněk podprostoru JV v prostoru L2(G). Píšeme K = L2(G) 6 N . Poznámka 5.7. Čtenáře jistě napadne jednoduchá geometrická interpretace věty 5.11: Uvažujme třírozměrný euklidovský prostor E3 a v něm rovinu a, procházející počátkem souřadnic. Pak libovolný polohový vektor r z tohoto prostoru lze jednoznačně rozložit v součet dvou ortogonálních vektorů r1 a r2, z nichž první je ortogonální projekcí vektoru r do roviny u , vn * v v L2(G) => (u„, p„) -> (u, r) . Důkaz: Máme dokázat, že lim («„, t;„) = («, c), tj. ze čili, což je totéž, že (5.52) Podle předpokladu je lim [(!<„, v,) - (u, vj] = 0 , lim J(«„, v„) - («, i>)| = 0 . n -ŕ* co "„ -» m , u„ y v L2(G) čili (5.53) Dále je lim \\u„ — u\\ = 0, lim ||r„ — v\\ — 0 . \(u„, v„) - («, i:), = j(w„ - u, v„ - v) + (u, vn - v) + (v, u„ - u)\ ^ £ \(u„ - u,v„- v)\ 4- \(u, vn - v)\ + \(v, un - u)\ £ s |[H„ - „f - v\\ + u \\Vn - ,,|| + li []„„ - H|| [podle Schwarzovy nerovnosti (3.14), str. 37], odkud v důsledku (5.53) okamžitě plyne (5.52). Věta 5.12 má několik jednoduchých důsledků: Věta 5.13. (užíváme jen stručného zápisu). (5.54) Je-li m„ -» u v L2(G) a ve L2(G) , pak (u,„ v) -> (u, t>) . Důkaz je snadný: V (5.51) stačí položit v„ = v pro každé ři. Věta 5.14. (5.55) Je-li u„ -» « r L2(G), ^afc |]«„|| -» ||u[j f). HrLBERTŮV prostor 67 Důkaz: V (5.51) stačí položit v„ = u„ a v ~ u; odtud podle (5.51) plyne |[«„||2 -* -t j|u|[2, což implikuje (5.55). Věta 5.15. Nechť M je hustá množina v L2(G) (str. 46) a nechťu(x) je ortogonální ke každé funkci z množiny M. Pak u = 0 v L2(G). Důkaz: Množina M je podle předpokladu hustá v L2(G). Speciálně lze tedy najít posloupnost funkcí w„(x) e M takovou, že lim un(x) =. u{x) v L2(G) . Ale pro každou funkci u,lx) platí podle předpokladu (5.56) («,„ «) = 0 . Podle (5.54), kde pokládáme i-(x) = u(x), je lim («„, w) = (u, u) = 0 [podle (5.56)], odkud plyne u = 0 v L2(G). Věta 5.15 se ukáže velmi užitečnou v našich dalších úvahách. Kapitola 6 Hilbertův prostor Přistoupíme nyní k definici Hilbertova prostoru, jehož příkladem je, jak uvidíme, nám již dobře známý prostor L2(G) funkcí integrovatelných v oblasti G s druhou mocninou s metrikou zavedenou v kap. 3. Uvedením axiómů Hilbertova prostoru a vyšetřováním jeho vlastností jsme mohli začít již dříve, nezávisle na tom, zda jsme se předtím seznámili s prostorem L2(G). Zvolili jsme však jinou cestu, která je podle našeho názoru pro čtenáře, který není profesionálním matematikem, mnohem přístupnější. Pojmy, které jsme zavedli v předcházejících kapitolách, jsou totiž v prostoru L2[G) mnohem názornější než v abstraktním Hilbertově prostoru, a přitom jsme je zavedli způsobem, kterého lze téměř beze změny použít i v obecnějším případě. Tato kapitola přinese tedy čtenáři zobecnění dříve zavedených pojmů i získaných výsledků, bude však pro něho zároveň i určitým přehledem a zopakováním předcházejícího textu. OB í. htlbertuv prostor a) Unitární prostor. HilbertíiY prostor Uvažujme množinu M, jejíž prvky mohou mit velmi obecný charakter. Množinu M mohou tvořit např. funkce, dané na oblasti G, tak jak tomu bylo v předcházejících kapitolách. Množina M může však být např. množinou všech n-rozměrných vektorů nebo množinou Číselných posloupností, posloupností funkcí apod. Definice 6.1. Řekneme, že M je lineál nebo lineární množina (podrobněji lineární množina nad tělesem reálných čísel), lineární prostor, vektorový prostor, také lineární soustava (lineární systém), má-Ii tyto vlastnosti: 1. Pro libovolné prvky u, v z M je definován jejich součet u + v a pro každý prvek a e M a každé reálné číslo a je definován součin au, přičemž u + v i au jsou rovněž prvky M.') 2. Pro takto zavedené operace sčítání a násobení reálným číslem platí tyto axiómy (obdobné známým pravidlům z vektorové algebry; odtud název vektorový prostor): u + v — v + u, u + (v + z) - (u + v) + z, a(u + v) = au + av, (a + b) u = au + bu , a(bu) - (ab) u , 1 .u = u . 3. Existuje takový prvek OeM, že m+0 = w pro každé w e M. Prvek O nazýváme nulovým prvkem lineálu M. 4. Ke každému u e M existuje ve M tak, že u + v = O. Prvek v nazýváme prvkem opačným k prvku u. Z uvedených axiómů plyne řada důsledků a „pravidel", obdobných známým pravidlům z algebry, o nichž se zde nebudeme podrobně zmiňovat. Poznamenejme např., že prvky O z v z axiómů 3 a 4 jsou jednoznačně určeny, že platí 0 , u = O pro každé u e M, atd. Nulový prvek lineálu M budeme často značit prostě symbolem 0, pokud nebude nebezpečí nedorozumění (zámena s číslem nula). Podrobněji budeme psát u — 0 v M. Klasickým příkladem lineálu je množina všech reálných n-rozměrných algebraických vektorů u = («,, ...,m„) s obvyklou definicí součtu dvou vektorů, u + v == = (u1 + Vi,w„ + vn) a násobení vektoru číslem, cti = (cuu cu„). Nulovým prvkem tohoto lineálu je nulový vektor o = (0,... ,0). Právě vlastnosti tohoto lineálu byly určitým vzorem pro obecnou definici lineálu. *) Odtud ovsem okamžitě plyne, ze i libovolná lineární kombinace {6.1) ¥i + -toa prvků «„ z M, kde ďt,an jsou reálná Čísla, patří do M. O. ]ilLUHRTUV PROSTOR Ui» Dalším jednoduchým příkladem lineálu je množina L všech reálných funkcí spojitých v uzavřené oblasti G s obvyklou definicí součtu dvou funkcí a násobení funkce reálným číslem. Zápis u = 0 v L zde znamená, že u{x) s 0 v G. Příklad množiny funkcí, klerá není lineálem, byl uveden na str. 22, příkl. 2.2, Poznámka 6.1. Vzhledem k účelu, který sledujeme, stačí nám vybudovat teorii „reálného" Hilbcrtova prostoru, proto v (6.1) (viz poznámku pod čarou na str. 68) uvažujeme konstanty at, a„ reálné. O obecnějším případě viz pozn. 6.11, str. 82. Definice 6.2. Říkáme, že na lineálu M je definován skalární součin, je-li každé dvojici h, v prvků z této množiny přiřazeno reálné číslo (6.2) (u,v) s těmito vlastnostmi («, v, w1; u2 jsou libovolné prvky lineálu M, au a2 jsou libovolná reálná čísla): (6.3) («, t>) = (v, u) , (6.4) (a,u, + a2u2, v) = ^(u,, v) + a2(u2, v), (6.5) (u, u)^0, (6.6) («,«) = 0 , + ... + u„v„ dvou reálných n-rozměrných algebraických vektorů u = (uí,u„), v — (»,,v„), definovaný na lineálu těchto vektorů, uvažovaném v předcházejícím textu (str. 68). Podobně jako vlastnosti tohc>to lineálu byly určitým vzorem pro obecnou definici lineálu, byly vlastnosti součinu (6.7) určitým vzorem pro obecnou definici skalárního součinu. Uvedeme některé další příklady. t.. HlLHfcKlUV ťKUSIUK Příklad 6.1. Uvažujme lineál M, jehož prvky tvoří funkce integrovatelné s druhou mocninou v oblasti G, přičemž dvě funkce, rovné v G skoro všude, pokladáme za totožné. Vztahem (6.8) (u, t>) — u(x) v(x) dx je na tomto lineálu definován skalární součin, neboť, jak jsme ověřili v kap. 3 (věta 3.1; část důkazů byla podrobně provedena již v kap. 2), vztah (6.8) splňuje všechny předepsané vlastnosti (6.3) až (6.6) skalárního součinu. Přiklad 6.2. Nechť lineál M je množina všech vektorových funkcí tvaru «(x) = ui(x)i + u2(x)j, jejichž souřadnice u^x), u2(x) jsou funkce integrovatelné s druhou mocninou v oblasti G. Je-li a libovolné reálné číslo a jsou-li u(x) = ut(x) i + u2(x) j, v(x) — — f?i(x) i + v2(x) j libovolné prvky z M, definujeme u(x) + v(x) = fu,(x) 4- v,(x)~\ i + [u2(x) + »2(x)]j, au(x) = au,{x) i -f au2(x)j. Čtenář snadno ověří, že jde o linea!. Nulovým prvkem tohoto lineálu je funkce u, jejíž obě souřadnice jsou rovny nule v L2(G). Vztahem (u, v) = (ií;, »i) + (u2, v2), kde (uk,vk), k— 1,2, jsou skalární součiny (6.8), je na lineálu M definován skalární součin. Vlastnosti (6.3) a (6.4) jsou zřejmé. Dále (u, u) = («!,«,) + ("z, u2), odkud ihned plyne (u, u)žO a (b,u) = 0 pro u = 0 v M. Dále (u,, «,) ä 0, (w2, u2) ä 0. Z rovnosti («i. «i) + («2, "2) = 0 tedy plyne («,, ut) = 0 a («2, «2) = 0> odkud «, = 0 a «2 = 0 v ^2(G), takže skutečně (ti, u) = 0 ** u = 0 v M, čímž je dokázána i druhá implikace v (6.6). Zcela obdobně lze zavést skalární součin i na lineálu vektorových funkcí o více než dvou souřadnicích. Příklad 6.3. Uvažujme množinu funkcí spojitých v uzavřené oblasti G, pro které v G platí |w(x)| ž 10. Na této množině nelze zavést skalární součin s vlastnostmi (6.3) až (6.6), neboť uvažovaná množina není lineál. [Na kterém z axiómů (6.3) až (6.6) skalárního součinu bychom ztroskotali?] o. mildertuv prostor / 1 Příklad 6.4. Uvažujme lineál M, jehož prvky jsou funkce spojité včetně první derivace v uzavřeném intervalu <0,1>, s obvyklou definicí sčítání funkcí a násobení funkce reálným číslem a s nulovým prvkem u(x) = 0 v {0,1). Ukážeme, že vztahem (6.9) (u, v) = ľ w(x) u(x) dx + ľ u'(x) v'(x) dx Jo Jo je na tomto lineálu definován skalární součin. Vlastnosti (6.3) a (6.4) pro vztah (6.9) jsou zřejmé. Dále je (6.10) («,«) = u2(x)dx + u'1(x)dx, Jo Jo takže (u, ti) ^ 0; je-li u(x) = 0v intervalu <0, 1>, je (w, w) == 0; je-li («, u) = 0, plyne z (6.10) u(x) = 0 v intervalu <0,1>. Tedy vztah (6.9) splňuje všechny vlastnosti skalárního součinu. Příklad 6.5. Uvažujme stejný lineál M jako v předcházejícím příkladě. Vztahem (6.11) (u, v) = j u'(x)v'(x)dx není na Jineálu M dán skalární součin. Všechny axiómy skalárního součinu jsou splněny s výjimkou posledního: Podle (6.11) je («,«)=jV(x) dx . Je-li («, u) — 0, plyne odtud u'(x) = 0 v intervalu <0, 1>, nikoli však «(x) s 0 v tomto intervalu. Např. funkce w(x) = 3 v intervalu <0,1> patří do lineálu M, splňuje vztah (u, «) = 0 a není nulovým prvkem tohoto lineálu. Poznámka 6.3. Protože vlastnosti (6.3) až (6.6) skalárního součinu (6.2) a vlastnosti (3.7) až (3.10) skalárního součinu (3.2), str. 37, jsou obdobné, jsou obdobné i důsledky odvozené z těchto vlastností. Zejména platí pravidlo o násobení, («!«! + a2u2, tí3w3 + a4u4) = aia3(ut, u3) + a2a3(u2, u3) + + a^Ju^ u4) -l- a2a4(u2, u4), analogické pravidlu (3.21). Definice 6.3. Nechť na lineálu M jc definován skalární součin (6.2) s vlastnostmi (6.3) až (6.6). Číslo (6.12) IH! = V(«>") 72 nazýváme normou prvku u toholo fineálu a číslo I. HILHERTŮV PROSTOR (6.13) q(u, v) u - m nazýváme vzdálenosti prvků u, v tohoto lineála. Čtenář si jistě povšiml, že v kap. 3 byly norma i vzdálenost v prostoru L2(C) zavedeny zcela analogickým způsobem, a to na základě skalárního součinu (3.2), str. 34. Protože všechny vlastnosti (3.11) až (3.20), odvozené v kap. 3 (popř. již v kap. 2) pro normu a vzdálenost v prostoru L2(G), byly odvozeny jen na základě vlastností (3.7) až (3.10) skalárního součinu, které jsou zcela analogické vlastnostem (6.3) až (6.6) skalárního součinu (6.2), budou mít norma (6.12) i vzdálenost (6.13) opět vlastnosti zcela analogické vlastnostem (3.11) až (3.20). Shrneme je do této věty (čtenář, který si chce znovu připomenout myšlenky příslušných důkazů z kap. 2 a 3, může si snadno podle nich podrobně dokázat jednotlivá tvrzení uváděné věty): Věta 6.1. Pro normu (6.12) a vzdálenost (6.13) platí (m, v, z jsou libovolně prvky lineálu M, a je libovolné reálně číslo): (6.14) (6.15) (6.16) (6.17) (6.18) (6.19) (6.20) (6.21) (6.22) (6.23) |[H| = 0o« = 0 ti M,1) \au\ = |a| f»1 , II" + »>! á H +1*1 ■ IIMI-HIéII"-'!. íf(o, v) \% 0 , q(u, v) = 0 «tŕ u = v v M ,2) q(u, v) = q(v, u) , q(u, z) s <;(". '•) + e(u> z) ■ Definice 6.4. Lineál JVf s metrikou (6.13), kde norma je dána vztahem (6.12), nazývame unitárním prostorem (prostorem se skalárním součinem, prostorem s kvadratickou metrikou). Tento prostor budeme v této kapitole značit symbolem S2. V jednotlivých speciálních případech budeme ovšem užívat speciální symboliky, jak jsme to učinili např. u nám již dobře známého prostoru L2(G). *) Tj. u je nulový prvek lincälu M. 2) Tj. u — i> = 0 v M. 6. HILBtRTŮv PROSTOR 73 Metrika (6.13) prostoru S2 je dána normou (6.12) na základě skalárního součinu (6.2) s vlastnostmi (6.3) až (6-6). Říkáme také, že tato metrika je indukována (generována) skalárním součinem (6.2). V kap. 4 jsme na základě metriky (3.4) s vlastnostmi (3.17) až (3.20) zavedli několik důležitých pojmů [pojem konvergence v prostoru L2(G), hromadného bodu, hustoty, úplnosti atd.] a odvodili jsme pro jejich vlastnosti několik základních vět. Protože metrika (6.13) má vlastnosti (6.20) až (6.23) zcela analogické vlastnostem (3.17) až (3.20) metriky (3.4), lze pro prostor S2 definovat zcela analogicky obdobné pojmy a téměř doslova přenést důkazy příslušných vět. Nebudeme zde proto reprodukovat úvahy, podrobně provedené v kap. 4, a jen v přehledu uvedeme odpovídající definice a věty. Jen tam, kde bude třeba, upozorníme čtenáře na některé odlišnosti a doplníme text potřebnými poznámkami, popř. uvedeme některé další výsledky. Čtenáři doporučujeme, aby si objasnil zavedené pojmy a aplikoval příslušné věty na prostorech uvedených v příkl. 6.1, 6.2 a 6.4, Definice 6.5. Říkáme, že posloupnost prvků un e S2 konverguje v S2 k prvku u £ S2, jestliže lim s(un, u) = 0 . Píšeme lim un = u v S, r. * f a prvek u nazýváme limitou nebo limitním prvkem posloupnosti {«„}. Příklad 6.6, V prostoru z příkl. 6.4 (označme tento prostor W) máme Qw(u, v) = ij u — v"2, — (u ■ ■ v,u — v)w = i" " nUa.i) + ||»' - "'Imo.d = r?L(o.n(»> v) + t?L(o,i)(«'> "O • (6.24) Konvergence v tomto prostoru tedy znamená, že posloupnost funkcí u„(x) konverguje v M0' !) k Itmitní funkci a zároveň posloupnost derivací u'Jxx) konverguje v L2(0, l) k derivaci této limitní funkce. Poznámka 6.4. Na základě pojmu konvergence posloupnosti definujeme konvergenci nekonečné řady: O radě i = l řekneme, že je konvergentní v prostoru S2 a má součet seS2, jestliže posloupnost {sn} jejích částečných součtů, s„ = £ "i - Jí = L konverguje v S2 k prvku s e S2. 74 I. hilbertův prostor Věta 6.2. Posloupnost {u„} může mít v S2 nejvýše jednu limitu. Tedy tato posloupnost buď má v S2 limitu, a to jedinou, nebo nemá v S2 žádnou limitu. Definice 6.6. Posloupnost prvků u„eS2 se nazývá cauchyovská (fundamentální) v prostoru S2, jestliže platí lim q(u„, ii„) = o, m-* co n-*oo podrobně, lze-Ii ke každému e > 0 najít číslo n0 tak, že je-li zároveň m > n0, n > n0, platí Věta 6.3. Každá posloupnost {uB}, která konverguje v S2 k některému prvku u e S2, je v S2 cauchyovská. Každá cauchyovská posloupnost však nemusí mít v prostoru S2 limitu. Definice 6.7. Prostor S2 se nazývá úplný, jestliže každá posloupnost {u„}, cauchyovská v S2, konverguje v S2 k některému prvku u e S2. Příklad 6.7. Prostor L2(G) z příkl. 6.1 je úplný (viz větu 4.3, str. 43). Příklad 6.8. Také prostor z příkl. 6.2, str. 70 [označme jej L2(G)] Je úplný. Pro každé dva prvky u e L2(G), v e L2(C) předně platí = (»1 ~ »1, «1 - "i)l2(C) + ("2 ~ ľ2> "i ~ ^Itltól ~ = - "ilfato + SK - »2||t(C) = flW«i- °») + W">' °J • takže pro posloupnost {"u) prvků z L2(G) máme íl*^ - "u) = qUoÍ"^ ~ ""O + -'"*) - Odtud plyne, že posloupnost {"u} je v L2(G) cauchyovská právě tehdy, jsou-li posloupnosti {"uj i {nu2} cauchyovské v L2(G). Nechť tedy {"u] je cauchyovská posloupnost v L2(G), takže {"«,} i {"«z} jsou cauchyovské posloupnosti v L2(G). Ale prostor L2(G) je úplný, takže posloupnost {"«,}, resp. {"u2} má v L2(G) jedinou limitu, označme ji u„ resp. u2. Funkce a - úji + u2j je zřejmě v L2(G) limitou posloupností {"u} a patří do L2(C), takže prostor L2(G) je úplný. Příklad 6.9. Lze ukázat, že prostor W z příkl. 6,4 není úplný. [Podle (6.24) je posloupnost {«„} v tomto prostoru cauchyovská právě tehdy, jsou-li zároveň po- 6. hilbertův prostor 75 sloupnosti {«„}, {u'„} cauchyovské v L2(0,1); nyní stačí uvažovat takovou posloupnost {«„} cauchyovskou v prostoru W, že např. příslušná posloupnost {«;}, cauchyovská Y konverguje v L2(G) k funkci, která není spojitá v intervalu <0, 1>.] Prostor S2, který není úplný, lze „zúplnit", přidáme-li k němu nové prvky, tzv. ideální elementy (viz napr. [26]; viz též kap. 10). Lze ukázat, že např. prostor W z příkl. fi.4 bude úplný, přidáme-li k němu určité prvky z prostoru L2(0, 1), které na tomto místě nebudeme blíže specifikovat. [Jde o ty funkce z L2(0,1), které mají tzv. první zobecněnou derivaci integrovatelnou s druhou mocninou (v Lebcsgueově smyslu) v intervalu (0,1). Viz definici prostoru WJ0 v kap. 29, str. 345.] V obecném případě bývá obtížné blíže určit povahu uvedených ideálních elementů. Definice 6.8. Buď & > 0. S-okolím (5-sférou) prvku u v prostoru S2 rozumíme množinu všech prvků zS2, pro než platí q(u, v) < ó . Definice 6.9. Nechť N jc nějaká množina prvků z prostoru S2. Říkáme, že prvek M e S2 je v prostoru S2 hromadným bodem množiny N, jestliže v každém libovolně malém <5-okolí prvku u leží nekonečně mnoho prvků z množiny N. Hromadný bod množiny N v prostoru S2 může, ale nemusí patřit do množiny N. Veta 6.4. Prvek u e S2 je v prostoru S2 hromadným bodem množiny N právě tehdy, existuje-li posloupnost prvků u„ e JV, která konverguje v S2 k prvku u. Definice 6.10. Množina N, která je sjednocením prvků množiny N a všech jejích hromadných bodů v prostoru S2, sc nazývá uzávěr množiny N v prostoru S2. Jc-li JV = JV (tj. patří-Ii každý hromadný bod množiny JV do této množiny), říkáme, že množina JV je v prostoru S2 uzavřená. Definice 6.11. Množina JV se nazývá hustá v prostoru S2, platí-li Ar = S2, tj. je-li každý prvek prostoru S2 hromadným bodem množiny JV v tomto prostoru. Poznámka 6.5. Podle věty 6.4 jc množina N hustá v prostoru S2 právě tehdy, jestliže ke každému prvku u prostoru S2 lze najít posloupnost {u„} prvků z množiny JV, která v S2 konverguje k prvku u. Nebo také: Množina JV je hustá v prostoru S2, lzedi každý prvek u e S2 s libovolnou přesností aproximovat prvky množiny JV; podrobněji, jestliže ke každému u e S2 a £ > 0 existuje prvek ve N tak, že q(u, v) < e. Definice 6.12. Existuje-li v S2 nejvýše spočetná množina, hustá v S2, nazývá se prostor S2 separobilní. 76 I. h1lbertův PROSTOR Poznámka 6.6. Příkladem separabilního prostoru je prostor L2(G) (viz větu 4.7). Na základě toho lze ukázat (čtenář to snadno provede sám), že i prostor L2(G) z příkl. 6.2 je separahilní. Definice 6.13. Je-li unitární prostor Sz úplný, nazýváme jej Hiibertovým prostorem. V dalším textu této knihy budeme pro Hilbertův prostor převážně používat symbolu //, majícího popr. různé indexy, bude-Ii třeba rozlišit dva nebo více uvažovaných Hilbertových prostorů. Čtenáře upozorňujeme na značnou nejednotnost v definicích Hilbertova prostoru, s kterou se setká v literatuře. Ne všude se žádá úplnost Hilbertova prostoru. Někde se naproti tomu žádá nejen úplnost, ale i separabiínost, někdy se vyslovuje i požadavek, aby v prostoru H ke každému přirozenému n existovalo n lineárně nezávislých prvků. Pokud budeme v této knize mluvit o Hilbertově prostoru, budeme jím vždy rozumět prostor podle def. 6.13, tedy úplný unitární prostor. Příklad 6.10. Prostory L2(G) a L2(G) z příkl. 6.1 a 6.2 jsou Hilbertovy prostory. Prostor L2(G) je úplný podle věty 4.3, úplnost prostoru L2(G) jsme ukázali v příkl. 6.8. Podle pozn. 6.6 jsou navíc oba prostory scparabilní. Prostor Wz příkl. 6.4 není Hilbertův prostor, neboť není úplný (příkl 6.9). Další úvahy budeme provádět převážně v Hilbertově prostoru, i když v mnoha definicích i větách bude zřejmé, že požadavek úplnosti je zbytečný. (Na některých závažnějších místech vyznačíme tuto okolnost přímo tím, že příslušnou větu formulujeme pro prostor S2. Tím spíše pak platí tato věta v Hilbertově prostoru.) Protože celá další tematika této kapitoly je jen analogií kap. 5 a také důkazy příslušných tvrzení, které jsme podrobně provedli v kap. 5, jsou zcela analogické, budeme postupovat stejnou přehlednou formou, jako jsme to učinili v první části této kapitoly. b) Lineární závislost a nezávislost v Hilbertově prostoru. Ortogonální systémy, Fourierovy řady Definice 6.14. Říkáme, že u e S2 je v prostoru S2 lineární kombinací prvků u,,..vr tohoto prostoru, Ize-li « vyjádřit v S2 ve tvaru (6.25) u - íi,t1, 4- ... + a,vT, kde a1.....a, jsou vhodné reálné konstanty. Definice 6.15. Říkáme, že prvky uu...,uk z S2 jsou v prostoru S2 lineárně závislé, je-li aspoň jeden z nich lineární kombinací ostatních. V opačném případe říkáme, že jsou v prostoru S2 lineárně nezávislé. 6. HILBERTŮV PROSTOR 77 Mluvíme také o lineárně závislém, resp. lineárně nezávislém systému prvků Uj, (v prostoru S2). Věta 6.5. Prvky ut e S2, uke S2 jsou v prostoru S2 lineárně závislé právě tehdy, je-li jejich Gramův determinant D{uu ut) = roven nule. (ult tíj), («!, u2), ...,(«t,ufc) (u2, !(.), (u2, Ií2), ...,(u2, uk) («*» «i), «2).•••,(«*, «*) Důsledek : Prvky w,, ..., uk prostoru S2 jsou v tomto prostoru lineárně nezávislé právě tehdy, je-li D 4= 0. Poznámka 6.7. Jestliže v prostoru S2 existuje n lineárně nezávislých prvků, ale každých «4-1 prvků z tohoto prostoru je již lineárně závislých, říkáme, že prostor S2 má konečnou dimenzi n. Příkladem takového prostoru je prostor n-rozměrných algebraických vektorů s obvyklými operacemi součtu dvou vektorů a násobení vektorů číslem a s obvyklou definicí skalárního součinu (str. 69). Jestliže ke každému n existuje v prostoru S2 n lineárně nezávislých prvků, říkáme, že prostor S2 má nekonečnou dimenzi. Příkladem takového prostoru je prostor L2{G). Definice 6.16. Prvky u, v prostoru S2 se nazývají ortogonální v tomto prostoru, je-li jejich skalární součin v tomto prostoru roven nule, (6.26) (u, v) = d. Píšeme (6.27) u Iv. Definice 6.17. Řekneme, že prvek ue S2 je normovaný, jestliže Definice 6.18. Jestliže pro každé dva navzájem různé prvky systému (6-28) »,-'-, •■■>■■■■> ^ieS2, i - 1,2,..., je v prostoru S2 lineárně nezávislý, jestliže každý systém, vytvořený ž konečného počtu těchto prvků, je v S2 lineárně nezávislý ve smyslu def. 6.15. Vybereme-li z ortonormálního systému (6.28) libovolných j prvků, budou tyto prvky podle věty 6.5 v S2 lineárně nezávislé, neboť z vlastností ortonormálnosti plyne, že jejich Gramův determinant bude mít v hlavní diagonále samé jedničky a všude jinde nuly, takže bude roven jedné. Tedy každý systém ortonormální v S2 je v S2 lineárně nezávislý. Věta 6.6. Nechť {6.2%) je ortonormální systém v Hilberíově prostoru H. Pak řada (6.29) Z akí = l«ľ Definice 6.20. Ortonormální systém (6.28) se nazývá úplný v Hilbertově prostoru II, jestliže pro každé ueH příslušná Fourierova řada konverguje v H k tomuto prvku, tj. je-li pro každé u e H splněna rovnost (6.35). Definice 6.21. Systém (6.28) se nazývá uzavřený v prostoru H, jestliže jediný prvek, který je ortogonální ke všem prvkům tohoto systému, je nulový prvek tohoto prostoru. Věta 6.10. Ortonormální systém (6.28) je v Hilbertově prostoru úplný právě tehdy, je-li v něm uzavřený. Některé příklady úplných ortonormálních systémů v L2{G) byly uvedeny v předcházející kapitole. 80 I. hilbertův prostor 6. hilbertův prostor 81 Definice 6.22. Systém (posloupnost) (6.36) ^1,iA2,...,^,...1) i prvků Hilbertova prostoru (nikoli nutně ortonormální) se nazývá úplný v tomto prostoru, je-li množina všech lineárních kombinací prvků tohoto prostoru hustá v H, tj. ize-li ke každému prvku u e II a ke každému e > 0 najít přirozené číslo n a čísla a'/0,.... ai"y tak, že platí (6.37) q(u, t «Í"V*) < s • *=i Je-li mimo to systém (6.36) v H lineárně nezávislý (str. 78), řekneme, že tvoří v prostoru H bázi. Báze v prostoru H je tedy nejvýše spočetný lineárně nezávislý úplný systém v//. Je-li přitom tento systém ortonormální, nazývá se ortonormální báze v tomto i prostoru. Poznámka 6.8. K def. 6.22 lze připojit poznámky (týkající se pojmu tzv. Schaude-rovy báze atd.) zcela obdobné pozn. 5.4 a 5.5, str. 60. Poznámka 6.9. Z požadavku lineární nezávislosti báze (6.36) vyplývá, že vybere-me-li z ní libovolný konečný počet prvků, je Gramův determinant, příslušný těmto prvkům, různý od nuly. Příklady bází, ortonormálních i neortonormálních, byly uvedeny v předcházející kapitole [systémy (5.14), (5.32), (5.33), (5.37), (5.38)]. Není-H systém (6.36) ortonormální, lze jej ortonormalizovat procesem, který byl ukázán v pozn. 5.6, str. 61. Přitom takto vzniklý ortonormální systém je v H úplný právě tehdy, je-li v H úplný systém (6.36), Lze ukázat, že platí (viz např. [27]) i Věta 6.11. V každém separabilním Hilbertově prostoru existuje báze.2) Na základě toho, co jsme právě řekli o možnosti tuto bázi ortonormalizovat, platí dokonce: j 1) V této definici připouštíme, že systém (6.36) může být i konečný. Napr. v každém prostoru, jehož dimenze je k (srov. pozn. 6.7, str. 77), tvoří každých k lineárně nezávislých prvků bázi. 2) Myšlenka důkazu tohoto tvrzení je velmi jednoduchá: Jc-Ji // separabilní, existuje v něm nejyýĚe spočetná množina, hustá v H. Tuto množinu uspořádáme v posloupnost a vyškrtáme •v ní členv. které isou lineární kombinací předcházejících členů. Věta 6.12. V každém separabilním Hilbertově prostoru existuje ortonormální báze.1) Snadno se ukáže (vyplývá to téměř přímo z definice hustoty), že najdeme-li v prostoru S2 (nejvýše spočetnou) bázi, je prostor S2 separabilní. c) Ortogonální podprostory. Některé vlastnosti skalárního součinu Definice 6.23. Uvažujme lineál/Vněkterých prvků Hilbertova prostoru II. Zavedeme-li na tomto lineálu stejnou metriku jako v H, stane se N metrickým prostorem. Je-li N úplný prostor, nazýváme jej (lineárním) podprostorem prostoru H. Analogií věty 5.10, str. 64, je tato věta: Věta 6.13. Prostor N je lineárním podprostorem prostoru II právě tehdy, je-li množina N uzavřená v H. Definice 6.24. Říkáme, že prvek u e H je ortogonální k podprostoru N Hilbertova prostoru II, a píšeme Kl.V, je-li ortogonální ke všem prvkům tohoto podprostoru. Věta 6.14. Nechť N je lineární podprostor Hilbertova prostoru 11. Pak každý prvek u e II lze, a to jednoznačně, rozložit v součet (6.38) u = v + w, kde veN a w ± N. Prvek v nazýváme ortogonální projekcí prvku u do podprostoru N. Viz také příkl. 5.9, str. 64. Poznámka 6.10. Lze ukázat, že množina všech prvků w e H, ortogonálních k lineárnímu podprostoru N Hilbertova prostoru, je opět lineární podprostor. Označme jej f£. O podprostoru Kříkáme, že je ortogonální k podprostoru /v, a píšeme K 1 M Výsledek věty 6.14 pak stručně charakterizujeme zápisem (6.39) ,JE = N ®K a říkáme, že daný Hilbertův prostor jc ortogonálním součtem podprostoru JV a K. i) Plati dokonce, jak lze očekávat, ještě více (viz např. [27], [28], [30]): Je-JÍ M hustá množina v separabilním Hilbertově prostoru //, lze bázi (resp. ortonormální bázi) v H zkonstruovat z prvků této množiny. 82 I, HILBERTŮV PROSTOU Prostor K nazýváme ortogonálním doplňkem podprostoru N v prostoru II. Píšeme (6.40) K = H 0 JV . Je-li N — H (tento případ není v def. 6.23 vyloučen), pak K obsahuje jen jediný prvek, a to nulový prvek prostoru H. Uvedeme ještě analogie vět 5.12 až 5.14 z kap. 5. V jejich formulaci užijeme zkráceného zápisu «„ «, v„ ->■ v, resp. a„ ■ > a, vyjadřujícího, že posloupnost {«„} konverguje v Hilbertovč prostoru H k prvku u, posloupnost {i>„} k prvku v, resp. číselná posloupnost [a„] konverguje k (reálnému) číslu a. Věta 6.15. Je-li u„ '~j w, v„ ■ > v, pak (»„, v„) (u, v). Zejména tedy, položíme-li v této větě u„ = v pro každé n, resp, v„ = u„ a v — u, dostaneme tyto důsledky věty 6.15: Věta 6.16. Je-li u„ > u, pak («„, v) -> (w, v) pro každé v c H. Věta 6.17. Je-li u„ > „, pak |h„| > [|w]|. Důležitá je i analogie věty 5.15: Věta 6.18. Je-li u s H ortogonální ke všem prvkům množiny N husté v líilhertove prostoru H, pak u je nulový prvek prostoru 11. d) Komplexní Hílbertův prostor Poznámka 6.11. V této kapitole jsme uvedli teorii tzv. reálného Hilbertova prostoru. V některých případech je užitečné uvažovat Hilbertův prostor s „komplexními" prvky, které tvoří lineál M nad tělesem komplexních čísel, kde tedy v (6.1) (viz pozn. pod čarou na str. 68) jsou at, a„ čísla komplexní. Typickým příkladem takových „komplexních" prvků jsou komplexní funkce reálné proměnné, tj. funkce tvaru (6.41) u(x) = »i(x) + i u2(x) , kde u,(x) a u2{x] jsou reálné funkce v některé oblasti O a i je imaginární jednotka. Zde vznikají některé obtíže. Máme-Ii zkonstruovat metrický prostor, jehož metrika je indukována skalárním součinem [viz (6.12), (6.13)], je třeba, aby číslo (w, u) bylo nezáporné. Proto je předně třeba na lineál u M definovat skalární součin vhodným způsobem. Kdybychom např. pro funkce (6.41) definovali skalární součin stejně, jako jsme to učinili dříve, tj. předpisem (M j" u(x) v(x) áx 6. HILBERTŮV PROSTOR [kde v(x) = «i(x) + i c2(x)], nebylo by Číslo 83 (w, «) j u2(x) áx v obecném případě nezáporné (nebylo by v obecném případě ani reálné). Definujcme-li však (6.42) kde («, v) = j* u(x) v(x) ůx , v[x) — v^x) — i t!2(x) je funkce komplexně sdružená k funkci u(x), je u(x) w(.v) = uj(x) + u|(.x) a číslo («> ") = [uí(x) + ul(x)] dx je nezáporné. Čtenář ihned namítne, že pak nebude splněn axióm (6.3), ("■ ») - ("> «) . nebof podle (6.42) je (v, u) = v{x) u(x) dx = «(x) v(x) dx = (u, v), J a Jo kde jako obvykle pruhem označujeme hodnoty komplexně sdružené. Lze ukázat, že všechny obtíže s tím spojené, lze jednoduchým způsobem odstranit, žádáme-Ii, aby skalární součin (u, v) na lineálu M [v obecném případě s komplexními koeficienty v (6.1)] byl definován jako číslo (v obecném případě komplexní), splňující požadavky (axiómy) (6.43) (6.44) (6.45) (6.46) («, ;•) = (v, u), (»!«! + a2u2, v) = ai(uu v) + a2(u7, v). (u, u) £ 0 , («,») = 0 o u = 0 v M . První z těchto axiómů je tedy odlišný od axiómů reálného Hilbertova prostoru. S tím souvisí i některé změny v algebře skalárního součinu, nebof z (6.43) a (6.44) např. plyne (6.47) (uy av) = (dVy u) = a(v, u) — a(v, u) = a(ut v) 84 I. HILBERTŮV PROSTOR Vzoiec pro skalární násobení z pozn. 6.3 je pak třeba nahradit vzorcem (alul + a2u2, a2u3 + u = v v M , fí(u, v) = q(v, u) , q{u, z) g ;.)(«, v) + q(v, z) . Definice 7.2. Říkáme, že posloupnost prvků u„ metrického prostoru P konverguje v tomto prostoru k prvku u c P, jestliže (7.5) lim g(n„, u) = 0 . Píšeme (7.6) lim u„ = ti v P a prvek « nazýváme limitou nebo limitním prvkem posloupnosti {«„} v prostoru P, Věta 7.1. Posloupnost {«„} múze mít v metrickém prostoru P nejvýše jednu limitu. Definice 7.3. Posloupnost prvků un metrického prostoru P se nazývá cauchyovská (fundamentální) v tomto prostoru, platí-li lim q(u„„ u„) ~ 0 ; m-* cťj r, ' i podrobně: lze-li ke každému e > 0 najít číslo n0 tak, že je-li zároveň m > n0, n > n0, platí q(um, u„) < k . Věta 7,2. Každá posloupnost {«„}, která konverguje v metrickém prostoru P k některému prvku u e P, je v tomto prostoru cauchyovská. Jak jsme viděli v předcházejících kapitolách, ne každá cauchyovská posloupnost je v obecném metrickém prostoru P konvergentní. 86 I. HILBERTŮY PROSTOR Definice 7.4« Metrický prostor P se nazývá úplný, jestliže každá posloupnost {«„}, ca uch y o vská v prostoru P, konverguje v tomto prostoru k některému prvku u g P. Poznámka 7.1. K metrickému prostoru, který není úplný, lze zkonstruovat úpíný prostor, tzv. úplný obal daného prostoru, přidáním tzv. ideálních elementů. Pro speciální případ viz poměrně jednoduchou konstrukci v kap. 10. Definice 7.5. Buď ó > 0. 5-okolím (5-sférou) prvku u v metrickém prostoru P rozumíme množinu všech prvků v e P, pro něž platí (7.7) q[u, v) < ô . Definice 7.6. Nechť JV je některá množina prvků metrického prostoru P. Říkáme, že prvek u e P je hromadným bodem množiny N v tomto prostoru, jestliže v každém libovolně malém <5-okolí prvku u leží nekonečně mnoho prvků z množiny JV. Hromadný bod množiny JV v prostoru P může, ale nemusí patřit do JV. Věta 7.3, Prvek u metrického prostoru P je hromadným bodem množiny JV v tomto prostoru právě tehdy, existvje-li posloupnost prvků un e N,un ŕ u, která konverguje v P k prvku u. Definice 7.7. Množina N, která je sjednocením pryků množiny JV a všech jejích hromadných bodů v prostoru P, se nazývá uzávěr množiny N v tomto prostoru. Je-li N — JV (tj. patří-Ii každý hromadný bod množiny JV do této množiny), řekneme, že množina N je v prostoru P uzavřená. Věta 7.4. Nechť P je úplný metrický prostor. Množina N <= P s metrikou prostoru P je sama úplným metrickým prostorem právě tehdy, je-li v prostoru P uzavřená. Srov. také větu 6.13, str. 81. Definice 7.8. Množina JV se nazývá hustá v metrickém prostoru P, platí-li JV = P, tj. je-li každý prvek prostoru P hromadným bodem množiny JV v tomto prostoru. Poznámka 7.2. Z této definice a z definice hromadného bodu plyne: Množina N je hustá v P právě tehdy, lze-li každý prvek mg P s libovolnou přesností aproximovat prvky z množiny JV, tj. lze-li ke každému prvku u e P a ke každému e > 0 najít prvek v e N tak, že q{u, v) < s. Z def. 7.8 a z věty 7.3 dále plyne: Veťa 7.5. Množina N je hustá v metrickém prostoru P právě tehdy, jestliže ke každému prvku u e P existuje posloupnost {un} prvků množiny JV, která konverguje v prostoru P k prvku u. 7. normovaný prostor, banachův PROSTOR O / Definice 7.9. Metrický prostor P se nazývá separabilní, existuje-li v něm nejvýše spočetná1) množina JV, hustá v tomto prostoru. V závěru této kapitoly uvedeme ještě tuto definici: Definice 7.10. Nechť M je lineál. Přiřaďme každému prvku m e M reálné číslo ||«|], tzv. normu prvku u, mající tyto vlastnosti (tj. splňující následující tzv. axiómy normy): (7.8) |u]| ä 0 , (7.9) fff = 0o» = 0vM, 2) (7.10) |), která je spojitá v uzavřené oblasti G, splňuje v (otevřené) oblasti G rovnici (8.2) a je rovna nule na hranici ľ. Vzhledem k tomu, že funkce f{x, ý) je podle předpokladu spojitá v G, je přirozené2) hledat řešení problému (8.2), (8.3) mezi funkcemi, které patří do cizj((j) (tj. jsou spojité v Gis parciálními derivacemi do druhého řádu včetně, viz str. 15) a na T jsou rovny nule. Množina těchto funkcí tvoří (při obvyklé definici součtu dvou funkcí a násobení funkce konstantou) Iincál — označme jej Vf, - . nebof jsou-li ui; u2 dvě libovolné funkce z M1 a au a2 libovolná (reálná) čísla, je funkce aiu1 + a2u2 rovněž z C(2'(G) a splňuje podmínku u — 0 na ľ, patří tedy také do ML. Danou úlohu pak formulujeme takto: Máme najít takovou funkci u z hneálu m,, která splňuje rovnici Au =/. ') Podle toho, co jsme řekli v kap. 2, rozumíme v této knize oblasti omezenou oblast s hranicí, popsanou v kap. 2 a přesně charakterizovanou v kap. 28 (oblast s tzv. lipschitzovskou hranicí). 2) O těchto otázkách budeme podrobně mluvit v dalších kapitolách. 90 I. hilbertúv prostor Nebo ještě stručněji: Máme řešit rovnici (8.4) Au -/ na lineálu M1. V souvislosti s tím mluvíme o Iineálu Aí\ jako o oboru, na němž operátor A uvažujeme, stručně jako o definičním oboru daného operátoru. Na prvky tohoto oboru pak aplikujeme operaci Au &u éru dx2 dy1 která každé funkci u e Mí přiřazuje funkci (8.5) « = Au, spojitou v G. Množina všech funkcí v, kterou dostaneme podle (8.5) pro všechny funkce u eMu tvoří zřejmě opět lineál, označme jej N. Lincál N nazveme oborem hodnot daného operátoru. Poznámka 8.1. Je-li definiční obor daného diferenciálního operátoru již specifikován, stačí daný problém s okrajovými podmínkami zapsat jedinou rovnicí Au «/, v našem příkladě rovnicí (8.4). Tento zápis zahrnuje i okrajové podmínky, které jsou právě zachyceny vhodnou volbou definičního oboru daného operátoru. V našem příkladě, kdy šlo o řešení rovnice (8.2) s okrajovou podmínkou (8.3), jsme za definiční obor operátoru A zvolili lineál Aí\. Funkce z tohoto lineálu jsou rovny nule na hranici ľ, a tedy již splňují okrajovou podmínku (8.3). Po tomto stručném úvodu přikročíme k obecné definici operátoru. a) Operátory v Hilbertově prostoro Definice 8.1. Nechť jsou dány dvě množiny Ml a M2. Říkáme, že na množině Mj je definován operátor A, zobrazující množinu Mt do množiny M2, je-li dán předpis, podle kterého je každému prvku u e Mí jednoznačně přiřazen určitý prvek v e M2. Píšeme v — Au .*) Množině M1 říkáme definiční obor operátoru A. Množinu JV všech v e M2, kterou dostaneme podle (8.6) pro všechna ueMx, nazýváme oborem hodnot operátoru A. Označujeme ji RA. x) V právě definovaném smyslu se často mluví také o zobrazení množiny M1 do množiny M2. 8. oper á to k v v hilbertově prostoru 91 Definice 8.2. Je-li RA = M2, říkáme, že operátor A zobrazuje množinu M1 na množinu M2. Zobrazení množiny Mi na množinu M2 (kdy tedy je RÁ = M2) je zřejmě speciálním případem zobrazení množiny M1 do množiny M2 (kdy žádáme, jen aby bylo RA c: Aí2). Definici 8.2 je zřejmě možno vyslovit v této ekvivalentní formě; Definice 8,3. Řekneme, že operátor A zobrazuje množinu M, na množinu M2, jestliže ji zobrazuje do množiny M2 a jestliže ke každému prvku v e M2 existuje aspoň jeden prvek ueM, takový, že Au = v. Protože jedním z hlavních úkolů této knihy je seznámit čtenáře s použitím variačních metod k řešení diferenciálních rovnic s okrajovými podmínkami, budou středem naší pozornosti diferenciální operátory. Klasickým příkladem operátoru, který není diferenciální, je čtvercová matice A n-tého stupně, která podle předpisu v = Au přiřazuje každému vektoru z lineálu V všech n-rozměrných vektorů vektor z téhož lineálu. [Přitom Au je obvyklý součin matic, viz např, [35], str. 76, uvažu-jeme-Ii vektor u jako matici typu (n, 1).] Je-li matice A regulární, je vztahem v ~ Au dáno zobrazení lineálu V na lineál V. Ke každé regulární matici A existuje totiž inverzní matice A~l (viz např. větu 6 v [35], str. 77), takže ke každému v e F existuje u e V (jc u - A~1v) tak, že Au = v. Příklad 8.2. Definičním oborem operátoru A z příkl. 8.1 je lineál Mt funkcí, patřících do C<2)(G) a rovných nule na ľ. Operátor A zobrazuje lineál Mt do lineálu M 2 funkcí spojitých v G, neboť je-li u e Mt, je d2u d2u v = Au =--1-- dx2 dy2 funkce spojitá v G. Na tomto místě nedovedeme rozhodnout, jde-li zároveň o zobrazení na lineál Ar-,, neboť zatím nevíme, zda ke každé spojité funkci v e M2 lze najít 92 I. HUBERTŮV PROSTOR 8. operátory v hilbehtově prostoru funkci u e Mj takovou, že Aw = v. [Čtenář si snadno rozmyslí, že tato otázka je ekvivalentní otázce, má-li Dirichletúv problém (8.2), (8.3) řešení u e Aí, pro každou spojitou pravou stranu /e M2.] Definice 8.4. O dvou operátorech A, B řekneme, že jsou si rovny, píšeme A — B, je-li jejich definičním oborem táž množina M a je-li zároveň Au = Bu pro každé K této definicí poznamenejme toto: Za definiční obor Laplaceova operátoru z příkl. 8.1 jsme zvolili lineál M£ funkcí patřících do C(2,(G) a rovných nule na hranici ľ. Takový definiční obor bylo vhodné zvolit k účelu, který jsme sledovali, tj. k hledání řešení uvažovaného Dirichletova problému (8.2), (8.3). Pokud jde o samotný operátor, má smysl definovat jej i na jiných množinách. Zvolme např. za jeho definiční obor lineál A", funkcí, které patří rovněž do C(2,(G), které však nemusí nutně splňovat podmínku u = 0 na ľ. Zřejmě každá funkce u e M1 patří také do A*,, avšak každá funkce u e A^ nemusí patřit do Mneboť nemusí být rovna nule na ľ (např. nenulová funkce konstantní v G). Lineál 7V"j je tedy širší než lineál Mu tj. M, c At a přitom M1 4 AV Označme A operátor A s definičním oborem Mu B operátor A s definičním oborem Nx. Podle def. 8.4 je A 4 B, neboť uvedené definiční obory jsou různé. Později, až se budeme zabývat pojmy symetrie, pozitivnosti atd., uvidíme, že uvedené operátory A, B maji skutečně podstatně různé vlastnosti. Poznamenali jsme již, že pro právě uvažovaný případ definičních oborů Mu resp. N}, operátorů A, resp. B, platí Ml c: .\r,, přičemž tato inkluze je ostrá, tj. Mí 4 A i. Zároveň pro každé « e Mj je Au = Bu ( — Au) . V takovém případě řekneme, žc operátor B jc rozšířením operátoru A. Uvedeme definici pro obecný případ. V této definici použijeme označení DA, resp. D„ pro definiční obor operátoru A, resp. B, které je v literatuře obvyklé a kterého budeme běžně používat v dalším textu. Definice 8.5. Mějme operátory A, resp. B s definičními obory DA, resp. DB. Je-li DÁ c D„ (DA 4 Djj) a platí-li zároveň Au = Bu pro každé u e DA, řekneme, že operátor B je rozšířením operátoru A. V souvislosti s touto problematikou poznamenejme na tomto místě ještě toto: Podle def. 8.1 je operátor dán jednak svým definičním oborem, který jsme v citované definici označili Mlt jednak operací v = Au, kterou je dáno zobrazení množiny Mj ') Rovností Au -~ Bu rozumíme ovšem rovnost prvků Au a Bu v množině M2, do níž operátory A, B zobrazují množinu M. Je-li např. M2 = L2(C), mohou se funkce Au a Bu lišit v C na množině míry nula. do množiny Aí2. Je-li z textu jasné, o jaký definiční obor operátoru A jde, vyjadřujeme se často stručněji, i když nepřesně. Např. mluvíme o operátoru A, místo abychom mluvili o operátoru A, jehož definičním oborem je uvažovaná množina funkcí a který je dán na této množině předpisem v = Aw.-Tohoto stručného způsobu vyjadřování budeme často používat, pokud ovšem bude z předcházejícího textu jasné, jaký definiční obor máme na mysli, aby nemohlo dojít k nedorozumění. V def. 8.4 jsme definovali rovnost dvou operátorů, a to způsobem velmi podobným tomu, jak se zavádí rovnost dvou funkcí v klasické analýze. Obdobně zavádíme i součet dvou operátorů. Určitou modifikaci potřebuje definice součinu: Definice 8.Ä. Součet A + B a součin AB operátorů A, B s definičními obory DA, resp. DB, je definován vztahy (8.7) (8.8) (A + B)u = Au + Bu , (AB)u = A(Bu) . Přitom operátor A + B je definován na průniku oborů DÁ a DB, operátor AB na množině DAB těch prvků u e DB, pro které je Bu e DA. Požadavky kladené na definiční obory operátorů A + B a AB jsou zcela přirozené: V případě operátoru A + B je definičním oborem průnik definičních oborů DA a Dn obou operátorů, tedy množina prvků patřících jak do DÁ, tak do DB, neboť potřebujeme, aby měly smysl obě operace Au a Bu na pravé straně rovnosti (8.7). V případě součinu AB jc definičním oborem DAB množina těch u e DB, pro které Bu leží v definičním oboru DA operátoru A, neboť podle předpisu (8.8) je třeba na prvek Bu aplikovat právě operátor A. Poznámka 8.2. V obecném případě je BA 4= AB, jak vyplývá již z toho, co bylo řečeno o definičním oboru součinu dvou operátorů. Ale ani když je DBA — DAB, nemusí platit BA = AB, jak je vidět z tohoto příkladu: Nechť V je lineál všech dvojrozměrných vektorů (srov. str. 68) a nechť A = e -0' B 1, t, jsou matice zobrazující Fdo V, Zřejmě je DA — V, DB = Ka také DAB = V, DBA Přitom (srov. např. | 35], str. 76) AB = BA (i-;)(■!: :)t; í> 94 I. hilbert&v prostor 8. OPERÁTORY V HILBERTOVŽ PROSTORU 95 takže AB 4= BA. (Napf. pro vektor je ABu == M"1í-2°)0)=O).) Operátory A, B, pro které platí BA = AB, se nazývají komutativní. Definice 8.7. Operátor A se nazývá prostý na svém definičním oboru DA, jestliže pro každé dva prvky Uj^ 4= u2 z ií^ je (8.9) * Au2 . Srov. ovšem poznámku pod čarou na str. 92. Poznámka 8.3. Uvažujme operátor A, zobrazující množinu Mt na množinu M2 a přitom prostý na množině M,. Z definice zobrazení množiny Mx na množinu M2 (viz def. 8.3) plyne, že každému prvku vsM2 odpovídá aspoň jeden prvek ueMx takový, že Au = v. Z předpokladu, že operátor A je na množině Aít prostý, plyne, že každému » e M2 odpovídá dokonce právě jeden prvek u e Mx takový, že Au = w. Neboť kdyby mu odpovídaly dva různé prvky*) uu u2, platilo by v = Aux = Au2 ve sporu s předpokladem (8.9). Tato vlastnost prostého zobrazení na množinu vede k této důležité definici: Definice 8.8. Nechť operátor A zobrazuje množinu Mx na množinu M2 a nechť je prostý. Operátor B, který přiřazuje každému prvku u e Aí2 právě ten prvek u e Af 1( pro který piati v = Au, se nazývá operátor inverzní k operátoru A. Označení A"1. Z definice zřejmě plyne, že pro všechna u e A/t a pro všechna v e M2 platí (8.10) A^Uu = u, AA~lv = v. Příklad 8.3. Uvažujme operátor A z příkl. 8.1, tj. operátor A s definičním oborem My, jehož prvky tvoří funkce z C(2)(G) rovné nule na T. Jako v citovaném přiklade označme obor hodnot operátoru A symbolem /V. Přímo z definice oboru hodnot ') Nebo více takových prvků. operátoru A plyne, že operátor A zobrazuje lineál na Iineäl JV. Tvrdíme, že toto zobrazení je prosté. Tato okolnost vyplývá z věty o jednoznačnosti řešení Dírichletova problému (8.2), (8.3) (viz [35], str. 733).1) Kdyby totiž k některému veN existovaly dva různé prvky út, u2 z JVÍ, tak, že by platilo .4«! = v, Au2 = v, měl by Dirichletův problém (8.11) Au = v , u = 0 na T dvě různá řešení u„ u2 /. M,, \e sporu s citovanou větou. Uvažovaný operátor je tedy prostý. Podle pozn. 8.3 odpovídá tedy každému d g JV právě jedno u e Mt tak, že Au — v. Existuje tedy inverzní operátor A'1, přiřazující každému veN příslušné řešení u Dírichletova problému (8.11). Jak jsme se již zmínili v příkl. 8.2, nemáme na tomto místě možnost rozhodnout, patří-li do TV všechny funkce, spojité v uzavřené oblasti S, tj. má-li Dirichletův problém (8.11) řešení u e M pro každou pravou stranu v, spojitou v G. Definice 8.9. Operátor A se nazývá lineární, je-li jeho definičním oborem DA lineál a platHi pro libovolné prvky ul,...,u„ z DA a pro libovolná (reálná) Čísla a1,...,a„ (8.12) A(aiu1 + ... + a„u„) = a1Aul + ... 4- anÁun. Definici 8.9 lze vyslovit v této zřejmě ekvivalentní formě:. Definice 8.10. Operátor A se nazývá lineární, je-li jeho definičním oborem DA lineál a platí-li (8.13) 1. A(au) - a Au pro každé u e DA a pro každé (reálné) číslo a , (8.14) 2. A(uy + ti;) = Aux + Au2 pro všechna u1eDÁ,u2eDA. Neboť zřejmě z (8.12) plynou (8.13) a (8.14) jako speciální případy. Naopak, platí-li (8.13) a (8.14), je pro každé ux e DA, u2 e DA a pro libovolná reálná čísla A(a1u1 + a2u2) — A(a1uí) + A(a2u2) = axAux + a2Au2 , odkud ihned (důkaz např. indukcí) plyne (8.12). Příkladem lineárního operátoru je operátor A, daný na lineálu Cm(a, b) (viz str. 15) předpisem Později (viz vítu 9.), str. 120) dokážeme jednoznačnost řešení jiným způsobem, neopírají-cím se o věty klasické teorie parciálních diferenciálních rovnic. 96 i. hilbertův prostor neboť předně množina Ca\a, b) je zřejmě lineál, a za druhé ze známých pravidel o derivování plyne , < d(au) du A[au) = -—'- — a — = a Au , áx dx A(u, + u2) = -H - —i + —2= AuL + Au2 . dx dx dx Lineární operátory mají, jak uvidíme, velmi důležitý význam v aplikacích. Poznámka 8.4. Na základě vlastností (8.13), (8.14) lineárního operátoru A lze snadno ukázat, že obor RA jeho hodnot je opět lineál. Mimoto je zřejmé [staěí v (8.13) psát a = 0], že nulovému prvku lineálu DA odpovídá nulový prvek lineálu RA, tj. že AQ = 0 v RÁ. Existuje-li dále k lineárnímu operátoru A inverzní operátor A'1 (definovaný na lineálu RA), pak A-1 je v RA také lineární operátor. Nechť totiž a je libovolné reálné číslo a„ncchr vu v2 jsou libovolné prvky z RA. Máme ukázat, že platí v4_1(ai>i) = aA~1v1, A~1(vl + v2) = A~1vl + A~lv2. Jak plyne z definice inverzního operátoru, je A~1ví w uí, A~lv2 = u2 , kde ult u2 jsou prvky z DA, jednoznačně určené danými prvky vu v2 e RA takové, že Aut = i>j , Au2 = v2 . Ale A je lineární operátor, takže A(aut) = aAu, — aví , A(ul + u2) = Aul + Auz = vx + v2 . Odtud a z (8.10) plyne A~l(aVi) = A~l A(au^) — auy = aA~lv^ , vl-1^, + v2) = <4~* /!(«! + «2) = = Ii[ + «2 = Zl"1^! + A~lV2 , čímž je lineárnost operátoru A'1 na lineálu RA dokázána. Z lineárnosti operátoru já^mimo jiné plyne: Existuje-li k lineárnímu operátoru inverzní operátor A'1, pak nulovému prvku lineálu RA odpovídá nulový prvek lineálu DA, tj. platí A~10 = 0 v DA. Často je užitečná tato věta: Věta 8.1. Nechť operátor A je lineární v lineálu DA a nechť RA je obor jeho hodnot. Pak k operátoru A existuje inverzní operátor A~l právě tehdy, jestliže platí (8.15) Au = 0 v RA => u - 0 v DA. 8. operátory v hilbertově prostoru " / Důkaz: 1. Nechť k operátoru A existuje inverzní operátor A~*, jehož definičním oborem je tedy lineál RA. Nechť u je nějaký prvek lineálu DA, pro který platí (8.16) Au = 0 v RA. Z (8.16) plyne A'1 Au = 4"'0 = 0v DA (srov. předcházející poznámku), odkud podle (8.10) je u - 0 v DA. 2. Nechť naopak platí (8.15). Máme dokázat, že k operátoru A existuje v RA inverzní operátor A'1. K tomu účelu stačí dokázat, že zobrazení lineálu DA na lineál RA je prosté, tj. že platí "1 é «2 Auí 4= Au2 . Kdyby však prou! 4= u2 bylo Aut — Au2, bylo by, jak plyne z lineárnosti operátoru A A{t*i — u2) — 0 a u, — u2 + 0, což je ve sporu s (8.15). Tím je věta 8.1 dokázána. Tedy požadavek, aby zobrazení lineálu DA na lineál RA bylo prosté, což je postačující podmínka k existenci inverzního operátoru, stačí v případě lineárního operátoru „nahradit" požadavkem (8.15). Tato skutečnost často značně zjednodušuje některé úvahy. V dalším textu se budeme zabývat především lineárními operátory, zejména v Hilbertově prostoru. S těmito operátory se totiž v naší knize nejčastěji setkáme. Ukažme však aspoň jeden příklad operátoru, důležitého zejména v problematice numerických metod, který v obecném případě není lineární: Nechť P je metrický prostor s metrikou q. Operátor A, zobrazující prvky tohoto prostoru opět do prostoru P (tj. zobrazující množinu prvků prostoru P do téže množiny) se nazývá kontraktivní (kontrahující) v tomto prostoru, existuje-li takové číslo a, 0 < a < 1, že pro každou dvojici prvků x, y e P platí q(Ax, Ay) á a q{x, y) . Kontraktivní operátor tedy „zkracuje vzdálenost", odtud jeho jméno: Vzdálenost obTazů Ax, Ay je menší, a to dokonce nejvýše a-krát větší, než vzdálenost vzorů x, y. Pro kontraktivní operátory platí následující věta, kterou uvedeme bez důkazu, neboť ji v naší knize nikde nepoužijeme. Důkaz najde čtenář např. v [26], str. 47. Věta 8.2. [Banachova věta o pevném bodě, věta o kontraktivním zobrazení.) Nechť A je kontraktivní operátor v úplném metrickém prostoru P. Pak rovnice x ~ Ax 98 T. hilbertův prostor má v prostoru P právě jedno řešení, tj. existuje právě jeden prvek ue P, pro který platí u — Au. Tento prvek je možno získat jako limitu posloupnosti prvků x„ e P, u — lim x„ , n-* oo kde x„+i - Ax„, n - 1, 2, ..., přičemž prvek xte P lze zvolit libovolně. Za předpokladu, že operátor A je v P kontraktiviií, plyne tedy ž věty 8.2 předně existence a jednoznačnost řešení rovnice x — Ax. Věta 8.2 však dává zároveň návod, jak získat řešení této rovnice iteračním postupem, tj. jako limitu „postupných aproximací" x„. To je důležité v numerických metodách v nejrozmanitějších matematických disciplínách. Jednu z nejjednodušších aplikací má Banachova věta v lineární algebře, při řešení soustav lineárních rovnic tvaru x = Bx + C s „malou" matici B. Pak je totiž operátor A, daný vztahem Ax — Bx + C, kontraktivní na množině uvažovaných n-rozměrných vektorů, na níž je zavedena některým z běžných způsobů metrika (pro kontraktivnost operátoru A stačí, splňuje-li příslušná norma matice B vztah |]B[| < 1) a je možno použít zmíněné iterační metody, která je v tomto případě známá jako Ritzova (prostá) iterace. Viz např. [35], str. 947. Viz také příklad aplikace věty 8.2 k řešení nelineárních integrálních rovnic v [35], str. 830, 831. Viz také [9]. V dalších kapitolách se budeme setkávat nejčastěji s operátory v některém Hilber-tově prostoru H. Půjde o operátory A, B,. ...jejichž definičními obory budou některé podmnožiny prostoru H (ve speciálním případě celý prostor H) a které zobrazují tyto podmnožiny do téhož Hilbertova prostoru. Definiční obory těchto operátorů budeme značit, jak jsme se již zmínili, symboly DA, DB,..., obory hodnot těchto operátorů symboly RA, RB,.... Protože jde o zobrazení množin DA> DB,... do prostoru H, leží množiny RA, RB,... v H. Poznamenejme přitom, že mnohé z definic i vět, které v této kapitole vyslovíme pro tento speciální případ, lze přenést na případy obecnější, např. na případ, kdy uvažovaný operátor zobrazuje určitý metrický (popř. normovaný) prostor do jiného metrického (resp. normovaného) prostoru, apod. V dalším textu této kapitoly půjde tedy o určitý pevně daný Hilbertův prostor H a o vyšetřování operátorů A,B,... s definičními obory DA, Ds,..., ležícími v H, a s obory hodnot RA, RB,..., ležícími v témž prostoru H. Stručně budeme mluvit o operátorech v Hubertově prostoru. 8. OPERÁTORY V HILBERTOVÍ řHOSTORU Připomeňme, že norma v Hilbertově prostoru H je dána vztahem H = V(".«) a metrika vztahem ) = || u — u I . Zavedením metriky je, jak víme, dána i konvergence v tomto prostoru a symbol lim un — u v H n-*ay znamená totéž jako lim q(u„, u) = 0 , tj. totéž jako lim ||u„ — u || = 0 . M * DO. Rovnicí u = 0 v H zapisujeme, že u je nulovým prvkem prostoru H. Definice 8.11. Operátor / se nazývá jednotkový operátor, přiřazuje-li každému prvku u e Dj opět tentýž prvek u. Operátor O nazveme nulovým operátorem, přiřazuje-li každému u e D0 nulový prvek prostoru H. Jednotkový operátor je tedy charakterizován vztahem Ju — u pro všechna u e D,, nulový operátor vztahem Ou = 0 v H pro všechna u g Dq . Definice 8.12. Operátor A se nazývá spojitý v bodě u0 e DA, jestliže pro každou posloupnost prvků u„ 6 DA, pro kterou je lim u„ = u0 v H, li — 'I: platí lim Au„ = Au0 v H n-* oo (tj. lim \\Au„ — j4ii0|| = 0). Je-li operátor A spojitý v každém bodě svého definičního n • co oboru DA, řekneme, že je spojitý v DA. Triviálním příkladem spojitého operátoru je jednotkový operátor v H (viz def. 8.11), neboť v tomto případě ze vztahu lim u„ = u0 v H 100 I. HILBERTŮY PROSTOR 8, OPERÁTORY v HILBERTOVĚ PROSTORU 101 plyne lira Iun — lim u„ = m0 = /w0 v H . Jednoduché kritérium pro spojitost lineárních operátorů uvedeme ve větě 8.3. Definice 8.13. Operátor A se nazývá omezený (ohraničený) ve svém definičním oboru DA, lze-li najít takové číslo K ž 0, že pro všechna ue DA platí (8.17) f-4« || g Jí || w |] . Nejmenší1) z čísel 1ČT, pro něž jc splněn vztah (8.17), nazýváme normou operátoru A. Označeni ||A||. Zřejmě platí pLwjj á |4| ||«J pro každé w e DA . Příklad 8.4. Nechť K(s, x) je (reálná) funkce integrovatclná s druhou mocninou ve Čtverci g (0 á x S 1, 0 ^ s í l). Označme Jo Jo K2(s, x) ds djc = C2 (C > 0) . Uvažujme v HUbertovč prostoru L2(0, 1) operátor A, daný předpisem (8.18) Au = í)(s) - J JC(s, x) m(x) áx . Z teorie Lebesgueova integrálu je známo, že za učiněných předpokladů [JC e L2(0, « e I»2(0, l)] je predne funkce K($, x) pro skoro všechna s e <0,1) integrovatelná s druhou mocninou jako funkce proměnné x [takže integrál (8.18) existuje v intervalu <0, 1) pro proměnnou s skoro všude] a za druhé, že v(s) e L2(0, l). Dále pro každé .5, pro které je K(s, x) e L2(0, 1), platí podle Schwarzovy nerovnosti (str. 38) v*(s) - ([k{s, x) u(x) dxJ á | K2(s, x) áx . J1"2^) dx . Odtud plyne f v2(s) ds < T í\ K2(s, x) dx . u2(x) dx\ d J o J o \ j o Jo / K2(s, x) áx ds . u2(x) dx l) Lze dokázat, že toto nejmenší číslo skuteční existuje. čili tj- HLco,.>šc2H|21<0il), M«k(o,i> s G[|«| Ll(O.l) Operátor (8.18) je tedy v Hilbertově prostom L2(0, 1) omezený. Protože v (8.17) můžeme za konstantu K vzít číslo C, plyne pro normu ||/í|| operátoru A odhad 114 á c. Příklad 8.5. Uvažujme v Hilbertově prostoru L2(0, l) lineál DA = C(1>(0, l) (str. 15) a definujme na tomto lineálu operátor A vztahem Au = du dx Tento operátor není na lineálu DA omezený. Abychom toto tvrzení dokázali, stačí dokázat, že neexistuje konstanta K taková, že platí (8.19) i-HUtcM) á XJl"lk«M) pro všechna ueDA. Předpokládejme naopak, že taková konstanta K existuje a dojdeme ke sporu. Uvažujme funkci (8.20) v(x) — sin nnx (n přirozené). Zřejmě je d e DA. Dále je Av = nn cos rrnx . Podle definice normy je dále 1 ■ , . H sin mix dx = 2 Av] Tl(O.l) 2 cos2 mix dx ~ nn Zvolíme-li tedy funkci (8.20) takovou, že nn > K, dostaneme spor s předpokladem, že (8.19) platí pro každou funkci z lineálu DÁ. Neomczcnost je nejen vlastností operátoru A z práve uvedeného príkladu, ale je typickou vlastností diferenciálních operátorů. Tato skutečnost způsobuje, jak známo, v teorii diferenciálních rovníc (obyčejných, zejména však paiciálních) s okrajovými podmínkami podstatné obtíže. Jak tyto obtíže překonat, poznáme v dalších kapitolách. Je-li operátor A lineární, je mezi spojitostí a ohraničeností operátoru jednoduchý vztah: 102 i. hilbertův prostor 8. operátory v hilbertově prostoru 103 Věta 8.3. Nechť A je lineárni operátor u Hubertově prostoru H, zobrazující Uneál DÁ c: II do H. Je-li operátor A omezený v DA, pak je v DA i spojitý. Důkaz: Dokážeme, že A je spojitý v libovolném bodě w0 svého definičního oboru DA, čímž bude důkaz proveden. Podle def. 8.12 máme dokázat, že pro libovolnou posloupnost prvků un e DA, konvergující v H k prvku h0 e DA, je lim Au„ = Au0 , IT-*<0 čili, což je totéž, že je (8.21) lim \[Au„ - Au0\\ = 0. Ale operátor A je podle předpokladu lineární, takže (8.22) Au„ - Au0 = A(u,: - u„) , a je dále omezený, tedy (viz str. 100) (8.23) \\A(u„ - «0)|] ú \\A\\ . K - Mol , kde \A\ je norma uvažovaného operátoru (viz def. 8.13). Protože posloupnost {u„} konverguje podle předpokladu k prvku «0, tj. platí lim !«„ - «o|| ~ °> «-»00 plyne z (8.23) lim \\A{uB - u0)í -0, odkud podle (8.22) lim \\Aun - Au0\\ = lim |/f(u„ - u0)\\ = 0, což jsme měli dokázat. Platí i následující věta, obrácená k větě 8.3; tuto větu uvedeme bez důkazu, neboť ji nebudeme v dalším textu potřebovat: Lineární operátor A, zobrazující svůj definiční obor DA <= H do II a spojitý v DA, je v DA omezený. b) Symetrické, pozitivní a pozitivně defitutní operátory. Věty o hustotě V dalším textu budou mít důležitý význam symetrické, pozitivní a pozitivně definitní operátory. Než se seznámíme s těmito pojmy, uvedeme některé věty, které budeme jednak přímo potřebovat, jednak nám budou užitečné v dalších kapitolách. Půjde o tzv. věty o hustotě (věty 8.5 a 8.6) a o Greenovu větu pro funkce více proměnných. Připomeňme (viz str. 15), že symbolem C(C0,(G) označujeme lineál všech (reálných) funkcí, spojitých včetně derivací všech řádů v G. Symbolem Co°\G) [v literatuře se často používá i označení ®(G)] budeme značit lineál těch funkcí z C c G. Protože supp q> je podle definice uzavřená množina a leží podle předpokladu v otevřené oblasti G, má od hranice ľ této oblasti kladnou vzdálenost. Tuto okolnost jsme charakterizovali stručně tím, že jsme řekli, že funkce , takže supp u a (—3, 3). Funkce w(x) je tedy skutečně funkce s kompaktním nosičem v intervalu (—3, 3). Všimněme si nyní případu N = 1 podrobněji. Uvažujme nejprve funkci ý(g, x, í) definovanou předpisem tp(g, x,ť) = ) pro pro |x - í| < Q , *) Z angl. support. 104 I. hilbertův prostor kde q je pevně dané kladné číslo. Podobně jako v případě právě uvažované funkce «(x) se ukáže, že pro každé pevné x e (—00, + 00) má funkce ^(g, x, t) (jako funkce proměnné í) v intervalu (—00, +00) derivace všech řádů, přičemž je ^(g, x, í) 4= 0 jen v intervalu (x — q, x 4- q). (Totéž ovšem platí pro funkci ^2-^í dz = ftfe) . (Použili jsme substituce í — x = z.) Z výsledku je zrejmé, že daný integrál nezávisí na x. Funkce pro kterou na základě (8.24) zřejmě platí (8.25) 0 lze najit takové ô > 0, že platí (8.27) j^«2(x) dx < n jakmile interval 0 existuje funkce v e C^°\a, b) tak, že platí 1« - %mo < e ■ Nechť tedy funkce u e L2(a, b) a Číslo e > 0 jsou dány. Označme n = K tomuto n lze podle (8.27) najít takové 5 > 0 [5 < (b - a)/2], že platí (8.28) r+*«2(*) ix + f "*(*) dx < 2ij = - . Nechť z(x) je funkce definovaná v intervalu 0 a sestrojme k funkci z(x) funkci v(q, x), v{e, x) = z(t) tp{G, x, t) át, J — ao podobně jako jsme na sír. Í04 sestrojili funkci p.{q, x) k funkci u(x). Tato funkce má, podobně jako citovaná funkce h(q, x) z věty 8.4, pro všechna x e (- co, + w) derivace všech řádů. Protože funkce z(x) je identicky rovna uule v intervalech 0, žc Pro každé kladné q < qa platí Me.Jc) - z{x)\h^b) < Budc-li zároveň q0 < 3, bude, jak jsme se právě zmínili, funkce (8.29) v(e, x) , Q < So , funkce s kompaktním nosičem v intervalu (a, b), tj. bude (8.30) v(e, x) e <$>\a, b) . Zároveň však bude platit \\u(x) - v{o,x)\Lt(aM S \\ti(x) - z(x)j|tsM + + ||z(x) - v((2, x)||ilt,t!j, < ^ + ^ = s- Za hledanou funkcí v e C^\a, b) stačí tedy zvolit funkci (8.29). Tím je důkaz věty 8.5 proveden. Obdobným postupem lze dokázat analogickou větu pro funkce více proměnných: Věta 8.6. Nechť G je oblast s lipschitzovskou hranicí. Pak lineál C^G) všech funkcí s kompaktním nosičem v G je hustý v L2{G). 8. operátory v hílbertově prostoru 107 Poznámka 8.5. Z věty 8.5 napr. plyne, že lineál IV všech funkcí h(x), které jsou v intervalu («, i>> spojité včetně derivací prvního a druhého řádu a splňují podmínky u(a) = 0, u(b) — 0, je hustý v L2(a, b), neboť lineál JV zřejmě obsahuje všechny funkce z lineálu C^^fa, b). Lze-li tedy každou funkci f eL2(a, b) aproximovat s libovolnou přesností [v metrice prostoru L2(a, b)] funkcemi z lineálu CÓm)(a, b), lze je tím spíše aproximovat s libovolnou přesností funkcemi z lineálu JV [kterých je „více" než funkcí z lineálu C'^^a, b)\. Totéž ovšem platí i pro lineál P těch funkcí, které mají vlastnosti funkcí z lineálu N a splňují obecnější podmínky c! u'(a) + c2 u(a) — 0 , c3 «'(£) -I- c4 u(b) — 0 , kde aspoň jedno číslo v každé z dvojic (clt c2), (c3, c4) je různé od nuly [tedy např. podmínky iť'(o) - 2 u(a) = 0, u(b) = 0] . Také tento lineál obsahuje všechny funkce z lineálu C^^a, b), neboť každá z funkcí u e C^°\a, b) má v intervalu ) a přitom takových, žc platí u(x) dx = 0 , Je hustý v prostoru L2(a, b) [s metrikou prostoru L2(d, bj] těch funkcí/e L2(a, b), kloré vyhovují podmínce f (x) dx 108 I. HILBERTŮV PROSTOR Pro naše úvahy bude užitečná ještě tato věta, známá z klasické analýzy (Greenova věta nebo věta o integrováni per partes pro funkce více proměnných): Věta 8.7. Nechť G je oblast s lipschitzovskou hranicí, nechť funkce f(x) = = /(x1,..., x„) a g(x) = g{xu-••>**) >ou *Po/«"'e «W parciálních derivací ÔffÔx,, dgjdx, (i je některé z čísel 1, .. ■, N) v G ~ G + ľ. Pak piati fcrfe v,, je i-(á souřadnice jednotkového vektoru vnější normály.1) Uvedeme nyní definici symetrických, pozitivních a pozitivně definitních operátora a ukážeme typické příklady těchto operátora. Definice 8.14. Nechť DA je lineái hustý v fí}) Operátor A lineární v DA se nazývá symetrický v DA, jestliže pro každou dvojici prvků u, v z DA platí (8.32) (Au, v) = (u, Av) . Příklad 8.6. Označme DA Hneál funkcí «(x) spojitých včetně derivaci prvního a druhého řádu v uzavřeném intervalu a splňujících podmínky (8.33) «(a) = 0, u(b) = 0. Podle věty 8.5 a pozn. 8.5 je tento lineál hustý v Hilbertově prostoru L2(a, b) [v němž skalární součin je dán, jak víme, vztahem Na lineálu IU. definujme operátor A vztahem (8.34) Au = -u". Tvrdíme, že operátor A jc v DÁ symetrický. Lineárnost operátoru A je ířejmá. Dále podle def. 8.14 máme dokázat, že pro každou dvojici funkcí u(x), v(x) z DA platí (8.35) (Au, v) = (u, Av) . ') Lze ukázat, že když hranice ľ oblasti <7 je lipschiteovská, pak že vektor vníjií normály existuje na ľ skoro viíude a že integrál přes F v (8.31) existuje. Viz kap. 28. z) Proč činíme tento předpoklad vysvitne v důkazu vity 9.2 na str. 123. 8. OPERÁTORY V HILBERTOVĚ PROSTORU 109 Ale je (8.36) (Au, v) = - j" u*u dx = - [u'vf, + f u'v' áx = f u V dx , Ja Ja Ja neboť [«'(.]* = u'(b) u(b)-u'(a)v(a) = 0 podle podmínek (8.33), Opětným použitím těchto podmínek dostaneme rb rb ŕb (8.37) u'v' áx = [uu'j* - uu' dx = u(-n") áx = (u, Av) . J a J 0 Jo Z (8.36) a (8.37) plyne (8.35), což jsme měli dokázat. Přiklad 8.7, Uvažujme v Hilbertově prostoru L2(a, í>) linea! DB funkcí spojitých včetnč derivací prvního a druhého řádu v uzavřeném intervalu (x) z DB není splněna rovnost (8.39) (Bu, v) = (a, Bv). Uvažujme funkce (8.40) u(x) = x - a , v(x) = (x - a)(x - b), které zřejmě patří do Dt. Je (Bu, v)= - J u"v dx = 0 , (u, Bu) = - j 2(x - a) dx = -(f> - a)2 * 0 . Pro funkce (8.40) není tedy splněna rovnost (8.39), takže operátor B není v DB symetrický. Z prikl. 8.6 a 8.7 je dobře vidět, že dva operátory, jejichž definiční předpis je stejný [v našich příkladech šlo o předpisy (8.34) a (8.38)], mohou mít různé vlastnosti, jsou-li jejich definiční obory různé. Příklad 8.8. Uvažujme v Hilbertově prostoru L2(G) lineál DA funkcí, patřících do Cm(G), tedy spojitých s parciálními derivacemi do druhého řádu včetně v uzavřené oblasti G = G + ľ (s lipschitzovskou hranicí), a splňujících okrajovou podmínku (8.41) u = 0 na ľ. 110 I, hilbertúv prostor Podle věty 8.6 a pozn. 8.5 je líneál DA hustý v L^G). Definujme na 0A operátor A předpisem (8.42) Au = —Au , kde i je Laplaceův operátor, (Proč zde volíme znaménko minus, vysvitne v příkl, 8.10.) Dokážeme, že operátor A je v t>A symetrický. Lineárnost operátoru A je zřejmá. Vezmime dále libovolné funkce u(x), v(x) z DA. Je (8.43) U«,t>)= - f Au.vdx = - f f— I ... + ^\vdx. v J x * }c Mm m Položíme-li v (8.31)/ = du\dxl a g — v, dostaneme (8.44) - vdx^-i 0V.dS+\ ~~-dx. JGdxt Jrdxí JGSxtdXi SeČteme-li rovnosti (8,44), psané postupně pro i = 1 až i = JV, a uvážíme-lí, že 3« du du * dxs dxN dv kde Bufdv je derivace funkce u(x) podle vnější normály, dostaneme d2u + ■ 3*1 v dx (!-45» **~J$r J ľ SV i=l Jc SjCj &Cj i = l Jc S*; neboť ve DA, a. tedy v = 0 na ľ. Zcela obdobně bude (8.46) («, Av) = - í &p . « dx = f f — — dx . J c '-i Jc áx;ax( Porovnáním rovností (8.45) a (8.46) dostaneme žádaný v/tah (Au, v) = (u, Av) pro všechna u e DA, v e DÁ , čímž je naše tvrzení dokázáno. Podobně jako v příkl. 8.7 bychom zjistili, že operátor B, definovaný předpisem (8.42) na lineálu DB funkcí majících vlastnosti obdobné vlastnostem funkcí z lineálu DA, které však nejsou vázány podmínkou (8.41), není symetrický. 8. operátory v hileertově prostoru 111 Definice 8.15. Operátor A se nazývá pozitivní ve svém definičním oboru DA, je-ii symetrický1) a platí-li pro všechna u € DA (8.47) (Au, u) > 0, přičemž (8.48) (Au, u) = O=í-tí = 0víV Jestliže mimoto esistuje konstanta C > 0 taková, že pro všechna u e DA je dokonce (8.49) ' (.4«, u) £ C2j[u||2 ,. nazývá se operátor A pozitivně definitni v DA. Z def. 8.15 vyplývá, že každý pozitivně definitni operátor je pozitivní v DA. Opačné tvrzení neplatí. Z následujících příkladů bude zřejmé, že ověření podmínky (8.48) je podstatným krokem k tomu, abychom ukázali, že operátor A je v DA pozitivní. „Obrácená" vlastnost, u = 0 v DA => (Au, u) = 0, je ovšem zřejmá. Příklad 8.9. Operátor A z příkl. 8.6, str. 108, je pozitívni: V příkl. 8.6jsme dokázali, že je symetrický. Dále z rovnosti (8.36), tj. z rovnosti (8.50) nejprve plyne (8.51) (Au, v) = j" u'v' dx pro všechna ue DA,ve DA, (Au, u) = J u'1 dx g 0 pro každé ueD^, neboť w'2(jc) ^ 0 v <«, í>>. Zbývá dokázat (8.48), tj. správnost implikace (8.52) (víií, u) = 0 =*■ w(a) = 0 v > . Nechť tedy (Au, u) = 0, tj. podle (8.51) nechť (8.53) ^u'2dx = 0. ') Lze ukázat (viz [30)), ie v pfípadí kompíetnlho Hilbertova prostoru vyplývá symetričnost operátoru A přímo 7 poř.adavku (8.47). U reálního Hilbertova prostoru je třeba požadavek symetričnosti zvláäte vyslovit. 112 I- hilbertův prostor Funkce u'(x) je podle předpokladu spojitá v >, neboť u e DA; z (8.53) tedy plyne u'(x) = 0 , tj. it(x) = konst v > . Protože u e D Á, je u (a) = u (6) = 0, a tedy u(x) = 0 v <«, f>> , což jsme měli dokázat. Dokážeme, že operátor A je v DÁ dokonce pozitivně definítoí. Máme tedy dokázat, že existuje konstanta C > 0 tak, že pro každé ue DA plad (8.54) tj. podle (8.51), že platí (Au,u)^C2\[u\\2, jV(x)dx ä C2 J"w2(x)dx . Protože u e DA, je u(a) — 0, a tedy u(x) = J «'(() dř, x e {a, b> . Podle Schwarzovy nerovnosti (6.17) (viz také str. 38) je u\x) = (T«'(ř) dřJ ^ j*1' d* ■ J*«'a(0 df = (x - a) JVa(t) dř. Protože x — a g 0 a u'2(f) í 0 v >, je tím spíše u2(x) < (x - a) u'2{t) dt, a tedy také (b - af (8.55) ľu2(x) dx < f «'2(í) df. ľ (x - a) dx = jV(í) dí. J d Ja Ja Ja Přejdeme-li v určitém integrálu jl urI(() dí k bežnému označení x pro integrační proměnnou, můžeme (8.55) zapsat ve tvaru 2 tj. vzhledem k (8.51) ve tvaru fV2(x) dx ä fV(x) dx , Ja Ja 8. operátory v hilbertově prostoru s což jsme měli dokázat. 113 c = b-a Příklad 8.10. Ukážeme, že operátor A z příkl. 8.8 je v DA pozitivní. V citovaném příkladě jsme ukázali, že je v DA symetrický. Stačí tedy ukázat, že pro každé u e DÁ platí (8.47), (8.48), tj. že pro každé « e DA je (8.56) (-A«, u) ä 0 (8.57) (-Au, «) = 0 => u(x) sOvC. Z (8.45) však plyne pro každé ue DA (8.58) (Au, u) = (-Au, u) = £ f f—Y dx ^ 0, '=i Jo\dxJ neboť (dujdxi)2 ž 0 y G pro každé i = 1,N. Tím je splnění nerovnosti (8.56) pro každé « e DA ověřeno. Zbývá dokázat správnost implikace (8.59) (-Aa, u) = 0 => u(x) = 0 v G. Avšak ze vztahu (—Au, «) = 0, tj. ze vztahu plyne (8.60) dx = 0 3u 3u „ j= -= 0,....-= 0 v G, 5xt dxw neboť u e D^, a tedy derivace dujBx^ ..., dujdxN jsou spojité v G. Z (8.60) plyne «(x) = konst v (J a z podmínky (8.41), íj. z podmínky u = 0 na f pak vyplývá u(jc) = 0v 5, což jsme měli dokázat. Operátor A z příkl. 8.8 je tedy v DA pozitivní. Podobně jako v předcházejícím příkladě lze ukázat, že je v DA dokonce pozitivně deřinitní. Důkaz zde nebudeme 114 I. hilbertův r-rqstor provádět, neboť tento výsledek vyplyne jako speciální případ úvah, které provedeme později (str. 271). c) Fuukcioiiály. Räeszoya veta V této kapitole, věnované operátorům, jsme zavedli řadu pojmů. Nejprve (viz def. 8.1 až 8.10) jsme zavedli operátor jako zobrazení množiny Mi do množiny M2 (jako Speciální případ jsme uvedli zobrazení množiny Mx na množinu M2), zavedli jsme rovnost, součet a součin dvou operátorů (přitom jsme se zmínili o tom, co rozumíme rozšířením daného operátoru), definovali jsme prostý operátor, operátor inverzní k danému operátoru a lineární operátor. V druhé Části této kapitoly jsme se věnovali poněkud speciálnějšímu případu operátorů, a to operátorům v Hilbertově prostoru. Definovali jsme jednotkový a nulový operátor, spojitý operátor a omezený operátor, přičemž jsme se zmínili o jednoduchém vztahu mezi těmito dvěma pojmy. Nakonec jsme se soustředili na operátory symetrické, pozitivní a pozitivně definiíní, které mají v problémech parciálních diferenciálních rovnic zvláště důležitý význam. V závěru této kapitoly se zmíníme o speciálním případě operátorů, o tzv. funkcio-nálech. Definice 8.16. Operátor F, který zobrazuje svůj definiční obor DF do množiny reálných, resp.-komplexních čísel, nazývá se funkcionál (reálný, resp. komplexní). Funkcionál F přiřazuje tedy každému prvku ue DF určité číslo Fa [často se píše těž F(u)], reálné nebo komplexní. V dalším textu, pokud nebude výslovně uveden opak, se budeme zabýval reálnými funkcionály. Protože funkcionál je speciálním případem operátoru, zůstávají pro něho téměř beze změny pojmy a výsledky, uvedené v předcházejícím textu, pokud ovšem nebyly vysloveny pro jiné případy (např. pro případy operátorů, zobrazujících některé množiny z Hilbertova prostoru do téhož Hubertova prostoru). Zejména tedy zůstává nezměněna def. 8.9: Definice 8,17. Reálný funkcionál F se nazývá lineární, je-li jeho definičním oborem Dr Iineál a jestliže pro každá reálná čísla alt ..-,<*„ a pro každé prvky «,, u„ z lineálu DF platí (8.61) F(a1ul + ... + a„u„) = a,Fu, + ... + a„Fun Také definice spojitosti a omezenosti funkcionál u jsou zcela obdobné def. 8.12 a 8.13. Uvedeme je pro případ, že definiční obor DF daného funkcionál u leží v některém Hilbertově prostoru H. Uvažme, že Fu, resp. Fu„ jsou Teálná čísla, a že tedy symbol lim Fu. = Fu 8, operátory v hilbertově prostoru 115 znamená konvergenci posloupnosti reálných čísel Fu, k čfslu Fu. Normou \Au§ z def. 8.13 je zde absolutní hodnota \Fu\ čísla Fu. Definice 8.18. Funkcionál F se nazývá spojitý v bodě u0 e DF, jestliže pro každpu posloupnost prvků u„ z DF, pro kterou je (8.62) lim u, = u0 v H , platí (8.É3) lim Fu„ = Fu0 . Je-li funkcionál F spojitý v každém bodě uu e DF, řekneme, že je spojitý v DF. Definice 8.19. Funkcionál F se nazývá omezený (ohraničený) v DF, existuje-Ii takové číslo JC, ře pro všechny prvky u e DF platí (8.64) \Fu\ĚK\u\\ Nejmenší z čísel K, pro něž je splněna podmínka (8.64), se nazývá norma funkcionálu F. Označení ||F|j. Příklad 8.11. Nechť v je určitý pevný prvek (reálného) Hilbertova prostoru H. Pak vztahem (8.65) Fu = (u, t>) pro všechna u e H je dán v H lineární omezený funkcionál a jeho norma je rovna normě prvku v, Nejprve je zřejmé, že F je funkcionál, neboť pro každé u e H je (u, v) určité (reálnej číslo. Dále H je podle definice Hilbertova prostoru lineál; ověření podmínky (8,6!) je snadné, neboť z vlastností skalárního souěinu plyne (8.66) F(atu1 + ... + a„u„) = (^ti, + ... + aau„ v) = a,(u„ v) + ... + aju„ v) = = a^Ut + ... + a,FuA. Tedy funkcionál (8.65) je lineární. Ze známé nerovnosti pro skalární součin IMlsM.Ni plyne, že je omezený, přičemž za číslo K v nerovnosti (8.64) je možno vzít číslo |«||. Snadno se však ukáže, že |ti|| je nejmenší z čísel K, splňujících podmínku (8.64): Pro prvek u = t> totiž je • Fv = (v,v)= Hl-H- takže číslo K = v (8.64) nelze zmenšit. Tedy norma funkcionálu (8.65) je rovna číslu (lít, 116 i. hilbertův prostor Speciálním případem funkcionálu (8.65) pro H = L2(0, 1) a v(x) m 1 v intervalu <0,1) je funkcionál G, daný předpisem (8.67) Gu dx . Funkcionál C je podle příkl. 8.11 lineární omezený funkcionál s normou |G| = 1. Z příkl. 8.11 je jasné, že pří pevně zvoleném v e H definuje skalární součin (a, v) lineární omezený funkcionál s normou |[F| = Platí však i tato velmi důležitá věta: Věta 8.8. (Ríeszova). Každý lineárni omezený funkcionál F v Hilbertově prostoru H lze vyjádřit ve tvaru (8.68) Fu = (u, v) , kde v je určitý prvek prostoru H, funkcionálem F jednoznační určený. Přitom platí ||,| - f*| Poznamenejme, že existence prvku v e H takového, že pro všechna u e H platí (8-68), je podle věty 8.8 zaručena, že však v obecném případě není snadné, je-li funkcionál F dán, tento prvek skuteční najít. Myšlenka důkazu věty 8.8 je následující: Je-li Fu = 0 pro každé u e H, stačí položit v = 0. Nechť tedy Fu není nulový funkcionál. Označme L lineál, s metrikou prostoru H, těch prvků z e H, pro které platí Fz = 0. Protože funkcionál F je omezený, snadno se dokáže, že X. je podprostor prostoru íf. Označme K jeho ortogonální doplněk v H, takže H — L © K. Protože dále F není nulový funkcionál, existuje takové x e K, že Fx = a. + 0. Pro prvek y = xjpt pak platí y £ K a Fy = 1. Nechť u je libovolný prvek z H. Označme Fu = Snadno se ukáže, že u = (u - £y) -f- /Jy , kde m - 0y e L, PyeK. Odtud pak jednoduchým výpočtem plyne, neboť u — fiy ± y, («, y) = ((a - fiy) + fiy, y) = /J||><|2 = j[y||2 . Fu , takže Fu = Ve větě 8.8 stačí tedy položit v = y/||y||2. Je-li »' jiný prvek, takový, že pro každé u e H platí Fu = (u, v'), pak (odečtením) (u, »' — v) = 0, ž čehož, položíme-li u = u' — u, plyne u' = u, odkud vyplývá jednoznačnost prvku v uvedené vlastnosti. 8. operAtorv v hilbertově prostoru 117 Dále \Fu\ = |(p, h)| g |*.| . ||u]|, takže ||P|| £ Avšak nemůže být ||jF|| < ||t>|j, neboť Fv = (v, v) - lv\\\ takže skutečně |P|| = ]|»||. Podobně jako na str. 102 lze ukázat: Věta 8.9. Lineární funkcionál je v DF spojitý právě tehdy, je-li omezený. Poznámka 8,7. V následující kapitole se setkáme s funkcionálem F, daným předpisem Fu - (Au, u) - 2(/, u) , kde A je pozitivní operátor v lineálu DA, hustém v Hilbertově prostoru H, f e H. Protože (vzhledem k lineárnosti operátoru Ä) platí (A(au), au) — a2(Au, u) pro každé reálné a, mluvíme o členu (Au, u) jako o kvadratickém členu funkcionálu F a funkcionál F samotný nazýváme kvadratickým funkcionálem. Pojmy zavedené v této kapitole, jakož i získané výsledky nám nyní dovolí přejít k formulaci základních vět, umožňujících přímo použití variačních metod k řešení operátorových rovnic tvaru Au — f, zejména k řešení jejich speciálního případu, diferenciálních rovnic s okrajovými podmínkami. Část II. VARIAČNÍ METODY Kapitola 9 Věta o minima kvadratického funkcionalit a její důsledky Již v úvodu předcházející kapitoly jsme uvedli, že v tito knize budou středem naší pozornosti rovnice tvaru hledané řešení. Jak dospíváme k rovnicím tvaru (9.1), jsme ukázali na příkladě Dirichletova problému pro Poissonovu rovnici, tj. problému kde P je hranice oblasti G. Přitom jsme operátor -Á uvažovali na lineálu Ml funkci patřících do Cm(G) a splňujících na F podmínku (9.3). Ukázali jsme (srov. větu 8.6, resp, pozn. 8.5 a příkl. 8.8 a 8.10), že lineál Mt je hustý v Hilbertově prostoru L2(G) a že operátor — A je na tomto lineálu symetrický a pozitivní. Řekli jsme, že později ukážeme, že je dokonce pozitivně definitní. S obdobným případem se setkáme v dalším textu velmi často: Je dán určitý Hilbertúv prostor ti [nemusí to být vždy prostor L2(G), jak tomu bylo v uvažovaném příkladě; při řešení některých problémů je výhodné uvažovat prostory obecnější nebo prostory jiného charakteru]. V tomto prostoru je dán určitý lineál DÄ hustý v H a na něm pozitivní (popř. pozitivně definitní) operátor A, zobrazující lineál DA *) Místo operátoru A, uvažovaného v citovaném příklade, uvažujeme zde operitor —A, který má před operátorem A tu přednost, v dalším textu podstatnou, že je na lineálu M1 pozitivní. Jinak je ovšem jedno, píšeme-li Poissonovu rovnici ve tvaru Au = g(x, y) nebo ve tvaru — Au = = f(x, y) s /{x, y) = - g(x, y). (9.2) -Au =/(x,v) ') v G, (9.3) u = 0 na ľ, 120 ii. VARIAČNÍ METODY 9. VĚTA O MINIMU KVADRATICKÉHO FUNKCIONÁLU 121 do prostoru H. Dále je dán určitý prvek feří. Hledáme takový prvek ueDÁ, který splňuje rovnici (9.4) Au = / v H. Zápisem (9.4) rozumíme, že rovnice Au — f je splněna v uvažovaném Hilbertově prostoru 11, tj. že Au — f je nulovým prvkem prostoru H. Je-li např. H = L2(G), znamená zápis (9.4), že rovnice Au = / je v oblasti G splněna skoro všude, tj. popř. s výjimkou bodů tvořících množinu nulové míry. Ukážeme, že je-li operátor A pozitivní v DA, může mít rovníce (9.4) v H nejvýše jedno řešení u e DA. Než přikročíme k důkazu, zopakujeme některé pojmy, zavedené v předcházející kapitole. Nechť DA je líneál hustý v Hilbertově prostoru H. Operátor A, zobrazující Ijneál DA do prostoru H, se nazývá symetrický v DA, je-li v 1)A lineární a platí-li (9.5) (Au, v) — (u, Av) pro každé dva prvky u e DA, v e DA . Nazývá se pozitivní v DA, je-li v DA symetrický a platí-li (9.6) (Au, «)ž0 pro každé v. e DA , přičemž (9.7) (Au, u) = 0 =s> « = 0 v />x. Věta 9,1. Je-li A pozitivní operátor v DA, pak rovnice (9.4), kde f e H, má v H nejvýše jedno řešení u e DA. Důkaz: Nechť existují dvě taková řešení u, e DA, u2 e DA. To znamená, že v H jsou splněny rovnice (9.8) Au, =f, (9.9) Au2=f. Odečteme-li rovnici (9.8) od rovnice (9.9) a uvážíme-li, že A je pozitivní, a tedy především lineární operátor, takže Au2 — Au, ~ A(u2 — "i), dostaneme A(u2 - m,) = 0 v H . Násobíme-li tuto rovnici skalárně prvkem u2 — ute DA zprava, dostaneme (A(u2 - Mj), u2 - uj) = 0 , odkud podle (9.7) plyne u2 — uj = 0 v DA čili u2 — Uj v DA, což jsme měli dokázat. Základní význam bude mít pro nás tato věta: Věta 9.2 (o minimu kvadratického funkcionálu). Nechť A je pozitivní operátor v DA, f e H. Nechť rovnice (9.4) má řešení ug e DAi tj. nechť platí (9.10) Au0^fvH, udgDa. Pak kvadratický1) funkcionál (9.11) Fu = (Au, «) - 2(f, u) nabývá v DÁ právě pro prvek u0 minimální hodnoty, tj. pro všechna u e DA platí Fu £: Fu0, přičemž Fu = Fua jen pro u = u0. Naopak, nechť funkcionál (9.11) nabývá pro prvek uQ minimální hodnoty mezi všemi prvky u e DA. Pak u0 je v H řešením rovnice (9.4), tj. platí (9.10). Důkaz: Nejprve je zřejmé, že pro všechna u e D,, je funkcionál Fu definován. 1. Nechf pro i/0 je v H splněna rovnice (9.10), takže / — Au0. Dosadíme-li za/ do (9.11), dostaneme pro u e DA Fu = (Au, u) — 2(Aua, u) . Snadno však zjistíme, že je Fu = (Au, u) — 2(Auv, a) = - (Au, u) - (Au0, u) - (u, Au0) = = (Au, u) - (Au0, u) - (Au, u0) = = (Au, u) - {Auq, u) - (Au, u0) 4- (Au0, u0) - (Au0, u0) = = (A(u - W0), w - u0) - (Au0, u0) . [Použili jsme jednak symetrie skalárního součinu, z níž plyne (Au0, u) — (u, Au0), jednak symetrie operátoru A, podle níž je (u, Au0) = (Au, a0)-] Platí-li tedy Au0 — f, pak (9.12) Fu = (A(u - u0), u - w0) - (Aua, uQ) . Člen (Au,,, u0) v (9.12) nezávisí na u a zůstává tedy s měnícím se «. konstantní; dále operátor A je podle předpokladu pozitivní, takže pro první člen na pravé straně (9.12) platí (A(u — u0), u — u0) S: 0 pro každé u e DA , *) Viz pozn. 8.7, str. 117. 122 II. variační metody 9. VĚTA O MINIMU KVADRATICKÉHO funkcionálu 123 přičemž (A(u - u0), u - u0) = 0 právě tehdy, je-li u - u0 = 0 v DÁ , Z (9,12) tedy plyne, že Fu Ž Fu0 pro každé ue DA, pncemz Fu — Fua právě tehdy, je-li u = u„ v DA. Jestliže je tedy splněna rovnice Au0 - /, nabývá funkcionál Fu nejmensí hodnoty v DA právě pro prvek u = u0. Tím je první tvrzení věty 9.2 dokázáno. 2. Nechť funkcionál Fu nabývá v DA nejmenší hodnoty pro prvek u0. To tedy znamená, že zvolíme-li libovolný prvek v e DA a libovolné reálné číslo t (takže zřejmě bude také u0 + tv e DA), bude (9.13) F(u0 + tv) S: Fu0 čili (9.14) F(u0 + íi.) - Fu0 ž 0 . Užijemc-li opět symetrie operátoru A a symetrie skalárního součinu, dostaneme F(u0 + tv) = (^(«0 + tv), u0 + íi>) - 2(/, u0 + í») = - (Au0 + Mu, u0 + tv) - 2(/, u0) - 2t(f, v) = = (Au0, u0) + t(Av, u0) + t(Au0, v) + t2{Av, v) - 2t(f, v) - 2(_f, u0) = - {Au0, u0) + 2t{Au0, v) + t7{Av, v) - 2t(f, v) - 2(f, u0) . Tedy (9.15) F(u0 + ít.) = (Au0, u0) + 2t(Au0, v) + t2(Av, v) - 2t(f, v) - 2{f, u0) . Protože u<,e DAaf e H jsou pevné prvky, je z (9.15) zřejmé, že pro pevně zvolené v e DA je F[ua + tv) kvadratickou funkcí proměnné í. Z (9.14) plyne, že tato funkce má mít pro í = 0 lokální minimum, což znamená, m její první derivace pro í = 0 je nutně rovna nule, (9.16) — F(u0 + tv) dí = 0, čili podle (9.15), (9.17) 2(Au0, v) - 2(/, v) = 0 Podmínku (9.17) snadno upravíme na tvar (9.18) {Au0 ~f,v) = O.1) Prvek ve DA byl zvolen pevně, ale libovolně, takže k rovnosti (9.18) dospějeme z podmínky (9.14) při každé volbě prvku ve DA. Lineál DA je podle předpokladu hustý v II. Z (9.18) tedy plyne, že prvek Au0 — f je v prostoru H ortogonální ke väem prvkům v z lineám DA, hustého v H, a podle věty 6.18, str. 82, je tedy Au0 -/ = 0vfl, tj. «o je v II řešením rovnice Au0 = /, což jsme měli dokázat. Příklad 9.1, Uvažujme diferenciální rovnici (9.19) (Elu")" = q , s okrajovými podmínkami (9.20) «(0) = u(í) = 0 , u'(0) = «'(f) = 0 . Předpokládejme přitom, že funkce E(x), l(x) a jejich derivace do druhého řádu včetně, jakož i funkce q(x) jsou spojité v intervalu (0, ř) a že platí (9.21) E(x) > 0, l(x) > 0 v <0,1) Rovnici (9.19) můžeme interpretovat jako diferenciální rovnici pro průhyb ohybové osy prutu délky /, s modulem pružnosti £(x), momentem setrvačnosti průřezu vzhledem k ohybové ose I(x) a s příčným zatížením q(x). Podmínky (9.20) pak znamenají, že prut je na obou koncích ve tknutý. Jsou-li E a I v intervalu <0, /> konstantní, můžeme ovšem rovnici (9.19) zapsat ve tvaru EIuw = q . Zvolme II s= L2(0, í) a v něm lineál DA funkcí w(x), které jsou s derivacemi do Čtvrtého řádu včetně spojité v intervalu <0, I> a splňují podmínky (9.20). Podle věty 8.5, resp. pozn. 8.5 je tento lineál hustý v L2(0, í). Definujme na Iineálu DA operátor A předpisem (9.22) Au = (Elu")" l) Funkcionál — F(u+ í«)],=0 se ve variačním počtu nazývá první variace funkcionalit F, dt Prvek «0, pro který je první variace rovna nule, se často nazývá stacionární bod funkcionalit F. V našem případe má první variace funkcionářů F tvar {Au — /, o) a ve stacionárním bodž «„ dosahuje funkcionál F minimální hodnoty. 124 II. VARIAČNÍ METODY 9, věta o minimu kvadratického funkcionálu 125 Problém (9.19), (9.20) pak můžeme zapsat jedinou rovnicí (9.23) Au = q . Snadno dokážeme, že operátor A je na lineálu DA pozitivní. Nejprve dokážeme, že je v DA symetrický: Pro každé u e DA, v e DA totiž platí (9.24) (Au, v) = C (Elu")" vdx = [(Elu")' iŕg - ľ (Elu")' v' dx M Jo Jo = - (Elu")' v' dx = - [Elu"v% + EIu"v" dx = EIu'v" dx . Jo Jo Jo {Výraz [(Elu")' u]ó, resp. [EJu V]0 je roven nule, neboť v důsledku (9.20) je «(0) = — v(l) - 0, resp. o'(O) = v'(l) = 0.} Obdobným způsobem dojdeme k výsledku, že (9.25) (u, Av) = •i ri u(EIv")" dx = Eluťdx o Jo Z (9.24) a (9.25) plyne symetričnost operátoru A na lineálu DA. Z (9.24) dostáváme dále pro každé u e DA (9.26) (Au, u) = | Elu"2 dx . V důsledku (9.21) plyne z (9.26) (áu, a) ä 0 pro každé ue DA. Přitom je-li (^u, a) - 0, plyne z (9.26) a z (9.21) u'(x) = 0 v <0, í> , odkud a v důsledku (9.20) u(x) = ax + b v <0, í> u(x) = 0 v <0, 0 . Tím je pozitivnost operátoru A na lineálu Dj dokázána. Funkcionál Fu = (Au, u) — 2(q, u) má v našem případě tvar (9.27) fu Elu 'd"2í qu dx a — fyzikálně řečeno — vyjadřuje při daném průhybu u e DA dvojnásobnou celkovou potenciální energií Lu uvažovaného prutu, (9.28) Fu = 2Lu =2(5Ír'id") [Jak známo, integrály Elu"1 dx , resp. dx je dána elastická potenciální energie prutu, resp. potenciální energie vnějších sil, tj. daného zatížení g.] Nechť m0(x) je řešením rovnice (9.23), tj. nechť u0 e DA a (9.30) (EIul)" = q . Dosadíme-li za. q z (9.30) do (9.27), dostaneme Fit = J EIu"z dx - 2 j (EIuq)" u dx . Integrováním per partes, obdobným integrování v (9.24), dostaneme (pro dané m0 e DA a pro každé u e D^) ľ (EluSf ti dx = f Elulu" dx , Jo Jo takže (9.31) Fu = f Elu"2 dx - 2 í EIu^u" dx - f Eí(u - «S)2 dx - f Eluf dx . Jo Jo Jo Jo Protože (u" — uj)2 ě 0a zároveň platí (9.21), je z (9.31) ihned vidět, žc funkcionál Fu bude v DÁ minimální právě tehdy, bude-li u = u0 v DA. Můžeme tedy v našem příkladě vyslovit první tvrzení, které je v souhlasu s prvním tvrzením věty 9.2: Je-li w0 e DA řešením rovnice (9.23), pak funkcionál Fu nabývá v DA pro toto u0 minimální hodnoty. Naopak, nechť u0 e DA je prvek, minimalizující v DA funkcionál (9.27). Nechť ve DA je libovolný prvek z DA a i libovolné reálné číslo. Podmínka minima, d , J - F(u0 +■«) = o dř [,,0 [srov. (9.16)], má v našem případě tvar — I" í El(ul + ti)")2 dx - 2 q(ua + tv) dx dtUo Jo = 0, čili (9.32) 2 J Eíu'qv" dx - 2 Jqvdx =• 0 . 126 II, variační metody 10. prostor HA 127 Dělením této rovnosti číslem 2 a integrováním prvního členu per partes [srov. (9.24)] uvedeme uvažovanou podmínku na tvar j'[(£K)s - q\váx = 0. Tato rovnost má platit pro každé v e DA. Lineál DA je však hustý v L2(0, /) odkud plyne, podobně jako v (9.18), (9.33) [F.IulY - q = 0 v L2(0, /), Funkce vystupující v (9.33), i jejich derivace jsou však podle předpokladu spojité v (0, ľ), takže rovnost (9.33) je splněna dokonce v obyčejném smyslu. Tak dospíváme k druhému tvrzení, opět ve shodě s příslušným tvrzením věty 9.2: Jestliže funkce Uffx), patřící do DA [a vyhovující tedy podmínkám (9.20)] minimalizuje v DA funkciottál (9.27),') pak splňuje podmínku (9.33), tj.je řešením diferenciální rovnice (9.19) pro pruhy b ohybové osy uvažovaného prutu. Obé tvrzení, která jsme právě vyslovili, nejsou ničím jiným než principem minima potenciální energie, známým z teorie pružnosti a aplikovaným na uvažovaný prut, a ukazují těsnou souvislost věty 9.2 s variačními principy mechaniky. Věta 9.2 uvažuje ovšem rovnici Au = f bez ohledu na její fyzikální interpretaci, resp. na interpretaci příslušného funkcionálu Fu. Poznámka 9.1. K objasnění souvislosti vály 9.2 s mechanickými principy jsme uvedli příklad neobyčejně jednoduchý. Čtenář může v tomto případě namítnout, že rovnici (9.19) stačí postupně integrovat a není třeba zabývat se její souvislostí s „funkcionálem energie" (9.27), resp. (9.28). V dalším textu budeme ovsem větu 9.2 aplikovat na řešení problémů obecnějších. Význam víty 9.2 záleží v tom, že úlohu řešit rovnici Au = f převádí na úlohu najít prvek «0 e DA, který minimalizuje v lineálu DA funkcionál (9.11). V dalších kapitolách ukážeme účinné metody, jak najít prvek u0 (resp. aspoň jeho dostatečně blízkou aproximací) minimalizující funkcionál (9.11). Uveďme však ještě jednu poznámku zásadního významu. Věta 9.2 má podmíněný charakter: Vyjadřuje ekvivalenci úlohy řešit na lineálu DA rovnici Au = f a úlohy najít v DÁ minimum kvadratického funkcionálu (9.11) za toho předpokladu, že je známo, že buďto existuje řešení rovnice Au — f (podrobněji, že existuje «„ e Da tak, že platí Au^ = f v li), nebo že funkcionál (9.11) nabývá na lineálu DA svého minima. Avšak splnění ani jednoho z těchto předpokladů neni a priori zřejmé dokonce ani ve velmi jednoduchých případech. Hledáme-li např. řešení rovnice (9.2) mezi funkcemi lineálu Aízmíněného na začátku teto kapitoly, a je-li funkce f na pravé straně této rovnice „dostatečně" nespojitá (např. je-li na některé podoblasti .) nebo funkcionál Lu, neboť je zřejmé, že funkcionál Lu nabývá v DA minima privč tehdy, nabývá-lí na tomto lineálu minima funkcionál Fu, oblasti G rovna nule a na zbývající části této oblasti je rovna jedné), takže ji nelze vhodnou změnou funkčních hodnot na množině míry nula učinit spojitou, nemá zřejmě rovnice (9.2) na lineálu Mx žádné řešení, neboť pro každé u e Mx je Au funkce spojitá v G. Ve shodě s větou 9.2 nemůže aní funkcionál (9.11) v takovém případě nabývat na lineálu Mx svého minima. [Jinak by totiž podle věty 9.2 existovalo řešení u0eM1 rovnice (9.2).] ) Abychom překonali tuto obtíž, zdá se velmi přirozené vhodně rozšířit (nebo přímo vhodně specifikovat) definiční obor operátoru —Au. S podobnými problémy týkajícími se rozšíření původního definičního oboru uvažovaného operátoru se setkáváme i v obecnějších případech. Otázka, jak vhodně rozšířit základní lineál DA, není jednoduchá. Je třeba, aby toto rozšíření bylo aspoň takové, aby funkcionál (9.11) nabýval v nějakém smyslu na tomto rozšířeném oboru svého minima: prvek realizující toto minimum pak prohlásíme za „zobecněné" řešení rovnice Au = /. Zároveň je třeba dbát, aby tento rozšířený obor byl ještě natolik úzký, aby byla 2aručena jednoznačnost tohoto zobecněného řešení; dále, existuje-li „klasické" řešení u0 rovníce (9.10) ve smyslu věty 9.2, je třeba, aby zobecněné řešení bylo právě tímto „klasickým" řešením. Určitý, do jisté míry jednotný postup ukážeme v kap. 34. Na tomto místě uvedeme konstrukci tzv. prostoru HA, pro naše nejbližší cíle dostatečně obecného, v němž, jak uvidíme, bude možno snadno dokázat existenci a jednoznačnost minima vhodně rozšířeného funkcionálu (9,11) a tím í existenci a jednoznačnost zobecněného řešení naší úlohy. Tuto konstrukci provedeme za předpokladu, že uvažovaný operátor A je v DA pozitivně definitní. Kapitola 10 Prostor //., Nechť v Hiíbertově prostoru II je dán iineál DA hustý v Ä a na něm operátor A, zobrazující lineál DA do prostoru H a pozitivně definitní na tomto lineálu, tedy symetrický a takový, že e listuje konstanta C > 0 tak, že platí (10.1) (Au, u) ^ C2\\u\\2 pro každé u e DA . Na lineálu DA definujme nový skalární souěin (u, e)A takto: (Í0.2) (u, v)A = (Au, v) pro všechna u e DA, v e DA . Snadno ověříme, že (u, v)A je skutečně skalární souěin, tj. že spiňuje všechny axiómy ') Podobně, je-li zatíženi q(x) prutu, uvažovaného v přfkl. 9.1, nespojité (a to je v aplikacích velmi častý případ), nemůže rdít rovnice (9.23) řešeni tf0 e DA (neboť levá strana léto rovnice by pak byla spojitou funkci v intervalu {0, ř^>), a tedy ani funkcionál (9.27) nemůže nabývat na lineálu DA minima. 128 II. VARIAČNÍ METODY 10. prostor HA 129 (6.3) až (6.6), uvedené pro skalární součin na str. 69: Protože operátor A je podle předpokladu pozitívne definitní, plyne již z jeho definice, že je symetrický (a tedy také lineární). Předně tedy pro libovolné prvky u, o, ttu u2 z DA a pro libovolná reálná čísla Oi, a2 platí (u, v)A = (Au, v) - (u, Av) = (Av, u) = (t>, u)Á , (atu, + a2u2,v)A = (A(aíuí + a2u2), v) = (a1Au1 + a2Au2,v) = = ai(Auu v) + a2(Au2, v) = as(u„ v)A + a2(u2, v)A, čímž je splnění prvních dvou axiómů (6.3) a (6.4) skalárního součinu ověřeno. Ale také zbývající axiómy (6.5) a (6.6) jsou zřejmě splněny, neboť z (10.1) plyne (H> U)A - (Au, u)gO, přičemž (u, u)A = 0 , jen je-li u = 0 v DA . Tedy vztahem (10.2) je na lineálu DA skutečně dán skalární součin. Příklad 10.1. V prostoru L2(a, b) se skalárním součinem (u, v) = j" m(x) v(x) dx uvažujme lineál DÁ funkcí a(x) spojitých včetně derivací u'(x) a u"(x) v uzavřeném intervalu (a, by a splňujících podmínky (10.3) u(a) = 0 , u(b) = 0 . Na tomto lineálu definujme operátor A vztahem (J0.4) Au = -u'. Jak jsme ukázali v příkl. 8.9, str. 111, je operátor (10.4) na lineálu DA pozitivně definitní, přičemž, jak jsme snadným výpočtem zjistili, platí (10.5) («, v)A = («', v'). V tomto případě je tedy nový skalární součin («, v)A funkcí u(x), v(x) z DA dán původním skalárním součinem [tj. skalárním součinem v prostoru L2(a, í))] jejich derivací u'(x), v'(x). Protože (u, v)A má všechny vlastnosti skalárního součinu, vyplývá odtud, jak jsme ukázali v podstatě již v druhé kapitole, že veličiny (10.6) resp. (10.7) «) = 11« - kIU splňují všechny axiómy normy, resp. vzdálenosti, a že tedy vztahy (10.6), (10.7) je ria lineálu DA definována nová norma, resp. metrika. Lineál DÁ s metrikou (10.7) tvoří tedy lineární metrický prostor, a to unitární prostor (str. 72) se skalárním součinem (10.2). Tento prostor nazveme prostorem SA. Všimněme si, že z (10.6), (10.2) a (10.1) plyne, že pro každý prvek u e DA platí (10.8) tj- (10.9) ž am II"II á^HU. s touž konstantou C > 0 jako v (10.1). Např. pro operátor (10.4) z příkl. 10.1 platí pro každé u e DA (10.10) H|} = \\ut Ě cl«f, tj. (10.11) ž-c 11-11 kde (viz příkl. 8.9, str. lil) můžeme položit C = V(2)/(í> ")■ Z (10.9) zejména plyne: Platí-li pro posloupnost {«„} prvků z = 0, (10.12) lim I u„ - resp. (10.13) lim I h„ - pak také platí (10.14) lim || «„ - resp. (10.15) lim ]|u„ - o, tj. konvergiije-li posloupnost {«„} k prvku uc v S^, pak konverguje k tomuto prvku i v J/; je-li cauchyovská v Sj, je cauchyovská i v H. Obrácená tvrzení ovšem neplatí. Prostor SA nemusí být v obecném případě úplný [rozumí se úplný v metrice (10.7)]. Je-li úplný, pak je Hilbertovým prostorem (def. 6.13, str. 76) a pro naše účely není třeba dále jej rozšiřovat. Nechť tedy SA není úplný prostor, Jak jsme poznamenali v kap. 7, lze v takovém případě sestrojit „přidáním" tzv. ideálních elementů k prvkům prostoru SA úplný prostor, tzv. úplný obal prostoru SA. Označme jej HA. 130 II. variační metody V této kapitole ukážeme konstrukci tohoto prostoru a zároveň ukážeme, že za předpokladu uvedeného na začátku této kapitoly, tj. za předpokladu, že operátor A je v DA pozitivně deficitní, lze všechny tyto ideální elementy vybrat z prvků původního prostoru H.1) K tomu účelu uvazujme množinu M všech posloupností, které jsou cauchyovské v prostoru SÁ. Protože prostor SÁ není podle předpokladu úplný, konvergují některé z nich k prvkům ležícím v SA (označme množinu těchto posloupností M {) a některé z nich limitu v SÁ nemají (množinu těchto posloupností označme M2). Tvrdíme předně, že vybereme-li z množiny M jakékoli dvě posloupnosti (uj e M, {va} e M, bez zřetele na to, jde-li o posloupnosti z množiny M, nebo z množiny Af2, pak že vždy existuje vlastní limita (10.16) lim |«„ - vJ\A . Podle Bolzanovy - Cauchyovy podmínky (str. 42) stačí dokázat, že příslušná posloupnost {||uB — f„|j^} je cauchyovská, tj. že (10.17) Mik ltl-*„} e M platí bud (10.21) nebo (10.22) lim ||«„ - v„\\A = 0, lim ||«„ = a > 0. ') Čtenář, který chce postupovat rychleji, nemusí na tomto miste podrobní sledovat celou konstrukci prostoru HA a může se zatím spokojit jen uvedeným tvrzením. Viz takÉ struční přehled na str. 187 a 188. 10. prostor HA 131 (kde ovšem číslo a je pro různé dvojice uvažovaných posloupností v obecném případě různé). Uvažujme nyní posloupnosti z množiny Mlt íj. cauchyovské posloupnosti, které mají v SA limitu. Označme MUa množinu všech posloupností z M,, které konvergují v SA k prvku ug. Tvrdíme, že všechny tyto posloupnosti splňují vztah (10.21). Naopak, je-li {u„} jedna z těchto posloupností, pak každá jiná posloupnost {v„}, splňující (10.21), patří také do M„0 (tj. konverguje tSj! témuž prvku u0 jako posloupnost {«»))• První čásí tohoto tvrzení plyne z nerovnosti (10.23) ||u„ - vAa = |(m„ ~ «c) ~ (f, - "o)|< ä \\u„ - u0\\A + |]d„ - u0\A . Patří-li totiž obé posloupnosti {aj t {v„} do Mm, platí (10.24) lim||UB-Uo||A = 0, (10.25) lim K -n„|U = 0, odkud podle (10.23) vyplývá (10.21). Druhá část tvrzení, tj. platnost vztahu (10.26) lim \\vn - u0\\A = 0 ■-►00 za předpokladu, že platí (10,24) a (10;21)* plyne okamžitě z nerovnosti (10.27) |C. - «0S, - \\{v, - »„) + («„ - ua)\\Á % \t, - u,\\A + j«„ - u0\\A . Odtud ovšem vyplývá tento důsledek: Je-li {«„} e Aí^ a platí-Ii pro posloupnost {v„} (10.22), pak nemůže být {()„} e neboť podle toho, co jsme právě dokázali, by musei být v takovém případě splněn vztah (10.21), což vede ke sporu s (10.22). Z právě odvozených výsledků plyne, že rozdčlíme-H posloupnosti z množiny M, na třídy tak, že dvě posloupnosti {u„} a (r„) z M, patří do téže třídy právě tehdy, splňují-li (10.21), pak že tyto třídy jsou vzájemně jednoznačně přiřazeny prvkům prostoru SA: Každému prvku u0 e SA je přiřazena třída Mn těch posloupnosti z M„ které konvergují v SA k tomuto prvku, a každé z uvažovaných tříd přísluší právě jeden prvek tí0 prostoru SA, a to ten, k němuž v SA konverguje některá (libovolná) posloupnost {tij z této třídy (neboť jak jsme ukázali, konvergují k tomuto prvku i všechny ostatní posloupnosti z této třídy). Uvažujme nyní posloupnosti z množiny M2, ij. posloupnosti cauchyovské v SA, které nemají v SA limitu. Rozdělme tyto posloupnosti, podobně jako v předcházejícím případě, na třídy tak, že dvě posloupnosti {u„} e M2, {v„} e M2 patří do téže třídy právě tehdy, platí-li (10.28) lim \\un - v„\\A - 0. 132 II. variační metody Těmto třídám nebudou tentokrát odpovídat prvky u0 z prostoru SA v dříve popsaném smyslu, neboř posloupnosti z množiny M2 nemají v prostoru SA limitu. Uvidíme však, že bude možno přiřadit jim vzájemné jednoznačně určité prvky z prostoru II (nepatřící do SA). Množinu těchto prvků označíme £>j. Na tyto prvky pak přirozeným způsobem rozšíříme skalární součin (u, v)Á, definovaný zatím jen pro prvky z prostoru SÁ, a vytvoříme tak, jak uvidíme, právě hledaný úplný prostor HA. Prvky množiny D; pak budou „ideálními elementy" prostoru HA (proto jsme pro množinu těchto prvků volili označení D s indexem /), o nichž byla zmínka v předcházejícím textu [srov. text následující za (10.15)]. Prvky z množiny Dj dostaneme takto: Vezměme určitou posloupnost {«„} z množiny M2. Tato posloupnost je podie předpokladu cauchyovská v SA, takže je také cauchyovská v H [srov. (10.15)]. Protože H je úplný prostor, konverguje posloupnost {u„} v H k určitému (touto posloupností jednoznačně určenému) prvku, který označíme u0. Tedy (10.29) lim h„ = u0 v H . Uvažujme nyní posloupnost {u„} e M2 z téže třídy, do které patří posloupnost {m„}, takže platí (10.28). Dokážeme, že tato posloupnost má v prostoru H tutéž limitu ua jako posloupnost {«„}, tj. žc platí (10.30) " limu, = u0 v II. Máme tedy dokázat, že z (10.29) a (10.28) plyne (10.31) lim \\v„ — «01| =0. jt-*oa Z (10.9) však vyplývá odkud podle (10.28) je (10.32) ».|| < -1|"„ - H lim |a„ - = 0 ■ Podobně jako v (10.27) máme j|ť„ - Kôf = 1(0. - «„} + («, - «o)|| Ě 1», - «„|| + ||«» -«»(,. odkud, protože platí (10.32) a (10.29), plyne (10.31), což jsme míli dokázat. Každé třídě posloupností z množiny M2 přísluší tedy ve smyslu konstrukce (10.29) určitý prvek z prostoru H (nepatřící do SA), touto třídou posloupností jednoznačně určený. Množinu všech těchto prvků (odpovídajících uvažovaným třídám) označíme, jak jsme již předeslali, symbolem Dt. Ukážeme, že také naopak každému 10. prostor H, 133 u0e Dj odpovídá právě jedna třída posloupností z Aí2. K tomuto účelu stačí dokázat, že každým dvěma navzájem různým třídám posloupností z M2 odpovídají [ve smyslu konstrukce (10.29)] různé prvky z Dj.1) Dvě posloupnosti {«„}, {i>„} z M2 patří, resp. nepatří do téže třídy, splňují-íi (10.21), resp. (10,22). Uvažujme tedy dvě posloupnosti {«„}, {t>„} z různých tříd, takže je (10.33) lim ||«. - v.]A = a > 0. Nechť přitom mají tyto posloupnosti v prostoru H tutéž limitu, tj. nechť platí (10.34) lim un n-»oo lim t>„ = w0 v H Ukážeme, žc tento předpoklad vede ke sporu, čímž bude dokázáno, že dvěma navzájem různým třídám posloupností z množiny M2 nemohou odpovídat [ve smyslu konstrukce (10.29)] dva stejné prvky z H. Označme z„ = u„ — vn. Protože posloupnosti {«„} i {«„} jsou cauchyovskc v SAt je i posloupnost {z„} cauchyovská v SA a podle (10.33) platí (10.35) takže také (10.36) lim \\z„\\Á = a >0, lim (z„ z,)A = a1 > 0 , B-*ĚO neboť (z„, z^)A — ||z„|ji. Podle (10.34) je zároveň (10.37) lim z„ = 0 v H , a tedy podle věty 6.17, str. 82, (10.38) lim ||z„|| = 0 . Protože {z„} je posloupnost cauchyovská v SA, existuje podle věty 7.8, str. 88, taková konstanta K > 0, že pro všechna n platí (10.39) „} „blízké" v metrice prostoru SA, pak že jsou také „blízké" v metrice prostoru H. Neplyne odtud oväcm, že posloupnosti „blízké" v prostoru // jsou také „blízké" v prostoru SA. Mohlo by se tedy stát, že dvě posloupnosti z různých tříd v metrice prostoru SA by mohly mft v H tutéž limitu. 134 Označme (10.40) II. variační metody 2(K + I) ' kde a je konstanta z (10.35). Protože e > 0 a posloupnost {z„} je v SA cauchyovská, lze k tomuto e najít číslo n0 takové, že platí (10.41) ||z„ — z„\A < e pro každou dvojici přirozených čísel m > n0, n > n0 . Zvolme pevně m > n0. Zřejmě je (10.42) (z., z„)A = (z, - zm, za)A + (rM1 z„)A. Dále (10.43) |(zm, 2„)„| - \{Azm, z„)| g [jfej . |z„| . Protože m je pevné, a tedy Azm je pevný prvek z prostoru H, plyne z (10.43) a z (10.38), že k číslu e, danému vztahem (10.40), lze najít číslo n'0 tak, že pro všechna n > n'a je (10.44) |(z„, 2(,)^| < 6 . Zároveň pro všechna n > n0 platí podle (10.39) a (10.41) (10.45) \{z„ - z„, zn)^| g ||i. - z„\\A . \\z„\\A < Ke . Označme N = max (n0, n0). Pro všechna n > N platí tedy zároveň (10.44) i (10.45), a tedy podle (10.42) i (10.46) (z„, z„)A ') < Ke + s = (K + 1) e podle (10.40). Nemůže tedy být lim (z„, z,)x = a2 , což je spor s (10.36). O třídách posloupností z množiny M2 můžeme tedy vyslovit obdobné tvrzení, které jsme vyslovili o vzájemně jednoznačném přiřazení tříd posloupností z množiny M! a prvků z lineálu DA: Každému prvku uB e D, odpovídá právě jedna třída posloupností z množiny Mlt a to třída všech těch posloupnosti z množiny M2, které konvergují v prostoru II k prvku u0. Naopak, každé z těchto tříd odpovídá v Dj právějeden prvek u0, a to ten, který je v prostoru H limitou některé (libovolné) posloupnosti z této třídy. Označme D sjednocení množin DA a D,, (10.47) D = Dj u D, . *) Zde nemusíme psát absolutní hodnotu, neboť (z,, z^)A eí 0, 10. prostor HÁ 135 Podle právě vyslovených tvrzení existuje tedy vzájemně jednoznačné přiřazení mezi prvky množiny D a jednotlivými třídami všech posloupností, cauchyovských v prostoru SA. Přitom tyto třídy jsou, jak víme, charakterizovány tím, že dvě posloupnosti {«„}, {u„}, cauchyovské v SA, patří do téže třídy právě tehdy, platí-li (10.21). Uvažované přiřazení je zřejmě lineární (odpovídá-li posloupnosti {u„} prvek «0, odpovídá posloupnosti {aw„} prvek au0 atd.), odkud snadnou úvahou plyne, že množina D je lineál. To umožňuje definovat na D skalární součin. Tento součin označíme stejným symbolem (u, o)^ jako skalární součin, definovaný vztahem (10.2) na lineálu DA. (Z následujících řádků vyplyne, že jsme k tomu skutečné oprávněni.) Definujeme (10.48) (u0, v0)A = lim (u„, v^)A pro každou dvojici prvků u0 e D, v0 g D , přičemž {un}, resp. [v„] (u„ e DA, v„ e DA) je některá posloupnost z třídy, která podle předcházejícího textu odpovídá prvku u0, resp. v0. Abychom ukázalí oprávněnost definice (10.48) (i zvoleného označení), je třeba ukázat, že 1. limita (10.48) vždy existuje a je konečná; 2. limita (10.48) nezávisí na výběru posloupnosti {u„}, resp. {u„} z třídy, která odpovídá prvku uu, resp. v0; 3. (10.48) má všechny vlastností skalárního součinu; 4. pro u0 e DA, va e DA je součin (10.48) roven součinu (10.2) [takže skalární součin (10.48) je rozšířením skalárního součinu (10.2) z lineálu DA na lineál D]. K jednotlivým bodům: 1. Stačí ukázat, že posloupnost (u„, v^)Á je cauchyovská, tj. že platí (10.49) lim |(«m, vm)A - (u„, v„)A\ = 0 . Ale posloupnosti {«„}, {v„} jsou v SA cauchyovské, takže platí (10.50) lim ||«m - un\\A = 0 , (10.51) lim ! »„ - v.\A = 0 ; mimoto podle věty 7.8, str. 88, existuje konstanta K tak, že pro všechna n je (10.52) \\uJA ž K , KlxSK. 136 II. VARIAČNÍ METODY Dále platí, neboť prvky posloupností {u„}, {vn} patří do SA, (10.53) \(um, vm)A - (u„, v„)A\ = \(uá - «„, vm)A 4- («„, vm - v„)A\ S Ä \(um - u„, vm)A\ + \{u„, r„ - v„)A\ í ||um - w„|U ■ Nfe + + ||«„|U . |% - ť„IU á K(\\um - U„\\Á +\\vm- gj|:J , odkud, protože platí (10.50) a (10,51), plyne (10.49). 2. Nechť fu„}, resp. {S„} je jiná cauchyovská posloupnost z třídy, která podle předcházejícího textu odpovídá prvku u0, resp. v0, uvažovanému v (10.48). To tedy znamená, žc je (10.54) lim ||m„ - u„\\A = 0, H-* CCl (10.55) lim Ur, - ř.L = 0. lim \\vn IÍ-* CO Nechť dále konstanta K v (10.52) je již tak velká, že mimo (10.52) platí i (10.56) lu„\\A < K . Máme (10.57) v„)A - (ú„, v„)A\ = ;(*„ - u„, ^ f (ff„ va - h„)A\ < < l(u„ - «„ 4^] +l(««- u« - £)J ^ II"- - «»IU ■ |t?4*+ odkud v důsledku (10.54) a (10.55) plyne čili lim l(u„, t-,).4 - (uB, f„). je-li u e Z) a je-li {«„} některá z jemu odpovídající třídy cauchyovských posloupností v SÁ, apod. Definice 10.1. Unitární prostor, vytvořený prvky lineálu D, se skalárním součinem (10.48) a metrikou (10.59) nazveme prostorem HA. Věta 10.1. Prostor HA je v metrice (10.59) úplný, je tedy líilbertovým prostorem. Lineál DA je v IIA hustý. Důkaz: a) Hustota. Nechť « je libovolný prvek z HA. Máme dokázat, že ke každému e > 0 lze najít takový prvek v e DA, že platí (10.61) íi - VÍ, s £ . Poďlc predpokladu je u e D. Prvku u je tedy jednoznačně přiřazena určitá třída posloupností cauchyovských v SA (a tedy také v H^. Vyberme jednu z nich a označme ji Nechť e > Oje dáno. Protože {u„} je cauchyovská posloupnost v HA, existuje takové n0, že pro každou dvojici čísel m, n, pro kterou platí m > n0i n > n0, je (10.62) ||Um - u„\\Á í s. Nechť u„ je pevně zvolený prvek uvažované posloupnosti takový, že n > n0. Protože {«.] je jedna z posloupností prvků z prostoru SA, odpovídajících prvku u, je {um — u„] (při pevném u„) jedna z posloupností prvků z prostoru SA, odpovídajících prvku u — ua. Podle (10.60) máme 11« - «„1U =lim I"™ - w»IU ■ 138 II. variační metody Ale n > n0, takže pro každé m > n0 platí (10.62). Uvažovaná limita tedy nemůže být včtší než s, tj. (10.63) 1« - «„!U ú e ■ Za hledaný prvek v v (10.63) stačí tedy vzít zvolený prvek u„. Tím je důkaz hustoty lineálu DA v prostoru HA proveden. Všimněme si ještě této okolnosti: Číslo s > 0 bylo zvoleno libovolně, takže z (10.63) plyne, že posloupnost {«„} konverguje v prostoru HA k prvku u. Je-li tedy u libovolný prvek z HA a. je-li {»„} některá z jemu odpovídající třídy cauchyovských posloupností v SA, pak (10.64) Hm u„ = u v HA . b) Úplnost. Nechť {v„} je libovolná posloupnost cauchyovská v fíA, Máme dokázat, že tato posloupnost má v HA limitu. Protože lineál DA je hustý v HA, lze každý prvek posloupnosti {i>„} aproximovat v tomto prostoru s libovolnou přesností některým prvkem z„ z DA. Speciálně je tedy možno najít takovou posloupnost {z„} prvků z DA, že pro každé n ■» 1, 2,... platí (10.65) I' Tvrdíme, že nejen posloupnost {ty}, ale i posloupnost {z„} je cauchyovská v HA. Z trojúhelníkové nerovnosti totiž plyne (10.66) ě ||z» - dli + K - f*!U * Ik »»11 a • Z (10.66), (10.65) a z okolnosti, že {»„} je cauchyovská posloupnost, plyne ihned uvedené tvrzení. Protože tedy posloupnost {z„} je cauchyovská v HA, a tedy i v SA, neboť prvky z, patří do DA, odpovídá jí v D určitý (touto posloupností jednoznačně stanovený) prvek z. Podle (10.64) je tj- (10.67) lim z„ = z v HA , lim |z - z„|U = 0 Snadno ukážeme, žc platí i (10.68) Um t>„ = z v HA 10. prostor HÁ 139 Je totiž |z - »„iU á |z - z„|A + |[z„ - i>„|[A . Odtud a z (10.67) a (10.65) plyne ihned lim I z - vn\\A = 0 , tj. (10.68). Tím je důkaz úplnosti prostoru HA proveden. Poznámka 10.1. Z (10.48) plyne snadno limitním přechodem, že vztahy (10.8), resp. (10.9), tj. vztahy (10.69) resp. (10.70) ;!»;; á-j«iU, o o, platné v prostoru SA, zůstávají v platnosti i v prostoru HA. Poznámka 10.2. Na začátku této kapitoly jsme nevyloučili případ, že SA je úplný prostor. V takovém případě není třeba provádět jeho rozšíření a je D = DA a HA — — SA. Tento případ např. nastane, je-li DA = II a je-li A identický operátor (dcf. 8.11, str. 99), tj. je-li A ~ I. Tento operátor je zřejmě v H pozitivně definitní, neboť je lineární a symetrický a pro každé u £ II je (lu, u) = (u, ti), takže v (10.1) stačí položit C = 1. Tento případ je ovšem málo zajímavý, neboť rovnice Au — f se zde redukuje na rovnici u = / a jejím řešením je zřejmě prvek /. Důležité jsou právě případy, kdy prostor SA není úplný, a kdy tedy je HA 4= SA. Tento případ je např. typický pro diferenciální operátory, s kterými se setkáváme v inženýrských a přírodovědných problémech. Poznámka 10.3. V příští kapitole ukážeme, že prostor HA je již dostatečně široký, aby bylo možno dokázat v něm existenci minima funkcionálu F z kap. 9 (vhodným způsobem modifikovaného), a tím i existenci „zobecněného řešení" daného problému Au = f. Prostor HA jsme zkonstruovali, nebyl-li prostor SA úplný, tak, že jsme k prvkům lineálu DA „přidali" určité prvky prostoru H (množinu těchto prvků jsme označili Ds); tím jsme vytvořili lineál D a na tento lineál jsme rozšířili skalární součin a metriku prostoru SA. Čtenář si jistě položí otázku, jaká je struktura množiny Dj, tj. jak „názorně" charakterizovat ty prvky prostoru H, které patří do Dr Na tomto místě nemáme zatím možnost dát na tuto otázku nějakou obecnější odpověď. Pokud jde o speciální případy, dává určitou představu příkl. 10.1, str. 128: V tomto případě je 1/ = L2(a, b) a lineál DA je vytvořen funkcemi u(x), spojitými včetně derivací 140 II variační metody 11. minimum funkcionalit F v prostoru H zobecnění řešení 141 prvního a druhého řádu v uzavřeném intervalu ).] Mimoto je třeba, aby tyto funkce splňovaly, alespoň v nějakém „rozumném" smyslu okrajo%'é podmínky (30.71). V případě diferenciálních operátorů (obyčejných nebo parciálních) druhého řádu, což je v aplikacích velmi častý případ, volíme za prostor H zpravidla prostor L2(a, b) [resp. t-i{(l)] a za lineál DA pak volíme zpravidla lineál funkcí spojitých včetně obyčejných, resp. parciálních derivací prvního a druhého řádu v uzavřeném intervalu < u2). 142 II. variační metody II. MINIMUM funkcionálu F V PROSTORU HA. ZOBECNĚNÁ řešení 143 takže za konstantu K v def. 8.19 lze vzít číslo ||/|, tj. normu funkce/ v prostoru H. Funkcionál (/, u) je však (při pevném/6 H) lineární omezený funkcionál i v prostoru HA. Podle (10.70) je totiž pro každé u 6 HA (11.6) odkud podle (11.5) plyne pro každé f e U a. u g Ha. V tomto prípade je tedy možno volit za konstantu K v def. 8.19 číslo |/||/C-Protože dále HA je Hilbertúv prostor, existuje podle Ricszovy věty (věta 8.8, str. 116) prvek u q e H A, prvkem f e II jednoznačně určený, tak, že platí (11.7) («o, ii)A = (/, u) pro všechna u e IIA. Píšeme-lí nyní podle (11.7) v (11.4) (uQ, u)A místo (/,"), dostaneme (11.8) Fu ~ (u, u)A - 2(«0, u)A = (u, u)A - 2(u0, u)A + («0, h,,)^ - («0, u0)A = = (u - «„, u - u0)A - («0,a0)^ = ||« - u0\\A ~ |[m0||Í ■ Ale ]|«]|A jc norma v prostom HA, takže (11.9) ||« - uQ\\A = 0 , jc-li u - u0 = 0 y HA , tj. jc-li H = W0 v ffj , a (11.10) ||w - u0\\A > 0 pro u 3= u0 v HÁ . Z (l 1.8), (11.9) a (11.10) je zřejmé, že funkcionál F nabývá v IIA minima, právě je-li u = «o v MA, tj. právě pro prvek u0, určený (jednoznačne) vztahem (11-7). Dokázali jsme tedy tuto větu: Věta 11.1. Nechť operátor A je pozitivně defin'ttni na lineálu DA hustém v Hil-bertově prostoru H. Nechť HA je Hilbertúv prostor, zkonstruovaný v kap. 10. Pak funkcionál F, daný v HA předpisem (11.4), nabývá v IIA své minimální hodnoty. Prvek «0, realizující v HA toto minimum, je jednoznačne dán vztahem (11,7). Jak jsme předeslali již v kapitole 9, definujeme: Definice 11.1. Prvek u0, minimalizující v prostoru IIA funkcionál (11.4) a určený jednoznačne vztahem (11.7), nazýváme zobecneným řešením rovnice Au = f. Speciální prípad zobecněného řešení je ten, kdy prvek u0, realizující v HA minimum funkcionálu F, je prvkem lineálu DA. Tento prípad odpovídá, zejména jde-li o di- ferenciální operátory, v jistém smyslu představě klasického řešení daného problému. Viz o tom podrobněji v pozn. 11,4, Věta 11.1 i definice 11.1 si zaslouží několika poznámek: Poznámka 11.1. Jak vyplývá z předcházejícího testu, je zobecněné řešení u0 rovnice Au — f jednoznačně určeno vztahem (H.7). Po praktické stránce však sám vztah (11.7) nedává návod, jak toto řešení efektivně zkonstruovat. Cestou k tomu zůstává minimalizování (v prostoru HA) funkcionálu F. Cílem následujících kapitol bude tedy seznámit se s účinnými metodami, jak najít prvek, který realizuje toto minimum, resp. aspoň jeho dostatečně blízkou aproximaci. Poznámka 11.2. Z (11.7) dále podle (11.6) plyne (11.11) \(u0,u)A\ = \(f,u)\í\\j u ' < — *■ }u\A pro každé ueHA. Speciálně pro u — u0 dostáváme odtud ll»o||Í («c,«o),S^fl«o|U, odkud plyne1) důležitá nerovnost (11.12) 1/1 Tato nerovnost vyjadřuje spojitou závislost zobecněného řešeni u0 na pravé straně f daně rovnice Au = f. To předně znamená, že je-li / „malé" v normě prostoru H, pak že zobecněné řešení je „malé" v normě prostoru HA [a tím podle (11.6) také „malé" v normě prostoru Jí]. Je-li dále u0, resp. v0 zobecněné řešení rovnice (11.13) resp. (11.14) tj. plalí-li (11.15) resp. (11.16) Au =/, Av = g, (ug, u)A = (f, u) pro všechna u e TíA , (»0: u)a = (d, ») p™ všechna uěHa, 1) Pro ua 4= 0; pro u0 = 0 platí ovšem nerovnost (11.12) také. 144 II. variační metody I 1. minimum funkcionálu F v prostoru HA- zobecnění řešení 145 pak z0 = vn — u0 je zobecněným řešením rovnice (11.17) Az = g - f,1) neboť z (11.15) a (11.1.6) plyne (11.18) (z0, u)A = (#—/, u) pro všechna u e HA. Z (11.18) pak dostáváme stejným způsobem, jakým jsme z (11.7) dospěli k nerovnosti (11.12), (11.19) i^gkz/l. Liší-li se tedy pravé strany rovnic (11.13), (11.14) „málo" v normě prostom H, liší se příslušná zobecnená řešení „málo" v normě prostoru 11A [a tím také podle (11.6) v normě prostora í/]. Toho je možno využít k odhadu chyby, hledáme-li zobecněné řešení (přesněji: jeho aproximaci) některou z metod, popsaných v následujících kapitolách. Je-li totiž n-tá aproximace u„ e DA zobecněného řešení u0 taková, že prvek (11.20) fn = Aun se liší „málo" od prvku/ v normě prostoru H, pak u„ se liší od uc „málo" v prostoru HA\ přesněji, podle (11.19), jc (11.21) c. c Známc-li tedy konstantu C (viz o tom podrobně v další části této knihy, zejména v kap. 18, 19 a 22; srov. také příkl. 8.9, str. 111), dovedeme podle (11.21) odhadnout v prostoru HA [a tím také podle (11.6) v prostoru fí] chybu, které se dopustíme, nahradíme-li zobecněné řešení u0 jeho aproximací u„. Přitom pravá strana dané rovnice má v aplikacích zpravidla jednoduchý fyzikální význam; např. v případě rovnice desky (viz kap. 23) je pravá strana této rovnice dána funkcí / e L2(G), která •charakterizuje zatížení uvažované desky. Uvážíme-li (11.20), vidíme, že v tomto případě je aproximace u„ „přesným" řešením téhož problému, avsaksjiným zatížení tri, ■daným funkcí /„ místo funkcí/. „Blízkost" funkcí/„ a/v normě prostoru L2(G) umožňuje přednč usuzovat podle (11.21) na „blízkost" řešení m0 a jeho aproximace u„ (v normě prostoru HA). Technikovi však často stačí dokonce jen zběžné porovnání funkcí/, a/k tomu, aby rozhodl, zda aproximace u„ je k účelu, který sleduje, již '} Formálně plyne ovšem tento výsledek odečtením rovnice Aua = f od rovnice Avv = g; formálně proto, žc pokud u0 a va nepatří do DA, nemusí mít symboly Aua, Av0 vůbec smysl. Proto bylo třeba ukázat, že z0 splňuje vztah (11.18), neboť tímto vztahem je definováno, ve smyslu (117), zobecněné řešení rovníce (13.17). dostatečným přiblížením řešení jeho problému; funkce/ totiž bývá dána jako výsledek měření, které samo obsahuje v sobě určitou chybu, jež dokonce může způsobit větší chybu v řešení uvažovaného problému, než je chyba vzniklá nahrazením řešení ií0 jeho aproximací «„. Při této příležitosti je třeba upozornit čtenáře na to, že ne u každé z metod, s nimiž sc seznámíme v následujících kapitolách, je vždy zaručeno, že s rostoucím n konverguje /„ = Au„ k funkci / v prostoru Jí. O tom se na příslušných místech u jednotlivých metod zmíníme. Tato otázka souvisí těsně s vhodnou volbou báze, jejímiž prvky (přesněji; lineárními kombinacemi těchto prvků) řešení aproximujeme; viz o tom zejména v kap. 20. Viz také kap. 44, kde je uvedena metoda odhadu chyby, založená na zcela jiné myšlence. Poznámka 11.3. Jak jsme již dříve naznačili, bude většina metod, které ukážeme v dalším textu, záležel v tom, že sestrojíme jistou posloupnost prvků u„ e HA (zpravidla pťijde o prvky z lineálu DA), o níž dokážeme, že konverguje v prostoru HA k hledanému zobecněnému řešení u0, tj. pro niž bude platit (11.22) lim 0 . V souvislosti s tím si nejprve všimněme této skutečnosti: Jak víme, funkcionáí F nabývá v prostoru HA minimální hodnoty pro prvek u0, definovaný rovnicí (11-7) na str. 142. Z (11.8) pak plyne, že tato minimální hodnota je rovna číslu — |«ó|aj tj. že min Fu — Mi- Definice 11.2. O posloupnosti {u„} prvků z HA řekneme, že je minimalizující profunkcioiiál(11.4)[atedytaképrofunkcionál(11.8)]nebože{u„}je^-posřť>«pnosí, platí-li (11.23) lim Fu„ Tedy fi-posloupnost je taková posloupnost {w„} prvků z IíA, že limita příslušných hodnot FuB funkcionálu F je rovna minimu tohoto funkcionálu v prostoru HA. Z (11.22), (11.23) a ze vztahu (11.8), tj. ze vztahu (11.24) přímo plyne: Fu II« - «o||Í " boWl Věta 11.2. Je-li {u„} p-posfoupnost, pak platí (11.22); Naopak, plati-li (11.22), pak fu,,} je n-posloupnost. 146 II, variační metody 11. minimom funkcionálů F v prostoru HA, zobecněná řešení 147 Důkaz: 1. Je-li {uK} /z-posloupnost, platí (11.23) a z ((1.24) plyne lim \\un - «0j|2 = lim (F«„ + ||«0|;j) = 1 -» 00 ti "4 zO = limFU„ + ||U()j|2 = -ga^g + |^J| = 0, n "tra lim ||u„ - == 0, B~* CO což je vztah (11.22). 2. Platí-li (11.22), plyne z (11.24) limfu„ • - lim ||«„ - «0||2 - [{m:9,|| = -fla,f* , což je vztah (11.23). Dokážeme-lí tedy o některé posloupnosti {«„}, že je /i-posloupnost, plyne z toho podle uvedené věty, žc {u„} konverguje v prostoru HA k zobecněnému řešení «0 rovníce Au — f. Tato skutečnost nám bude užitečná při zkoumání konvergence některých metod, uvedených v dalších kapitolách. Poznámka 11.4. V této kapitole jsme zavedli pojem zobecněného řešení rovnice Au = /. Jako o jeho speciálním případě jsme se v textu za def. 11.1 zmínili o řešení z lineálu DA, které jé zejména v případě diferenciálních operátorů jistou obdobou pojmu klasického řešeni dané rovnice, známého čtenáři např. z klasické teorie parciálních diferenciálních rovnic. Patří-li prvek u0 e HA do DÁ nebo nikoli, závisí zejména na tom, jaký je operátor A a jaký je prvek f na pravé straně rovnice Au = /; podrobněji o lom viz v kap. 46. Všimněme si blíže zmíněných pojmů řešení, zejména v souvislosti s případem, který je pro nás nej zajímavější, tj. v souvislosti s diferenciálními operátory. Poznamenejme nejprve, že i když pojmy „klasické řešení" a „řešení z lineálu DA" jsou v těchto případech velmi příbuzné, nemusí vždy značit totéž. Uvažujme nám již dobře známý Dirichletův problém pro Poissonovu rovnici v rovinné oblasti G s hranicí r, , (11.25) — Au => f v G , (11.26) tt = 0 na F . Klasickým řešením tohoto problému rozumíme funkci u, spojitou v G = G + F, rovnou nule na T a mající v G derivace ô2ujBx2, d2ujtJy2, které v G splňují rovnici (11.25). Za lineál DA = D_& jsme však zvolili lineál funkcí, spojitých včetně parciálních derivací prvního a druhého řádu v G = G + T a splňujících podmínku (11.26). Má-li funkce u být řešením našeho problému a má-li patřit do DA, pak má mít předně všechny právě uvedené vlastnosti funkcí z DA, Na hladkost funkcí z lineálu DA (a tím také na hladkost uvažovaného řešení z DA) klademe zde tedy vyšší požadavky než na hladkost klasického řešení. Důvod (nepříliš podstatný; jde spíše o určité zjednodušení úvah, např. o snadné ověření toho, že jsou splněny předpoklady Greenovy věty 8.7 apod.) jc ten, že na takto definovaném lineálu se veimi snadno dokáží charakteristické vlastnosti daného operátoru, jako je symetrie, pozítivnost atd. Nikterak nevadí, požadujeme-Ii od funkcí z lineálu DA hladkost ještě větší; lze např, ukázat, že konstrukcí uvedenou v kap. 10 dospějeme k témuž prostoru HA, zvolímc-li pro náš problém (11.25), (11.26) místo lineálu funkcí s právě uvedenými vlastnostmi lineál funkcí spojitých včetně parciálních derivací všech řádů v G = G + F a splňujících podmínku (11.26). Na problému (11.25), (13.26) je názorně vidět, že pojem klasického řešení dané úlohy je v obecném případě odlišný od pojmu řešení z lineálu DA. Přesto jsou tyto dva pojmy příbuzné a čtenář si pod pojmem „řešení z DA" může představit jakousi modifikovanou formu klasického řešení. Zobecněné řešení, pokud neleží v DÁ, má v obecném případě vlastnosti podstatně rozdílné od řešení klasického. Jak jsme se zmínili v závěru předcházející kapitoly, mají v případě diferenciálních rovnic druhého řádu s okrajovými podmínkami funkce z množiny Dj v obecném případě v uvažované oblasti jen derivace prvního řádu, a to ještě tzv. zobecněné. Zobecněné řešení nemusí tedy mít v obecném případě (ncžádáme-li dostatečnou hladkost koeficientů dané rovnice apod.) ani derivace toho řádu, jakého je daná diferenciální rovnice. Čtenář zde může namítnout, že pak jde buď o „nerozumné problémy", nebo o špatně koncipovanou definici řešení. Není tomu tak. Diferenciální rovnice, které popisují určité fyzikální jevy, jsou často odvozeny z různých fyzikálních principů (princip mmima potenciální energie apod., srov. str. 126) použitím variačního počtu. Matematicky řečeno, jde tedy o minimalizování určitých funkcionálů. Použitím Eulerových rovnic, známých z variačního počtu, které vyjadřují nutné podmínky pro extrém těchto funkcionálů, dospíváme k diferenciálním rovnicím, které obsahují, abychonl tak řekli „zbytečně", vyšší derivace, než jsou ty, které obsahuje daný funkcíonál. (Viz typický případ rovnice pro pruhy b membrány v [34], str. 15.) Protože nám dobře známý funkciouál F odpovídá v těchto případech právě uvedeným funkcionálům [elastické energii, potenciální energii,1) apod.], je hledání zobecněného řešení daného problému z fyzikálního hlediska přirozenější cestou2) než hledání řešení klasického. V případě diferenciálních rovnic (zhruba řečeno) s dostatečně hladkými koeficienty a dostatečně hladkou pravou stranou / je zobecněné řešení dostatečně hladké. [Např. zobecněné řešení problému (11.25), (11.26) má v (otevřené) oblasti G spojité parciální derivace všech řádů, má-li v G spojité parciální derivace *) Proto se funkckraálu F říká často i v matematické literatuře funkcíonál energie a variačním metodám, založeným na jeho minimalizování, energetické metody. Ve spojitosti s tím nazýváme často skalární součin («, v)A energetickým součinem, normu \\u\\A energetickou normou a prostor HA energetickým prostorem. 2) Známá je Hilbertova teze, že „fyzikální zákony by měly být formulovány nikoli pomoci diferenciálních, nýbrž pomocí integrálních vztahů". 148 II. variační metody všech řádů funkce /.] Na tomto místě nemáme možnost precizovat význam slova „dostatečně" a vrátíme se k této problematice v kap. 46. Poznámka 11.5. Je-li ua e DA a jestliže přitom u0 minimalizuje v HA funkcionál (11.4), pak tím spiše minimalizuje v DA funkcionál (11.3) a podle věty 9.2 je v H řešením rovnice Au = /, Nepatří-li vsak prvek ua, minimalizující v fíA funkcionál (11.4), do DA, pak nemůže rovnice Au = f mít řešení z DA. Důkaz tohoto tvrzení provedeme sporem. Nechť uD £ DA minimalizuje v fíA funkcionál (11.4), tj. funkcionál (11.8), takže platí (11.27) Fu0 = min(|« - uoJ]2 - |n0|p *= -|«c|5. a nechť h, e DA je v H řešením rovnice Au — f. Podle věty 9.2 minimalizuje prvek uy na Iineálu DA funkcionál [Au, u) — 2(f, u), který je pro ue DA totožný s funkcio-nálem F. Tedy (11.28) /-'m, = min (}u - u0\\2A - || «o|jÍ) = l«i - Uo\\2a Protože u, 4= u0 (neboť a.j e DA a u0 f DA)jc jjuj - u.,\A > 0, a tedy podle (11.27) a (11.28) je (11.29) Fu, > Fu0 . Označme (11.30) FuL - Fu0 = 11«! - uJA = a > 0 Avšak DA je hustá množina v HA, takže existuje posloupnost {w„} prvků z D^, konvergující v HA k prvku u0, tj. lim || u„ — u0 (1 -. 0. Existuje tedy prvek u„e DAs dostatečně velkým indexem n tak, že < Pak ovšem je (11.31) m *0|M ~ !%JW Fu0 4- íj = FuL «oU + ^ < "li"" podle (11.30). Tedy funkcionál F nabývá pro prvek u„ e DA menší hodnoty než pro prvek ulr což je spor s předpokladem, že prvek uy minimalizuje funkcionál F na Iineálu DA. Jestíiže tedy prvek «0, minimalizující v HA funkcionál F, neleží v DA, nemá rovnice Au = f řešení z DA. Zobecněné řešení uQ pak pokládáme za řešení daného problému ve smyslu diskutovaném v pozn. 11,4. 11. MINIMUM FUNKCIONÁIA! F V PROSTORU HA. ZOBECNĚNA RliSFNť 149 Poznámka 11.6. (Nehomogenní okrajové podmínky.) Teorie, kterou jsme vybudovali v kap. 9 až 11, předpokládá, že definičním oborem operátoru A je lineál. Také přibližné metody, s kterými se setkáme v následujících kapitolách, budou předpokládat aproximaci řešení daného problému, tj, aproximaci zobecněného řešení uQ, ve tvaru lineární kombinace prvků z tohoto Iineálu, nebo alespoň prvku z prostoru HA, tedy opět prvků z určitého Iineálu. V případě nám již dobře známého Dirichletova problému pro Poissonovu rovnici, tj, problému (11.32) -Au =/ v G, (11.33) m — 0 na F, jsme mohli za výchozí lineál DA zvolit, a také jsme zvolili, lineál funkcí spojitých včetně parciálních derivací prvního a druhého řádu v G = G + f a splňujících podmínku (11.33). Naproti tomu množina M, jejíž prvky tvoří funkce, které splňují sice stejné podmínky hladkosti jako funkce z Iineálu DÁ, ale pro které platí (11.34) u = 2 na F, již není lineálem. Neboť jsou-li u a. v dvě funkce z množiny M, pak na ľ platí u + v = = 4, takže funkce u + v nesplňuje podmínku u + v = 2 na F, a nepatří tedy do množiny M. Podobně množina všech funkcí, splňujících stejné podmínky hladkosti jako funkce z Iineálu DA a vyhovujících podmínce <:u (11.35) ■u na r (dujov je derivace funkce u podle vnější normály), tvoří lineál, zatímco množina funkcí, které splňují tytéž podmínky hladkosti, ale vyhovují podmínce (11.36) du dv — — (u — 3) na f, netvoří lineál. Je tedy otázka, jak do naší teorie zahrnout řešení diferenciálních rovnic s nehomogenními okrajovými podmínkami, jak vůbec formulovat tento problém v podobném tvaru, jako jsme to učinili v této kapitole pro případ, že definičním oborem daného operátoru je lineál, a co rozumět řešením, resp. zobecněným řešením daného problému. Jedno z možných řešení této otázky je zcela elementární: Převést problém s nehomogenními okrajovými podmínkami na problém s homogenními okrajovými podmínkami. Uvažujme jako příklad Dirichletův problém pro Poissonovu rovnici, s předepsanou spojitou funkcí g na hranici F, (11.37) -Au — f \ G , (11.38) « = g na F . 150 II. VARIAČNÍ MtTODY Předpokládejme, že se nám podaří najít funkci w, spojitou v G = G + F, splňující podmínku (11.38) a přitom takovou, že (11.39) -AweL2(G). Hledáme-li řešení problému (11.37), (11.38) ve tvaru (11.40) u = vv + z , dostaneme pro funkci z podmínky (11.41) -Az = /+ Aivv G, (11.42) 2 = 0 na ľ, V (11.37) předpokládáme / e L2(G), podle (11.39) jc Aw e L2(p), takže pro známou funkci h = / 4- Avv platí také ři e L2(G). Problém (11.43) (11.44) -Az — /i v G , 2 = 0 na T je již úloha tvaru (11.32), (11.33), tedy tvaru, o kterém jsme podrobné mluvili v předcházejícím textu. V obecnějším případě jde tedy o tento problém: Je dána lineární diferenciální rovnice (11.45) Au=f s lineárními, avšak nehomogenními okrajovými podmínkami. Tyto podmínky mohou být různého tvaru, např. tvaru (11.38), (11.36) apod.; v obecném případě je předepsáno těchto podmínek na hranici F několik, podle řádu dané diferenciální rovnice. Uvažujme pro jednoduchost případ, že za základní Hilberlův prostor zvolíme prostor L2(G), takže předpokládáme /e L2(G). Předpokládejme dále, že sc nám podaří najít funkci w, která splňuje předepsané okrajové podmínky a je přitom dostatečně hladká, takže na ni můžeme aplikovat operátor A a přitom ještě je Aw e L2(G). Pak tedy pro funkcí h = f - Aw platí h e L2(G). Předpokládáme-li řešení daného problému vc tvaru u = w + z, dostaneme rovnici Az = h s homogenními okrajovými podmínkami. Je-li dále operátor A pozitivně definitní na lineálu DA dostatečně hladkých funkcí, splňujících dané homogenní okrajové podmínky, pak podle předcházejícího textu má tento problém zobecněné řešení z0; zobecněným řešením původního problému s nehomogenními okrajovými podmínkami pak budeme rozumět funkci u0 = w + z„. J 1. MINIMUM FUNKCIONÄLU F V PROSTORU HA. ZOBECNENÁ ŘEŠENÍ 151 K těmto úvahám je třeba poznamenat, že v obecném případě není snadné najít funkci w s dříve uvedenými vlastnostmi, která umožňuje převést problém s nehomogenními okrajovými podmínkami na problém s okrajovými podmínkami homogennimi. Není snadné dokázat ani její existenci, a to ani v případě, kdy jde o jisté zobecnění požadavků kladených na tuto funkci, o kterém se zmíníme v následujícím textu. K těmto otázkám se podrobně vrátíme v kap. 32 a 46. V úlohách praktického rázu, vznikajících z technických nebo přírodovědných problémů, bývá však řešení uvažované otázky zpravidla snadné a často lze tvar hledané funkce u> přímo napsat. Ukážeme jednoduchý příklad: Řešme Dirichletův problém pro Laplaceovu rovnici na obdélníku G (0 < x < a, 0 < y < b) a nechť okrajová podmínka g na hranici P je dána předpisem (11.46) g = sin — pro 0 < x < a , y — 0 , a g = 0 na zbývající části hranice F . Za funkci w zde zřejmě stačí zvolit funkci w = I 1--) sni-, V m a která splňuje podmínky (11.46) a převádí daný problém na problém (11.47) _Az=-^fl-^si»-vG, íi \ b J a (11.48) z = 0 na F , nám již dobře známý, Je-H z0 jeho (zobecnené) řešení, pak řešení původního problému je w0 = >v + zB. Poznámka 11.7. {Nehomogenní okrajové podmínky, druhá formulace.) Uvedeme ještě druhou formulaci problému s nehomogenními okrajovými podmínkami, která je svou koncepcí bližší koncepci zobecněného řešení pro případ okrajových podmínek homogenních. Spokojíme se jen jednoduchým příkladem, neboť na tomto místě nemáme možnost precizovat, jaké vlastnosti má mít funkce >v(x), o níž byla zmínka v předcházející poznámce, a v jakém smyslu má splňovat dané nehomogenní okrajové podmínky. Otázky spojené s touto problematikou budeme, a to značně obecněji, řešit ve čtvrté části naší knihy (viz zejména kap. 34 a 35), až budeme mít k dispozici pojem prostoru W2\G) a pojem stop. V textu této poznámky se tedy budeme na některých místech vyjadřovat poněkud nepřesně. Uvažujme opět Dirichletův problém pro Poissonovu rovnici, (11.49) (11.50) - Au = / v (7 , u = g na F, 152 II. VARIAČNÍ MF.TOOY a nechť w(x) je dostatečné hladká funkce, splňující v G podmínku Aw e L2(G) a na F podmínku w — g. Položíme-li, jako v předcházející poznámce, (11.51) « = iv + z , dostaneme pro funkci z podmínky (11.52) -Az = /+ Aw v G , (11.53) z = 0 na T. Zde tedy jíž jde o homogenní okrajovou podmínku. Označme, jako obvykle, DA lineál funkcí z(x) spojitých s parciálními derivacemi do druhého řádu včetně v G a rovných nule na ľ a A = — A operátor uvažovaný na tomto lineálu. Jak jsme ukázali již v příkl. 8.8 a 8.10, je operátor A na lineálu DA pozitivní, přičemž Jc i=l ox; 8X; (11.54) takže (11.55) M«,«)= f | ^Ydx. Je \0XiJ V kap. 22 ukážeme, že tento operátor je na DA dokonce pozitivně definitní. Příslušný prostor HA z kap. 10 tvoří, zhruba řečeno (jak jsme řekli, precizování některých pojmů a výsledků budeme moci provést až vc tvrté části naší knihy), funkce rovné nule na ľ a mající v G parciální derivace prvního rádu, intcgrovatelné v G s druhou mocninou. Funkcionál (11.56) Gz = (z, z)A - 2(f + Aw, z) , tj. funkcionál (11.57) Gz = í £ (—Y dx - 2 f (/ + Aw) z áx , J c i=i \dxj J0 nabývá v prostoru HA minima, a prvek z0 e HA, realizující toto minimum, je zobecněným řešením problému (11.52), (11.53). Funkce u0 - w + z0 je pak zobecněným řešením problému (11.49), (11.50). Protože pro z e IIA je z = 0 na f, dostaneme formálním použitím Greenovy vety, podobně jako v citovaném příkl. 8.8, f Aw . z dx = — f Y ~ ~ , Je jfji^idXidXi takže funkcionál (11.57) můžeme napsat ve tvaru (11.58) Gz= f í (^ydx-2Í/zdx + 2Í Y— — **- Jc i=i \dXiJ jc Je i=i dx, čx, 153 Tento zápis dovoluje předně zobecnit požadavky kladené dosud na funkci w(x). Z (11.58) je vidět, že stačí volit funkci w(x) tak, aby splňovala podmínku w = g na t a aby měla parciální derivace prvního řádu integrovatelné v G s druhou mocninou1). Za druhé je zřejmé toto: Skalární součin (11.59) 4-, ov oz , Y--—dx t=i dx, dx. byl definován pro funkce v, z z prostoru HA, tedy pro funkce, které splňují podmínku u = 0 a z = 0 na í. Integrál v (11.59) má však smysl pro mnohem širší třídu funkcí, které nikterak nemusí splňovat uvedenou podmínku na hranici. Označme na okamžik tento integrál, uvažovaný pro tuto obecnější třídu funkcí, symbolem ((u. z)), (11.60) ' & m dz Zj--dx. 0 f= 1 3X; BX; Použitím této symboliky je pak možno funkcionál Gz zapsat ve tvaru (11.61) Gz = ((z, z)) - 2(/, z) + 2((w, z)), ze IIÁ , který již mnohem lépe odpovídá naší koncepci než tvar (11.57) [srov. také funkcionál (34.58), str. 434; funkcionál (11.61.) je jeho speciálním případem]. Postup uvedený na tomto jednoduchém příkladě lze snadno rozšířit na případy obecnější. Jednak je však třeba určité opatrnosti při formulaci tzv. nestabilních okrajových podmínek (Neumannovy okrajové podmínky apod.), jednak je třeba zavést určité pojmy, abychom se vyhnuli poněkud nepřesnému vyjadřování, kterého jsme použili v této poznámce. Proto ponecháme řešení těchto otázek do čtvrté části knihy; v této části a v třetí části knihy uvedeme jen některé výsledky, a to s odvoláním na pozdější teorii. Poznámka 11.8. Dosadíme-li z (11.51) do (11.61), dostaneme funkcionál (11.62) G(u - w) = Jí(«) = ((« - w, « - w)) - 2(/, u - w) + 2((w, u - w)) = - ((«, «)) - 2((w, «)) + ((w, w)) - 2(/, u) + 2(f, w) + + 2((w, u)) - 2((w, w)) = ((«, «)) - 2(f, u) - ((w, w)) + 2(f, w). Místo abychom hledali zobecněné řešení problému (11.49), (11.50) ve tvaru ti0 = = w + z0 a funkci z0 našli jako prvek, minimalizující funkcionál (11.61) v prostoru HA, můžeme tedy postupovat tak, že u0 hledáme jako prvek minimalizující funkcionál (11.62) , resp., což je totéž, funkcionál (11.63) Fu = ((u.«)) - 2(/, u) ') Přesněji ve smyslu kap. 30 stačí, aby bylo >v e WQ\G), w = g na ľ ve smyslu stop. 1 54 H. VARIAČNÍ METODY [neboť členy ((w, w)) a (/, w) zůstávají při měnícím se u konstantní]; tento funkcionál má tedy stejný tvar jako funkcionál (11-4), uvažovaný pro případ homogenních okrajových podmínek. Podstatný rozdíl zde je v tom, že funkcionál (11.63) nemíním ali zujeme v prostoru HA, ale [jak vyplývá z (11.51)] v prostoru (dostatečně hladkých) funkcí, splňujících podmínku u = g na P. Poznamenejme při této příležitosti (zmínili jsme se o tom již v předmluvě), že po historické stránce byla vlastně tato úloha zkoumána jako první - a to pro Laplaceovu rovnici, tedy pro případ / = 0: Řešení Dirichíetova problému pro Laplaceovu rovnici, — Au = 0 v G, u = g na P, hledat jako prvek minimalizující Dirichletův integrál na množině dostatečně hladkých funkcí, splňujících podmínku u = g na ľ. Zde také nastaly první obtíže v tom, jak precizovat třídu „dostatečně hladkých funkcí, splňujících podmínku u = g na /'" a jak vhodně rozšířit funkcionál (11.64), aby skutečně nabýval na této třídě minima. Tento problém vyvolal nejprve intenzívní studium problémů nehomogenních diferenciálních rovnic s homogenními okrajovými podmínkami, které vedlo ke konstrukci prostoru 11A a k pojmu zobecněného řešení a později k vybudování obecnější teorie, s kterou se setkáme ve čtvrté části této knihy. Po podrobné diskusi věnované pojmu zobecněného řešení sc nyní obrátíme k metodám, které umožňují najít toto zobecněné řešení nebo aspoň jeho dostatečně blízkou aproximaci. 12, METODA ORTONORMÁLNÍCH RAD 155 Kapitola 12 Metoda ortonormálních řad. Příklad Uvažujme, jako obvykle, Hilbertův prostor H a operátor A, pozitivně definitní na lineálu DA, hustém v H. Nechf IIA je prostor, zkonstruovaný v kap. 10, sc skalárním součinem (u, v)A, který je, jak víme, rozšířením skalárního součinu (u, v)A, definovaného pro prvky z původního lineálu DA vztahem (12.1) (u, v)A = (Au, v) , ueDA, v e DA , na celý tento prostor IIA. V předcházející kapitole jsme ukázali, že funkcionář (12.2) Fu = (u. u)A - 2(f, u), ueIIA, nabývá v prostoru HA minima pro jistý prvek tta, prvkem / jednoznačně určený z podmínky (12.3) (n0, u)A = (/, u) pro každé u e HA . Prvek «0, minimalizující v HA funkcionál (12.2), jsme nazvali zobecněným řešením rovnice Au - f. Řadu vlastností tohoto řešení jsme ukázali v předcházející kapitole. V této kapitole, jakož í v následujících kapitolách ukážeme některé metody, jak toto zobecněné řešení dané rovnice efektivně najít, resp. vhodně aproximovat. K tomu účelu budeme předpokládat, že prostor HA je separabilní. K tomu je postačující, jak je možno očekávat a jak je podrobně dokázáno např. v [30], je-li separabilní prostor H. Zvolíme-li speciálně za prostor H prostor L2(G), což bude častý případ, bude tím zaručena í separabilnost prostoru IIA, neboť prostor !:(G) je (viz větu 4.7, str. 47) separabilní. Připomeňme, že o metrickém prostoru P říkáme, že je separabilní, lzc-li najít nejvýše spočetnou množinu jeho prvků, hustou v tomto prostoru. Podle věty 6.1!, str. 80, existuje v každém separabilním Hilbertově prostoru tzv. báze, tj. nejvýše spočetný lineárně nezávislý systém 02-4) !, 0 lze najít čísla äý- tíik, že platí (12-5) éliy <«=]. t=t Je-li mimoto M některá množina prvků hustá v tomto prostoru, lze v něm vytvořit bázi právě z prvků této množiny (viz str. 81). Podle věty 6.12 lze navíc dosáhnout toho, aby báze (12.4) byla v uvažovaném prostoru ortonormální. 156 II. variační metody Nechť tedy (12.4) je ortonormální báze v HA, vytvořená, chceme-li, z prvků lineálu DA. Pro prvky této báze tedy platí (12.6) . , (0 pro fc # i, ( u _4 množinu funkcí, které jsou spojité včetně parciálních derivací prvního a druhého řádu v G = = G + T a splňují podmínku (12. i 6). Jak víme, jc tento lineál hustý v L2{G) (věta 8.6, str. 106). Jak dále uvidíme (kap. 22, str. 271), jc operátora, daný na tomto lineálu předpisem A = — A, na tomto lineálu pozitivně definitní, takže lze obvyklým způsobem (viz kap. 10) zkonstruovat Hilbertúv prostor HA = J/_4. V tomto případě 158 IL VARIAČNÍ METODY ]2. metoda ortonormálních řai> 159 lze [viz kap. 20, text za rovnicí (20.20), str, 238], zvolit za bázi v tomto prostoru systém funkcí (i2.i7) -™«^*?y? sin-sm —- , m — 1, 2, ..., n — 1, 2,... . Označme tyto funkce takto: (12.18) . . M HJ ~ sm — sin — , a b . 2nx . ity , . irx . 2ity \ji2 = sin -— sin — , \p3 = sin — sin —- . a b a b , . ixx . ny , i/>4 = sin-sm — , ý5 a b 2jix . 2ny , nx . 3ny sm-sin —- , ire = sin — sin- a b a b Postup při očíslování funkcí systému (12.18) je zřejmý: Z funkcí (12.17) vytváříme skupiny, pro nčž je m +• n — í, kde i nabývá postupně hodnot 2, 3, a v každé skupině seřazujeme tyto funkce podle sestupných hodnot prvního indexu m, který tedy v každé skupině nabývá postupně hodnot í — 1, í — 2,..., 1. Tím dostáváme systém funkcí ^s(x, y), s = 1, 2..... Jak víme, je (12.19) a obdobně (12.20) Proto je také (12.21) f . jnx . mnx , sin — sm —— dx J0 a a fcity . nny , sm —- sin —- dy b 0 , je-li m + j , a . - , jen m = ] , 2 0 , jedí n + k , , je-li n = k . jTrx . fary sin —— . / . jn: sin — V a r f . jnx . !; sin — si Jo Jo a f . jitx . mnx . Cb . sin — sm---dx . I si Jo o « Jo mjrx . nny sin — sin — krty . mnx . mry , , sm-sm--sm — dx dy bab kny . nny , sin--sin- dy = b b ab . ,. . v —, ie-li m = i a zároveň n 4 0 v ostatních případech . k, Funkce \j/s zřejmě patří do Iineálu J?_A, takže je Protože 5x2 (. jnx . kny\ j2n sm — sm —- I = -— a b J a2 ô1 ( . jnx . kny\ k2n2 . jn: ----I sin — sin — I =-sin — dy2\ a b J b2 a . jnx . kny sin — sm —- , a b jnx . kny sin —-. b ' je (12.22) J7tx . kny . mnx . nny sm —- sin---, sin-sm — a b a b '"(jy o\a2 k2n2\ . jnx . kny . mnx . nny , , -----1 sm — sin--sin-sin-dx dy b2 J a b a b ab 4 (j2n2 k2n2\ . ,. . . ■ i —-\--_: i je-li m = í a zároveň n = k , \a2 b2 J 0 v ostatních případech Funkce (12.18) jsou tedy v prostoru řř_A ortogonální, neboť pro dvě navzájem rázné funkce tohoto systému je přinejmenším buď j 4= m, nebo k 4= n. Podle (12.22) budou tedy funkce (12.23) . nx . iry sin — sin — . y) sm-sm — dx dy . Podle věty 12.1 konverguje řada (12.28) pro /e L2(G) v prostoru íf_A i v prostoru L2(G). Tím jc problém (12.15), (12.16) řešen. Je-li speciálně f(x, y) = k = konst, je 1 b' , . mnx . nny , , k sin-sni —- dx dy ŕ + b kab T mnx~\a ľ nirvT —---— cos- cos-- n_\ mmt2 \_ u J„L b J0 4kab Í6a2b2k aby. 0 v ostatních případech . mnu' jr^mn^m1 +■ «2íj2) ' je-li m í n liché, Řešení má tedy v tomto případě tvar (12.29) u **** - isr m=i,3,... mníb^m2 + a2n2) 11-1,3.... . mnx . nny sin----sin-. a b K řešení problému (12.15), (12.16) vede řada úloh, např. některé úlohy o potenciálu, úloha o stacionárním rozložení teploty v nekonečném kvádru s nulovou předepsanou teplotou na hranici a s intenzitou vnitřních zdrojů tepla, charakterizovanou funkcí f{x, y), úloha o krouceni prutu obdélníkového průřezu apod. 162 II, variační metody Kapitola 13 Ritzova metoda Budiž stejně jako dříve A pozitivně definitní operátor na Iineálu DA, hustém v sc-parabilním Hubertově prostoru II af eH. Nechť HA je Hilbertův prostor z kap. 10 (tedy také separabilní, neboť H je separabilní, viz str. 155). Uvažujme v prostoru HA bázi (tedy nejvýše spočetný lineárně nezávislý úplný systém) (13.1) Na rozdíl od předcházející kapitoly však nebudeme předpokládat, že tato báze je v HA ortogonální (a tedy tím méně, že je ortonormální). V předcházející kapitole jsme poznamenali, že proces ortogonalizace báze (13.l) a s ním spojené normování vzniklé ortogonální báze, abychom získali bázi ortonormální, je v obecném případě velmi pracný, takže metody ortonormálních řad, uvedené v kap. 12, lze k hledání, resp. aproximování zobecněného řešení našeho problému efektivně použít jen ve velmi speciálních případech, i když myšlenková jednoduchost této metody jc jistě její velkou předností. V této kapitole uvedeme proto další metodu, tzv. Ritzovu, která je zejména v technických aplikacích jednou z nejčastěji používaných metod. Ritzova metoda jc založena na této myšlence: Zobecněným řešením uvažované rovnice Au — f je podle definice ten prvek ua e IIA, který v HA minimalizuje funkcionál (13.2) Fu = («, u)A - 2{f, u) , tj. pro který platí (13.3) Fu0 = min Fu . Zvolme přirozené číslo n a hledejme aproximaci u„ prvku u0 ve tvaru n (13.4) u„ = £ at„) nabýval funkcionál F nejmenší hodnoty právě pro aproximaci (13.4). Podle předpokladu je (13.1) báze v IIA, takže zobecněné řešení u0 lze s libovolnou přesností aproximovat vhodnými lineárními kombinacemi jejích prvků. Mimoto podmínka (13.5) je analogická podmínce (13.3). Lze tedy intuitivně očekávat (a ve větě 13.1 to potvrdíme), že pro dostatečně velké n se bude (13,4) s konstantami, určenými podle (13.5), dostatečně málo lišit v HA od hledaného řešení a0. Určení konstant ak v (13.4) je poměrně snadné (to je také podstatnou předností Ritzovy metody), viz soustavu (13.11). Dosadíme-li totiž (13.6) za u do (13.2), dostaneme nejprve (13.7) Fv„ - (btVi + ... + b„ 9i)a b] 4- ()a ^2^1 + ((Pz, <í>i)a b\ + ... + (q>2, (p„)A bzb„ 4- + (w A + ... + („)x bl --- 2(/, q,,) b, - 2(f, 2 + ... 4- 2(2) b2 - .. 2(f, „) K - Protože skalární součiny (,) = 0, 2(2, 92)a a2 + ... + 2((p2, i, ViXtii + ( d". = (/. Pl)' ( 9z)a ai + fyi, 9»J > Wi, 9«)a a i + (•,...,j)A > 0, atd.] Poznámka 13.1. Je-li speciálně báze (13.1) ortonormální v HA — její prvky pro tento případ označme (13.12) pak je a soustava (13.11) má tvar {13.13) 0 pro i 4= k , 1 pro i — k «i = (/. 9i) » «2 - (f, 9i), V tomto případě dává tedy Ritzova metoda aproximaci u„ ve tvaru součtu (13.14) prvních n členů řady (12.12) [s koeficienty (12.13)], s kterou jsme se seznámili při použití metody ortonormálních rad v předcházející kapitole. Této skutečnosti lze jednoduchým způsobem využít k důkazu toho, že tzv. Ritzova posloupnost, tj. posloupnost aproximací u„, daných vztahem (13.4), s konstantami ak, určenými soustavou (13.11), konverguje v prostoru HÁ (a tím také v prostoru H) k zobecněnému řešení u0 rovnice Au =/: Předpokládejme, že na bázi (13.1) aplikujeme v prostoruHA proces ortonormalizace, popsaný v kap. 5, str. 61, takže dostaneme ortonormální bázi, kterou podobně jako dříve označíme (13.15) Wh 2, Z procesu ortonormalizace, popsaného v citované kapitole, plyne, že prvky báze (13.15) jsou (jednoznačně určenými) lineárními kombinacemi prvků báze (13.l), a naopak, podrobněji, že platí (13.16) (13.17) ,, tp„, tj. všechny prvky tvaru (13.6), kde b„ jsou libovolné reálné konstanty, tvoři určitý lineál — označme jej M. Protože prvky !,q>„ jsou vzájemně jednoznačně přiřazeny prvkům „, tj. všechny prvky tvaru (13.18), kde jsou libovolné reálné konstanty. Podmínkou (13.5) je dána úloha najít ten prvek u„ z lineálu M, pro který funkcionál F nabývá na tomto lineálu svého minima. Tato úloha má, jak jsme viděli, jediné řešení — konstanty ak z (13.4) jsou soustavou (13.11) jednoznačně určeny. Také podmínkou (13.19) je dána úloha najít prvek z„, minimalizující ľunkcionál F na lineálu M. Protože i tato úloha má jediné řešení, nemůže být z„ 4= «„■ Tedy platí (13.22). Posloupnost (13.20) je však posloupností částečných součtů řady (13.23) která jc nám známa (s poněkud jiným označením) /. předcházející kapitoly a která má v HA součet u0, takže také posloupnost (13.4) s konstantami, které jsou určeny soustavou (13.11), konverguje v prostoru 11A k prvku w0. Platí tedy; Věta 13.1. Nechť A je pozitivně dejinitní operátor na lineálu DÁ hustém v separa-bilním HUbertově prostoru H a nechť f s H. Nechť dále m, pak (13.24) ||"» - "o|U š ||«„ - "o| Jak jsme totiž v pozn. 13.1 ukázali, je u„ = z„ [viz (13.22)]. Ale podle kap. 12 je (s označením použitým v pozn. 13.1) (13.25) a podle (13.22) je (13.26) "o - E aía plyne z (13.27) 0 pro i \- k, 1 pro i = k , (13.28) IIZ V 2 "■•U = L «* S rostoucím n tedy norma \\u0 - u„\\A klesá nebo aspoň neroste, odkud ihned píyne (13.24) pro n > to. Zvětšíme-3i tedy v Ritzově metodě n, zlepšíme (nebo alespoň nezhoršíme) tím v metrice prostoru IIA přiblížení zobecněného řešení u0 uvažované rovnice aproximací (13.4). Všimněme si, že při volbě vyššího n se původně vytvořená soustava (13.11) jen rozšíří, dříve vypočítané skalární součiny na levých i pravých stranách uvažovaných rovnic zůstanou použitelné i u rozšířené soustavy, k jejíž matici tedy jen přidáme další řádky a sloupce, a na pravé straně vypočteme další skalární součiny. Stejně tak, spokojíme-li se z nějakého důvodu nižší aproximací, než kterou jsme původně zamýšleli, stačí v soustavě (13.11) jen vyškrtat příslušné neznámé a příslušné rovnice. To je další vlastnost Ritzovy metody, významná po numerické stránce. \ 58 II. variační metody Poznámka 13,5. Jak jsme se zmínili již v předcházející kapitole, je bázi v prostoru HA možno volit z prvků lineálu DA, neboť tento lineál jc v tíÁ hustý. Pak ovšem (i, o„) u„ = (f, Oi) , (/tfp;. <.<„)<: i + (I'??, e>„) a2 + ■-■ + (:1#«, v + z0 , kde w(x) je funkce splňující danou nehomogenní okrajovou podmínku na hranici, pak, použijeme-Ií symboliky zavedené v citované pozn. 11.7, minimalizuje funkce z0 v prostoru HA funkcioiiál (13.31) m = ((z, z)) - 2(f, 2) + 2(fw, z)) = = (z, z)A m 2(f, z) + 2((tv, z)) = Jo «-£ VxJ J c h «-1 CX. ČXi Minimalizujeme-li tento funkcionál Ritzovou metódou, takže předpokládáme opět aproximaci z„(x) funkce z0(x) ve tvaru z„ = Z ak2, ■ ■ - je báze v prostom IIAt dostaneme pro neznámé konstanty ak snadným výpočtem soustavu (13.32) [2, %)^ «» = (/> '/>:) - ((*'- f z)) > (m &§ji a„ = (/, (pn) « ((»'. a splňujících podmínky (13.34), je na tomto lineálu pozitivně defiuitní. Podle kap. 20, sir. 239 a 237, je možno za prvky báze zvolit funkce (13.35) m = 1 - x\ .<*) funkcí (13.35) lze totiž napsat ve tvaru (13.38) u(x) = Í! + z(x), kde v(x), resp. z(x) obsahuje jen liché, resp. sudé funkce z (13.35). V daném případě je zbytečné uvažovat v Ri tzově posloupnosti {w„(x)} Členy s nenulovou lichou častí v„(x), neboť o limitě posloupnosti {v„(x)} v prostoru IIA [i v prostoru L2(— 1, l)] víme předem, že bude nulová, protože řešení je sudá funkce. V tomto případě tedy potřebujeme jen „bázi vzhledem k sudým funkcím". I) Rozumíme tím sudá v intervalu <• 1, 1), popř. až na množinu bodů míry nula. 170 II. variační metody 14. GALĽRKINOVA METODA 171 Obdobnou úvahu lze provést i v případě problémů z parciálních diferenciálních rovnic. Jde-li např. o rovinný problém a je-li zřejmé, že řešení bude funkce sudá v proměnné x a lichá v proměnné y, stačí bázi vytvořit jen z funkcí týchž vlastností. Numerické příklady na použití Ritzovy metody uvedeme zejména v kap. 21 á 26. Pokud jde o použití Ritzovy metody při řešení problému vlastních čísel, viz zejména kap. 40, 41. O metodě konečných prvků, která úzce souvisí s Ritzovou metodou, viz v kap. 42. Kapitola 14 Galerkinova metoda Uvažujme separabilní Hilbertův prostor H a množinu M jeho prvků, hustou v H. Podle věty 6.18, sír. 82, víme, že platí-li pro některý prvek u (14.1) (k, u) = 0 pro každé ve M, pak že odtud plyne u = 0 v H. Budiž nyní (14.2) 9u u = 0 v 17 . Podle predpokladu je totiž (14.2) báze v tí, takže množina jV všech prvků tvaru (14.4) £ ak k=l kde n je libovolné přirozené číslo a ak jsou libovolná reálna čísla, je hustá v H. Protože platí («. k) = 0 , k = l,...,n, analogické podmínce (14.6). Podmínka (14.9) představuje n rovnic pro n neznámých konstant at, «„.') V případě, že operátor A je lineární, nabude podmínka (14.9) tvaru (14.10) (a,^ + ... + anA„, ;)] a použijeme-Ii dříve zavedeného skalárního součinu (u, v)A — (Au, t;), můžeme soustavu (14.11) zapsat ve tvaru (14.12) (i), (2 = Í^Xi 02 + ... + ( „).< A„ = (/, a„, jednoznačně určenými podmínkou (14.9), konverguje v HA (a tedy také v H) k zobecněnému řešeni uv rovnice Au = f. Numerické příklady viz v kap. 21 a 26. Poznámka 14.1. V případě pozitivně defmitních operátorů nepřináší Galerkinova metoda v porovnání s Ritzovou metodou nic nového; obě metody vedou k řešeni týchž soustav lineárních rovnic a týmž posloupnostem přibližných řešení. Možnost použití Galerkinovy metody je však mnohem širší než metody Ritzovy. Galerkinova metoda, charakterizovaná podmínkou (14.9), neklade předem žádné podstatně omezující podmínky na operátor A; není nikterak třeba, aby operátor A byl pozitivně definitní, nemusí být ani symetrický, dokonce nemusí být ani lineární. Formálně můžeme tedy Galerkinovy metody použít i v případě velmi obecných operátorů. Jak ovšem lze očekávat, jsou příslušné úvahy týkající se řešitelnosti soustavy (14.9) (která popř, není ani lineární) a konvergence Galerkinovy posloupnosti (v některém vhodném prostoru) v obecném případě obtížné. (Viz také Michli-novu knihu [28].) Poznámka 14,2.1 když Ritzova a Galerkinova metoda vedou pro případ lineárních pozitivně definítních operátorů k týmž výsledkům, jsou prcce jen základní myšlenky těchto metod zcela různé a formálně jsou různé i soustavy rovnic (13.11) a (14.11), k nimž tyto metody vedou. Zřetelně je rozdíl v celé koncepci vidět např. na běžném inženýrském přístupu k řešení klasických problémů pružnosti. Uveďme jednoduchý příklad: Řešme úlohu o práhybu u(x) nehomogenního prutu proměnného průřezu, délky /, na obou koncích vetknutého a namáhaného příčným zatížením q(x) (vizpříkl. 9.1, str. 123). K řešení této úlohy přistupují inženýři zpravidla dvojím způsobem. Buďto vyjdou z příslušné diferenciální rovnice (14.13) lE(x)l(x)u"]" = q(x) s okrajovými podmínkami (14.14) h(0) = w'(0) = 0 , u(í) = u(l) = 0 , nebo na třídě dostatečně hladkých funkcí, splňujících podmínky (14.14), minimalizuji „funkcionál energie" tm |' vyjadřující celkovou potenciální energii deformace namáhaného prutu (srov. citovuný příkl. 9.1). Elu"1 ůx- qudx 34. galerkinova metoda 173 Hledáme-li přibližné řešení daného problému ve tvaru n (14.16) «« - I «i.9k i, *=i kde funkce '{)" q>l dx + a2 j (Eltpl)" (p, dx 't ri n ri a, (Etyl)" „ dx = q"2q>ldx — J qp2 dx , «i í EIl, >p2, ■•■ ■ Podmínky (14.9) mají pak tvar (Au„ - /, ýk) = 0 , k=l,...,H. Podrobně o této modifikaci Galerkinovy metody a o některých jejích přednostech viz např. v [10], Poznamenejme ještě, že zatímco rovnice (13.11) Ritzovy metody vyjadřují podmínku stacionární hodnoty funkcíonálu na podprostoru, vytvořeném prvky Olze najít přirozené číslo m a konstanty cL, ...,cm tak, že platí (15.4) \\tckA9k-f\\ * = i čili, protože operátor A je lineární, (15.5) ||íi«iWk)-/|| <ň.t) Metoda nejmenších čtverců záleží v tom, že uvažujeme přibližné řešení u„ (tj. aproximaci zobecněného řešení) rovnice Au = / ve tvaru (15.6) w„ = £ ak„ = Z h2) at 4- (A 0 lze najít přirozené číslo m takové, že pro všechna n > m platí ;|«„ - «o|U < «• Zvolme tedy c > 0. Operátor A je podle předpokladu na lineálu DA pozitivně definitní, existuje tedy konstanta C > 0 tak, že je (15.10) ä Clu II pro každé ueHA. Přitom pro každou aproximaci u„ e DÁ zobecněného řešení u0 rovnice Au = / platí podle (11.21), str. 144, (15.11) K - ua\\A á l\Au'-fW . Stačí tedy dokázat, že výraz \\Au„ — /|j lze učinit libovolně malý, je-li íi dostatečně velké. Označme (15.12) n = Cc. 1) HA je prostor zkonstruovaný v kap. 10. K tomuto t\ lze najít číslo m a konstanty Cj,c„ tak, že platí (15.5). V lineární kombinaci : I h m a uičíme-li konstanty ak v (15.6) tak, aby bylo splněno (15.7), bude též (15.16) II A{ak 0 existuje m tak, že pro každé n > m platí pro (15.6) s konstantami, které jsou určeny podmínkou (15.7), (15.17) a tedy podle (15.11) \Au. < n = Cs , což jsme měli dokázat. Mimoto z (15.17) plyne lim Au„ - f v H . Tim jsme dokázali tuto větu: Věta 15.1. Nechť A je pozitivně definitní operátor na lineálu DA, hustém v sepa-bilním Hubertové prostoru H, f e H. Nechť posloupnost (15.3) tvoří bázi v H. Pak posloupnost prvků u„, daných předpisem (15.6), s konstantami ak, jednoznačné 178 II. VARIAČNÍ METODY 15. METODA NEJMENŠÍCH ČTVERCŮ 179 určenými podmínkou (15.7) [viz soustavu (15.9)], konverguje v HA, a tedy také v H, k zobecněnému řešení u0 rovnice Au =/. Mimoto platí lim Au„ = f v H . Poznámka 15.1 Zmiňme se stručně o některých přednostech a nevýhodách metody nejmenších čtverců, zejména v porovnání s Ritzovou metodou. Protože posloupnost {w„}, získaná metodou nejmenších čtverců, konverguje v HA k zobecněnému řešení u0 rovnice Au ~ f, je podle věty 1! .2, str. 145, /j-posloup-ností pro funkcionál (15.18) tj. platí Fu = (u. u)A - 2(f, u) , lim Fu. ■ min Fu Označme {vn} Ritzovu posloupnost (kap. 13), sestrojenou při stejné voibě báze (15.2), při které byla sestrojena posloupnost {«„}. [Podle věty 20.1 je (15.2) báze i v HÁ^\ Jak víme, Ritzova posloupnost {»„} je také posloupnost prvků tvaru (15.6), avšak na rozdíl od posloupnosti {«„}, získané metodou nejmenších čtverců, jsou příslušné koeficienty určeny podmínkou '• Fvn — min (srov. kap. 13). Odtud přímo vyplývá, že pro každé n je Fv„ ^ Fu, , čili, píšeme-Ii funkcionál (15.18) ve tvaru Fu = 1« - Holi - Wľ, viz (11.8), str. 142, že 05.19) H - u0\\A £ \\u„ - u0\\A . Z (15.19) plyne, že při téže volbě báze konverguje Ritzova posloupnost v prostoru HA rychleji (nebo přinejmenším stejně rychle) k zobecněnému řešení u0 rovnice Au = f než posloupnost {uB}, sestrojená metodou nejmenších čtverců. Mimoto nemusí být v případě Ritzovy metody prvky báze voleny z DA. Na druhé straně předností metody nejmenších čtverců je, že pro ni platí jak tak (15.20) ua v H. Au„ -*f v H , což umožňuje provést [známe-li konstantu C z (15,10)] poměrně snadný odhad chyby podle (15.11). Je-li II - L2[G), lze mimoto v některých jednoduchých případech dokázat na základě (15.20) stejnoměrnou konvergenci na G posloupnosti {un} k hledanému řešení. Viz např. [30], str. 47, kde je užitím Greenovy funkce dokázána na G stejnoměrná konvergence posloupnosti {«„} pro případ Dirichletova problému s nulovými okrajovými podmínkami pro Poissonovu rovnicí — Au = f sfeL2(G). Poznámka 15.2. Určitou kombinací Ritzovy metody a metody nejmenších čtverců je Courantova metoda. Nechť je předem známo, že zobecněné řešení u0 rovnice Au = f patří do DA. Sestrojme funkcionál (15.21) Fu = Fu + \\Au -/|[2 , ueDÁ kde F je funkcionál (15.18). Funkcionál F nabývá na DA minima právě pro u = u0 neboť pro u = u0 je Fu na DA minimální podie věty 9.2, str. 121, a také [Au — f\\2 je pro u = u0 minimální, neboť \AuB — f \ =0. Úloha najít řešení u0 rovnice Au = f je tedy ekvivalentní úloze najít v DA prvek u0 minimalizujíc! funkcionál (15.21). Z tvaru funkcionářů F je vidét, že jeho minimalizování v DA (např. Ritzovou metodou) bude pracnější než minimalizování samotného funkcionálu F, resp. \\Au — j~\\2. Zároveň však Courantova metoda spojuje v sobě výhody Ritzovy metody a metody nejmenších čtverců, což má, jak lze ukázat, příznivý vliv na rychlost konvergence, popř. její typ. Speciálně, sestrojímc-Ii pro funkcionál F minimalizující posloupnost, např. Ritzovou metodou, bude zřejmě opět (15.22) Au» ► / v II pro n -> co , což umožňuje v některých jednoduchých případech provést obdobné úvahy o stejnoměrné konvergenci, o nichž jsme se zmínili dříve. Je-lí II — L2(G) a je-li známo, že u0 a také / jsou v G dostatečně hladké funkce, je místo funkcionálu (15.21) možno uvažovat funkcionál (15.23) Fu + Z ú*(Au k V tomto případě bude numerický výpočet, vedoncí k aproximaci u„ (např. Ritzovou metodou), zřejmě značně pracný, zato konvergence posloupnosti {u„} bude velmi rychlá. Zejména ze vztahů (15.24) ó*(Au„ -/) dx\l... dx% 0 v H pro n-*co, analogických vztahu (15.22), lze pak činit odpovídající závěry pro stejnoměrnou konvergenci derivací hledaného řešení v uvažovaném oboru. Podrobně o tom viz např. v [28], str. 101. 180 II. VARIAČNÍ METODY Poznámka 15.3. Abychom mohli formálně použít metody nejmenších čtverců, není zřejmě nutné, aby operátor A byl na DA pozitivně definilní. S podobnou poznámkou jsme se setkali již u Galerkinovy metody. Je-li operátor A obecnější, je ovšem problematika, která se týká otázek jednoznačného určení konstant ak v (15.6) podmínkou (15.7) a konvergence příslušné posloupnosti {«„} (ve vhodném prostoru), značně obtížnější. Lze ukázat, viz např. [28], sir. 455, že obě otázky lze zodpovědět kladně, přičemž konvergencí posloupnosti {u„} rozumíme konvergenci v prostoru H, jsou-li splněny tyto předpoklady: 1. Operátor A je lineární a DA je iineál hustý v H. 2. Posloupnost (15.3) tvoří bázi v H. 3. Rovnice Au = f, f e H, má v H řešení u0 e DA. 4. Existuje kladná konstanta K taková, že pro každé u c DA jc (15.25) \\Au II = Kh\ Poznámka 15.4. Z (15.25) plyne ovšem zároveň jednoznačnost řešení. Rovnice Au = 0 má totiž v důsledku (15.25) jediné řešení u — Qy H. [Kdyby bylo Au — 0 pro m 4= 0 v H, bylo by \\Au\\ = 0 a jju|| 4= 0, což je spor s (15.25).] Kapitola 16 Metoda nej většího spádu. Přiklad Ukážeme ještě jednu metodu přibližného řešení rovnice Au = f, vhodnou v případě, žc A je pozitivně definitní operátor, tzv. metodu nejvěišího spádu. Tato metoda je vhodná pro omezené operátory (dcf. 8.13, str. 100), tedy nikoli pro diferenciální operátory. Typickým příkladem rovnic, k jejíchž řešení je výhodné aplikovat tuto metodu, jsou integrální rovnice. Nechť A je pozitivně derinitní operátor v Hilbertově prostoru ff.1) Nechť/e H a nechť ua je v H řešením rovnice (16.1) Au -/. 1) Je-li operátor A omezený a pozitivnĚ definilní jen na lineálu DA, hustém v H, lze jej snadno rozšířit (viz např. [26]) na celý prostor // se zachováním normy i pozitivní dcfinitnosti. 16. METODA NEJVĚTŠÍHO SPADU 181 Jak víme z věty 9.2, str. 121, minimalizuje prvek u0 v H funkcionál (16.2) Fu - (Au, u) - 2(/, w) Tato skutečnost umožňuje následující geometrickou představu, na níž je založena metoda popsaná v této kapitole: Funkcionál F nabývá pro každé u e H určité hodnoty. Geometricky si tedy můžeme tento funkcionál představit jako určitou „plochu" nad prostorem H, která nabývá „nejmenší souřadnice" právě pro u ~ u0. Po léto ploše se budeme chtít od výchozího bodu pokud možno nejrychleji, a to ve „směru jejího největšího spádu", přiblížit bodu, který má tuto souřadnicí „nejmenší". Zvolme určily prvek uy e fí. Je-li Aux = /, je daný problém řešen. V opačném případě je Aut - f 4= 0 v H a prvek u, budeme pokládat za první aproximací hledaného řešení. Najděme v II takový prvek t?,, pro který platí (16.3) 1^1=1^-11 (16.4) ■—/■(«! ■+ tVy) = max .') dt t-0 Avšak je (16.6) F(«, + re,) = (A(uL + tvL), u, 4- řt>,) - 2(/, u, + (»,) = - (Auu u,) + 2t(Auu v,) + r(Avs, Uj) - 2(/, Ut) - - 2t(f, Ví) = Fut + 2t[Aux - f, t>,) + t2(Avu o,) (16.7) Pro í = 0 je (16.8) dt F{u, + tu,) = 2(Au1 - f,V!) + 2t(Avit «,) . dí f(«i + í«i) = 2(Aut -f, . Z požadavků (16.3) a (16.4) pak zřejmě plyne (16.9) Ví=AUl-f 1) Geometrická interpretace: Prvky tvaru (16.5) H=° «1 + fu, , kde t probíhá všechna reálná čísla, tvoří v //„přímku spojující body «j a ut | Vrátíme-li se k představě funkcíonálu f jako plochy nad prostorem //, pak nad přímkou (16.5) můžeme funkcionál F interpretovat jako „křivku" na této ploše. Hledáme takový prvek tij e H, a tím tedy takový „smčr", aby v bodč u = u, měla tečna této křivky největší spád. To je geometrická interpretace podmínky (16.4). K určení prvku o, je ještě třeba znát jeho normu. Aby výsledek byl co nejjednoduäíí, předepíšeme ji podmínkou (16.3). 182 II. VARIAČNÍ METODY [neboť při předepsané normě (16.3) prvku », bude skalární součin na pravé sírane (16.8) největší pravé pro vL = Au^ /]. Zároveň z (16.6) a (16.7) je vidět, že při této volbě prvku e, bude funkcionál F nabývat na „přímce" « = uí + tvt minimální hodnoty pro (16.10) ř=(l_(^p^,.^\. Za druhou aproximaci řešení vezměme prvek (16.11) «2 = tí, + ÍJ.C! . Je-li 4= /, pokračujeme stejným způsobem dále, tj. sestrojíme podobně jako v (16.9) a (16.11) prvky (16.12) v2=Au2-f (16.13) kde (16.14) m3 = «2 + t2V2 (Pjt. H) (Av2, t)2) atd. Tím dostaneme posloupnost prvků «„ u2, w3,.... Nechť maAÍ jsou takové kladné konstanty, že (16.15) m|«2| i (vit/, u) á JWluf pro každé ueH. Pak lze ukázat (viz např. [28]), že posloupnost {«„} konverguje k řešení u0 dané rovnice v prostoru fí i v prostoru HÁ se skalárním součinem («, «)„ = (Au, v) a že platí odhad (iů-16) k« - «olU ^ - "o^(^7^j • Přiklad 16.1. V prostoru H = L2(0, n) uvažujme integrální rovnici (16.17) u(x) - 0,11 sin (x + s) u(s) ds = ít(x) , kde hGL2(0,7t). Operátor (16.18) Au = u(x) - 0,1 j" sin (x + s) u(s) ds 16. METODA NEJVĚtSÍHO spádu 183 je předně zřejmě v L2(0, %) symetrický, neboť platí (16.19) (Au, ,)=[ ^ii(x) ~°aJ sin (x + s) u(s) dsj v(x) dx = = u(x) v(x) dx — 0,1 I I sin (x + s) u(s) v(x) ds dx = Jo J o J a = u(x) v(x) dx — 0,1 sin (x + s) v(s) u(x) ds dx — Jo Jo Jo = j ^v(x) — 0,1 j" sin (x 4- s) v(s) díj u(x) dx = (Av, u) . Dále je podle (16,19) (16.20) (Au, u) - \u\x) dx - 0,1 í í sin (x + s) u(s) u(x) ds dx . Jo JoJo Ale podle Schwarzovy nerovnosti (viz str. 38) platí pro každé dvě funkce /€L2(0,5t), 0fc-L2(O,Jt) (16.21) K"/(x) ff(x) dxj S dx . JV(x) dx . Odtud dostáváme, položíme-li f(x) = J sin (x + s) u(s) ds , g(x) = u(x) , (16.22) H* ľj^sin (x + s) w(s) dsj . «(x) dxj g ~ Í Lf ^ + ^ dX Í Použijeme-ii znovu Schwarzovy nerovnosti, dostaneme (16.23) y sin (x + s) a(s) dsj S | sin2 (x -+ s)ds. j*V(s) ds « - ľ - [1 - cos 2(x 4- s)] ds . fV(x)dx = - [V(x) dx . Jo2 Jo 2j0 184 Dosadíme-li do (16.22), bude ľj f sin (x + s) tí(s) ufx) ds di 11. variační metody eiii (16.24) jj" ľ sin (x + s) u(s) u(x) ds dx Z (16.24) a z (16.20) plyne 72 j"V(x) dx u2(x) dx . (16.25) 0,1 jr J 2 O.lít odkud předně vyplývá, neboť zřejmě je 1 — > 0, pozitivní definitnost operátoru (16.18) na prostoru L2(0,7t). Dále, rer- nosti (16.25) jsou nerovnosti typu (16.15). Jestliže tedy k řešení rovnice (16.17) použijeme metody nejvělšího spádu, dostaneme konvergentní proces. Jako příklad pro numerický výpočet zvolme /t(x) = 1 v intervalu <0, ti). Řešíme tedy rovnici (16.26) u(x) - 0,1 sin(x 4- s) u(s)ás = 1 Vzhledem k „malosti" koeficientu 0,1 u druhého členu dané rovnice bude zřejmě vhodné zvolit za první aproximaci řešení pravou stranu dané rovnice, tj. funkci (16.27) «;(x) = 1 v <0,rc> . Podle (16.9) určíme nejprve (16.28) ifj = Auí - f = = 1 - 0,1 J" sin (x + s) . 1 . ds - 1 = 0,l[cos (x 4- í)]J = -0,2 cos x . Dále podle (16.10) je (16.29) ti -Avšak (16.30) (p„ t-,) = 0,04 cos2 x dx = 0,04 . - - 0,02rt Jo 2 (Avu v,) (16.31) 16. metoda n El většího sfadu (Avlt t>,) = J j^—0,2 cos x + 0,02 j* sin (x + s) cos s dsj . . (-0,2) cos xdx = = 0,04 J cos2 xdx - 0,004 . . J" ^j* i[sin x 4- sin (x + 2.s)] d.?^ cos x dx = 185 - n 2j0S = 0,04 .-- 0,004 . - I sin x cos x dx = 0,02tu , 2 2 neboť síti (x + 2s) ds = 0 . ■1 . Dosazením (16.30) a (16.31) do (16.29) dostaneme _ 0,02n 1 ~ 0,02ít Podle (16.11) je tedy druhá aproximace řešení (16.32) u2 = «i 4- íji), = 1 4- 0,2 cos x . Tato aproximace je podle (16.16) v prostoru IIA nejméně [(M + m)j(M — m)]'-krát, tj. nejméně čtyřikrát') lepší než aproximace «j. Celý příklad je ovšem jen ilustrativní a zvolili jsme jej proto, abychom mohli posoudit efektivnost metody. Protože platí sin (x 4- s) = sin x cos s 4- cos x sin s, je zřejmě jádro rovnice (16.17) degenerované, takže její řešení je možno hledat ve tvaru w(x) = h(xj 4- c, sin x + c2 cos x . Hledámc-li řešení rovnice (16.26) ve tvaru (16.33) u(x) = 1 + c, sin x 4- c2 cos x , dostaneme dosazením do (16,26) podmínku Či sin x + c2 cos (sinx cos s 4- cos x sin s) (l 4- c, sin.? + c2 cos s) ds = 0 . I) Je totiž M 4- m 2 J2 1,41 M-m 0,1* 0,17t 0,32 II, VARIAČNÍ METODY Provedeme-Ii integrování a porovnáme-li koeficienty u lineárně nezávislých funkcí sin x a cos x, dostaneme 1 2 ci ) = 0 , h - o. odkud pro neznámé koeficienty qa^ plynou hodnoty 0,0l7t 0,2 c, —-——■-r , c, 1 - 0,002 5rt2 ' 1 - 0,002 Sk1 Podle (16.33) je tedy řešení rovnice (16.26) (16.34) u(x) = 1 + — 0,01ir 0,002 5n2 sin x + 0,2 1 - 0,002 5jc2 Protože čísla 0,002 5n2, resp. 0,0In jsou malá ve srovnání s čísly 1, resp. 0,2, je shoda aproximace (16.32) s řešením (16.34) zřejmě velmi dobrá. Kapitola 17 Shrnutí kapitol 9 až 16 Obsah druhé časti této knihy, tj, kap. 9 až 16, je poměrně bohatý. Pokládáme proto za účelné shrnout v této kapitole hlavní výsledky druhé části a umožnit tím čtenáři rychlejší orientaci v této problematice. V inženýrských problémech a v problémech matematické fyziky se velmi často setkáváme s rovnicemi typu (17.1) Au = f, kde / je prvek některého Hilbertova prostoru H a A je určitý operátor, nejčastěji pozitivní, resp. pozitivně definitní na některém lineálu DA, hustém v H. V případě problémů z diferenciálních rovnic s okrajovými podmínkami (na řešení těchto problémů je především, i když ne výlučně, zaměřena tato kniha), volíme nejčastěji H = = L2(G); Da je pak lineál některých dostatečně hladkých funkcí (na něž lze tedy aplikovat operace derivování, dané uvažovaným diferenciálním operátorem), 17. SHRNUTÍ KAPITOL 9 AŽ 1 6 187 vyhovujících daným okrajovým podmínkám (popř. jiným požadavkům). Řešením rovnice Au = f v prostoru H pak rozumíme takový prvek u0 e DA, pro který platí (17.2) Au0 = / v H . Je-li např. H — L2(G), znamená Aua=f\ L2(G), že tato rovnost je splněna skoro všude v G. Je-li A pozitivní operátor na lineálu DA, pak rovnice Au = f má v H nejvýše jedno řešení, tj. nemohou existovat dva různé prvky ti,, w2 z DA tak, aby byly splněny rovnice Auj — f v H a Auz =f\H. To je obsahem tvrzení věty 9.1. Hlavním obsahem kap. 9 je véla o minimu kvadratického funkcionálu (věta 9.2); podle ní je pro pozitivní operátor A úloha najít řešení u0 e DA rovnice Au — f ekvivalentní úloze najít v DA prvek u0, minimalizující v DA funkcionál (17.3) Fu = (Au, u) - 2(f, u) Věta 9.2 je zásadního významu, neboť úlohu řešit danou rovnici převádí na úlohu najít prvek u0, minimalizující v DA funkcionál (17.3), pro jejíž řešení (resp. přibližné řešení) jsou vypracovány poměrně jednoduché numerické metody. Věta 9.2 však netvrdí nic o existenci řešení u0 dané rovnice, resp. o existenci prvku u0, minimalizujícího v DA funkcionál (17.3). Lze také skutečně uvést řadu dokonce jednoduchých příkladů, kdy rovnice Au — f nemá řešení «0 g Da, a kdy tedy ani problém najít v DA prvek u0, minimalizující funkcionál (17.3), nemá řešení. Pak ovšem úloha aproximovat např. Ritzovou metodou toto neexistující řešení, ztrácí smysl. Jednoduchou myšlenkou, jak tuto obtíž překonat, je uvažovat funkcionál F na Širším oboru, než je lineál DÁ. Proto jsme za předpokladu, že operátor A je na lineálu DA pozitivně definitní, rozšířili v kap. 10 obor tohoto funkcionálu na tzv. prostor JíA. Takto rozšířený funkcionál skutečně dosahuje na tomto prostoru pro určitý prvek w0 svého minima. Prvek u0 e MA, jednoznačně určený pravou stranou rovnice Au ~ /, jsme nazvali zobecněným řešením této rovnice. Ve speciálních případech se ovšem může stát, že je u0 e DA, takže pak dostáváme řešení rovnice Au = / v obvyklém, dříve uvedeném smyslu. Prostor říA jsme zkonstruovali takto; Na lineálu DA jsme definovali nový skalární součin (17.4) (», v)A - (Au, v), U, D £ DA a na základě tohoto skalárního součinu jsme obvyklým způsobem definovali normu j| u \A a vzdálenost QA(u, v). Tím jsme dostali metrický, a to unitární prostor, který 188 II. variační metody 17. shrnutí kapitol 9 až 16 189 jsme nazvali SA. V případě, že SA je úplný prostor v metrice gÁ, položili jsme HA = SA. V opačném případě jsme uvažovali množinu M všech posloupností cauchyovských v SA. Tyto posloupnosti (tedy prvky množiny Aí) jsme rozdělili na třídy, a to tak, že dvě posloupnosti («„}, {v„} z M patří do téže třídy právě tehdy, platí-li (17.5) lim u„ = 0 . Každé z těchto tříd jsme přiřadili (a to vzájemně jednoznačně) určitý prvek prostoru II.1) Množinu těchto prvků jsme označili D. Lineál D je sjednocením prvků původního lineálu DA a množiny Ds „nových" prvků. Tyto nové prvky odpovídají třídám těch posloupností, cauchyovských v prostoru SA, které nemají v SA limitu. Na lineálu D jsme zavedli skalární součin («, v)A prvků u0, u0 e D vztahem (17.6) ("tu »o)a = hni («„, !>„), kde {»„}, resp. {t;„} je některá posloupnost prvků z DA, a to z třídy, která odpovídá podle popsaného přiřazení prvku u0, resp. v0. Limita (17.6) vždy existuje a je nezávislá na výběru posloupnosti {u„}, resp. {v„} z třídy, která odpovídá prvku u0, resp. p0. Součin (17.6) má všechny vlastnosti skalárního součinu a je rozšířením skalárního součinu (17.4), definovaného pro prvky lineálu DA, na celý lineál D. Na základě skalárního součinu (17.6) jsme na lineálu D definovali obvyklým způsobem normu a vzdálenost, které jsou opět rozšířením normy ^ a vzdálenosti cJu, v), definovaných na lineálu DA pomocí skalárního součinu (17.4), na celý lineál D. Lineál Ľ s metrikou qa jsme nazvali prostorem HA. Tento prostor je v metrice qa úplný, je tedy Hilbertovým prostorem. Jeho prvky tvoří, jak jsme řekli, jednak prvky lineálu DA (tento lineál je v prostoru IIA hustý), jednak prvky množiny Ds, které je podle dříve uvedené konstrukce možno charakterizovat tak, že každý prvek u e D| jc takový prvek prostoru H, který nepatří do DA a přitom je v H limitou některé posloupnosti {«„}. cauchyovské v prostoru SA. Charakter prvků z D} může být rozmanitý. Např. v případě běžných diferenciálních operátorů druhého řádu, kdy za Hubertův prostor H volíme zpravidla prostor L2(G)2) a za lineál DA lineál funkcí spojitých včetně parciálních derivací prvního a druhého řádu v uzavřené oblasti G a splňujících uvažované okrajové podmínky, můžeme v obecném případě o prvcích lineálu Dj říci jen to, že mají tzv. zobecněné parciální derivace prvního řadu, intcgrovatelné s druhou mocninou v oblasti C. Později, až budeme mít k dispozici pojem prostoru W^\G), bude možno prvky prostoru HA vhodněji charakterizovat. ') Vzájemně jednoznačné přiřazení určitých prvků třídám cauchyovských posloupností je základní myšlenkou „zúplnění" i v případě obecného metrického prostoru, viz např. [26]. V obecném případě však není snadné blíže určit charakter „ideálních" prvků, tj. těch prvků, které „přidáváme" k prvkům původního prostoru. J) V případě obyčejných diferenciálních operátorů je ovšem G = (a, i) a místo o parciálních derivacích mluvíme o obyčejných derivacích. Vztah ä Cul charakterizující pozitivní definitnosl operátoru A na lineálu DA, zůstává v platnosti i v prostoru IIA. Funkcionál F, definovaný na lineálu DA předpisem čili předpisem (17.7) Fu = (Au, u) - 2(f, u) Fu = (u, u)A - 2(f, u) , lze po právě popsaném rozšíření skalárního součinu (u, u)A na celý prostor HA rozšířit předpisem (17.7) rovněž na celý prostor IIA. Na tomto prostoru nabývá funkcionál (17.7) minima, a to pro prvek u0, daný podmínkou, aby pro všechna u s HA byla splněna rovnost (17.8) («o. »)a = (/. «) Podle Rieszovy věty je prvek u0 touto podmínkou (tj. pravou stranou rovnice Au — f) jednoznačně určen. Prvek ua nazýváme zobecněným řešením dané rovnice. Tím je tedy v případě, že A je na lineálu DA pozitivně definitní operátor, dokázána existence minima funkcionálu F v prostoru HA a tím také (podle definice) existence řešení rovnice Au ~ /, v obecném případě zobecněného (neboť prvek u0 není v obecném případě prvkem lineálu DA; víme jen, že je u0 e HA a že u0 lze s libovolnou přesností aproximovat v metrice prostoru HA prvky z lineálu DA). Po dosazení za (/, «) ze (17.8) do (17.7) můžeme funkcionál F zapsat ve tvaru (17.9) Fu = (w - u0, u - u0)A - (u0, Kc)^ = ||w "o li z něhož je vidět, že (17.10) min Fw = — j|uo| V souvislosti se (17.10) jsme pro funkcionál F zavedli pojem minimalizující posloupnosti (ji-posloupnosti) jako takové posloupnosti prvků u„ z HA, pro kterou je (17.11) lim Fu„ n-» co min Fu — — |u0|| Ze (17.9) plyne, že posloupnost {u„} je /i-posloupnost právě tehdy, konverguje-li v HA k prvku uQ (tj. k zobecněnému řešení rovnice Au — f). Zobecněné řešení u0 rovnice Au = f závisí spojitě na pravé straně f e II této rovnice. Podrobněji, platí (17.12) 190 II. VARIAČNÍ METODY Jsou-li tt0l resp. u0 zobecněná řešení rovnic Au — f, resp. Au = g, pak ze (17.12) plyne (17-13) h-Uň|USI^I. Je-li u„ e DA aproximace prvku u0 v prostoru HA, získaná např. některou z metod kap. 12 až 15, pak \\Au„-f\\ C (17.14) 1". - "o\\a S což umožňuje jednoduchý odhad chyby, tj. odhad rozdílu aproximace u„ a zobecněného řešení u0 v prostoru HA. V kap. 11 jsme uvedli ještě některé poznámky týkající se speciálně řešení diferenciálních rovnic — obyčejných nebo parciálních — s okrajovými podmínkami: Patří-li zobecněné řešení n0 rovnice Au = /, tj. prvek minimalizující v HA funkcio-nál (17.7), do DA (to je zhruba řečeno, případ, kdy koeficienty diferenciálního operátoru i pravá strana dané rovnice jsou dostatečně hladké funkce), pak toto řešení odpovídá (i když v poněkud modifikovaném smyslu, viz pozn. 11.4, str. 146) pojmu klasického řešení, známého z klasické teorie obyčejných, resp. parciálních diferenciálních rovnic. Nepatří-li u0 do DA, patří do Ds> a je tedy zobecněným řešením daného problému, které v obecném případě nemá v uvažovaném oboru ani tolik derivací, kolik vyžaduje daná diferenciální rovnice. Přesto však zpravidla velmi dobře vystihuje po fyzikální stránce řešení daného problému, neboť minimalizuje funkcionál, z něhož bývá daná diferenciální rovnice odvozena metodami variačního počtu, čímž se v této rovnici objeví vyšší počet derivací, než vyžaduje daná úloha. Viz také kap. 46, týkající se otázek hladkosti zobecneného řešení rovníce Au — f. Okolnost, že výchozím definičním oborem operátoru A je líneál (a také to, že přibližné řešení problému např. Ritzovou metodou hledáme mezi prvky určitého lincálu), vyžaduje uvažovat problémy s homogenními okrajovými podmínkami. V pozn. 11.6 až 11.8 jsme ukázali, jak daný problém s nehomogenními okrajovými podmínkami převést na problém s podmínkami homogenními, podarí-íi se najít vhodnou funkci w, splňující dané okrajové podmínky. Uvedli jsme příklad ukazující, jak tuto funkci v některých jednoduchých případech najít, ale upozornili jsme na to, že z teoretického hlediska není v obecném případě jednoduché dokázat dokonce jen existenci takové funkce. Podrobněji sc budeme touto problematikou zabývat v kap. 32, 34 a 46. Úkolem kap. 9 až 11 bylo jednak ukázat, jak úlohu řešit rovnici Au — f lze v případe pozitivního operátoru převést na úlohu najít v DA prvek, minimalizující v DA funkcionál F, jednak dokázat pro případ pozitivně definitivního operátoru existenci (a jednoznačnost) prvku uQ e HA, minimalizujícího v HA funkcionál F, rozšířený na celý tento prostor, a tím pro tento případ dokázat existenci (a jednoznačnost) 17. SHRNUTÍ KAPITOL 9 AŽ 16 191 zobecněného řešení rovnice Au = /. Úkolem kap. 12 až 16 bylo ukázat účinné metody, jak toto zobecněné řešení najít, resp. dostatečně přesně aproximovat. Základní předpoklad v kap. 12 až 16 tedy byl, že operátor A je na DA pozitivně deflnjtivní. V kap. 12 až 15 jsme dále předpokládali, že prostor IÍA je separabilní (k tomu stačí, je-li prostor // separabilní), takže v něm existuje (nejvýše spočetná) báze (17.15) yu(p2,.... [V případě metody nejmenších čtverců jsme předpokládali, že (17.15) je tzv. j4-báze v H, viz (17,25); pak (17.15) tvoří bázi i v HA.~\ Je-li báze (17.15) ortonormální v Jí^, pak (viz kap. 12) je zobecněné řešení uQ dáno radou (17.16) £ Wh , kde ak = (/, i)Á0, + (2, (p2)A Oj + ... + („, ip„)A a„ = (/, K voleny z DA, k řešení soustavy (17.23) (AVl, u Acp2) a. + (A„) a, + (Aip2, AuAq>2,... báze v H. V závěru kap. 13 jsme se stručně zmínili o tvaru Ritzovy soustavy v případě nehomogenních okrajových podmínek. Pokud jde o formální stránku, tedy nikoli o otázky řešitelnosti příslušných soustav a konvergenci příslušných posloupností {w„}, je u Ritzovy metody předpoklad o pozitivní definitnosti operátoru A celkem přirozený, neboť, jak je vidět ze (17.19), je Ritzova metoda v podstatě založena na větě o minimu kvadratického funkcionálu, 17. SHRNUTÍ KAPITOL 9 AŽ 16 193 formulované pro pozitivní operátor. U Galerkinovy metody a metody nejmenších čtverců je po formální stránce předpoklad pozitivní definitnosti operátoru A zcela zbytečný. K tomu, abychom od podmínek (17.20), resp. (17.21) dospěli k soustavám (17,23), resp. (17.24), stačí, je-li operátor A jen lineární. Samotné podmínky (17.20) a (37.21) mají smysl i tenkrát, je-li operátor A nelineární. (Přitom lze poznamenat, že v nelineárních úlohách sc používá i Ritzovy metody.) Otázky řešitelnosti uvažovaných soustav i konvergence příslušných posloupností jsou v těchto případech ovšem značně složitější než v uvedeném případě. Viz také závěr kap. 15, týkající se některých předpokladů, které zaručují konvergenci metody nejmenších čtverců pro případ lineárních operátorů. U metody nejmenších čtverců jsme dále upozornili na to, že zároveň s u„ -4 u0 v H platí i (17.26) Au„-*f v H. (Např. u Ritzovy metody je tento závěr správný jen při speciální volbě báze, viz zejména kap. 20 a 25.) Ze (17.26) předně plyne, že k odhadu chyby je možno použít (17.14). Dále lze v některých jednoduchých případech, kdy je H = L2(C), učinit na základě (17.26) některé závěry, týkající se stejnoměrné konvergence posloupnosti [u„] na G. O takové zlepšení konvergence jde i u tzv. Courantovy metody, která záleží v minimalizování funkcionálu tvaru (17.27) Fua + \\Au„ resp. v obecnějším případě tvaru (17.28) Fu„ + £ /lľ> ô*(Au„ -/) dx\' ... 34" na vhodném lineálu M. Podmínka minimalizování funkcionálu (17.27) na M je tedy „kombinací" podmínek (17.19) a (17.21). V kap. 16 jsme uvedli ještě metodu, která je vhodná pro případ pozitivně de-finitních omezených operátorů (tedy nikoli pro případ diferenciálních operátorů), definovaných na celém prostoru H, resp. rozšířených na celý tento prostor. Tato metoda je založena na myšlence „blížit se ve směru největšího spádu po ploše, která je reprezentována funkcionálem F nad prostorem fí, k jejímu minimu". Upustíme-li od geometrické interpretace, konstruujeme posloupnost přibližných řešení u2, kde u, je zvolená první aproximace a kde v„ = Au, -/, t„ fe> "») {Av„, v.) pro n pak pro rychlost konvergence dostaneme odhad = 1,2,.... Je-li 0 < m ž M a plaíí-li pro každé u e H m |H2 á (^w, «) g Aí|[U||\ II. VARIAČNÍ METODY Část III. APLIKACE VARIAČNÍCH METOD K ŘEŠENÍ OBYČEJNÝCH A PARCIÁLNÍCH DIFERENCIÁLNÍCH ROVNIC S OKRAJOVÝMI PODMÍNKAMI K + i - «o|U Ě 11»! - uQ\J——-) . \KI + m f Jako typický (i když jen ilustrativní) příklad na použití této metody jsme ukázali řešení integrální rovnice (16.17). V předcházejících kapitolách jsme se seznámili s nejběžnějšími variačními metodami, vhodnými k řešení lineárních operátorových rovnic typu Au = f s pozitivně deflnitními operátory. I když jsme výsledky formulovali pro obecný případ pozitivně definitních operátorů, jsou z hlediska aplikací variačních metod v inženýrských a přírodovědných problémech nejdůležitější rovnice, které obsahují diferenciální operátory. Těmto operátorům věnujeme proto v této knize zvláštní pozornost; ukážeme v ní, že diferenciální operátory, s kterými se nejčastěji setkáváme v problémech obyčejných a parciálních diferenciálních rovnic s okrajovými podmínkami, jsou na vhodně zvolených definičních oborech pozitivně definitní, a že je tedy možno k řešení těchto problémů použít právě uvedených variačních metod. Ukážeme, jak důležitá je vhodná volba báze pro stabilitu numerického procesu i pro získání některých užitečných vlastností hledané posloupnosti přibližných řešení u„. Zároveň na příkladech důležitých pro aplikace ukážeme numerické zpracování uvažovaných problémů (zpravidla i s numerickým odhadem chyby). Dané problémy budeme řešit různými metodami, abychom mohli porovnat pracnost a účinnost jednotlivých metod. Nezbytným prostředkem k tomu, abychom pro vyšetřované diferenciální operátory ověřili výchozí krok této teorie, tj. dokázali nerovnost (Au, u) ä C2||w[|2 a tím i pozitivní definitnost těchto operátorů, bude tzv. Friedrichsova, resp. Poincaréova nerovnost; jim je proto věnována první kapitola této části knihy.1) Věnovali jsme značnou pozornost i numerickému aspektu těchto nerovností, neboť, jak jsme se již zmínili na několika místech v předcházejícím textu, dává jejich použití jednu z možností numerického odhadu chyby při použití právě uvedených variačních metod. Proto jsme se snažili odvodit některé jemnější nerovnosti, než s jakými se setkáváme v literatuře. Čtenář, který chce postupovat rychleji, nemusí podrobně sledovat všechna uvedená odvození a může si vybrat jen ty výsledky, které bude přímo potřebovat. Tato poznámka se týká v podstatě všech kapitol této části knihy. Podobně jako v předcházejících kapitolách budeme i v dalším textu rozumět Hilbertovým prostorem reálný Hilbertův prostor. Zejména všechny funkce a konstanty, s kterými se v této části knihy setkáme, budou reálné. ') O ní kterých zobecněních třehto nerovností viz v kap. 30, str. 358 a 359. 196 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE Kapitola 18 FriedrichsGva nerovnost Poincaréova nerovnost Jako obvykle označme G omezenou oblast v JV-rozměrném euklidovském prostoru, s lipschitzovskou hranicí JT (viz kap. 2, resp. 28). [Pro JV = 1 jde o interval (a, 6).] Úvahy této kapitoly budeme provádět v reálném Hilbcrtově prostoru L2(G), v němž, jak víme, jsou skalární součin, resp. norma, resp. metrika dány vztahy (u, v) = j* u(x)v(x)dx, resp. |«jj = J j u2(x)áx, resp. q(u, v) -[u(x) - v(x)Y dx . Označme M stručně lineál funkcí u(x), spojitých včetně parciálních derivací prvního rádu v G [tedy množinu C(l\G), viz str. 15]. Věta 18.1. (Friedrichsova nerovnost.) Nechť G je oblast s lipschitzovskou hranicí ľ. Pak existuji nezáporné konstanty cL, e2, závislé na uvažované oblasti, ale nezávislé na funkcích z lineálu M tak, že platí (18.1) dS u2(x) dx cí pro každou funkci ubM . Zejména pro N = 2 dostáváme při obvyklém označení proměnných W |*»« 1<.£[($' ♦ + Pro případ JV = 1, kdy M je lineál funkcí spojitých včetně prvních derivací v uzavřeném intervalu takže (18.9) {v2gg')' - v2gg" g u'2 . ]ntegrujeme-li (18.9) v mezích od a do b, dostaneme (18.10) [trW]! - f"*98" ÚXS\ " 1 dX ^ Ale podle (18.6) je (18.11) takže (18.12) a dále (18.13) neboť (18.14) a (18.15) "2gg" 16(6 - a) 16(6 - a)- 9 : 16(6 - a)2 ti idx — a) -rjg--'- g 4(ŕ> - tí) 4(ŕ> - a) g'(a) = g'(ř>) g{a) ~ ' g(b) ~~ 4(6 - a) 4 4(i> - a) tg- 198 III. APLIKÁCIÍ NA DIFERENCIÁLNÍ ROVNICE Z (18.10), (18.12) a (18.13) plyne _t-__(V d* * ľ"'2 A* + -7-"-^ «2(fc) Hb-a)1}. "J. 4(í>-a) čili (18,6) JV dx g H*-^ jV2 dx + ^ -\» • V (18.4) stačí tedy položit 16(6 - af 4(6 - | (18.17) c, = —v . -y- , c, = ---£ • Zcela analogicky se provede důkaz nerovnosti (18.3). Místo funkce (18.6) stačí uvažovat funkci *(x - b) g(x) = 4(6 - i, je v (18.19) c, P c2. Naopak, je-li b - a < 1, je Ci < c2. Tato okolnost může být 1) Zlepšit v tomto smyslu: Pozitivní definitn! operátor je charakterizován nerovností (Au,a) ä C2||"|]2. Z různých důvodů je vhodne, aby konstanta C v teto nerovnosti hýla co možná nejvitší. Např při odhadu chyby v (11.21), str. 144, se tato konstanta vyskytuje ve jme-novale'i. V případech, s kterými se setkáme v dalším textu, dostaneme pro C1 odhady tvaru (18.18) C2 = Ír., C2 = min (-") apod. [srov. např. (19.77), str. 221, (19.43), str. 217], kde p a o-jsou kladné konstanty, daní vyšetřovanou diferenciální rovnicí a okrajovými podmínkami. Aby bylo možno uvažovat C co možná nejvitší, potřebujeme získat pro c, a c2 odhady co možná nejmenší. 18. FRIEDRICHSOVA A POINCARÉOVA NEROVNOST 199 v odhadech typu (18.18) (viz pozn. 1 pod čarou) nepříjemná, zejména v druhem z nich. Je proto vhodné mít určitou možnost „regulace" poměru Čísel c, a c2, abychom např. mohli dosáhnout toho, že čísla pjey a o, označme a' = a — jj, b' = b + t\ (obr. 8), takže interval (a, b} .vložíme" do intervalu 0 tak, aby čísla L 5_ Ci ' c2 byla přibližně stejně velká. 200 Ilí. APLIKACE NA DlIEHbNCIALNÍ ROVNICE Podle (18.21) máme tedy zvolit n > 0 tak, aby sc přibližně sobě rovnala čísla (je b' — a' = b — a + 2i\ = 5 + 2rj) (18.23) 8rc Tlfí (5 + 2tf}2 5 + 2n 5 f 2n Protože 7t1/(5 + 2řj)2 je značně menší než Sr.;(5 + 2n), zvolíme n malé; pak můžeme položit nn nrj tg Uvedená podmínka má pak tvar m (18.24) 5 + ty 5 + 2tj 8lT JtřJ (5 + 2nf 5 + 2>/ 5 + 27 Zřejmě stačí zvolit r\ — 1/8. Poznámka 18.2. Splňují-li funkce z lineálu M další podmínky, např. podmínky u(a) = 0 nebo u(b) - 0 nebo u(a) = 0 i w(i>) = 0, dostaneme pro tyto speciální případy odpovídající speciální případy právě získaných odhadů. Speciálně, jestliže označíme My lineál těch funkcí z Af, pro které platí (18,25) u(a) ~ 0 . «(r») = 0, dostaneme podle (18.5) odhad (18.26) pšfp di í c, u'2(x) dx , « € JVf ± , kde za c, můžeme zvolit některý z odhadů (18.19) nebo (18.21). Zvolíme-li odhad (18.21), dostaneme ledy (18.27) j w2(x) dx Ä Í-^f jV(x) dx (í> - a + 2^ u'2(x) dx . Protože však nerovnost (18.27) platí pro každé kladné r\, dostáváme odtud snadnou Úvahou nerovnost (18.28) fV(É dx £ ^fi- fV2(x) dx , platnou pro každé u g .Ví ,, tj. pro každé u e M, splňující podmínky (18.25). 18. FRiEDRICHSOVA A POlNCARÉOVA NEROVNOST 201 Poznámka 18.3. Nerovnost typu (18.26) lze odvodit pro funkce z lineálu M\ i tímto jednoduchým způsobem (srov. str. 112): Protože platí první z podmínek (18.25), dostaneme u(x) = J u'(l)dí, takže je 1r(x)^Q<í)d/l2. Uř.ijeme-li na pravou stranu této rovnice Schwarzovy nerovnosti (str. 38) dostaT ncme f1 fT u\x) ^ l2dx . u'2(t)dt. J a J a Protože u'2(t) je v intervalu (a. £> nezáporné, je tím spíše u2(x) £ ÍV dx . V2(ř) dí = (x - a) f«'2(f) dí. J a J a J d Integrujeme-li tuto nerovnost v mezích od a do ŕ a přejdcmc-Ii opět k označení x místo í pro integrační proměnnou, dostaneme (18.29) ju2(x) tedy nerovnost (18.26) s (18.30) dx < 2 Jb-a)2 u'2(x) dx . což je odhad běžně uváděný v literatuře. Porovnáme-li tento výsledek s nerovností (18.28), vidíme, že odhad (18.28) je přibližně pětkrát lepší než odhad (18.30). Myšlenky důkazu nerovností (18.3) až (18.5) lze použít i pro vícerozměrný případ. Je-li napr. Ar = 2 a je-li interval ), resp. , b') x (c, d) (obr. 9), lze např. položit (18.31) g(x, v) 2{b - a) 2(d - c) a provést téměř doslovnou analogii důkazu nerovnosti (18.4), Přitom místo identity (18.8) použijeme identity (je opět « = gv; místo d2g\dx2 + d2gjdy2 píšeme stručně Aj/) 202 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE 1 8. FRIFDRICHSOVA A POINCARÉOVA NEROVNOST 203 (18.32) í3uV + fduV {dx/ \3yJ -'[(^♦(DK^ d ( j dg\ - [v g — j — v c By 2gAg. Vynecháme-li na pravé straně této identity první člen, který je zřejmě nezáporný, dostaneme nerovnost obdobnou nerovnosti (18.9) a jejím integrováním přes oblast G dospějeme k nerovnosti (18.33) - || v?$ Ag úx dy á || + gjl tedy-j v2 g & ás ; v posledním členu je v vnější normála k hranici ľ; použili jsme (8.31), str. 108, kde jsme psali 2 % 2 dg V 9 — , resp. vlg — ex dy za / a 1 za g a uvážili, že dq Sq dq dq „ dq ■— vx + — v„ = -2-cos a + — cos /? = ~i ox ííy dx dy dv Ale podle (18.31) je takže Afí n n' + (18.34) - II u1!/ Aff dx dy = y 4(f> - a)1 4{d - c) M, íb- «ľ t" - c)2]Ji" 1 1 + (6 - af (d - c) u2g2 dx dy = dx dy. Dále ídg g dv r max 71 <«,»> 2(b - a) 1 (Sg 8g D> - [ — cos a +■ -- cos P g \dx 8y J í a ± b\ 71 \ X--1 ,\ 2 / + lôg r S dx r 9 3v|r 2(6 - a) max n mm ( a + b\ íc \ X-- . V_2 J 2(6 - a) 2(d - c) min 2Cj - e) 2(d-e) jc . íl srn - sin-Jt 4 n 4 jt jr # ~ «) ^5 + 2(á " c) co7* = 2(ft - 4 + 2(d ~ c) ' t A a tedy (18.35) - f ir*p — da g f uV — ds š f Jr 3v j Jr g Ji <[ * -r * 1 IV d,. L2(6-«) 2(rf-c)JJr Z (18.33), (18.34) a (18.35) pak plyne *7 r 1 1 4 (ŕ - a)2 {d - c)2 + u2 dx dy íí í 2 \fc - a d - cj Jr čili, označíme-li 1 1 „1 l A =-+-----, b =------h---, (b - a)2 (d - c)2 b - a d - c (18.36) í «J(x, v) dx dy á 4- Í Í ["(''"V + (-Y1 dx dy + — í U2(s) dS V (18.2) tedy stačí položit (18.37) 4 _ 2J3 n2 A nA 204 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE Potřebujeme-H získat určitou možnost, jak mĚnít poměr odhadů ct a c2, můžeme postupovat podobně jako v pozn. 18.1: Zvolíme opět tf > 0, označíme a' ~ a - t], b' = b + n < C = c - n, ď = d + n a místo funkce (18.31) použijeme funkce (18.38) , % . k(x — a') , n(y — c') g(x, y) = sin -j--f sin -i---L . b' - a' ď - f Pro Cj a c2 tak zcela analogickým postupem dostaneme odhady (18.39) 1 . _ W_ C' ~ n2 A! ' t2 nA' kde A' (ť - ď)2 + (ď - c')2 (b- a + 2nf ^ (ď - c + 2nf ' 1 1 + 1 B' = ------------J.------- /,, ,\ ■ Ma — a') ,,, ,\ . k(c - c') (b - a) sm ->■--' (d - c) srn —--'- X ' W - n' K ' A' - r' b' -1 (b — a + 2n) sin nn b - a + 2n (d — c + 2r\) sin d - c + 2n takže je «,40) jj^,,,)^ S ^£[(0 * + Vhodnou volbou čísia r/ je možno získat žádoucí odhady pro čísla c, a c2, podobne jako v příkl. 18.1. Je-li oblast G speciálního tvaru, lze ukázaným postupem uvedené odhady dále zlepšit. Analogicky postupujeme v případě N > 2. Poznámka 18.4. Splňují-Ii funkce z lineálu M navíc podmínku (18.41) w = 0 na ľ , plynou z (18.1), resp. (18.2) nerovnosti 18. FRIEDRICHSOVA A POINCARÉOVA NEROVNOST 205 resp. m h'ľ-*í4[[(s)'^)>*' Zejména použijeme-Ii odhadu (18.39), plyne z (18.40) kde (18.45) Ä' (ť - ď)2 [ď - c')2 [b - a + 2n)2 (d-c + 2n)2 Protože nerovnost (18.44) je správná pro každé n > 0, dojdeme podobně jako v pozn. 18.2 k závěru, že platí m jf#^/)*^^£[@r+(*)>4,. kde (18,47) A = _í_ 1 Je-li speciálně G čtverec s délkou strany /, takže 2 u2(x, y) dx dy g ^ 2n2 lí+§)0 plyne z (18.46) odhad (18.48) který je tedy asi dvacetkrát lepší než odhad („», ,£[(|)- + gj] běžně uváděný v literatuře (viz např. [28], str. 129). Další důležitý typ nerovnosti uvádí tato věta: dx dy, dx dy, Věta 18.2. (Poíncaréova nerovnost.) Nechť G je oblast s lipschitzovskou hranicí, M lineál funkci spojitých včetně parciálních derivací prvního řádu v G (uvažujeme-li 206 ÍH. APLIKACE NA DIFERENCIÁLNÍ ROVNICE 18. FR1EDR1CHSOVA a poincakéova NtJKOVNOST 207 JV = I, jde o interval {a, by a o obyčejní derivace). Pak existuji konstanty c3 a e+, závislé na daně oblasti, ale nezávislé na funkcích u(x) z lineálu M, tak, že platí (18,50) í u\x) dx g c.f% f (—\ dx +- c± í u(x) dx] pro každé u e M . Jako špeciálni případy této nerovnosti dostávame pro N = 2 nerovnost (,8,D f£^(Jt, „ d, ^ Ě „ + + c4 jjj" u(x, y) dx d>J , pro JV = 1 nerovnost (18.52) u\x)dx í c3 u'2(x)dx + c4 n(x) dx . Hodnoty konstant ci, a c4 mohou ovšem být v každé z nerovností (18,50) až (18.52) různé, i když pro ně používame stejného označení [víz obdobnou poznámku k nerovnostem (18.1) až (18.5)]. Důkaz provedeme podrobně pro případ JV = 1, tj. pro nerovnost (18.52). Myšlenka důkazu jc obdobná i pro N > 1. Budiž tedy u(x) libovolná funkce definovaná v intervalu (a, by a patřící do M [takže u(x) a u'(x) jsou spojité funkce v (a, />> !. Pro každé dva body x,, x2 z intervalu (ři, b} platí u(x2) — ti(xr) = u'(x)dx , Jjfi a tedy (18.53) u\x2) + u2(x,) - 2w(x,) u(x2) = JJ" ~u'(x) dxj . Podle Schwarzovy nerovnosti (str. 38) je (18.54) ľ"2 "l1 I i'1' u'(x)dx xt). Z (18.53) a (18.54) plyne (18.55) h2(x2) + u2^) - 2u(xJ u(x2) jí (b - a) u'2(x) dx . Integrujeme-li tuto nerovnost v intervalu p0 > 0 , r(x) ž 0 v > ; p0 je konstanta. Okrajové podmínky pro rovnici (19.1) uvažujme ve tvaru (19.3) '(a) - pu(a) = 0 , yu'(b) + 5u(b) = 0 , kde cc, /J, y, ô jsou nezáporná čísla taková, že v žádné z dvojic a, ji; y, ó nejsou obě čísla zároveň rovna nule, tedy taková, že je {19.4) « + rj > 0, ? + <5>0. Příkladem okrajových podmínek (19.3) jsou podmínky tvaru {19.5) (19.6) (19.7) (19.8) apod. u(a) = 0 , u'{a) = 0, u'(a) - jiu(a) = 0 , u{a) = 0 , u{b) = 0, u'(b) = 0, u'(b) + Su(b) = 0, /? > 0, 5>0, u'(b) = 0' Poznámka 19.1. Okrajové podmínky (19.3) předpokládáme tedy homogenní. Nejsou-li dané okrajové podmínky homogenní, převedeme daný problém snadno ') O zobecnění podmínek kladených na koeficienty rovnice (19.1), popř. rovnic vyšších řádů, viz v kap. 31, str. 372. O případech, kdy funkce p(x) může být v některých bodech intervalu <^a, b~y rovna nule, kap. 47, str. 581, Pfíkladem takové rovnice je rovníce ~(xu')' + u - f v intervalu ( 0,1) apod. na problém s homogenními okrajovými podmínkami (srov. pozn. 11.6, str. 149). Stačí najít dostatečně hladkou funkci w(x), splňující dané nehomogenní okrajové podmínky, a hledat řešení vc tvaru (19.9) u(x) = vv(x) + z(x) . Funkce z(x) pak bude splňovat rovnici (19.1) s pravou stranou 9 = f + (p™1)' - rw (místo s původní pravou stranou /) a s příslušnými homogenními okrajovými podmínkami. Příklad 19.1. Uvažujme rovnici — [(1 + x2) u']' + u = sin nx s okrajovými podmínkami (19.10) «(0) = I , «'(1) = 3 . Substitucí (19.9), kde stačí zvolit w(x) = 1 4-3* [tato funkce zřejmě vyhovuje podmínkám (19.10)], dostaneme pro funkci z(x) rovnici - '(1 + x2) -']' 4- z = sin nx + 3x - 1 s homogenními okrajovými podmínkami z(0) = 0 , z'(l) = 0 . Poznámka 19.2. V dalším textu ukážeme, že diferenciální operátor daný rovnicí (19.1) a uvažovaný na vhodně zvoleném lincálu (resp. vhodně zvolených lineálech) funkcí, které splňují podmínky (19.3), je pozitivně definitní. Nejprve však vyšetříme speciální případy okrajových podmínek (19.3), a to případy (19.5) až (19.8). Jedním z hlavních důvodů je ten, že každá z okrajových podmínek (19.5) až (19.8) má svůj specifický charakter, který, jak uvidíme, má svou velmi blízkou analogii i v případě parciálních diferenciálních rovnic. [Podmínky (19.5) až (19.8) odpovídají po řadě Dirichlctovým, Neumannovým, Newtonovým a smíšeným okrajovým podmínkám pro parciální rovnice druhého řádu.] Přitom zde,- tj. v případě obyčejných diferenciálních rovnic, je celá problematika značně průzračnější. Příslušné úvahy provedeme v reálném Hilbertově prostoru L2(a, b) funkcí integro-vatelných s druhou mocninou v intervalu ) = v(x) v(x) dx , resp. u2(x) dx , 210 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE Jen v případě okrajových podmínek u'(a) ~ 0, u'(b) — 0 budeme pracovat s prostorem L2{a, b), což je podprostor prostoru L2(a, b) těch funkcí u e L2(a, b), které splňují podmínku dx = 0. Z věty 8.5, str. 105, a z pozn. 8.5 a 8.6, str. 107, plyne, že všechny lineály, na nichž budeme v této kapitole vyšetřovat uvažovaný operátor, jsou husté v L2(a, b), resp. v L\(a, b). Tuto okolnost nebudeme stále v dalším textu zdůrazňovat. Budeme-li proto dokazovat např. symetriěnost operátoru At na lineálu Aíj, dokážeme jen platnost vztahu (Atu, v) — (Atv, u) pro u, v e Mu aniž se zvláště zmíníme o hustotě lineálu Aí, v L2(tJ, í>), vyplývající z citované věty 8.5. Obraťme se tedy k vyšetřování uvažovaných problémů. 1. Okrajové podmínky u(a) = 0, u(b) = 0. Označme M, lineál všech funkcí spojitých včetně derivací prvního a druhého řádu v uzavřeném intervalu 0 taková, že platí (Ayu, u) ž C2||u||2 pro každé h e Aíj. Zřejmě však pro každé u e M,, v e Aí, je (19.13) (,4,1í, v) = [-(pu')' + ru] váx = - {pu')' vdx -f ruvúx = * Ja Ju Vt fě pb [pu'v]l + pu'v'dx + \ ruodx = pu'v' dx + \ ruv dx Ja .Ja Ja Ja neboť t? e M,, a tedy (19.14) [pu'vf, = 0 v důsledku (19-H). Tím je symetričnost operátoru At na lineálu Af, dokázána, neboť pravá strana rovnosti (19.13) je symetrická v u a v. Z (19.13) dále plyne (A^u, u) pu'2 dx + ru2 dx, 19. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE odkud vzhledem k předpokladům (19.2) dostáváme 211 (Aiu, u) Ž Po u'2 dx, Protože u e Aí\, platí u(a) = 0, u(b) = 0. Můžeme tedy použít např. nerovnosti (18.28), str. 200, takže (19.15) s (19.16) ľu'2 dx ž ; - „ Í«2 dx = ť (/í,u,u) ž C2||u||2 , ueM, ""II2, «M„ čímž je pozitivní deíinitnost operátoru At na lineálu M, dokázána. 2. Okrajové podmínky u'(a) = 0, t/(Z>) = 0. Tento případ jc na rozdíl od ostatních případů poněkud složitější. Označme M2 lineál všech funkcí spojitých včetně derivací prvního a druhého řádu v uzavřeném intervalu a splňujících okrajové podmínky (19.17) u'(a) m 0 , u'(b) = 0 a A2 operátor, který je definován na tomto lineálu a přiřazuje každé funkci ueM2 funkci (19.18) A2u = — (pu')' + kdep(x) a r(x) jsou dříve uvažované funkce na levé straně rovnice (19.1). Zcela stejným způsobem jako v (19.13) dokážeme, že operátor A2 je na lineálu M2 symetrický, neboť z (19.17) plyne pro ueM2,veM2 opět (19.14). Jak však vyplyne z následujícího textu, není operátor A2 za uvedených předpokladů o funkcích p(x) a r(x) v obecném případě na lineálu Aí2 pozitivně definitm. [Všimněme si, že funkce z lineálu Aí2 splňují podmínku (19.17), a že tedy nelze použít odhadu (18,28), jak jsme to učinili v předcházejícím případě, nebo některého z odhadů (18.3) až (18.5), neboť tyto odhady obsahují hodnoty u(a), u(b) funkce «(x) v krajních bodech intervalu > je (19.19) r(x) ž r0 > 0 . 212 Pak z rovnosti III. aplikace na diferenciální rovnice pb p b (Azu, u) — I pu'2 dx + ru2 dx J a J a [plynoucí z (19.13) pro u = v] vyplývá [neboť p(x) £ 0] (A2u, u) ^ r0J"w2 dx, což znamená, že za předpokladu (19.19) je operátor A2 na lineálu M2 pozitivně definitní, přičemž je možno položit C = •Jt'o- Poznámka 19.3. Pozitivní definitnost operátoru A2 na lineálu M2 lze dokázat za slabšího předpokladu o koeficientu r(x), než je předpoklad (19.19). Stačí předpokládat, že funkce r(x) je spojitá a nezáporná v (a, by a že r(x) > 0 aspoň v jednom bodě x1 e (a, by. Je-li totiž (c, ďy libovolný, ale pevný interval kladné délky, ležící v (a, by, lze ukázat (tento výsledek je speciálním případem obecnější nerovnosti, uvedené v [33], str. 22), že existuje takové číslo x > 0, nezávislé na funkcích z lineálu M2, že pro každé u e M2 platí (19.20) til* < tt (J? dx + u2 dx Nechť tedy r(x^ > 0. Protože funkce r(x) je podle předpokladu v > a obsahujícím bod x,, větší než některá kladná konstanta m, r(.\) ^ m > 0 v Z (19.20) a z rovnosti (/í2w, u) pu'2 dx + r«2 dx pak plyne [neboť je p(x) ä p0 > 0 v 12 na lineálu Af2 pozitivně definitní. V dalším textu ukážeme, žc je-li r(x) = 0, není operátor A2 na lineálu M2 ani pozitivní (a tím méně pozitivně dsfinilní). 19. obyčejně diferenciální rovnice Budiž tedy r(x) = 0, takže uvažujeme rovnici (19.21) . -(puj^f(x) s okrajovými podmínkami (19.22) u'(«) > • 0 , «'(£>) = 0.1) V našem případě tedy je 213 (19.23) (A2u, u) pu'2 dx pro každé u e M2 . Podle definice je symetrický operátor A2 na M2 pozitivní, jestliže jsou splněny podmínky (19.24) (A2u, u) Ě 0 pro každé ueM2 , (19.25) (A2u, u) = 0 =>■ « = 0 v M2 , tj. u(x) = 0 v . Vzhledem k předpokladům o funkci p(x) plyne z (19.23) nerovnost (19.24). Podmínka (19.25) však není splněna: Jak je vidět z (19.23), může být (A2u, u) rovno nule i pro funkci u 4= 0 v M2, např. pro funkci w(x) = 7 v (a, by, která anuluje výraz (A2u, u) — — JJ pu'2 dx a přitom zřejmě patří do M2, neboť splňuje podmínky (19,22). Operátor A2 není tedy v případě r(x) == 0 na lineálu M2 pozitivní (a tím méně pozitivně definitní). , Všimněme si ještě další zajímavé okolnosti: Předpokládejme, že problém (19.21), (19.22) má řešení u e M2. Integrováním rovnice (19.21) v mezích od a do b dostaneme (pu')' dx <= f(x) dx J a J a Podle (19.22) však jc (pu')'dx = -[fu']J = 0, takže má-li daný problém řešení, je nutně (19.26) f(x) dx=0. V našem případě je tedy (19.26) nutnou podmínkou k existenci řešení. !) Rovnici (19.21) je ovšem možno integroval přímo a dospčt tak k uvedeným zavírám mnohem jednoduSäím způsobem. My zde väak chceme získat určitý ucelený pohled na celou problematiku, dokonale analogickou, jak uvidíme, problematice eliptických parciálních diferenciálních rovnic druhého řádu. 214 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE Je-li tedy r(x) = 0 v p0í u'2(x) dx, u i ! e M, Avšak pro funkce u(x) z lineálu Ä?2- které tedy splňují podmínku (19.27), platí podle Poincaréovy nerovnosti (18.52), str. 206, (•b fb z u2 dx < c3 f# dx 3) Z^Co, b) je totiž ortogonálním doplňkem v prostoru L2(a, b) k podprostoru, jehož prvky tvoří víechny funkce konstantní v (a, by (nebo funkce jím ekvivalentní), takže je (srov. str, 81) úplným prostorem. 19. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE 215 čili 09-31) ÍNL*,m S.c3 i, u'2dx, kde podle (18.57) lze položit (19.32) Z (19.30) a (19.31) plyne O9-33) Wm*%m%W¥Ěm? čímž je pozitivní definitnost operátoru Ä2 na lineálu &2 dokázána. Přitom z (19.32) plyne, že lze zvolit (19.34) V(2Po) í> - a Je dobře znovu upozornit čtenáře, že v uvažovaném případě r(x) s 0 pracujeme stále s operátorem M2 na lineálu M2, tedy stále v Hubertově prostoru H = Z2(a, b). Proto z právě dokázané pozitivní deflnitnosti operátoru A2 na lineálu M2 plyne existence zobecněného řešení u0(x) (ve smyslu kap. 11) rovnice Ä2u = / [tedy rovnice (19.21) s okrajovými podmínkami (19.22)] jen pro pravé strany/eL2(a, b), tj. jen pro taková / e L2(a, b), která splňují podmínku (19.26). Z (19.21), (19.22) je dále vidět, že je li přitom «<, e DÄ1, pak že i každá funkce tvaru u0(x) + k, kde k je libovolná konstanta, je řešením problému (19.21), (19.22). Není-li uo e Däii můžeme funkci u0(x) + k pokládat za řešení v určitém zobecněném smyslu. (Srov. str. 447.) 3. Okrajové podmínky u (a) - fiu(a) = 0, u'(b) + bu(b) = 0, 0 > 0, b > 0 . V L2(fl, í>) uvažujme líneál M3 všech funkcí u(x) spojitých včetně derivací prvního a druhého řádu v uzavřeném intervalu (a, by a splňujících okrajové podmínky (19.35) u'(a) - fiu(a) = 0 , u'(b) * ou(b) = 0 , jS > 0, ä > 0 , a operátor A3, definovaný na Af^ předpisem (19.36) A3u = -(PU'Y + ru -kde p{x) a r[x) jsou funkce z rovnice (19.1). 216 iii. aplikací; na diferenciální rovnice Pro každou dvojicí funkcí u(x), u(x) z lineálu M3 platí (19.37) (A^u, v) = [ (/>«')' + ru~\ v dx = - (pi/)' ij dx 4- ruw dx = = — [pn'pja + pu'tí'dx 4- I ruudx = J a J a = puV dx 4- rutř dx 4- dp(b) u(b) v(b) + fip(a) u(a) v(a) , Jo J a což ukazuje, že operátor A$ je na lineálu M3 symetrický. Podle (19.37) je dále (A3u, u) = ľ pu'z dx 4- (* r«2 dx + &p(b) u2(b) + (ip(d) u2(a) . Jo J a Uvážíme-li (19.2) a označíme-li k = min (/f, 5) , můžeme psát (19.38) (A^u, u) > p0 |J u'a dx + A;[i/2(tf) + !<2(r>)]J . Ale podle Friedrich sovy nerovnosti (i8.5), str. 196, je (19.39) |uf - [V dx g c, f u'2 dx 4- c2[u2{a) + Mz(b)] , Ja J o kde je možno podle (18.19) nebo (18.21) volit 4(b - a)1 2(b - a) (19.40) c, = - ' , c2 = • -; TI K nebo . (ŕ> - u + 2ŕ/)2 b - a + 2n nn (19.41) f j = i----, ■'■ , c2 = ——-cotg--'-- , it n b — a 4- 2n n > 0. Z (19.38) a (19.39) pak plyne (Asu, u) > ?! c, ľu'2 dx + ^ Cl[u2(a) 4- ^(fc)] ^ fl Ja C2 j^jV2 dx 4- c2[M2(«) + U2(ŕ)]j a podle (19.39) (19.42) (A3u,u) g C2|]u|| 19. OBYČEJNÉ DIFERENCIÁLNÍ' ROVNICE 217 kde (19.43) C2 = min • í Po Pok c, c. Tím je pozitivní deŕinitnost operátoru na lineálu JVÍ3 dokázána. Zvolíme-li pro cí a c2 odhady (19.41), lze vhodnou volbou čísla n dosáhnout toho, aby hodnoty c, a c2 byly „optimální", tj. aby čísla pa\cl a puk/c2 byla — aspoň približne — stejné veliká. (Srov. príkl. 18.1, str, 199.) 4. Okrajové podmínky u(a) = 0 , u'(b) = 0 . Označme M4 líneál funkcí spojitých včetně derivací prvního a druhého řádu v {a, b} a splňujících podmínky (19.44) u(a) ťt 0 , u'(ti) = 0 a AA operátor definovaný na Mt předpisem (19.45) AiU - -(pu'}' 4- ru , kde p(x) a r(x) jsou Tunkcc z rovnice (19.1). Zcela stejně jako v předcházejíeíeh případech zjistíme, že operátor A4 je na lineálu JW4 symetrický a že platí (19.46) (A^u, m) pu'2 dx 4- ru2 dx ä Po | «'2 dx pro všechna u e !W4 . kde Po > 0 je konstanta z podmínek (19.2). Všimněme si nyní, že vzhledem k první podmínce (19.44), které vyhovují funkce z lineálu Mit můžeme psát (19.47) u(x) u'(t) dl a téměř doslova stejným způsobem, jako jsme v kap. 18 dospěli k nerovnosti (18.29), str. 201, dostaneme (19.48) [|«|j2 = Cuzdx g ^-"ľ «'2 dx , ne M4 Z (19.46) a (19.48) pak plyne (19.49) (AAu, w) ž C2||uj|2 pro všechna « e M4 s 7(2po) (19.50) C = b - a čímž je pozitivní defmitnost operátoru A± na lineálu M"4 dokázána. 218 Odhad (19.48) je lepší než odhad III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE dx , vyplývající z (18.3) a (18.17), použijeme-li první z podmínek (19.44), neboť 1/2 < 16/ji2. K výsledku (19.49), (19.50) dospějeme i v případě okrajových podmínek (19.51) «'(«)= 0, «(*>) = 0; místo (19.47) stačí uvažovat integrál (19.52) u(x) = - ju'(t) dt. Jak jsme se již dříve zmínili, setkáme se s téměř doslovnou analogií výsledků, získaných pro okrajové podmínky (19.5) až (19.8), v případě Dirichletovýcb, Neumannových, Newtonových a smíšených okrajových podmínek u parciálních diferenciálních rovnic (srov. kap. 22). V případě obyčejných diferenciálních rovnic je ovšem studium těchto problémů značně jednodušší; proto jsme se snažili připravit tuto problematiku již na tomto místě. Obraťme se k obecnému případu okrajových podmínek (19.3). 5. Okrajové podmínky (19.3) (19.53) au'(a) - pu(a) = 0 , yu(b) + Óu(b) = 0 . Přitom ql, fi, y, ô jsou nezáporná čísla a (19.54) d + ^>0, y + S>0, takže v žádné z dvojic a, fi; y, ô nejsou obě čísla zároveň rovna nule. Nechť M je lineái funkcí spojitých včetně derivací prvního a druhého řádu v (a, by a splňujících podmínky (19.53). Ukážeme, že diferenciální operátor A, daný na lineálu M předpisem (19.55) Au — — (pu')' -f ru , u e M . je [za uvažovaných předpokladů o funkcích p(x), r(x)\ s výjimkou případu, kdy podmínky (19.53) přejdou v podmínky (19.17) a zároveň r(x) = 0, pozitivně definitní, K důkazu tohoto tvrzeni podstatně využijeme předcházejících výsledků. 19. OBYČEJNÍ DIFERENCIÁLNÍ ROVNICE 219 Nejprve obdobným způsobem jako dříve dokážeme, že operátor A je na lineálu M symetrický, a to i v případě okrajových podmínek (19.17): Pro každou dvojici funkcí u(x), v(x) z lineálu M totiž platí (19.56) (Au, v) = - (pu')'vdx + ruv ax = = -p(b) u'(b) v(b) + p(a) u'(a) v(a) + pu'v' dx 4- ruv dx Uvažujme nyní tyto čtyři případy, vyčerpávající zřejmě všechny možnosti: (19.57) a) ct = 0, y = Q; (19.58) b) a - 0 , y > 0 ; (19.59) c) a > 0 , y = 0 ; (19.60) d) a > 0, y > 0 . Uvážíme-li, že z podmínek (19.54) plyne (19.61) a = 0 => ji > 0 , a tedy u(a) = 0 , resp. v(a) = 0 , y=0=><5>0, a tedy u(b) ■■ 0 , resp. i(b) - 0, dostaneme z (19.56) [popř. ještě použitím podmínek (19.53)] v jednotlivých případech f* f (19.62) a) (Au, v) = pu'v' dx + ruvdx ; J a J a (19.63) b) (Au, v) - f pu'v' dx + f ruv dx + - p(b) u(b) v(b) ; J b J a y (19.64) c) (Au, v) — í pu'v' dx + ľ ruv dx + - p(a) u(a) v(a) ; (19.65) d) (Au, v) = f pu'v' dx + í ruv dx + £ p(a) u(a) v(a) + - /;(/;) u(b) v(b) . L L «■ ľ V každém z těchto čtyř případů, se vyskytují tedy funkce u(x) i v(x) symetricky (zaměníme-li je mezi sebou, dostaneme tentýž výsledek), což potvrzuje symetrii operátoru A na lineálu Aí. Z (19.62) až (19.65) plyne, položímc-li y(x) = u(xj a uvážíme podmínky (19.2) IX*) ž 0, p(x) ŕ pD > 0 v >], 220 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE (19.66) a) (Au, u) ž p0 J u'2 dx ; (í9.67) b) (Au, u) ž po | u'1 dx ; (19.68) c) (Au, u) ž p0^u'2dx; (19.69) d) (>, u) 2; Po dx + k[u2(a) + «2(t>)]J kde k = min V případě a) plyne z (19.54) a (19.57) u(a) = 0 , u(b) = 0, takže podle (19.66) a kap. 18 jc (19.70) a) (Au,u)^^\\u\\\ kde za cj je možno zvolit (b - a)2\n2 podle (18.28), str. 200 [srov. (19.15), (19.16), str. 211]. V případech b) a c) můžeme použít odhadu (19.48), neboť vzhledem k (19.54) a (19.58), resp. (19.59) je u(a) = 0, resp. u(b) = 0, takže platí (19.47), resp. (19.52). Je tedy (19.71) kde (19.72) b), e) (Au, u) ž ^ 1« (6 - a)2 Je-li přitom 5 > 0, resp. /J > 0, můžeme použít i odhadů (18.4), resp. (18.3) s konstantami [podle (18.17), str. 198] (19.73) 16(ř> - a)2 _ 4(6 - <*) > c2 19. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE neboť z (19.63), resp. (19.64) plyne (19.74) 221 resp. (19.75) Dostaneme tak (19.76) kde (19.77) resp. (19.78) b) (Au, u) > p0 .TJV2 dx + ~ u2(i>)J , c) (Au, u) ^ p0 ^ u'2 dx + - u2(a)J . (Au,u) > C2\\u\\2 , b) cl = rmn(^,M V, Cz7. c) C3 = min f-P-e , M \c, ca Odhad (19.71), (19.72) je ovšem lepší, neboť dává větší hodnotu konstanty C2 (srov. pozn. 1 pod čarou na str. 198). Je-li v případě d) Jí > 0 a ä > 0, lze použít nerovnosti (18.5), str. 196, kde lze volit (19.79) nebo _ 4(6 - af 2{b -a) ci — '-;-j c2 —--1 (19.80) Cl=(b-«+2«)\ ei->-« + *l cotg n b - a -Vln [viz (18.19) a (18.21), str. 198, 199]. Z (19.69) pak plyne (19.81) d) (Au,u) ä C2||u||2 , kde (19.82) ť-min^,^. Je-li v případě d) fi - 0, ale ô > 0, resp. 3 = 0, ale > 0, dostáváme pro (Au, u) nerovnosti (19.74), resp. (19.75) a odtud nerovnost (19.76), (19.83) (A.u,u)~ě C2\\u\\2 , kde C2 jc dáno výrazem (19.77), resp. (19.78). 222 III, APLIKACE NA DIFERENCIÁLNÍ ROVNICE 19. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE 223 [Všimněme si, že v žádném z tří posledních případů nelze použít analogie s odhadem (19.71), (19.72), neboť zde v obecném případě není ani u(a) — 0, ani u(í>) — 0, takže neplatí ani (19.47), ani (19.52), a tedy ani odhad (19.48).] Pro J? = 0 a ô = 0 přejdou podmínky (19.53) v podmínky (19.17), (19.84) u'(a) = 0, «'(£) = 0, které jsme vyšetřovali v bodě 2 (str. 211). V případě, že bylo r(x) ž r, > 0 v <(a, í>> [nebo bylo-li r[x) > 0 aspoň v jednom bodě Xj e , viz pozn. 19.3], dokázali jsme pozitivní definitnost daného operátoru; v případě r(x) = 0 v <> jsme dokázali pozitivní definitnost uvažovaného operátoru na lineálu A?2 funkcí vyhovujících podmínce (19.27). Ponecháme-Ii stranou případ okrajových podmínek (19.84), který má speciální charakter (k tomuto případu se ještě později vrátíme), můžeme závěrem říci, že operátor A, definovaný předpisem (19.55), je na lineálu M funkcí spojitých včetně derivací prvního a druhého řádu v uzavřeném intervalu „(x)} přísMnou bázi, která splňuje předpoklady uvedené v citovaných kapitolách. Protože lineál Aí je hustý v HA, lze prvky 0 v i>), (19.93) lim (V - O2 dx = 0 . 224 Hl. APLIKACE NA DIFERENCIÁLNÍ ROVNICE 19. obyčejné diferenciální rovnice 225 To však znamená, že posloupnost {«á(x)} Je cauchyovská v L2(a, b). Prostor L2(a, í>) je však úplný, takže tato posloupnost konverguje v tomto prostoru k určité funkci, kterou označíme k0(x), (19.94) lim u'„(x) = v0(x) v L2(a, b) Dále je vzhledem k první z podmínek f 19.90) ««(*) (ŕ)dí pro každé n = 1,2, odkud obvyklým způsobem (použitím Schwarzovy nerovnosti) dostaneme (19.95) [um(x) - u„(x)f - ľfti,; - <) dí Ě ľl2 dí. (K - dt^(b- a) ľ(u'„ - utf dx . Protože platí (19.93), není (19.95) nic jiného než známá Bolzanova—Cauchyova podmínka pro stejnoměrnou konvergenci posloupnosti {"„(x)} v intervalu ) spojitá [u„(x) jsou funkce z M a konvergence je stejnoměrná]. Mimoto v L2(a, b) platí u(x) = u0(x), kde u0(x) je hledané zobecněné řešení našeho problému. Posloupnost {«„(*)} konverguje totiž v <[a, by stejnoměrně k funkci u(x), a tedy konverguje v <\a, ŕ>) k téže funkci i v průměru, srov. str. 42; protože však podle (19.89) konverguje {«„(*)} k u0(x) v HA, a tedy tím spíše v L2(a, b), nemůže být v L2(a, b) u w0. neboť pak by posloupnost {"„(x)} měla v L2(a, b) dvě různé limity a to je ve sporu s včtou 4.1, str. 41, Protože u(x) je spojitá funkce v intervalu (a, b} a u0(x) = u(x) v L2(a, b), můžeme i funkci u0(x) pokládat za spojitou v >, takže V0(x) = itn(x) v >'a, by. Podle (19.97) je tedy skoro všude v . V případě podmínek (19.98) je operátor AL, daný na lineálu M} [tj. na lineálu funkcí spojitých včetně derivací prvního a druhého řádu v <"')', na tomto lineálu pozitivně definitní, viz nerovnost (19.15), str. 211. Můžeme tedy zkonstruovat příslušný prostor HAl, jehož prvky patří, jak jsme viděli v kap. 10, do L2(a, b). Ovšem ne každý prvek z L2(a, b) patří do HAl. Jak uvidíme ve čtvrté části naší knihy, patří prvky prostoru IIÁÍ do tzv. prostoru W2l)(a, b). O prostorech tohoto typu je podrobně pojednáno v kap. 29 a 30. Jde zhruba řečeno o prostor těch funkcí z L2(a, b), které mají první derivaci (v určitém zobecněném smyslu) integrova-telnou s druhou mocninou v intervalu > a splňuji (rovněž v určitém zobecněném smyslu, v tzv. smyslu stop) podmínky (19.98)1). Proto podmínky (19.98) nazýváme stabilními: Všechny funkce z prostoru HAi splňují (v uvedeném zobecněném smyslu) tyto podmínky, tak jako je splňovaly funkce z původního lineálu Mt. V případě operátoru (19.102) A2u -O')' definovaného na lineálu Si2 funkcí spojitých včetně derivací do druhého řádu v <«, b}, splňujících podmínku (19.100) a okrajové podmínky (19.99), se setkáváme s jevem značně odlišným. Jak jsme ukázali, je operátor A2 na lineálu M2 pozitivně definitní. Avšak zdaleka ne všechny funkce z příslušného prostoru splňují (dokonce ani v některém zobecněném smyslu) podmínky (19.99). [Srov. příklad funkcí (32.3), (32.4) na str. 375.] Proto podmínky (19.99) nazýváme nestabilními2) [Podmínky (19.99) jsou nestabilní i v tom případě, že příslušný diferenciální operátor je pozitivně definitní již na lineálu M2 funkcí nesplňujících v obecném případě podmínku (19.100), což nastane např. je-li r{x) í r, > 0 v u„ minimální. Protože bázi volíme v prostoru HAl a všechny prvky tohoto prostoru splňují (v zobecněném smyslu) podmínky (19.98), splňují prvky báze automaticky stabilní okrajové podmínky (19.98). Také v případě problému s podmínkami (19.99) je hledaným zobecněným řešením funkce minimalizující funkcionál F2u = ^ pu'2dx - 2J7wdx (který zde co do formy splývá s funkcionálem Fju) v prostoru Funkce tohoto prostoru však obecně nesplňují (ani v zobecněném smyslu) podmínky (19.99). Při volbě báze {í(x)} je báze v J7 a to bez jakýchkoli dalších požadavků, týkajících se splnění okrajových podmínek. Limitní funkce jakožto zobecněné řešení pak tyto podmínky automaticky splňuje (popř. opět v určitém zobecněném smyslu). Je ovšem vhodné volil bázi v HXl. tak, aby prvky báze splňovaly okrajové podmínky (19.99); pak totiž splňuje tyto okrajové podmínky i každá lineární kombinace prvků báze, tedy také každá z Ritzových aproximací u„(x), takže přibližně zůstává splněna jen daná diferenciální rovnice. Tyto jednoduché úvahy, provedené na speciálním příkladě, lze snadno rozšířit na případ obyčejných diferenciálních rovnic vyšších řádů i na parciální diferenciální rovnice. Rovněž v těchto případech není třeba při volbě báze přihlížet ke splnění nestabilních okrajových podmínek, tj. podmínek obsahujících derivace vyššího ) Totéž se ovšem týká i metody ortonormálních řad, která vlastní je, jak jsme vidřli, speciálním případem Ritzovy metody, kdy báze {?>;(*)} je ortonormální v HA. 228 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE 19. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE 229 než (k — J)-ního řádu, kde 2k je řád dané rovnice.1) V této kapitole zatím nemáme vybudovány prostředky k hlubší analýze této problematiky, proto tvrzení zde uvedená ani neformulujeme dostatečně ostře a předkládáme je zde čtenáři bez důkazu. Podrobně se těmito otázkami zabýváme v kap. 34 a 35. Mimoto v kap. 21, sir. 255, uvedeme velmi jednoduchý, ale instruktivní příklad, na němž budeme moci tuto problematiku velmi dobře sledovat. Poznamenejme, že otázky související s eventuálním nesplněním nestabilních okrajových podmínek sc týkají metod založených na minimalizování příslušného funkcionálu, zejména tedy Rítzovy metody. Pokud jde např. o Galerkinovu metodu, je situace poněkud jiná. Při formulaci Galerkinovy metody (kap. 14, str. 170) jsme předpokládali, že funkce jak jsme již řekli, i funkce, které nesplňují tyto podmínky. Píšeme-li pak v případě Ritzovy metody uvedenou soustavu rovnic ve tvaru (13.11), str. 164, nikoli ve tvaru (l 3.29), str. 168 [tedy s koeficienty (^)A místo (Atpi, v)A = pu'2 dx + i ru2 dx + - p(b) u2(b) , J a J a y takže se zde vyskytuje člen (•) />(r>) w2(i>), který by se zde nevyskytoval v případě stabilní okrajové podmínky «(&) = 0. Mimoto se projeví vliv nestabilních okrajových podmínek při konstrukci prostoru IíA, ledy provést předem integrování per partes, kterým součin (Au, v) „převedeme" na tvar («, v)A, a to pro funkce u e DA, v e DA, tedy při použití všech okrajových podmínek. [Tim dosáhneme toho, aby se nám „neztratily" takové členy, jako je např. člen (5jy) p(ř>) u2(b) v případě okrajových podmínek (19.103).] Tak dostaneme vlastně Ritzovu soustavu ve tvaru (13.11), str. 164. V případě, že bychom použili Galerkinovy metody v klasické formulaci a za bázové funkce <ř>f(x) bychom zvolili funkce, které nevyhovují daným nestabilním okrajovým podmínkám, pak by se nám tyto podmínky skutečně z uvažovaného problému „ztratily" a řešili bychom vlastně problém poněkud jiný. Celá problematika je velmi průzračná v citovaném příkl. 21.2 na str. 255. Poznámka 19.6. (Nehomogenní okrajové podmínky) V případě, že místo homogenních okrajových podmínek (19.3) jsou dány nehomogenní okrajové podmínky (19.104) au'(a) - pu(a) - K, , yu'(b) + Su(b) = K2 , kde Klt K2 jsou daná reálná čísla, a nechceme-li daný problém předem převést na problém s okrajovými podmínkami homogenními (viz pozn. 19.1 a příkl. 19.1), pak (srov. pozn. 11.8, str. 153) místo funkcionálu (19.85) až (19.88) minimalizujeme funkcionály (19.105) F,« (19.106) F2u (19.107) F2u (19.108) Fiii pu'2 dx 4- I J a J a í pu'1 dx + f Ja J ( j* pu'1 dx + j" í ru2 dx - 2 ru2 dx — 2 ru2 dx dx + - p(b) u2(b) - 2K2p(b)u(b), y y pu dx + ru dx \ fu dx , J; J> 2 ľfu dx + £ p(a) u\a) + ?K' p(a)u(a), J. « a 2 ff« dx + £ p(a) u2(a) + 5 p(b) u2(b) + J. a 1 + ^lp(a) „(a) - ™2 p(b) u(b), a y na množině dostatečně hladkých funkcí,1) splňujících dané stabilní nehomogenní okrajové podmínky [a podmínku |*/(x)dx = 0 v případě, že je r(x) = 0aj) = — <5 — 0]. Např. v případě podmínek u(a) - 2, u(b) — 3 hledáme minimum funkcionálu (19.105) na množině funkcí splňujících obě podmínky u(a) = 2, «(í>) == 3, v případě podmínek u(a) - 2, u'(b) — 4u(b) - 3 na množině funkcí splňujících jen první z těchto podmínek atd. Podrobně o těchto otázkách i o vytvoření funkcionálu (19.105) až(l9.108) viz v kap. 34a 35. Viz tabulku funkcionálu na konci knihy. 1) Ve sroyslu čtvrté části naší knihy jde o funkce z prostoru W^-\a, b). 230 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE Ukažme ještě, jaká je podmínka pro řešitelnost problému (19.109) -{pu')' (19.110) u'(a) = ÍC,, «'(*) = ^2 ■ Předpokládejme, že existuje řešení této úlohy, a integrujme rovnici (19.109) v intervalu ']* - -Kfr) «'(*) + áá«%) = Nutná, a jak později uvidíme, i postačující podmínka pro existenci řešení tedy je (19.111) j/Wd* + KlP(b) - Kíp{q) = 0. b) Rovnice vyšších řádů. Uvažujme diferenciální rovnici 2fc-tého řádu (19.112) {~lf(pkvmr + (-!)*-'(/vy-'T"" + .-+PÚ* =f> stručným zápisem (19.113) 2(-l)'(P«^T =/« kde /eLj(ii, &), p,(x), i = 0, 1,..., k, jsou včetně derivací do i-tého řádu spojité funkce v uzavřeném intervalu > , ŕ - 0, 1, k - 1 , (19.115) ft(x) Ž P > 0 v , p = konst, s okrajovými podmínkami (19.116) u( a splňujících podmínky (19.116) a (19.117) a označme A operátor s definičním oborem M, daný předpisem (19.118) Au =Yl(-i)'(piuíi)yi\ ugM. 19. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE 231 Opakovaným integrováním per partes a použitím podmínek (19.116), (19.117) dostaneme t; ŕb (19.119) {Au, «) = I PiUmVm dx , odkud okamžitě plyne symetričnost operátoru A. Dále z (19.119) plyne (19.120) [Au, u) = £ fW0)2 dx ^ p fV")2 dx i = 0 J o J J v důsledku (19.114) a (19.115). Podle (19.116), (19.117) jc však u(o) = u(b) = 0, takže [viz (18.28), str. 200] (19.121) j" w2 dx í c, J u' kde pro C, je možno volit odhad (19.122) c, - dx, obdobne platí, neboť je u'(a) = "'(6) = 0, (19.123) j u'2 dx g c, j u"2 dx atd. až (19.124) jV*"-")2 dx á cL j" (u<*>)2 dx . Z (19.120), (19.121), (19.123) a (19.124) plyne (19.125) (Au,u)ž^\\u\\2, m kde pro c, můžeme volit odhad (19.122). Nerovnost (19.125) ukazuje, že operátor A je na lineálu M pozitivně definitní. Zobecněné řešení u0 dané úlohy lze tedy hledat jako prvek minimalizující v prostoru HA, popsaném v kap. 10, funkcionál (19.126) 7" = £ p{ui0fůx - 2 fudx i^=0 Jo J ď Jestliže k hledání tohoto zobecněného řešení použijeme některé z metod uvedených v předcházející části knihy a zvolíme-li bázi z prvků lineálu M, dokážeme obdobně jako v pozn. 19.4, že posloupnost (u**'(x)} je konvergentní v L2(a, b) a posloupnost {tt£'~n(x)} stejnoměrně konvergentní v (a, by. Odtud pak již lze snadno dospět k závěru, že zobecněné řešení u0(x) má v (a, r>) spojité derivace do řádu (fc — l)-ního 232 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE včetně a skoro všude v <«, fc> derivaci uak) e L2(a, b); posloupnosti {(^"'(x)}, i — = 0, 1, ..., k — 1, konvergují v 0 v (a, 6>] , s okrajovými podmínkami (19.129) u(a) = 0, u(b) = 0, (19.130) u"(a) = 0 , u*(o) - 0 . Jako dříve označme M lineál funkcí spojitých s derivacemi do čtvrtého rádu včetně v ŕ /"t /"b = — [p2u"o']* -f PjU v dx + i p,uVdx + p0«t)dx =s J ú J d Ja f-ŕ rb rb — p2u"o" dx 4- Piu'v' dx 4- pautidx , Ja Ja Ja odkud plyne symetričnost operátoru A na lineálu M. Dále podle (19.132) je rb rb rb rb (19.133) (Au, u) = p2u"2 dx + Plu'2 dx + p0u2 dx S p u"2 dx . J o Ja Ja Ja 19. OBYČEJNÉ DIFERENCIÁLNÍ ROVNICE 233 Napíšeme-li nyní Poincaréovu nerovnost (18.52), str. 206, pro funkci «'(x) (u e M), dostaneme (19.134) j"V2 dx S c3 j"V2 dx 4- c+ QV dxj - c3 |V2 dx , neboť j u' dx = u(í>) - u(a) = 0 v důsledku podmínek (19.129). Dále vzhledem k týmž podmínkám platí nerovnost (18.28), str. 200, (19.135) |[H|]J = fVdx Ä c, fu'2dx. Ja Ja Z (19.133), (19.134) a (19.135) plyne (19.136) (Au, u) Z — ■ \\u\l1, kde pro Cj, resp. c3 lze použít odhadů (19,37) O-M^ Tím je pozitivní definjtnost operátoru ^ dokázána. Úloha (19.127), (19.129), (19.130) se tedy redukuje na hledání minima funkcionálu rb rh rb = p2u"2 dx + pxu'2 dx + p0u2 dx - 2 (19.138) Fu v příslušném prostoru HA. Viz numerický příklad na str. 261. f u dx 234 III, APLIKACE NA DIFERENCIÁLNÍ ROVNICE 20. OTÁZKA VOLBY BÁZE 235 Kapitola 20 Otázka volby báze x) Obecné zásady Úvahy uvedené v této kapitoíe se budou týkat převážné — i když nikoli výhradné — Ritzovy metody, která je z variačních metod nejpoužívanější. Proto také budeme většinou mluvit přímo o RttzovČ metodě a jen na některých místech upozorníme na možnost, resp. vhodnost aplikace uvedených výsledků i v jiných případech. Ostatně čtenář dovede jisté sám posoudit, který z těchto výsledků je v příslušném případě užitečný. Jestliže k minimalizování funkcionálu Fu = (n, u)A - 2(/,«)T příslušného danému pozitivně definitnímu operátoru A a definovaného pro u g Ha, kde HA je prostor, o němž jsme podrobně hovořili v kap. 10, používáme Ritzovy metody, potřebujeme nejprve zkonstruovat vhodnou posloupnost funkcí1} (20.1) j00, PÄx), ... , z nichž pak tvoříme Ritzovu posloupnost (20.2) ut(x), u„(x),.... Přitom n-tý člen Ritzovy posloupností je lineární kombinací funkcí (20.1), u„ ta + ... + an,)*«„ =(f,. <ŕ\.)* °2 + ■- ■ + ( 0, stačí vypočítat prvky matice ft„ a vektoru f„ s dostatečnou přesností, abychom dostali \vK - u„\\A < e . Při právě řešené otázce numerické stability jsme nevzali v úvahu zaokrouhlovací chyby, vznikající při samotném řešení soustavy (20.3), např. při řešení iteracemi, ale i jinými metodami. Vliv těchto chyb je, jak známo, tím menši, čím je menší tzv. cislo podmíněnosti (stručně podmíněnost) matice dané soustavy, což je poměr největšího vlastního čísla této matice k nejmenšímu. Bude jistě přirozený požadavek, aby toto číslo zůstalo omezené stejnoměrně k n. Jak tedy z uvedeného textu plyne, bude vhodné položit na bázi (20.1) tyto další požadavky: Báze (20.1) je taková, aby c) numerický proces byl stabilní; d) čísla podmíněnosti matice R„ byla stejnoměrně omezená vzhledem k n. Splnění těchto požadavků pak vylučuje různá „překvapení" při numerickém výpočtu. V kap. 13, jsme se zmínili o možnosti odhadnout chybu na základě vzorce (11.21), (20.9) Ik - "II kde \\Au„ - /|| je norma rozdílu Avn — / v prostoru L2(G) a C je konstanta pozitivní deůnitnosti ze vzorce (10.1), (20.10) ž C2HŽ • ') Normou matice zde rozumíme euklidovskou normu: Je-li C= (ejj), pak - ||C|| n ( £ e&) ■ Vektor gn pokládáme za jednostoupcovou matici. <,l = i Již v diskusi o přednostech a nedostatcích Ritzovy metody jsme se zmínili d tom, že odhadu (20.9) nelze vždy s úspěchem využít, neboť ne vždy platí (20.11) Au„ — f 0 pro n -> oo a že platnost, resp. neplatnost vztahu (20.11) závisí na vhodné volbě báze. Další požadavek, kladený na bázi (20.1), tedy bude: e) Báze (20.1) je taková, že v případě Ritzovy metody platí (20.11).1) Po tomto úvodu uvedeme některá kritéria a návody, jak zkonstruovat bázi, která má vlastnosti a) až e), resp. aspoň některé z nich. Přitom podstatně využijeme Michlinových výsledků, zejména z jeho monografie [29]. Viz také [4]. Připomeňme nejprve některé klasické příklady systémů úplných v L2(G). Již v kap. 4 jsme se seznámili se systémy jednoduchých polynomů: Tak v prostoru L2(a, b) je úplný systém (20.12) \,x, x^x*, v prostoru L2(G) odpovídající systém jednoduchých polynomů v N proměnných, např. v rovinném případě (N = 2) systém (20.13) 1. x, y, x2, xy, y1, .... 2) Systémy typu (20.12), (20.13) ovšem nejsou vhodné jako báze v případech, které nás právě nejvíce zajímají, kdy totiž máme splnit některé homogenní okrajové podmínky. V případě funkcí jedné proměnné splňují nulové okrajové podmínky v krajních bodech intervalu > např. funkce (20.14) / ■> • ntt(x - a) 0„{x) = sin —i-'- , (i 1.2, ■ speciálně tedy v intervalu (0, je) funkce (20.í5) (p„(x) = sin nx , n = 1, 2,..., ') Poznamenejme, že u některých metod, např, u metody ncjmcnšícli Čtverců, je (20.11) přímým důsledkem užité metody. 2) Připomeňme (srov. kap. 4), že prostor L2(l7) je separabilní: Spočetnou množinu hustou v metrice tohoto prostoru tvoří množina polynomů (v N premenných) s racionálními koeficienty. Poznamenejme, že tato množina je hustá, v příslušných metrikách, i ve všech prostorech, s nimiž se v této knize setkáme, tj. v prostorech HA i v prostorech W2k,(G), které zavedeme ve čtvrté části této knihy, takže vScchny tyto prostory jsou separabilní. Tento poznatek bude v dalším textu užitečný. 238 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE 20, OTÁZKA VOI.BY BÁZE 239 přičemž je známo, že systém (20.14) je v L2(a, b) úplný. Podobně je úplný v L2(G) systém funkcí / \ ■ niníx, — a) . nrc(x2 — c) (20.16) m„(x) = sin-^-í-i sin —K—--í, m = 1, 2,..., n = 1, 2, ..., b — a d — c splňujících nulové okrajové podmínky na hranici obdélníka G = (a, b) x (c, d), speciálně systém funkcí splňujících nulové okrajové podmínky na hranici čtverce (0, n) x (0, tc). Obdobná tvrzení platí na príslušných kvádrech v N-rozměrném prostoru (pro N > 2). Je otázka, Ize-Ii použít těchto systémů i jako úplných systémů v prostorech HA. Uvedeme bez důkazu tuto větu (důkaz viz např. v [29], str. 366): Věta 20.1. Nechť (jako obvykle) A je pozitivně dejinitní operátor na lineálu DA, hustém v Hilbertově prostoru H. Je-li posloupnost (20.17) A„... je úplná v HA. Odtud ihned vyplývá, že v případě Dírichlctova problému pro Poissonovu rovnici na obdélníku G = (a, b) x (c, d), (20.19) -Au = / v G, (20.20) u = 0 na ľ, je systém (20.16) v příslušném prostoru HA úplný. Operátor A, daný na lineálu DA funkcí patřících do C(2)(G) a splňujících podmínku (20.20) je totiž (viz kap. 22, str. 270) na tomto lineálu pozitivně definitní. Každá z funkcí (20.16) zřejmě patří do DA; dále jc A2-y2). (x2 - a2) (y2 - b2) (x2 + y2 - R2).. která je zřejmě v G dostatečně hladká, je rovna nule na hranici a kladná v (otevřené) oblasti G. Např. Ritzovu aproximací u6 lze pak v prvním případě volit ve tvaru (20.26) u6(x, y) = (R2 - x2 - y2)(a, + a2x + a3y + a4x2 + a5xy + a6y2) . 1) Stačí, má-li tato funkce v G spojité parciální derivace do druhého rádu včetně. 240 III. APLIKACE NA DIFERENCIÁLNÍ ROVNľCE 20. OTÁZKA VOLBY BÁZE 241 Obdobně můžeme postupovat v případě vyššího počtu dimenzí, resp. v případě rovnic vyššího řádu. Řešíme-li napr. v oblasti C problém (20.27) (20.28) 0. Á2u au č v f, = 0 na ľ , můžeme použít systému funkcí (20.13), násobených funkcí g2(x, y). Tento systém pak bude úplný v HA. [Funkci g(x, y) zde volíme v kvadrátu, aby byly splněny zároveň obě podmínky (20.28).] Podobně lze při řešení Dirichletova problému pro rovnice vyšších řádů použit systému funkcí (20.13), násobených dostatečně vysokou mocninou funkce g. Uvedený způsob lze v jednotlivých případech vhodně modifikovat. Řešíme-li např. na půlkruhu x2 + y2 < R2 , y > 0 problém (20.29) (20.30) (20.31) (20.32) u = 0, — = 0 na horní půlkružnici , d v u = 0 pro y — 0 , = 0 pro y = 0 (půlkruhová deska, vclknutá do kruhové části hranice a prostě podepřená na zbývající části hranice), můžeme za bázi zvolit posloupnost funkcí (20.13), násobených funkcí (20.33) y(R2 Funkce (20.33) je na G kladná a dostatečně hladká a pro každou z funkcí takto vzniklé posloupnosti budou splněny podmínky (20.30) a (20.31). Podmínku (20.32) není nutno a priori splnit, neboť je nestabilní. Uvedené systémy [tj. systémy typu (20.25), popř, vhodně modifikované] jsou sice úplné v HA, jsou však v obecném případě „málo ortogonální", a tedy ne vždy vhodné k numerickému výpočtu. Značného zlepšení v tomto směru lze získat užitím Legen-drových polynomů, viz [29]. Často však bývá podstatně účinnější cesta, kterou popíšeme: Čtenáři je pravděpodobně známý pojem vlastního čísla, resp. vlastni funkce některého problému. Podrobně se tnuto problematikou zabýváme v kap. 37 až 41. Zde stručně uvedeme jen některé výsledky a příklady. Nechť A je lineární diferenciální operátor1), definovaný na lineálu DA dostatečně hladkých funkcí (je třeba, aby tyto funkce měly potřebný počet derivací, neboť je třeba na ně aplikovat operátor A), vyhovujících daným homogenním okrajovým podmínkám. Řekneme, že číslo A je vlastním číslem operátoru A, existuje-1i nenulová funkce u e DÁ tak, že (20.34) Au - Xu = 0 Funkci u(x) [u(x) ép 0] nazýváme vlastní funkci operátoru A, příslušnou tomuto vlastnímu číslu. Z homogennosti uvažovaného problému plyne, že je-li u(x) vlastní funkce operátoru A, příslušná vlastnímu číslu X, pak že funkce ku(x), kde k je nenulová konstanta, je také vlastní funkcí operátoru A. V kap. 39 ukážeme (i když příslušnou větu tam budeme formulovat v poněkud odlišném tvaru), že pro pozitivně definitní diferenciální operátory typů, s nimiž se v této knize setkáme, platí: Operátor A má spočetně mnoho vlastních čísel A,, Xz, ... a„, ... a spočetně mnoho příslušných vlastních funkcí (20.35) které lze v HA ortonormalizovat (takže jsou zároveň v HA lineárně nezávislé). Systém (20.35) je úplný v HA. System (20.35) splňuje tedy požadavky a), b), vyslovené na začátku této kapitoly. Lz: ukázat (viz [29]), že je-li ortonormovaný, splňuje i požadavky c), d) a e), týkající se numerické stability procesu v Ritzově metodě, stejnoměrné podmíněnosti Růžových matic a konvergence posloupnosti Au„ k funkci / v L2(G). Velmi jednoduchým příkladem problému vlastního čísla je problém (20.36) (20.37) -u" - Xu = 0, «(0) = 0 , h(5i) = 0 pro operátor A = — u", jehož definiční obor DA tvoří funkce dvakrát spojitě diferencovatelné v intervalu (0, h) a splňující podmínky (20.37). Určení vlastních čísel i vlastních funkcí je zde neobyčejně jednoduché. Hledejme tedy nenulové řešení problému (20.36), (20.37). Snadno zjistíme, že pokud je X = 0 nebo X < 0, nenulové řešení neexistuje. [Je-li totiž 1 = 0, redukuje sc rovnice (30.36) na rovnici u" = 0 s obecným integrálem u(x) = ax + ŕ>; z podmínek (20.37) pak jednoduchým výpočtem plyne a — 0, b = 0, takže u(jc) = 0. K témuž výsledku dospějeme obdobným způsobem, je-li X < 0.] Nechť tedy je JL= n2 n > 0 . ') V této části knihy uvažujme jen diferenciální operátory s dostatečně hladkými koeficienty v 5. 242 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE Rovnice (20.36), tj. rovníce u" + n}u = 0, má pak obecný integrál u = a cos nx + b sin nx . Z první podmínky (20.37) plyne a = 0, takže u = b sin nx . Z druhé podmínky (20.37) plyne b sin nic = 0 . Nemá-li být řešení nulové, je b + 0, takže musí být sin nu = 0. Protože n > 0 podle předpokladu, plynou odtud pro n hodnoty «i = 1, «2 = 2, n3 = 3, ... . Vlastní čísla daného problému jsou tedy A, = n, = - n\ = 4, 23 = n2 = 9,... a příslušné vlastni funkce jsou (20.38) sin x, sin 2x, sin 3x, ... . Funkce (20.38) jsou v odpovídajícím prostoru HA ortogonální, jak lze ověřit přímým výpočtem: 0, je-li fc +/, (/i sin jx, sin kx) j sin /x sin kx dx , je-li k = ; . Protože skalární součin (u, u)^ v prostoru /íA je jen rozšířením skalárního součinu (Au, v), vyplývá odtud ortogonálnost funkcí (20.38) v HA}) Ve shodě s dříve uvedeným tvrzením je mimoto systém (20.38) úplný v fíA.2r) Normujeme-li jej v tomto prostoru, bude splňovat i požadavky c), d), e), formulované v předcházejícím textu. Zcela analogicky se ukáže, že (20.14) je systém vlastních funkcí problému -«" - Xu = 0, «(o) = 0 , u(b) - 0 , ') Je ovšem možno použít přímo skalárního součinu Jq u'v' dx, srov. příkl. 10.1, str. 128. 2) Úplnost systému (20.15) v HA plyne tedy nejen z včty 20.1, ale i z práve uvedeného výsledku. 20. OTÁZKA VOLBY BAZE 243 a dále, že (20.16) je systém vlastních funkcí problému (20.39) -Au — 2u = 0 v G , (20.40) u = 0 na ľ na obdélníku G — (a, i>) x (c, cl), tj. systém vlastních funkcí operátoru — A, uvažovaného na lineálu funkcí spojitých s parciálními derivacemi do druhého řádu včetně v 5 a splňujících podmínku (20.40).') Podobně lze sestrojit analogické systémy vlastních funkcí na kvádrech vyšších dimenzí. Zcela obdobně jako v případě problému (20.36), (20.37) zjistíme, žc (20.41) cos x , cos 2x , cos 3x,... je systém vlastních funkcí operátoru u", pozitivně definitního (viz str, 214) na lineálu M2 funkcí dvakrát spojitě diferencovatelných v intervalu •(O, rc> a splňujících podmínky (20.42) (20.43) Podobně funkce (20.44) J" u(x) dx = 0 , h'(0) = 0, u'(%) = 0 . ítJt(x - a) cos —1-'■ , n = 1, 2, ... b — a tvoří systém vlastních funkcí obdobného problému, uvažovaného na intervalu (a, by. V uvedených případech jsme sestrojili systém vlastních funkcí — a tím i vhodnou bázi v RA, splňující (po normování v tomto prostoru) požadavky a) až e) — velmi jednoduchým způsobem, neboť uvažované operátory — u", —Au i jejich definiční obory (interval, obdélník apod.) byly velmi jednoduché. Problém by byl daleko obtížnější, kdybychom uvažovali např. operátory s nckonstantními koeficienty. Tím důležitější je proto výsledek který formulujeme ve větě 20.2 na str. 245 a který nám umožní „nahradil" systém vlastních funkcí složitějšího operátoru systémem vlastních funkcí jednoduššího operátoru. Předem však zavedeme pojem samo-adjungovaného operátoru. Uvažujme lineární operátor A s definičním oborem DA, hustým v Hilbertově prostoru H se skalárním součinem (u, v). Pro některá ve H existuje takové v*eH, že platí (Au, v) — (u, u*) pro každé u e DA . ') Vzpomeňme si, že systému (20.16), předem ještě znormovaného, jsme použili v příkl. 12.1 při užilí metody ortonormálních řad. 244 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE Tuto vlastnost má napr. prvek v ~ 0; příslušný prvek je v* — 0: Pro každé u e DA zřejmé platí (Au, 0) = (u, 0) = 0 . Je-li operátor A symetrický na lineáln DA, mají tuto vlastnost všechny prvky u 6 DA; odpovídající prvky jsou v* = Av, neboť pro každé u e DA, v e DA v tomto případě platí (Au, v) = («, v*) . Množina všech ve H s touto vlastností však může být i širší. Označme v obecném prípade M množinu všech ve H & uvažovanou vlastností. Protože lineál DA je hustý v H, je prvek v* prvkem ve M vždy jednoznačně určen. Tím je na množině M definován určitý operátor A*, v* = A*v , v g M , takový, že pro každé u e DA a pro každé v e M = DA. platí [Au, v) = («, A*v) . Operátor A* se nazývá adjungovaný k operátoru A. Je-li A* — A (tj. je-li DA. ~ DA a A*u = Au pro každé u e Df), nazývá se operátor A samoadjungováný. Pro symetrický operátor je zřejmě DA DA,, přičemž, jak jsme se zmínili, může skutečně množina DA, být Širší než množina DA, Všimněme si ještě, že (zhruba řečeno) čím širší je definiční obor DA daného operátoru, tím užší je definiční obor D^.adjun-govaného operátoru [neboť definiční rovnice (Au, v) = (u, v*) má platit pro „více" prvků til. Lze očekávat, že rozšíříme-li vhodně definiční obor symetrického operátoru, zúžíme tím definiční obor adjungovaného operátoru tak, že oba definiční obory splynou. Jak lze ukázat (viz např. [30]), mají tuto vlastnost pozitivně definitní operátory: Každý pozitivní definitní operátor1) lze rozšířit na samoadjungovuný. Přitom takto rozšířený operátor zůstane pozitivně definitní a systém jeho vlastních funkcí splývá se systémem vlastních funkcí původního operátoru A. Dva pozitivně definitní samoadjungované operátory A, B se nazývají shodné, je-li DA = DB2) Pokud jde o pozitivně definitní diferenciální operátory týchž řádů, s kterými se zabýváme v této části naší knihy a jejichž původní definiční obory se skládají z dostatečně hladkých funkcí, můžeme zhruba říci, že příslušné samoadjungované operátory Ä, B, které jsou jejích rozšířením, jsou shodné, jsou-li definiční obory 1) Podle definice je pozitivně definitní operátor a priori symetrický, 2) Upozorňujeme čtenáře, že terminologie není v literatuře ustálená. V žádném případě ze shodnosti dvou operátorů nemusí plynout jejich rovnost podle def. 8.4, str. 92. 20. OTÁZKA VOLBY BÁZE 245 DA, DB původních operátorů A, B totožné. Podrobně se touto problematikou zabývá kniha [29], kde také čtenář najde důkazy dále uvedených tvrzení. Např. operátory (20.45) (20.46) A ~ — (pu')' + ru . B = -«", kde p, p', r jsou funkce spojité v (a, ři>, p(x) ž p0 > 0, r(x) H v {«, f>>, jsou pozitivně definitní na společném definičním oboru DÁ — DB funkcí dvakrát spojitě diferencovatelných v {a, &> a splňujících podmínku (20.47) u(a) = 0 , u(b) = 0. Jejich samoadjungovaná rozšíření A, B jsou shodné operátory. Totéž platí pro samoadjungovaná rozšíření operátorů (20.48) (20.49) \3x2 dy1) k > 0, B -Au , pozitivně definitních na společném definičním oboru DA = DB funkcí spojitých s parciálními derivacemi do druhého řádu včetně v uzavřené oblasti G a splňujících podmínku (20.50) u = 0 na ľ . Další příklady si jistě čtenář zkonstruuje sám. Dva shodné operátory A, B nazveme příbuznými, lze-li najít kladné konstanty c a k tak, že pro každé u e D% = DB platí \(Äu,[B + kl)u)\ ä c\\Äu\\2, kde / je jednotkový operátor. Lze opět ukázat ([29], str. 138 a dále), že shodné operátory, které uvažujeme v naší knize, splňují uvedenou podmínku. Platí tato důležitá věta (viz [29], str, 369 a 371, viz též [28]): Věta 20.2. Nechť A a B jsou shodné příbuzné operátory. Pak ortonormální systém1) vlastních funkcí operátoru B má všechny požadované vlastnosti a) až e) kladené na bázi v prostoru HA. Zhruba řečeno, při volbě báze s vlastnostmi a) až e) lze zaměnit ortonormální systém vlastních funkcí operátoru Ä ortonormálním systémem vlastních funkcí' některého jednoduššího operátoru B, shodného a příbuzného s operátorem Ä. ') Normovaný v metrice prostoru //g nebo, což je totéž, v metrice prostoru HB. 246 III. aplikace na diferenciální rovnice 20. otAzka volby báze 247 Například pro Ritzovu metodu řešení problému -(pu')' + ru = f, u(0) = 0. u(k) = 0, lze využít shodnosti a příbuznosti samoadjungovaného rozšíření operátorů (20.45) a (20.46) a za bázi lze zvolit systém (20.38) vlastních funkcí operátoru B, ortonormo-vaný v HB, tj. v prostoru se skalárním součinem tedy systém (20.51) (", v)B = u V Jo dx , resp. <-/, i>, s kterými se v aplikacích nejčastěji setkáme. I. Rovnice (20.55) -(?"')'.+ m. =f> p, p', r spojité v <0, />, p(x) g p0 > 0, r(x) ^ 0 v <0, í>. 1. Okrajové podmínky (20.56) u(0) = 0 , u(í) = 0 . Zvolíme bázi sin (20.57) 1 n = 1,2, Zejména pro l = it dostáváme bázi (20.52). 2. Okrajové podmínky (20.58) u'(0) - jS u(0) = 0 , u'(l) + 5 u(í) = 0, řžO.ížO. Není-li zároveň r(x) m 0, p - š - 0, volíme bázi (20.59) q>0(x) = 1 , tp„{x) , «=1,2,....') V případě, že je r(x) = 0, fi = ô = 0 (str. 213), vynecháme v (20.59) funkci 0 [přičemž připouštíme r(x) s 0], je příbuzným operátorem samo-adjungované rozSiřeni operátoru, daného předpisem —u" na lineálu (dostateční hladkých) funkcí splňujících podmínky (20.58). Systém vlastních funkcí tohoto operátoru však není jednoduchý. Dáváme zde proto přednost systému (20.55). (Srov. [29], str. 168, 169.) 248 III. APLIKACI NA DIFERENCIÁLNÍ ROVNICE 21, NUMERICKÉ PRÍKLADY 249 3. Okrajové podmínky (20.60) u(0) = 0 , «'(() + ô u(f) = 0 , 5 ä 0 . Zvolíme bázi (20.6 í) Pi-> P\> P21 Pii PÍ spojité funkce v intervalu <0, />, resp. <-/, />, p0(x) > 0, Pí(jc) ž 0, p2(x) ž j) > 0 v {0, 1>, resp. <-/, />. 4. Okrajové podmínky (20.63) u(°) = °> w(i) = 0, (20.64) u"(0) = 0 , u"(l) = 0 . Zvolíme bázi (20.65) 2» = "V cos--{— 1) , n = 1,2, ... , kde X„ jsou kladné kořeny rovnice uspořádané podle velikosti, takže tg Í — k, (2" -1)* <, < (2" + a* Je a. ä 4,493 2 , a2 ä 7,725 2 , 1$ ä 10,903 5 , Příklady dalších bází najde čtenář v [29], str. 163 až 178. Viz také [4], str. 153 až 157. Poznamenejme, že ve speciálních případech (využijeme4i např. lichosti nebo sudosti daného problému) lze použít jednodušších bází (srov. text na str. 169). Kapitola 21 Numerické příklady: Obyčejné diferenciální rovnice V této kapitole uvedeme tři příklady na řešení obyčejných diferenciálních rovnic variačními metodami. První dva z nich budou ilustrativní, neboť jejich řešení je předem známo. Uvádíme je proto, že budou pro Čtenáře po všech stránkách velmi instruktivní a že bude na nich velmi dobře vidět, jak lze a také jak nelze postupovat v případech, které zdaleka nejsou tak jasné (zejména v případě parciálních diferenciálních rovnic). V třetím příkladě provedeme numerický výpočet rovnice (21.50) Čtvrtého řádu, s proměnnými koeficienty, s okrajovými podmínkami (21.51), (21.52). (Technicky vztato jde o průhyb nehomogenního prostě podepřeného prutu spočívajícího na pružném podloží, resp. zatíženého i osovými silami.) Příklad 21.1. Řešme problém (21.1) -h" = cosx, (21.2) u(0)=0, u(k) = 0. Řešení tohoto problému je / ^ 2 u(x) — cos x H— x — 1 ; 71 rovnici (21.1) stačí dvakrát integrovat a integrační konstanty určit z podmínek (21.2). Příklad je tedy zřejmě ilustrativní. Ukážeme na něm použití Ritzovy a Galer-kinovy metody i metody nejmenších čtverců a zároveň užití vzorce (11.21), str. 144, 250 III. APLIKACE NA DIFERENCIÁLNÍ RQYNICE 21. numerické PŘÍKLADY 251 pro odhad chyby. Problém je tak jednoduchý, že na něm nelze nic „zkazit". Výsledků tohoto příkladu však použijeme v příkl. 21.2, kde, jak uvidíme, lze již „zkazit" mnoho. Pozitivní definítnost operáto r,u A, definovaného předpisem Au - ■■ — u" na lineálu M fhustém v L2(0, Jt)] dvakrát spojitě diferencovatelných funkcí v intervalu (0, liy a vyhovujících podmínkám (21.2), vyplývá jako speciální případ z výsledků kap. 19. 1. Řešení Ritzovou metodou Podle (20.57) zvolíme bázi (21.3) sin x, sin 2x sin 3x 2 3 Ritzova n-tá aproximace bude tedy mít tvar - s A sinjx ".("•) = L CJ — * i=í J resp. píšeme-1 i cjjj = ajt tvar (21.4) u„(x) - Y. «iSÍn./x . j= i Používáme-li tvaru (21.4), volíme vlastně bázi (21.5) sin x , siu2x, sin 3x..... což, jak uvidíme, v našem případě, kdy půjde o explicitní vzorce pro koeficienty Oj, po numerické stránce nikterak nevadí. Všimněme si ještě, že problém je „symetrický podle bodu (jt/2, 0)": Daný diferenciální operátor má konstantní koeficienty, okrajové podmínky jsou symetrické podle bodu (;t;2. 0) a graf pravé strany rovnice (21.1) je symetrický podle bodu (w./2, 0). V souhlasu s úvahou provedenou v pozn. 13.7, str. 169, můžeme v (21.5) uvažovat jen ty funkce, jejichž grafy jsou symetrické podle bodu (jt/2, 0). Zvolíme tedy bázi (21.6) i> „)a2 + ... + (A 0,348 1, takže \u3\a > 0,59. Pro odhad relativní chyby ||«0 - UíIWIJ^jIL dostáváme tedy podle (21.14) "n — »3 L 0,43 „ „. L^--< ----- < 0,74 Skutečná relativní chyba je 0,59 0,035 0,59 0,06 . Uvedené odhady (pro n — 3) nejsou ovšem příliš uspokojivé. Poznamenejme však, že je možno učinit je libovolně malé, zvolíme-li n dostatečně velké, neboť, jak víme z předcházející kapitoly, při zvolené bázi platí lim \\AuB -/fl =0. Poznámka 21.1. Lze snadno ukázat, žc součet řady (21.15) s(x) 2 sin 2/x n j-i j(4j2 - 1) je roven funkci cos x 4- (2/tc) x — 1. Derívujeme-li totiž řadu (21.15) člen po členu, dostaneme řadu (21.16) 4 |1, cos 2/x 7E j= i Aj% — 1 která je, díky druhé mocnině j ve jmenovateli, stejnoměrně konvergentní v intervalu ■(O, rc>. Její součet je tedy derivaci součtu řady (21.15), která je v intervalu <0, w) také stejnoměrně konvergentní. Podle vzorce 10, [35], str. 591, je součet řady (21.16) v intervalu <0, te) roven funkci (21.17) --sin x ; n funkce s(x) je tedy v intervalu <0, jc) primitivní k funkcí (21.17), a protože je s(0) = = s(jc) = 0, je rovna funkci cosx + (2/jt) x — 1, Z právě provedené úvahy dále 254 III, APLIKACE NA DIFERENCIÁLNÍ KO.VNICF. vyplývá, že v uvedeném případě konverguje nejen Ritzova posloupnost {u„(x)}, ale i posloupnost jejích derivací {«^(x)} stejnoměrně v intervalu <0, n) k hledané funkci u0(x), resp. k její derivaci u'0(x). (Srov. též [25].) 2. Řešeni Galerkinovou metodou Zvolme opět bázi (21.6), tj. bázi (21.18) k = !,-■,", dostaneme po vynásobení a využití symetrie [tj. vztahu (Aj(x) = sin 2jx , j = 1,2,.... Myšlenka metody nejmenších čtverců záleží, jak známo, v minimalizování výrazu (21.21) lK-y;ľ v metrice prostoru L2(0, ti) na lineáiu funkci tvaru z„M = I ej'?/*) • 21. NUMERICKÍ PRÍKLADY 255 Jak jsme ukázali v kap. 15, vede požadavek minima výrazu (21.21) k této soustavě pro určení konstant cy. (21.22) £ (A což je vzhledem k symetričnosti operátoru A opět soustava totožná se soustavou (21.7). Také zde je tedy další rozbor užité metody zbytečný. Příklad 21.2. Řešme problém (21.24) -u" = cosx, (21.25) «'(0) = 0, u'(n) = 0. Funkce na pravé straně vyhovuje podmínce (21.26) í: cos x dx = 0 , což je [viz (19,26), str. 213] nutná (i postačující) podmínka pro existenci řešení. Operátor á2 - —u" jc na lineáiu f/l2 funkcí dvakrát spojitě diferencovatelných v <0,7t> a vyhovujících podmínce (21.27) dx = 0 a okrajovým podmínkám (21.25) pozitivně denními [nerovnost (19.33), str. 215]. Lze tedy obvyklým způsobem sestrojit prostor H^, v němž existuje právě jedno zobecněné řešení w0(x) problému (21.24), (21.25). Toto řešení minimalizuje v HXí funkcionál (21.28) Fu - í «'2(x) dx - 2 ľ u(x) cos x dx . Jo Jo Připomeňme, že každá z funkcí prostoru IIx, splňuje podmínku (21.27), v obecném případě však nikoli podmínky (21.25), které jsou pro operátor A2 nestabilní. Snadno ověříme, že v našem případě je w0(x) = cos x. Řešení je tedy známo a příklad je ilustrativní. Přesto najde čtenář v tomto příkladě mnoho zajímavého. 256 iii. APLIKACE NA DIFERENCIÁLNÍ KOVNICE 21. NUMERICKÉ PRÍKLADY 257 1. Řešení Ritzovou metodou Podle (20.59) zvolíme bázi [funkci (p0(x) = 1 v systému (20.59) vynecháváme] cos 2x cos 3x (21.29) takže bude cos x , "»(x) = X cj COS JX = 1 J O/načímc-li, jako v předcházejícím textu a i: bude (21.30) což odpovídá bázi (21.31) (srov. str. 250). Vzhledem ke vztahu »»(*) = 2>j«wjjc, (j>j(x) = cos jx , 7=1,2, a k ortogonalitě funkcí (21.31) v intervalu <0, Tt> se Ritzova soustava (21.7) redukuje na soustavu (21.32) -a, + 0.a2 + ... + 0.aH~n_, 22jt 0 . a1 + — a2 + ... + 0 . a„ = 0 , 0 . 4, + 0. a2 + .. + — a„ ~ 0, s řešením a1 = 1, a2 = tí3 = ■•• = °- Odtud ihned plyne nám již známý výsledek u„(x) =. cos x pro každé n , u„(x) = cos x . a tedy 1) V této bázi bychom mohli vzhledem k symetrii problému podle bodu (rt/2,0) vyškrtat sudé členy. Poznámka 21.2. Funkce báze (21.31) splňují zřejmě dané nestabilní okrajové podmínky (21.25). Jak jsme upozornili v pozn. 19.4, není třeba v případě nestabilních okrajových podmínek volit u Riztovy metody bázi tak, aby funkce báze splňovaly tyto podmínky. Podívejme se tedy na způsob řešení Ritzovou metodou, zvolíme-íi bázi, jejíž funkce nebudou splňovat okrajové podmínky (21,25). Zvolme za bázi funkce (21.6), tj. funkce (21.33)

Wk)*2 c* = (f)> J — 1, ...,n . Ale pro u e DXl, v S DÄ1 je (21.35) (Ä2u, v) = (-u")udx = Jo u'v' dx vzhledem k podmínkám (21.25). Skalární součin v je jen rozšířením skalárního součinu (21.35) z lincálu M2 na celý prostor HAj, takže {9j,xhi = f >i dx = j° Protože (/>Oy) = - pro A- + j , 2jy*2 pro k ~ j . m 4f - 1 jako v (21.9), bude soustava (21.34) mít tvar (21.36) 2Tr.lJ.a,+ 0.aa + ... + 0. «„ = 0 . ax + 2k . 22.a2 + ... + 0 . a„ = 4 . I2 - 1 4.2 4 . 22 - 1 ' 0 . at + 0 . «2 I ... ; 27tn2 . a„ - 4n 4/j2 - 1 To však je přesně táž soustava jako soustava (21.10), takže i v našem případě je 2 sin 2jx (21.37) «A*) = - I it/=u(4i' - 1) 258 III. A PLI K AC R NA DIFERENCIÁLNÍ ROVNICE Posloupnost (21.37) však nemůže konvergovat k hledanému (a v našem případě známému) řešení uB(x) — cos x, neboť, jak jsme ukázali, součet řady 2 .í, sin 2jx je v intervalu (0, jc) roven funkci (21.38) cos x +■ (2/ji) x — 1 . Kde jsme tedy udělali chybu? Chyba není v lom, že funkce sin jx nesplňují okrajové podmínky (21.25) — tyto podmínky jsou nestabilní —, ani v tom, že jsme ze systému funkcí sin jx vyškrtali liché členy a ponechali jen Členy tvaru sin 2jx; problém je skutečně symetrický vzhledem k bodu (jc/2, 0). Chyba není způsobena ani tím, že bychom u bázových funkcí nerespektovali podmínku funkcí z II Xl, u(x) dx = 0 ; každá z funkcí sin 2jx tuto podmínku splňuje. Systém (sin 2jx] však není v prostoru HÍ7 úplný. Jc úplný [máme-li stále na mysli symetričnost problému vzhledem k bodu (ti/2, O)] např. v prostoru L2(0, ji) nebo v prostoru IIA, kde A je operátor z příkl. 21.1 [a kde tedy funkce z HA splňují podmínky u(0) = 0, m(tc) — 0]. Není však úplný v metrice prostoru IIAl, který je sice „užší" než prostor HA v tom smyslu, že funkce z HX: splňují podmínku (21.27), jc však „širší" než prostor HA v tom smyslu, že obsahuje i funkce, které nejsou rovny nule v krajních bodech intervalu <0, rc>. Již z názoru lze očekávat, že právě takové funkce [a tedy také hledané řešení u0(x) = cos x] nelze v metrice prostoru HAl aproximovat funkcemi tvaru sin 2jx, rovnými nule pro x = 0 a x = tt V případě Ritzovy metody lze ukázat, že nápravy lže dosáhnout lak, že k systému (21.6) „přidáme" vhodnou lineární funkcí.2) Aby tato funkce zároveň splňovala podmínku J"£ u(x) dx == 0 i podmínku symetričností vzhledem k bodu (ji/2, 0), volme ji ve tvaru x — nj2. Zvolme tedy bázi (21.39) 2 '(0, ji) těch funkcí, jejichž graf je symetrický vzhledem k bodu (it/2, 0) a které splňují podmínku f" u(x) dx = 0, nikoli. 2) Z názoru lze očekávat, že tím právě dosáhneme možností aproximovat i ťy funkce z prostoru HA!, které nejsou rovny nule pro x = 0 a x = tt, neboť přidáním vhodné lineární funkce k funkci " € Hj, lze dosáhnout toho, že uvažovaná funkce nabude v těchto bodech nulových hodnot. 21. numerické příklady Snadno pak zjistíme, vypočítáme-li součiny a uvážíme-li, že (pj. nh3 <= JV>Í dx , k = 0, 1, ..., n , („(x) = £ bj sin 2jx a konstanty bj určíme, jako obvykle, z podmínek (21.46) (Ä2v„ - f, tpk) = 0 , k - 1, ..., íi, tj. z podmínek n (21.47) £ (iírf,, j - 1. 2. •• Napíšeme-li pak totiž Galerkinovu soustavu Z C*2Í>j, a — — dostatečně hladké. Protože mimoto je v intervalu <0, 1) p2(x) £ 4 > 0, plyne z úvah provedených pro problém ((9.127), (19.129), (19.130), že operátor Au = [(4 + x)u"Y + 600« je na Iineálu funkcí čtyřikrát spojitě diferencovatelných v intervalu <0,1> a splňujících podmínky (21.51), (21.52) pozitivně definitní. Zobecněné řešení problému minimalizuje v příslušném prostoru HÁ funkcionál [srov. (19.138)] (21.55) Fu = (4 - x) u"1 dx + 600u2 dx - 2 5 000(x - x2) u dx . Jo Jo jo 1. Ritzova metoda K numerickému výpočtu zvolme podle (20.65), str. 248, bázi sin jnx (21.56) í = 1,2,..., jejíž členy splňují všechny podmínky (21.51), (21.52).1) Zvolme dále n = 3 [takže při tomto malém počtu členů je možno jmenovatele v (21.56) volit rovné jedničce, srov. str. 247], a hledejme tedy Ritzovu aproximaci u3(x) ve tvaru (21.57) ui(x) — sin rrx + a2 sin 2rtx + a3 sin 3jtx . Protože členy uvažované báze patří do DA, je možno Ritzovu soustavu napsat ve tvaru (13.29), tj. ve tvaru (Atpu (pt) aj + (Afi, cp2) a2 + [A(pi, 2) ax + (A3, k, s, (pk) - [(4 + x)(sin/itx)"]"sin/;7txdx -f- 600 sin jttx sin íotxdx = Jo Jo Dále (21.61) sin JKx sin kizx dx + 600 0 pro k + j , sin jTcxsin fcTtx dx. ' i pro k = j , J* (4 + x) sir f1 . . fi I sin jnx sin fcrtx dx = -j (21.62) f x sin jnx sin knx dx = - í x[cos (j - k) nx - cos (j + k) jix] dx = Jo 2 J o 1 [cos [j — k) tzx x sin (/ — k) nx cos (;' + k)nx x sin (/ + k) nx]1 ^ 2 L (J-k)2*1 + (j-k)x ''{t+kY^ ~~Jj + k)n 1 1 u-\y-k -1 (-iy+* - n . ,. , . = _ k._J--- ic-li k + i 2 L {J ~ kY *Z 0 + kfn2 J ' J (viz např. [35], str. 439, vzorec 286), (21.63) x sin2 jttx dx = - x(l — cos 2íjtx) dx — Jo 2 J 0 _ 1 1 fcos 2jnx x sin 2j7ix~|1 _ 1 " 4 2 L~4/V~ 2Jk~~]0 ~ 4 (použili jsme téhož vzorce), (21.64) f (x - x2) sin jnx dx = Tsin jnx xcosjjix 2x sin jrtx Jt A2 + (----cos JTtxl \jn jVJ J0 Použili jsme vzorců 247 a 248 z [35], str. 436. ÍZ±V JK 264 III, APLIKACE NA DJFF.RĚNCIALNÍ ROVNICE Dosadime-lí získané výsledky do (21.60) a (21.58), dostaneme hledanou Ritzovu soustavu ve tvaru (W^ + 30o)aI+ ^^-l+^a2 + 4tu4 (~—+ --) «i + (3271* + 47t4 + 300) a2 + 0 . a. 5 000.4 + 36k*(- — + —\a, =0, V rc2 25*7 0 , a, + 36n4 1 1 \ — +--s )a tc2 25k2J ( I j • v2rt* • *y • J-- \ 5 000 . i) o3 =--- / 27tc3 a po úpravě ^ít* + 300^«! 32tt2 a2 + 0 . a, 20 000 jt 32rr 9 0 . o Oj + (367t4 4- 300) «2 24 . 36 24 . 36tc2 25 - a3 = 0 ; 25 ;i3 /729H4 \ — a3 -) I-+ 300 J ti3 20 000 27ir 3 ' tj. soustavu (21.65) s řešením (21.66) 519,17«! - 35,09u2 + 0. a3 = 645,05 , - 35,09«! + 3 806,76 28,30. Z (21.68) a (21.69) plyne tedy pro relativní chybu (v prostoru 17,,} odhad (21.70) ^<14^0,5 28,30 I když odhad (21.70) není z teoretického hlediska příliš uspokojivý (skutečná relativní chyba je ovšem menší), je funkce (21.67) po praktické stránce, zejména interpretujeme-!i funkci u9(x) jako průhyb prutu, popsaného na začátku tohoto příkladu, zcela uspokojivou aproximací hledaného řešení. Funkce Au} se totiž od funkce/(x) na pravé straně rovnice (21.50) liší relativně velmi málo, jak je zřejmé z obr. 11. lnterpretujeme-li tuto okolnost technicky, znamená to, že funkce (21.67) je přesným řešením problému (21.50)až(2l .52), v němž „zatížení"/(x) je zaměněno „velmi blízkým zatížením" /4w3. 2. Galerkinova metoda Zvolme opět bázi (21.56). Protože funkce báze patří do definičního oboru daného operátoru, splývá Galerkinova soustava s Ritzovou soustavou (21.65) a Galerkinovo řešení s Ritzovým řešením (21.67). Poznámka 21.3. Ve všech třech uvedených příkladech bylo možno vyčíslit koeficienty příslušných soustav poměrně snadno, neboť všechny uvažované integrály bylo možno vypočítal pomocí primitivních funkcí (i když v třetím příkladě bylo třeba některých obratů). V obecném případě lze k vyčíslení těchto koeficientů, tj. příslušných integrálů, použit numerických metod (Simpsonova pravidla apod., viz např. [35], str. 492 až 494). Kapitola 22 Parciální diferenciální rovníce druhého řádu s okrajovými podmínkami V 7V-rozměrné oblasti G s lipschitzovskou hranicí uvažujme diferenciální rovnici (22.1) kde (22.2) ~ L aij ~—; - + L bt — + eu = /, dxjdxj i-i dxt a Oj/x), bj(x), c(x) jsou spojité funkce v G, f(x) e L2(G). [Používáme obvyklého označení, zavedeného na sir. 21, takže místo au{xL, ...,xN) píšeme stručně a;j(x) apod.] Definice 22.1. O rovnici (22.1) řekneme, že je stejnoměrně eliptická v G, a o příslušném diferenciálním operátoru, daném levou stranou této rovnice, že je stejnoměrně eliptický v G, jestliže existuje taková konstanta p > 0 nezávislá na x g G a na vektorech uvažovaných v (22.3) a (22.4), že pro každý reálný vektor ..., aN) platí zároveň pro všechna x e G buď (22.3) nebo (22.4) ",j=l Právě definovaná vlastnost rovnice (22.1) závisí tedy jen na koeficientech u nej-vyšších derivací v dané rovnici. Příklad 22.1. Poissonova rovnice (22.5) -A«=/, kde i=i dx2 (jejím speciálním případem je, jak víme, Laplaceova rovnice - Au = 0), je stejnoměrně eliptická v každé oblasti, neboť zde je fl pro ; = í, (0 pro j * i, 268 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE takže a v (22,3) stačí položit p = 1. Příklad 22.2. Rovnice (22.6) I = S «f / S2ii s2u\ . je stejnoměrné eliptická v každé oblasti G, která leží v „pravé polorovině" x, > 0 a má od osy xt = 0 kladnou vzdálenost, tj. pro niž je inf x, = k > 0, neboť pak v (22.3) stačí položit p = min (1, k). Tuto vlastnost ztrácí rovnice (22.6) v takové oblasti G, která se dotýká osy xL — 0 nebo která dokonce obsahuje body se zápornou souřadnicí xt. Poznámka 22.1. Násobíme-li rovnici (22. l) číslem -1, rovnice se nezmění, její koeficienty však změní znaménko. Proto je třeba v def. 22.1 uvažovat oba případy (22.3) i (22.4). Jinak by např. rovnice -Au = 0 byla eliptická a rovnice Au = 0 nikoli, resp. naopak. Splňuje-li ovšem daná rovnice podmínku (22.4), uvedeme ji násobením číslem —1 na rovnici splňující podmínku (22.3). Proto se budeme v dalším textu [srov. rovnici (22.7)] zabýval jen podmínkou (22.3), která nám umožní jednoduchou formulaci v otázkách pozitivní definitnosti vyšetřovaných operátorů, Uvažujme v oblasti G rovnici1) (22.7) - £ — (»0— ) + «*=/, au = a}t, 1 tíX( \ VXj/ kde f(x) e L2(G) a funkce atj(x) a jejich parciální derivace prvniho řádu, jakož i funkce c(x) jsou spojité v uzavřené oblasti G. Dále předpokládáme, že v G platí nerovnosti (22.8) I au{x) ?X a • P > 0 > ijj'=l '-i kde p nezávisí na volbě bodu x e G a na uvažovaných vektorech, a (22.9) c(x) £ 0 . Vzhledem k (22.8) je rovnice (22.7) stejnoměrně eliptická v G, neboť S 3 ( du\ * d2u $ dau du - h L aij ä i - L -~ —. j.;=1í:X,-\ ÔXjJ i,j = l ÔXiOXj í,j = l ČXj CXj '} O rovnici (22.7) často říkáme, že je zapsána v tzv. divergentním tvaru. 22, PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE 269 takže (22.7) je rovnice typu (22.1) s koeficienty u nejvyšších derivací, vyhovujícími podmínce (22.3). Pro rovnici (22.7) uvažujeme tři charakteristické typy okrajových podmínek charakterizujících po řadě ízv. Dirichletův, Neumannův a Newtonůu problém pro danou rovnici: (22.10) (22.11) (22.12) kde (22.13) u = 0 na T, Nu = 0 na T, Nu + <7U = 0 [it(S) ž aa > 0] na T, i,j = l CX; v( = cos (v, X;) (i = 1, ...,N) jsou směrové kosiny vnější normály v. Výrazu (22.13) se často říká derivace podle konormály. Pro Poissonovu rovnici (22.5)je (22.14) takže (22.15) !,(x) = J1 Pr° j = (0 pro j 4= i, JVm E — * i=l OXj pro tuto rovnici splývá tedy derivace podle konormály s derivací podle vnější normály. Okrajové podmínky (22.10) až (22.12) jsou analogií okrajových podmínek (19.5) až (19.7) pro obyčejnou diferenciální rovnici (19,1), str. 208, a také výsledky, které se týkají otázek symetrie a pozitivní definitnosti, jsou, jak uvidíme, velmi podobné. Označme M,, resp. M2, resp. M3 lineái funkcí u(x) spojitých včetně parciálních derivací prvního a druhého řádu v G a splňujících podmínky (22.10), resp. (22.11), resp. (22.12). [Každý z těchto lineálů je hustý v L2(G), viz větu 8.6 a pozn. 8.5, str. 106 a 107.] Nechť Au resp. A2, resp. A3 je operátor definovaný na Mt, resp. M2, resp. /W3 předpisem, který je stejný pro všechna k " 1,2, 3, (22.16) Atu ^z ^ í,j=i ĚXj ôx + cu , fc — 1,2, 3 Ukážeme nejprve, že každý z těchto operátorů je na příslušném lineálu symetrický, a to nezávisle na tom, splňují-li koeficienty ai} předpoklad (22.8), koeficient c předpoklad (22.9) a funkce 0 . Podle (22.21) a (22.8), (22.9), (22.28) jc (22.29) (A3u, u) ' Ř du du . Z au •---dx + c í,/=l ÔXiÔXj : I au2 dS > ipí„l.(l)^ + Í"'dS' Friedrichsova nerovnost (18.1), str. 108, (22.30) \\u\\2 = f u2 dx £ c, [ £ f—Y dx + c2 f u J c Jo V-V Jr dS 272 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE 22. PARCIÁLNÍ IJÍFťRENfľlÁLNÍ ROVNICE 273 pak dává (22.31) kde (22.32) (Ayti, u) ^ C2\\u\\2 , C> 0, ■ ÍP Oo\ čímž je pozitivní defin i tnost operátoru A3 na lineáíu M3 dokázána. Zejména v případě JV = 2 lze za čísla c,, c2 v (22.32) zvolit odhady (18.37) nebo (18.39), str. 203 a 204. Úlohu řešit rovnici (22.7) s okrajovými podmínkami (22.28) lze tedy přibližně řešit metodami popsanými v kap. 12 až 15. Zobecněné řešení u„ minimalizuje v příslušném prostoru U A} funkcionál (22.33) F,w = 3u 3u , ľ au — r- djc + e ;.j = i (?jc; ůXj 1 i- j ™2d.V - 2 /» dx . Protože podmínky (22.28) jsou nestabilní (viz pozn. 19.5, str. 225), není třeba (i když je to vhodné) volit bázi v prostoru HAi tak, aby její členy splňovaly podmínku (22.28). Viz též kap. 25. 3. Neumannova okrajová podmínka (22.34) Nu = 0. V tomto případě je možno téměř doslova opakovat úvahy provedené v kap. 19 pro obyčejnou diferenciální rovnici druhého řádu s okrajovými podmínkami u'(a) = 0, u'(b) = 0 . Podle (22.20) je (22.35) (A2u, u) = '.J, ?U ÔU . S a'i T" T- dx + G OXj 3Xy Učiníme-li dodatečný předpoklad, že (22.36) e(x) ^ c0 > 0 v G , plyne z (22.35) a (22.8) (22.37) (42u, u) > p I — dx + c0 I ti dx J0 í=l \čxj Jc Za předpokladu (22.36) je operátor A2 na lineálu M2 pozitivně definitní, a je tedy opět možno použít metod kap. 12 až 15. Příslušný funkcionál je c dti Stí í* c (22.38) F2u = £ au — — dx 4- eu2dx - 2 fu dx . c« || «|| Protože podmínka Nu = 0 je nestabilní (pozn. 19.5, str. 225), není nutné dbát na ni při volbě bázových funkcí. Poznámka 22.2, K témuž závěru i k témuž funkcionál u (22.38) lze dospět, podobně jako v pozn. 19.3, str. 212, i za obecnějšího předpokladu, že totiž funkce c(x) je v G spojitá a nezáporná a že c(x) > 0 aspoň v jednom bodě x0 e G. Toto tvrzení plyne obdobným postupem — jako v citované poznámce — z nerovnosti (22.39) JH2 < xU | dx + | u2 dx , ú > 0 , která jc, podobně jako nerovnost (19.20), str. 212, speciálním případem obecnější nerovnosti uvedené v [33], str. 22. Přitom K jc některá N-ruzměrná krychle, ležící v G. Je-li c(x) = 0 v G, není operátor Á± na lineálu M2 pozitivní. V tomto případě je totiž [viz (22.35)] (22.40) (A2u,u)=í f^^dx. J c ÔXi ÔXj Z (22.8) sice plyne (A2u, u) ^ 0 pro každé u e M2, ale z (A2u, u) = 0 neplyne u = 0 v M2 [tj. u(x) = 0 v EQ: Pro u(x) = konst =h 0 je totiž (A2u, u) = 0 podle (22.40). Operátor A2 není tedy v případě c(x) = 0 na Aí2 pozitivní (a tím méně ovšem je na M2 pozitivně definitní). Předpokládejme dále, že u e M2 je řešením problému (22.41) (22.42) Arit- -I — U« ~-)=/ V C. Nu = 0 na ľ . Integrujeme-li rovnici (22.41) v oblasti G, dostaneme snadným výpočtem [v (22.17) položíme du ffi ~ - au ■— , g2 = 1 (5x, a použijeme (22.13)] f(x) dx . Odtud a z (22.42) plyne nutná podmínka pro řešitelnost problému (22.41), (22.42), (22.43) j /(x) dx = 0 . III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE Uvažovaný případ operátoru A2 pro c(x) s 0 je tedy analogický obdobnému případu pro obyčejné diferenciální rovnice (srov. str. 214) a také postup jeho řešení je analogický: Uvažujme podproslor £2(G) prostoru L2(G) těch funkcí z L2(G), pro něž platí (22.44) Ir x) dx = 0 . V tomto prostoru uvažujme lineál M2 těch funkcí z lineálu M2, které splňují podmínku (22.44). Lineál U2 je hustý v £2(G), srov. pozn. 8.6, str. 107. Na tomto lineálu M2 nechť je dán operátor Á2 předpisem (22.45) í,j = i dx, \ dXjJ [srov. (22.16)]. Zcela stejným způsobem jako v případě operátoru A2 [srov. (22.20)] dospějeme k rovnosti f Bu do , (22.46) (A2u, v) = Z a./— — <**. JC i.J = l CX; 0Xj z níž v důsledku předpokladu ařJ(x) = ^(x) plyne symetričnost operátoru A~2 na lineálu Jff 2- Z (22.46) dále vyplývá (22.47) (12«, «) = f I o,,- ^ ^ dx Ě p f £ (f" ■ P > 0 . podle předpokladu (22.8). Avšak podle Poincaréovy nerovnosti (18.50), str. 206, platí pro funkce z lineálu M2 [splňující tedy podmínku (22.44)] odhad (22.48) kde c3 je kladná konstanta. [V případě obdélníka o stranách lí, l2 je uapř. možno položit (22.49) max (/f, f2), viz(18.58), str. 207.] Z (22.47) a (22.48) pak plyne pozitivní deťinítnost operátoru A% na lineálu A?2, (22.50) (Ä2u,u) ž Cz\\u\\2 , ueÁ?2, (22.51) 22. PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE 275 Poznámka 22.3. K získanému výsledku lze připojit poznámku obdobnou poznámce na str. 215: Pozitivní definitnosl operátoru A2 jsme dokázali jen pro funkce z lineálu M2. Zobecněné řešení u0 problému (22,41), (22.42) existuje, právě když pravá strana / patří do prostoru L2{G), tj. vyhovuje-lí podmínce (22.52) Ir x) dx = 0 . Přibližné řešení lze pak hledat metodami popsanými v kap. 12 až 15. Příslušný funkcionál je " du du , Z a'j--- dx c i,j=t dxt dxj (22.53) F2u : j /« dx Připomeňme, že funkce z prostoru //^2 splňují podmínku (22.52), nesplňují však v obecném případě nestabilní okrajovou podmínku Nu — 0. Při volbě báze z prostoru HA2 není nutné přihlížet ke splnění této podmínky. Poznamenejme ještě, že je-li u0 e DAl řešením problému -i fh-ř)-'^- <,7 = i3x;V oxj/ Nu * 0 na F, jc řešením i každá funkce tvaru w0(x) + k, kde k je libovolná konstanta. Nepa-trí-li zobecněné řešení u0(x) do DAl, můžeme fukci i*0(x) + k pokládat za řešení v určitém zobecněném smyslu. (Srov. str. 447.) Smíšené okrajové podmínky V problémech parciálních diferenciálních rovnic se často setkáváme s případem, kdy na hranici ľ uvažované oblasti není dána podmínka téhož typu (tj. podmínka h = 0 nebo Nu ~ 0 nebo Nu + au = 0), ale kdy hranice F jc rozdělena na několik (nejčastěji na dvě) částí ľ,...../,!) a na každé z těchto částí je dána okrajová podmínka určitého typu. Všimněme si pro ilustraci okrajových podmínek (22.54) (22.55) u-0\ Nu-0 Obr. 12. ') Rozumí se disjunktní části kladné (TV* — l)-dímenzioná1ní míry; neuvažujeme ovšem případy, kdy některá z Části F; se redukuje na bod, apod. 276 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE (obr. 12). Označme M Iineál funkcí spojitých s parciálními derivacemi do druhého řádu včetně v G a splňujících podmínky (22.54), (22.55). Tento lineál je podle pozn. 8.5, str. 107, hustý v L2(G). Označme A operáíor daný na M předpisem (22.56) Au = í,j-i íbfj \ OxjJ + cu , kde funkce atj = a;i a c vyhovují dříve uvedeným podmínkám hladkosti a podmínkám (22.8), (22.9). Obvyklým použitím Greenovy věty [víz (22.17)] dostaneme rovnost (22.18). Jc-li u e M, v e M, je (22.57) Nu.vdS Nu.vdS + n J r2 j Nu .v dS = 0, neboť první integrál na pravé straně v (22.57) je roven nule podle (22.54), druhý podle (22.55). Tedy (22.58) (Au, v) -. I 2>..^.dx + cvv d.x , u e M, v e M , odkud [podle předpokladu je tiy = a^] plyne symetričnost operátoru A nalineálu M. Z (22.58) a z (22.8), (22.9) vyplývá jako dříve (22.59) Na tomto místě se musíme odvolat na nerovnost (30.6), str. 359, podle níž existuje konstanta c > 0, závislá jen na dané oblasti, taková, že pro každou funkci u e W2(1)(G) (22.60) < c u2dS + í mu Ale, jak uvidíme v citované kapitole, je a podle (22f60) je tedy tím spíše (22.61.) j|u||2 £ e dx + m i=\ \axl J" dx , Jr, Jf, i-i \ Jo (,j=l Mi Č.Kj Je Jn Jo ovšem v odpovídajícím prostoru HA; v případě podmínek (22.64) nesplňují v obecném případě funkce z prostoru HA nestabilní podmínku Nu + au = 0 na ľ2, v případě podmínek (22,65) nesplňují v obecném případě žádnou z těchto podmínek. Při volbě báze je tedy nutno splnit jen podmínku u = Onaf,. Obdobné výsledky lze dostat i v případě, kdy hranice /' je rozdělena na více než dvě částí s různými okrajovými podmínkami.1) Poznámka 22.4. Nehomogenní okrajové podmínky. V případě nehomogenních okrajových podmínek (22.67) resp. (22.68} u = g{S) na ľ , Nu - h(S) na F, ') Jediný případ, kdy nastávají „obtíže" s pozitivní definitnoslí, jc tedy případ s Neumannovou okrajovou podmínkou Nu = 0 na celé hranici, uvažovaný na str. 272 až 274. 278 III. aplikace na diferenciální rovnice resp. (22.69) Nu 4- o-u = fe(S) na ľ je třeba místo funkcionálů (22.27), resp. (22.38), resp. (22.33) minimalizovat funkcio-nály (viz o tom podrobně v kap. 34 a 35; viz také tabulku funkcionálů, uvedenou na konci knihy). (22.70) resp. (22.71) resp. (22.72) 'v _ au----dx + cu dx a í,j=i dx, Bxj Jc £ du du , f , , 2_ úi;----dx 4- ck dx — 2 &C; SXj- J c j> dx . dx dS, ^ ňu 8u L au— — dx g '.J=1 ÔX,- ax,- cu dx + dx — t-v, ds1) Jr m c 3x\ dx, dx. ^ Li- Podle (23.4) je dále t^ň *s f ť" dv a ľ d2u dv J f d2u d2v J (23.6) - —- — dx = - — - — v, ds + —- —-dx. Jc čx, dx1 Jr <"x, 3x, Ja dxy 3xl Z (23.5) a (23.6) tedy dostáváme m 7, r dAu r éii , r ô2u dv . t r d2u d2v (23.7) „ —-vdx=\ —, t.' v f ds -- l —-- v, ds +\ —-—-dx. Jc «4 Jrdx* ]rdx\dx1 )cdx]dx\ x) Píšeme ds, nikoli ÚS, neboť uvažujeme případ dvou proměnných; ds je tedy diferenciál oblouku hranice ľ. Je-li oblast G jednoduše souvislá, takže hranici tvoří jediná uzavřená křivka c délky /, můžeme na ní zvolit určitý bod P jako výchozí bod a psát integrál fraU) ds ve (varu So s{s) As. V případě vícenásobně souvislé oblasti bude integrál po hranici r součtem integrálů tohoto typu. 23. BIHARMON1CKÝ OPERÁTOR (DESKY A NOSNÉ STĚNY) 281 Obdobně dostaneme (23.8) j -v dx — f--dv, ds J c <'xt 3x2 ôx1 dx2 j r vx2 3x, ŕ3x2 d2 u dv r dxt dx2 8xt v- ds + d2 v Ja ex, Ôx2 Ôx, Ôx2 dx , (23.9) f ------&_______É dx = í vv2 ds - J g 3X2 ÔXy dX2 dXy Jr 3xj 8x2 OX, r d2u dv . r d2u d2v „ n --- —-v, ds -f- ------dx ,') jr dx2 dxt dx2 Ja Ex, t?x2 ŕJx.i dx2 w2 ds (23.10) ' -íŕu g 3xť v dx r M C ô2u ô2v r 3x\ dx2 J di--KJ+ |V>'ds. 23. BIHARMONICKÝ OPERÁTOR (DESKY A NOSNĚ STÍNY) 283 Člen v lomené závorce je nulový: Integrování probíhá totiž po hranici oblasti ľ, která je uzavřenou křivkou nebo se skládá z konečného počtu uzavřených křivek; funkce vF je na ľ spojitá,1) takže při oběhnutí každé z těchto uzavřených křivek se vrátíme do výchozího bodu s touže hodnotou této funkce. Tedy je (23.19) - r tré* J r ÔS v — ds /) r ÔS Z (23.7) až (23.10) a z (23.ll), (23.14), (23.15) a (23.19) tedy pro každou dvojici funkcí u e M, v e M plyne /„., «„\ i.-i \ f (d2uv2v . d2u 32u čJu ôz»\ (23.20) (A2u, t.) = — — + 2 —— ■- — + . 2 — J c ox1 cx1 t?x2 ox, ox2 cx2 ox2J j" [ dx2 M dx + d2u , 2 n d2 u dv dv Než přistoupíme k důsledkům integrální identity (23.20), uvedeme určité zobecnění této identity, které vzniká z požadavku teorie pružnosti, aby bylo možno ve formulaci problému zachytit vhodným způsobem i vliv Poissonovy konstanty. Zapíšeme-li bi harmonický operátor ve tvaru (23.21) d2 (d2 u d2 —r —r + er flxi \ŕx! ^ + 2....i3_r(1_ff)^!fL_i 3x2/ ôxt ôx2 L ^JCi dx2j + Ô2k (JX2 d2u dx\ \dx\ + " dx] ') Zde používáme hladkosti hranice /". Jinak totiž nemusí být funkce Vj{j), v2(j) na f spojité. V „rozích" pak vznikají při integrování per partes bodové íleny, které odpovídají v mechanice desek bodovým reakcím, 2) Jc-li G jednoduše souvislá oblast a píšcme-li integrál ve tvaru dostaneme výsledek (23.19) okamžité dv í Sv Fds F ds , SF v — ds , Ss neboť funkce o i F maji pro i=0ai=ř tutéž hodnotu. V případe vícenásobně souvislé oblasti můžeme provést integrování per partes po každé z hraničních křivek zvlášť. 284 iii. APLIKACE NA DIFERENCIÁLNÍ ROVNICE 23- rjIHARMONICKÝ OPERÁTOR (DESKY a NOSNÉ STENY) 285 lede cr je reálné číslo, dostaneme zcela obdobným výpočtem, který zde již nebudeme podrobně provádět, identitu (23.22) (A-h, v) = rd2u/d2v d2v\ , m . B2u -f — + o- •— ) + 2{ 1 - rr)- _Ôxj\dx2 dx2J K dx.d: d2u fd2v ô2v\]J —i | —í 1- c-; dx dx\ \dx\ dxj_ d2v kde jsme použili označení Nu (23.23) f (A„) + (J ov , 4,«, h) ž 1 f«||2 , čímž je pozitivní definitnost operátoru At na lineälu Mx dokázána. K přibližnému řešení problému (23.24) až (23.26) je tedy možno použít metod uvedených v kap. 12 až 15. Zobecněné řešení m0(x) uvažovaného problému minimalizuje v odpovídajícím prostom HAí funkcionál ,2 , 22„ \2 /flZ, dx fu dx . J g Pritom prvky báze v prostoru HAi splňují podmínky (23.25) j (23.26), neboť obě tyto podmínky jsou pro biharmonický operátor stabilní.1) Uvažujme nyní operátor A2. Použijeme integrální identity (23.22). Je-li u e M2, veMz, odpadnou v této identitě oba integrály po hranici F, takže dostaneme [v prvním integrálu na pravé straně rovnost! (23.22) roznásobíme závorky] , , , > i C \~ô2u d2v /B2u d2v d2u d2v\ (23.41) (A2u, v) - + x2 3x, dx2 dx, dx2j odkud plyne symetričnost operátoru A2 na lineálu M2. Dále je (23.42) ^ôx,^-y +2^(Ä) dx. Pro aplikace (zejména v teorii pružnosti) má význam uvažovat případ (23.43) 0 g 1 dx , r m *dx,, -'-d poslední integrál je roven nule, neboť u = 0 na F, a tedy d1ujax2, resp. 8u!cx2 je rovno nule na stranách obdélníka, rovnoběžných s osou x,, resp. s osou x2. V uvažovaném případě jsou tedy funkcionáiy (23.40) a (23.49) stejného tvaru. Poznámka 23.2. Podobně jako u rovnic druhého řádu setkáváme se i v případě rovnice (23.24) se smíšenými okrajovými podmínkami. Napr. na části F, hranice F jsou dány podmínky (23.25), (23.26), na části F2 podmínky (23.27), (23.28). Zde je možno ukázat téměř doslovnou analogii sc závěrem kap. 22: Pokud uvažujeme okrajové podmínky uvedených tří typů a pokud nejsou podmínky (23.29), (23.30) dány na celé hranici (tento případ tvoří určitou výjimku), lze použitím identity (23.22) ukázat ve všech těchto případech pozitivní detinitnost biharmonického operátoru, uvažovaného na příslušných lineálech funkcí splňujících tyto smíšené okrajové podmínky. Viz též kap. 34, 35. Poznámka 23.3. Nehomogenní okrajové podmínky. Problémy nosných stěn vedou, jak známo, k řešeni biharmonické rovnice (23.50) A2u = 0 (rovnice pro tzv. Airyovu funkci) s nehomogenními okrajovými podmínkami. Např. tzv. první problém teorie rovinné pružnosti vede k řešení rovnice (23.50) s okrajovými podmínkami (23.51) (23.52) u = 0j(s) na l", du dv g2(s) na F (Viz o tom podrobně v kap. 43.) Také v těchto případech můžeme postupovat obdobně jako v přecházejících kapitolách. Např. zobecněné řešení problému (23.50) až (23.52) lze hledat jako funkci minimalizující funkcionál (23.40) [s /(x) = 0], (23.53) tíxj \8x, ox2J \dx2 dx , ve třídě dostatečně hladkých funkcí splňujících dané (stabilní) okrajové podmínky (23.51), (23.52).') Prakticky tato úloha znamená, jak víme, hledat přibližné řešení u„(x) v c tvaru (23.54) "„{*) = w(x) + £ ak ci2'ei3, *23 PaK zpravidla píšeme ex, ey, e,, yxy,Yxr, yn\ v tomto případe pak je (24.3) cx dux du2 By ' cx atd. V literatuře jc určitá nejednotnost v definici funkcí c-lk ti =f= k), resp. yxy, .... Někteří autoři definují 1 / ČÍH; SmA 1 ícu, ěuj atd. V tomto případě je ovšem třeba změnit vhodným způsobem koeficienty v zobecněném Hookeově zákonč (24.4). Zejména v případě izotropního tělesa je třeba druhou z rovnic (24.5) nahradit rovnicí ■ 7ik = 2^íj(. pro / 4= k . 2) Místo označení <*ii"Pí2> 0 jsou tzv. Laméovy koeficienty. Jc-li těleso homogenní, jsou la /t konstantní a nazývají se Laméovy konstanty. S modulem pružnosti E a s Poissonovou konstantou o jsou i. a ^ vázány vztahy 2 = Ea (1 4- = ^íif atd. 292 III. aplikace na diferenciální rovnice 24. operátory matematické teorie pružnosti 293 Uvažujme v oblasti G dva vektory posunutí o, v a nechť e;l(u) jsou složky deformace příslušné vektoru «, aik(v) složky tenzoru napětí příslušné vektoru v. Tedy ( \ tíui etí(") = — atd., , s , s. ídv2 3i>3\ rn(v) = du eu(v) + ... + «16e23(v) - aÍL~~ + ... + «16 -- + CX, \0x3 t/Xj/ atd. Označme podrobně W(u, y) = l[c,i(u) o-n(v) + ... + £13(u) c23(v)] . + ... + (24.6) ^T).-^^ + ... + a^- + 5i)j idú, Bu-x\ r 3tí, / 0, že v G platí (24.9) W(") ä fc £ 4 ■ [V případě izotropního tělesa je tato okolnost zřejmá přímo z (24.8): Je-li /i v oblasti G konstantní, stačí položit např. k - j/*; je-li íi(x) spojitá (a kladná) v G, stačí položit k = \ min u(x).~\ Funkce W(u, v) i Vf(u) budou mít v našich dalších úvahách důležitý význam. Označme dále (24.10) f=(/l./2,/3) vektor objemových („vnitřních") sil v tělese G. Integrálem (24.11) IF(u) dx - j fu dx, kde f u značí skalární součin vektorů f a u, je v případě homogenních okrajových podmínek dána, jak známo, celková potenciální energie deformace daného tělesa. Je-li vektor f dán, splňují složky tenzoru napjatosti v G tzv. rovnice rovnováhy (24.12) t=t <)xt 0, 1,2,3 Zapíšeme-li tyto rovnice podrobně, přičemž členy převedeme na pravé strany rovnic a vzniklé rovnice násobíme Číslem —1, dostaneme (24.13) \ flxj dx2 3x3 / _ /t>g2. ^ff21 , ÔO 22 dx, řlx, 3 1 do, + — 3 x i íjc-i ^23 3x3 3x3 f3; přitom ovšem můžeme psát i = 1. 2, 3 , kde vt jsou, jako obvykle, směrové kosiny vnější normály a a:i [podrobněji (?,*(")] jsou složky tenzoru napětí, příslušné hledanému vektoru u. Podrobněji píšeme t(ti) m isto t. 3. Okrajové podmínky (24.19) (24.20) u = 0 na T, , t = 0 na I\ , kde a r2 (/ , + r2 — í") jsou (disjunktní) části hranice T (nenulové míry), na něž je hranice ľ rozdělena. Okrajovými podmínkami (24.16), resp. (24.18), resp. (24.19), (24.20) je pro rovnici Au = f dán tzv. první, resp. druhý1), resp. smíšený problém matematické teorie pružnosti. Označme L2(C) Hilbertův prostor se skalárním součinem (24.21) ("' V)L2«7) = ' dx = J (ulvl + u2v2 + U3Ľ3) áy jehož prvky tvoří, jak víme (srov. příkl. 6.2 a 6.8, str. 70 a str. 74), vektory, jejichž souřadnice jsou v oblasti G integrovatelnč s druhou mocninou. Označme dále M lineál těch vektorů, z L2(G), jejichž souřadnice jsou s parciálními derivacemi do druhého řádu včetně spojité v G. Nechť M,, resp. M2, resp. Al3 je lineál vektorů z M, splňujících podmínky (24.16), resp. (24.18), resp. (24.19),(24.20). Z pozn. 8.5, str. 107, snadnou úvahou plyne, že každý z těchto lineálů je hustý v i.2(C). Označme dále At, resp. A2, resp. A3 diferenciální operátor A, uvažovaný na lineálu A-f,. resp. M2, resp. M3. Nechť u a v jsou dva libovolné vektory z Aí. Obvyklou aplikací Grecnovy věty na skalární součin (Au, v)L,((-;), tj. na integrál vAu áx, dostaneme známou Bettiovu identitu (24.22) (-1«. Ít« = 2 I W(u, v) dx - í v ť(u) dS Jo J r Patří-li mimoto vektory u, v do Mresp. M2, resp. M3, splňují okrajové podmínky (24.16), resp. (24.18), resp. (24.19), (24.20), takže integrál po hranici F je roven nule. Tedy pro vektory u, v z M,, resp. z Aí2, resp. z Af3 platí (24.23) p$$m * 2 j w(»>v)áx Z této identity plyne ihned podle (24.7) symetričnost každého z operátorů A._, A2, A3 na příslušném lineálu M,, resp. M2, resp. Aíj. Dokážeme, že operátor At jc na lineálu Aít pozitivně definitní. Důležitým krokem k tomu je tzv. Kornová nerovnost, kterou uvedeme bez důkazu: (24.24) f Í (p)1 dx S kS X4dx, Ut.A/, , Jit V''-W Jg'.* = 1 ') Názvosloví v literatuře není jednotné. Často se prvním problémem pružnosti rozumí problém charakterizovaný podmínkou (24.18). 296 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE 24. operátory matematické teorie pružnosti 297 kde fc, je kladná konstanta. Kornová nerovnost je základním krokem i v důkazu pozitivní derinitnosti operátorů A2 a A3. Její důkaz je poměrně obtížný a čtenáře odkazujeme v tomto smčru na článek [16], resp. na Míchlinovu monografii [30], str. 191 až 202. Z (24.23), (24.9) a (24.24) vyplývá r T 3 2k C 3 /du,\2 (24.25) (A* U),(C) - 2 J *M dx Ě 2, jc £4 dx * -^ £ ^ dx. Každý z vektorů ueM, splňuje podmínku u - 0 na ľ, takže tuto podmínku splňují i jeho souřadnice, tj. funkce u,,u2a u3 [srov. (24.17)]. Použijeme-li tedy na funkci u, Fricdrichsovy nerovnost) (l 8-1), str. 196, dostaneme dx Obdobné nerovnosti platí pro funkce u2 a u3. Z těchto nerovností a z (24.25) pak plyne (24.26) (A,u, u)l2(e) fft«if f 1«2|2 + ||"3|2) = C2|l"lit2(C, Ml' čímž je pozitivní delinitnost operátoru Ak na lineálu Mt dokázána. Uvažujme nyní operátor A2 na lineálu M2 vektorů ti, které splňují podmínku (24.27) <«) = 0 na f . Tato podmínka odpovídá Neumannově podmínce z kap. 22. Z teorie pružnosti je dobře známo (a použitím Gaussovy věty lze snadno ověřit), že v případě okrajové podmínky (24.27) je k existenci řešení třeba, aby objemová síla f splňovala určité podmínky, charakterizující statickou a momentovou rovnováhu tělesa: (24.28) fdx = 0, r x fdx = 0 , kde r je rádiusvektor bodu x. Mimoto lze snadno ukázat, že operátor A2 není na lineálu M2 pozitivní: Ze vztahu (A2u, u)tj(C) = 0 sice plyne podle (24.25) a (24.9) (24.29) Ejh = 0 pro všechna 1 g i, fc g 3 , odtud ovšem neplyne, jak je známo a jak vyplývá z (24.3), o = 0, K tomu, aby vektor o byl vztahy (24.29) jednoznačně určen jako nulový vektor, stačí, předcpíšeme-li ještě podmínky (24.30) (24.31) í;dx= r x u Jo 0 , dx == 0. Nyní již lze očekávat, že další postup bude analogický postupu v případě Neumannova problému z kap. 22: Označme M2 lineáí těch vektorů z lineálu M2, klcré splňují podmínky (24.30), (24.31), a Ä2 operátor teorie pružnosti uvažovaný na lineálu M2. Jak jsme již předeslali, lze i v tomto případě dokázat Kornovu nerovnost, (24.32) f Í (f'Ydxg^ f Í 4dx, uzlW2 (viz citovaný článek [16], resp. knihu [30]). Z (24.23), (24.9) a (24.32) pak vyplývá pro u e A?2 (24.33) (Ä2u, u)Ll(G) = 2 í řr(U)dx >2k\ £ 4 dx S> f f f (^Y Jc Jcí.* = i ^2 J(; i..*=r \3xt/ dx. Protože dále vektory u z lineálu M2 splňují podmínku (24.30), platí totéž pro jejich souřadnice: u,áx = 0, u2dx = 0, »3 dx = 0 . (24.34) Protože platí první z rovností (24.34), plyne z Poincaréovy nerovnosti (18.50,) str. 206, (24.35) dx Obdobná nerovnost platí pro u2 a u3. Z těchto vztahů a z (24.33) pak pro každý vektor u e plyne (24.36) (Ä2u, u)Li(G} & -^(ih||2 + |[«2||2 + ||«3f) = ClHkV, fc,c3 g = 2k kí c-i což znamená splnění podmínky pozitivní derinitnosti operátoru Ä2 na lineálu AÍ2. Lze ukázat, což zde již nebudeme podrobně provádět, že i operátor A3 je pozitivně definitní na původním lineálu JW3, pokud, jak jsme předpokládali, má část r, 298 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE 24. OPERÁTORY MATEMATICKÉ TEORIE PRUŽNOSTI 299 hranice ľ, na níž je předepsána podmínka u = 0, kladnou míru (neredukuje se na bod apod.). V každém z uvažovaných tří případů minimalizuje zobecněné řešení u0 funkcionál nebo, což je totéž, funkcionál W(a)áx - 2 fu dx ; J g í W(u) dx-lfii dx J g j g („princip minima potenciálni energie"), ovšem na příslušném prostoru. Podmínka v = 0 je pro operátor teorie pružnosti, který je druhého rádu, stabilní, takže funkce z prostoru HA] tuto podmínku splňují (přesněji řečeno, ve smyslu stop, viz kap. 30). Podmínka t(u) - 0 je nestabilní, funkce z prostoru HÄ1 tuto podmínku v obecném případě nesplňují; při volbě báze není nutno ke splnění této podmínky přihlížet. Je ovšem třeba dbát na to, že funkce z prostoru HXl jsou podrobeny podmínkám (24.30), (24.31), V případě prostoru HÁ3 je splněna (ve smyslu stop) první z podmínek (24.19), (24.20). Při volbě báw; v prostoru HAi není nutné přihlížet kc splnění podmínky (24.20). Poznámka 24.2. (Nehomogenní okrajové podmínky) Jsou-li místo homogenních okrajových podmínek (24.16), resp. (24.18), resp. (24.19), (24.20) předepsány podmínky (24.37) resp. (24.38) resp. (24.39) (24.40) t(u) t(u) g(S) na F , = ŕi(S) na ľ , - g(S) na F, , -- h(S) na r2 , hledáme zobecněné řešení daného problému jako funkci u(x), minimalizující funkcionál (24.41) resp. (24.42) W(u) dx £w(U) fu dx , dx ■J>M, hu dS resp. (24.43) Ír W{i>) dx fu dx — dS. na příslušné třídě funkcí splňujících dané stabilní okrajové podmínky. Podrobněji: Funkcionál (24.41) minimalizujeme na třídě funkci splňujících podmínku (24.37), funkcionál (24.43) na třídě funkcí splňujících podmínku (24.39). V případě funkcio-nálu (24,42) nemusí uvažované funkce splňovat žádnou okrajovou podmínku, je však třeba, aby splňovaly podmínky (24.30), (24.31). Poznamenejme, že v případě okrajové podmínky (24.38) je nutnou a postačující podmínkou k existenci řešení splnění rovnic (24.44) (24.45) I f dx + h dS = 0 Ír'á'+L r x fdx + r x h dS = 0 (silová, resp. momentová podmínka rovnováhy). Některé úvahy týkající se numerických výpočtů v problémech trojdimcnzionální matematické teorie pružnosti lze najít např. v [28], str. 390. Poznámka 24.3. Čtenáře upozorňujeme na tomto místě na sérii velmi zajímavých článků I. Hlaváčka v časopisu Aplikace matematiky (viz zejména články [12], [13]), které pojednávají o řadě variačních principů (klasických j velmi moderních) v matematické teorii pružnosti. Kapitola 25 Volba báze pro parciální diferenciální rovnice s okrajovými podmínkami Obecné zásady pro volbu báze při použití Ritzovy metody (a nejen této metody) jsme podrobně diskutovali v kap. 20. V této kapitole připomeneme některé z uvedených výsledků a vyvodíme z nich další praktické závěry. Přitom se zaměříme zejména na parciální diferenciální operátory druhého a čtvrtého řádu ve dvou proměnných. Pokud se týká operátorů druhého řádu, půjde tedy o operátory tvaru Au du\ '<^) + ™' 300 III. APLIKACE NA DIFERENCIÁLNÍ ROVNÍCE 25, VOLBA BÁZE PRO PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE 301 resp. použijeme-li pro proměnné označení x, y místo x1( x2, tvaru d f du du\ d ( du , du\ (25.1) Au =-----[ + aí2 —--a21 — + a12 — + cw , kde (viz kap. 22) koeficienty au(x, y) = aJ((x, y) jsou včetně parciálních derivací prvního řádu spojité v 5, c(x, y) S 0 je funkce spojitá v G a je splněna podmínka (22.8) stejnoměrné eliptičnosti (viz str. 267) (25.2) I M*, y) Ui ž p{í\ + 51), p > o. Z operátorů čtvrtého řádu si všimneme zejména biharmonického operátoru. V kap. 20 jsme upozornili na systém jednoduchých funkcí (25.3) 1, x, y, x2, xy, y2, ... . O tomto systému víme již z kap. 5, že je úplný v L2(C). Poznamenali jsme, že jde-Ji napr. o problém (25.4) -Au =/ v G, (25.5) u = 0 na F, pak že lze ukázat, že funkce (25.6) g, xg, yg, x2g, xyg, y2g, Obr. 14. kde g(x, y) je dostatečně hladká funkce, kladná v oblasti G 1) a rovná nule na její hranici, tvoří bázi v příslušném prostoru HA. Je-li napr. G čtverec s kruhovým otvorem, nakreslený na obr. 14, stačí za funkci g(x, y) zvolit funkci (25.7) (a2-x2)(a2-y2){x2+y2-R2), která má zřejmě všechny požadované vlastnosti.2) *) Máme stále na mysli omezené oblasti s „lipschítzovskou" hranící. 2) Všimněme si, že funkce (25.7) má v roviné xy derivace všech řidů, přestože hranice oblasti G není hladká (má Čtyři úhlové body). Také v případě, že místo problému (25.4), (25.5) je dán problém Au = / v G, « = 0 na ľ, kde A je operátor (25.1), tvoří systém (25.6) v příslušném prostoru HA bázi. Uvedli jsme, že obdobnou vlastnost má v odpovídajícím prostoru HA systém funkcí (25.8) jde-li o problém V případě problému (25.9) (25.10) (25.11) (25.12) f, xg2, yg2, x2g2, xyg2, y2g2, A2u = f v G , « = 0, — - 0 na T . dv A2u = / v G , u — 0 na ľ , du 0 na r, a2u . - = 0 na F, , dv2 kde G je půlkruh nakreslený na obr. 15 a r{ je horní půlkružnice, je možno za bázi v odpovídajícím prostoru HA zvolit systém funkcí (25,3), násobených funkcí g(x, y) = y(R2 - x2 - y2)2 . Obr. 15. Tato funkce zaručuje splnění podmínek (25.10) a (25.11); podmínka (25.12) je nestabilní, není tedy třeba přihlížet při volbě báze k lomu, je-li splněna nebo nikoli. Systémy typu (25.6), (25.8) mají tu výhodu, že jsou poměrně jednoduché a že jimi lze zachytit okrajové podmínky i v případě „nepříjemných" vícenásobně souvislých oblastí, např. oblastí typu znázorněného na obr. 14. Mimoto, jak jsme řekli, tvoří v HA bázi, takže splňují požadavky a), b) formulované v úvodu kap. 20. Nevýhodou 302 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE těchto systémů jc malá „ortogonálnost" jejich členů v prostoru MÄ a z toho plynoucí špatná numerická stabilita [viz požadavky c) a d) formulované na str. 236]. Tato nepříznivá vlastnost způsobuje, že rovnice Ritzovy soustavy jsou „téměř" lineárně závislé, a vyžaduje velkou přesnost jak při výpočtu koeficientů Ritzovy soustavy, tak při jejím řešení. Také splnění požadavku e), tj. vztahu Au„ ->/ pro n -> co (str. 237), nelze v obecném případě zaručit. Proto dáváme v případě speciálních oblastí přednost systému vlastních funkcí příslušného homogenního problému, resp. systému vlastních funkcí některého jednoduchého shodného příbuzného operátoru (str. 245). Poznamenejme, že zde zejména často používáme shodnosti a příbuznosti samoadjungovaného rozšíření operátorů —Au a operátoru (25.1), pozitivně definitních na příslušných lineálcĽh.1) Obdobného postupu Jze použít i v případě operátorů vyšších řádů. Pro Laplaceův operátor —A a okrajovou podmínku u = 0 na ľ lze pro některé jednoduché oblasti snadno napsat úplný systém vlastních funkcí, ortonormální v příslušném prostoru H_/í a tím podle předcházejícího textu získat bázi v prostoru HÁ, odpovídajícím operátoru (25.1) a okrajové podmínce u = 0 na ľ. Je-li oblast G kruh K se středem v počátku a s poloměrem R, tvoří takový systém funkce (25.13) <řV0> , m = 0, 1, 2, n — 0, 1, 2, ..., kde Jm jsou Besselovy funkce indexu m a y„„ jsou kladné kořeny rovnice J,„(yR) = 0; cm„ jsou takové koeficienty, aby systém (25.13) byl ortonormální v i/„A, tj. aby bylo (tp„„ íd,„„)_a = 1. Je-li C obdélník Oíiíti, OSyíb, tvoří takový systém funkce (25.14) >' místo x, y a který zaručuje splnění všech požadavků a) až e) formulovaných v kap. 20. Lze ovšem postupovat i tak, že se vrátíme k původním proměnným a problém (25.15), (25.16) řešíme na elipse E, přičemž použijeme systému (25.13), napsaného původně pro souřadnice x', / a transformovaného zpět do souřadnic x, y podle rovnic (25.17). Řadu obdobných obratů najde čtenář např, v knize [29], str. 179 a dále. Je vsak třeba poznamenat, že již sám systém (25.13) je vzhledem k přítomnosti lícsselových funkcí poněkud složitější a stane se ovšem ještě složitějším, pôužijeme-li např. transformace, o níž jsme se právě zmínili. Přestože tedy máme v Uvažovaných případech zaručeno při použití Ritzovy metody, že budou splněny všechny podmínky a) až e) z kap. 20, dáváme často přednost „méně stabilním" systémům typu (25.6), (25.8), i když vyžadují provedení příslušných numeiických výpočtů s daleko větší přesností. Častější a jednodušší bývají transformace systému (25.14). Uvedeme jednoduchý příklad (viz [4], str. 209): Řešme problém (25.20) (25.21) -Au = / v G , u = 0 na ľ, 304 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE kde G je kosodélník znázorněný na obr. 16. Proveďme transformaci souřadnic . (25.22) k y = y, kterou kosočtverec G přejde v obdélník Q = (0, a) x (0, íj) s hranicí f. Rovnice (25.20) přejde transformací (25.22) v rovnici (25.23) v b1) dx'2 Oy'1 b dx' By' ~ jejíž levá strana opčt představuje pozitivně deíinitní operátor, tentokrát na množině funkcí dostatečně hladkých v Q a splňujících podmínku u = 0 na F'. Dlkbl cta**,U y Obr. 17. Obdobnou úvahou jako v předcházejícím textu dojdeme k závěru, že při použití Ritzovy metody k řešení rovnice (25.23) s podmínkou u ~ 0 na F' zaručuje splnění podmínek a) až c) z kap. 20 volba báze (25.24) nity i , ,\ ■ mxx a b kde cm„ jsou konstanty ze systému (25.14). Místo toho, abychom řešili transformovaný problém s bází (25.24), můžeme ovšem řešit původní problém s bází {25.25) říITT x--y V. b j . my a b Protože obdélník a obrazce, které lze jednoduchými transformacemi [typu (25.22) apod.] snadno na obdélník převést, jsou v technických aplikacích nejčastější, uvedeme aspoň pro případy nejjednodušŠích okrajových podmínek příklady vhodných bází pro operátory druhého a čtvrtého řádu na obdélníku. Volbu báze pro operátory druhého řádu (str. 299 a 300) na obdélníku G = = (0, a) x (0, 6), obr. 17. 25. VOLBA BÁZE PRO PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE a) Okrajová podmínka 305 (25.26) 1 m n ~7 + u = 0 na ľ : . mjrx . mty , „ sin-sin —- , m, n — 1,2, a b ■') b) Okrajová podmínka resp. / . du , i ôu (anv, + a21v2) — + (u12v, + a22v2)— = 0 na / , dx vy kde v,, v2 jsou směrové kosiny vnější normály: (25.27) 9mn~ im2 n1 + 1 niKx my cos--cos------- , m, n = 0, 1, 2, V případě, že v (25.1) je c(x) = 0, vynecháváme v systému (25.27) první (konstantní) člen, odpovídající hodnotám m = 0, n = 0. c) Okrajové podmínky u = 0 pro x = 0 , x = u (na bočných stranách obdélníka) . resp. (mm + «iivi)— + (fli2ľ, + a21?2) — = 0 pro j> = 0, y = fc: ŮX (\ť (25.28) = 1 ■ sm---cos —- , m — 1, 2, n = 0, 1, 2, ... .2 -í b a J) Multiplikativní konstanty nezávislé na m a n, např. číslo 2/[n^/(aA)] v (25.14) lze při volbě bázových funkci vynechat. V některých případech (použijemc-li k řešení Ritzovy soustavy eliminační metody a použijemc-li programování s pohyblivou desetinnou čárkou, resp. uvažujeme-li jen „malý" počet členů systému) lze vynechat i multiplikativní konstanty závislé na m a n, tj. položit jc rovny jedničce. Viz str. 247. 306 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE Volba báze pro biharmonický operátor na obdélníku G — (-a, a) x (-b, b), obr. 18. V obecném případě (pokud nepoužíváme speciálních postupů, srov. pozn. pod čarou na str. 305), je třeba uvedené funkce normovat, tj. násobit je konstantami cmB, kde cín jlAKWj \8xoyJ {dy1) dx dy, y G 0 x i 2a Obr. 18. nebo aspoň takovými konstantami, aby byla zachována „řádová" závislost na m a n, srov. str. 246, např. konstantami 1 d) Okrajové podmínky (25.29) u=0, — = 0 na T . dv ^ - [cos m -{-íř\[co. f-i-w], Vin-i.iH = I^sin - I sin A„,J [cos - (-l/j , Pí^-j = cos — - (-1)* /Sin-^-iSin/lJ, f;™-i,2„-t = ^sin ^ - | sin Á^j ^sin ^ - | sin ^ , m, n — 1, 2,kde,A4 je takový kořen rovnice tgA^ = Xk, pro který platí 2A -• 1 , 2fe + 1 -— k < ak < -7T . 25. VOLBA BÁZE PRO PARCIÁLNÍ DIFERENCIÁLNÍ ROVNICE Je la = 4,493 2 , A2 = 7,725 2 , 307 atd. e) Okrajové podmínky (25.30) 02ti „ = 0, — = 0 na T Ôv2 (2m - 1) iíx (2n - i) ny i,n-i 2«-i = cos -—--—cos1-—'-— , mnx (2n — l) ttv (j 20 (2m - l) rcx . nn flWi.í. = cos —;—-sm^T' Zc7 P . mnx . nizy - jj jj| + y) v 0 4- » _ f] dx dy (26.3) d2u~] V- i m (4 + y)-- +-— dxdy, JJjcL dxôx dy vyj odkud plyne symetričnost operátoru A na M. Dále je podle (26.3) (26.4) (u, u), = (Au, u) = jj [(4 + y) (j^J + gjj dx dy £ 26. numerické příklady 309 odkud např, podle nerovnosti (18.46), str. 205, již snadno vyplývá pozitivní definitnost uvažovaného operátoru na M. pro řešení Ritzovou metodou zvolme první čtyři členy báze (25.25), str. 304 (můžeme položit c„„ = 1, srov. pozn. pod čarou na str. 305), tedy funkce (26.5) , n(x — hy) . ny tpn — sin ——-—— sin — , a b . n(x — hy) . 2~y cpí2 = sin • sm , a b . 2it(x — hy) . Tcy (p21 — sin —-- sin — , a b . 2n(x — hy) . lny tp22 — sin—'--— sin—■■ a b kde h — kjb. Hledáme-li přibližné řešení ve tvaru (26.6) í.j-i bude Ritzova soustava rovnic pro neznámé konstanty a;j- tvaru (26.7) n,n— 1 kde /(v, y) = y2. Ale podle (26.3) je (26.8) fe = ľľ ľ(4 + y) ^ém^ ku *2=r| dx dy = J J a L ox dx By By J f.... íit ŕirťx — h v) . jity mn mii(x — hy) , nny , , (4 + y) — cos —=- ' sin — . — cos —i- ' sin —- dx dy + a a ba a b + h in iití.v - hý\ . jny jn . ijrfx — hy) jny" — ■-ens - >--— sin -—--. -I- — sin —i----il r-n* ...... ., , . 1*1 - cos —~-- sin----1--sin —*-—^ cos — b b a b j hmn mn(x — hy) . nny nn . mn(x — hy) nnyl , —— cos —i-ííí sm —- H--sin-i---■ ' cos —- dx dy . a a b b a b J Zavedením nových proměnných (26.9) z - x - hy, y = y. 310 III, APLIKACE NA DIFERENCIÁLNÍ ROVNICE (s Jacobiovým determinantem zřejmě rovným jedné) převedeme výpočet integrálů (26.8) přes kosodélník K na výpočet integrálů přes obdélník (26.10) (26.11) („./) = f ľ J 0 J < mz . mnz . iny nity , . sm-sm-cos-dz dy a b b inz mnz my , nny , , cos-cos ä"- sin-dz d v . a b b («(••/) ~ I ! r si" — sm , d.-d v . o a f K vyčíslení integrálů v (26.11), (26.12) uvážíme (viz [35], str. 482, 439 a 437), že a f* íjcz . mícz , C" iJt (26 13) sin —sin-—dz = cos — Jo a a ]0 a vrz mnz , cos-dz je-Ji j = m 0, je-li i+-m , mz mnz sin-cos-dz a a a 2i , je-li f — m liché , 0, je-H i — m sudé ; obdobné vztahy platí pro integrály vzhledem k proměnné y, píšeme-lí v nich ovsem b místo a; dále je (substitucí ityjb ~ í) (26.14) b_ 2k ,, , . ]Tiy . nny , (4 + y) sm •• — sin —- dy = , b b j* ^4 + —j [cos (j - n) f - cos (j + n) í] dt = 26. NUMERICKÍ PRÍKLADY 4 2?t: 311 tcos 2jt t sín 2/íT 4ľ ' + 2Í~"Í ; 2jt (sÍn2/íT _ b2 .... +--- - 2b + je-h j = n , 2; Jo 4 L. 'J ~J _IO 1 b^ ľcos (; - n) t t sin (j - n) t _ cos (j + n) t í sin (/ + n) íT _ (./ nf j-n' (j + nf j + n J0 " b* r(-iy-" - i (-íy4-" - n . ,. ■= —í •---=--•-■-, je-h j + n, 2n2l [j -n)2 (j + n)2 ]' jtt ;JnJ Dosadíme-lt z (26.11) až (26.15) do (26.7), dostaneme soustavu 7t2 (bh2 a\\ Jt3 a b2 f „ 2\ — — I • | aM ^ — . - . —~ 2 + - )a,i + 4\a bi] a2 2 2ŕ \ 9J (26.16) a 2 V 4 + 0 . a21 + 2n2h ÍAa 2b la 4f>\ _ 2a /V 4f/\ ári \3ít 3m 3ji ítcJ 12 % \n n1 / ' n2 a b2 f „ 2\ T"2 « í>2\ it2 (bh2 4a\] 72 - v ^ (-2+9) °"+b ■ 2 r+t) + 4- (t+?)Jui: ít2/t/4íi 4b , 2a 2b\ „ 2a b* --—.--: 4. aM + 0.a2, - ~ — . — , ab \3ji 3it 3n 3nJ n 2n 7t2ŕi/„ 2a 2b Aa 4b\ V4n2 a A, PI 0«it--~ (4 • — • — + ■ r" 012 + 2Í> + • - + tib \ 3rt 3jt 3tu 3tc/ La 2 V 4/ it2 (4bh2 a + — [---+ - 4 V a b "21 + 4tc2 a b2 a2'2'2K2 -2 + -)fljl = 0, ;jt2ft 2a 4b 4a 2b\ A 4n2 a b2 f , 2\ ab \3n 3n íffl 3n) a2 2 2ti2\ 9/ ' a22 = 0. Numerický výpočet proveďme pro kosodélník nakreslený na obr. 19, Tedy do (26.16) dosadíme (26.17) a = n , b = n , k ~ n , li = - — 1 b 312 III, APLIKACÍ NA DIFERENCIÁL N f ROVNICE a dostaneme tuto soustavu pro neznámé a tu i, j = 1,2' (26.18) Kn1 7t3\ 4;: - +— ]«i) - ~- «12 + 0.a21 + t 2 8/ 9 4jt f9~2 "3 --~ ": i • ( . "-■ i " .i o.fl,, - 32 7fl» + tc 7t3\ — + — )a 4 8/ 32 /21tc2 7i3\ — «i2 + I------ + — a 9 \ 4 2,/ a21 +- |fl„ = 2(^-4) 0 . a22 = -K2 . 16 7I«22 = 0 , 0 . 013 16 xa2i + (6n2+^yh = O, tj. soustavu 18,680 2a n - 1,396 3a, z + 0.a2, + 3,555 6«22 = 11,739 2, - 1,396 3su + 26,082 4aI2 - 3,555 6a21 + 0.«22 - -9,869 6, O.ti,, - 3,555 6a 12 + 67,318 6a2í - 5,585 0a22 = 0, 3,555 60,!+ 0,a12 - 5,5850a21 + 74,720 8«22 = 0. Řešení léto soustavy je (20.19) a,, = 0,608, aX2 = -0,349, o2, = -0,021 , a22 ě -0,031 . OsAÍOfií B(x,0> x Obr. 19. Řešení problému (26.1), (26.2) na kosodélníku z obr. 19 je tedy dáno přibližně výrazem (26.20) u22(x) = 0,608 sin (jc - y) sin y - 0,349 sin (x - y) sin 2y -- 0,021 sin 2(x - y) sin y - 0,031 sin 2(jc - y) sin 2y . 26. NUMERICKÉ 1'ŘÍKLADY 313 Poznámka 26.1. Výpočet v předcházejícím příkladě je poněkud zdlouhavější proto, že uvažovaný obor jc kosodélník a koeficienty rovnice (26.1) i její pravá strana jsou proměnné. V případě, že oblast G je obdélník O = (0, a) x ÍO, b) a že místo problému (26.1), (26.2) je dán problém (26.21) -Aw = 1 v O, (26.22) ú = 0 na F, jc výpočet velmi jednoduchý: Soustava funkcí (26.5) bude (26.23) . nx . rty (p,! — sin — sin — , a b . nx . 2tiy 2, = sin--sin — a b . 2irx . 2tíy íp22 = sin----sin- a b V tomto případe dostaneme (26.24) JJo vox m <>y vy i = ľ f* /™ ™ J 0 J o V " fl mít iitx , jity mrcx . nitv cos-srn -— cos---sin--h i3t nit . Mtx jny . nmx H---. — sni — cos — sin- b b a b a cos-) dx d v ■K2ab (5+SH>,/+>*'■>• m = i a h = j , 0 v ostatních případech. Dále jc (26.25) («,,„/)= ľ f sin ^ Jo Jo « mx . itew sin — dx dy = 4a b n2ij je-li i i j liché, 0 v ostatních případech. 314 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE Ritzova soustava rovnic tedy v tomto případě bude 4ab 4ab 2 ■ n2(4a2 + b1) 4ab - 4ab ab odkud {26.27} ■a (26.28) 16a2bz í; í ...... a 7t>2 + S?| M2l(*) 16a 6 . Jtx . ny -—■—■-sin -— sin — n4(az + b2) a b Viz také vzorec (J 2.29), str. 161. Z uvedeného výpočtu i z citovaného vzorce vyplývá, že v našem případě vede volba soustavy funkcí (26.23) k témuž výsledku jako volba jen jedné z těchto funkcí, a to první. (Symetrie problému vzhledem ke středu obdélníka jsme mohli využít již při volbě bázových funkcí, čímž by odpadl zbytečný výpočet koeficientů al2, a,,, a2l.) V případě, že bychom místo systému (26.23) zvolili systém (26.29) ikx . jny , . , „ . tp{j s* sin-sin — , í, j — i, 2, j a b {a popř. použili právě zmíněné symetrie), dostali bychom podle (26.24), (26.25) snadným výpočtem (26.30) = 16íi2ř>2 1 a2 + b2 TTX . rty sin — sin — + 1 . tcx . 3ity —--sin-— sin--+ b 3(9íj2 + b2) a b + . 3ttjc . ny sin-sin--h 1 , 3itx . 3/tv~] sin-sin-- 3(a2 + 9b2) a b 8hV + b2) a b j Speciálně, volíme-li a = b — % jako v předcházejícím příklade, dostaneme (26.31) «3300 = ~2 (sin x sin y + — sin x sin 3 y + 15 + — sin 3x sin y + — sin 3x sin 3v 15 81 26. NUMERICKÉ PŘÍKLADY 315 Poznámka 26.2. (Neumannův problém.) Jt-Vi dán na obdélníku O = (0, a) x (0, b) pro rovnici (26.21) Neumannův problém, tedy problém ■Au - 1 v O, du (26.32) (26.33) — = 0 na ľ, snadno zjistíme, že tento problém nemá řešení: Není totiž splněna podmínka (26.34) jj f(x,y)dyáx = 0, [viz (22.43), str, 273], neboť v našem případě je Jjo/(x, y) dx dy = ab > 0. Je-li dán problém (26.35) (26.36) -Au = / v O , — = 0 na ľ, kde funkce /e L2(Ó) splňuje podmínku (26.34), pak, jak víme z kap. 22, má tento problém právě jedno zobecněné řešení u(x, y), splňujíc! podmínku (26.37) x, y) dx dy — 0 Předpokládejme tedy, že podmínka (26.34) je splněna, a podle (25.27) [všimněme si přitom, že v (25.1) jc c(x, y) =. 0, takže vynecháváme případ m = 0, n ~ 0; dále pokládáme cm„ = l] zvolme prvních patnáct bázových funkcí (26.38) y) f=l _/ = 0 (26.49) (26.50) n\a2f + ŕ2 i2) 4a b /(x, y) sin —- cos dx dy , i, j = 1, 2, 3 , , a b -au = f[x, y) sin —- dx dy , i = 1, 2, 3 , j = 0 , 2a Jo Jo « I v tomto případě je z uvedených rovnic patrno, že není třeba omezovat se jen na uvažované hodnoty indexů i, Přiklad 26.2. Uvažujme problém (26.51) (26.52) (26.53) na dvojnásobně souvislé oblasti G s lipschitzovskou hranicí (obr. 20); vertikálně zatížená deska s otvorem, na hranici vetknutá). y A2u = / v C u - 0 na r, ôu 5j= 0 r na m Obr. 20. Podle kap. 23 (str. 286) je biharmonický operátor, uvažovaný na liueálu funkcí spojitých s parciálními derivacemi do čtvrtého rádu včetně v G a splňujících podmínky (26.52), (26.53), pozitivně definitní. Zobecněné řešení problému (26.51) až (26.53) minimalizuje funkcionál F« = v prostoru HA, jehož prvky splňují — v určitém zobecněném smyslu, v tzv. smyslu 318 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE stop, viz kap. 30 — podmínky (26.52), (26.53). Numerický výpočet proveďme Ritzo-vou metodou [k téže soustavě rovnic (26.60) vede i metoda Galerkinova] pro problém (26.51) až (26.53) na mezikruží G se středem v počátku souřadnic a s vnitřním, resp. vnějším poloměrem Jij = 1, resp. R2 = 2 (obr. 21), pro případ f(x, y) - Iv G. Obr. 21. Zvolme prvních šest členů báze (25.8), (26.54) g2(x,y), xg\x, y), yg2(x, y), x2g2(x, y), xyg2(x, y) , y2g\x, y), kde (26.55) g{x, y) = (x2 + y2 - 1) (4 - x2 - y2), takže vzhledem k tomu, že funkce g(x, y) se vyskytuje v (26.54) v druhé mocnině, bude každá lineární kombinace funkcí (26.54) splňovat obě podmínky (26.52), (26.53). Protože oblast C, operátor A2 i funkce / jsou symetrické vzhledem k oběma osám souřadnic, stačí v (26.54) uvažovat (vizpozn. 13.7, str. 169) jen členy se sudými mocninami x a y. Vzhledem k symetrii problému podle počátku souřadnic stačí dokonce psát Ritzovu aproximaci u6(x, y) ve tvaru (26.56) u6 = g2(x, y) [a, + a2(x2 4- y2)~\ , resp,, použijeme-li polárních souřadnic r a ij/, ve tvaru (26.57) «6 = fli 2, , +2d^_ 1 d^ + Idjj =23mř4_ 5 760rl + 2112 dr4 r dr3 r2 dr2 r3 dr a obdobně A>2 = 6 400r6 - 23 040r* + 19 008r2 - 2 560. Odtud dostaneme (26.61) {»,, c* = ~t* - ¥Pi + <=*) * °>241 41' 0,002 500 Obr. 22. takže řešen! uvažovaného problému (přesné až na zaokrouhlení v koeficientech C,,..., GH4) je u = (-0,266 104 - 0,279 2l7r2) ln r - 0,257 036 + 0,241 411rJ + r4/64 , Speciálně je m(1) = 0, «(£) = 0,001 590, »(!) = 0,002 612 , u{{) = 0,001 381 , u(2) = 0 , zatímco podle (26.64) máme ««M = o. «<($ - °.°01 225. «4) = °>002 493. "^D = °>001371. ««#) =0 • Průběh přibližného, resp. přesného řešení jc graficky znázorněn čárkovaně, resp. plně na obr. 22. Aproximace wfi zřejmě vystihuje zcela uspokojivě přesné řešení. Poznámka 26.5. (Odhad chyby.) Pokud jde o odhad chyby v metrice prostoru HA l/s u všech příkladů počítaných v této kapitole použít nerovnosti (l 1.21). u - u li - \Au--n uir uo\\a — - ■ C (26.65) Pro iluslraci odhadněme chybu v případě problému (26.21), (26.22) pro a = % b = Ti, tj. chybu výsledku uS3, daného vzorcem (26,31). V tomto případě můžeme pro odhad konstanty C použít vzorce (18.48), str.205, který pro náš případ ř = Jt dává (- Au, u) ľf-Y + tm G AW dx dy > - , 2 11 " ' takže Podle (26.66) dostaneme tedy pro odhad chyby v normě protoru IIA výsledek (26.67) neboť 11-3-3 72. 1,364 = 1,93, 1 . .í':- 1 . , . sin y + - sin x sin 3v + - sin 3x sin v 4-3 3 -i— sin 3x : 9 162 dx dy = v i,, r r i /. . i — Au,, — 1 — J — A — sin x sin v 4- — sin x sin 3y 4- Jo Jol uzv 15 4- - sin 3x sin v 4- — sin 3x sin 3v* ] | — ll dx dy 15 ' 81 3 }\ J 16/. — sin x y\ sin 3jM — *4JoJcl H--sin J 3.x sin*" 3 v 4---■--f 81 ' 256 16 V. 4- - sin x sin 3y 4- - sin 3x sin v + - sin 3x sin 3 vil dx dy 1) ss 3 3 9 /J Integrály z ostatních členů jsou rovny nule vzhledem k ortogonalitč sinových funkcí v intervalu (0, it). sin2 x sin2 y + - sin2 x sin2 3x 4- - sin2 3x sin2 y + sin x sin y + 322 II [. APLIKACE NA DIFERENCIÁLNÍ ROVNICE 27. SHRNUTÍ KAPITOL 18 AŽ 26 323 16/100jr2 7t+\ 324 256 —--f---h--b-+---{ 4 4- - 4- - + —] Tt4 |_4 36 36 324 256 16 \ 9 9 81/J rt2 400\ _ 162 _ 10Chr2\ ^ 16 81 / n+ \256 324 J 6 400 ^lí2" = 1,86, takže skutečně (26.68) |-Att3j - f || = ^1,86 = 1,364 Poznámka 26.6. Odhad ||—Au33 — l|2 = 1,86 je sám o sobě zajímavý. Operátor —A, aplikovaný na sinové funkce (26.29), dává opět funkce téhož typu. Tyto funkce jsou na hranici /' rovny nule. Není-Ii pravá strana f(x, y) dané rovníce na hranici ľ rovna nule [a to je náš případ, neboť f(x, y) = 1], ncin&že tedy přibližné řešení splňovat uvažovanou diferenciální rovnici uspokojivě v celé oblasti G — rozdíl mezi levou a pravou stranou rovnice bude značný přinejmenším v určitém okolí hranice, které ovšem bude záviset na počtu členů báze, který bereme v úvahu. Odhad I — A«3 — íf2 = 1,86 skutečně není — a při poměrně malém počtu členů báze nemůže být — příliš příznivý, neboť, uvážíme-li, že obsah čtverce je v.2, připadá na „průměrný" rozdíl mezi funkcemi — &ul2, a —1 hodnota což není nikterak zanedbatelné číslo vzhledem k jedničce. Tento nepříznivý jev je možno odstranit teprve vezmeme-íi v úvahu značný počet členů báze. Jestliže nám tedy z nějakého důvodu nestačí, aby přibližné řešení uspokojivě aproximovalo přesné řešení v prostoru HÁ, ale aby s dostatečnou přesností splňovalo i danou diferenciální rovnici, je v tomto případě [kdy tedy f(x, y) £ 0 na hranici uvažovaného čtverce, resp. původního obdélníka (0, a) x (0, £)] vhodné použít místo sinové báze napr. báze polynomiální, tj. hledat přibližné řešení ve tvaru g(x, y)(a0 + ^x + a2y + - j »2 dx £ c,Í j (^J dx + c2\ u\S)áS , resp (27 •2) INU) = Í "2dx£ c3£ Jo ' • 1 ((-) <*a i « • ! a V--V ľ f m L J g dx platná pro funkce spojitě diferencovatelné v oblasti G s lipschitzovskou hranicí ľ (pro N — 1 spojitě diferencovatelné v intervalu < 0, r(x) í£ 0 v {a, by, s okrajovými podmínkami (27.4) a u'(a) - u(íí) = 0 , y u'(b) 4- & u(b) = 0 , a, ji, y, S jsou nezáporné konstanty, a + p > 0, y 4- <5 > 0. Mezi okrajové podmínky (27.4) patří zejména podmínky (19.5) až (19.8), kterým jsme věnovali zvláštní pozornost, neboť jsou obdobou typických okrajových podmínek pro parciální diferenciální rovnice druhého řádu. Zjistili jsme, že s výjimkou případu (27.5) r(x) = 0, u'(a) = 0 , u'(b) = 0 324 III. APLIKACE NA DIFERENCIÁLNÍ ROVNICE je příslušný diferenciální operátor A, uvažovaný na lineálu Aí funkcí dvakrát spojitě diferencovatelných v > a splňujících podmínky (27.4), pozitivně deŕinitní, a uvedli jsme funkcionály (19.85) až (19.88) (pro různé případy konstant a, f}, y, 5), které zobecněné řešení problému (27.3), (27.4) minimalizuje v příslušném prostoru fíA. V případě (27.5) jsme ukázali, že daný operátor je pozitivně defmitní na lineálu M2 funkcí dvakrát spojitě diferencovatelných v > a splňujících nejen podmínky u'(a) — u'(b) = 0, ale také podmínku JJ u(x) dx = 0. Nutná a postačující podmínka pro existenci zobecněného řešení pak je \baf(x)dx = 0. Příslušný funkcionál má přitom stejný tvar jako v případě okrajových podmínek u(a) — u(b) = 0. Při té příležitosti jsme upozornili na rozdíl mezi stabilními a nestabilními okrajovými podmínkami a na rozdílnou strukturu prostoru HA. Stabilní okrajové podmínky (podmínky, v nichž se vyskytují derivace nejvýše řádu k - 1, je-li daná rovnice řádu 2k) splňují - popř. v určitém zobecněném smyslu tzv. stop, viz kap. 30 -všechny funkce prostoru HA, zatímco u nestabilních okrajových podmínek (v nichž se vyskytují derivace řádu k-tého a vyššího) tomu tak není. Při volbě báze v příslušném prostoru HÁ, na němž minimalizujeme uvažovaný funkcionál, je třeba dbát na splnění stabilních okrajových podmínek. Nestabilní okrajové podmínky nemusí bázové funkce splňovat, ty jsou „obsaženy" v uvažovaném funkcionálu a jsou automaticky splněny (popř. v určitém zobecněném smyslu) zobecněným řešením, které v prostoru BA minimalizuje tento funkcionál. Ukázali jsme v této souvislosti i na rozdíl mezi Ritzovou a Galerkinovou metodou. Podrobně se budeme těmito otázkami zabývat v kap. 32, 34 a 35 (viz zejména str. 429 až 431), kde bude také mnohem lépe vidět do struktury uvažovaných prostorů. V kap. 19 jsme se v případě rovnic druhého řádu ještě zmínili o stejnoměrné konvergenci minimalizující posloupnosti {u„(x)} k zobecnenému řešení Uq(x), volíme-li prvky báze z DA [odkud ovšem ihned vyplývá spojitost funkce u0(x) v ]. Dále jsme uvedli funkcionály (19.105) až (19.108) pro nehomogenní okrajové podmínky. V závěru kap. 19 jsme se zabývali rovnicí řádu 2k s Dirichletovýmí okrajovými podmínkami a ukázali jsme na rovnici čtvrtého řádu s okrajovými podmínkami u(a) — u*(a) = u(f?) = u"(b) = 0, jak postupovat u rovnic vyšších řádů v případě jiných než Dirichletových okrajových podmínek. S podobnou problematikou jsme se zabývali v připadě parciálních diferenciálních rovnic. V kap. 22 jsme uvažovali stejnoměrné eliptickou rovnici druhého řádu, (27.6) Au = - Y ~ Ui) ~) + cu = /• u=i 8xi \ dxjj kde feh2(G), a!;(x) = ^(x) jsou spolu s parciálními derivacemi prvního řádu spojité v C, (27.7) Z a,fe)xfljž P2>i . P > 0 , U=í 1 = 1 27. SHRNUTÍ KAPITOL ] 8 AŽ 26 325 c(x) je funkce spojitá v G, c(x) 2; 0, a to s Dirjchletovými, Neumannovými, Newtonovými a smíšenými okrajovými podmínkami, které svým charakterem odpovídají okrajovým podmínkám (19.5) až (19.8) pro obyčejnou diferenciální rovnici. Výsledky jsou zcela obdobné. V případě, že je c(x) = 0 v G, je třeba, jde-lí o Neumannovu okrajovou podmínku JVu = 0, uvažovat daný diferenciální operátor na lineálu M2 funkcí spojitých s parciálními derivacemi do druhého řádu včetně v G a splňujících nejen podmínku Nu = 0, ale i podmínku Jff u dx — 0. Na tomto lineálu je daný operátor pozitivně deŕinitní. Nutná a postačující podmínka pro existenci zobecněného řešení je \Gf(x)dx = 0. Toto řešení pak v příslušném prostoru (funkce tohoto prostoru v obecném případě nesplňují podmínku Nu = 0, ale splňují podmínku J"fi udx = 0) minimalizuje funkcionál (22.53). Ostatní případy „nečiní potíže" a snadno jsme dokázali pozitivní definitttost daného operátoru na příslušných lineálech. Odpovídající funkcionály jsou funkcionály (22.27), (22.33), (22.38), (22.63) a (22.66). V závěru kapitoly jsme pak uvedli funkcionály (22.70) až (22.72) odpovídající nehomogenním okrajovým podmínkám. (Srov. také tabulku funkcionálu, uvedenou na konci knihy.) V kap. 23 jsme vyšetřovali biharmouieký operátor s okrajovými podmínkami (27.8) u = 0 , — = 0 na ľ, 3 v (27.9) u = 0, Mu = 0ha f, (27.10) Mu = 0 , Nu = 0 na T , kde operátory M a JV jsou dány vztahy (23.23), které zachycují i Poissonovu konstantu a, což je důležité pro aplikace v teorii pružnosti. Okrajové podmínky (27.10) jsou pro biharmomeký operátor nestabilní a odpovídají zde Neumannově okrajové podmínce pro rovnice druhého řádu. Tento problém je poněkud obtížnější a vrátíme se k němu v kap. 35 (str. 448, 456). V případě okrajových podmínek (27.8), (27.9) jsme bez obtíží dokázali pozitivní definitnost biharmonického operátoru na příslušných lineálech. Odpovídající funkcionály jsou funkcionály (23.40), (23.49). V případě nehomogenních okrajových podmínek je možno ke konstrukci přibližného řešení s výhodou použít metody nejmenších čtverců na hranici (kap. 43). Kap. 24 je věnována matematické teorii pružností. Rovnice rovnováhy jsme zapsali ve tvaru Au = f, kde A je tzv. operátor teorie pružnosti. [Jeho konkrétní tvar jsme ukázali v rovnici (24.í4) pro případ homogenního izotropního tělesa.] Pomocí tzv. Kornový nerovnosti jsme dokázali pozitivní definitnost tohoto operátoru na lineálech vektorových funkcí, spojitých s parciálními derivacemi do druhého řádu věcí ně v G a splňujících okrajové podmínky (27.11) u = 0 na P 326 III. APLIKACE. NA DIFERENCIÁLNÍ ROVNICE 27. SEIRNUTÍ KAP [TO L 18 AŽ 26 327 (nulové posunutí na hranici), resp. (27.12) t = 0 na F (nulové zatížení na hranici), resp. smíšené okrajové podmínky (27.13) o = 0 na fj , t = 0 na rz . Přitom v případě podmínky (27.12), která zde má význam Neumannovy okrajové podmínky, je třeba, aby vektorové funkce uvažovaného lineáíu splňovaly podmínky statické a momentové rovnováhy (27.14) í u dx = 0, Ír x u dx = 0 . JO JG Splnění týchž podmínek pro funkci f je nutnou a postačující podmínkou řešitelnosti problému Au = f v G, t = 0 na f. Ve všech případech minimalizuje zobecněné řešení „funkcionál potenciální energie" jG W(u) dx — JG fu dx v příslušném prostoru IIA, jehož prvky (vektorové funkce) splňují — popř. ve smyslu stop — odpovídající stabilní okrajové podmínky u = 0 na T, resp. na f,, v případě (27.12) nesplňují v obecném případě podmínku t - 0 na ľ, splňují však podmínky (27.14). V závěru kap. 24 jsme se pak zmínili o nehomogenních okrajových podmínkách. Viz též tabulku funkcionálů na konci knihy. Kap. 20 a 25 jsme věnovali otázkám volby báze, zejména pro Ritzovu metodu. Přímo z definice báze plyne, že báze je a) úplná v HÁ, b) lineárně nezávislá v HA. Po numerické stránce je dále důležité, aby báze zaručovala c) numerickou stabilitu procesu, d) stejnoměrnou omezenost čísel podmíněnosti Ritzovy matice R„, e) splnění podmínky Au„ -* f pro n -* co. V kap. 20 jsme uvedli dvě užitečné věty (věty 20.1 a 20.2), z nichž první tvrdí, za velmi přirozených předpokladů, že z úplnosti posloupnosti {Aq>„} v prostoru H plyne úplnost posloupnosti { 2; pro JV = 1 dostaneme ovšem systém funkcí 1, x, x2,....) V případě Dirichletova problému pro rovnici (27.6) tvoří bázi v prostoru HA systém funkcí (27-16) g, xg, yg, x2g, xyg, y2g, kde g(x, y) je dostatečně hladká funkce v G, kladná v C a rovná nule na F. Příklady lakových bází jsme uvedli v kap. 20 a 25 (str. 239, 300, 301 aj.). Bází podobného typu lze použít i v případě rovnic vyšších řádů a popř. jiných okrajových podmínek, než jsou Dirichletovy podmínky [srov. problém (25.9) až(25.12), str. 301]. Tyto systémy mají tu výhodu, žc jsou jednoduché a lze jimi snadno zachytit okrajové podmínky i v případě vícenásobně souvislých oblastí. Jejich nevýhodou je, že nemají v obecném případě vlastnosti c), d), c). Zejména tedy levé strany rovnic v Ritzově soustavě jsou „málo nezávislé", a jak při výpočtu koeficientů této soustavy, tak při jejím řešení je třeba výpočtů s velkou přesností. Mimoto je zpravidla možno uvažovat jen několik prvních členů báze. 2. Citované věty 20.2 je možno použít s výhodou tak, že najdeme ortonormální systém vlastních funkcí některého poměrně jednoduchého operátoru (např. Lapla-ceova), jehož samoadjungované rozšíření a samoadjungovaná rozšíření daného operátoru jsou shodné příbuzné operátory. To je zejména u rovnic druhého řádu poměrně snadné, nebof s výjimkou Neumannových okrajových podmínek a případu c(x) = 0 v G mají tuto vlastnost operátory (27.6) a —Au; v případě Neumannových podmínek a c(x) = 0 stačí vyšetřovat operátory (27.6) a —Au na lineáíu dostatečně hladkých funkcí, splňujících dané okrajové podmínky a podmínku J"e u dx = 0. Zmíněný ortonormální systém vlastních funkcí má pak všechny požadované vlastnosti a) až e). V kap. 25 jsme pak uvedli příklady některých vhodných bází, zejména pro kruh a obdélník, a mimoto jsme ukázali některé obraty, jak pomocí jednoduchých transformací využít těchto systémů i v případě jiných oblastí. Koeficienty uvedených ortonormálních systémů závisejí na n. Upozornili jsme na to, že tvar těchto koeficientů je možno často zjednodušit, že však je přitom třeba dbát na to, aby byla zachována aspoň řádová závislost těchto koeficientů na n. Jinak totiž v obecném případě převažují prvky v pravé dolní části Ritzovy matice velmi výrazně (v absolutní hodnotě) nad prvky vlevé horní části této matice, což se nepříznivě projeví v numerickém procesu. Poznamenali jsme však také, že koeficienty v uvedených systémech je možno položit rovny jedničce, používáme-li speciálních numerických postupů, např. programování s pohyblivou čárkou a řešení Ritzovy soustavy eliminační metodou, a ovšem i tenkrát, bcrcmc-li pří výpočtu v úvahu jen malý počet členů těchto systémů. Názorně bylo vlastnosti systémů prvního a druhého typu vidět na příkladech uvedených v kap. 21 a 26. Tyto příklady jsme volili jednak ilustrativní (viz zejména první dva příklady v kap.. 20), jednak zaměřené tak, aby obsáhly značný počet problémů, s nimiž se inženýr—teoretik, resp. přírodovědec setká. Podrobně se otázkami účelné volby báze zabývají např. knihy [29] a [4]. O speciální volbě báze v tzv. metodě konečných prvků pojednáme v kap. 42.