Drsná matematika Martin Panák, Jan Slovák Pokus o učební text pro začínající studenty informatiky přibližující podstatnou část matematiky v rozsahu čtyř semestrálních přednášek. Texty jsou neúplné, zejména poslední semestr teprve čeká na dopracování. i Obsah Kapitola 1. Úvod a motivace 1 1. Čísla a funkce 1 2. Kombinatorické formule 3 3. Diferenční rovnice 9 4. Pravděpodobnost 17 5. Geometrie v rovině 28 6. Relace a zobrazení 38 Kapitola 2. Elementární lineární algebra 45 1. Vektory a matice 45 2. Determinanty 53 3. Vektorové prostory a lineární zobrazení 60 4. Vlastnosti lineárních zobrazení 72 Kapitola 3. Linární modely 83 1. Lineární rovnice a procesy 83 2. Lineární diferenční rovnice a filtry 86 3. Markovovy procesy 91 4. Více maticového počtu 93 5. Rozklady matic a pseudoinverze 98 Kapitola 4. Analytická geometrie 105 1. Afinní geometrie 105 2. Euklidovská geometrie 115 3. Projektivní geometrie 130 Kapitola 5. Zřízení ZOO 135 1. Interpolace polynomy 135 2. Spojité funkce 143 3. Derivace 157 4. Mocninné řady 165 Kapitola 6. Diferenciální a integrální počet 177 1. Derivování 177 2. Integrování 191 3. Nekonečné řady 208 Kapitola 7. Spojité modely 215 1. Aproximace pomocí Fourierových řad 215 2. Integrální operátory 221 iii iv OBSAH Kapitola 8. Spojité modely s více proměnnými 227 1. Funkce a zobrazení na Rn 227 2. Integrování podruhé 256 3. Diferenciální operátory 271 4. Poznámky o numerických metodách 281 Kapitola 9. Kombinatorické metody 283 1. Grafy a algoritmy 283 2. Aplikace kombinatorických postupů 304 Kapitola 10. Algebraické struktury a techniky 325 1. Grupy 325 2. Okruhy polynomů a tělesa 342 3. Uspořádané množiny a Booleovská algebra 354 4. Kódy (a šifry?) 360 Kapitola 11. Statistické metody 367 1. Pravděpodobnost 368 2. Popisná statistika 382 3. Matematická statistika 382 4. Poznámky o některých aplikacích 383 Literatura 385 OBSAH v Předmluva Tento učební text vzniká průběžně při přípravě přednášek pro předměty Matematika I­IV na Fakultě informatiky MU. Text se snaží prezentovat standardní výklad matematiky s akcentem na smysl a obsah prezentovaných matematických metod. Řešené úlohy pak procvičují základní pojmy, ale zároveň se snažíme dávat co nejlepší příklady užití matematických modelů. Studenti navíc mají řešit a odevzdávat každý týden zadávané příklady. Seminární skupiny pak obdobně standardním ,,cvičením vytváří podporu pro řešení domácích úloh. V tomto textu podáváme formální výklad proložený řešenými příklady. Ne vše se daří průběžně naplňovat tak, jak bychom si představovali. Samotný teoretický text by měl být podrobnější a lépe formulovaný, řešených příkladů bychom chtěli mít podstatně více a měly by pokrývat celou škálu složitosti, od banálních až po perličky ke skutečnému přemýšlení. Posluchače bychom rádi naučili: * přesně formulovat definice základních pojmů a dokazovat jednoduchá matematická tvrzení, * vnímat obsah i přibližně formulovaných závislostí, vlastností a výhledů použití, * vstřebat návody na užívání matematických modelů a osvojit si jejich využití. K těmto ambiciózním cílům nelze dojít lehce a pro většinu lidí to znamená hledat si vlastní cestu s tápáním různými směry (s potřebným překonáváním odporu či nechutě). I proto je celý výklad strukturován tak, aby se pojmy a postupy vždy několikrát vracely s postupně rostoucí složitostí a šíří diskuse. Jsme si vědomi, že tento postup se může jevit jako chaotický, domníváme se ale, že dává mnohem lepší šanci na pochopení u těch, kteří vytrvají. Vstup do matematiky je skoro pro každého obtížný ­ pokud už ,,víme , nechce se nám přemýšlet, pokud ,,nevíme , je to ještě horší. Jediný spolehlivý postup pro orientaci v matematice je hledat porozumnění v mnoha pokusech a hledat je při četbě v různých zdrojích. Určitě nepovažujeme tento text za dostatečný jediný zdroj pro každého. Pro ulehčení vícekolového přístupu ke čtení je text strukturován také pomocí barev, resp. sazby, takto * normální text je sázen černě * řešené příklady jsou sázeny barvou * složitější text, který by měl být čten pozorněji, ale určitě ne přeskakován, je sázen barvou * náročné pasáže, které mohou (nebo by raději měly být) být při studiu přinejmenším napoprvé přeskakovány jsou sázeny v barvě . Všechny čtyři semestry výuky už jednou proběhly a výsledných 11 kapitol máte v rukou, všechny jsou ovšem jen v různém stavu rozpracovanosti. Stručně shrnuto je obsah takovýto: vi OBSAH 1. semestr: Úvodní motivační kapitola se snaží v rozsahu přibližně 4­5 týdnů přednášek ilustrovat několik přístupů k matematickému popisu problémů. Začínáme nejjednoduššími funkcemi (základní kombinatorické formule), naznačujeme jak pracovat se závislostmi zadanými pomocí okamžitých změn (jednoduché diferenční rovnice), užití kombinatoriky a množinové algebry diskutujeme prostřednictvím konečné klasické pravděpodobnosti, předvádíme maticový počet pro jednoduché úlohy rovinné geometrie (práce s pojmem pozice a transformace) a závěrem vše trochu zformalizujeme (relace, uspořádní, ekvivalence). Nenechte se zde uvrhnout do chaotického zmatku příliš rychlým střídáním témat ­ cílem je nashromáždit něco málo netriviálních námětů k přemýšlení a hledání jejich souvislostí i použití, ještě než zabředneme do úrovně problémů a teorií složitějších. Ke všem tématům této úvodní kapitoly se časem vrátíme. Dalších přibližně 5 týdnů přednášek je věnováno základům počtu, který umožňuje práci s vícerozměrnými daty i grafikou. Jde o postupy tzv. lineární algebry, které jsou základem a konečným výpočetním nástrojem pro většinu matematických modelů. Jednoduché postupy pro práci s vektory a maticemi jsou obsahem kapitoly druhé, další kapitola je pak věnována aplikacím maticového počtu v různých lineárních modelech (systémy lineárních rovnic, lineární procesy, lineární diferenční rovnice, Markovovy procesy, lineární regrese). Poslední 2­3 přednášky prvního semestru jsou věnovány použitím maticového počtu v geometrických úlohách a lze se z nich dozvědět něco málo o afinní, euklidovské a projektivní geometrii. 2. semestr: Další semestr je věnován tzv. spojitým modelům. Chceme co nejnázorněji ukázat, že základní ideje, jak s funkcemi pracovat, bývají jednoduché. Stručně řečeno, hledáme cesty, jak složitější věci nelineární povahy řešit pomocí jednoduchých lineárních triků a postupů lineární algebry. Složitosti se pojí skoro výhradně se zvládnutím rozumně velké třídy funkcí, pro které mají naše postupy být použitelné. Prvně proto přišla na řadu kapitola pátá, kde diskutujeme jaké funkce potřebujeme pro nelineární modely. Začínáme s polynomy a spliny, pak postupně diskutujeme pojmy spojitosti, limity posloupoností a funkcí a derivace funkcí a seznámíme se se všemi základními elementárními funkcemi a s mocninnými řadami. Tím je připravena půda pro klasický diferenciální a integrální počet. Ten prezentujeme v kaptole šesté s důrazem na co nejjednodušší pochopení aproximací, integračních procesů a limitních procesů. Poslední sedmá kapitola se věnuje náznakům aplikací a snaží se co nejvíce připomínat analogie k postupům jednoduché lineární algebry z minulého semestru. Místo lineárních zobrazení mezi konečně rozměrnými vektorovými prostory tak pracujeme s lineárními operacemi mezi nekonečně rozměrnými vektorovými prostory funkcí, definovaných buď integrálními nebo diferenciálními operátory. Zatímco studium diferenciální rovnic ponecháváme do semestru dalšího, zde studujeme nejprve aproximace funkcí s pomocí vzdálenosti definované integrálem (tzv. Fourierovy řady) abychom vzápětí mohli ukázat souvislost s některými integrálními transformacemi (Fourirerova transformace). 3. semestr: Zde nejprve pokračujeme v našem stručném nastínění analytických metod pro modely s mnoha proměnnými. Nejprve v osmé kapitole rozšíme základní postupy a výsledky týkající se derivací na funkce více proměnných, včetně funkcí OBSAH vii zadaných implicitně a tzv. vázaných extrémů. Hned poté rozšíříme teorii integrování o tzv. násobné integrály. Poté se věnujeme stručně modelům zachycujím známou zněnu našich obejktů, tj. diferenciálním rovnicím. Závěrem této kapitoly pak uvádíme několik poznámek o odhadech a numerických příblíženích. Devátá kapitola směřuje zpět do světa diskrétních metod. Zabýváme se v ní základními pojmy poznatky teorie grafů a jejich využitím v praktických problémech (např. prohledávání do šířky a hloubky, minimální pokrývající kostry, toky v sítích, hry popisované stromy). Závěrem uvádíme pár poznámek o vytvořujících funkcích. 4. semestr: V posledním semestru celého cyklu přednášek se zabýváme nejprve obecnými algebraickými strukturami s důrazem na teorii grup a náznaky aplikací. Tomuto tématu budeme věnovat 5­6 přednášek. Konečně, závěrečná jedenáctá kapitola je věnována matematické pravděpododobnosti a statistice v rozsahu 6-7 přednášek. Seznámíme se s pojmy pravděpodobnostní prostor, hustota pravděpodobnosti, normální rozdělení, střední hodnota, medián, kvantil, rozptyl, příklady diskrétních a spojitých rozdělení a budeme se náznakem věnovat statistickému zpracování dat. Září 2007, Martin Panák, Jan Slovák KAPITOLA 5 Zřízení ZOO jaké funkce potřebujeme pro naše modely? ­ pořádný zvěřinec... 1. Interpolace polynomy Touto kapitolou započneme budování nástrojů umožňujících modelování závislostí, které nejsou ani lineární ani diskrétní. S takovou potřebou se např. setkáme, kdykoliv popisujeme systém vyvíjející se v čase a to ne jen v několika vybraných okamžicích ale ,,souvisle , tj. pro všechny možné okamžiky. Někdy je to přímo záměr či potřeba (třeba ve fyzikálních procesech), jindy je to vhodné přiblížení diskrétního modelu (třeba u ekonomických nebo populačních modelů). V předchozích kapitolách jsme pracovali často s posloupnostmi hodnot reálných nebo komplexních čísel, tj. se skalárními funkcemi N K nebo Z K, kde K byl zvolený okruh skalárů, případně N V , kde V je vektorový prostor nad K. Připomeňme si diskusi z odstavce 1.3, kde jsme přemýšleli nad způsoby, jak pracovat se skalárními funkcemi. Na této diskusi se vůbec nic nemění a rádi bychom (pro začátek) uměli pracovat s funkcemi R R (reálné funkce reálné proměnné) nebo R C (komplexní funkce reálné proměnné), případně funkcemi Q Q (funkce jedné racionální proměnné s racionálními hodnotami) apod. Většinou půjdou naše závěry snadno rozšířit na případ s vektorovými hodnotami nad stejnými skaláry, ve výkladu se ale zpravidla omezíme jen na případ reálných čísel, případně komplexních čísel. Čím větší třídu funkcí připustíme, tím obtížnější bude vybudovat nástroje pro naši práci. Když ale bude různých typů funkcí málo, nebudeme patrně umět budovat dostatek modelů pro reálné situace. Cílem našich prvních dvou kapitol matematické analýzy bude proto explicitně zavést několik typů elementárních funkcí, implicitně popsat více funkcí a vybudovat standardní nástroje pro práci s nimi. Souhrnně se tomu říká diferenciální a integrální počet jedné proměnné. 5.1 5.1. Polynomy. Připomeňme si vlastnosti skalárů. Umíme je sčítat i násobit a tyto operace splňují řadu vlastností, které jsme vyjmenovali už v odstavcích 1.1 a 1.2. Polynomem nad okruhem skalárů K rozumíme zobrazení f : K K dané výrazem f(x) = anxn + an-1xn-1 + + a1x + a0, kde ai, i = 0, . . . , n, jsou pevně zadané skaláry, násobení je znázorněno prostým zřetězením symbolů a ,,+ označuje sčítání. Pokud je an = 0, říkáme, že polynom f je stupně n. Stupěň nulového polynomu není definován. Skaláry ai označujeme jako koeficienty polynomu f. Polynomy stupně nula jsou právě konstantní nenulová zobrazení x a0. V algebře jsou častěji polynomy definovány jako formální výrazy f(x), tj. jako posloupnosti koeficientů a0, a1, . . . s konečně mnoha nenulovými 135 136 5. ZŘÍZENÍ ZOO prvky. Následující jednoduché lemma ukazuje, že v analýze budou oba přístupy ekvivalentní. Je snadné ověřit, že polynomy nad okruhem skalárů tvoří opět okruh, kde násobení a sčítání je dáno operacemi v původním okruhu K pomocí hodnot polynomů. Připomeňte si při této příležitosti vlastnosti skalárů a ověřte! Nad každým polem skalárů (viz axiom ,,P v odstavcích 1.1 a 1.2) funguje dělení polynomů se zbytkem, tj. pro polynomy f stupně n a g stupně m, existují jednoznačně určené polynomy q a r takové, že stupeň r je menší než m nebo je r = 0 a f = q g +r. Je-li pro nějaký prvek b K hodnota f(b) = 0, pak to znamená, že v podílu f(x) = q(x)(x-b)+r musí být r = 0. Jinak by totiž nebylo možné dosáhnout f(b) = q(b)0+r, kde stupeň r je nulový. Říkáme, že b je kořen polynomu f. Stupeň q je pak právě n - 1. Pokud má q opět kořen, můžeme pokračovat a po nejvýše n krocích dojdeme ke konstatnímu polynomu. Dokázali jsme tedy, že každý nenulový polynom nad polem K má nejvýše tolik kořenů, kolik je jeho stupeň. Odtud již snadno dovodíme i následující pozorování: Lemma. Je-li K pole s nekonečně mnoha prvky, pak dva polynomy f a g jsou si rovny jako zobrazení, právě když mají shodné koeficienty. Důkaz. Předpokládejme f = g, tj. f - g = 0 jako zobrazení. Polynom (f g)(x) tedy má nekonečně mnoho kořenů, což je možné pouze tehdy, je-li nulovým polynomem. Uvědomme si, že u konečných polí samozřejmě takové tvrzení neplatí. Uvažte např. polynom x2 + x nad Z2. 5.2 5.2. Interpolační polynom. Častá praktická úloha vyžaduje stanovení počítatelné formule pro funkci, pro kterou máme zadány hodnoty v předem daných daných bodech x0, . . . , xn. Pokud by šlo o nulové hodnoty, umíme přímo zadat polynom f(x) = (x - x0)(x - x1) . . . (x - xn), který bude mít nulové hodnoty právě v těchto bodech a nikde jinde. To ale není jediná odpověď, protože požadovanou vlastnost má i nulový polynom. Ten je přitom jediný s touto vlastností ve vektorovém prostoru polynomů stupně nejvýše n. Obdobně to dopadne i v obecném případě: Věta. Nechť K je nekonečné pole skalárů, pak pro každnou množinu po dvou různých bodů x0, . . . , xn K a předepsaných hodnot y0, . . . , yn K existuje právě jeden polynom f stupně nejvýše n (případně nulový polynom), pro který platí f(xi) = yi, i = 0, . . . , n. Důkaz. Označme si prozatím neznámé koeficienty polynomu f stupně n f = anxn + + a1x + a0. Dosazením požadovaných hodnot dostaneme systém n + 1 rovnic pro stejný počet neznámých koeficientů ai a0 + x0a1 + + (x0)n an = y0 ... a0 + xna1 + + (xn)n an = yn. 1. INTERPOLACE POLYNOMY 137 Jak je dobře známo z lineární algebry, tento systém lineárních rovnic má právě jedno řešení pokud je determinant jeho matice invertibilní skalár, tj. pokud je nenulový (viz 3.1 a 2.22). Musíme tedy vyšetřit tzv. Vandermondův determinant V (x0, . . . , xn) = det 1 x0 (x0)2 . . . (x0)n 1 x1 (x1)2 . . . (x1)n ... ... ... ... ... 1 xn (xn)2 . . . (xn)n . Tento determinant umíme nad libovolným nekonečným polem skalárů snadno spo- číst: Lemma. Pro všechny hodnoty x0, . . . , xn K platí V (x0, . . . , xn) = n i>k=0 (xi - xk). Důkaz. Vztah dokážeme indukcí přes počet bodů xi. Evidentně je správný pro n = 1 (a pro n = 0 je úloha nezajímavá). Předpokládejme, že výsledek je správný pro n - 1, tj. V (x0, . . . , xn-1) = n-1 i>k=0 (xi - xk). Nyní považujme hodnoty x0, . . . , xn-1 za pevné a hodnotu xn ponechme jako volnou proměnnou. Rozvojem determinantu podle posledního řádku (viz 2.19) obdržíme hledaný determinant jako polynom e5.1 (5.1) V (x0, . . . , xn) = (xn)n V (x0, . . . , xn-1) - (xn)n-1 . Toto je polynom stupně n, protože víme, že jeho koeficient u (xn)n je nenulový dle indukčního předpokladu. Přitom bude zjevně nulový při dosazení kterékoliv hodnoty xn = xi pro i < n, protože bude v takovém případě obsahovat původní determinant dva stejné řádky. Náš polynom tedy bude dělitelný výrazem (xn - x0)(xn - x1) (xn - xn-1), který má sám již stupeň n. Odtud vyplývá, že celý Vandermondův determinant coby polynom v proměnné xn musí být tomuto výrazu roven až na konstantní násobek, tj. V (x0, . . . , xn) = c (xn - x0)(xn - x1) (xn - xn-1). Porovnáním koeficientů u nejvyšší mocniny v (5.1) a tomto výrazu dostáváme c = V (x0, . . . , xn-1) a tím je důkaz lemmatu ukončen. Ukázali jsme, že je determinant naší soustavy rovnic vždy roven součinu rozdílů definičních bodů. Pro naše po dvou různé body xi tedy musí být nenulový. Odtud ale vyplývá jednoznačná existence řešení. Protože polynomy jsou jako zobrazení stejné, právě když mají stejné koeficienty, věta je dokázána. Jednoznačně určený polynom f z předchozí věty nazýváme interpolační polynom pro hodnoty yi v bodech xi. 138 5. ZŘÍZENÍ ZOO 5.3 5.3. Poznámky. Uvažujme nyní pro jednoduchost pouze reálné nebo případně racionální polynomy, tj. polynomiálně zadané funkce R R nebo Q Q. Na první pohled se může zdát, že polynomy tvoří hezkou velikou třídu funkcí jedné proměnné, kterou můžeme použít na proložení jakékoliv sady předem zadaných hodnot. Navíc se zdají být snadno vyjádřitelné, takže by s jejich pomocí mělo být dobře možné počítat i hodnoty těchto funkcí pro jakoukoliv hodnotu proměnné. Při pokusu o praktické využití v tomto směru ovšem narazíme hned na několik problémů. Prvním z nich je potřeba rychle vyjádřit polynom, kterým zadaná data proložíme. Pro řešení výše diskutovaného systému rovnic totiž budeme obecně potřebovat čas úměrný třetí mocnině počtu bodů, což při hustějších datech je jistě těžko přijatelné. Podobným problémem je pomalé vyčíslení hodnoty polynomu vysokého stupně v zadaném bodě. Obojí lze částečně obejít tak, že zvolíme vhodné vyjádření intepolačního polynomu (tj. vybereme lepší bázi příslušného vektorového prostoru všech polynomů stupně nejvýše k, než je ta nejobvyklejší 1, x, x2 , . . . , xn ). Jednou z možností je tzv. Lagrangeův interpolační polynom, kterým rychle a snadno zapíšeme řešení. Sestrojíme si nejprve pomocné polynomy i s vlastností i(xj) = 1 i = j 0 i = j . Zřejmě musí být tyto polynomy až na konstantu rovny výrazům (x - x0) . . . (x xi-1)(x - xi+1) . . . (x - xn) a proto i(x) = j=i(x - xj) j=i(xi - xj) . Hledaný Lagrangeův interpolační polynom pak snadno zadáme formulí f(x) = y0 0(x) + y1 1(x) + + yn n(x). Toto vyjádření má nevýhodu ve velké citlivosti na nepřesnosti výpočtu při malých rozdílech zadaných hodnot xi, protože se v ní těmito rozdíly dělí. Všimněme si ale, že přímá konstrukce Lagrangeova polynomu může nahradit existenční část důkazu v předchozí Větě 5.2. (Jednoznačnost pak je také jednoduchá i bez příslušné lineární algebry: dvě možná řešení f a g mají stejné hodnoty v n + 1 různých bodech, tj. polynom f - g má n + 1 různých kořenů a stupeň nejvýše n a proto musí být nulovým polynomem.) Ještě horším problémem je velice špatná stabilita hodnot reálných nebo racionálních polynomů při zvětšující se hodnotě proměnné. Brzy budeme mít nástroje na přesný popis kvalitativního chování funkcí, nicméně i bez nich je zřejmé, že podle znaménka koeficientu u nejvyšší mocniny polynomu se hodnoty velice rychle při rostoucím x vydají buď do plus nebo mínus nekonečna. Ani toto znaménko koeficientu u nejvyššího stupně se ale u interpolačního polynomu při malých změnách prokládaných hodnot nechová stabilně. Názorně to vidíme na dvou obrázcích, kde je proloženo jedenáct hodnot funkce sin(x) s různými malými náhodnými změnami hodnot. Zelenou barvou je vynesena aproximovaná funkce, kolečka jsou malinko posunuté hodnoty a červeně je vynesen jednoznačně zadaný interpolační polynom. Zatímco uvnitř intervalu je aproximace vcelku dobrá, stabilita na okrajích je otřesná. 1. INTERPOLACE POLYNOMY 139 -4 x 2 4 1 2 0 -1 0 -2 -2 -4 x 2 4 1 2 0 -1 0 -2 -2 Kolem interpolačních polynomů existuje bohatá teorie. Částečně se budeme k některým jejich vlastnostem vracet, podrobnější rozbor lze najít např. v pěkných textech [8]. 5.4. Určování interpolačních polynomů. Nalezněte polynom P splňující následující podmínky: P(2) = 1, P(3) = 0, P(4) = -1, P(5) = 6. Řešení. Řešíme buď přímo, t.j. sestavením soustavy čtyř lineárních rovnic o čtyřech neznámých. Předpokládáme polynom ve tvaru a3x3 + a2x2 + a1x1 + a0. Víme, že polynom stupně nejvýše tři splňující podmínky v zadání je dán jednoznačně. a0 + 2a1 + 4a2 + 8a3 = 1 a0 + 3a1 + 9a2 + 27a3 = 0 a0 + 4a1 + 16a2 + 64a3 = -1 a0 + 5a1 + 25a2 + 125a3 = 6. Každá rovnice vznikla z jedné z podmínek v zadání. Druhou možností je vytvořit hledaný polynom pomocí fundamentálních Lagrangeových polynomů: P(x) = 1 (x - 3)(x - 4)(x - 5) (2 - 3)(2 - 4)(2 - 5) + 0 (. . . ) + = (-1) (x - 2)(x - 3)(x - 5) (4 - 2)(4 - 3)(4 - 5) + 6 (x - 2)(x - 3)(x - 4) (5 - 2)(5 - 3)(5 - 4) = = 4 3 z3 - 12z2 + 101 3 z - 29. Koeficienty tohoto polynomu jsou samozřejmě jediným řešením výše sestavené soustavy lineárních rovnic. 5.4.1. Nalezněte polynom P splňující následující podmínky: P(1 + i) = i, P(2) = 1, P(3) = -i. 140 5. ZŘÍZENÍ ZOO Řešení. P(x) = (-3 5 - 4 5 i)x2 + (2 + 3i)x - 3 5 - 14 5 i. 5.4 5.5. Derivace polynomů. Zjistili jsme, že hodnoty polynomů s rostoucí proměnnou rychle míří k nekonečným hodnotám (viz také obrázky). Proto je zřejmé, že polynomy nemohou nikdy vhodně popisovat jakékoliv periodicky se opakující děje (jako jsou např. hodnoty goniometrických funkcí). Mohlo by se ale zdát, že podstatně lepší výsledky budeme alespoň mezi body xi dosahovat, když si budeme kromě hodnot funkce hlídat, jak rychle naše funkce v daných bodech rostou. Pro tento účel zavedeme (prozatím spíše intuitivně) pojem derivace pro polynomy. Můžeme přitom pracovat opět s reálnými, komplexními nebo racionálními polynomy. Rychlost růstu v bodě x R pro reálný polynom f(x) dobře vyjadřují podíly e5.2 (5.2) f(x + x) - f(x) x a protože umíme spočíst (nad libovolným okruhem) (x + x)k = xk + kxk-1 x + + k l xl (x)k-l + + (x)k , dostaneme pro polynom f(x) = anxn + + a0 výše vedený podíl ve tvaru f(x + x) - f(x) x = an nxn-1 x + + (x)k x + + a1 x x = nanxn-1 + (n - 1)an-1xn-2 + + a1 + x(. . . ), kde výraz v závorce je polynomiálně závislý na x. Evidentně pro hodnoty x velice blízké nule dostaneme hodnotu libovolně blízkou výrazu f (x) = nanxn-1 + (n - 1)an-1xn-2 + + a1, který nazýváme derivace polynomu f podle proměnné x. Z definice je jasné, že právě hodnota f (x0) derivace polynomu nám dává dobré přiblížení jeho chování v okolí bodu x0. Přesněji řečeno, přímka y = f (x0)(x - x0) + f(x0) velice dobře aproximuje přímky procházející body [x0, f(x0)] a [x0+x, f(x0+x)] pro malé hodnoty x. Hovoříme o lineárním přiblížení polynomu f jeho tečnou. Derivace polynomů je lineární zobrazení, které přiřazuje polynomům stupně nejvýše n polynomy stupně nejvýše n - 1. Iterací této operace dostáváme druhé derivace f , třetí derivace f(3) a obecně po k­násobném opakování polynom f(k) stupně n - k. Po n + 1 derivacích je výsledkem nulový polynom. S tímto lineárním zobrazením jsme se již potkali v odstavci 2.45 o nilpotentních zobrazeních. 5.5 5.6. Hermiteův interpolační problém. Uvažme opět m + 1 po dvou různých reálných nebo racionálních hodnot x0, . . . , xm, tj. xi = xj pro všechna i = j. Předepišme dále hodnoty y (k) i aproximované funkce a jejich derivací pro k = 0 a k = 1. To znamená, že máme předepsány hodnoty a první derivace v zadaných bodech xi. Hledáme polynom f, který bude nabývat těchto předepsaných hodnot a derivací. 1. INTERPOLACE POLYNOMY 141 Zcela analogicky jako u interpolace pouhých hodnot obdržíme pro neznámé koeficienty polynomu f(x) = anxn + . . . a0 systém rovnic a0 + x0a1 + + (x0)n an = y (0) 0 ... a0 + xma1 + + (xm)n an = y(0) m a1 + 2x0a2 + + n(x0)n-1 an = y (1) 0 ... a1 + 2xma2 + + n(xm)n-1 an = y(1) m . Opět bychom mohli ověřit, že při volbě n = 2m+1 bude determinant tohoto systému rovnic nenulový a tudíž bude existovat právě jedno řešení. Nicméně, stejně jako při konstrukci Lagrangeova polynomu lze zkonstruovat takový polynom f přímo. Nazýváme jej Hermiteův interpolační polynom. Hermiteův polynom můžeme určit podobně pomocí fundamentálních Hermiteových polynomů: h1 i (x) = 1 l (xi) l (xi) (x - xi) (li(x)) 2 h2 i (x) = (x - xi) (li(x)) 2 , kde l(x) = n i=1(x - xi) Tyto polynomy splňují následující podmínky: h1 i (xj) = j i = 1 pro i = j 0 pro i = j (h1 i ) (xj) = 0 h2 i (xj) = 0 (h2 i ) (xj) = j i Máme-li dán systém podmínek f(x1) = y1, f (x1) = y1, . . . , f(xk) = yk, f (xk) = yk, pak je odpovídající polynom dán předpisem f(x) = k i=1 [yih1 i (xi) + yih2 i (xi)]. Úplně nejjednodušší případ je zadání hodnoty a derivace v jediném bodě. Tím určíme beze zbytku polynom stupně 1 f(x) = f(x0) + f (x0)(x - x0) tj. právě rovnici přímky zadané hodnotou a směrnicí v bodě x0. Když zadáme hodnotu a derivaci ve dvou bodech, tj. y0 = f(x0), y0 = f (x0), y1 = f(x1), y1 = f (x1) pro dva různé body xi, dostaneme ještě pořád snadno počítatelný problém. Ukažme si jej v zjednodušeném provedení, kdy x0 = 0, x1 = 1. Pak matice systému a její inverze budou A = 0 0 0 1 1 1 1 1 0 0 1 0 3 2 1 0 , A-1 = 2 -2 1 1 -3 3 -2 -1 0 0 1 0 1 0 0 0 . 142 5. ZŘÍZENÍ ZOO Přímým vynásobením A (y0, y1, y0, y1)T pak vyjde vektor (a3, a2, a1, a0)T koeficientů polynomu f, tj. f(x) = (2y0 - 2y1 + y0 + y1)x3 + (-3y0 + 3y1 - 2y0 - y1)x2 + y0x + y0. V případě, že máme zadány hodnoty a derivace v jiných bodech x0 a x1, lze využít tohoto výsledku s pomocí vhodné afinní transformace R R (pozor ale na vliv transformace na velikosti derivací, podrobněji budeme podobné úkony diskutovat později). 5.6.1. Příklad Nalezněte polynom P splňující následující podmínky: P(1) = 0, P (1) = 1, P(2) = 3, P (2) = 3. Řešení. P(x) = -2x3 + 10x2 - 13x + 5. Obdobně lze předepisovat libovolný konečný počet derivací v jednotlivých bodech a vhodnou volbou stupně polynomu obdržíme vždy jednoznačné interpolace. Nebudeme zde uvádět podrobnosti, viz opět text [8]. Bohužel, u těchto interpolací pořád zůstávají problémy zmíněné už v případě jednoduchých interpolací hodnot ­ složitost výpočtů a nestabilita. Použití derivací však podbízí jednoduché vylepšení metodiky: 5.6 5.7. Interpolace splajny. 1 Jak jsme viděli na obrázcích demonstrujících nestabilitu interpolace jedním polynomem dostatečně vysokého stupně, malé lokální změny hodnot zapřičiňovaly dramatické celkové změny chování výsledného polynomu. Nabízí se tedy využití malých polynomiálních kousků, které ale musíme umět rozumně navazovat. Nejjednodušší je propojení vždy dvou sousedních bodů lineárním polynomem. Tak se nejčastěji zobrazují data. Z pohledu derivací to znamená, že budou na jednotlivých úsecích konstantní a pak se skokem změní. O něco sofistikovanější možností je předepsat v každém bodě hodnotu a derivaci, tj. pro dva body budeme mít 4 hodnoty a jednoznačně tím určíme Hermiteův polynom 3. stupně, viz výše. Tento polynom pak můžeme použít pro všechny hodnoty nezávislé proměnné mezi krajními hodnotami x0 < x1. Hovoříme o intervalu [x0, x1]. Takové polynomiální příblížení po kouskách už bude mít tu vlastnost, že derivace na sebe budou nava- zovat. V praxi ale není pouhé navazování první derivace dostatečné a navíc při naměřených datech nemíváme hodnoty derivací k dispozici. Přímo se proto vnucuje pokus využívat pouze zadané hodnoty ve dvou sousedních bodech, ale požadovat zároveň rovnost prvních i druhých derivací u sousedních kousků polynomů třetího stupně: Definice. Nechť x0 < x1 < < xn jsou reálné (nebo racionální) hodnoty, ve kterých jsou zadány požadované hodnoty y0, . . . , yn. Kubickým interpolačním splajnem pro toto zadání je funkce S : R R (nebot S : Q Q), která splňuje následující podmínky: * zúžení S na interval [xi-1, xi] je polynom Si třetího stupně, i = 1, . . . , n * Si(xi-1) = yi-1 a Si(xi) = yi pro všechny i = 1, . . . n, * Si(xi) = Si+1(xi) pro všechny i = 1, . . . , n - 1, * Si (xi) = Si+1(xi) pro všechny i = 1, . . . , n - 1. 1Ošklivé české slovo ,,splajn vzniklo fonetickým přepisem anglického ekvivalentu ,,spline , který znamenal tvárné pravítko užívané inženýry pro kreslení křivek. 2. SPOJITÉ FUNKCE 143 Kubický splajn pro n + 1 bodů sestává z n kubických polynomů, tj. máme k dispozici 4n volných parametrů (první definiční podmínka). Další podmínky přitom zadávají 2n + (n - 1) + (n - 1) rovností, tj. dva parametry zůstávají volné. Při praktickém použití se dodávají předpisy pro derivace v krajních bodech, tzv. úplný splajn, nebo jsou tyto zadány jako nula, tzv. přirozený splajn. Výpočet celého splajnu už není bohužel tak jednoduchý jako u nezávislých výpočtů Hermiteových polynomů třetího stupně, protože data se prolínají vždy mezi sousedními intervaly. Při vhodném uspořádání se však dosáhne matice systému, která má nenulové prvky prakticky jen ve třech diagonálách, a pro takové existují vhodné numerické postupy, které umožní splajn počítat také v čase úměrném počtu bodů. Podrobnosti vynecháme, lze je dohledat např. v [8]. Pro srovnání se podívejme na interpolaci stejných dat jako v případě Lagrangeova polynomu, nyní pomocí splajnů: 0 -4 0 -0,5 2 -1 1 -2 4 x 0,5 0 -4 -0,5 x 2 -1 1 0 0,5 4-2 2. Spojité funkce Viděli jsme právě, že je důležité mít dostatečně velkou zásobu funkcí, se kterými bude možné možné vyjadřovat všechny běžné závislosti, zároveň ale musí být výběr šikovně omezen, abychom uměli vybudovat nějaké univerzální nástroje pro práci s nimi. Polynomů je přitom zjevně příliš málo, i když jejich šikovné využití ve splajnech může ledacos vynahradit. Nejvýraznější vlastností polynomů je jejich ,,spojitá závislost hodnot na nezávislé proměnné. Intuitivně řečeno, když dostatečně málo změníme x, určitě se nám moc nezmění ani hodnota f(x). Takové chování naopak nemáme u po částech konstantních funkcí f : R R v okolí ,,skoků . Např. u tzv. Heavisideovy funkce f(x) = 0 pro všechny x < 0 1/2 pro x = 0 1 pro všechny x > 0 taková ,,nespojitost nastane pro x = 0. 144 5. ZŘÍZENÍ ZOO Začneme formalizací takovýchto intuitivních výroků. K tomu budeme potřebovat upřesnit vlastnosti našich skalárů a zasvést pojem limity. 5.7 5.8. Reálná a komplexní čísla. Prozatím jsme docela dobře vystačili s algebraickými vlastnostmi reálných čísel, které říkaly, že R je pole. Už jsme ale používali i relaci uspořádání reálných čísel, kterou značíme ,, (viz odstavec 1.45). Připoměňme si nyní vlastnosti (axiomy) reálných čísel včetně souvislostí uspořádání a ostatních relací. Dělící čáry naznačují, jak axiomy postupně zaručují, že jsou reálná čísla komutativní grupou vůči sčítání, že R \ {0} je komutativní grupa vůči násobení, R je pole, množina R spolu s operacemi +, a s relací uspořádání je tzv. uspořádané pole a konečně poslednímu axiomu můžeme rozumět tak, že R je ,,dostatečně husté , tj. nechybí nám tam body, jako např. druhá odmocnina ze dvou v číslech racionálních. Formálně poslední axiom vysvětlíme níže. (R1) (a + b) + c = a + (b + c), pro všechny a, b, c R (R2) a + b = b + a, pro všechny a, b R (R3) existuje prvek 0 R takový, že pro všechny a R platí a + 0 = a (R4) pro všechny a R existuje opačný prvek (-a) R takový, že platí a + (-a) = 0 (R5) a b) c = a (b c), pro všechny a, b, c R (R6) a b = b a pro všechny a, b R (R7) existuje prvek 1 R takový, že pro všechny a R platí 1 a = a (R8) pro každý a R, a = 0 existuje inverzní prvek a-1 R takový, že platí a a-1 = 1 (R9) a (b + c) = a b + a c, pro všechny a, b, c R (R10) relace je úplné uspořádání, tj. reflexivní, antisymetrická, tranzitivní a úplná relace na R (R11) pro všechny a, b, c R platí, že z a b vyplývá také a + c b + c (R12) pro všechny a, b R, a > 0, b > 0, platí také a b > 0 (R13) každá neprázdná ohraničená množina A R má supremum. Pojem suprema má smysl pro každou uspořádanou množinu. Uvažme podmnožinu A B v uspořádané množině B. Horní závorou množiny A je každý prvek b B, pro který platí, že b a pro všechny a A. Obdobně definujeme dolní závory množiny A jako prvky b A takové, že b a pro všechny a A. Nejmenší horní závora podmnožiny A, pokud existuje, se nazývá supremum této podmnožiny a značíme ji sup A. Přesněji: sup A = b, jestliže z c a pro všechny a A vyplývá také c b. Obdobně, největší dolní závora se nazývá infimum, píšeme inf A, tzn. inf A = b, jestliže z c a pro všechny a A vyplývá také c b. Pro formální výstavbu další teorie potřebujeme vědět, zda námi požadované vlastnosti reálných čísel lze realizovat, tj. zda existuje taková množina R s operacemi a relací uspořádání, které (R1)­(R13) splňují. Skutečně lze reálná čísla nejen zkonstruovat, ale také lze ukázat, že až na izomorfismus to jde jediným způsobem. Pro naši potřebu vystačíme s intuitivní představou reálné přímky, jednoznačnost nebudeme diskutovat vůbec a existenci jen naznačíme v dalším odstavci. Pole komplexních čísel splňuje axiomy (R1)­(R9), není na nich ale žádným rozumným způsobem definováno uspořádání, které by naplnilo axiomy (R10)­R(13). Nicméně s nimi budeme také občas pracovat a již dříve jsme viděli, že rozšíření 2. SPOJITÉ FUNKCE 145 skalárů na komplexní čísla je často pro výpočty mimořádně užitečné. Protože jsou komplexní čísla z = re z + i im z dána jako dvojice reálných čísel, je dobrou představou rovina komplexních čísel. Operací, která je u komplexních čísel navíc je tzv. konjugace. Je to zrcadlení podle přímky reálných čísel, tj. obrácení znaménka u imaginární složky. Značíme ji pruhem nad daným číslem, z = re z - i im z. Protože je pro z = x + iy z z = (x + iy)(x - iy) = x2 + y2 , zadává nám tento výraz právě kvadrát vzdálenosti komplexního čísla od nuly. Odmocnině z tohoto reálného nezáporného čísla říkáme absolutní hodnota komplexního čísla z, píšeme e5.3 (5.3) |z|2 = z z 5.8.1. Načrtněte následující podmnožiny v C (1) {z C| |z - 1| = |z + 1|} (2) {z C| 1 |z - i| 2} (3) {z C| Re(z2 ) = 1} (4) {z C| Re(1 z ) < 1 2 } Řešení. * imaginární osa * mezikruží okolo i * hyperbola a2 - b2 = 1. * vnějšek jednotkového kruhu se středem v 1. 5.8 5.9. Hromadné body a konvergence. Uvažujme na chvíli nějaké pole skalárů K, které splňuje axiomy (R1)­(R12). Takové určitě existuje, protože racionální čísla Q jsou příkladem. Zkonstruovali jsme je v odstavci 1.47 a čtenář si snadno může ověřit platnost všech požadovaných axiomů. Pro každý prvek a K definujeme jeho absolutní hodnotu |a| takto |a| = a je-li a 0 -a je-li a < 0. Samozřejmě platí pro každá dvě čísla a, b K e5.4 (5.4) |a + b| |a| + |b|. Této vlastnosti říkáme trojúhelníková nerovnost a splňuje ji také absolutní hodnota komplexních čísel definovaná výše. Uvažme nyní libovolnou posloupnost prvků a0, a1, . . . v našem uspořádaném poli K takovou, že pro libolné pevně zvolené kladné číslo > 0 platí pro všechny prvky ak až na konečně mnoho výjimek |ai - aj| < . Jinak řečeno, pro každé pevné > 0 existuje index N takový, že předcházející nerovnost platí pro všechna i, j > N. Takové posloupnosti prvků se říká Cauchyovská posloupnost. Intuitivně jistě cítíme, že buď jsou v takové posloupnosti všechny 146 5. ZŘÍZENÍ ZOO prvky stejné až na konečně mnoho z nich (pak bude od určitého indexu N počínaje vždy |ai - aj| = 0) nebo se taková posloupnost ,,hromadí k nějaké hodnotě. Pokud by taková hodnota a K existovala, očekávali bychom od ní patrně následující vlastnost: pro libovolné pevně zvolené číslo platí pro všechny i, až na konečně mnoho výjimek, |ai - a| < . Říkáme v takovém případě, že posloupnost ai, i = 1, 2, . . . konverguje k hodnotě a K. Uvažme nyní jakoukoliv množinu A K a předpokládejme, že naše posloupnost je vybraná z prvků A. Pokud konverguje k a K a navíc je nekonečně mnoho bodů ai A různých od a, hovoříme o hromadném bodu množiny A. Jestliže nějaká posloupnost ai K konverguje k a K, pak pro zvolené víme, že |ai - a| < pro vhodné N N a všechny i N. Pak pro i, j N dostaneme |ai - aj| < |ai - aN | + |aN - aj| < 2 . Vidíme tedy, že každá konvergující posloupnost je Cauchyovská. V poli racionálních čísel se může snadno stát, že pro takovéto posloupnosti příslušná hodnota a neexistuje. Např. číslo 2 můžeme libovolně přesně přiblížit racionálními čísly ai, ale samotná odmocnina racionální není. Uspořádaná pole skalárů, ve kterém všechny Caychyovské posloupnosti konvergují, se nazývají úplná. Následující tvrzení říká, že axiom (R13) takové chování zaručuje: Lemma. Každá Cauchyovská posloupnost reálných čísel ai konverguje k reálné hodnotě a R. Důkaz. Každá Cauchyovská posloupnost je zjevně ohraničená množina (dokažte si podrobně ­ pro libovolné ohraničíte všechny členy až na konečně mnoho z nich!). Definujme si množinu B = {x R, x < aj pro všechny prvky ai, až na konečně mnoho z nich}. Zřejmě má B horní závoru, tudíž podle axiomu (R13) má i supremum. Definujme a = sup B. Nyní pro nějaké > 0 zvolme N takové, aby |ai - aj| < pro všechny i, j N. Zejména pak aj > aN - , aj < aN + takže aN - patří do B, zatímco aN + už nikoliv. Souhrnně z toho dostáváme, že |a - aN | , a proto také |a - aj| |a - aN | + |aN - aj| 2 pro všechny j > N. To ale značí právě, že a je hromadný bod posloupnosti. Při jedné z možností, jak vybudovat reálná čísla, postupujeme podobně jako při zúplňování přirozených čísel na celá (abychom přidali opačné hodnoty) a celých na racionální (abychom přidali podíly nenulových čísel). Skutečně, vhodným formálním způsobem přidáme všechny chybějící hromadné body pro podmnožiny racionálních čísel (např. vhodným způsobem zavedeme ekvivalenci na množině všech Cauchyovských posloupností racionálních čísel). Pak se lze již snadno přesvědčit, že všechny požadované axiomy skutečně dojdou naplnění. Další teorické nuance tady není vhodné rozebírat. Zájemce může ale nahlédnout např. do [4] pro další informace i odkazy. 2. SPOJITÉ FUNKCE 147 5.9 5.10. Otevřené a uzavřené množiny. Uzavřená podmnožina v R je taková, která obsahuje i všechny své hromadné body. Typickou uzavřenou množinou je tzv. uzavřený interval [a, b] = {x R, a x b}. Zde a je reálné číslo nebo hraniční hodnota chybí a píšeme a = - (mínus nekonečno) a podobně b > a je reálné číslo nebo +. Uzavřenou množinu bude tvořit i posloupnost reálných čísel bez hromadného bodu nebo posloupnost s konečným počtem hromadných bodů spolu s těmito body. Zjevně je konečné sjednocení uzavřených množin opět uzavřená množina. Otevřená množina v R je taková množina, jejíž doplněk je uzavřenou množinou. Typickou otevřenou množinou je otevřený interval (a, b) = {x R, a < x < b}, kde pro hraniční hodnoty máme stejné možnosti jako výše. Okolím bodu a R nazýváme libovolný otevřený interval O, který a obsahuje. Je-li okolí definované jako interval O(a) = (a - , a + ) pro kladné číslo , hovoříme o -okolí bodu a. Všimněme si, že pro libovolnou množinu A je a R hromadným bodem A, právě když v libovolném okolí a leží také alespoň jeden bod b A, b = a. Lemma. Množina reálných čísel A je otevřená, právě když každý její bod a A do ní patří i s nějakým svým okolím. Důkaz. Nechť je A otevřená a a A. Kdyby neexistovalo žádné okolí bodu a uvnitř A, musela by existovat posloupnost an / A, |a - an| 1/n. Pak je ovšem a A hromadným bodem množiny R \ A, což není možné, protože doplněk A je uzavřený. Naopak předpokládejme, že každé a A leží v A i s nějakým svým okolím. To přirozeně zabraňuje, aby nějaký hromadný bod b pro množinu R \ A ležel v A. Je proto R \ A uzavřená a tedy je A otevřená. Zjevně je libovolné sjednocení otevřených množin opět otevřenou množinou a každý konečný průnik otevřených množin je opět otevřená množina. Množina A reálných čísel se nazývá ohraničená, jestliže celá leží v nějakém konečném intervalu [a, b], a, b R. V opačném případě je neohraničená. Ohraničená a uzavřená množina se nazývá kompaktní. 5.10 5.11. Několik topologických vlastností. Přidejme ještě několik pojmů, které nám umožní účinné vyjadřování. Vnitřním bodem množiny A reálných čísel nazveme takový bod, který do A patří i s nějakým svým okolím. Hraniční bod a A je naopak takový, jehož každé okolí má neprázdný průnik jak s A tak s doplňkem R\A. Otevřené pokrytí množiny A je takový systém otevřených intervalů Ui, i I, že jejich sjednocení obsahuje celé A. Izolovaným bodem množiny A rozumíme bod a A, který má okolí, jehož průnik s A je právě jednobodová množina {a}. Věta. Pro podmnožiny A reálných čísel platí: (1) A je otevřená, právě když je sjednocením nejvýše spočetného systému otevřených intervalů, 148 5. ZŘÍZENÍ ZOO (2) každý bod a A je buď vnitřní nebo hraniční, (3) každý hraniční bod je buď izolovaným nebo hromadným bodem A, (4) A je kompaktní, právě když každá v ní obsažená nekonečná posloupnost má podposloupnost konvergující k bodu v A, (5) A je kompaktní, právě když každé její otevřené pokrytí obsahuje konečné pokrytí. Důkaz. (1) Zjevně je každá otevřená množina sjednocením nějakých okolí svých bodů, tj. otevřených intervalů. Jde tedy pouze o to, jestli nám jich vždy stačí spočetně mnoho. Zkusme tedy najít ,,co největší intervaly. Řekneme, že body a, b A jsou v relaci, jestliže celý otevřený interval (a, b) je v A. To je zjevně relace ekvivalence a její třídy budou zjevně intervaly, které budou navíc po dvou disjunktní. Každý z těchto intervalů jistě musí obsahovat nějaké racionální číslo a tyto musí být různé. Všech racionálních čísel je ale spočetně mnoho, proto máme tvrzení dokázané. (2) Přímo z definic vyplývá, že bod nemůže být vnitřní a hraniční zároveň. Nechť tedy a A není vnitřní. Pak ovšem existuje posloupnost bodů ai / A s hromadným bodem a. Zároveň a patří do každého svého okolí. Proto je a hraniční. (3) Předpokládejme, že a A je hraniční a není izolovaný. Pak stejně jako v poslední argumentaci existují body ai, tentokrát uvnitř A, jejichž hromadným bodem je a. (4) Předpokládejme, že je A kompaktní, tj. uzavřená a ohraničená, a uvažme nějakou nekonečnou posloupnost bodů ai A. Tato podmnožina má jistě supremum b i infimum a (nebo můžeme zvolit libovolnou horní a dolní závoru množiny A). Rozdělme nyní interval [a, b] přesně na dvě poloviny [a, 1 2 (b - a)] a [1 2 (b - a), b]. V alespoň jedné z nich musí být nekonečně mnoho prvků ai. Vyberme takovou polovinu, jeden z prvků v ní obsažených a následně tento interval opět rozdělme uvažovaný interval na poloviny. Znovu vybereme tu polovinu, kde je nekonečně mnoho prvků posloupnosti a vybereme si jeden z nich. Tímto způsobem dostaneme posloupnost, která bude Cauchyovská (dokažte si detailně ­ vyžaduje si jen pozorné hraní s odhady, podobně jako výše). O Cauchyovských posloupnostech ovšem už víme, že mají vždy hromadné body nebo jsou konstantní až na konečně mnoho výjimek. Existuje tedy podposloupnost s námi hledanou limitou. Z uzavřenosti A zase vyplývá, že námi nalezený bod musí opět ležet v A. Opačně, jestliže každá v A obsažená nekonečná podmnožina má hromadný bod v A, znamená to, že všechny hromadné body jsou v A a tedy je A uzavřená. Pokud by nebyla množina A zároveň ohraničená, uměli bychom najít posloupnost stále rostoucí nebo klesající s rozdíly dvou po sobě jdoucích čísel třeba alespoň 1. Taková posloupnost bodů z A ale nemůže mít hromadný bod vůbec. (5) Nejprve se věnujme snadnější implikaci, tj. předpokládejme, že z každého otevřeného pokrytí lze vybrat konečné. Jistě lze A pokrýt spočetným systémem intervalů In = (n - 2, n + 2), n Z, a jakýkoliv výběr konečně mnoha z nich říká, že je množina A ohraničená. Předpokládejme nyní, že a R\A je hromadným bodem posloupnosti ai A a předpokládejme rovnou, že |a - an| < 1 n . Množiny Jn = R \ [a - 1 n , a + 1 n ] pro všechny n N, n > 0, jsou sjednocení dvou otevřených intervalů a jistě také pokrývají naši množinu A. Protože je možné vybrat konečné pokrytí A, bod a je uvnitř doplňku R\A včetně nějakého svého okolí a není tedy hromadným bodem. Proto musí být všechny hromadné body A opět v A a tato množina je i uzavřená. Opačný směr je opět založený na existenci a vlastnostech suprem. Předpokládejme, že je A kompaktní a že je dáno nějaké její otevřené pokrytí C. Z předchozího je zjevné, že v A existují největší a nejmenší prvek, které jsou zároveň rovny b = sup A a a = inf A. Označme si teď ,,nejzašší mez , pro kterou ještě půjde konečné pokrytí vybrat: B = {x [a, b], a existuje výběr konečného pokrytí [a, x] A z C}. 2. SPOJITÉ FUNKCE 149 Evidentně a B, jde tedy o neprázdnou zhora ohraničenou množinu a existuje proto c = sup B. Jde nám o to dokázat, že ve skutečnosti musí být c = b. Argumentace je trochu nepřehledná, dokud si ji nenačrtneme na obrázku, podstata je ale snadná: Víme, že a < c b, předpokládejme tedy chvíli, že c < b. Protože je R \ A otevřená, pro c / A existuje okolí bodu c obsažené v [a, b] a zároveň disjunktní s A. To by ale vylučovalo možnost c = sup B. Zbývá tedy v takovém případě c A a tedy je i nějaké okolí O bodu c v otevřeném pokrytí C. Zvolme si body p < c < q v O. Opět nyní bude existovat konečné pokrytí pro [a, q] A. To ale značí, že q > c leží v B, což není možné. Původní volba c < b tedy vedla ke sporu, což dokazuje požadovanou rovnost b = c. Nyní ale s pomocí okolí b, které patří do C umíme najít konečné pokrytí v C pro celé A. 5.11.1. Určete hromadné, izolované, hraniční a vnitřní body následujících podmnožin v R: (1) N (2) Q (3) {x R| 0 x < 1}. Svá tvrzení zdůvodněte. Řešení. (1) , N, N, (2) R, , Q, (3) 0, 1 , , 0, (0, 1) 5.11 5.12. Limity funkcí a posloupností. Pro diskusi limit je vhodné rozšířit množinu reálných čísel R o dvě nekonečné hodnoty . Pro tyto účely si zavádíme i pravidla pro počítání s těmito formálně přidanými hodnotami pro libovolná ,,konečná čísla a R: a + = a - = a = , je-li a > 0 a = -, je-li a < 0 Okolím nekonečna rozumíme interval (a, ), resp. (-, a) je okolí -. Pojem hromadného bodu množin rozšiřujeme tak, že je hromadným bodem množiny A R jestliže každé okolí s ní má neprázdný průnik, tj. jestliže je A zprava neohraničená. Obdobně pro -. Protože je užitečné od začátku sledovat i možné komplexní hodnoty funkcí, rozšíříme také pojem okolí do komplexní roviny. Pro kladné reálné číslo rozumíme -okolím komplexního čísla z C množinu O(z) = {w C, |w - z| < }. Definice. Nechť A R je libovolná podmnožina a f : A R je reálná funkce (nebo f : A C je komplexní funkce) definovaná na A a nechť x0 je hromadný bod množiny A. Říkáme, že f má v x0 limitu a R (nebo a C) a píšeme lim xx0 f(x) = a, 150 5. ZŘÍZENÍ ZOO jestliže pro každé okolí bodu O(a) bodu a lze najít okolí O(x0) bodu x0 takové, že pro všechny x A (O(x0) \ {x0}) je f(x) O(a). Limita reálné funkce se nazývá nevlastní, jestliže je a = , V opačném případě se nazává vlastní. Je důležité si všimnout, že hodnota f v bodě x0 v definici nevystupuje a f v tomto hromadném bodě vůbec nemusí být definována! Také je zřejmé, že nevlastní limity komplexních funkcí nejsou definovány. 5.12 5.13. Příklady. (1) Jestliže je A = N, tj. funkce f je definována pouze pro přirozená čísla, hovoříme o limitách posloupností reálných nebo komplexních hodnot. Jediným hromadným bodem A je pak a píšeme pro f(n) = an lim n an = a. Podle definice to pak znamená, že pro každé okolí O(a) limitní hodnoty a existuje index N N takový, že an O(a) pro všechny n N. Ve skutečnosti jsme tedy v tomto speciálním případě přeformulovali definici konvergence posloupnosti (viz 5.9). Říkáme také, že posloupnost an konverguje k a. Přímo z naší definice pro komplexní hodnoty je také vidět, že komplexní posloupnost má limitu a, právě když reálné části ai konvergují k re a a zároveň imaginární části konvergují k im a. (2) Jestliže je f definována na intervalu A = [a, b] a x0 je vnitřním bodem intervalu, hovoříme o limitě funkce ve vnitřním bodě jejího definičního oboru. Podívejme se, proč je důležité v definici požadovat f(x) O(a) pouze pro body x = x0 i v tomto případě. Vezměme jako příklad funkci f : R R f(x) = 0 je-li x = 0 1 je-li x = 0. Pak zjevně limita v nule je dobře definována a limx0 = 0, přestože f(0) = 1 do malých okolí limitní hodnoty 0 nepatří. (3) Je-li A = [a, b] ohraničený interval a x0 = a nebo x0 = b, hovoříme o limitě v hraničním bodě definičního oboru funkce f. Jestliže je ale bod x0 vnitřním bodem, můžeme pro účely výpočtu limity definiční obor zúžit na [x0, b] nebo [a, x0]. Výsledným limitám pak říkáme limita zprava, resp. limita zleva pro funkci f v bodě x0. Označujeme ji výrazem limxx+ 0 f(x), resp. limxx- 0 f(x). Jako příklad nám může sloužit limita zprava a zleva v x0 = 0 pro Heavisideovu funkci h z úvodu této části. Evidentně je lim x0+ h(x) = 1, lim x0h(x) = 0. Limita limx0 f(x) přitom neexistuje. Je snadné dokázat, že limita ve vnitřním bodu definičního oboru libovolné reálné funkce f existuje, právě když existují limity zprava i zleva a jsou si rovny. (4) Limita komplexní funkce f : A C existuje tehdy a jen tehdy, jestliže existují limity její reálné a imaginární části. V takovém případě je pak lim xx0 f(x) = lim xx0 (re f(x)) + i lim xx0 (im f(x)). (5) Nechť f je reálný nebo komplexní polynom. Pak pro každý bod x R je lim xx0 f(x) = f(x0). 2. SPOJITÉ FUNKCE 151 Skutečně, je-li f(x) = anxn + +a0, pak roznásobením (x0 +)k = xk 0 +kxk-1 0 + + k a dosazením pro k = 0, . . . , n vidíme, že volbou dostatečně malého se hodnotou libovolně blízko přiblížíme f(x0). (6) Uvažme nyní obzvlášť ošklivou funkci definovanou na celém R f(x) = 1 je-li x Q 0 jestliže x / Q. Jistě snadno ověříte, že tato funkce nemá limitu v žádném bodě (dokonce ani zleva nebo zprava). (7) Ale definice spojitosti je ještě záludnější, než jsme viděli v předchozím případě. Definujme následující funkci f : R R: f(x) = 1 q jestliže x = p q Q, p a q nesoudělná 0 jestliže x / Q Tato funkce je spojitá ve všech iracionálních bodech a nespojitá ve všech racionálních realných bodech. Důkaz přenecháváme jako cvičení. 5.14. Věta. Věta o třech limitách. Buď f, g, h reálné funkce takové, že existuje okolí bodu x0 R, kde platí f(x) g(x) h(x). Pak pokud existují limity lim xx0 f(x) = f0 a lim xx0 h(x) = h0 a navíc f0 = h0, pak také existuje limita lim xx0 g(x) = g0 a platí g0 = f0 = h0. Důkaz. Z definice limity, pro libovolné > 0 existuje okolí U bodu x0, ve kterém je f(x), h(x) (g0 - , g0 + ). z podmínky f(x) g(x) h(x) vyplývá, že i g(x) (g0 - , g0 + ), tedy lim xx0 g(x) = g0. 5.13 5.15. Věta. Nechť A R je definiční obor reálných nebo komplexních funkcí f a g, x0 nechť je hromadný bod A a existují limity lim xx0 f(x) = a R, lim xx0 g(x) = b R. Potom: (1) limita a je určena jednoznačně, (2) limita součtu f + g existuje a platí lim xx0 (f(x) + g(x)) = a + b, (3) limita součinu f g existuje a platí lim xx0 (f(x) g(x)) = a b, (4) pokud navíc b = 0, pak limita podílu f/g existuje a platí lim xx0 f(x) g(x) = a b . Důkaz. (1) Předpokládejme, že a a a jsou dvě hodnoty limity limxx0 f(x). Pokud je a = a , pak existují disjunktní okolí O(a) a O(a ). Pro dostatečně malá okolí x0 ale mají hodnoty f ležet v obou naráz, což je spor. Proto je a = a . (2) Zvolme si nějaké okolí a + b, třeba O2 (a + b). Pro dostatečně malé okolí x0 a x = x0 bude jak f(x), tak g(x) v ­okolích bodů a a b. Proto jejich součet bude v 2 ­okolí kýžené hodnoty a + b. Tím je důkaz ukončen. 152 5. ZŘÍZENÍ ZOO (3) Obdobně postupujeme u součinu s O 2 (ab). Pro malá okolí x0 se nám hodnoty f i g trefí do ­okolí hodnot a a b. Proto jejich součin bude v požadovaném 2 ­okolí. (4) Podobný postup ponechán jako cvičení. Poznámka. Podrobnějším sledováním důkazů jednotlivých bodů věty můžeme její tvrzení rozšířit i na některé nekonečné hodnoty limit: V prvém případě je zapotřebí, aby buď alespoň jedna z limit byla konečná nebo aby obě měly stejné znaménko. Pak opět platí že limita součtu je součet limit s konvencemi z 5.12. Případ ,,ale není zahrnut. V druhém případě může být jedna z limit nekonečná a druhá nenulová. Pak opět platí, že limita součinu je součin limit. Případ ,,0 () není ale zahrnut. V případě podílu může být a R a b = , kdy výsledek limity bude nula, nebo a = a b R, kde výsledek bude podle znamének čitatele a jmenovatele. Případ ,, není zahrnut. Zdůrazněme, že naše věta jako speciální případ pokrývá také odpovídající tvrzení o konvergenci posloupností. 5.15.1. Spočítejte následující limity posloupností: (1) lim n 2n2 +3n+1 n+1 , (2) lim n 2n2 +3n+1 3n2+n+1 , (3) lim n n+1 2n2+3n+1 , (4) lim n 4n2+n n , (5) lim n 4n2 + n - 2n. Řešení. (1) lim n 2n2 +3n+1 n+1 = lim n 2n+3+ 1 n 1+ 1 n = . (2) lim n 2n2 +3n+1 3n2+n+1 = lim n 2+ 3 n + 1 n2 3+ 1 n + 1 n2 = 2 3 . (3) lim n n+1 2n2+3n+1 = lim n 1+ 1 n 2n+3+ 1 n = 1 = 0. (4) Podle věty o třech limitách: n N : 4n2 n < 4n2+n n < 4n2+n+ 1 16 n . Dále pak lim n 4n2 n = lim n 2n n = 2, lim n 4n2 + n + 1 16 n = lim n 2n + 1 4 n = 2. Tedy i lim n 4n2 + n n = 2 . 2. SPOJITÉ FUNKCE 153 (5) lim n 4n2 + n - 2n = lim n ( 4n2 + n - 2n)( 4n2 + n + 2n) 4n2 + n + 2n = lim n n 4n2 + n + 2n = = lim n 1 4n2+n n + 2 = 1 4 5.14 5.16. Spojité funkce. Nechť f je reálná nebo komplexní funkce definovaná na intervalu A R. Říkáme, že f je spojitá v bodě x0 A, jestliže je lim xx0 f(x) = f(x0). Funkce f je spojitá na A, jestliže je spojitá ve ve všech bodech x0 A. Všiměme si, že pro hraniční body intervalu A říká naše definice, že f v nich má být spojitá zprava, resp. zleva. Již jsme také viděli, že každý polynom je spojitou funkcí na celém R, viz 5.13(5). Z předchozí věty okamžitě vyplývá většina následujících tvrzení Věta. Nechť f a g jsou spojité funkce na intervalu A. Pak (1) součet f + g je spojitá funkce (2) součin f g je spojitá funkce (3) pokud navíc g(x0) = 0, pak podíl f/g je dobře definován v nějakém okolí x0 a je spojitý v x0. (4) pokud spojitá funkce h je definována na okolí hodnoty f(x0), pak složená funkce h f je definována na okolí bodu x0 a je v x0 spojitá. Důkaz. Tvrzení (1) a (2) jsou zřejmá, doplnit důkaz potřebujeme u tvrzení (3). Jestliže je g(x0) = 0, pak také celé ­okolí čísla g(x0) neobsahuje nulu pro dostatečně malé > 0. Ze spojitosti g pak vyplývá, že na dostatečně malém ­okolí x0 bude g neulové a podíl f/g tam bude tedy dobře definován. Pak bude ovšem i spojitý v x0 podle předchozí věty. (4) Zvolme nějaké okolí O hodnoty h(f(x0)). Ze spojitosti h k němu existuje okolí O bodu f(x0), které je celé zobrazeno funkcí h do O. Do tohoto okolí O spojité zobrazení f zobrazí dostatečně malé okolí bodu x0. To je ale právě definiční vlastnost spojitosti a důkaz je ukončen. Nyní si vcelku snadno můžeme odvodit zásadní souvislosti spojitých zobrazení a topologie reálných čísel: 5.15 5.17. Věta. Nechť f : R R je spojitá funkce. Pak (1) vzor f-1 (U) každé otevřené množiny je otevřená množina, (2) vzor f-1 (W) každé uzavřené množiny je uzavřená množina, (3) obraz f(K) každé kompaktní množiny je kompaktní množina, (4) na libovolné kompaktní množině K dosahuje spojité zobrazení maxima a mi- nima. 154 5. ZŘÍZENÍ ZOO Důkaz. (1) Uvažme nějaký bod x0 f-1 (U). Nějaké okolí O hodnoty f(x0) je celé v U, protože je U otevřená. Pak ovšem existuje okolí O bodu x0, které se celé zobrazí do O, patří tedy do vzoru. Každý bod vzoru je tedy vnitřní a tím je důkaz ukončený. (2) Uvažme nějaký hromadný bod x0 vzoru f-1 (W) a nějakou posloupnost xi, f(xi) W, která k němu konverguje. Ze spojitosti f nyní zjevně vyplývá, že f(xi) konverguje k f(x0), a protože je W uzavřená, musí i f(x0) W. Zřejmě jsou tedy všechny hromadné body vzoru W ve W také obsaženy. (3) Zvolme libovolné otevřené pokrytí f(K). Vzory jednotlivých intervalů budou sjednoceními otevřených intervalů a tedy také vytvoří pokrytí množiny K. Z něho lze vybrat konečné pokrytí a proto nám stačilo konečně mnoho odpovídajících obrazů k pokrytí původní množiny f(K). (4) Protože je obrazem kompaktní množiny opět kompaktní množina, musí být obraz ohraničený a zároveň musí obsahovat svoje supremum i infimum. Odtud ale vyplývá, že tyto musí být zároveň maximem a minimem hodnot. 5.16 5.18. Důsledek. Nechť f : R R je spojitá. Potom (1) obraz každého intervalu je opět interval (2) f na uzavřeném intervalu [a, b] nabývá všech hodnot mezi svou maximální a minimální hodnotou. Důkaz. (1) Uvažme nějaký interval A (a ponechme stranou, jestli je A uzavřený nebo otevřený, ať už zleva nebo zprava) a předpokládejme, že existuje bod y R takový, že f(A) obsahuje body menší i větší než y, ale y / f(A). Znamená to tedy, že pro otevřené množiny B1 = (-, y) a B2 = (y, ) jejich vzory A1 = f-1 (B1) a A2 = f-1 (B2) pokrývají A. Tyto množiny jsou přitom opět otevřené, jsou disjunktní a obě mají neprázdný průnik s A. Nutně tedy musí existovat bod x A, který neleží v B1, je ale jejím hromadným bodem. Musí však ležet v B2 a to u disjunktních otevřených množin není možné. Dokázali jsme tedy, že pokud nějaký bod y nepatří do obrazu intervalu, musí být všechny hodnoty buď zároveň větší nebo zároveň menší. Odtud vyplývá, že obrazem bude opět interval. Všimněme si, že jeho krajní body mohou a nemusí do obrazu patřit. (2) Toto tvrzení je přímým důsledkem předchozího. 5.17 5.19. Přírůstky do ZOO. Zatím jsme v podstatě pracovali pouze s polynomy a s funkcemi, které se z nich dají vyrobit ,,po částech . Zároveň jsme dovodili spoustu vlastností pro obrovskou třídu spojitých funkcí, nemáme ale zatím moc prakticky zvladatelných příkladů. Naše úvahy nám teď umožňují alespoň trochu rozšířit naši zásobárnu funkcí. (1) Nechť f a g jsou dva polynomy, které mohou mít i komplexní hodnoty (tj. připouštíme výrazy anxn + +a0 s komplexními ai C, ale dosazujeme jen reálné hodnoty za x). Pak funkce h : R \ {x R, g(x) = 0} C h(x) = f(x) g(x) je dobře definována ve všech reálných bodech kromě kořenů polynomu g. Takové funkce nazýváme racionální funkce. Z věty 5.16 vyplývá, že racionální funkce jsou 2. SPOJITÉ FUNKCE 155 spojité ve všech bodech svého definičního oboru. V bodech, kde definovány nejsou mohou mít * konečnou limitu, když jde o společný kořen polynomů f i g (a v tomto případě rozšířením jejich definice o limitní hodnotu v tomto bodě dostaneme funkci i v tomto bodě spojitou) * nekonečnou limitu, když limity zprava a zleva v tomto bodě jsou stejné * různé nekonečné limity zprava a zleva. Názorně je možné tuto situaci vidět na obrázku, který ukazuje hodnoty funkce h(x) = (x - 0.05a)(x - 2 - 0.2a)(x - 5) x(x - 2)(x - 4) pro hodnoty a = 0 (obrázek vlevo tedy vlastně zobrazuje racionální funkci (x 5)/(x - 4)) a pro a = 5/3. y x 6 5 4 2 4 0 -2 3 -4 -6 210-1 a=0. y x 6 5 4 2 4 0 -2 3 -4 -6 210-1 a=1.6667 (2) Polynomy jsou pomocí sčítání a násobení skaláry seskládány z jednoduchých mocninných funkcí x xn s přirozených číslem n = 0, 1, 2, . . . . Samozřejmý smysl má také funkce x x-1 pro všechny x = 0. Tuto definici teď rozšíříme na obecnou mocninnou funkci s n R. Pro n = -a s a N definujeme x-a = (xa )-1 = (x-1 )a . Dále jistě chceme, aby ze vztahu bn = x pro n N vyplývalo b = x 1 n . Je třeba ale ověřit, že taková b skutečně existují. Předpokládejme x > 0 a označme B množinu B = {y R, y > 0, yn b}. To je zřejmě zhora ohraničená množina a lze ověřit, že pro b = sup M skutečně platí požadovaná rovnost. Zdůvodnili jsme tedy existenci xa pro všechny x > 0 a a Q. Konečně, pro a R, x > 1 klademe xa = sup{xy , y Q, y a}. Pro 0 < x < 1 buď definujeme analogicky (je třeba si jen pohrát s nerovnítky) nebo klademe přímo xa = (1 x )-a . Pro x = 1 je pak 1a = 1 pro libovolné a. Obecnou mocninnou funkci x xa máme tedy dobře definovanou pro všechny x [0, ) a a R. Naši konstrukci ale můžeme také číst následujícím způsobem: 156 5. ZŘÍZENÍ ZOO Pro každé pevné reálné c > 0 existuje dobře definovaná funkce na celém R, y cy . Této funkci říkáme exponenciální funkce o základu c. Na obrázcích vidíme funkce x ax a x xb pro jednu konkrétní hodnotu a = 2.5167 a b = 4.5833. 20 0 0 -2-4 y b 100 4 80 60 2 40 a=2.5167 a 32,5 y 2 100 80 1,5 60 40 1 20 0 0,5 b=4.5833 Z našich definic je vcelku zřejmé, že mocninné i exponenciální funkce jsou spojité na celých svých definičních oborech. Zároveň se ze spojitosti definice pomocí suprem množin hodnot zjevně přenáší základní vlastnosti platné pro racionální čísla, a, x, y: e5.3a (5.5) ax ay = ax+y , (ax )y = axy . 5.20. Příklady. 5.20.1. Buď c R+ (kladné reálné číslo). Ukážeme, že lim n n c = 1. Řešení. Uvažme nejprve c > 1. Vzhledem k tomu, že funkce n c je vzhledem k n klesající a její hodnoty jsou stále větší než 1, tak musí mít posloupnost n c limitu a tou je infimum jejich členů. Předpokládejme, že by tato limita byla větší než 1, řekněme 1 + , kde > 0. Pak by podle definice limity byly všechny hodnoty dané posloupnosti od jistého m menší než 1 + + 2 4 , t.j. zejména m c < 1 + + eps2 4 . Potom by však 2m c = m c < 1 + + 2 4 = 1 + 2 < 1 + , což je spor s tím, že 1 + je infimem dané posloupnosti. 5.20.2. Určete limitu lim x0 1 - cos x x2 sin(x2) Řešení. . 3. DERIVACE 157 3. Derivace U polynomů jsme již v odstavci 5.5 diskutovali, jak popisovat jednoduše velikost růstu hodnot polynomu kolem daného bodu jeho definičního oboru. Tehdy jsme pozorovali podíl (5.2), který vyjadřoval směrnici sečny mezi body [x, f(x)] R2 a [x + x, f(x + x)] R2 pro (malý) přírůstek x nezávisle proměnné. Tehdejší úvaha funguje zrovna stejně pro libovolnou reálnou nebo komplexní funkci f, jen musíme místo intuitivního ,,zmenšování přírůstku x pracovat s pojmem limity. 5.18 5.21. Definice. Nechť f je reálná nebo komplexní funkce s definičním oborem A R a x0 A. Jestliže existuje limita lim xx0 f(x) - f(x0) x - x0 = a pak řídáme, že f má v bodě x0 derivaci a. Píšeme často a = f (x0) nebo a = df dx (x0) případně a = d dx f(x0). Derivace funkce je vlastní, resp. nevlastní, když je takovou příslušná limita. Jednostranné derivace (tj. derivaci zprava a zleva) definujeme zcela stejně pomocí limity zprava a zleva. Z formulace definice lze očekávat, že f (x0) bude opět umožňovat dobře aproximovat danou funkci pomocí přímky y = f(x0) + f (x0)(x - x0). Takto lze snad vnímat následující lemma, které říká, že nahrazením konstantního koeficientu f (x0) spojitou funkcí dostaneme přímo hodnoty f. Lemma. Reálná nebo komplexní funkce má v bodě x0 vlastní derivaci, právě když existuje na nějakém okolí O(x0) funkce spojitá v x0 a taková, že pro všechny x O(x0) platí f(x) = f(x0) + (x)(x - x0). Navíc pak vždy (x0) = f (x0). Důkaz. Nejprve předpokládejme, že f (x0) je vlastní derivace. Pokud má existovat, má jistě tvar (x) = (f(x) - f(x0))/(x - x0) pro všechny x O \ {x0}. V bodě x0 naopak definujme hodnotu derivací. Pak jistě lim xx0 (x) = f (x0) = (x0) jak je požadováno. Naopak, jestliže taková funkce existuje, tentýž postup vypočte její limitu v x0. Proto existuje i f (x0) a je (x0) rovna. 5.18a 5.22. Geometrický význam derivace. Předchozí lemma lze názorně vysvětlit geometricky a tím popsat smysl derivace. Říká totiž, že na grafu funkce y = f(x), tj. na příslušné křivce v rovině se souřadnicemi x a y, poznáme, zda existuje derivace podle toho, jestli se spojitě mění hodnota směrnice sečny procházející body [x0, f(x0)] a [x, f(x)]. Pokud ano, pak limitní hodnota této směrnice je hodnotou derivace. 158 5. ZŘÍZENÍ ZOO Důsledek. Má-li reálná funkce f v bodě x0 R derivaci f (x0) > 0, pak pro nějaké okolí O(x0) platí f(b) > f(a) pro všechny body a, b O(x0), b > a. Je-li derivace f (x0) < 0, pak naopak pro nějaké okolí O(x0) platí f(b) < f(a) pro všechny body a, b O(x0), b > a. Důkaz. Uvažme prvý případ. Pak podle předchozího lematu platí f(x) = f(x0) + (x)(x - x0) a (x0) > 0. Protože je ale v x0 spojitá, musí existovat okolí O(x0), na kterém bude (x) > 0. Pak ale s rostoucím x nutně poroste i hodnota f(x). Stejná argumentace ověří i tvrzení se zápornou derivací. Funkce, které mají vlastnost f(b) > f(a) kdykoliv b > a pro nějaké okolí bodu x0 se nazývají rostoucí v bodě x0. Funkce rostoucí ve všech bodech nějakého intervalu se nazývá rostoucí na intervalu. Podobně je funkce klesající v bodu, resp. klesající na intervalu, jestliže f(b) < f(a) kdykoliv je a < b. Náš důsledek tedy říká, že funkce která má v bodě nenulovou konečnou derivaci je v tomto bodě buď rostoucí nebo klesající podle znaménka této derivace. 5.19 5.23. Pravidla pro počítání. Uveďme si nyní několik základních tvrzení o výpočtech derivací. Říkají nám, jak dobře se snáší operace derivování s algebraickou strukturou sčítání a násobení na reálných nebo komplexních funkcích. Poslední z pravidel pak umožňuje efektivní výpočet derivace složených funkcí a říkává se mu ,,chain rule . Intuitivně jim můžeme všem velice snadno rozumět, když si derivaci funkce y = f(x) představíme jako podíl přírůstků závislé proměnné y a nezávislé proměnné x: f = y x . Samozřejmě pak při y = h(x) = f(x) + g(x) je přírůstek y dán součtem přírůstků f a g a přírůstek závislé proměnné zůstává stejný. Je tedy derivace součtu součtem derivací. U součinu musíme být malinko pozornější. Pro y = h(x) = f(x)g(x) je přírůstek y = f(x + x)g(x + x) - f(x)g(x) = f(x + x)(g(x + x) - g(x)) + (f(x + x) - f(x))g(x) Nyní ale když budeme zmenšovat přírůstek x, jde vlastně o výpočet limity součtu součinů a o tom už víme, že jej lze počítat jako součet součinů limit. Proto z naší formulky lze očkávat pro derivaci součinu fg výraz fg + f g. Ještě zajímavější je to pro derivaci složené funkce g = h f, kde definiční obor funkce z = h(y) obsahuje obor hodnot funkce y = f(x). Opět vypsáním přírůstků dostáváme g = z x = z y y x . Můžeme tedy očekávat, že pravidlo pro výpočet bude (h f) (x) = h (f(x))f (x). Podáme nyní korektní formulace a důkaz: Věta. Nechť f a g jsou reálné nebo komplexní funkce definované na okolí bodu x0 R a mající v tomto bodě vlastní derivaci. Potom (1) funkce f je v bodě x0 spojitá, (2) pro každé reálné nebo komplexní číslo c má funkce x c f(x) derivaci v x0 a platí (cf) (x0) = c(f (x0)), 3. DERIVACE 159 (3) funkce f + g má v x0 derivaci a platí (f + g) (x0) = f (x0) + g (x0), (4) funkce f g má v x0 derivaci a platí (f g) (x0) = f (x0)g(x0) + f(x0)g (x0). (5) Je-li dále h funkce definovaná na okolí obrazu y0 = f(x0), která má derivaci v bodě y0, má také složená funkce h f derivaci v bodě x0 a platí (h f) (x0) = h (f(x0)) f (x0) Důkaz. (1) Předpokládejme, že f (x0) existuje a je vlastní (tj. není nekonečná). Pak můžeme vyjádřit pro každé x = x0 f(x) = f(x) - f(x0) x - x0 (x - x0) + f(x0). Protože je ale limita součtu a součinu funkcí dána jako součet a součin limit (viz Věta 5.15), dostáváme lim xx0 f(x) = f (x0) 0 + lim xx0 f(x0) = f(x0), což ověřuje spojitost f v x0. (2) a (3) Opět přímé použití věty o součtech a součinech limit funkcí dává výsledek. (4) Přepíšeme vztah pro podíl přírůstků, který jsme zmínili před formulací věty, takto (f g)(x) - (f g)(x0) x - x0 = f(x) g(x) - g(x0) x - x0 + f(x) - f(x0) x - x0 g(x0). Limita tohoto výrazu pro x x0 dá právě požadovaný výsledek, protože je funkce f spojitá v x0. (5) Podle předchozího lematu existují funkce a spojité v bodech x0 a y0 = f(x0) takové, že h(y) = h(y0) + (y)(y - y0), f(x) = f(x0) + (x)(x - x0) na nějakých okolích x0 a y0. Navíc pro ně platí (x0) = f (x0) a (y0) = h (y0). Pak ovšem také platí h(f(x)) - h(f(x0)) = (f(x))(f(x) - f(x0)) = (f(x))(x)(x - x0) pro x z okolí bodu x0. Součin (f(x))(x) je ovšem spojitá funkce v x0 a její hodnota v bodě x0 je právě požadovaná derivace složené funkce. Důsledek. Nechť f a g jsou reálné funkce, která mají v bodě x0 vlastní derivace a g(x0) = 0. Pak pro funkci h(x) = f(x)(g(x))-1 platí h (x0) = f g (x0) = f (x0)g(x0) - f(x0)g (x0) (g(x0))2 . Důkaz. Dokážeme si speciální případ formulky pro h(x) = x-1 . Přímo z definice derivace dostáváme h (x) = lim x0 1 x+x - 1 x x = lim x0 x - x - x x(x2 + xx) = lim x0 -1 x2 + xx . 160 5. ZŘÍZENÍ ZOO Z pravidel pro počítání limit okamžitě dostáváme h (x0) = -x-2 . Nyní pravidlo pro derivaci složené funkce říká, že (g-1 ) = -g2 g a konečně pravidlo pro derivaci součinu nám dává právě kýžený vzorec: (f/g) = (f g-1 ) = f g-1 - fg-2 g = f g - gf g2 . 5.20 5.24. Derivace inverzních funkcí. V odstavci 1.43 jsme při obecné diskusi relací a zobrazení formulovali pojem inverzní funkce. Pokud k dané funkci f : R R inverzní funkce f-1 existuje (nezaměňujme značení s funkcí x (f(x))-1 ), pak je dána jednoznačně kterýmkoliv ze vztahů f-1 f = idR, f f-1 = idR, a druhý již pak platí také. Pokud je f definováno na podmnožině A R a f(A) = B, je existence f-1 podmíněna stejnými vztahy s identickými zobrazeními idA resp. idB na pravých stranách. Pokud bychom věděli, že pro diferencovatelnou funkci f je i f-1 diferencovatelná, pravidlo pro derivaci složené funkce nám říká 1 = (id) (x) = (f-1 f) (x) = (f-1 ) (f(x)) f (x) a tedy přímo víme formuli (zjevně f (x) v takovém případě nemůže být nulové) e5.5 (5.6) (f-1 ) (f(x)) = 1 f (x) . To dobře odpovídá intuitivní představě, že pro y = f(x) je f = y x zatímco pro x = f-1 (y) je (f-1 ) (y) = x y . Takto skutečně můžeme derivace inverzních funkcí počítat: Věta. Je-li f diferencovatelná funkce na okolí bodu x0 a f (x0) = 0, pak existuje na nějakém okolí bodu y0 = f(x0) funkce f-1 inverzní k f a platí vztah (5.6). Pokud je f (x0) = 0 izolovaným nulovým bodem derivace f (x) a inverzní funkce k f na okolí f(x0) existuje, pak limity zprava i zleva funkce f jsou v bodě x0 nevlastní. Důkaz. Nejprve si povšimněme, že nenulovost derivace znamená, že na nějakém okolí je naše funkce f buď ostře rostoucí nebo klesající, viz důsledek 5.22. Proto na nějakém okolí nutně existuje inverzní funkce. Přímo z definice spojitosti pomocí okolí je pak tato inverzní funkce také spojitá. Pro odvození našeho tvrzení nyní postačí pozorně znovu pročíst důkaz pátého tvrzení věty 5.23. Jen volíme f místo funkce h a f-1 místo f a místo předpokladu existence derivací pro obě funkce víme, že funkce složená je diferencovatelná (a víme, že její derivace je identita): Skutečně, podle lematu 5.21 existuje funkce spojitá v bodě y0 taková, že f(y) - f(y0) = (y)(y - y0), na nějakém okolí y0. Navíc pro ni platí (y0) = f (y0). Pak ovšem po dosazení y = f-1 (x) také platí x - x0 = (f-1 (x))(f-1 (x) - f-1 (x0)), 3. DERIVACE 161 pro x z nějakého okolí O(x0) bodu x0. Dále platí f-1 (x0) = y0 a protože je f buď ostře rostoucí nebo klesající, je (f-1 (x)) = 0 pro všechny x O(x0) \ {x0}. Můžeme tedy psát f-1 (x) - f-1 (x0) x - x0 = 1 (f-1(x)) = 0, pro všechny x O(x0) \ {x0}. Pravá strana tohoto výrazu je spojitá v bodě x0 a limita je rovna (y0) = (f (y0))-1 , proto i limita levé strany existuje a je rovna témuž výrazu. Předpokládejme, že je x0 izolovaný nulový bod derivace f a že inverzní funkce na nějakém okolí f(x0) existuje. Pak je f na okolí bodu x0 nenulová, její hodnota se ale blíží nule. Proto má nalevo i napravo derivaci i inverzní funkce a na nějakém levém, resp. pravém, okolí bodu x0 tato nemění znaménko. Odtud již vyplývá, že existují limity zprava i zleva pro f v bodě x0 a jsou nevlastní. 5.22 5.25. Derivace vyšších řádů. Říkáme, že reálná nebo komplexní funkce f má v bodě x0 derivaci druhého řádu v bodě x0, jestliže derivace f existuje na nějakém okolí bodu x0 a existuje její derivace v bodě x0. Píšeme f (x0) = (f ) (x0) nebo také f(2) (x0). Funkce f je dvakrát diferencovatelná na nějakém intervalu A, jestliže má druhou derivaci v každém jeho bodě. Derivace vyšších řádů definujeme induktivně. Známe již pojem první a druhá derivace a říkáme, že reálná nebo komplexní funkce f je k-krát diferencovatelná pro nějaké přirozené číslo k v bodě x0, jestliže je (k - 1)-krát diferencovatelná na nějakém okolí bodu x0 a její (k - 1)-ní derivace má v bodě x0 derivaci. Pro k-tou derivaci funkce f(x) užíváme značení f(k) (x). Jestliže existují derivace všech řádů na intervalu, říkáme, že je tam funkce f hladká. Většinou se také užívá konvence, že 0-krát diferencovatelná funkce znamená spojitá funkce. Používáme pro takové funkce označení třída funkcí Ck (A) na intervalu A, kde k může nabývat hodnot 0, 1, . . . , . Často píšeme pouze Ck , je-li definiční obor znám z kontextu. Ilustrovat můžeme rychle pojem derivace vyššího řádu na polynomech. Protože výsledkem derivování polynomu je opět polynom, ale derivací se vždy o jedničku snižuje jeho stupeň, dostaneme po konečném počtu derivací nulový polynom. Přesněji řečeno, právě po k + 1 derivacích, kde k je stupeň polynomu, dostaneme nulu. Samozřejmě pak existují derivace všech řádů, tj. f C (R). Při konstrukci splajnů, viz 5.7, jsme pohlídali, aby výsledné funkce byly třídy C2 (R). Jejich třetí derivace budou po částech konstantní funkce. Proto nebudou splajny patřit do C3 (R), přestože jejich všechny derivace vyšších řádů budou nulové ve všech vnitřních bodech jednotlivých intervalů v interpolaci. Promyslete si podrobně tento příklad! 5.26. Zvěřinec. Zatím máme shromážděny ctyři typy funkcí: * polynomy f definované na celém R s hodnotami v R nebo v C, * racionální funkce f/g definované na celém R kromě nejvýše konečné množiny kořenů polynomu g ve jmenovateli zlomku, s hodnotami v R nebo C, * mocninné funkce xb s obecným b R, definované pro x > 0 a hodnotami v R, 162 5. ZŘÍZENÍ ZOO * exponenciální funkce ax o libovolném základu a > 0 definované pro všechna x R a s hodnotami v R. Polynomy. Derivace polynomů jsme spočítali již v odstavci 5.5. Ilustrujme naše nástroje pro výpočet derivací při diskusi kořenů polynomů. Předně platí tzv. základní věta algebry, kterou však nebudeme dokazovat: Věta. Každý nenulový komplexní polynom f : C C stupně alespoň jedna má kořen. Nutně tedy polynom stupně k > 0 má právě k kořenů včetně násobností a můžeme jej vždy psát jednoznačně ve tvaru f(x) = (x - a1)c1 (x - aq)cq kde a1, . . . , aq jsou všechny kořeny polynomu f a 1 c1, . . . , cq k jsou jejich násobnosti. Derivací dostaneme f (x) = c1(x - a1)c1-1 . . . (x - aq)cq + + cq(x - a1)c1 . . . (x - aq)cq-1 . Jestliže je c1 = 1, bude hodnota derivace f v bodě a1 nenulová, protože první člen výrazu je nenulový, zatímco všechny zbývající po dosazení hodnoty x = a1 zmizí. Oddobně to bude i s ostatními kořeny. Ověřili jsme tedy užitečnou vlastnost, že kořen a polynomu f je vícenásobný tehdy a jen tehdy, když je zároveň kořenem derivace f . Protože polynomy jen zřídka jsou výhradně rostoucí nebo klesající funkce, nemůžeme očekávat, že by existovaly globálně definované inverzní funkce k nim. Naopak ovšem inverzní funkce k polynomu f existují na každém intervalu mezi kořeny derivace f , tj. tam kde derivace polynomu je nenulová a nemění znaménko. Tyto inverzní funkce nebudou nikdy polynomy, až na případ polynomů stupně jedna, kdy z rovnice y = ax + b spočteme přímo x = 1 a (y - b). U polynomu druhého řádu obdobně y = ax2 + bx + c vede k formuli x = -b b2 - 4a(c - y) 2a , a inverze tedy existuje (a je dána touto formulí) jen pro x na intervalech (-, - b 2a ), (- b 2a , ). Pro práci s inverzními funkcemi k polynomům nevystačíme s našimi funkcemi a dostáváme v našem zvířetníku nové přírůstky. Racionální funkce. Všechny racionální funkce jsou také třídy C ve všech bodech svého definičního oboru. Jejich derivace se snadno počítá pomocí formule pro derivaci podílu. Samozřejmě bude také racionální funkcí. Inverze také budou jako u polynomů existovat obecně jen lokálně a jsou novými přírůstky do našeho společenstva funkcí. 3. DERIVACE 163 Mocninné funkce. Obecnou mocninou funkci není tak snadné zderivovat, i když bychom mohli věřit, že formulka e5.6 (5.7) (xa ) = axa-1 známá pro přirozená a bude platit i pro obecné a. K tomu totiž máme dobrý důvod, protože ji umíme přímo ověřit pro racionální a = p/q. Je-li a celé a záporné, pak tvrzení přímo vidíme z věty o složené funkci: (x-n ) = ((xn )-1 ) = -(xn )-2 nxn-1 = -nx-2n+n-1 = -nx-n-1 . Pokračujme dále s odmocninami, tj. a = 1/q. Pišme x = h(y) = y1/q , y = xq a počítejme podle věty o derivaci inverzní funkce h (y) = 1 q 1 xq-1 = 1 q y-(q-1)/q = 1 q y1/q-1 . Pro obecné racionální a = p/q máme (xp/q ) = ((x1/q )p ) = p(x1/q )p-1 1 q x1/q-1 = p q xp/q-1 . Nyní bychom mohli zvládnout důkaz platnosti formule (5.7) pomocí spojitosti definice mocninné funkce xa v parametru a. Vrátíme se raději k důkazu z jiného pohledu za malou chvíli. Funkce f(x) = x0 = 1 má samozřejmě derivaci nulovou, pro všechny jiné hodnoty a = 0 je derivace nenulová. Je záporná pro a (0, 1), kladná pro a (1, ). Proto je mocninná funkce na celém definičním oboru (0, ) klesající v prvém případě a rostoucí v druhém. Její inverzní funkce je opět mocninnou funkcí. Exponenciální funkce. Zbývají nám funkce f(x) = ax . Zde se také budeme s derivací poněkud potýkat. Pokud budeme umět derivovat ax ve všech bodech x, bude jistě platit f (x) = lim x0 ax+x - ax x = ax lim x0 ax - 1 x = f (0)ax . Naopak, pokud existuje derivace v nule, pak tento výpočet ověřuje existenci derivace v kterémkoliv bodě a dává její hodnotu. Zároveň jsme ověřili platnost téhož vztahu pro derivace zprava a zleva. Exponenciální funkce jsou tedy zvláštními případy funkcí, kdy jejich derivace jsou úměrné hodnotám s konstantním koeficientem úměrnosti. Spočtěme derivaci f (0), tj. výraz lim x0 ax - 1 x a předpokládejme, že naše a > 1. Z definice hodnot exponenciální funkce pomocí suprem množin hodnot s racionálními x je zjevné, že exponenciální funkce ax je na celém svém definičním oboru rostoucí. Stačí nám proto při výpočtu derivace zprava dosazovat za x postupně hodnoty xn = 1/n a dostaneme lim x0+ ax - 1 x = lim n a1/n - 1 1/n . Zkusíme najít takové a, aby limita existovala a byla rovna jedné. Toho dosáhneme, pokud budeme umět s rostoucím n libovolně dobře přibližovat hodnotu a1/n k hodnotě 1 + 1/n, tj. ekvivalentně (dle pravidel pro počítání limit) a je s rostoucím n libovolně přesně aproximováno hodnotou an = ,, 1 + 1 n n . 164 5. ZŘÍZENÍ ZOO Z binomického rozvoje je zřejmé, že pro každé kladné číslo b a přirozené n platí (1+b)n > 1+nb, dostáváme proto pro dva po sobě jdoucí členy naší posloupnosti podíl (1 + 1 n )n (1 + 1 n-1 )n-1 = (n2 - 1)n n n2n(n - 1) = ,, 1 - 1 n2 n n n - 1 > (1 - 1 n ) n n - 1 = 1. Je tedy naše posloupnost rostoucí. Zároveň stejným výpočtem ověříme, že posloupnost čísel bn = (1 + 1 n )n+1 = (1 + 1 n )(1 + 1 n )n je klesající a jistě je bn > an. Ověřili jsme tedy existenci limity poslounosti an (a zároveň vidíme, že je rovna limitě klesající posloupnosti bn). Tato limita je jedním z nejdůležitějších čísel v matematice (vedle nuly, jedničky a Ludolfova čísla ), nazýváme jej Eulerovým číslem e. Je tedy e = lim n 1 + 1 n n . Náš postup zároveň ověřil, že existuje derivace v nule zprava exponenciální funkce ex a je rovna jedné. Proto existuje ve všech bodech x také derivace zprava a je rovna ex . Nyní můžeme spočíst derivaci zleva pomocí derivací složených funkcí. Skutečně, lim x0- ex -1 x = lim x0+ e-x -1 -x = (e0 )-2 e0 = 1. Derivace zleva i zprava tedy pro funkci f(x) = ex existují ve všech bodech a jsou si rovny. Přirozený logaritmus. Protože je exponenciální funkce ex všude dobře definována a kladná, existuje všude i její funkce inverzní. Označujeme ji ln x a říkáme jí přirozený logaritmus nebo logaritmus se základem e. Je definována vztahem eln x = x. Z vlastností mocninných funkcí, viz vztahy (5.5), okamžitě dostáváme 5.6a (5.8) ln(x y) = ln x + ln y, ln xy = y ln x. Derivaci přirozeného logaritmu spočteme podle pravidla pro derivaci složené funkce (užíváme již, že ex je rovno své derivaci, a také definiční vztah pro logaritmus): e5.7 (5.9) (ln) (y) = (ln) (ex ) = 1 (ex) = 1 ex = 1 y . Derivaci obecné exponenciální funkce f(x) = ax můžeme nyní spočíst takto: e5.8 (5.10) (ax ) = (ex ln a ) = ex ln a (x ln a) = ax ln a. Podobně také můžeme konečně ověřit i formuli pro derivaci obecné mocninné funkce pro všechny x > 0: (xa ) = (ea ln x ) = ea ln x (a ln x) = axa-1 . Pro obecnou exponenciální funkci ax se základem a = 1, a > 0 také existuje všude inverzní funkce. Říkáme jí logaritmus při základu a, píšeme loga x. Vlastnosti dosavadního osazenstva našeho zvířetníku funkcí zpřehledňuje následující tabulka, kde jsou shrnuty vlastnosti jednotlivých obyvatelů a jejich vztahy: 4. MOCNINNÉ ŘADY 165 funkce definiční obor třída derivace inverze polynomy f celé R C f opět polynom f-1 existuje jen lokálně a neumíme obecnou formulí kubické splajny h celé R C2 h je opět splajn formule s odmocninami a jen lokálně racionální funkce f/g celé R kromě kořenů jmenovatele g C opět racionální funkce: f g-fg g2 existuje jen lokálně a neumíme obecnou formulí mocninné funkce xa interval (0, ) C funkce axa-1 existuje všude a je opět mocninnou funkcí y1/a exponenciální funkce ax s a > 0, a = 1 celé R C existuje všude a je ln a ax logaritmická funkce loga 4. Mocninné řady 5.24 5.27. Vraťme se k exponenciální funkci ex . Jestliže v posloupnosti am = (1+ 1 m )m dosadíme za m hodnoty m = n/x pro nějaké pevné x R, dostaneme bn = 1 + x n n x , bx n = 1 + x n n . Přitom, je limita bn pro n jdoucí do nekonečna opět e. Odvodili jsme tedy důležitý vztah platný pro všechna x R e5.11 (5.11) ex = lim n 1 + x n n . Označme si n-tý člen této posloupnosti un(x) a vyjádřeme si jej pomocí bionomické věty: e5.11a (5.12) un(x) = 1 + n x n + n(n - 1)x2 2!n2 + + n!xn n!nn = 1 + x + x2 2! 1 - 1 n + x3 3! 1 - 1 n 1 - 2 n + . . . + xn n! 1 - 1 n 1 - 2 n . . . 1 n - 1 n . Protože jsou všechny závorky v součinech menší než jedna, dostáváme také un(x) < vn(x) = n j=0 1 j! xj . Podívejme se nyní na formální nekonečný součet e5.12 (5.13) X j=0 cj = X j=0 1 j! xj tj. vn(x) je právě částečný součet prvních n členů. Podíl dvou po sobě jdoucích členů v řadě je cj+1/cj = x/(n + 1). Pro každé pevné x tedy existuje N N takové, že cj+1/cj < 1/2 pro 166 5. ZŘÍZENÍ ZOO všechny j > N. Pro takto velké j je ovšem cj+1 < 1 2 cj < 2-(j-N+1) cN . To ale znamená, že částečné součty prvních n členů v našem formálním součtu jsou shora ohraničeny součty vn < NX j=0 1 j! xj + 1 j! xj n-NX j=0 1 2j . Poslední sumu ovšem umíme snadno spočíst. Jde o zvláštní případ součtu geometrické řadyPk j=0 qj . Protože platí pro každé q (1 - q)(1 + q + + qk ) = 1 - qk+1 , existuje limita částečných součtů v geometrické řadě P j=0 qk právě když |q| < 1 a v takovém případě platí e5.13 (5.14) X j=0 qj = lim k kX j=0 qj = 1 1 - q . Protože čísla vn tvoří rostoucí posloupnost, jistě také tato posloupnost konverguje. Říkáme, že řada (5.13) konverguje. Nyní si prohlédněme pozorněji posloupnost čísel un, jejíž limitou je ex . Budeme uvažovat n > N pro nějaké pevné N (hodně velké) a zvolíme si k < N pevné (docela malé). Pak pro dostatečně velká N umíme součet prvních k členů ve vyjádření uN v (5.12) aproximovat libovolně přesně výrazem vk. Protože je tato část součtu uN ostře menší než uN samotné, musí posloupnost un konvergovat k téže limitě jako poslounost vn. Dokázali jsme tedy: Věta. Exponenciální funkce je pro každé x R vyjádřena jako limita částečných součtů ve výrazu ex = 1 + x + 1 2! x2 + + 1 n! xn + = n=0 1 n! xn . Při dovození tohoto mimořádně důležitého tvrzení jsme mimoděk pracovali s několika užitečnými pojmy a nástroji. Sformulujeme si je nyní obecněji: 5.25 5.28. Definice. Nekonečná řada je výraz n=0 an = a0 + a1 + a2 + + ak + . . . , kde an jsou reálná nebo komplexní čísla. Posloupnost částečných součtů je dána svými členy sk = k n=0 an a říkáme, že řada konverguje a je rovna s, jestliže existuje konečná limita částečných součtů s = lim k sn. K tomu, aby posloupnost sn konvergovala, je nutné a stačí, aby byla Cauchyovská. Tzn. že |sm - sn| = |an+1 + + am| musí být libovolně malé pro dostatečně velká m > n. Protože je |an+1| + + |am| > |an+1 + + am|, vyplývá z konvergence řady k=0 |an| i konvergence řady k=0 an. Říkáme, že řada k=0 an konverguje absolutně, jestliže konverguje řada n=0 |an|. Jestliže posloupnost částečných součtů řady má nevlastní limitu, říkáme že řada diverguje k nebo -. 4. MOCNINNÉ ŘADY 167 Jednoduché algebraické operace s absolutně konvergentními řadami se chovají všechny dobře: Věta. Nechť S = n=0 an a T = n=0 bn jsou dvě absolutně konvergentní řady. Pak (1) jejich součet absolutně konverguje k součtu S + T = n=0 an + n=0 bn = n=0 (an + bn), (2) jejich rozdíl absolutně konverguje k rozdílu S - T = n=0 an - n=0 bn = n=0 (an - bn), (3) jejich součin absolutně konverguje k součinu S T = n=0 an n=0 bn = n=0 n k=0 an-kbk . Důkaz. První i druhé tvrzení jsou bezprostředním důsledkem obdobných vlastností limit. Třetí tvrzení vyžaduje větší pozornost. Označme si cn = n k=0 an-kbk. Z předpokladů a podle pravidel pro limitu součinu posloupností dostáváme k n=0 an k n=0 bn n=0 an n=0 bn . Máme tedy dokázat, že 0 = lim k k n=0 an k n=0 bn - k n=0 ck . Porovnejme si nyní výrazy k n=0 an k n=0 bn = 0i,jk aibj, cn = i+j=n 0i,jk aibj, k n=0 cn = i+jk 0i,jk aibj. Dostáváme tedy odhad k n=0 an k n=0 bn - k n=0 ck = i+j>k 0i,jk aibj i+j>k 0i,jk |aibj|. K odhadu posledního výrazu nám poslouží jednoduchý trik: aby mohl být součet idexů větší než k, musí být alespoň jeden z nich větší než k/2. Jistě tedy výraz nezmenšíme, když do něj přidáme více členů, tj. vezmeme všechny jako v součinu a odebereme pouze ty, u kterých jsou oba nejvýše k/2. i+j>k 0i,jk |aibj| 0i,jk |aibj| - 0i,jk/2 |aibj|. 168 5. ZŘÍZENÍ ZOO Oba výrazy v rozdílu jsou ale částečné součty pro součin S T, mají tedy také stejnou limitu a proto jejich rozdíl jde k nule. Jako obvykle si hned shrneme několik dalších jednoduchých tvrzení o řadách: 5.26 5.29. Věta. Nechť S = n=0 an je nekonečná řada reálných nebo komplexních čísel. (1) Jestliže S konverguje, pak limn an = 0. (2) Předpokládejme, že existuje limita podílů po sobě jdoucích členů řady a platí lim n an+1 an = q. Pak řada S konverguje absolutně při |q| < 1 a nekonverguje při |q| > 1. Při |q| = 1 může řada konvergovat ale nemusí. (3) Jestliže existuje limita lim n n |an| = q, pak při q < 1 řada konverguje, zatímco při q > 1 diverguje. Je-li q = 1, může konvergovat i divergovat. Důkaz. (1) Jestliže limn an neexistuje nebo je nenulová, exituje pro dostatečně malé číslo > 0 nekonečně mnoho členů ak s |ak| > . Zároveň tedy musí mezi nimi existovat nekončeně mnoho kladných nebo nekonečně mnoho záporných. Pak ovšem při přidání kteréhokoliv z nich do částečného součtu dostáváme rozdíl dvou po sobě jdoucích sn a sn+1 o velikosti alespoň . Posloupnost částečných součtů proto nemůže být Cauchyovská a tedy ani konvergentní. (2) Protože chceme dokazovat absolutní konvergenci, můžeme rovnou předpokládat ai > 0. Důkaz jsme pro speciální hodnotu q = 1/2 provedli při dovození hodnoty ex pomocí řady. Stejnou úvahou z existence limity podílů dovodíme pro dostatečně veliké N aj+1 < q aj < q-(j-N+1) cN . To ale znamená, že částečné součty prvních sn jsou shora ohraničeny součty sn < NX j=0 aj + cN n-NX j=0 1 qj . Je-li 0 < q < 1, je množina všech částečných součtů shora ohraničená a proto je limitou naší řady její supremum. Při hodnotě q > 1 použijeme obdobný postup, ale z existence limity q na začátku odvo- díme aj+1 < q aj < q-(j-N+1) cN . To ale znamená, že částečné součty prvních sn jsou zdola ohraničeny součty sn > NX j=0 aj + cN n-NX j=0 1 qj . Při q > 0 tento výraz poroste nad všechny meze (3) Důkaz je zde velmi podobný předchozímu případu. Z existence limity q < 1 vyplývá, že pro každé q < r < 1 existuje N takové, že pro všechny n > N platí n p |an| < r. Umocněním pak |an| < rn takže jsme opět v situaci, kdy srovnáváme s geometrickou řadou. Důkaz se proto dokončí stejně jako v případě podílového testu. 4. MOCNINNÉ ŘADY 169 V důkazu druhého i třetího tvrzení jsme využívali slabšího tvrzení, než je existecne limity. Potřebovali jsme pro studované posloupnosti nezáporných výrazů pouze tvrzení, že od určitého indexu už budou větší nebo menší než dané číslo. K takovému odhadu nám ale postačí pro danou posloupnost bn uvažovat s každým indexem n supremum hodnot členů s indexy vyššími. Tato suprema vždy existují a budou tvořit nerostoucí posloupnost. Její infimum pak označujeme jako limes superior dané posloupnosti a značíme lim sup n bn. Výhodou je, že limes superior vždy existuje, můžeme proto předchozí výsledek (včetně důkazu) přeformulovat v silnější podobě: Důsledek. Nechť S = n=0 an je nekonečná řada reálných nebo komplexních čísel. (1) Je-li q = lim sup n an+1 an , pak řada S konverguje absolutně při q < 1 a nekonverguje při q > 1. Při q = 1 může řada konvergovat ale nemusí. (2) Je-li q = lim sup n n |an|, pak při q < 1 řada konverguje, zatímco při q > 1 diverguje. Je-li q = 1, může konvergovat i divergovat. 5.29.1. Ukažte, že tzv. harmonická řada i=1 1 i diverguje. Řešení. Pro libovolné přirozené k je součet prvních 2k členů řady větší než k/2: 1 + 1 2 > 1 2 + 1 3 + 1 4 > 1 4 + 1 4 = 1 2 + 1 5 + 1 6 + 1 7 + 1 8 > 1 8 + 1 8 + 1 8 + 1 8 = 1 2 + . . . , součet členů od 2l +1 do 2l+1 je totiž vždy větší než 2l -krát (jejich počet) číslo 1/2l (nejmenší z nich), což je dohromady 1/2. 5.29.2. Rozhodněte o následujících řadách, jestli konvergují či divergují: (1) n=1 2n n (2) n=1 1 n (3) n=1 1 n2100000 (4) n=1 1 (1+i)n Řešení. 170 5. ZŘÍZENÍ ZOO (1) Budeme zkoumat konvergenci podílovým kritériem: lim n an+1 an = lim n 2n+1 n+1 2n n = lim n 2(n + 1) n = 2 > 1, řada tedy diverguje. (2) Odhadneme řadu ze spodu: víme, že pro libovolné přirozené n platí 1 n 1 n . Pro posloupnost částečných součtů sn zkoumané řady a posloupnost částečných součtů harmonické řady sn tedy platí: sn = n i=1 1 n n i=1 1 n = sn. A protože harmonická řada diverguje (viz předchozí příklad), diverguje i její posloupnost částečných součtů {sn} n=1, tedy diverguje i posloupnost částečných součtů {sn} n=1, tedy diverguje i zadaná posloupnost. (3) Diverguje, jedná se o násobek harmonické řady. (4) Jedná se o geometrickou řadu s koeficientem 1 1+i , ta bude konvergovat, bude-li absolutní hodnota koeficientu menší než 1. Víme, že | 1 1 + i | = | 1 - i 2 | = | 1 2 - 1 2 i| = 1 4 + 1 4 = 2 2 < 1, řada tedy konverguje a umíme ji dokonce sečíst: n=1 1 (1 + i)n = 1 1 - 1 1+i = 1 + i i = 1 - i. 5.27 5.30. Mocninné řady. Jestliže máme místo posloupnosti čísel an k dispozici posloupnost funkcí fn(x) se stejným definičním oborem A, můžeme bod po bodu použít definici řady a dostáváme pojem součtu řady funkcí S(x) = n=0 fn(x). Mocninná řada je dána výrazem S(x) = n=0 anxn . Řekneme, že S(x) má poloměr konvergence 0, jestliže S(x) konverguje pro každé x splňující |x| < a diverguje při |x| > . Věta. Nechť S(x) = n=0 anxn je mocninná řada a existuje limita = lim n n an. Pak je poloměr konvergece řady S roven r = -1 . Mocninná řada S(x) je spojitá na celém svém intervalu konvergence (včetně krajních bodů, pokud v nich konverguje) a existuje také její derivace S (x), S (x) = n=1 nanxn-1 . 4. MOCNINNÉ ŘADY 171 Důkaz. Pro ověření konvergence řady můžeme pro každou pevnou hodnotu x použít odmocninový test z věty 5.29(3). Počítáme přitom lim n n anxn = x a řada konverguje, resp. diverguje, jestliže je tato limita různá od 1. Tvrzení o spojitosti a derivaci dokážeme později v obecnějším kontextu, viz 6.27­6.29. Všimněme si také, že můžeme při důkazu konvergence použít silnější variantu odmocninového testu a tedy lze poloměr konvergence r pro každou mocninnou řadu přímo zadat fomulí r-1 = lim sup n n an. 5.28 5.31. Příklad. Prodíváme se na mocninné řady S(x) = n=0 xn , T(x) = n=1 1 n xn . První příklad je geometrická řada, kterou jsme se zabývali již dříve, a její součet je pro všechny x s |x| < 1 S(x) = 1 1 - x , zatímco |x| > 1 zaručuje divergenci. Pro x = 1 dostáváme také zjevně divergentní řadu 1 + 1 + 1 + . . . s nekonečným součtem, při x = -1 jde o řadu 1 - 1 + 1 - . . . , jejíž částečné součty nemají limitu vůbec. Věta 5.29(3) ukazuje, že poloměr konvergence druhého příkladu je také jedna, protože existuje lim n 1 n+1 xn+1 1 n xn = x lim n n n + 1 = x Pro x = -1 tu dostaneme divergentní řadu 1+ 1 2 + 1 3 +. . . (dokažte si jako cvičení!). Naopak, řada T(-1) = -1 + 1 2 - 1 3 + . . . konverguje. Vyplývá to z obecnějšího platného tvrzení: O řadě T = n=0 bn s reálnými členy řekneme, že je alternující, jestliže je znaménko dvou po sobě jdoucích členů vždy opačné. Pokud je navíc |bn| klesající posloupnost a pro řadu T platí nutná podmínka konvergence z 5.29, tj. limn bn = 0, pak řada konverguje. Důkaz teď nebudeme provádět, vyplyne z obecnějších výsledků později, viz ??. 5.31.1. 7. Určete poloměr konvergence následujících mocninných řad: (1) n=1 2n n xn (2) n=1 1 (1+i)n xn Řešení. (1) r = 1 lim sup n an+1 an = 1 2 , 172 5. ZŘÍZENÍ ZOO viz úloha ??. Daná mocniná řada tedy konverguje pro reálná x (-1 2 , 1 2 ), případně pro komplexní |x| < 1 2 . Všimněme si, že řada je divergentní pro x = 1 2 (jde o harmonickou řadu) a naopak konverguje pro x = -1 2 (alternující harmonická řada). Rozhodnout o konvergenci pro libovoné x ležící v komplexní rovině na kružnici o poloměru 1 2 je těžší otázka a přesahuje rámec našeho kurzu. (2) Opět díky přechozímu příkladu víme, že lim sup n n 1 (1 + i)n = lim sup n 1 1 + i = 2 2 . je tedy poloměr konvergence dané mocninné řady r = 2. 5.29 5.32. Zvěřinec. S mocninnými řadami nám do našeho společenství přibyla spousta nových příkladů hladkých funkcí, tj. funkcí libovolněkrát diferencovatelných na celém svém definičním oboru. Pohrejme si chvíli s nejvýznamnějším a prvním naším příkladem, exponenciálou ex = 1 + x + 1 2 x2 + + 1 n! xn + . . . . Tato mocninnná řada má poloměr konvergence nekonečný a dobře proto definuje hladkou funkci pro všechna komplexní čísla x. Její hodnoty jsou limitami hodnot (komplexních) polynomů s reálnými koeficienty a ze spojitosti tedy musí pro ni platit i obvyklé vztahy, které jsme pro reálné hodnoty proměnné x již odvodili. Zejména tedy platí ex+y = ex ey , viz (5.5) a věta 5.28(3). Dosaďme si hodnoty x = i t, kde i C je imaginární jednotka, t R libovolné. eit = 1 + it - 1 2 t2 - i 1 3! t3 + 1 4! t4 + i 1 5! t5 - . . . a zjevně tedy je komplexně konjugované číslo k z = eit číslo z = e-it . Proto |z|2 = z z = eit e-it = e0 = 1 a všechny hodnoty z = eit proto leží na jednotkové kružnici v komplexní rovině. Reálné a imaginární složky bodů na jednotkové kružnici přitom bývají popisovány pomocí goniometrických funkcí cos a sin , kde je patřičný úhel. Derivací parametrického popisu bodů kružnice, t eit dostáváme vektory ,,rychlostí , které budou dány výrazem (lze např. zderivovat skutečně zvlášť reálnou a imaginární složku a sečíst výsledky) t eit ) = i eit a jejich velikost proto také bude pořád jednotková. Odtud lze tušit, že celou kružnici oběhneme po dosažení hodnoty parametru rovného délce oblouku, tj. 2 (i když ke skutečnému ověření této skutečnosti budeme potřebovat integrální počet). Takto bývá Ludolfovo číslo také definováno. Můžeme se ale nyní aspoň částečně ujistit pohledem na nejmenší kladné kořeny reálné části částečných součtů naší řady, tj. 4. MOCNINNÉ ŘADY 173 příslušných polynomů. Již při řádu deset nám vyjde číslo přesně na 5 desetinných míst. Dostali jsem tedy přímou definici goniometrických funkcí pomocí mocninných řad: cos t = re eit = 1 - 1 2 t2 + 1 4! t4 - 1 6! t6 + + (-1)k 1 (2k)! t2k + . . .e5.15 (5.15) sin t = im eit = t - 1 3! t3 + 1 5! t5 - 1 7! t7 + + (-1)k 1 (2k + 1)! t2k+1 + . . .e5.16 (5.16) Ilustraci konvergence řady pro funkci cos je vidět na obrázku. Jde o graf příslušného polynomu stupně 68. Při postupném vykreslení částečných součtů je vidět, že aproximace v okolí nuly je velice dobrá a prakticky beze změn. S rostoucím řádem se pak zlepšuje i dále od počátku. y t~ 1,5 30 1 0,5 20 0 -0,5 10 -1 -1,5 0-10-20-30 Přímo z definice vyplývá známý vztah sin2 t + cos2 t = 1 a také z derivace (eit ) = i eit vidíme, že (sin t) = cos t, (cos t) = - sin t. Tentýž výsledek lze samozřejmě ověřit přímo derivací našich řad člen po členu. Předpokládejme, že t0 je nejmenší kladné číslo, pro které je e-it0 = - eit0 , tj. první kladný nulový bod funkce cos t. Podle naší definice Ludolfova čísla je t0 = 1 2 . Pak e-i2t0 = (e-it0 )2 = ei2t0 a jde proto o nulový bod funkce sin t. Samozřejmě pak platí pro libovolné t ei(4kt0+t) = (eit0 )4k eit = 1 eit . Jsou tedy obě funkce goniometrické funkce periodické s periodou 2. Z našich definic je přitom vidět, že je to nejmenší jejich perioda. Nyní můžeme snadno odvodit všechny obvyklé vztahy mezi goniometrickými funkcemi. Uvedeme na ukázku několik z nich. Nejprve si všimněme, že definice 174 5. ZŘÍZENÍ ZOO vlastně říká cos t = 1 2 (eit + e-it ) sin t = 1 2i (eit - e-it ). Součin těchto funkcí jde tedy vyjádřit jako sin t cos t = 1 4i (eit - e-it )(eit + e-it ) = 1 4i (ei2t - e-i2t ) = 1 2 sin 2t. Dále můžeme využít naši znalost derivací: cos 2t = ( 1 2 sin 2t) = (sin t cos t) = cos2 t - sin2 t. Vlastnosti dalších goniometrických funkcí tg t = sin t cos t , cotg t = (tg t)-1 se snadno odvodí z jejich definice a pravidel pro derivování. Grafy funkcí sinus, cosinus, tangens a cotangens jsou na obrázcích (postupně červený a zelený vlevo, červený a zelený vpravo): 1 x 0,5 0 10-5 -0,5 5 -1 0-10 x 3210-1-2 y -3 10 5 0 -5 -10 Cyklometrické funkce jsou inverzní ke goniometrickým. Protože jsou goniometrické funkce všechny periodické s periodou 2, jsou jejich inverze definované vždy jen v rámci jedné periody a to ještě jen na části, kdy je daná funkce buď rostoucí nebo klesající. Jsou to funkce arcsin = sin-1 s definičním oborem [-1, 1] a oborem hodnot [-/2, /2]. Dále arccos = cos-1 s definičním oborem [-1, 1] a oborem hodnot [0, ], viz obrázek vlevo. 4. MOCNINNÉ ŘADY 175 3 2 1 0 -1 x 10,50-0,5-1 3 2 1 x 0 -1 1050-5-10 Zbývají ještě funkce (zobrazené na obrázku vpravo) arctg = tg-1 s definičním oborem [-, ] a oborem hodnot [-/2, /2] a konečně arccotg = cotg-1 s definičním oborem [-, ] a oborem hodnot [0, ]. Velice často se také využívají tzv. hyperbolické funkce sinh x = 1 2 (ex - e-x ), cosh x = 1 2 (ex + e-x ). Název naznačuje, že by funkce mohly mít něco společného s hyperbolou. Přímý výpočet dává (druhé mocniny se v roznásobených dvojčlenech všechny odečtou a zůstanou smíšené členy) (cosh x)2 - (sinh x)2 = 2 1 2 (ex e-x ) = 1. Body [cosh t, sinh t] tedy skutečně parametricky popisují hyperbolu v rovině. Pro hyperbolické funkce lze snadno odvodit podobné identity jako pro funkce goniometrické. Mimo jiné je přímo z definice snadno vidět cosh x = cos(ix), i sinh x = sin(ix) (ověřte si jako cvičení). 5.32.1. Sečtěte: 2 + 1 + 2 2! + 1 3! + 2 4! + 1 5! + 2 6! + Řešení. Porovnáme tvar součtu s mocninným rozvojem funkcí sinh a cosh a dostáváme výsledek sinh(1) + 2 cosh(1) . 176 5. ZŘÍZENÍ ZOO 5.30 5.33. Poznámky. Mocninné řady můžeme zcela stejně definovat takto: S(x) = n=0 an(x - x0)n , kde x0 je libovolné pevně zvolené reálné číslo. Všechny naše předchozí úvahy jsou pořád platné, jen je třeba mít na paměti, že se vztahují k bodu x0. Zejména tedy taková řada konverguje na intervalu (x0 -, x0 +), kde je její poloměr konvergence. Říkáme, že S je mocninná řada se středem v x0. Dále platí, že má-li mocninná řada y = T(x) hodnoty v intervalu, kde je dobře definována řada S(y), potom i hodnoty funkce S T jsou vyjádřeny mocninnou řadou, kterou dostaneme formálním dosazením y = T(x) za y do S(y). Zejména lze takto počítat členy mocninných řad zadávajících inverzní funkce. Nebudeme zde uvádět seznam formulí, snadno se k nim dostaneme například v Maplu procedurou ,,series . KAPITOLA 6 Diferenciální a integrální počet zvěřinec teď máme, ale co s ním? ­ naučíme se s ním zacházet... V minulé kapitole jsme si postupně hráli buď s mimořádně velikými třídami funkcí -- všechny spojité, všechny diferencovatelné apod. -- nebo jen s konkrétními funkcemi -- např. exponenciální, goniometrické, polynomy atd. Měli jsme ale přitom jen minimum nástrojů a vše jsme počítali tak říkajíc na koleně. Teď dáme dohromady několik výsledků, které umožní snáze pracovat s funkcemi při modelování reálných problémů. 1. Derivování Začneme několika jednoduchými výsledky o derivování funkcí. 6.1 6.1. Věta. Nechť funkce f : R R je spojitá na intervalu [a, b] a diferencovatelná uvnitř tohoto intervalu. Jestliže platí f(a) = f(b), pak existuje c (a, b) takové, že f (c) = 0. Důkaz. Protože je funkce f spojitá na uzavřeném intervalu (tj. kompaktní množině), má na něm maximum a minimum. Pokud by maximum i minimum mělo stejnou hodnotu f(a) = f(b), pak by funkce f byla konstantní a tedy i její derivace by byla nulová ve všech bodech intervalu (a, b). Předpokládejme tedy, že buď maximum nebo mimimum je jiné a nechť nastává jedno z nich ve vnitřním bodě c. Pak ovšem není možné, aby v c bylo f (c) = 0, protože to by v tomto bodě byla byla funkce f buď rostoucí nebo klesající (viz 5.22) a jistě by tedy v okolí bodu c nabývala větších i menších hodnot, než je f(c). Právě dokázanému tvrzení se říká Rolleova věta. Z ní snadno vyplývá následující důsledek, známý jako věta o střední hodnotě. 6.2 6.2. Věta. Nechť funkce f : R R je spojitá na intervalu [a, b] a diferencovatelná uvnitř tohoto intervalu. Pak existuje c (a, b) takové, že f (c) = f(b) - f(a) b - a . Důkaz. Důkaz je prostým zápisem geometrického významu tvrzení: k sečně mezi body [a, f(a)] a [b, f(b)] existuje tečna, která je s ní rovnoběžná (namalujte si obrázek). Rovnice naší sečny je y = g(x) = f(a) + f(b) - f(a) b - a (x - a). 177 178 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Rozdíl h(x) = f(x) - g(x) udává vzdálenost grafu od sečny (v hodnotách y). Jistě platí h(a) = h(b) a h (x) = f (x) f(b) - f(a) b - a . Podle předchozí věty existuje bod c, ve kterém je h (c) = 0. Větu o střední hodnotě můžeme také přepsat ve tvaru: e6.1 (6.1) f(b) = f(a) + f (c)(b - a). V případě parametricky zadané křivky v rovině, tj. dvojice funkcí y = f(t), x = g(t), je stejný výsledek o existenci rovnoběžné tečny k sečně krajními body popsán takto: Důsledek. Nechť funkce y = f(t) a x = g(t) jsou spojité na intervalu [a, b] a diferencovatelné uvnitř tohoto intervalu a g (t) = 0 pro všechny t (a, b). Pak existuje bod c (a, b) takový, že platí f(b) - f(a) g(b) - g(a) = f (c) g (c) . Důkaz. Opět spoléháme na použití Rolleovy věty. Položíme proto h(t) = (f(b) - f(a))g(t) - (g(b) - g(a))f(t). Nyní h(a) = f(b)g(a)-f(a)g(b), h(b) = f(b)g(a)-f(a)g(b), takže existuje c (a, b) takový, že h (c) = 0. Protože je g (c) = 0, dostáváme právě požadovaný vztah. Podobná úvaha jako v posledním tvrzení vede k mimořádně užitečnému nástroji pro počítání limit funkcí. Je znám jako ĽHospitalovo pravidlo: 6.3 6.3. Věta. Předpokládejme, že f a g jsou funkce diferencovatelné v okolí bodu x0 R, ne však nutně v bodě x0 samotném, a nechť existují limity lim xx0 f(x) = 0, lim xx0 g(x) = 0. Jestliže existuje limita lim xx0 f (x) g (x) pak existuje i limita lim xx0 f(x) g(x) a jsou si rovny. Důkaz. Bez újmy na obecnosti můžeme předpokládat, že v x0 mají funkce f a g nulovou hodnotu. Výsledek je opět jednoduše představitelný pomocí obrázku. Uvažujme body [g(x), f(x)] R2 parametrizované proměnnou x. Podíl hodnot pak odpovídá směrnici sečny mezi body [0, 0] a [f(x), g(x)]. Zároveň víme, že podíl derivací odpovídá směrnici tečny v příslušném bodě. Z existence limity směrnic tečen tedy chceme dovodit existenci limity směrnic sečen. 1. DERIVOVÁNÍ 179 Technicky lze využít věty o střední hodnotě v parametrickém tvaru. Předně si uvědomme, že v tvrzení věty implicitně předpokládáme existenci výrazu f (x)/g (x) na nějakém okolí x0, zejména tedy pro dostatečně blízké body c k x0 bude g (c) = 0.1 lim xx0 f(x) g(x) = lim xx0 f(x) - f(x0) g(x) - g(x0) = lim xx0 f (cx) g (cx) , kde cx je číslo mezi x0 a x. Nyní si všimněme, že z existence limity lim xx0 f (x) g (x) vyplývá, že stejnou hodnotu bude mít i limita libovolné posloupnosti vzniklé dosazením hodnot x = xn jdoucích k x0 do f (x)/g (x). Zejména tedy můžeme dosadit jakoukoliv posloupnost cxn pro xn x0 a proto bude existovat i limita lim xx0 f (cx) g (cx) a poslední dvě limity zjevně budou mít stejnou hodnotu. Dokázali jsme tedy, že naše hledaná limita existuje a má také stejnou hodnotu. 6.4 6.4. Důsledky. Jednoduše lze rozšířit ĽHospitalovo pravidlo i pro limity v nevlastních bodech a v případě nevlastních hodnot limit. Je-li, např. lim x f(x) = 0, lim x g(x) = 0, potom je limx0+ f(1/x) = 0 a limx0+ g(1/x) = 0. Zároveň z existence limity podílu derivací v nekonečnu dostaneme lim x0+ (f(1/x)) (g(1/x)) = lim x0+ f (1/x)(-1/x2 ) g (1/x)(-1/x2) = lim x0+ f (1/x) g (1/x) = lim x f (x) g (x) . Použitím předchozí věty tedy dostáváme, že v tomto případě bude existovat i limita podílu lim x f(x) g(x) = lim x0+ f(1/x) g(1/x) = lim x f (x) g (x) . Ještě jednodušší je postup při výpočtu limity v případě, kdy lim xx0 f(x) = , lim xx0 g(x) = . Stačí totiž psát lim xx0 f(x) g(x) = lim xx0 1/g(x) 1/f(x) , což je již případ pro použití ĽHospitalova pravidla z předchozí věty. Lze ale i dokázat, že ĽHospitalovo pravidlo platí ve stejné formě pro nevlastní limity: Věta. Nechť f a g jsou funkce diferencovatelné v okolí bodu x0 R, ne však nutně v bodě x0 samotném, a nechť existují limity limxx0 f(x) = a limxx0 g(x) = . Jestliže existuje limita lim xx0 f (x) g (x) 1Pro samu existenci limity v obecném smyslu to vždy nutné není, nicméně pro tvrzení ĽHospitalovy věty je to potřebné. Podrobnou diskusi je možné najít (vygooglovat) v populárním článku "R. P. Boas, Counterexamples to LHôpitals Rule, The American Mathematical Monthly, October 1986, Volume 93, Number 8, pp. 644­645." 180 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET pak existuje i limita lim xx0 f(x) g(x) a jsou si rovny. Důkaz. Opět lze vyjít z věty o střední hodnotě. Základem je vyjádření podílu tak, abychom dostali do hry derivaci: f(x) g(x) = f(x) f(x) - f(y) f(x) - f(y) g(x) - g(y) g(x) - g(y) g(x) kde y volíme nějaký pevný ze zvoleného okolí x0 a x necháme blížit k x0. Protože jsou limity f i g v x0 nekonečné, můžeme jistě předpokládat, že rozdíly hodnot v x a y jsou u obou funkcí při pevném y nenulové. Pomocí věty o střední hodnotě můžeme nyní nahradit prostřední zlomek podílem derivací ve vhodném bodě c mezi x a y a výraz ve zkoumané limitě dostává tvar f(x) g(x) = 1 - g(y) g(x) 1 - f(y) f(x) f (c) g (c) , kde c závisí na x i y. Při pevném y a x jdoucím k x0 jde první zlomek zjevně k jedničce. Když zároveň budeme y přibližovat k x0, bude se nám druhý zlomek libovolně přesně blížit k limitní hodnotě podílu derivací. 6.4a 6.5. Příklady užití. Vhodnými úpravami sledovaných výrazů lze využít ĽHospitalova pravidla také na výrazy typu -, 1 , 0 apod. Zpravidla jde o prosté přepsání výrazů nebo o využití nějaké hladké funkce, např. exponenciální. Uveďme alespoň dva příklady hned: lim x0 1 sin 2x - 1 2x = lim x0 2x - sin 2x 2x sin 2x = lim x0 2 - 2 cos 2x 2 sin 2x + 4x cos 2x = lim x0 4 sin 2x 4 cos 2x + 4 cos 2x - 8x sin 2x = 0, přičemž získané tvrzení je třeba číst od konce. Tj. z existence poslední limity (podíl druhých derivací) vyplývá existence limity podílů prvních derivací a z toho plyne existence i hodnota původní limity. Druhý příklad nám ukáže souvislost aritmetického a geometrického průměru z n hodnot. Aritmetický průměr M1 (x1, . . . , xn) = x1 + + xn n je speciálním případem tzv. mocninného průměru stupně r: Mr (x1, . . . , xn) = xr 1 + + xr n n 1 r . Speciální hodnota M-1 se nazývá harmonický průměr. Spočtěme si nyní limitní hodnotu Mr pro r jdoucí k nule. Za tímto účelem spočteme limitu pomocí ĽHospitalova 1. DERIVOVÁNÍ 181 pravidla (jde o výraz 0/0): lim r0 ln(Mr (x1, . . . , xn)) = lim r0 ln( 1 n (xr 1 + . . . xr n)) r = lim r0 xr 1 ln x1++xr n ln xn n xr 1+...xr n n = ln x1 + + ln xn n = ln n x1 xn. Odtud tedy je přímo vidět, že lim r0 Mr (x1, . . . , xn) = n x1 . . . xn, což je hodnota známá pod názvem geometrický průměr. 6.5 6.6. Význam druhé derivace. Již jsme viděli, že první derivace funkce je jejím lineárním přiblížením v okolí daného bodu a že ze znaménka nenulové derivace vyplývá, že funkce je v bodě x0 rostoucí nebo klesající. Body, ve kterých je první derivace nulová se nazývají kritické body dané funkce. Je-li x0 kritický bod funkce f, může být chování funkce f v okolí bodu x0 jakékoliv. Vidíme to již z chování funkce f(x) = xn v okolí nuly pro libovolné n. Pro lichá n > 0 bude f(x) rostoucí, pro sudá n naopak bude nalevo klesající a napravo rostoucí, dosáhne tedy v bodě x0 své minimální hodnoty mezi body z (dostatečně malého) okolí bodu x0 = 0. Tentýž pohled můžeme aplikovat na funkci f . Jestliže totiž je druhá derivace nenulová, určuje její znaménko chování derivace první. Proto v kritickém bodě x0 bude derivace f (x) rostoucí při kladné druhé derivaci a klesající při záporné. Jestliže je ale rostoucí, znamenená to, že nutně bude záporná nalevo od kritického bodu a kladná napravo od něj. Funkce f v takovém případě je klesající nalevo od kritického bodu a rostoucí napravo od něj. To znamená, že má funkce f v bodě x0 minimum ze všech hodnot z nějakého malého okolí bodu x0. Naopak, je-li druhá derivace záporná v x0, je první derivace klesající, tedy záporná vlevo od x0 a kladná vpravo. Funkce f bude tedy mít v bodě x0 maximální hodnotu ze všech hodnot na nějakém okolí. Funkce diferencovatelná na (a, b) a spojitá na [a, b] má jistě na tomto intervalu absolutní maximum a minimum. Může ho dosáhnout pouze buď na hranici nebo v bodě s nulovou derivací, tj. v kritickém bodě. Pro diskusi extrémů nám tedy mohou stačit kritické body a druhé derivace pomůžou určit typy extrémů, pokud jsou nenulové. Pro přesnější diskusi ale potřebujeme lepší než lineární aproximace zkoumaných funkcí. Proto se nejprve budeme věnovat úvahám v tomto směru a teprve poté se vrátíme k diskusi průběhu funkcí. 6.6 6.7. Taylorův rozvoj. Jako překvapivě jednoduché využití Rolleovy věty teď odvodíme mimořádně důležitý výsledek. Říkává se mu Taylorův rozvoj se zbytkem. Intuitivně se k němu můžeme dostat obrácením našich úvah kolem mocninných řad. Máme-li totiž mocninnou řadu S(x) = n=0 an(x - a)n 182 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET a derivujeme-li ji opakovaně, dostáváme mocninné řady (víme, že je možné takový výraz derivovat člen po členu, i když jsme to ještě nedokázali) S(k) (x) = n=k n(n - 1) . . . (n - k + 1)an(x - a)n-k . V bodě x = a je tedy S(k) (a) = k!ak. Můžeme tedy naopak číst poslední tvrzení jako rovnici pro ak a původní řadu přepsat jako S(x) = n=0 1 k! S(k) (a)(x - a)n . Jestliže místo mocninné řady máme nějakou dostatečně hladkou funkci f(x), je tedy na místě se ptát, zda ji můžeme vyjádřit jako mocninnou řadu a jak rychle budou konvergovat částečné součty (tj. přiblížení funkce f polynomy). Naše úvaha právě naznačila, že můžeme očekávat v okolí bodu a dobrou aproximaxi polynomy, tzv. Taylorovými polynomy k­tého řádu: Pkf(x) = f(a) + f (a)(x - a) + 1 2 f (a)(x - a)2 + + 1 k! fk (a)(x - a)k . Přesná odpověď vypadá podobně jako věta o střední hodnotě, jen pracujeme s vyššími stupni plynomů (tzv. Taylorův rozvoj se zbytkem): Věta. Nechť je f(x) funkce k­krát diferencovatelná na intervalu (a, b) a spojitá na [a, b]. Pak pro každé x (a, b) existuje číslo c (a, x) takové, že f(x) = f(a) + f (a)(x - a) + + 1 (k - 1)! f(k-1) (a)(x - a)k-1 + 1 k! f(k) (c)(x - a)k = Pk-1f(x) + 1 k! f(k) (c)(x - a)k . Důkaz. Definujme zbytek R (tj. chybu při aproximaci pro pevně zvolené x) takto f(x) = Pk-1f(x) + R tj. R = 1 k! r(x - a)k pro vhodné číslo r (závislé na x). Nyní uvažujme funkci F() defino- vanou F() = k-1X j=0 1 j! f(j) ()(x - )j + 1 k! r(x - )k Její derivace je F () = f () + k-1X j=1 ,, 1 j! f(j+1) ()(x - )j - 1 (j - 1)! f(j) ()(x - )j-1 - 1 (k - 1)! r(x - )k-1 = 1 (k - 1)! f(k) ()(x - )k-1 - 1 (k - 1)! r(x - )k-1 = 1 (k - 1)! (x - )k-1 (f(k) () - r), protože výrazy v sumě se postupně vzájemně ruší. Nyní si stačí všimnout, že F(a) = F(x) = f(x) (připoměňme, že x je pevně zvolená ale pevná hodnota). Proto podle Rolleovy věty existuje číslo c, a < c < x, takové, že F (c) = 0. To ale je právě požadovaný vztah. 1. DERIVOVÁNÍ 183 Pokud tedy umíme odhadnout velikost k­té derivace na celém intervalu, dostaneme přímo odhady chyb. Speciálním případem je samozřejme věta o střední hodnotě coby aproximace řádu nula, viz (6.1). Dobrým příkladem jsou tady třeba goniometrické funkce. Iterováním derivace funkce sin x dostaneme vždy buď sinus nebo cosinus s nějakým znaménkem, ale v absolutní hodnotě budou hodnoty vždy nejvýše jedna. Dostáváme tedy přímý odhad rychlosti konvergence mocninné řady | sin x - (Pk sin)(x)| |x|k+1 (k + 1)! . Vidíme tedy, že pro x výrazně menší než k bude chyba malá, pro x srovnatelné s k nebo větší ale bude obrovská. 6.7.1. Určete Taylorovy rozvoje Tk x (k-tého řádu v bodě x) z následujících funkcí: (1) T3 0 z funkce sin x, (2) T3 1 z funkce ex x . Řešení. (1) Spočítáme hodnoty první až třetí derivace funkce f = sin v bodě 0: f (0) = cos(0) = 1, f(2) (0) = - sin(0) = 0, f(3) (0) = - cos(0) = -1, dále f(0) = 0 Taylorův rozvoj 3-tího řádu funkce sin(x) v bodě 0 je tedy T3 0 (sin(x)) = x - 1 6 x3 . (2) Opět f(1) = e, f (1) = ex x - ex x2 1 = 0 f(2) = ex x - 2 ex x 2 + 2ex x3 1 = e f(3) = ex x - 3 ex x 2 + 6ex x3 - 6ex x4 1 = -2e Dostáváme tedy Taylorův rozvoj třetího řádu funkce ex x v bodě 1: T3 1 ( ex x ) = e + e 2 (x - 1)2 - e 3 (x - 1)3 = e(- x3 3 + 3x2 2 - 2x + 5 6 ). 6.7.2. Určete Taylorův polynom T6 0 funkce sin a pomocí věty 6.6 odhadněte chybu polynomu v bodě /4. Řešení. Podobně jako v předchozím příkladu určíme T6 0 (sin(x)) = x - 1 6 x3 + 1 120 x5 . Dle věty 6.7 pak odhadneme velikost zbytku (chyby) R. Podle věty existuje c (0, 4 ) takové, že R(/4) = - cos(c)7 7!47 < 1 7! . = 0, 0002. 184 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET 6.7.3. Rozviňte funkci ln(1+x) do mocninné řady v bodech 0 a 1 a určete všechna x R, pro která tyto řady konvergují. Řešení. Rozvinout funkci do mocninné řady v daném bodě je to stejné, jako určit její Taylorův rovoj v daném bodě. ln(x + 1) = x - 1 2 x2 + 1 3 x3 - 1 4 x4 + . . . = ln(2) + 1 2 (x - 1) - 1 8 (x - 1)2 + 1 3 23 (x - 1)3 - 1 4 24 (x - 1)4 + . . . První řada konverguje pro -1 < x 1, druhá pro -1 < x 3. 6.7.4. Rozviňte do mocninné řady funkci cos2 (x) v bodě 0 a určete pro která reálná čísla tato řada konverguje. Řešení. i=0 (-1)i 22i-1 (2i)! x2i , konverguje pro libovolné reálné x. 6.7.5. Rozviňte do mocninné řady funkci sin2 (x) v bodě 0 a určete pro která reálná čísla tato řada konverguje. Řešení. i=1 (-1)i+1 22i-1 (2i)! x2i , konverguje pro libovolné reálné x. 6.7 6.8. Analytické a hladké funkce. Je-li f v bodě a hladká, pak můžeme napsat formálně mocninnou řadu S(x) = n=0 1 k! f(k) (a)(x - a)n . Taylorova věta nám říká, že pokud tato mocninná řada má nenulový poloměr konvergence, pak je S(x) = f(x) na příslušném intervalu. Takovým funkcím říkáme analytické funkce v bodě a. Funkce je analytická na intervalu, je-li analytická v každém jeho bodě. Ne všechny hladké funkce jsou ale analytické. Ve skutečnosti lze dokázat, že pro každou posloupnost čísel an umíme najít hladkou funkci, jejiž derivace řádů k budou tato čísla ak. Abychom si alespoň představili podstatu problému, ukážeme si funkci, která má v nule všechny derivace nulové, je však všude kromě tohoto bodu nenulová: f(x) = e-1/x2 . Je dobře definovaná hladká funkce pro všechny body x = 0. Derivací dostaneme f (x) = f(x) 2x-3 a iterovanou derivací dostaneme součet konečně mnoha členů tvaru C f(x) x-k , kde C je nějaké celé číslo a k je přirozené číslo. Pro každý výraz P(x)e-1/x2 , kde P je nějaký polynom, lze opakovanou aplikací ĽHospitalova 1. DERIVOVÁNÍ 185 pravidla snadno zjistit, že jde limitně k nule, při x jdoucím k nule. Dodefinujeme-li tedy hodnoty všech derivací naší funkce v nule rovnicí f(k) = 0, získáme hladkou funkci na celém R. Je vidět, že skutečně jde o nenulovou funkci všude mimo x = 0, všechny její derivace v tomto bodě jsou ale nulové. Samozřejmě to tedy není analytická funkce v bodě x0 = 0. Snadno můžeme naši funkci modifikovat takto: g(x) = 0 je-li x 0 e-1/x2 je-li x > 0 . Opět jde o hladkou funkci na celém R. Další úpravou můžeme získat funkci nenulovou ve všech vnitřních bodech intervalu [-a, a], a > 0 a nulovou jinde: h(x) = 0 je-li |x| a e 1 x2-a2 + 1 a2 je-li |x| < a. Tato funkce je opět hladká na celém R. Poslední dvě funkce jsou na obrázcích, vpravo je použit parametr a = 1. 0,8 0,6 0,4 0,2 x 0 43210 0-0,2-0,4 1 x 0,8 0,6 0,4 0,4 0,2 0,2 0 Nakonec ještě ukážeme, jak lze dostat hladké analogie Heavisideových funkcí. Pro dvě pevně zvolená reálná čísla a < b definujeme funkci f(x) s použitím výše definované funkce g takto: f(x) = g(x - a) g(x - a) + g(b - x) . Zjevně je pro každé x R jmenovatel zlomku kladný (pro každý z intervalů určených čísly a a b je totiž alespoň jeden ze sčítanců jmenovatele nenulový a tedy je celý jmenovatel kladný). Dostáváme z našeho definičního vztahu proto hladkou funkci f(x) na celém R. Při x a je přitom jmenovatel zlomku přímo dle definice funkce g nulový, při x b je čitatel i jmenovatel stejný. Na dalších dvou obrázcích jsou právě funkce f(x) a to s parametry a = 1 - , b = 1 + , kde nalevo je = 0.8 a napravo = 0.4. 186 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET 1 0,8 0,6 0,4 0,2 0 x 21,510,50 alpha=.8 1 0,8 0,6 0,4 0,2 0 x 21,510,50 alpha=.40000 6.8 6.9. Popis lokálního chování funkcí. Už jsme se setkali s významem druhé derivace při popisu kritických bodů. Teď zobecníme diskusi kritických bodů pro všechny řády. Budeme v dalším uvažovat funkce s dostatečným počtem spojitých derivací, aniž bychom tento předpoklad přímo uváděli. Řekneme, že bod a v definičním oboru funkce f je kritický bod řádu k, jestliže platí f (a) = = f(k) (a) = 0, f(k+1) (a) = 0. Předpokládejme, že f(k+1) (a) > 0. Pak je tato spojitá derivace kladná i na jistém okolí O(a) bodu a. Taylorův rozvoj se zbytkem nám v takovém případě dává pro všechna x z O(a) f(x) = f(a) + 1 (k + 1)! f(k+1) (c)(x - a)k+1 . Je proto změna hodnot f(x) v okolí bodu a dána chováním funkce (x - a)k+1 . Je-li přitom k + 1 sudé číslo, jsou nutně hodnoty f(x) v takovém okolí větší než hodnota f(a) a zjevně je proto bod a bodem lokálního minima. Pokud je ale k sudé číslo, pak jsou hodnoty vlevo menší a vpravo větší než než f(a), extrém tedy ani lokálně nenastává. Zato si můžeme všimnout, že graf funkce f(x) protíná svoji tečnu y = f(a) bodem [a, f(a)]. Naopak, je-li f(k+1) (a) < 0, pak ze stejného důvodu jde o lokální maximum při lichém k a extrém opět nenastává pro k sudé. Říkáme, že funkce f je v bodě a konkávní v bodě a, jestliže se její graf nachází v jistém okolí celý pod tečnou v bodě [a, f(a)], tj. f(x) < f(a) + f (a)(x - a). Říkáme, že funkce f je konvexní v bodě a, jetliže naopak je její graf nad tečnou v bodě a, tj. f(x) f(a) + f (a)(x - a). Funkce je konvexní nebo konkávní na intervalu, jestliže má tuto vlastnost v každém jeho bodě. 1. DERIVOVÁNÍ 187 Z Taylorova rozvoje druhého řádu se zbytkem dostáváme f(x) = f(a) + f (a)(x - a) + 1 2 f (c)(x - a)2 . Proto je zjevně funkce konvexní, kdykoliv je f (a) > 0, a je konkávní, kdykoliv f (a) < 0. Pokud je druhá derivace nulová, můžeme použít derivace vyšších řádů. Bod a nazýváme inflexní bod funkce f, jestliže graf funkce f přechází z jedné strany tečny na druhou. Napišme si Taylorův rozvoj třetího řádu se zbytkem: f(x) = f(a) + f (a)(x - a) + 1 2 f (a)(x - a)2 + 1 6 f (c)(x - a)3 . Je-li a nulový bod druhé derivace takový, že f (a) = 0, pak je třetí derivace nenulová i na nějakém okolí a jde proto zjevně o inflexní bod. Znaménko třetí derivace nám v takovém případě určuje, zda graf funkce přechází tečnu zdola nahoru nebo naopak. Poslední dobrou pomůckou pro náčrtek grafu funkce je zjištění asymptot, tj. přímek, ke kterým se blíží hodnoty funkce f. Asyptotou v nevlastním bodě je proto taková přímka y = ax + b, pro kterou je lim x (f(x) - ax - b) = 0. Pokud asymptota existuje, platí lim x (f(x) - ax) = b a tedy existuje i limita lim x f(x) x = a. Pokud ovšem existují poslední dvě limity, existuje i limita z definice asymptoty, jde proto i o podmínky dostatečné. Obdobně se definuje a počítá asymptota i v nevlastním bodě -. Tímto způsobem dohledáme všechny potenciální přímky splňující vlastnosti asymptot s konečnou reálnou směrnicí. Zbývají nám případné přímky kolmé na osu x: Asymptoty v bodech a R jsou přímky x = a takové, že funkce f má v bodě a alespoň jednu nekonečnou jednostrannou limitu. Např. racionální funkce lomené mají v nulových bodech jmenovatele, které nejsou nulovými body čitatele, asymptotu. Spočtěme aspoň jeden jednoduchý příklad: Funkce f(x) = x+1 x má za asymptoty přímky y = x a x = 0 (ověřte podrobně!). Derivací obdržíme f (x) = 1 - x-2 , f (x) = 2x-3 . Funkce f (x) má dva nulové body 1. V bodě x = 1 má funkce lokální minimum, v bodě x = -1 lokální maximum. Druhá derivace nemá nulové body v celém definičním oboru (-, 0) (0, ), f tedy nemá žádný inflexní bod. 188 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET -4 0-2-4 y x 4 4 2 0 2 -2 6.10. Příklady. 6.10.1. Do rovnostranného trojúhelníka o straně a je vepsán pravoúhelník (jedna jeho strana leží na straně trojúhelníka, zbylé dva vrcholy leží na zbylých stranách trojúhelníka). Jaký může mít maximálně obsah? Řešení. Vepsaný pravoúhelník má strany x, 3/2(a-x), tedy obsah 3/2(a-x)x. Maximum pro x = a/2, tedy maximální obsah je ( 3/8)a2 . 6.10.2. Ve čase t = 0 se začaly pohybovat tři body P, Q, R v rovině a to bod P z bodu [-2, 1] směrem (3, 1), rovnoměrnou rychlostí 10 m/s, bod Q z bodu [0, 0] směrem (-1, 1) rovnoměrně zrychleným pohybem se zrychlením 2 2 m/s2 a bod R z bodu [0, 1] směrem (1, 0) rovnoměrnou rychlostí 2 m/s. V jakém čase bude obsah trojúhelníku PQR minimální? Řešení. Rovnice bodů P, Q, R v čase jsou P : [-2, 1] + (3, 1)t Q : [0, 0] + (-1, 1)t2 R : [0, 1] + (2, 0)t Obsah trojúhelníka PQR je určený např. polovinou absolutní hodnoty determinantu, jehož řádky jsou souřadnice vektorů PQ a QR (viz Matematika I). Minimalizujeme tedy determinant: -2 + t t -t2 - 2t -1 + t2 = 2t3 - t + 2. Derivace je 6t2 - 1, extrémy tedy nastávají pro t = 1 6 , vzhledem k tomu, že uvažujeme pouze nezáporný čas, vyšetřujeme pouze t = 1 6 , jde o minimum, navíc je hodnota determinantu v tomto bodě kladná a menší, než hodnota v bodě 0 (krajní bod intervalu, na kterém hledáme extrém), je tedy o globální minimum obsahu v čase. 6.10.3. V devět hodin ráno vylezl starý vlk z nory N a v rámci ranní rozcvičky začal běhat proti směru hodinových ručiček po kružnici o poloměru 1km, kolem svého oblíbeného pařezu P a to rovnoměrnou rychlostí 4 km/h. Ve stejnou dobu vyrazila Karkulka z domu D k babičce sídlící v chaloupce C rychlostí 4 km/h (po přímce). Kdy si budou nejblíž a jaká tato vzdálenost bude? Souřadnice (v kilometrech): N = [2, 3], P = [3, 3], D = [0, 0], C = [5, 5]. 1. DERIVOVÁNÍ 189 Řešení. Vlk se pohybuje po jednotkové kružnici, jeho úhlová rychlost je tedy stejná jako jeho absolutní rychlost a jeho dráhu můžeme v závislosti na čase popsat následujícími parametrickými rovnicemi: x(t) = 2 - cos(4t), y(t) = 2 - sin(4t), Karkulka se pak pohybuje po dráze x(t) = 2 2t, y(t) = 2 2t. Nalezněme extrémy (čtverce) vzdálenosti jejich drah v čase: (t) = (2 - cos(4t) - 2 2t)2 + (2 - sin(4t) - 2 2t)2 (t) = 16(cos(4t) - sin(4t))( 2t - 1) + 32t + 4 2(cos(4t) + sin(4t)) - 16 2 Řešit algebraicky rovnici (t) = 0 se nám nepodaří (ani to nelze), zbývá pouze najít řešení numericky (pomocí výpočetního softwaru). Zjistíme, že lokální minima nastávají pro t . = 0, 31 a poté pro t . = 0, 97, kdy bude vzdálenost vlka a Karkulky asi 5 metrů. Je zřejmé, že půjde i o globální minimum. Situace, kdy neumíme explicitně vyřešit daný problém je v praxi velmi častá a použití numerických metod výpočtu tedy má velký význam. 6.10.4. Určete parametr c R tak, aby tečna ke grafu funkce ln(cx) x v bodě [1, 0] procházela bodem [2, 2]. Řešení. Podle zadání má mít tečna směrnici 2 (2-0 2-1 ). Směrnice je určena derivací funkce v daném bodě, dostáváme tedy podmínku 2 - ln(cx) 2 x (1) = 2, neboli 2 - ln(c) = 4, tedy c = 1 e2 . Pro c = 1 e2 je však hodnota fce ln(cx) x v bodě 1 rovna -2. Tedy žádné takové c neexistuje. 6.10.5. Vyšetřete průběh funkce x ln(x) , a načrtněte její graf. Řešení. (1) Nejprve určíme definiční obor funkce: R+ \ {1}. (2) Nalezneme intervaly monotónnosti funkce: nejprve nalezneme nulové body de- rivace: f (x) = ln(x) - 1 ln2 (x) = 0 Tato rovnice má kořen e. Dále vidíme, že f (x) je na intervalu (0, 1) i (1, e) záporná, tedy je f(x) na intervalu (0, 1) i na (1, e) klesající, dále je f (x) na intervalu (e, ) kladná a tedy f(x) rostoucí. Má tedy funkce f jediný extrém v bodě e a to minimum. (také bychom o tom mohli rozhodnout pomocí znaménka druhé derivace funkce f v bodě e, je totiž f(2) (e) > 0) 190 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET (3) Určíme inflexní body: f(2) (x) = ln(x) - 2 x ln3 (x) = 0 Tato rovnice má kořen e2 , který musí být inflexním bodem (extrém to již být nemůže vzhledem k předchozímu bodu). (4) Asymptoty. Funkce má asymptotu přímku x = 1. Dále hledejme asymptoty s konečnou směrnicí k: k = limx x ln(x) x = lim x 1 ln(x) = 0. Pokud asymptota existuje, má tedy směrnici 0. Pokračujme tedy ve výpočtu lim × x ln(x) - 0 x = lim x ln(x) = , a protože limita není konečná, asymptota s konečnou směrnicí neexistuje. Průběh funkce: ­4 ­2 0 2 4 6 8 10 y 2 4 6 8 10 12 14 16 18 20 x 6.10.6. Vyšetřete průběh funkce ln(x) x (tj. mimo jiné najít extrémy, inflexní body, asymptoty) a načrtněte její graf. Řešení. Def. obor R+ , globální maximum x = e, infl. bod x = e3, rostoucí na int (0, e), klesající na (e, ), konkávní (0, e3, konvexní ( e3, ), asymptoty x = 0 a y = 0, limx0 f(x) = -, limx f(x) = 0. 6.10.7. Vyšetřete průběh funkce (mimo jiné najít extrémy, inflexní body, asymptoty). ln(x2 - 3x + 2) + x. Řešení. Def. obor R \ 1, 2 . Lokální maximum x = 1- 5 2 , na celém def. oboru konkávní, asymptoty x = 1, x = 2. 6.10.8. Vyšetřete průběh funkce (mimo jiné najít extrémy, inflexní body, asymptoty). ln(x2 - 3x + 2) + x. Řešení. Def. obor R \ 1, 2 . Lokální maximum x = 1- 5 2 , na celém def. oboru konkávní, asymptoty x = 1, x = 2. 2. INTEGROVÁNÍ 191 6.10.9. Vyšetřete průběh funkce (mimo jiné nalezněte extrémy, inflexní body a asymptoty): (x2 - 2)ex2 -1 . Řešení. Def. obor R. Lokální minima v -1, 1, maximum v 0. Funkce sudá. Inflexní body 1 2 , bez asymptot. 6.10.10. Vyšetřete průběh funkce (mimo jiné nalezněte extrémy, inflexní body a asymptoty): ln(2x2 - x - 1). Řešení. Def. obor R\ -1 2 , 1 . Glob. extrémy nemá. Bez inflexních bodů, asymptoty x = -1 2 , x = 1. 6.10.11. Vyšetřete průběh funkce (mimo jiné nalezněte extrémy, inflexní body a asymptoty): x2 - 2 x - 1 . Řešení. Def. obor R \ {1}. Bez extrémů. Bez infl. bodů, na int. (-, 1) konvexní, (1, ) konkávní, Asymptota bez směrnice x = 1. Asymptota se směrnicí y = x + 1. 2. Integrování 6.9 6.11. Newtonův integrál. Předpokládejme, že známe na intervalu [a, b] reálnou nebo komplexní funkci F(x) reálné proměnné x a její derivaci F (x) = f(x). Jestliže rozdělíme interval [a, b] na n částí volbou bodů e6.2 (6.2) a = x0 < x1 < < xn = b a přiblížíme hodnoty derivací v bodech xi výrazy f(x) F(xi+1) - F(xi) xi+1 - xi dostáváme součtem F(b) - F(a) = n-1 i=0 F(xi+1) - F(xi) xi+1 - xi (xi+1 - xi) n-1 i=0 f(xi) (xi+1 - xi). Funkci F nazýváme antiderivace nebo neurčitý integrál k funkci f a poslední výraz pro reálnou funkci f(x) zjevně přibližně vyjadřuje plochu vytyčenou grafem funkce f, souřadnou osou x a přímkami x = a, x = b (včetně znaménka zohledňujícího pozici plochy nad nebo pod osou x -- namalujte si obrázek!). Dá se tedy očekávat, že takovou plochu skutečně spočteme jako rozdíl hodnot antiderivace v krajních bodech intervalu. Tomuto postupu se také říká Newtonův integrál. Píšeme b a f(x)dx = [F(x)]b a = F(b) - F(a). V případě komplexní funkce f je i reálná a imaginární část jejího integrálu jednoznačně dána reálnou a imaginární částí f, budeme proto v dalším pracovat výhradně s reálnými funkcemi. 192 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET V dalším skutečně ukážeme, že lze rozumně definovat pojem plocha v rovině tak, aby ji bylo možné počítat právě uvedeným způsobem. Newtonův integrál má ale jednu podstatnou vadu -- jeho vyčíslení vyžaduje znalost antiderivace. Tu obecně není snadné spočíst i když ukážeme, že ke všem spojitým funkcím f existuje. Proto budeme napřed diskutovat i jinou definici integrálu. Všimněme si ještě, že antiderivace je na každém souvislém intervalu [a, b] určena jednoznačně až na konstantu. Skutečně, pokud je F (x) = G (x) = f(x), pak Taylorův rozvoj prvního řádu se zbytkem v bodě a dává F(x) - G(x) = F(a) - G(a) + (f(c) - f(c))(x - a) = F(a) - G(a) na nějakém okolí bodu a. Pokud by ale x0 < b bylo supremem hodnot, pro které tento vztah ještě platí, opětovnou volbou tohoto bodu za a dosáhneme rozšíření tohoto vztahu i napravo od něj. Musí tedy platit na celém intervalu. S poukazem na toto pozorování budeme neurčitý integrál také zapisovat ve tvaru F(t) = f(x)dx + C. 6.11 6.12. Riemannův integrál. Pro definici integrálu využijeme přímo intuitivní úvahy, kterou jsme v minulém odstavci odůvodňovali souvislost Newtonova integrálu s velikostí plochy. Uvažme reálnou funkci f definovanou na intervalu [a, b] a zvolme dělení (6.2) tohoto intervalu, spolu s výběrem reprezentantů i jednotlivých částí, tj. a = x0 < x1 < < xn = b a zároveň i [xi-1, xi], i = 1, . . . , n. Normou takového dělení nazýváme číslo min{xi - xi-1}. Riemannův součet odpovídající zvolenému dělení = (x0, . . . , xn) a reprezentantům je dán výrazem S, = n i=1 f(i) (xi - xi-1) Řekneme, že Riemannův integrál funkce f na intervalu [a, b] existuje, jestliže pro každou posloupnost dělení s reprezentanty (k, k) s normou dělení jdoucí k nule existuje limita lim k Sk,k = S, jejíž hodnota navíc nezávisí na volbě posloupnosti dělení a reprezentantů. Píšeme v takovém případě opět S = b a f(x)dx. Tato definice nevypadá příliš prakticky, nicméně nám dovolí sformulovat a dokázat některé jednoduché vlastnosti Riemannova integrálu. Věta. (1) Je-li f omezená reálná funkce definovaná na reálném intervalu [a, b] a c [a, b] nějaký vnitřní bod, potom integrál b a f(x)dx existuje tehdy a jen tehdy když existují oba integrály c a f(x)dx a b c f(x)dx. V takovém případě pak také platí b a f(x)dx = c a f(x)dx + b c f(x)dx. 2. INTEGROVÁNÍ 193 (2) Jsou-li f a g dvě reálné funkce definované na intervalu [a, b], a existují-li integrály b a f(x)dx a b a g(x)dx, pak existuje také integrál jejich součtu a platí b a (f(x) + g(x))dx = b a f(x)dx + b a g(x)dx. (3) Je-li f reálná funkce definovaná na intervalu [a, b], C R konstanta a existuje-li integrál b a f(x)dx, pak existuje také integrál b a C f(x)dx a platí b a C f(x)dx = C b a f(x)dx. Důkaz. (1) Předpokládejme nejprve, že existuje integrál přes celý interval. Jistě se lze při jeho výpočtu omezit na limity Riemannových součtů, jejichž dělení mají bod c mezi svými dělícími body. Každý takový součet dostaneme jako součet dvou dílčích Riemannových součtů. Pokud by tyto dílčí součty v limitě závisely na zvolených rozděleních a reprezentantech, pak by celkové součty nemohly být v limitě na volbách nezávislé (stačí ponechat jednu posloupnost dělení podintervalu stejnou a druhou měnit tak, aby se limita změnila). Naopak, jestliže existují Riemannovy integrály na obou podintervalech, jsou libovolně přesně aproximovatelné Riemannovými součty a to navíc nezávisle na jejich volbě. Pokud do libovolné posloupnosti Riemannových součtů přes celý interval [a, b] přidáme jeden dělící bod c navíc, změníme hodnotu celého součtu i částečných součtů přes intervaly patřící do [a, c] a [c, b] nejvýše o násobek normy dělení a možných rozdílů omezené funkce f na celém [a, b]. To je číslo jdoucí libovolně blízko k nule při zmenšující se normě dělení. Proto nutně i částečné Riemannovy součty nutně konvergují k limitám, jejichž součtem je Riemannův integrál přes [a, b]. (2) V každém Riemannově součtu se součet funkcí projeví jako součet hodnot ve vybraných reprezentantech. Protože je násobení reálných čísel distributivní, vyplývá odtud právě dokazované tvrzení. (3) Stejná úvaha jako v předchozím případě. 6.12 6.13. Věta. Pro každou spojitou funkci f na konečném intervalu [a, b] existuje její Riemannův integrál b a f(x)dx. Navíc, je funkce F(t) zadaná na intervalu [a, b] pomocí Riemannova integrálu F(t) = t a f(x)dx antiderivací funkce f na tomto intervalu. Důkaz. Pro důkaz existence použijeme alternativní definici, která nahrazuje výběr reprezentatů a příslušné hodnoty f(i) pomocí suprem hodnot f(x) v příslušném podintervalu, resp. pomocí infim f(x) tamtéž. Hovoříme o horních Riemannových součtech, resp. dolních Riemannových součtech (někdy také o tzv. Darbouxově integrálu). Protože je naše funkce spojitá, je jistě i omezená na uzavřeném intervalu a proto jsou všechna výše uvažovaná suprema i infima konečná. Je tedy horní součet příslušný dělení zadán výrazem S,sup = n i=1 sup xi-1xi f() (xi - xi-1) 194 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Zatímco dolní Riemannův součet je S,inf = n i=1 inf xi-1xi f() (xi - xi-1). Protože zjevně pro každé dělení s reprezentanty (, ) platí S,inf S, S,sup a infima i suprema lze libovolně přesně aproximovat skutečnými hodnotami, bude Riemannův integrál existovat právě když bude existovat pro libovolné posloupnosti dělení s normou jdoucí k nule limita horních i dolních součtů a tyto si budou rovny. Dokážeme, že tomu tak skutečně musí být. Tvrzení. Nechť je funkce f omezená na uzavřeném intervalu [a, b]. Pak Ssup = inf S,sup, Sinf = sup S,inf jsou limity všech posloupností horních, resp. dolních, součtů s normou jdoucí k nule. Důkaz. Pokud zjemníme nějaké rozdělení 1 na 2 přidáním dalších bodů, zřejmě bude S1,sup S2,sup, S1,inf S2,inf . Každá dvě dělení mají společné zjemnění, jsou tedy hodnoty Ssup = inf S,sup, Sinf = sup S,inf dobrými kandidáty na limity horních a dolních součtů. Skutečně, pokud existuje společná limita horních součtů S nezávislá na zvolené posloupnosti dělení, musí to být právě Ssup, a podobně pro dolní součty. Naopak, uvažme nějaké pevně zvolené dělení s n vnitřními dělícími body intervalu [a, b], a jiné dělení 1, jehož norma je hodně malé číslo . Ve společném zjemnění 2 bude jen n intervalů, které budou do součtu Ssup přispívat případně menším příspěvkem než je tomu v 1. Protože je f omezená funkce na [a, b], bude každý z těchto příspěvků ohraničený univerzální konstantou krát velikost intervalu. Při zvolení dostatečně malého tedy nebude vzdálenost S1,sup od Ssup více než dvakrát vzdálenost S,sup od Ssup. Právě jsme ukázali, že pro libovolné číslo > 0 umíme najít takové > 0, že pro všechna dělení s normou nejvýše bude |S,sup -S| < . To je přesné tvrzení, že číslo Ssup je limitou všech posloupností horních součtů s normami dělení jdoucími k nule. Úplně stejně se dokáže i tvrzení pro součty dolní. Prozatím jsme ze spojitosti naší funkce f využili pouze to, že každá taková funkce je na konečném uzavřeném intervalu omezená. Zbývá nám ale ukázat, že pro spojité funkce je Ssup = Sinf . Ze definice spojitosti víme, že pro každý pevně zvolený bod x [a, b] a každé okolí O (f(x)) existuje okolí O(x) takové, že f(O(x)) O (f(x)). Toto tvrzení lze přepsat takto: jsou-li y, z O(x), tzn. mimo jiné platí |y - z| < 2, je také f(y), f(z) O (f(x)), tzn. mimo jiné platí |f(y) - f(z)| < 2 . Budeme potřebovat globální variantu takového tvrzení: Tvrzení. Nechť je f spojitá funkce na uzavřeném konečném intervalu [a, b]. Pak pro každé číslo > 0 existuje takové číslo > 0, že pro všechny z, y [a, b] splňující |y - z| < platí |f(y) - f(z)| < . 2. INTEGROVÁNÍ 195 Důkaz. Protože je každý konečný uzavřený interval kompaktní, umíme jej celý pokrýt konečně mnoha okolími O(x)(x) zmiňovanými v souvislosti se spojitostí výše, přičemž jejich poloměr (x) závisí na středu x zatímco čísla budeme uvažovat pořád stejná. Zvolíme konečně za minimum ze všech (konečně mnoha) (x). Naše spojitá funkce f tedy má požadovanou vlastnost (pouze zaměňujeme čísla a za jejich dvojnásobky). Nyní již snadno dokončíme celý důkaz existence Riemannova integrálu. Zvolme si a jako v posledním tvrzení a uvažujme jakékoliv dělení s n intervaly a normou nejvýš . Pak n i=1 sup xi-1xi f() (xi - xi-1) - n i=1 inf xi-1xi f() (xi - xi-1) n i=1 sup xi-1xi f() - inf xi-1xi f() (xi - xi-1) (b - a). Vidíme tedy, že se zmenšující se normou dělení jsou k sobě horní a dolní součty libovolně blízké. Proto infima a suprema splývají. To jsme potřebovali ukázat. Víme již, že pro spojitou funkci f na intervalu [a, b] existuje pro každé t [a, b] integrál t a f(x)dx. Zvolme jako výše k pevnému malému > 0 číslo > 0 tak, aby |f(x + x) - f(x)| < pro všechna 0 x < . Potom ovšem při použití dostatečně jemného dělení intervalu [a, t + t] dostaneme 1 t t+t a f(x)dx - t a f(t)dt - f(t) < . Skutečně, přiblížením integrálů kterýmkoliv Riemannovým součtem s dělením , v němž je t jedním z vnitřních bodů, dostaneme sčítance f(i)(xi - xi-1) s i [t, t + t] (ostatní se vyruší v rozdílu). Všechny hodnoty f(i) jsou ale k f(t) blíže než o . To ovšem znamená, že existuje v bodě t derivace funkce F(t) zprava a je rovna f(t). Stejně dokážeme výsledek pro derivaci zleva a celá věta je dokázaná. Důležité poznámky. (1) Předchozí dvě věty nám říkají, že integrál je lineární zobrazení : C[a, b] R vektorového prostoru spojitých funkcí na intervalu [a, b] do reálných čísel (tj. lineární forma). (2) Dokázali jsme, že každá spojitá funkce je derivací nějaké funkce. Newtonův a Riemannův integrál tedy jako koncepty pro spojité funkce splývají. Riemannův integrál spojitých funkcí lze proto spočíst pomocí rozdílu hodnot F(b) - F(a) antiderivace F. (3) V prvním pomocném tvrzení v důkazu předchozí věty jsme dokázali důležité tvrzení, že pro omezenou funkci f na intervalu [a, b] vždy existují limity horních součtů i dolních součtů. Říká se jim také horní Riemannův integrál a dolní Riemannův integrál. Takto lze pro omezené funkce ekvivalentně definovat i Riemannův integrál (jak jsme konečně v důkazu i činili). (4) V dalším tvrzení v důkazu jsme odvodili důležitou vlastnost spojitých funkcí, které se říká stejnoměrná spojitost na uzavřeném intervalu [a, b]. Zjevně 196 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET je každá stejnoměrně spojitá funkce také spojitá, naopak to ale na otevřených intervalech platit nemusí. (5) Uvažme funkci f na intervalu [a, b], která je pouze po částech spojitá. To znamená, že je spojitá ve všech bodech c [a, b] kromě konečně mnoha bodů nespojitosti ci, a < ci < b. Vzhledem k aditivnosti integrálu vůči intervalu přes který se integruje, viz 6.12(1), existuje podle poslední věty v takovém případě integrál F(t) = t a f(x)dx pro všechna t [a, b] a derivace funkce F(t) existuje ve všech bodech t, ve kterých je f spojitá. Navíc se snadno ověří, že ve zbývajících bodech je funkce F(t) spojitá, je to tedy spojitá funkce na celém intervalu [a, b]. Při výpočtu integrálu pomocí antiderivací je zapotřebí volit její jednotlivé části tak, aby na sebe navazovaly. Pak bude i celý integrál vyčíslen jako rozdíl v krajních hodnotách. 6.13 6.14. Integrace ,,po paměti . Neurčitý integrál nám formálně dovoluje spočíst Riemannův integrál pro každou spojitou funkci. Nicméně prakticky bývá zejména použitelný tam, kde v integrované funkci umíme derivaci přímo uvidět. K tomu v jednoduchých případech stačí číst tabulky pro derivace funkcí v našem zvěřinci naopak. Dostáváme tak např. následující tvrzení pro všechna a R a n Z, n = -1: a dx = ax + C axn dx = a n + 1 xn+1 + C eax dx = 1 a eax +C a x dx = a ln x + C a cos bx dx = a b sin bx + C a sin bx dx = - a b cos bx + C a cos bx sinn bx dx = a b(n + 1) sinn+1 bx + C a sin bx cosn bx dx = - a b(n + 1) cosn+1 bx + C a tg bx dx = - a b ln(cos bx) + C a a2 + x2 dx = arctg x a + C -1 a2 - x2 dx = arccos x a + C 1 a2 - x2 dx = arcsin x a + C 2. INTEGROVÁNÍ 197 kde ve všech případech je zapotřebí zvážit definiční obor, na kterém je neurčitý integrál dobře definován. K takovýmto tabulkovým hodnotám lze relativně snadno dodávat další jednoduchými pozorováními vhodné struktury integrovaných funkcí. Např. f (x) f(x) dx = ln f(x) + C. 6.13 6.15. Integrace per partes a substitucí. Výpočet integrálu pomocí antiderivace (neurčitého integrálu), spolu s pravidlem (F G) (t) = F (t) G(t) + F(t) G (t) pro derivaci součinu funkcí, dává následující formuli pro neurčitý integrál F(x) G(x) + C = F (x)G(x) dx + F(x)G (x) dx. Tato formule se většinou používá v případě, že jeden z integrálů napravo máme počítat, zatímco druhý umíme počítat lépe. Uveďme si nějaké příklady. Nejprve spočteme I = x sin x dx. V tomto případě pomůže volba F(x) = x, G (x) = sin x. Odtud G(x) = - cos x, proto také I = -x cos x - - cos x dx = -x cos x + sin x + C. Obvyklým trikem je také použít tento postup s F (x) = 1: ln x dx = 1 ln x dx = x ln x - 1 x x dx = x ln x - x + C. Další užitečný vzorec je odvozen z derivování složených funkcí. Je-li F (y) = f(y) a y = (x), potom dF((x)) dx = F (y) (x) a tedy F(y) + C = f(y) dy lze spočíst jako F((x)) + C = f((x)) (x) dx. Dosazením x = -1 (y) pak dostaneme původně požadovanou antiderivaci. Častěji zapisujeme tuto skutečnost takto: f(y) dy = f((x)) (x) dx a hovoříme o substituci za proměnnou y. Přímo na úrovni Riemannových součtů je možné substituci porozumět snadno tak, že přírůstky v proměnné y a v x jsou vzájemně ve vztahu popsaném formálně jako dy = (x) dx který odpovídá vztahu dy dx = (x) a snadno jej spočítáme výpočtem derivace. Jako příklad ověříme touto metodou předposlední integrál v seznamu v 6.13. Pro integrál I = 1 1 - x2 dx 198 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET zvolíme substituci x = sin t. Odtud dx = cos t dt a dostáváme I = 1 1 - sin2 t cos t dt = 1 cos2 t cos t dt = dt = t + C. Zpětným dosazením t = acrsin x dopočítáme již známý vzorec I = arcsin x + C. Při substitucích je třeba dát pozor na skutečnou existenci inverzní funkce k y = (x) a při výpočtu určitého integrálu je třeba řádně přepočítávat i meze. 6.15 6.16. Příklad. Často vede použití substitucí a metody per partes k rekurentním vztahům, ze kterých teprve lze dopočíst hledané integrály. Spočtěme si alespoň jeden příklad. Metodou per partes počítáme Im = cosm x dx = cosm-1 x cos x dx = cosm-1 x sin x - (m - 1) cosm-2 x(- sin x) sin x dx = cosm-1 x sin x + (m - 1) cosm-2 x sin2 x dx. Odtud díky vztahu sin2 x = 1 - cos2 x dostáváme mIm = cosm-1 x sin x + (m - 1)Im-2 a počáteční hodnoty jsou I0 = x, I1 = sin x. K těmto typům integrálů se substitucí x = tg t často převádí integrály, kde integrovaná funkce závisí na výrazech tvaru (x2 + 1). Skutečně, např. pro Jk = dx (x2 + 1)k dostáváme touto substitucí dx = cos-2 t dt Jk = dt cos2 t sin2 t cos2 t + 1 k = cos2k-2 t dt. Pro k = 2 je výsledkem J2 = 1 2 (cos t sin t + t) = 1 2 tg t 1 + tg2 t + t a proto také po zpětné substituci t = arctg x J2 = 1 2 x 1 + x2 + arctg x + C. Při počítání určitých integrálů je možné celou rekurenci rovnou počítat po vyčíslení v zadaných mezích. Tak například je okamžitě vidět, že při integraci přes 2. INTEGROVÁNÍ 199 interval [0, 2] je I0 = 2 0 dx = [x]2 0 = 2 I1 = 2 0 cos x dx = [sin x]2 0 = 0 Im = 2 0 cosm x dx = 0 pro sudá m m-1 m Im-2 pro lichá m . Pro sudé m = 2n tedy dostáváme přímo výsledek 2 0 cos2n x dx = (2n - 1)(2n - 3) . . . 3 1 2n(2n - 2) . . . 2 2, zatímco u lichých m je to vždy nula (jak bylo možné přímo uhádnout z grafu funkce cos x). 6.16.1. 1. Vypočtěte: (1) x cos x dx (2) ln x dx Řešení. V obou případech řešíme metodou per partes. (1) x sin x + cos x (2) x ln x - x 6.16.2. 2. Vypočtěte: (1) 2 0 sin x sin 2x dx (2) sin2 x sin 2x dx Řešení. (1) 2 3 (2) 1 2 sin4 x 6.16.3. 3. Dokažte, že 1 2 sin4 x = - 1 4 cos(2x) + 1 16 cos(4x) + 3 16 . Řešení. Funkce na pravé a levé straně rovnosti mají shodné derivace, tudíž se liší o reálnou konstantu. Tuto konstantu určíme porovnáním funkčních hodnot v jednom bodě, například bodě 0. Hodnota obou funkcí je v nule nulová, jsou si tedy rovny. 200 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET 6.16 6.17. Integrace racionálních funkcí lomených. U racionálních funkcí lomených si můžeme při integraci pomoci několika zjednodušeními. Zejména v případě, že je stupeň polynomu f v čitateli větší nebo roven stupni polynomu g v jmenovateli, je rozumné hned z kraje dělením se zbytkem převést integraci na součet dvou integrálů. První pak bude integrací polynomu a druhý integrací výrazu f/g se stupněm g ostře větším, než je stupeň f. Toho skutečně dosáhneme prostým vydělením polynomů: f = q g + h, f g = q + h g . Můžeme tedy zrovna předpokládat, že stupeň g je ostře větší než stupeň f. Další postup si ukažme na jednoduchém příkladě. Zkusme si rozebrat, jak se dostaneme k výsledku f(x) g(x) = 4x + 2 x2 + 3x + 2 = -2 x + 1 + 6 x + 2 , který již umíme integrovat přímo: 4x + 2 x2 + 3x + 2 dx = -2 ln |x + 1| + 6 ln |x + 2| + C. Především převedením součtu zlomků na společného jmenovatele tuto rovnost snadno ověříme. Pokud naopak víme, že lze náš výraz rozepsat ve tvaru 4x + 2 x2 + 3x + 2 = A x + 1 + B x + 2 a jde nám pouze o výpočet koeficientů A a B, můžeme pro ně získat rovnice pomocí roznásobení obou stran polynomem x2 + 3x + 2 ze jmenovatele a porovnáním koeficientů u jednotlivých mocnin x ve výsledných polynomech napravo i nalevo: 4x + 2 = A(x + 2) + B(x + 1) = 2A + B = 2, A + B = 4. Odtud již přímo vychází náš rozklad. Říká se mu rozklad na parciální zlomky. Zkusme nyní zobecnit naše pozorování. Předpokládejme, že jmenovatel g(x) naší racionální funkce lomené má právě n různých reálných kořenů a1, . . . , an a předpokládejme, že naopak čitatel f(x) ani jedno z těchto čísel jako kořen nemá. Pak jsou body a1, . . . an právě všechny body nespojitosti funkce f(x)/g(x) a nabízí se tedy jako co nejjednodušší sčítance v součtu s podobnou vlastností výrazy tvaru p(x) (x - ai)ni . Chceme úspěšně použít stejný postup pro výpočet jako v předchozím jednoduchém příkladě. Musíme si proto hlídat, abychom po roznásobení uměli dosazením vhodných hodnot za volné koeficienty v polynomech p(x) dostat napravo i nalevo stejné polynomy. Podbízí se tedy hledat sčítance, kde ni bude násobnost kořene ai, zatímco p(x) bude polynom stupně ni - 1. Ověřte si, že taková volba naplňuje právě sformulovaný záměr. Např. lze snadno spočíst, že x - 4 (x + 1)(x - 2)2 = -5 9(x + 1) + 5x - 16 9(x - 2)2 . Takto to skutečně projde vždy, kdy má polynom g(x) v čitateli právě tolik reálných kořenů včetně násobnosti, kolik je jeho stupeň. Opět už umíme integrovat výsledné 2. INTEGROVÁNÍ 201 sčítance. První typ jsme už viděli. Druhý typ rozdělíme na součet dvou zlomků: 5x - 16 9(x - 2)2 = 5 9 x - 2 (x - 2)2 - 6 9 1 (x - 2)2 = 5 9 1 x - 2 - 6 9 1 (x - 2)2 . tyto už opět integrovat umíme. Mohli jsme samozřejmě již rovnou hledat původní rozklad na parciální zlomky ve tvaru x - 4 (x + 1)(x - 2)2 = A x + 1 + B x - 2 + C (x - 2)2 . Obdobně můžeme vždy spočíst rozklad na parciální zlomky u mocniny stupně n ­ bude v něm n sčítanců s konstantou v čitateli a postupně narůstajícími mocninami příslušného lineárního faktoru ve jmenovateli. Zbývá ošetřit ještě případ, kdy reálných kořenů není dostatek. Vždycky ale existuje rozklad g(x) na lineární a kvadratické faktory (ty kvadratické odpovídají dvojicím komplexně sdružených kořenů). Každý takový kvadratický faktor lze upravit na součet čtverců (x-a)2 +b2 , budeme pro zjednodušení rovnou počítat s x2 +b2 . Opět stejný požadavek na počet volných koeficientů a stupně nám naznačuje, že bude možné hledat příslušné sčítance ve tvaru Bx + C (x - a)2 + b2 . Obdobně jako v případě násobných kořenů se i v případě mocniny (x2 + b2 )n takového faktoru druhého řádu vždy podaří najít odpovídající rozklad na parciální zlomky tvaru A1x + B1 (x - a)2 + b2 + + Anx + Bn ((x - a)2 + b2)n . Konkrétní výsledky lze také snadno ozkoušet v Maplu pomocí volání procedury ,,convert(h, parfrac, x) , které rozloží výraz h v proměnné x na parciální zlomky. Všechny výše uvedené parciální zlomky už umíme integrovat. Připoměňme, že ty poslední zmíněné vedou mimo jiné na integrály diskutované v Příkladu 6.16. Celkově můžeme shrnout, že racionální funkce f(x)/g(x) lze poměrně snadno integrovat, pokud se podaří najít příslušný rozklad polynomu ve jmenovateli g(x). Při výpočtu určitých integrálů jsou ale problematické body nespojitosti racionálních funkcí lomených, v jejichž okolí jsou tyto funkce neohraničené. Tomuto problému se budeme obecně věnovat v následujícím odstavci. 6.17 6.18. Nevlastní a nekonečné integrály. Jak jsme právě viděli, občas musíme pracovat s určitými integrály přes intervaly, v nichž jsou i body, kde integrovaná funkce f(x) má nevlastní (jednostranné) limity. V takovém případě není integrovaná funkce ani spojitá ani omezená a proto pro ni nemusí platit námi odvozené výsledky. Hovoříme o ,,nevlastním integrálu . Jednoduchým východiskem je diskutovat v takovém případě určité integrály na menších intervalech s hranicí blížící se problematickému bodu a zkoumat, zda existuje limitní hodnota takovýchto určitých integrálů. Pokud existuje, řekneme, že příslušný nevlastní integrál existuje a je roven této limitě. Uvedeme postup na jednoduchém příkladě: I = 2 0 dx 4 2 - x 202 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET je nevlastní integrál, protože je má funkce f(x) = (2 - x)-1/4 v bodě b = 2 limitu zleva rovnou . V ostatních bodech je integrovaná funkce spojitá. Zajímáme se proto o integrály I = 2- 0 dx 4 2 - x = 2 y-1/4 dy = - 4 3 y3/4 2 = 4 3 23/4 - 4 3 3/4 . Všimněme si, že jsme ve výpočtu substitucí dostali integrál s přepočtenou horní mezí a dolní mezí 2. Otočením mezí do obvyklé polohy jsme do výrazu přidali jedno znaménko - navíc. Limita pro 0 zprava zjevně existuje a spočítali jsme tedy nevlastní určitý integrál I = 2 0 dx 4 2 - x = 4 3 23/4 . Stejně budeme postupovat, pokud je zadáno integrování přes neohraničený interval. Hovoříme o nekonečných integrálech. Obecně tedy např. pro a R I = a f(x) dx = lim b b a f(x) dx, pokud limita vpravo existuje. Obdobně můžeme mít horní mez integrování konečnou a druhou nekonečnou. Pokud jsou nekonečné obě, počítáme integrál jako součet dvou integrálů s libovolně pevně zvolenou pevnou mezí uprostřed, tj. f(x) dx = a f(x) dx + a f(x) dx Existence ani hodnota nezávisí na volbě takové meze, protože její změnou pouze o stejnou konečnou hodnotu měníme oba sčítance, ovšem s opačným znaménkem. Naopak limita při které by stejně rychle šla horní i dolní mez do může vést k odlišným výsledkům! Např. a -a x dx = [ 1 2 x2 ]a -a = 0, přestože hodnoty integrálů a x dx s jednou pevnou mezí utečou rychle k nekončených hodnotám. Ukažme si opět výpočet nekonečného integrálu na příkladě (jeden z typů parciálních zlomků, integrál vyřešíme snadno substitucí x2 + a2 = t, 2x dx = dt) 0 x (x2 + a2)2 dx = lim b -1 2(x2 + a2) b 0 = lim b - 1 2b2 + 2a2 + 1 2a2 = 1 2a2 . Při výpočtu určitého integrálu z racionální funkce lomené musíme pečlivě rozdělit zadaný interval podle bodů nespojitosti integrované funkce a spočítat jednotlivé nevlastní integrály každý zvlášť. Navíc je nutné rozdělit celý interval tak, abychom vždy integrovali funkci neohraničenou pouze v okolí jednoho z krajních bodů. 6.19. Příklady. 6.19.1. Spočtěte neurčitý integrál 1 x4 + 3x3 + 5x2 + 4x + 2 dx. Řešení. 1 2 ln(x2 + 2 x + 2) - 1 2 ln(x2 + x + 1) + 1 3 3 arctan (2x+1) 3 3 + C. 2. INTEGROVÁNÍ 203 6.19.2. Vypočtěte integrál 2 4 sin(t) 1 - cos2 x dt. Řešení. 1 2 ln 2+ln(2) 2-ln(2) . 6.19.3. Vypočtěte integrál ln(2) 0 dx e2x - 3ex . Řešení. -1 6 - 2 9 ln(2). 6.18 6.20. Příklady užití integrálu. Sama definice Riemanova integrálu byla odvozena od představy velikosti plochy v rovině se souřadnicemi x a y ohraničené osou x, hodnotami funkce y = f(x) a hraničními přímkami x = a, x = b. Přitom je plocha nad osou x dána s kladným znaménkem zatímco hodnoty pod osou vedou ke znaménku zápornému. Ve skutečnosti víme pouze, co je to plocha rovnoběžnostěnu určeného dvěma vektory, obecněji ve vektorovém prostoru Rn víme, co je to objem rovnoběžnostěnu. Plochy jiných podmnožin je teprve třeba definovat. Pro některé jednoduché objekty jako třeba mnohoúhelníky je definice dána přirozeně předpokládanými vlastnostmi. Námi vybudovaný koncept Riemannova integrálu je možné zatím přímo použít pouze k měření ,,objemu jednorozměrných podmnožin. O podmnožině A R řekneme, že je (Riemannovsky) měřitelná, jestliže je funkce : R R A(x) = 1 jestliže je x A 0 jestliže je x / A Riemannovsky integrovatelná, tj. existuje integrál (ať už s konečnou nebo nekonečnou hodnotou) m(A) = A(x) dx. Funkci A říkáme charakteristická funkce množiny A. Všimněme si, že pro interval A = [a, b] jde vlastně o hodnotu A(x) dx = b a dx = b - a, přesně jak jsme očekávali. Zároveň má takováto definice ,,velikosti očekávanou vlastnost, že míra sjednocení dvou Riemannovsky měřitelných disjunktních množin vyjde jako součet (detailně tu ani nebudeme dokazovat). Pokud ale vezmeme spočetné sjednocení, taková vlastnost již neplatí. Např. stačí vzít množinu Q všech racionálních čísel jakožto sjednocení jednoprvkových podmnožin. Zatímco každá množina o konečně mnoha bodech má podle naší definice míru nulovou, charakteristická funkce Q není Riemannovsky integrovatelná. Pro definici plochy (objemu) ve vícerozměrných prostorech budeme umět použít koncept Riemannova integrálu, až jej zobecníme do vícerozměrného případu. Nicméně je dobré si už teď povšimnout, že skutečně původní představa o ploše rovinného útvaru uzavřeného výše uvedeným způsobem grafem funkce bude bezezbytku naplněna. 204 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Střední hodnota funkce f(x) na intervalu (konečném nebo nekonečném) [a, b] je definována výrazem m = 1 b - a b a f(x) dx. Z definice je m výška obdélníka (s orientací podle znaménka) nad intervalem [a, b], který má stejnou plochu jako je plocha mezi osou x a grafem funkce f(x). Námi vybudovaný integrál jde také dobře použít pro výpočet délky křivky ve vícerozměrném vektorovém prostoru Rn . Pro jednoduchost si to předvedeme na případu křivky v rovině R2 se souřadnicemi x, y. Mějme tedy parametrický popis křivky F : R R2 , F(t) = [g(t), f(t)] a představme si ji jako dráhu pohybu. Derivací tohoto zobrazení dostaneme hodnoty, které budou odpovídat rychlosti pohybu po takovéto dráze. Proto celková délka křivky (tj. dráha uražená za dobu mezi hodnotami t = a, t = b) bude dána integrálem přes interval [a, b], kde integrovanou funkcí h(t) budou právě velikosti vektorů F (t). Chceme tedy spočíst délku s rovnou s = b a h(t) dt = b a (f (t))2 + (g (t))2 dt. Ve speciálním případě, kdy křivka je grafem funkce y = f(x) mezi body a < b obdžíme pro její délku s = b a 1 + (f (x))2 dx Tentýž výsledek lze intuitivně vidět jako důsledek Pythagorovy věty: pro lineární přírůstek délky křivky s odpovídající přírůstku x proměnné x spočteme totiž právě s = x2 + y2 a to při pohledu přímo na naši definici integrálu znamená s = b a 1 + dy dx 2 dx. Jako snadný příklad spočteme délku jednotkové kružnice jako dvojnásobek integrálu funkce y = 1 - x2 v mezích [-1, 1]. Víme již, že musí vyjít číslo 2, protože jsme takto číslo definovali. s = 2 1 -1 1 + (y )2 dx = 2 1 -1 1 + x2 1 - x2 dx = 2 1 -1 1 1 - x2 dx = 2[arcsin x]1 -1 = 2. Jestliže v předchozím výpočtu budeme počítat s y = r2 - x2 = r 1 - (x/r)2 a meze budou [-r, r], dostaneme substitucí x = rt déku kružnice o poloměru r: s(r) = 2 r -r 1 + (x/r)2 1 - (x/r)2 dx = 2 1 -1 r 1 - t2 dt = 2r[arcsin x]1 -1 = 2r, tzn. že je skutečně délka kružnice lineárně závislá na jejím poloměru. 2. INTEGROVÁNÍ 205 Podobně plochu takové kružnice spočteme substitucí x = r sin t, dx = r cos t dt (s využitím výsledku pro I2 v 6.16) a(r) = 2 r -r r2 - x2 dx = 2r2 /2 -/2 cos2 t dt = 2r2 2 [cos t sin t + t] /2 -/2 = r2 . Další obdobou téhož principu je výpočet povrchu nebo objemu rotačního tělesa. Pokud vznikne těleso rotací grafu funkce f kolem osy x v intervalu [a, b], vzniká při přírůstku x nárůst plochy o násobek s délky křivky zadané grafem funkce f a velikosti kružnice o poloměru f(x). Plocha se proto spočte formulí A(f) = 2 b a f(x) ds = 2 b a f(x) 1 + (f (x))2 dx, kde ds = dx2 + dy2 je dán přírůstkem délky křivky y = f(x). Objem stejného tělesa naroste při změně x o násobek tohoto přírůstku a plochy kružnice o poloměru f(x). Proto je dán formulí V (f) = b a (f(x))2 dx. Jako příklad užití posledních dvou vzorců odvodíme známé formule pro plochu jednotkové sféry a objem jednotkové koule. Ar = 2 r -r r 1 - (x/r)2 1 1 - (x/r)2 dt = 2r r -r dt = 4r2 Vr = r -r r2 - x2 dx = 2rr2 - 1 3 x3 r -r = 4 3 r3 . 6.20.1. Odvoďte vzorec pro výpočet povrchu a objemu kužele. 6.20.2. Určete délku křivky dané parametricky x = sin2 (t), y = cos2 (t), pro t 0, 2 . Řešení. Možno počítat i přímo (jedná se o část přímky y = 1 - x). 2. 6.20.3. Určete délku křivky dané parametricky x = t2 , y = t3 pro t 0, 5 . Řešení. 335 27 6.20.4. Určete plochu ležící napravo od přímky x = 3 a dále ohraničenou grafem funkce y = 1 x3-1 a osou x. 206 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Řešení. Plocha je dána nevlastním integrálem 1 1 x3-1 dx. Vypočteme jej metodou rozkladu na parciální zlomky: 1 x3 - 1 = Ax + B x2 + x + 1 + C x - 1 1 = (Ax + B)(x - 1) + C(x2 + x + 1) x = 1 = C = 1 3 x0 : 1 = C - B = B = - 2 3 x2 : 0 = A + C = A = - 1 3 a můžeme psát 1 1 x3 - 1 dx = 1 3 1 1 (x - 1) x + 2 x2 + x + 1 dx Nyní určíme zvlášť neurčitý integrál x+2 x2+x+1 dx: x + 2 x2 + x + 1 dx = = x + 1 2 (x + 1 2 )2 + 3 4 dx + 3 2 1 (x + 1 2 )2 + 3 4 dx = substituce u prvního integrálu t = x2 + x + 1 dt = 2(x + 1 2 ) dx = 1 2 1 t dt + 3 2 1 (x + 1 2 )2 + 3 4 = substituce u prvního integrálu s = x + 1 2 ds = dx = 1 2 ln(x2 + x + 1) + 3 2 1 s2 + 3 4 ds = = 1 2 ln((x2 + x + 1) + 3 2 4 3 1 2 3 s 2 + 1 ds = substituce u druhého integrálu u = 2 3 s du = 2 3 s ds = 1 2 ln(x2 + x + 1) + 2 3 2 1 u2 + 1 du = = 1 2 ln(x2 + x + 1) + 3 arctan(u) = 1 2 ln(x2 + x + 1) + 3 arctan 2x + 1 3 . Celkem pak pro nevlastní integrál můžeme psát: 1 1 x3 - 1 dx = 1 3 lim ln |x - 1| - 1 2 ln(x2 + x + 1) - 3 arctan 2x + 1 3 3 = = 1 3 lim 1 3 ln | - 1| - 1 2 ln(2 + + 1) - 3 arctan 2 + 1 3 - - 1 3 ln(2) + 1 6 ln(13) + 3 3 arctan 7 3 = = 1 6 ln(13) - 1 3 ln(2) + 3 3 arctan 7 3 - 2. INTEGROVÁNÍ 207 - 1 3 lim ln x - 1 x2 + x + 1 - 1 3 lim 3 arctan 2 + 1 3 = = 1 6 ln(13) + 1 3 arctan 7 3 - 1 3 ln(2) - 3 6 6.20.5. Určete povrch a objem rotačního paraboloidu, který vznikne rotací části paraboly y = 2x2 pro x 0, 1 kolem osy y. Řešení. Vzorce uvedené v textech platí pro rotaci křivek kolem osy x! Je tedy nutno buď integrovat podle danou křivku neznámé y, nebo transformovat. V = 2 0 x 2 dx = S = 2 2 0 x 2 ( 1 + 1 8x ) dx = 2 2 0 x 2 + 1 16 dx = 17 17 - 1 24 dx. Pomocí nevlastního integrálu také umíme rozhodnout o konvegenci širší třídy nekonečných řad než doposud: 6.21. Věta. Integrální kriterium konvergence řad. Buď n=1 f(n) řada taková, že funkce f : R R je kladná a nerostoucí na intervalu 1, ). Pak tato řada konverguje právě tehdy, když konverguje intergrál 1 f(x) dx. Důkaz. Pokud interpretujeme integrál, jako plochu pod křivkou, je kriterium zřejmé. Pokud daná řada diverguje, pak diverguje i řada n=2 f(n). Pro libovolné k N máme pro k-tý částečný součet sk (řady bez prvního člene) nerovnost sk = k n=2 f(n) < k 1 f(x) dx, neboť sk je dolním součtem Riemannova integrálu k 1 f(x) dx. Pak ale je 1 f(x) dx = lim k k 1 f(x) dx > lim k sk = , a uvažovaný integrál diverguje. Předpokládeme nyní, že daný integrál konverguje a označme k-tý částečný součet dané řady jako sk. Potom máme nerovnosti 1 f(x) dx = lim k k 1 f(x) dx < lim k sk < , neboť sk je horním součtem Riemannova integrálu k 1 f(x) dx a předpokádáme, že daná řada konverguje. 6.21.1. 3. Rozhodněte, zda následující sumy konvergují či divergují: a) n=1 1 n ln n , 208 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET b) n=1 1 n2 . Řešení. Všimněme si nejprve, že ani u jedné z uvažovaných řad neumíme o její konvergenci rozhodnout na základě podílového či odmocninového kriteria (všechny limity lim n |an+1 an | i lim n n an jsou rovny 1). Pomocí integrálního kriteria pro konvergenci řad pak dostáváme: a) 1 1 x ln(x) dx = 0 1 t dt = lim [ln(t)] 0 = , daná řada tedy diverguje. b) 1 1 x2 dx = lim - 1 x 1 = 1, a daná řada tedy konverguje. 3. Nekonečné řady Již jsme se při budování našeho zvířetníku funkcí setkali s mocninnými řadami, které přirozeným způsobem rozšiřují skupinu všech polynomů, viz 5.28. Zároveň jsme si říkali, že takto získáme třídu analytických funkcí, ale nedokazovali jsme tehdy ani to, že jsou mocninné řady spojitými funkcemi. Snadno nyní ukážeme, že tomu tak je a že skutečně umíme mocninné řady i diferencovat a integrovat po jednotlivých sčítancích. Právě proto ale také uvidíme, že není možné pomocí mocninných řad získat dostatečně širokou třídu funkcí. Např. nikdy tak nedostaneme jen po částech spojisté periodické funkce, které jsou tak důležité pro modelování a zpracování audio a video signálů. 6.19 6.22. Jak ochočené jsou řady funkcí? Vraťme se nyní k diskusi limit posloupností funkcí a součtu řad funkcí z pohledu uplatnění postupů diferenciálního a integrálního počtu. Uvažujme tedy konvergentní řadu funkcí S(x) = n=1 fn(x) na intervalu [a, b]. Přirozené dotazy jsou: * Jsou-li všechny funkce fn(x) spojité v nějakém bodě x0 [a, b], je spojitá i funkce S(x) v bodě x0? * Jsou-li všechny funkce fn(x) diferencovatelné v a [a, b], je v něm diferencovatelná i funkce S(x) a platí vztah S (x) = n=1 fn(x)? * Jsou-li všechny funkce fn(x) integrovatelné na intervalu [a, b], je integrovatelná i funkce S(x) a platí vztah S (x) = n=1 fn(x)? Ukážeme si nejprve na příkladech, že odpovědi na všechny tři takto kladené otázky jsou ,,NE! . Poté ale najdeme jednoduché dodatečné podmínky na konvergenci řady, které naopak platnosti všech tří tvrzení zajistí. Řady funkcí tedy obecně moc zvladatelné nejsou, nicméně si umíme vybrat velikou třídu takových, se kterými se už pracuje velmi dobře. Mezi ně samozřejmě budou patřit mocninné řady. 3. NEKONEČNÉ ŘADY 209 Uvažme funkce fn(x) = (sin x)n na intervalu [0, ]. Hodnoty těchto funkcí budou ve všech bodech 0 x nezáporné a menší než jedna, kromě x = 2 , kde je hodnota 1. Proto lim n fn(x) = 0 pro všechna x = 2 1 pro x = 2 . Zjevně tedy je limita posloupnosti funkcí fn nespojitou funkcí. Tentýž jev umíme najít i pro řady funkcí, protože součet je limitou částečných součtů. Stačí tedy v předchozím příkladě vyjádřit fn jako n-tý částečný součet. Např. f1(x) = sin x, f2(x) = (sin x)2 - sin x, atd. Levý obrázek vykresluje funkce fn3 (x) pro n = 1, . . . , 10. x 32,5 0,2 1 0,5 0,4 1 20 0,6 1,5 0,8 0 -0,5 0,4 0,2 x 1 -0,4 -0,2 0 0-1 0,5 Obrázek na pravo vykresluje fn(x) = x(1-x2 )n na intervalu [-1, 1] pro hodnoty n = m2 , m = 1, . . . , 10. Na první pohled je zjevné, že lim n fn(x) = 0, všechny funkce fn(x) jsou hladké, ale v bodě x = 0 je jejich derivace fn(0) = (1 - x2 )n - 2nx2 (1 - x2 )n-1 |x=0 = 1 nezávisle na n. Limitní funkce pro posloupnost fn přitom má samozřejmě všude derivaci nulovou! Protipříklad k třetímu tvrzení jsme už viděli. Charakteristickou funkci Q racionálních čísel můžeme vyjádřit jakou součet spočetně mnoha funkcí, které budou očíslovány právě racionálními čísly a budou vždy všude nulové, kromě množiny bodů, podle které jsou pojmenovány, kde jsou rovny 1. Riemannovy integrály všech takových funkcí budou nulové, jejich součet ale není Riemannovsky inegrovatelnou funkcí. 6.20 6.23. Stejnoměrná konvergence posloupností a řad funkcí. Zjevným důvodem neúspěchu ve všech třech předchozích příkladech je skutečnost, že rychlost bodové konvergence hodnot fn(x) f(x) se bod od bodu velice liší. Přirozenou myšlenkou tedy je omezit se na takové případy, kdy bude naopak konvergence probíhat přibližně podobně rychle po celém intervalu. 210 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Říkáme, že posloupnost funkcí fn(x) konverguje stejnoměrně na intervalu [a, b] k limitě f(x), jestliže pro každé kladné (malé) číslo existuje (velké) přirozené číslo N N takové, že pro všechna n N a všechna x [a, b] platí |fn(x) - f(x)| < . Graficky si definici můžeme představit tak, že do pásu vzniklého posunutím limitní funkce f(x) na f(x) pro libovolně malé, ale pevně zvolené kladné , vždy padnou všechny funkce fn(x), až na konečně mnoho z nich. Tuto vlastnost zjevně neměl první a poslední z předchozích příkladů, u druhého ji postrádala posloupnost derivací fn. O řadě funkcí řekneme, že konverguje stejnoměrně na intervalu, jestliže stejnoměrně konverguje posloupnost jejích částečných součtů. Následující tři věty lze stručně shrnout tvrzením, že všechna tři obecně neplatná tvrzení v 6.22 platí pro stejnoměrnou konvergenci (pozor ale na jemnosti u derivování). 6.21 6.24. Věta. Nechť fn(x) je posloupnost funkcí spojitých na intervalu [a, b], která na tomto intervalu stejnoměrně konverguje k funkci f(x). Pak je také f(x) spojitá funkce na intervalu [a, b]. Důkaz. Chceme ukázat, že pro libovolný pevný bod x0 [a, b] a jakékoliv pevně zvolené malé > 0 bude |f(x) - f(x0)| < pro všechna x dostatečně blízká k x0. Z definice stejnoměrné spojitosti je pro naše > 0 |fn(x) - f(x)| < pro všechna x [a, b] a všechna dostatečně velká n. Zvolme si tedy nějaké takové n a uvažme > 0 tak, aby |fn(x) - fn(x0)| < pro všechna x z -okolí x0 (to je možné, protože všechny fn(x) jsou spojité). Pak |f(x) - f(x0)| < |f(x) - fn(x)| + |fn(x) - fn(x0)| + |fn(x0) - f(x0)| < 3 pro všechna x z námi zvoleného -okolí bodu x0. 6.22 6.25. Věta. Nechť fn(x) je posloupnost Riemannovsky integrovatelných funkcí na konečném intervalu [a, b], které stejnoměrně konvergují k funkci f(x). Pak také f(x) je integrovatelná a platí lim n b a fn(x) dx = b a ( lim n fn(x)) dx = b a f(x) dx. Důkaz. Důkaz se opírá o zobecnění vlastností Cauchyovských posloupností čísel na stejnoměrnou konvergenci funkcí. Tímto způsobem umíme pracovat s existencí limity posloupnosti integrálů, aniž bychom ji potřebovali znát. Řekneme, že posloupnost funkcí fn(x) na intervalu [a, b] je stejnoměrně Cauchyovská, jestliže pro každé (malé) kladné číslo existuje (velké) přirozené číslo N takové, že pro všechna x [a, b] a všechna n N platí |fn(x) - fm(x)| < . Zřejmě je každá stejnoměrně konvergentní posloupnost funkcí na intervalu [a, b] také stejnoměrně Cauchyovská na témže intervalu. Toto pozorování nám už stačí k důkazu naší věty, zastavíme se ale napřed u užitečného obráceného tvrzení: Tvrzení. Každá stejnoměrně Cauchyovská posloupnost funkcí fn(x) na intervalu [a, b] stejnoměrně konverguje k nějaké funkci f na tomto intervalu. 3. NEKONEČNÉ ŘADY 211 Důkaz. Z podmínky Cauchyovskosti posloupnosti funkcí okamžitě vyplývá, že také pro každý bod x [a, b] je posloupnost hodnot fn(x) Cauchyovskou posloupností reálných (případně komplexních) čísel. Bodově tedy nutně konverguje posloupnost funkcí fn(x) k nějaké funkci f(x). Ukážeme, že ve skutečnosti konverguje posloupnost fn(x) ke své limitě stejnoměrně. Zvolme N tak velké, aby |fn(x) - fm(x)| < pro nějaké předem zvolené malé kladné a všechna n N, x [a, b]. Nyní zvolíme pevně jedno takové n a odhadneme |fn(x) - f(x)| = lim m |fn(x) - fm(x)| pro všechna x [a, b]. Konečně se vrátíme ke snadnému důkazu věty: Připomeňme, že každá stejnoměrně konvergentní posloupnost funkcí je také stejnoměrně Cauchyovská a že Riemannovy součty pro jednotlivé členy naší posloupnosti konvergují k b a fn(x) dx nezávisle na výběru dělení a reprezentantů. Proto jestliže platí |fn(x) - fm(x)| < pro všechna x [a, b], pak také b a fn(x) dx - b a fm(x) dx |b - a|. Je tedy posloupnost čísel b a fn(x) dx Cauchyovská a proto konvergentní. Současně ale také díky stejnoměrné konvergenci posloupnosti fn(x) platí pro limitní funkci f(x) ze stejného důvodu, že její Riemannovy součty jsou libovolně blízké Riemannových součtům pro funkce fn s dostatečně velkým n a limitní funkce f(x) bude tedy opět integrovatelná. Zároveň b a fn(x) dx - b a f(x) dx |b - a|. a musí proto jít o správnou limitní hodnotu. Pro příslušný výsledek o derivacích je třeba zvýšené pozornosti ohledně před- pokladů: 6.23 6.26. Věta. Nechť fn(x) je posloupnost funkcí diferencovatelných na intervalu [a, b], která na tomto intervalu stejnoměrně konverguje k funkci f(x). Dále nechť jsou všechny derivace gn(x) = fn(x) spojité a nechť konvergují na témže intervalu stejnoměrně k funkci g(x). Pak je také funkce f(x) diferencovatelná na intervalu [a, b] a platí zde f (x) = g(x). Důkaz. Bez újmy na obecnosti můžeme předpokládat, že všechny naše funkce splňují fn(a) = 0 (v opačném případě je pozměníme o konstanty a na výsledku úvah se nic nezmění). Pak ovšem můžeme psát pro všechny x [a, b] fn(x) = x a gn(t) dt. 212 6. DIFERENCIÁLNÍ A INTEGRÁLNÍ POČET Protože ale funkce gn stejnoměrně konvergují k funkci g na celém [a, b], tedy tím spíše na intervalech [a, x], kde a x b, platí také f(x) = x a g(t) dt. Protože je funkce g coby stejnoměrná limita spojitých funkcí opět spojitou funkcí, dokázali jsme vše potřebné, viz Věta 6.12 o Riemannově integrálu a antiderivaci. 6.24 6.27. Důsledek. Pro nekonečné řady můžeme předchozí výsledky shrnout takto: Uvažme funkce fn(x) na intervalu I = [a, b]. (1) Jsou-li všechny funkce fn(x) spojité na I a řada S(x) = n=1 fn(x) konverguje stejnoměrně k funkci S(x), je i funkce S(x) spojitá na I. (2) Jsou-li všechny funkce fn(x) spojitě diferencovatelné na I, a obě řady S(x) = n=1 fn(x), T(x) = n=1 fn(x) konvergují stejnoměrně, pak je také funkce S(x) spojitě diferencovatelná a platí S (x) = T(x), tj. n=1 fn(x) = n=1 fn(x). (3) Jsou-li všechny funkce fn(x) Riemannovsky integrovatelné na I a řada S(x) = n=1 fn(x) konverguje stejnoměrně k funkci S(x) na I, je tamtéž integrovatelná i funkce S(x) a platí vztah b a n=1 fn(x) dx = n=1 b a fn(x) dx. 6.25 6.28. Test pro stejnoměrnou konvergenci. Nejjednodušším způsobem pro zjištění stejnoměrné konvergence funkcí je porovnání s absolutní konvergencí vhodné posloupnosti. Říkává se tomu často Weierstrassův test. Předpokládejme tedy, že máme řadu funkcí fn(x) na intervalu I = [a, b] a že navíc známe odhad |fn(x)| an R pro vhodné reálné konstanty an a všechna x [a, b]. Okamžitě můžeme odhadnout rozdíly částečných součtů sk(x) = k n=1 fn(x) pro různé indexy k. Pro k > m dostáváme |sk(x) - sm(x)| k n=m+1 fn(x) k n=m+1 |fn(x)| k n=m+1 ak. Pokud je řada (kladných) konstant n=1 an konvergentní, pak bude samozřejmě posloupnost jejích částečných součtů Caychyovská. Právě jsme ale spočetli, že v takovém případě bude posloupnost částečných součtů sn(x) stejnoměrně Caychyovská. Díky tvrzení dokázanému před chvílí v 6.25 jsme tedy právě dokázali násle- dující Tvrzení. Nechť fn(x) je posloupnost funkcí definovaných na intervalu I = [a, b] a platí |fn(x)| an R. Je-li řada čísel n=1 an konvergentní, pak řada S(x) = n=1 fn(x) konverguje stejnoměrně. 3. NEKONEČNÉ ŘADY 213 6.26 6.29. Důsledky pro mocninné řady. Weistrassův testu je velice užitečný pro diskusi mocninných řad S(x) = n=1 an(x - x0)n se středem v bodě x0. Při našem prvním setkání s mocninnými řadami jsme ukázali v 5.30, že každá taková řada konverguje na (x0 - , x0 + ), kde tzv. poloměr konvergence 0 může být také nula nebo . (viz také 5.33). Zejména jsme v důkazu věty 5.30 pro ověření konvergence řady S(x) používali srovnání s vhodnou geometrickou posloupností. Podle Weistrassova testu je proto řada S(x) stejnoměrně konvergentní na každém kompaktním (tj. konečném) intervalu [a,b] uvnitř intervalu (x0 - , x0 + ). Dokázali jsme tedy Důsledek. Každá mocninná řada S(x) je ve všech bodech uvnitř svého intervalu konvergence spojitá a spojitě diferencovatelná. Funkce S(x) je také integrovatelná a derivování i integrování lze provádět člen po členu. Ve skutečnosti platí také tzv. Abelova věta, která říká, že mocninné řady jsou spojité i v hraničních bodech svého definičního oboru (včetně případných nekonečných limit). Tu zde nedokazujeme. Právě dokázané příjemné vlastnosti mocninných řad zároveň poukazují na hranice jejich použitelnosti při modelování závislostí nějakých praktických jevů nebo procesů. Zejména není možné pomocí mocninných řad dobře modelovat po částech spojité funkce. Jak uvidíme v zápětí, je možné pro konkrétněji vymezené potřeby nacházet lepší sady funkcí fn(x) než jsou hodnoty fn(x) = xn . Nejznámějšími příklady jsou Fourierovy řady a tzv. wawelety, které přibolížíme v další kapitole. 6.29.1. Sečtěte řadu n=1 1 n2n . Nápověda: 2 dx xn+1 = 1 n2n . Řešení. Zaměnou sumace s integrací dostaneme integrál 2 n=1 1 xn+1 dx = ln 2. KAPITOLA 7 Spojité modely jak šikovně zachytit nelinární změny? ­ pořádně si je lineárně přibližme... V této kapitole se budeme snažit podat stručné náznaky, jak lze relativně jednoduše používat nástroje diferenciálního a integrálního počtu. V jistém smyslu půjde o postupy a nástroje podobné, jako jsme již viděli v kapitole třetí. Jen místo konečně rozměrných vektorů budou naše objekty nebo jejich stavy často prezentovány pomocí funkcí. V první části budeme aproximovat funkce pomocí předem pevně zvolených sad generátorů. V zásadě budeme ideově pokračovat v postupech, které známe z konce třetí části druhé kapitoly. Poté se budeme zabývat integrálními operacemi, tj. lineárními operátory definovanými na funkcích pomocí integrování. 1. Aproximace pomocí Fourierových řad 7.1 7.1. Vzdálenosti funkcí. Zvolme si pevně nějaký interval I = [a, b], konečný nebo nekonečný. Koncept integrování můžeme velice intuitivním způsobem využít pro vyjádření vzdálenosti funkcí definované na I: Pro každé dvě (reálné nebo komplexní) funkce f, g na I zkusíme definovat jejich vzdálenost f - g jako plochu oblasti vymezené mezi jejich grafy, tj. f - g 2 = b a |f(x) - g(x)|2 dx. Samozřejmě je třeba předpokládat, že tento Riemannův integrál existuje. Velikost f funkce f je pak její vzdálenost od funkce nulové, tj. f 2 = b a |f(x)|2 dx. Pro jednoduchost budeme pracovat s množinou S = S[a, b] omezených a po částech spojitých reálných funkcí na I, ale úvahy lze rozšiřovat podle potřeby (často ale za cenu značné technické námahy). Z námi již dokázaných vlastností integrování je okamžitě vidět, že S je vektorový prostor a že námi právě uvažovaná velikost je odvozena z dobře definovaného symetrického bilineárního zobrazení f, g = b a f(x)g(x) dx, které má všechny vlastnosti skalárního součinu. V konečněrozměrném případě jsme takto definovali velikost vektorů v odstavci 2.37. Nyní je to naprosto stejné a pokud zúžíme naši definici na vektorový prostor generovaný nad reálnými čísly jen konečně 215 216 7. SPOJITÉ MODELY mnoha funkcemi f1, . . . , fk, dostaneme opět dobře definovaný skalární součin na tomto konečněrozměrném vektorovém podprostoru. Jako příklad uvažme funkce fi = xi , i = 0, . . . , k. Jimi je v S generován (k+1)­ rozměrný vektorový podprostor Rk[x] všech polynomů stupně nejvýše k. Skalární součin dvou takových polynomů je dán integrálem. Každý polynom stupně nejvýše k je vyjádřen jednoznačným způsobem jako lineární kombinace generátorů f0, . . . , fk. Pokud by navíc naše generátory měly tu vlastnost, že e7.1 (7.1) fi, fj = 0 pro i = j 1 pro i = j jde o tzv. ortonormální bázi. Připomeňme si v této souvislosti proceduru Grammovy­ Schmidtovy ortogonalizace, viz 2.48, která z libovolného systému generátorů fi vytvoří nové ortogonální generátory gi téhož prostoru, tj. gi, gj = 0 pro všechny i = j. Spočteme je přitom postupně jako g1 = f1 a formulemi g +1 = f +1 + a1g1 + + a g , ai = f +1, gi gi 2 pro > 1. Aplikujme tuto proceduru na první tři polynomy 1, x, x2 na intervalu [-1, 1]. Dostaneme g1 = 1, g2 = x - 1 g1 2 1 -1 x 1 dx 1 = x - 0 = x g3 = x2 - 1 g1 2 1 -1 x2 1 dx 1 - 1 g2 2 1 -1 x2 x dx x = x2 - 1 3 . Příslušná ortogonální báze prostoru R2[x] na intervalu [-1, 1] je tedy 1, x, x2 - 3. Normalizací, tj. vhodným násobením skalárem tak, aby prvky v bázi měly velikost jedna dostaneme ortonormální bázi h1 = 1 2 , h2 = 3 2 x, h3 = 1 2 5 2 (3x2 - 1). Takovým ortonormálním generátorům Rk[x] se říká Legendreovy polynomy. 7.2 7.2. Ortogonální systémy funkcí. Připomeňme si výhody, které ortonormální báze podprostorů měly pro konečněrozměrné vektorové prostory. Můžeme pokračovat v předchozím příkladu polynomů a uvažovat třeba V = Rk[x] pro libovolné k > 2. Pro libovolnou funkci h V bude funkce H = h, h1 h1 + h, h2 h2 + h, h3 h3 jednoznačně určenou funkcí, která minimalizuje vzdálenost h - H mezi všemi funkcemi v R2[x]. Koeficienty pro nejlepší aproximaci zadané funkce pomocí funkce z vybraného podprostoru je možné tedy získat prostě integrací. Uvedený příklad podbízí následující zobecnění: Když provedeme proceduru Grammovy­Schmidtovy ortogonalizace pro všechny monomy 1, x, x2 , . . . , tj. pro spočetný systém generátorů, co z toho vznikne? Nebo ještě obecněji ­ co se stane, když zvolíme úplně libovolný spočetný systém lineárně nezávislých funkcí v S takový, že každé dvě různé z nich mají nulový skalární součin? Takovému systému 1. APROXIMACE POMOCÍ FOURIEROVÝCH ŘAD 217 funkcí na intervalu I říkáme ortogonální systém funkcí. Jestliže jsou všechny funkce fn v posloupnosti po dvou ortogonální a zároveň je pro všechna n velikost fn = 1 normovaná, hovoříme o ortonormálním systému funkcí. Nechť tedy tvoří posloupnost funcí fn ortogonální systém po částech spojitých funkcí na intervalu I = [a, b] a předpokládejme, že pro konstanty cn konverguje řada F(x) = n=1 cnfn stejnoměrně na I. Pak snadno vyjádříme skalární součin F, fn po jednotlivých sčítancích (viz Důsledek 6.27) a dostaneme F, fn = m=1 cm b a fm(x)fn(x) dx = cn fn 2 . Máme tedy tušení, v jakou přibližně odpověď je možné doufat, a docela přehledně nám ji skutečně dává následující věta: 7.3 7.3. Věta. Nechť fn, n = 1, 2, . . . , je ortogonální posloupnost funkcí Riemannovsky integrovatelných na I = [a, b] a nechť g je libovolná funkce Riemannovsky integrovatelná na I. Označme cn = fn -2 b a fn(x)g(x) dx. (1) Pro libovolné pevné n N má ze všech lineárních kombinací funkcí f1, . . . , fn nejmenší vzdálenost od g výraz hn = n i=1 cifi(x). (2) Řada čísel n=1 c2 n fn 2 vždy konverguje a platí n=1 c2 n fn 2 g 2 . (3) Vzdálenost g od částečných součtů sk = k n=1 cnfn jde v limitě k nule, tj. lim k g - sk 2 = 0, tehdy a jen tehdy, když n=1 c2 n fn 2 = g 2 . Ještě než se pustíme do důkazu, zkusíme lépe porozumět významu jednotlivých tvrzení této věty. Protože pracujeme s úplně libovolně zvoleným ortogonálním systémem funcí, nemůžeme očekávat, že lze dobře aproximovat jakoukoliv funkci pomocí lineárních kombinací funkcí fi. Např. když se omezíme u ortogonálních polynomů pouze na sudé stupně, určitě budeme dobře aproximovat pouze sudé funkce. Nicméně hned první tvrzení nám říká, že vždycky budeme dosahovat nejlepší možné aproximace částečnými součty. Druhé a třetí tvrzení pak můžeme vnímat jako analogii ke komým průmětům do podprostorů vyjádřených pomocí souřadnic. Skutečně, že pokud k dané funkci g bodově konverguje řada F(x) = n=1 cnfn, pak je funkce F(x) kolmým průmětem g do vektorového podprostoru všech takovýchto řad. 218 7. SPOJITÉ MODELY Na druhé straně ale naše věta neříká, že by částečné součty uvažované řady musely bodově konvergovat k nějaké funkci. Tj. řada F(x) nemusí být obecně konvergentní ani v případě, kdy nastane rovnost v (3). Pokud ale např. existuje konečná hodnota n=1 |ci| a všechny funkce fn jsou stejnoměrně omezené na I, pak zřejmě řada F(x) konverguje v každém x. Důkaz. Zvolme libovolnou lineární kombinaci f = k n=1 anfn a spočtěme její vzdálenost od g. Dostáváme g - k n=1 anfn 2 = b a g - k n=1 anfn 2 dx = b a g2 dx - 2 b a k n=1 anfng dx + b a k n=1 anfn 2 dx = g 2 - 2 k n=1 ancn + k n=1 a2 n fn 2 = g 2 + k n=1 fn 2 ((cn - an)2 - c2 n). Evidentně lze poslední výraz minimalizovat právě volbou an = cn a tím je první tvrzení dokázáno. Dosazením této volby dostáváme tzv. Besselovu identitu g - k n=1 cnfn 2 = g 2 - k n=1 c2 n fn 2 , ze které okamžitě díky nezápornosti levé strany vyplývá tzv. Besselova nerovnost k n=1 c2 n fn 2 g 2 . Tím je dokázáno druhé tvrzení, protože každá neklesající a shora omezená posloupnost reálných čísel má limitu (a je jí supremum celé množiny hodnot prvků posloupnosti). Jestliže v Besselově nerovnosti nastane rovnost, hovoříme o tzv. Parsevalově rovnosti. Přímo z definic vyplývá nyní tvrzení (3). Ortonogonální systém funkcí nazveme úplný ortogonální systém na intervalu I = [a, b], jetliže platí Parsevalova rovnost pro každou funkci g s konečnou velikostí g na tomto intervalu. 7.4 7.4. Fourierovy řady. Předchozí věta naznačuje, že umíme se spočetnými ortogonálními systémy fn funkcí pracovat velice podobně jako s konečnými ortogonálními bazemi vektorových prostorů, jsou tu ale zásadní rozdíly: * Není snadné říci, jak vypadá celý prostor konvergentních nebo stejnoměrně konvergentních řad F(x) = n=1 cnfn. * Pro danou integrovatelnou funkci umíme najít jen nejlepší možné přiblížení takovou řadou F(x). 1. APROXIMACE POMOCÍ FOURIEROVÝCH ŘAD 219 V případě, že místo ortonogonálního systému fn máme systém ortonormální, jsou formulky ve větě o něco jednodušší, žádné další zlepšení ale nenastane. Jako pěkný příklad na integrování lze elementárními metodami ověřit, že systém funkcí 1, sin x, cos x, sin 2x, cos 2x, . . . , sin nx, cos nx, . . . je ortogonální systém na intervalu [-, ] (a také na kterémkoliv jiném intervalu o délce 2). Řady z předchozí věty odpovídající tomuto systému nazýváme Fourierovy řady. I v obecném případě diskutovaném výše se někdy hovoří o obecných Fourierových řadách vzhledem k ortogonálnímu systému funkcí fn. Koeficienty cn se pak nazývají Fourierovy koeficienty funkce f. Na intervalu [-, ] jsou velikosti všech funkcí kromě první vždy , první má velikost 2. Lze dokázat, že náš systém funkcí je úplným ortogonálním systémem, nebudeme to zde ale dokazovat. Ve smyslu vzdálenosti funkcí definované pomocí našeho skalárního součinu proto budou částečné součty Fourierovy řady F(x) pro libovolnou funkci g(x) s konečným integrálem b a g(x)2 dx, tj. F(x) = a0 2 + n=1 (an cos(nx) + bn sin(nx)) s koeficienty an = 1 g(x) cos(nx) dx, bn = 1 g(x) sin(nx) dx, vždy konvergovat k funkci g(x). Z obecnějších úvah lze dovodit, že z konvergence v tomto smyslu vždy vyplývá bodová konvergence částečných součtů ve skoro všech bodech x I. Nebudeme zde ale ani vysvětlovat, co znamená ,,skoro všechny , ani nebudeme takový výsledek dokazovat. Jako příklad Fourierovy řady si uvedeme Fourierovu řadu pro periodickou funkci vzniklou z Heavisideovy funkce zúžením na jednu periodu. Tj. naše funkce g bude na intervalu [-, 0] rovna -1 a na intervalu [0, ] bude rovna 1. Protože jde o funkci lichou, jistě budou všechny koeficienty u funkcí cos(nx) nulové, a pro coeficienty u funkcí sin(nx) spočteme bn = 1 g(x) sin(nx) dx = 2 0 sin(nx) dx = 2 n (1 - (-1)n ). Výsledná Fourierova řada je tedy tvaru g(x) = 4 sin(x) + 1 3 sin(3x) + 1 5 sin(5x) + . . . a součet jejích prvních pěti a prvních padesáti členů je na následujících dvou ob- rázcích. Všimněme si, že se zvyšujícím se počtem členů řady se výrazně spřesňuje aproximace s výjimkou stále se zmenšujícího okolí bodu nespojitosti, na němž je ale maximum odchylky stále zhruba stejné. Je to obecná vlastnost Fourierových řad, které se říká Gibbsův jev. Povšimněme si také, že v samotném bodě nespojitosti je hodnota aproximující funkce právě v polovině mezi limitami zprava a zleva pro Heavisideovu funkci. 220 7. SPOJITÉ MODELY -1 0 2 x 0 -2 -0,5 0,5 -4 1 4 t=2. -1 0 2 x 4-2 -0,5 0 -4 1 0,5 t=24. Samozřejmě nelze očekávat, že by konvergence Fourierových řad pro funkce g s body nespojitosti mohla být stejnoměrná (to by totiž g musela být coby stejnoměrná limita spojitých funkcí sama spojitá!). Bez podrobného důkazu si uvedeme následující větu podávající ucelený obrázek o bodové konvergenci Fourierových řad. Nejde o nutné podmínky konvergence a v literatuře lze najít řadu jiných formulací. Tato je ale jednoduchá a postihuje velké množství užitečných případů. Věta. Nechť g je po částech spojitá a po částech monotonní funkce na intervalu [-, ]. Pak její Fourierova řada F(x) konverguje na [-, ] a její součet je * roven hodnotě g(x0) v každém bodě x0 [-, ], ve kterém je funkce g(x) spojitá, * v každém bodě nespojitosti x0 funkce g(x) roven 1 2 lim xx+ 0 g(x) + lim xx- 0 g(x) , * v krajních bodech intervalu [-, ] je roven 1 2 lim x-+ g(x) + lim xg(x) . Pokud navíc je funkce g(x) spojitá, periodická s periodou 2 a všude existuje její po částech spojitá derivace, pak konverguje její Fourierova řada stejnoměrně. 7.5 7.5. Wavelety. Fourierovy řady a další z nich vycházející nástroje jsou využívány ke zpracování různých signálů, obrázků apod. Povaha použitých periodických goniometrických funkcí a jejich prosté škálování pomocí zvětšující se frekvence zároveň omezují jejich použitelnost. V mnoha oborech proto vyvstala přirozená potřeba nalézt šikovnější úplné ortogonální systémy funkcí, které budou vycházet z předpokládané povahy dat a které bude možné efektivněji zpracovávat. Takový systém se lze například vytvořit volbou vhodné spojité funkce s kompaktním nosičem, ze které sestrojíme spočetně mnoho funkcí ij, j, k Z, pomocí dyadických translací a dilatací: jk(x) = 2j/2 (2j x - k). 2. INTEGRÁLNÍ OPERÁTORY 221 Pokud tvar mateřské funkce dobře vystihuje možné chování dat, a zároveň její potomci jk tvoří úplný ortogonální systém, pak se zpravidla dobře daří konkrétní zpracovávaný signál aproximovat pomocí jen několika málo funkcí. Nebudeme zde zacházet do podrobností, jde o mimořádně živý směr výzkumu i základ komerčních aplikací. Zájemce snadno najde spoustu literatury. Na obrázku je ilustrována tzv. Daubechies mateřská wavelet D4(x) a její dcera D4(2-3 x - 1). 1,2 2 0,8 0,4 1 0 0-1 t 3 4 t 252015 0 1,2 0 5 30 0,8 10 0,4 2. Integrální operátory 7.6 7.6. Integrální operátory. V případě konečněrozměrných vektorových prostorů jsme mohli vnímat vektory jako zobrazení z konečné množiny pevně zvolených generátorů do prostoru souřadnic. Nejjednodušší lineární zobrazení zobrazovala vektory do skalárů (tzv. lineární formy) a byla definována pomocí jednořádkových matic jako součet součinů těchto souřadnic s pevně zvolenými hodnotami na generátorech. Složitější zobrazení s hodnotami opět v tom samém prostoru pak byla obdobně zadána maticemi. Velice podobně umíme přistoupit k lineárním operacím na prostorech funkcí. V případě vektorového prostoru S všech po částech spojitých funkcí na intervalu I = [a, b] se lineární zobrazení S R nazývají (reálné) lineární funkcionály. Jednoduše je můžeme zadat dvěma způsoby ­ pomocí vyčíslení funkce (případně jejích derivací) v jednotlivých bodech nebo pomocí integrování. Příkladem funkcionálu L tedy může být vyčíslení v jediném pevném bodě x0 I L(f) = f(x0) integrální funkcionál pak je zadán pomocí pevně zvolené funkce g(x) L(f) = b a f(x)g(x) dx. Funkce g(x) zde hraje roli váhy, se kterou při definici Riemannova integrálu bereme jednotlivé hodnoty reprezentující funkci f(x). Nejjednodušším příkladem takového funkcionálu je samozřejmě Riemannův integrál samotný, tj. případ s g(x) = 1 pro 222 7. SPOJITÉ MODELY všechny body x. Dobrou představu dává také volba g(x) = 0 je-li |x| a e 1 x2-a2 + 1 a2 je-li |x| < a. To je funkce hladká na celém R s kompaktním nosičem v intervalu (-a, a), viz 6.8. V bodě x = 0 má přitom hodnotu jedna. Integrální funkcionál Ly(f) = b a f(x)g(y - x) dx je možné vnímat jako ,,rozmlžené zprůměrování hodnot funkce f kolem bodu x = y (obrázek funkce g je v 6.8 ­ ve svém středu má hodnotu jedna a hladkým monotonním způsobem se plynule přimkne k nule ve vzdálenosti a na obě strany). Ještě lepší volbou je z tohoto pohledu libovolná funkce g jejíž integrál přes celou reálnou osu je jednička. 7.7 7.7. Konvoluce funkcí. Pohled na integrální funkcionál Ly jako na zprůměrované chování funkce f v okolí daného bodu je názornější pro případ nevlastních mezí integrálu a = -, b = . Místo prostoru S všech po částech spojitých funkcí na R budeme uvažovat po částech spojité a v absolutní hodnotě integrovatelné funkce f v roli argumentu pro náš funkcionál. Volný parametr y může být vnímán jako nová nezávislá proměnná a naše operace tedy ve skutečnosti zobrazuje funkce opět na funkce f ~f: ~f(y) = Ly(f) = f(x)g(y - x) dx. Této operaci se říká konvoluce funkcí f a g, značíme ji f g. Většinou se konvoluce definuje pro reálné nebo komplexní funkce s kompaktním nosičem na celém R. Pomocí transformace t = z - x se snadno spočte (f g)(z) = f(x)g(z - x) dx = - - f(z - t)g(t) dt = (g f)(z), je tedy konvoluce coby binární operace na dvojicích funkcí s kompaktními nosiči komutativní. Konvoluce je mimořádně užitečný nástroj pro modelování způsobu, jak můžeme pozorovat experiment nebo jak se projevuje prostředí při přenosu informací (např. analogový audio nebo video signál ovlivňovaný šumy apod.). Argument f je přenášenou informací, funkce g je volena tak, aby co nejlépe vystihovala vlivy prostředí či zvoleného technického postupu. Konvoluce jsou jedním z mnoha případů obecných integrálních operátorů na prostorech funkcí K(f)(y) = b a f(x)k(y, x) dx s jádrem daným funkcí dvou proměnných k : R2 R. Definiční obor takových funkcionálů je nutné vždy volit s ohledem na vlastnosti jádra tak, aby vždy existoval použitý integrál. 2. INTEGRÁLNÍ OPERÁTORY 223 7.8 7.8. Fourierova transformace. Teorie integrálních operátorů s jádry a rovnic, které je obsahují je velice užitečná a zajímavá zároveň, bohužel pro ni zde teď ale nemáme dost prostoru. Zaměříme teď alespoň na jeden mimořádně důležitý případ, tzv. Fourierovu transformaci F, která úzce souvisí s Fourierovými řadami. Připomeňme si základní formuli pro parametrizaci jednotkové kružnice v komplexní rovině s rychlostí obíhání = 2/T, kde T je čas jednoho oběhu: eit = cos t + i sin t. Pro (reálnou nebo komplexní) funkci f(t) můžeme spočíst její tzv. komplexní Fourierovy koeficienty jako komplexní čísla cn = 1 T T/2 -T/2 f(t) e-int dt. Přitom platí vztahy mezi koeficienty an a bn Fourierových řad (po přepočtu formulí pro tyto koeficienty pro funkce s obecnou periodou délky T) a těmito čísly cn cn = 1 2 (an - ibn), c-n = 1 2 (an + ibn) a při reálném f jsou samozřejmě cn a c-n komplexně konjugované. Označíme-li n = n, bude tedy původní funkce f(t) s konvergující Fourierovou řadou rovna f(t) = n=cn eint . Při pevně zvoleném T vyjadřuje výraz = 2/T právě změnu ve frekvenci způsobenou nárustem n o jedničku. Je to tedy právě diskrétní krok, se kterým při výpočtu koeficientů Fourierovy řady měníme frekvence. Koeficient 1/T u formule pro cn je pak roven /2, takže můžeme řadu pro f(t) přepsat jako f(t) = n=- 1 2 T/2 -T/2 f(x) e-inx dx eint . Představme si nyní hodnoty n pro všechna n Z jako vybrané reprezentanty pro malé intervaly [n, n+1] o délce . Pak náš výraz ve vnitřní velké závorce v poslední formuli pro f(t) ve skutečnosti vyjadřuje sčítance Riemannových součtů pro nevlastní integrál 1 2 Z g() eit d kde g() je funkce nabývající v bodech n hodnoty g(n) = Z T/2 -T/2 f(x) e-inx dx. Předpokládejme, že naše funkce f je integrovatelná v absolutní hodnotě přes celé R. Pak můžeme limitně přejít T a dojde ke zejmňování normy našich intervalů. Zároveň se dostaneme v posledním výrazu k integrálu g() = Z f(x) e-ix dx. Můžeme tedy položit pro (každou v absolutní hodnotě Riemannovsky integrovatelnou) funkci f na R F(f)() = ~f() = 1 2 f(t) e-it dt. 224 7. SPOJITÉ MODELY Této funkci ~f říkáme Fourierova trasnformace funkce f. Přechozí úvahy pak ukazují, že pro ,,rozumné funkce f(t) bude také platit f(t) = F-1 ( ~f)(t) = 1 2 ~f() eit d. Tím říkáme, že existuje k právě definované Fourierově transformaci F inverzní operace F-1 , které říkáme inverzní Fourierova transformace. Všimněme si, že Fourierova transformace a její inverze jsou integrální operátory se skoro shodným jádrem k(, t) = eit . 7.9 7.9. Vlastnosti Fourierovy transformace. Fourierova transformace zajímavým způsobem převrací lokální a globální chování funkcí. Začněme jednoduchým příkladem, ve kterém najdeme funkci f(t), která se ztransformuje na charateristickou funkci intervalu [-, ], tj. ~f() = 0 pro || > a ~f = 1 pro || . Inverzní transformace F-1 nám dává f(t) = 1 2 - eit d = 1 2 1 it eit - = 2 2t 1 2i (eit - e-it ) = 2 2t sin(t). Přímým výpočtem limity v nule (ĽHospitalovo pravidlo) spočteme, že f(0) = 2(2)-1/2 , nejbližší nulové body jsou v t = / a funkce poměrně rychle klesá k nule mimo počátek x = 0. Na obrázku je tato funkce znázorněná zelenou křivkou pro = 20. Zároveň je vynesena červenou křivkou oblast, ve které se s rostoucím naše funkce f(t) stále rychleji ,,vlní . t 32 y 1 20 0 15 10 -1 5 0 -2 -5 -3 Omega=20.000 V dalším příkladu spočtěme Fourierovu transformaci derivace f (t) pro nějakou funkci f. Pro jednoduchost předpokládejme, že f má kompaktní nosič, tj, zejména 2. INTEGRÁLNÍ OPERÁTORY 225 F(f ) i F(f) skutečně existují a počítejme metodou per partes: F(f )() = 1 2 f (t) e-it dt = 1 2 [e -itf(t)] - + i 2 f(t) e-it dt = iF(f)() Vidíme tedy, že Fourierova transformace převádí (infinitesimální) operaci derivování na (algebraickou) operaci prostého násobení proměnnou. Samozřejmě můžeme tento vzorec iterovat, tj. F(f )() = -2 F(f), . . . , F(f(n) ) = in n F(f). Další mimořádně důležitou vlastností je vztah mezi konvolucemi a Fourierovou transformací. Spočtěme, jak dopadne transformace konvoluce h = f g, kde opět pro jednoduchost předpokládáme, že funkce mají kompaktní nosiče. Při výpočtu prohodíme pořadí integrovanání, což je krok, který ověříme teprve v diferenciálním a integrálním počtu později, viz 8.24. V dalším krůčku pak zavedeme substituci t - x = u. F(h)() = 1 2 - f(x)g(t - x) dx e-it dt = 1 2 - f(x) g(t - x) e-it dt dx = 1 2 - f(x) g(u) e-i(u+x) du dx = 1 2 f(x) e-ix dx g(u) e-iu) du = 2F(f) F(g) Podobný výpočet ukazuje i obrácené tvrzení, že Fourierova transformace součinu je, až na konstantu, konvoluce transformací. F(f g) = 1 2 F(f) F(g). Jak jsme si uváděli výše, konvoluce f g velice často modeluje proces našeho pozorování nějaké sledované veličiny f. Pomocí Fourierovy transformace a její inverze nyní můžeme snadno rozpoznat původní hodnoty této veličiny, pokud známe konvoluční jádro g. Prostě spočteme F(f g) a podělíme obrazem F(g). Hovoříme o dekonvoluci. Vraťme se nyní ještě k prvnímu příkladu s inverzní transformací k charakteristické funkci f intervalu [-, ]. Zkusme provést limitní přechod pro jdoucí k nekonečnu a označme 2(t) kýženou limitní ,,funkci pro F-1 (f)(t). Pro součin s libovolným obrazem F(g) platí F-1 (f F(g))(z) = 1 2 Z - g(t)F-1 (f)(z - t) dt. Při přejde výraz nalevo k F-1 (F(g))(z) = g(z), zatímco napravo dostáváme g(z) = Z g(t)(z - t) dt. 226 7. SPOJITÉ MODELY Naše hledaná (t) tedy vypadá na ,,funkci , která je všude nulová, kromě jediného bodu t = 0, kde je tak ,,nekonečná , že integrováním jejího součinu s libovolnou integrovatelnou funkcí g dostaneme právě hodnotu g v bodě t = 0. Není to samozřejmě funkce v našem smyslu, nicméně jde o objekt často používaný. Říká se jí Diracova funkce a korektně ji lze popsat jako tzv. distribuci. Z nedostatku času nebudeme distribuce podrobněji rozebírat a omezíme se na konstatování, že si lze dobře Diracovo představit jako jednotkový impulz v jediném bodě. Fourierova transformace jej pak přetransformuje na konstantní funkci F()() = 1 2 . Naopak mnohé funkce, které nejsou integrovatelné v absolutní hodnotě na R transformuje Fourierova transformace na výrazy s Diracovým . Např. F(cos(nt))() = r 2 ((n - ) + (n + )). 7.10 7.10. Poznámky o dalších transformacích. Pokud použijeme Fourierovu transformaci na lichou funkci f(t), tj. f(-t) = -f(t), příspěvek integrace součinu f(t) a funkce cos t se pro kladná a záporná t vyruší. Dostaneme proto přímým výpočtem F(f)() = -2i 2 0 f(t) sin t dt. Výsledná funkce je opět lichá, proto ze stejného důvodu i inverzní transformaci lze spočíst obdobně. Vynecháním imaginární jednotky i dostáváme vzájemně inverzní transformace, kterým se říká Fourierova sinusová transformace pro liché funkce: ~fs() = 2 0 f(t) sin t dt, f(t) = 2 0 ~fs(t) sin t dt. Obdobně se definuje Fourierova cosinová transformace pro sudé funkce. Fourierovu transformaci nelze dobře využít pro funkce, které nejsou integrovatelné v absolutní hodnotě přes celé R (minimálně nedostáváme opravdové funkce). Laplaceova transformace se chová docela podobně jako Fourierova a tuto vadu nemá: L(f)(s) = f(s) = 0 f(t) e-st dt. Integrální operátor L má velice rychle se zmenšující jádro, proto bude existovat L(p(t)) například pro každý polynom p a všechna kladná s. Obdobně jako pro Fourierovu transformaci dostaneme prostým výpočtem per partes vztah pro Laplaceovu transformaci derivované funkce při s > 0: L(f (t))(s) = 0 f (t) e-st dt = [f(t) e-st ] 0 + s 0 f(t) e-st dt = -f(0) + sL(f)(s). Vlastnosti Laplaceovy transformace a řadu dalších zejména v technické praxi používaných transformací je možné snadno dohledat v literatuře. Literatura [1] Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80- 210-3313-4. [2] Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Popisná statistika, Masarykova univerzita, 3. vydání, 2002, 48 stran, ISBN 80-210-1831-3. [3] Marie Budíková, Tomáš Lerch, Štěpán Mikoláš, Základní statistické metody, Masarykova univerzita, 2005, 170 stran, ISBN 80-210-3886-1. [4] Zuzana Došlá, Jaromír Kuben, Diferenciální počet funkcí jedné proměnné, MU Brno, 2003, 215 s., ISBN 80-210-3121-2. [5] Zuzana Došlá, Roman Plch, Petr Sojka, Diferenciální počet funkcí více proměnných s programem Maple, MU Brno, 1999, 273 s. [6] William J. Gilbert, W. Keith Nicholson, Modern algebra with applications, 2nd ed. John Wiley and Sons (Pure and applied mathematics) ISBN 0-471-41451-4 [7] Pavel Horák, Úvod do lineární algebry, MU Brno, skripta. [8] Ivana Horová, Jiří Zelinka, Numerické metody, MU Brno, 2. rozšířené vydání, 2004, 294 s., ISBN 80-210-3317-7. [9] Jiří Matoušek, Jaroslav Nešetřil, Kapitoly z diskrétní matematiky, Univerzita Karlova v Praze, Karolinum, Praha, 2000, 377 s. [10] Luboš Motl, Miloš Zahradník, Pěstujeme lineární algebru, 3. vydání, Univerzita Karlova v Praze, Karolinum, 348 stran (elektronické vydání také na http://www.kolej.mff.cuni.cz/~lmotm275/skripta/). [11] Riley, K.F., Hobson, M.P., Bence, S.J. Mathematical Methods for Physics and Engineering, second edition, Cambridge University Press, Cambridge 2004, ISBN 0 521 89067 5, xxiii + 1232 pp. [12] František Šik, Lineární algebra zaměřená na numerickou analýzu, MU, 1998, 176 s. ISBN 80-210-1996-2. [13] Jan Slovák, Lineární algebra. učební texty, Masarykova univerzita, elektronicky dostupné na www.math.muni.cz/~slovak [14] Pavol Zlatoš, Lineárna algebra a geometria, skripta MFF Univerzity komenského v Brati- slavě. [15] Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická statistika, Matfyzpress, Universita Karlova, 2006, 230 s. 385