Drsná matematika Martin Panák, Jan Slovák a „autorský kolektiv“ i Projekt netradiční základní učebnice matematiky pro studenty přírodních věd, informatiky, ekonomie apod., přibližující podstatnou část matematiky v rozsahu čtyř semestrálních přednášek. Text by měl být dokončen a vydán v roce 2013. Práce na učebnici jsou podpořeny projektem Univerzitní výuka matematiky v měnícím se světě (CZ.1.07/2.2.00/15.0203) ii Obsah Kapitola 1. Krůčky k matematickým problémům 1 1. Čísla a funkce 1 2. Kombinatorické veličiny 6 3. Diferenční rovnice 10 4. Pravděpodobnost 14 5. Geometrie v rovině 23 6. Relace a zobrazení 37 Kapitola 2. Elementární lineární algebra 50 1. Vektory a matice 50 2. Determinanty 62 3. Vektorové prostory a lineární zobrazení 70 4. Vlastnosti lineárních zobrazení 86 Kapitola 3. Linární modely a maticový počet 94 1. Lineární procesy 94 2. Diferenční rovnice 96 3. Iterované lineární procesy 102 4. Více maticového počtu 111 5. Rozklady matic a pseudoinverze 130 Kapitola 4. Analytická geometrie 138 1. Afinní a euklideovská geometrie 138 2. Geometrie kvadratických forem 156 3. Projektivní geometrie 162 Kapitola 5. Zřízení ZOO 166 1. Interpolace polynomy 166 2. Reálná čísla a limitní procesy 176 3. Derivace 194 4. Mocninné řady 205 iii CHAPTER 0. OBSAH 1 Předmluva Příprava této učebnice byla motivována přednáškami pro informatické obory na Masarykově univerzitě, kde je celý program založen na precizním matematickém přístupu. Chtěli jsme proto rychle, ale zároveň pořádně, pokrýt zhruba tolik matematických metod, jako je obvyklé u větších kurzů v klasických technických oborech opřených o matematické metody. Zároveň jsme ale nechtěli rezignovat na úplný a matematicky korektní výklad. Chtěli jsme vedle sebe vyložit i obtížnější partie matematiky a spoustu elementárních i obtížnějších konkrétních příkladů, jak s uvedenými postupy ve skutečnosti pracovat. Nechtěli jsme přitom za čtenáře řešit, v jakém pořadí a kolik „teorie“ či „praxe“ pročítat. Z těchto podnětů vznikl dvousloupcový formát s oddělenými teoretickými úvahami a praktickými postupy, který kopíruje i skutečné rozdělení výkladu na přednáškách na „teoretické přednášky“ a „demonstrovaná cvičení“. Snažíme se tím vyjít vstříc jak čtenářům, kteří si napřed chtějí procvičit postupy při řešení úloh a teprve pak přemýšlet, proč a jak algoritmy fungují, tak těm druhým, kteří si napřed chtějí dělat jasno o tom proč a jak věci fungují a pak případně zkouší počítat příklady. Zároveň tím snad zbavujeme čtenáře stresu, že by měl přečíst úplně vše. Naopak, měl by mít radost z brouzdání textem a prožitku objevování vlastní cestičky. Text se přitom v obou svých částech snaží prezentovat standardní výklad matematiky s akcentem na smysl a obsah představovaných matematických metod. Řešené úlohy procvičují základní pojmy, ale zároveň se snažíme dávat co nejlepší příklady užití matematických modelů. Teoretický text je prezentován dosti kompaktním způsobem, mnoho prostoru je ponecháno pro dořešení podrobností čtenáři. Uváděné příklady se snaží pokrýt celou škálu složitosti, od banálních až po perličky ke skutečnému přemýšlení. Studenti navíc řešili a odevzdávali každý týden zadávané příklady. Čtenářům bychom rádi pomohli: • přesně formulovat definice základních pojmů a dokazovat jednoduchá matematická tvrzení, • vnímat obsah i přibližně formulovaných závislostí, vlastností a výhledů použití matematických nástrojů, • vstřebat návody na užívání matematických modelů a osvojit si jejich využití. K těmto ambiciózním cílům nelze dojít lehce a pro většinu lidí to znamená hledat si vlastní cestu s tápáním různými směry (s potřebným překonáváním odporu či nechutě). I proto je celý výklad strukturován tak, aby se pojmy a postupy vždy několikrát vracely s postupně rostoucí složitostí a šíří diskuse. Jsme si vědomi, že se tento postup může jevit jako chaotický. Domníváme se ale, že dává mnohem lepší šanci na pochopení u těch, kteří vytrvají. Vstup do matematiky je skoro pro každého obtížný — pokud už „víme“, nechce se nám přemýšlet, pokud „nevíme“, je to ještě horší. Jediný spolehlivý postup pro orientaci v matematice je 2 hledat porozumnění v mnoha pokusech a hledat je při četbě v různých zdrojích. Určitě nepovažujeme tento text za dostatečný jediný zdroj pro každého. Doufáme, že může být dobrým začátkem a případně i dlouhodobým pomocníkem, zvláště pro ty, kdo se k jednotlivým částem budou znovu a znovu vracet. Pro ulehčení vícekolového přístupu ke čtení je text doprovázen emotivně laděnými ikonkami, které snad nejen oživí obvyklou strohou strukturu matematického textu, ale naznačí čtenáři, kde by složitější text měl být čten pozorněji, ale určitě ne přeskakován, případně kde by bylo možná lépe náročné pasáže přinejmenším napoprvé vůbec nečíst. Volba jednotlivých ikonek samozřejmě odráží hlavně pocity autorů. Přesto by postupně mohly být dobrým vodítkem pro čtenáře. Velice zhruba řečeno, používáme ikonky varující před pracností/složitostí/náročností, např. Další označují ne úplně pohodovou zdlouhavost práce a potřebu trpělivosti či nadhledu, jako jsou tyto A konečně máme také ikonky vyjadřující pohodu nebo radost ze hry, třeba následující Snažili jsme se sloupce s příklady sepsat tak, aby byly čitelné prakticky víceméně samostatně. Bez ambicí pohrát si s hlubšími důvody, proč uváděné postupy fungují, (nebo s prostým cílem „projít s písemkou“) by mělo skoro stačit probírat se jen příklady. Definice pojmů či popisy jejich vlastností používaných při řešení příkladů jsou v teoretickém sloupci zpravidla vyznačeny, aby o ně bylo možno snadno pohledem zavadit. Souvislost řešených příkladů s paralelně studovanou teorií je přitom spíše volná, snažili jsme ale ulehčit přeskakování „z teorie do praxe a zpět“ co nejvíce. Obsahově je celá učebnice ovlivněna představou, že pro praktické využití jsou vlastně skoro vždy podstatné metody tzv. diskrétní matematiky, zatímco tzv. spojité modely jsou matematicky dobře uchopitelná přiblížení veskrze diskrétního světa kolem nás. Počítat koneckonců stejně umíme vždy jen s konečně mnoha racionálními čísly naráz. Bez spojité matematiky si lze ale těžko dobře představit koncepty jako konvergence procesu k limitnímu stavu nebo robustnost výpočtu. Bylo by bez ní také obtížné pracovat s odhady chyb při numerických procesech. Všechna témata a velmi podstatnou část textu jsme v létech 2005 – 2012 ověřovali při výuce studentů informatiky a později i matematiky na Masarykově univerzitě. Paralelně jsme přitom vytvořili také podklady pro praktické semináře matematického modelování a numerických metod. V nich se studenti, věnují skutečnému využití výpočtových nástrojů a modelů. Závěrem tohoto stručného představení stručně shrneme obsah celé učebnice. Samozřejmě předpokládáme, že si každý čtenář, případně přednášející, vybere témata a jejich pořadí. Pokusíme se proto zároveň vymezit bloky, se kterými lze takto nezávisle zacházet. CHAPTER 0. OBSAH 3 Úvodní motivační kapitola se snaží ilustrovat několik přístupů k matematickému popisu problémů. Začínáme nejjednoduššími funkcemi (základní kombinatorické vzorce). Pak naznačujeme jak pracovat se závislostmi zadanými pomocí okamžitých změn (jednoduché diferenční rovnice), užití kombinatoriky a množinové algebry diskutujeme prostřednictvím konečné klasické pravděpodobnosti. Předvádíme maticový počet pro jednoduché úlohy rovinné geometrie (práce s pojmem pozice a transformace) a závěrem vše trochu zformalizujeme (relace, uspořádní, ekvivalence). Nenechte se zde uvrhnout do chaotického zmatku rychlým střídáním témat — cílem je nashromáždit něco málo netriviálních námětů k přemýšlení a hledání jejich souvislostí i použití, ještě než zabředneme do úrovně problémů a teorií složitějších. Ke všem tématům této úvodní kapitoly se časem vrátíme. Další dvě kapitoly jsou věnovány základům počtu, který umožňuje práci s vícerozměrnými daty i grafikou. Jde o postupy tzv. lineární algebry, které jsou základem a konečným výpočetním nástrojem pro většinu matematických modelů. Nejprve probíráme jednoduché postupy pro práci s vektory a maticemi, třetí kapitola je pak věnována aplikacím maticového počtu v různých lineárních modelech (systémy lineárních rovnic, lineární procesy, lineární diferenční rovnice, Markovovy procesy, lineární regrese). Čtvrtá kapitola pak ilustruje použití maticového počtu v geometrických úlohách. Dozvíme se něco málo o afinní, euklidovské a projektivní geometrii. V tomto okamžiku přerušíme diskusi diskrétních modelů a přejdeme ke spojitým. Chceme co nejnázorněji ukázat, že základní ideje, jak s funkcemi pracovat, bývají jednoduché. Stručně řečeno, velmi jednoduché úvahy spojené s popisem okamžitých změn sledovaných veličin umožňují dělat závěry pro jejich celkové chování. Složitosti se pojí skoro výhradně se zvládnutím rozumně velké třídy funkcí, pro které mají naše postupy být použitelné. Začínáme proto kapitolou, kde diskutujeme jaké funkce potřebujeme pro nelineární modely. Po polynomech a splajnech postupně diskutujeme pojmy spojitosti, limity posloupností a funkcí a derivace funkcí, připomeneme všechny základní elementární funkce a závěrem se seznámíme s mocninnými řadami. Tím je připravena půda pro klasický diferenciální a integrální počet. Ten prezentujeme v kapitole šesté s důrazem na co nejpřímočařejší pochopení souvislostí limitních procesů, integračních procesů a aproximací. Sedmá kapitola se věnuje náznakům aplikací a snaží se co nejvíce připomínat analogie k postupům jednoduché lineární algebry z minulého semestru. Místo lineárních zobrazení mezi konečně rozměrnými vektorovými prostory tak pracujeme s lineárními operacemi mezi nekonečně rozměrnými vektorovými prostory funkcí, definovanými buď integrálními nebo diferenciálními operátory. Zatímco studium diferenciální rovnic necháváme na později, zde studujeme nejprve aproximace funkcí s pomocí vzdálenosti definované integrálem (tzv. Fourierovy řady). Pak se věnujeme souvislostem s některými integrálními operátory (např. konvoluce) a integrálními transformacemi (zejména Fourirerova transformace). Po cestě si neodpustíme ilustraci obecného principu, že spojité modely jsou zpravidla ideovým podkladem a zároveň dobrou aproximací pro modely diskrétní. Poslouží nám k tomu stručné nahlédnutí na problematiky tzv. waweletů a diskrétní Fourierovy transformace. 4 V osmé kapitole pokračujeme v našem stručném nastínění analytických spojitých metod, tentokrát pro modely s mnoha proměnnými. Nejprve rozšíme základní postupy a výsledky týkající se derivací na funkce více proměnných, včetně funkcí zadaných implicitně a tzv. vázaných extrémů. Hned poté rozšíříme teorii integrování o tzv. násobné integrály. Poté se věnujeme stručně modelům opřeným o známou změnu našich objektů, tj. diferenciálním rovnicím a malinko naznačíme obdobné problémy variační. Závěrem této kapitoly se pak stručně věnujeme numerickým příblížením a odhadům. Devátá kapitola směřuje zpět do světa diskrétních metod. Zabýváme se v ní základními pojmy poznatky teorie grafů a jejich využitím v praktických problémech (např. prohledávání do šířky a hloubky, minimální pokrývající kostry, toky v sítích, hry popisované stromy). Závěrem uvádíme pár poznámek o vytvořujících funkcích. Předposlední kapitola se zabývá nejprve obecnými algebraickými strukturami s důrazem na teorii grup. Věnujeme se ale i jiným strukturám a soustředíme se na aplikace, které směřujeme na velmi aktuální oblasti kódování a šifrování. CHAPTER 0. OBSAH 5 Poslední jedenáctá kapitola je věnována matematické pravděpododobnosti a statistice. Seznámíme se s pojmy pravděpodobnostní prostor, hustota pravděpodobnosti, normální rozdělení, střední hodnota, medián, kvantil, rozptyl, příklady diskrétních a spojitých rozdělení a budeme se náznakem věnovat statistickému zpracování dat. Pořádné poděkování všem zúčastněným, kteří nebudou přímo v autorském kolektivu, studentům apod. ??. ??. 2013, kolektiv autorů KAPITOLA 1 Krůčky k matematickým problémům „hodnota, změna, poloha“ – co to je a jak to uchopit? Cílem první kapitoly je uvést čtenáře do fascinujícího světa matematického myšlení. Vybíráme si k tomu co nejkonkrétnější příklady modelování reálných situací pomocí abstraktních objektů a souvislostí. Zároveň projdeme několik témat a postupů, ke kterým se postupně budeme vracet a v závěru kapitoly se budeme chvíli věnovat samotnému jazyku matematiky (se kterým budeme jinak zacházet spíše in- tuitivně). O co jednodušší jsou východiska a objekty, se kterými zde budeme pracovat, o to složitější je pochopit do důsledku jemnosti použitých nástrojů a postupů. Většinou je možné proniknout k podstatě věcí teprve v jejich souvislostech. Proto je také představujeme hned z několika pohledů záro- veň. Přecházení od tématu k tématu se možná bude zdát jako zmatečné, ale to se jistě postupně spraví při našich návratech k jednotlivým úvahám a pojmům v pozdějších kapitolách. Název kapitoly lze chápat i jako nabádání k trpělivosti. I nejjednodušší úlohy a úvahy budou snadné jen pro ty, kteří už podobné řešili (a půjde pro ně jen o opakování znalosti ze střední školy). K postupnému poznání a ovládnutí matematického myšlení vede jen pozvolná a spletitá cesta. Začneme s tím nejjednodušším: obyčejnými čísly. 1. Čísla a funkce Lidé odjakživa chtějí mít jasno „kolik“ něčeho je, případně „za kolik“ to je, „jak dlouho“ něco trvá apod. Výsledkem takových úvah je většinou nějaké „číslo“. Za číslo přitom považujeme něco, co umíme sčítat a násobit a splňuje to obvyklé zákonitosti, ať už všechny nebo jen některé. Například výsledek sčítání nezávisí na pořadí, v jakém čísla sčítáme, máme k dispozici číslo nula, které přičtením výsledek nezmění, číslo jedna, kterým můžeme násobit, aniž bychom změnili výsledek, apod. Nejjednodušším příkladem jsou tzv. čísla přirozená, budeme je značit N = {0, 1, 2, 3, . . . }. Všimněme si, že jsme mezi přirozená čísla vzali i nulu, jak je obvyklé zvláště v in- formatice. Počítat „jedna, dvě, tři, ... “ se učí děti už ve školce. O něco později se setkáváme s čísly celými Z = {. . . , −2, −1, 0, 1, 2, . . . } a nakonec si zvykneme na 6 KAPITOLA 1 Přehršel různorodých úloh „hodnota, změna, poloha“ – co to je a jak to uchopit? 1. Čísla a funkce Číselné obory. Všichni jsme jistě zvyklí počítat s přirozenými, celými, racionálními a reálnými čísly a máme také představy, jak jsou uspořádány do vztahů „menší–větší“. Je také docela zřejmé, že mezi každými dvěmi celými čísly n a n + 1 je spousta racionálních čísel n < q < n + 1. Jak jsou na tom ale čísla reálná? Potřebujeme je vůbec? I tady je patrně odpověď dobře známá: již staří Řekové věděli, že předepíšeme-li plochu čtverce a2 = 2, pak nelze najít racionální a, které by předpisu vyhovovalo. Ověřit to můžeme za předpokladu, že známe následující vlastnost jednoznačného rozkladu přirozených čísel na prvočísla: Tvrzení. Každé přirozené číslo n lze jednoznačným způsobem (až na pořadí činitelů) vyjádřit jako součin n = pr1 1 · pr2 2 . . . prk k , kde p1, . . . , pk jsou po dvou různá prvočísla. Skutečně, pokud by platilo (p/q)2 = 2 pro přirozená čísla p a q, pak tedy p2 = 2q2 . Na levé straně máme v rozkladu na prvočísla 2r se sudým r (případně r = 0), na pravé straně ale bude vždy mocnina dvojky lichá. To je spor s naším tvrzením a tedy předpoklad nemůže platit a žádné racionální číslo nemůže mít za svoji druhou mocninu dvojku. Vidíme tedy, že již hledání odmocnin nás nutí k rozšíření racionálních čísel na reálná. Jako cvičení si dokažte 1.1. Nechť t a m jsou kladná celá čísla. Ukažte, že číslo m √ t je buď přirozené, nebo není racionální. Komplexní čísla. Stačí nám aspoň pro elementární počty reálná čísla? Je lehké si uvědomit, že nikoliv: Úvahu o racionalitě druhé odmocniny v minulém odstavci můžeme formulovat jako dotaz na existenci řešení rovnice x2 = 2 CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM desetinná čísla a víme, co znamená 1.19–násobek ceny díky 19% dani z přidané hodnoty. 1.1. Vlastnosti čísel. Abychom mohli s čísly pracovat opravdu, musíme se jejich definici a vlastnostem věnovat pořádněji. V matematice se těm základním tvrzením o vlastnostech objektů, jejichž platnost předpokládáme, aniž bychom se zabývali jejich dokazovaním, říká axiomy. Vhodná volba axiomů předurčuje jak dosah z nich vycházející teorie, tak její použitelnost v matematických modelech skutečnosti. Vlastnosti skalárů Vlastnosti sčítání: (a + b) + c = a + (b + c), pro všechna a, b, c(KG1) a + b = b + a, pro všechna a, b(KG2) existuje 0 taková, že pro všechna a platí a + 0 = a(KG3) pro všechna a existuje b takové, že a + b = 0(KG4) Vlastnostem (KG1) – (KG4) říkáme vlastnosti komutativní grupy. Jsou to po řadě asociativita, komutativita, existence neutrálního prvku (říkáme u sčítání také nulového prvku), existence inverzního prvku (říkáme u sčítání také opačného prvku k a a značíme ho −a). Vlastnosti násobení: (a · b) · c = a · (b · c), pro všechny a, b, c(O1) a · b = b · a, pro všechny a, b(O2) existuje prvek 1 takový, že pro všechny a platí 1 · a = a (O3) a · (b + c) = a · b + a · c, pro všechny a, b, c.(O4) Vlastnosti (O1)-(O4) se postupně nazývají asociativita, komutativita, existence jednotkového prvku a distributivita sčítání vůči násobení. Množiny s operacemi +, · a vlastnostmi (KG1)–(KG4), (O1)–(O4) se nazývají komutativní okruhy. Další vlastnosti násobení: pro každé a ̸= 0 existuje b takové, že a · b = 1.(P) je-li a · b = 0, potom buď a = 0 nebo b = 0.(OI) Vlastnost (P) se nazývá existence inverzního prvku vzhledem k násobení (tento prvek se pak značí a−1 ) a vlastnost (OI) říká, že neexistují „dělitelé nuly“. Uvedli jsme si základní vlastnosti operací sčítání a násobení pro naše počty s čísly, která píšeme jako písmena a, b, c, . . . . Obě tyto operace fungují tak, že vezmeme dvě čísla a, b a aplikací sčítání nebo násobení dostaneme výsledné hodnoty a + b a a · b. Vlastnosti těchto operací budeme soustavně využívat, aniž bychom museli přesně vědět, s jakými objekty skutečně pracujeme. Tak se dostaneme k obecným matematickým nástrojům, je však vždy dobré mít představu o typických příkladech. 7 v oboru racionáních čísel. Ověřili jsme, že řešení nemá, v oboru reálných čísel už ale ano. Co když napíšeme obecněji x2 = b a ptáme se pořešení teď? Tato rovnice má vždy řešení x v oboru reálných čísel, pokud je b nezáporné. Jestliže je b = −1, pak ale zjevně takové reálné x existovat nemůže. Podbízí se „přidat“ k reálným číslům nové číslo i, tzv. imaginární jednotku a zkusit dát dohromady rozšíření číselného oboru R reálných čísel tak, aby byly splněny všechny vlastnosti, které od skalárů očekáváme. Kupodivu to skutečně jde tím nejjednodušším způsobem: jistě budeme chtít umět nové číslo i násobit reálnými čísly a budeme chtít umět přičítat i skutečná reálná čísla. Nutně proto musíme v novém číselném oboru komplexních čísel C pracovat s formálními výrazy z = a+i b. Reálnému číslu a říkáme reálná složka komplexního číla z, reálnému číslu b pak imaginární složka, píšeme re(z) = a, im(z) = b. Aby byly splněny vlatnosti asociativity a distributivity, zavedeme sčítání tak, že se nezávisle sčítají reálné složky a imaginární složky a násobení tak, jak by se násobily dvojčleny reálných čísel s jediným dodatečným pravidlem i2 = −1, tj. (a + i b) + (c + i d) = (a + c) + i (b + d),(1.1) (a + i b) · (c + i d) = (ac − bd) + i (bc + ad).(1.2) Ověřte si pečlivě, že skutečně platí všechny vlastnosti (KG1-4), (O1-4) a (P) skalárů, jde tedy o pole (komutativní těleso) skalárů. Nulou je samozřejmě číslo 0 + i 0, jedničkou číslo 1 + i 0, které opět píšeme jako 0 a 1. Komplexní čísla jako body v rovině. Tak jak si jistě představujeme reálná čísla jako body přímky všech reálných čísel, můžeme si dobře představit komplexní čísla z = a+i b jako body v rovně o souřadnicích (a, b). Imaginární jednotka i pak odpovídá bodu (0, 1) a všimněme si, že vynásobení jakéhokoliv čísla z = a + i b imaginární jednotkou dává výsledek i · (a + i b) = −b + i a což je v interpertaci v rovině otočení bodu z o pravý úhel v kladném smyslu, tj. proti směru hodinových ručiček. Další geometrická operace, která má jednoduché vyjádření je symetrie podle osy reálných čísel: z = (a + i b) → (a − i b) = ¯z. Hovoříme o číslu ¯z komplexně sdruženém k z. Všimněme si dále, že součin z¯z = (a2 + b2 ) + i (−ab + ba) = a2 + b2 1. ČÍSLA A FUNKCE Celá čísla Z jsou dobrým příkladem komutativní grupy, přirozená čísla nikoliv, protože nesplňují (KG4) (a případně neobsahují neutrální prvek, pokud někdo nulu do N nezahr- nuje). Když komutativní okruh navíc splňuje i vlastnost (P), hovoříme o poli (často také o komutativním tělese). Poslední uvedená vlastnost (OI) je automaticky splněna, pokud platí (P). Opačně to ovšem neplatí a tak říkáme, že vlastnost (OI) je slabší než (P). Např. okruh celých čísel Z nesplňuje (P), ale splňuje (OI). Hovoříme v takovém případě o oboru integrity. Všimněme si, že množina všech nenulových prvků v poli společně s operací násobení splňuje (O1), (O2), (O3), (P), a je proto také komutativní grupa. Jen se místo sčítání mluví o násobení. Jako příklad můžeme vzít všechna nenulová reálná čísla. Prvky nějaké množiny s operacemi + a · splňujícími (ne nutně všechny) výše uvedené vlastnosti (tj. komutativní okruh, obor integrity, pole) budeme nazývat skaláry. Budeme pro ně vesměs užívat malá latinská písmena ze začátku nebo konce abecedy. Všechny vlastnosti (KG1)–(KG4), (O1)–(O4), (P), (OI) z našich úvah je třeba brát jako axiomatickou definici příslušných matematických pojmů. Pro naše potřeby bude stačit si průběžně uvědomovat, že při dalších diskusích budeme důsledně používat pouze tyto vlastnosti skalárů a že i naše výsledky proto budou platné pro všechny objekty s těmito vlastnostmi. V tomto je pravá síla matematických teorií – nejsou platné jen pro konkrétní řešený příklad. Naopak, při rozumné výstavbě mají vždy univerzální použití. Budeme se snažit tento aspekt zdůrazňovat, přestože naše ambice mohou být v rámci daného rozsahu učebnice jen velice skromné. 1.2. Existence skalárů. K tomu, aby ale skutečně bylo možné budovat matematickou teorii, je třeba ověřit, že takové objekty mohou existovat. Pro pořádek si proto budeme postupně ukazovat, jak je možné zkonstruovat základní číselné obory. Pro konstrukci přirozených čísel začneme s předpokladem, že víme, co jsou to množiny. Prázdnou množinu si označíme ∅ a definujeme (1.1) 0 := ∅, n + 1 := n ∪ {n} , neboli 0 := ∅, 1 := {∅}, 2 := {0, 1}, . . . , n + 1 := {0, 1, . . . , n}. Tímto zápisem říkáme, že pokud už máme definovaná všechna čísla 0, 1, 2, . . . n, pak číslo n + 1 definujeme jako množinu všech předchozích čísel. Přirozená čísla takto ztotožňujeme s počty prvků konkrétních množin. Číslo n je množina, která má n prvků a dvě přirozená čísla a, b jsou stejná, právě když příslušné množiny mají stejně prvků. V teorii množin se místo slovního spojení „počet prvků množiny“ používá pojem „mohutnost 8 1. ČÍSLA A FUNKCE je vždy reálné číslo a dává nám kvadrát vzdálenosti čísla z od počátku 0. Platí tedy |z|2 = z¯z. Komplexní čísla tvaru z = cos φ+i sin φ, kde φ je reálný parametr udávající úhel mezi reálnou přímkou a spojnicí z s počátkem (měřený v kladném smyslu), popisují právě všechny body na jednotkové kružnici v komplexní rovině. Každé nenulové číslo z pak lze právě jedním způsobem napsat jako z = |z|(cos φ + i sin φ). Tento výraz nazýváme goniometrický tvar komplexního čísla z (vyjádření z = a + ib říkáme algebraický tvar komplexního čísla z). Vzorce pro sinus a kosinus součtu argumentů jsou pak ekvivalentní tvrzení Tvrzení (Moivrova věta). z1 · z2 = |z1||z2|(cos(φ1 + φ2) + i sin(φ1 + φ2), kde φi jsou argumenty čísel zi. 1.2. Číslo ( 5 √ 3 + 5i )12 zapište v co nejjednodušším tvaru. Řešení. Úpravy jako postupné umocňování nebo rozvoj podle binomické věty jsou v tomto případě časově náročné. Při vyjádření 5 √ 3 + 5i = 10 (√ 3 2 + i 2 ) = 10 ( cos π 6 + i sin π 6 ) užitím Moivreovy věty však snadno obdržíme ( 5 √ 3 + 5i )12 = 1012 ( cos 12π 6 + i sin 12π 6 ) = 1012 . 1.3. Vyjádřete z = cos 0 + cos π 3 + i sin π 3 v goniometrickém tvaru. Řešení. Abychom mohli vyjádřit z = |z| (cos φ + i sin φ) , nejprve určíme |z| = √( cos 0 + cos π 3 )2 + sin2 π 3 = √ ( 1 + 1 2 )2 + (√ 3 2 )2 = √ 3. Zapíšeme-li z = √ 3 ( cos 0+cos π 3√ 3 + i sin π 3√ 3 ) = √ 3 ( 1+ 1 2√ 3 + i √ 3 2√ 3 ) = √ 3 (√ 3 2 + i 1 2 ) , vidíme, že pro argument φ má platit cos φ = √ 3 2 , sin φ = 1 2 , což již dává φ = π/6. Celkem jsme tak získali z = √ 3 ( cos π 6 + i sin π 6 ) . CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM množiny“. Tento pojem má smysl (narozdíl od toho předchozího) i pro nekonečné množiny. Na první pohled je také vidět obvyklá definice uspořádání přirozených čísel podle velikosti (o číslu a řekneme, že je ostře menší než b tehdy a jen tehdy, když a ̸= b a a ⊂ b jako množina). Dalším formálním krokem by měla být definice sčítání a násobení a důkaz všech základních vlastnostní přirozených čísel, včetně výše uvedených axiomů komutativního okruhu. Snadno lze např. ukázat, že každá podmnožina v N má nejmenší prvek a spoustu dalších vlastností o kterých zpravidla už dávno nepřemýšlíme a máme je za samozřejmé. Nebudeme se tu konstrukcí číselných oborů zabývat podrobně a předpokládáme, že čtenář čísla racionální (Q), reálná (R) a komplexní (C) důvěrně zná. Občas budeme jen připomínat teoretické i praktické souvislosti při dalším výkladu. Podrobně bude konstrukce racionálních čísel z přirozených diskutována v 1.40. Konstrukci reálných čísel bude vhodné zmínit při studiu limitních procesů později a již dříve budeme z různých algebraických pohledů zkoumat čísla komplexní. Navíc, jak je v matematice obvyklé, budeme místo s čísly manipulovat s písmeny abecedy, případně jinými znaky, ať už jejich hodnota je nebo není předem známá. 9 1.4. Pomocí Moivreovy věty vypočítejte ( cos π 6 + i sin π 6 )31 . Řešení. Ihned dostáváme ( cos π 6 + i sin π 6 )31 = cos 31π 6 + i sin 31π 6 = cos 7π 6 + i sin 7π 6 = − √ 3 2 − i 1 2 . 1.5. Stanovte (2+3i) ( 1+i √ 3 ) 1−i √ 3 . Řešení. Neboť absolutní hodnota součinu (podílu) dvou libovolných komplexních čísel je součin (podíl) jejich absolutních hodnot a každé komplexní číslo má stejnou absolutní hodnotu jako číslo s ním komplexně sdružené, platí (2+3i) ( 1+i √ 3 ) 1−i √ 3 = | 2 + 3i | · 1+i √ 3 1−i √ 3 = | 2 + 3i | = √ 22 + 32 = √ 13. 1.6. Uveďte vzdálenost d čísel z,¯z v komplexní rovině, je-li ¯z = √ 3 √ 3 2 − i 3 2 . Řešení. Není obtížné si uvědomit, že komplexně sdružená čísla jsou souměrně sdružená podle osy x a že vzdálenost komplexního čísla od osy x je rovna absolutní hodnotě jeho imaginární části. To již dává d = 3. 1.7. Spočítejte i) z1 + z2 ii) z1.z2 iii) ¯z1 iv) |z2| v) z1 z2 pro i) z1 = 1 − 2i, z2 = 4i − 3 ii) z1 = 2, z2 = i Komplexní čísla nejsou pouze nástrojem, abychom získali „divná“ řešení kvadratických rovnic, ale jsou potřeba i k tomu, abychom určili reálná řešení kubických rovnic. Jak vyjádřit řešení kubické rovnice x3 + ax2 + bx + c = 0 1. ČÍSLA A FUNKCE 1.3. Skalární funkce. Často pracujeme s číselnou hodnotou, která není dána jako konkrétní číslo. Místo toho něco víme o závislosti naší hodnoty na hodnotách jiných. Formálně píšeme, že hodnota y = f (x) naší „závislé“ proměnné veličiny y je dána „nezávislou“ veličinou x. Přitom můžeme znalost f brát formálně (prostě je to nějaká, blíže nespecifikovaná, závislost) nebo operačně, tj. f (x) je dáno vzorcem poskládaným z (prozatím si představme konečně mnoha) známých operací. Pokud je hodnotou skalár, hovoříme o skalární funkci. Každá funkce je definována na nějaké množině, mluvíme o definičním oboru funkce, a množina všech hodnot je pak tzv. obor hodnot funkce. Také mohou být ale hodnoty funkce f dány pouze přibližně nebo s jistou pravděpodobností. Smyslem matematických úvah pak bývá z neformálního popisu závislostí najít explicitní vzorce pro funkce, které je popisují, nebo aspoň explicitní vyjádření pro konkrétní hodnoty závislých proměnných, případně jejich přiblížení. Podle typu úlohy a cíle pracujeme: • s přesným a konečným výrazem • s nekonečným výrazem • s přiblížením neznámé funkce známým odhadem (většinou s vyčíslenou možnou chybou) • s odhadem hodnot s vyčíslením jejich pravděpodobnosti apod. Skalární funkcí je např. roční mzda pracovníka nějaké firmy (hodnoty nezávislé veličiny, tj. definiční obor funkce, jsou jednotliví pracovníci x z množiny všech sledovaných pracovníků, f (x) je jejich roční mzda za dané období). Stejně tak můžeme sledovat měsíční mzdu konkrétního pracovníka v čase (nezávislou hodnotou je čas v měsících, závislou příjem v jednom každém měsíci). Jiným příkladem je třeba plocha obrazce v rovině, objem tělesa v prostoru, rychlost konkrétního auta v čase atd. Dovedeme si jistě představit, že ve všech uvedených případech může být hodnota dána nějakou volně popsanou souvislostí nebo naměřena přibližně nebo odhadnuta atd. 1.4. Operačně definované funkce. Funkce můžeme mít dány výčtem jejich hodnot – např. ve firmě je jen konečně mnoho zaměstnanců a umíme sestavit tabulku s jejich aktuálními měsíčními platy. Častěji ale máme místo hodnot pravidla, jak k hodnotám dojít. Funkce faktoriál Důležitou skalární funkcí na přirozených číslech je faktoriál, který definujeme vztahy f (0) = 1, f (n) = n · f (n − 1) pro n = 1, 2, . . . . Píšeme f (n) = n! a definice zjevně zna- mená n! = n · (n − 1) · · · 1. 10 1. ČÍSLA A FUNKCE pomocí reálných koeficientů a, b, c? Ukažme si metodu, na kterou přišli v šestnáctém století pánové Ferro, Cardano, Tartaglia a možná další. Zaveďme substituci x := t − a/3 (abychom odstranili kvadratický člen v rovnici), dostaneme rovnici: t3 + pt + q = 0, kde p = b −a2 /3 a q = c +(2a3 −9ab)/27. Nyní zaveďme neznámé u, v splňující podmínky u + v = t a 3uv + p = 0. Dosazením první podmínky do původní rovnice dostáváme u3 + v3 + (3uv + p)(u + v) + q = 0, dosazením druhé pak u6 + qu3 − p3 27 = 0, což je kvadratická rovnice v neznámé s = u3 . Máme tedy u = 3 √ − q 2 ± √ q2 4 + p3 27 , Celkem pak zpětným dosazením x = −p/3u + u − a/3. Ve výrazu pro u je se vyskytuje třetí odmocnina a abychom dostali všechna tři řešení, je nutno pracovat i s komplexními odmocninami. Rovnice x3 = a, a ̸= 0, s neznámou x má totiž právě tři řešení v oboru komplexních čísel (Základní věta algebry, viz ??). Všechna tato řešení nazýváme třetí odmocninou z čísla a. Je tedy výraz 3 √ a v komplexním oboru trojznačný. Pokud se chce přisoudit výrazu 3 √ a jednoznačný význam, tak se za třetí odmocninu uvažuje řešení s nejmenším argumentem. Navíc ještě dodejme, že při popsaném postupu se mohlo vyskytnout dělení nulou. V tom případě je nutno použít jiného (většinou snadnějšího) postupu. 1.8. Řešte rovnici x3 + x2 − 2x − 1 = 0. Řešení. Jak snadno zjistíme, tak rovnice nemá racionální kořeny (metody si objasníme v části ??). Dosazením do získaných vztahů získáme p = b − a2 /3 = −7/3, q = −7/27, pro u pak dostáváme u = 3 √ 28 ± 12 √ −147 6 , kde můžeme teoreticky volit až šest možností pro u (dvě volby znaménka plus či mínus a k tomu tři nezávislé volby třetí odmocniny). CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM Naše definice funkce faktoriál říká, jak se změní hodnota f (n), když změníme hodnotu n o jedničku. Vzorec pro n! již explicitně říká, kolik to je doopravdy. V tomto případě to není příliš efektivní vzorec, protože se jeho složitost zvětšuje s rostoucím n, lepší ale těžko hledat. Podívejme se ještě na obyčejné sčítání přirozených čísel jako na operačně definovanou skalární funkci. Definičním oborem je množina všech dvojic (a, b) přirozených čísel. Definujeme a + b jako výsledek procedury, ve které k a několikrát po sobě přičítáme 1. Tak jsme vlastně obecně a + 1 definovali v rovnicích (1.1). Při každém přičtení odebereme z b největší prvek a postupujeme tak, dokud není b prázdná (tj. b se postupně zmenšuje o jedničku a v každém kroku nám říká, kolik ještě zbývá přičíst). Je evidentní, že takto definované sčítání sice je dáno (iterativním) vzorcem, postup ale není vhodný pro praktické počítání. Tak tomu bude v našem výkladu často – teoreticky korektní definice pojmu či operace neznamená, že úkony s nimi spojené jsou efektivně vykonavatelné. Právě k tomu budeme postupně rozvíjet celé teorie, abychom praktické nástroje získávali. Co se týče přirozených čísel, od školky je umíme sčítat zpaměti a rychle (pokud jsou malá), pro větší známe ze základní školy algoritmus písemného sčítání a s velkými si poradí počítače (pokud nejsou příliš velká). 2. Kombinatorické veličiny Typickým „kombinatorickým“ problémem je napočítat, kolika různými způsoby se může něco stát. Např. kolika způsoby lze vybrat v samoobsluze dva různé sendviče z dané nabídky? Myslíme si přitom, že jsou všechny sendviče v regálu po dvou různé nebo rozlišujeme jen různé typy sendvičů? Připouštíme pak, že si také můžeme vzít dva stejné? Nepřeberně takových otázek máme u karetních a jiných her. 1.5. Permutace. Jestliže z množiny n předmětů vytváříme nějaké pořadí jejich prvků, máme pro volbu prvního prvku n možností, další je volen z n − 1 možností atd., až nám nakonec zbude jediný poslední prvek. Zjevně tedy je na dané konečné množině S s n prvky právě n! různých pořadí. Procesu uspořádávání prvků množiny S říkáme permutace prvků množiny S. Výsledkem permutace je pak vždy nějaké pořadí prvků. Jestliže si předem prvky v S očíslujeme, tj. ztotožníme si S s množinou S = {1, . . . , n} n přirozených čísel, pak permutace odpovídají možným pořadím čísel od jedné do n. Máme tedy příklad jednoduché matematické věty a naši předchozí diskusi je možné považovat za její důkaz: Počet permutací na konečné množině Tvrzení. Počet p(n) různých pořadí na konečné množině s n prvky je dán známou funkcí faktoriál: (1.2) p(n) = n! 11 Jak však snadno nahlédneme, dostáváme pro x pouze tři různé hodnoty. Dosazením do (1.7) pak jeden z kořenů má tvar 14 3 √ 3(28 − 84i √ 3) + 3 √ 28 − 84i √ 3 6 − 1 3 . = 1, 247, obdobně pro ostatní dva kořeny (přibližně −0, 445 a −1, 802). Jak jsme předeslali, vidíme, že i když se ve vzorcích pro kořeny vyskytují komplexní čísla, tak výsledek je reálný. Závěrem uveďme ještě jeden příklad ukazující, že „divné“ skaláry se chovají divně: 1.9. Nenulový mnohočlen s nulovými hodnotami. Najděte nenulový mnohočlen jedné neznámé s koeficienty v Z7, tj. výraz typu anxn + · · · + a1x + a0, ai ∈ Z7, an ̸= 0, takový, že na množině Z7 nabývá pouze nulových hodnot (tj. dosadíme-li za x libovolný z prvků Z7 a výraz v Z7 vyčíslíme, dostaneme vždy nulu). Řešení. Při konstrukci tohoto mnohočlenu se opřeme o Malou Fermatovu větu, která říká, že pro livovolné prvočíslo p a číslo a s ním nesoudělné platí: (1.3) ap−1 ≡ 1(mod p). Hledaný polynom je tedy například polynom x7 − x (polynom x6 − 1 by neměl nulovou hodnotu v čísle 0). 2. Kombinatorika V této kapitole si budeme hrát s přirozenými čísly, která budou popisovat různé nedělitelné předměty nacházející se v našem životním prostoru a budeme se zabývat tím, jak spočítat počet jejich uspořádání, přeuspořádání, výběrů a tak podobně. Ve velké většině takovýchto problémů lze vystačit se „selským rozumem“. Stačí vhodně používat pravidel součtu a součinu, která si ukážeme na následujících příkladech: 1.10. Maminka chce Jeníkovi a Mařence rozdělit pět hrušek a šest jablek. Kolika způsoby to může udělat? (Hrušky mezi sebou považujeme za nerozlišitelné, stejně tak jablka. Připouštíme, že některé z dětí nic nedostane.) Řešení. Pět hrušek samostatně může maminka rozdělit šesti způsoby. (Rozdělení je určeno tím, kolik hrušek dá Jeníkovi, zbytek připadne Mařence.) Šest jablek pak nezávisle sedmi způsoby. Podle pravidla součinu pak obě ovoce současně může rozdělit 6 · 7 = 42 způsoby. 1.11. Určete počet čísel čtyřciferných čísel, která začínají cifrou 1 a nekončí cifrou 2, nebo končí cifrou 2 a nezačínají cifrou 1. Řešení. Množina uvažovaných čísel je složená ze dvou disjunktních množin, totiž čísel, která začínají cifrou 1 a nekončí cifrou 2 (první 2. KOMBINATORICKÉ VELIČINY 1.6. Kombinace a variace. Dalším jednoduchým příkladem hodnoty určené vzorcem jsou tzv. kombinační čísla, která vyjadřují, kolika způsoby lze vybrat k různých rozlišitelných předmětů z množiny n předmětů. Zjevně máme n(n − 1) · · · (n − k + 1) možných výsledků postupného výběru našich k prvků, přitom ale stejnou výslednou k–tici dostaneme v k! různých pořadích. Pokud nám záleží i na pořadí vybrané k-tice prvků, hovoříme o variaci k–tého stupně. Jak jsme si právě ověřili, počet kombinací a variací udávají následující vzorce, které také nejsou pro výpočet moc efektivní při velikých k a n, protože obsahují výrazy pro fak- toriály. Kombinace a variace Tvrzení. Pro počet c(n, k) kombinací k-tého stupně z n prvků, kde 0 ≤ k ≤ n, platí (1.3) c(n, k) = ( n k ) = n(n − 1) . . . (n − k + 1) k(k − 1) . . . 1 = n! (n − k)!k! . Pro počet v(n, k) variací platí (1.4) v(n, k) = n(n − 1) · · · (n − k + 1) pro všechny 0 ≤ k ≤ n (a nula jinak). Kombinační číslo (n k ) čteme „n nad k“ a nazýváme ho také někdy binomickým číslem. Tento název čísla dostala od tzv. binomického rozvoje, tj. roznásobení n-té mocniny dvojčlenu. Počítáme-li totiž (a +b)n , bude koeficient u mocniny ak bn−k pro každé 0 ≤ k ≤ n roven právě počtu možností, jak vybrat k–tici z n závorek v součinu (ty, kde bereme do výsledku a). Platí proto (1.5) (a + b)n = n∑ k=0 ( n k ) ak bn−k a všimněme si, že pro odvození jsme potřebovali pouze distributivitu, komutativitu a asociativitu násobení a sčítání. Formule (1.5) proto platí v každém komutativním okruhu. Jako další jednoduchou ukázku, jak vypadá matematický důkaz si odvoďme několik jednoduchých tvrzení o kombinačních číslech. Pro zjednodušení formulací definujme (n k ) = 0, kdykoliv je buď k < 0 nebo k > n. 1.7. Tvrzení. Pro všechna přirozená čísla k a n platí (1) (n k ) = ( n n−k ) (2) (n+1 k+1 ) = (n k ) + ( n k+1 ) (3) ∑n k=0 (n k ) = 2n (4) ∑n k=0 k (n k ) = n2n−1 . 12 2. KOMBINATORIKA množina) a čísel, která nezačínají cifrou 1 a končí cifrou 2. Celkový počet popsaných čísel dostaneme podle pravidla součtu tak, že sečteme počty čísel v těchto dvou množinách. V první z těchto množin máme čísla tvaru „1XXY“, kde X je libovolná cifra a Y je libovolná číslice mimo dvojky. Můžeme tedy provést deset voleb druhé cifry, nezávisle na tom můžeme provést deset voleb třetí cifry a opět nezávisle devět voleb poslední cifry. Tyto tři nezávislé volby jednoznačně určují dané číslo a podle pravidla součinu máme tedy 10 · 10 · 9 = 900 takových čísel. Obdobně ve druhé skupině máme 8 · 10 · 10 = 800 čísel (na první cifru máme pouze osm možností, neboť číslo nemůže začínat nulou a jedničku máme zakázánu). Celkem podle pravidla součtu je 900 + 800 = 1700 uvažovaných čísel. 1.12. Určete počet způsobů, jak lze na šachovnici (8×8 polí) postavit bílou a černou věž tak, aby se neohrožovaly (nebyly ve stejném řádku ani sloupci). Řešení. Nejprve umístíme např. bílou věž. Pro ni máme na výběr z 82 polí. Ve druhém kroku umístíme věž černou. Nyní máme „k dispozici“ 72 polí. Podle pravidla součinu je výsledek 82 · 72 = 3 136. V následujících příkladech už budeme při řešení používat pojmů kombinace, permutace, variace (případně s opakováním), které jsme definovali. 1.13. Během schůze má vystoupit 8 řečníků. Stanovte počet všech pořadí, v nichž dva předem určení řečníci nevystupují ihned po sobě. Řešení. Označme si zmíněné dva řečníky jako osoby A a B. Pokud hned po vystoupení osoby A následuje vystoupení osoby B, můžeme na to nahlížet jako na projev jediného řečníka. Počet všech pořadí, v nichž vystupuje B ihned po A, je tedy roven počtu všech permutací ze sedmi prvků. Stejný je pochopitelně také počet všech pořadí, v nichž vystupuje A ihned po B. Neboť počet všech možných pořadí 8 řečníků je 8!, číslo 8! − 2 · 7! udává hledaný počet pořadí. 1.14. Kolika způsoby může sportovec umístit 10 různých pohárů do 5 polic, jestliže se na každou polici vejde všech 10 pohárů? Řešení. K pohárům přidáme 4 navzájem nerozlišitelné předměty, kupř. tužky. Počet všech různých pořadí pohárů a tužek je zřejmě 14!/4! (tužky jsou nerozlišitelné). Každé umístění pohárů do polic ovšem odpovídá právě jednomu seřazení pohárů a tužek. Stačí třeba říci, že poháry před první tužkou v pořadí dáme do první police (při zachování pořadí), poháry před druhou tužkou do druhé police atd. To znamená, že číslo 14!/4! je výsledkem. CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM Důkaz. První tvrzení je zjevné přímo z formule (1.3). Jestliže vyčíslíme pravou stranu z tvrzení (2), dostáváme ( n k ) + ( n k + 1 ) = n! k!(n − k)! + n! (k + 1)!(n − k − 1)! = (k + 1)n! + (n − k)n! (k + 1)!(n − k)! = (n + 1)! (k + 1)!(n − k)! což je ale levá strana tohoto tvrzení. Tvrzení (3) dokážeme tzv. matematickou indukcí. Tento typ důkazu je vhodný právě pro tvrzení, která říkají, že něco má platit pro všechna přirozená čísla n. Matematická indukce se skládá ze dvou kroků. V prvním se tvrzení dokáže pro n = 0 (popřípadě n = 1 nebo další hodnoty n). V druhém, tzv. indukčním, kroku předpokládáme, že tvrzení platí pro nějaké n (a všechny předešlé hodnoty), a za pomoci tohoto předpokladu dokážeme, že tvrzení platí i pro n + 1. Dohromady z toho pak vyvodíme, že tvrzení platí pro všechna přirozená n. Tvrzení (3) zjevně platí pro n = 0, protože (0 0 ) = 1 = 20 . (Stejně tak je přímo vidět i pro n = 1.) Předpokládejme, že platí pro nějaké n a spočtěme příslušnou sumu pro n + 1 s využitím tvrzení (2) i (3). Dostaneme n+1∑ k=0 ( n + 1 k ) = n+1∑ k=0 [( n k − 1 ) + ( n k )] = n∑ k=−1 ( n k ) + n+1∑ k=0 ( n k ) = 2n + 2n = 2n+1 . Všimněme si, že vzorec (3) udává počet všech podmnožin n–prvkové množiny, neboť (n k ) je počet všech jejích k–prvkových podmnožin. Všimněme si také, že tvrzení (3) plyne přímo z (1.5) volbou a = b = 1. Tvrzení (4) dokážeme opět matematickou indukcí, podobně jako (3). Zjevně platí pro n = 0, čímž je hotov první krok. Indukční předoklad říká, že (4) platí pro nějaké n. Spočtěme nyní příslušnou sumu pro n+1 s využitím tvrzení (2) a indukčního předpokladu. Dostaneme n+1∑ k=0 k ( n + 1 k ) = n+1∑ k=0 k [( n k − 1 ) + ( n k )] = n∑ k=−1 (k + 1) ( n k ) + n+1∑ k=0 k ( n k ) = n∑ k=0 ( n k ) + n∑ k=0 k ( n k ) + n∑ k=0 k ( n k ) = 2n + n2n−1 + n2n−1 = (n + 1)2n . Tím je proveden indukční krok, a tvrzení je dokázáno pro všechna přirozená n. 13 1.15. Určete počet čtyřciferných čísel sestavených z právě dvou různých cifer. Řešení. Dvě různé cifry použité na zápis můžeme vybrat (10 2 ) způsoby, ze dvou vybraných cifer můžeme sestavit 24 − 2 různých čtyřciferných čísel (dvojku odečítáme za dvě čísla složená pouze z jedné cifry). Celkem máme (10 2 ) (24 −2) = 630 čísel. Nyní jsme ale započítali i čísla začínající nulou. Těch je (9 1 ) (23 − 1) = 63. Celkově dostáváme 630 − 63 = 567 čísel. 1.16. Určete počet sudých čtyřciferných čísel sestavených z právě dvou různých cifer. Řešení. Obdobně jako v předchozím příkladu se nejprve nebudeme ohlížet na cifru nula. Dostaneme tak (5 2 ) (24 − 2) + 5 · 5(23 − 1) čísel (nejprve počítáme čísla pouze ze sudých cifer, druhý sčítanec udává počet sudých čtyřciferných čísel složených ze sudé a liché cifry). Opět musíme odečíst čísla začínající nulou, těch je (23 − 1)4 + (22 − 1)5. Hledaný počet cifer tak je ( 5 2 ) (24 − 2) + 5 · 5(23 − 1) − (23 − 1)4 − (22 − 1)5 = 272. 1.17. Na koncertě je 730 lidí. Mají někteří z nich stejné iniciály? (Neuvažujeme háčky ani čárky) Řešení. Písmen v abecedě (včetně CH) je 27. Počet všech možných iniciálů je tedy 272 = 729. Proto aspoň 2 lidé budou mít stejné iniciály. 1.18. Noví hráči se sejdou v jednom volejbalovém týmu (6 lidí). Kolikrát si při seznamování (každý s každým) podají ruce? Kolikrát si hráči podají ruce se soupeřem po odehrání zápasu? Řešení. Seznamuje se každá dvojice z šesti hráčů. Počet podání rukou je teda roven kombinaci C(2, 6) = (6 2 ) = 15. Po zápase si každý z šesti hráčů podá ruku šestkrá (s každým z šesti soupeřů). Počet je teda dohromady 62 = 36. 1.19. Jak se může rozesadit pět osob v pětimístném autě, když jen dva z nich mají řidičský průkaz? Jak se může rozesadit 20 cestujících a dva řidiči v 25-místném minibuse? Řešení. Na místě řidiče máme dvě možnosti a na zbylých místech už je pořadí libovolné, tzn. pro spolujezdce 4 možnosti, pro další místo 3, pak 2 a 1. Celkově 2.4! = 48 možností. Podobně v minibuse máme dvě možnosti na místě řidiče a druhý řidič plus cestující mohou na zbylých 24 místech sedět libovolně. Nejprve vybereme místa, která budou 2. KOMBINATORICKÉ VELIČINY Druhá vlastnost z našeho tvrzení umožňuje sestavit všechna kombinační čísla do tzv. Pascalova trojúhelníku, kde každé číslo obdržíme jako součet dvou bezprostředně nad ním ležících sousedů: n = 0 : 1 n = 1 : 1 1 n = 2 : 1 2 1 n = 3 : 1 3 3 1 n = 4 : 1 4 6 4 1 n = 5 : 1 5 10 10 5 1 Všimněme si, že v jednotlivých řádcích máme právě koeficienty u jednotlivých mocnin z výrazu (1.5), např. poslední uvedený řádek říká (a + b)5 = a5 + 5a4 b + 10a3 b2 + 10a2 b3 + 5ab4 + b5 . 1.8. Výběr s opakováním. Pořadí n prvků, z nichž mezi některými nerozlišujeme, nazýváme permutace s opakovaním. Nechť je mezi n danými prvky p1 prvků prvního druhu, p2 prvků druhého druhu, ..., pk prvků k–tého druhu, p1 + p2 + · · · + pk = n, potom počet pořadí těchto prvků s opakováním budeme značit P(p1, . . . , pk). Podobně jako u permutací a kombinací bez opakování, pro výběr prvního z nich máme n možností, pro další n − 1 a tak dále, až po poslední, který zbude. Přitom ale za stejná považujeme pořadí nerozlišitelných objektů. Těch je pro každou skupinku o pi objektech právě pi!, takže zřejmě platí Permutace s opakováním P(p1, . . . , pk) = n! p1! · · · pk! . Volný výběr k prvků z n možností, včetně pořadí, nazýváme variace k-tého stupně s opakováním, jejich počet budeme značit V (n, k). Volný výběr v tomto případě znamená, že předpokládáme, že stále máme pro výběr stejně možností, např. díky tomu, že vybrané prvky před dalším výběrem vracíme nebo třeba házíme pořád stejnou kostkou. Zřejmě platí Variace s opakováním V (n, k) = nk . Pokud nás výběr zajímá bez zohlednění pořadí, hovoříme o kombinacích s opakováním a pro jejich počet píšeme C(n, k). Zde se na první pohled nezdá tak jednoduché, jak výsledný počet zjistit. Důkaz následující věty je pro matematiku typický – podaří se nám nový problém převést na problém jiný, který jsme už dříve zvládli. V našem případě je to převedení na problém standardních kombinací bez opakování: 14 2. KOMBINATORIKA obsazená, tj. (24 21 ) a na těchto místech může být 21! různých pořadí. Dohromady máme 2. (24 21 ) 21! = 24! 3 možností. 1.20. Kolika způsoby lze do tří různých obálek rozmístit pět shodných stokorun a pět shodných tisícikorun tak, aby žádná nezůstala prázdná? Řešení. Nejdříve zjistíme všechna rozmístění bez podmínky neprázdnosti. Těch je podle pravidla součinu (rozmísťujeme nezávisle stokoruny a tisícikoruny) C(3, 5)2 = (7 2 )2 . Odečteme postupně rozmístění, kdy je právě jedna obálka prázdná, a poté kdy jsou dvě obálky prázdné. Celkem C(3, 5)2 −3(C(2, 5)2 − 2) −3 = (7 2 )2 −3(62 − 2)−3 = 336. 1.21. Určete počet různých vět, které vzniknou přesmyčkami v jednotlivých slovech věty „Skokan na koks“ (vzniklé věty ani slova nemusejí dávat smysl). Řešení. Určíme nejprve počty přesmyček jednotlivých slov. Ze slova „skokan“ dostaneme 6!/2 různých přesmyček (permutace s opakováním P (1, 1, 1, 1, 2)), obdobně ze slova „na“ dvě a ze slova „koks“ 4!/2. Celkem podle pravidla součinu 6!4!/4 = 4320. 1.22. Kolik existuje různých přesmyček slova „krakatit“ takových, že mezi písmeny „k“ je právě jedno jiné písmeno. Řešení. V uvažovaných přesmyčkách je šest možností, jak umístit skupinu dvou „k“. Fixujeme-li pevně místa pro dvě písmena „k“, pak ostatní písmena můžeme rozmístit na zbylých šest míst libovolně, tedy P (1, 1, 2, 2) způsoby. Celkem podle pravidla součinu je hledaný počet 6 · P(1, 1, 2, 2) = 6 · 6! 2 · 2 = 1080. 1.23. Kolika způsoby můžeme do pěti různých důlků vybrat po jedné kouli, vybíráme-li ze čtyř bílých, čtyř modrých a tří červených koulí? Řešení. Nejprve řešme úlohu v případě, že bychom měli k dispozici alespoň pět koulí od každé barvy. V tomto případě se jedná o volný výběr pěti prvků ze tří možností, tedy o variace s opakováním třetí třídy z pěti prvků (viz odstavec 2.4. učebních textů). Máme V (3, 5) = 35 . Nyní odečteme ty výběry, ve kterých se vyskytují buď pouze koule stejné barvy (takové výběry jsou tři), nebo právě čtyři koule červené (takových výběrů je 10 = 2 · 5; nejprve vybereme barvu koule, která nebude červená – dvě možnosti – a poté důlek, ve kterém bude – pět možností). Celkem tedy máme 35 − 3 − 10 = 230 CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM Kombinace s opakováním Věta. Počet kombinací s opakováním k-té třídy z n prvků je pro všechny k ≥ 0 a n ≥ 1 C(n, k) = ( n + k − 1 k ) . Důkaz. Důkaz je opřen o trik (jednoduchý, jakmile ho pochopíme). Uvedeme dva různé postupy. Představme si nejprve, že taháme postupně karty z balíku n různých karet a abychom mohli případně některou z nich vytáhnout vícekrát, přidáme si k balíku ještě k − 1 různých žolíků (alespoň jednou určitě chceme jednu z původních karet). Řekněme, že postupně vytáhneme r původních karet a s žolíků, tj. r +s = k. Zdá se, že bychom měli vymyslet postup, jak z těch s žolíků poznat, které karty nám zastupují. Ve skutečnosti nám ale stačí diskuse počtů možností takových voleb. K tomu můžeme použít matematickou indukci a předpokládat, že dokazovaná věta platí pro menší argumenty než jsou n a k. Skutečně, potřebujeme obsáhnout kombinace s– té třídy s opakováním z pouze r původních karet, což dává(r+k−r−1 s ) = (k−1 s ) , což je právě počet kombinací s–tého stupně (bez opakování) ze všech žolíků. Tím je věta doká- zána. Druhý přístup (bez matematické indukce): Na množině S = {a1, . . . , an}, ze které vybíráme kombinace, si zafixujeme uvedené pořadí prvků a pro naše volby prvků z S si připravíme n přihrádek, do kterých si již předem dáme v námi zvoleném pořadí po právě jednom prvku z S. Jednotlivé volby xi ∈ S přidáváme do přihrádky, která již tento prvek obsahuje. Nyní si uvědomme, že pro rozpoznání původní kombinace nám stačí vědět, kolik je prvků v jednotlivých přihrádkách. Například, a | bbb | cc | d ≃ ∗ | ∗ ∗ ∗ | ∗∗ | ∗, vypovídá o volbě b, b, c z množiny S = {a, b, c, d}. V obecném případě výběru k prvků z n možných tedy máme řetězec n + k znaků a počet C(n, k) je roven počtu možných umístění přihrádek | mezi jednotlivé znaky. To odpovídá výběru n − 1 pozic z n + k − 1 možných. Protože je ( n + k − 1 k ) = ( n + k − 1 n + k − 1 − k ) = ( n + k − 1 n − 1 ) , je věta dokázána i podruhé. 3. Diferenční rovnice V předchozích odstavcích jsme viděli vzorce, které zadávaly hodnotu skalární funkce definované na přirozených 15 možných výběrů. 1.24. Kolika způsoby lze rozestavit n shodných věží na šachovnici n × n tak, aby bylo každé neobsazené pole ohrožováno některou z věží? Řešení. Daná rozestavení jsou sjednocením dvou množin: množiny rozestavení, kdy je alespoň v jednom řádku jedna věž (tedy v každém řádku právě jedna; tato množina má nn prvků – v každém řádku vybereme nezávisle jedno pole pro věž) a množiny rozestavení, kdy je v každém sloupci alespoň (tedy právě) jedna věž (stejnou úvahou jako u první množiny má tato množina rovněž nn prvků). Průnik těchto množin pak má n! prvků (místa pro věže vybíráme postupně od prvního řádku – tam máme n možností, ve druhém pak již pouze n − 1 možností – jeden sloupec je již obsazen, ...). Podle principu inkluze a exkluze je počet hledaných rozestavení: 2nn − n!. 1.25. Kolika způsoby mohla skončit tabulka první fotbalové ligy, víme-li o ní, že žádné dva z trojice týmů Zbrojovka Brno, Baník Ostrava a Sigma Olomouc spolu v tabulce „nesousedí“?(Ligu hraje 16 mužstev.) Řešení. První způsob. Hledaný počet spočítáme podle principu inkluze a exkluze tak, že od počtu všech možných tabulek odečteme počet tabulek, ve kterých sousedí některá dvojice z uvedených tří týmů a přičteme počet těch tabulek, ve kterých sousedí všechny tři týmy. Hledaný počet tedy je 16! − ( 3 2 ) · 2! · 15! + 3! · 14! = 13599813427200. Jiné řešení. Zmíněné tři týmy budeme považovat za „oddělovače“. Zbylých třináct týmů musíme rozdělit tak, aby mezi libovolnými dvěma oddělovači byl alespoň jeden tým. Navíc zbylé týmy můžeme mezi sebou nezávisle permutovat a rovněžtak oddělovače. Celkem tedy dostáváme ( 14 3 ) · 13! · 3! = 13599813427200 možností. 1.26. Pro libovolné pevné n ∈ N určete počet všech řešení rovnice x1 + x2 + · · · + xk = n v množině a) nezáporných b) kladných 3. DIFERENČNÍ ROVNICE číslech (faktoriál) nebo dvojicích čísel (binomická čísla) pomocí předcházejících hodnot. Zatímco v odstavci 1.5 jsou kombinační čísla definována přímo spočítatelným výrazem, lze rozumět vztahům v 1.8 také tak, že místo hodnoty naší funkce zadáváme její změnu při odpovídající změně nezávislé proměnné. Takto se skutečně velice často postupuje při matematické formulaci modelů, které popisují reálné systémy v ekonomice, biologii apod. My si tu povšimneme jen několika jednoduchých případů a budeme se k této tématice postupně vracet. 1.9. Lineární diferenční rovnice prvního řádu. Obecnou diferenční rovnicí prvního řádu rozumíme výraz f (n + 1) = F(n, f (n)), kde F je známá skalární funkce závislá na dvojicích přirozených čísel. Známe–li „počáteční“ hodnotu f (0), můžeme spočítat f (1) = F(0, f (0)), poté f (2) = F(1, f (1)) atd. Tímto postupným způsobem můžeme tedy nakonec spočítat hodnotu f (n) pro libovolné n ∈ N. Všimněme si, že tato úvaha je podobná konstrukci přirozených čísel z prázdné množiny nebo principu matematické indukce. Jako příklad může sloužit definiční formule pro faktoriál, tj. (n + 1)! = (n + 1) · n! Vidíme, že skutečně vztah pro f (n + 1) závisí na n i na hodnotě f (n). Dalším obzvlášť jednoduchým příkladem je f (n) = C pro nějaký pevný skalár C a všechna n a tzv. lineární diferenční rovnice (1.6) f (n + 1) = a · f (n) + b, kde a ̸= 0, a b jsou známé skaláry. Takovou diferenční rovnici umíme snadno řešit, je-li b = 0. Pak se totiž jedná o dobře známou rekurentní definici geometrické posloupnosti a platí f (1) = af (0), f (2) = af (1) = a2 f (0) atd. Máme tedy pro všechna n f (n) = an f (0). To je např. vztah pro tzv. Malthusiánský model populačního růstu, který vychází z představy, že za zvolený časový interval vzroste populace s konstantní úměrou a vůči předchozímu stavu. Dokážeme si obecný výsledek pro rovnice prvního řádu, které se podobají lineárním, ale připouští proměnné koeficienty a a b, (1.7) f (n + 1) = an · f (n) + bn. Nejdřívě se ale zamysleme, co mohou takové rovnice popiso- vat. Lineární diferenční rovnici (1.6) můžeme pěkně interpretovat jako matematický model pro spoření nebo splácení 16 3. DIFERENČNÍ ROVNICE celých čísel. Řešení. a) Každé řešení (r1, . . . , rk), ∑k i=1 ri = n můžeme jednoznačně zašifrovat jako posloupnost jedniček a nul, ve které napíšeme nejprve r1 jedniček, pak nulu, pak r2 jedniček, nulu a tak dále. Posloupnost bude celkem obsahovat n jedniček a k − 1 nul. Každá taková posloupnost navíc zřejmě určuje nějaké řešení dané rovnice. Je tedy řešení tolik, kolik je posloupností, tedy (n+k−1 n ) . b) Hledáme-li řešení v oboru kladných celých čísel, tak si všimněme, že přirozená čísla x1, . . . xk jsou řešením dané rovnice, právě když jsou celá nezáporná čísla yi = xi − 1, i = 1, . . . , k, řešením rovnice y1 + y2 + · · · + yk = n − k. Těch je podle první části řešení (n−1 k−1 ) . 1.27. Kolik existuje přesmyček slova PROBLÉM takových, že v nich a) písmena B a R stojí vedle sebe, b) písmena B a R nestojí vedle sebe. Řešení. a) Dvojici písmen B a R můžeme považovat za jedno nedělitelné dvojpísmeno. Celkem tedy máme k dispozici šest různých písmen a šestipísmených slov složených z různých písmen je 6!. V našem případě však tento počet musíme ještě vynásobit dvěma, neboť naše dvojpísmeno může bít jak BR tak RB. Celkem dostáváme 2 · 6! různých přesmyček. b) 7! − 2 · 6! (doplněk části a) do počtu všech sedmipísmenných slov složených z různých písmen. 3. Diferenční rovnice Diferenční rovnice (jinak řečeno též rekurentní vztahy) jsou vztahy mezi členy nějaké posloupnosti, přičemž následující člen je dán pomocí členů předchozích. Vyřešit diferenční rovnici pak znamená najít explicitní vzorec pro n-tý (libovolný) člen dané posloupnosti. Rekurentní vztah nám totiž po zadání několika prvních členů posloupnosti zadává n-tý člen přímo pouze pomocí postupného vyčíslení všech předchozích členů. Pokud je následující člen posloupnosti určen pouze předchozím členem, hovoříme o diferenčních rovnicích prvního řádu. S nimi se můžeme v životě opravdu setkat, například, pokud si chceme zjistit dobu splácení nějaké půjčky při pevné měsíční splátce, nebo naopak chceme zjistit výši měsíční splátky, zadáme-li si dobu, za kterou chceme půjčku splatit. CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM úvěru s pevnou úrokovou mírou a a pevnou splátkou b (tyto dva případy se liší pouze znaménkem u parametru b). S proměnnými parametry dostáváme obdobný model, ovšem s proměnlivými jak úroky, tak splátkami. Můžeme si představit třeba n jako počet měsíců, an bude vyjadřovat úrokovou míru v měsíci n, bn příslušnou splátku v měsíci n. Neděste se zdánlivě složitého sčítání a násobení v následujícím výsledku. Jde o typický příklad technického matematického tvrzení, kdy těžké je „uhodnout“, jak zní. Naopak důkaz je už pak jen docela snadné cvičení na základní vlastnosti skalárů a matematickou indukci. Skutečně zajímavé jsou teprve důsledky, viz 1.11 níže. Ve formulaci používáme vedle obvyklých znaků pro sou- čet ∑ také obdobné znaky pro součin ∏ . V dalším budeme vždy používat také konvenci, že pokud u součtu je množina uvedených indexů prázdná, pak je součet nula, zatímco u součinu je ve stejném případě výsledek jedna. 1.10. Tvrzení. Obecné řešení diferenční rovnice (1.7) prvního řádu s počáteční podmínkou f (0) = y0 je dáno vzta- hem (1.8) f (n) = (n−1∏ i=0 ai ) y0 + n−2∑ j=0   n−1∏ i=j+1 ai   bj + bn−1. Důkaz. Tvrzení dokážeme matematickou indukcí. Zjevně tvrzení platí pro n = 1, kdy se jedná právě o definiční vztah f (1) = a0y0 + b0. Předpokládáme-li, že tvrzení platí pro nějaké pevně zvolené n, můžeme snadno spočíst: f (n + 1) = an   (n−1∏ i=0 ai ) y0 + n−2∑ j=0   n−1∏ i=j+1 ai   bj + bn−1   + bn = ( n∏ i=0 ai ) y0 + n−1∑ j=0   n∏ i=j+1 ai   bj + bn, jak se přímo vidí roznásobením výrazů. Opět si všimněme, že jsme pro důkaz nepotřebovali o použitých skalárech nic víc než vlastnosti komutativního okruhu. 1.11. Důsledek. Obecné řešení lineární diferenční rovnice (1.6) s a ̸= 1 a počáteční podmínkou f (0) = y0 je (1.9) f (n) = an y0 + 1 − an 1 − a b. Důkaz. Dosazením konstantních hodnot za ai a bi do obecného vzorce (1.8) dostáváme f (n) = an y0 + b ( 1 + n−2∑ j=0 an−j−1 ) . 17 1.28. Mirek si chce koupit nové auto. Auto stojí 300 000 Kč. Mirek by chtěl auto koupit na měsíční splátky. Prodávající společnost mu nabízí půjčku na koupi auta s ročním úrokem 6%. Mirek bych chtěl auto splatit za tři roky. Jak vysoká bude měsíční splátka? Řešení. Označme Mirkovu měsíční splátku S. Po prvním měsíci splatí Mirek S korun, z nichž část půjde na vlastní splátku, část na splacení úroku. Částku, kterou bude Mirek dlužit po uplynutí k měsíců označme dk. Po prvním měsíci bude Mirek dlužit (1.4) d1 = 300000 − S + 0, 06 12 · 300000. Obecně po uplynutí k-tého měsíce (1.5) dk = dk−1 − S + 0, 06 12 dk−1. Podle vztahu (1.9) je dk dáno následovně (1.6) dk = ( 1 + 0, 06 12 )k 300000− [( 1 + 0, 06 12 )k − 1 ] ( 12S 0, 06 ) . Splacení po třech letech se rovná podmínce d36 = 0, odkud dostá- váme (1.7) S = 300000 ( 0,06 12 1 − (1 + 0,06 12 )−36 ) . = 9127. Všimněme si, že rekurentní vztah (1.5) můžeme použít na náš příklad pouze tak dlouho, dokud budou všechna y(n) kladná, tj. dokud bude Mirek skutečně něco dlužit. 1.29. Uvažujme situaci z předchozího příkladu. Jak dlouho by Mirek auto splácel, kdyby chtěl měsíčně splácet 5000 Kč? Řešení. Při označení q = 1, 005, c = 300000 nám podmínka dk = 0 dává vztah qk = 200S 200S − c , jehož logaritmováním obdržíme k = ln 200S − ln(200S − c) ln g , což pro S = 5000 dává přibližně k = 71, 5, tedy splácení půjčky by trvalo šest let (poslední splátka by nebyla plných 5 000 Kč). Obdobným příkladem, kde se můžeme setkat s diferenčními rovnicemi je při výpočtu naspořené sumy při stavebním spoření: 1.30. Určete posloupnost {yn}∞ n=1, která vyhovuje následujícímu rekurentnímu vztahu yn+1 = 3yn 2 + 1, n ≥ 1, y1 = 1. 3. DIFERENČNÍ ROVNICE Pro vyčíslení součtu součinů v druhém sčítanci si je třeba všimnout, že se jedná o výrazy (1 + a + · · · + an−1 )b. Součet této geometrické řady spočteme ze vztahu 1 − an = (1 − a)(1 + a + · · · + an−1 ) a dostaneme právě požadovaný výsledek. Všimněme si, že pro výpočet součtu geometrické řady jsme potřebovali existenci inverze pro nenulové skaláry. To bychom nad celými čísly neuměli. Poslední výsledek tedy platí pro pole skalárů a můžeme jej bez problému použít pro lineární diferenční rovnice, kde koeficienty a, b a počáteční podmínka f (0) = y0 jsou racionální, reálné nebo komplexní, ale také nad okruhem zbytkových tříd Zk s prvočíselným k (zbytkové třídy budeme definovat v odstavci 1.41). Pozoruhodné je, že ve skutečnosti vzorec (1.9) platí i s celočíselnými koeficienty a počáteční podmínkou. Pak totiž předem víme, že všechny f (n) budou také celočíselné, a celá čísla jsou podmnožinou v číslech racionálních. Musí proto nutně náš vzorec dávat ta správná celočíselná řešení. Při pozornějším pohledu na důkaz je zřejmé, že 1−an je vždy dělitelné 1 − a, takže nás poslední pozorování nemělo překvapit. Nicméně je vidět, že třeba nad skaláry ze Z4 a tady to asi není šikovné — příklady na zbytkové třídy snad budou v druhém sloupci už dříve, nejlépe by bylo i z tohoto udělat příklad a odtud to přesunout (nebo úplně vypustit) třeba a = 3 už neuspějeme, protože pak 1 − a = 2 je dělitelem nuly. 1.12. Nelineární příklad. Vraťme se na chvíli k rovnici prvního řádu (1.6), kterou jsme použili na velice primitivní model populačního růstu závisející přímo úměrně na okamžité velikosti populace p. Na první pohled je zřejmé, že takový model vede při úměře a > 1 k příliš rychlému a hlavně neomezenému růstu. Realističtější model bude mít takto úměrnou změnu populace p(n) = p(n + 1) − p(n) jen při malých hodnotách p, tj. p/p ∼ r > 0. Pokud tedy budeme chtít nechat růst populaci o 5% za období při malém p, budeme r volit 0, 05. Při určité limitní hodnotě p = K > 0 ale naopak už populace neroste a při ještě větších už klesá (třeba protože zdroje pro její obživu jsou omezené, jedinci ve veliké populaci si navzájem překáží apod.). Předpokládejme, že právě hodnoty yn = p(n)/p(n) se v závislosti na p(n) mění lineárně. Graficky si tedy tuto závislost můžeme představit jako přímku v rovině proměnných p a y, která prochází body [0, r] (tj. při p = 0 máme y = r) a [K, 0] (což dává druhou podmínku, že při p = K se populace nemění). Položíme proto y = − r K p + r. Dosazením yn za y a p(n) za p dostáváme p(n + 1) − p(n) p(n) = − r K p(n) + r, 18 3. DIFERENČNÍ ROVNICE Lineární rekurentní vtahy se mohou vyskytnout například v geometrických problémech: 1.31. Na kolik nejvýše oblastí může dělit rovinu n přímek? Řešení. Označme hledaný počet oblastí pn. Pokud v rovině nemáme dánu žádnou přímku, je celá rovina jedinou oblastí, je tedy p0 = 1. Pokud je v rovině dáno n přímek, tak přidáním n + 1 přibude nejvýše (n + 1) oblastí: oblastí přibude právě tolik, kolika (původními) oblastmi bude přímka procházet (každou takovou oblast rozdělí na dvě části, jedna oblast tedy přibude). Přidaná přímka může mít nejvýše n různých průsečíků s n přímkami, které už v rovnině byly. Část přímky mezi libovolnými dvěma sousedními průsečíky prochází právě jednou oblastí, celkem může přidaná přímka procházet nejvýše n+1 oblastmi, tedy může přibýt maximálně n + 1 oblastí, navíc v rovině bylo před přidáním (n + 1)-ní přímky nejvýše pn oblastí (tak jsme číslo pn totiž definovali). Celkem dostáváme rekurentní vztah pn+1 = pn + (n + 1), ze kterého získáme explicitní formuli pro pn buď pomocí vzorce ?? nebo přímo: pn = pn−1 + n = pn−2 + (n − 1) + n = = pn−3 + (n − 2) + (n − 1) + n = · · · = p0 + n∑ i=1 i = = 1 + n(n + 1) 2 = n2 + n + 2 2 CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM tj. roznásobením dostáváme diferenční rovnici prvního řádu (kde hodnota p(n) vystupuje v první i v druhé mocnině) (1.10) p(n + 1) = p(n) ( 1 − r K p(n) + r ) . Zkuste si promyslet nebo vyzkoušet chování tohoto modelu pro různé hodnoty r a K. Na obrázku je průběh hodnot pro parametry r = 0, 05 (tj. pětiprocentní nárůst v ideálním stavu), K = 100 (tj. zdroje limitují hodnotu na 100 jedinců) a p(0) jsou dva jedinci. 100 80 60 40 20 x 200150100500 Všimněme si, že počáteční přibližně exponenciální růst se skutečně později zlomí a hodnota se postupně blíží kýženému limitu 100 jedinců. Pro p blízké jedné a K daleko větší než r bude pravá strana rovnice (1.10) přibližně p(n)(1 + r), tzn. chování je obdobné Malthusiánskému modelu. Naopak při p přibližně K bude pravá strana přibližně p(n). Pro větší počáteční hodnoty p než K budou hodnoty klesat, pro menší než K růst, takže systém bude zpravidla postupně oscilovat kolem hodnoty K. 4. Pravděpodobnost Teď se podíváme na jiný obvyklý případ skalárních hodnot funkcí – sledované hodnoty často nejsou známy ani explicitně vzorcem, ani implicitně nějakým popisem. Jsou výsledkem nějaké nahodilosti a my se snažíme popsat s jakou pravděpodobností nastane ta či ona možnost. 1.13. Co je pravděpodobnost? Jako jednoduchý příklad může sloužit obvyklé házení kostkou se šesti stěnami s ozna- čeními 1, 2, 3, 4, 5, 6. Pokud popisujeme matematický model takového házení „poctivou“ kostkou, budeme očekávat a tudíž i předepisovat, že každá ze stran padá stejně často. Slovy to vyjadřujeme „každá předem vybraná stěna padne s pravděpodobností 1 6 “. 19 Rekurentní vztahy mohou mít i složitější podobu než je rekurze prvního řádu. Uveďme si příklady kombinatorických úloh, při jejichž řešení se můžeme rekurze s výhodou využít. 1.32. Kolik existuje slov délky 12 složených pouze z písmen A a B, které neobsahují skupinu BBB? Řešení. Nechť an značí počet slov délky n složených pouze z písmen A, B, neobsahujících skupinu BBB. Pak pro an (n ≥ 3) platí rekurentní vztah an = an−1 + an−2 + an−3, neboť slova délky n splňující danou podmínku musí končit buď na A, nebo na AB, nebo na ABB. Slov končících na A je právě an−1 (před posledním A může být libovolné slovo délky n − 1 splňující danou podmínku. Obdobně pro zbylé dvě skupiny. Dále snadno vyčíslíme a1 = 2, a2 = 4, a3 = 7. Postupným dopočítáním a12 = 1705. Též bychom mohli odvodit explicitní vzorec pro n-tý člen takto zadané posloupnosti, dle uvedené teorie. Charakteristický polynom dané rekurentní rovnice je x3 −x2 −x−1 s jedním reálným a dalšími dvěma komplexními kořeny, které můžeme vyjádřit pomocí vztahů (1.7). 1.33. Skóre basketbalového utkání mezi týmy Česka a Ruska vyznělo po první čtvtině 12 : 9 pro ruský tým. Kolika způsoby se mohlo vyvíjet skóre? K výpočtu můžete použít výpočetní techniky. Řešení. Označíme-li P(k,l) počet způsobů, kterými se mohlo vyvíjet skóre basketbalového utkání, které skončilo k : l, tak pro k, l ≥ 3 platí rekurentní vztah: P(k,l) = P(k−3,l) + P(k−2,l) + P(k−1,l) + P(k,l−1) + P(k,l−2) + P(k,l−3). (Způsoby, kterými se mohlo vyvíjet utkání s výsledným skóre k : l rozdělíme na šest po dvou disjunktních podmnožin podle toho, které družstvo vstřelilo koš a za kolik bodů (1, 2, či 3).) Ze symetrie úlohy zřejmě platí P(k,l) = P(l,k). Dále pro k ≥ 3 platí: P(k,2) = P(k−3,2) + P(k−2,2) + P(k−1,2) + P(k,1) + P(k,0), P(k,1) = P(k−3,1) + P(k−2,1) + P(k−1,1) + P(k,0), P(k,0) = P(k−3,0) + P(k−2,0) + P(k−1,0), což spolu s počátečními podmínkami P(0,0) = 1, P(1,0) = 1, P(2,0) = 2, P(3,0) = 4, P(1,1) = 2, P(2,1) = P(1,1) + P(0,1) + P(2,0) = 5, P(2,2) = 4. PRAVDĚPODOBNOST Pokud ale si třeba sami nožíkem vyrobíme takovou kostku z kusu dřeva, je jisté, že skutečné relativní četnosti výsledků nebudou stejné. Pak můžeme z velikého počtu pokusů usoudit na relativní četnosti jednotlivých výsledků hodů a tyto ustanovit jako pravděpodobnosti v našem matematickém popisu. Nicméně při sebevětším počtu pokusů nemůžeme vyloučit možnost, že se náhodou povedla velice nepravděpodobná kombinace výsledků a že jsme proto náš matematický model skutečnosti pro naši kostku nevybrali dobře. V dalším budeme pracovat s abstraktním matematickým popisem pravděpodobnosti v nejjednoduším přiblížení. To, do jaké míry je takový popis adekvátní pro konkrétní pokusy či jiný problém, je záležitostí mimo samotnou matematiku. To ale neznamená, že by se takovým přemýšlením neměli zabývat matematikové (nejspíše ve spolupráci s jinými experty). Později se vrátíme k pravděpodobnosti coby teorii popisující chování nahodilých procesů nebo i plně determinovaných dějů, kde ovšem neznáme přesně všechny určující parametry. Matematická statistika pak umožňuje posuzovat, do jaké míry lze očekávat, že vybraný model je ve shodě s realitou, resp. umožňuje určit parametry modelu tak, aby docházelo k co nejlepší shodě s pozorováním a zároveň umí odhadnout míru spolehlivosti zvoleného modelu. K matematické pravděpodobnosti i statistice ovšem budeme potřebovat dosti rozsáhlý matematický aparát, který budeme mezitím několik semestrů budovat. Na příkladu naší neumělé kostky si to můžeme představit tak, že v teorii pravděpodobnosti budeme pracovat s parametry pi pro pravděpodobnost jednotlivých hodnot stran a budeme požadovat pouze aby všechny tyto pravděpodobnosti byly nezáporné a jejich součet byl p1 + p2 + p3 + p4 + p5 + p6 = 1. Při volbě konkrétních hodnot pi pro konkrétní kostku pak v matematické statistice budeme schopni odhadnout s jakou spolehlivostí tento model naší kostce odpovídá. Naším skromným cílem je teď pouze naznačit, jak abstraktně zachytit pravděpodobnostní úvahy ve formalizovaných matematických objektech. Následující odstavce tak budou ve své podstatě pouhými cvičeními v jednoduchých operacích nad množinami a jednoduché kombinatorice (tj. výpočtech počtu možností, jak mohou být splněny dané podmínky kladené na konečné množiny prvků). 1.14. Náhodné jevy. Budeme pracovat s neprázdnou pevně zvolenou množinou všech možných výsledků, kterou nazýváme základní prostor. Pro jednoduchost bude pro nás konečná množina s prvky ω1, . . . , ωn, představujícími jednotlivé možné výsledky. Každá podmnožina A ⊂ představuje možný jev. Systém podmnožin A základního prostoru se nazývá jevové pole, jestliže 20 4. PRAVDĚPODOBNOST P(0,2) + P(1,2) + P(2,1) + P(2,0) = 14, dává P(12,9) = 497178513. Poznámka. Vidíme, že rekurentní vztah v tomto příkladu má složitější formu, než kterou jsme se zabývali v teorii a tudíž neumíme vyčíslit libovolné číslo P(k,l) explicitně, nýbrž pouze postupným výpočtem od počátečních členů. Takové rovnice nazýváme parciální diferenční rovnice, protože členy posloupnosti jsou značeny dvěma nezávislými proměnnými (k, l). O lineárních rekurentních formulích (diferenčních rovnicích) vyšších řádů s konstantími koeficienty si povíme více v kapitole 3. 4. Pravděpodobnost Klasická pravděpodobnost Uveďme si několik jednoduchých příkladů na klasickou pravděpodobnost, kdy zkoumáme nějaký pokus, který má konečně mnoho možných výsledků („všechny případy“) a nás zajímá, kdy výsledek pokusu bude náležet nějaké podmnožině možných výsledků („příznivé případy“). Hledaná pravděpodobnost je pak rovna poměru počtu příznivých případů ku počtu všech případů. Klasickou pravděpodobnost můžeme použít tam, kde předpokládáme (víme), že každý z možných výsledků má stejnou pravděpodobnost toho, že nastane (například při hodech kostkou). 1.34. Jaká je pravděpodobnost, že při hodu šestibokou kostkou padne číslo větší než 4? 1.35. Všech možných výsledků je šest (tvoří množinu {1, 2, 3, 4, 5, 6}), příznivé možnosti jsou dvě ({5, 6}). Hledaná pravděpodobnost je tedy 2/6 = 1/3. 1.36. Ze skupiny osmi mužů a čtyř žen náhodně vybereme skupinu pěti lidí. Jaká je pravděpodobnost, že v ní budou alespoň tři ženy? Řešení. Pravděpodobnost spočítáme jako podíl počtu příznivých případů ku počtu všech případů. Příznivé případy rozdělíme podle toho, kolik je v náhodně vybrané skupině mužů: mohou v ní být buď dva, nebo jeden muž. Skupinek o pěti lidech s jedním mužem je osm (záleží pouze na výběru muže, ženy v ní musí být všechny), skupinek se dvěma muži je potom c(8, 2)c(4, 3) = (8 2 )(4 3 ) (vybereme dva muže z osmi a nezávisle na tom tři ženy ze čtyř, tyto dva výběry můžeme nezávisle kombinovat a podle pravidla součinu dostáváme uvedený počet skupin). Všech možných skupin o pěti lidech pak můžeme sestavit c(12, 5) = (12 5 ) . Hledaná pravděpodobnost je tedy CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM • ∈ A (tj. základní prostor, je jevem), • je-li A, B ∈ A, pak A \ B ∈ A (tj. pro každé dva jevy je jevem i jejich množinový rozdíl), • jsou-li A, B ∈ A, pak A∪B ∈ A (tj. pro každé dva jevy je jevem i jejich sjednocení). Zjevně je i komplement Ac = \ A jevu A jevem, který nazýváme opačný jev k jevu A. Průnik dvou jevů je opět jevem, protože pro každé dvě podmnožiny A, B ⊂ platí A \ ( \ B) = A ∩ B. Slovy se tak dá jevové pole charakterizovat jako systém podmnožin (konečného) základního prostoru uzavřený na průniky, sjednocení a rozdíly. Jednotlivé množiny A ∈ A nazýváme náhodné jevy (vzhledem k A). Pro naše házení kostkou je = {1, 2, 3, 4, 5, 6} a jevové pole je tvořeno všemi podmnožinami množiny . Např. náhodný jev {1, 3, 5} pak interpretujeme jako „padne liché číslo“. Něco málo terminologie, která by měla dále připomínat souvislosti s popisem skutečných modelů: • celý základní prostor se nazývá jistý jev, prázdná podmnožina ∅ ∈ A se nazývá nemožný jev, • jednoprvkové podmnožiny {ω} ⊂ se nazývají elementární jevy, • společné nastoupení jevů Ai, i ∈ I, odpovídá jevu ∩i∈I Ai, nastoupení alespoň jednoho z jevů Ai, i ∈ I, odpovídá jevu ∪i∈I Ai, • A, B ∈ A jsou neslučitelné jevy, je-li A ∩ B = ∅, • jev A má za důsledek jev B, když A ⊂ B, Přestavte si příklady všech uvedených pojmů pro jevový prostor popisující házení kostkou nebo obdobně pro házení mincí! 21 8 + (4 3 )(8 2 ) (12 5 ) . 1.37. Do výtahu osmipatrové budovy nastoupilo 5 osob. Každá z nich vystoupí se stejnou pravděpodobností v libovolném poschodí. Jaká je pravděpodobnost, že vystoupí i) všichni v šestém poschodí, ii) všichni ve stejném poschodí, iii) každý v jiném poschodí? Řešení. Základní prostor všech možných jevů je prostor všech možných způsobů vystoupení 5 osob z výtahu. Těch je 85 . V prvním případě je jediná příznivá možnost vystoupení, hledaná pravděpodobnost je tedy 1 85 , ve druhém případě máme osm možností, hledaná pravděpodobnost je tedy 1 84 a konečně ve třetím je počet příznivých případů dán pětiprvkovou variací z osmi prvků (z osmi pater vybíráme pět, ve kterých se vystoupí a dále kteří lidé vystoupí ve vybraných poschodích), celkem je hledaná pravděpodobnost ve třetím případě rovna (viz 1.7 a ??) v(5, 8) V (5, 8) = 8 · 7 · · · 4 85 . = 0, 2050781250. Uveďme si příklad nevhodného použití klasické pravděpodob- nosti: 1.38. Jaká je pravděpodobnost toho, že čtenář této úlohy vyhraje příští týden alespoň milión dolarů v loterii? Řešení. Základní prostor všech možný jevů je dvouprvkový: buď vyhraje nebo nevyhraje. Příznivý jev je jeden (vyhraje), hledaná pravděpodobnost je tedy 1/2. Poznámka. V předchozím příkladě je porušena základní podmínka použití klasické pravděpodobnosti, totiž to, že každý z možných výsledků má stejnou pravděpodobnost toho, že nastane. 1.39. Do řady v kině o 2n místech je náhodně rozmístěno n mužů a n žen. Jaká je pravděpodobnost, že žádné dvě osoby stejného pohlaví nebudou sedět vedle sebe? Řešení. Všech možných rozmístění lidí v řadě je (2n)!, rozmístění splňujících podmínky je 2(n!)2 (máme dvě možnosti výběru pozice mužů, tedy i žen, na nich jsou pak muži i ženy rozmístěny libovolně). Výsledná pravděpodobnost je tedy p(n) = 2(n!)2 (2n)! , p(2) . = 0, 33, p(5) . = 0, 0079, p(8) . = 0, 00016. 4. PRAVDĚPODOBNOST 1.15. Definice. Pravděpodobnostní prostor je trojice ( , A, P), kde A je jevové pole podmnožin (konečného) základního prostoru , na kterém je definována skalární funkce P : A → R s následujícími vlastnostmi: • P je nezáporná, tj. P(A) ≥ 0 pro všechny jevy A, • P je aditivní, tj. P(A ∪ B) = P(A) + P(B), kdykoliv je A, B ∈ A a A ∩ B = ∅, • pravděpodobnost jistého jevu je 1, tj. P( ) = 1. Funkci P nazýváme pravděpodobností na jevovém poli A. Zjevně je okamžitým důsledkem našich definic řada prostých ale užitečných tvrzení. Např. pro všechny jevy platí P(Ac ) = 1 − P(A). Dále můžeme matematickou indukcí snadno rozšířit aditivnost na jakýkoliv konečný počet vzájemně neslučitelných jevů Ai ⊂ , i ∈ I, tj. P(∪i∈I Ai) = ∑ i∈I P(Ai), kdykoliv Ai ∩ Aj = ∅, pro všechna i ̸= j, i, j ∈ I. 1.16. Definice. Nechť je konečný základní prostor a nechť jevové pole A je právě systém všech podmnožin v . Klasická pravděpodobnost je pravděpodobnostní prostor ( , A, P) s pravděpodobnostní funkcí P : A → R, P(A) = |A| | | , kde |A| značí počet prvků množiny A ∈ A. Zjevně takto zadaná funkce skutečně definuje pravděpodobnost, ověřte si samostatně všechny požadované axiomy. 1.17. Sčítání pravděpodobností. U neslučitelných jevů je sčítání pravděpodobností pro výskyt alespoň jednoho z nich přímo požadováno v základní definici pravděpodobnosti. Obecně je sčítání pravděpodobností pro výskyty jevů složité. Problém totiž je, že pokud jsou jevy slučitelné, částečně máme v součtu pravděpodobností započteny příznivé výskyty vícekrát. Nejjednodušší je si nejprve představit situci se dvěma slučitelnými jevy A, B. Uvažme nejprve klasickou pravděpodobnost, kde jde vlastně o počítání prvků v podmnožinách. Pravděpodobnost výskytu alespoň jednoho z nich, tj. pravděpodobnost jejich sjednocení, je dána vztahem (1.11) P(A ∪ B) = P(A) + P(B) − P(A ∩ B) protože ty prvky, které patří do množiny A i B, jsme nejprve započetli dvakrát a tak je musíme jednou odečíst. Tentýž výsledek dostaneme i pro obecnou pravděpodobnost P na nějakém jevovém poli. Protože A∩B a A\B jsou nezávislé jevy, P(A) = P(A \ B) + P(A ∩ B), 22 4. PRAVDĚPODOBNOST 1.40. Náhodně vybereme celé kladné číslo menší než 105 . Jaká je pravděpodobnost, že bude složeno pouze z cifer 0, 1, 5 a zároveň bude dělitelné číslem 5? Řešení. Čísel spňujích danou podmínku je 2 · 34 − 1 (kromě poslední cifry máme na každý řád na výběr ze tří cifer, případné číslice 0 na začátku slova nepíšeme. Všech celých kladných čísel menších než 105 je 105 − 1, podle klasické pravděpodobnosti dostáváme, že hledaná pravděpodobnost je 2·34−1 105−1 . Ukažme si ještě pěkné použití principu inkluze a exkluze: 1.41. Sekretářka má rozeslat šest dopisů šesti různým lidem. Dopisy pro různé adresáty vkládá do obálek s adresami náhodně. Jaká je pravděpodobnost, že alespoň jeden člověk dostane dopis určený pro něj? Řešení. Spočítejme pravděpodobnost jevu opačného, tedy toho, že ani jeden člověk neobdrží správný dopis. Stavový prostor všech možných jevů odpovídá všem možným pořadím pěti prvků (obálek). Označímeli jak obálky tak dopisy čísly od jedné do šesti, tak všechny příznivé jevy (tedy žádný dopis nepřijde do obálky se stejným číslem) odpovídají takovým pořadím šesti prvků, kdy i-tý prvek není na i-tém místě (i = 1, . . . , 6), tzv. pořadím bez pevného bodu. Jejich počet spočítáme pomocí principu inkluze a exkluze. Označíme-li Mi množinu permutací s pevným bodem i (permutace v Mi ale mohou mít i jiné pevné body), tak výsledný počet d permutací bez pevného bodu je roven d = 6! − |M1 ∪ · · · ∪ M6| Počet prvků průniku |Mi1 ∩· · ·∩Mik |, k = 1, . . . , 6, je (6−k)! (pořadí prvků i1, . . . , ik je pevně dáno, ostatních 6−k prvků řadíme libovolně). Podle principu inkluze a exkluze je |M1 ∪ · · · ∪ M6| = 6∑ k=1 (−1)k+1 ( 6 k ) (6 − k)! a tedy pro hledaný počet d dostáváme vztah d = 6! − 6∑ k=1 (−1)k+1 ( 6 k ) (n − k)! = 6∑ k=0 (−1)k ( 6 k ) (6 − k)! = 6! 6∑ k=0 (−1)k k! Pravděpodobnost toho, že žádný člověk neobdrží „svůj“ dopis je tedy 6∑ k=0 (−1)k k! CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM podobně pro B, ale také máme P (A ∪ B) = P(A \ B) + P(B \ A) + P(A ∩ B). Dosazením za pravděpodobnosti množinových rozdílů dostáváme opět vztah (1.11). Následující věta je přímým promítnutím tzv. kombinatorického principu inkluze a exkluze do naší konečné pravděpodobnosti a říká, jakým způsobem vícenásobné započítávání výsledků kompenzovat v obecném případě. Jde patrně o dobrý příklad matematického tvrzení, kde nejtěžší je najít dobrou formulaci a pak se dá říci, že (intuitivně) je tvrzení zřejmé. Na obrázku je situace znázorněna pro tři množiny A, B, C a pro klasickou pravděpodobnost. Jednoduše šrafované oblasti v prostém součtu máme dvakrát, dvojitě šrafované třikrát. Pak ty jednoduše šrafované jednou odečteme, přitom ty dvojitě šrafované opět třikrát odečteme, proto je tam nakonec ješte jednou započteme. Obecně, díky aditivní vlastnosti pravděpodobnosti, si můžeme představit, že každý jev rozložíme na elementární (tj. jednobodové) jevy, jakkoliv ve skutečnosti nemusí jednoprvkové podmnožiny do uvažovaného jevového pole patřit. Pak je pravděpodobnost každého jevu dána součtem pravděpodobností jednotlivých elementárních jevů do něj patřících a můžeme při vyjádření pravděpodobnosti nastoupení alespoň jednoho z jevů takto: sečteme všechny pravděpodobnosti výsledků pro všechna Ai zvlášť, pak ovšem musíme odečíst ty, které tam jsou započteny dvakrát (tj. prvky v průnicích dvou). Teď si ovšem dovolujeme odečíst příliš mnoho tam, kde ve skutečnosti byly prvky třikrát, tj. korigujeme přičtením pravděpodobností ze třetího členu, atd. Věta. Buďte A1, . . . , Ak ∈ A libovolné jevy na základním prostoru s jevovým polem A. Pak platí P(∪k i=1Ai) = k∑ i=1 P(Ai) − k−1∑ i=1 k∑ j=i+1 P(Ai ∩ Aj ) + k−2∑ i=1 k−1∑ j=i+1 k∑ ℓ=j+1 P(Ai ∩ Aj ∩ Aℓ) 23 a hledaná pravděpodobnost pak 1 − 6∑ k=0 (−1)k k! = 53 144 . Poznámka. Všimněme si, že odpověď na stejnou otázku, se s rostoucím počtem dopisů příliš nemění. Pro n dopisů je pravděpodobnost, že sekretářka nedá žádný do správné obálky 1 − n∑ k=0 (−1)k k! . = 1 − 1 e , jak totiž uvidíme později, uvedená suma konverguje (blíží se) k hodnotě 1/e. 1.42. Volejbalový tým (s liberem, tj. celkem sedum osob) sedí po zápase v hospodě a popíjí zasloužené pivo. Je ale málo kríglů a proto hospodský používá pořád těch sedum samých. Jaká je pravděpodobnost, že příště i) právě jeden nedostane ten svůj, ze kterého pil ii) nikdo nedostane ten svůj iii) právě tři dostanou ten svůj. 1.43. Další principy počítání s pravděpodobnostmi. Vraťme se k házení kostkou a zkusme popsat jevy ze základního prostoru vznikající při házení tak dlouho, dokud nepadne šestka, ne však více než stokrát. Pro jeden hod samostatně je základním prostorem šest čísel od jedné do šesti a jde o klasickou pravděpodobnost. Pro celé série našich hodů bude základní prostor daleko větší – bude to množina konečných posloupností čísel od jedné do šestky, které buď končí šestkou, mají nejvýše 100 členů a všechna předchozí čísla jsou menší než šest, nebo jde o 100 čísel od jedné do pěti. Jevem A může být např. podmnožina „házení končí druhým pokusem“. Všechny příznivé elementární jevy pak jsou [1, 6], [2, 6], [3, 6], [4, 6], [5, 6]. Ze známé klasické pravděpodobnosti pro jednotlivé hody umíme odvodit pravděpodobnosti našich jevů v . Není to ale jistě klasická pravděpodobnost. Tak pro diskutovaný jev chceme popsat, s jakou pravděpodobností nepadne šestka při prvém hodu a zároveň padne při druhém. Vnucuje se řešení P(A) = 5 6 · 1 6 = 5 36 , 4. PRAVDĚPODOBNOST − · · · + (−1)k−1 P(A1 ∩ A2 ∩ · · · ∩ Ak). Důkaz. Aby se výše naznačený postup stal důkazem, je zapotřebí si ujasnit, že skutečně všechny korekce, tak jak jsou popsány, jsou skutečně s koeficienty jedna. Místo toho můžeme snáze dát dohromady formálnější důkaz matematickou indukcí přes počet k jevů, jejichž pravděpodobnosti sčítáme. Zkuste si průběžně porovnávat oba postupy, mělo by to vést k vyjasnění, co to znamená „dokázat“ a co „porozumět“. Pro k = 1 tvrzení zjevně platí, vztah pro k = 2 je totožný s rovností (1.11) a tu jsme pro obecné pravděpodobnostní funkce již dokázali také. Předpokládejme tedy, že věta platí pro všechny počty množin až do pevně zvoleného k ≥ 1. Nyní můžeme pracovat v indukčním kroku se vztahem pro k + 1 jevů, když sjednocení prvních k jevů bereme jako A ve vzorci (1.11) výše, zatímco zbývající jev hraje roli B: P(∪k+1 i=1 Ai) = P( ( ∪k i=1Ai ) ∪ Ak+1) = k∑ j=1 ( (−1)j+1 ∑ 1≤i1<··· 0, potom P(A1 ∩ A2) = P(A2)P(A1|A2) = P(A1)P(A2|A1). Všechna tato čísla vyjadřují pravděpodobnost toho, že nastanou oba jevy A1 i A2, jenom jinými způsoby. Například v posledním případě nejprve sledujeme, zda nastane první jev. Potom za předpokladu, že ten první nastal, sledujeme zda nastane i ten druhý. Podobně, pro tři jevy A1, A2, A3 splňující P(A1 ∩ A2 ∩ A3) > 0, dostaneme P(A1 ∩ A2 ∩ A3) = P(A1)P(A2|A1)P(A3|A1 ∩ A2). Slovy to lze opět popsat tak, že pravděpodobnost výskytu všech tří jevů zároveň můžeme spočítat tak, že se nejprve zabýváme výskytem pouze prvního z nich, potom druhého za předpokladu, že první už nastal a naposledy třetího za předpokladu, že oba předešlé jevy již nastaly. Máme-li obecný počet k jevů A1, . . . , Ak splňujících P(A1 ∩ · · · ∩ Ak) > 0, pak věta říká následující: P(A1∩· · ·∩Ak) = P(A1)P(A2|A1)· · ·P(Ak|A1∩· · ·∩Ak−1). 26 4. PRAVDĚPODOBNOST že někdo z vybraných pěti set lidí zahyne, je tedy 1 − ( 1 − 12 105 )5000 . = 0, 4512. Poznámka. Model, který jsme použili v předchozím příkladu k popisu zadané situace, je pouze přibližný. Problém spočívá v podmínce, že každý občan z vyšetřovaného vzorku má stejnou pravděpodobnost toho, že v průběhu roku zahyne, kterou jsme odhadli z počtu usmrcených osob za rok. Počet tragických nehod se totiž rok od roku mění a i kdyby se neměnil, tak se mění populace. Ukažme si jednu s nepřesností příkladu na jiném způsobu řešení: zahyne-li 1200 osob za rok, tak za deset let zahyne 12000. Pravděpodobnost toho, že konkrétní člověk zahyne v průběhu deseti let tedy můžeme odhadnout i zlomkem 12000/107 . Pravděpodobnost, že konkrétní osoba nezahyne v průběhu 10 let je tedy (1 − 12 104 ) (to jsou první dva členy binomického rozvoje (1 − 12 105 )10 ). Celkem dostáváme anolagicky jako v předchozím řešení odhad pravděpodobnosti 1 − ( 1 − 12 104 )500 . = 0, 4514. Vidíme, že oba odhady jsou velmi blízké. Snaha použít matematických znalostí k výhře v nejrůznějších hazardních hrách je velmi stará. Podívejme se na jednoduchý příklad. 1.48. Alešovi zbylo 2500 Kč z pořádání tábora. Aleš není žádný ňouma: 50 Kč přidal z kasičky a rozhodl se jít hrát ruletu na automaty. Aleš sází pouze na barvu. Pravděpodobnost výhry při sázce na barvu je 18/37. Začíná sázet na 10 Kč a pokud prohraje, v další sázce vsadí dvojnásobek toho, co v předchozí (pokud na to ještě má, pokud ne, tak končí s hrou – byť by měl ještě peníze na nějakou menší sázku). Pokud nějakou sázku vyhraje, v následující sázce hraje opět o 10 Kč. Jaká je pravděpodobnost, že při tomto postupu vyhraje dalších 2550 Kč? (jakmile bude 2500 Kč v plusu, tak končí) Řešení. Nejprve spočítejme, kolikrát po sobě může Aleš prohrát. Začíná-li s 10 Kč, tak na n vsazení potřebuje 10 + 20 + · · · + 10 · 2n−1 = 10( n−1∑ i=0 2i ) = 10( 2n − 1 2 − 1 ) = 10 · (2n − 1). Jak snadno nahlédneme, číslo 2550 je tvaru 10(2n − 1) a to pro n = 8. Aleš tedy může sázet osmkrát po sobě bez ohledu na výsledek sázky, na devět sázek by potřeboval již 10(29 − 1) = 5110 Kč a to v průběhu hry nikdy mít nebude (jakmile bude mít 5100 Kč, tak končí). Aby tedy jeho hra skončila neúspěchem, musel by prohrát osmkrát v řadě. Pravděpodobnost prohry při jedné sázce je 19/37, pravděpodbnost prohry CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM Skutečně, dle předpokladu jsou i pravděpodobnosti všech průniků, které jsou brány ve výrazu za hypotézy, nenulové. Pokrácením čitatelů a jmenovatelů získáme i napravo právě pravděpodobnost jevu odpovídajícího průniku všech uvažovaných jevů. 1.21. Geometrická pravděpodobnost. V praktických problémech se často setkáváme s daleko složitějšími modely, kde základní prostor není konečnou množinou. Nemáme momentálně k dispozici ani základní nástroje pro dostatečné zobecnění pojmu pravděpodobnosti, nicméně můžeme uvést alespoň jednoduchou ilustraci. Uvažme rovinu R2 dvojic reálných čísel a v ní podmnožinu se známým obsahem vol (symbol „vol“ je od anglického „volume“, tj. obsah/objem). Příkladem může sloužit třeba jednotkový čtverec. Náhodné jevy budou reprezentovány podmnožinami A ⊂ a za jevové pole A bereme nějaký vhodný systém podmnožin, u kterých umíme určit jejich obsah. Nastoupení nebo nenastoupení jevu je dáno výběrem bodu v , kterým se trefíme nebo netrefíme do množiny reprezentující jev A. Uvažme jako příklad problém, kdy náhodně vybereme dvě hodnoty a < b v intervalu [0, 1] ⊂ R. Všechny hodnoty a i b jsou stejně pravděpodobné a otázka zní „jaká je pravděpodobnost, že interval (a, b) bude mít velikost alespoň jedna polovina?“. Volba čísel a, b je volbou libovolného bodu [a, b] ve vnitřku trojúhelníku s hraničními vrcholy [0, 0], [0, 1], [1, 1] (viz obrázek). Úlohu si můžeme představit jako popis problému, kdy se hodně unavený účastník večírku nad ránem pokouší dvěma řezy rozdělit párek na tři díly pro sebe a své dva kamarády. Jaká je pravděpodobnost, že se na někoho dostane aspoň půlka? Odpověď je docela jednoduchá: Podobně jako u klasické pravděpodobnosti definujeme pravděpodobnostní funkci P : A → R vztahem P(A) = vol A vol , 27 v osmi po sobě následujících (nezávislých) sázkách je tedy (19/37)8 . Pravděpodobnost, že v těchto osmi hrách vyhraje 10 Kč (při daném postupu) je tedy 1 − (19/37)8 . Na to, aby vyhrál 2500 Kč, potřebuje 255 krát vyhrát po desetikoruně. Tedy opět podle pravidla součinu je pravděpodobnost výhry ( 1 − ( 19 37 )8 )255 . = 0, 29. Tedy pravděpodobnost výhry je nižší, než kdyby vsadil rovnou vše na jednu barvu. 1.49. Samostatně si můžete vyzkoušet spočítat předchozí příklad za předpokladu, že Aleš sází stejnou metodou jako v předchozím příkladě, končí však až v okamžiku, kdy nemá žádné peníze (pokud nemá na vsazení dvojnásobku částky prohrané v předchozí sázce, ale má ještě nějaké peníze, začíná sázet znovu od 10 Kč). Podmíněná pravděpodobnost 1.50. Jaká je pravděpodobnost toho, že při hodu dvěma kostkami padne součet 7, víme-li, že ani na jedné z kostek nepadlo číslo 2? Řešení. Označme jako B jev, že ani na jedné kostce nepadne dvojka, jev „padne součet 7“ označme jako A. Množinu všech možných výsledků budeme značit opět jako . Pak P(A|B) = P(A ∩ B) P(B) = |A∩B| | | |B| | | = |A ∩ B| |B| Číslo 7 může padnout čtyřmi různými způsoby, pokud nepadne dvojka, tedy |A ∩ B| = 4, |B| = 5 · 5 = 25, tedy P(A|B) = 4 25 . Všimněme si, že P(A) = 1 6 , tedy jevy A a B jsou závislé. 1.51. Michal má dvě poštovní schránky, jednu na gmail.com a jednu na seznam.cz. Uživatelské jméno má stejné na obou serverech, hesla různá (ale nepamatuje si, které heslo má na kterém serveru). Při zadávání hesla při přístupu do schránky se splete s pravděpodobností 1/20 (tj. jestliže chce napsat zadat jemu známé slovo jako heslo, tak jej s pravděpodobností 95% skutečně správně na klávesnici zadá). Michal zadal na serveru seznam.cz jméno a heslo a server mu oznámil, že něco není vpořádku. Jaká je pravděpodobnost, že chtěl zadat správné heslo, ale pouze se „překlepnul“ při zadávání? (Předpokládáme, že uživatelské jméno zadá vždy bez chyby.) Řešení. Označme A jev, že Michal fyzicky zadal na serveru seznam.cz špatné heslo. Tento jev je sjednocením dvou disjunktních jevů: A1 : chtěl zadat správné heslo a přepsal se, 5. GEOMETRIE V ROVINĚ kde A jsou podmnožiny v rovině, které odpovídají námi vybraným jevům. Potřebujeme tedy znát plochu podmnožiny, která odpovídá bodům s b ≥ a + 1 2 , tj. vnitřku trojúhelníku A ohraničeného vrcholy [0, 1 2 ], [0, 1], [1 2 , 1]. Evidentně dostáváme P(A) = 1 4 . Zkuste si samostatně odpovědět na otázku „pro jakou požadovanou minimální délku intervalu (a, b) dostaneme pravděpodobnost jedna polovina?“. 1.22. Metody Monte Carlo. Jednou z účinných výpočetních metod přibližných hodnot je naopak simulace známé takovéto pravděpodobnosti pomocí relativní četnosti nastoupení vhodně zvoleného jevu. Např. známá formule pro obsah kruhu o daném poloměru říká, že obsah jednotkového kruhu je roven právě konstantě π = 3, 1415 . . . , která vyjadřuje poměr obsahu kruhu a druhé mocniny jeho poloměru. (Tady si také povšimněme východiska, které jsme nedokázali – proč by měl být obsah kruhu roven konstantnímu násobku druhé mocniny poloměru? Matematicky to budeme umět ukázat, až zvládneme tzv. integrování. Experimentálně si to ale můžeme ověřit níže uvedeným postupem s různými velikostmi strany čtverce.) Pokud zvolíme za jednotkový čtverec a za A průnik a jednotkového kruhu se středem v počátku, pak vol A = 1 4 π. Máme-li tedy spolehlivý generátor náhodných čísel mezi nulou a jedničkou a počítáme relativní četnosti, jak často bude vzdálenost bodu [a, b] (určeného vygenerovanou dvojicí a, b) od počátku menší než jedna, tj. a2 + b2 < 1, pak výsledek bude při velkém počtu pokusů s velikou jistotou dobře aproximovat číslo 1 4 π. Numerickým postupům založeným na tomto principu se říká metody Monte Carlo. 5. Geometrie v rovině V posledních odstavcích jsme intuitivně používali elementární pojmy z geometrie reálné roviny. Teď budeme podrobněji zkoumat, jak se vypořádávat s potřebou popisovat „polohu v rovině“, resp. dávat do souvislostí polohy různých bodů roviny. Nástrojem k tomu budou opět zobrazení, tentokrát to ale budou velice speciální pravidla přiřazující dvojicím hodnot (x, y) dvojice (w, z) = F(x, y). Zároveň půjde o předzvěst úvah z oblasti matematiky, které se říká lineární algebra a kterou se budeme podrobně zabývat v dalších třech kapito- lách. 1.23. Vektorový prostor R2 . Podívejme se na „rovinu“ jakožto na množinu dvojic reálných čísel (x, y) ∈ R2 . Budeme jim říkat vektory v R2 . Pro takové vektory umíme definovat sčítání „po složkách“, tj. pro vektory u = (x, y) a 28 4. PRAVDĚPODOBNOST A2 : chtěl zadat špatné heslo (to z gmail.com) a buď se přepsal nebo ne. Hledáme tedy podmíněnou pravděpodobnost P(A1|A), ta je podle vztahu pro podmíněnou pravděpodobnost rovna: P(A1|A) = P(A1 ∩ A) P(A) = P(A1) P(A1 ∪ A2) = P(A1) P(A1) + P(A2) , potřebujeme tedy určit pravděpodobnosti P(A1) a P (A2). Jev A1 je konjunkcí (průnikem) dvou nezávislých jevů: Michal chtěl zadat správné heslo a Michal se při zadávání přepsal. Dle zadání je pravděpodobnost prvního z nich 1/2, druhého 1/20, celkem P(A1) = 1 2 · 1 20 = 1 40 (pravděpodobnosti násobíme, protože se jedná o nezávislé jevy). Dále je ze zadání P(A2) = 1 2 . Celkem P(A) = P(A1) + P(A2) = 1 40 + 1 2 = 21 40 , a můžeme vyčíslit: P(A1|A) = P(A1) P(A) = 1 40 21 40 = 1 21 . Geometrická pravděpodobnost. Metodu geometrické pravděpodobnosti můžeme použít v případě, že daný jevový prostor sestává z nekonečně mnoha elementárních jevů, které dohromady vyplňují nějakou oblast na přímce, rovnině, prostoru (u které umíme určit její délku, obsah, objem, ...). Předpokládáme, že pravděpodobnost toho, že nastane elementární jev z určité podoblasti je rovna poměru její velikosti (délce, obsahu, ...) k velikosti celého jevového prostoru. 1.52. Z Těšína vyjíždí vlaky co půl hodinu (směrem na Bohumín) a z tohoto směru přijíždějí také každé půl hodiny. Předpokládejme, že vlaky se mezi těmito dvěma stanicemi pohybují rovnoměrnou rychostí 72 km/h a jsou dlouhé 100 metrů, cesta trvá 30 minut, vlaky se míjejí někde na trase. Nevyspalý hazardér Jarek si vybere jeden z těchto vlaků a během cesty z Těšína do Bohumína náhodně vystrčí hlavu z okna na pět vteřin nad kolejiště pro protější směr. Jaká je pravděpodobnost, že mu bude uražena? (Předpokládáme, že jiné než zmíněné vlaky na trati nejezdí.) Řešení. Vzájemná rychlost protijedoucích vlaků je 40 m/s, protijedoucí vlak mine Jardovo okno za dvě a půl sekundy. Prostor všech možností je tedy interval ⟨0, 1800 s⟩, prostor „příznivých“ možností je potom interval délky 7, 5 s ležící někde uvnitř předchozí úsečky. Pravděpodobnost uražení hlavy je tedy 7, 5/1800 . = 0, 004. 1.53. Jednou denně někdy mezi osmou hodinou ranní a osmou hodinnou večerní vyjíždí náhodně autobus z Koločavy do Užhorodu. Jednou CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM v = (x′ , y′ ) klademe u + v = (x + x′ , y + y′ ). Protože pro jednotlivé složky platí všechny vlastnosti komutativní grupy, evidentně budou tyto vlastnosti platit i pro naše nové sčítání vektorů. Zejména tedy máme tzv. nulový vektor 0 = (0, 0), jehož přičtením k jakémukoliv vektoru v dostaneme opět vektor v. Záměrně teď používáme tentýž symbol 0 pro vektor i jeho skalární složky — z kontextu je vždy jasné, jakou „nulu“ máme kdy na mysli. Dále definujeme násobení vektorů a skalárů tak, že pro a ∈ R a v = (x, y) ∈ R2 klademe a · v = (ax, ay). Zpravidla budeme znak · vynechávat a pouhé zřetězení znaků a v bude označovat skalární násobek vektoru. Přímo se ověří další vlastnosti pro násobení skaláry a, b a sčítání vektorů u, v, např. a (u+v) = a u+a v, (a+b)u = a u+b u, a(b u) = (ab)u, kde opět používáme stejný znak plus pro sčítání vektorů i skalárů. Tyto operace si můžeme dobře představit, jestliže uvažujeme vektory v jako šipky začínající v počátku 0 = [0, 0] a končící v bodě [x, y] v rovině. Takové šipky pak můžeme přikládat jednu za druhou a to přesně odpovídá sčítání vektorů. Násobení skalárem a pak odpovídá natažení dané šipky na a–násobek. Nyní můžeme udělat podstatný krok: jestliže si zapamatujeme dva významné vektory e1 = (1, 0) a e2 = (0, 1), pak každý jiný vektor dostaneme jako u = (x, y) = x e1 + y e2. Výrazu napravo říkáme lineární kombinace vektorů e1 a e2. Dvojici vektorů e = (e1, e2) říkáme báze vektorového prostoru R2 . 29 denně ve stejném časovém rozmezí jezdí jiný autobus náhodně opačným směrem. Cesta tam trvá pět hodin, zpět též pět hodin. Jaká je pravděpodobnost, že se autobusy potkají, jezdí-li po stejné trase? Řešení. Prostor všech možných jevů je čtverec 12 × 12, Označíme-li doby odjezdu obou autobusů x, resp. y, pak se tyto na trase potkají právě když |x − y| ≤ 5. Tato nerovnost vymezuje v daném čtverci oblast „příznivých jevů“. Obsah zbylé části spočítáme přímo jednodušeji, neboť je sjednocením dvou pravoúhlých rovnoramenných trojúhelníků o odvěsnách délky 7, tedy je roven 49, obsah části odpovídající „příznivým jevům“ je tedy 144 − 49 = 95, celkem je hledaná pravděpodobnost p = 95 144 . = 0, 66. 1.54. Dvoumetrová tyč je náhodně rozdělena na tři díly. Určete pravděpodobnost, že alespoň jeden díl bude nejvýše 20 cm dlouhý. Řešení. Náhodné rozdělení tyče na tři díly je dáno dvěma body řezu, čísly x a y (nejprve tyč rozřízneme ve vzdálenosti x od počátku, nehýbeme s ní a dále ji rozřízneme ve vzdálenosti y od počátku). Pravděpodobnostní prostor je tedy čtverec C o straně 2 m. Umístíme-li čtverec C tak, aby dvě jeho strany ležely na kartézských osách v rovině, tak podmínka, že alespoň jeden díl má být nejvýše 20 cm dlouhý, nám vymezuje ve čtverci následující oblast O: O = {(x, y) ∈ C| (x ≤ 20) ∨ (x ≥ 180) ∨ (y ≤ 20) ∨ (y ≥ 180) ∨ (|x − y|) ≤ 20}. Jak snadno nahlédneme, zaujímá takto vymezená oblast 51 100 obsahu čtverce. 5. GEOMETRIE V ROVINĚ Jestliže si ale vybereme jiné dva vektory u, v, které nejsou jeden násobek druhého, tj. jinou bázi v R2 , budeme moci udělat totéž. Lineární kombinace w = x u + y v nám pro všechny různé dvojice (x, y) dá právě všechny vektory w v rovině. Nakonec můžeme nahlížet vektory jako naše šipky v abstraktní poloze, tj. zapomeneme na ztotožnění bodů v rovině s dvojicemi čísel. Jenom budou naše šipky všechny „upoutány“ v bodě 0, který je zároveň nulovým vektorem. Zůstanou nám operace sčítání a násobení skaláry a teprve volbou báze e1, e2 ztotožníme naši rovinu šipek s R2 . 1.24. Afinní rovina. Když si pevně vyvolíme nějaký vektor u ∈ R2 , můžeme jej přičítat (tj. coby šipku přikládat) k libovolnému bodu P = [x, y]. Máme tak tedy s pevným vektorem definované posunutí, které každý bod roviny P zobrazí na P + u. Zkusme teď úplně zapomenout na souřadnice a vnímat celou rovinu jako množinu, na které fungují naše posunutí. Takovou množinu A = R2 si můžeme představit z pohledu pozorovatele, který sedí v některém pevně zvoleném místě (můžeme mu říkat třeba bod O = [x0, y0] ∈ R2 ). Předpokládejme, že ji vnímá jako nekonečnou desku bez jakýchkoliv zvolených měřítek a popisů a jenom ví, co to znamená posunout se o libovolný násobek nějakého vektoru u ∈ R2 . Takové rovině budeme říkat „afinní rovina“. Aby mohl vidět kolem sebe „dvojice reálných čísel“, musí si vybrat nějaký bod E1, kterému řekne „bod [1, 0]“ a jiný bod E2, kterému začne říkat „bod [0, 1]“. Jinými slovy, zvolí si bázi e1 = (1, 0), e2 = (0, 1) mezi vektory posunutí. Do všech ostatních se pak dostane tak, že poskočí „a–krát ve směru e1 “ a pak „b–krát ve směru e2 “ a takovému bodu bude říkat „bod [a, b]“. Pokud to bude dělat obvyklým způsobem, nebude výsledek záviset na pořadí, tzn. může také napřed jít b–krát ve směru e2 a pak teprve ve směru e1. 30 5. GEOMETRIE V ROVINĚ 5. Geometrie v rovině 1.55. Napište obecnou rovnici přímky p : x = 2 − t, y = 1 + 3t, t ∈ R. Řešení. Vektor (−1, 3) je směrovým vektorem přímky p. Proto vektor (3, 1) je jejím normálovým vektorem a obecná rovnice přímky p má tvar 3x + y + c = 0 pro jisté c ∈ R. Tuto konstantu c určíme dosazením x = 2, y = 1 (přímka p prochází bodem [2, 1] daným volbou t = 0). Získáváme tak c = −7 a následně výsledek 3x + y − 7 = 0. 1.56. Je dána přímka p : [2, 0] + t(3, 2), t ∈ R Určete její obecnou rovnici a nalezněte průnik s přímkou q : [−1, 2] + s(1, 3), s ∈ R Řešení. Souřadnice bodů na přímce jsou dány dle daného parametrického zadání jako x = 2 + 3t a y = 0 + 2t. Vyloučením parametru t ze soustavy těchto dvou rovnic dostáváme obecnou rovnici přímky p: 2x − 3y − 4 = 0. Průnik s přímkou q získáme dosazením parametrického vyjádření bodů přímky q, tedy x = −1 + s a y = 2 + 3s, do obecné rovnice přímky p: 2(−1 + s) − 3(2 + 3s) − 4 = 0, odkud s = −12/7 a dosazením do parametrického vyjádření přímky q dostáváme souřadnice průsečíku P : P = [− 19 7 , − 22 7 ]. CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM To, co jsme popsali, se nazývá volba (afinního) souřadného systému v rovině, bod O je jeho počátkem, a obecně každý bod P roviny je ztotožněn s dvojicí čísel [a, b], kterou také budeme psát jako posunutí P − O. Budeme dále pracovat v pevně zvolených souřadnicích, tj. s dvojicemi reálných čísel, ale pro lepší orientaci budeme vektory zapisovat s kulatými závorkami místo hranatých u souřadnic bodů v afinní rovině. 1.25. Přímky v rovině. Když se náš pozorovatel umí posouvat o libovolný násobek pevného vektoru, pak také ví, co je to přímka. Je to podmnožina p ⊂ A v rovině taková, že existují bod O a nenulový vektor v takové, že p = {P ∈ A; P − O = t · v, t ∈ R}. Popišme si P = P(t) ∈ p ve zvolených souřadnicích s volbou v = (α, β): x(t) = x0 + α · t, y(t) = y0 + β · t. Protože vektor v = (α, β) je nenulový, musí být aspoň jedno z čísel α, β různé od nuly. Když pro určitost předpokládáme, že třeba α ̸= 0, pak vyloučíme t z parametrického vyjádření pro x a y a jednoduchým výpočtem dostaneme −βx + αy = −βx0 + αy0. To je obecná rovnice přímky (1.13) ax + by = c, se známým vztahem dvojice čísel (a, b) = (−β, α) a směrového vektoru přímky v = (α, β) (1.14) aα + bβ = 0. 31 1.57. Stanovte průsečík přímek p : x + y − 4 = 0, q : x = −1 + 2t, y = 2 + t, t ∈ R. Řešení. Nejdříve poznamenejme, že směrovým vektorem přímky p je up = (1, −1) (libovolný nenulový vektor kolmý k vektoru (1, 1) z obecné rovnice přímky) a směrovým vektorem přímky q je uq = (2, 1). To, že vektor up není násobkem vektoru uq, pak zaručuje, že se přímky protínají (přímky nejsou rovnoběžné). Bod [x, y] je hledaným průsečíkem, právě když jeho souřadnice vyhovují rovnici přímky p a současně existuje reálné číslo t, pro které x = −1 + 2t, y = 2 + t. Dosadíme-li odsud do obecné rovnice p, obdržíme (−1 + 2t) + (2 + t) − 4 = 0. Této rovnici vyhovuje právě t = 1, což dává průsečík se souřadnicemi x = 1, y = 3. 1.58. Najděte obecnou rovnici přímky p, jež prochází bodem [2, 3] a je rovnoběžná s přímkou x − 3y + 2 = 0, a parametrickou rovnici přímky q procházející body [1, 3] a [−2, 1]. Řešení. Každá přímka rovnoběžná s přímkou x−3y+2 = 0 je zadána rovnicí x − 3y + c = 0 pro nějaké c ∈ R. Přímka p prochází bodem [2, 3]. Musí tedy platit 2 − 3 · 3 + c = 0, tj. c = 7. Pro přímku q lze ihned uvést její parametrické vyjádření q : [1, 3] + t (1 − (−2), 3 − 1) = [1, 3] + t (3, 2) , t ∈ R. 1.59. Zjistěte, zda některé z přímek p1 : 2x + 3y − 4 = 0, p2 : x − y + 3 = 0, p3 : −2x + 2y = −6, p4 : −x − 3 2 y + 2 = 0, p5 : x = 2 + t, y = −2 − t, t ∈ R (ne)jsou totožné. Řešení. Je vidět, že −2 · ( −x − 3 2 y + 2 ) = 2x + 3y − 4. Obecné rovnice p1 a p4 tudíž zadávají stejnou přímku. Normálový vektor přímky p1 je (2, 3), pro přímku p2 je (1, −1), pro p3 je (−2, 2) a pro p5 je (1, 1) (kolmý vektor k vektoru (1, −1)). Přímky p2 a p3 jsou rovnoběžné (normálový vektor jedné je násobkem normálového vektoru druhé). Další dvojice rovnoběžných přímek neexistují. Neboť soustava x − y + 3 = 0, −2x + 2y + 6 = 0 5. GEOMETRIE V ROVINĚ Výraz nalevo v rovnici přímky (1.13) můžeme vidět jako skalární funkci F závislou na bodech v rovině a s hodnotami v R, samu rovnici pak jako požadavek na její hodnotu. Časem uvidíme, že vektor (a, b) je v tomto případě právě směrem, ve kterém F nejrychleji roste. Proto bude směr kolmý na (a, b) právě tím směrem, ve kterém zůstává naše funkce F konstantní. Konstanta c pak určuje, kterou ze všech rovnoběžných přímek rovnice určuje. Mějme nyní dvě přímky p a q a ptejme se po jejich průniku p ∩ q. Ten bude popsán jako bod, splňující obě rovnice přímek současně. Pišme je takto (1.15) ax + by = r cx + dy = s. Opět můžeme levou stranu vnímat jako přiřazení, které každé dvojici souřadnic [x, y] bodů P v rovině přiřadí vektor hodnot dvou skalárních funkcí F1 a F2 daných levými stranami jednotlivých rovnic (1.15). Můžeme tedy naše rovnice napsat jako jediný vztah F(v) = w, kde F je přiřazení, které vektor v popisující polohu obecného bodu v rovině (v našich souřadnicích) zobrazí na vektor zadaný levou stranou rovnic, a požadujeme, aby se toto zobrazení strefilo do předem zadané hodnoty w = (r, s). 1.26. Lineární zobrazení a matice. Přiřazení F, se kterými jsme pracovali při popisu průniku přímek, mají jednu velice podstatnou společnou vlastnost: respektují operace sčítání a násobení s vektory a skaláry, tj. respektují lineární kombinace: F(a · v + b · w) = a · F(v) + b · F(w) pro všechny a, b ∈ R, v, w ∈ R2 . Říkáme, že F je lineární zobrazení z R2 do R2 , a píšeme F : R2 → R2 . Slovy lze podmínku také vyjádřit tak, že lineární kombinace vektorů se zobrazuje na tutéž lineární kombinaci jejich obrazů, tj. lineární zobrazení jsou ta zobrazení, která zachovávají lineární kombinace. 32 5. GEOMETRIE V ROVINĚ zjevně nemá řešení, přímky p1 a p4 tvoří jedinou dvojici totožných přímek. 1.60. Určete přímku p, která je kolmá k přímce q : 6x−7y+13 = 0 a která prochází bodem [−6, 7]. Řešení. Protože normálový vektor přímky q je směrový vektor přímky p, můžeme bezprostředně napsat výsledek p : x = −6 + 6t, y = 7 − 7t, t ∈ R. 1.61. Udejte příklad čísel a, b ∈ R, pro něž je vektor u normálovým vektorem přímky AB, je-li A = [1, 2], B = [2b, b], u = (a − b, 3). Řešení. Směrovým vektorem přímky AB je (2b − 1, b − 2) (tento vektor je vždy nenulový), a proto jejím normálovým vektorem je (2 − b, 2b − 1). Položíme-li 2 − b = a − b, 2b − 1 = 3, dostáváme a = b = 2. 1.62. Určete vzájemnou polohu přímek p, q v rovině, jestliže je p : 2x − y − 5 = 0, q : x + 2y − 5 = 0. Pokud se jedná o různoběžky, nalezněte souřadnice jejich průsečíku. Řešení. Z obecných rovnic přímek p, q známe jejich normálové vektory (2, −1), (1, 2). Přímky jsou rovnoběžné právě tehdy, je-li normálový vektor jedné násobkem normálového vektoru druhé, což zřejmě pro přímky p, q splněno není. Jde tedy o různoběžky. Průsečík nalezneme vyřešením soustavy 2x − y − 5 = 0, x + 2y − 5 = 0. Když z první rovnice vyjádříme y = 2x −5 a dosadíme za y do druhé, získáme x + 2(2x − 5) − 5 = 0, tj. x = 3. Poté snadno určíme y = 2 · 3 − 5 = 1. Přímky se tak protínají v bodě [3, 1]. 1.63. Uvažujme rovinu R2 se standardní soustavou souřadnic. Z počátku [0, 0] je vyslán laserový paprsek ve směru (3, 1). Dopadne na zrcadlovou přímku p danou parametricky jako p : [4, 3] + t(−2, 1) a poté se odrazí (úhel dopadu je shodný s úhlem odrazu). V jakém bodě dopadne odražený paprsek na přímku q, danou parametricky jako q : [7, −10] + t(−1, 6)? CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM Se stejným chováním jsme se setkali i v rovnici (1.13) pro přímku, kde šlo o lineární zobrazení F : R2 → R a jeho předepsanou hodnotu c. To je také důvodem, proč jsou hodnoty zobrazení z = F(x, y) na obrázku vyobrazeny jako rovina v R3 . Stručně budeme zapisovat taková zobrazení pomocí tzv. matic a jejich násobení. Maticí rozumíme obdélníkové schéma skalárů, např. A = ( a b c d ) nebo v = ( x y ) , hovoříme o (čtvercové) matici A a (sloupcovém) vektoru v. Jejich násobení definujeme takto: A · v = ( a b c d ) · ( x y ) = ( ax + by cx + dy ) . Podobně, můžeme místo vektoru v zprava násobit jinou maticí B stejného rozměru jako je A. Prostě aplikujeme předchozí formule po jednotlivých sloupcích matice B a obrdržíme jako výsledek opět čtvercovou matici. Neumíme násobit vektor v zprava maticí A protože nám nevychází počty skalárů na řádcích v s počty skalárů ve sloupcích A. Umíme však napsat vektor w do řádku skalárů (tzv. transponovaný vektor) wT = (a b) a ten zprava našimi maticemi A nebo vektory v již násobit umíme. Snadno ověříme tzv. asociativitu násobení (propočítejte pro obecné matice A, B a vektor v detailně): (A · B) · v = A · (B · v). Místo vektoru v můžeme samozřejmě psát i libovolnou matici C správného rozměru. Stejně snadno je vidět i distributi- vita A · (B + C) = A · B + A · C, neplatí však komutativita a existují „dělitelé nuly“. Např. ( 0 1 0 0 ) · ( 0 0 0 1 ) = ( 0 1 0 0 ) , ( 0 0 0 1 ) · ( 0 1 0 0 ) = ( 0 0 0 0 ) . Zejména vidíme, že násobení vektorů pevnou maticí zadává linerání zobrazení, a naopak, pomocí hodnot lineárního zobrazení F na dvou pevných vektorech báze už dostaneme celé příslušné zobrazení. Body v rovině jsou tedy obecně vzory hodnot lineárních zobrazení F roviny do roviny, přímky jsou obecně vzory hodnot lineárních zobrazení z roviny do reálné přímky R. S maticemi a vektory umíme rovnice pro přímky a body psát wT · v = ( a b ) · ( x y ) = c A · v = ( a b c d ) · ( x y ) = ( r s ) = u. Samozřejmě, ve zvláštních situacích tomu tak být nemusí. Tak třeba průnikem dvou stejných přímek je opět sama přímka (a vzorem vhodné hodnoty pro takové lineární zobrazení bude celá přímka), nulové zobrazení má za vzor nuly 33 Řešení. Směr paprsku svírá s přímkou p úhel 45◦ , odražený paprsek tedy bude kolmý na dopadající, jeho směrový vektor bude (1, −3) (Pozor na orientaci! Daný směrový vektor můžeme též získat například zrcadlením podle kolmého vektoru k přímce p.) Paprsek dopadne v bodě [6, 2], odražený paprsek tedy bude mít rovnici [6, 2] + t(1, −3), t ≥ 0. Průnik přímky dané odraženým paprskem s přímkou q je bod [4, 8], což je mimo polopřímku, která je daná odraženým paprskem (t = −2). Odražený paprsek tedy přímku q neprotne. 1.64. Z bodu [−2, 0] vyrazila v pravé poledne konstantní rychlostí 1 ms−1 ve směru (3, 2) úsečka délky 1. Rovněž v poledne vyrazila z bodu [5, −2] druhá úsečka délky 1 ve směru (−1, 1), ovšem dvojnásobnou rychlostí. Srazí se? Řešení. Přímky, po kterých se pohybují dané úsečky, můžeme popsat parametrickým vyjádřením: p : [−2, 0] + r(3, 2), q : [5, −2] + s(−1, 1). Obecná rovnice přímky p je 2x − 3y + 4 = 0. Dosazením parametrického vyjádření přímky q získáme průsečík P = [1, 2]. Nyní se snažme zvolit jediný parametr t pro obě úsečky tak, aby nám odpovídající bod na přímkách p, resp. q, popisoval polohu počátku první, resp. druhé, úsečky v čase t. V čase 0 je první úsečka v bodě [−2, 0], druhá v bodě [5, −2]. Za čas t sekund urazí první úsečka t jednotek délky ve směru (3, 2) druhá pak 2t jednotek délky ve směru (−1, 1). Odpovídající parametrizace jsou tedy p : [−2, 0] + t √ 13 (3, 2), q : [5, −2] + t √ 2(−1, 1), Počátek první úsečky dorazí do bodu [1, 2] v čase t1 = √ 13 s, počátek druhé úsečky v čase t = 2 √ 2 s, tedy více než o půl vteřiny dříve. Tedy v době, kdy dorazí do průsečíku P počátek první úsečky, bude již konec druhé úsečky pryč a úsečky se tak nesrazí. 1.65. Rovinný fotbalista vystřelí míč z bodu F = [1, 0] ve směru (3, 4) na bránu (úsečku) ohraničenou body A = [23, 36] a B = [26, 30]. Směřuje míč do brány? 5. GEOMETRIE V ROVINĚ celou rovinu. V prvém případě to poznáme tak, že jsou nalevo v rovnicích (1.15) stejné výrazy až na skalární násobek (nebo jinak řečeno, řádky matice A jsou stejné až na skalární násobek). V takovém případě buď nebude v průniku příslušných přímek žádný bod (rovnoběžné různé přímky) nebo tam budou všechny body přímky (stejné přímky). Tuto podmínku může vyjádřit tak, že poměry a/c a b/d musí být stejné, ne- boli (1.16) ad − bc = 0. Všimněme si, že toto vyjádření už zahrnuje i případy, kdy c nebo d je nulové. 1.27. Determinant matice. Výrazu nalevo v (1.16) říkáme determinant matice A a píšeme pro něj det A = a b c d = ad − bc. Naši diskusi teď můžeme vyjádřit takto: Tvrzení. Determinant je skalární funkce det A definovaná na všech maticích A a rovnice A·v = u je jednoznačně řešitelná, právě když je det A ̸= 0. Zkuste promyslet, že pro tuto úvahu bylo podstatné, že pracujeme s polem skalárů. Například nad celými čísly obecně neplatí. Když prostě spočteme řešení rovnic s celočíselnými koeficienty (tj. matice A má pouze celočíselné vstupy), tak toto řešení celočíselné být nemusí. 1.28. Afinní zobrazení. Podíváme se, jak maticová symbolika umožňuje pracovat s jednoduchými zobrazeními v afinní rovině. Viděli jsme, že násobením maticí je dáno linerání zobrazení. Posunutí v afinní rovině R2 o pevný vektor t = (r, s) ∈ R2 umíme v maticové formě také snadno zapsat: P = ( x y ) → P + t = ( x y ) + ( r s ) = ( x + r y + s ) . Jestliže k výsledku lineárního zobrazení ještě dovolíme přičíst pevný vektor t = (r, s), pak naše zobrazení bude mít tvar v = ( x y ) → A · v + t = ( ax + by + r cx + dy + s ) . Takto jsou popsána právě všechna tzv. afinní zobrazení roviny do sebe. Taková zobrazení nám umožní přepočítávání souřadnic vzniklých různými volbami počátků a bází směrů pro posunutí. Co se stane, když náš pozorovatel z odstavce 1.23 bude tutéž rovinu shlížet z jiného bodu nebo si aspoň vybere jiné body E1, E2? Zkuste si promyslet, že na úrovni souřadnic to skutečně bude právě změna realizovaná pomocí afinního zobrazení. Časem budeme vidět obecné důvody, proč tomu tak je ve všech dimenzích. 34 5. GEOMETRIE V ROVINĚ Řešení. Vzhledem k tomu, že se situace odehrává v prvním kvadrantu, stačí uvažovat směrnice vektorů ⃗FA, (3, 4), ⃗FB. Tvoří-li (v tomto pořadí) buď rostoucí nebo klesající posloupnost, míč směřuje na bránu. Tato posloupnost je 36/22, 4/3, 30/25, což je klesající posloupnost, míč tedy směřuje do brány. 1.66. Upravte (A − B)T · 2C · u, přičemž A = ( 0 5 −2 2 ) , B = ( 2 0 −1 1 ) , C = ( 2 −2 4 5 ) , u = ( 3 2 ) . Řešení. Dosazením A−B = ( −2 5 −1 1 ) , (A−B)T = ( −2 −1 5 1 ) , 2C = ( 4 −4 8 10 ) a násobením matic dostáváme (A − B)T · 2C · u = ( −2 −1 5 1 ) · ( 4 −4 8 10 ) · ( 3 2 ) = ( −52 64 ) . 1.67. Uveďte příklad matic A a B, pro něž (a) (A + B) · (A − B) ̸= A · A − B · B; (b) (A + B) · (A + B) ̸= A · A + 2A · B + B · B. Řešení. Připomeňme, že uvažujeme dvojrozměrné (čtvercové) matice A a B. Pro libovolné matice A a B ovšem platí (A + B) · (A − B) = A · A − A · B + B · A − B · B. Identitu (A + B) · (A − B) = A · A − B · B tak dostaneme, právě když je −A · B + B · A nulovou maticí, tj. právě když matice A a B komutují. Příkladem hledaných matic jsou tedy právě ty dvojice matic, které nekomutují (matice součinu se při záměně pořadí násobených matic změní). Můžeme např. zvolit A = ( 1 2 3 4 ) , B = ( 4 3 2 1 ) , neboť při této volbě je A · B = ( 8 5 20 13 ) , B · A = ( 13 20 5 8 ) . Analogicky pro každou dvojici matic A, B platí (A + B) · (A + B) = A · A + A · B + B · A + B · B. To znamená, že (A + B) · (A + B) = A · A + A · B + A · B + B · B je splněno tehdy a jenom tehdy, když A·B = B·A. Ve druhém případě jsou tak hledané dvojice matic A, B zcela totožné s případem prvním. CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM 1.29. Euklidovská rovina. Přidejme nyní schopnost našeho pozorovatele vidět vzdálenosti. Např. může věřit obvyklému vzorci pro velikost vektoru v = (a, b) ∥v∥ = √ a2 + b2 v jím zvolených afinních souřadnicích. Okamžitě pak můžeme definovat pojmy jako jsou úhel a otočení v rovině. Jednoduše si to můžeme představit takto: náš člověk se rozhodne o nějakých bodech E1 a E2, že jsou od něj ve vzdálenosti jedna, a zároveň si řekne, že jsou na sebe kolmé. Vzdálenosti ve směrech souřadných os pak jsou dány příslušným poměrem, obecně používá Euklidovu (nebo Pythagorovu) větu. Odtud vyjde právě výše uvedený vzorec. Náš pozorovatel roviny může samozřejmě postupovat i jinak. Může použít nějaký standard pro skutečné měření vzdálenosti bodů P a Q v rovině a říci, že to je právě velikost vektoru Q − P , který potřebujeme na posunutí z P do Q. Pak si vybere nějaký z vektorů, které skutečně mají velikost 1 a třeba pomocí trojúhelníku o stranách s velikostmi 3, 4 a 5 zkonstruuje kolmý vektor o velikosti jedna a dále pokračuje jako výše. 35 1.68. Rozhodněte, zda jsou zobrazení F, G : R2 → R2 zadaná přiřa- zeními F : ( x y ) → ( 7x − 3y −2x + 5y ) , x, y ∈ R, G : ( x y ) → ( 2x + 2y − 4 4x − 9y + 3 ) , x, y ∈ R lineární. Řešení. Pro libovolný vektor (x, y)T ∈ R2 můžeme vyjádřit F (( x y )) = ( 7 −3 −2 5 ) · ( x y ) , G (( x y )) = ( 2 2 4 −9 ) · ( x y ) + ( −4 3 ) . Odtud vyplývá, že obě zobrazení jsou afinní. Připomeňme, že afinní zobrazení je lineární, právě když se nulový vektor zobrazí sám na sebe. Neboť F (( 0 0 )) = ( 0 0 ) , G (( 0 0 )) = ( −4 3 ) , zobrazení F je lineární, zobrazení G nikoli. 1.69. Buď dán pravidelný šestiúhelník ABCDEF (vrcholy jsou označeny pořadě v kladném smyslu) se středem v bodě S = [1, 0] a vrcholem A = [0, 2] Určete souřadnice vrcholu C. Řešení. Souřadnice vrcholu C získáme otočením bodu A okolo středu S šestiúhelníka o 120◦ v kladném smyslu: C = ( cos(120◦ ) − sin(120◦ ) sin(120◦ ) cos(120◦ ) ) (C − S) + S = = ( −1 2 − √ 3 2√ 3 2 −1 2 ) ( −1 2 ) + [1, 0] = [ 3 2 − √ 3, −1 − √ 3 2 ]. 1.70. Buď dán rovnostranný trojúhelník s vrcholy [1, 0] a [0, 1] ležící celý v prvním kvadrantu. Určete souřadnice jeho třetího vrcholu. Řešení. Třetí souřadnice je [1 2 + √ 3 2 , 1 2 + √ 3 2 ] (otáčíme bod [1, 0] o 60◦ kolem bodu [0, 1] v kladném smyslu). 1.71. Určete souřadnice vrcholů trojúhelníka, který vznikne otočením rovnostranného trojúhelníka, jehož dva vrcholy jsou A = [1, 1] a B = [2, 3] (třetí pak v polorovině dané přímkou AB a bodem S = [0, 0]) o 60◦ v kladném smyslu kolem bodu S. Řešení. Třetí vrchol trojúhelníka dostaneme např. otočením o 60◦ jednoho z vrcholů kolem druhého (ve správném smyslu). Hledané body mají souřadnice [−3 2 √ 3, √ 3−1 2 ], [1 2 −1 2 √ 3, 1 2 √ 3+1 2 ], [1−3 2 √ 3, √ 3+ 3 2 ]. 5. GEOMETRIE V ROVINĚ Euklidovská rovina je afinní rovina s výše zavedeným pojmem vzdálenosti. 1.30. Úhel vektorů. Jak jsme již používali při diskusi komplexních čísel coby bodů v rovině, tzv. goniometrická funkce cos φ je dána hodnotou reálné první souřadnice jednotkového vektoru, jehož úhel s vektorem (1, 0) je φ. Zjevně je pak druhá souřadnice takového vektoru dána reálnou hodnotou 0 ≤ sin φ ≤ 1 splňující (cos φ)2 + (sin φ)2 = 1. Obecně pak pro dva vektory v a w můžeme jejich úhel popsat pomocí souřadnic v = (vx, vy), w = (wx, wy) takto: cos φ = vxwx + vywy ∥v∥ · ∥w∥ . Tento vztah si snadno ověříme, pokud věříme, že otočení roviny kolem počátku nemění úhly. Pak totiž můžeme napřed libovolně zvolené vektory vynásobit vhodnými skaláry tak, abychom dostali vektory velikosti jedna (náš vzorec totiž po násobení vektorů libovolnými skaláry dává pochopitleně neměnné výsledky). Poté můžeme vhodným otočením naší roviny dosáhnout toho, že první z vektorů bude právě prvním bázovým vektorem (1, 0). Potom dává náš vzorec cos φ = wx ∥w∥ , což je pouze opakováním definice funkce cos φ. 1.31. Rotace kolem bodu v rovině. Matici libovolného známého zobrazení F : R2 → R2 lze vcelku snadno uhádnout: Je-li totiž výsledkem matice se sloupci (a, c) a (b, d), pak první sloupec dostaneme nasobením této matice s prvním vektorem báze (1, 0) a druhý je vyčíslením na druhém vektoru báze (0, 1). 36 5. GEOMETRIE V ROVINĚ 1.72. Určete úhel, který svírají vektory (a) u = (−3, −2), v = (−2, 3); (b) u = (2, 6), v = (−3, −9). Řešení. Hledaný úhel φ lze vypočítat ze vzorce cos φ = uxvx+uyvy ||u||·||v|| , kde u = (ux, uy), v = (vx, vy). Všimněme si, že vektor (−3, −2) můžeme získat tak, že zaměníme pořadí souřadnic ve vektoru (−2, 3) a jednu z nich vynásobíme číslem −1. To je ovšem úprava, která se provádí, když chceme ze směrového vektoru přímky získat normálový (nebo naopak). Vektory ve variantě (a) jsou tedy kolmé, tj. φ = π/2. Neboť −3 · (2, 6) = 2 · (−3, −9), je ve variantě (b) vektor u násobkem vektoru v. Pokud jeden vektor přejde na druhý tak, že ho vynásobíme kladným číslem, svírají tyto vektory evidentně nulový úhel. V našem příkladu je třeba násobit záporným číslem, což bezprostředně dává φ = π. 1.73. Určete úhel, který svírají φ úhlopříčky A3A7 a A5A10 pravidelného dvanáctiúhelníka A0A1A2 . . . A11. Řešení. Odchylka nezávisí na velikosti daného dvanáctiúhelníka. Volme dvanáctiúhelník vepsaný do kružnice o poloměru 1. Jako v předchozím příkladě určíme souřadnice jeho vrcholů a podle vzorce snadno dopočítáme, že cos(φ) = 1 2 √ 2+ √ 3 , tedy φ = 75◦ . Jiné řešení. Úlohu lze řešit čistě metodami syntetické geometrie: označíme S střed dvanáctiúhelníka a T průsečík úhlopříček A3A7 a A5A10. Nyní |̸ A7A5A10| = 45◦ (obvodový úhel příslušný středovému úhlu A7SA10, který je pravý), dále |̸ A5A7A3| = 30◦ (obvodový úhel příslušný středovému úhlu A5SA3, jehož velikost je 60◦ ). Velikost úhlu A5T A7 je pak dopňkem výše zmíněných úhlů do 180◦ , tedy je rovna 105◦ . Hledaná odchylka je pak 180◦ − 105◦ = 75◦ . 1.74. Najděte matice A takové, že A2 = ( 1 2 − √ 3 2√ 3 2 1 2 ) . Nápověda: jaké geometrické zobrazení v rovině zadává matice A2 ? Řešení. A2 je matice rotace o 60◦ v kladném smyslu, takže hledané matice jsou A = ± (√ 3 2 −1 2 1 2 √ 3 2 ) , tj. jsou to matice rotace o 30◦ , resp. o 210◦ . CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM Z obrázku je proto vidět, že pro rotaci o úhel ψ proti směru hodinových ruček jsou v matici sloupce ( a b c d ) ( 1 0 ) = ( cos ψ sin ψ ) ( a b c d ) ( 0 1 ) = ( − sin ψ cos ψ ) Směr proti směru hodinových ruček označujeme jako kladný směr rotace, opačný je pak záporný. Proto dostáváme tvr- zení: Matice rotace Rotace o předem daný úhel ψ v kladném směru kolem počátku souřadnic je dána maticí Rψ : v = ( x y ) → Rψ · v = ( cos ψ − sin ψ sin ψ cos ψ ) · ( x y ) . Nyní, když už víme, jak vypadá matice otočení v rovině, můžeme ověřit, že otočení zachovává vzdálenosti a úhly (definované předešlým vzorcem). Označíme-li obraz vektoru v jako v′ = ( v′ x v′ y ) = Rψ · v = ( vx cos ψ − vy sin ψ vx sin ψ + vy cos ψ ) , a podobně w′ = Rψ · w, pak lze snadno přepočítat, že opravdu platí ∥v′ ∥ = ∥v∥ v′ xw′ x + v′ yw′ y = vxwx + vywy. Předchozí výraz lze pomocí vektorů a matic napsat ná- sledovně (Rψ · w)T (Rψ · v) = wT v. Transponovaný vektor (Rψ · w)T je roven wT · RT ψ , kde RT ψ je tzv. transponovaná matice k matici Rψ . To je matice, jejíž řádky tvoří sloupce původní matice a sloupce naopak tvoří 37 1.75. Stanovte A · A pro A = ( cos φ − sin φ sin φ cos φ ) , kde φ ∈ R. Řešení. Víme, že zobrazení( x y ) → ( cos φ − sin φ sin φ cos φ ) · ( x y ) , x, y ∈ R je rotací roviny R2 kolem počátku soustavy souřadnic o úhel φ v kladném smyslu. Vzhledem k asociativitě násobení matic dostáváme, že zobrazení( x y ) → ( cos φ − sin φ sin φ cos φ ) · ( cos φ − sin φ sin φ cos φ ) · ( x y ) , x, y ∈ R je rotací o úhel 2φ. To znamená, že platí A · A = ( cos 2φ − sin 2φ sin 2φ cos 2φ ) . Poznamenejme, že jsme samozřejmě mohli přímo vynásobit A · A (a aplikovat vzorce pro sinus a kosinus dvojnásobného úhlu). Opakováním výše uvedeného (příp. použitím matematické indukce) lze ovšem snadněji obdržet An = ( cos nφ − sin nφ sin nφ cos nφ ) , n = 2, 3, . . . , jestliže klademe A2 = A · A, A3 = A · A · A atd. 1.76. Zjistěte, jaká lineární zobrazení R2 do R2 jsou zadána maticemi (tj. popište jejich geometrický význam) A1 = ( 1 0 0 0 ) , A2 = ( −1 0 0 1 ) , A3 = (√ 2 2 − √ 2 2√ 2 2 √ 2 2 ) , A4 = ( 0 1 1 0 ) . Řešení. Nechť (x, y)T je nadále libovolný reálný vektor. Pro matici A1 dostáváme ( x y ) → ( 1 0 0 0 ) · ( x y ) = ( x 0 ) , což znamená, že lineární zobrazení, které tato matice zadává, je projekce na osu x. Podobně vidíme, že matice A2 určuje zrcadlení vzhledem k ose y, protože ( x y ) → ( −1 0 0 1 ) · ( x y ) = ( −x y ) . Matici A3 lze vyjádřit ve tvaru ( cos φ − sin φ sin φ cos φ ) pro φ = π/4, a tudíž zadává otočení roviny kolem počátku o úhel π/4 (v kladném smyslu, tj. proti pohybu hodinových ručiček). Pro matici A4 pak získáváme ( x y ) → ( 0 1 1 0 ) · ( x y ) = ( y x ) . Matice A4 tedy určuje záměnu os – zrcadlení vzhledem k přímce y = x. 5. GEOMETRIE V ROVINĚ řádky původní matice. Vidíme tedy, že matice otočení splňují vztah RT ψ ·Rψ = I, matice I (někdy píšeme prostě 1 a máme tím na mysli jednotku v okruhu matic), je tzv. jednotková ma- tice I = ( 1 0 0 1 ) . Tím jsme odvodili pozoruhodné tvrzení — matice F s vlastností, že F · Rψ = I (budeme takové říkat inverzní matice k matici rotace Rψ ) je maticí transponovanou k původní. To je logické, neboť inverzní zobrazení k rotaci o úhel ψ je opět rotace, ale o úhel −ψ, tj. inverzní matice RT ψ je rovna matici R−ψ = ( cos(−ψ) − sin(−ψ) sin(−ψ) cos(−ψ) ) = ( cos ψ sin ψ − sin ψ cos ψ ) . Pokud bychom chtěli zapsat rotaci kolem jiného bodu P = O + w, P = [wx, wy], opět pomocí matice, snadno napíšeme potřebný vzorec pomocí posunutí: Stačí si k tomu uvědomit, že můžeme místo rotace kolem daného bodu P napřed posunout P do našeho počátku, pak provést rotaci a pak udělat opačné posunutí, kterým celou rovinu vrátíme tam, kde měla celou dobu být, viz obrázek. Počítejme tedy v = ( x y ) → v − w → Rψ · (v − w) → Rψ · (v − w) + w = ( cos ψ(x − wx) − sin ψ(y − wy) + wx sin ψ(x − wx) + cos ψ(y − wy)) + wy ) . 1.32. Zrcadlení. Dalším dobře známým příkladem zobrazení, která zachovávají velikosti, je tzv. zrcadlení vzhledem k přímce. Opět nám bude stačit popsat zrcadlení vzhledem k přímkám procházejícím počátkem O a ostatní se z nich odvodí pomocí posunutí, resp. rotací. Hledejme tedy matici Zψ zrcadlení vzhledem k přímce s jednotkovým směrovým vektorem v svírajícím úhel ψ s vektorem (1, 0). Nejprve si uvědomme, že Z0 = ( 1 0 0 −1 ) . 38 5. GEOMETRIE V ROVINĚ 1.77. Rovnoběžníková rovnost. Dokažme jako ilustraci našich nástrojů tzv. „rovnoběžníkovou rovnost“: Jsou–li u, v ∈ R2 , pak: 2(∥u∥2 + ∥v∥2 ) = ∥u + v∥2 + ∥u − v∥2 . Neboli součet druhých mocnin délek úhlopříček rovnoběžníka je roven dvojnásobku součtu druhých mocnin délek jeho stran. Řešení. Rozepsáním obou stran do souřadnic u = (u1, u2), v = (v1, v2) obdržíme: 2(∥u∥2 + ∥v∥2 ) = = 2(u2 1 + u2 2 + v2 1 + v2 2) = u2 1 + 2u1v1 + v2 1 + u2 2 + 2u2v2 + v2 2 + u2 1 − 2u1v1+ + v2 1 + u2 2 − 2u2v2 + v2 2 = (u1 + v1)2 + (u2 + v2)2 + (u1 − v1)2 + (u2 − v2)2 = ∥u + v∥2 + ∥u − v∥2 . 1.78. Ukažte, že složením lichého počtu středových souměrností v rovině dostaneme opět středovou symetrii. Řešení. Středovou souměrnost v rovině se středem S reprezentujme předpisem X → S −(X−S), neboli X → 2S −X. (Obraz bodu X ve středové symetrii podle středu S dostaneme tak, že k souřadnicím bodu S přičteme souřadnice vektoru opačného k vektoru X−S.) Postupnou aplikací tří středových souměrností se středy S, T a U tak dostáváme X → 2S − X → 2T − (2S − X) → 2U − (2T − (2S − X)) = 2(U − T + S) − X, celkem X → 2(U − T + S) − X, což je středová souměrnost se středem S − T + U. Složení libovolného lichého počtu středových souměrností tak postupně redukujeme až na složení tří středových souměrností, jde tedy o středovou symetrii (v principu se jedná o důkaz matematickou indukcí, zkuste si jej sami zformulovat). 1.79. Sestrojte (2n + 1)-úhelník, jsou-li dány všechny středy jeho stran. Řešení. K řešení využijeme toho, že složením lichého počtu středových souměrností je opět středová souměrnost (viz předchozí příklad). Označme vrcholy hledaného (2n + 1)-úhelníka po řadě A1, A2, . . . , A2n+1 a středy stran (počínaje středem strany A1A2) postupně S1, S2, . . . S2n+1. Provedeme-li středové souměrnosti po řadě podle těchto středů, tak bod A1 je zjevně pevným bodem výsledné středové souměrnost, tedy jejím středem. K jeho nalezení tedy stačí provést uvedenou středovou souměrnost s libovolným bodem X roviny. Bod A1 leží pak ve středu úsečky XX′ , kde X′ je obrazem bodu X ve zmíněné CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM Obecně můžeme každou přímku otočit do směru vektoru (1, 0) a tedy zapsat obecnou matici zrcadlení jako Zψ = Rψ · Z0 · R−ψ , kdy nejprve otočíme maticí R−ψ přímku do „nulové“ polohy, odzrcadlíme maticí Z0 a vrátíme zpět otočením Rψ . Můžeme proto (díky asociativitě násobení matic) spočíst: Zψ = ( cos ψ − sin ψ sin ψ cos ψ ) · ( 1 0 0 −1 ) · ( cos ψ sin ψ − sin ψ cos ψ ) = ( cos ψ sin ψ sin ψ − cos ψ ) · ( cos ψ sin ψ − sin ψ cos ψ ) = ( cos2 ψ − sin2 ψ 2 sin ψ cos ψ 2 sin ψ cos ψ −(cos2 ψ − sin2 ψ) ) = ( cos 2ψ sin 2ψ sin 2ψ − cos 2ψ ) . Použili jsme přitom obvyklé součtové vzorce pro goniometrické funkce. Povšimněme si také, že Zψ · Z0 je dáno: ( cos 2ψ sin 2ψ sin 2ψ − cos 2ψ ) · ( 1 0 0 −1 ) = ( cos 2ψ − sin 2ψ sin 2ψ cos 2ψ ) . Toto pozorování lze zakreslit a zformulovat následovně 39 středové symetrii. Další vrcholy A2, . . . , A2n+1 získáme zobrazováním bodu A1 ve středových souměrnostech podle S1, . . . , S2n+1. 1.80. Spočtěte délky stran trojúhelníku s vrcholy A = [2, 2], B = [3, 0], C = [4, 3]. Řešení. Užitím známého vzorce pro velikost vektoru ||u|| = √ u2 1 + u2 2, u = (u1, u2) ∈ R2 obdržíme výsledky |AB| = ||A − B|| = √ (2 − 3)2 + (2 − 0)2 = √ 5, |BC| = ||B − C|| = √ (3 − 4)2 + (0 − 3)2 = √ 10, |AC| = ||A − C|| = √ (2 − 4)2 + (2 − 3)2 = √ 5. 1.81. Určete obsah trojúhelníku ABC, je-li A = [−8, 1], B = [−2, 0], C = [5, 9]. Řešení. Víme, že obsah je roven polovině determinantu matice, jejíž první sloupec je dán vektorem B −A a druhý sloupec vektorem C −A, tj. determinantu matice ( −2 − (−8) 5 − (−8) 0 − 1 9 − 1 ) . Jednoduchý výpočet tak dává výsledek 1 2 ((−2 − (−8)) · (9 − 1) − (5 − (−8)) · (0 − 1)) = 61 2 . Dodejme, že při záměně pořadí vektorů by hodnota determinantu měla opačné znaménko (její absolutní hodnota by tedy zůstala stejná) a že by se vůbec nezměnila, kdybychom vektory (při zachování pořadí) napsali do řádků. 1.82. Pomocí určení determinantů dvojrozměrných matic spočtěte obsah S čtyřúhelníku vymezeného jeho vrcholy [1, 1], [6, 1], [11, 4], [2, 4]. Řešení. Nejprve si označme vrcholy (proti směru pohybu hodinových ručiček) A = [1, 1], B = [6, 1], C = [11, 4], D = [2, 4]. Pokud rozdělíme čtyřúhelník ABCD na trojúhelníky ABC a ACD, můžeme získat jeho obsah jako součet obsahů těchto trojúhelníků, a to vyčíslením determinantů d1 = 6 − 1 11 − 1 1 − 1 4 − 1 = 5 10 0 3 , d2 = 11 − 1 2 − 1 4 − 1 4 − 1 = 10 1 3 3 , kde ve sloupcích jsou postupně vektory B −A, C−A (pro d1) a C−A, D − A (pro d2). Platí S = d1 2 + d2 2 = 5·3−10·0 2 + 10·3−1·3 2 = 15+27 2 = 21. 5. GEOMETRIE V ROVINĚ Tvrzení. Otočení o úhel ψ obdržíme následným provedením dvou zrcadlení vzhledem ke směrům, které spolu svírají úhel 1 2 ψ. Pokud umíme odůvodnit předchozí tvrzení ryze geometrickou úvahou (zkuste si zahrát na „syntetického geometra“), dokázali jsme právě standardní vzorce pro goniometrické funkce dvojnásobného úhlu. Hlubší je následující rekapitulace předchozích úvah (skoro si můžeme říci, že už umíme dokázat skutečně zajímavý matematický výsledek): Zobrazení zachovávající velikosti 1.33. Věta. Lineární zobrazení euklidovské roviny je složeno z jednoho nebo více zrcadlení, právě když je dáno maticí R splňující R = ( a b c d ) , ab + cd = 0, a2 + c2 = b2 + d2 = 1. To nastane, právě když toto zobrazení zachovává velikosti. Otočením je takové zobrazení přitom právě tehdy, když je determinant matice R roven jedné, což odpovídá sudému počtu zrcadlení. Při lichém počtu zrcadlení je determinant roven −1. Důkaz. Zkusme napřed spočíst, jak může vypadat obecně matice A, když příslušné zobrazení zachovává velikosti. Tj. máme zobrazení ( x y ) → ( a b c d ) · ( x y ) = ( ax + by cx + dy ) . Zachování velikosti tedy znamená, že pro všechna x a y je x2 + y2 = (ax + by)2 + (cx + dy)2 = = (a2 + c2 )x2 + (b2 + d2 )y2 + 2(ab + cd)xy. Protože má tato rovnost platit pro všechna x a y, musí si být rovny koeficienty u jednotlivých mocnin x2 , y2 a xy na pravé i levé straně. Tím jsme spočetli, že rovnosti kladené na matici R v prvním tvrzení dokazované věty jsou ekvivalentní vlastnosti, že příslušné zobrazení zachovává velikosti. Díky vztahu a2 + c2 = 1 můžeme předpokládat, že a = cos φ a c = sin φ pro vhodný úhel φ. Jakmile takto zvolíme první sloupec matice R, až na násobek nám vztah ab + cd = 0 určuje i druhý sloupec. Zároveň ale víme, že i velikost vektoru ve druhém sloupci je jedna a dostáváme tedy právě dvě možnosti pro matici R: ( cos φ − sin φ sin φ cos φ ) , ( cos φ sin φ sin φ − cos φ ) . V prvém případě jde o rotaci o úhel φ, ve druhém pak o rotaci složenou se zrcadlením podle první souřadné osy. Jak 40 5. GEOMETRIE V ROVINĚ Správnost výsledku můžeme snadno potvrdit, neboť čtyřúhelník ABCD je očividně lichoběžníkem s rovnoběžnými stranami délek 5, 9 a jejich vzdáleností v = 3. 1.83. Vypočítejte obsah S čtyřúhelníku zadaného vrcholy [0, −2], [−1, 1], [1, 5], [1, −1]. Řešení. Při obvyklém označení vrcholů A = [0, −2], B = [1, −1], C = [1, 5], D = [−1, 1] a neméně obvyklém rozdělení čtyřúhelníku na trojúhelníky ABC a ACD s obsahy S1 a S2, dostáváme S = S1 + S2 = 1 2 1 − 0 1 − 0 −1 + 2 5 + 2 + 1 2 1 − 0 −1 − 0 5 + 2 1 + 2 = 1 2 (7 − 1) + 1 2 (3 + 7) = 8. 1.84. Určete obsah čtyřúhelníka ABCD s vrcholy A = [1, 0], B = [11, 13], C = [2, 5] a D = [−2, −5]. Řešení. Čtyřúhelník rozdělíme na dva trojúhelníky ABC a ACD. Jejich obsahy pak spočítáme pomocí patřičných determinantů, viz 1.34 S = 1 2 1 5 10 13 + 1 2 1 5 −3 −5 = 47 2 . 1.85. Stanovte rozlohu louky, která je na pozemkové mapě ohraničena body o kótách [−7, 1], [−1, 0], [29, 0], [25, 1], [24, 2] a [17, 5]. (Jednotky neuvažujte. Jsou určeny poměrem pozemkové mapy vůči skutečnosti.) Řešení. Uvažovaný šestiúhelník můžeme rozdělit např. na čtyři trojúhelníky s vrcholy [−7, 1], [−1, 0], [17, 5]; [−1, 0], [24, 2], [17, 5]; [−1, 0], [25, 1], [24, 2]; [−1, 0], [29, 0], [25, 1]. Jejich obsahy jsou po řadě 24, 89/2, 27/2 a 15, což dává výsledek 24 + 44 1 2 + 13 1 2 + 15 = 97. 1.86. Určete obsah trojúhelníka A2A3A11, kde A0A1 . . . A11 jsou vrcholy pravidelného dvanáctiúhelníka vepsaného do kružnice o poloměru 1. Řešení. Vrcholy dvanáctiúhelníka můžeme ztotožnit s dvanáctými odmocninami z čísla 1 v komplexní rovině. Zvolíme-li navíc A0 = 1, pak můžeme psát Ak = cos(2kπ/12) + i sin(2kπ/12). Pro vrcholy zkoumaného trojúhelníka máme: A2 = cos(π/3) + i sin(π/3) = CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM jsme viděli v předchozím tvrzení 1.31, každá rotace odpovídá dvěma zrcadlením a determinant matice R je v těchto dvou případěch skutečně jedna nebo mínus jedna a rozlišuje je. 1.34. Obsah trojúhelníka. Závěrem našeho malého výletu do geometrie se zaměřme na obsah rovinných objektů. Budou nám stačit trojúhelníky. Každý trojúhelník je vymezen dvojicí vektorů v a w, které, přiloženy do jednoho z vrcholů P , zadají zbylé dva vrcholy. Chtěli bychom tedy najít vzorec (skalární funkci vol), která dvěma vektorům přiřadí číslo rovné obsahu vol (v, w) takto definovaného trojúhelníku (v, w), kde si pro určitost za P volíme počátek a posunutím se obsah stejně nemění. Ze zadání je vidět, že hledaná hodnota je polovinou plochy rovnoběžníku nataženého na vektory v a w a snadno se spočte (pomocí známého vzorečku: základna krát příslušná výška) nebo prostě vidí z obrázku, že nutně platí vol (v + v′ , w) = vol (v, w) + vol (v′ , w) vol (av, w) = a vol (v, w). Nakonec ještě přidáme k našemu zadání požadavek vol (v, w) = − vol (w, v), který odpovídá představě, že opatříme plochu znaménkem podle toho, v jakém pořadí bereme vektory (tj. jestli se na ni díváme shora nebo zespodu). Pokud vektory v a w napíšeme do sloupců matice A, pak A = (v, w) → det A splňuje všechny tři naše požadavky. Kolik takových zobrazení ale může být? Každý vektor umíme vyjádřit pomocí dvou bázových vektorů e1 = (1, 0) a e2 = (0, 1) a díky linearitě je tedy každá možnost pro vol jednoznačně určena už vyčíslením na těchto vektorech. Protože ale pro obsah, stejně jako pro determinant, je zjevně vol (e1, e1) = vol (e2, e2) = 0 (kvůli požadované antisymetrii), je nutně každá taková skalární funkce jednoznačně zadána hodnotou na jediné dvojici argumentů (e1, e2). Jsou si tedy všechny možnosti rovny až na skalární násobek. Ten umíme určit požadavkem vol (e1, e2) = 1 2 , 41 1/2 + i √ 3/2, A3 = cos(π/2) + i sin(π/2) = i, A11 = cos(−π/6) + i sin(−π/6) = √ 3/2 − i/2, neboli souřadnice těchto bodů v komplexní rovnině jsou A2 = [1/2, √ 3/2], A3 = [0, 1], A11 = [ √ 3/2, −1 2 ]. Podle vzorce pro obsah trojúhelníka je potom hledaný obsah S roven S = 1 2 A2 − A11 A3 − A11 = 1 2 1 2 − √ 3 2 1 2 + √ 3 2 − √ 3 2 3 2 = 3 − √ 3 4 . 1.87. Které strany čtyřúhelníku zadaného vrcholy [−2, −2], [1, 4], [3, 3] a [2, 1] jsou viditelné z pozice bodu [3, π − 2]? Řešení. Jedná se o modelovou úlohu na viditelnost stran konvexního mnohoúhelníku v rovině. V prvním kroku uspořádáme vrcholy tak, aby jejich pořadí odpovídalo směru proti pohybu hodinových ručiček. Když jako první vrchol zvolíme např. A = [−2, −2], je další pořadí B = [2, 1], C = [3, 3], D = [1, 4]. Uvažujme nejprve stranu AB. Ta společně s bodem X = [3, π − 2] zadává matici ( −2 − 3 2 − 3 −2 − (π − 2) 1 − (π − 2) ) tak, že její první sloupec je rozdílem A − X a druhý sloupec je B − X. To, zda je vidět z bodu [3, π − 2], pak určuje znaménko determinantu −2 − 3 2 − 3 −2 − (π − 2) 1 − (π − 2) = −5 −1 −π 3 − π = −5 · (3 − π) − (−1)(−π) < 0. Záporná hodnota znamená, že strana je vidět. Doplňme, že nezáleží na tom, zda uvažujeme rozdíly A − X a B − X, nebo X − A a X − B. Kdybychom však zaměnili pořadí sloupců, příslušná strana by byla vidět právě tehdy, když by byl determinant kladný. Pro stranu BC analogicky obdržíme 2 − 3 3 − 3 1 − (π − 2) 3 − (π − 2) = −1 0 3 − π 5 − π = −1 · (5 − π) − 0 < 0. Tato strana je tudíž vidět. Zbývají strany CD a DA. Pro ně dostáváme po řadě 3 − 3 1 − 3 3 − (π − 2) 4 − (π − 2) = 0 −2 5 − π 6 − π = 0 − (−2) · (5 − π) > 0, 1 − 3 −2 − 3 4 − (π − 2) −2 − (π − 2) = −2 −5 6 − π −π = −2 · (−π) − (−5) · (6 − π) > 0. Z bodu X jsou tedy vidět právě strany určené dvojicemi vrcholů [−2, −2], [2, 1] a [2, 1], [3, 3]. 6. RELACE A ZOBRAZENÍ tj. volíme orientaci a měřítko pomocí volby bázových vektorů a chceme aby jednotkový čvtverec měl plochu jedna. Vidíme tedy, že determinant zadává plochu rovnoběžníku určeného sloupci matice A a plocha trojúhelníku je tedy poloviční. 1.35. Viditelnost v rovině. Předchozí popis hodnot pro orientovaný obsah nám dává do rukou elegantní nástroj pro určování pozice bodu vůči orientovaným úsečkám. Orientovanou úsečkou rozumíme dva body v rovině R2 s určeným pořadím. Můžeme si ji představit jako šipku od prvého k druhému bodu. Taková orientovaná úsečka nám rozděluje rovinu na dvě poloroviny, říkejme jim „levou“ a „pravou“. Pro daný bod chceme poznat, jestli je v té levé nebo pravé. Takové úlohy často potkáváme v počítačové grafice při řešení viditelnosti objektů. Pro zjednodušení si zde jen představme, že úsečku „je vidět“ z bodů nalevo a není vidět z těch napravo. Máme-li dán nějaký bod C, spočtěme orientovanou plochu příslušného trojúhelníku zadaného vektory A − C a B − C. Pokud jsme s bodem C nalevo od úsečky, pak při obvyklé kladné orientaci proti směru hodinových ruček bude vektor A−C dříve než ten druhý a proto výsledná plocha (tj. hodnota determinantu matice jejímiž sloupci jsou tyto dva vektory) bude kladná. Naopak, při opačné poloze bude výsledkem záporná hodnota determinantu a podle záporné hodnoty determinantu zjistíme, že je náš bod od úsečky napravo. Uvedený jednoduchý postup je skutečně často využíván pro testování polohy při standardních úlohách v 2D grafice. 6. Relace a zobrazení V této závěrečné části úvodní motivační kapitoly se vrátíme k formálnímu popisu matematických struktur, budeme se je ale průběžně snažit ilustrovat na již známých příkladech. Zároveň můžeme tuto část brát jako cvičení ve formálním přístupu k objektům a konceptům matematiky. 1.36. Relace mezi množinami. Nejprve potřebujeme definovat kartézský součin A × B dvou množin A a B. Je to množina všech uspořádaných dvojic (a, b) takových, že a ∈ A a b ∈ B. Binární relací mezi množinami A a B pak rozumíme libovolnou podmnožinu R kartézského součinu A×B. 42 6. ZOBRAZENÍ A RELACE 1.88. Uveďte strany pětiúhelníku s vrcholy v bodech [−2, −2], [−2, 2], [1, 4], [3, 1] a [2, −11/6], které je možné vidět z bodu [300, 1]. Řešení. Pro zjednodušení zápisů „tradičně“ položme A = [−2, −2], B = [2, −11/6], C = [3, 1], D = [1, 4], E = [−2, 2]. Strany BC a CD jsou zjevně z pozice bodu [300, 1] viditelné; naopak strany DE a EA být vidět nemohou. Pro stranu AB raději určeme −2 − 300 2 − 300 −2 − 1 −11 6 − 1 = −302 · ( −17 6 ) − (−298) · (−3) < 0. Odsud plyne, že tato strana je z bodu [300, 1] vidět. 1.89. Viditelnost stran trojúhelníka. Je dán trojúhelník s vrcholy A = [5, 6], B = [7, 8], C = [5, 8]. Určete, které jeho strany je vidět z bodu [0, 1]. Řešení. Uspořádáme vrcholy v kladném smyslu, tedy proti směru hodinových ručiček: [5, 6], [7, 8], [5, 8]. Pomocí příslušných determinantů určíme, je-li bod [0, 1] „nalevo“ či „napravo“ od jednotlivých stran trojúhelníka uvažovaných jako orientované úsečky, B − P C − P = 7 5 7 7 > 0, C − P A − P = 5 5 7 5 < 0 A − P B − P = 5 7 5 7 = 0. Z nulovosti posledního determinantu vidíme, že body [0, 1], [5, 6] a [7, 8] leží na přímce, stranu AB tedy nevidíme. Stranu BC rovněž tak nevidíme, narozdíl od strany AC. 1.90. Určete, které strany čtyřúhelníka s vrcholy A = [95, 99], B = [130, 106], C = [40, 60], D = [130, 120]. jsou viditelné z bodu [2, 0]. Řešení. Nejprve je třeba určit strany čtyřúhelníka („správné“ pořadí vrcholů): ACBD. Po spočítání příslušných determinantů (viz přednáška) zjistíme, že jsou vidět pouze strana CB. 6. Zobrazení a relace 1.91. Rozhodněte, zda následující relace na množině M jsou relace ekvivalence: i) M = {f : R → R}, kde (f ∼ g) pokud f (0) = g(0). ii) M = {f : R → R}, kde (f ∼ g) pokud f (0) = g(1). iii) M je množina přímek v rovině, přičemž dvě přímky jsou v relaci, jestliže se neprotínají. iv) M je množina přímek v rovině, přičemž dvě přímky jsou v relaci, jestliže jsou rovnoběžné. CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM Často píšeme a ≃R b pro vyjádření skutečnosti, že (a, b) ∈ R, tj. že body a ∈ A a b ∈ B jsou v relaci R. Definičním oborem relace je podmnožina D ⊆ A, D = {a ∈ A; ∃b ∈ B, (a, b) ∈ R}. Slovy vyjádřené, je to množina prvků a z množiny A takových, že existuje prvek b z množiny B tak, že (a, b) patří do relace R. Stručněji, jsou to takové prvky z A, které mají obraz v B. Podobně oborem hodnot relace je podmnožina I ⊆ B, I = {b ∈ B; ∃a ∈ A, (a, b) ∈ R}, to znamená takové prvky v B, které mají vzor v A. Speciálním případem relace mezi množinami je zobrazení z množiny A do množiny B. Je to případ, kdy pro každý prvek definičního oboru relace existuje právě jeden prvek z oboru hodnot, který je s ním v relaci. Nám známým případem zobrazení jsou všechny skalární funkce, kde oborem hodnot zobrazení je množina skalárů, třeba celých nebo reálných čísel. Pro zobrazení zpravidla používáme značení, které jsme také u skalárních funcí zavedli. Píšeme f : D ⊆ A → I ⊆ B, f (a) = b pro vyjádření skutečnosti, že (a, b) patří do relace, a říkáme, že b je hodnotou zobrazení f v bodě a. Dále říkáme, že f je • zobrazení množiny A do množiny B, jestliže je D = A, • zobrazení množiny A na množinu B, jestliže je D = A a I = B, často také surjektivní zobrazení • prosté (často také injektivní zobrazení), jestliže je D = A a pro každé b ∈ I existuje právě jeden vzor a ∈ A, f (a) = b. Vyjádření zobrazení f : A → B jakožto relace f ⊆ A × B, f = {(a, f (a)); a ∈ A} známe také pod názvem graf zobrazení f . 43 v) M = N, kde (m ∼ n) pokud S(m) + S(n) = 20, přičemž S(n) značí ciferný součet čísla n. vi) M = N, kde (m ∼ n) pokud C(m) = C(n), kde C(n) = S(n), pokud je ciferný součet S(n) menší než 10, jinak definujeme C(n) = C(S(n)) (je tedy C(n) < 10). Řešení. i) Ano. Ověříme tři vlastnosti ekvivalence: i) Reflexivita: pro libovolnou reálnou funkci f je f (0) = f (0). ii) Symetrie: jestliže platí f (0) = g(0), pak i g(0) = f (0). iii) Tranzitivita: jestliže platí f (0) = g(0) a g(0) = h(0), pak platí i f (0) = h(0). ii) Ne. Definovaná relace není reflexivní, např pro funkci sin máme sin 0 ̸= sin 1 a není ani tranzitivní. iii) Ne. Relace opět není reflexivní (každá přímka protíná sama sebe) ani tranzitivní. iv) Ano. Třídy ekvivalence pak tvoří množinu neorientovaných směrů v rovině. v) Ne. Relace není reflexivní. S(1) + S(1) = 2. vi) Ano. 1.92. Máme množinu {3, 4, 5, 6, 7}. Napište explicitně relaci i) a dělí b ii) a dělí b nebo b dělí a iii) a a b jsou soudělná 1.93. Nechť je na R2 definována relace R tak, že ((a, b), (c, d)) ∈ R pro libovolná a, b, c, d ∈ R, právě když b = d. Zjistěte, zda se jedná o relaci ekvivalence. Pokud jde o relaci ekvivalence, popište geometricky rozklad, který určuje. Řešení. Z ((a, b), (a, b)) ∈ R pro všechna a, b ∈ R plyne, že relace je reflexivní. Stejně snadno vidíme, že relace je symetrická, neboť v rovnosti (druhých složek) můžeme zaměnit levou a pravou stranu. Je-li ((a, b), (c, d)) ∈ R a ((c, d), (e, f )) ∈ R, tj. platí-li b = d a d = f , lehce dostáváme splnění tranzitivní podmínky ((a, b), (e, f )) ∈ R, tj. b = f . Relace R je relací ekvivalence, kdy body roviny jsou spolu v relaci, právě když mají stejnou druhou souřadnici (přímka jimi zadaná je kolmá na osu y). Příslušný rozklad proto rozdělí rovinu na přímky rovnoběžné s osou x. 6. RELACE A ZOBRAZENÍ 1.37. Skládání relací a funkcí. U zobrazení je jasná koncepce, jak se skládají. Máme-li dvě zobrazení f : A → B a g : B → C, pak jejich složení g ◦ f : A → C je definováno (g ◦ f )(a) = g(f (a)). Ve značení používaném pro relace totéž můžeme zapsat jako f ⊆ A × B, f = {(a, f (a)); a ∈ A} g ⊆ B × C, g = {(b, g(b)); b ∈ B} g ◦ f ⊆ A × C, g ◦ f = {(a, g(f (a))); a ∈ A}. Zcela obdobně definujeme skládání relací, v předchozích vztazích jen doplníme existenční kvantifikátory, tj. musíme uvažovat všechny „vzory“ a všechny „obrazy“. Uvažme relace R ⊆ A × B, S ⊆ B × C. Potom S ◦ R ⊆ A × C, S ◦ R = {(a, c); ∃b ∈ B, (a, b) ∈ R, (b, c) ∈ S}. Zvláštním případem relace je identické zobrazení idA = {(a, a) ∈ A × A; a ∈ A} na množině A. Je neutrální vzhledem ke skládání s každou relací s definičním oborem nebo oborem hodnot A. Pro každou relaci R ⊆ A×B definujeme inverzní relaci R−1 = {(b, a); (a, b) ∈ R} ⊂ B × A. Pozor, u zobrazení, je stejný pojem užíván ve specifičtější situaci. Samozřejmě, že existuje pro každé zobrazení jeho invezní relace, ta však nemusí být zobrazením. Zcela logicky proto hovoříme o existenci inverzního zobrazení, pokud každý prvek b ∈ B je obrazem pro právě jeden vzor v A. V takovém případě je samozřejmě inverzní zobrazení právě inverzní relací. 44 6. ZOBRAZENÍ A RELACE 1.94. Určete, kolik různých binárních relací lze zavést mezi množinou X a množinou všech jejích podmnožin, má-li množina X právě 3 prvky. Řešení. Nejprve si uvědomme, že množina všech podmnožin X má 23 = 8 prvků, a tudíž její kartézský součin s množinou X má 8 · 3 = 24 prvků. Uvažovanými binárními relacemi jsou právě podmnožiny tohoto kartézského součinu, kterých je celkem 224 . 1.95. Uveďte definiční obor D a obor hodnot I relace R = {(a, v), (b, x), (c, x), (c, u), (d, v), (f, y)} mezi množinami A = {a, b, c, d, e, f } a B = {x, y, u, v, w}. Je relace R zobrazení? Řešení. Přímo z definice definičního oboru a oboru hodnot relace do- stáváme D = {a, b, c, d, f } ⊂ A, I = {x, y, u, v} ⊂ B. Nejedná se o zobrazení, protože (c, x), (c, u) ∈ R, tj. c ∈ D má dva obrazy. 1.96. Nechť je na množině {a, b, c, d} dána relace R. Rozhodněte, zda je R relací uspořádání (příp. zda se jedná o úplné uspořádání), je-li (a) R = {(a, a), (b, b), (c, c), (d, d), (b, a), (b, c), (b, d)}; (b) R = {(a, a), (b, b), (c, c), (d, d), (d, a), (a, d)}; (c) R = {(a, a), (b, b), (c, c), (d, d), (a, b), (b, c), (b, d)}; (d) R = {(a, a), (b, b), (c, c), (a, b), (a, c), (a, d), (b, c), (b, d), (c, d)}; (e) R = {(a, a), (b, b), (c, c), (d, d), (a, b), (a, c), (a, d), (b, c), (b, d), (c, d)}. Řešení. Ve variantě (a) je uvedeno uspořádání, které není úplné (např. (a, c) /∈ R, (c, a) /∈ R). Ve variantě (b) relace R není antisymetrická (viz (a, d) ∈ R, (d, a) ∈ R), a tudíž se nejedná o uspořádání (jde o ekvivalenci). Ve variantách (c) a (d) také není uvedeno uspořádání, protože relace R zde není po řadě tranzitivní (např. (a, b), (b, c) ∈ R, (a, c) /∈ R) a reflexivní (viz (d, d) /∈ R). Ve variantě (e) je úplné uspořádání (pokud budeme (a, b) ∈ R interpretovat jako a ≤ b, pak a ≤ b ≤ c ≤ d). 1.97. Rozhodněte, zda je zobrazení f injektivní, resp. surjektivní, jestliže (a) f : Z × Z → Z, f ((x, y)) = x + y − 10x2 ; (b) f : N → N × N, f (x) = ( 2x, x2 + 10 ) . Řešení. Ve variantě (a) je uvedeno surjektivní zobrazení (postačuje položit x = 0), které není injektivní (stačí zvolit (x, y) = (0, −9) a (x, y) = (1, 0)). Ve variantě (b) se naopak jedná o injektivní zobrazení (obě jeho složky, tj. funkce y = 2x a y = x2 +10, jsou evidentně CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM Všimněme si, že složením zobrazení a jeho inverzního zobrazení (pokud obě existují) vždy vznikne identické obrazení, u obecných relací tomu tak být nemusí. 1.38. Relace na množině. V případě A = B hovoříme o relaci na množině A. Říkáme, že relace R je: • reflexivní, pokud idA ⊆ R, tj. (a, a) ∈ R pro všechny a ∈ A, • symetrická, pokud R−1 = R, tj. pokud (a, b) ∈ R, pak i (b, a) ∈ R, • antisymetrická, pokud R−1 ∩R ⊆ idA, tj. pokud (a, b) ∈ R a zároveň (b, a) ∈ R, pak a = b, • tranzitivní, pokud R ◦ R ⊆ R, tj. pokud z (a, b) ∈ R a (b, c) ∈ R vyplývá i (a, c) ∈ R. Relace se nazývá ekvivalence, pokud je současně reflexivní, symetrická i tranzitivní. Relace se nazývá uspořádání jestliže je reflexivní, tranzitivní a antisymetrická. Relaci uspořádání obvykle značíme symbolem ≤, tj. skutečnost, že prvek a je v relaci s prvkem b značíme a ≤ b. Zde je dobré si uvědomit, že relace <, tj. „býti ostře menší než“, mezi reálnými (racionálními, celými, přirozenými) čísly není relace uspořádání, protože není reflexivní. Dobrým příkladem uspořádání je inkluze. Uvažme množinu 2A všech podmnožin konečné množiny A (značení je speciálním případem obvyklé notace BA pro množinu všech zobrazení z A do B; prvky množiny 2A jsou tedy zobrazení A → {0, 1}, které "říkají", zda určitý prvek je či není v dané podmnožině) a na ní relaci X ⊆ Z danou vlastností „být podmnožinou“. Evidentně jsou splněny všechny tři vlastnosti pro uspořádání: skutečně, je–li X ⊆ Y a zároveň Y ⊆ X musí být nutně množiny X a Y stejné. Je–li X ⊆ Y ⊆ Z je také X ⊆ Z a také reflexivita je zřejmá. Říkáme, že uspořádání ≤ na množině A je úplné, když pro každé dva prvky a, b ∈ A platí, že jsou srovnatelné, tj. buď a ≤ b nebo b ≤ a. Všimněme si, že ne všechny dvojice (X, Y) podmnožin v A jsou srovnatelné v tomto smyslu. Přesněji, pokud je v A více než jeden prvek, existují podmnožiny X a Y, kdy není ani X ⊆ Y ani Y ⊆ X. Připomeňme rekurentní definici přirozených čísel N = {0, 1, 2, 3, . . . }, kde 0 = ∅, n + 1 = {0, 1, 2, . . . , n}. Na této množině N definujeme relaci ≤ následovně: m ≤ n, právě když m ∈ n nebo m = n. Evidentně jde o úplné úspořádání. Např. 2 ≤ 4, protože 2 = {∅, {∅}} ∈ {∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}} = 4. Jinak řečeno, samotná rekurentní definice zadává vztah n ≤ n + 1 a tranzitivně pak n ≤ k pro všechna k, která jsou tímto postupem definována později. 45 rostoucí na N), které není surjektivní (např. dvojice (1, 1) nemá vzor). 1.98. Stanovte počet zobrazení množiny {1, 2} do množiny {a, b, c}. Kolik z nich je surjektivních a kolik injektivních? Řešení. Prvku 1 můžeme v rámci zobrazení přiřadit libovolně jeden ze tří prvků a, b, c. Podobně také pro prvek 2 máme tři možnosti. Podle (kombinatorického) pravidla součinu tak existuje celkem 32 zobrazení množiny {1, 2} do množiny {a, b, c}. Surjektivní žádné z nich být nemůže, neboť konečná množina {a, b, c} má více prvků než množina {1, 2}. Při libovolném zobrazení prvku 1 (tři možnosti) obdržíme injektivní zobrazení, právě když prvek 2 zobrazíme na jiný prvek (dvě možnosti). Vidíme tedy, že injektivních zobrazení množiny {1, 2} do množiny {a, b, c} je 6. 1.99. Počet injektivních zobrazení mezi množinami Určete počet injektivních zobrazení množiny {1, 2, 3} do množiny {1, 2, 3, 4} Řešení. Libovolné injektivní zobrazení mezi uvažovanými množinami je dáno výběrem (uspořádané) trojice z množiny {1, 2, 3, 4} (prvky ve vybrané trojici budou po řadě obrazy čísel 1, 2, 3) a obráceně každé injektivní zobrazení nám zadává takovou trojici. Je tedy hledaných injektivních zobrazení stejně jako možností výběru uspořádaných trojic ze čtyř prvků, tedy v(3, 4) = 4 · 3 · 2 = 24. 1.100. Určete počet surjektivních zobrazení množiny {1, 2, 3, 4} na množinu {1, 2, 3}. Řešení. Hledaný počet určíme tak, že od počtu všech zobrazení odečteme ta, která nejsou surjektivní, t.j. ta, jejichž obor hodnot je buď jednoprvkovou nebo dvouprvkovou množinou. Všech zobrazení je V (3, 4) = 34 , zobrazení, jejichž oborem hodnot je jednoprvková množina, jsou tři. Počet zobrazení jejichž oborem hodnot je dvouprvková množina je (3 2 ) (24 −2) ( (3 2 ) způsoby můžeme vybrat obor hodnot a máme-li již dva prvky fixovány, máme 24 − 2 možností, jak na ně zobrazit čtyři prvky). Celkem je tedy počet hledaných surjektivních zobrazení (1.8) 34 − ( 3 2 ) (24 − 2) − 3 = 36. 1.101. Určete počet surjektivních zobrazení f množiny {1, 2, 3, 4, 5} na množinu {1, 2, 3} takových, že f (1) = f (2). Řešení. Každé takové zobrazení je jednoznačně dáno obrazem prvků {1, 3, 4, 5}, těchto zobrazení je tedy přesně tolik, kolik je zobrazení 6. RELACE A ZOBRAZENÍ 1.39. Rozklad podle ekvivalence. Každá ekvivalence R na množině A zadává zároveň rozklad množiny A na podmnožiny vzájemně ekvivalentních prvků, tzv. třídy ekvivalence. Pro libovolné a ∈ A uvažujeme třídu (množinu) prvků, které jsou ekvivalentní s prvkem a, tj. Ra = {b ∈ A; (a, b) ∈ R}. Často budeme psát pro Ra prostě [a], je-li z kontextu zřejmé, o kterou ekvivalenci jde. Zjevně Ra = Rb, právě když (a, b) ∈ R a každá taková třída ekvivalence je tedy reprezentována kterýmkoliv svým prvkem, tzv. reprezentantem. Zároveň Ra ∩ Rb ̸= ∅, právě když Ra = Rb, tj. třídy ekvivalence jsou po dvou disjunktní. Konečně, A = ∪a∈ARa, tj. celá množina A se skutečně rozloží na jednotlivé třídy. Můžeme také třídám rozkladu rozumět tak, že třídu [a] vnímáme jako prvek a „až na ekvivalenci“. 1.40. Konstrukce celých a racionálních čísel. Na přirozených číslech umíme sice sčítat a víme, že přičtením nuly se číslo nezmění. Umíme i definovat odečítání, při něm ale jen někdy existuje výsledek v množině N. Základní ideou konstrukce celých čísel z přirozených je tedy přidat k nim chybějící rozdíly. To můžeme udělat tak, že místo výsledku odečítání budeme pracovat s uspořádanými dvojicemi čísel, které nám samozřejmě vždy výsledek dobře reprezentují. Zbývá jen dobře definovat, kdy jsou (z hlediska výsledku odečítání) takové dvojice ekvivalentní. Potřebný vztah tedy je: (a, b) ∼ (a′ , b′ ) ⇐⇒ a−b = a′ −b′ ⇐⇒ a+b′ = a′ +b. Všimněme si, že zatímco výrazy v prostřední rovnosti v přirozených číslech neumíme, výrazy vpravo už ano. Snadno ověříme, že skutečně jde o ekvivalenci a její třídy označíme jako celá čísla Z. Na nich definujeme operaci sčítání (a s ní i odečítání) pomocí reprezentantů. Např. [(a, b)] + [(c, d)] = [(a + c, b + d)], což zjevně nezávisí na výběru reprezentantů. Lze si přitom vždy volit reprezentanty (a, 0) pro kladná čísla a reprezentanty (0, a) pro čísla záporná, se kterými se nám bude patrně počítat nejlépe. Tento jednoduchý příklad ukazuje, jak důležité je umět nahlížet na třídy ekvivalence jako na celistvý objekt a soustředit se na vlastnosti těchto objektů, nikoliv formální popisy jejich konstrukcí. Ty jsou však důležité k ověření, že takové objekty vůbec existují. U celých čísel nám už platí všechny vlastnosti skalárů (KG1)–(KG4) a (O1)–(O4), viz odstavce 1.1 a 1.3. Pro násobení je neutrálním prvkem jednička, ale pro všechna čísla a 46 6. ZOBRAZENÍ A RELACE surjektivních zobrazení množiny {1, 3, 4, 5} na množinu {1, 2, 3}, tedy 36, jak víme z předchozího příkladu. 1.102. Hasseův diagram uspořádání. Hasseův diagram daného uspořádání ≺ na n-prvkové množině M je diagram s n vrcholy (každý vrchol odpovídá právě jednomu prvku množiny), přičemž dva vrchly (prvky) a, b jsou spojeny (víceméně svislou) čarou (tak, že a je „dole“ a b „nahoře“), právě když b pokrývá a, tj. a ≺ b a neexistuje c ∈ M tak, že a ≺ c a c ≺ b. 1.103. Určete počet relací uspořádání na čtyřprvkové množině. Řešení. Postupně projdeme všechny možné Hasseovy diagramy uspořádání na nějaké čtyřprvkové množině M a spočítáme, kolik různých uspořádání (tj. podmnožin množiny M × M) má daný Hasseův diagram, viz obr.: Celkem tedy je 219 uspořádání na čtyřprvkové množině. 1.104. Určete počet relací uspořádání množiny {1, 2, 3, 4, 5} takových, že právě dvě dvojice prvků jsou nesrovnatelné. 1.105. Vypište všechny relace na dvouprvkové množině {1, 2}, jež současně nejsou reflexivní, jsou symetrické a nejsou tranzitivní. Řešení. Reflexní relace jsou právě ty, které obsahují obě dvojice (1, 1), (2, 2). Tím jsme vyloučili relace {(1, 1), (2, 2)}, {(1, 1), (2, 2), (1, 2)}, {(1, 1), (2, 2), (2, 1)}, {(1, 1), (2, 2), (1, 2), (2, 1)}. Zbývající relace, které jsou symetrické a nejsou tranzitivní, musejí obsahovat (1, 2), (2, 1). Pokud taková relace obsahuje jednu z těchto dvou uspořádaných dvojic, musí obsahovat rovněž druhou (podmínka symetrie). Kdyby neobsahovala ani jednu z těchto dvou uspořádaných dvojic, pak by očividně byla tranzitivní. Z celkového počtu 16 relací na dvouprvkové množině jsme tak vybrali {(1, 2), (2, 1)}, {(1, 2), (2, 1), (1, 1)}, {(1, 2), (2, 1), (2, 2)}. Je vidět, že každá z těchto 3 relací není reflexivní, je symetrická a není tranzitivní. CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM různá od nuly a jedničky neumíme najít číslo a−1 s vlastností a · a−1 = 1, tzn. chybí nám inverzní prvky pro násobení. Zároveň si povšimněme, že platí vlastnost oboru integrity (OI), viz 1.3, tzn. je-li součin dvou čísel nulový, musí být alespoň jedno z nich nula. Díky poslední jmenované vlastnosti můžeme zkonstruovat racionální čísla Q přidáním všech chybějících inverzí zcela obdobným způsobem, jak jsme konstruovali Z z množiny N. Na množině uspořádáných dvojic (p, q), q ̸= 0, celých čísel definujeme relaci ∼ tak, jak očekáváme, že se mají chovat podíly p/q: (p, q) ∼ (p′ , q′ ) ⇐⇒ p/q = p′ /q′ ⇐⇒ p · q′ = p′ · q. Opět neumíme očekávané chování v prostřední rovnosti v množině Z formulovat, nicméně rovnost na pravé straně ano. Zjevně jde o dobře definovanou relaci ekvivalence (ověřte podrobnosti!) a racionální čísla jsou pak její třídy ekvivalence. Když budeme formálně psát p/q místo dvojic (p, q), budeme definovat operace násobení a sčítání právě pomocí formulí, které nám jsou jistě dobře známy. 1.41. Zbytkové třídy. Jiným dobrým a jednoduchým příkladem jsou tzv. zbytkové třídy celých čísel. Pro pevně zvolené přirozené číslo k definujeme ekvivalenci ∼k tak, že dvě čísla a, b ∈ Z jsou ekvivalentní, jestliže jejich zbytek po dělení číslem k je stejný. Výslednou množinu tříd ekvivalence označujeme Zk. Nejjednodušší je tato procedura pro k = 2. To dostáváme Z2 = {0, 1}, kde nula reprezentuje sudá čísla, zatímco jednička čísla lichá. Opět lze snadno zjistit, že pomocí reprezentantů můžeme koerektně definovat násobení a sčítání na každém Zk. Věta. Zbytkové třídy Zk jsou komutativním tělesem skalárů (tj. splňují i vlastnost (P) z odstavce 1.3), právě když je k pr- vočíslo. Pokud k prvočíslem není, obsahuje Z vždy dělitele nuly, není proto ani obor integrity. Důkaz. Okamžitě je vidět druhé tvrzení — jestliže x · y = k pro přirozená čísla x, y, pak samozřejmě je výsledek násobení příslušných tříd [x] · [y] nulový. Naopak, jsou-li x a k nesoudělná, existují podle tzv. Bezoutovy rovnosti, kterou dovodíme později (viz ??) přirozená čísla a a b splňující a x + b k = 1, což pro odpovídající třídy ekvivalence dává [a] · [x] + [0] = [a] · [x] = [1] a proto je [a] inverzním prvkem k [x]. 47 1.106. Určete počet relací ekvivalence na množině {1, 2, 3, 4}. Řešení. Ekvivalence můžeme počítat podle toho, kolik prvků mají jejich třídy rozkladu. Pro počty prvků tříd rozkladu ekvivalencí na čtyřprvkové množině jsou tyto možnosti: Počty prvků ve třídách rozkladu počet ekvivalencí daného typu 1,1,1,1 1 2,1,1 (4 2 ) 2,2 1 2 (4 2 ) 3,1 (4 1 ) 4 1 Celkem tedy máme 15 různých ekvivalencí. Poznámka. Obecně počet tříd rozkladu n-prvkové množiny udává Bellovo číslo Bn+k, pro které lze odvodit rekurentní formuli Bn+1 = n∑ k=0 (n k ) Bk. 1.107. Kolik existuje relací na n-prvkové množině? Řešení. Relace je libovolná podmnožina kartézského součinu množiny se sebou samou. Tento kartézský součin má n2 prvků a je tedy počet všech relací na n-prvkové množině 2n2 . 1.108. Kolik existuje reflexivních relací na n-prvkové množině? Řešení. Relace na množině M je reflexivní, právě když je diagonální relace M = {(a, a), kdea ∈ M} její podmnožinou. U zbylých n2 −n uspořádaných dvojic v kartézském součinu M × M máme nezávislou volbu, jestli daná dvojice v dané relaci bude či ne. Celkem tedy máme 2n2−n různých reflexivních relací na n-prvkové množině. 1.109. Kolik existuje symetrických relací na n-prvkové množině? Řešení. Relace na množině M je symetrická, právě když je její průnik s každou množinou {(a, b), (b, a), kde a ̸= b, a, b ∈ M} buď celá daná dvouprvková množina, nebo je tento průnik prázdný. Dvouprvkových podmnožin množiny M je (n 2 ) a pokud kromě průniků s těmito množinami ještě určíme průnik dané relace s diagonální relací M = {(a, a), kde a ∈ M}, je tímto daná relace jednoznačně určena. Celkem můžeme provést (n 2 ) + n nezávislých voleb mezi dvěma alternativami: každá množina typu {(a, b), (b, a)|a, b ∈ M, a ̸= b} buď je podmnožinou dané relace, nebo ani jeden z jejich prvků v dané relaci neleží a každá dvojice (a, a), a ∈ M, potom také buď v relaci leží nebo ne. Celkem tedy máme 2 (n 2 ) +n symetrických relací na n-prvkové množině. 6. RELACE A ZOBRAZENÍ 48 6. ZOBRAZENÍ A RELACE 1.110. Kolik existuje antisymetrických relací na n-prvkové množině? Řešení. Relace na množině M je antisymetrická právě když její průnik s každou množinou {(a, b), (b, a)} a ̸= b, a, b ∈ M není dvojprvkový (jsou tedy tři možnosti jak průnik vypadá, buď je to množina {(a, b)}, nebo {(b, a)}, nebo je průnik prázdný). Průnik s diagonální relací pak může být libovolný. Určením těchto všech průniků je relace jednoznačně určena. Celkem máme 3 (n 2 ) 2n antisymetrických relací na n-prvkové množině. 1.111. Určete počet relací na množině {1, 2, 3, 4}, které jsou současně symetrické i tranzitivní. 1.112. Určete počet relací uspořádání na tříprvkové množině. 1.113. Určete počet relací uspořádání na množině {1, 2, 3, 4} takových, že prvky 1 a 2 jsou nesrovnatelné (tedy neplatí 1 ≺ 2 ani 2 ≺ 1, kde ≺ je označení uvažované relace uspořádání). 1.114. Nechť pro libovolná celá čísla k, l platí (k, l) ∈ R právě tehdy, když je číslo 4k − 4l celočíselným násobkem 7. Je takto zavedená relace R ekvivalence, uspořádání? Řešení. Uvědomme si, že dvě celá čísla jsou spolu v relaci R, právě když dávají stejný zbytek po dělení 7. Jde tedy o příklad tzv. zbytkové třídy celých čísel. Proto víme, že relace R je relací ekvivalence. Její symetrie (např. (3, 10), (10, 3) ∈ R, 3 ̸= 10) pak implikuje, že se nejedná o uspořádání. 1.115. Nechť je na množině N = {3, 4, 5, . . . , n, n + 1, . . . } definována relace R tak, že dvě čísla jsou v relaci, právě když jsou nesoudělná (tedy neobsahuje-li prvočíselný rozklad uvažovaných dvou čísel ani jedno stejné prvočíslo). Zjistěte, zda je tato relace reflexivní, symetrická, antisymetrická, tranzitivní. Řešení. Pro dvojici stejných čísel platí, že (n, n) /∈ R. Nejedná se tedy o reflexivní relaci. Být „soudělný“ nebo „nesoudělný“ pro dvojici čísel z N je zřejmě vlastnost neuspořádané dvojice – nezávisí na uvedeném pořadí uvažovaných čísel, a proto je relace R symetrická. Ze symetrie relace R plyne, že není antisymetrická (např. (3, 5) ∈ R, 3 ̸= 5). Neboť je R symetrická a (n, n) /∈ R pro libovolné číslo n ∈ N, volba dvou různých čísel, která jsou spolu v této relaci, dává, že R není tranzitivní. CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM 49 Řešení cvičení 1.1. Ukažte, že pokud uvažovaná odmocnina není přirozená, pak není ani racionální. Pokud m √ t není přirozená, tak existuje prvočíslo r a přirozené s taková, že rs dělí t, rs+1 nedělí t a m nedělí s (zápis ordr t = s) Předpokládejte, že m √ t = p q , p, q ∈ Z, neboli t · pm = qm. Uvažte ordr L a ordr R a jejich dělitelnost číslem m. (L značí levou stranu rovnice, ...) 1.7. i) a) 1 − 3 − 2i + 4i = −2 + 2i b) 1.(−3) − 8i2 + 6i + 4i = 5 + 10i c) 1 + 2i d) √ 42 + (−3)2 = 5 e) z1 z2 = z1¯z2 |z2|2 = 1.(−3)+8i2+6i−4i 25 = −11 25 + 2 25 i ii) a) 2 + i b) 2i c) 2 d) 1 e) 2 i = −2i 1.30. yn = 2(3 2 )n − 2. 1.42. Jedná se o známý problém permutací s pevnými body. i) Pokud šest lidí dostne ten svůj, tak zákonitě i ten šestý. pravděpodobnost je tedy nulová. ii) Nechť M je množina všech uspořádání a jev Ai je uspořádání, kdy i-tý hráč dostane svůj krígl. Chceme spočítat |M − ∪iAi|. Dostáváme 7! ∑7 k=0 (−1)k k! = 1854. A pravděpodobnost je 1854 5040 = 103 280 . = 0, 37. iii) Vybereme, kteří tři dostanou ten svůj - (7 3 ) = 35 možností. Zbylí čtyři musí dostat jiné než svoje. To je opět vzorec z minulého bodu, konkrétně jde o 4! ∑4 k=0 (−1)k k! = 9 možností. Máme tedy dohromady 9 · 35 = 315 možností a pravděpodobnost je 315 5040 = 1 16 . 1.92. i) (3, 3), (4, 4), (5, 5), (6, 6), (7, 7), (3, 6) ověřte, že jde o relaci uspořádání ii) opět (i, i) pro i = 1, . . . , 7 a k tomu (3, 6), (6, 3) ověřte, že jde o relaci ekvivalence iii) (i, i) pro i = 1, . . . , 7 a k tomu (3, 6), (6, 3), (4, 6), (6, 4) ověřte, že nejde o relaci ekvivalence, protože není splňena tranzitivita. 1.104. 1.111. Relace uvedených vlastností je relací ekvivalence na nějaké podmnožině množiny {1, 2, 3, 4}. Celkem 1 + 4 · 1 + (4 2 ) · 2 + (4 3 ) · 5 + 15 = 52. 1.112. 19. 1.113. 87. 6. RELACE A ZOBRAZENÍ 50 6. ZOBRAZENÍ A RELACE Doplňující příklady k celé kapitole 1.116. Setkání se zúčastnilo šest mužů. Pokud si všichni navzájem potřásli rukama, vyčíslete počet potřesení. Řešení. Počet potřesení rukou zřejmě odpovídá počtu způsobů, jak lze vybrat neuspořádanou dvojici ze 6 prvků, tj. výsledek je c (6, 2) = (6 2 ) = 15. 1.117. Určete, kolika způsoby lze z 15 poslanců vybrat čtyřčlennou komisi, není-li možné, aby jistí 2 poslanci pracovali spolu. Řešení. Výsledek je (15 4 ) − (13 2 ) = 1 287. Obdržíme ho tak, že nejprve určíme počet všech možných výběrů čtyřčlenné komise, potom od něj odečteme počet těch výběrů, kdy oba zmínění poslanci budou vybráni (v takovém případě vybíráme pouze 2 další členy komise ze 13 poslanců). 1.118. Kolika způsoby můžeme rozdělit 8 žen a 4 muže do 2 šestičlenných skupin (v nichž nerozlišujeme pořadí – jsou neuspořádané) tak, aby v obou skupinách byl alespoň 1 muž? Řešení. Rozdělení 12 osob do 2 šestičlenných skupin bez jakýchkoli podmínek je dáno libovolným výběrem 6 z nich do první ze skupin, což lze provést (12 6 ) způsoby. Skupiny ale nejsou rozlišitelné (nevíme, která z nich je první), a proto je počet všech možných rozdělení 1 2 · (12 6 ) . V (8 2 ) případech pak budou všichni muži v jedné skupině (volíme 2 ženy z 8, které skupinu doplní). Správná odpověď je tudíž 1 2 · (12 6 ) − (8 2 ) = 434. 1.119. Jaký je počet čtyřciferných čísel složených z číslic 1, 3, 5, 6, 7 a 9, ve kterých se žádná z cifer neopakuje? Řešení. K dispozici máme šest různých číslic. Ptáme se: Kolik různých uspořádaných čtveřic z nich můžeme vybrat? Výsledek je proto v (6, 4) = 6 · 5 · 4 · 3 = 360. 1.120. K vytrvalostnímu závodu, v němž běžci vybíhají jeden po druhém s danými časovými odstupy, se přihlásilo k závodníků, mezi nimi také tři kamarádi. Stanovte počet startovních listin, v rámci kterých žádní dva z trojice kamarádů nestartují těsně po sobě. Pro jednoduchost uvažujte k ≥ 5. Řešení. Ostatních k−3 závodníků můžeme seřadit (k−3)! způsoby. Pro uvažované tři kamarády pak máme k − 2 míst (začátek, konec a k − 4 mezer), na které je můžeme rozmístit v (k − 2, 3) způsoby. Podle (kombinatorického) pravidla součinu je tak výsledek (k − 3)! · (k − 2) · (k − 3) · (k − 4) = (k − 2)! · (k − 3) · (k − 4). CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM 51 1.121. Turnaje se zúčastní 32 lidí. Podle požadavků organizátorů se musí libovolným způsobem rozdělit do čtyř skupin tak, aby první skupina měla 10 účastníků, druhá 8, třetí také 8 a poslední čtvrtá potom 6. Kolika způsoby se mohou takto rozdělit? Řešení. Můžeme si představit, že z 32 účastníků vytvoříme řadu, kdy prvních 10 utvoří první skupinu, dalších 8 druhou atd. Celkem můžeme účastníky seřadit 32! způsoby. Uvědomme si ovšem, že na rozdělení do skupin nemá vliv, když zaměníme pořadí osob, které patří do stejné skupiny. Proto je počet navzájem různých rozdělení roven P (10, 8, 8, 6) = 32! 10!·8!·8!·6! . 1.122. Je potřeba ubytovat 9 osob v jednom čtyřlůžkovém, jednom třílůžkovém a jednom dvoulůžkovém pokoji. Zjistěte, kolika způsoby to lze provést. Řešení. Jestliže např. hostům ve čtyřlůžkovém pokoji, přiřadíme číslici 1, v třílůžkovém pokoji číslici 2 a v dvoulůžkovém číslici 3, pak vytváříme permutace s opakováním ze tří prvků 1, 2, 3, v nichž jednička se vyskytuje čtyřikrát, dvojka třikrát a trojka dvakrát. Příslušný počet permutací je P (4, 3, 2) = 9! 4!·3!·2! = 1 260. 1.123. Řecká abeceda se skládá z 24 písmen. Kolik různých slov majících právě pět písmen z ní lze utvořit? (Bez ohledu na to, zda tato slova mají nějaký jazykový význam.) Řešení. Pro každou z pěti pozic ve slově máme 24 možností, neboť písmena se mohou opakovat. Výsledek je tedy V (24, 5) = 245 . 1.124. Určete počet způsobů, jak lze rozdělit mezi tři osoby A, B a C 33 různých mincí tak, aby osoby A a B měly dohromady právě dvakrát více mincí, než má osoba C. Řešení. Ze zadání vyplývá, že osoba C má obdržet 11 mincí. To lze provést (33 11 ) způsoby. Každou ze zbývajících 22 mincí může získat osoba A nebo B, což dává 222 možností. Z (kombinatorického) pravidla součinu plyne výsledek (33 11 ) · 222 . 1.125. Kolika způsoby můžete mezi 4 chlapce rozdělit 40 stejných kuliček? Řešení. Přidejme ke 40 kuličkám troje zápalky. Poskládáme-li kuličky a zápalky do řady, rozdělí zápalky kuličky na 4 úseky. Náhodně seřaďme chlapce. Dáme-li prvnímu chlapci všechny kuličky z prvního úseku, druhému chlapci všechny kuličky z druhého úseku atd., je již vidět, že všech rozdělení je právě (43 3 ) = 12 341. 1.126. Podle kvality dělíme výrobky do skupin I, II, III, IV . Zjistěte počet všech možných rozdělení 9 výrobků do těchto skupin, která se liší tím, kolik výrobků je ve skupině I, II, III, IV. Řešení. Zapisujeme-li přímo uvažované devítičlenné skupiny z prvků I, II, III, IV , vytváříme kombinace s opakováním deváté třídy ze čtyř prvků. Počet takových kombinací je (12 9 ) = 220. 6. RELACE A ZOBRAZENÍ 52 6. ZOBRAZENÍ A RELACE 1.127. Kolika způsoby mohla skončit tabulka první fotbalové ligy, víme-li o ní pouze, že alespoň jeden z týmů z dvojice Ostrava, Olomouc je v tabulce za týmem Brna (ligu hraje 16 mužstev). Řešení. Nejprve určíme tři místa, na kterých se umístily celky Brna, Olomouce a Ostravy. Ty lze vybrat c(3, 16) = (16 3 ) způsoby. Z šesti možných pořadí zmíněných tří týmů na vybraných třech místech vyhovují podmínce ze zadání čtyři. Pro libovolné pořadí těchto týmů na libovolně vybraných třech místech pak můžeme nezávisle volit pořadí zbylých 13 týmů na ostatních místech tabulky. Podle pravidla součinu je tedy hledaný počet tabulek roven ( 16 3 ) · 4 · 13! = 13948526592000. 1.128. Kolik je možných uspořádání (v řadě) na fotce volejbalového týmu (6 hráčů), když i) Gouald a Bamba chtějí stát vedle sebe ii) Gouald a Bamba chtějí stát vedle sebe a uprostřed iii) Gouald a Kamil nechtějí stát vedle sebe Řešení. i) Goualda a Bambu můžeme v tomto případě počítat za jednoho, rozlišíme jen jak stojí vzájemně. Máme 2.5! = 240 pořadí. ii) Tady je to podobné,jen pozice Goualda a Bamby je pevně daná. Dostáváme 2.4! = 48 možností. iii) Nejjednodušší je asi odečíst případy, kdy stojí vedle sebe (viz (1)) od všech pořadí. Dostaneme 6! − 2.5! = 720 − 240 = 480. 1.129. Házení mincí. Šestkrát hodíme mincí. i) Kolik je všech různých posloupností panna, orel ii) Kolik je takových, že padnou právě čtyři panny. iii) Kolik je takových, že padnou aspoň dvě panny. 1.130. Kolik existuje přesmyček slova BAZILIKA takových, že se v nich střídají souhlásky a sa- mohlásky? Řešení. Protože souhlásky i samohlásky jsou v daném slově čtyři, tak se v každé takové přesmyčce střídají pravidelně souhlásky a samohlásky. Slovo tedy může být typu BABABABA nebo ABABABAB. Na daných čtyřech místech můžeme pak samohlásky permutovat mezi sebou (Po(2, 2) = 4! 2!2! způsoby) a nezávisle na tom i souhlásky (4! způsoby). Hledaný počet je pak dle pravidla součinu 2 · 4! · 4! 2!2! = 288. 1.131. Kolika způsoby lze rozdělit 9 děvčat a 6 chlapců do dvou skupin tak, aby každá skupina obsahovala alespoň dva chlapce? Řešení. Rozdělíme zvlášť děvčata a chlapce: 29 (25 − 7) = 12800. CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM 53 1.132. Materiál je tvořen pěti vrstvami, každá z nich má vlákna v jednom z daných šesti směrů. Kolik takových materiálů existuje? Kolik je jich takových, že dvě sousední vrstvy nemají vlákna ve stejném směru? Řešení. 65 a 6 · 55 . 1.133. Na kružnici stojí n pevností (n ≥ 3), očíslovaných po řadě čísly 1,..., n. V jeden okamžik každá vystřelí na jednu ze dvou sousedních (pevnost 1 sousedí s pevností n). Označme P(n) počet možných výsledků střelby (za výsledek střelby považujeme množinu čísel právě těch pevností, které byly při střelbě zasaženy, nerozlišujeme přitom mezi jedním a dvěma zásahy). Dokažte, že P(n) a P(n + 1) jsou nesoudělná. Řešení. Označíme-li zasažené pevnosti černým kolečkem a nezasažené bílým, úloha je ekvivalentní úloze určit počet všech možných obarvení n koleček, umístěných na kružnici, černou a bílou barvou tak, aby nebyla žádná dvě bílá kolečka „objedno“. Pro lichá n je tento počet roven počtu K(n) obarvení černou a bílou barvou tak, aby žádná dvě bílá kolečka nestála vedle sebe (přečíslujeme pevnosti tak, že začneme u kolečka 1 a číslujeme popořadě vzestupně po lichých číslech a poté vzestupně po sudých). V případě sudého n je tento počet roven K(n/2)2 , kvadrátu počtu obarvení n/2 koleček na obvodu kruhu tak, aby žádná dvě bílá nestála vedle sebe (barvíme nezávisle kolečka na lichých a na sudých pozicích). Pro K(n) snadno odvodíme rekurentní formuli K(n) = K(n − 1) + K(n − 2). Navíc snadno spočteme, že K(2) = 3, K(3) = 4, K(4) = 7, tedy K(2) = F(4) − F(0), K(3) = F(5) − F(1), K(4) = F(6)−F(2) a indukcí snadno dokážeme K(n) = F(n+2)−F(n−2), kde F(n) značí n-tý člen Fibonacciho posloupnosti (F(0) = 0, F(1) = F(2) = 1). Navíc protože (K(2), K(3)) = 1, máme pro n ≥ 3 obdobně jako u Fibonacciho posloupnosti (K(n), K(n − 1)) = (K(n) − K(n − 1), K(n − 1)) = = (K(n − 2), K(n − 1)) = · · · = 1. Ukážeme nyní, že pro každé sudé n = 2a je P(n) = K(a)2 nesoudělné jak s P(n + 1) = K(2a + 1), tak s P(n − 1) = K(2a − 1). K tomu stačí následující: pro a ≥ 2 je totiž (K(a), K(2a + 1)) = (K(a), F(2)K(2a) + F(1)K(2a − 1)) = = (K(a), F(3)K(2a − 1) + F(2)K(2a − 2) = . . . = (K(a), F(a + 1)K(a + 1) + F(a)K(a)) = = (K(a), F(a + 1)) = (F(a + 2) − F(a − 2), F(a + 1)) = = (F(a + 2) − F(a + 1) − F(a − 2), F(a + 1)) = = (F(a) − F(a − 2), F(a + 1)) = = (F(a − 1), F(a + 1)) = (F(a − 1), F(a)) = 1 (K(a), K(2a − 1)) = (K(a), F(2)K(2a − 2) + F(1)K(2a − 3)) = = (K(a), F(3)K(2a − 3) + F(2)K(2a − 4)) = = · · · = (K(a), F(a)K(a) + F(a − 1)K(a − 1)) = = (K(a), F(a − 1)) = (F(a + 2) − F(a − 2), F(a − 1)) = = (F(a + 2) − F(a), F(a − 1)) = 6. RELACE A ZOBRAZENÍ 54 6. ZOBRAZENÍ A RELACE = (F(a + 2) − F(a + 1), F(a − 1)) = (F(a), F(a − 1)) = 1. Tím je tvrzení dokázáno. 1.134. Kolik peněz naspořím na stavebním spoření za pět let, vkládám-li 3000 Kč měsíčně (vždy k 1. v měsíci), vklad je úročen roční úrokovou mírou 3% (úročení probíhá jednou za rok) a od státu obdržím ročně příspěvek 1500 Kč (státní příspěvek se připisuje vždy až 1. května následujícího roku)? Řešení. Označme množství naspořených peněz po n-tém roce jako xn. Potom dostáváme (pro n > 2) následující rekurentní formuli (navíc předpokládáme, že každý měsíc je přesně dvanáctina roku) xn+1 = 1, 03(xn) + 36000 + 1500+ 0, 03 · 3000 ( 1 + 11 12 + · · · + 1 12 ) úroky z vkladů za aktuální rok + + 0, 03 · 2 3 · 1500 úrok ze státního příspěvku připsaného v aktuálním roce = = 1, 03(xn) + 38115. Tedy xn = 38115 n−2∑ i=0 (1, 03)i + (1, 03)n−1 x1 + 1500, přičemž x1 = 36000 + 0, 03 · 3000 ( 1 + 11 12 + · · · + 1 12 ) = 36585, celkem x5 = 38115 ( (1, 03)4 − 1 0, 03 ) + (1, 03)4 · 36585 + 1500 . = 202136. 1.135. Poznámka. Ve skutečnosti úročení probíhá podle počtu dní, které jsou peníze na účtu. Obstarejte si skutečný výpis ze stavebního spoření, zjistěte si jeho úročení a zkuste si spočítat připsané úroky za rok. Porovnejte je se skutečně připsanou sumou. Počítejte tak dlouho, dokud sumy nebudou souhlasit ... 1.136. Na kolik maximálně částí dělí rovinu n kružnic? Řešení. Pro maximální počet pn oblastí, na které dělí rovinu kružnice odvodíme rekurentní vzorec pk+1 = pk + 2k. Všimněme si totiž, že (n + 1)-ní kružnice protíná n předchozích maximálně v 2n průsečících (a tato situace skutečně může nastat). CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM 55 Navíc zřejmě p1 = 2. Pro počet pn tedy dostáváme pk = pn−1 + 2(n − 1) = pn−2 + 2(n − 2) + 2(n − 1) = . . . = p1 + n−1∑ i=1 2i = n2 − n + 2. 1.137. Na kolik nejvýše částí dělí třírozměrný prostor n rovin? Řešení. Označme hledaný počet rn. Vidíme, že r0 = 1. Podobně jako v předchozím příkladu uvažujme, že máme v prostoru n rovin, přidejme jednu další a ptejme se, kolik nejvýše částí prostoru přibude. Opět to bude přesně tolik, kolika původními částmi prostoru přidaná rovina prochází. Kolik to může být? Počet částí prostoru, kterými (n + 1)-ní rovina prochází je roven počtu částí, na které je přidaná (n + 1)-ní rovina rozdělena průsečnicemi s n rovinami, které v prostoru již byly rozmístěny. Těchto částí však může být podle předchozího příkladu nejvýše 1/2 · (n2 + n + 2), dostáváme tak rekurentní formuli rn+1 = rn + n2 + n + 2 2 . Danou rovnici opět můžeme vyřešit přímo: rn = rn−1 + (n − 1)2 + (n − 1) + 2 2 = rn−1 + n2 − n + 2 2 = = rn−2 + (n − 1)2 − (n − 1) + 2 2 + n2 − n + 2 2 = = rn−2 + n2 2 + (n − 1)2 2 − n 2 − (n − 1) 2 + 1 + 1 = = rn−3 + n2 2 + (n − 1)2 2 + (n − 3)2 2 − n 2 − (n − 1) 2 − (n − 2) 2 + +1 + 1 + 1 = = · · · = r0 + 1 2 n∑ i=1 i2 − 1 2 n∑ i=1 i + n∑ i=1 1 = = 1 + n(n + 1)(2n + 1) 12 − n(n + 1) 4 + n = 6. RELACE A ZOBRAZENÍ 56 6. ZOBRAZENÍ A RELACE = n3 + 6n + 5 6 , kde jsme použili známého vztahu n∑ i=1 i2 = n(n + 1)(2n + 1) 6 , který lze snadno dokázat matematickou indukcí. 1.138. Na kolik maximálně částí dělí trojrozměrný prostor n koulí? 1.139. Na kolik částí dělí prostor n navzájem různých rovin, které všechny prochází jedním daným bodem? Řešení. Pro hledaný počet xn odvodíme rekurentní formuli xn = xn−1 + 2(n − 1), dále x1 = 2, tedy xn = n(n − 1) + 2. 1.140. Z balíčku 52 karet náhodně vybereme 16 karet. Vyjádřete pravděpodobnost, že vybereme právě 10 červených a 6 černých karet. Řešení. Nejdříve si uvědomme, že nemusíme zohledňovat pořadí výběru karet. (Ve výsledném zlomku bychom uspořádané výběry získali tak, že bychom číslem 16! vynásobili čitatele i jmenovatele.) Počet všech možných (neuspořádaných) výběrů 16 karet z 52 je (52 16 ) . Podobně je počet všech možných výběrů 10 karet z 26 roven (26 10 ) a 6 karet z 26 pak (26 6 ) . Neboť vybíráme nezávisle na sobě 10 karet z 26 červených a 6 karet z 26 černých, užití (kombinatorického) pravidla součinu dává výsle- dek (26 10 ) · (26 6 ) (52 16 ) . 1.141. V urně je 7 bílých, 6 žlutých a 5 modrých koulí. Vylosujeme (bez vracení) 3 koule. Určete pravděpodobnost, že právě 2 jsou bílé. Řešení. Celkem máme (7+6+5 3 ) způsobů, jak lze vybrat 3 koule. Vylosovat právě 2 bílé umožňuje (7 2 ) výběrů bílých a současně (11 1 ) výběrů zbylé (třetí) koule. Podle pravidla součinu je tak počet způsobů, jak lze vylosovat právě 2 bílé, roven (7 2 ) · (11 1 ) . Odsud již plyne výsledek (7 2 ) ·11 (18 3 ) . CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM 57 1.142. Z karetní hry o 108 kartách (2 × 52 + 4 žolíci) bez vracení vybereme 4 karty. Jaká je pravděpodobnost, že aspoň jedna z nich je eso nebo žolík? Řešení. Lehce můžeme určit pravděpodobnost opačného (komplementárního) jevu znamenajícího, že ve vybrané čtveřici není žádná z 12 uvažovaných karet (8 es a 4 žolíků). Tato pravděpodobnost je dána poměrem počtu výběrů 4 karet z 96 a počtu výběrů 4 karet ze 108, tj. je rovna (96 4 ) / (108 4 ) . Opačný jev má tudíž pravděpodobnost 1 − (96 4 ) (108 4 ) . 1.143. Při házení kostkou padla jedenáctkrát po sobě čtyřka. Uveďte pravděpodobnost, že padne podvanácté. Řešení. Předchozí výsledky (podle našich předpokladů) nijak neovlivňují, co padne na kostce při dalších hodech. Proto je hledaná pravděpodobnost 1/6. 1.144. Z balíčku 32 karet náhodně vypadne 6 karet. Jaká je pravděpodobnost, že jsou všechny téže barvy? Řešení. K tomu, abychom získali výsledek 4· (8 6 ) (32 6 ) , stačí nejprve zvolit jednu ze 4 barev a uvědomit si, že existuje (8 6 ) způsobů, jak vybrat 6 karet z 8 této barvy. 1.145. Tři hráči dostanou po 10 kartách a 2 zbudou (z balíčku připraveného na mariáš nebo prší – 32 karet, z toho 4 esa). Je pravděpodobnější, že někdo dostane listovou sedmu, osmu a devítku, nebo to, že zbyla dvě esa? Řešení. Protože pravděpodobnost, že nějaký z hráčů dostane uvedené tři karty, je rovna hodnotě 3 (29 7 ) (32 10 ) , zatímco pravděpodobnost, že zbudou dvě esa, je rovna číslu (4 2 ) (32 2 ) , je pravděpodobnější, že nějaký z hráčů dostal zmíněné tři karty. Poznamenejme, že dokázat nerovnost 3· (29 7 ) (32 10 ) > (4 2 ) (32 2 ) lze úpravou obou jejích stran, kdy opakovaným krácením (po vyjádření kombinačních čísel dle definice) lehce dostaneme 6 > 1. 1.146. Hodíme n kostkami. Jaká je pravděpodobnost, že mezi čísly, která padnou, nebudou hodnoty 1, 3 a 6? Řešení. Úlohu můžeme přeformulovat tak, že n-krát po sobě hodíme 1 kostkou. Pravděpodobnost, že při prvním hodu nepadne 1, 3 nebo 6, je 1/2. Pravděpodobnost, že při prvním a druhém hodu nepadne 1, 3 ani 6, je zjevně 1/4 (výsledek prvního hodu neovlivňuje výsledek druhého). Vzhledem k tomu, že jev určený výsledkem jistého hodu a jakýkoli jev určený výsledkem jiného hodu jsou vždy (stochasticky) nezávislé, hledaná pravděpodobnost je 1/2n . 6. RELACE A ZOBRAZENÍ 58 6. ZOBRAZENÍ A RELACE 1.147. Dva přátelé střílejí nezávisle na sobě do jednoho terče, každý po jednom výstřelu. Pravděpodobnost zásahu terče pro prvního je 0, 4, pro druhého je 0, 3. Nalezněte pravděpodobnost P jevu, že po střelbě bude v terči právě jeden zásah. Řešení. Výsledek stanovíme tak, že sečteme pravděpodobnosti těchto dvou neslučitelných jevů: trefil se první střelec a druhý nikoli; první střelec minul, zatímco druhý terč zasáhl. Při nezávislosti jevů (která se zachovává také tehdy, když uvažujeme komplementy některých z jevů) je pravděpodobnost společného nastoupení dána součinem pravděpodobností jednotlivých jevů. Užitím toho dostáváme P = 0, 4 · (1 − 0, 3) + (1 − 0, 4) · 0, 3 = 0, 46. 1.148. Dvanáctkrát po sobě házíme třemi mincemi. Jaká je pravděpodobnost, že alespoň v jednom hodu padnou tři líce? Řešení. Uvážíme-li, že při opakovaní téhož pokusu jsou jednotlivé výsledky nezávislé, a označíme-li pro i ∈ {1, . . . , 12} jako Ai jev „při i-tém hodu padly tři líce“, určujeme P ( 12∪ i=1 Ai ) = 1 − (1 − P(A1)) · (1 − P (A2)) · · · (1 − P(A12)). Pro každé i ∈ {1, . . . , 12} je však P(Ai) = 1/8, neboť na každé ze tří mincí padne líc s pravděpodobností 1/2 nezávisle na tom, zda na ostatním mincích padl líc, příp. rub. Nyní již můžeme napsat výsledek 1 − (7 8 )12 . 1.149. Z deseti karet, z nichž právě jedna je eso, namátkou vybereme kartu a vrátíme ji zpět. Kolikrát takový výběr musíme provést, aby pravděpodobnost, že aspoň jednou vybereme eso, byla větší než 0, 9? Řešení. Označme Ai jev „při i-tém výběru bylo vytaženo eso“. Neboť jednotlivé jevy Ai jsou (stochasticky) nezávislé, víme, že P ( n∪ i=1 Ai ) = 1 − (1 − P(A1)) · (1 − P(A2)) · · · (1 − P(An)) pro každé n ∈ N. Připomeňme, že hledáme n ∈ N takové, aby platilo P ( n∪ i=1 Ai ) = 1 − (1 − P(A1)) · (1 − P(A2)) · · · (1 − P(An)) > 0, 9. Zřejmě je P(Ai) = 1/10 pro libovolné i ∈ N. Proto stačí vyřešit nerovnici 1 − ( 9 10 )n > 0, 9, ze které lze vyjádřit n > loga 0,1 loga 0,9 , kde a > 1. Vyčíslením potom zjistíme, že daný pokus musíme provést alespoň dvaadvacetkrát. CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM 59 1.150. Texas hold’em. Nyní spočítejme několik jednoduchých úloh týkajících se populární karetní hry Texas hold’em, jejíž pravidla zde nebudeme uvádět (pokud je čtenář nezná, snadno je dohledá na internetu). Jaká je pravděpodobnost, že i) jako startovní kominaci dostanu dvojici stejných symbolů? ii) ve své startovní dvojici karet budu mít eso? iii) na konci budu mít jednu z šesti nejlepších kombinací karet? iv) vyhraji, pokud držím v ruce eso a trojku (libovolné barvy), na flopu je eso a dve dvojky a na turnu je třetí trojka a všechny tyto čtyři karty mají různou barvu? (poslední karta river ještě není otočena) Řešení. i) Počet různých symbolů je 13 a jsou vždy čtyři (pro každou barvu jeden). Proto je počet dvojic se stejnými symboly 13 (4 2 ) = 78. Počet všech možných dvojic je (13.4 2 ) = 1326. Pravděpodobnost stejných symbolů je tedy 1 17 . = 0, 06. ii) Jedna karta je eso, to jsou čtyři možnosti a druhá je libovolná, to je 51 možností. Dvojice s oběma esama, kterých je (4 2 ) = 6 jsme ale takto započítali dvakrát. Dostáváme tedy 4.51 − 6 = 198 dvojic a pravděpodobnost je 198 1326 . = 0, 15. iii) Spočítáme pravděpodobnosti jednotlivých nejlepších kombinací: ROYAL FLUSH: Takové kobinace jsou zřejmě jen čtyři - pro každou barvu jedna. Všech kombinací pěti karet je (52 5 ) = 2598960. Pravděpodobnost je tak rovna asi 1, 5.10−6 . Hodně malá :) STRAIGHT FLUSH: Postupka, která končí nejvyšší kartou v rozmezí 6 až K, tj. 8 možností pro každou barvu. Dostáváme 32 2598960 . = 1, 2.10−5 . POKER: Čtyři stejné symboly - 13 možností (pro každý symbol jedna). Pátá karta může být libovolná, to znamená 48 možností. Odtud: 624 2598960 . = 2, 4.10−4 . FULL HOUSE: Tři stejné symboly 13 (4 3 ) = 52 možností a k tomu dva stejné symboly je 12 (4 2 ) = 72 možností. Pravděpodobnost je 3744 2598960 . = 1, 4.10−3 . FLUSH: Všech pět karet stejné barvy znamená 4 (13 5 ) = 5148 možností a pravděpodobnost je pak 5148 2598960 . = 2.10−3 . STRAIGHT: Nejvyšší katrta postupky je v rozmezí 6 až A, tj. 9 možností. Barva každé karty je pak libovolná, tj. dohromady 9.45 = 9216 možností. Zde jsme ale započítali jak straight flush, tak i royal flush. Ty je potřeba odečíst. Pro zjištění pravděpodobnosti nějaké z šesti nejlepších kombinací to ale ani nemusíme dělat, jen první dvě kombinace nezapočteme. Celkově tedy dostáváme pravděpodobnost zhruba 3, 5.10−3 + 2.10−3 + 1, 4.10−3 + 2, 4.10−4 = 7, 14.10−3 . iv) Evidentně je situace hodně dobrá a proto bude lepší spočítat nepříznivé situace, tj. kdy bude mít soupeř lepší kombinaci. Já mám v tuto chvíli full house ze dvou es a tří dvojek. Jediná kombinace, která by mmě mohla porazit v tuto chvíli je buď full house ze tří es a dvou dvojek nebo dvojkový poker. To znamená, že soupeř by určitě musel držet eso nebo poslední dvojku. Pokud drží dvojku a libovolnou jinou kartu, pak určitě vyhraje bez ohledu na kartu na riveru. Kolik je možností pro tuto kartu ke dvojce? 3 + 4 + · · · + 4 + 2 = 45 (jednu trojku a dvě esa už mít v ruce nemůže). Včech zbylých kombinací je (46 2 ) = 1035 a pravděpodobnost takové prohry je tak 0,043. Pokud drží v ruce eso, pak se může stát následující. Pokud drží 6. RELACE A ZOBRAZENÍ 60 6. ZOBRAZENÍ A RELACE (zbylá) dvě esa, tak opět vyhraje, pokud na riveru nepříjde dvojka - pak by byl split poker. Pravděpodobnost (podmíněná) mé prohry je tedy 1 1035 .43 44 . = 10−3 . pokud drží soupeř v ruce eso a nějakou jinou kartu, než 2 a A, tak následuje remíza bez ohledu na river. Celková pravděpodobnost výhry je tak skoro 96 %. 1.151. Zjistěte pravděpodobnost, že při hodu dvěma kostkami padla alespoň na jedné kostce čtyřka, jestliže padl součet 7. Řešení. Příklad je nejsnáze řešitelný jednoduchým výčtem možností – těch je 7, z čehož právě 2 jsou příznivé vyšetřovanému jevu. Správná odpověď je 2/7. 1.152. Hodíme dvěma kostkami. Určete podmíněnou pravděpodobnost, že na první kostce padla pětka za podmínky, že padl součet 9. Na základě tohoto výsledku rozhodněte o nezávislosti jevů „na první kostce padla pětka“ a „padl součet 9“. Řešení. Označíme-li jev „na první kostce padla pětka“ jako A a jev „padl součet 9“ jako H, pak platí P(A|H) = P(A∩H) P(H) = 1 36 4 36 = 1 4 . Uvědomme si, že součet 9 můžeme získat tak, že na první kostce padne 3 a na druhé 6, na první 4 a na druhé 5, na první 5 a na druhé 4 nebo na první 6 a na druhé 3. Z těchto čtyř (stejně pravděpodobných) výsledků jevu A vyhovuje právě jeden. Protože pravděpodobnost jevu A je očividně 1/6 ̸= 1/4, nejsou uvedené jevy nezávislé. 1.153. Mějme balíček 32 karet. Vytáhneme-li dvakrát po jedné kartě, nalezněte pravděpodobnost, že druhá tažená karta bude eso, když první kartu vrátíme, a také tehdy, když ji do balíčku nevrátíme (druhou kartu potom vybíráme z balíčku 31 karet). Řešení. Pokud kartu do balíčku vrátíme, zjevně opakujeme pokus, který má 32 možných (stejně pravděpodobných) výsledků, přičemž právě 4 z nich vyhovují námi uvažovanému jevu. Vidíme, že tomto případě je hledaná pravděpodobnost 1/8. Ve druhém případě, kdy první kartu do balíčku nevrátíme, je ovšem hledaná pravděpodobnost stejná. Postačuje např. uvážit, že při vytažení postupně všech karet je pravděpodobnost vytažení esa jako první karty totožná s pravděpodobností, že druhá vytažená karta bude eso. Pochopitelně bylo možné využít toho, že máme zavedenu podmíněnou pravděpodobnost. Tak bychom mohli obdržet 4 32 · 3 31 + 28 32 · 4 31 = 1 8 . 1.154. Uvažujme rodiny se dvěma dětmi a pro jednoduchost předpokládejme, že všechny možnosti v množině = {kk, kh, hk, hh}, kde k značí „kluk“ a h znamená „holka“ při zohlednění stáří dětí, jsou stejně pravděpodobné. Zaveďme náhodné jevy H1 – rodina má kluka, A1 – rodina má 2 kluky. Vypočtěte P (A1|H1). Podobně uvažujme rodiny se třemi dětmi, kdy je = {kkk, kkh, khk, hkk, khh, hkh, hhk, hhh}. CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM 61 Jestliže H2 – rodina má kluka i holku, A2 – rodina má nejvýše jednu holku, rozhodněte o nezávislosti náhodných jevů A2 a H2. Řešení. Uvážením, které ze čtyř prvků množiny (ne)vyhovují jevu A1, resp. H1, lehce získáváme P (A1|H1) = P (A1∩H1) P(H1) = P(A1) P(H1) = 1 4 3 4 = 1 3 . Dále máme zjistit, zda platí P (A2 ∩ H2) = P (A2) · P (H2) . Opět si stačí pouze uvědomit, že jevu A2 vyhovují právě prvky kkk, kkh, khk, hkk množiny , jevu H2 prvky kkh, khk, hkk, khh, hkh, hhk a jevu A2 ∩ H2 prvky kkh, khk, hkk. Odtud plyne P (A2 ∩ H2) = 3 8 = 4 8 · 6 8 = P (A2) · P (H2) , což znamená, že jevy A2 a H2 jsou nezávislé. 1.155. Pětkrát jsme hodili mincí. Pokud padl líc, dali jsme do klobouku bílou kuličku. Když padl rub, dali jsme do téhož klobouku kuličku černou. Vyjádřete pravděpodobnost, že v klobouku je více černých kuliček než bílých, je-li v klobouku alespoň jedna černá kulička. Řešení. Zaveďme jevy A – v klobouku je víc černých kuliček než bílých, H – v klobouku je aspoň jedna černá kulička. Chceme stanovit P (A|H). Uvědomme si, že pravděpodobnost P ( HC ) opačného jevu k jevu H je 2−5 a že pravděpodobnost jevu A je stejná jako pravděpodobnost P ( AC ) jevu opačného (v klobouku je víc bílých kuliček). Nutně tedy P(H) = 1 − 2−5 , P(A) = 1/2. Dále je P(A ∩ H) = P(A), neboť jev H obsahuje jev A (jev A má za důsledek jev H). Celkem jsme obdrželi P(A|H) = P(A∩H) P(H) = 1 2 1− ( 1 2 )5 = 16 31 . 1.156. V osudí je 9 červených a 7 bílých koulí. Postupně vytáhneme 3 koule (bez vracení). Určete pravděpodobnost, že první dvě budou červené a třetí bílá. Řešení. Příklad budeme řešit pomocí věty o násobení pravděpodobností. Nejprve požadujeme vytažení červené koule, což se podaří s pravděpodobností 9/16. Pokud byla poprvé vytažena červená koule, při druhém tahu vytáhneme znovu červenou kouli s pravděpodobností 8/15 (v osudí je 15 koulí, z toho 8 červených). Konečně, pokud byla dvakrát vytažena červená koule, pravděpodobnost, že potom bude vytažena bílá, je 7/14 (v osudí je 7 bílých koulí a 7 červených koulí). Celkem dostáváme 9 16 · 8 15 · 7 14 = 0, 15. 6. RELACE A ZOBRAZENÍ 62 6. ZOBRAZENÍ A RELACE 1.157. V osudí je 10 koulí, a to 5 černých a 5 bílých. Postupně budeme losovat po jedné kouli, přičemž vytaženou kouli nevrátíme zpět. Stanovte pravděpodobnost, že nejprve vytáhneme bílou, poté černou, pak bílou a v posledním čtvrtém tahu opět bílou kouli. Řešení. Použijeme větu o násobení pravděpodobností. V prvním tahu vytáhneme bílou kouli s pravděpodobností 5/10, poté černou s pravděpodobností 5/9, následně bílou s pravděpodobností 4/8 a na závěr bílou s pravděpodobností 3/7. Dohromady to dává 5 10 · 5 9 · 4 8 · 3 7 = 5 84 . 1.158. Z balíčku 32 karet náhodně vybereme šestkrát po sobě po jedné kartě, a to bez vracení. Spočtěte pravděpodobnost, že první král bude vybrán až při šestém výběru. Řešení. Podle věty o násobení pravděpodobností je výsledek 28 32 · 27 31 · 26 30 · 25 29 · 24 28 · 4 27 . = 0, 0723. 1.159. Jaká je pravděpodobnost, že součet dvou náhodně zvolených kladných čísel menších než 1 bude menší než 3/7? Řešení. Je vidět, že jde o jednoduchý příklad na geometrickou pravděpodobnost, kdy jako základní prostor se nabízí čtverec s vrcholy [0, 0], [1, 0], [1, 1], [0, 1] (volíme dvě čísla mezi 0 a 1). Zajímá nás pravděpodobnost jevu udávajícího, že pro náhodně zvolený bod [x, y] v tomto čtverci bude platit x + y < 3/7; tj. pravděpodobnost toho, že zvolený bod se bude nacházet uvnitř trojúhelníku A s vrcholy [0, 0], [3/7, 0], [0, 3/7]. Nyní již snadno vyčíslíme P(A) = vol A vol = ( 3 7 )2 /2 1 = 9 98 . 1.160. Nechť je náhodně rozlomena tyč na tři části. Stanovte pravděpodobnost, že délka druhé (prostřední) části bude větší než dvě třetiny délky tyče před jejím rozlomením. Řešení. Nejprve si označme délku uvažované tyče jako d. Rozlomení tyče ve dvou místech je dáno volbou bodů, kde ji zlomíme. Označme jako x bod, ve kterém je první (např. blíže nějakému předmětu) zlom, a jako x + y bod, ve kterém je druhý zlom. To nám říká, že za základní prostor lze považovat množinu {[x, y]; x ∈ (0, d), y ∈ (0, d − x)}, tj. trojúhelník s vrcholy v bodech [0, 0], [d, 0], [0, d]. Délka prostřední části je dána hodnotou y. Požadavek ze zadaní lze nyní zapsat v jednoduchém tvaru y > 2d/3, což odpovídá trojúhelníku s vrcholy [0, 2d/3], [d/3, 2d/3], [0, d]. Obsahy uvažovaných pravoúhlých rovnoramenných trojúhelníků jsou d2 /2 a (d/3)2 /2, a proto je hledaná pravděpodobnost d2 32·2 d2 2 = 1 9 . CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM 63 1.161. Tyč o délce 2 m je náhodně rozřezána na tři části. Nalezněte pravděpodobnost jevu, že třetí část měří méně než 1, 5 m. Řešení. Tento příklad je na užití geometrické pravděpodobnosti, kdy hledáme pravděpodobnost toho, že součet délek prvních dvou částí je větší než čtvrtina délky tyče. Určeme pravděpodobnost opačného jevu, tj. pravděpodobnost, když budou náhodně (a nezávisle na sobě) zvolena dvě místa, ve kterých bude tyč rozřezána, že budou obě v první čtvrtině tyče. Pravděpodobnost tohoto jevu je 1/42 , neboť pravděpodobnost výběru místa v první čtvrtině tyče je zřejmě 1/4 a tento výběr se (nezávisle) jednou opakuje. Pravděpodobnost hledaného (opačného) jevu je tak 15/16. 1.162. Z Brna vyrazí náhodně někdy mezi polednem a čtvrtou hodinou odpolední Honza autem do Prahy a opačným směrem někdy ve stejném intervalu autem Martin. Oba si dávají půl hodiny pauzu v motorestu v polovině cesty (přístupném pro oba směry). Jaká je pravděpodobnost, že se tam potkají, jezdí-li Honza rychlostí 150 km/h, a Martin 100 km/h? (Vzdálenost Brno-Praha je 200 km) Řešení. Označíme-li dobu odjezdu Martina x a dobu odjezdu Honzy y a pro menší výskyt zlomků v následujících výpočtech zvolíme za jednotku deset minut, tak stavovým prostorem bude čtverec 24 × 24. Doba příjezdu Martina do motorestu je x + 6, do příjezdu Honzy (x + 4). Stejně jako v předchozím příkladu to, že se v motorestu potkají je ekvivalentní tomu, že doby jejich příjezdu se neliší o více než o půl hodiny, tedy |(x + 6) − (y + 4)| ≤ 3. Tato podmínka nám pak ve stavovém čtverci vymezuje oblast o obsahu 242 − 1 2 (232 + 192 ) (viz obr.) a hledaná pravděpodobnost je p = 242 − 1 2 (232 + 192 ) 242 = 131 576 . = 0, 227 1.163. Mirek a Marek chodí na obědy do univerzitní menzy. Menza má otevřeno od 11h do 14h. Každý z nich stráví na obědě půl hodiny a dobu příchodu (mezi 11h a 14h) si vybírá náhodně. Jaká je pravděpodobnost, že se na obědě v daný den potkají, sedávají-li oba u stejného stolu? Řešení. Prostor všech možných jevů je čtverec 3 × 3. Označíme-li x dobu příchodu Mirka a y dobu příchodu Marka, tak tito se potkají, právě když |x − y| ≤ 1/2. Tato nerovnost vymezuje ve čtverci možných událostí oblast, jejíž obsah je roven 11/36 obsahu čtverce. Tomuto zlomku je tedy rovna i hledaná pravděpodobnost. 1.164. Mirek vyjede náhodně mezi desátou hodinou dopolední a osmou hodinou večerní z Brna do Prahy. Marek vyjede náhodně ve stejném intervalu z Prahy do Brna. Oběma trvá cesta 2h. Jaká je pravděpodobnost, že se po cestě potkají (jezdí po stejné trase). Cesta trvá oběma 2h. 6. RELACE A ZOBRAZENÍ 64 6. ZOBRAZENÍ A RELACE Řešení. Řešíme naprosto analogicky jako v předchozím příkladě. Prostor všech možných jevů je čtverec 10×10, Mirek vyjíždějící v čase x, potká Marka vyjíždějícího v čase y právě když |x−y| ≤ 2. Hledaná pravděpodobnost je p = 36 100 = 9 25 = 0, 36. 1.165. Dvoumetrová tyč je náhodně rozdělena na tři díly. Určete pravděpodobnost, že ze vzniklých dílů půjde sestavit trojúhelník. Řešení. Rozdělení tyče je dáno stejně jako v předchozím příkladě body řezu x a y a jevovým prostorem je opět čtverec 2 × 2. Aby z částí bylo možno sestavit trojúhelník, musejí jejich délky splňovat tzv. trojúhelníkové nerovnosti, tedy součet délek libovolných dvou částí musí být větší než délka třetí části. Vzhledem k tomu, že součet délek je roven 2 m, je tato podmínka ekvivalentní podmínce, že každá s částí musí být menší než 1 m. To pomocí řezů x a y vyjádříme tak, že nesmí platit současně x ≤ 1 a y ≤ 1 nebo současně x ≥ 1 a y ≥ 1 (odpovídá podmínkám, že krajní díly tyče jsou menší než 1), navíc |x − y| ≤ 1 (prostřední díl musí být menší než jedna). Tyto podmínky splňuje vyšrafovaná oblast na obrázku a jak snadno nahlédneme, její obsah je 1/4. 1.166. Je rovnice (a) 4x1 − √ 3x2 = 3, x1 − 2 √ 7x2 = −2; (b) 4x1 − √ 3x2 = 16, x1 − 2 √ 7x2 = −7; (c) 4x1 + 2x2 = 7, −2x1 − x2 = −3 CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM 65 jednoznačně řešitelná (má právě 1 řešení)? Řešení. Soustava lineárních rovnic je jednoznačně řešitelná právě tehdy, když je nenulový determinant matice určené koeficienty na levé straně soustavy. Zvláště řečeno, absolutní členy (čísla na pravé straně) neovlivňují jednoznačnost řešení soustavy. Musíme tedy ve variantách (a) a (b) dostat stejnou odpověď. Protože 4 − √ 3 1 −2 √ 7 = 4 · ( −2 √ 7 ) − ( − √ 3 · 1 ) ̸= 0, 4 2 −2 −1 = 4 · (−1) − (2 · (−2)) = 0, mají soustavy ve variantách (a) a (b) právě 1 řešení a poslední soustava nikoliv. Vynásobíme-li druhou rovnici v (c) číslem −2, vidíme, že tato soustava nemá řešení. 1.167. Spočítejte obsah rovnoběžníku s vrcholy v bodech [5, 5], [6, 8] a [6, 9]. Řešení. Přestože takový rovnoběžník není zadán jednoznačně (není uveden čtvrtý vrchol), trojúhelník s vrcholy [5, 5], [6, 8] a [6, 9] musí být nutně polovinou každého rovnoběžníku s těmito třemi vrcholy (jedna ze stran trojúhelníku se stane úhlopříčkou rovnoběžníku). Proto je hledaný obsah vždy roven determinantu 6 − 5 6 − 5 8 − 5 9 − 5 = 1 1 3 4 = 1 · 4 − 1 · 3 = 1. 6. RELACE A ZOBRAZENÍ 66 6. ZOBRAZENÍ A RELACE 1.168. Výčtem prvků zadejte S ◦ R, je-li R = {(2, 4), (4, 4), (4, 5)} ⊂ N × N, S = {(3, 1), (3, 2), (3, 5), (4, 1), (4, 4)} ⊂ N × N. Řešení. Uvážením všech výběrů dvou uspořádaných dvojic (2, 4), (4, 1); (2, 4), (4, 4); (4, 4), (4, 1); (4, 4), (4, 4) splňujících, že druhá složka první uspořádané dvojice, která je prvkem R, je rovna první složce druhé uspořádané dvojice, která je prvkem S, dostáváme S ◦ R = {(2, 1), (2, 4), (4, 1), (4, 4)}. 1.169. Nechť je dána binární relace R = {(0, 4), (−3, 0), (5, π), (5, 2), (0, 2)} mezi množinami A = Z a B = R. Vyjádřete R−1 a R ◦ R−1 . Řešení. Ihned vidíme, že R−1 = {(4, 0), (0, −3), (π, 5), (2, 5), (2, 0)}. Odtud pak dále R ◦ R−1 = {(4, 4), (0, 0), (π, π), (2, 2), (4, 2), (π, 2), (2, π), (2, 4)}. 1.170. Rozhodněte, zda je relace R určená podmínkou (a) (a, b) ∈ R ⇐⇒ |a| < |b|; (b) (a, b) ∈ R ⇐⇒ |a| = |2b| na množině celých čísel Z tranzitivní. Řešení. V prvním případě relace R tranzitivní je, protože platí | a | < | b |, | b | < | c | ⇒ | a | < | c |. Ve druhém případě relace R tranzitivní není. Stačí např. uvážit, že (4, 2), (2, 1) ∈ R, (4, 1) /∈ R. 1.171. Najděte všechny relace na M = {1, 2}, které nejsou antisymetrické. Které z nich jsou tranzi- tivní? Řešení. Hledané relace, jež nejsou antisymetrické, jsou čtyři. Jsou to právě ty podmnožiny {1, 2} × {1, 2}, které obsahují prvky (1, 2), (2, 1) (jinak nemůže být podmínka antisymetrie porušena). Z těchto čtyř je tranzitivní pouze jediná relace {(1, 1), (1, 2), (2, 1), (2, 2)} = M × M, protože nezahrnutí dvojic (1, 1) a (2, 2) do tranzitivní relace by znamenalo, že nemůže obsahovat zároveň (1, 2) a (2, 1). CHAPTER 1. KRŮČKY K MATEMATICKÝM PROBLÉMŮM 67 1.172. Existuje relace ekvivalence, která je současně relací uspořádání, na množině všech přímek v rovině? Řešení. Relace ekvivalence (příp. relace uspořádání) musí být reflexivní, a proto každá přímka musí být v relaci sama se sebou. Dále požadujeme, aby hledaná relace byla symetrická (ekvivalence) a zároveň antisymetrická (uspořádání). To dává, že přímka může být v relaci pouze sama se sebou. Zavedeme-li ovšem relaci tak, že dvě přímky jsou v relaci právě tehdy, když jsou totožné, dostaneme „velmi přirozenou“ relaci ekvivalence i relaci uspořádání. Stačí si uvědomit, že je triviálně tranzitivní. Hledanou relací je právě identické zobrazení množiny všech přímek v rovině. 1.173. Určete, zda je relace R = {(k, l) ∈ Z × Z; | k | ≥ | l |} na množině Z ekvivalence, uspořádání. Řešení. Relace R není ekvivalencí: není symetrická (kupř. (6, 2) ∈ R, (2, 6) /∈ R); není uspořádáním: není antisymetrická (mj. (2, −2) ∈ R, (−2, 2) ∈ R). 1.174. Ukažte, že průnik libovolných relací ekvivalence na libovolně dané množině X je rovněž relace ekvivalence a že sjednocení dvou relací uspořádání na X nemusí být relace uspořádání. Řešení. Postupně uvidíme, že průnik relací ekvivalence je reflexivní, symetrický a tranzitivní. Všechny relace ekvivalence na X musí obsahovat dvojici (x, x) pro každé x ∈ X, a proto ji musí obsahovat také daný průnik. Pokud v průniku ekvivalencí je prvek (x, y), musí v něm být rovněž prvek (y, x) (stačí využít toho, že každá ekvivalence je symetrická). To, že do průniku ekvivalencí náleží prvky (x, y) a (y, z), znamená, že se jedná o prvky každé z ekvivalencí. Z tranzitivnosti všech jednotlivých ekvivalencí již vyplývá, že do průniku náleží také prvek (x, z). Zvolíme-li X = {1, 2} a relace uspořádání R1 = {(1, 1), (2, 2), (1, 2)}, R2 = {(1, 1), (2, 2), (2, 1)} na X, dostáváme relaci R1 ∪ R2 = {(1, 1), (2, 2), (1, 2), (2, 1)}, která zřejmě není antisymetrická, a tedy ani uspořádáním. 1.175. Na množině M = {1, 2, . . . , 19, 20} je zavedena relace ekvivalence ∼ tak, že a ∼ b pro libovolná a, b ∈ M právě tehdy, když první cifry čísel a, b jsou stejné. Sestrojte rozklad daný touto ekvivalencí. Řešení. Dvě čísla z množiny M jsou ve stejné třídě ekvivalence, právě když jsou spolu v relaci (první cifra je stejná). Rozklad jí určený se tedy skládá z množin {1, 10, 11, . . . , 18, 19}, {2, 20}, {3}, {4}, {5}, {6}, {7}, {8}, {9}. 1.176. Je dán rozklad se dvěma třídami {b, c}, {a, d, e} množiny X = {a, b, c, d, e}. Napište relaci ekvivalence R na množině X příslušnou tomuto rozkladu. Řešení. Ekvivalence R je určena tím, že v relaci jsou spolu ty prvky, které jsou ve stejné třídě rozkladu, a to v obou pořadích (R musí být symetrická) a každý sám se sebou (R musí být reflexivní). Proto R obsahuje právě 6. RELACE A ZOBRAZENÍ 68 6. ZOBRAZENÍ A RELACE (a, a), (b, b), (c, c), (d, d), (e, e), (b, c), (c, b), (a, d), (a, e), (d, a), (d, e), (e, a), (e, d). KAPITOLA 2 Elementární lineární algebra V minulé kapitole jsme se snad rozehřáli s relativně jednoduchými úlohami, k jejichž řešení nebylo potřeba složitých nástrojů. Vystačili jsme si přitom se sčítáním a násobením skalárů. V této a dalších kapitolách se postupně budeme věnovat jednotlivým tématům souvisleji. Hned tři kapitoly budou věnovány nástrojům pro práci s daty, kdy operace spočívají v obzvlášť jednoduchých úkonech se skaláry, jen je těch skalárů povíce naráz. Hovoříme o „lineárních objektech“ a „lineární algebře“. Jakkoliv to teď může vypadat jako hodně speciální nástroj, uvidíme později, že složitější objekty a závislosti stejně studujeme hlavně pomocí jejich „lineárních přiblížení“. V této kapitole budeme pracovat přímo s konečnými posloupnostmi skalárů. Takové se objevují v praktických úlohách všude, kde máme objekty popisovány pomocí několika parametrů. Nedělejme si přitom problémy s představou, jak vypadá prostor s více než třemi „souřadnicemi“. Smiřme se se skutečností, že malovat si budeme umět jednu, dvě nebo tři dimenze, ale představovat ty obrázky mohou jakýkoliv jiný počet. A když budeme sledovat jakýkoliv parametr u třeba 500 studentů (např. jejich váhu nebo věk), budou naše data mít hned zrovna 500 položek a budeme s nimi chtít pracovat. Naším cílem bude vytvořit nástroje, které budou dobře fungovat nezávisle na skutečném počtu těchto položek. Také se neděsme slovních spojení jako pole či okruh skalárů K. Prostě si můžeme představit jakýkoliv konkrétní číselný obor. Okruhy skalárů pak zahrnují i celá čísla Z a všechny zbytkové třídy, zatímco mezi poli jsou pouze R, Q, C a zbytkové třídy Zk s prvočíselným k. Zvláštní je mezi nimi Z2, kde ze vztahu x = −x nemůžeme usoudit, že x = 0, zatímco u všech ostatních číselných oborů tomu tak je. Většinou se o vektorech hovoří pouze ve spojení s poli skalárů, protože obecná teorie je při existenci neivertibilních nenulových skalárů nesrovnatelně složitější. Jen v prvních dvou částech této kapitoly budeme pracovat s vektory a maticemi v kontextu konečných poslouností skalárů a tam bude zajímavé si i třeba případu celých čísel povšimnout. Bude přitom snad pěkně vidět, jak silné výsledky lze důslednným formálním uvažováním odvodit. 1. Vektory a matice 2.1. Vektory nad skaláry. Prozatím budeme vektorem rozumět uspořádanou n-tici skalárů z K, kde pevně zvolené n ∈ N budeme nazývat dimenzí. 69 KAPITOLA 2 Elementární lineární algebra Na vektorové prostory půjdeme od lesa. Začneme s něčím známým, totiž soustavami lineárních rovnic. I za nimi jsou totiž skryty vektorové prostory. 2.1. A teď vám to pěkně natřeme. Firma zabývající se velkoplošnými nátěry si objednala 810 litrů barvy, která má obsahovat stejné množství červené, zelené a modré barvy (tj. 810 litrů černé barvy). Obchod může splnit tuto zakázku smícháním běžně prodávaných barev (má skladem jejich dostatečné zásoby), a to • načervenalé barvy – obsahuje 50 % červené, 25 % zelené a 25 % modré barvy; • nazelenalé barvy – obsahuje 12,5 % červené, 75 % zelené a 12,5 % modré barvy; • namodralé barvy – obsahuje 20 % červené, 20 % zelené a 60 % modré barvy. Kolik litrů od každé z uskladněných barev se musí smíchat, aby byly splněny požadavky zákazníka? Řešení. Označme jako • x – množství (v litrech) načervenalé barvy, které se použije; • y – množství (v litrech) nazelenalé barvy, které se použije; • z – množství (v litrech) namodralé barvy, které se použije. Smícháním barev chceme získat barvu, která bude obsahovat 270 litrů červené barvy. Uvědomme si, že načervenalá barva obsahuje 50 % červené, nazelenalá obsahuje 12,5 % červené a namodralá 20 % červené barvy. Musí tudíž platit 0, 5x + 0, 125y + 0, 2z = 270. Analogicky požadujeme (pro zelenou a modrou barvu) 0, 25x + 0, 75y + 0, 2z = 270, 0, 25x + 0, 125y + 0, 6z = 270. Nyní můžeme postupovat dvěma způsoby. Buď budeme postupně vyjadřovat proměnné pomocí ostatních (z první rovnice je x = 540 − 0, 25y − 0, 4z, dosadíme za x do druhé a třetí rovnice a dostaneme dvě lineární rovnice o dvou neznámých 2, 75y + 0, 4z = 540 a 0, 25y + 2z = 540. Ze druhé rovnice vyjádříme z = 270 − 0, 125y a 1. VEKTORY A MATICE Skaláry umíme sčítat a násobit. Vektory budeme také sčítat, násobit však vektor budeme umět jen skalárem. To odpovídá představě, kterou jsme již viděli v rovině R2 , kde sčítání odpovídalo skládání vektorů coby šipek výcházejících z počátku a násobení skalárem pak jejich patřičnému nataho- vání. Násobení vektoru u = (a1, . . . , an) skalárem b tedy definujeme tak, že každý prvek n-tice u vynásobíme stejným skalárem b a také sčítání vektorů definujeme po složkách.. To znamená Základní operace s vektory u + v = (a1, . . . , an) + (b1, . . . , bn) = (a1 + b1, . . . , an + bn) b · u = b · (a1, . . . , an) = (b · a1, . . . , b · an). Pro sčítání vektorů a násobení vektorů skaláry budeme používat stále stejné symboly jako u skalárů samotných, tj. symboly plus a buď tečku nebo prosté zřetězení znaků. Konvence zápisu vektorů. Nebudeme, na rozdíl od mnoha jiných učebnic, v textu používat pro vektory žádné speciální značení a ponecháváme na čtenáři, aby udržoval svoji pozornost přemýšlením o kontextu. Pro skaláry ale spíše budeme používat písmena ze začátku abecedy a pro vektory od konce (prostředek nám zůstane na indexy proměných či komponent a také pro sčítací indexy v součtech). Často budeme požadovat, aby skaláry byly z nějakého pole, viz 1.1, ale v této kapitole budeme vesměs pracovat s operacemi, které tento přepoklad nepotřebují. V literatuře se pak většinou místo o vektorových prostorech hovoří o modulech nad okruhy. U obecné teorie se ale v příští kapitole již zcela omezíme na pole skalárů. Pro sčítání vektorů v Kn zjevně platí (KG1)–(KG4) s nulovým prvkem 0 = (0, . . . , 0) ∈ Kn . Schválně zde používáme i pro nulový prvek stejný symbol jako pro nulový prvek skalárů. Vlastnosti vektorů Pro všechny vektory v, w ∈ Kn a skaláry a, b ∈ K platí a · (v + w) = a · v + a · w(V1) (a + b) · v = a · v + b · v(V2) a · (b · v) = (a · b) · v(V3) 1 · v = v(V4) Vlastnosti vektorů (V1)–(V4) se pro Kn snadno ověří pro kterýkoliv okruh skalárů K, protože při ověřování vždy používáme pro jednotlivé souřadnice vektorů pouze vlastnosti skalárů uvedené v 1.1 a 1.3. Budeme takto pracovat např. s Rn , Qn , Cn , ale také Zn , (Zk)n , n = 1, 2, 3, . . .. 70 dosazením do první dostáváme 2, 7y = 432, neboli y = 160, odkud z = 270−0, 125·160 = 250 a x = 540−0, 25·160+0, 4·250 = 400. Druhým způsobem je zapsat si soustavu do matice, jejíž první řádek bude tvořen koeficienty u neznámých v první rovnici, druhý koeficienty ve druhé rovnici a třetí ve třetí. Je tedy matice soustavy   0, 5 0, 125 0, 2 0, 25 0, 75 0, 2 0, 25 0, 125 0, 6   , rozšířenou matici soustavy potom získáme z matice soustavy připsáním sloupce pravých stran jednotlivých rovnic v systému:   0, 5 0, 125 0, 2 270 0, 25 0, 75 0, 2 270 0, 25 0, 125 0, 6 270   Jejím postupným upravováním pomocí tzv. elementárních řádkových úprav (odpovídají ekvivalentním úpravám rovnic, více viz ?? pak dostáváme:   0, 5 0, 125 0, 2 270 0, 25 0, 75 0, 2 270 0, 25 0, 125 0, 6 270   ∼   1 0, 25 0, 4 540 1 3 0, 8 1 080 1 0, 5 2, 4 1 080   ∼   1 0, 25 0, 4 540 0 2, 75 0, 4 540 0 0, 25 2 540   ∼   1 0, 25 0, 4 540 0 11 1, 6 2 160 0 1 8 2 160   ∼   1 0, 25 0, 4 540 0 1 8 2 160 0 11 1, 6 2 160   ∼   1 0, 25 0, 4 540 0 1 8 2 160 0 0 −86, 4 −21 600   . A opět zpětně vypočítáme z = −21 600 −86, 4 = 250, y = 2 160 − 8 · 250 = 160, x = 540 − 0, 4 · 250 − 0, 25 · 160 = 400. Je tedy potřeba smísit po řadě 400 l, 160 l, 250 l uvedených barev. Čím více máme v soustavě rovnic, tím je druhý způsob řešení zpravidla výhodnější. 2.2. Vypočtěte x1 + 2x2 + 3x3 = 2, 2x1 − 3x2 − x3 = −3, −3x1 + x2 + 2x3 = −3. Řešení. Zadanou soustavu lineárních rovnic zapíšeme ve tvaru rozšířené matice   1 2 3 2 2 −3 −1 −3 −3 1 2 −3   , CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA 2.2. Matice nad skaláry. O něco složitějším objektem, který budeme při práci s vektory používat, jsou matice. Matice nad skaláry Maticí typu m/n nad skaláry K rozumíme obdélníkové schéma A =      a11 a12 . . . a1n a21 a22 . . . a2n ... ... am1 am2 . . . amn      kde aij ∈ K pro všechny 1 ≤ i ≤ m, 1 ≤ j ≤ n. Matici A s prvky aij značíme také A = (aij ). Vektory (ai1, ai2, . . . , ain) ∈ Kn nazýváme (i–té) řádky matice A, i = 1, . . . , m, vektory (a1j , a2j , . . . , amj ) ∈ Km nazýváme (j–té) sloupce matice A, j = 1, . . . , n. Matici můžeme také chápat jako zobrazení A : {1, . . . , m} × {1, . . . , n} → K, kde A(i, j) = aij . Matice typu 1/n nebo n/1 jsou vlastně právě vektory v Kn . I obecné matice lze chápat jako vektory v Km·n , prostě zapomeneme na řádkování. Zejména tedy je definováno sčítání matic a násobení matic skaláry: A + B = (aij + bij ), a · A = (a · aij ) kde A = (aij ), B = (bij ), a ∈ K. Matice −A = (−aij ) se nazývá matice opačná k matici A a matice 0 =    0 . . . 0 ... ... 0 . . . 0    se nazývá nulová matice. Zapomenutím řádkování tak získáme následující tvrzení, že matice jsou jen specificky zapsané vektory: Tvrzení. Předpisy pro A + B, a · A, −A, 0 zadávají na množině všech matic typu m/n operace sčítání a násobení skaláry splňující axiomy (V1)–(V4). 2.3. Matice a rovnice. Velmi častý nástroj pro popis nějakých matematických modelů jsou systémy lineárních rovnic. Právě matice lze vhodně využít pro jejich zápis. Uvažme následující systém m rovnic v n proměnných: a11x1 + a12x2 + · · · + a1nxn = b1 a21x1 + a22x2 + · · · + a2nxn = b2 ... am1x1 + am2x2 + · · · + amnxn = bm. Posloupnost x1, . . . , xn lze chápat jako vektor proměnných, tj. sloupec v matici typu n/1, a podobně hodnoty b1, . . . , bn můžeme vnímat jako vektor u a to opět jako jediný sloupec 71 kterou pomocí elementárních řádkových transformací postupně převedeme na schodovitý tvar   1 2 3 2 2 −3 −1 −3 −3 1 2 −3   ∼   1 2 3 2 0 −7 −7 −7 0 7 11 3   ∼ ∼   1 2 3 2 0 1 1 1 0 0 4 −4   ∼   1 2 3 2 0 1 1 1 0 0 1 −1   . Nejdříve jsme přitom dvojnásobek prvního řádku odečetli od druhého a jeho trojnásobek přičetli ke třetímu. Poté jsme sečetli druhý a třetí řádek (součet napsali do třetího řádku) a druhý řádek vynásobili číslem −1/7. Přejdeme nyní zpět k soustavě rovnic x1 + 2x2 + 3x3 = 2, x2 + x3 = 1, x3 = −1. Ihned vidíme, že x3 = −1. Dosadíme-li x3 = −1 do rovnice x2 +x3 = 1, dostaneme x2 = 2. Podobně dosazení získaných hodnot x3 = −1, x2 = 2 do první rovnice dává x1 = 1. Systémy lineárních rovnic tedy lze zapisovat v maticovém tvaru. Ale je to nějaká výhoda, když je stejně umíme řešit, aniž bychom hovořili o maticích? Ano je, o řešení můžeme hovořit koncepčněji a jazyk matic pak daleko lépe navádí k počítačovému zpracování problému. Zkusme si tedy osvojit lépe různé operace, které můžeme s maticemi provádět. Jak jsme viděli v předchozích příkladech, tak ekvivalentní úpravy lineárních rovnic odpovídají v řeči matic elementárním řádkovým (sloupcovým) úpravám. Dále jsme viděli, že převedeme-li těmito úpravami matici soustavy do schodovitého tvaru (tomuto procesu říkáme Gaussova eliminace, viz 2.7), tak je již vyřešení soustavy velmi jednoduché. Ukažme si to ještě na dalších příkladech, na kterých uvidíme, že soustava lineárních rovnic může mít nekonečně mnoho řešení. 2.3. Vyřešte soustavu lineárních rovnic 2x1 − x2 + 3x3 = 0, 3x1 + 16x2 + 7x3 = 0, 3x1 − 5x2 + 4x3 = 0, −7x1 + 7x2 + −10x3 = 0. Řešení. Vzhledem k nulovosti pravých stran všech rovnic (jedná se tedy o homogenní systém) budeme upravovat pouze matici systému. Řešení nalezneme převodem na schodovitý tvar pomocí elementárních řádkových transformací, které odpovídají záměně pořadí rovnic, vynásobení rovnice nenulovým číslem a přičítání násobků rovnic. Navíc můžeme kdykoli od maticového zápisu přejít zpět k zápisu rovnic 1. VEKTORY A MATICE v matici typu n/1. Systém rovnic lze pak formálně psát ve tvaru A · x = u takto:    a11 . . . a1n ... ... am1 . . . amn    .    x1 ... xn    =    b1 ... bn    Původní rovnice nyní obdržíme tak, že vždy bereme řádky z A a sčítáme součiny odpovídajících komponent. To znamená, že skutečně jako i-tý prvek výsledného vektoru získáme ai1x1 + · · · + ainxn a zápis A · x = u dává skutečně původní systém lineárních rovnic. V rovině, tj. pro vektory dimenze 2, jsme už zavedli takovýto počet a viděli jsme, že s ním lze pracovat velice efektivně (viz 1.26). Nyní budeme postupovat obecněji a zavedeme všechny nástroje již známé z roviny pro všechny dimenze n. 2.4. Součin matic. Násobení matic je definována pouze, když to rozměry sloupců a řádků v maticích dovolí: Součin matic Pro libovolnou matici A = (aij ) typu m/n nad okruhem skalárů K a libovolnou matici B = (bjk ) typu n/q nad K definujeme jejich součin C = A · B = (cik) jako matici typu m/q s prvky cik = n∑ j=1 aij bjk , pro libovolné 1 ≤ i ≤ m, 1 ≤ k ≤ q. Například máme ( 2 1 1 −1 ) · ( 2 1 1 −1 0 1 ) = ( 3 2 3 3 1 0 ) 2.5. Čtvercové matice. Je-li v matici stejný počet řádků a sloupců, hovoříme o čtvercové matici. Počet řádků a sloupců pak nazýváme také dimenzí matice. Matici E = (δij ) =    1 . . . 0 ... ... ... 0 . . . 1    se říká jednotková matice. Na množině čtvercových matic nad K dimenze n je součin matic definován pro každé dvě matice, je tam tedy definována operace násobení, jejíž vlastnosti jsou velice podobné jako u skalárů: Tvrzení. Na množině všech čtvercových matic dimenze n nad libovolným okruhem skalárů K je definována operace násobení s následujícími vlastnosti okruhů (viz 1.3): (1) Platí asociativita násobení (O1) (2) jednotková matice E = (δij ) je jednotkovým prvkem pro násobení dle (O3) (3) Platí distributivita sčítání a násobení (O4). 72 s neznámými xi. Nejprve docílíme toho, aby se proměnná x1 vyskytovala pouze v první rovnici. Zřejmě postačuje (−3/2)násobek prvního řádku přičíst ke druhému a ke třetímu řádku a jeho (7/2)násobek k poslednímu řádku, což v maticovém zápisu dává     2 −1 3 3 16 7 3 −5 4 −7 7 −10     ∼     2 −1 3 0 35/2 5/2 0 −7/2 −1/2 0 7/2 1/2     . Odtud je vidět, že druhá, třetí a čtvrtá rovnice jsou násobky rovnice 7x2 + x3 = 0. Při maticovém zápisu můžeme např. (1/5)násobek druhého řádku přičíst ke třetímu a jeho (−1/5)násobek k poslednímu řádku, čímž obdržíme schodovitý tvar     2 −1 3 0 35/2 5/2 0 −7/2 −1/2 0 7/2 1/2     ∼     2 −1 3 0 35/2 5/2 0 0 0 0 0 0     ∼     2 −1 3 0 7 1 0 0 0 0 0 0     , který jsme v posledním kroku zjednodušili tak, že jsme druhý řádek (druhou rovnici) vynásobili číslem 2/5. Přestože byly zadány čtyři rovnice pro tři neznámé, má celá soustava nekonečně mnoho řešení, neboť pro libovolné x3 ∈ R mají zbylé rovnice 2x1 − x2 + 3x3 = 0, 7x2 + x3 = 0 řešení. Nahradíme tak proměnnou x3 parametrem t ∈ R a vyjádříme x2 = − 1 7 x3 = − 1 7 t a x1 = 1 2 (x2 − 3x3) = − 11 7 t. Pokud ještě nahradíme t = −7s, obdržíme výsledek v jednoduchém tvaru (x1, x2, x3) = (11s, s, −7s) , s ∈ R. 2.4. Nalezněte všechna řešení soustavy lineárních rovnic 3x1 + 3x3 − 5x4 = −8, x1 − x2 + x3 − x4 = −2, −2x1 − x2 + 4x3 − 2x4 = 0, 2x1 + x2 − x3 − x4 = −3. Řešení. Soustavě rovnic odpovídá rozšířená matice     3 0 3 −5 −8 1 −1 1 −1 −2 −2 −1 4 −2 0 2 1 −1 −1 −3     . Záměnou pořadí řádků (rovnic) potom obdržíme matici     1 −1 1 −1 −2 2 1 −1 −1 −3 −2 −1 4 −2 0 3 0 3 −5 −8     , CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Obecně však neplatí axiomy (O2) ani (OI). Čtvercové matice pro n > 1 proto netvoří obor integrity, zejména tedy nejsou ani (nekomutativním) tělesem. Důkaz. Asociativita násobení – (O1): Protože skaláry jsou asociativní, distributivní i komutativní, můžeme pro tři matice A = (aij ) typu m/n, B = (bjk ) typu n/p a C = (ckl) typu p/q spočíst A · B = (∑ j aij .bjk ) , B · C = (∑ k bjk .ckl ) (A · B) · C = (∑ k ( ∑ j aij .bjk ).ckl ) = (∑ j,k aij .bjk .ckl ) A · (B · C) = (∑ j aij .( ∑ k bjk .ckl) ) = (∑ j,k aij .bjk .ckl ) . Všimněme si, že jsme při výpočtu vycházeli z toho, že je jedno v jakém pořadí uvedené součty a součiny provádíme, tj. využívali jsme podstatně našich vlastností skalárů. Velmi snadno vidíme, že násobení jednotkovou maticí má skutečně vlastnost jednotkového prvku: A·E =    a11 · · · a1m ... am1 · · · amm   ·      1 0 · · · 0 0 1 · · · 0 ... ... 0 0 · · · 1      = A = E·A Zbývá distributivita násobení a sčítání. Opět díky distributivitě skalárů snadno spočteme pro matice A = (aij ) typu m/n, B = (bjk ) typu n/p, C = (cjk ) typu n/p, D = (dkl) typu p/q A · (B + C) = (∑ j aij (bjk + cjk ) ) = ( ( ∑ j aij bjk ) + ( ∑ j aij cjk ) ) = A · B + A · C (B + C) · D = (∑ k (bjk + cjk )dkl ) = ( ( ∑ k bjk dkl) + ( ∑ k cjk dkl) ) = B · D + C · D Jak jsme již viděli v 1.26, dvě matice dimenze 2 nemusí komutovat: ( 1 0 0 0 ) . ( 0 1 0 0 ) = ( 0 1 0 0 ) ( 0 1 0 0 ) . ( 1 0 0 0 ) = ( 0 0 0 0 ) Tím jsme získali zároveň protipříklad na platnost (O2) i (OI). Pro matice typu 1/1 ovšem oba axiomy samozřejmě platí, protože je mají samy skaláry a pro větší matice získáme protipříklady snadno tak, že právě uvedené matice umístíme do levého horního rohu příslušných čtvercových schémat a doplníme nulami. (Ověřte si sami!) 73 kterou převedeme na schodovitý tvar. Nejprve přičteme (−2)násobek, 2násobek a (−3)násobek prvního řádku po řadě ke druhému, třetímu a čtvrtému řádku, čímž získáme 0 pod prvním nenulovým číslem v prvním řádku. Analogicky poté získáme 0 pod prvním nenulovým číslem ve druhém řádku tak, že tento řádek a jeho (−1)násobek přičteme po řadě ke třetímu a čtvrtému řádku. Takto dostaneme     1 −1 1 −1 −2 2 1 −1 −1 −3 −2 −1 4 −2 0 3 0 3 −5 −8     ∼     1 −1 1 −1 −2 0 3 −3 1 1 0 −3 6 −4 −4 0 3 0 −2 −2     ∼     1 −1 1 −1 −2 0 3 −3 1 1 0 0 3 −3 −3 0 0 3 −3 −3     ∼     1 −1 1 −1 −2 0 3 −3 1 1 0 0 3 −3 −3 0 0 0 0 0     . Odtud vyplývá (čtvrtý řádek je pouhou kopií třetího – lze jej tedy „vynulovat“), že soustava bude mít nekonečně mnoho řešení, neboť dostáváme tři rovnice pro čtyři neznámé, které očividně budou mít právě jedno řešení pro každou volbu proměnné x4 ∈ R. Neznámou x4 proto nahradíme parametrem t ∈ R a od maticového zápisu přejdeme zpět k rovnicím x1 − x2 + x3 − t = −2, 3x2 − 3x3 + t = 1, 3x3 − 3t = −3. Z poslední rovnice máme x3 = t −1. Dosazení za x3 do druhé rovnice potom dává 3x2 − 3t + 3 + t = 1, tj. x2 = 1 3 (2t − 2) . Konečně podle první rovnice je x1 − 1 3 (2t − 2) + t − 1 − t = −2, tj. x1 = 1 3 (2t − 5) . Množinu řešení můžeme tudíž zapsat (pro t = 3s) ve tvaru { (x1, x2, x3, x4) = ( 2s − 5 3 , 2s − 2 3 , 3s − 1, 3s ) , s ∈ R } . Nyní se vraťme k rozšířené matici naší soustavy a upravujme ji dále užitím řádkových transformací tak, aby (při schodovitém tvaru) první nenulové číslo každého řádku (tzv. pivot) bylo právě číslo 1 a aby všechna ostatní čísla v jeho sloupci byla 0. Platí     1 −1 1 −1 −2 0 3 −3 1 1 0 0 3 −3 −3 0 0 0 0 0     ∼     1 −1 1 −1 −2 0 1 −1 1/3 1/3 0 0 1 −1 −1 0 0 0 0 0     ∼     1 −1 0 0 −1 0 1 0 −2/3 −2/3 0 0 1 −1 −1 0 0 0 0 0     ∼     1 0 0 −2/3 −5/3 0 1 0 −2/3 −2/3 0 0 1 −1 −1 0 0 0 0 0     , 1. VEKTORY A MATICE V důkazu jsme vlastně pracovali s maticemi obecnějšího typu, dokázali jsme tedy příslušné vlastnosti obecněji: Asociativita a distributivita násobení matic Důsledek. Násobení matic je asociativní a distributivní, tj. A · (B · C) = (A · B) · C A · (B + C) = A · B + A · C, kdykoliv jsou všechny uvedené operace definovány. Jednotková matice je neutrálním prvkem pro násobení zleva i zprava. 2.6. Inverzní matice. Se skaláry umíme počítat tak, že z rovnosti a · x = b umíme vyjádřit x = a−1 · b, kdykoliv inverze k a existuje. Podobně bychom to chtěli umět i s maticemi, máme ale problém, jak poznat, zda taková existuje, a jak ji spočítat. Říkáme, že B je matice inverzní k matici A, když A · B = B · A = E. Píšeme pak B = A−1 a je samozřejmé, že obě matice musí mít tutéž dimenzi n. Matici, k níž existuje matice inverzní, říkáme invertibilní matice. Pokud A−1 a B−1 existují, pak existuje i inverze k součinu A · B (A · B)−1 = B−1 · A−1 . Je totiž, díky právě dokázané asociativitě násobení, (B−1 · A−1 ) · (A · B) = B−1 · (A−1 · A) · B = E (A · B) · (B−1 · A−1 ) = A · (B · B−1 ) · A−1 = E. Protože s maticemi umíme počítat podobně jako se skaláry, jen mají složitější chování, mohou nám skutečně hodně pomoci s řešením systémů lineárních rovnic: Jestliže vyjádříme soustavu n rovnic pro n neznámých součinem matic A · x =    a11 · · · a1m ... am1 · · · amm    ·    x1 ... xm    =    b1 ... bm    = u a jestliže existuje matice inverzní k matici A, pak lze násobit zleva A−1 a dostaneme A−1 · u = A−1 · A · x = E · x = x, tj. hledané řešení. Naopak rozepsáním podmínky A·A−1 = E pro neznámé skaláry v hledané matici A−1 dostaneme n systémů lineárních rovnic se stejnou maticí na levé straně a různými vektory napravo. 74 1. MANIPULACE S MATICEMI přičemž nejdříve jsme vynásobili druhý a třetí řádek číslem 1/3, pak přičetli třetí řádek ke druhému a jeho (−1)násobek k prvnímu a na závěr přičetli druhý řádek k prvnímu. Z poslední matice snadno dostáváme výsledek     x1 x2 x3 x4     =     −5/3 −2/3 −1 0     + t     2/3 2/3 1 1     , t ∈ R. Volné proměnné jsou totiž ty, jejichž sloupce neobsahují žádného pivota (v našem případě neobsahuje pivota čtvrtý sloupec, je tedy volná čtvrtá proměnná, tj. používáme ji jako parametr). 2.5. Určete řešení systému rovnic 3x1 + 3x3 − 5x4 = 8, x1 − x2 + x3 − x4 = −2, −2x1 − x2 + 4x3 − 2x4 = 0, 2x1 + x2 − x3 − x4 = −3. Řešení. Uvědomme si, že soustava rovnic v tomto příkladu se od soustavy z předešlého příkladu liší pouze v hodnotě 8 (místo −8) na pravé straně první rovnice. Provedeme-li totožné řádkové úpravy jako v minulém příkladu, obdržíme     3 0 3 −5 8 1 −1 1 −1 −2 −2 −1 4 −2 0 2 1 −1 −1 −3     ∼     1 −1 1 −1 −2 2 1 −1 −1 −3 −2 −1 4 −2 0 3 0 3 −5 8     · · · ∼     1 −1 1 −1 −2 0 3 −3 1 1 0 0 3 −3 −3 0 0 3 −3 13     ∼     1 −1 1 −1 −2 0 3 −3 1 1 0 0 3 −3 −3 0 0 0 0 16     , kde poslední úpravou bylo odečtení třetího řádku od čtvrtého. Ze čtvrté rovnice 0 = 16 vyplývá, že soustava nemá řešení. Vyzdvihněme, že při úpravě na schodovitý tvar obdržíme rovnici 0 = a pro nějaké a ̸= 0 (tj. nulový řádek na levé straně a nenulové číslo za svislou čarou) právě tehdy, když soustava nemá řešení. 1. Manipulace s maticemi V této podkapitole budeme pracovat pouze s maticemi, abychom si osvojili jejich vlastnosti. 2.6. Násobení matic. Proveďte naznačené násobení: i) ( 1 2 −1 3 ) · ( 1 −1 2 1 ) , ii) ( 1 −1 2 1 ) · ( 1 2 −1 3 ) , iii) ( 1 2 3 1 −1 1 ) ·   1 −1 2 1 1 1 −2 −3 3 2 1 0  , CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA 2.7. Ekvivalentní úpravy matic. Zkusme se praktičtěji zorientovat v předchozí úvaze o systémech rovnic a jejich maticích. Samozřejmě nás nalezení inverzní matice stojí jisté úsilí – větší než přímé vyřešení rovnice. Podstatné však je, že pokud máme mnohokrát za sebou řešit systémy se stejnou maticí A ale různými pravými stranami u, pak se nám nalezení A−1 opravdu hodně vyplatí. Z hlediska řešení systémů rovnic A · x = u je jistě přirozené považovat za ekvivalentní matice A a vektory u, které zadávají systémy rovnic se stejným řešením. Zkusme se teď zamyslet nad možnostmi, jak zjednodušovat matici A tak, abychom se k řešení blížili. Začneme jednoduchými manipulacemi s řádky rovnic, které řešení ovlivňovat nebudou, a stejným způsobem pak můžeme upravovat i vektor napravo. Když se nám u čtvercové matice podaří vlevo dostat systém s jednotkovou maticí, bude napravo řešení původního systému. Pokud při našem postupu nějaké řádky úplně vypadnou (při úpravách se vynulují), bude to také dávat další přímé informace o řešení. Naše jednoduché úpravy jsou: Řádkové elementární transformace • záměna dvou řádků • vynásobení vybraného řádku nenulovým skalárem • přičtení řádku k jinému řádku. Těmto operacím říkáme řádkové elementární transformace. Je zjevné, že odpovídající operace na úrovni rovnic v systému skutečně nemohou změnit množinu všech jeho řešení. Analogicky, sloupcové elementární transformace matic jsou • záměna dvou sloupců • vynásobení vybraného sloupce nenulovým skalárem • přičtení sloupce k jinému sloupci, ty však nezachovávají řešení příslušných rovnic, protože mezi sebou míchají samotné proměnné. Systematicky můžeme použít elementární řádkové úpravy k postupné eliminaci proměnných. Postup je algoritmický a většinou se mu říká Gausova eliminace proměnných. Gaussova eliminace proměnných Tvrzení. Nenulovou matici nad libovolným okruhem skalárů K lze konečně mnoha elementárními řádkovými transformacemi převést na tzv. (řádkově) schodovitý tvar: • Je-li aij = 0 a všechny předchozí prvky na i-tém řádku jsou také nulové, potom akj = 0 pro všechna k ≥ i • je-li a(i−1)j první nenulový prvek na (i − 1)-ním řádku, pak aij = 0. 75 iv)   1 3 1 −2 2 −1 3 1 −4   ·   1 3 −3  , v) ( 1 3 −3 ) ·   1 −2 3 −2 2 −1 3 1 −4  , vi) ( 1 2 −2 ) ·   2 1 3  . Body i) a ii) v předchozím příkladu ukazují, že násobení čtvercových matic není komutativní, v bodě iii) vidíme, že pokud můžeme násobit obdélníkové matice, tak pouze v jednom ze dvou možných pořadí. V bodech iv) a v) si pak všimněme, že (A·B)T = AT ·BT , což zejména platí, pokud matice B je vektorem (má buď pouze jeden řádek, či jeden sloupec). 2.7. Nechť je A =   4 0 −5 2 7 15 2 7 13   , B =   7 2 0 0 0 3 0 −19 √ 13   . Lze matici A převést na matici B pomocí elementárních řádkových transformací (pak říkáme, že jsou řádkově ekvivalentní)? Řešení. Obě matice jsou zřejmě řádkově ekvivalentní s trojrozměrnou jednotkovou maticí. Snadno se vidí, že řádková ekvivalence na množině všech matic daných rozměrů je relací ekvivalence. Matice A a B jsou tudíž řádkově ekvivalentní. 2.8. Řešte maticovou rovnici X · ( 2 5 1 3 ) = ( 4 −6 2 1 ) . 2.9. Nalezněte libovolnou matici B, pro kterou je matice C = B · A ve schodovitém tvaru, jestliže A =     3 −1 3 2 5 −3 2 3 1 −3 −5 0 7 −5 1 4     . Řešení. Budeme-li matici A postupně násobit zleva elementárními maticemi (uvažte, jakým řádkovým úpravám toto násobení matic od- povídá) E1 =     0 0 1 0 0 1 0 0 1 0 0 0 0 0 0 1     , E2 =     1 0 0 0 −5 1 0 0 0 0 1 0 0 0 0 1     , E3 =     1 0 0 0 0 1 0 0 −3 0 1 0 0 0 0 1     , E4 =     1 0 0 0 0 1 0 0 0 0 1 0 −7 0 0 1     , 1. VEKTORY A MATICE Důkaz. Matice v řádkově schodovitém tvaru vypadá takto        0 . . . 0 a1j . . . . . . . . . a1m 0 . . . 0 0 . . . a2k . . . a2m ... 0 . . . . . . . . . . . . 0 alp . . . ...        a matice může, ale nemusí, končit několika nulovými řádky. K převodu libovolné matice můžeme použít jednoduchý algoritmus, kterým se postupně, řádek za řádkem, blížíme k výslednému schodovitému tvaru: Algoritmus Gaussovy eliminace (1) Záměnou řádků docílíme, že v prvním řádku bude v prvním nenulovém sloupci nenulový prvek, nechť je to j-tý sloupec. (2) Pro i = 2, . . ., vynásobením prvního řádku prvkem aij , i-tého řádku prvkem a1j a odečtením vynulujeme prvek aij na i-tém řádku. (3) Opakovanou aplikací bodů (1) a (2), vždy pro dosud neupravený zbytek řádků a sloupců v získané matici dospějeme po konečném počtu kroků k požadovanému tvaru. Tím je tvrzení dokázáno Uvedený postup je skutečně právě obvyklá eliminace proměnných v systémech lineárních rovnic. Poznámka. Gaussovu eliminaci jsme sformulovali pro obecné skaláry z nějakého okruhu. Zdá se být přirozené, že ve schodovitém tvaru ještě vynásobením vhodnými skaláry dosáhneme jednotkových koeficientů na výsledné nenulové „diagonále“ nad nulami v matici a dopočítáme řešení. To ale pro obecné skaláry nepůjde, představte si třeba celá čísla Z. Pro řešení systémů rovnic nemá ale vůbec uvedený postup rozumný smysl, když jsou mezi skaláry dělitelé nuly. Promyslete si pečlivě rozdíl mezi K = Z, K = R a případně Z2 nebo Z3. 2.8. Poznámka. V dalším budeme už pracovat jen s polem skalárů P , každý nenulový skalár je tedy invertibilní. Všimněme si, že elementární řádkové (resp. sloupcové) transformace odpovídají vynásobením zleva (resp. zprava) následujícími maticemi: (1) Přehození i-tého a j-tého řádku (resp. sloupce)               1 0 . . . 0 ... ... 0 . . . 1 ... ... ... 1 . . . 0 ... 1               76 1. MANIPULACE S MATICEMI E5 =     1 0 0 0 0 1/3 0 0 0 0 1 0 0 0 0 1     , E6 =     1 0 0 0 0 1 0 0 0 −2 1 0 0 0 0 1     , E7 =     1 0 0 0 0 1 0 0 0 0 1 0 0 −4 0 1     , E8 =     1 0 0 0 0 1/4 0 0 0 0 1 0 0 0 0 1     , obdržíme B = E8E7E6E5E4E3E2E1 =     0 0 1 0 0 1/12 −5/12 0 1 −2/3 1/3 0 0 −4/3 −1/3 1     , C =     1 −3 −5 0 0 1 9/4 1/4 0 0 0 0 0 0 0 0     . 2.10. Komplexní čísla jako matice. Uvažme množinu matic C = { ( a b −b a ) , a, b ∈ R}. Všimněte si, že C je uzavřená na sčítání a násobení matic a dále ukažte, že přiřazení f : C → C,( a b −b a ) → a + bi splňuje f (M + N) = f (M) + f (N) i f (M · N) = f (M) · f (N) (na levých stranác rovností se jedná o sčítání a násobení matic, na pravých o sčítání a násobení komplexních čísel). Na množinu C spolu s násobením a sčítáním matic lze tedy nahlížet jako na těleso C komplexních čísel. Zobrazení f se pak nazývá izomorfismem (těles). Je tedy například ( 3 5 −5 3 ) · ( 8 −9 9 8 ) = ( 69 13 −13 69 ) , což odpovídá tomu, že (3 + 5i) · (8 − 9i) = 69 − 13i. 2.11. Vyřešte maticové rovnice ( 1 3 3 8 ) · X1 = ( 1 2 3 4 ) , X2 · ( 1 3 3 8 ) = ( 1 2 3 4 ) . Řešení. Zjevně neznámé X1 a X2 musejí být matice 2×2 (aby uvažované součiny matic existovaly a výsledkem byla matice 2×2). Položme X1 = ( a1 b1 c1 d1 ) , X2 = ( a2 b2 c2 d2 ) a roznásobme matice v první zadané rovnici. Má platit ( a1 + 3c1 b1 + 3d1 3a1 + 8c1 3b1 + 8d1 ) = ( 1 2 3 4 ) , CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA (2) Vynásobení i-tého řádku (resp. sloupce) skalárem a:             1 ... 1 a 1 ... 1             ← i (3) Sečtení i-tého řádku (resp. sloupce) s j-tým: i →                1 0 0 ... ... ... 1 ... ... 1                ↑ j Toto prostinké pozorování je ve skutečnosti velice podstatné, protože součin invertibilních matic je invertibilní a všechny elementární transformace jsou nad polem skalárů invertibilní. Pro libovolnou matici A tedy dostaneme násobením vhodnou invertibilní maticí P = Pk · · · P1 zleva (postupné násobení k maticemi zleva) její ekvivalentní řádkový schodovitý tvar A′ = P · A. Jestliže obecně aplikujeme tentýž eliminační postup na sloupce, dostaneme z každé matice B její sloucový schodovitý tvar B′ vynásobením vhodnou invertibilní maticí Q = Q1 · · · Qℓ. Pokud ale začneme s maticí B = A′ v řádkově schodovitém tvaru, eliminuje takový postup pouze všechny dosud nenulové prvky mimo diagonálu matice a závěrem lze ještě i tyto elementárními operacemi změnit na jedničky. Celkem jsme tedy ověřili důležitý výsledek, ke kterému se budeme mnohokrát vracet: 2.9. Věta. Pro každou matici A typu m/n nad polem skalárů K existují čtvercové invertibilní matice P dimenze m a Q dimenze n takové, že matice P · A je v řádkově schodovitém tvaru a P · A · Q =          1 . . . 0 . . . . . . . . . 0 ... ... 0 . . . 1 0 . . . . . . 0 0 . . . 0 1 0 . . . 0 0 . . . 0 0 0 . . . 0 ...          . 2.10. Algoritmus pro výpočet inverzní matice. V předchozích úvahách jsme se dostali prakticky k úplnému algoritmu pro výpočet inverzní matice. Během jednoduchého níže uvedeného postupu buď zjistíme, že inverze neexistuje, 77 tj. má být a1 + 3c1 = 1, b1 + 3d1 = 2, 3a1 + 8c1 = 3, 3b1 + 8d1 = 4. Sečtením (−3)násobku první rovnice se třetí dostáváme c1 = 0 a následně a1 = 1. Podobně sečtením (−3)násobku druhé rovnice se čtvrtou dostáváme d1 = 2 a poté b1 = −4. Je tedy X1 = ( 1 −4 0 2 ) . Hodnoty a2, b2, c2, d2 najdeme odlišným způsobem. Např. použitím vzorce ( a b c d )−1 = 1 ad − bc ( d −b −c a ) , který platí pro libovolná čísla a, b, c, d ∈ R (přičemž inverzní matice existuje právě tehdy, když ad − bc ̸= 0), spočtěme ( 1 3 3 8 )−1 = ( −8 3 3 −1 ) . Vynásobení zadané rovnice touto maticí zprava dává X2 = ( 1 2 3 4 ) · ( −8 3 3 −1 ) , a tudíž X2 = ( −2 1 −12 5 ) . 2.12. Výpočet inverzní matice. Spočtěte inverzní matice k maticím A =   4 3 2 5 6 3 3 5 2   , B =   1 0 1 3 3 4 2 2 3   . Poté určete matici ( AT · B )−1 . Řešení. Inverzní matici nalezneme tak, že vedle sebe napíšeme matici A a matici jednotkovou. Pomocí řádkových transformací pak převedeme matici A na jednotkovou. Tímto matice jednotková přejde na matici A−1 . Postupnými úpravami dostáváme   4 3 2 1 0 0 5 6 3 0 1 0 3 5 2 0 0 1   ∼   1 −2 0 1 0 −1 5 6 3 0 1 0 3 5 2 0 0 1   ∼   1 −2 0 1 0 −1 0 16 3 −5 1 5 0 11 2 −3 0 4   ∼   1 −2 0 1 0 −1 0 5 1 −2 1 1 0 11 2 −3 0 4   ∼   1 −2 0 1 0 −1 0 5 1 −2 1 1 0 1 0 1 −2 2   ∼   1 0 0 3 −4 3 0 0 1 −7 11 −9 0 1 0 1 −2 2   1. VEKTORY A MATICE nebo bude inverze spočtena. I nadále pracujeme nad polem skalárů. Ekvivalentní řádkové transformace se čtvercovou maticí A dimenze n vedou k matici P ′ takové, že matice P ′ ·A bude v řádkově schodovitém tvaru. Přitom může (ale nemusí) být jeden nebo více posledních řádků nulových. Jestliže má existovat inverzní matice k A, pak existuje i inverzní matice k P ′ · A. Jestliže však je poslední řádek v P ′ · A nulový, bude nulový i poslední řádek v P ′ · A · B pro jakoukoliv matici B dimenze n. Existence takového nulového řádku ve výsledku (řádkové) Gaussovy eliminace tedy vylučuje existenci A−1 . Předpokládejme nyní, že A−1 existuje. Podle předchozího, nalezneme řádkově schodovitý tvar bez nulového řádku, tzn. že všechny diagonální prvky v P ′ · A jsou nenulové. Pak ovšem pokračováním eliminace pomocí řádkových elementárních transformací od pravého dolního rohu zpět a vynormováním diagonálních prvků na jedničky získáme jednotkovou matici E. Jinými slovy, najdeme další invertibilní matici P ′′ takovou, že pro P = P ′′ · P ′ platí P · A = E. Výměnou řádkových a sloupcových transformací lze za předpokladu existence A−1 stejným postupem najít Q takovou, že A · Q = E. Odtud P = P · E = P · (A · Q) = (P · A) · Q = Q. To ale znamená, že jsme nalezli hledanou inverzní matici A−1 = P = Q k matici A. Prakticky tedy můžeme postupovat takto: Výpočet inverzní matice Vedle sebe napíšeme původní matici A a jednotkovou matici E, matici A upravujeme řádkovými elementárními úpravami nejprve na schodovitý tvar, potom tzv. zpětnou eliminací na diagonální matici a v té násobíme řádky inverzními prvky z K. Tytéž úpravy postupně prováděné s E vedou právě k hledané matici A−1 . Pokud tento algoritmus narazí na vynulování celého řádku v původní matici, znamená to, že matice inverzní neexistuje. 2.11. Závislost řádků a sloupců a hodnost matice. V předchozích úvahách a počtech s maticemi jsme stále pracovali se sčítáním řádků nebo sloupců coby vektorů, spolu s jejich násobením skaláry. Takové operaci říkáme lineární kombinace. V abstraktním pojetí se k operacím s vektory vrátíme za chvíli v 2.23, bude ale užitečné pochopit podstatu už nyní. Lineární kombinací řádků (nebo sloupců) matice A = (aij ) typu m/n rozumíme výraz a1ui1 + · · · + akuik , kde ai jsou skaláry, uj = (aj1 , . . . , ajn ) jsou řádky (nebo uj = (a1j , . . . , amj ) jsou sloupce) matice A. Jestliže existuje lineární kombinace daných řádků s alespoň jedním nenulovým skalárním koeficientem, jejímž výsledkem je nulový řádek, říkáme, že jsou lineárně závislé. V opačném případě, tj. když jedinou možnost jak získat nulový řádek je vynásobení výhradně nulovými skaláry, jsou 78 1. MANIPULACE S MATICEMI ∼   1 0 0 3 −4 3 0 1 0 1 −2 2 0 0 1 −7 11 −9   , přičemž v prvním kroku jsme odečetli od prvního řádku třetí, ve druhém jsme (−5)násobek prvního přičetli ke druhému a současně jeho (−3)násobek ke třetímu, ve třetím kroku jsme odečetli od druhého řádku třetí, ve čtvrtém jsme (−2)násobek druhého přičetli ke třetímu, v pátém kroku jsme (−5)násobek třetího řádku přičetli ke druhému a jeho 2násobek k prvnímu, v posledním kroku jsme pak zaměnili druhý a třetí řádek. Zdůrazněme výsledek A−1 =   3 −4 3 1 −2 2 −7 11 −9   . Upozorněme, že při určování matice A−1 jsme díky vhodným řádkovým úpravám nemuseli počítat se zlomky. Přestože bychom si mohli obdobně počínat při určování matice B−1 , budeme raději provádět více názorné (nabízející se) řádkové úpravy. Platí   1 0 1 1 0 0 3 3 4 0 1 0 2 2 3 0 0 1   ∼   1 0 1 1 0 0 0 3 1 −3 1 0 0 2 1 −2 0 1   ∼   1 0 1 1 0 0 0 3 1 −3 1 0 0 0 1/3 0 −2/3 1   ∼   1 0 1 1 0 0 0 1 1 3 −1 1 3 0 0 0 1 3 0 −2 3 1   ∼   1 0 0 1 2 −3 0 1 0 −1 1 −1 0 0 1 3 0 −2 3 1   ∼   1 0 0 1 2 −3 0 1 0 −1 1 −1 0 0 1 0 −2 3   , tj. B−1 =   1 2 −3 −1 1 −1 0 −2 3   . Využitím identity ( AT · B )−1 = B−1 · ( AT )−1 = B−1 · ( A−1 )T a znalosti výše vypočítaných inverzních matic lze obdržet ( AT · B )−1 =   1 2 −3 −1 1 −1 0 −2 3   ·   3 1 −7 −4 −2 11 3 2 −9   =   −14 −9 42 −10 −5 27 17 10 −49   . CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA lineárně nezávislé. Obdobně definujeme lineárně závislé a nezávislé sloupce matice. Předchozí výsledky o Gausově eliminaci můžeme teď intepretovat tak, že počet výsledných nenulových „schodů“ v řádkově nebo sloupcově schodovitém tvaru je vždy roven počtu lineárně nezávislých řádků matice, resp. počtu lineárně nezávislých sloupců matice. Označme Eh matici z věty 2.9 s h jedničkami na diagonále a předpokládejme, že dvěma různými postupy dostaneme různá h′ < h. Pak ovšem podle našeho postupu budou existovat také invertibilní matice P a Q takové, že P · Eh′ · Q = Eh. V součinu Eh′ · Q bude více nulových řádků ve spodní části matice, než kolik má být jedniček v Eh a přitom se k nim máme dostat už jen řádkovými transformacemi. Zvýšit počet lineárně nezávislých řádků ale pomocí elementárních řdákových transformací nelze. Proto je počet jedniček v matici P ·A·Q ve větě 2.9 nezávislý na volbě našeho postupu eliminace a je roven jak počtu lineárně nezávislých řádků v A, tak počtu lineárně nezávislých sloupců v A. Tomuto číslu říkáme hodnost matice a značíme je h(A). Zapamatujme si výsledné tvrzení: Věta. Nechť A je matice typu m/n nad polem skalárů K. Matice A má stejný počet h(A) linárně nezávislých řádků a lineárně nezávislých sloupců. Zejména je hodnost vždy nejvýše rovna menšímu z rozměrů matice A. Algoristmus pro výpočet inverzních matic také říká, že čtvercová matice A dimenze m má inverzi právě, když je její hodnost rovna počtu řádků m. 2.12. Matice jako zobrazení. Zcela stejně, jak jsme s maticemi pracovali v geometrii roviny, viz 1.29, můžeme každou čtvercovou matici A interpretovat jako zobrazení A : Kn → Kn , x → A · x. Díky distributivnosti násobení matic je zřejmé, jak jsou zobrazovány lineární kombinace vektorů takovými zobrazeními: A · (a x + b y) = a A · x + b A · y. Přímo z definice je také vidět (díky asociativnosti násobení matic), že skládání zobrazení odpovídá skládání matic. Invertibilní matice tedy odpovídají bijektivním zobrazením. Z tohoto pohledu je velice zajímavá věta 2.9. Můžeme ji číst tak, že hodnost matice určuje, jak velký je obraz celého Kn v tomto zobrazení. Skutečně, je-li A = P · J · Q s maticí J s k jedničkami jako v 2.9, pak invertibilní Q napřed jen bijektivně „zamíchá“ n–rozměrné vektory v Kn , matice J pak „zkopíruje“ prvních k souřadnic a vynuluje n−k zbývajících. Tento „k–rozměrný“ obraz už pak následně násobení invertibilní P nemůže zvětšit. K pojmům dimenze, lineární nezávislost apod. se vrátíme ve třetí části této kapitoly. 79 2.13. Zjistěte, zda je matice     3 2 −1 2 4 1 2 −4 −2 2 4 1 2 3 −4 8     invertibilní. Řešení. Matice je invertibilní (existuje k ní inverzní matice) právě tehdy, když ji lze pomocí řádkových transformací převést na jednotkovou matici. To je ekvivalentní např. s tím, že má nenulový determinant. Vyčíslení 3 2 −1 2 4 1 2 −4 −2 2 4 1 2 3 −4 8 = 0 tak dává, že není invertibilní. 2.14. Vypočítejte inverzní matici k matici A =   1 0 −2 2 −2 1 5 −5 2   . 2.15. Nalezněte inverzní matici k matici       8 3 0 0 0 5 2 0 0 0 0 0 −1 0 0 0 0 0 1 2 0 0 0 3 5       . 2.16. Zjistěte, zda existuje inverzní matice k matici C =     1 1 1 1 1 1 −1 1 1 −1 1 −1 1 −1 −1 1     . Pokud ano, určete tuto matici C−1 . 2.17. Stanovte A−1 , je-li (a) A = ( 1 i −i 3 ) , přičemž i je imaginární jednotka; (b) A =   1 −5 −3 −1 5 4 −1 6 2  . 2.18. Napište inverzní matici k n × n matici (n > 1) A =         2 − n 1 · · · 1 1 1 2 − n ... ... 1 ... ... ... ... ... 1 ... ... 2 − n 1 1 1 · · · 1 2 − n         . 1. VEKTORY A MATICE 2.13. Matice rotací v R3 . Nyní si jako ilustraci najdeme popis rotací v R3 . Nejprve si napíšeme matice zobrazení rotací o úhel φ postupně kolem os x, y, z v R3 . Při rotaci libovolného bodu kolem dané osy (řekněme x), se příslušná souřadnice daného bodu nemění, v rovině dané dvěma zbylými osami pak již je rotace dána známou maticí typu 2/2. Postupně tedy dostáváme následující matice — rotace kolem osy z:   cos φ − sin φ 0 sin φ cos φ 0 0 0 1   rotace kolem osy y:   cos φ 0 sin φ 0 1 0 − sin φ 0 cos φ   rotace kolem osy x:   1 0 0 0 cos φ − sin φ 0 sin φ cos φ   . U matice rotace kolem osy y máme jinak znaménko u φ. Chceme totiž, stejně jako u ostatních os rotaci kolem osy y v kladném smyslu, tedy takovou, že pokud se díváme proti směru osy y, tak se svět točí proti směru hodinových ručiček. Při obvyklé orientaci souřadných os jako na obrázku jde tady o rotaci v záporném smyslu v rovině xz (tedy osa z se otáčí směrem k x). Rozmyslete si kladný a záporný smysl rotace podél všech tří os. vlozit obrazek Díky tomu, že násobení matic odpovídá skládání zbrazení (stejně jako jsme to používali v rovině) můžeme nyní docela snadno napsat matici pro zobrazení rotace kolem libovolné osy procházející počátkem v R3 . Ukážeme si to na rotaci v kladném smyslu o úhel 60◦ kolem přímky dané počátkem a vektorem (1, 1, 0) v R3 . Toto otáčení je složením následujících tří zobrazení: • rotace o 45◦ v záporném smyslu podle osy z (osa rotace (1, 1, 0) přejde do osy x) • rotace o 60◦ v kladném smyslu podle osy x. • rotace o 45◦ v kladném smyslu podle osy z (osa x přejde zpět na osu danou vektorem (1, 1, 0)). Matice výsledné rotace tedy bude součinem matic odpovídajících těmto třem zobrazením, přičemž pořadí matic je dáno pořadím provádění jednotlivých zobrazení, prvnímu zobrazení odpovídá v součinu matice nejvíce napravo. Celkem tedy dostáváme pro hledanou matici A vztah: A =    √ 2 2 − √ 2 2 0√ 2 2 √ 2 2 0 0 0 1    ·    1 0 0 0 1 2 − √ 3 2 0 √ 3 2 1 2    ·    √ 2 2 √ 2 2 0 − √ 2 2 √ 2 2 0 0 0 1    =    3 4 1 4 √ 6 4 1 4 3 4 − √ 6 4 − √ 6 4 √ 6 4 1 2    80 2. SOUSTAVY LINEÁRNÍCH ROVNIC 2. Soustavy lineárních rovnic Se soustavami lineárních rovnic jsme se již setakli na začátku kapitoly. Nyní se budeme věnovat této problematice podrobněji. Zkusme nejprve využít výpočtu inverzní matice k řešení systému lineárních soustav rovnic. 2.19. Účastníci zájezdu. Dvoudenního autobusového zájezdu se zúčastnilo 45 osob. První den se platilo vstupné na rozhlednu 30 Kč za dospělého, 16 Kč za dítě a 24 Kč za seniora, celkem 1 116 Kč. Druhý den se platilo vstupné do botanické zahrady 40 Kč za dospělého, 24 Kč za dítě a 34 Kč za seniora, celkem 1 542 Kč. Kolik bylo mezi výletníky dospělých, dětí a seniorů? Řešení. Zaveďme proměnné x udávající „počet dospělých“; y udávající „počet dětí“; z udávající „počet seniorů“. Zájezdu se zúčastnilo 45 osob, a proto x + y + z = 45. Celkové vstupné na rozhlednu a do botanické zahrady při zavedení našich proměnných a při zachování pořadí činí 30x+16y+24z a 40x+ 24y + 34z. My je ovšem známe (1 116 Kč a 1 542 Kč). Máme tak 30x + 16y + 24z = 1 116, 40x + 24y + 34z = 1 542. Soustavu tří lineárních rovnic zapíšeme maticově jako   1 1 1 30 16 24 40 24 34   ·   x y z   =   45 1 116 1 542   . Řešením je   x y z   = 1 6   16 5 −4 30 3 −3 −40 −8 7   ·   45 1 116 1 542   = 1 6   132 72 66   =   22 12 11   , neboť   1 1 1 30 16 24 40 24 34   −1 = 1 6   16 5 −4 30 3 −3 −40 −8 7   . Slovně vyjádřeno, zájezdu se zúčastnilo 22 dospělých, 12 dětí, 11 se- niorů. CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA 2. Determinanty V páté části první kapitoly jsme viděli, že pro čtvercové matice dimenze 2 nad reálnými čísly existuje skalární funkce det, která matici přiřadí nenulové číslo právě, když existuje její inverze. Neříkali jsme to sice stejnými slovy, ale snadno si to ověříte (viz odstavce počínaje 1.26 a vzorec (1.16)). Determinant byl užitečný i jinak, viz 1.33 a 1.34, kde jsme si volnou úvahou odvodili, že obsah rovnoběžníka by měl být lineárně závislý na každém ze dvou vektorů definujících rovnoběžník a že je užitečné zároveň požadovat změnu znaménka při změně pořadí těchto vektorů. Protože tyto vlastnosti měl, až na pevný skalární násobek, jedině determinant, odvodili jsme, že je obsah dán právě takto. Nyní uvidíme, že podobně lze postupovat v každé konečné dimenzi. V této části budeme pracovat s libovolnými skaláry K a maticemi nad těmito skaláry. Naše výsledky o determinantech tedy budou vesměs platit pro všechny komutativní okruhy, zejména tedy třeba pro celočíslené matice. 2.14. Definice determinantu. Připomeňme, že bijektivní zobrazení množiny X na sebe se nazývá permutace množiny X, viz 1.7. Je-li X = {1, 2, . . . , n}, lze permutace zapsat pomocí výsledného pořadí ve formě tabulky: ( 1 2 . . . n σ(1) σ(2) . . . σ(n) ) . Prvek x ∈ X se nazývá samodružným bodem permutace σ, je-li σ(x) = x. Permutace σ taková, že existují právě dva různé prvky x, y ∈ X s σ(x) = y a σ(z) = z pro všechna ostatní z ∈ X se nazývá transpozice, značíme ji (x, y). Samozřejmě pro takovou transpozici platí také σ(y) = x, odtud název. V dimenzi dva byl vzorec pro determinant jednoduchý – vezmeme všechny možné součiny dvou prvků, po jednom z každého sloupce a řádku matice, opatříme je znaménkem tak, aby při přehození dvou sloupců došlo ke změně celkového znaménka, a výrazy všechny (tj. oba) sečteme: A = ( a b c d ) , det A = ad − bc. Obecně, uvažujme čtvercové matice A = (aij ) dimenze n nad K. Vzorec pro determinant matice A bude také poskládáný ze všech možných součinů prvků z jednotlivých řádků a sloupců: Definice determinantu Determinant matice A je skalár det A = |A| definovaný vztahem |A| = ∑ σ∈ n sgn(σ)a1σ(1) · a2σ(2) · · · anσ(n) kde n je množina všech možných permutací na {1, . . . , n} a znaménko sgn pro každou permutaci σ ještě musíme popsat. Každý z výrazů sgn(σ)a1σ(1) · a2σ(2) · · · anσ(n) 81 2.20. Za pomoci výpočtu inverzní matice určete řešení soustavy x1 + x2 + x3 + x4 = 2, x1 + x2 − x3 − x4 = 3, x1 − x2 + x3 − x4 = 3, x1 − x2 − x3 + x4 = 5. Co když však matice soustavy není invertibilní? Potom nemůžeme k jejímu řešení inverzní matice využít. Taková soustava pak má jiný počet než jedno řešení. Jak možná čtenář již ví, tak systém lineárních rovnic buď nemá řešení, nebo má jedno řešení, nebo jich má nekonečně mnoho (například nemůže mít právě dvě řešení). Prostor řešení je buď vektorový prostor (v případě, že pravá strana všech rovnic v systému je nulová, hovoříme o homogenním systému lineárních rovnic) nebo afinní prostor, viz 4.1, (v případě, ze pravá strana alespoň jedné z rovnic je nenulová, hovoříme o nehomogenním systému lineárních rovnic). Ukažme si tedy různé možné typy řešení soustavy lineárních rovnic na příkladech. 2.21. Pro jaké hodnoty parametrů a, b ∈ R má lineární systém x1 − ax2 − 2x3 = b, x1 + (1 − a)x2 = b − 3, x1 + (1 − a)x2 + ax3 = 2b − 1 (a) právě 1 řešení; (b) žádné řešení; (c) alespoň 2 řešení? Řešení. Soustavu „tradičně“ přepíšeme do rozšířené matice a upra- víme   1 −a −2 b 1 1 − a 0 b − 3 1 1 − a a 2b − 1   ∼   1 −a −2 b 0 1 2 −3 0 1 a + 2 b − 1   ∼   1 −a −2 b 0 1 2 −3 0 0 a b + 2   . Dodejme, že v prvním kroku jsme první řádek odečetli od druhého a od třetího a ve druhém kroku pak druhý od třetího. Vidíme, že soustava bude mít právě jedno řešení (které lze určit zpětnou eliminací) tehdy a jenom tehdy, když a ̸= 0. Pro a = 0 totiž ve třetím sloupci není první nenulové číslo nějakého řádku. Je-li a = 0 a b = −2, dostáváme nulový řádek, kdy volba x3 ∈ R jako parametru dává nekonečně mnoho různých řešení. Pro a = 0 a b ̸= −2 poslední rovnice a = b+2 nemůže být splněna – soustava nemá řešení. 2. DETERMINANTY nazýváme člen determinantu |A|. V dimenzích 2 a 3 snadno uhádneme i správná znaménka. Součin prvků z diagonály má být s kladným znaménkem a chceme linearitu v každém sloupci a antisymetrii při přehození dvou sloupců nebo řádků. Determinanty v dimensi dvě a tři Pro n = 2 je, jak jsme čekali a11 a12 a21 a22 = +a11a22 − a12a21. Podobně pro n = 3 a11 a12 a13 a21 a22 a23 a31 a32 a33 = + a11a22a33 − a13a22a31 + a13a21a32 − a11a23a32 + a12a23a31 − a12a21a33. Tomuto vzorci se říká Saarusovo pravidlo. 2.15. Parita permutace. Jak tedy najít správná znaménka permutací? Říkáme, že dvojice prvků a, b ∈ X = {1, . . . , n} tvoří inverzi v permutaci σ, je-li a < b a σ(a) > σ(b). Permutace σ se nazývá sudá (resp. lichá), obsahuje-li sudý (resp. lichý) počet inverzí. Parita permutace σ je (−1)počet inverzí a značíme ji sgn(σ). Tolik tedy definice znamének našich členů determintu, chceme ale vědět, jak s paritou počítat. Z následujícího tvrzení o permutacích už je jasně vidět, že Saarusovo pravidlo skutečně počítá determinant v dimenzi 3. Věta. Na množině X = {1, 2, . . . , n} je právě n! různých permutací. Tyto lze seřadit do posloupnosti tak, že každé dvě po sobě jdoucí se liší právě jednou transpozicí a každá transpozice mění paritu. Lze při tom začít libovolnou permutací. Důkaz. Pro jednoprvkové a dvouprvkové X tvrzení samozřejmě platí. Budeme postupovat indukcí přes dimenzi. Předpokládejme, že tvrzení platí pro všechny množiny s n − 1 prvky a uvažme permutaci σ(1) = a1, . . . , σ(n) = an. Podle indukčního předpokladu všechny permutace, které mají na posledním místě an, dostaneme z tohoto pořadí postupným prováděním transpozic. Přitom jich bude (n−1)!. V posledním z nich prohodíme σ(n) = an za některý z prvků, který dosud nebyl na posledním místě, a znovu uspořádáme všechny permutace s tímto vybraným prvkem na posledním místě do posloupnosti s požadovanými vlastnostmi. Po nnásobné aplikaci tohoto postupu získáme n(n − 1) = n! zaručeně různých permutací, tzn. všechny, právě předepsaným způsobem. Všimněme si, že poslední věta dokazovaného tvrzení se nezdá příliš důležitá pro jeho využití. Je však velice důležitou částí postupu v našem důkazu indukcí přes počet prvků. 82 2. SOUSTAVY LINEÁRNÍCH ROVNIC Poznamenejme, že pro a = 0, b = −2 jsou řešeními (x1, x2, x3) = (−2 + 2t, −3 − 2t, t) , t ∈ R a pro a ̸= 0 je jediným řešením trojice ( −3a2 − ab − 4a + 2b + 4 a , − 2b + 3a + 4 a , b + 2 a ) . 2.22. Zjistěte počet řešení soustav (a) 12x1 + √ 5x2 + 11x3 = −9, x1 − 5x3 = −9, x1 + 2x3 = −7; (b) 4x1 + 2x2 − 12x3 = 0, 5x1 + 2x2 − x3 = 0, −2x1 − x2 + 6x3 = 4; (c) 4x1 + 2x2 − 12x3 = 0, 5x1 + 2x2 − x3 = 1, −2x1 − x2 + 6x3 = 0. Řešení. Vektory (1, 0, −5), (1, 0, 2) jsou očividně lineárně nezávislé (jeden není násobkem druhého) a vektor (12, √ 5, 11) nemůže být jejich lineární kombinací (jeho druhá složka je nenulová), a proto matice, jejímiž řádky jsou tyto tři lineárně nezávislé vektory, je invertibilní. Soustava ve variantě (a) má tedy právě jedno řešení. U soustav ve variantách (b), (c) si stačí povšimnout, že je (4, 2, −12) = −2(−2, −1, 6). V případě (b) tak sečtení první rovnice s dvojnásobkem třetí dává 0 = 8 – soustava nemá řešení; v případě (c) je třetí rovnice násobkem první – soustava má zřejmě nekonečně mnoho řešení. 2.23. Najděte (libovolný) lineární systém, jehož množina řešení je právě {(t + 1, 2t, 3t, 4t); t ∈ R}. Řešení. Takovým systémem je např. 2x1 − x2 = 2, 2x2 − x4 = 0, 4x3 − 3x4 = 0. Těmto rovnicím totiž uvedené řešení vyhovuje pro každé t ∈ R a vek- tory (2, −1, 0, 0), (0, 2, 0, −1), (0, 0, 4, −3) zadávající levé strany rovnic jsou zřejmě lineárně nezávislé (množina řešení obsahuje jeden parametr). CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Zbývá tvrzení věty o paritách. Uvažme pořadí (a1, . . . , ai, ai+1, . . . , n), ve kterém je r inverzí. Pak zjevně je v pořadí (a1, . . . , ai+1, ai . . . , n) buď r − 1 nebo r + 1 inverzí. Každou transpozici (ai, aj ) lze přitom získat postupným provedením (j −i)+(j −i −1) = 2(j − i) − 1 transpozic sousedních prvků. Proto se provedením libovolné transpozice parita permutace změní. Navíc již víme, že všechny permutace lze získat prováděním transpo- zic. Zjistili jsme, že provedení libovolné transpozice změní paritu permutace a že každé pořadí čísel {1, 2, . . . , n} lze získat postupnými transpozicemi sousedních prvků. Dokázali jsme proto: Důsledek. Na každé konečné množině X = {1, . . . , n} s n prvky, n > 1, je právě 1 2 n! sudých a 1 2 n! lichých permutací. Jestliže složíme dvě permutace za sebou, znamená to provést napřed všechny transpozice tvořící první a pak druhou. Proto pro libovolné permutace σ, η : X → X platí sgn(σ ◦ η) = sgn(σ) · sgn(η) a proto také sgn(σ−1 ) = sgn(σ). 2.16. Rozklad permutace na cykly. Dobrým nástrojem pro praktickou práci s permutacemi je jejich rozklad na tzv. cykly. Cykly Permutace σ na množině X = {1, . . . , n} se nazývá cyklus délky k, jestliže je možné najít prvky a1, . . . , ak ∈ X, 2 ≤ k ≤ n takové, že σ(ai) = ai+1, i = 1, . . . , k − 1, zatímco σ(ak) = a1 a ostatní prvky v X jsou pro σ samodružné. Cykly délky dva jsou právě transpozice. Každá permutace je složením cyklů. Cykly sudé délky mají paritu −1, cykly liché délky mají paritu 1. Poslední tvrzení musíme ještě dokázat. Jestliže definujeme pro danou permutaci σ relaci R tak, že dva prvky x, y ∈ X jsou v relaci právě když σr (x) = y pro nějakou iteraci permutace σ, pak zjevně jde o relaci ekvivalence. Protože je X konečná množina, musí pro nějaké ℓ být σℓ (x) = x. Jestliže zvolíme jednu třídu ekvivalence {x, σ(x), . . . , σℓ−1 (x)} ⊂ X a ostatní prvky definujeme jako samodružné, dostáváme cyklus. Evidentně je pak celá původní permutace X složením všech těchto cyklů a je jedno v jakém pořadí cykly skládáme. Pro určení parity si nyní stačí povšimnout, že cykly sudé délky lze napsat jako lichý počet transpozic, proto mají paritu −1. Obdobně cyklus liché délky dostaneme ze sudého počtu transpozic a proto mají paritu 1. 83 2.24. Stanovte hodnost matice A =     1 −3 0 1 1 −2 2 −4 1 −1 0 1 −2 −1 1 −2     . Poté stanovte počet řešení systému lineárních rovnic x1 + x2 + x3 − 2x4 = 4, −3x1 − 2x2 − x3 − x4 = 5, + 2x2 + x4 = 1, x1 − 4x2 + x3 − 2x4 = 3 a také všechna řešení systému x1 + x2 + x3 − 2x4 = 0, −3x1 − 2x2 − x3 − x4 = 0, + 2x2 + x4 = 0, x1 − 4x2 + x3 − 2x4 = 0 a systému x1 − 3x2 = 1, x1 − 2x2 + 2x3 = −4, x1 − x2 = 1, −2x1 − x2 + x3 = −2. Řešení. Neboť je 1 −3 0 1 1 −2 2 −4 1 −1 0 1 −2 −1 1 −2 = −10, jsou sloupce matice A lineárně nezávislé, a tudíž se její hodnost rovná jejímu rozměru. První z uvedených třech systémů je zadán rozšířenou maticí     1 1 1 −2 4 −3 −2 −1 −1 5 0 2 0 1 1 1 −4 1 −2 3     . Ovšem levá strana je právě AT s determinantem |AT | = |A| ̸= 0. Existuje tedy matice ( AT )−1 a soustava má právě 1 řešení (x1, x2, x3, x4)T = ( AT )−1 · (4, 5, 1, 3)T . Druhý ze systémů má totožnou levou stranu (určenou maticí AT ) s prvním. Protože absolutní členy na pravé straně lineárních systémů neovlivňují počet řešení a protože každý homogenní systém má nulové řešení, dostáváme jako jediné řešení druhého systému uspořádanou čtveřici (x1, x2, x3, x4) = (0, 0, 0, 0) . Třetí systém má rozšířenou matici     1 −3 0 1 1 −2 2 −4 1 −1 0 1 −2 −1 1 −2     , 2. DETERMINANTY 2.17. Jednoduché vlastnosti determinantu. Poznání vlastností permutací a jejich parit z předchozích odstavců nám teď umožní rychle odvodit základní vlastnosti detemrintů. Pro každou matici A = (aij ) typu m/n nad skaláry z K definujeme matici transponovanou k A. Jde o matici AT = (a′ ij ) s prvky a′ ij = aji , která je typu n/m. Čtvercová matice A s vlastností A = AT se nazývá symetrická. Jestliže platí A = −AT , pak se A nazývá antisy- metrická. Jednoduché vlastnosti determinantů Věta. Pro každou čtvercovou matici A = (aij ) platí (1) |AT | = |A|, (2) Je-li jeden řádek v A tvořen nulovými prvky z K, pak |A| = 0, (3) Jestliže matice B vznikla z A výměnou dvou řádků, pak |A| = −|B|, (4) Jestliže matice B vznikla z A vynásobením řádku skalárem a ∈ K, pak |B| = a |A|, (5) Jsou-li prvky k-tého řádku v A tvaru akj = ckj + bkj a všechny ostatní řádky v maticích A, B = (bij ), C = (cij ) jsou stejné, pak |A| = |B| + |C|, (6) Determinant |A| se nezmění, přičteme-li k libovolnému řádku A lineární kombinaci ostatních řádků. Důkaz. (1) Členy determinantů |A| a |AT | jsou v bijektivní korespondenci. Členu sgn(σ)a1σ(1) ·a2σ(2) · · · anσ(n) přitom v AT odpovídá člen (na pořadí skalárů v součinu totiž nezáleží) sgn(σ)aσ(1)1 · aσ(2)2 · · · aσ(n)n = = sgn(σ)a1σ−1(1) · a2σ−1(2) · · · anσ−1(n) , přičemž musíme ověřit, že je tento člen opatřen správným znaménkem. Parita σ a σ−1 je ale stejná, jde tedy opravdu o člen |AT | a první tvrzení je dokázáno. (2) Plyne přímo z definice determinantu, protože všechny jeho členy obsahují z každého řádku právě jeden člen, a je-li jeden z řádků nulový, budou tedy všechny nulové. (3) Ve všech členech |B| dojde ve srovnání s determinantem |A| u permutací k přidání jedné transpozice, znaménko všech členů determinantu tedy bude opačné. (4) Vyplývá přímo z definice, protože členy determinantu |B| jsou členy |A| vynásobené skalárem a. (5) V každém členu |A| je právě jeden součinitel z ktého řádku matice A. Protože platí distributivní zákon pro násobení a sčítání v K, vyplývá tvrzení přímo z definičního vztahu pro determinanty. (6) Jsou-li v A dva stejné řádky, jsou mezi členy determinantu vždy dva sčítance stejné až na znaménko. Proto je v takovém případě |A| = 0. Je tedy podle tvrzení (5) možné přičíst k vybranému řádku libovolný jiný řádek, aniž by se zmněnila hodnota determinantu. Vzhledem k tvrzení (4) lze ale přičíst i skalární násobek libovolného jiného řádku. 84 2. SOUSTAVY LINEÁRNÍCH ROVNIC což je matice A (pouze poslední sloupec je uveden za svislou čarou). Pokud budeme tuto matici upravovat na schodovitý tvar, musíme obdržet řádek ( 0 0 0 a ) , kde a ̸= 0. Víme totiž, že sloupec na pravé straně není lineární kombinací sloupců na levé straně (hodnost matice je 4). Tento systém nemá řešení. 2.25. Vyřešte systém homogenních lineárních rovnic zadaný maticí     0 √ 2 √ 3 √ 6 0 2 2 √ 3 −2 − √ 5 0 2 √ 5 2 √ 3 − √ 3 3 3 √ 3 −3 0     . 2.26. Určete všechna řešení systému x2 + x4 = 1, 3x1 − 2x2 − 3x3 + 4x4 = −2, x1 + x2 − x3 + x4 = 2, x1 − x3 = 1. 2.27. Vyřešte 3x − 5y + 2u + 4z = 2, 5x + 7y − 4u − 6z = 3, 7x − 4y + u + 3z = 5. 2.28. Rozhodněte o řešitelnosti soustavy lineárních rovnic 3x1 + 3x2 + x3 = 1, 2x1 + 3x2 − x3 = 8, 2x1 − 3x2 + x3 = 4, 3x1 − 2x2 + x3 = 6 třech proměnných x1, x2, x3. 2.29. Stanovte počet řešení 2 soustav 5 lineárních rovnic AT · x = (1, 2, 3, 4, 5)T , AT · x = (1, 1, 1, 1, 1)T , kde x = (x1, x2, x3)T a A =   3 1 7 5 0 0 0 0 0 1 2 1 4 3 0   . CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA 2.18. Výpočetní důsledky. Podle předchozí věty umíme převést elementárními řádkovými transformacemi každou čtvercovou matici A na řádkově schodovitý tvar, aniž bychom změnili hodnotu jejího determinantu. Jen musíme dávat pozor, abychom vždy k upravovanému řádku pouze přičítali lineární kombinace řádků ostatních. Výpočet determinantů eliminací Je-li matice A v řádkovém schodovitém tvaru, pak v každém členu |A| je alespoň jeden součinitel prvkem pod diagonálou s výjimkou případu, kdy jsou všechny jen na diagonále. Pak je ale jediným nenulovým členem determinantu ten, který odpovídá identické permutaci. Vidíme tedy, že determinant takové matice ve schodovitém tvaru je |A| = a11 · a22 · · · · ann. Předchozí věta tedy poskytuje velice efektivní metodu výpočtu determinantů pomocí Gaussovy eliminační metody, viz 2.7. Všimněme si také hezkého důsledku prvního tvrzení předchozí věty o rovnosti determinantů matice a matice transponované. Zaručuje totiž, že kdykoliv se nám podaří dokázat nějaké tvrzení o determinantech formulované s využitím řádků příslušné matice, pak analogické tvrzení platí i pro sloupce. Např. tedy můžeme okamžitě všechna tvrzení (2)– (6) této věty přeformulovat i pro přičítání lineárních kombinací ostatních sloupců k vybranému. Dále si všimněme, že vlastnosti (3)–(5) z předchozí věty říkají, že determinant jakožto zobrazení, které n vektorům dimenze n (řádkům nebo sloupcům matice) přiřadí skalár, je antisymetrické zobrazení lineární v každém svém argumentu, přesně jako jsme podle analogie z dimenze 2 požadovali. 2.19. Další vlastnosti determinantu. Časem uvidíme, že skutečně stejně jako v dimenzi dva je determinant matice roven orientovanému objemu rovnoběžnostěnu určeného jejími sloupci. Uvidíme také, že když uvážíme zobrazení x → A · x zadané čtvercovou maticí A na Rn , pak můžeme determinant této matice vidět jako vyjádření poměru mezi objemem rovnoběžnostěnů daných vektory x1, . . . xn a jejich obrazy A · x1, . . . , A · xn. Protože skládání zobrazení x → A · x → B · (A · x) odpovídá násobení matic, je snad docela pochopitelná tzv. Cauchyova věta: Cauchyova věta Věta. Nechť A = (aij ), B = (bij ) jsou čtvercové matice dimenze n nad okruhem skalárů K. Pak |A · B| = |A| · |B|. My teď tuto větu odvodíme ryze algebraicky už proto, že předchozí odvolávka na geometrický argument těžko může fungovat pro jakékoliv skaláry. Základním nástrojem je tzv. rozvoj determinantu podle jednoho nebo více řádků či sloupců. Budeme potřebovat něco málo technické přípravy. Čtenář, který by snad tolik abstrakce neztrávil může tyto 85 2.30. Nechť je dáno A =   4 5 1 3 4 0 1 1 1   , x =   x1 x2 x3   , b =   b1 b2 b3   . Najděte taková reálná čísla b1, b2, b3, aby systém lineárních rovnic A · x = b měl: (a) nekonečně mnoho řešení; (b) právě jedno řešení; (c) žádné řešení; (d) právě 4 řešení. 2.31. Určete řešení soustavy lineárních rovnic ax1 + 4x2 + 2 x3 = 0, 2x1 + 3x2 − x3 = 0, v závislosti na parametru a ∈ R. 2.32. V závislosti na hodnotě parametru a ∈ R rozhodněte o počtu řešení soustavy     4 1 4 a 2 3 6 8 3 2 5 4 6 −1 2 −8     t’     x1 x2 x3 x4     =     2 5 3 −3     . 2.33. Rozhodněte, zda existuje homogenní soustava lineárních rovnic tří proměnných, jejíž množinou řešení je (a) {(0, 0, 0)}; (b) {(0, 1, 0), (0, 0, 0), (1, 1, 0)}; (c) {(x, 1, 0); x ∈ R}; (d) {(x, y, 2y); x, y ∈ R}. 2.34. Řešte soustavu lineárních rovnic v závislosti na reálných parametrech a, b. x + 2y + bz = a x − y + 2z = 1 3x − y = 1. 3. Determinanty 2.35. Spočítejte determinant matice     1 3 5 6 1 2 2 2 1 1 1 2 0 1 2 1     . 2. DETERMINANTY pasáže přeskočit a vstřebat pouze znění Laplaceovy věty a jejich důsledků. 2.20. Minory matice. Nechť A = (aij ) je matice typu m/n a 1 ≤ i1 < . . . < ik ≤ m, 1 ≤ j1 < . . . < jl ≤ n jsou pevně zvolená přirozená čísla. Pak matici M =    ai1j1 ai1j2 . . . ai1jℓ ... ... aikj1 aikj2 . . . aikjℓ    typu k/ℓ nazýváme submaticí matice A určenou řádky i1, . . . , ik a sloupci j1, . . . , jℓ. Zbývajícími (m − k) řádky a (n − l) sloupci je určena matice M∗ typu (m − k)/(n − ℓ), která se nazývá doplňková submatice k M v A. Při k = ℓ je definován |M|, který nazýváme subdeterminant nebo minor řádu k matice A. Je-li m = n, pak při k = ℓ je i M∗ čtvercová a |M∗ | se nazývá doplněk minoru |M|, nebo doplňkový minor k submatici M v matici A. Skalár (−1)i1+···+ik+j1+···+jl · |M∗ | se nazývá algebraický doplněk k minoru |M|. Submatice tvořené prvními k řádky a sloupci se nazývají hlavní submatice, jejich determinanty hlavní minory matice A. Při speciální volbě k = ℓ = 1, m = n hovoříme o algebraickém doplňku Aij prvku aij matice A. Pokud je |M| hlavní minor matice A řádu k, pak přímo z definice determinantu je vidět, že každý z jednotlivých k!(n − k)! sčítanců v součinu |M| s jeho algebraickým doplňkem je členem determinantu |A|. Obecně, uvažme submatici M, tj. čtvercovou matici, určenou řádky i1 < i2 < · · · < ik a sloupci j1 < · · · < jk. Pak pomocí (i1 − 1) + · · · + (ik − k) výměn sousedních řádků a (j1 − 1) + · · · + (jk − k) výměn sousedních sloupců v A převedeme tuto submatici M na hlavní submatici a doplňková matice přitom přejde právě na doplňkovou matici. Celá matice A přejde přitom v matici B, pro kterou platí podle 2.17 a definice determinantu |B| = (−1)α |A|, kde α = ∑k h=1(ih − jh) − 2(1 + · · · + k). Tím jsme ověřili: Tvrzení. Jestliže je A je čtvercová matice dimenze n a |M| je její minor řádu k < n, pak součin libovolného členu |M| s libovolným členem jeho algebraického doplňku je členem |A|. Toto tvrzení už podbízí představu, že by se pomocí takových součinů menších determinantů skutečně mohl determinant matic vyjadřovat. Víme, že |A| obsahuje právě n! různých členů, právě jeden pro každou permutaci. Tyto členy jsou navzájem různé jakožto polynomy v prvcích (neznámé obecné) matice A. Jestliže tedy ukážeme, že navzájem různých výrazů z předchozího tvrzení je právě tolik jako je tomu u determinantu |A|, pak dostaneme jejich součtem právě de- terminant. 86 3. DETERMINANTY Řešení. Začneme rozvíjet podle prvního sloupce, kde máme nejvíce (jednu) nul. Postupně dostáváme 1 3 5 6 1 2 2 2 1 1 1 2 0 1 2 1 = 1 · 2 2 2 1 1 2 1 2 1 − 1 · 3 5 6 1 1 2 1 2 1 + 1 · 3 5 6 2 2 2 1 2 1 Podle Saarusova pravidla = −2 − 2 + 6 = 2. 2.36. Nalezněte všechny hodnoty argumentu a takové, že a 1 1 1 0 a 1 1 0 1 a 1 0 0 0 −a = 1. Pro komplexní a uveďte buď jeho algebraický nebo goniometrický tvar. Řešení. Spočítáme determinant rozvinutím podle prvního sloupce ma- tice: D = a 1 1 1 0 a 1 1 0 1 a 1 0 0 0 −a = a · a 1 1 1 a 1 0 0 −a , dále rozvíjíme podle posledního řádku: D = a · (−a) a 1 1 a = −a2 (a2 − 1). Celkem dostáváme následující podmínku pro a: a4 − a2 + 1 = 0. Substitucí t = a2 , pak máme t2 − t + 1 s kořeny t1 = 1+i √ 3 2 = cos(π/3) + i sin(π/3), t1 = 1−i √ 3 2 = cos(π/3) − i sin(π/3) = cos(−π/3) + i sin(−π/3), odkud snadno určíme čtyři možné hodnoty parametru a: a1 = cos(π/6) + i sin(π/6) = √ 3/2 + i/2, a2 = cos(7π/6) + i sin(7π/6) = − √ 3/2 − i/2, a3 = cos(−π/6) + i sin(−π/6) = √ 3/2 − i/2, a4 = cos(5π/6) + i sin(5π/6) = − √ 3/2 + i/2. 2.37. Vandermondův determinant. Dokažte vzorec pro tzv. Vandermondův determinant, tj. determinant Vandermondovy matice: Vn = 1 1 . . . 1 a1 a2 . . . an a2 1 a2 . . . a2 n ... ... ... an−1 1 a2 . . . an−1 n = ∏ 1≤i i. Řešení. Ukážeme opravdu nádherný důkaz indukcí, nad nímž srdce matematika zaplesá. Pro n = 2 vztah triviálně platí. Nechť tedy platí CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Zbývá proto ukázat, že uvažované součiny |M| · |M∗ | obsahují právě n! různých členů z |A|. Ze zvolených k řádků lze vybrat (n k ) minorů M a podle předchozího lematu je každý z k!(n − k)! členů v součinech |M| s jejich algebraickými doplňky členem |A|. Přitom pro různé výběry M nemůžeme nikdy obdržet stejné členy a jednotlivé členy v (−1)i1+···+ik+j1+···+jl · |M| · |M∗ | jsou také po dvou různé. Celkem tedy máme právě požadovaný počet k!(n − k)! (n k ) = n! členů. Tím jsme bezezbytku dokázali tzv. Laplaceovu větu: Laplaceova věta Věta. Nechť A = (aij ) je čtvercová matice dimenze n nad libovolným okruhem skalárů a nechť je pevně zvoleno k jejích řádků. Pak |A| je součet všech (n k ) součinů (−1)i1+···+ik+j1+···+jl · |M| · |M∗ | minorů řádu k vybraných ze zvolených řádků, s jejich algebraickými doplňky. Uvedená věta převádí výpočet |A| na výpočet determinantů nižšího stupně. Této metodě výpočtu se říká Laplaceův rozvoj podle zvolených řádků či sloupců. Např. rozvoj podle i-tého řádku nebo i-tého sloupce: |A| = n∑ j=1 aij Aij = n∑ j=1 aji Aji kde Aij označuje algebraický doplněk k prvku aij (tj. k minoru stupně 1). Při praktickém počítání determinantů bývá výhodné kombinovat Laplaceův rozvoj s přímou metodou přičítání lineárních kombinací řádků či sloupců. 2.21. Důkaz Cauchyovy věty. Důkaz se opírá o trikovou ale elementární aplikaci Laplaceovy věty. Použijeme prostě dvakrát Laplaceův rozvoj na vhodné matice: Uvažme nejprve matici H dimenze 2n (používáme tzv. blokovou symboliku, tj. píšeme matici jakoby složenou ze (sub)matic A, B atd.) H = ( A 0 −E B ) =          a11 . . . a1n ... ... an1 . . . ann 0 . . . 0 ... ... 0 . . . 0 −1 0 ... 0 −1 b11 . . . b1n ... ... bn1 . . . bnn          Laplaceovým rozvojem podle prvních n řádků obdržíme právě |H| = |A| · |B|. Nyní budeme k posledním n sloupcům postupně přičítat lineární kombinace prvních n sloupců tak, abychom obdrželi 87 pro determinant matice určené čísly a1, . . . , ak a dokážeme, že platí i pro výpočet determinantu Vandermondovy matice určenou čísly a1, . . . , ak+1. Uvažme determinant Vk+1 jako polynom P v proměnné ak+1. Z definice determinantu vyplývá, že tento polynom bude stupně k v této proměnné a navíc čísla a1,...,ak budou jeho kořeny: nahradímeli totiž ve Vandermondově matici Vk+1 poslední sloupec tvořený mocninami čísla ak+1 libovolným z předchozích sloupců tvořeným mocninami čísla ai, tak hodnota tohoto pozměněného determinantu je vlastně hodnotou Vandermondova determinantu (jakožto polynomu v proměnné ak+1) v bodě ai. Tato je ovšem nulová, neboť determinant z matice se dvěma shodnými, tedy lineárně závislými, sloupci je nulový. To znamená, že ai je kořenem P . Nalezli jsme tedy k kořenů polynomu stupně k, tudíž všechny jeho kořeny a P musí být tvaru P = C(ak+1−a1)(ak+1−a2) · · · (ak+1−ak), kde C je nějaká konstanta, resp. vedoucí koeficient polynomu P . Uvážíme-li však výpočet determinantu Vk+1 pomocí rozvoje podle posledního sloupce, tak vidíme, že C = Vk, což už dokazuje vzorec pro Vk+1. Jiné řešení. (viz Návody a řešení cvičení) 2.38. Nalezněte matici algebraicky adjungovanou a matici inverzní k matici A =     1 0 2 0 0 3 0 4 5 0 6 0 0 7 0 8     . Řešení. Adjungovaná matice je A∗ =     A11 A12 A13 A14 A21 A22 A23 A24 A31 A32 A33 A34 A41 A42 A43 A44     T , kde Aij je algebraický doplňek prvku aij matice A, tedy součin čísla (−1)i+j a determinantu trojrozměrné matice vzniklé z A vynecháním i-tého řádku a j-tého sloupce. Platí A11 = 3 0 4 0 6 0 7 0 8 = −24, A12 = − 0 0 4 5 6 0 0 0 8 = 0, . . . A43 = − 1 0 0 0 3 4 5 0 0 = 0, A44 = 1 0 2 0 3 0 5 0 6 = −12. Dosazením získáme A∗ =     −24 0 20 0 0 −32 0 28 8 0 −4 0 0 16 0 −12     T =     −24 0 8 0 0 −32 0 16 20 0 −4 0 0 28 0 −12     . 2. DETERMINANTY matici s nulami v pravém dolním rohu. Dostaneme K =          a11 . . . a1n ... ... an1 . . . ann c11 . . . c1n ... ... cn1 . . . cnn −1 0 ... 0 −1 0 . . . 0 ... ... 0 . . . 0          . Prvky submatice nahoře vpravo přitom musí splňovat cij = ai1b1j + ai2b2j + · · · + ainbnj neboli jde právě o prvky součinu A · B a |K| = |H|. Přitom rozvojem podle posledních n sloupců dostáváme |K| = (−1)n+1+···+2n |A·B| = (−1)2n·(n+1) ·|A·B| = |A·B|. Tím je Cauchyova věta bezezbytku dokázána. 2.22. Determinant a inverzní matice. Předpokládejme nejprve, že existuje matice inverzní k matici A, tj. A · A−1 = E. Protože pro jednotkovou matici platí vždy |E| = 1, je pro každou invertibilní matici vždy |A| invertibilní skalár a díky Cauchyově větě platí |A|−1 = |A−1 |. My však nyní kombinací Laplaceovy věty a Cauchyho věty umíme říci víc. Vzorec pro inverzní matici Pro libovolnou čtvercovou matici A = (aij ) dimenze n definujeme matici A∗ = (a∗ ij ), kde a∗ ij = Aji jsou algebraické doplňky k prvkům aji v A. Matici A∗ nazýváme algebraicky adjungovaná matice k matici A. Věta. Pro každou čtvercovou matici A nad okruhem skalárů K platí (2.1) AA∗ = A∗ A = |A| · E. Zejména tedy (1) A−1 existuje jako matice nad okruhem skalárů K právě, když |A|−1 existuje v K. (2) Pokud existuje A−1 , pak platí A−1 = |A|−1 · A∗ . Důkaz. Jak jsme již zmínili, Cauchyova věta ukazuje, že z existence A−1 vyplývá invertibilita |A| ∈ K. Pro libovolnou čtvercovou matici A spočteme přímým výpočtem A · A∗ = (cij ), kde cij = n∑ k=1 aika∗ kj = n∑ k=1 aikAjk . Pokud i = j je to právě Laplaceův rozvoj |A| podle i-tého řádku. Pokud i ̸= j jde o rozvoj determinantu matice v níž je i-tý a j-tý řádek stejný a proto je cij = 0. Odtud plyne A · A∗ = |A| · E a dokázali jsme rovnost (2.1). Předpokládejme navíc, že |A| je invertibilní skalár. Jestliže zopakujeme předešlý výpočet pro A∗ · A, obdržíme 88 5. VEKTOROVÉ PROSTORY A LINEÁRNÍ ZOBRAZENÍ Inverzní matici A−1 určíme ze vztahu A−1 = |A|−1 · A∗ . Determinant matice A je (rozvojem podle prvního řádku) roven |A| = 1 0 2 0 0 3 0 4 5 0 6 0 0 7 0 8 = 3 0 4 0 6 0 7 0 8 + 2 0 3 4 5 0 0 0 7 8 = 16. Dostáváme tedy A−1 =     −3/2 0 1/2 0 0 −2 0 1 5/4 0 −1/4 0 0 7/4 0 −3/4     . 2.39. Najděte algebraicky adjungovanou matici F∗ , je-li F =   α β 0 γ δ 0 0 0 1   , α, β, γ, δ ∈ R. 2.40. Vypočítejte algebraicky adjungované matice k maticím (a)     3 −2 0 −1 0 2 2 1 1 −2 −3 −2 0 1 2 1     , (b) ( 1 + i 2i 3 − 2i 6 ) , přičemž i označuje imaginární jednotku. 4. Vektory a matice 5. Vektorové prostory a lineární zobrazení Jak popsat analyticky shodná zobrazení v rovině či prostoru jako je rotace, osová symetrie či zrcadlení, nebo projekci třírozměrného prostoru na dvojrozměrné plátno? Jak popsat zvětšení obrázku? Co mají společného? Jsou to všechno lineární zobrazení. Znamená to, že zachovávají jistou strukturu roviny či prostoru. Jakou strukturu? Strukturu vektorového prostoru. Každý bod v rovině je popsán dvěma v prostoru pak třema souřadnicemi. Pokud zvolíme počátek souřadnic, tak má smysl mluvit o tom, že nějaký bod je dvakrát dál od počátku stejným směrem než jiný bod. Také víme, kam se dostaneme, posuneme-li se o nějaký úsek v jistém směru a pak o jiný úsek v jiném směru. Tyto vlastnosti můžeme zformalizovat, hovoříme-li o vektorech v rovině, či prostoru a o jejich násobcích, či součtech. Lineární zobrazení má pak tu vlastnost, že obraz součtu vektorů je součet obrazů sčítaných vektorů a obraz násobku vektoru je ten stejný násobek obrazu násobeného vektoru. Tyto vlastnosti právě mají zobrazení zmíněná v úvodu tohoto odstavce. Takové zobrazení je pak jednoznačně určeno tím, jak se chová na vektrorech nějaké báze (to je v rovině obrazem dvou vektorů neležících na přímce, v prostoru obrazem tří vektorů neležích v rovině). CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA |A|−1 A∗ · A = E. Proto náš výpočet skutečně dává inverzní matici A, jak je tvrzeno ve větě. 3. Vektorové prostory a lineární zobrazení Vraťme se teď na chvilku k systémům m lineárních rovnic pro n proměnných z 2.3 a předpokládejme navíc, že jde o rovnice tvaru A · x = 0, tj.    a11 . . . a1n ... ... am1 . . . amn    .    x1 ... xn    =    0 ... 0    . Díky vlastnosti distributivity pro násobení matic je zřejmé, že součet dvou řešení x = (x1, . . . , xn) a y = (y1, . . . , yn) splňuje A · (x + y) = A · x + A · y = 0 a je tedy také řešením. Stejně tak zůstává řešením i skalární násobek a · x. Množina všech řešení pevně zvoleného systému rovnic je proto uzavřená na sčítání vektorů a násobení vektorů skaláry. To byly základní vlastnosti vektorů dimenze n v Kn , viz 2.1. Teď ale máme vektory v prostoru řešení s n souřadnicemi a „dimenze“ tohoto prostoru určitě nemá být n (pokud matice systému není nulová). Případy dvou rovnic pro dvě neznámé jsme potkali při řešení geometrických problémů v rovině v 1.25 a pro dvě závislé rovnice byl množinou všech řešení „jednorozměrný“ prostor – přímka. U dvou nezávislých rovnic to byl průsečík dvou přímek, tj. „nularozměrný“ prostor. 2.23. Abstraktní vektorové prostory. Už v 1.12, jsme ale potkali ještě zajímavější příklad prostoru všech řešení homogenní lineární diferenční rovnice (druhého řádu). Opět jsme dvě řešení mohli libovolně kombinovat pomocí sčítání a násobení skaláry a dostali jsme tak všechna možná řešení. Tyto „vektory“ ovšem jsou nekonečné posloupnosti čísel, přestože intuitivně očekáváme, že dimenze celého prostoru řešení by měla být dvě. Potřebujeme proto obecnější definici vektorového prostoru a jeho dimenze: Definice vektorového prostoru Vektorovým prostorem V nad polem skalárů K rozumíme množinu, na které jsou definovány • operace sčítání splňující axiomy 1.1(KG1)–(KG4), • násobení skaláry, pro které platí axiomy 2.1(V1)–(V4). Připoměňme naši jednoduchou konvenci ohledně značení: skaláry budou zpravidla označovány znaky z počátku abecedy, tj. a, b, c, . . . , zatímco pro vektory budeme užívat znaky z konce, u, v, w, x, y, z. Přitom ještě navíc většinou x, y, z budou opravdu n-tice skalárů. Pro úplnost výčtu, písmena z prostředka, např. i, j, k, ℓ budou nejčastěji označovat indexy výrazů. Abychom se trochu pocvičili ve formálním postupu, ověříme jednoduché vlastnosti vektorů, které pro n-tice 89 A jak tedy zapsat nějaké lineární zobrazení f na vektorovém prostoru V ? Začněme pro jednoduchost s rovinou R2 : předpokládejme, že obraz bodu (vektoru) (1, 0) je (a, b) a obraz bodu (0, 1) je (c, d). Tím už je jednoznačně určený obraz libovolného bodu o souřadnicích (u, v): f ((u, v)) = f (u(1, 0) + v(0, 1)) = uf (1, 0) + vf (1, 0) = (ua, ub) + (vc, vd) = (au + cv, bu + dv), což můžeme výhodně zapsat následujícím způsobem: ( a c b d ) ( u v ) = ( au + cv bu + dv ) Lineární je tedy zobrazení jednoznačně dané maticí. Navíc pokud máme další lineární zobrazení g, dané maticí ( e f g h ) , tak snadno spočítáme (čtenář si jistě ze zájmu sám ověří), že jejich složení g ◦ f je dáno maticí ( ae + f c be + df ag + ch bg + dh ) . To nás vede k tomu, abychom násobení matic definovali tímto způsobem, tedy aby aby aplikace zobrazení na vektor byla dána maticovým násobením matice zobrazení se zobrazovaným vektorem a aby složení zobrazení bylo dáno součinem matic jednotlivých zobrazení. Obdobně to funguje v prostorech vyšší dimenze. Zároveň nám to zajistí, že násobení matic bude asociativní, ale nebude komutativní, neboť tomu tak je u skládání zobrazení. To je tedy další z motivací, proč se zabývat vektorovými prostory a proč je s pojmem vektorového prostoru úzce spojen pojem matice. Dále si samozřejmě ukážeme celou řadu jiných využití počítání s maticemi a vektory. Vlastnosti vektorového prostoru, kterých jsme si všimli u roviny či třírozměrného prostoru, ve kterém žijeme, má celá řada jiných množin. Ukažme si to na příkladech. 2.41. Vektorový prostor ano či ne? Rozhodněte o následujících množinách, jestli jsou vektorovými prostory nad tělesem reálných čí- sel: i) Množina všech reálných, resp. komplexních, posloupností. (Reálnou, resp. komplexní posloupností rozumíme zobrazení f : N → R, resp. f : N → C. O obrazu čísla n pak hovoříme jako o n-tém členu posloupnosti, většinou jej označujeme dolním indexem, např. an.) ii) Množina řešení homogenní diferenční rovnice. iii) Množina řešení nehomogenní diferenční rovnice. iv) {f : R → R|f (1) = f (2) = c, c ∈ R} Řešení. (1) Ano. Množina všech reálných, resp. komplexních, posloupností tvoří zřejmě reálný, resp. komplexní, vektorový prostor. Sčítání posloupností a násobení posloupnosti skalárem je totiž definováno 3. VEKTOROVÉ PROSTORY A LINEÁRNÍ ZOBRAZENÍ skalárů byly samozřejmé, nicméně teď je musíme odvodit z axiomů. Tvrzení. Nechť V je vektorový prostor nad polem skalárů K, dále uvažme a, b, ai ∈ K, vektory u, v, uj ∈ V . Potom (1) a · u = 0 právě když a = 0 nebo u = 0 (2) (−1) · u = −u (3) a · (u − v) = a · u − a · v (4) (a − b) · u = a · u − b · u (5) (∑n i=1 ai ) · (∑m j=1 uj ) = ∑n i=1 ∑m j=1 ai · uj . Důkaz. Můžeme rozepsat (a + 0) · u (V 2) = a · u + 0 · u = a · u což podle axiomu (KG4) zaručuje 0 · u = 0. Nyní u + (−1) · u (V 2) = (1 + (−1)) · u = 0 · u = 0 a odtud −u = (−1) · u. Dále a · (u + (−1) · v) (V 2,V 3) = a · u + (−a) · v = a · u − a · v což dokazuje (3). Platí (a − b) · u (V 2,V 3) = a · u + (−b) · u = a · u − b · u a tím je ověřeno (4). Vztah (5) plyne indukcí z (V2) a (V1). Zbývá (1): a·0 = a·(u−u) = a·u−a·u = 0, což spolu s prvním tvrzením tohoto důkazu ukazuje jednu implikaci. K opačné implikaci poprvé potřebujeme axiom pole pro skaláry a axiom (V4) pro vektorové prostory: je-li p · u = 0 a p ̸= 0, pak u = 1 · u = (p−1 · p) · u = p−1 · 0 = 0. 2.24. Lineární (ne)závislost. V odstavci 2.11 jsme pracovali s tzv. lineárními kombinacemi řádků matice. S obecnými vektory budeme zacházet zcela analogicky: Lineární kombinace a nezávislost Výrazy tvaru a1 ·v1 +· · ·+ak ·vk nazýváme lineární kombinace vektorů v1, . . . , vk ∈ V . Množina vektorů M ⊂ V ve vektorovém prostoru V nad K se nazývá lineárně nezávislá jestliže pro každou k-tici vektorů v1, . . . , vk ∈ M a každé skaláry a1, . . . , ak ∈ K platí: a1 ·v1 +· · ·+ak ·vk = 0 ⇒ a1 = a2 = · · · = ak = 0. Posloupnost vektorů v1, . . . , vk nazveme lineárně nezávislou jestliže v1, . . . , vk jsou po dvou různé a {v1, . . . , vk} je lineárně nezávislá. Množina M vektorů je lineárně závislá, jestliže není lineárně nezávislá. Přímo z definice pak vyplývá, že neprázdná podmnožina M vektorů ve vektorovém prostoru nad polem skalárů K je závislá právě, když je jeden z jejích vektorů vyjádřitelný jako lineární kombinace ostatních. Skutečně, alespoň jeden koeficient ve výrazu musí být nenulový a protože jsme nad polem skalárů, můžeme jím podělit a vyjádřit tak u něj stojící vektor pomocí ostatních. 90 5. VEKTOROVÉ PROSTORY A LINEÁRNÍ ZOBRAZENÍ člen po členu, kde se jedná o vektorový prostor reálných, resp. komplexních, čísel. (2) Ano. Abychom ukázali, že množina posloupností vyhovujících dané diferenční homogenní rovnici tvoří vektorový prostor, stačí ukázat, že je uzavřená vzhledem ke sčítání i násobení reálným číslem (neboť se jedná o podmnožinu vektorového prostoru) mějme posloupnosti (xn)∞ n=0 a (yn)∞ n=0 vyhovující stejné homogenní diferenční rovnici, tedy a(n)xn + a(n − 1)xn−1 + · · · + a(1)x1 = 0 a(n)yn + a(n − 1)yn−1 + · · · + a(1)y1 = 0. Sečtením těchto rovnic dostaneme a(n)(xn + yn) + a(n − 1)(xn−1 + yn−1) + · · · + a(1)(x1 + y1) = 0, tedy i posloupnost (xn + yn)∞ n=0, vyhovuje stejné diferenční rovnici. Rovněž tak pokud posloupnost (xn)∞ n=0 vyhovuje dané rovnici, tak i posloupnost (kxn)∞ n=0, kde k ∈ R. (2) Ne. Součet dvou řešení nehomogenní rovnice a(n)xn + a(n − 1)xn−1 + · · · + a(1)x1 = c a(n)yn + a(n − 1)yn−1 + · · · + a(1)y1 = c, c ∈ R − {0} vyhovuje rovnici a(n)(xn + yn) + a(n − 1)(xn−1 + yn−1) + · · · + a(1)(x1 + y1) = 2c, zejména pak nevyhovuje původní nehomogenní rovnici. Množina řešení však tvoří afinní prostor, viz 4.1. (3) Je to vektorový prostor právě, když c = 0. Vezme-li dvě funkce f a g z dané množiny, pak (f + g)(1) = (f + g)(2) = f (1) + g(1) = 2c. Má-li funkce f + g být prvkem dané množiny, musí být (f + g)(1) = c, tedy 2c = c, tedy c = 0. 2.42. Zjistěte, zda je množina U1 = {(x1, x2, x3) ∈ R3 ; | x1 | = | x2 | = | x3 |} podprostorem vektorového prostoru R3 a množina U2 = {ax2 + c; a, c ∈ R} podprostorem prostoru polynomů stupně nejvýše 2. Řešení. Množina U1 není vektorovým (pod)prostorem. Vidíme např., že je (1, 1, 1) + (−1, 1, 1) = (0, 2, 2) /∈ U1. Množina U2 ovšem podprostor tvoří (nabízí se přirozené ztotožnění s R2 ), protože ( a1x2 + c1 ) + ( a2x2 + c2 ) = (a1 + a2) x2 + (c1 + c2), CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Každá podmnožina lineárně nezávislé množiny M je samozřejmě také lineárně nezávislá (požadujeme stejné podmínky na méně vektorů). Stejně snadno vidíme, že M ⊂ V je lineárně nezávislá právě tehdy, když každá konečná podmnožina v M je lineárně nezávislá. 2.25. Generátory a podprostory. Podmnožina M ⊂ V se nazývá vektorovým podprostorem jestliže spolu se zúženými operacemi sčítání a násobení skaláry je sama vektorovým prostorem. Tzn. požadujeme ∀a, b ∈ K, ∀v, w ∈ M, a · v + b · w ∈ M. Rozeberme si hned několik příkladů: Prostor m–tic skalárů Rm se sčítáním a násobením po složkách je vektorový prostor nad R, ale také vektorový prostor nad Q. Např. pro m = 2, jsou vektory (1, 0), (0, 1) ∈ R2 lineárně nezávislé, protože z a · (1, 0) + b · (0, 1) = (0, 0) plyne a = b = 0. Dále, vektory (1, 0), ( √ 2, 0) ∈ R2 jsou lineárně závislé nad R, protože √ 2·(1, 0) = ( √ 2, 0), ovšem nad Q jsou lineárně nezávislé! Nad R tedy tyto dva vektory „generují“ jednorozměrný podprostor, zatímco nad Q je dvourozměrný. Polynomy stupně nejvýše m tvoří vektorový prostor Rm[x]. Polynomy můžeme chápat jako zobrazení f : R → R a sčítání a násobení skaláry definujeme takto: (f + g)(x) = f (x) + g(x), (a · f )(x) = a · f (x). Polynomy všech stupňů také tvoří vektorový prostor R∞[x] a Rm[x] ⊂ Rn[x] je vektorový podprostor pro všechna m ≤ n ≤ ∞. Podprostory jsou také např. všechny sudé polynomy nebo liché polynomy, tj. splňující f (−x) = ±f (x). Úplně analogicky jako u polynomů můžeme definovat strukturu vektorového prostoru na množině všech zobrazení R → R nebo všech zobrazení M → V libovolné pevně zvolené množiny M do vektorového prostoru V . Protože podmínka v definici podprostoru obsahuje pouze univerzální kvantifikátory, je jistě průnik podprostorů opět podprostor. Snadno to ověříme i přímo: Nechť Wi, i ∈ I, jsou vektorové podprostory ve V , a, b ∈ K, u, v ∈ ∩i∈I Wi. Pak pro všechny i ∈ I, a · u + b · v ∈ Wi, to ale znamená, že a · u + b · v ∈ ∩i∈I Wi. Zejména je tedy podprostorem průnik všech podprostorů W ⊂ V , které obsahují předem danou množinu vektorů M ⊂ V . Říkáme, že takto M generuje podprostor ⟨M⟩, nebo že prvky M jsou generátory podprostoru ⟨M⟩. Zformulujme opět několik jednoduchých tvrzení o generování podprostorů: Tvrzení. Pro každou podmnožinu M ⊂ V platí (1) ⟨M⟩ = {a1 · u1 + · · · + ak · uk; k ∈ N, ai ∈ K, uj ∈ M, j = 1, . . . , k}; (2) M = ⟨M⟩ právě když M je vektorový podprostor; (3) jestliže N ⊂ M pak ⟨N⟩ ⊂ ⟨M⟩ je vektorový podprostor; (4) ⟨∅⟩ = {0} ⊂ V , triviální podprostor. 91 k · ( ax2 + c ) = (ka) x2 + kc pro všechna čísla a1, c1, a2, c2, a, c, k ∈ R. 2.43. Je množina V = {(1, x); x ∈ R} s operacemi ⊕ : V × V → V, (1, y) ⊕ (1, z) = (1, z + y) pro všechna ⊙ : R × V → V, z ⊙ (1, y) = (1, y · z) pro všechna vektorovým prostorem? 6. Lineární závislost a nezávislost 2.44. Výpočtem determinantu vhodné matice rozhodněte o lineární nezávislosti vektorů (1, 2, 3, 1), (1, 0, −1, 1), (2, 1, −1, 3) a (0, 0, 3, 2). Řešení. Protože 1 2 3 1 1 0 −1 1 2 1 −1 3 0 0 3 2 = 10 ̸= 0, uvedené vektory jsou lineárně nezávislé. 2.45. Nechť jsou dány libovolné lineárně nezávislé vektory u, v, w, z ve vektorovém prostoru V . Rozhodněte, zda jsou ve V lineárně závislé, či nezávislé, vektory u − 2v, 3u + w − z, u − 4v + w + 2z, 4v + 8w + 4z. Řešení. Uvažované vektory jsou lineárně nezávislé právě tehdy, když jsou lineárně nezávislé vektory (1, −2, 0, 0), (3, 0, 1, −1), (1, −4, 1, 2), (0, 4, 8, 4) v R4 . Je však 1 −2 0 0 3 0 1 −1 1 −4 1 2 0 4 8 4 = −36 ̸= 0, tudíž jsou uvažované vektory lineárně nezávislé. 2.46. Určete všechny konstanty a ∈ R takové, aby polynomy ax2 + x + 2, −2x2 + ax + 3 a x2 + 2x + a byly lineárně závislé (ve vektorovém prostoru P3[x], polynomů jedné proměnné stupně nejvýše 3 nad reálnými čísly). Řešení. V bázi 1, x, x2 jsou souřadnice zadaných vektorů (polynomů) následující: (a, 1, 2), (−2, a, 3), (1, 2, a). Polynomy budou lineárně závislé, právě když bude mít matice, jejíž řádky jsou tvořeny souřadnicemi zadaných vektorů menší hodnost, než je počet vektorů, v tomto případě tedy hodnost dvě a menší. V případě čtvercové matice nižší 3. VEKTOROVÉ PROSTORY A LINEÁRNÍ ZOBRAZENÍ Důkaz. (1) Množina všech lineárních kombinací a1u1+ · · · + akuk na pravé straně (1) je jistě vektorový podprostor a samozřejmě obsahuje M. Naopak, každá z jednotlivých lineárních kombinací nutně musí být v ⟨M⟩ a první tvrzení je dokázáno. Tvrzení (2) vyplývá okamžitě z (1) a z definice vektorového podprostoru a obdobně je z prvního tvrzení zřejmé i tvrzení třetí. Konečně, nejmenší vektorový podprostor je {0}, protože prázdnou množinu obsahují všechny podprostory a každý z nich obsahuje 0. 2.26. Součty podprostorů. Když už máme představu o generátorech a jimi vytvářených podprostorech, měli bychom rozumět i možnostem, jak několik podprostorů může vytvářet celý vektorový prostor V . Součty podprostorů Nechť Vi, i ∈ I, jsou podprostory ve V . Pak podprostor generovaný jejich sjednocením, tj. ⟨∪i∈I Vi⟩, nazýváme součtem podprostorů Vi. Značíme ∑ i∈I Vi. Zejména pro V1, . . . , Vk ⊂ V , V1 + · · · + Vk = ⟨V1 ∪ V2 ∪ · · · ∪ Vk⟩. Vidíme jsme, že každý prvek v uvažovaném součtu podprostorů můžeme vyjádřit jako lineární kombinaci vektorů z podprostorů Vi. Protože však je sčítání vektorů komutativní, lze k sobě poskládat členy patřící do stejného podprostoru a pro konečný součet k podprostorů tak dostáváme V1 +V2 +· · ·+Vk = {v1 +· · ·+vk; vi ∈ Vi, i = 1, . . . , k}. Součet W = V1 + · · · + Vk ⊂ V se nazývá přímý součet podprostorů, jsou-li průniky všech dvojic triviální, tj. Vi ∩ Vj = {0} pro všechny i ̸= j. Ukážeme, že v takovém případě lze každý vektor w ∈ W napsat právě jedním způsobem jako součet w = v1 + · · · + vk, kde vi ∈ Vi. Skutečně, pokud by tento vektor šlo zároveň vyjádřit, jako w = v′ 1 + · · · + v′ k, potom 0 = w − w = (v1 − v′ 1) + · · · + (vk − v′ k). Pokud bude vi − v′ i první nenulový člen na pravé straně, pak tento vektor z Vi umíme vyjádřit pomocí vektorů z ostatních podprostorů. To je ale ve sporu s předpokladem, že Vi má se všemi ostatními nulový průnik. Jedinou možností tedy je, že všechny vektory na pravé straně jsou nulové a tedy je rozklad w jednoznačný. Pro přímé součty podprostorů píšeme W = V1 ⊕ · · · ⊕ Vk = ⊕k i=1Vi. 2.27. Báze. Nyní máme vše připravené pochopení minimálních množin generátorů tak, jak jsme to dělali v rovnině R2 . 92 6. LINEÁRNÍ ZÁVISLOST A NEZÁVISLOST hodnost než je počet řádků je ekvivalentní nulovosti determinantu dané matice. Podmíka na a tedy zní a 1 2 −2 a 3 1 2 a = 0, tj. a bude kořenem polynomu a3 − 6a − 5 = (a + 1)(a2 − a − 5), tj. úloha má tři řešení a1 = −1, a2,3 = 1± √ 21 2 . 2.47. Vektory (1, 2, 1), (−1, 1, 0), (0, 1, 1) jsou lineárně nezávislé, a proto z nich lze sestavit bázi R3 . Každý trojrozměrný vektor je tak nějakou jejich lineární kombinací. Jakou jejich lineární kombinací je vektor (1, 1, 1)? 2.48. Vyjádřete vektor (5, 1, 11) jako lineární kombinaci vektorů (3, 2, 2), (2, 3, 1), (1, 1, 3), tj. nalezněte čísla p, q, r ∈ R, pro která je (5, 1, 11) = p (3, 2, 2) + q (2, 3, 1) + r (1, 1, 3) . 2.49. Pro jaké hodnoty parametrů a, b, c ∈ R jsou vektory (1, 1, a, 1), (1, b, 1, 1), (c, 1, 1, 1) lineárně závislé? 2.50. Nechť je dán vektorový prostor V a nějaká jeho báze složená z vektorů u, v, w, z. Zjistěte, zda jsou vektory u − 3v + z, v − 5w − z, 3w − 7z, u − w + z lineárně (ne)závislé. 2.51. Doplňte vektory 1 − x2 + x3 , 1 + x2 + x3 , 1 − x − x3 na bázi prostoru polynomů stupně nejvýše 3. 2.52. Tvoří matice ( 1 0 1 −2 ) , ( 1 4 0 −1 ) , ( −5 0 3 0 ) , ( 1 −2 0 3 ) bázi vektorového prostoru čtvercových dvourozměrných matic? Řešení. Uvedené čtyři matice jsou jako vektory v prostoru 2×2 matic lineárně nezávislé. Vyplývá to z toho, že matice     1 1 −5 1 0 4 0 −2 1 0 3 0 −2 −1 0 3     je tzv. regulární, což je mimochodem ekvivalentní livovolnému z následujích tvrzení: její hodnost je rovna rozměru;ze z ní pomocí řádkových elementárních transformací obdržet jednotkovou matici; existuje k ní matice inverzní; má nenulový determinant, roven 116; jí zadaná homogenní soustava lineárních rovnic má pouze nulové řešení; každý nehomogenní lineární systém s levou stranou určenou touto maticí má CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Báze vektorových prostorů Podmnožina M ⊂ V se nazývá báze vektorového prostoru V , jestliže ⟨M⟩ = V a M je lineárně nezávislá. Vektorový prostor, který má konečnou bázi nazýváme konečněrozměrný, mohutnost báze nazýváme dimenzí V . Nemá-li V konečnou bázi, říkáme, že V je nekonečněrozměrný. Píšeme dim V = k, k ∈ N, případně k = ∞. Všimněme si, že triviální podprostor je generován prázdnou množinou, která je "prázdnou"bazí. Má tedy triviální podprostor dimenzi nulovou. Bázi k-rozměrného prostoru budeme obvykle zapisovat jako k-tici v = (v1 . . . , vk) bázových vektorů. Jde tu především o zavedení konvence: U konečněrozměrných podprostorů budeme totiž vždy uvažovat bázi včetně zadaného pořadí prvků i když jsme to takto, striktně vzato, nedefino- vali. Zjevně, je-li (v1, . . . , vn) bazí V , je celý prostor V přímým součtem jednorozměrných podprostorů V = ⟨v1⟩ ⊕ · · · ⊕ ⟨vn⟩. Okamžitým důsledkem výše odvozené jednoznačnosti rozkladu jakéhokoliv vektoru ve V do komponent v přímém součtu dává jednoznačné vyjádření w = x1v1 + · · · + xnvn a dovoluje nám tedy po volbě báze opět vidět vektory jako n– tici skalárů. K tomuto pohledu se vrátíme v zápětí v odstavci 2.31, jak jen dokončíme diskusi existence bazí a součtů podprostorů v obecné poloze. 2.28. Věta. Z libovolné konečné množiny generátorů vektorového prostoru V lze vybrat bázi. Každá báze V má přitom stejný počet prvků. Důkaz. První tvrzení ukážeme snadno indukcí přes počet generátorů k. Jedině nulový podprostor nepotřebuje žádný generátor a tedy umíme vybrat prázdnou bázi. Naopak, nulový vektor vybrat nesmíme (generátory by byly lineárně závislé) a nic jiného už v podprostoru není. Abychom měli indukční krok přirozenější, probereme ještě přímo případ k = 1. Máme V = ⟨{v}⟩ a v ̸= 0 protože {v} je lineárně nezávislá množina vektorů. Pak je ovšem {v} zároveň báze V . Předpokládejme, že tvrzení platí pro k = n, a uvažme V = ⟨v1, . . . , vn+1⟩. Jsou-li v1, . . . , vn+1 lineárně nezávislé, pak tvoří bázi. V opačném případě existuje index i takový, že vi = a1v1 + · · · + ai−1vi−1 + ai+1vi+1 + · · · + an+1vn+1. Pak ovšem V = ⟨v1, . . . , vi−1, vi+1, . . . , vn+1⟩ a již umíme vybrat bázi (podle indukčního předpokladu). 93 právě jedno řešení; obor hodnot lineárního zobrazení, jež zadává, je vektorový prostor dimenze 4; toto zobrazení je injektivní). 2.53. Uvažme komplexní čísla C jako reálný vektorový prostor. Určete souřadnice čísla 2+i v bázi dané kořeny polynomu x2 +x +1. 2.54. Uvažme komplexní čísla C jako reálný vektorový prostor. Určete souřadnice čísla 2+i v bázi dané kořeny polynomu x2 −x +1. 7. Průniky a sjednocení vektorových prostorů, generátory 2.55. V R3 jsou dány podprostory U a V generované po řadě vektory (1, 1, −3) , (1, 2, 2) a (1, 1, −1) , (1, 2, 1) , (1, 3, 3) . Nalezněte průnik těchto podprostorů. Řešení. Podprostor V má dimenzi pouze 2 (nejedná se tedy o celý prostor R3 ), neboť 1 1 −1 1 2 1 1 3 3 = 1 1 1 1 2 3 −1 1 3 = 0 a neboť libovolná dvojice z uvažovaných třech vektorů je očividně lineárně nezávislá. Stejně snadno vidíme, že také podprostor U má dimenzi 2. Současně je 1 1 1 1 2 1 −3 2 −1 = 2 ̸= 0, a proto vektor (1, 1, −1) nemůže náležet do podprostoru U. Průnikem rovin procházejících počátkem (dvojrozměrných podprostorů) v trojrozměrném prostoru musí být alespoň přímka. V našem případu je jím právě přímka (podprostory nejsou totožné). Určili jsme dimenzi průniku – je jednodimenzionální. Všimneme-li si, že 1 · (1, 1, −3) + 2 · (1, 2, 2) = (3, 5, 1) = 1 · (1, 1, −1) + 2 · (1, 2, 1) , dostáváme vyjádření hledaného průniku ve tvaru množiny všech skalárních násobků vektoru (3, 5, 1) (jedná se o přímku procházející počátkem s tímto směrovým vektorem). 2.56. Stanovte vektorový podprostor (prostoru R4 ) generovaný vektory u1 = (−1, 3, −2, 1), u2 = (2, −1, −1, 2), u3 = (−4, 7, −3, 0), u4 = (1, 5, −5, 4). vybráním nějaké maximální množiny lineárně nezávislých vektorů ui (tj. vybráním báze). Řešení. Sepíšeme vektory ui do sloupců matice a obdrženou matici upravíme pomocí řádkových elementárních transformací. Takto zís- káme 3. VEKTOROVÉ PROSTORY A LINEÁRNÍ ZOBRAZENÍ Zbývá ověřit, že báze mají vždy stejný počet prvků. Uvažujme bázi (v1, . . . , vn) prostoru V a libovolný nenulový vek- tor u = a1v1 + · · · + anvn ∈ V s ai ̸= 0 pro jisté i. Pak vi = 1 ai ( u−(a1v1 +· · ·+ai−1vi−1 +ai+1vi+1 +· · ·+anvn) ) a proto také ⟨u, v1, . . . , vi−1, vi+1, . . . , vn⟩ = V . Jistě je to opět báze, protože vektory v1, . . . , vi−1, vi+1, . . . , vn byly nezávislé, takže kdyby přidáním u vznikly lineárně závislé vektory, pak by u bylo jejich lineární kombinací, ale to by zna- menalo V = ⟨v1, . . . , vi−1, vi+1, . . . , vn⟩, což není možné. Takže už víme, že pro libovolný nenulový vektor u ∈ V existuje i, 1 ≤ i ≤ n, takové, že (u, v1, . . . , vi−1, vi+1, . . . , vn) je opět báze V . Dále budeme místo jednoho vektoru u uvažovat lineárně nezávislou množinu u1, . . . , uk a budeme postupně přidávat u1, u2, . . . , vždy výměnou za vhodné vi podle předchozího postupu. Je třeba pouze ověřit, že takové vi vždy bude existovat (tj. že se nebudou vektory u vyměňovat vzájemně). Předpokládejme tedy, že již máme umístěné u1, . . . , uℓ. Pak uℓ+1 se jistě vyjádří jako lineární kombinace těchto vektorů a zbylých vj . Pokud by pouze koeficienty u u1, . . . , uℓ byly nenulové, znamenalo by to, že již samy vektory u1, . . . , uℓ+1 byly lineárně závislé, což je ve sporu s našimi předpoklady. Pro každé k ≤ n tak po k krocích získáme bázi ve které z původní došlo k výměně k vektorů za nové. Pokud by k > n, pak již v n-tém kroku obdržíme bázi vybranou z nových vektorů ui, což znamená, že tyto nemohou být lineárně nezávislé. Zejména tedy není možné, aby dvě báze měly různý počet prvků. Ve skutečnosti jsme dokázali silnější tvrzení, tzv. Steinitzovu větu o výměně, která říká, že pro každou konečnou bázi v a každý systém lineárně nezávislých vektorů ve V umíme najít podmnožinu bázových vektorů vi, po jejichž záměně za zadané nové vektory opět dostaneme bázi. 2.29. Důsledky Steinitzovy věty o výměně. Díky možnosti volně volit a vyměňovat bázové vektory můžeme okamžitě dovodit pěkné (a intuitivně snad také očekávané) vlastnosti bazí vektorových prostorů: Tvrzení. (1) Každé dvě báze konečněrozměrného vektorového prostoru mají stejný počet vektorů, tzn. že naše definice dimenze nezávisí na volbě báze. (2) Má-li V konečnou bázi, lze každou lineárně nezávislou množinu doplnit do báze. (3) Báze konečněrozměrných vektorových prostorů jsou právě maximální lineárně nezávislé množiny. (4) Báze prostoru s konečnou dimenzí jsou právě minimální množiny generátorů. 94 8. LINEÁRNÍ ZOBRAZENÍ     −1 2 −4 1 3 −1 7 5 −2 −1 −3 −5 1 2 0 4     ∼     1 2 0 4 −1 2 −4 1 3 −1 7 5 −2 −1 −3 −5     ∼     1 2 0 4 0 4 −4 5 0 −7 7 −7 0 3 −3 3     ∼     1 2 0 4 0 1 −1 5/4 0 1 −1 1 0 0 0 0     ∼     1 2 0 4 0 1 −1 5/4 0 0 0 −1/4 0 0 0 0     ∼     1 0 2 0 0 1 −1 0 0 0 0 1 0 0 0 0     Odtud vyplývá, že lineárně nezávislé jsou právě vektory u1, u2, u4, tj. právě ty vektory odpovídající sloupcům, které obsahují první nenulové číslo nějakého řádku. Navíc odsud plyne (viz třetí sloupec) 2 · (−1, 3, −2, 1) − (2, −1, −1, 2) = (−4, 7, −3, 0). 8. Lineární zobrazení 2.57. Popišme si nejprve některá lineární zobrazení. Začneme několika příklady v prostorech malých dimenzí. Ve standardní bázi R2 uvažujme následující matice zobrazení f : R2 → R2 : A = ( 1 0 0 0 ) , B = ( 0 1 0 0 ) , C = ( a 0 0 b ) , D = ( 0 −1 1 0 ) . Matice A zadává kolmou projekci podél podprostoru W ⊂ {(0, a); a ∈ R} ⊂ R2 na podprostor V ⊂ {(a, 0); a ∈ R} ⊂ R2 . Evidentně pro toto zobrazení f : R2 → R2 platí f ◦ f = f a tedy f |Im f je identické zobrazení. Jádrem f je právě podprostor W. Matice B má vlastnost B2 = 0, platí tedy totéž o příslušném zobrazení f . Můžeme si jej představit jako matici derivování polynomů R1[x] stupně nejvýše jedna v bázi (1, x). Matice C zadává zobrazení f , které první vektor báze zvětší a– krát, druhý b–krát. Tady se nám tedy celá rovina rozpadá na dva podprostory, které jsou zobrazením f zachovány a ve kterých jde o pouhou homotetii, tj. roztažení skalárním násobkem. Např. volba a = 1, b = −1 odpovídá komplexní konjugaci x + iy → x − iy na dvourozměrném reálném prostoru R2 ≃ C v bázi (1, i). Toto je lineární zobrazení reálného vektorového prostoru, nikoliv však jednorozměrného komplexního prostoru C. V geometrii roviny jde o zrcadlení podle osy x. Matice D je maticí rotace o pravý úhel ve standardní bázi. Jako pro každé lineární zobrazení, které je bijekcí, umíme najít báze na definičním oboru a oboru hodnot, ve kterých bude jeho maticí jednotková matice E (prostě vezmeme jakoukoliv bázi na definičním oboru a její obraz na oboru hodnot). Neumíme ale v tomto případě totéž s CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Malinko složitější, ale nyní snadno zvládnutelná, je situace kolem dimenzí podprostorů a jejich součtů: Důsledek. Nechť W, W1, W2 ⊂ V jsou podprostory v prostoru konečné dimenze. Pak platí (1) dim W ≤ dim V (2) V = W právě když dim V = dim W (3) dim W1 + dim W2 = dim(W1 + W2) + dim(W1 ∩ W2). Důkaz. Zbývá dokázat pouze poslední tvrzení. To je zřejmé, pokud je dimenze jednoho z prostorů nulová. Předpokládejme tedy dim W1 = r ̸= 0, dim W2 = s ̸= 0 a nechť (w1 . . . , wt ) je báze W1 ∩W2 (nebo prázdná množina, pokud je průnik triviální). Podle Steinitzovy věty o výměně lze tuto bázi doplnit na bázi (w1, . . . , wt , ut+1 . . . , ur) pro W1 a bázi (w1 . . . , wt , vt+1 , . . . , vs) pro W2. Vektory w1, . . . , wt , ut+1 , . . . , ur, vt+1 . . . , vs jistě generují W1 + W2. Ukážeme, že jsou přitom lineárně nezávislé. Nechť tedy a1w1+· · ·+at wt +bt+1 ut+1 +· · ·+brur+ct+1 vt+1 +· · ·+csvs = 0 Pak nutně − (ct+1 · vt+1 + · · · + cs · vs) = = a1 · w1 + · · · + at · wt + bt+1 · ut+1 + · · · + br · ur musí patřit do W2 ∩ W1. To ale má za následek, že bt+1 = · · · = br = 0, protože tak jsem doplňovali naše báze. Pak ovšem i a1 · w1 + · · · + at · wt + ct+1 · vt+1 + · · · + cs · vs = 0 a protože příslušné vektory tvoří bázi W2, jsou všechny koeficienty nulové. Tvrzení (3) se nyní ověří přímým počítáním generátorů. 2.30. Příklady. (1) Kn má (jako vektorový prostor nad K) dimenzi n. Bazí je např. n-tice vektorů ((1, 0, . . . , 0), (0, 1, . . . , 0) . . . , (0, . . . , 0, 1)). Tuto bázi nazýváme standardní báze v Kn . V případě konečného pole skalárů, např. Zk, má celý vektorový prostor Kn jen konečný počet prvků. Kolik? (2) C jako vektorový prostor nad R má dimenzi 2, bázi tvoří např. čísla 1 a i. (3) Km[x], tj. prostor polynomů stupně nejvýše m, má dimenzi m+1, bazí je např. posloupnost 1, x, x2 , . . . , xm . Vektorový prostor všech polynomů K[x] má dimenzi ∞, umíme však ještě stále najít bázi (i když s nekonečně mnoha prvky): 1, x, x2 , . . . . (4) Vektorový prostor R nad Q má dimenzi ∞ a nemá spočetnou bázi. (5) Vektorový prostor všech zobrazení f : R → R má také dimenzi ∞ a nemá spočetnou bázi. 95 jednou bází na začátku i konci. Zkusme však uvažovat matici C jako matici zobrazení g : C2 → C2 . Pak umíme najít vektory u = (i, 1), v = (1, i), pro které bude platit g(u) = ( 0 −1 1 0 ) · ( i 1 ) = i · u, g(v) = ( 0 −1 1 0 ) · ( 1 i ) = −i · v. To ale znamená, že v bázi (u, v) na C2 má g matici K = ( i 0 0 −i ) a povšimněme si, že tato komplexní analogie k případu matice C má na diagonále prvky ±a, a = cos(1 2 π)+i sin(1 2 π). Jinými slovy, argument v goniometrickém tvaru tohoto komplexního čísla udává úhel otočení. Navíc, můžeme si označit reálnou a imaginární část vektoru u takto u = xu + iyu = Re u + i Im u = ( 0 1 ) + i · ( 1 0 ) a zúžení komplexního zobrazení g na reálný vektorový podprostor generovaný vektory xu a iyu (tj. násobení komplexní jednotkou i) je právě otočení o úhel 1 2 π. Nyní zkusme přejít do lineárních zobrazení z R3 do R3 . Jedním z nich je například rotace. 2.58. Nalezněte matici rotace v kladném smyslu o úhel π/3 kolem přímky procházející počátkem s orientovaným směrovým vektorem (1, 1, 0) ve standardní bázi R3 . Řešení. Uvedené otočení lze získat složením po řadě těchto tří zobra- zení: • rotace o π/4 v záporném smyslu podle osy z (osa rotace přejde na osu x); • rotace o π/3 v kladném smyslu podle osy x; • rotace o π/4 v kladném smyslu podle osy z (osa x přejde na osu rotace). Matice výsledné rotace bude součinem matic odpovídajících uvedeným třem zobrazením, přičemž pořadí matic je dáno pořadím provádění jednotlivých zobrazení – prvnímu zobrazení odpovídá v součinu matice nejvíce napravo. Takto dostaneme hledanou matici    √ 2 2 − √ 2 2 0√ 2 2 √ 2 2 0 0 0 1    ·    1 0 0 0 1 2 − √ 3 2 0 √ 3 2 1 2    ·    √ 2 2 √ 2 2 0 − √ 2 2 √ 2 2 0 0 0 1    = =    3 4 1 4 √ 6 4 1 4 3 4 − √ 6 4 − √ 6 4 √ 6 4 1 2    Uvědomme si, že výslednou rotaci bylo možné získat např. také složením následujících tří zobrazení: 3. VEKTOROVÉ PROSTORY A LINEÁRNÍ ZOBRAZENÍ 2.31. Souřadnice vektorů. Když je množina {v1, . . . , vn} ⊂ V báze, můžeme každý vektor w ∈ V vyjádřit jako lineární kombinaci v = a1v1 + · · · + anvn. Předpokládejme, že to uděláme dvěma způsoby: w = a1v1 + · · · + anvn = b1v1 + · · · + bnvn. Potom ale 0 = (a1 − b1) · v1 + · · · + (an − bn) · vn a proto ai = bi pro všechna i = 1, . . . , n. Lze tedy každý vektor zadat právě jediným způsobem jako lineární kombinaci bázových vektorů. Koeficienty této jediné lineární kombinace vyjadřující daný vektor w ∈ V ve zvolené bázi v = (v1, . . . , vn) se nazývají souřadnice vektoru w v této bázi. Kdykoliv budeme mluvit o souřadnicích (a1, . . . , an) vektoru w, které vyjadřujeme jako posloupnost, musíme mít pevně zvolenu i posloupnost bázových vektorů v = (v1, . . . , vn). Jakkoliv jsme tedy báze zavedli jako minimální množiny generátorů, ve skutečnosti s nimi budeme pracovat jako s posloupnostmi. Přiřazení souřadnic vektorům Přiřazení, které vektoru u = a1v1 + · · · + anvn přiřadí jeho souřadnice v bázi v, budeme značit stejným symbolem v : V → Kn . Má tyto vlastnosti: (1) v(u + w) = v(u) + v(w); ∀u, w ∈ V (2) v(a · u) = a · v(u); ∀a ∈ K, ∀u ∈ V . Všimněme si, že operace na levých a pravých stranách těchto rovnic nejsou totožné, naopak, jde o operace na různých vektorových prostorech! Při této příležitosti se také můžeme zamyslet nad obecným případem báze M (možná nekonečněrozměrného) prostoru V . Báze pak nemusí být spočetná, pořád ale ještě můžeme definovat zobrazení M : V → KM (tj. souřadnice vektoru jsou zobrazení z M do K). Uvedené vlastnosti přiřazení souřadnic jsme viděli už dříve u zobrazení, kterým jsme v geometrii roviny říkali lineární (zachovávaly naši lineární strukturu v rovině). Než se budeme věnovat podrobněji závislosti souřadnic na volbě báze, podíváme se obecněji na pojem linearity zobrazení. 2.32. Lineární zobrazení. Pro zcela obecné vektorové prostory, konečné i nekonečné dimenze, definujeme pojem „linearity“ takto: Definice lineárních zobrazení Nechť V a W jsou vektorové prostory nad týmž polem skalárů K. Zobrazení f : V → W se nazývá lineární zobrazení (homomorfismus) jestliže platí: (1) f (u + v) = f (u) + f (v), ∀u, v ∈ V (2) f (a · u) = a · f (u), ∀a ∈ K, ∀u ∈ V . 96 8. LINEÁRNÍ ZOBRAZENÍ • rotace o π/4 v kladném smyslu podle osy z (osa rotace přejde na osu y); • rotace o π/3 v kladném smyslu podle osy y; • rotace o π/4 v záporném smyslu podle osy z (osa y přejde na osu rotace). Analogicky tak dostáváme    √ 2 2 √ 2 2 0 − √ 2 2 √ 2 2 0 0 0 1    ·    1 2 0 √ 3 2 0 1 0 − √ 3 2 0 1 2    ·    √ 2 2 − √ 2 2 0√ 2 2 √ 2 2 0 0 0 1    = =    3 4 1 4 √ 6 4 1 4 3 4 − √ 6 4 − √ 6 4 √ 6 4 1 2    2.59. Matice obecné rotace v R3 . Ve vedlejším sloupci umí kolega v R3 popsat pouze matice rotace kolem souřadnicových os. V tomto sloupci umíme odvodit i matici obecné rotace v R3 . Úvahu z předchozího příkladu totiž můžeme provést i s obecnými hodnotami. Uvažme libovolný jednotkový vektor (x, y, z). Rotace v kladném smyslu o úhel φ kolem tohoto vektoru pak můžeme zapsat jako složení následujících rotací, jejichž matice již známe: i) rotace R1 v záporném smyslu kolem osy z o úhel s kosinem x/ √ x2 + y2 = x/ √ 1 − z2, tedy sinem y/ √ 1 − z2, ve které přejde přímka se směrovým vektorem (x, y, z) na přímku se směrovým vektorem (0, y, z). Matice této rotace je R1 =   x/ √ 1 − z2 y/ √ 1 − z2 0 −y/ √ 1 − z2 x/ √ 1 − z2 0 0 0 1   , ii) rotace R2 v kladném smyslu podle osy y o úhel s kosinem √ 1 − z2, tedy sinem z, ve které přejde přímka se směrovým vektorem (0, y, z) na přímku se směrovým vektorem (1, 0, 0). Matice této rotace je R2 =   √ 1 − z2 0 z 0 1 0 −z 0 √ 1 − z2   , iii) rotace R3 v kladném smyslu kolem osy x o úhel φ s maticí   1 0 0 0 cos(φ) − sin(φ) 0 sin(φ) cos(φ)   , iv) rotace R−1 2 s maticí R−1 2 , v) rotace R−1 1 s maticí R−1 1 . Matice složení těchto zobrazení, tedy hledaná matice, je dána součinem matic jednotlivých rotací v opačném pořadí: CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Samozřejmě, že jsme taková zobrazení již viděli ve formě násobení matic: Kn ∋ x → A · x ∈ Km s maticí typu m/n nad K. Obraz Im f := f (V ) ⊂ W je vždy vektorový podprostor, protože lineární kombinace obrazů f (ui) je obrazem lineární kombinace vektorů ui se stejnými koeficienty. Stejně tak je vektorovým podprostorem množina všech vektorů Ker f := f −1 ({0}) ⊂ V , protože lineární kombinace nulových obrazů bude vždy zase nulovým vektorem. Nazývá se jádro lineárního zobrazení f . Lineární zobrazení, které je bijekcí nazýváme izomorfis- mus. Podobně jako u abstraktní definice vektorových prostorů, opět je třeba ověřit zdánlivě samozřejmá tvrzení vyplývající z axiomů: Tvrzení. Nechť f : V → W je lineární zobrazení. Pro všechny vektory u, u1, . . . , uk ∈ V , a1, . . . , ak ∈ K platí: (1) f (0) = 0 (2) f (−u) = −f (u) (3) f (a1 · u1 + · · · + ak · uk) = a1 · f (u1) + · · · + ak · f (uk) (4) pro každý vektorový podprostor V1 ⊂ V je jeho obraz f (V1) vektorový podprostor ve W. (5) Pro každý podprostor W1 ⊂ W je množina f −1 (W1) = {v ∈ V ; f (v) ∈ W1} vektorový podprostor ve V . Důkaz. Počítáme s využitím axiomů a definic a již dokázaných výsledků (dohledejte si případně samostatně!): f (0) = f (u − u) = f ((1 − 1) · u) = 0 · f (u) = 0 f (−u) = f ((−1) · u) = (−1) · f (u) = −f (u). Vlastnost (3) se ověří snadno z definičního vztahu pro dva sčítance indukcí přes počet sčítanců. Z platnosti (3) nyní plyne, že ⟨f (V1)⟩ = f (V1), je to tedy vektorový podprostor. Je-li naopak f (u) ∈ W1 a f (v) ∈ W1, pak pro libovolné skaláry bude i f (a·u+b·v) = a·f (u)+b·f (v) ∈ W1. 2.33. Jednoduché důsledky. (1) Složení g ◦ f : V → Z dvou lineárních zobrazení f : V → W a g : W → Z je opět lineární zobrazení. (2) Lineární zobrazení f : V → W je izomorfismus právě když Im f = W a Ker f = {0} ⊂ V . Inverzní zobrazení k izomorfismu je opět izomorfismus. (3) Pro libovolné podprostory V1, V2 ⊂ V a lineární zobrazení f : V → W platí f (V1 + V2) = f (V1) + f (V2), f (V1 ∩ V2) ⊂ f (V1) ∩ f (V2). (4) Zobrazení „přiřazení souřadnic“ u : V → Kn dané libovolně zvolenou bází u = (u1, . . . , un) vektorového prostoru V je izomorfismus. (5) Dva konečněrozměrné vektorové prostory jsou izomorfní právě když mají stejnou dimenzi. 97 R−1 1 · R−1 2 · R3 · R2 · R1 = (2.1)   cos φ + (1 − cos φ)x2 (1 − cos φ)xy − z sin φ (1 − cos φ)xz + y sin φ yx(1 − cos φ) + z sin φ cos φ + (1 − cos φ)y2 (1 − cos φ)yz − x sin φ zx(1 − cos φ) − y sin φ (1 − cos φ)zy + x sin φ cos φ + (1 − cos φ)z2   (2.2) 2.60. Je dáno lineární zobrazení R3 → R3 ve standardní bázi následujicí maticí:   1 −1 0 0 1 1 2 0 0   . Napište matici tohoto zobrazení v bázi (f1, f2, f3) = ((1, 1, 0), (−1, 1, 1), (2, 0, 1)). Řešení. Matice přechodu T od báze f = (f1, f2, f3) k standardní bázi, tj. bázi danou vektory (1, 0, 0), (0, 1, 0), (0, 0, 1), získáme podle Tvrzení 2.25 zapsáním souřadnic vektorů f1, f2, f3 ve standardní bázi do sloupců matice přechodu T . Máme tedy T =   1 −1 2 1 1 0 0 1 1   . Matice přechodu od standardní báze k bázi f je potom T −1 =   1 4 3 4 −1 2 −1 4 1 4 1 2 1 4 −1 4 1 2   . Matice zobrazení v bázi f je potom T −1 AT =   1 4 2 −3 4 5 4 0 7 4 3 4 −2 9 4   . 2.61. Uvažme vektorový prostor mnohočlenů jedné neznámé stupně nejvýše 2 s reálnými koeficienty. V tomto prostoru uvažme bázi 1, x, x2 . Napište matici zobrazení derivace v této bázi a také v bázi 1 + x2 , x, x + x2 . Řešení.   0 1 0 0 0 2 0 0 0  ,   0 1 1 2 1 3 0 −1 −1  . 2.62. Ve standardní bázi v R3 určete matici rotace o 90◦ v kladném smyslu kolem přímky (t, t, t), t ∈ R, orientované ve směru vektoru (1, 1, 1). Dále určete matici této rotace v bázi g = ((1, 1, 0), (1, 0, −1), (0, 1, 1)). Řešení. Snadno určíme matici uvažované rotace a to ve vhodné bázi, totiž v bázi dané směrovým vektorem přímky a dále dvěma navzájem 3. VEKTOROVÉ PROSTORY A LINEÁRNÍ ZOBRAZENÍ (6) Složení dvou izomorfismů je izomorfismus. Důkaz. Ověření prvního tvrzení je velmi snadné cvičení. Pro druhé si uvědomme, že je-li f lineární bijekce, pak w = f −1 (au + bv) právě, když f (w) = au + bv = f (a · f −1 (u) + b · f −1 (v)). Je tedy také w = af −1 (u) + bf −1 (v) a tedy je inverze k lineární bijekci opět lineární zobrazení. Dále, f je surjektivní právě, když Im f = W a pokud Ker f = {0}, pak f (u) = f (v) zaručuje f (u − v) = 0, tj. u = v. Je tedy v tom případě f injektivní. Další tvrzení se dokáže snadno přímo z definic. Najděte si protipříklad, že v dokazované inkluzi opravdu nemusí nastat rovnost! Zbývající body jsou již zřejmé. 2.34. Opět souřadnice. Uvažujme libovolné vektorové prostory V a W nad K s dim V = n, dim W = m a mějme lineární zobrazení f : V → W. Pro každou volbu bází u = (u1, . . . , un) na V , v = (v1, . . . , vn) na W, máme k dispozici příslušná přiřazení souřadnic a celou situaci několika právě zmíněných zobrazení zachycuje následující diagram: V f // ≃u  W v≃  Kn fu,v // Km Spodní šipka fu,v je definována zbylými třemi, tj. jako zobrazení jde o složení fu,v = v ◦ f ◦ u−1 . Přitom je každé lineární zobrazení jednoznačně určeno svými hodnotami na libovolné množině generátorů, zejména tedy na vektorech báze u. Označme f (u1) = a11 · v1 + a21 · v2 + · · · + am1vm f (u2) = a12 · v1 + a22 · v2 + · · · + am2vm ... f (un) = a1n · v1 + a2n · v2 + · · · + amnvm tj. skaláry aij tvoří matici A, kde sloupce jsou souřadnice hodnot f (uj ) zobrazení f na bázových vektorech vyjádření v bázi v na cílovém prostoru W. Pro obecný vektor u = x1u1 + · · ·+xnun ∈ V spočteme (vzpomeňme, že sčítání vektorů je komutativní a distributivní vůči násobení skaláry) f (u) = x1f (u1) + · · · + xnf (un) = x1(a11v1 + · · · + am1vm) + · · · + xn(a1nv1 + · · · + amnvm) = (x1a11 + · · · + xna1n)v1 + · · · + (x1am1 + · · · + xnamn)vm Pomocí násobení matic lze nyní velice snadno a přehledně zapsat hodnoty zobrazení fu,v(w) definovaného jednoznačně předchozím diagramem. Připomeňme si, že vektory v Kr chápeme jako sloupce, tj. matice typu r/1 fu,v(u(w)) = v(f (w)) = A · u(w). 98 8. LINEÁRNÍ ZOBRAZENÍ kolmými vektory v rovině x + y + z = 0, tedy v rovině vektorů kolmých k vektoru (1, 1, 1). Uvědomme si, že matice rotace v kladném smyslu o 90◦ v nějaké ortonormální bázi v R2 je ( 0 −1 1 0 ) , v ortogonální s velikostmi vekorů k, l potom ( 0 −k/l l/k 0 ) . Zvolíme-li v rovině x + y + z = 0 kolmé vektory (1, −1, 0) a (1, 1, −2) o velikos- tech √ 2 a √ 6, tak v bázi f = ((1, 1, 1), (1, −1, 0), (1, 1, −2)) má uvažovaná rotace matici   1 0 0 0 0 − √ 3 0 1/ √ 3 0  . Abychom získali matici uvažované rotace ve standardní bázi, stačí nám transformovat matici již známým způsobem. Matici přechodu T od báze f ke standardní dostaneme zapsáním souřadnic (ve standardní bázi) vektorů báze f do sloupců matice T : T =   1 1 1 1 −1 1 1 0 −2  . Celkem tedy pro hledanou matici R máme R = T ·   1 0 0 0 0 − √ 3 0 1/ √ 3 0   · T −1 (2.3) =   1/3 1/3 − √ 3/3 1/3 + √ 3/3 1/3 + √ 3/3 1/3 1/3 − √ 3/3 1/3 − √ 3/3 1/3 + √ 3/3 1/3  (2.4) Tento výsledek můžeme ověřit dosazením do matice obecné rotace (2.1), normováním vektoru (1, 1, 1) dostáváme vektor (x, y, z) = (1/ √ 3, 1/ √ 3, 1/ √ 3), cos(φ) = 0, sin(φ) = 1. 2.63. Matice obecné rotace podruhé. Zkusme odvodit matici (obecné) rotace (2.1) o úhel φ v kladném smyslu kolem jednotkového vektoru (x, y, z) jiným způsobem než, jsme učinili v [], analogicky jako v předchozím příkladě. V bázi f = ((x, y, z), (−y, x, 0), (zx, zy, z2 − 1)), tedy v ortogonální bázi tvořené směrovým vektorem osy rotace a dvěma navzájem kolmými vektory o shodných velikostech √ 1 − z2 ležícími v rovině kolmé na osu, má uvažovaná rotace matici A =   1 0 0 0 cos(φ) − sin(φ) cos(φ) sin(φ) 0  . Matice přechodu od báze f ke standardní bázi je potom T =   x −y zx y x zy z 0 z2 − 1   s inverzní maticí T −1 =   x y z − y 1−z2 x 1−z2 0 zx 1−z2 zy 1−z2 −1   . Celkem pak pro matici R hledané rotace dostáváme CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Matici A nazýváme maticí zobrazení f v bázích u, v. Naopak, máme-li pevně zvoleny báze na V i W, pak každá volba matice A typu m/n zadává jednoznačně lineární zobrazení Kn → Km a tedy i zobrazení f : V → W. Mámeli tedy zvoleny báze prostorů V a W, odpovídá každé volbě matice typu m/n právě jedno lineární zobrazení V → W a ukázali jsme bijekci mezi maticemi příslušného rozměru a lineárními zobrazeními V → W. 2.35. Matice přechodu mezi souřadnicemi. Jestliže za V i W zvolíme tentýž prostor, ale s různými bazemi, a za f identické zobrazení, vyjadřuje postup z předchozího odstavce vektory báze u v souřadnicích vzhledem k v. Označme výslednou matici T . Když pak zadáme vektor u u = x1u1 + · · · + xnun v souřadnicích vzhledem k u a dosadíme za ui jejich vyjádření pomocí vektorů z v, obdržíme souřadné vyjádření ¯x = (¯x1, . . . , ¯xn) téhož vektoru v bázi v. Stačí k tomu přeskládat pořadí sčítanců a vyjádřit skaláry u jednotlivých vektorů báze. Ve skutečnosti teď děláme totéž, co v předchozím odstavci pro speciální případ identického zobrazení idV na vektorovém prostoru V . Matice tohoto identického zobrazení je T a tedy nutně musí naznačený přímý výpočet dát ¯x = T · x. Situace se zobrazena na diagramu: V idV // ≃u  V v≃  Kn T =(idV )u,v // Kn Výslednou matici T nazýváme matice přechodu od báze u vektorového prostoru V k bázi v téhož prostoru. Přímo z definice vyplývá: Výpočet matice přechodu Tvrzení. Matici T přechodu od báze u k bázi v získáme tak, že souřadnice vektorů báze u v bázi v napíšeme do sloupců matice T . Funkce matice přechodu je taková, že známe-li souřadnice x vektoru v bázi u, pak jeho souřadnice v bázi v se obdrží vynásobením sloupce x maticí přechodu (zleva). Protože inverzní zobrazení k identickému je opět totéž identické zobrazení, je matice přechodu vždy invertibilní a její inverze je právě matice přechodu opačným směrem, tj. od báze v k bázi u. 2.36. Více souřadnic. Nyní si ukážeme, jak se skládají souřadná vyjádření lineárních zobrazení. Uvažme ještě další vektorový prostor Z nad K dimenze k s bází w, lineární zobrazení g : W → Z a označme příslušnou matici gv,w. 99 R =T · R · T −1 =   cos φ + (1 − cos φ)x2 (1 − cos φ)xy − z sin φ (1 − cos φ)xz + y sin φ yx(1 − cos φ) + z sin φ cos φ + (1 − cos φ)y2 (1 − cos φ)yz − x sin φ zx(1 − cos φ) − y sin φ (1 − cos φ)zy + x sin φ cos φ + (1 − cos φ)z2   Při násobení a následném zjednodušování je nutno opakovaně použít předpokladu x2 + y2 + z2 = 1. Podrobnějším rozborem vlastností různých typů lineárních zobrazení se nyní dostaneme k pořádnějšímu pochopení nástrojů, které nám vektorové prostory pro lineární modelování procesů a systémů nabí- zejí. 2.64. Najděte matici zrcadlení v rovině podle přímky y = x Řešení. Namalujte si obrázek. V bázi určené vektory (1, 1), (1, −1) je matice zrcadlení zřejmě ( 1 0 0 −1 ) . Ve standardní bázi je tedy rovna ( 1 1 −1 1 )−1 ( 1 0 0 −1 ) ( 1 1 −1 1 ) Inverzní matici je v tomto případě jednoduché najít, protože vektory ve sloupcích jsou kolmé, tj. matice je (skoro) ortogonální. Máme ( 1 1 −1 1 )2 = 2 ( 1 0 0 1 ) ⇒ ( 1 1 −1 1 )−1 = 1 2 ( 1 1 −1 1 ) Vynásobením příslušných matic dostaneme výsledek ( 0 1 1 0 ) . Tento výsledek se dá uhádnout i přímo z obrázku. 2.65. Najděte matici zrcadlení vzhledem k rovině x + y + z = 0. Řešení. Z tvaru rovnice roviny zjistíme její jednotkový normálový vektor. V našem případě to je n = 1√ 3 (1, 1, 1). Zrcadlení Z na vektoru v lze pak vyjádřit Zv = v − 2(v.n)n = (1 − 2nnT )v (pro standardní skalarni součin je v.n = vnT ). Matice zrcadlení je tedy 1 − 2nnT =   1 0 0 0 1 0 0 0 1   − 2 · 1 3   1 1 1 1 1 1 1 1 1   = 1 3   1 −2 −2 −2 1 −2 −2 −2 1   Nyní jeden známý, ale velmi pěkný příklad. 2.66. Určete součet úhlů, které v rovině R2 svírají s osou x postupně vektory (1, 1), (2, 1) a (3, 1) (obrázek). Řešení. Uvážíme-li rovinu R2 jakožto Gaussovu rovinu komplexních čísel, tak uvedené vektory odpovídají komplexním číslům 1 + i, 2 + i a 3 + i a máme najít součet jejich argumentů, tedy podle Moivrovy věty argument jejich součinu. Jejich součin je (1 + i)(2 + i)(3 + i) = (1 + 3i)(3 + i) = 10i, tedy ryze imaginární číslo s argumentem π/2 a tedy hledaný součet je roven právě π/2. 3. VEKTOROVÉ PROSTORY A LINEÁRNÍ ZOBRAZENÍ V f // ≃u  W g // v≃  Z w≃  Kn fu,v // Km gv,w // Kk Složení g◦f na horním řádku odpovídá matici zobrazení Kn → Kk dole a přímo spočteme (píšeme A pro matici f a B pro matici g ve zvolených bazích): gv,w ◦ fu,v(x) = w ◦ g ◦ v−1 ◦ v ◦ f ◦ u−1 = B · (A · x) = (B · A) · x = (g ◦ f )u,w(x) pro všechny x ∈ Kn . Skládání obrazení tedy odpovídá násobení příslušných matic. Všimněte si také, že isomorfismy odpovídají právě invertibilním maticím. Stejný postup nám dává odpověď na otázku, jak se změní matice zobrazení, změníme-li báze na definičním oboru i oboru hodnot: V idV // ≃u′  V f // ≃u  W idW // v≃  W v′≃  Kn T // Kn fu,v // Km S−1 // Km kde T je matice přechodu od u′ k u a S je matice přechodu od v′ k v. Je-li tedy A původní matice zobrazení, bude nová dána jako A′ = S−1 AT . Ve speciálním případě lineárního zobrazení f : V → V , tj. zobrazení má stejný prostor V jako definiční obor i obor hodnot, vyjadřujeme zpravidla f pomocí jediné báze u prostoru V . Pak tedy přechod k nové bázi u′ s maticí předchodu T od u′ k u bude znamenat změnu matice zobrazení na A′ = T −1 AT . 2.37. Lineární formy. Obzvlášť jednoduchým a zároveň důležitým případem lineárních zobrazení jsou tzv. lineární formy. Jde o lineární zobrazení z vektorového prostoru V nad polem skalárů K do skalárů K. Jsou-li dány souřadnice na V , je přiřazení jednotlivé i-té souřadnice vektorům právě takovou lineární formou. Přesněji řečeno, pro každou volbu báze v = (v1, . . . , vn) máme k dispozici lineární formy v∗ i : V → K takové, že v∗ i (vj ) = δi j , tj. nula pro různé indexy i a j a jednička pro stejné. Vektorový prostor všech lineárních forem na V značíme V ∗ a říkáme mu duální prostor vektorovému prostoru V . Předpokládejme nyní, že prostor V má konečnou dimenzi n. Bázi V ∗ sestavenou z přiřazování jednotlivých souřadnic jako výše nazýváme duální báze. Skutečně se jedná o bázi prostoru V ∗ , protože jsou tyto formy zjevně lineárně nezávislé (prověřte si!) a je-li α libovolná forma, pak platí pro každý vektor u = x1v1 + · · · + xnvn α(u) = x1α(v1) + · · · + xnα(vn) = α(v1)v∗ 1(u) + · · · + α(vn)v∗ n(u) a je tedy α lineární kombinací forem v∗ i . 100 8. LINEÁRNÍ ZOBRAZENÍ 2.67. Uvažme komplexní čísla jako reálný vektorový prostor a za jeho bázi zvolme 1 a i. V této bázi určete matici následujících lineárních zobrazení: a) konjugace, b) násobení číslem (2 + i). Určete matici těchto zobrazení v bázi (1 − i), (1 + i). Řešení. a) ( 1 0 0 −1 ) , b) V obou bazích je matice stejná a to ( 2 −1 1 2 ) . Zamyslete se, proč tomu tak je. 2.68. Určete matici A, která ve standardní bázi prostoru R3 zadává kolmou projekci do vektorového podprostoru generovaného vektory u1 = (−1, 1, 0) a u2 = (−1, 0, 1). Řešení. Nejprve poznamenejme, že uvedený podprostor je rovinou procházející počátkem s normálovým vektorem u3 = (1, 1, 1). Uspořádaná trojice (1, 1, 1) je totiž očividným řešením soustavy −x1 + x2 = 0, −x1 + x3 = 0, tj. vektor u3 je kolmý na vektory u1, u2. Podotkněme rovněž, že jsme tento příklad již vyřešili (matici A známe z dřívějšího příkladu). Při dané projekci se vektory u1 a u2 musejí zobrazit na sebe a vektor u3 potom na nulový vektor. V bázi složené po řadě z vektorů u1, u2, u3 je proto matice této projekce   1 0 0 0 1 0 0 0 0   . Pomocí matic přechodu T =   −1 −1 1 1 0 1 0 1 1   , T −1 =   −1 3 2 3 −1 3 −1 3 −1 3 2 3 1 3 1 3 1 3   od báze (u1, u2, u3) ke standardní bázi a od standardní báze k bázi (u1, u2, u3) získáme A =   −1 −1 1 1 0 1 0 1 1   ·   1 0 0 0 1 0 0 0 0   ·   −1 3 2 3 −1 3 −1 3 −1 3 2 3 1 3 1 3 1 3   =   2 3 −1 3 −1 3 −1 3 2 3 −1 3 −1 3 −1 3 2 3   . CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Při pevně zvolené bázi {1} na jednorozměrném prostoru skalárů K jsou s každou volbou báze v na V lineární formy α ztotožněny s maticemi typu 1/n, tj. s řádky y. Právě komponenty těchto řádků jsou souřadnicemi obecných lineárních forem v duální bázi v∗ . Vyčíslení takové formy na vektoru je pak dáno vynásobením příslušného řádkového vektoru y se sloupcem souřadnic x vektoru u ∈ V v bázi v: α(u) = y · x = y1x1 + · · · + ynxn. Zejména tedy vidíme, že pro každý konečněrozměrný prostor V je V ∗ izomorfní prostoru V . Realizace takového izomorfismu je dána např. naší volbou duální báze k zvolené bázi na V . U nekonečně rozměrného prostoru se věci mají jinak. Např. už nejjednodušší příklad prostoru všech polynomů K[x] v jedné proměnné je vektorovým prostorem se spočetnou bazí s prvky vi = xi a stejně jako výše můžeme definovat lineárně nezávislé formy v∗ i . Jakýkoliv formální nekonečný součet ∑∞ i=0 aiv∗ i je nyní dobře definovanou lineární formou na K[x], protože bude vyčíslován vždy pouze na konečné lineární kombinaci bázových polynomů xi , i = 0, 1, 2, . . . . Spočetná množina všech v∗ i tedy není bazí. Ve skutečnosti lze ukázat, že tento duální prostor ani spočetnou bázi mít nemůže. 2.38. Multilineární formy. Podobně budeme pracovat i se zobrazeními ze součinu k kopií vektorového prostoru V do skalárů, která jsou lineární v každém ze svých k argumentů. Hovoříme o k–lineárních formách. Budeme se často setkávat s bilineárními formami, tj. případem α : V × V → K, kde pro jakékoliv vektory u, v, w, z a skaláry a, b, c a d platí α(au + bv, cw + dz) = ac α(u, w) + ad α(u, z) + bc α(v, w) + bd α(v, z). Pokud navíc platí α(u, w) = α(w, u), hovoříme o symetrické bilineární formě. Již v dimenzi 2 jsme zavedli determinant jako bilineární antisymetrickou formu, tj. takovou, kde místo druhé rovnosti výše platí α(u, w) = −α(w, u). Obecně víme z věty 2.17, že je determinant možno nahlížet jako n–lineární antisymetrickou formu. Jako u lineárních zobrazení je zřejmé, že každá k– lineární forma je úplně určena svými hodnotami na všech k–ticích bázových prvků v pevné bázi. V analogii k lineárním zobrazením tyto hodnoty můžeme vnímat jako k–rozměrné analogie matic. Ukážeme si to v případě k = 2, kde půjde doopravdy o matice, jak jsme je zavedli. Matice bilineární formy Jestliže zvolíme bázi u na V a definujeme pro danou bilineární formu α skaláry aij = α(ui, uj ), pak zjevně dostaneme pro vektory v, w se souřadnicemi x a y (jakožto 101 2.69. Napište matici zobrazení kolmé projekce do roviny procházející počátkem a kolmé na vektor (1, 1, 1). Řešení. Obraz libovolného bodu (vektoru) x = (x1, x2, x3) ∈ R3 v uvažovaném zobrazení získáme tak, že od daného bodu odečteme jeho kolmou projekci do normálového směru dané roviny, tedy do směru (1, 1, 1). Tato projekce p je dána (viz přednáška) jako (x, (1, 1, 1)) |(1, 1, 1)|2 = ( x1 + x2 + x3 3 , x1 + x2 + x3 3 , x1 + x2 + x3 3 ). Výsledné zobrazení je tedy x − p = ( 2x1 3 − x2 + x3 3 , 2x2 3 − x1 + x3 3 , 2x3 3 − x1 + x2 3 ) = =   2 3 −1 3 −1 3 −1 3 2 3 −1 3 −1 3 −1 3 2 3     x1 x2 x3   . 2.70. Ve vektorovém prostoru R3 určete matici kolmé projekce na rovinu x + y − 2z = 0. 2.71. Ve vektorovém prostoru R3 určete matici kolmé projekce na rovinu 2x − y + 2z = 0. 9. Vlastní čísla a vlastní vektory 2.72. Vlastní čísla a vlastní vektory mohou sloužit k názornému popisu lineárních zobrazení, zejména v R2 a R3 . (1) Uvažme zobrazení s maticí ve standardní bázi f : R3 → R3 , A =   0 0 1 0 1 0 1 0 0   . Pak dostáváme |A − λE| = −λ 0 1 0 1 − λ 0 1 0 −λ = −λ3 + λ2 + λ − 1, s kořeny λ1,2 = 1, λ3 = −1. Vlastní vektory s vlastní hodnotou λ = 1 se spočtou:   −1 0 1 0 0 0 1 0 −1   ∼   1 0 −1 0 0 0 0 0 0   ; s bází prostoru řešení, tj. všech vlastních vektorů s touto vlastní hod- notou u1 = (0, 1, 0), u2 = (1, 0, 1). Podobně pro λ = −1 dostáváme třetí nezávislý vlastní vektor   1 0 1 0 2 0 1 0 1   ∼   1 0 1 0 2 0 0 0 0   ⇒ u3 = (−1, 0, 1). 3. VEKTOROVÉ PROSTORY A LINEÁRNÍ ZOBRAZENÍ sloupce souřadnic) α(v, w) = n∑ i,j=1 aij xiyj = yT · A · x, kde A je matice A = (aij ). Přímo z definice matice bilinerání formy je vidět, že forma je symetrická nebo antisymetrická právě, když má tutéž vlastnost její matice. 2.39. Skalární součin a velikost vektorů. V geometrii roviny R2 jsme již pracovali nejen s bázemi a lineárními zobrazeními, ale také s velikostí vektorů a jejich úhly. Pro zavedení těchto pojmů jsme použili souřadného vyjádření pro velikost v = (x, y): ∥v∥ = √ x2 + y2 , zatímco úhel φ dvou vektorů v = (x, y) a v′ = (x′ , y′ ) byl dán cos φ = xx′ + yy′ ∥v∥∥v′∥ . Povšimněme si, že výraz v čitateli posledního výrazu je lineární v každém ze svých argumentů, značíme jej ⟨v, v′ ⟩ a říkáme mu skalární součin vektorů v a v′ . Takto definovaný skalární součin je také symetrický ve svých argumentech a platí ∥v∥2 = ⟨v, v⟩. Zejména platí, že ∥v∥ = 0 právě, když v = 0. Z našich úvah je také vidět, že v Euklidovské rovině jsou dva vektory kolmé právě, když je jejich skalární součin nulový. Analogicky budeme postupovat v obecném případě reálného vektorového prostoru, tj. uvažujeme nyní pouze vektorové prostory nad reálnými skaláry R. Skalární součin Skalární součin na vektorovém prostoru V nad reálnými čísly je bilineární symetrická forma ⟨ , ⟩ : V × V → R taková, že ⟨v, v⟩ ≥ 0 a ∥v∥2 = ⟨v, v⟩ = 0 pouze při v = 0. Číslu ∥v∥ říkáme velikost vektoru v. Vektory v a w ∈ V se nazývají ortogonální, jestliže ⟨v, w⟩ = 0. Vektor v se nazývá normovaný, jestliže ∥v∥ = 1. Báze prostoru V složená z ortogonálních vektorů se nazývá ortogonální báze. Jsou-li bázové vektory navíc i normované, je to ortonormální báze. Pro skalární součin se často používá také obvyklé tečky, tj. ⟨u, v⟩ = u · v. Z kontextu je pak třeba poznat, zda jde o součin dvou vektorů (tedy výsledkem je skalár) nebo něco jiného (stejně jsme značili součin matic a také někdy součin skalárů). Jak jsme viděli v minulém odstavci, bilineární formy jsou v souřadnicích dány svojí maticí. Zvolíme-li si tedy bázi u, je skalární součin plně určen svými hodnotami na dvojicích bázových vektorů. Označme 102 9. VLASTNÍ ČÍSLA A VLASTNÍ VEKTORY V bázi u1, u2, u3 (všimněte si, že u3 musí být lineárně nezávislý na zbylých dvou díky předchozí větě a u1, u2 vyšly jako dvě nezávislá řešení) má f diagonální matici A =   1 0 0 0 1 0 0 0 −1   . Celý prostor R3 je přímým součtem vlastních podprostorů, R3 = V1 ⊕ V2, dim V1 = 2, dim V2 = 1. Tento rozklad je dán jednoznačně a vypovídá mnoho o geometrických vlastnostech zobrazení f . Vlastní podprostor V1 je navíc přímým součtem jednorozměrných vlastních podprostorů, které lze však zvolit mnoha různými způsoby (takový další rozklad nemá tedy již žádný geometrický význam). (2) Uvažme lineární zobrazení f : R2[x] → R2[x] definované derivováním polynomů, tj. f (1) = 0, f (x) = 1, f (x2 ) = 2x. Zobrazení f má tedy v obvyklé bázi (1, x, x2 ) matici A =   0 1 0 0 0 2 0 0 0   . Charakteristický polynom je |A − λ · E| = −λ3 , existuje tedy pouze jediná vlastní hodnota, λ = 0. Spočtěme vlastní vektory:   0 1 0 0 0 2 0 0 0   ∼   0 1 0 0 0 1 0 0 0   . Prostor vlastních vektorů je tedy jednorozměrný, generovaný konstantním polynomem 1. 2.73. Příklad i se změnou báze. Určete vlastní čísla a vlastní vektory matice A =   1 1 0 1 2 1 1 2 1   . Popište toto zobrazení a napište jeho matici v bázi: e1 = [1, −1, 1] e2 = [1, 2, 0] e3 = [0, 1, 1] Řešení. Charakteristický polynom dané matice je 1 − λ 1 0 1 2 − λ 1 1 2 1 − λ = −λ3 + 4λ2 − 2λ = −λ(λ2 − 4λ + 2). Kořeny tohoto polynomu, vlastní čísla, udávají, kdy nebude mít matice   1 − λ 1 0 1 2 − λ 1 1 2 1 − λ   CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA si tedy sij = ⟨ui, uj ⟩. Pak ze symetričnosti skalárního součinu plyne sij = sji a z lineárnosti součinu v každém z argumentů dostáváme: ⟨ ∑ i xiui, ∑ j yj uj ⟩ = ∑ i,j xiyj ⟨ui, uj ⟩ = ∑ i,j sij xiyj . Pokud je báze ortonormální, je matice S jednotkovou maticí. Tím jsme dokázali následující užitečné tvrzení: skalární součin a ortogonální báze Tvrzení. Skalární součin je v každé ortonormální bázi dán výrazem ⟨x, y⟩ = xT · y. V obecné bázi V existuje symetrická matice S taková, že ⟨x, y⟩ = xT · S · y. 2.40. Ortogonální doplňky a projekce. Pro každý pevně zvolený podprostor W ⊂ V v prostoru se skalárním součinem definujeme jeho ortogonální doplněk takto W⊥ = {u ∈ V ; ⟨u, v⟩ = 0 pro všechny v ∈ W}. Přímo z definice je zjevné, že W⊥ je vektorový podprostor. Jestliže W ⊂ V má bázi (u1, . . . , uk) je podmínka pro W⊥ dána jako k homogenních rovnic pro n proměnných. Bude tedy mít W⊥ dimenzi alespoň n−k. Zároveň ale u ∈ W ∩W⊥ znamená ⟨u, u⟩ = 0 a tedy i u = 0 podle definice skalárního součinu. Zřejmě je tedy vždy V = W ⊕ W⊥ . Lineární zobrazení f : V → V na libovolném vektorovém prostoru se nazývá projekce, jestliže platí f ◦ f = f. V takovém případě je pro každý vektor v ∈ V v = f (v) + (v − f (v)) ∈ Im(f ) + Ker(f ) = V a je-li v ∈ Im(f ) a f (v) = 0, pak je i v = 0. Je tedy přechozí součet podprostorů přímý. Říkáme, že f je projekce na podprostor W = Im(f ) podél podprostoru U = Ker(f ). Slovy se dá projekce popsat přirozeně takto: rozložíme daný vektor na komponentu ve W a v U a tu druhou zapomeneme. Je-li na V navíc skalární součin, říkáme že jde o kolmou projekci, když je jádro kolmé na obraz. Každý podprostor W ̸= V tedy definuje kolmou projekci na W. Je to projekce na W podél W⊥ , která je dána pomocí jednoznačného rozkladu každého vektoru u na komponenty uW ∈ W a uW⊥ ∈ W⊥ , tj. lineární zobrazení, které uW + uW⊥ zobrazí na uW . 103 plnou hodnost, tedy soustava rovnic   1 − λ 1 0 1 2 − λ 1 1 2 1 − λ     x1 x2 x3   bude mít i jiné řešení než řešení x = (0, 0, 0). Vlastní čísla tedy jsou 0, 2 + √ 2, 2 − √ 2. Spočítejme vlastní vektory příslušné jednotlivým vlastním hodnotám: • 0: Řešíme tedy soustavu   1 1 0 1 2 1 1 2 1     x1 x2 x3   = 0 Jejím řešením je jednodimenzionální vektorový prostor vlastních vektorů ⟨(1, −1, 1)⟩. • 2 + √ 2: Řešíme soustavu   −(1 + √ 2) 1 0 1 − √ 2 1 1 2 −(1 + √ 2)     x1 x2 x3   = 0. Řešením je jednodimenzionální prostor ⟨(1, 1 + √ 2, 1 + √ 2)⟩. • 2 − √ 2: Řešíme soustavu   ( √ 2 − 1) 1 0 1 √ 2 1 1 2 ( √ 2 − 1)     x1 x2 x3   = 0. Řešením je prostor vlastních vektorů ⟨(1, 1 − √ 2, 1 − √ 2)⟩. Daná matice má vlastní čísla 0, 2+ √ 2 a 2− √ 2, kterým přísluší po řadě jednorozměrné prostory vlastních vektorů ⟨(1, −1, 1)⟩, ⟨(1, 1 + √ 2, 1 + √ 2)⟩ a ⟨(1, 1 − √ 2, 1 − √ 2)⟩. Zobrazení tedy můžeme interpretovat jako projekci podél vektoru (1, −1, 1) do roviny dané vektory (1, 1 + √ 2, 1 + √ 2) a (1, 1 − √ 2, 1 − √ 2) složenou s lineárním zobrazením daným „natažením“ daným vlastními čísly ve směru uvedených vlastních vektorů. Nyní jej vyjádřeme v uvedené bázi. K tomu budeme potřebovat matici přechodu T od standardní báze k dané nové bázi. Tu získáme tak, že souřadnice vektorů staré báze v bázi nové napíšeme do sloupců matice T . My však snadněji zapíšeme matici přechodu od dané báze k bázi standardní, tedy matici T −1 . Souřadnice vektorů nové báze pouze zapíšeme do sloupců: T −1 =   1 1 0 −1 2 1 1 0 1   . Potom T = T −1−1 =   0 0 1 1 0 −1 −2 1 3   , 3. VEKTOROVÉ PROSTORY A LINEÁRNÍ ZOBRAZENÍ 2.41. Existence ortonormální báze. Povšimněme si, že na každém vektorovém prostoru jistě existují skalární součiny. Prostě si stačí vybrat libovolnou bázi, prohlásit ji za ortonormální a hned jeden dobře definovaný skalární součin máme. V této bázi pak skalární součiny počítáme podle vzorce v Tvrzení 2.39. Umíme to ale i naopak. Máme-li zadán skalární součin na vektorovém prostoru V , můžeme vcelku jednoduše početně využít vhodných kolmých projekcí a jakoukoliv zvolenou bázi upravit na ortonormální. Jde o tzv. Grammův– Schmidtův ortogonalizační proces. Cílem této procedury bude z dané posloupnosti nenulových generátorů v1, . . . , vk konečněrozměrného prostoru V vytvořit ortogonální množinu nenulových generátorů pro V . Grammova–Schmidtova ortogonalizace Tvrzení. Nechť (u1, . . . , uk) je lineárně nezávislá k-tice vektorů prostoru V se skalárním součinem. Pak existuje ortogonální systém vektorů (v1, . . . , vk) takový, že vi ∈ ⟨u1, . . . , ui⟩, i = 1, . . . , k. Získáme je následující procedu- rou: • Nezávislost vektorů ui zaručuje, že u1 ̸= 0; zvolíme v1 = u1. • Máme-li již vektory v1, . . . , vℓ potřebných vlastností, zvolíme vℓ+1 = uℓ+1 +a1v1 +· · ·+aℓvℓ, kde ai = −⟨uℓ+1,vi⟩ ∥vi∥2 . Důkaz. Začneme prvním (nenulovým) vektorem v1 a spočteme kolmou projekci v2 do ⟨v1⟩⊥ ⊂ ⟨{v1, v2}⟩. Výsledek bude nenulový právě, když je v2 nezávislé na v1. Ve všech dalších krocích budeme postupovat obdobně. V ℓ-tém kroku tedy chceme, aby pro vℓ+1 = uℓ+1 + a1v1 + · · · + aℓvℓ platilo ⟨vℓ+1, vi⟩ = 0, pro všechny i = 1, . . . , ℓ. Odtud plyne 0 = ⟨uℓ+1 + a1v1 + · · · + aℓvℓ, vi⟩ = ⟨uℓ+1, vi⟩ + ai⟨vi, vi⟩ a je vidět, že vektory s požadovanými vlastnostmi jsou určeny jednoznačně až na násobek. Kdykoliv máme ortogonální bázi vektorového prostoru V , stačí vektory vynormovat a získáme bázi ortonormální. Dokázali jsme proto: Důsledek. Na každém vektorovém prostoru se skalárním součinem existuje ortonormální báze. V ortonormální bázi se obzvlášť snadno spočtou souřadnice a kolmé projekce. Skutečně, mějme ortonormální bázi (e1, . . . , en) prostoru V . Pak každý vektor v = x1e1 + · · · + xnen splňuje ⟨ei, v⟩ = ⟨ei, x1e1 + · · · + xnen⟩ = xi a platí tedy vždy (2.2) v = ⟨e1, v⟩e1 + · · · + ⟨en, v⟩en. 104 9. VLASTNÍ ČÍSLA A VLASTNÍ VEKTORY a pro matici B zobrazení v nové bázi pak máme (viz 2.36) B = T AT −1 =   0 5 2 0 −2 −1 0 14 6   . 2.74. Nalezňete vlastní čísla a jim příslušné vektorové prostory vlastních vektorů matice:   −1 −5 6 5 3 0 −2 3 −2 3 0 1 6 −4 3   . 2.75. Určete charakteristický polynom | A−λ E |, vlastní čísla a vlastní vektory matice   4 −1 6 2 1 6 2 −1 8   . 2.76. Stanovte vlastní hodnoty matice     −13 5 4 2 0 −1 0 0 −30 12 9 5 −12 6 4 1     . 2.77. Udejte příklad čtyřrozměrné matice s vlastními čísly λ1 = 6 a λ2 = 7 takové, aby násobnost λ2 jako kořene charakteristického polynomu byla 3 a aby (a) dimenze podprostoru vlastních vektorů λ2 byla 3; (b) dimenze podprostoru vlastních vektorů λ2 byla 2; (c) dimenze podprostoru vlastních vektorů λ2 byla 1. 2.78. Víte-li, že čísla 1, −1 jsou vlastní hodnoty matice A =     −11 5 4 1 −3 0 1 0 −21 11 8 2 −9 5 3 1     , uveďte v echna ře ení charakteristické rovnice | A − λ E | = 0. Nápověda: Označíme-li kořeny polynomu | A − λ E | jako λ1, λ2, λ3, λ4, je | A | = λ1 · λ2 · λ3 · λ4, tr A = λ1 + λ2 + λ3 + λ4. 2.79. Pro libovolnou n × n matici A je její charakteristický polynom | A − λ E | stupně n, je tedy tvaru | A − λ E | = cn λn + cn−1 λn−1 + · · · + c1 λ + c0, cn ̸= 0, přičem platí cn = (−1)n , cn−1 = (−1)n−1 tr A, c0 = | A |. Jestliže je matice A trojrozměrná, obdržíme | A − λ E | = −λ3 + (tr A) λ2 + c1 λ + | A |. CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Pokud máme zadán podprostor W ⊂ V a jeho ortonormální bázi (e1, . . . , ek), jde ji jistě doplnit na ortonormální bázi (e1, . . . , en) celého V . Kolmá projekce obecného vektoru v ∈ V do W pak bude dána vztahem v → ⟨e1, v⟩e1 + · · · + ⟨en, v⟩ek. Pro kolmou projekci nám tedy stačí znát jen ortonormání bázi podprostoru W, na nejž promítáme. Povšimněme si také, že obecně jsou projekce f na podprostor W podél U a projekce g na U podél W svázány vztahem g = idV −f . Je tedy u kolmých projekcí na daný podprostor W vždy výhodnější počítat ortonormální bázi toho z dvojice W, W⊥ , který má menší dimenzi. Uvědomme si také, že existence ortonormální báze nám zaručuje, že pro každý prostor V se skalárním součinem existuje lineární zobrazení, které je izomorfismem mezi V a prostorem Rn se standardním skalárním součinem. Podrobně to bylo ukázáno již ve Tvrzení 2.39, kde jsme ukázali, že hledaným izomorfismem je právě přiřazení souřadnic. Řečeno volnými slovy – v ortonormální bázi se skalární součin pomocí souřadnic počítá stejnou formulí jako standardní skalární součin v Rn . 2.42. Úhel dvou vektorů. Určitě očekáváme, že úhel dvou lineárně nezávislých vektorů musí být stejný, když je budeme uvažovat v dvourozměrném podprostoru, který generují, nebo když budou v okolním prostoru větším. Ve své podstatě je proto pojem úhlu dvou vektorů nezávislý na dimenzi okolního prostoru a můžeme převzít definici z roviny, kterou jsme už úspěšně používali: Úhel dvou vektorů Úhel φ dvou vektorů v a w ve vektorovém prostoru se skalárním součinem je dán vztahem cos φ = ⟨v, w⟩ ∥v∥∥w∥ . K problematice skalárních součinů a úhlů vektorů se vrátime v dalších kapitolách. 4. Vlastnosti lineárních zobrazení Podrobnějším rozborem vlastností různých typů lineárních zobrazení se nyní dostaneme k pořádnějšímu pochopení nástrojů, které nám vektorové prostory pro lineární modelování procesů a systémů nabízejí. 2.43. Příklady. Začneme čtyřmi příklady v nejnižší zajímavé dimenzi. Ve standardní bázi roviny R2 se standardním skalárním součinem uvažujme následující matice zobrazení f : R2 → R2 : A = ( 1 0 0 0 ) , B = ( 0 1 0 0 ) , C = ( a 0 0 b ) , D = ( 0 −1 1 0 ) . 105 Volbou λ = 1 dostáváme | A − E | = −1 + tr A + c1 + | A |. Odsud získáváme vyjádření | A − λ E | = −λ3 + (tr A) λ2 + (| A − E | + 1 − tr A − | A |) λ + | A |. Využijte toto vyjádření k určení charakteristického polynomu a vlastních hodnot matice A =   32 −67 47 7 −14 13 −7 15 −6   . 2.80. Vypočítejte A5 a A−3 , je-li A =   2 −1 1 −1 2 −1 0 0 1   . 2.81. Bez počítání napište spektrum lineárního zobrazení f : R3 → R3 zadaného přiřazením (x1, x2, x3) → (x1 + x3, x2, x1 + x3). 2.82. Pauliho matice. Ve fyzice se stav částice se spinem 1 2 popisuje Pauliho maticemi. Jsou to následující matice 2 × 2 nad komplexními čísly σ1 = ( 0 1 1 0 ) , σ2 = ( 0 −i i 0 ) , σ3 = ( 1 0 0 −1 ) Ukažte, že pro komutátor matic (značený hranatými závorkami) platí [σ1, σ2] := σ1σ2−σ2σ1 = 2iσ3 a podobně [σ1, σ3] = 2iσ2 a [σ2, σ3] = 2iσ1. Dále ukažte, že σ2 1 = σ2 2 = σ2 3 = 1 a vlastní hodnoty matic jsou ±1. Ukažte, že pro matice popisující stav částice se spinem 1 1 √ 2   0 1 0 1 0 1 0 1 0   , 1 √ 2   0 −i 0 i 0 −i 0 i 0   ,   1 0 0 0 0 0 0 0 −1   platí stejné komutační relace jako v případě Pauliho matic. Řešení. Označme 1 := ( 1 0 0 1 ) , I := iσ3, J := iσ2, K := iσ1. Ukažte, že 1, I, J, K tvoří algebru kvaternionů, tj. I2 = J2 = K2 = −1 a IJ = −JI = K, JK = −KJ = I a KI = −IK = J. 2.83. Uveďte dimenze vlastních podprostorů jednotlivých vlastních hodnot λi matice     4 0 0 0 1 4 0 0 5 2 3 0 0 4 0 3     . 2.84. Lze vyjádřit matici B = ( 5 6 6 5 ) 4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ Matice A zadává kolmou projekci podél podprostoru W ⊂ {(0, a); a ∈ R} ⊂ R2 na podprostor V ⊂ {(a, 0); a ∈ R} ⊂ R2 . Evidentně pro toto zobrazení f : R2 → R2 platí f ◦ f = f a tedy zúžení f |V daného zobrazení na obor hodnot je identické zobrazení. Jádrem f je právě podprostor W. Matice B má vlastnost B2 = 0, platí tedy totéž o příslušném zobrazení f . Můžeme si jej představit jako matici derivování polynomů R1[x] stupně nejvýše jedna v bázi (1, x). Matice C zadává zobrazení f , které první vektor báze zvětší a–krát, druhý b–krát. Tady se nám tedy celá rovina rozpadá na dva podprostory, které jsou zobrazením f zachovány a ve kterých jde o pouhou homotetii, tj. roztažení skalárním násobkem (první příklad byl speciální případem s a = 1, b = 0). Např. volba a = 1, b = −1 odpovídá osové symetrii (zrcadlení) podle osy x, což je totéž jako komplexní konjugace x + iy → x − iy na dvourozměrném reálném prostoru R2 ≃ C v bázi (1, i). Toto je lineární zobrazení dvourozměrného reálného vektorového prostoru C, nikoliv však jednorozměrného komplexního prostoru C. Matice D je maticí rotace o pravý úhel ve standardní bázi a na první pohled je vidět, že žádný jednorozměrný podprostor není zobrazením zachováván. Taková rotace je bijekcí roviny na sebe, proto jistě umíme najít (různé) báze na definičním oboru a oboru hodnot, ve kterých bude jeho maticí jednotková matice E (prostě vezmeme jakoukoliv bázi na definičním oboru a její obraz na oboru hodnot). Neumíme ale v tomto případě totéž s jednou bází na definičním oboru i oboru hodnot. Zkusme však uvažovat matici D jako matici zobrazení g : C2 → C2 ve standardní bázi komplexního vektorového prostoru C2 . Pak umíme najít vektory u = (i, 1), v = (1, i), pro které bude platit g(u) = ( 0 −1 1 0 ) · ( i 1 ) = i·u, g(v) = ( 0 −1 1 0 ) · ( 1 i ) = −i·v. To ale znamená, že v bázi (u, v) na C2 má zobrazení g matici K = ( i 0 0 −i ) a povšimněme si, že tato komplexní analogie k případu matice C má na diagonále prvky ±a, a = cos(1 2 π) + i sin(1 2 π). Jinými slovy, argument v goniometrickém tvaru tohoto komplexního čísla udává úhel otočení. Navíc, můžeme si označit reálnou a imaginární část vektoru u takto u = xu + iyu = Re u + i Im u = ( 0 1 ) + i · ( 1 0 ) a zúžení komplexního zobrazení g na reálný vektorový podprostor generovaný vektory xu a iyu (tj. násobení komplexní jednotkou i) je právě otočení o úhel 1 2 π. 106 10. BÁZE A SKALÁRNÍ SOUČINY ve tvaru součinu B = P −1 ·D·P pro nějakou diagonální matici D a invertibilní matici P ? Pokud je to mo né, udejte příklad takové dvojice matic D, P a zjistěte, kolik takových dvojic existuje. 2.85. Určete, jaké lineární zobrazení R3 → R3 zadává matice   − 2 3 −1 3 −2 3 4 3 −7 3 −8 3 − 1 1 1   Řešení. Dvojnásobná vlastní hodnota -1, příslušné vlastní vektory (2, 0, 1), (1, 1, 0), jednonásobná vlastní hodnota 0, vlastní vektor (1, 4, −3). Osová souměrnost podle přímky dané posledním vektorem složená s projekcí na rovinu kolmou k poslednímu vektoru, tedy danou obecnou rovnicí x + 4y − 3z = 0. 10. Báze a skalární součiny 2.86. Pomocí Gramova-Schmidtova ortogonalizačního procesu získejte ortogonální bázi podprostoru U = { (x1, x2, x3, x4)T ∈ R4 ; x1 + x2 + x3 + x4 = 0 } prostoru R4 . Řešení. Množina řešení uvedené homogenní lineární rovnice je zřejmě vektorovým prostorem s bází u1 =     −1 1 0 0     , u2 =     −1 0 1 0     , u3 =     −1 0 0 1     . Vektory ortogonální báze získané užitím Gramova-Schmidtova ortogonalizačního procesu budeme značit v1, v2, v3. Nejprve položme v1 = u1. Dále v2 = u2 − uT 2 · v1 ||v1||2 v1 = u2 − 1 2 v1 = ( − 1 2 , − 1 2 , 1, 0 )T , resp. zvolme násobek v2 = (−1, −1, 2, 0)T . Následně je v3 = u3 − uT 3 · v1 ||v1||2 v1 − uT 3 · v2 ||v2||2 v2 = u3 − 1 2 v1 − 1 6 v2 = = ( − 1 3 , − 1 3 , − 1 3 , 1 )T . Máme tedy celkem v1 =     −1 1 0 0     , v2 =     −1 −1 2 0     , v3 =     −1 −1 −1 3     . CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA 2.44. Vlastní čísla a vlastní vektory zobrazení. Klíčem k popisu zobrazení v předchozích příkladech byly odpovědi na otázku „jaké jsou vektory splňující rovnici f (u) = a · u?“ pro nějaké skaláry a. Zvolme tedy pevně lineární zobrazní f : V → V na vektorovém prostoru dimenze n nad skaláry K. Jestliže si představíme takovou rovnost zapsanou v souřadnicích, tj. s využitím matice zobrazení A v nějakých bazích, jde o výraz A · x − a · x = (A − a · E) · x = 0. Z předchozího víme, že taková soustava rovnic má jediné řešení x = 0, pokud je matice A − aE invertibilní. My tedy chceme najít takové hodnoty a ∈ K, pro které naopak A−aE invertibilní není, a nutnou a dostatečnou podmínkou je (viz Věta 2.22) (2.3) det(A − a · E) = 0. Jestliže považujeme λ = a za proměnnou v předchozí skalární rovnici, hledáme ve skutečnosti kořeny polynomu stupně n. Jak jsme viděli v případě matice D výše, kořeny mohou, ale nemusí existovat podle volby pole skalárů K. Vlastní čísla a vlastní vektory lineárního zobrazení Skaláry a vyhovující rovnici f (u) = a · u pro nenulový vektor u ∈ V nazýváme vlastní čísla zobrazení f , příslušné vektory u pak vlastní vektory zobrazení f . Z definice vlastních čísel je zřejmé, že jejich výpočet nemůže záviset na volbě báze a tedy matice zobrazení f . Skutečně, jako přímý důsledek trasformačních vlastností z 2.36 a Cauchyovy věty 2.19 pro výpočet determinantu součinu dostáváme jinou volbou souřadnic matici A′ = P −1 AP s invertibilní maticí P a |P −1 AP − λE| = |P −1 AP − P −1 λEP| = |P −1 (A − λE)P| = |P −1 )||(A − λE||P |, protože násobení skalárů je komutativní a |P −1 | = |P |−1 . Charaktersitický polynom matice a obrazení Obdobnou terminologii používáme i pro matice. Pro matici A dimenze n nad K nazýváme polynom |A − λE| ∈ Kn[λ] charakteristický polynom matice A. Kořeny tohoto polynomu jsou vlastní hodnoty matice A. Je-li A matice zobrazení f : V → V v jisté bázi, pak |A − λE| nazýváme také charakteristický polynom zobrazení f . Protože je charakteristický polynom zobrazení f : V → V nezávislý na volbě báze V , jsou i jeho koeficienty u jednotlivých mocnin proměnné λ skaláry vyjadřující vlastnosti zobrazení f , tj. nemohou záviset na naší volbě báze. Zejména jako jednoduché cvičení na počítání determinantů vyjádříme koeficienty u nejvyšších a nejnižších mocnin (předpokládáme dim V = n): |A−λ·E| = (−1)n λn +(−1)n−1 (a11+· · ·+ann)·λn−1 +· · ·+|A|·λ0 107 Dodejme, že pro jednoduchost příkladu lze bezprostředně uvést ortogonální bázi z vektorů (1, −1, 0, 0)T , (0, 0, 1, −1)T , (1, 1, −1, −1)T nebo (−1, 1, 1, −1)T , (1, −1, 1, −1)T , (−1, −1, 1, 1)T . 2.87. Ve vektorovém prostoru R4 jsou dány trojrozměrné podpro- story U = ⟨u1, u2, u3⟩, V = ⟨v1, v2, v3⟩, přičemž u1 =     1 1 1 0     , u2 =     1 1 0 1     , u3 =     1 0 1 1     , v1 =     1 1 −1 −1     , v2 =     1 −1 1 −1     , v3 = (1, −1, −1, 1)T . Určete dimenzi a libovolnou bázi podprostoru U ∩ V . Řešení. Do podprostoru U ∩V náleží právě ty vektory, které je možné obdržet jako lineární kombinaci vektorů ui a také jako lineární kombinaci vektorů vi. Hledáme tedy čísla x1, x2, x3, y1, y2, y3 ∈ R taková, aby platilo x1     1 1 1 0     + x2     1 1 0 1     + x3     1 0 1 1     = y1     1 1 −1 −1     + y2     1 −1 1 −1     + y3     1 −1 −1 1     , tj. hledáme řešení soustavy x1 + x2 + x3 = y1 + y2 + y3, x1 + x2 = y1 − y2 − y3, x1 + x3 = −y1 + y2 − y3, x2 + x3 = −y1 − y2 + y3. Při maticovém zápisu této homogenní soustavy (a při zachování pořadí proměnných) je     1 1 1 −1 −1 −1 1 1 0 −1 1 1 1 0 1 1 −1 1 0 1 1 1 1 −1     ∼     1 1 1 −1 −1 −1 0 0 −1 0 2 2 0 −1 0 2 0 2 0 1 1 1 1 −1     ∼     1 1 1 −1 −1 −1 0 1 1 1 1 −1 0 0 −1 0 2 2 0 0 1 3 1 1     ∼     1 1 1 −1 −1 −1 0 1 1 1 1 −1 0 0 1 0 −2 −2 0 0 0 1 1 1     ∼     1 1 1 0 0 0 0 1 1 0 0 −2 0 0 1 0 −2 −2 0 0 0 1 1 1     ∼     1 0 0 0 0 2 0 1 0 0 2 0 0 0 1 0 −2 −2 0 0 0 1 1 1     . 4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ Součet diagonálních členů matice se nazývá stopa matice, značíme ji TrA, stopa zobrazení je definována jako stopa jeho matice v libovolné bázi. 2.45. Věta. Vlastní vektory lineárního zobrazení f : V → V příslušné různým vlastním hodnotám jsou lineárně nezá- vislé. Důkaz. Nechť a1, . . . , ak jsou různé vlastní hodnoty zobrazení f a u1, . . . , uk vlastní vektory s těmito vlastními hodnotami. Důkaz provedeme indukcí přes počet lineárně nezávislých vektorů mezi zvolenými. Předpokládejme, že u1, . . . , uℓ jsou lineárně nezávislé a ul+1 = ∑ i ciui je jejich lineární kombinací. Alespoň ℓ = 1 lze zvolit, protože vlastní vektory jsou nenulové. Pak ovšem al+1 · ul+1 = ∑l i=1 al+1 · ci · ui, tj. f (ul+1) = l∑ i=1 al+1 · ci · ui = l∑ i=1 ci · f (ui) = l∑ i=1 ci · ai · ui. Odečtením druhého a čtvrtého výrazu v rovnostech dostáváme 0 = ∑l i=1(al+1 −ai)·ci ·ui. Všechny rozdíly vlastních hodnot jsou však nenulové a alespoň jeden koeficient ci je nenulový. To je spor s předpokládanou nezávislostí u1, . . . , uℓ, takže i vektor ul+1 musí být lineárně nezavislý na předcho- zích. Na právě dokázané tvrzení se můžeme podívat z pohledu rozkladu lineárního zobrazení f na součet nejjednodušších možných zobrazení, které budou vždy představovat projekci na invariantní jednorozměrný podprostor v rozkladu celého prostoru V na přímý součet jednotlivých vlastních podprostorů, následovanou vynásobením příslušným vlastním číslem. Navíc lze tento rozklad na vlastní podprostory snadno spočíst: Báze z vlastních vektorů Důsledek. Jestliže existuje n navzájem různých kořenů ai charakteristického polynomu zobrazení f : V → V , na n– rozměrném prostoru V , pak existuje rozklad V na přímý součet vlastních podprostorů dimenze 1. To znamená, že existuje báze V složená výhradně z vlastních vektorů a v této bázi má f diagonální matici. Tato báze je určená jednoznačně až na pořadí prvků. Příslušnou bázi (vyjádřenou v souřadnicích vzhledem k libovolně zvolené bázi V ) obdržíme řešením n systémů homogenních lineárních rovnic o n neznámých s maticemi (A − ai · E), kde A je matice f ve zvolené bázi. 2.46. Invariantní podprostory. Každý vlastní vektor v zobrazení f : V → V generuje podprostor ⟨v⟩ ⊂ V , který je zobrazením f zachováván. Obecněji říkáme, že podprostor W ⊂ V je invariantní podprostor pro zobrazení f , jestliže platí f (W) ⊂ W. 108 10. BÁZE A SKALÁRNÍ SOUČINY Dostáváme tak řešení x1 = −2t, x2 = −2s, x3 = 2s + 2t, y1 = −s − t, y2 = s, y3 = t, t, s ∈ R. Odtud dosazením získáváme obecný vektor průniku     x1 + x2 + x3 x1 + x2 x1 + x3 x2 + x3     =     0 −2t − 2s 2s 2t     . Vidíme, že dim U ∩ V = 2, U ∩ V = ⟨     0 −1 1 0     ,     0 −1 0 1     ⟩ . 2.88. Uveďte nějakou bázi podprostoru U = ⟨  1 2 3 4 5 6   ,   0 1 2 3 4 5   ,   −1 0 1 2 3 4   ,   −2 −1 0 1 2 3   ⟩ vektorového prostoru reálných matic 3 × 2. Tuto bázi doplňte na bázi celého prostoru. Řešení. Připomeňme, že bázi podprostoru tvoří množina lineárně nezávislých vektorů, které generují uvažovaný podprostor. Protože −1 ·   1 2 3 4 5 6   + 2 ·   0 1 2 3 4 5   =   −1 0 1 2 3 4   , −2 ·   1 2 3 4 5 6   + 3 ·   0 1 2 3 4 5   =   −2 −1 0 1 2 3   , celý podprostor U je generován pouze prvními dvěma maticemi. Ty jsou potom lineárně nezávislé (jedna není násobkem druhé), a tak zadávají bázi. Chceme-li ji doplnit na bázi celého prostoru reálných matic 3 × 2, musíme najít další čtyři matice (dimenze celého prostoru je zjevně 6) takové, aby výsledná šestice byla lineárně nezávislá. Můžeme využít toho, že známe např. standardní bázi   1 0 0 0 0 0   ,   0 1 0 0 0 0   ,   0 0 1 0 0 0   ,   0 0 0 1 0 0   ,   0 0 0 0 1 0   ,   0 0 0 0 0 1   prostoru reálných matic 3 × 2, který lze přímo ztotožnit s R6 . Sepíšeme-li dva vektory báze U a vektory standardní báze celého prostoru v tomto pořadí, výběrem prvních 6 lineárně nezávislých CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Jestliže je V konečněrozměrný vektorový prostor a vybereme nějakou bázi (u1, . . . , uk) podprostoru W, můžeme ji vždy doplnit na bázi (u1, . . . , uk, uk+1, . . . , un) celého V a v každé takové bázi má naše zobrazení matici A tvaru (2.4) A = ( B C 0 D ) kde B je čtvercová matice dimenze k, D je čtvercová matice dimenze n−k a C je matice typu n/(n−k). Naopak, jestliže existuje v nějaké bázi matice zobrazení f tvaru (2.4), je W = ⟨u1, . . . , uk⟩ invariantní podprostor zobrazení f . Pochopitelně bude v naší matici zobrazení (2.4) submatice C nulová právě tehdy, když bude i podprostor ⟨uk+1, . . . , un⟩ generovaný doplněnými vektory báze invariantní. Z tohoto pohledu jsou vlastní podprostory lineárního zobrazení extrémní případy invariantních podsprostorů a zejména v případě existence n = dim V různých vlastních čísel zobrazení f dostáváme rozklad V na přímý součet n vlastních podprostorů. V příslušné bázi z vlastních vektorů má pak naše zobrazení diagonální tvar s vlastními čísly na diagonále. 2.47. Ortogonální zobrazení. Podívejme se teď na speciální případ zobrazení f : V → W mezi prostory se skalárními součiny, která zachovávají velikosti pro všechny vektory u ∈ V . Definice ortogonálních zobrazení Lineární zobrazení f : V → W mezi prostory se skalárním součinem se nazývá ortogonální zobrazení, jesltiže pro všechny u ∈ V ⟨f (u), f (u)⟩ = ⟨u, u⟩. Z linearity f a ze symetrie skalárního součinu vyplývá pro všechny dvojice vektorů rovnost ⟨f (u+v), f (u+v)⟩ = ⟨f (u), f (u)⟩+⟨f (v), f (v)⟩+2⟨f (u), f (v)⟩. Proto všechny ortogonální zobrazení splňují i zdánlivě silnější požadavek, aby ⟨f (u), f (v)⟩ = ⟨u, v⟩, pro všechny vektory u, v ∈ V . V úvodní diskusi o geometrii v rovině jsme ve Větě 1.33 dokázali, že lineární zobrazení R2 → R2 zachovává velikosti vektorů právě, když jeho matice ve standardní bázi (a ta je ortonormální vzhledem ke standardnímu skalárnímu součinu) splňuje AT · A = E, tj. A−1 = AT . Obecně, ortogonální zobrazení musí vždycky být injektivní, protože podmínka ⟨f (u), f (u)⟩ = 0 znamená i ⟨u, u⟩ = 0 a tedy u = 0. Je tedy vždy v takovém případě dimenze oboru hodnot alespoň taková, jako je dimenze definičního oboru f . Pak ovšem je dimenze obrazu rovna dimenzi oboru hodnot a bez újmy na obecnost můžeme rovnou předpokládat, že jsou stejné a f : V → V (pokud by 109 vektorů dostaneme hledanou bázi. Pokud však uvážíme, že kupř. 1 0 0 0 0 0 2 1 0 0 0 0 3 2 1 0 0 0 4 3 0 1 0 0 5 4 0 0 1 0 6 5 0 0 0 1 = 1, můžeme ihned bázového vektory   1 2 3 4 5 6   ,   0 1 2 3 4 5   podprostoru U doplnit maticemi (vektory prostoru matic)   0 0 1 0 0 0   ,   0 0 0 1 0 0   ,   0 0 0 0 1 0   ,   0 0 0 0 0 1   na bázi. Upozorněme, že výše uvedený determinant lze vyčíslit velmi snadno – je roven součinu prvků na diagonále, neboť matice je v dolním trojúhelníkovém tvaru (nad diagonálou jsou všechny prvky nu- lové). 2.89. Napište nějakou bázi reálného vektorového prostoru matic 3×3 nad R s nulovou stopou (součet prvků na diagonále) a napište souřadnice matice   1 2 0 0 2 0 1 −2 −3   v této bázi. 2.90. Zaveďte nějaký skalární součin na vektorovém prostoru matic z předchozího příkladu. Spočítejte normu matice z předchozího příkladu, která je indukovaná Vámi zavedeným součinem. 2.91. Určete nějakou bázi vektorového prostoru antisymetrických reálných čtvercových matic typu 4×4. Uvažte standardní skalární součin v této bázi a pomocí tohoto součinu vyjádřete velikost matice     0 3 1 0 −3 0 1 2 −1 −1 0 2 0 −2 −2 0     . 2.92. Najděte ortogonální doplněk U⊥ podprostoru U = {(x1, x2, x3, x4); x1 = x3, x2 = x3 + 6x4} ⊂ R4 . Řešení. Ortogonální doplněk U⊥ tvoří právě ty vektory, které jsou kolmé na každé řešení soustavy x1 − x3 = 0, x2 − x3 − 6x4 = 0. 4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ nebyly, doplníme ortonormální bázi na oboru hodnot na bázi cílového prostoru a matice zobrazení bude čtvercovou maticí A doplněnou nulami na potřebnou velikost). Naše podmínka pro matici ortogonálního zobrazení v ortonormální bázi pak říká pro všechny vektory x a y v prostoru Kn toto: (A · x)T · (A · y) = xT · (AT · A) · y = xT · y. Speciálními volbami vektorů standardní báze za x a y dostaneme přímo, že AT · A = E, tedy tentýž výsledek jako v dimenzi dvě. Dokázali jsme tak následující tvrzení: Matice ortogonálních zobrazení Věta. Nechť V je reálný vektorový prostor se skalárním součinem a f : V → V je lineární zobrazení. Pak f je ortogonální právě, když v některé ortonormální bázi (a pak už všech) má matici A splňující AT = A−1 . Důkaz. Skutečně, jestliže zachovává f velikosti, musí mít uvedenou vlastnost v každé ortonormální bázi. Naopak, předchozí výpočet ukazuje, že vlastnost matice v jedné bázi už zaručuje zachovávání velikostí. Maticím splňujícím AT = A−1 se říká ortogonální ma- tice. Důsledkem této věty je také popis všech matic přechodu S mezi ortonormálními bázemi. Každá totiž musí zadávat zobrazení Kn → Kn zachovávající velikosti a splňují tady také právě podmínku S−1 = ST . Při přechodu od jedné ortonormální báze ke druhé se tedy matice (ortogonálního) zobrazení mění podle vztahu A′ = ST AS. 2.48. Rozklad ortogonálního zobrazení. Podívejme se nyní podrobněji na vlastní vektory a vlastní čísla ortogonálních zobrazení na vektorovém prostoru V se skalárním součinem. Uvažme pevně zvolené ortogonální zobrazení f : V → V s maticí A v nějaké ortonormální bázi a zkusme postupovat obdobně jako s maticí rotace D v příkladu 2.57. Nejprve se ale podívejme obecně na invariantní podprostory ortogonálních zobrazení a jejich ortogonální doplňky. Jestliže pro libovolný podprostor W ⊂ V a ortogonální zobrazení f : V → V platí f (W) ⊂ W, pak také platí pro všechny v ∈ W⊥ , w ∈ W ⟨f (v), w⟩ = ⟨f (v), f ◦ f −1 (w)⟩ = ⟨v, f −1 (w)⟩ = 0 protože i f −1 (w) ∈ W. To ale znamená, že také f (W⊥ ) ⊂ W⊥ . Dokázali jsme tedy jednoduché, ale velice důležité tvr- zení: Tvrzení. Ortogonální doplněk k invariantnímu podprostoru je také invariantní. 110 10. BÁZE A SKALÁRNÍ SOUČINY Vektor je ovšem řešením této soustavy tehdy a jenom tehdy, když je kolmý na oba vektory (1, 0, −1, 0), (0, 1, −1, −6). Je tedy U⊥ = {a · (1, 0, −1, 0) + b · (0, 1, −1, −6); a, b ∈ R}. 2.93. Určete, zda jsou podprostory U = ⟨(2, 1, 2, 2)⟩ a V = ⟨(−1, 0, −1, 2) , (−1, 0, 1, 0) , (0, 0, 1, −1)⟩ prostoru R4 na sebe kolmé. Pokud ano, je R4 = U ⊕ V , tj. je U⊥ = V ? Řešení. Vektor, který zadává podprostor U, je kolmý na každý ze tří vektorů, které generují V . Podprostory jsou tak na sebe kolmé. Avšak není pravda, že R4 = U ⊕ V . Podprostor V je totiž pouze dvojdimenzionální, protože (−1, 0, −1, 2) = (−1, 0, 1, 0) − 2 (0, 0, 1, −1) . 2.94. V závislosti na parametru t ∈ R stanovte dimenzi podprostoru U vektorového prostoru R3 , je-li U generován vektory (a) u1 = (1, 1, 1), u2 = (1, t, 1), u3 = (2, 2, t); (b) u1 = (t, t, t), u2 = (−4t, −4t, 4t), u3 = (−2, −2, −2). Řešení. V prvním případu je dim U = 2 pro t ∈ {1, 2}, jinak je dim U = 3. Ve druhém případu je dim U = 2 pro t ̸= 0 a dim U = 1 pro t = 0. 2.95. Sestrojte ortogonální bázi podprostoru ⟨ (1, 1, 1, 1), (1, 1, 1, −1), (−1, 1, 1, 1) ⟩ prostoru R4 . Řešení. Gramovým-Schmidtovým ortogonalizačním procesem lze obdržet výsledek ((1, 1, 1, 1), (1, 1, 1, −3), (−2, 1, 1, 0)) . 2.96. V prostoru R4 nalezněte nějakou ortogonální bázi podprostoru všech lineárních kombinací vektorů (1, 0, 1, 0), (0, 1, 0, −7), (4, −2, 4, 14) a podprostoru generovaného vektory (1, 2, 2, −1), (1, 1, −5, 3), (3, 2, 8, −7). Řešení. Při zachování pořadí podprostorů ze zadání jsou ortogonálními bázemi např. ((1, 0, 1, 0), (0, 1, 0, −7)) a ((1, 2, 2, −1), (2, 3, −3, 2), (2, −1, −1, −2)). CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Kdyby byla vlastní čísla ortogonálního zobrazení reálná, zaručovalo by už toto tvrzení, že bude vždy existovat báze V z vlastních vektorů. Skutečně, zúžení f na ortogonální doplněk invariantního podprostoru je opět ortogonální zobrazení, takže můžeme do báze přibírat jeden vlastní vektor za druhým, až dostaneme celý rozklad V . Nicméně většinou nejsou vlastní čísla ortogonálních zobrazení reálná. Musíme si proto pomoci opět výletem do komplexních vektorových prostorů. Sformulujeme rovnou výsledek: Rozklad ortogonálních zobrazení Věta. Nechť f : V → V je ortogonální zobrazení na prostoru se skalárním součinem. Pak všechny kořeny charakteristického polynomu f mají velikost jedna a existuje rozklad V na jednorozměrné vlastní podprostory odpovídající vlastním číslům λ = ±1 a dvourozměrné podprostory Pλ,¯λ , na kterých působí f rotací o úhel rovný argumentu komplexního čísla λ. Všchny tyto různé podprostory jsou po dvou ortogo- nální. Náznak důkazu. Jestliže budeme považovat ortogonální matici A za matici lineárního zobrazení na komplexním prostoru Cn (která je jen shodou okolností reálná), bude zaručeně existovat právě n (koplexních) kořenů charakteristického polynomu, včetně jejich algebraické násobnosti. Navíc, protože charakteristický polynom zobrazení bude mít výhradně reálné koeficienty, budou tyto kořeny buď reálné, nebo půjde o dvojice komplexně sdružených kořenů λ a ¯λ. Příslušné vlastní vektory v Cn k takové dvojici komplexně sdružených vlastních čísel budou řešením dvou komplexně sdružených systémů homogenních lineárních rovnic, neboť příslušné matice systémů rovnic jsou celé reálné, až na samotná dosazená vlastní čísla. Evidentně proto budou také řešení těchto systémů komplexně sdružené vektory. Označme vλ, stejně jako v případě rotace v 2.57, vlastní vektor příslušný k vlastnímu číslu λ = α + iβ, β ̸= 0. Reálný vektorový podprostor Pλ generovaný reálnou a imaginární částí xλ = re vλ, yλ = im vλ je zjevně invariantní vůči násobení maticí A a dostáváme A · xλ = αxλ − βyλ, A · yλ = αyλ + βxλ. To ale neznamená nic jiného, než že zúžení našeho zobrazení na Pλ je dáno složením rotace o argument vlastní honoty λ (úhel arccos α√ α2+β2 ) s násobením velikostí vlastní hodnoty λ (skalárem √ α2 + β2 ). Protože naše zobrazení zachovává velikosti, musí být velikost vlastní hodnoty λ rovna jedné. Společně s předchozími úvahami jsme tedy dokázali úplný popis všech ortogonálních zobrazení ve větě. K důkazu se ještě vrátíme v kapitole třetí, když budeme studovat komplexní rozšíření euklidovských vektorových prostorů, viz 3.23. 111 2.97. Pro jaké hodnoty parametrů a, b ∈ R jsou vektory (1, 1, 2, 0, 0), (1, −1, 0, 1, a), (1, b, 2, 3, −2) v prostoru R5 po dvou ortogonální? Řešení. Výsledek je a = 9/2, b = −5, neboť musí mj. platit 1 + b + 4 + 0 + 0 = 0, 1 − b + 0 + 3 − 2a = 0. 2.98. V prostoru R5 uvažujte podprostor generovaný vektory (1, 1, −1, −1, 0), (1, −1, −1, 0, −1), (1, 1, 0, 1, 1), (−1, 0, −1, 1, 1). Najděte nějakou bázi jeho ortogonálního doplňku. Řešení. Hledaná báze obsahuje jediný vektor. Je jím nějaký nenulový skalární násobek vektoru (3, −7, 1, −5, 9). 2.99. Popište ortogonální doplněk podprostoru V prostoru R4 , jeli V generován vektory (−1, 2, 0, 1), (3, 1, −2, 4), (−4, 1, 2, −4), (2, 3, −2, 5). Řešení. Ortogonální doplněk (komplement) V ⊥ je množina všech skalárních násobků vektoru (4, 2, 7, 0). 2.100. V prostoru R5 určete ortogonální doplněk W⊥ podprostoru W, jestliže (a) W = {(r + s + t, −r + t, r + s, −t, s + t); r, s, t ∈ R}; (b) W je množina řešení soustavy rovnic x1 − x3 = 0, x1 − x2 + x3 − x4 + x5 = 0. Řešení. (a) W⊥ = ⟨ (1, 0, −1, 1, 0), (1, 3, 2, 1, −3) ⟩ ; (b) W⊥ = ⟨ (1, 0, −1, 0, 0), (1, −1, 1, −1, 1) ⟩. 2.101. Nechť jsou v prostoru R4 dány vektory (1, −2, 2, 1), (1, 3, 2, 1). Doplňte tyto dva vektory libovolným způsobem na ortogonální bázi celého R4 . (Můžete k tomu využít Gramův-Schmidtův ortogonalizační proces.) Řešení. Hledaných doplnění je pochopitelně nekonečně mnoho. Jedním (skutečně jednoduchým) je např. (1, −2, 2, 1), (1, 3, 2, 1), (1, 0, 0, −1), (1, 0, −1, 1). 4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ Poznámka. Specielně v dimenzi tři musí být alespoň jedno vlastní číslo ±1, protože je trojka liché číslo. Pak ovšem příslušný vlastní podprostor je osou rotace trojrozměrného prostoru o úhel daný argumentem dalších vlastních čísel. Zkuste si rozmyslet, jak poznat, kterým směrem jde rotace a také, že vlastní číslo −1 znamená ještě dodatečnou symetrii podle roviny kolmé na osu rotace. K diskusi vlastností matic a lineárních zobrazení se budeme vracet. Před pokračováním obecné teorie si ukážeme několik aplikací, ještě ale uzavřeme naši diskusi obecnou de- finicí: Spektrum lineárního zobrazení 2.49. Definice. Spektrum lineárního zobrazení f : V → V (resp. matice) je posloupnost kořenů charakteristického polynomu zobrazení f , včetně násobností. Algebraickou násobností vlastní hodnoty rozumíme její násobnost jakožto kořenu charakteristického polynomu, geometrická násobnost vlastní hodnoty je dimenze příslušného podprostoru vlastních vektorů. Spektrálním poloměrem lineárního zobrazení (matice) je největší z absolutní hodnot vlastních čísel. V této terminologii můžeme naše výsledky o ortogonálních zobrazeních zformulovat tak, že jejich spektra jsou vždy celá podmnožinou jednotkové kružnice v komplexní rovině. To znamená, že v reálné části spektra mohou být pouze hodnoty ±1, jejichž algebraické a geometrické násobnosti jsou stejné. Komplexní hodnoty spektra pak odpovídají rotacím ve vhodných dvourozměrných podprostorech. 112 10. BÁZE A SKALÁRNÍ SOUČINY 2.102. Gramovým-Schmidtovým ortogonalizačním procesem nalezněte nějakou ortonormální bází podprostoru V ⊂ R, kde V = {(x1, x2, x3, x4) ∈ R4 | x1 + 2x2 + x3 = 0}. CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA 113 Řešení cvičení 4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ 114 10. BÁZE A SKALÁRNÍ SOUČINY 2.6. i) ( 5 1 5 4 ) ii) ( 2 −1 1 7 ) iii) ( 12 7 1 −5 3 0 5 4 ) iv)   7 7 18   v) ( −14 1 12 ) vi) ( −2 ) 2.8. Taková matice X existuje právě jedna, a to ( 18 −32 5 −8 ) . 2.14. A−1 =   1 10 −4 1 12 −5 0 5 −2   . 2.15.       2 −3 0 0 0 −5 8 0 0 0 0 0 −1 0 0 0 0 0 −5 2 0 0 0 3 −1       . 2.16. C−1 = 1 2     0 1 1 0 0 1 0 −1 1 −1 0 0 1 −1 −1 1     . 2.17. V prvním případě dostáváme A−1 = 1 2 · ( 3 −i i 1 ) ; ve druhém potom A−1 =   14 8 5 2 1 1 1 1 0   . 2.18. Platí A−1 = 1 n − 1         0 1 1 · · · 1 1 0 1 · · · 1 1 1 0 ... ... ... ... ... ... 1 1 1 · · · 1 0         . 2.20.     1 1 1 1 1 1 −1 −1 1 −1 1 −1 1 −1 −1 1     −1 1 4     1 1 1 1 1 1 −1 −1 1 −1 1 −1 1 −1 −1 1     . Následně lze snadno získat x1 = 13 4 , x2 = − 3 4 , x3 = − 3 4 , x4 = 1 4 . 2.25. Řešeními jsou právě všechny skalární násobky vektoru ( 1 + √ 3, − √ 3, 0, 1, 0 ) . 2.26. x1 = 1 + t, x2 = 3 2 , x3 = t, x4 = −1 2 , t ∈ R. 2.27. Soustava nemá řešení. CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA 115 2.28. Soustava má řešení, protože je 3 ·     3 2 2 3     −     3 3 −3 −2     − 5 ·     1 −1 1 1     =     1 8 4 6     . 2.29. Systém lineárních rovnic 3x1 + 2x3 = 1, x1 + x3 = 2, 7x1 + 4x3 = 3, 5x1 + 3x3 = 4, x2 = 5 nemá řešení, zatímco systém 3x1 + 2x3 = 1, x1 + x3 = 1, 7x1 + 4x3 = 1, 5x1 + 3x3 = 1, x2 = 1 má právě jedno řešení x1 = −1, x2 = 1, x3 = 2. 2.30. Správné odpovědi zní: (a) b1 = b2 + b3; (b) nelze; (c) b1 ̸= b2 + b3; (d) nelze. 2.31. Množina všech řešení je {(−10t, (a + 4)t, (3a − 8)t) ; t ∈ R}. 2.32. Pro a = 0 nemá uvažovaný systém řešení; pro a ̸= 0 má nekonečně mnoho řešení. 2.33. Při zachování pořadí jsou správné odpovědi „ano“, „ne“, „ne“ a „ano“. 2.34. i) Pro b ̸= −7 je x = z = (2+a)/(b +7), y = (3a −b −1)/(b +7) (1b). ii) Pro b = −7 (1b) a a ̸= −2 (1b) nemá řešení (1b), pro a = −2 je řešením x = z, 3z − 1 (2b). 2.37. Odečtením prvního řádku od všech ostatních řádků a následným rozvojem podle prvního sloupce ob- držíme Vn(x1, x2, . . . , xn) = 1 x1 x2 1 . . . xn−1 1 0 x2 − x1 x2 2 − x2 1 . . . xn−1 2 − xn−1 1 ... ... ... ... ... 0 xn − x1 x2 n − x2 1 . . . xn−1 n − xn−1 1 = x2 − x1 x2 2 − x2 1 . . . xn−1 2 − xn−1 1 ... ... ... ... xn − x1 x2 n − x2 1 . . . xn−1 n − xn−1 1 . Vytkneme-li z i-tého řádku xi+1 − x1 pro i ∈ {1, 2, . . . , n − 1}, dostaneme Vn(x1, x2, . . . , xn) = (x2 − x1) · · · (xn − x1) 1 x2 + x1 . . . ∑n−2 j=0 x n−j−2 2 x j 1 ... ... ... ... 1 xn + x1 . . . ∑n−2 j=0 x n−j−2 n x j 1 . 4. VLASTNOSTI LINEÁRNÍCH ZOBRAZENÍ 116 10. BÁZE A SKALÁRNÍ SOUČINY Odečtením od každého sloupce (počínaje posledním a konče druhým) x1-násobku předcházejícího lze docílit úpravy 1 x2 + x1 . . . ∑n−2 j=0 x n−j−2 2 x j 1 ... ... ... ... 1 xn + x1 . . . ∑n−2 j=0 x n−j−2 n x j 1 = 1 x2 . . . xn−2 2 ... ... ... ... 1 xn . . . xn−2 n . Proto Vn(x1, x2, . . . , xn) = (x2 − x1) · · · (xn − x1) Vn−1(x2, . . . , xn). Neboť je zřejmě V2(xn−1, xn) = xn − xn−1, platí (uvažme matematickou indukci) Vn(x1, x2, . . . , xn) = ∏ 1≤i 1), zatímco nedospělí jedinci vysílí a zničí část dospělé populace (tj. koeficient a může být i záporný). Navíc si je třeba někdo pěstuje a průběžně si ujídá konstantní počet c < 0. Speciálním takovým příkladem s c = 0 je např. Fibonacciho posloupnost čísel y0, y1, . . . , kde yn+2 = yn+1 + yn. Jestliže při řešení matematického problému nemáme žádný nový nápad, vždy můžeme zkusit, do jaké míry funguje známé řešení podobných úloh. Zkusme proto dosadit do rovnice (3.1) s koeficientem c = 0 podobné řešení jako u rovnic lineárních, tj. f (n) = λn pro nějaké skalární λ. Dosazením dostáváme λn+2 − aλn+1 − bλn = λn (λ2 − aλ − b) = 0. Tento vztah bude platit buď pro λ = 0 nebo při volbě hodnot λ1 = 1 2 (a + √ a2 + 4b), λ2 = 1 2 (a − √ a2 + 4b). Zjistili jsme tedy, že skutečně opět taková řešení fungují, jen musíme vhodně zvolit skalár λ. To nám ale nestačí, protože my chceme najít řešení pro jakékoliv počáteční hodnoty f (0) a f (1), a zatím jsme našli jen dvě konkrétní posloupnosti splňující danou rovnici (a nebo dokonce jen jednu, pokud je λ2 = λ1). Jak jsem již dovodili i u zcela obecných lineárních rekurencí, součet dvou řešení f1(n) a f2(n) naší rovnice f (n + 2) − a · f (n + 1) − b · f (n) = 0 je zjevně opět řešením téže rovnice a totéž platí pro konstatní násobky řešení. Naše dvě konkrétní řešení proto poskytují daleko obecnější řešení f (n) = C1λn 1 + C2λn 2 125 x 1 35 0,95 30 0,9 0,85 25 0,8 0,75 20 0,7 151050 Dále si procvičme, jak řešit lineární diferenční rovnice druhého řádu s konstantními koeficienty. Posloupnost vyhovující dané rekurentní rovnici druhého řádu je dána jednoznačně, pokud zadáme navíc nějaké dva její sousední členy. Znovu si povšimněme dalšího využití komplexních čísel: pro určení explicitního vzorce pro n-tý člen posloupnosti reálných čísel můžeme potřebovat výpočty s čísly komplexními (to nastává tehdy, pokud má charakteristický polynom dané diferenční rovnice komplexní kořeny). 3.3. Nalezněte explicitní vzorec pro posloupnost vyhovující následující lineární diferenční rovnici s počátečními podmínkami: xn+2 = 2xn + n, x1 = 2, x2 = 2. Řešení. Zhomogenizovaná rovnice je xn+2 = 2xn. Její charakteristický polynom je x2 −2, jeho kořeny jsou ± √ 2. Řešení zhomogenizované rovnice je tedy tvaru a( √ 2)n + b(− √ 2)n , pro libovolné a, b ∈ R. Partikulární řešení budeme hledat metodou neurčitých koeficientů. Nehomogenní část dané rovnice je lineární polynom n, partikulární řešení proto budeme nejprve hledat ve tvaru lineárního polynomu v proměnné n, tedy kn + l, kde k, l ∈ R. Dosazením do původní rovnice dostáváme k(n + 2) + l = 2(kn + l) + n. Porovnáním koeficientů u proměnné n na obou stranách rovnice dostáváme vztah k = 2k + 1, tedy k = −1, porovnáním absolutních členů pak vztah 2k + l = 2l, tedy l = −2. Celkem je tedy partikulárním řešením je posloupnost −n − 2. 2. DIFERENČNÍ ROVNICE pro libovolné skaláry C1 a C2 a pro jednoznačné vyřešení konkrétní úlohy se zadanými počátečními hodnotami f (0) a f (1) nám zbývá jen najít příslušné konstanty C1 a C2. (A také si musíme ujasnit, zda to pro všechny počáteční hodnoty půjde). 3.8. Volba skalárů. Ukažme si, jak to může fungovat alespoň na jednom příkladě. Soustředíme se přitom na problém, že kořeny charakteristického polynomu nevychází obecně ve stejném oboru skalárů, jako jsou koeficienty v rovnici. (3.2) yn+2 = yn+1 + 1 2 yn y0 = 2, y1 = 0. V našem případě je tedy λ1,2 = 1 2 (1 ± √ 3) a zjevně y0 = C1 + C2 = 2 y1 = 1 2 C1(1 + √ 3) + 1 2 C2(1 − √ 3) je splněno pro právě jednu volbu těchto konstant. Přímým výpočtem C1 = 1 − 1 3 √ 3, C2 = 1 + 1 3 √ 3 a naše úloha má jediné řešení f (n) = (1 − 1 3 √ 3) 1 2n (1 + √ 3)n + (1 + 1 3 √ 3) 1 2n (1 − √ 3)n . Všimněme si, že i když nalezená řešení pro rovnice s celočíselnými koeficienty vypadají složitě a jsou vyjádřena pomocí iracionálních (případně komplexních) čísel, o samotném řešení dopředu víme, že je celočíselné též. Bez tohoto „úkroku“ do většího oboru skalárů bychom ovšem obecné řešení napsat neuměli. S podobnými jevy se budeme potkávat velice často. Obecné řešení nám také umožňuje bez přímého vyčíslování konstant diskutovat kvalitativní chování posloupnosti čísel f (n), tj. zda se budou s rostoucím n blížit k nějaké pevné hodnotě nebo budou oscilovat v nějakém rozsahu nebo utečou do neomezených kladných nebo záporných hodnot. 3.9. Obecný případ homogenních rekurencí s konstantními koeficienty. Zkusme nyní stejně jako v případě druhého řádu dosadit volbu xn = λn pro nějaký ( zatím neznámý) skalár λ do obecné homogenní rovnice z definice 3.6. Dostáváme pro každé n podmínku λn−k (a0λk + a1λk−1 · · · + ak) = 0 což znamená, že buď λ = 0 nebo je λ kořenem tzv. charakteristického polynomu v závorce. Charakteristický polynom ale už není závislý na n. Předpokládejme, že má charakteristický polynom k různých kořenů λ1, . . . , λk. Můžeme za tímto účelem i rozšířit uvažované pole skalárů, např. Q na R nebo R na C, protože výsledkem výpočtu pak stejně budou řešení, která opět zůstanou v původním poli díky samotné rovnici. Každý z kořenů nám dává jedno možné řešení xn = (λi)n . 126 1. LINEÁRNÍ ROVNICE A PROCESY Řešení dané nehomogenní diferenční rovnice druhého řádu bez počátečních podmínek jsou tedy tvaru a( √ 2)n + b(− √ 2)n − n − 2, a, b ∈ R. Nyní dosazením do počátečních podmínek určíme neznámé a, b ∈ R. Pro početní jednoduchost použijeme malého triku: z počátečních podmínek a daného rekurentního vztahu vypočteme člen x0 : x0 = 1 2 (x2 − 0) = 1. Daný rekurentní vztah spolu s podmínkami x0 = 1 a x1 = 1 pak zřejmě splňuje tatáž posloupnost, která splňuje původní počáteční podmínky. Máme tedy následující vztahy pro a, b: x0 : a( √ 2)0 + b(− √ 2)0 − 2 = 1, tedy a + b = 3, x1 : √ 2a − √ 2b = 5, jejichž řešením dostáváme a = 6+5 √ 2 4 , b = 6−5 √ 2 4 . Řešením je po- sloupnost xn = 6 + 5 √ 2 4 ( √ 2)n + 6 − 5 √ 2 4 (− √ 2)n − n − 2. 3.4. Určete reálnou bázi prostoru řešení homogenní diferenční rov- nice xn+4 = xn+3 + xn+1 − xn, Řešení. Charakteristický polynom dané rovnice je x4 − x3 − x + 1. Hledáme-li jeho kořeny, řešíme reciprokou rovnici x4 − x3 − x + 1 = 0 Standardním postupem nejprve vydělíme rovnici výrazem x2 a poté zavedeme substituci t = x + 1 x , tedy t2 = x2 + 1 x2 + 2. Obdržíme rovnici t2 − t − 2 = 0, s kořeny t1 = −1, t2 = 2. Pro obě tyto hodnoty neznámé t pak řešíme zvlášť rovnici danou substitučním vztahem: x + 1 x = −1. Ta má dva komplexní kořeny x1 = −1 2 + i √ 3 2 = cos(2π/3) + i sin(2π/3) a x2 = −1 2 − i √ 3 2 = cos(2π/3) − i sin(2π/3). Pro druhou hodnotu neznámé t dostáváme rovnici x + 1 x = 2 s dvojnásobným kořenem 1. Celkem je tedy bazí hledaného vektorového prostoru posloupností, které jsou řešením dané diferenční rovnice, následující čtveřice posloupností: {−1 2 + i √ 3}∞ n=1, {−1 2 − CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET Abychom byli uspokojeni, potřebujeme k lineárně nezávislých řešení. K tomu nám postačí ověřit nezávislost dosazením k hodnot pro n = 0, . . . , k − 1 pro k možností λi. Dostaneme tzv. Vandermondovu matici a je pěkným (ale ne úplně snadným) cvičením spočíst, že pro všechna k a jakékoliv k–tice různých λi je determinant takovéto matice nenulový, viz ??. To ale znamená, že zvolená řešení jsou lineárně nezávislá. Nalezli jsme tedy fundamentální systém řešení homogenní diferenční rovnice v případě, že všechny kořeny jejího charakteristického polynomu jsou po dvou různé. Uvažme nyní násobný kořen λ a dosaďme do definiční rovnice předpokládané řešení xn = nλn . Dostáváme pod- mínku a0nλn + · · · + ak(n − k)λn−k = 0. Tuto podmínku je možné přepsat pomocí tzv. derivace polynomu, kterou značíme apostrofem: λ(a0λn + · · · + akλn−k )′ = 0 a hned na začátku kapitoly páté uvidíme, že kořen polynomu f je vícenásobný právě, když je kořenem i jeho derivace f ′ . Naše podmínka je tedy splněna. Při vyšší násobnosti ℓ kořenu charakteristického polynomu můžeme postupovat obdobně a využijeme skutečnosti, že ℓ–násobný kořen je kořenem všech derivací polynomu až do ℓ − 1 včetně. Derivace přitom postupně vypadají takto: f (λ) = a0λn + · · · + akλn−k f ′ (λ) = a0nλn−1 + · · · + ak(n − k)λn−k−1 f ′′ (λ) = a0n(n − 1)λn−2 + · · · + ak(n − k)(n − k − 1)λn−k−2 ... f (ℓ+1) = a0n . . . (n − ℓ)λn−ℓ−1 + . . . + ak(n − k) . . . (n − k − ℓ)λn−k−ℓ−1 Podívejme se na případ trojnásobného kořenu λ a hledejme řešení ve tvaru n2 λn . Dosazením do definiční podmínky dostaneme rovnost a0n2 λn + · · · + ak(n − k)2 λn−k = 0. Zjevně je levá strana rovna výrazu λ2 f ′′ (λ) + λf ′ (λ) a protože je λ kořenem obou derivací, je podmínka splněna. Indukcí snadno dokážeme, že i obecnou podmínku pro hledané řešení ve tvaru xn = nℓ λn , a0nℓ λn + . . . ak(n − k)ℓ λn−k = 0, dostaneme jako vhodnou lineární kombinaci derivací charakteristického polynomu začínající λℓ+1 f (ℓ+1) + 1 2 λℓ ℓ(ℓ + 1)f (ℓ) + . . . a dostali jsme se tedy blízko k úplnému důkazu následující: Věta. Každá homogenní lineární diferenční rovnice řádu k nad libovolným číselným oborem K obsaženým v komplexních číslech K má za množinu všech řešení k–rozměrný vektorový prostor generovaný posloupnostmi xn = nℓ λn , kde λ 127 i √ 3}∞ n=1,{1}∞ n=1 (konstantní posloupnost) a {n}∞ n=1. Hledáme-li však reálnou bázi, musíme nahradit dva generátory (posloupnosti) z této báze s komplexními hodnotami generátory reálnými. Protože tyto generátory jsou geometrické řady, jejichž libovolné členy jsou komplexně sdružená čísla, můžeme vzít jako vhodné generátory posloupnosti dané polovinou součtu, resp. polovinou i-násobku rozdílu, daných komplexních generátorů. Takto dostaneme následující reálnou bázi řešení: {1}∞ n=1 (konstantní posloupnost), {n}∞ n=1, {cos(n · 2π/3)}∞ n=1, {sin(n · 2π/3)}∞ n=1. 3.5. Najděte posloupnost, která vyhovuje nehomogenní diferenční rovnici s počátečními podmínkami: xn+2 = xn+1 + 2xn + 1, x1 = 2, x2 = 2. Řešení. Obecné řešení zhomogenizované rovnice je tvaru a(−1)n + b2n . Partikulárním řešením je konstanta −1/2. Obecné řešení dané nehomogenní rovnice bez počátečních podmínek je tedy a(−1)n + b2n − 1 2 . Dosazením do počátečních podmínek zjistíme konstanty a = −5/6, b = 5/6. Dané rovnici s počátečními podmínkami tedy vyhovuje po- sloupnost − 5 6 (−1)n + 5 3 2n−1 − 1 2 . 3.6. Určete posloupnost reálných čísel, která vyhovuje následující nehomogenní diferenční rovnici s počátečními podmínkami: 2xn+2 = −xn+1 + xn + 2, x1 = 2, x2 = 3. Řešení. Obecné řešení zhomogenizované rovnice je tvaru a(−1)n + b(1/2)n . Partikulárním řešením je konstanta 1. Obecné řešení dané nehomogenní rovnice bez počátečních podmínek je tedy a(−1)n + b ( 1 2 )n + 1. Dosazením do počátečních podmínek zjistíme konstanty a = 1, b = 4. Dané rovnici s počátečními podmínkami tedy vyhovuje posloupnost (−1)n + 4 ( 1 2 )n + 1. 2. DIFERENČNÍ ROVNICE jsou (komplexní) kořeny charakteristického polynomu a mocniny ℓ probíhají všechna přirozená čísla od nuly až do násobnosti příslušného kořenu λ. Důkaz. Výše použité vztahy násobnosti kořenů a derivací uvidíme později, a nebudeme tu dokazovat tvrzení, že každý komplexní polynom má právě tolik kořenů, včetně násobnosti, jaký má stupeň. Zbývá tedy ještě dokázat, že nalezená k–tice řešení je lineárně nezávislá. I v tomto případě lze induktivně dokázat nenulovost příslušného determinantu, jako jsme zmiňovali u toho Vandermondova výše. 3.10. Reálné báze řešení reálných differenčních rovnic. Pro rovnice s reálnými koeficienty povedou reálné počáteční podmínky vždy na reálná řešení. Přesto ale budou příslušná fundamentální řešení z právě odvozené věty často existovat pouze v oboru komplexním. Zkusme proto najít jiné generátory, se kterými se nám bude pracovat lépe. Potože jsou koeficienty charakteristického polynomu reálné, každý jeho kořen bude buď také reálný nebo musí kořeny vystupovat po dvou komplexně zdru- žených. Jestliže si řešení popíšeme v goniometrickém tvaru jako λn = |λ|n (cos nϕ + i sin nϕ) ¯λn = |λ|n (cos nϕ − i sin nϕ), okamžitě je vidět, že jejich součtem a rozdílem dostáváme jiná dvě lineárně nezávislá řešení xn = |λ|n cos nϕ, yn = |λ|n sin nϕ. Difereční rovnice se velmi často vyskytují jako model dynamiky nějakého systému. Pěkným tématem na přemýšlení je proto souvislost absolutních hodnot jednotlivých kořenů a stabilizace řešení, buď všech nebo v závislosti na počátečních podmínkách. Nepůjdeme zde do podrobností, protože teprve v páté kapitole budeme probírat pojem konvergence hodnot k nějaké hodnotě limitní apod., jistě je tu ale prostor pro zajímavé numerické experimenty např. s oscilacemi vhodných populačních nebo ekonomických modelů. 3.11. Nehomogenní lineární diferenční rovnice. Stejně jako u systémů lineárních rovnic můžeme dostat všechna řešení nehomogenních lineárních diferenčních rovnic a0(n)xn + a1(n)xn−1 + · · · + ak(n)xn−k = b(n), kde koeficienty ai a b jsou skaláry, které mohou záviset na n, a a0(n) ̸=, ak(n) ̸= 0. Postupujeme tak, že najdeme jedno řešení a přičteme celý vektorový prostor dimenze k řešení odpovídajících systémů homogenních. Skutečně takto dostáváme řešení a protože je rozdíl dvou řešení nehomogenní rovnice zjevně řešením homogenní, dostáváme takto řešení všechna. U systémů lineárních rovnic se mohlo stát, že nemusel vůbec mít řešení. To u našich diferenčních rovnic možné není. Zato ale bývá nesnadné nalézt to jedno potřebné partikulární 128 1. LINEÁRNÍ ROVNICE A PROCESY 3.7. Řešte následující diferenční rovnici: xn+4 = xn+3 − xn+2 + xn+1 − xn. Řešení. Z teorie víme, že prostor řešení této diferenční rovnice bude čtyřdimenzionální vektorový prostor, jehož generátory zjistíme z kořenů charakteristického polynomu dané rovnice. Charakteristická rovnice je x4 − x3 + x2 − x + 1 = 0. Jedná se o reciprokou rovnici (to znamená, že koeficienty u (n−k)-té a k-té mocniny x, k = 1, . . . , n, jsou shodné). Zavedeme tedy substituci u = x + 1 x . Po vydělení rovnice x2 (nula nemůže být kořenem) a substituci (všimněte si, že x2 + 1 x2 = u2 − 2) dostáváme x2 − x + 1 − 1 x + 1 x2 = u2 − u − 1 = 0. Dostáváme tedy neznámé u1,2 = 1± √ 5 2 . Odtud pak z rovnice x2 −ux+ 1 = 0 určíme čtyři kořeny x1,2,3,4 = 1 ± √ 5 ± √ −10 ± 2 √ 5 4 . Nyní si všimněme, že kořeny charakteristické rovnice jsme mohli „uhodnout“ rovnou. Je totiž x5 + 1 = (x + 1)(x4 − x3 + x2 − x + 1), a tedy jsou kořeny polynomu x4 − x3 + x2 − x + 1 i kořeny polynomu x5 + 1, což jsou páté odmocniny z −1. Takto dostáváme, že řešením charakteristikého polynomu jsou čísla x1,2 = cos(π 5 )±sin(π 5 ) a x3,4 = cos(3π 5 ) ± sin(3π 5 ). Tedy reálnou bází prostoru řešení dané diferenční rovnice je například báze posloupností cos(nπ 5 ), sin(nπ 5 ), cos(3nπ 5 ) a sin(3nπ 5 ), což jsou siny a kosiny argumentů příslušných mocnin kořenů charakteristického polynomu. Všimněme si, že jsme mimochodem odvodili algebraické výrazy pro cos(π 5 ) = 1+ √ 5 4 , sin(π 5 ) = √ 10−2 √ 5 4 , cos(3π 5 ) = √ 5−1 4 a sin(3π 5 ) = √ 10+2 √ 5 4 (vzhledem k tomu, že všechny kořeny rovnice mají absolutní hodnotu 1, tak jsou to reálné, resp. imaginární, části příslušných kořenů). 3.8. Určete explicitní vyjádření posloupnosti vyhovující diferenční rovnici xn+2 = 2xn+1 − 2xn se členy x1 = 2, x2 = 2. Řešení. Kořeny charakteristického polynomu x2 −2x +2 jsou 1+i a 1−i. Báze (komplexního) vektorového prostoru řešení je tedy tvořena posloupnostmi yn = (1 + i)n a zn = (1 − i)n . Hledanou posloupnost můžeme vyjádřit jako lineární kombinaci těchto poslopností (s komplexními koeficienty). Je tedy xn = a · yn + b · zn, kde a = a1 + ia2, CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET řešení nehomogenního systému, pokud je chování skalárních koeficientů v rovnici složité. Omezíme se tu na jediný případ, kdy příslušný homogenní systém má koeficienty konstantní a b(n) je polynom stupně s. Řešení pak lze hledat ve tvaru polynomu xn = α0 + α1n + · · · + αsns s neznámými koeficienty αi, i = 1, . . . , s. Dosazením do diferenční rovnice a porovnáním koeficientů u jednotlivých mocnin n dostaneme systém s + 1 rovnic pro s + 1 proměnných αi. Pokud má tento systém řešení, našli jsme řešení našeho původního problému. Pokud řešení nemá, může stačit zvětšit stupeň s hledaného polynomu. Např. rovnice xn − xn−2 = 2 nemůže mít konstantní řešení, ale dosazením xn = α0+α1n dostáváme řešení α1 = 1 (a koeficient α0 může být libovolný) a proto je obecné řešení naší rovnice xn = C1 + C2(−1)n + n. Všimněme si, že skutečně matice příslušného systému rovnic pro polynom nižšího stupně nula je nulová a rovnice 0·α0 = 2 nemá řešení. doplnit pořádněji diskusi řešitelnosti pomocí variace konstant ... 3.12. Lineární filtry. Uvažujme nyní nekonečné posloup- nosti x = (. . . , x−n, x−n+1, . . . , x−1, x0, x1, . . . , xn, . . . ) a budeme, podobně jako u systémů lineárních rovnic, pracovat s operací T , která zobrazí celou posloupnost x na posloupnost z = T x se členy zn = a0xn + a1xn−1 + · · · + akxn−k. S posloupnostmi x můžeme opět pracovat jako s vektory vzhledem ke sčítání i násobení skaláry po složkách. Pouze bude tento velký vektorový prostor nekonečněrozměrný. Naše zobrazení T je zjevně lineárním zobrazením na takovém vektorovém prostoru. Posloupnosti si představme jako diskrétní hodnoty nějakého signálu, odečítané zpravidla ve velmi krátkých časových jednotkách, operace T pak může být filtrem, který signál zpracovává. Bude nás zajímat, jak odhadnout vlastnosti, které takový „filtr“ bude mít. Signály jsou velice často ze své podstaty dány součtem několika částí, které jsou samy o sobě víceméně periodické. Z naší definice je ale zřejmé, že periodické posloupnosti xn, tj. posloupnosti splňující pro nějaké pevné přirozené číslo p xn+p = xn budou mít i periodické obrazy z = T x zn+p = a0xn+p + a1xn−1+p + · · · + akxn−k+p = a0xn + a1xn−1 + · · · + akxn−k = zn se stejnou periodou p. Pro pevně zvolenou operaci T nás bude zajímat, které vstupní periodické posloupnosti zůstanou přibližně stejné 129 b = b1 +ib2. Z rekurentního vztahu dopočteme x0 = 1 2 (2x1 −x2) = 0 a dosazením n = 0 a n = 1 do uvažovaného vyjádření xn dostáváme 1 = x0 = a1 + ia2 + b1 + ib2 2 = x1 = (a1 + ia2)(1 + i) + (b1 + ib2)(1 − i), a porovnáním reálné a komplexní složky obou rovnic dostáváme lineární soustavu čtyř rovnic o čtyřech neznámých a1 + b1 = 1 a2 + b2 = 0 a1 − a2 + b1 + b2 = 2 a1 + a2 − b1 + b2 = 0 s řešením a1 = b1 = b2 = 1 2 a a2 = −1/2. Celkem můžeme hledanou posloupnost vyjádřit jako xn = ( 1 2 − 1 2 i)(1 + i)n + ( 1 2 + 1 2 i)(1 − i)n . Posloupnost můžeme však vyjádřit i pomocí reálné báze (komplexního) vektorového prostoru řešení, totiž posloupností un = 1 2 (yn + zn) = ( √ 2)n cos(nπ 4 ) a vn = 1 2 i(zn − yn) = ( √ 2)n sin(nπ 4 ). Matice přechodu od komplexní báze k reálné je T := (1 2 −1 2 i 1 2 1 2 i ) , inverzní matice je T −1 = ( 1 1 i −i ) , pro vyjádření posloupnosti xn pomocí reálné báze, tj. souřadnice (c, d) posloupnosti xn v bázi {un, vn}, pak máme ( c d ) = T −1 ( a b ) = ( 1 1 ) , máme tedy alternativní vyjádření posloupnosti xn, ve kterém se nevyskytují komplexní čísla (ale zase jsou v něm odmocniny): xn = ( √ 2)n cos (nπ 4 ) + ( √ 2)n sin (nπ 4 ) , které jsme samozřejmě mohli získat též řešením dvou lineárních rovnic o dvou neznámých c, d, totiž 1 = x0 = c · u0 + d · v0 = c a 2 = x1 = c · u1 + d · v1 = c + d. 3.9. Určete explicitní vyjádření posloupnosti vyhovující diferenční rovnici xn+2 = 3xn+1 + 3xn se členy x1 = 1 a x2 = 3. 3.10. Určete explicitní vzorec pro n-tý člen jediné posloupnosti {xn}∞ n=1 vyhovující následujícím podmínkám: xn+2 = xn+1 − xn, , x1 = 1, x2 = 5. 3. ITEROVANÉ LINEÁRNÍ PROCESY (případně až na násobek) a které budou utlumeny na nulové hodnoty. V druhém případě tedy hledáme jádro našeho lineárního zobrazení T . To je ale dáno právě homogenní diferenční rov- nicí a0xn + a1xn−1 + · · · + akxn−k = 0, a0 ̸= 0 ak ̸= 0, kterou jsme se naučili řešit. 3.13. Špatný equalizer. Jako příklad uvažujme velmi jednoduchý lineární filtr zadaný rovnicí zn = (T x)n = xn+2 + xn. Výsledky takového zpracování signálu jsou naznačeny na následujících čtyřech obrázcích pro postupně se zvyšující frekvenci periodického signálu xn = cos(φn). Červený je původní signál, zelený je výsledek po zpracování filtrem. Nerovnoměrnosti křivek jsou důsledkem nepřesného kreslení, oba signály jsou samozřejmě rovnoměrnými sinusovkami. 1 1 0 2 2 -1 0 -2 43 5 A=7.1250 1 1 0 2 2 -1 0 -2 43 5 A=19.375 1 1 0 2 2 -1 0 -2 43 5 A=25.500 1 1 0 2 2 -1 0 -2 43 5 A=29.583 Všimněme si, že v oblastech, kde je výsledný signál přibližně stejně silný jako původní, dochází k dramatickému posuvu fáze signálu. Levné equalizery skutečně podobně špatně fungují. doplnit podrobný výpočet pomocí uvedených nástrojů 3. Iterované lineární procesy 3.14. Iterované procesy. V praktických modelech se často setkáváme se situací, kdy je vývoj systému v jednom časovém období dán lineárním procesem, zajímáme se ale o chování systému po mnoha iteracích. Často přitom samotný lineární proces zůstává pořád stejný, z pohledu našeho matematického modelu tedy nejde o nic jiného než opakované násobení stavového vektoru stále stejnou maticí. 130 1. LINEÁRNÍ ROVNICE A PROCESY 3.11. Určete explicitní vzorec pro n-tý člen jediné posloupnosti {xn}∞ n=1 vyhovující následujícím podmínkám: −xn+3 = 2xn+2 + 2xn+1 + xn, x1 = 1, x2 = 1, x3 = 1. 3.12. Určete explicitní vzorec pro n-tý člen jediné posloupnosti {xn}∞ n=1 vyhovující následujícím podmínkám: −xn+3 = 3xn+2 + 3xn+1 + xn, x1 = 1, x2 = 1, x3 = 1. Nyní přejděme k modelům růstu využívajících maticového počtu. Leslieho model růstu, který jsem detailně rozebrali v teorii, velmi dobře popisuje nejen populace ovcí (podle kterých byl sestaven), ale uplatňuje se npříklad i při modelování následujích populací: 3.13. Zajíci podruhé. Ukažme si, jak můžeme Leslieho modelem popsat populaci zajíců na louce, kterou jsme se zaobírali v příkladu (3.1). Uvažujme, že zajíci umírají po dovršení devátého měsíce věku (v původním modelu byl věk zajíců neomezen). Označme počty zajíců (resp. zaječic) podle stáří v měsících v čase t (měsíců) jako x1(t), x2(t),..., x9(t), tak počty zajíců v jednotlivých věkových skupinách budou po jednom měsíci x1(t + 1) = x2(t) + x3(t) + · · · + x9(t), xi(t + 1) = xi−1(t), pro i = 2, 3, . . . , 10, neboli          x1(t + 1) x2(t + 1) x3(t + 1) x4(t + 1) x5(t + 1) x6(t + 1) x7(t + 1) x8(t + 1) x9(t + 1)          =          0 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0                   x1(t) x2(t) x3(t) x4(t) x5(t) x6(t) x7(t) x8(t) x9(t)          . Charakteristický polynom uvedené matice je λ9 −λ7 −λ6 −λ5 −λ4 − λ3 −λ2 −λ−1. Kořeny této rovnice nejsme schopni explicitně vyjádřit, jeden z nich však velmi dobře odhadnout, λ1 . = 1, 608 (proč musí být menší než ( √ 5 + 1)/2)?). Populace bude tedy podle tohoto modelu růst přibližně s geometrickou řadou 1, 608t . 3.14. Model vývoje populace velryb. Pro vývoj populace jsou podstatné samice a u nich není důležitý věk, ale plodnost. Z tohoto hlediska můžeme samice rozdělit na novorozené neboli juvenilní, tj. dosud neplodné samice, mladé plodné samice, dospělé samice s největší plodností a samice postmenopauzní, které již plodné nejsou, ale mají velký význam při ochraně mláďat nebo vyhledávání zdrojů potravy. Budeme modelovat vývoj takové populace v čase. Za časovou jednotku zvolíme dobu dosažení dospělosti. Novorozená samice, která tuto dobu přežije, dospěje k plodnosti. Vývoj mladé samice do plné CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET Zatímco pro řešení systémů lineárních rovnic jsme potřebovali jen minumum znalostí o vlastnostech lineárních zobrazení, k pochopení chování iterovaného systému budeme účelně používat znalosti vlastních čísel, vlastností vlastních vektorů a další strukturní výsledky. V jistém smyslu se pohybujeme v podobném prostředí jako u lineárních rekurencí a skutečně můžeme náš popis filtrů v minulých odstavcích takto také popsat. Představme si, že pracujeme se zvukem a uchováváme si stavový vektor Yn = (xn, . . . , xn−k+1) všech hodnot od aktuální až po poslední, kterou ještě v našem lineárních filtru zpracováváme. V jednom (ve vzorkovací frekveci audio signálu mimořádně krátkém) časovém intervalu pak přejdeme ke stavovému vektoru Yn+1 = (xn+1, xn, . . . , xn−k+2), kde první hodnota xn+1 = a1xn + · · · + akxn−k+1 je spočtena jako u homogenních diferenčních rovnic, ostatní si jen posunujeme o jednu pozici a poslední zapomeneme. Příslušná čtvercová matice řádu k, splňující Yn+1 = A · Yn, bude vypadat takto: A =        a1 a2 . . . ak−1 ak 1 0 . . . 0 0 0 1 ... 0 0 ... ... ... ... 0 0 . . . 1 0        Pro takovou jednoduchou matici jsme si odvodili explicitní postup pro úplné řešení otázky, jak vypadá formule pro řešení. Obecně to tak snadno nepůjde ani pro velice podobné systémy. Jedním z typických případů je studium dynamiky populací v různých biologických systémech. Všimněme si také, že vcelku pochopitelně má matice A za charakteristický polynom právě p(λ) = λk − a1λk−1 − · · ·−ak (snadno dovodíme pomocí rozvoje podle posledního sloupce a rekurencí). To je snadno vysvětlitelné přímo, protože řešení xn = λn , λ ̸= 0 vlastně nyní znamená, že matice A vynásobením převede vlastní vektor (λk , . . . , λ)T na jeho λ–násobek. Musí být tedy λ vlastním číslem matice A. 3.15. Model růstu populací. Představme si, že zkoumáme nějaký systém jednotlivců (pěstovaná zvířata, hmyz, buněčné kultury apod.) rozdělený do m skupin (třeba podle stáří, fází vývoje hmyzu apod.). Stav Xn je tedy dán vektorem Xn = (u1, . . . , um)T závisejícím na okamžiku tn, ve kterém systém pozorujeme. Lineární model vývoje takového systému je dán maticí A dimenze n, která zadává změnu vektoru Xn na Xn+1 = A · Xn při přírůstku času z tk na tk+1. 131 plodnosti a vývoj dospělé samice k menopauze závisí na podmínkách prostředí. Přechod do další plodnostní kategorie je tedy náhodný jev. Stejně je náhodným jevem i úmrtí samice. Mladá plodná samice má za jednotku času průměrně méně mláďat, než samice plodná. Tyto poznatky vyjádříme formalizovaně. Označme x1(t), resp. x2(t), resp. x3(t), resp. x4(t), množství juvenilních, resp. mladých, resp. plně plodných, resp. postmenopauzních, samic v čase t. Množství může vyjadřovat počet jedinců, ale také počet jedinců vztažených na jednotkový areál (tzv. populační hustotu), případně také celkovou biomasu a podobně. Dále označme p1 pravděpodobnost, že juvenilní samice přežije jednotkový časový interval a tedy během něho dospěje, a p2, resp. p3, pravděpodobnost, že během jednotkové doby mladá, resp. plně plodná, samice, která neuhyne, dospěje do následující kategorie, tj. mladá do plné plodnosti a plně plodná k menopauze. Dalším náhodným jevem je umírání (pozitivně řečeno: přežívání) samic, které nedospějí do další kategorie; označme pravděpodobnosti přežití po řadě q2, q3 a q4 pro mladé, plně plodné a postmenopauzní samice. Každé z čísel p1, p2, p3, q2, q3, q4 jakožto pravděpodobnost je z intervalu [0, 1]. Mladá samice může přežít, dospět do plné plodnosti nebo uhynout; tyto jevy jsou neslučitelné, společně tvoří jev jistý a možnost úmrtí nelze vyloučit. Platí tedy p2 + q2 < 1. Z podobných důvodů platí p3 + q3 < 1. Nakonec ještě označíme f2, resp. f3 průměrný počet dcer mladé, resp. plně plodné, samice. Tyto parametry splňují nerovnost 0 < f2 < f3. Očekávaný počet novorozených samic v následujícím časovém období je součtem dcer mladých a plně plodných samic, tj. x1(t + 1) = f2x2(t) + f3x3(t). Označme na okamžik x2,1(t +1) množství mladých samic v čase t +1, které byly v předchozím období, tj. v čase t juvenilními, a x2,2(t + 1) množství mladých samic, které již v čase t byly plodné, jednotkový časový interval přežily, ale nedosáhly plné plodnosti. Pravděpodobnost p1, že juvenilní samice přežije jednotkový časový interval, můžeme vyjádřit jako klasickou, tj. jako poměr x2,1(t + 1)/x1(t), a podobně můžeme vyjádřit pravděpodobnost q2 jako poměr x2,2(t + 1)/x2(t). Poněvadž mladé samice v čase t + 1 jsou právě ty, které dospěly z juvenilního stádia, a ty, které již plodné byly, přežily a nedospěly k plné plodnosti, platí x2(t + 1) = x2,1(t + 1) + x2,2(t + 1) = p1x1(t) + q2x2(t). Analogicky odvodíme očekávaný počet plně plodných samic jako x3(t + 1) = p2x2(t) + q3x3(t) 3. ITEROVANÉ LINEÁRNÍ PROCESY Uvažujme jako příklad tzv. Leslieho model růstu, ve kterém vystupuje matice A =          f1 f2 f3 . . . fm−1 fm τ1 0 0 . . . 0 0 0 τ2 0 . . . 0 0 0 0 τ3 ... 0 0 ... ... ... ... 0 0 0 . . . τm−1 0          , jejíž parametry jsou svázány s vývojem populace rozdělené do m věkových skupin tak, že fi označuje relativní plodnost příslušné věkové skupiny (ve sledovaném časovém skoku vznikne z N jedinců v i–té skupině fiN jedinců nových, tj. ve skupině první), zatímco τi je relativní úmrtnost i-té skupiny během jednoho období. Pochopitelně lze použít takový model s libovolným počtem věkových skupin. Všechny koeficienty jsou tedy nezáporná reálná čísla a čísla τ jsou mezi nulou a jedničkou (a pokud jsou všechna rovna jedné, jde vlastně o lineární rekurenci s konstantními koeficienty). Než se pustíme do obecnější teorie, trochu si pohrajeme s tímto konkrétním modelem. Přímým výpočtem pomocí Laplaceova rozvoje podle posledního sloupce spočteme charakteristický polynom pm(λ) matice A pro model s m skupinami: pm(λ) = det(A−λE) = −λpm−1(λ)+(−1)m−1 fmτ1 . . . τm−1. Vcelku snadno dovodíme indukcí, že tento charakteristický polynom má tvar pm(λ) = (−1)m (λm − a1λm−1 − · · · − am−1λ − am) s vesměs nezápornými koeficienty a1, . . . , am, pokud jsou všechny prametry τi a fi kladné. Např. je vždy am = fmτ1 . . . τm−1. Zkusme kvalitativně odhadnout rozložení kořenů polynomu pm, detaily budeme umět přesně vysvětlit a ověřit až po absolvování příslušných partií tzv. matematické analýzy v kapitole páté a později. Vyjádříme si pm(λ) = ±λm (1 − q(λ)) kde q(λ) = a1λ−1 + · · · + amλ−m je ostře klesající a nezáporná funkce pro λ > 0. Evidentně bude proto existovat právě jedno kladné λ, pro které bude q(λ) = 1 a tedy také pm(λ) = 0. Jinými slovy, pro každou Leslieho matici existuje právě jedno kladné reálné vlastní číslo. Pro skutečné Leslieho modely populací bývají všechny koeficienty τi i fj mezi nulou a jedničkou a typicky nastává situace, kdy jediné reálné vlastní číslo λ1 je větší nebo rovno jedné, zatímco absolutní hodnoty ostatních vlastních čísel jsou ostře menší než jedna. Jestliže začneme s libovolnýmn stavovým vektorem X, který bude dán jako součet vlastních vektorů X = X1 + · · · + Xm 132 1. LINEÁRNÍ ROVNICE A PROCESY a očekávaný počet postmenopauzních samic x4(t + 1) = p3x3(t) + q4x4(t). Nyní můžeme označit A =     0 f2 f3 0 p1 q2 0 0 0 p2 q3 0 0 0 p3 q4     , x(t) =     x1(t) x2(t) x3(t) x4(t)     a předchozí rekurentní formule přepsat v maticovém tvaru x(t + 1) = Ax(t). Pomocí této maticové diferenční rovnice snadno spočítáme očekávané množství velrybích samic v jednotlivých plodnostních kategoriích, pokud známe složení populace v nějakém počátečním čase. Konkrétně, pro populaci kosatek dravých byly odpozorovány populační parametry p1 = 0,9775, q2 = 0,9111, f2 = 0,0043, p2 = 0,0736, q3 = 0,9534. f3 = 0,1132, p3 = 0,0452, q4 = 0,9804; časovou jednotkou je v tomto případě jeden rok. Začneme-li v čase t = 0 s jednotkovým množstvím mladých samic v nějakém neobsazeném areálu, tj. s vektorem x(0) = (0, 1, 0, 0)T , můžeme spočítat x(1) =     0 0,0043 0,1132 0 0,9775 0,9111 0 0 0 0,0736 0,9534 0 0 0 0,0452 0,9804         0 1 0 0     =     0,0043 0,9111 0,0736 0     , x(2) =     0 0,0043 0,1132 0 0,9775 0,9111 0 0 0 0,0736 0,9534 0 0 0 0,0452 0,9804         0,0043 0,9111 0,0736 0     =     0,01224925 0,83430646 0,13722720 0,00332672     a tak můžeme pokračovat dále. Výsledky výpočtu můžeme také znázornit graficky; to je provedeno na obrázku 1. Vyzkoušejte si výpočet a grafické znázornění jeho výsledků i pro jiné počáteční složení populace. Výsledkem by mělo být pozorování, že celková velikost populace roste jako exponenciální funkce, poměry velikostí jednotlivých plodnostních tříd se postupně ustálí na konstantních hodnotách. Matice A má vlastní hodnoty λ1 = 1,025441326, λ2 = 0,980400000, λ3 = 0,834222976, λ4 = 0,004835698, vlastní vektor příslušný k největší vlastní hodnotě λ1 je w = (0,03697187, 0,31607121, 0,32290968, 0,32404724); tento vektor je normován tak, aby součet jednotlivých složek byl roven 1. CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET s vlastními hodnotami λi, pak při iteracích dostáváme Ak · X = λk 1X1 + . . . λk mXm, takže za předpokladu, že |λi| < 1 pro všechna i ≥ 2, budou všechny komponenty ve vlastních podprostorech velmi rychle mizet, kromě kompomenty λ1Xk 1. Rozložení populace do věkových skupin se tak budou rychle blížit poměrům komponent vlastního vektoru k dominantnímu vlastnímu číslu λ1. Například pro matici (uvědomme si význam jednotlivých koeficientů, jsou převzaty z modelu pro chov ovcí, tj. hodnoty τ zahrnují jak přirozený úhyn tak případné aktivity chovatelů na jatkách) A =       0 0.2 0.8 0.6 0 0.95 0 0 0 0 0 0.8 0 0 0 0 0 0.7 0 0 0 0 0 0.6 0       vyjdou vlastní hodnoty přibližně 1.03, 0, −0.5, −0, 27 + 0.74i, −0.27 − 0.74i s velikostmi 1.03, 0, 0.5, 0.78, 0.78 a vlastní vektor příslušný dominantnímu vlastnímu číslu je přibližně x = (30 27 21 14 8). Zvolili jsme rovnou jediný vlastní vektor se součtem souřadnic rovným stu, zadává nám proto přímo výsledné procentní rozložení populace. Pokud bychom chtěli místo tříprocentního celkového růstu populace setrvalý stav a předsevzali si ujídat více ovce třeba z druhé věkové skupiny, řešili bychom úlohu, o kolik máme změnšit τ2, aby bylo dominantní vlastní číslo rovno jedné. 3.16. Matice s nezápornými prvky. Reálné matice, které nemají žádné záporné prvky mají velmi speciální vlastnosti. Zároveň jsou skutečně časté v praktických modelech. Naznačíme proto teď proto tzv. Perronovu-Frobeniovu teorii, která se právě takovým maticím věnuje. tady by se hodilo trochu historie, vlastně jen naznačíme část výsledků Perrona, k Frobeniově obecnější situaci se vůbec nedopracujeme. Začneme definicí několika pojmů, abychom mohli naše úvahy vůbec formulovat. Kladné a primitivní matice Definice. Za kladnou matici budeme považovat takovou čtvercovou matici A, jejíž všechny prvky aij jsou reálné a ostře kladné. Primitivní matice je pak taková čtvercová matice A, jejíž nějaká mocnina Ak je kladná. Připoměňme, že spektrálním poloměrem matice A nazýváme maximum absolutních hodnot všech jejích (komplexních) vlastních čísel. Spektrálním poloměrem lineárního zobrazení na (konečněrozměrném) vektorovém prostoru rozumíme spektrální poloměr jeho matice v některé bázi. Normou 133 0 10 20 30 40 50 01234 Census with stage or age structure Time Numbers Obrázek 1. Vývoj populace kosatky dravé. Na vodorovné ose je čas v letech, na svislé velikost populace. Jednotlivé plochy zobrazují množství juvenilních, mladých, plně plodných a postmenopauzních samic v tomto pořadí zdola. Porovnejte vývoj velikosti populace s exponenciální funkcí F(t) = λt 1x0, kde x0 je celková velikost počáteční populace. Vypočítejte také relativní zastoupení jednotlivých plodnostních kategorií v populaci po jisté době vývoje a porovnejte ho se složkami vlastního vektoru w. Shoda je způsobena pouze tím, že matice A má jednu vlastní hodnotu, která má absolutní hodnotu největší z absolutních hodnot všech vlastních hodnot matice A, a tím, že vektorový podprostor generovaný vlastními vektory příslušnými k vlastním hodnotám λ2, λ3, λ4 má s nezáporným orthantem jednoprvkový průnik (pouze nulový vektor). Struktura matice A však sama nezaručuje takto jednoduše předvídatelný vývoj, je totiž reducibilní. (tyto pojmy asi ještě nebudou zavedeny, pokud vůbec) 3.15. Model růstu populace bodláků Dipsacus sylvestris. Tuto rostlinu můžeme vidět ve čtyřech podobách. Buď jako kvetoucí rostlinu nebo jako růžici listů, přičemž u růžic můžeme rozlišit trojí velikost – malé, střední a velké. Životní cyklus této jednodomé víceleté byliny můžeme popsat následovně. Kvetoucí rostlina vyprodukuje v pozdním létě větší množství semen a uhyne. Ze semen některá vyklíčí ještě v témže roce a vyroste z nich růžice listů, nejčastěji střední velikosti. Jiná semena zůstanou v zemi a přezimují. Některá z přezimujících semen na jaře vyklíčí a vyroste z nich růžice listů; poněvadž jsou ale přezimováním oslabena, bude tato růžice s nejvyšší pravděpodobností malá. Většina z přezimujících semen zůstane v zemi, a ta z nich, která přežijí, na jaře vyklíčí a vyrostou z nich malé růžice. Po třech nebo více zimách „spící“ 3. ITEROVANÉ LINEÁRNÍ PROCESY matice A ∈ Rn2 nebo vektoru x ∈ Rn rozumíme součet absolutních hodnot všech jejich prvků. U vektorů x píšeme pro jejich normu |x|. Následující výsledek je mimořádně užitečný a snad i dobře srozumitelný. Jeho důkaz se svou náročností dosti vymyká této učebnici, uvádíme ale alespoň jeho stručný nástin. Pokud by čtenář měl problém s plynulým čtení nástinu důkazu, doporučujeme jej přeskočit. Věta (Perronova). Jestliže je A primitivní matice se spektrálním poloměrem λ ∈ R, pak je λ jednoduchým kořenem charakteristického polynomu matice A, který je ostře větší než absolutní hodnota kteréhokoliv jiného vlastního čísla matice A. K vlastnímu číslu λ navíc existuje vlastní vektor x s výhradně kladnými prvky xi. Náznak důkazu. V důkazu se budeme opírat o intuici inspirováno materiálem na webu, viz http://www- users.math.umd.edu/ ˜mmb/475/spec.pdf elementární geometrie. Částečně budeme použité koncepty upřesňovat už v analytické geometrii ve čtvrté kapitole, některé analytické aspekty budeme studovat podrobněji v kapitolách páté a později, přesné důkazy některých analytických kroků v této učebnici nepodáme vůbec. Snad budou následující úvahy nejen osvětlovat dokazovaný teorém, ale budou také samy o sobě motivací pro naše další studium geometrie i matematické analýzy. Začneme docela srozumitelně znějícím pomocným lemmatem: Lemma. Uvažme libovolný mnohostěn P obsahující počátek 0 ∈ Rn . Jestliže nějaká iterace lineárního zobrazení ψ : Rn → Rn zobrazuje P do jeho vnitřku, pak je spektrální poloměr zobrazení ψ ostře menší než jedna. Uvažme matici A zobrazení ψ ve standardní bázi. Protože vlastní čísla Ak jsou k–té mocniny vlastních čísel matice A, můžeme rovnou bez újmy na obecnosti předpokládat, že samotné zobrazení ψ již zobrazuje P do vnitřku P . Zjevně tedy nemůže mít ψ žádnout vlastní hodnotu s absolutní hodnotou větší než jedna. Důkaz dále povedeme sporem. Předpokládejme, že existuje vlastní hodnota λ s |λ| = 1. Máme tedy dvě možnosti. Buď je λk = 1 pro vhodné k nebo takové k neexistuje. Obrazem P je uzavřená množina (to znamená, že pokud se body v obrazu budou hromadit k nějakému bodu y v Rn , bude y opět v obrazu) a hranici P tento obraz vůbec neprotíná. Nemůže tedy mít ψ pevný bod na hranici P ani nemůže existovat žádný bod na hranici, ke kterému by se mohly libovolně blížit body v obrazu. První argument vylučuje, že by nějaká mocnina λ byla jedničkou, protože to by takový pevný bod na hranici P jistě existoval. Ve zbývajícím případě jistě existuje dvourozměrný podprostor W ⊂ Rn , na nějž se ψ zužuje coby rotace o iracionální argument a jistě existuje bod y v průniku W s hranicí P . Pak by ale byl bod y libovolně přesně přiblížen body z množiny ψn (y) při průchodu přes všechny iterace a tedy by musel sám být také v obrazu. Došli jsme tedy ke sporu a lemma je ověřeno. 134 1. LINEÁRNÍ ROVNICE A PROCESY (odborně řečeno dormantní) semena hynou, ztrácí schopnost vyklíčit. Podle podmínek prostředí, kde rostlina roste, může malá nebo střední růžice listů do dalšího roku vyrůst, kterákoliv z růžic může zůstat ve své velikostní kategorii nebo uhynout – uschnout, být sežrána nějakým hmyzem a podobně. Střední nebo velká růžice může v následujícím roce vykvést. Kvetoucí rostlina produkuje semena a celý cyklus se opakuje. Abychom mohli předpovídat, jak rychle se bude populace uvažovaných bodláků v krajině šířit, potřebujeme popsané procesy nějak kvantifikovat. Botanici zjistili, že kvetoucí rostlina vyprodukuje průměrně 431 semen. Pravděpodobnosti klíčení různých semen, růstu růžic listů a vykvetení jsou shrnuty v tabulce: jev pravděpodobnost semeno vyprodukované rostlinou uhyne 0,172 ze semene vyroste malá růžice v témže roce 0,008 ze semene vyroste střední růžice v témže roce 0,070 ze semene vyroste velká růžice v témže roce 0,002 ze semene přezimujícího rok vyroste malá růžice 0,013 ze semene přezimujícího rok vyroste střední růžice 0,007 ze semene přezimujícího rok vyroste velká růžice 0,001 ze semene přezimujícího dva roky vyroste malá růžice 0,001 semeno po prvním přezimování uhyne 0,013 malá růžice přežije a nevyroste 0,125 střední růžice přežije a nevyroste 0,238 velká růžice přežije a nevyroste 0,167 z malé růžice vyroste střední 0,125 z malé růžice vyroste velká 0,036 ze střední růžice vyroste velká 0,245 střední růžice vykvete 0,023 velká růžice vykvete 0,750 Povšimněme si, že všechny relevantní jevy v životním cyklu rostliny mají pravděpodobnost přiřazenu a že se jedná o jevy neslučitelné. Budeme si představovat, že populaci pozorujeme vždycky na začátku vegetačního roku, řekněme v březnu, a že ke všem uvažovaným jevům dochází ve zbytku času, dejme tomu od dubna do února. V populaci se vyskytují kvetoucí rostliny, růžice tří velikostí, vyprodukovaná semena a semena dormantní jeden nebo dva roky. Toto pozorování by mohlo svádět k tomu, že populaci rozdělíme do sedmi tříd – semena čerstvá, dormantní první rok a dormantní druhý rok, růžice malé střední a velké, kvetoucí rostliny. Avšak z vyprodukovaných semen se v témže roce vyvinou buď růžice nebo semena přezimují. Čerstvá semena tedy netvoří samostatnou třídu, jejíž velikost bychom na začátku roku mohli určit. Označme tedy: CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET Nyní se dáme do důkazu Perronovy věty. Naším prvním krokem bude ověření existence vlastního vektoru, který má všechny prvky kladné. Uvažme za tím účelem tzv. standardní simplex S = {x = (x1, . . . , xn)T , |x| = 1, xi ≥ 0, i = 1, . . . , n}. Protože všechny prvky v matici A jsou nezáporné, obraz A · x bude mít samé nezáporné souřadnice stejně jako x a alespoň jedna z nich bude vždy nenulová. Zobrazení x → |A · x|−1 (A · x) proto zobrazuje S do sebe, Toto zobrazení S → S splňuje všechny předpoklady tzv. Browerovy věty o pevném bodě a proto existuje vektor y ∈ S takový, že je tímto zobrazením zobrazen sám na sebe. To ale znamená, že A · y = λ y, λ = |A · y| a našli jsme vlastní vektor, který leží v S. Protože ale má nějaká mocnina Ak podle našeho předpokladu samé kladné prvky a samozřejmě je také Ak ·y = λk y, všechny souřadnice vektoru y jsou ostře kladné (tj. leží ve vnitřku S) a λ > 0. Abychom dokázali zbytek věty, budeme uvažovat zobrazení zadané maticí A ve výhodnější bázi a navíc ho vynásobíme konstantou λ−1 : B = λ−1 (Y−1 · A · Y), kde Y je diagonální matice se souřadnicemi yi vektoru y na diagonále. Evidentně je B také primitivní matice a navíc je vektor z = (1, . . . , 1)T jejím vlastním vektorem. Jestliže nyní dokážeme, že µ = 1 je jednoduchým kořenem charakteristického polynomu matice B a všechny ostatní kořeny mají absolutní hodnotu ostře menší než jedna, bude Perronova věta dokázána. K tomu se nám teď bude hodit dříve dokázané pomocné lemma. Uvažujme matici B jako matici lineárního zobrazení, které zobrazuje řádkové vektory u = (u1, . . . , un) → u · B = v, tj. pomocí násobení zprava. Díky tomu, že je z = (1, . . . , 1)T vlastním vektorem matice B, je součet souřadnic řádkového vektoru v n∑ i,j=1 uibij = n∑ i=1 ui = 1, kdykoliv je u ∈ S. Proto toto zobrazení zobrazuje simplex S na sebe a má také jistě v S vlastní (řádkový) vektor w s vlastní hodnotou jedna (pevný bod, opět dle Browerovy věty). Protože nějaká mocnina Bk obsahuje samé ostře pozitivní prvky, je nutně obraz simplexu S v k–té iteraci zobrazení daného B uvnitř S. To už jsme blízko použití našeho lematu, které jsme si pro důkaz připravili. Budeme i nadále pracovat s řádkovými vektory a označme si P posunutí simplexu S do počátku pomocí vlastního vektoru w, který jsme právě našli, tj. P = −w + S. Evidentně je P mnohostěn obsahující počátek a vektorový podprostor V ⊂ Rn generovaný P je invariantní vůči násobení 135 x1(t) — počet semen dormantních první rok na jaře roku t x2(t) — počet semen dormantních druhý rok na jaře roku t x3(t) — počet malých růžic na jaře roku t x4(t) — počet středních růžic na jaře roku t x5(t) — počet velkých růžic na jaře roku t x6(t) — počet kvetoucích rostlin na jaře roku t Počet vyprodukovaných semen v roce t je 431x6(t). Pravděpodobnost, že semeno zůstane jako dormantní první rok, je rovna pravděpodobnosti, že ze semena nevyroste žádná růžice a že neuhyne, tedy 1 − (0,008 + 0,070 + 0,002 + 0,172) = 0,748. Očekávaný počet semen dormantních jednu zimu v následujícím roce tedy je x1(t + 1) = 0,748 · 431x6(t) = 322,388x6(t). Pravděpodobnost, že semeno, které již jeden rok bylo dormantní, zůstane dormantním i druhý rok je rovna pravděpodobnosti, že ze semena dormantního jeden rok nevyroste žádná růžice a že neuhyne, tedy 1 − 0,013 − 0,007 − 0,001 − 0,013 = 0,966. Očekávaný počet semen dormantních dvě zimy v následujícím roce tedy bude x2(t + 1) = 0,966x1(t). Malá růžice může vyrůst ze semena bezprostředně, ze semena dormantního jeden rok nebo dormantního dva roky. Očekávaný počet malých růžic vyrostlých bezprostředně v roce t je roven 0,008·431x6(t) = 3,448x6(t). Očekávaný počet malých růžic vyrostlých ze semen dormantních jeden a dva roky je 0,013x1(t) a 0,010x2(t). S těmito nově vyrostlými malými růžicemi jsou v populaci rostlin také malé růžice starší, které nevyrostly; těch je 0,125x3(t). Celkový očekávaný počet malých růžic tedy je x3(t + 1) = 0,013x1(t) + 0,010x2(t) + 0,125x3(t) + 3,448x6(t). Analogicky určíme očekávaný počet středních a velkých růžic x4(t + 1) =0,007x1(t) + 0,125x3(t) + 0,238x4(t) + 0,070 · 431x6(t) = =0,007x1(t) + 0,125x3(t) + 0,238x4(t) + 30,170x6, x5(t + 1) =0,245x4(t) + 0,167x5(t) + 0,002 · 431x6(t) = =0,245x4(t) + 0,167x5(t) + 0,862x6(t). Kvetoucí rostlina může vyrůst ze střední nebo velké růžice. Očekávaný počet kvetoucích rostlin tedy bude x6(t + 1) = 0,023x4(t) + 0,750x5(t). 3. ITEROVANÉ LINEÁRNÍ PROCESY maticí B násobením řádkových vektorů zprava. Zúžení našeho zobrazení na P tedy splňuje předpoklady pomocného lemmatu a proto nutně musí být všechny jeho vlastní hodnoty v absolutní hodnotě menší než jedna. Ještě se musíme vypořádat se skutečností, že právě uvažované zobrazení je dáno násobením řádkových vektorů zprava maticí B (zatímco nás původně zajímalo chování zobrazení, daného B pomocí násobení sloupcových vektorů zleva). To je ale ekvivalentní násobení transponovaných sloupcových vektorů transponovanou maticí B obvyklým způsobem zleva. Dokázali jsem tedy vlastně potřebné tvrzení o vlastních číslech pro matici transponovanou k naší matici B. Transponování ale vlastní čísla nemění. Dimenze prostoru V je přitom n−1, takže důkaz věty je ukončen. 3.17. Jednoduché důsledky. Následující velice užitečné tvrzení má při znalosti Perronovy věty až překvapivě jednoduchý důkaz a ukazuje, jak silná je vlastnost primitivnosti matice zobrazení. Důsledek. Jestliže A = (aij ) je primitivní matice a x ∈ Rn její vlastní vektor se samými nezápornými souřadnicemi a vlastní hodnotou λ, pak λ > 0 je spektrální poloměr A. Navíc platí minj n∑ i=1 aij ≤ λ ≤ maxj n∑ i=1 aij . Důkaz. Uvažme vlastní vektor x z dokazovaného tvrzení. Protože je A primitivní, můžeme zvolit pevně k tak, aby Ak už měla samé positivní prvky a pak je samozřejmě i Ak · x = λk x vektor se samými ostře kladnými souřadnicemi. Nutně proto je λ > 0. Z Perronovy věty víme, že spektrální poloměr µ je vlastním číslem a zvolme takový vlastní vektor y k µ, že rozdíl x − y má samé kladné souřadnice. Potom nutně pro všechny mocniny n 0 < An · (x − y) = λn x − µn y, ale zároveň platí λ ≤ µ. Odtud již vyplývá λ = µ. Zbývá odhad spektrálního poloměru pomocí minima a maxima součtů jednotlivých sloupců matice. Označme je bmin a bmax, zvolme za x vektor se součtem souřadnic jedna a počítejme: n∑ i,j=1 aij xj = n∑ i=1 λxi = λ λ = n∑ j=1 ( n∑ i=1 aij ) xj ≤ n∑ j=1 bmaxxj = bmax λ = n∑ j=1 ( n∑ i=1 aij ) xj ≥ n∑ j=1 bminxj = bmin 136 1. LINEÁRNÍ ROVNICE A PROCESY Dospěli jsme tedy k šesti rekurentním formulím pro jednotlivé složky populace studované rostliny. Označíme nyní A =         0 0 0 0 0 322,388 0,966 0 0 0 0 0 0,013 0,010 0,125 0 0 3,448 0,007 0 0,125 0,238 0 30,170 0,008 0 0,038 0,245 0,167 0,862 0 0 0 0,023 0,750 0         , x(t) =         x1(t) x2(t) x3(t) x4(t) x5(t) x6(t)         a předchozí rovnosti zapíšeme v maticovém tvaru vhodném pro vý- počet x(t + 1) = Ax(t). Pokud známe počty jednotlivých složek populace v nějakém počátečním roce t = 0, můžeme vypočítat očekávané počty rostlin a semen v letech následujících. Můžeme také počítat celkový počet jedinců n(t) v čase t, n(t) = 6∑ i=1 xi(t), relativní zastoupení jednotlivých složek xi(t)/n(t), i = 1, 2, 3, 4, 5, 6 a meziroční relativní změnu populace n(t + 1)/n(t). Výsledky takového výpočtu pro patnáct let a případ, že na nějakou lokalitu jsme přesadili jednu kvetoucí rostlinu, jsou uvedeny v tabulce 1. Na rozdíl od populace velryb by nyní obrázek nebyl příliš přehledný, počty rostlin jsou oproti počtům semen zanedbatelné, v obrázku by splynuly. Matice A má vlastní hodnoty λ1 = 2,3339 λ4 = 0,1187 + 0,1953i λ2 = −0,9569 + 1,4942i λ5 = 0,1187 − 0,1953i λ3 = −0,9569 − 1,4942i λ6 = −0,1274 Vlastní vektor příslušný k vlastní hodnotě λ1 je w = (0,6377, 0,2640, 0,0122, 0,0693, 0,0122, 0,0046); tento vektor je normován tak, aby součet jeho složek byl roven jedné. Vidíme, že s rostoucím časem t se relativní změna velikosti populace přibližuje vlastní hodnotě λ1, relativní zastoupení jednotlivých složek populace se přibližují složkám normovaného vlastního vektoru příslušného k vlastní hodnotě λ1. Každá nezáporná matice, která má nenulové prvky na stejných pozicích jako matice A je primitivní. Vývoj populace tedy zákonitě spěje ke stabilizované struktuře. 3.16. Model šíření jednoletých bylin. Budeme uvažovat rostliny, které na začátku léta vykvetou, na jeho vrcholu vyprodukují semena a samy uhynou. Některá ze semen vyklíčí ještě na konci podzimu (ozimé rostliny), jiná přečkají zimu v zemi a vyklíčí na začátku jara (jarní rostliny). Ozimé rostlinky (sazenice), které přes zimu nezmrznou, jsou na jaře větší než jarní a většinou z nich vyrostou větší rostliny než z jarních sazenic. Větší rostlina vyprodukuje více semen. Pak se celý vegetační cyklus opakuje. CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET Všimněmě si, že např. všechny Leslieho matice z 3.15, kde jsou všechny uvažované koeficienty fi a τj ostře kladné, jsou primitivní a tedy na ně můžeme plně použít právě odvozené výsledky. Perronova-Frobeniova věta je zobecněním Perronovy věty na obecnější matice, které tu nebudeme uvádět. Další informace lze najít např. v ??. 3.18. Markovovy řetězce. Velice častý a zajímavý případ lineárních procesů se samými nezápornými prvky v matici je matematický model systému, který se může nacházet v m různých stavech s různou pravděpodobností. V jistém okamžiku je systém ve stavu i s pravděpodobností xi a k přechodu z možného stavu i do stavu j dojde s pravděpodobností tij . Můžeme tedy proces zapsat takto: V čase n je systém popsán pravděpodobnostním vektorem xn = (u1(n), . . . , um(n))T . To znamená, že všechny komponenty vektoru x jsou reálná nezáporná čísla a jejich součet je roven jedné. Komponenty udávají rozdělení pravděpodobnosti jednotlivých možností stavů systému. Rozdělení pravděpodobností pro čas n + 1 bude dáno vynásobením pravděpodobnostní maticí přechodu T = (tij ), tj. xn+1 = T · xn. Protože předpokládáme, že vektor x zachycuje všechny možné stavy a proto s celkovou pravděpodobností jedna přejde opět do některého z nich, budou všechny sloupce matice T tvořeny také pravděpodobnostními vektory. Takovému procesu říkáme (diskrétní) Markovův proces. Všimněme si, že každý pravděpodobnostní vektor x je skutečně Markovovým procesem zobrazen na vektor se součtem souřadnic jedna: ∑ i,j tij xj = ∑ j (∑ i tij ) xj = ∑ j xj = 1. Nyní můžeme v plné síle použít Perronovu–Frobeniovu teorii. Protože je součet řádků matice T vždy roven vektoru (1, . . . , 1), je zcela elementárně vidět, že matice T − E je singulární a jednička proto bude zaručeně vlastním číslem matice T . Pokud je navíc T primitivní matice (tj. např. když jsou všechny prvky nenulové), z Důsledku 3.17 víme, že je jednička jednoduchým kořenem charakteristického polynomu a všechny ostatní mají absolutní hodnotu ostře měnší než jedna. Věta. Markovovy procesy s maticí, která nemá žádné nulové prvky nebo jejíž některá mocnina má tuto vlastnost, splňují: • existuje jediný vlastní vektor x∞ pro vlastní číslo 1, který je pravděpodobnostní • iterace T k x0 se blíží k vektoru x∞ pro jakýkoliv počáteční pravděpodobnostní vektor x0. 137 t x1 x2 x3 x4 x5 x6 n(t) 0 0,00 0,00 0,00 0,00 0,00 1,00 1,00 1 322,39 0,00 3,45 30,17 0,86 0,00 356,87 2 0,00 311,43 4,62 9,87 10,25 1,34 337,50 3 432,13 0,00 8,31 43,37 5,46 7,91 497,18 4 2 550,50 417,44 33,93 253,07 22,13 5,09 3 282,16 5 1 641,69 2 463,78 59,13 235,96 91,78 22,42 4 514,76 6 7 227,10 1 585,88 130,67 751,37 107,84 74,26 9 877,12 7 23 941,29 6 981,37 382,20 2 486,25 328,89 98,16 34 218,17 8 31 646,56 23 127,29 767,29 3 768,67 954,73 303,85 60 568,39 9 97 958,56 30 570,58 1 786,27 10 381,63 1 627,01 802,72 143 126,78 10 258 788,42 94 627,97 4 570,24 27 597,99 4 358,70 1 459,04 391 402,36 11 470 376,19 249 989,61 9 912,57 52 970,28 10 991,08 3 903,78 798 143,52 12 1 258 532,41 454 383,40 23 314,10 134 915,73 22 317,98 9 461,62 1 902 925,24 13 3 050 314,29 1 215 742,31 56 442,70 329 291,15 55 891,57 19 841,54 4 727 523,56 14 6 396 675,73 2 946 603,60 127 280,49 705 398,22 133 660,97 49 492,37 10 359 111,38 15 15 955 747,76 6 179 188,75 299 182,59 1 721 756,52 293 816,44 116 469,89 24 566 161,94 t x1(t) n(t) x2(t) n(t) x3(t) n(t) x4(t) n(t) x5(t) n(t) x6(t) n(t) n(t + 1) n(t) 0 0,000 0,000 0,000 0,000 0,000 1,000 356,868 1 0,903 0,000 0,010 0,085 0,002 0,000 0,946 2 0,000 0,923 0,014 0,029 0,030 0,004 1,473 3 0,869 0,000 0,017 0,087 0,011 0,016 6,602 4 0,777 0,127 0,010 0,077 0,007 0,002 1,376 5 0,364 0,546 0,013 0,052 0,020 0,005 2,188 6 0,732 0,161 0,013 0,076 0,011 0,008 3,464 7 0,700 0,204 0,011 0,073 0,010 0,003 1,770 8 0,522 0,382 0,013 0,062 0,016 0,005 2,363 9 0,684 0,214 0,012 0,073 0,011 0,006 2,735 10 0,661 0,242 0,012 0,071 0,011 0,004 2,039 11 0,589 0,313 0,012 0,066 0,014 0,005 2,384 12 0,661 0,239 0,012 0,071 0,012 0,005 2,484 13 0,645 0,257 0,012 0,070 0,012 0,004 2,191 14 0,617 0,284 0,012 0,068 0,013 0,005 2,371 15 0,650 0,252 0,012 0,070 0,012 0,005 Tabulka 1. Modelovaný vývoj populace bodláku Dipsacus sylvestris. Velikosti jednotlivých složek populace, celková velikost populace, relativní zastoupení jednotlivých složek a relativní přírůstky veli- kosti. Rok je tedy rozdělen na čtyři vegetační období a v každém z těchto období můžeme rozlišit několik „forem“ rostliny: Období stadia rostliny začátek jara malé a velké sazenice začátek léta malé, střední a velké kvetoucí rostliny vrcholné léto semena podzim sazenice a přezimující semena Označme x1(t), resp. x2(t), počet malých, resp. velkých, sazenic na začátku jara roku t a y1(t), resp. y2(t), resp. y3(t), počet malých, resp. středních, resp. velkých rostlin v létě téhož roku. Z malých sazenic mohou vyrůst malé nebo střední rostliny, z velkých sazenic mohou vyrůst střední nebo velké rostliny. Kterákoliv ze sazenic samozřejmě může uhynout (uschnout, být spasena krávou a podobně) a nevyroste z ní nic. Označme bij pravděpodobnost, že ze sazenice j-té velikosti, j = 1, 2, 3. ITEROVANÉ LINEÁRNÍ PROCESY Důkaz. První tvrzení vyplývá přímo z kladnosti souřadnic vlastního vektoru dovozené v Perronově větě. Pokud jsou algebraické a geometrické násobnosti vlastních čísel matice T stejné, pak druhé tvrzení okamžitě vyplývá z toho, že absolutní hodnoty všech ostatních vlastních čísel musí být ostře menší než jedna. Skutečně, za uvedeného předpoladu na vlastní čísla lze každý počáteční vektor x0 napsat jako součet vlastních vektorů matice T a při iterovaném působení matice T na počátečním vektoru x0 všechny komponenty rychle vymizí, kromě té jediné s vlastním číslem 1. Ve skutečnosti ale i při různé algebraické a geometrické násobnosti vlastních čísel dojdeme ke stejnému závěru pomocí podrobnějšího studia tzv. kořenových podprostorů pro maticí T , ke kterým se dostaneme v souvislosti s tzv. Jordanovým rozkladem ještě v této kapitole, viz poznámka ??. 3.19. Iterace stochastických matic. Matice Markovových procesů, tj. matice jejichž všechny sloupce mají součet svých komponent roven jedné se nazývají stochastické matice. Standardní úlohy spojené s Markovovými procesy zahrnují odpovědi na otázky po očekávané střední době přechodu mezi předem určenými stavy systému apod. Momentálně nejsme na řešení těchto úloh připraveni, vrátíme se ale k této tématice později. vymazat příslib, pokud to nenastane, a nahradit odkazem do literaturyPřeformulujeme předchozí větu do jednoduchého, ale asi docela překvapivého důsledku. Konvergencí k limitní matici v následujcím tvrzení myslíme skutečnost, že když si předem určíme možnou chybu ϵ > 0, tak najdeme hranici na počet iterací k po níž už všechny komponenty uvedené matice se od té limitní budou lišit o méně než ϵ. Důsledek. Nechť T je primitivní stochastická matice z Markovova procesu a x∞ je stochastický vlastní vektor k dominantnímu číslu 1 jako ve větě výše. Pak iterace T k konvergují k limitní matici T∞, jejíž všechny sloupce jsou rovny x∞. Nyní se ještě na rozlučku s Markovovými procesy zamyslíme se nad problémem, zda existují pro daný systém stavy, do kterých se má systém tendenci dostat a setrvat v nich. O stavu systému řekneme, že je přechodový, jestliže v něm systém setrvává s pravděpodobností ostře menší než jedna. Za absorbční označíme stav, ve kterém systém setrvává s pravděpodobností 1, a do kterého se lze dostat s nenulovou pravděpodobností z kteréhokoliv z přechodových stavů. Konečně, Markovův řetězec Xn je absorpční, jestliže jsou jeho všechny jeho stavy buď absorpční nebo přechodové. Je-li v absorpčním Markovově řetězci prvních r stavů systému absorpčních, pro stochastickou matici T systému to znamené, že se rozpadá na „blokově“ horní trojúhelníkový tvar T = ( E R 0 Q ) kde E je jednotková matice, jejíž rozměr je dán počtem absorpčních stavů, zatímco R je kladná matice a Q nezáporná. 138 1. LINEÁRNÍ ROVNICE A PROCESY vyroste rostlina i-té velikosti, i = 1, 2, 3. Pak je 0 < b11 < 1, b12 = 0, 0 < b21 < 1, 0 < b22 < 0, b31 = 0, 0 < b32 < 1, b11 + b21 < 1, b22 + b32 < 1 (promyslete si, co každá z těchto nerovností vyjadřuje). Pokud pravděpodobnost považujeme za klasickou, můžeme b11 vypočítat jako podíl příznivých výsledků (z malé vyrostla malá rostlina) a všech možných výsledků (počet malých sazenic), tj. b11 = y1(t)/x1(t). Odtud y1(t) = b11x1(t). Analogicky dostaneme rovnost y3(t) = b32x2(t). Označíme-li na chvíli y2,1(t), resp. y2,2(t) počet středních rostlin vyrostlých z malých, resp. velkých sazenic, je y2(t) = y2,1(t) + y2,2(t) a b21 = y2,1(t)/x1(t), b22 = y2,2(t)/x2(t) a tedy y2(t) = b21x1(t) + b22x2(t). Označíme B =   b11 0 b21 b22 0 b32   , x(t) = ( x1(t) x2(t) ) , y(t) =   y1(t) y2(t) y3(t)   a předchozí rovnosti zapíšeme v maticovém tvaru y(t) = Bx(t). Označíme-li po řadě c11, c12 a c13 počty semen, které vyprodukuje jedna malá, střední a velká rostlina, a z(t) celkový počet vyprodukovaných semen v létě roku t, platí z(t) = c11y1(t) + c12y2(t) + c13y3(t), nebo v maticovém tvaru z(t) = Cy(t) při označení C = ( c11 c12 c13 ) . Aby matice C popisovala modelovanou realitu, budeme předpokládat, že platí nerovnosti 0 < c11 < c12 < c13. Označme nakonec w1(t) a w2(t) počet semen, které vyklíčí ještě na podzim a počet semen, která přezimují, v tomto pořadí, a d11, resp. d21 pravděpodobnost, že semeno vyklíčí na podzim, resp. nevyklíčí (přezimuje), a f11, resp. f22 pravděpodobnost, že ozimá sazenice, resp. že přezimující semeno během zimy nezmrzne. Pravděpodobnosti vyklíčení d11, d21 zřejmě musí splňovat nerovnosti 0 < d11, 0 < d21, d11 + d21 = 1, CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET V každém případě iteracemi této matice budeme pořád dostávat stejný blok nulových hodnot v levém dolním bloku a tedy zcela jistě nebude primitivní, např. T 2 = ( E R + R · Q 0 Q2 ) . I o takových maticích lze získat hodně informací pomocí plné Perronovy–Frobeniovy teorie a se znalostí pravděpodobnosti a statistiky také odhadovat střední doby, po kterých se systém dostane do jedhodo z abosrpčních stavů apod. 4. Více maticového počtu Na vcelku praktických příkladech jsme viděli, že porozumění vnitřní struktuře matic a jejim vlastnostem je silným nástrojem pro konkrétní výpočty nebo analýzy. Ještě více to platí pro efektivitu numerického počítání s maticemi. Proto se budeme zase chvíli věnovat abstraktní teorii. Budeme přitom zkoumat další speciální typy lineárních zobrazení na vektorových prostorech ale také obecný případ, kdy je struktura zobrazení popsána tzv. Jordanovou větou. 3.20. Unitární prostory a zobrazení. Už jsme si zvykli, že je užitečné pracovat rovnou v číselném oboru komplexních čísel a to i v případě, kdy nás zajímají jen reálné objekty. Navíc v mnohých oblastech jsou komplexní vektorové prostory nutnou součástí úvah. Jasným příkladem je například tzv. kvantové počítání, které se stalo velmi akční oblastí teoretické informatiky, přestože kvantové počítače zatím zkonstruovány ve funkční podobě nebyly. Proto navážeme na ortogonální zobrazení a matice z konce druhé kapitoly následující definicí: Unitární prostory Definice. Unitární prostor je komplexní vektorový prostor V spolu se zobrazením V × V → C, (u, v) → u · v, které splňuje pro všechny vektory u, v, w ∈ V a skaláry a ∈ C (1) u · v = v · u (zde pruh značí komplexní konjugaci) (2) (au) · v = a(u · v) (3) (u + v) · w = u · w + v · w (4) je-li u ̸= 0, pak u · u > 0 (zejména je výraz reálný). Toto zobrazení nazýváme skalární součin na V . Reálné číslo √ v · v nazýváme velikostí vektoru v a vektor je normovaný, jestliže má velikost jedna. Vektory u a v nazýváme ortogonální, jestliže je jejich skalární součin nulový, bázi sestavenou z po dvou ortogonálních a normovaných vektorů nazýváme ortonormální báze V . Na první pohled jde o rozšíření definice euklidovských vektorových prostorů do komplexního oboru. Nadále budeme také používat alternativní značení ⟨u, v⟩ pro sklaární součin vektorů u a v. Zcela stejně jako v reálném oboru také okamžitě z definice vyplývají násludující jednoduché vlastnosti skalárního součinu pro všechny vektory ve V a skaláry 139 a poněvadž rostlinka snáze zmrzne, než semeno ukryté v zemi, budeme o pravděpodobnostech f11, f22 přežití zimy předpokládat 0 < f11 < f22 < 1. Při označení D = ( d11 d21 ) , F = ( f11 0 0 f22 ) , w(t) = ( w1(t) w2(t) ) dostaneme podobnými úvahami jako výše rovnosti w(t) = Dz(t), x(t + 1) = Fw(t). Poněvadž násobení matic je asociativní, můžeme pro počty jednotlivých stadií rostlin v následujícím roce z předchozích rovností sestavit rekurentní formule: x(t + 1) =Fw(t) = F ( Dz(t) ) = (FD)z(t) = (FD) ( Cy(t) ) = =(FDC)y(t) = (FDC) ( Bx(t) ) = (FDCB)x(t), y(t + 1) =Bx(t + 1) = B ( Fw(t) ) = (BF)w(t) = (BF) ( Dz(t) ) = =(BFD)z(t) = (BFD) ( Cy(t) ) = (BFDC)y(t), z(t + 1) =Cy(t + 1) = C ( Bx(t + 1) ) = (CB)x(t + 1) = (CB) ( Fw(t) ) = =(CBF)w(t) = (CBF) ( Dz(t) ) = (CBFD)z(t), w(t + 1) =Dz(t + 1) = D ( Cy(t + 1) ) = (DC)y(t + 1) = =(DC) ( Bx(t + 1) ) = (DCB)x(t + 1) = (DCB) ( Fw(t) ) = ==(DCBF)w(t). Při označení Ax = FDCB, Ay = BFDC, Az = CBFD, Aw = DCBF, je zjednodušíme na formule x(t+1) = Axx(t), y(t+1) = Ayy(t), z(t+1) = Azz(t), w(t+1) = Aw(t). Z těchto formulí již můžeme vypočítat složení populace rostlin v libovolném období libovolného roku, pokud známe složení populace v nějakém období počátečního (nultého) roku. Nechť je například známo složení populace v létě, tj. počet z(0) vysetých semen. Pak složení populace na začátku jara t-tého roku je x(t) = Axx(t − 1) = A2 xx(t − 2) = · · · = At−1 x x(1) = At−1 x Fw(0) = =At−1 x FDz(0). 4. VÍCE MATICOVÉHO POČTU v C: u · u ∈ R u · u = 0 právě tehdy, když u = 0 u · (av) = ¯a(u · v) u · (v + w) = u · v + u · w u · 0 = 0 · u = 0 (∑ i aiui ) · (∑ j bj vj ) = ∑ i,j ai ¯bj (ui · vj ), kde poslední rovnost platí pro všechny konečné lineární kombinace. Podrobné ověření je skutečně jednoduchým cvičením, např. první vztah plyne okamžitě z definiční vlastnosti (1). Standardním příkladem skalárního součinu na komplexním prostoru Cn je (x1, . . . , xn)T · (y1, . . . , xn)T = x1 ¯y1 + · · · + xn ¯yn. Díky konjugování souřadnic druhého argumentu toto zobrazení splňuje všechny požadované vlastnosti. Prostor Cn s tímto skalárním součinem budeme nazývat standardní unitární prostor v dimenzi n. Maticově můžeme tento skalární součin psát jako x · y = ¯yT · x. Zcela obdobně jako u euklidovských prostorů a ortogonálních zobrazení budou důležitá lineárních zobrazení, která respektují skalární součiny. Unitární zobrazení Lineární zobrazení φ : V → W mezi unitárními prostory se nazývá unitární zobrazení, jestliže pro všechny vektory u, v ∈ V platí u · v = φ(u) · φ(v). Unitární isomorfismus je bijektivní unitární zobrazení. 3.21. Vlastnosti prostorů se skalárním součinem. Ve stručné diskusi euklidovských prostorů v předchozí kapitole jsme už některé jednoduché vlastnosti prostorů se skalárním součinem odvodili, důkazy v komplexním oboru jsou velmi podobné. V dalším budeme pracovat s reálnými i komplexními prostory zároveň a budeme psát K pro R nebo C, v reálném případě je konjugace prostě identické zobrazení (tak jak skutečně zúžení konjugace na reálnou přímku v komplexní rovině je). Stejně jako u reálných prostorů definujeme obecně pro libovolný vektorový podprostor U ⊂ V v prostoru se skalárním součinem jeho ortogonální doplněk U⊥ = {v ∈ V ; u · v = 0 pro všechny u ∈ U}, což je zjevně také vektorový podprostor v V . Budeme v dalším pracovat prakticky pouze s konečněrozměrnými unitárními nebo euklidovskými prostory. Řada našich výsledků ale má přirozené rozšíření pro tzv. Hilbertovy prostory, což jsou jisté nekonečněrozměrné 140 1. LINEÁRNÍ ROVNICE A PROCESY Povšimněme si, že matice Az = CBFD je typu 1 × 1; není to tedy matice, ale skalár. Můžeme tedy označit λ = Az, vypočítat (3.5) λ = CBFD = ( c11 c12 c13 )   b11 0 b21 b22 0 b32   ( f11 0 0 f22 ) ( d11 d21 ) = = ( c11b11 + c12b21 c12b22 + c13b32 ) ( f11d11 f22d21 ) = = b11c11d11f11 + b21c12d11f11 + b22c12d21f22 + b32c13d21f22 a předchozí výpočet uspořádat do výhodného tvaru x(t) = (FDCB)t−1 FDz(0) = FD(CBFD)t−2 CBFDz(0) = = FD(CBFD)t−1 z(0) = FDAt−1 z z(0) = λt−1 FDz(0); tímto způsobem zůstanou pouze dvě násobení matic. Uvedeme konkrétní hodnoty matic B, C, D, F; jedná se o parametry hypotetické rostliny, které ale byly inspirovanou skutečnou trávou Vulpia ciliata: B =   0,3 0 0,1 0,6 0 0,2   , C = ( 1 10 100 ) , D = ( 0,5 0,5 ) , F = ( 0,05 0 0 0,1 ) . Nyní můžeme vypočítat jednotlivé matice, které zobrazují vektor popisující složení populace v nějakém vegetačním období na vektor složení populace v témže období následujícího roku: Ax = ( 0,0325 0,6500 0,0650 1,3000 ) Ay =   0,0075 0,0750 0,7500 0,0325 0,3250 3,2500 0,0100 0,1000 1,0000   , Az = 1,3325, Aw = ( 0,0325 1,3000 0,0325 1,3000 ) . Hodnota λ = Az = 1,3325 vyjadřuje meziroční relativní přírůstek populace. Přesvědčete se, že každá z matic Ax, Ay, Aw má jedinou nenulovou vlastní hodnotu λ = 1,3325; ostatní vlastní hodnoty jsou rovny 0. Ukážeme ještě jedno využití uvedeného modelu. Může nás zajímat, jak „pružně“ reaguje meziroční relativní přírůstek λ na na změnu jednotlivých „demografických parametrů“, jak např. změna pravděpodobnosti přežití semene přes zimu ovlivní meziroční přírůstek. Tuto otázku poněkud upřesníme. Za pružnost reakce charakteristiky λ na parametr s, označenou e(λ, s) prohlásíme relativní změnu hodnoty λ vztaženou k relativní změně parametru s. Ještě přesněji: označíme λ(s) meziroční přírůstek závislý na parametru s. Potom λ(s) = λ(s + s) − λ(s) vyjadřuje absolutní změnu relativního přírůstku λ při absolutní změně parametru s o s. Relativní změna λ tedy je CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET prostory se skalárním součinem, ke kterým se aspoň stručně vrátíme později. Tvrzení. Pro každý konečněrozměrný prostor V dimenze n se skalárním součinem platí: (1) Ve V existuje ortonormální báze. (2) Každý systém nenulových ortogonálních vektorů ve V je lineárně nezávislý a lze jej doplnit do ortogonální báze. (3) Pro každý systém lineárně nezávislých vektorů (u1, . . . , uk) existuje ortonormální báze (v1, . . . , vn) taková, že její vektory postupně generují stejné podprostory jako vektory uj , tzn. ⟨v1, . . . , vi⟩ = ⟨u1 . . . , ui⟩, 1 ≤ i ≤ k. (4) Je-li (u1, . . . , un) ortonormální báze V , pak souřadnice každého vektoru u ∈ V jsou vyjádřeny vztahem u = (u · u1)u1 + · · · + (u · un)un. (5) V libovolné ortonormální bázi má skalární součin souřadný tvar u · v = x · y = x1 ¯y1 + · · · + xn ¯yn kde x a y jsou sloupce souřadnic vektorů u a v ve zvolené bázi. Zejména je tedy každý n–rozměrný prostor se skalárním součinem izomorfní standardnímu euklidovskému Rn nebo unitárnímu Cn . (6) Ortogonální součet unitárních podprostorů V1 +· · ·+Vk ve V je vždy přímý součet. (7) Je-li A ⊂ V libovolná podmnožina, pak A⊥ ⊂ V je vektorový (tedy i unitární) podprostor a (A⊥ )⊥ ⊂ V je právě podprostor generovaný A. Navíc platí V = ⟨A⟩ ⊕ A⊥ . (8) V je ortogonálním součtem n jednorozměrných unitárních podprostorů. Důkaz. (1),(2),(3): Daný systém vektorů nejprve doplníme do libovolné báze (u1, . . . , un) vektorového prostoru V a spustíme na ni Grammovu–Schmidtovu ortogonalizaci z 2.41. Tak získáme ortogonální bázi s vlastnostmi požadovanými v (3). Přitom ale z algoritmu Grammovy–Schmidtovy ortogonalizace vyplývá, že pokud již původních k vektorů tvořilo ortogonální systém vektorů, pak v průběhu ortogonalizace zůstanou nezměněny. Dokázali jsme tedy zároeveň i (2) a (1). (4): Je-li u = a1u1 + · · · + anun, pak u · ui = a1(u1 · ui) + · · · + an(un · ui) = ai∥ui∥2 = ai (5): Podobně spočteme pro u = x1u1 + · · · + xnun, v = y1u1 + · · · + ynun u·v = (x1u1+· · ·+xnun)·(y1u1+· · ·+ynun) = x1 ¯y1+· · ·+xn ¯yn. (6): Potřebujeme ukázat, že pro libovolnou dvojici Vi, Vj ze zadaných podprostorů je jejich průnik triviální. Je-li však u ∈ Vi a zároveň u ∈ Vj , pak je u ⊥ u, tj. u · u = 0. To je ale možné pouze pro nulový vektor u ∈ V . 141 λ(s)/λ(s). Relativní změna přírůstku parametru s je s/s. Hledaná pružnost je tedy podíl těchto relativních změn, tj. e(λ, s) = λ(s)/λ(s) s/s = s λ(s) λ(s + s) − λ(s) s . Konkrétně, meziroční relativní přírůstek populace závislý na přežití semen přes zimu je podle (3.5) λ(f22) = d21(b22c12 + b32c13)f22 + d11(b11c11f11 + b21c12f11) a pro konkrétní zvolené hodnoty ostatních parametrů λ(f22) = 13f22 + 0,0325. Poněvadž f22 = 0,1, můžeme počítat λ(0,1) = 1,3325, λ(0,1+ s) = 1,3325+13 s, λ(0,1) = 13 s, takže e(λ, 0,1) = 0,1 1,3325 13 s s . = 0,976. Analogicky můžeme spočítat pružnost reakce relativního přírůstku λ populace na ostatních „demografických parametrech“. Výsledky jsou shrnuty v tabulce parametr pružnost reakce parametr pružnost reakce b11 0,006 c11 0,006 b21 0,019 c12 0,244 b22 0,225 c13 0,751 b23 0,750 f11 0,024 d11 0,024 f22 0,976 d21 0,976 Z ní můžeme vidět, že přírůstek λ je nejvíce ovlivňován množstvím přezimujících semen (parametr d21) a jejich přežíváním (parametr f22). Toto zjištění není nijak překvapivé, zemědělcům je tento fakt dobře známý již od neolitu. Výsledek však ukazuje, že matematický model skutečně nějak adekvátně realitu popisuje. 3.17. Uvažujme Leslieho model růstu pro populaci krys, které máme rozděleny do tří věkových skupin: do jednoho roku, od jednoho do dvou let a od dvou let do tří. Předpokládáme, že se žádná krysa nedožívá více než tří let. Průměrná porodnost v jednotlivých věkových skupinách připadajících na jednu krysu je následující: v 1.skupině je to nula a ve druhé i třetí 2 krysy. Krysy, které se dožijí jednoho roku umírají až po druhém roce života (úmrtnost ve druhé skupině je nulová). Určete úmrtnost v první skupině víte-li, že daná populace krys stagnuje (počet jedinců v ní se nemění). 3.18. Uvažujte následující Leslieho model: farmář chová ovce. Porodnost ovcí je dána pouze věkem a je průměrně 2 ovce na jednu ovci mezi jedním a dvěma lety věku, pět ovcí na ovci mezi dvěma a třemi lety věku a dvě ovce na ovci mezi třemi a čtyřmi roky věku. Ovce do 4. VÍCE MATICOVÉHO POČTU (7): Nechť u, v ∈ A⊥ . Pak (au + bv) · w = 0 pro všechny w ∈ A, a, b ∈ K (z distributivity skalárního součinu). Tím jsme ověřili, že A⊥ je unitární podprostor ve V . Nechť (v1, . . . , vk) je nějaká báze ⟨A⟩, vybraná z prvků A, (u1, . . . , uk) ortonormální báze vzniklá z Grammovy– Schmidtovy ortogonalizace vektorů (v1, . . . , vk). Doplňme ji na ortonormální bázi celého V (obojí existuje podle již dokázaných částí věty). Protože se jedná o ortogonální bázi, je nutně ⟨uk+1, . . . , un⟩ = ⟨u1, . . . , uk⟩⊥ = A⊥ a A ⊂ ⟨uk+1, . . . , un⟩⊥ (jak plyne z vyjádření souřadnic v ortonormální bázi). Je-li u ⊥ ⟨uk+1, . . . , un⟩, pak u je nutně lineární kombinací vektorů u1, . . . , uk, to je ale právě tehdy, když je lineární kombinací vektorů v1, . . . , vk, což je ekvivalentní příslušnosti u do ⟨A⟩. (8): Je pouze ekvivalentní formulací existence ortonormální báze. 3.22. Důležité vlastnosti velikosti. Nyní máme vše připraveno pro základní vlastnosti spojené s naší definicí velikostí vektorů. Hovoříme také o normě definované skalárním součinem. Všimněme si také, že všechna tvrzení se týkají vždy konečných množin vektorů a jejich platnost proto nezávisí na dimenzi prostoru V , ve kterém se vše odehrává. Věta. Pro libovolné vektory u, v v prostoru V se skalárním součinem platí (1) ∥u+v∥ ≤ ∥u∥+∥v∥ Přitom rovnost nastane právě, když jsou u a v lineárně závislé. (trojúhelníková nerovnost) (2) |u · v| ≤ ∥u∥ ∥v∥ Přitom rovnost nastane právě, když jsou u a v lineárně závislé. (Cauchyova nerovnost) (3) pro každý ortonormální systém vektorů (e1, . . . , ek) platí ∥u∥2 ≥ |u · e1|2 + · · · + |u · ek|2 (Besselova nerovnost). (4) Pro ortonormální systém vektorů (e1, . . . , ek) je vektor u v podprostoru ∈ ⟨e1, . . . , ek⟩ právě když ∥u∥2 = |u · e1|2 + · · · + |u · ek|2 . (Parsevalova rovnost) (5) Pro ortonormální systém vektorů (e1, . . . , ek) a u ∈ V je vektor w = (u · e1)e1 + · · · + (u · ek)ek jediným vektorem, který minimalizuje velikost ∥u − v∥ pro všechny v ∈ ⟨e1, . . . , ek⟩. Důkaz. Všechny důkazy spočívají v podstatě v přímých výpočtech: (2): Definujme vektor w := u− u·v v·v v, tzn. w ⊥ v a počítejme 0 ≤ ∥w∥2 = ∥u∥2 − (u·v) ∥v∥2 (u · v) − u·v ∥v∥2 (v · u) + (u·v)(u·v) ∥v∥4 ∥v∥2 0 ≤ ∥w∥2 ∥v∥2 = ∥u∥2 ∥v∥2 − 2(u · v)(u · v) + (u · v)(u · v) 142 2. MARKOVOVY PROCESY jednoho roku nerodí. Z roku na rok umře vždy polovina ovcí a to rovnoměrně ve všech věkových skupinách. Po čtyřech letech posílá farmář ovce na jatka. Farmář by rád ještě prodával (živá) jehňátka do jednoho roku na kožešinu. Jakou část jehňátek může každý rok prodat, aby mu velikost stáda zůstavala z roku na rok stejná? V jakém poměru budou potom rozděleny počty ovcí v jednotlivých věkových skupinách? Řešení. Matice daného modelu (bez zásahu farmáře) je L =     0 2 5 2 1 2 0 0 0 0 1 2 0 0 0 0 1 2 0     Farmář může ovlivnit kolik ovcí do jednoho roku mu ve stádu zůstane do dalšího roku, může tedy ovlivnit prvek l12 matice L. Zkoumáme tedy model L =     0 2 5 2 a 0 0 0 0 1 2 0 0 0 0 1 2 0     , a hledáme a tak, aby daná matice měla vlastní hodnotu 1 (víme, že má pouze jednu reálnou kladnou). Charakteristický polynom této matice je λ4 − 2aλ2 − 5 2 λ − 1 2 , požadujeme-li, aby měl kořen 1, musí být a = 1 5 (dosadíme za λ číslo 1 a položíme rovno nule). Farmář tedy může prodat 1 2 − 1 5 = 3 10 ovcí, které se mu v daný rok narodí. Odpovídající vlastní vektor k vlastnímu číslu 1 dané matice je (20, 4, 2, 1) a v těchto poměrech se taky ustálí populace ovcí. 2. Markovovy procesy 3.19. Mlsný hazardér. Hazardní hráč sází na to, která strana mince padne. Na začátku hry má tři kremrole. Na každý hod vsadí jednu kremroli a když jeho tip vyjde, tak k ní získá jednu navíc, pokud ne, tak kremroli prohrává. Hra končí, pokud všechny kremrole prohraje, nebo jich získá pět. Jaká je pravděpodobnost, že hra neskončí po čtyřech sázkách? Řešení. Před j-tým kolem (sázkou) můžeme popsat stav, ve kterém se hráč nachází náhodným vektorem Xj = (p0(j), p1(j), p2(j), p3(j), p4(j), p5(j)), kde pi je pravděpodobnost, že hráč má i kremrolí. Pokud má hráč před j-tou sázkou i kremrolí (i=2,3,4), tak po sázce má s poloviční pravděpodobností (i − 1) kremrolí a s poloviční pravděpodobností (i + 1) kremrolí. Pokud dosáhne pěti kremrolí nebo všechny prohraje už se počet CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET Odtud již přímo plyne, že ∥u∥2 ∥v∥2 ≥ |u · v|2 a rovnost nastane právě tehdy, když w = 0, tj. když jsou u a v lineárně závislé. (1): Opět stačí počítat ∥u + v∥2 = ∥u∥2 + ∥v∥2 + u · v + v · u = ∥u∥2 + ∥v∥2 + 2 Re(u · v) ≤ ∥u∥2 + ∥v∥2 + 2|u · v| ≤ ∥u∥2 + ∥v∥2 + 2∥u∥∥v∥ = (∥u∥ + ∥v∥)2 Protože se přitom jedná o kladná reálná čísla, je opravdu ∥u+ v∥ ≤ ∥u∥ + ∥v∥. Navíc, při rovnosti musí nastat rovnost ve všech předchozích nerovnostech, to však je ekvivalentní podmínce, že u a v jsou lineárně závislé (podle předchozí části důkazu). (3), (4): Nechť (e1, . . . , ek) je ortonormální systém vektorů. Doplníme jej do ortonormální báze (e1, . . . , en) (to vždy jde podle předchozí věty). Pak, opět podle předchozí věty, je pro každý vektor u ∈ V ∥u∥2 = n∑ i=1 (u · ei)(u · ei) = n∑ i=1 |u · ei|2 ≥ k∑ i=1 |u · ei|2 To je ale právě dokazovaná Besselova nerovnost. Přitom rovnost může nastat právě tehdy, když u · ei = 0 pro všechny i > k, a to dokazuje Parsevalovu rovnost. (5): Zvolme libovolný v ∈ ⟨e1, . . . , ek⟩ a doplňme daný ortonormální systém na ortonormální bázi (e1, . . . , en). Nechť (u1, . . . , un) a (x1, . . . , xk, 0, . . . , 0) jsou souřadnice u a v v této bázi. Pak ∥u−v∥2 = |u1 −x1|2 +· · ·+|uk −xk|2 +|uk+1|2 +· · ·+|un|2 a tento výraz je zjevně minimalizován při volbě jednotlivých vektorů x1 = u1, . . . , xk = uk. 3.23. Vlastnosti unitárních zobrazení. Vlastnosti ortogonálních zobrazení mají přímočarou obdobu v komplexním oboru. Můžeme je snadno zformulovat a dokázat společně: Tvrzení. Uvažme lineární zobrazení (endomorfismus) φ : V → V na prostoru se skalárním součinem. Pak jsou následující podmínky ekvivalentní: (1) φ je unitární nebo ortogonální transformace (2) φ je lineární isomorfismus a pro každé u, v ∈ V platí φ(u) · v = u · φ−1 (v) (3) matice A zobrazení φ v libovolné ortonormální bázi splňuje A−1 = ¯AT (pro euklidovské prostory to znamená A−1 = AT ) (4) matice A zobrazení φ v některé ortonormální bázi splňuje A−1 = ¯AT (5) řádky matice A zobrazení φ v ortonormální bázi tvoří ortonormální bázi prostoru Kn se standardním skalárním součinem (6) sloupce matice A zobrazení φ v ortonormální bázi tvoří ortonormální bázi prostoru Kn se standardním skalárním součinem 143 kremrolí nemění. Vektor Xj+1 tak získáme podle podmínek v priklání z Xj vynásobením maticí A :=         1 0, 5 0 0 0 0 0 0 0, 5 0 0 0 0 0, 5 0 0, 5 0 0 0 0 0, 5 0 0, 5 0 0 0 0 0, 5 0 0 0 0 0 0 0, 5 1         . Na začátku máme X1 =         0 0 0 1 0 0         , po čtyřech sázkách bude situaci popisovat náhodný vektor X5 = A4 X1 =         1 8 3 16 0 5 16 0 3 8         , tedy pravděpodobnost, že hra skončí do čtvté sázky (včetně) je polo- vina. Všimněme si ještě, že matice A popisující vývoj pravděpodobnostního vektoru X je pravděpodobnostní, tedy má součet prvků v každém sloupci 1. Nemá ale vlastnost vyžadovanou v Perronově–Frobeniově větě a snadným výpočtem zjistíte (nebo přímo uvidíte bez počítání), že existují dva lineárně nezávislé vlastní vektory příslušné k vlastnímu číslu 1 – případ, kdy hráči nezůstane žádná krémrole, tj. x = (1, 0, 0, 0, 0, 0)T , nebo případ kdy získá 5 krémrolí a hra tím pádem končí a všechny mu už zůstávají, tj. x = (0, 0, 0, 0, 0, 1)T . Všechna ostatní vlastní čísla (přibližně 0, 8, 0, 3, −0, 8, −0, 3) jsou v absolutní hodnotě ostře menší než jedna. Proto komponenty v příslušných vlastních podprostorech při iteraci procesu s libovolnou počáteční hodnotou vymizí a proces se blíží k limitní hodnotě pravděpodobnostího vektoru tvaru (a, 0, 0, 0, 0, 1−a), kde hodnota a závisí na počtu krémrolí, se kterými hráč začíná. V našem případě je to a = 0, 4, kdyby začal se 4 krémrolemi, bylo by to a = 0, 2 atd. 3.20. Půjčovna aut. Firma půjčující každý týden auta má dvě pobočky - jednu v Brně a jednu v Praze. Auto zapůjčené v Brně lze vrátit i v Praze a naopak. Po čase se zjistilo, že na konci týdne je vždy v Praze vráceno zhruba 80 % z aut vypůjčených v Praze a 90 % z aut vypůjčených v Brně. Jak je potřeba rozdělit auta mezi pobočky, aby na obou byl na začátku 4. VÍCE MATICOVÉHO POČTU Důkaz. (1) ⇒ (2): Zobrazení φ je prosté, proto musí být i na. Platí přitom φ(u)·v = φ(u)·φ(φ−1 (v)) = u·φ−1 (v). (2) ⇒ (3): Standardní skalární součin je v Kn vždy dán pro sloupce x, y skalárů výrazem x ·y = xT E¯y, kde E je jednotková matice. Vlastnost (2) tedy znamená, že matice A zobrazení φ je invertibilní a platí (Ax)T ¯y = xT A−1y. To znamená ¯xT ( ¯AT y − A−1 y) = 0 pro všechny x ∈ Kn . Zejména dosazením výrazu v závorce za x zjistíme, že to je možné pouze při ¯AT = A−1 . (3) ⇔ (4): Je-li ¯AT = A−1 v některé ortonormální bázi, pak to zaručuje platnost podmínky (2) (φ(u) · v = (Ax)T E¯y = xT EA−1y = u · φ−1 (v)) a tedy i (3). (4) ⇒ (5) Dokazované tvrzení je vyjádřeno prostřednictvím matice A zobrazení φ vztahem A ¯AT = E, to je ale zaručeno podmínkou (4). (5) ⇒ (6): Protože pro determinant platí | ¯AT A| = |E| = |A ¯AT | = |A||A| = 1, existuje inverzní matice A−1 . Přitom je A ¯AT A = A, proto i ¯AT A = E což vyjadřuje právě (6). (6) ⇒ (1): Ve vybrané ortonormální bázi je φ(u) · φ(v) = (Ax)T (Ay) = xAT ¯A ¯y = xT ¯E ¯y = xT ¯y kde x a y jsou sloupce souřadnic vektorů u a v. Tím je zaručeno zachovávání skalárního součinu. Charakterizace z předchozí věty si zaslouží několik poznámek. Matice A ∈ Matn(K) s vlastností A−1 = ¯AT se nazývají unitární matice pro komplexní skaláry (a v případě R jsme jim již říkali ortogonální matice). Z definiční vlastnosti plyne, že součin unitárních (resp. ortogonálních) matic je unitární (resp. ortogonální), stejně pro inverze. Unitární matice tedy tvoří podgrupu U(n) ⊂ Matn(C), ortogonální matice tvoří podgrupu O(n) ⊂ Matn(R). Hovoříme o unitární grupě a o ortogonální grupě. Jednoduchý výpočet 1 = det E = det(A ¯AT ) = det A det A = | det A|2 ukazuje, že determinant unitární matice má vždy velikost rovnu jedné, v případě reálných skalárů pak determinant musí být ±1. Dále, je-li Ax = λx pro unitární či ortogonální matici, pak (Ax) · (Ax) = x · x = |λ|2 (x · x). Proto jsou vlastní hodnoty ortogonálních matic v reálném oboru rovny ±1, vlastní hodnoty unitárních matic jsou vždy komplexní jednotky v komplexní rovině. Stejně jako u ortogonálních zobrazení také docela snadno ověříme, že ortogonální doplňky k invariantním podprostorům vzhledem k unitárnímu φ : V → V jsou vždy také invariatní. Skutečně, je-li φ(U) ⊂ U, u ∈ U a v ∈ U⊥ libovolné, pak φ(v) · φ(φ−1 (u)) = v · φ−1 (u). Protože je zúžení φ|U také unitární, musí to tedy být bijekce, zejména je φ−1 (u) ∈ U. Pak ovšem φ(v) · u = 0, protože v ∈ U⊥ . To znamená, že i φ(v) ∈ U⊥ . Odtud ovšem v komplexním oboru okamžitě dotáváme užitečný 144 2. MARKOVOVY PROCESY týdne vždy stejný počet aut jako předchozí týden? Jak bude vypadat situace po jisté dlouhé době, pokud jsou auta mezi pobočky na začátečátku náhodně rozdělena? Řešení. Hledaný začáteční počet aut v Brně označme xB a v Praze xP . Stav rozmístění aut mezi pobočkami je tedy popsán vektorem x = ( xB xP ) . Uvážíme-li takový násobek vektoru x, že součet jeho složek je 1, pak dávají jeho složky procentuální rozmístění aut. Na konci týdne bude podle zadání stav popsán vektorem( 0, 1 0, 2 0, 9 0, 8 ) ( xB xP ) . Matice A = ( 0, 1 0, 2 0, 9 0, 8 ) tedy popisuje náš (lineární) systém půjčování aut. Pokud má být na konci týdne v pobočkách stejně aut jako na začátku, pak hledáme takový vektor x, pro který platí Ax = x. To znamená, že hledáme vlastní vektor matice A příslušný vlastnímu číslu 1. Charakteristický polynom matice A je (0, 1−λ)(0, 8−λ)−0, 9.0, 2 = (λ−1)(λ+0, 1) a 1 je tedy opravdu vlastní hodnota matice A. Příslušný vlastní vektor x = ( xB xP ) splňuje rovnici ( −0, 9 0, 2 0, 9 −0, 2 ) ( xB xP ) = 0. Je to tedy násobek vektoru ( 0, 2 0, 9 ) . Pro zjištění procentuálního rozložení hledáme takový násobek, aby xB + xP = 1. To splňuje vektor 1 1,1 ( 0, 2 0, 9 ) = ( 0, 18 0, 82 ) . Správné rozložení aut mezi Brnem a Prahou je takové, že 18% aut bude v Brně a 82% aut v Praze. Pokud zvolíme libovolný počáteční stav x = ( xB xP ) , pak bude stav za n týdnů popsán vektorem xn = An x. Nyní je výhodné vyjádřit počáteční vektor x v bázi vlastních vektorů matice A. Vlastní vektor k vlastnímu číslu 1 už jsme našli a podobně se nalezne vlastní vektor k vlastnímu číslu −0, 1. Tím je například vektor ( −1 1 ) . Počáteční vektor tedy můžeme vyjádřit jako lineární kombinaci x = a ( 0, 2 0, 9 ) + b ( −1 1 ) . Stav po n týdnech je pak xn = An (a ( 0, 18 0, 82 ) + b ( −1 1 ) ) = a ( 0, 18 0, 82 ) + b(−0, 1)n ( −1 1 ) Druhý sčítanec se pro n → ∞ blíží nule a proto se stav ustálí na a ( 0, 18 0, 82 ) , tedy složce počátečního vektoru ve směru prvního vlastního vektoru. Koeficient a lze jednoduše vyjádřit pomocí počátečních počtů aut: a = xB +xP 1,1 . 3.21. Sledovanost televizí. V jisté zemi vysílají jisté dvě televizní stanice. Z veřejného výzkumu vyplynulo, že po jednom roce přejde 1/6 diváků první stanice ke druhé stanici, 1/5 diváků druhé stanice přejde k první stanici. Popište časový vývoj počtu diváků sledujících dané stanice jako Markovův proces, napište jeho matici, nalezněte její vlastní čísla a vlastní vektory. CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET Důsledek. Nechť φ : V → V je unitární zobrazení komplexních vektorových prostorů. Pak je V ortogonálním součtem jednorozměrných vlastních podprostorů. Důkaz. Jistě existuje alespoň jeden vlastní vektor v ∈ V . Pak je zúžení φ na invariantní podprostor ⟨v⟩⊥ opět unitární a jistě má opět nějaký vlastní vektor. Po n takovýchto krocích obdržíme hledanou ortogonální bázi z vlastních vektorů. Po vynormování vektorů získáme ortonormální bázi. Nyní už je možné snadno pochopit detaily důkazu spektrálního rozkladu ortogonálního zobrazení z 2.48 na konci druhé kapitoly — reálnou matici ortogonálního zobrazení interpretujeme jako matici unitárního zobrazení na komplexním rozšíření euklidovského prostoru a pečlivě sledujeme důsledky struktury kořenů reálného charakteristického polynomu nad komplexním oborem. Automaticky přitom dostáváme invariantní dvourozměrné podprostory zadané dvojicemi komplexně sdružených vlastních čísel a tedy příslušné rotace pro zúžené původní reálné zobrazení. 3.24. Duální a adjungovaná zobrazení. Při diskusi vektorových prostorů a lineárních zobrazení jsme již ve druhé kapitole letmo zmínili duální vektorový prostor V ∗ všech lineárních forem na vektorovém prosotru V , viz 2.37. Pro každé lineární zobrazení mezi vektorovými prostory ψ : V → W můžeme přirozeně definovat zobrazení ψ∗ : W∗ → V ∗ vztahem ⟨v, ψ∗ (α)⟩ = ⟨ψ(v), α⟩, kde ⟨ , ⟩ značí vyčíslení formy (druhý argument) na vektoru (první argument), v ∈ V a α ∈ W∗ jsou libovolné. Zvolme si báze v na V , w na W a matici A pro zobrazení ψ v těchto bazích. Pak snadno spočteme v duálních bazích matici zobrazení ψ∗ v příslušných duálních bazí na duálních prostorech. Skutečně, definiční vztah říká, že pokud bychom reprezentovali vektory z W∗ v souřadnicích jako řádky skalárů, pak je zobrazení ψ∗ je dáno toutéž maticí jako ψ, pokud jí násobíme řádkové vektory zprava: ⟨ψ(v), α⟩ = (α1, . . . , αn) · A ·    v1 ... vn    = ⟨v, ψ∗ (α)⟩. To znamená, že maticí duálního zobrazení ψ∗ je transponovaná matice AT , protože α · A = (AT · αT )T . Předpokládejme nadále, že se pohybujeme ve vektorovém prostoru se skalárním součinem. Jestliže tedy zvolíme pevně jeden vektor v ∈ V , dosazování vektorů za druhý argument ve skalárním součinu nám dává zobrazení V → V ∗ = Hom(V, K) V ∋ v → (w → ⟨v, w⟩ ∈ K). Podmínka nedegenerovanosti skalárního součinu nám zaručuje, že toto zobrazení je bijekcí. Zároveň víme, že jde skutečně o lineární zobrazení nad komplexními nebo reálnými 145 3.22. Na základě teploty ve 14.00 se rozdělují dny na teplé, průměrné a chladné. Dle celoročních statistik následuje po teplém dni teplý v polovině případů a průměrný ve 30 % případů, po průměrném dnu průměrný ve 40 % případů a chladný ve 30 % případů, po chladném dnu chladný v polovině případů a ve 30 % případů průměrný. Bez dalších informací zjistěte, kolik lze během roku očekávat teplých, průměrných a chladných dnů. Řešení. Pro každý den musí nastav právě jeden ze stavů „teplý den“, „průměrný den“, „chladný den“. Pokud vektor xn má za složky pravděpodobnosti toho, že jistý (označený jako n-tý) den bude teplý, průměrný, chladný (při zachování pořadí), potom složky vektoru xn+1 =   0, 5 0, 3 0, 2 0, 3 0, 4 0, 3 0, 2 0, 3 0, 5   · xn udávají postupně pravděpodobnosti, že následující den bude teplý, průměrný, chladný. Pro ověření stačí dosadit xn =   1 0 0   , xn =   0 1 0   , xn =   0 0 1   , přičemž např. pro třetí volbu musíme dostat pravděpodobnosti, že po chladném dnu bude následovat teplý, průměrný, chladný (v tomto pořadí). Vidíme tak, že úloha je Markovovým řetězcem s pravděpodobnostní maticí přechodu T =   0, 5 0, 3 0, 2 0, 3 0, 4 0, 3 0, 2 0, 3 0, 5   . Neboť jsou všechny prvky této matice kladné, existuje pravděpodobnostní vektor x∞ = ( x1 ∞ , x2 ∞ , x3 ∞ )T , k němuž se blíží vektor xn pro zvětšující se n nezávisle na tom, jaký byl vektor xn pro mnohem menší n. Navíc podle důsledku PerronovyFrobeniovy věty je x∞ vlastním vektorem matice T pro vlastní číslo 1. Má tedy platit x1 ∞ = 0, 5 x1 ∞ + 0, 3 x2 ∞ + 0, 2 x3 ∞ , x2 ∞ = 0, 3 x1 ∞ + 0, 4 x2 ∞ + 0, 3 x3 ∞ , x3 ∞ = 0, 2 x1 ∞ + 0, 3 x2 ∞ + 0, 5 x3 ∞ , 1 = x1 ∞ + x2 ∞ + x3 ∞ , kde poslední podmínka znamená, že vektor x∞ je pravděpodobnostní. Snadno se vypočítá, že tato soustava má jediné řešení x1 ∞ = x2 ∞ = x3 ∞ = 1 3 . Lze tedy očekávat přibližně stejný počet teplých, průměrných a chladných dnů. 4. VÍCE MATICOVÉHO POČTU skaláry, protože jsme pevně zvolili druhý argument. Na první pohled je vidět, že vektory ortonormální báze jsou takto zobrazeny na formy tvořící bázi duální, a každý vektor můžeme prostřednictvím skalárního součinu chápat také jako lineární formu. V případě vektorových prostorů se skalárním součinem proto převádí naše ztotožnění vektorového prostoru se svým duálem také duální zobrazení ψ∗ na zobrazení ψ∗ : W → V zadané formulí ⟨ψ(u), v⟩ = ⟨u, ψ∗ (v)⟩, kde stejným značením závorek nyní myslíme skalární součin. Tomuto zobrazení se říká adjungované zobrazení k ψ. Ekvivalentně lze brát poslední vztah za definici zobrazení ψ∗ , např. dosazením všech dvojic vektorů ortonormální báze za vektory u a v dostáváme přímo všechny hodnoty matice zobrazení ψ∗ . Předchozí výpočet pro duální zobrazení v souřadnicích nyní můžeme zopakovat, pouze musíme mít na paměti, že v ortonormálních bazích na unitárních prostorech vystupují souřadnice druhého argumentu konjugované: ⟨ψ(v), w⟩ = (w1, . . . , wn) · A ·    v1 ... vn    = ( ¯AT ·    w1 ... wn    )T ·    v1 ... vn    = ⟨v, ψ∗ (w)⟩ Vidíme proto, že je-li A matice zobrazení ψ v ortonormální bázi, pak matice adjungovaného zobrazení ψ∗ je matice transponovaná a konjugovaná, kterou značíme A∗ = ¯AT . Zvláštním případem lineárních zobrazení jsou tedy ty, které jsou rovny svému adjungovanému zobrazení: ψ∗ = ψ. Takovým zobrazením říkáme samoadjungovaná. Ekvivalentně můžeme říci, že jsou to ta zobrazení, jejichž matice A v jedné a tedy ve všech ortonormálních bazích splňují A = A∗ . V případě euklidovských prostorů jsou samoadjungovaná zobrazení tedy ta, která mají v některé ortonormální bázi (a pak už všech) symetrickou matici. Často se jim proto říká symetrické matice a symetrická zobrazení. V komplexním oboru se maticím splňujícím A = A∗ říká hermiteovské matice. Všimněme si, že hermiteovské matice tvoří reálný vektorový podprostor v prostoru všech komplexních matic, není však podprostorem v komplexním oboru. Poznámka. Obzvlášť zajímavý je v této souvislosti následující postřeh. Jestliže hermiteovskou matici A vynásobíme imaginární jednotkou, dostáváme matici B = i A, která má vlastnost B∗ = ¯i ¯AT = −B. Takovým maticím říkáme anti– hermiteovské. Tak jako je tedy každá reálná matice součtem své symetrické a antisymetrické části A = 1 2 (A + AT ) + 1 2 (A − AT ), 146 2. MARKOVOVY PROCESY Zdůrazněme, že součet všech čísel z libovolného sloupce matice T musel být roven 1 (jinak by se nejednalo o Markovův proces). Protože T T = T (matice je symetrická), je součet všech čísel z libovolného řádku matice také roven 1. O matici s nezápornými prvky a s vlastností, že součet čísel v každém řádku a rovněž součet čísel v každém sloupci je 1, mluvíme jako o dvojnásobně (dvojitě, dvojně) stochastické. Důležitou vlastností každé dvojnásobně stochastické regulární matice (pro jakýkoli rozměr – počet stavů) je, že jí příslušný vektor x∞ má všechny složky stejné, tj. po dostatečně dlouhé době vyhodnocování se všechny stavy v odpovídajícím Markovově procesu jeví jako stejně časté. 3.23. Studenti na přednášce. Studenty můžeme rozdělit řekněme do tří skupin - na ty, co jsou přítomni na přednášce a vnímají, na ty, co jsou rovněž přítomni, ale nevnímají a na ty, co sedí místo přednášky v hospodě. Nyní budeme hodinu po hodině sledovat, jak se mění počty studentů v těchto skupinách. Základem je vypozorovat, jaké jsou jednotlivé pravděpodobnosti změn stavu studenta. Dejme tomu, že by to mohlo být následovně: Student, který vnímá: s pravděpodobností 50% zůstane vnímat, 40% přestane vnímat a 10% odejde do hospody. Student, který je na přednášce a nevnímá: začne vnímat s pravděpodobností 10%, zůstane ve stejném stavu 50%, odejde do hospody 40%. Student, který sedí v hospodě má nulovou pravděpodobnost, že se vrátí na přednášku. Jak se bude tento model vyvíjet v čase? Jak se situace změní, pokud budeme předpokládat aspoň desetiprocentní pravděpodobnost toho, že se student vrátí z hospody na přednášku (tu ovšem samozřejmě nevnímá)? Řešení. Ze zadání se jedná o Markovovův proces s ma- ticí   0, 5 0, 1 0 0, 4 0, 5 0 0, 1 0, 4 1  . Její charakteristický polynom je (0, 5 − λ)2 (1 − λ) − 0, 4(1 − λ) = 0. Evidentně je tedy 1 vlastní číslo této matice (další kořeny jsou pak 0,3 a 0,7). Postupem času se tedy studenti rozdělí do skupin tak, že stav bude popsán příslušným vlastním vektorem. Ten je řešením rovnice  −0, 5 0, 1 0 0, 4 −0, 5 0 0, 1 0, 4 0     x y z   = 0, což jsou právě násobky vektoru (0.0.1). Jinými slovy, všichni studenti po čase skončí v hospodě. Tento výsledek je zřejmý i bez počítání - tím, že je nulová pravděpodopnost odchodu studenta do školy, se budou studenti postupně hromadit v hospodě. Přidáním desetiprocentní možnosti odchodu studenta do školy se toto změní. Příslušná matice bude CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET je v koplexním oboru obdobně A = 1 2 (A + A∗ ) + 1 2 (A − A∗ ), tj. můžeme vyjadřit každou komplexní matici právě jedním způsobem jako součet A = B + i C s hermiteovskými maticemi B a C. Jde o obdobu rozkladu komplexního čísla na reálnou a ryze imaginární komponentu. V řeši lineárních zobrazení to tedy znamená, že každý komplexní lineární automorfismus můžeme takto jednoznačně vyjádřit pomocí dvou samoadjungovaných zobrazení. 3.25. Spektrální rozklad samoadjungovaných zobrazení. Uvažujme samoadjungované zobrazení ψ : V → V s maticí A v nějaké ortonormální bázi a zkusme postupovat obdobně jako v 2.48. Opět se nejprve obecně podíváme na invariantní podprostory samoadjungovaných zobrazení a jejich ortogonální doplňky. Jestliže pro libovolný podprostor W ⊂ V a samoadjungované zobrazení ψ : V → V platí ψ(W) ⊂ W, pak také platí pro všechny v ∈ W⊥ , w ∈ W ⟨ψ(v), w⟩ = ⟨v, ψ(w)⟩ = 0. To ale znamená, že také ψ(W⊥ ) ⊂ W⊥ . Uvažme nyní matici A samoadjungovaného zobrazení v nějaké ortonormální bázi a A · x = λx pro nějaký vlastní vektor x ∈ Cn . Dostáváme λ⟨x, x⟩ = ⟨Ax, x⟩ = ⟨x, Ax⟩ = ¯λ⟨x, x⟩. Kladným reálným číslem ⟨x, x⟩ můžeme krátit a proto musí být ¯λ = λ, tj. vlastní čísla jsou vždy reálná. Komplexních kořenů má charakteristický polynom det(A − λE) tolik, kolik je dimenze čtvercové matice A, a všechny jsou ve skutečnosti reálné. Dokázali jsme tak důležitý obecný výsledek: Tvrzení. Ortogonální doplněk k invariantnímu podprostoru pro samoadjungované zobrazení je také invariantní. Navíc jsou všechna vlastní čísla samoadjungované matice A vždy reálná. Ze samotné definice je zřejmé, že zúžení samoadjungovaného zobrazení na invariantní podprostor je opět samoadjungované. Předchozí tvrzení nám tedy zaručuje, že bude vždy existovat báze V z vlastních vektorů. Skutečně, zúžení ψ na ortogonální doplněk invariantního podprostoru je opět ortogonální zobrazení, takže můžeme do báze přibírat jeden vlastní vektor za druhým, až dostaneme celý rozklad V . Vlastní vektory příslušející různým vlastním číslům jsou navíc kolmé, protože z rovností ψ(u) = λu, ψ(v) = µv vy- plývá λ⟨u, v⟩ = ⟨ψ(u), v⟩ = ⟨u, ψ(v)⟩ = µ⟨u, v⟩. Obvykle bývá náš výsledek formulován pomocí projekcí na vlastní podprostory. O projektoru P : V → V říkáme, že 147   0, 5 0, 1 0 0, 4 0, 5 0, 1 0, 1 0, 4 0, 9  . Opět platí, že se stav usálí na vlastním vektoru příslušnému vlastnímu číslu 1. Ten je v tomto případě řešením rovnice   −0, 5 0, 1 0 0, 4 −0, 5 0, 1 0, 1 0, 4 −0, 1     x y z   = 0. Řešením je například vektor (1, 5, 21). Poměrné rozložení studentů v jednotlivých skupinách pak dá násobek tohoto vektoru, který má součet složek roven 1, tj. vektor ( 1 27 , 5 27 , 21 27 ). Opět tedy většina studentů skončí v hospodě, někteří ale ve škole budou. 3.24. Jezírko. Mějme jednoduchý model jezírka, ve kterém žije populace bílé ryby (plotice, ouklej, podoustev, ostroretka atd.). Předpokládáme, že druhého roku se dožije 20 % rybího plůdku a od tohoto stáří už jsou ryby schopny se reprodukovat. Z mladých ryb přežije z druhého do třetího roku přibližně 60 % a v dalších letech je už úmrtnost zanedbatelná. Dále předpokládáme, že roční přírustek nových plůdků je třikrát větší než počet ryb (schopných reprodukce). Tato populace by evidentně jezírko brzy přeplnila. Rovnováhu chceme dosáhnout nasazením dravé ryby, např. štiky. Předpokládejme, že jedna štika sní ročně asi 500 dospělých bílých ryb. Kolik štik pak musíme do jezírka nasadit, aby populace stagnovala? Řešení. Pokud označíme p počet plůdku, m počet mladých ryb a r počet dospělých ryb, pak je stav populace v dalším roce popsán následovně:   p m r   →   3m + 3r 0, 2p 0, 6m + τr   , kde 1 − τ je relativní úmrtnost dospělé ryby způsobená štikou. Příslušná matice popisující tento model je tedy   0 3 3 0, 2 0 0 0 0, 6 τ   Pokud má populace stagnovat, pak musí mít tato matice vlastní hodnotu 1. Jinými slovy, jednička musí být kořenem charakteristického polynomu této matice. Ten je tvaru λ2 (τ −λ)+0, 36−0, 6.(τ −λ) = 0. To znamená, že τ musí splňovat τ − 1 + 0, 36 − 0, 6(τ − 1) = 0 0, 4τ − 0, 04 = 0 Do dalšího roku tedy může přežít jen 10 % z dospělých ryb a zbytek by měla sníst štika. Označíme-li hledaný počet štik x, pak dohromady sní 500x ryb, což by mělo odpovídat podle předchozího výpočtu 0, 9r. Poměr počtu bílé ryby ku počtu štik by tedy měl být r x = 500 0,9 . To je přibližně jedna štika na 556 kusů bílé ryby. 4. VÍCE MATICOVÉHO POČTU je kolmý, je-li Im P ⊥ Ker P . Dva kolmé projektory P, Q jsou vzájemně kolmé, je-li Im P ⊥ Im Q. Věta (O spektrálním rozkladu). Pro každé samoadjungované zobrazení ψ : V → V na vektorovém prostoru se skalárním součinem existuje ortonormální báze z vlastních vektorů. Jsou-li λ1, . . . , λk všechna různá vlastní čísla f a P1, . . . , Pk příslušné kolmé a navzájem kolmé projektory na vlastní podprostory, pak f = λ1P1 + · · · + λkPk. Dimenze obrazů těchto projektorů je přitom vždy rovna algebraické násobnosti vlastních čísel λi. 3.26. Ortogonální diagonalizace. Zamysleme se, jak vypadají zobrazení, pro která lze najít ortonormální bázi jako v předchozí větě o spektrálním rozkladu se nazývají normální. Pro euklidovský případ je to snadné: diagonální matice jsou zejména symetrické, jedná se tedy právě o samoadjungovaná zobrazení. Jako důsledek získáváme tvrzení, že ortogonální zobrazení euklidovského prostoru do sebe je ortogonálně diagonalizovatelné právě, když je zároveň samoadjungované (jsou to právě ta samoadjungovaná zobrazení s vlastními hodnotami ±1). U komplexních unitárních prostorů je situace složitější. Uvažme libovolné lineární zobrazení φ : V → V unitárního prostoru a nechť φ = ψ + iη je (jednoznačně daný) rozklad φ na hermiteovskou a antihermiteovskou část. Máli φ ve vhodné ortonormální bázi diagonální matici D, pak D = reD+iimD, kde reálná a imaginární část jsou právě matice ψ a η (plyne z jednoznačnosti rozkladu). Zejména tedy platí ψ ◦η = η ◦ψ a φ ◦φ∗ = φ∗ ◦φ. Zobrazení φ : V → V s poslední uvedenou vlastností se nazývají normální. Vzájemné souvislosti ukazuje následující věta (pokračujeme ve značení tohoto odstavce): Tvrzení. Následující podmínky jsou ekvivalentní: (1) φ je ortogonálně diagonalizovatelné (2) φ∗ ◦ φ = φ ◦ φ∗ (tj. φ je normální zobrazení) (3) ψ ◦ η = η ◦ ψ (4) Pro matici A = (aij ) zobrazení φ v nějaké ortonormální bázi a jejích m = dimV vlastních čísel λi platí∑ i,j |aij |2 = ∑m i=1 |λi|2 . Stručný důkaz. Implikaci (1) ⇒ (2) jsme již diskuto- vali. (2) ⇔ (3): Stačí provést přímý výpočet φφ∗ = (ψ + iη)(ψ − iη) = ψ2 + η2 + i(ηψ − ψη) φ∗ φ = (ψ − iη)(ψ + iη) = ψ2 + η2 + i(ψη − ηψ) Odečtením dostaneme 2i(ηψ − ψη). (2) ⇒ (1): Nechť u ∈ V je vlastní vektor normálního zobrazení φ. Pak φ(u) · φ(u) = ⟨φ∗ φ(u), u⟩ = ⟨φφ∗ (u), u⟩ = φ∗ (u) · φ∗ (u) 148 2. MARKOVOVY PROCESY 3.25. Nechť je v populačním modelu dravec-kořist určen vztah mezi počtem dravců Dk a kořisti Kk v daném a následujícím měsíci (k ∈ N ∪ {0}) lineárním systémem (a) Dk+1 = 0, 6 Dk + 0, 5 Kk, Kk+1 = −0, 16 Dk + 1, 2 Kk; (b) Dk+1 = 0, 6 Dk + 0, 5 Kk, Kk+1 = −0, 175 Dk + 1, 2 Kk; (c) Dk+1 = 0, 6 Dk + 0, 5 Kk, Kk+1 = −0, 135 Dk + 1, 2 Kk. Analyzujte chování tohoto modelu po velmi dlouhé době. Řešení. Všimněme si, že jednotlivé varianty se od sebe navzájem liší pouze v hodnotě koeficientu u Dk ve druhé rovnici. Můžeme proto všechny tři případy vyjádřit jako ( Dk Kk ) = ( 0, 6 0, 5 −a 1, 2 ) · ( Dk−1 Kk−1 ) , k ∈ N, kde budeme postupně klást a = 0, 16, a = 0, 175, a = 0, 135. Hodnota koeficientu a zde reprezentuje průměrný počet kusů kořisti zahubených jedním (očividně „nenáročným“) dravcem za měsíc. Při ozna- čení T = ( 0, 6 0, 5 −a 1, 2 ) bezprostředně dostáváme ( Dk Kk ) = T k · ( D0 K0 ) , k ∈ N. Pomocí mocnin matice T tak můžeme určit vývoj populací dravce a kořisti po velmi dlouhé době. Snadno stanovíme vlastní čísla (a) λ1 = 1, λ2 = 0, 8; (b) λ1 = 0, 95, λ2 = 0, 85; (c) λ1 = 1, 05, λ2 = 0, 75 matice T a jim (při zachování pořadí) příslušné vlastní vektory (a) (5, 4)T , (5, 2)T ; (b) (10, 7)T , (2, 1)T ; (c) (10, 9)T , (10, 3)T . Pro k ∈ N tudíž platí (a) T k = ( 5 5 4 2 ) · ( 1 0 0 0, 8 )k · ( 5 5 4 2 )−1 ; (b) T k = ( 10 2 7 1 ) · ( 0, 95 0 0 0, 85 )k · ( 10 2 7 1 )−1 ; CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET zejména tedy |φ(u)| = |φ∗ (u)|. Je-li φ normální, je (φ − λ id V )∗ = (φ∗ − ¯λ id V ) a je proto i (φ − λ id V ) normální zobrazení. Z předešlé rovnosti tedy plyne, že je-li φ(u) = λu, pak φ∗ (u) = ¯λu. Tzn., že φ a φ∗ mají stejné vlastní vektory a konjugované vlastní hodnoty. Stejně jako u samoadjungovaných teď snadno dokážeme ortogonální diagonalizovatelnost. K tomu je nutné a stačí, aby ortogonální doplněk každého vlastního podprostoru pro normální φ byl invariantní (je totiž zúžení normálního zobrazení na invariantní podprostor opět normální). Uvažme vlastní vektor u ∈ V s vlastní hodnotou λ, v ∈ ⟨u⟩⊥ . Platí φ(v) · u = v · φ∗ (u) = ⟨v, ¯λu⟩ = λu · v = 0 a tedy opět φ(v) ∈ ⟨u⟩⊥ . (1) ⇔ (4): Výraz ∑ i,j |aij |2 je právě stopa matice AA∗ , to je matice zobrazení φ ◦ φ∗ . Proto nezávisí na volbě ortonormální báze. Je-li tedy φ diagonalizovatelné, je tento výraz roven právě ∑ i |λi|2 . Opačná implikace je přímým důsledkem Schurovy věty o unitární triangulovatelnosti libovolného lineárního zobrazení V → V , kterou dokážeme později v 3.32. Podle ní totiž existuje pro každé lineární zobrazení φ : V → V ortonormální báze, ve které má φ horní trojúhelníkovou matici. Na její diagonále pak musí být právě všechny vlastní hodnoty φ. Jak jsme již ukázali, výraz ∑ i,j |aij |2 nezávisí na volbě ortonormální báze, proto z předpokládané rovnosti vyplývá, že všechny prvky mimo diagonálu musí být v této matici nu- lové. V termínech matic zobrazení dostáváme: zobrazení je normální právě, když jeho matice v některé ortonormální bázi (a ekvivalentně v každé) splňuje AA∗ = A∗ A. Takové matice nazýváme normální matice. Poznámka. Všimněme si, že pro počet s lineárními zobrazeními na komplexním unitárním prostoru lze poslední větu chápat také jako zobecnění běžných počtů s komplexními čísly v goniometrickém tvaru (roli reálných čísel zde hrají samoadjungovaná zobrazení). Roli komplexních jednotek pak hrají unitární zobrazení. Zejména si všimněme analogie k jejich tvaru cos t + i sin t s vlastností cos2 t + sin2 t = 1: Důsledek. Unitární zobrazení na unitárním prostoru V jsou právě ta normální zobrazení, pro která výše užívaný jednoznačný rozklad φ = ψ + iη splňuje ψ2 + η2 = id V Důkaz. Pro unitární je φφ∗ = id V = φ∗ φ a tedy φφ∗ = (ψ + iη)(ψ − iη) = ψ2 + 0 + η2 = id V . Naopak, pro normální poslední výpočet ukazuje, že opačná implikace platí také. 3.27. Nezáporná zobrazení a odmocniny. Nezáporná reálná čísla jsou právě ta, která umíme psát jako druhé mocniny. Zobecnění takového chování pro matice a zobrazení lze vidět u součinů B = A∗ · A (tj. složení zobrazení ψ∗ ◦ ψ): ⟨B · x, x⟩ = ⟨A∗ · A · x, x⟩ = ⟨A · x, A · x⟩ ≥ 0 149 (c) T k = ( 10 10 9 3 ) · ( 1, 05 0 0 0, 75 )k · ( 10 10 9 3 )−1 . Odtud dále pro velká k ∈ N plyne (a) T k ≈ ( 5 5 4 2 ) · ( 1 0 0 0 ) · ( 5 5 4 2 )−1 = 1 10 ( −10 25 −8 20 ) ; (b) T k ≈ ( 10 2 7 1 ) · ( 0 0 0 0 ) · ( 10 2 7 1 )−1 = ( 0 0 0 0 ) ; (c) T k ≈ ( 10 10 9 3 ) · ( 1, 05k 0 0 0 ) · ( 10 10 9 3 )−1 = 1, 05k 60 ( −30 100 −27 90 ) , neboť právě pro velká k ∈ N můžeme položit (a) ( 1 0 0 0, 8 )k ≈ ( 1 0 0 0 ) ; (b) ( 0, 95 0 0 0, 85 )k ≈ ( 0 0 0 0 ) ; (c) ( 1, 05 0 0 0, 75 )k ≈ ( 1, 05k 0 0 0 ) . Podotkněme, že ve variantě (b), tj. pro a = 0, 175, nebylo nutné vlastní vektory počítat. Obdrželi jsme tak (a) ( Dk Kk ) ≈ 1 10 ( −10 25 −8 20 ) · ( D0 K0 ) = 1 10 ( 5 (−2D0 + 5K0) 4 (−2D0 + 5K0) ) ; (b) ( Dk Kk ) ≈ ( 0 0 0 0 ) · ( D0 K0 ) = ( 0 0 ) ; (c) ( Dk Kk ) ≈ 1, 05k 60 ( −30 100 −27 90 ) · ( D0 K0 ) = 1, 05k 60 ( 10 (−3D0 + 10K0) 9 (−3D0 + 10K0) ) . 4. VÍCE MATICOVÉHO POČTU pro všechny vektory x. Navíc zjevně B∗ = (A∗ · A)∗ = A∗ · A = B. Hermiteovských maticím B s takovou vlastností říkáme pozitivně semidefinitní a pokud nastane nulová hodnota pouze pro x = 0, pak jim říkáme pozitivně definitní. Obdobně hovoříme o pozitivě definitních a a positivně semidefinitních zobrazeních ψ : V → V . Pro každé pozitivně semidefinitní zobrazení ψ : V → V umíme najít jeho odmocninu, tj. zobrazení η takové, že η ◦ η = ψ. Nejjednodušeji to uvidíme v ortonormální bázi, ve které bude mít ψ diagonální matici. Taková podle našich předchozích úvah vždy existuje a matice A zobrazení ψ v ní bude mít na diagonále nezáporná reálná vlastní čísla zobrazení ψ. Kdyby totiž bylo některé z nich záporné, nebyla by splněna podmínka nezápornosti již pro některý z bázových vektorů. Pak ovšem stačí definovat zobrazení η pomocí matice B s odmocninami příslušných vlastních čísel na diago- nále. 3.28. Spektra a nilpotentní zobrazení. Na závěr této části se vrátíme k otázce, jak se mohou chovat lineární zobrazení v úplné obecnosti. Budeme i nadále pracovat s reálnými nebo komplexními vektorovými prostory. Připomeňme, že spektrum lineárního zobrazení f : V → V je posloupnost kořenů charakteristického polynomu zobrazení f , včetně násobností. Algebraickou násobností vlastní hodnoty rozumíme její násobnost jako kořenu charakteristického polynomu, geometrická násobnost vlastní hodnoty je dimenze příslušného podprostoru vlastních vek- torů. Lineární zobrazení f : V → V se nazývá nilpotentní, jestliže existuje celé číslo k ≥ 1 takové, že iterované zobrazení f k je identicky nulové. Nejmenší číslo k s touto vlastností se nazývá stupněm nilpotentnosti zobrazení f . Zobrazení f : V → V se nazývá cyklické, jestliže existuje báze (u1, . . . , un) prostoru V taková, že f (u1) = 0 a f (ui) = ui−1 pro všechna i = 2, . . . , n. Jinými slovy, matice f v této bázi je tvaru A =    0 1 0 . . . 0 0 1 . . . ... ... ...    . Je-li f (v) = a · v, pak pro každé přirozené k je f k (v) = ak ·v. Zejména tedy může spektrum nilpotentního zobrazení obsahovat pouze nulový skalár (a ten tam vždy je). Přímo z definice plyne, že každé cyklické zobrazení je nilpotentní, navíc je jeho stupeň nilpotentnosti roven dimenzi prostoru V . Operátor derivování na polynomech, D(xk ) = kxk−1 , je příkladem cyklického zobrazení na Kn[x] pro libovolné n. Kupodivu to platí i naopak a každé nilpotentní zobrazení je přímým součtem cyklických. Důkaz tohoto tvrzení nám dá hodně práce, proto napřed zformulujeme další výsledky a pak se teprve dáme do technické práce. Ve výsledné větě 150 2. MARKOVOVY PROCESY Tyto výsledky lze interpretovat následovně: (a) Pokud 2D0 < 5K0, velikosti obou populací se ustálí na nenulových hodnotách (říkáme, že jsou stabilní); jestliže 2D0 ≥ 5K0, obě populace vymřou. (b) Obě populace vymřou. (c) Pro 3D0 < 10K0 nastává populační exploze obou druhů; pro 3D0 ≥ 10K0 obě populace vymřou. To, že extrémně malá změna velikosti a může vést ke zcela odlišnému výsledku, je zapříčiněno neměnností hodnoty a v závislosti na velikosti obou populací. Poznamenejme, že toto omezení, kdy a v našich modelech považujeme za konstantní, nemá oporu ve skutečnosti. Přesto získáváme odhad velikosti a pro stabilní populace. 3.26. Poznámka. Jiný model soužití populací dravce a kořisti poskytuje model pánů Lotky a Volterra, který popisuje vztah mezi populacemi soustavou dvou obyčejných diferenciálních rovnic. Podle tohoto modelu obě populace oscilují, což je i v souladu s pozorováními. 3.27. Ruleta. Hráč rulety má následující strategii: přišel hrát se 100 Kč. Vždy všechno, co aktuálně má. Sází vždy na černou (v ruletě je 37 čísel, z toho je 18 černých, 18 červených a nula). Hráč skončí, pokud nic nemá, nebo pokud získá 800 Uvažte tuto úlohu jako Markovův proces a napište jeho matici. Řešení. V průběhu a na konci hry může mít hráč pouze následující peněžní obnosy (v Kč): 0, 100, 200, 400, 800. Budeme-li na danou situaci nahlížet jako na Markovův proces, toto budou jeho stavy a snadno také sestavíme jeho matici: A =       1 a a a 0 0 0 0 0 0 0 b 0 0 0 0 0 b 0 0 0 0 0 b 1       , kde a = 19 37 a b = 18 37 .Všimněme si, že matice je pravděpodobnostní a singulární. Vlastní hodnota 1 je dvojnásobná. Hra nebude konvergovat k jedinému vektoru x∞, nýbrž skončí na jednom z vlastních vektorů příslušných vlastní hodnotě 1, totiž (1, 0, 0, 0, 0) (hráč prohraje vše), nebo (0, 0, 0, 0, 1) (hráč vyhraje 800 Kč). Navíc snadno nahlédneme, že hra skončí po třech sázkách, tedy posloupnost {An }∞ n=1, je konstantní pro n ≥ 3: A∞ := A3 = An =       1 a + ab + ab2 a + ab a 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 b3 b2 b 1       CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET o Jordanově rozkladu vvystupují vektorové (pod)prostory a lineární zobrazení na nich s jediným vlastním číslem λ a ma- ticí J =      λ 1 0 . . . 0 0 λ 1 . . . 0 ... ... ... ... 0 0 0 . . . λ      . Takovýmto maticím (a odpovídajícím invariantním podprostorům) se říká Jordanův blok. Věta (Jordanova věta o kanonickém tvaru). Nechť V je vektorový prostor dimenze n a f : V → V je lineární zobrazení s n vlastními čísly včetně algebraických násobností. Pak existuje jednoznačný rozklad prostoru V na přímý součet pod- prostorů V = V1 ⊕ · · · ⊕ Vk takových, že f (Vi) ⊂ Vi, zúžení f na každé Vi má jediné vlastní číslo λi a zúžení f −λi ·id na Vi je buď cyklické nebo nulové zobrazení. Věta tedy říká, že ve vhodné bázi má každé lineární zobrazení blokově diagonální tvar s Jordanovými bloky podél diagonály. Celkový počet jedniček nad diagonálou v takovém tvaru je roven rozdílu mezi celkovou algebraickou a geometrickou násobností vlastních čísel. Všimněme si, že jsme tuto větu plně dokázali v případech, kdy jsou všechna vlastní čísla různá nebo když jsou geometrické a algebraické násobnosti vlastních čísel stejné. Také jsme ji plně dokázali pro unitární a samoadjungovaná zobrazení. Také si všimněme, že v situaci, kdy jsou vlastní hodnoty v absolutní hodnotě menší než jedna, opakované působení lineárního zobrazení na jakémkoliv vektoru v z jednoho z podprostorů Vi ve větě vede k rychlému zmenšování všech jeho souřadnic nad všechny meze. Skutečně, předpokládejme pro jednoduchost, že na celém Vi je naše zobrazení cyklické, příslušná vlastní hodnota je λ a v1, . . . , vℓ nechť je příslušná báze. Pak podmínka z věty říká, že f (v2) = λv2 + v1, f 2 (vj ) = λ2 v2 + λv1 + λv1, a podobně pro ostatní vi a vyšší mocniny. V každém případě při iterování dostáváme stále vyšší a vyšší mocniny λ u všech nenulových komponent. Zbytek této části je věnován důkazu Jordanovy věty a několika k tomu potřebným pojmům. Je výrazně obtížnější než dosavadní text a čtenář jej může případně přeskočit až do začátku 5. části této kapitoly. 3.29. Kořenové prostory. Na příkladech jsme viděli, že vlastní podprostory popisují dostatečně geometrické vlastnosti jen některých lineárních zobrazení. Zavedeme nyní jemnější nástroj, tzv. kořenové podprostory. Definice. Nenulový vektor u ∈ V se nazývá kořenovým vektorem lineárního zobrazení φ : V → V , jestliže existuje a ∈ K a celé číslo k > 0 takové, že (φ−a·idV )k (u) = 0, tj. ktá iterace uvedeného zobrazení zobrazuje u na nulu. Množinu 151 a snadno zjistíme, že hra skončí s pravděpodobností a + ab + ab2 . = 0, 885 prohrou a s pravděpodobností cca 0, 115 výhrou 800 Kč. (Maticí A∞ vynásobíme počáteční vektor (0, 1, 0, 0, 0) a dostáváme vektor (a + ab + ab2 , 0, 0, 0, b3 ).) 3.28. Uvažujme situaci z předchozího případu a předpokládejme, že pravděpodobnost výhry i prohry je 1/2. Označme matici procesu A. Bez použití výpočetního software určete A100 . 3.29. Roztržitý profesor. Uvažujme následující situaci: Roztržitý profesor s sebou nosí deštník, ale s pravděpodobností 1/2 jej zapomene tam, odkud odchází. Ráno odchází do práce. V práci chodí na oběd do restaurace a zpět. Po skončení práce odchází domů. Uvažujme pro jednoduchost, že nikam jinam po dostatečně dlouhou dobu profesor nechodí a že v restauraci zůstává deštník na profesorově oblíbeném místě, odkud si ho může následující den vzít (pokud nezapomene). Uvažte tuto situaci jako Markovův proces a napište jeho matici. Jaká je pravděpodobnost, že se po mnoha dnech po ránu deštník bude nalézat v restauraci? (Je vhodné za časovou jednotku vzít jeden den – od rána do rána.) Řešení. A =   11/16 3/8 1/4 3/16 3/8 1/4 1/8 1/4 1/2   Spočítejme třeba prvek a1 1, tedy pravděpodobnost, že deštník začne den doma a skončí doma (bude tam i druhý den ráno): deštník může putovat třemi disjunktními cestami: D Profesor ho hned ráno zapomene doma: p1 = 1 2 . DPD Profesor si ho vezme do práce, pak ho zapomene vzít na oběd a poté ho večer odnese domů: p2 = 1 2 · 1 2 · 1 2 = 1 8 . DPRPD Profesor bere deštník všude a nikde ho nezapomene: p3 = 1 2 · 1 2 · 1 2 · 1 2 = 1 16 . Celkem a1 1 = p1 + p2 + p3 = 11 16 . Vlastní vektor této matice příslušný dominantní vlastní hodnotě 1 je (2, 1, 1), je tedy hledaná pravděpodobnost 1/(2 + 1 + 1) = 4. 3.30. Algoritmus na určování důležitosti stránek. Internetové vyhledávače umí na internetu vyhledat (skoro) všechny stránky obsahující dané slovo či frázi. Jak ale setřídit vyhledané stránky tak, aby uživatel dostal pokud možno seznam seřazený podle relevance daných stránek? Jednou z možností je následující algortitmus: soubor všech nalezených stránek považujme za systém a každou z nalezených stránek za jeden z jeho možných stavů. Popíšeme náhodné procházení těchto stránek jako Markovův proces. Pravděpodobnosti přechodu mezi jednotlivými stránkami jsou dány odkazy: každý odkaz, řekněme ze stránky 4. VÍCE MATICOVÉHO POČTU všech kořenových vektorů příslušných k pevnému skaláru λ doplněnou o nulový vektor nazýváme kořenovým prostorem příslušným ke skaláru λ ∈ K, značíme Rλ. Je-li u kořenový vektor a k z definice je vybráno nejmenší možné, pak (φ − a · idV )k−1 (u) je vlastní vektor s vlastní hodnotou a. Je tedy Rλ = {0} pro všechny skaláry λ, které neleží ve spektru zobrazení φ. Tvrzení. Pro lineární zobrazení φ V → V platí (1) Pro každé λ ∈ K je Rλ ⊂ V vektorový podprostor. (2) Pro každé λ, µ ∈ K je Rλ invariantní vzhledem k lineárnímu zobrazení (φ − µ · idV ), zejména tedy je Rλ invariantní vzhledem k φ. (3) Je-li µ ̸= λ, pak (φ − µ · idV )|Rλ je invertibilní. (4) Zobrazení (φ − λ · idV )|Rλ je nilpotentní. Důkaz. (1) Ověření vlastností vektorového podprostoru je jednoduché a ponecháváme jej čtenáři. (2) Předpokládejme, že (φ − λ · idV )k (u) = 0 a uvažme v = (φ − µ · idV )(u). Pak (φ−λ · idV )k (v) = = (φ − λ · idV )k ((φ − λ · idV ) + (λ − µ) · idV )(u) = (φ − λ · idV )k+1 (u) + (λ − µ) · (φ − λ · idV )k (u) = 0 (3) Je-li u ∈ Ker(φ − µ · idV )|Rλ , pak (φ −λ·idV )(u) = (φ −µ·idV )(u)+(µ−λ)·u = (µ−λ)·u Odtud 0 = (φ − λ · idV )k (u) = (µ − λ)k · u a je tedy nutně u = 0 pro λ ̸= µ. (4) Zvolme bázi e1, . . . , ep podprostoru Rλ. Protože podle definice existují čísla ki taková, že (φ −λ·idV )ki (ei) = 0, je nutně celé zobrazení (φ − λ · idV )|Rλ nilpotentní. 3.30. Faktorové prostory. Našim dalším cílem je ukázat, že dimenze kořenových prostorů je vždy rovna algebraické násobnosti příslušných vlastních čísel. Nejprve však zavedeme šikovné technické nástroje. Definice. Nechť U ⊂ V je vektorový podprostor. Na množině všech vektorů ve V definujeme ekvivalenci takto: v1 ∼ v2 právě tehdy, když v1 −v2 ∈ U. Axiomy ekvivalence jdou ověřit snadno. Množina V/U tříd této ekvivalence, spolu s operacemi definovanými pomocí reprezentantů, tj. [v]+[w] = [v +w], a ·[u] = [a ·u], tvoří vektorový prostor, který nazýváme faktorový vektorový prostor prostoru V podle podprostoru U. Ověřte si korektnost definice operací a platnost všech axiomů vektorového prostoru! Třídy (vektory) ve faktorovém prostoru V/U budeme často označovat jako formální součet jednoho reprezentanta se všemi vektory podprostoru U, např. u+U ∈ V/U, u ∈ V . Nulový vektor ve V/U je právě třída 0 + U, tj. vektor u ∈ V reprezentuje nulový vektor ve V/U právě, když je u ∈ U. 152 2. MARKOVOVY PROCESY A na stránku B určuje pravděpodobnost (1/(celkový počet odkazů ze stránky A)), se kterou se dostaneme ze stránky A na stránku B. Pokud z některé stránky nevedou žádné odkazy, tak ji uvažujeme jako stránku, ze které vedou odkazy na všechny ostatní. Tímto dostaneme pravděpodobnostní matici M (prvek mij odpovídá pravděpodobnosti, se kterou se dostaneme z i-té stránky na j-tou). Bude-li tedy člověk náhodně klikat na odkazy v nalezených stránkách (pokud se dostane na stránku, ze které nevede odkaz, vybere si náhodně další), tak pravděpodobnost toho, že se v daný okamžik (dostatečně vzdálený od počátku klikání) bude nalézat na i-té stránce odpovídá i-té složce jednotkového vlastního vektoru matice M, odpovídajícího vlastnímu číslu 1. Podle velikosti těchto pravděpodobností pak určíme důležitost jednotlivých stránek. Tento algoritmus lze modifikovat tím, že budeme předpokládat, že uživatel po nějaké době přestane klikat z odkazu na odkaz a opět začne náhodně na nějaké nové stránce. Řekněme, že s pravděpodobností d vybere náhodně novou stránku a s pravděpodobností (1-d). V takovéto situaci je nyní pravděpodobnost přechodu mezi libovolnými dvěma stránkami Si a Sj nenulová, je to totiž d/n+(1-d)/(celkový počet odkazů ze stránky Si), pokud ze stránky Si vede odkaz na Sj , pokud ne, tak je tato pravděpodobnost d/n (1/n, pokud z Si nevedou žádné odkazy). podle Frobeniovy-Perronovy věty je vlastní hodnota 1 jednonásobná a dominantní, takže jí odpovídající vlastní vektor je jediný (pokud bychom volili pravděpodobnosti přechodu pouze způsobem z předchozího odstavce, tak by tomu tak nemuselo být). Pro názornost uvažme stránky A, B, C a D. Odkazy vedou z A na B a na C, z B na C a z C na A, z D pak nikam. Uvažujme, že pravděpodobnst toho, že uživatel náhodně zvolí novou stránku je 1/5. Potom by matice M vypadala následovně: M =     1/20 1/20 17/20 1/4 9/20 1/20 1/20 1/4 9/20 17/20 1/20 1/4 1/20 1/20 1/20 1/4     Vlastní vektor příslušný vlastní hodnotě 1 je (305/53, 175/53, 315/53, 1), důležitost stránek tedy bude stanovena v pořadí podle velikosti jeho odpovídajících složek, tedy C > A > B > D. 3.31. V laboratoři je prováděn pokus se stejnou pravděpodobností úspěchu i neúspěchu. Pokud se pokus podaří, bude pravděpodobnost úspěchu druhého pokusu 0, 7. Jestliže skončí první pokus neúspěchem, bude pravděpodobnost úspěchu druhého pokusu pouze 0, 6. Dále se bude pokračovat v provádění pokusů, kdy úspěšnost předešlého znamená, že pravděpodobnost úspěchu následujícího bude 0, 7, a jeho neúspěšnost způsobí, že pravděpodobnost úspěchu následujícího CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET Jako jednoduché příklady si rozmyslete V/{0} ∼= V , V/V ∼= {0} a faktorový prostor roviny R2 podle libovolného jednorozměrného podprostoru, kde každý jednorozměrný podprostor U ⊂ R2 je přímka procházející počátkem, třídy ekvivalence jsou rovnoběžky s touto přímkou. Tvrzení. Nechť U ⊂ V je vektorový podprostor a u1, . . . , un je taková báze V , že u1, . . . , uk je báze U. Pak dim V/U = n − k a uk+1 + U, . . . , un + U je báze V/U. Důkaz. Protože V = ⟨u1, . . . , dotsun⟩, je i V/U = ⟨u1 + U, . . . , un + U⟩. Přitom ale je prvních k generátorů nulových, takže je V/U = ⟨uk+1 + U, . . . , un + U⟩. Předpokládejme, že ak+1 · (uk+1 + U) + · · · + an · (un + U) = (ak+1 ·uk+1 +· · ·+an ·un)+U = 0 ∈ V/U. To je ale ekvivalentní příslušnosti lineární kombinace vektorů uk+1, . . . , un do podprostoru U. Protože U je generováno zbylými vektory, je nutně tato kombinace nulová, tj. všechny koeficienty ai jsou nulové. 3.31. Indukovaná zobrazení na faktorových prostorech. Předpokládejme, že U ⊂ V je invariantní podprostor vzhledem k lineárnímu zobrazení φ : V → V a zvolme bázi u1, . . . , un prostoru V , že prvních k vektorů této báze je bazí U. V této bázi má φ polorozpadlou matici A = ( B C 0 D ) . Pak budeme umět dokázat následující tvrzení: Lemma. (1) Zobrazení φ indukuje lineární zobrazení φV/U : V/U → V/U, φV/U (v + U) = φ(v) + U s maticí D v indukované bázi uk+1 + U, . . . , un + U na V/U. (2) Charakteristický polynom φV/U dělí charakteristický polynom φ. Důkaz. Pro v, w ∈ V , u ∈ U, a ∈ K máme φ(v + u) ∈ φ(v) + U (protože U je invariantní), (φ(v) + U) + (φ(w) + U) = φ(v + w) + U a a · (φ(v) + U) = a · φ(v) + U = φ(a · v) + U (protože φ je lineární), je tedy zobrazení φV/U dobře definované a lineární. Navíc je přímo z definice matice zobrazení patrné, že matice φV/U v indukované bázi na V/U je právě matice D (při počítání obrazů bázových prvků nám koeficienty z matice C přispívají pouze do třídy U). Charakteristický polynom indukovaného zobrazení φV/U je tedy |D − λ · E|, zatímco charakteristický polynom původního zobrazení φ je |A − λ · E| = |B − λ · E||D − λ · E|. Důsledek. Nechť V je vektorový prostor nad K dimenze n a nechť φ : V → V je lineární zobrazení, jehož spektrum obsahuje n prvků (tj. všechny kořeny charakteristického polynomu leží v K a počítáme je včetně násobnosti). Pak existuje posloupnost invariantních podprostorů {0} = V0 ⊂ V1 ⊂ · · · ⊂ Vn = V s dimenzemi dim Vi = i. V bázi u1, . . . , un 153 bude 0, 6. Pro libovolné n ∈ N stanovte pravděpodobnost, že n-tý pokus se podaří. Řešení. Zaveďme pravděpodobnostní vektor xn = ( x1 n , x2 n )T , n ∈ N, kde x1 n je pravděpodobnost úspěchu n-tého pokusu a x2 n = 1 − x1 n je pravděpodobnost jeho neúspěchu. Podle zadání je x1 = ( 1/2 1/2 ) a zřejmě také x2 = ( 0, 7 0, 6 0, 3 0, 4 ) · ( 1/2 1/2 ) = ( 13/20 7/20 ) . Při označení T = ( 7/10 3/5 3/10 2/5 ) platí (3.6) xn+1 = T · xn, n ∈ N, neboť pravděpodobnostní vektor xn+1 závisí pouze na xn a tato závislost je totožná jako pro x2 a x1. Ze vztahu (3.6) bezprostředně plyne (3.7) xn+1 = T · T · xn−1 = · · · = T n · x1, n ≥ 2, n ∈ N. Proto vyjádříme T n , n ∈ N. Jedná se o Markovův proces, a tudíž je 1 vlastní číslo matice T . Druhé vlastní číslo 0, 1 vyplývá kupř. z toho, že stopa (součet prvků na diagonále) je rovna součtu všech vlastních čísel (každé vlastní číslo bereme tolikrát, jaká je jeho algebraická násobnost). Těmto vlastním číslům pak přísluší vlastní vektory ( 2 1 ) , ( 1 −1 ) . Dostáváme tak T = ( 2 1 1 −1 ) · ( 1 0 0 1/10 ) · ( 2 1 1 −1 )−1 , tj. pro n ∈ N je T n = ( 2 1 1 −1 ) · ( 1 0 0 1/10 )n · ( 2 1 1 −1 )−1 = = ( 2 1 1 −1 ) · ( 1n 0 0 10−n ) · ( 2 1 1 −1 )−1 . Dosazení ( 2 1 1 −1 )−1 = 1 3 ( 1 1 1 −2 ) a roznásobení dává T n = 1 3 ( 2 + 10−n 2 − 2 · 10−n 1 − 10−n 1 + 2 · 10−n ) , n ∈ N. Odtud, z (3.6) a (3.7) plyne xn+1 = ( 2 3 − 1 6 · 10n , 1 3 + 1 6 · 10n )T , n ∈ N. 4. VÍCE MATICOVÉHO POČTU prostoru V takové, že Vi = ⟨u1, . . . , ui⟩, má φ horní trojúhelníkovou matici:    λ1 . . . ∗ ... ... ... 0 . . . λn    , kde λ1, . . . , λn je posloupnost prvků spektra. Důkaz. Konstrukci podprostorů Vi provedeme induktivně. Nechť λ1, . . . , λn jsou prvky ve spektru zobrazení φ, tzn. charakteristický polynom zobrazení φ je tvaru (λ − λ1) · · · · · (λ − λn). Zvolme V0 = {0}, V1 = ⟨u1⟩, kde u1 je libovolný vlastní vektor s vlastní hodnotou λ1. Podle předešlé věty je charakteristický polynom zobrazení φV/V1 tvaru (λ−λ2)·· · ··(λ−λn). Předpokládejme, že jsme již sestrojili lineárně nezávislé vektory u1, . . . , uk a invariantní podprostory Vi = ⟨u1 . . . , ui⟩, i = 1, . . . , k < n, takové, že charakteristický polynom φV/Vk je tvaru (λ − λk+1) · · · · · (λ − λn) a φ(ui) ∈ (λi · ui + Vi−1) pro všechna i = 1, . . . , k. Zejména tedy existuje vlastní vektor uk+1 + Vk ∈ V/Vk zobrazení φV/Vk s vlastní hodnotou λk+1. Uvažme nyní prostor Vk+1 = ⟨u1, . . . , uk+1⟩. Kdyby byl vektor uk+1 lineární kombinací vektorů u1, . . . , uk, znamenalo by to, že uk+1 + Vk je nulová třída v V/Vk, to ale není možné. Je proto dim Vk+1 = k + 1. Zbývá studovat indukované zobrazení φV/Vk+1 . Charakteristický polynom tohoto zobrazení je stupně n − k − 1 a dělí charakteristický polynom zobrazení φ. Přitom doplněním vektorů u1, . . . , uk+1 do báze V dostaneme polorozpadlou matici zobrazení φ s horní trojúhelníkovou submaticí B v horním levém rohu, jejíž diagonální prvky jsou právě skaláry λ1, . . . , uk+1. Proto mají kořeny charakteristického polynomu indukovaného zobrazení požadované vlastnosti. 3.32. Poznámky. Pokud existuje rozklad celého prostoru V na přímý součet vlastních podprostorů, existuje báze z vlastních podprostorů a předchozí věta vlastně neříká vůbec nic zajímavého. Její síla ovšem spočívá v tom, že jediným jejím předpokladem je existence dim V kořenů charakteristického polynomu (včetně násobností). To je ovšem zaručeno, je-li pole K algebraicky uzavřené, např. pro komplexní čísla C. Přímým důsledkem pak jsou zajímavá tvrzení o determinantu a stopě zobrazení: jsou vždy součinem, resp. součtem prvků ve spektru. Tuto skutečnost můžeme použít i pro všechny reálné matice. Můžeme je totiž vždy považovat za komplexní, spočítat potřebné, a protože determinant i stopa jsou algebraické výrazy v prvcích matice, výsledkem budou právě hledané reálné hodnoty. Když je na vektorovém prostoru V zadán skalární součin, můžeme v každém induktivním kroku důkazu předchozího tvrzení využít skutečnosti, že vždy V/Vk ≃ V ⊥ k a V ⊥ k ∋ u → (u + Vk) ∈ V/Vk. To znamená, že v každé třídě rozkladu V/Vk existuje právě jeden vektor z V ⊥ k . Skutečně, tuto vlastnost má faktorový prostor podle libovolného podprostoru v unitárním prostoru – pokud u, v ∈ V ⊥ k jsou 154 2. MARKOVOVY PROCESY Zvláště vidíme, že pro velká n je pravděpodobnost úspěchu n-tého pokusu blízká 2/3. 3.32. Na základě teploty ve 14.00 se rozdělují dny na teplé, průměrné a chladné. Dle celoročních statistik následuje po teplém dni teplý v polovině případů a průměrný ve 30 % případů, po průměrném dnu průměrný ve 40 % případů a chladný ve 30 % případů, po chladném dnu chladný v polovině případů a ve 30 % případů průměrný. Bez dalších informací zjistěte, kolik lze během roku očekávat teplých, průměrných a chladných dnů. Řešení. Pro každý den musí nastav právě jeden ze stavů „teplý den“, „průměrný den“, „chladný den“. Pokud vektor xn má za složky pravděpodobnosti toho, že jistý (označený jako n-tý) den bude teplý, průměrný, chladný (při zachování pořadí), potom složky vektoru xn+1 =   0, 5 0, 3 0, 2 0, 3 0, 4 0, 3 0, 2 0, 3 0, 5   · xn udávají postupně pravděpodobnosti, že následující den bude teplý, průměrný, chladný. Pro ověření stačí dosadit xn =   1 0 0   , xn =   0 1 0   , xn =   0 0 1   , přičemž např. pro třetí volbu musíme dostat pravděpodobnosti, že po chladném dnu bude následovat teplý, průměrný, chladný (v tomto pořadí). Vidíme tak, že úloha je Markovovým řetězcem s pravděpodobnostní maticí přechodu T =   0, 5 0, 3 0, 2 0, 3 0, 4 0, 3 0, 2 0, 3 0, 5   . Neboť jsou všechny prvky této matice kladné, existuje pravděpodobnostní vektor x∞ = ( x1 ∞ , x2 ∞ , x3 ∞ )T , k němuž se blíží vektor xn pro zvětšující se n nezávisle na tom, jaký byl vektor xn pro mnohem menší n. Navíc podle důsledku PerronovyFrobeniovy věty je x∞ vlastním vektorem matice T pro vlastní číslo 1. Má tedy platit x1 ∞ = 0, 5 x1 ∞ + 0, 3 x2 ∞ + 0, 2 x3 ∞ , x2 ∞ = 0, 3 x1 ∞ + 0, 4 x2 ∞ + 0, 3 x3 ∞ , x3 ∞ = 0, 2 x1 ∞ + 0, 3 x2 ∞ + 0, 5 x3 ∞ , 1 = x1 ∞ + x2 ∞ + x3 ∞ , kde poslední podmínka znamená, že vektor x∞ je pravděpodobnostní. Snadno se vypočítá, že tato soustava má jediné řešení x1 ∞ = x2 ∞ = x3 ∞ = 1 3 . CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET v jedné třídě, pak jejich rozdíl patří do Vk ∩ V ⊥ k , tedy jsou stejné. Můžeme tedy jako reprezentanta uk+1 nalezené třídy, tedy vlastního vektoru φV/Vk , zvolit právě vektor z V ⊥ k . Touto modifikací dojdeme k ortogonální bázi s vlastnostmi požadovanými v tvrzení o triangulovatelnosti. Proto existuje i taková ortonormální báze: Důsledek (Schurova věta o ortogonální triangulovatelnosti). Nechť φ : V → V je libovolné lineární zobrazení (reálného nebo komplexního) unitárního prostoru s m = dim V vlastními hodnotami (včetně násobonosti). Pak existuje ortonormální báze prostoru V taková, že φ v ní má horní trojúhelníkovou matici s vlastními čísly λ1, . . . , λm na diagonále. 3.33. Věta. Nechť φ V → V je lineární zobrazení. Součet kořenových prostorů Rλ1 , . . . , Rλk příslušných různým vlastním hodnotám λ1′ . . . , λk je přímý. Navíc je pro každou vlastní hodnotu λ dimenze podprostoru Rλ rovna její algebraické násobnosti. Důkaz. Důkaz provedeme indukcí přes počet k kořenových prostorů. Předpokládejme, že tvrzení vždy platí pro méně než k prostorů a že pro vektory u1 ∈ Rλ1 , . . . , uk ∈ Rλk platí u1 + · · · + uk = 0. Pro vhodné j pak (φ − λk · idV )j (uk) = 0 a zároveň jsou yi = (φ − λk · idV )j (ui) nenulové vektory v Rλi , i = 1, . . . , k−1, pokud ui jsou nenulové, viz. předchozí věta. Přitom ale y1 + · · · + yk−1 = k∑ i=1 (φ − λk · idV )j (ui) = 0 a tedy podle indukčního předpokladu jsou všechny yi nulové. Pak ovšem i uk = 0 a lineární nezávislost je dokázána. Zbývá ukázat, že dimenze každého kořenového prostoru Rλ je rovna algebraické násobnosti kořenu λ charakteristického polynomu. Nechť tedy je λ vlastní hodnota φ, označme ¯φ zúžení φ|Rλ a ψ V/Rλ → V/Rλ nechť je zobrazení indukované φ na faktorovém prostoru. Předpokládejme, že dimenze Rλ je menší než násobnost kořenu λ charakteristického polynomu. Podle věty ?? to znamená, že λ je i vlastní hodnotou zobrazení ψ. Nechť (v +Rλ) ∈ V/Rλ je příslušný vlastní vektor, tj. ψ(v+Rλ) = λ·(v+Rλ) což podle definice značí v /∈ Rλ a φ(v) = λ·v +w pro vhodné w ∈ Rλ. Máme tedy w = (φ−λ·idV )(v) a (φ−λ·idV )j (w) = 0 pro vhodné j. Celkem tedy (φ −λ·idV )j+1 (v) = 0 což je ve sporu s volbou v /∈ Rλ. Tím jsme dokázali, že dimenze Rλ je rovna násobnosti kořene λ charakteristického polynomu φ. Důsledek. Pro každé lineární zobrazení φ : V → V , jehož celé spektrum je v K, je V = Rλ1 ⊕ · · · ⊕ Rλn přímým součtem kořenových podprostorů. Zvolíme-li vhodně báze těchto podprostorů, pak φ má v této bázi blokově diagonální tvar s horními trojúhelníkovými maticemi v blocích a vlastními hodnotami λi na diagonále. 155 Lze tedy očekávat přibližně stejný počet teplých, průměrných a chladných dnů. Zdůrazněme, že součet všech čísel z libovolného sloupce matice T musel být roven 1 (jinak by se nejednalo o Markovův proces). Protože T T = T (matice je symetrická), je součet všech čísel z libovolného řádku matice také roven 1. O matici s nezápornými prvky a s vlastností, že součet čísel v každém řádku a rovněž součet čísel v každém sloupci je 1, mluvíme jako o dvojnásobně (dvojitě, dvojně) stochastické. Důležitou vlastností každé dvojnásobně stochastické regulární matice (pro jakýkoli rozměr – počet stavů) je, že jí příslušný vektor x∞ má všechny složky stejné, tj. po dostatečně dlouhé době vyhodnocování se všechny stavy v odpovídajícím Markovově procesu jeví jako stejně časté. 3.33. Jirka má ve zvyku si každý večer zaběhat. Má tři trasy – krátkou, střední a dlouhou. Pokud si někdy zvolí krátkou trasu, následující den si to vyčítá a rozhodne se libovolně (tj. se stejnou pravděpodobností) pro dlouhou, nebo střední. Jestliže si v některý den zvolí dlouhou trasu, v následujícím dnu volí zcela libovolně jednu z tras. Pokud běžel středně dlouhou trasu, cítí se dobře a druhý den si se stejnou pravděpodobností vybere buď střední, nebo dlouhou. Předpokládejte, že takto běhá každý večer už velmi dlouhou dobu. Jak často volí krátkou a jak často dlouhou trasu? Jaká je pravděpodobnost, že si zvolí dlouhou trasu, když si ji zvolil přesně před týdnem? Řešení. Zřejmě se jedná o Markovův proces se třemi možnými stavy, a to volbami krátké, střední a dlouhé trasy. Toto pořadí stavů dává pravděpodobnostní matici přechodu T =   0 0 1/3 1/2 1/2 1/3 1/2 1/2 1/3   . Stačí si uvědomit, že např. druhý sloupec odpovídá volbě střední trasy v minulém dnu, která znamená, že s pravděpodobností 1/2 bude opět zvolena střední trasa (druhý řádek) a s pravděpodobností 1/2 bude zvolena dlouhá trasa (třetí řádek). Neboť je T 2 =   1/6 1/6 1/9 5/12 5/12 4/9 5/12 5/12 4/9   , můžeme využít důsledků Perronovy-Frobeniovy věty pro Markovovy procesy. Není obtížné vypočítat, že vlastním vektorem, který přísluší vlastnímu číslu 1 a který je pravděpodobnostní, je právě ( 1 7 , 3 7 , 3 7 )T . Hodnoty 1/7, 3/7, 3/7 pak udávají po řadě pravděpodobnosti, že v náhodně určeném dnu volí trasu krátkou, střední, dlouhou. 4. VÍCE MATICOVÉHO POČTU 3.34. Nilpotentní a cyklická zobrazení. Nyní již máme skoro vše připraveno pro diskusi kanonických tvarů matic. Zbývá jen vyjasnit vztah mezi cyklickými a nilpotentními zobrazeními a poskládat dohromady již připravené výsledky. Věta. Nechť φ V → V je nilpotentní lineární zobrazení. Pak existuje rozklad V na přímý součet podprostorů V = V1 ⊕ · · ·⊕Vk takových, že zúžení φ na kterýkoliv z nich je cyklické. Důkaz. Ověření je docela jednoduché a spočívá v konstrukci takové báze prostoru V , že akce zobrazení φ na bázových vektorech přímo ukazuje rozklad na cyklická zobrazení. Postup bude ale poněkud zdlouhavý. Nechť k je stupeň nilpotentnosti zobrazení φ a označme Pi = im(φi ), i = 0, . . . , k, tzn. {0} = Pk ⊂ Pk−1 ⊂ · · · ⊂ P1 ⊂ P0 = V. Vyberme libovolnou bázi ek−1 1 , . . . , ek−1 pk−1 prostoru Pk−1, kde pk−1 > 0 je dimenze Pk−1. Z definice plyne, že Pk−1 ⊂ Ker φ, tj. vždy φ(ek−1 j ) = 0. Předpokládejme, že Pk−1 ̸= V . Protože Pk−1 = φ(Pk−2), nutně existují v Pk−2 vektory ek−2 j , j = 1, . . . , pk−1, takové, že φ(ek−2 j ) = ek−1 j . Předpoklá- dejme a1ek−1 1 + · · · + apk−1 ek−1 pk−1 + b1ek−2 1 + · · · + bpk−1 ek−2 pk−1 = 0. Aplikací zobrazení φ na tuto lineární kombinaci získáme b1ek−1 1 + · · · + bpk−1 ek−1 pk−1 = 0, proto jsou všechny bj = 0. Pak ale i aj = 0, protože se jedná o kombinaci bázových vektorů. Celkem jsme tedy ověřili lineární nezávislost všech 2pk−1 zvolených vektorů. Doplňme je do báze ek−1 1 , . . . , ek−1 pk−1 ek−2 1 , . . . , ek−2 pk−1 , ek−2 pk−1+1, . . . , ek−2 pk−2 prostoru Pk−2. Navíc jsou obrazy přidaných bázových prvků v Pk−1, nutně tedy musejí být lineárními kombinacemi bázových prvků ek−1 1 , . . . , ek−1 pk−1 . Můžeme proto zaměnit zvolené vektory ek−2 pk−1+1, . . . , ek−2 pk−2 vektory ek−2 j −φ(ek−2 j ). Tím docílíme, že doplněné vektory do báze Pk−2 patří do jádra zobrazení φ. Předpokládejme to přímo o zvolené bázi (1). Předpokládejme dále, že již máme sestrojenu bázi podprostoru Pk−ℓ takovou, že ji můžeme poskládat do schématu ek−1 1 , . . . , ek−1 pk−1 ek−2 1 , . . . , ek−2 pk−1 , ek−2 pk−1+1, . . . , ek−2 pk−2 ek−3 1 , . . . , ek−3 pk−1 , ek−3 pk−1+1, . . . , ek−3 pk−2 , ek−3 pk−2+1, . . . , ek−3 pk−3 ... ek−ℓ 1 , . . . , ek−ℓ pk−1 , ek−ℓ pk−1+1, . . . , ek−ℓ pk−2 , ek−ℓ pk−2+1, . . . , ek−ℓ pk−3 , . . . ek−ℓ pk−ℓ kde hodnota zobrazení φ na libovolném bázovém vektoru se nachází nad ním, nebo je nulová, pokud nad zvoleným vektorem báze již nic není. Pokud je Pk−ℓ ̸= V , opět musí existovat vektory ek−ℓ−1 1 , . . . , ek−ℓ−1 pk−ℓ , které se zobrazují na 156 2. MARKOVOVY PROCESY Nechť si Jirka v jistý den (v čase n ∈ N) vybere dlouhou trasu. Tomuto rozhodnutí odpovídá pravděpodobnostní vektor xn = (0, 0, 1)T . Pro následující den tedy platí xn+1 =   0 0 1/3 1/2 1/2 1/3 1/2 1/2 1/3   ·   0 0 1   =   1/3 1/3 1/3   , až po sedmi dnech je xn+7 = T 7 ·   0 0 1   = T 6 ·   1/3 1/3 1/3   . Vyčíslením dostáváme jako složky xn+7 hodnoty 0, 142 861 225 . . . ; 0, 428 569 387 . . . ; 0, 428 569 387 . . . Tedy pravděpodobnost, že zvolí dlouhou trasu za podmínky, že si ji zvolil před sedmi dny, činí přibližně 0, 428 569 ≈ 3/7 . = 0, 428 571. 3.34. Výrobní linka nefunguje spolehlivě: jednotlivé výrobky se od sebe co do kvality nezanedbatelně liší. Navíc jistý pracovník ve snaze zvýšit kvalitu neustále zasahuje do výrobního procesu. Při rozdělení výrobků do tříd I, II, III podle kvality se zjistilo, že po výrobku třídy I následuje výrobek stejné kvality v 80 % případů a třídy II v 10 % případů, po výrobku třídy II se nezmění kvalita v 60 % případů a změní se na třídu I ve 20 % případů a že po výrobku třídy III následuje výrobek stejné kvality v polovině případů a se stejnou četností pak výrobky tříd I, II. Spočtěte pravděpodobnost, že 18. výrobek je třídy I, pokud 16. výrobek v pořadí náležel do třídy III. Řešení. Nejprve úlohu vyřešme bez uvážení Markovova řetězce. Sledovanému jevu vyhovují případy (16. výrobek je třídy III) • 17. výrobek byl zařazen do třídy I a 18. do třídy I; • 17. výrobek byl zařazen do třídy II a 18. do třídy I; • 17. výrobek byl zařazen do třídy III a 18. do třídy I po řadě s pravděpodobnostmi • 0, 25 · 0, 8 = 0, 2; • 0, 25 · 0, 2 = 0, 05; • 0, 5 · 0, 25 = 0, 125. Lehce tak získáváme výsledek 0, 375 = 0, 2 + 0, 05 + 0, 125. Nyní na úlohu nahlížejme jako na Markovův proces. Ze zadání plyne, že pořadí možných stavů „výrobek je třídy I“, „výrobek je CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET ek−ℓ 1 , . . . , ek−ℓ pk−ℓ a můžeme je doplnit do báze Pk−l−1, řekněme vektory ek−ℓ−1 pk−ℓ+1, . . . , ek−ℓ−1 pk−ℓ−1 . Přitom postupným odečítáním hodnot iterací zobrazení φ na těchto vektorech dosáhneme opět toho, že doplněné vektory do báze Pk−ℓ−1 budou ležet v jádru φ a analogicky jako výše ověříme, že skutečně dostaneme bázi Pk−ℓ−1. Po k krocích získáme bázi celého V , která má vlastnosti uvedené pro bázi (2) prostoru Pk−ℓ. Jednotlivé sloupce výsledného schématu pak generují hledané podprostory Vi a navíc jsme přímo našli báze těchto podprostorů ukazující, že příslušná zúžení φ jsou cyklická zobrazení. 3.35. Důkaz Jordanovy věty. Nechť λ1, . . . , λk jsou všechny různé vlastní hodnoty zobrazení φ. Z předpokladů Jordanovy věty plyne, že V = Rλ1 ⊕ · · · ⊕ Rλk . Zobrazení φi = (φ|Rλi − λi · idRλi ) jsou nilpotentní a proto je každý z kořenových prostorů přímým součtem Rλi = P1,λi ⊕ · · · ⊕ Pji,λi prostorů na nichž je zúžení zobrazení φ − λi · idV cyklické. Matice těchto zúžených zobrazení na Pr,s jsou Jordanovy bloky příslušné k nulové vlastní hodnotě, zúžené zobrazení φ|Pr,s má proto za matici Jordanův blok s vlastní hodnotou λi. Pro důkaz Jordanovy věty zbývá dokázat tvrzení o jednoznačnosti. Protože diagonální hodnoty λi jsou dány jako kořeny charakteristického polynomu, je jejich jednoznačnost zřejmá. Vyjádříme rozměry jednotlivých Jordanových bloků prostřednictvím hodností rk(λi) zobrazení (φ − λi · idV )k . Tím bude jasné, že až na pořadí jsou bloky jednoznačně určeny. Naopak, přehození bloků odpovídá přečíslování vektorů báze, lze je tedy získat v libovolném pořadí. Je-li ψ cyklický operátor na n-rozměrném prostoru, pak defekt iterovaného zobrazení ψk je k pro 0 ≤ k ≤ n a je n pro všechna k ≥ n. Odtud plyne, že pokud matice J zobrazení φ obsahuje dk(λ) Jordanových bloků řádu k s vlastní hodnotou λ, pak defekt matice (J − λ · E)ℓ je d1(λ) + 2d2(λ) + . . . ℓdℓ(λ) + ℓdℓ+1(λ) + . . . Odtud spočítáme n − rℓ(λ) = d1(λ) + 2d2(λ) + · · · + ℓdℓ(λ) + ℓdℓ+1(λ) + . . . dk(λ) = rk−1(λ) − 2rk(λ) + rk+1(λ) (kde poslední řádek vznikne kombinací předchozího pro hodnoty ℓ = k − 1, k, k + 1). 3.36. Poznámka. Důkaz věty o existenci Jordanova kanonického tvaru byl sice konstruktivní, nedává nám ale dokonale efektivní algoritmický postup pro jejich hledání. Nyní shrneme již odvozený postup explicitního výpočtu báze, v níž má dané zobrazení φ V → V matici v kanonickém Jordanově tvaru. (1) Najdeme kořeny charakteristického polynomu. 157 třídy II“, „výrobek je třídy III“ odpovídá pravděpodobnostní matice přechodu   0, 8 0, 2 0, 25 0, 1 0, 6 0, 25 0, 1 0, 2 0, 5   . Situaci, kdy výrobek patří do třídy III, zadává pravděpodobnostní vektor (0, 0, 1)T . Pro následující výrobek dostáváme pravděpodobnostní vektor   0, 25 0, 25 0, 5   =   0, 8 0, 2 0, 25 0, 1 0, 6 0, 25 0, 1 0, 2 0, 5   ·   0 0 1   a pro další výrobek v pořadí potom vektor   0, 375 0, 3 0, 325   =   0, 8 0, 2 0, 25 0, 1 0, 6 0, 25 0, 1 0, 2 0, 5   ·   0, 25 0, 25 0, 5   , jehož první složka je hledanou pravděpodobností. Doplňme, že první metoda řešení (bez zavedení Markovova procesu) vedla k výsledku zřejmě rychleji. Uvědomme si, jak výrazně by se však první metoda znepřehlednila, kdybychom např. místo 18. výrobku uvažovali 20., 22. nebo až 30. výrobek v pořadí. Ve druhé metodě se lze omezit na do jisté míry „bezmyšlenkovité“ násobení (umocňování) matic. Při zavedení Markovova procesu jsme také současně vyšetřovali situace, kdy 18. výrobek náleží do tříd II a III. 3.35. Opakovaně házíme hrací kostkou. Napište pravděpodobnostní matici přechodu T pro Markovův řetězec „maximální počet ok dosažených do n-tého hodu včetně“ pro pořadí stavů 1, . . . , 6. Poté určete T n pro každé n ∈ N. Řešení. Ihned můžeme uvést T =         1/6 0 0 0 0 0 1/6 2/6 0 0 0 0 1/6 1/6 3/6 0 0 0 1/6 1/6 1/6 4/6 0 0 1/6 1/6 1/6 1/6 5/6 0 1/6 1/6 1/6 1/6 1/6 1         , kde první sloupec je určen stavem 1 a pravděpodobností 1/6 pro jeho zachování (v dalším hodu padne 1) a pravděpodobností 1/6 jeho přechodu do libovolného ze stavů 2, . . . , 6 (po řadě padne 2, . . . , 6), druhý sloupec je zadán stavem 2 a pravděpodobností 2/6 pro jeho zachování (v dalším hodu padne 1 nebo 2) a pravděpodobností 1/6 pro přechod do jakéhokoli ze stavů 3, . . . , 6 (padne 3, . . . , 6), až poslední sloupce získáme ze skutečnosti, že stav 6 je trvalý (pokud již padla šestka, nemůže padnout vyšší počet ok). 5. ROZKLADY MATIC A PSEUDOINVERZE (2) Jestliže jich je méně než n = dim V , včetně násobností, kanonický tvar neexistuje. (3) Je-li n lineárně nezávislých vlastních vektorů, získáme bázi V z vlastních vektorů a v ní má φ diagonální matici. (4) Nechť λ je vlastní hodnota s geometrickou násobností menší než algebraickou a v1, . . . , vk nechť jsou příslušné vlastní vektory. To by měly být vektory na horním okraji schématu z důkazu věty 3.34, je ovšem nutné najít vhodnou bázi aplikacemi iterací φ − λ · idV . Zároveň přitom zjistíme ve kterém řádku se vektory nacházejí a najdeme lineárně nezávislá řešení wi rovnic (φ − λ id)(x) = vi z řádků pod nimi. Postup opakujeme iterativně (tj. pro wi atd.). Najdeme tak „řetízky“ bázových vektorů zadávajících podprostory, kde φ − λ id je cyklické. Postup je praktický pro matice, kde násobnosti vlastních hodnot jsou malé, nebo aspoň diskutované stupně nilpotentnosti jsou malé. Např. pro matici A =   2 0 1 0 2 1 0 0 2   dostaneme dvourozměrný podprostor vlastních vektorů ⟨(1, 0, 0), (0, 1, 0)⟩. Potřebujeme proto najít řešení rovnic (A−2E)x = (a, b, 0)T pro vhodné konstanty a, b. Tento systém je ovšem řešitelný pouze pro a = b a jedno z možných řešení je v = (0, 0, 1), a = b = 1. Celá hledaná báze pak je (1, 1, 0), (0, 0, 1), (1, 0, 0). Všimněme si, že jsme měli spoustu voleb a bazí s požadovanými vlastnostmi je tedy mnoho. 5. Rozklady matic a pseudoinverze V minulé části jsme s soustředili na geometrický popis struktury zobrazení. Teď naše výsledky přeložíme do jazyku tzv. rozkladů matic, což je obzvlášť důležité téma pro numerické postupy a maticový počet obecně. I při počítání s reálnými čísly užíváme pro zjednodušení rozklady na součiny. Nejjednodušším je vyjádření každého reálného čísla jednoznačně ve tvaru a = sgn(a) · |a|, tj. jako součin znaménka a abolutní hodnoty. V dalším textu si uvedeme stručně přehled několika takových rozkladů pro různé typy matic, které bývají nesmírně užitečné při numerických výpočtech s maticemi. Například jsme vhodný rozklad pro pozitivně semidefinitní symetrické matice využili v odstavci 3.27 pro konstrukci odmocniny z matice. 3.37. LU–rozklad. Začneme přeformulováním několika výsledků, které jsme už dávno odvodili. V odstavcích 2.7 a 2.8 jsme upravovali matice nad skaláry z libovolného pole na řádkový schodovitý tvar. K tomu jsme používali elementární úpravy, které spočívaly v postupném násobení naší matice invertibilními dolními trojúhelníkovými maticemi Pi, které 158 2. MARKOVOVY PROCESY Rovněž pro n ∈ N lze přímo určit T n =          ( 1 6 )n 0 0 0 0 0 ( 2 6 )n − ( 1 6 )n ( 2 6 )n 0 0 0 0 ( 3 6 )n − ( 2 6 )n ( 3 6 )n − ( 2 6 )n ( 3 6 )n 0 0 0 ( 4 6 )n − ( 3 6 )n ( 4 6 )n − ( 3 6 )n ( 4 6 )n − ( 3 6 )n ( 4 6 )n 0 0 ( 5 6 )n − ( 4 6 )n ( 5 6 )n − ( 4 6 )n ( 5 6 )n − ( 4 6 )n ( 5 6 )n − ( 4 6 )n ( 5 6 )n 0 1 − ( 5 6 )n 1 − ( 5 6 )n 1 − ( 5 6 )n 1 − ( 5 6 )n 1 − ( 5 6 )n 1          . Hodnoty v prvním sloupci totiž odpovídají postupně pravděpodobnostem, že n-krát po sobě padne 1, n-krát po sobě padne 1 nebo 2 a alespoň jednou 2 (odečítáme proto pravděpodobnost uvedenou v prvním řádku), n-krát po sobě padne 1, 2 nebo 3 a alespoň jednou padne 3, až v posledním řádku je pravděpodobnost, že aspoň jednou během n hodů padne 6 (tu lze snadno určit z pravděpodobnosti opačného jevu). Podobně např. ve čtvrtém sloupci jsou postupně nenulové pravděpodobnosti jevů „n-krát po sobě padne 1, 2, 3 nebo 4“, „n-krát po sobě padne 1, 2, 3, 4 nebo 5 a alespoň jednou 5“ a „alespoň jednou během n hodů padne 6“. Interpretace matice T jako matice přechodu jistého Markovova procesu tak umožňuje rychlé vyjádření mocnin T n , n ∈ N. 3.36. Sledujte určitou vlastnost daného živočišného druhu, která je podmíněna nezávisle na pohlaví jistým genem – dvojicí alel. Každý jedinec získává po jedné alele od obou rodičů zcela náhodně a nezávisle na sobě. Existují formy genu dané různými alelami a, A. Ty určují tři možné stavy aa, aA = Aa, AA vyšetřované vlastnosti. (a) Předpokládejte, že každý jedinec jisté populace se bude rozmnožovat výhradně s jedincem jiné populace, ve které se vyskytuje pouze vlastnost podmíněná dvojicí aA. Právě jeden jejich (náhodně zvolený) potomek bude ponechán na stanovišti a také on se bude rozmnožovat výhradně s jedincem té jiné populace atd. Stanovte výskyt kombinací aa, aA, AA v uvažované populaci po dostatečně dlouhé době. (b) Řešte úlohu uvedenou ve variantě (a), pokud je jiná populace tvořena pouze jedinci s dvojicí alel AA. (c) Náhodně zvolené dva jedince opačného pohlaví zkřížíte. Z jejich potomstva opět náhodně vyberete dva jedince opačného pohlaví, které zkřížíte. Pokud takto budete pokračovat velmi dlouho dobu, vypočtěte pravděpodobnost, že oba křížení jedinci budou mít dvojici alel AA, příp. aa (proces křížení skončí). CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET postihovaly přičítání násobků řádků pod právě zpravovávaným. Předpokládejme pro jednoduchost, že naše matice A je čtvercová a že při Gausově eliminaci nejsme nuceni přehazovat řádky a proto všechny naše matice Pi mohou být dolní trojúhelníkové s jedničkami na diagonálách. Konečně, stačí si povšimnout, že inverzní matice k takovýmto Pi jsou opět dolní trojúhelníkové s jedničkami na diagonálách a dostáváme U = P · A = Pk · · · P1 · A kde U je horní trojúhelníková matice a tedy A = L · U kde L je dolní trojúhelníková matice s jedničkami na diagonále a U je horní trojúhelníková. Tomuto rozkladu se říká LU–rozklad matice A. V případě obecné matice můžeme při Gausově eliminaci na řádkově schodovitý tvar potřebovat navíc permutace řádků, někdy i sloupců matice. Pak dostáváme obecněji A = P · L · U · Q, kde P a Q jsou nějaké permutační matice. 3.38. Poznámky. Přímým důsledkem Gausovy eliminace bylo také zjištění, že až na volbu vhodných bází na definičním oboru a oboru hodnot je každé zobrazení f : V → W zadáno maticí v blokově diagonálním tvaru s jednotkovou maticí, s rozměrem daným dimenzí obrazu f , a s nulovými bloky všude kolem. To lze přeformulovat takto: Každou matici A typu m/n nad polem skalárů K lze rozložit na součin A = P · ( E 0 0 0 ) · Q, kde P a Q jsou vhodné invertibilní matice. Pro čtvercové matice jsme v 3.28 ukázali při diskusi vlastností lineárních zobrazení f : V → V na komplexních vektorových prostorech, že každou čtvercovou matici A dimenze m umíme rozložit na součin A = P · B · P −1 kde B je blokově diagonální s Jordanovými bloky příslušnými k vlastním číslům na diagonále. Skutečně jde o pouhé přepsání Jordanovy věty, protože násobení maticí P a její inverzí z opačných stran odpovídá v tomto přípaě právě změně báze na vektorovém prostoru V a citovaná věta říká, že ve vhodné bázi má každé zobrazení Jordanův kanonický tvar. Obdodně jsme tedy při diskusi samoadjungovaných zobrazení dokázali, že pro reálné symetrické nebo komplexní Hermiteovské matice existuje vždy rozklad na součin A = P · B · P ∗ , kde B je diagonální matice se všemi (vždy reálnými) vlastními čísly na diagonále, včetně násobností. Skutečně, jde opět o součin s maticemi vystihující změnu báze, nicméně připouštíme nyní pouze změny mezi mezi ortonormálními bazemi a proto i matice přechodu P musí být ortogonální. Odtud P −1 = P ∗ . 159 (d) Řešte úlohu uvedenou ve variantě (c) bez kladení podmínky, že křížení jedinci mají stejné rodiče. Pouze tedy křížíte jedince jisté velké populace mezi sebou, potom křížíte potomky mezi sebou atd. Řešení. Případ (a). Jedná se o Markovův proces zadaný maticí T =   1/2 1/4 0 1/2 1/2 1/2 0 1/4 1/2   , přičemž pořadí stavů odpovídá pořadí dvojic alel aa, aA, AA. Hodnoty v prvním sloupci plynou z toho, že potomek jedince s dvojicí alel aa a jedince s dvojicí alel aA má s pravděpodobností 1/2 dvojici aa a s pravděpodobností 1/2 dvojici aA. Analogicky postupujeme pro třetí sloupec. Hodnoty ve druhém sloupci potom vyplývají z toho, že každý ze čtyř případů dvojic alel aa, aA, Aa, AA je stejně pravděpodobný u jedince, jehož oba rodiče mají dvojici alel aA. Uvědomme si, že na rozdíl od počítání pravděpodobností, kdy musíme rozlišovat dvojici aA od Aa (která z alel pochází od kterého z rodičů), vlastnosti podmíněné dvojicemi aA a Aa jsou samozřejmě stejné. Pro určení výsledného stavu stačí nalézt pravděpodobnostní vektor, který přísluší vlastnímu číslu 1 matice T , protože matice T 2 =   3/8 1/4 1/8 1/2 1/2 1/2 1/8 1/4 3/8   splňuje podmínku Perronovy-Frobeniovy věty (všechny její prvky jsou kladné). Hledaný pravděpodobnostní vektor je ( 1 4 , 1 2 , 1 4 )T , což již dává pravděpodobnosti 1/4, 1/2, 1/4 výskytu po řadě kombinací aa, aA, AA po velmi dlouhé (teoreticky nekonečné) době. Případ (b). Pro pořadí dvojic alel AA, aA, aa nyní dostáváme pravděpodobnostní matici přechodu T =   1 1/2 0 0 1/2 1 0 0 0   . Ihned vidíme všechna vlastní čísla 1, 1/2 a 0 (odečteme-li je od diagonály, hodnost obdržené matice nebude 3, tj. touto maticí zadaná homogenní soustava bude mít netriviální řešení). Těmto vlastním číslům přísluší po řadě vlastní vektory   1 0 0   ,   −1 1 0   ,   1 −2 1   . 5. ROZKLADY MATIC A PSEUDOINVERZE Pro reálná ortogonální zobrazení jsme odvodili obdobné vyjádření jako u symetrických, pouze naše B bude blokově diagonální s bloky rozměru dva nebo jedna vyjadřujícími buď rotaci nebo zrcadlení nebo identitu vzhledem k příslušným podprostorům. 3.39. Věta o singulárním rozkladu. Nyní se vrátíme k obecným lineárním zobrazením mezi (obecně různými) vektorovými prostory. Jestliže na nich je definován skalární součin a omezíme se přitom na ortonormální báze, musíme postupovat o hodně rafinovaněji, než v případě bazí libovolných : Věta. Nechť A je libovolná matice typu m/n nad reálnými nebo komplexními skaláry. Pak existují čtvercové unitární matice U a V dimenzí m a n, a reálná diagonální matice s nezápornými prvky D dimenze r, r ≤ min{m, n}, takové, že A = USV ∗ , S = ( D 0 0 0 ) a r je hodnost matice AA∗ . Přitom je S určena jednoznačně až na pořadí prvků a prvky diagonální matice D jsou druhé odmocniny vlastních čísel di matice AA∗ . Pokud je A reálná matice, pak i matice U a V jsou ortogonální. Důkaz. Předpokládejme nejprve m ≤ n a označme φ : Kn → Km zobrazení mezi reálnými nebo komplexními prostory se standardními skalárními součiny, zadané maticí A ve standardních bazích. Tvrzení věty můžeme přeformulovat tak, že existují ortonormální báze na Kn a Km ve kterých bude mít φ matici S z tvrzení věty. Jak jsme viděli dříve, matice A∗ A je pozitivně semidefinitní. Proto má samá reálná nezáporná vlastní čísla a existuje ortonormální báze w v Kn , ve které má příslušné zobrazení φ∗ ◦φ diagonální matici s vlastními čísly na diagonále. Jinými slovy, existuje unitární matice V taková, že A∗ A = V BV ∗ pro reálnou diagonální matici s nezápornými vlastními čísly (d1, d2, . . . , dr, 0, . . . , 0) na diagonále, di ̸= 0 pro všechny i = 1, . . . , r. Odtud B = V ∗ A∗ AV = (AV )∗ (AV ). To je ale je ekvivalentní tvrzení, že prvních r sloupců matice AV je ortogonálních a zbývající jsou nulové, protože mají nulovou velikost. Označme nyní prvních r sloupců v1, . . . , vr ∈ Rm . Platí tedy ⟨vi, vi⟩ = di, i = 1, . . . , r a normované vektory ui = 1√ di vi tvoří ortonormální systém nenulových vektorů. Doplňme je na ortonormální bázi u = u1, . . . , un celého Km . Vyjádříme-li naše původní zobrazení zobrazení φ v bazích w na Kn a u na Km , dostáváme matici √ B. Přechody od standardních bází k nově vybraným odpovídají násobení zleva ortogonálními maticemi U a zprava V −1 = V ∗ . Pokud je m > n, můžeme aplikovat předchozí část důkazu na matici A∗ . Odtud pak přímo plyne požadované tvr- zení. 160 2. MARKOVOVY PROCESY Proto je T =   1 −1 1 0 1 −2 0 0 1   ·   1 0 0 0 1/2 0 0 0 0   ·   1 −1 1 0 1 −2 0 0 1   −1 =   1 −1 1 0 1 −2 0 0 1   ·   1 0 0 0 1/2 0 0 0 0   ·   1 1 1 0 1 2 0 0 1   . Odsud pro libovolné n ∈ N plyne T n =   1 −1 1 0 1 −2 0 0 1   ·   1 0 0 0 1/2 0 0 0 0   n ·   1 1 1 0 1 2 0 0 1   =   1 −1 1 0 1 −2 0 0 1   ·   1 0 0 0 2−n 0 0 0 0   ·   1 1 1 0 1 2 0 0 1   . Zřejmě pro velká n ∈ N můžeme nahradit 2−n za 0, což implikuje T n ≈   1 −1 1 0 1 −2 0 0 1   ·   1 0 0 0 0 0 0 0 0   ·   1 1 1 0 1 2 0 0 1   =   1 1 1 0 0 0 0 0 0   . Pokud tedy plodí potomky jedinci původní populace výhradně s členy populace, ve které se vyskytuje pouze dvojice alel AA, nutně po dostatečně velkém počtu křížení dojde k tomu, že dvojice aA a aa zcela vymizí (bez ohledu na jejich původní četnost). Případ (c). Tentokráte budeme mít 6 možných stavů (v tomto pořadí) AA, AA; aA, AA; aa, AA; aA, aA; aa, aA; aa, aa, přičemž tyto stavy jsou dány různými případy genotypů rodičů. Matice odpovídajícího Markovova řetězce je T =         1 1/4 0 1/16 0 0 0 1/2 0 1/4 0 0 0 0 0 1/8 0 0 0 1/4 1 1/4 1/4 0 0 0 0 1/4 1/2 0 0 0 0 1/16 1/4 1         . Pokud budeme např. uvažovat situaci (druhý sloupce), kdy jeden z rodičů má dvojici alel AA a druhý aA, pak zjevně může nastat každý ze čtyř případů (jde-li o dvojice alel jejich dvou náhodně zvolených potomků) AA, AA; AA, aA; aA, AA; aA, aA se stejnou pravděpodobností. Pravděpodobnost setrvání ve druhém stavu je proto 1/2 a pravděpodobnost přechodu ze druhého stavu do prvního je 1/4 a do čtvrtého také 1/4. CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET Pokud pracujeme nad reálnými skaláry, jsou všechny naše kroky v důkazu výše také realizovány v reálném oboru. Tento důkaz věty o singulárním rozkladu je konstruktivní a můžeme jej opravdu použít pro výpočet unitárních, resp. ortogonálních, matic U, V a diagonálních nenulových prvků matice S. 3.40. Geometrická interpretace singulárního rozkladu. Diagonálním hodnotám matice D z předchozí věty se říká singulární hodnoty matice A. Přeformulujme si tuto větu v reálném případě geometričtěji. Pro příslušné lineární zobrazení φ : Rn → Rm mají singulární hodnoty skutečně jednoduchý geometrický význam: Nechť K ⊂ Rn je jednotková sféra pro standardní skalární součin. Obrazem φ(K) pak vždy bude (případně degenerovaný) m-rozměrný elipsoid. Singulární čísla matice A jsou přitom velikosti hlavních poloos a věta navíc říká, že původní sféra vždy připouští ortogonální sdružené průměry, jejichž obrazem budou právě všechny poloosy tohoto elipsoidu. Pro čtvercové matice je vidět, že A je invertibilní právě, když všechna singulární čísla jsou nenulová. Poměr největšího a nejmenšího singulárního čísla je důležitým parametrem pro robustnost řady numerických výpočtů s maticemi, např. pro výpočet inverzní matice. Poznamejme také, že existují rychlé metody výpočtů, resp. odhadů, vlastních čísel, proto je se singulárním rozkladem velmi efektivně pra- covat. 3.41. Věta o polárním rozkladu. Věta o singulárním rozkladu je východiskem pro mnoho mimořádně užitečných nástrojů. Uvažujme nyní nad několika přímými důsledky (které samy o sobě jsou dosti netriviální). Tvrzení věty říká pro libovolnou matici A, ať už reálnou nebo komplexní, A = USW∗ s diagonální S s nezápornými reálnými čísly na diagonále a unitárními U, W. Pak ovšem také A = USU∗ UW∗ a pojmenujme si matice P = USU∗ , V = UW∗ . První z nich, P je hermiteovská (v reálném případě symetrická) a pozitivně semidefinitní, protože jde jen o zápis zobrazení s reálnou diagonální maticí S v jiné ortonormální bázi, zatímco V je coby součin dvou unitárních opět unitární (v reálném případě ortogonální). Navíc A∗ = WSU∗ a tedy AA∗ = USSU∗ = P 2 a naše matice P je vlastně odmocninou ze snadno spočítatelné hermiteovské matice AA∗ . Předpokládejme, že A = PV = QU jsou dva takové rozklady matice A na součin positivně semidefinitní hermiteovské a unitární matice a předpokládejme, že A je invertibilní. Pak ovšem je AA∗ = PV V ∗ P = P 2 = QUU∗ Q = Q2 pozitivně definitní a proto jsou matice Q = P = √ AA∗ jednoznačně určené a invertibilní. Pak ovšem také U = V = P −1 A. Beze zbytku jsme tedy odvodili velice užitečnou analogii rozkladu reálného čísla na znaménko (ortogonální matice v 161 Nyní bychom měli opět určit mocniny T n pro velká n ∈ N. Uvážením podoby prvního a posledního sloupce ihned zjistíme, že 1 je vlastním číslem matice T . Velmi lehce lze najít vlastní vektory (1, 0, 0, 0, 0, 0)T , (0, 0, 0, 0, 0, 1)T příslušné vlastnímu číslu 1. Přechodem ke čtyřrozměrné podmatici matice T (vynecháním právě prvního a šestého řádku a sloupce) nalezneme poté zbylá vlastní čísla 1 2 , 1 4 , 1 − √ 5 4 , 1 + √ 5 4 . Vzpomeneme-li si na řešení příkladu nazvaného Mlsný hazardér, nemusíme T n počítat. V tomto příkladu jsme dostali stejné vlastní vektory příslušné číslu 1 a ostatní vlastní čísla měla rovněž absolutní hodnotu ostře menší 1 (jejich přesné hodnoty jsme nevyužívali). Dostáváme tak totožný závěr, že proces se blíží k pravděpodobnostnímu vektoru (a, 0, 0, 0, 0, 1 − a)T , kde a ∈ [0, 1] je dáno výchozím stavem. Protože pouze na první a šesté pozici výsledného vektoru mohou být nenulová čísla, stavy aA, AA; aa, AA; aA, aA; aa, aA po mnohonásobném křížení vymizí. Uvědomme si dále (plyne z předešlého a z příkladu Mlsný hazardér), že pravděpodobnost toho, aby proces končil AA, AA, se rovná relativní četnosti výskytu A v počátečním stavu. Případ (d). Nechť hodnoty a, b, c ∈ [0, 1] udávají (při zachování pořadí) relativní četnosti výskytu dvojic alel AA, aA, aa v dané populaci. Chceme získat vyjádření relativních četností dvojic AA, aA, aa v potomstvu populace. Probíhá-li výběr dvojic pro páření náhodně, lze při velkém počtu jedinců očekávat, že relativní četnost páření jedinců s dvojicemi alel AA (u obou) je a2 , relativní četnost páření jedinců, z nichž jeden má dvojici alel AA a druhý aA, je 2ab, relativní četnost páření jedinců s dvojicemi alel aA (u obou) je b2 atd. Potomek rodičů s dvojicemi AA, AA musí dvojici alel AA zdědit. Pravděpodobnost, že potomek rodičů s dvojicemi AA, aA bude mít AA, je zřejmě 1/2 a pravděpodobnost, že potomek rodičů s dvojicemi aA, aA bude mít AA, je pak 1/4. Jiné případy pro potomka s dvojicí alel AA uvažovat nemusíme (pokud má jeden rodič dvojici alel aa, potomek nemůže mít dvojici AA). Relativní četnost výskytu dvojice alel AA v potomstvu je tedy a2 · 1 + 2ab · 1 2 + b2 · 1 4 = a2 + ab + b2 4 . 5. ROZKLADY MATIC A PSEUDOINVERZE případě dimenze jedna jsou právě ±1) a absolutní hodnotu (matice P , ke které umíme odmocninu). Věta (Věta o polárním rozkladu). Každou čtvercovou komplexní matici A dimenze n lze vždy vyjádřit ve tvaru A = P · V , kde P je hermiteovská a positivně definitní čtvercová matice téže dimenze a V je unitární. Přitom P = √ AA∗. Jeli A invertibilní, je rozklad jednoznačný a V = ( √ AA∗)−1 A. Pokud pracujeme nad reálnými skaláry, je P symetrická a V ortogonální. Když budeme tutéž větu aplikovat na A∗ místo A, dostaneme tentýž výsledek, ovšem s obráceným pořadím hermiteovských a unitárních matic. Matice v příslušných pravých a levých rozkladech budou samozřejmě obecně různé. V komplexním případě je analogie s rozkladem čísel ještě zábavnější — pozitivně semidefinitní P hraje opět roli absolutní hodnoty komplexního čísla, unitární matice V pak má jednoznačné vyjádření jako součet V = Vr + i Vi s hermiteovkými Vr a Vi s vlastností V 2 r + V 2 i = E, tj. dostáváme plnou analogii goniometrického tvaru komplexních čísel (viz závěrečná poznámka v 3.26). Všimněme si ale, že ve vícerozměrném případě je podstané, v jakém pořadí tento „goniometrický tvar“ matice píšeme. Jde to oběma způsoby, vysledky jsou ale obecně různé. Pro řadu praktických aplikací bývá rychlejší použití tzv. QR rozkladu matic, který je obdobou Schurovy věty o ortogonální triangulaci: 3.42. Věta. Pro každou komplexní matici A typu m/n existuje unitární matice Q a horní trojúhelníková matice R takové, že A = QT R. Pokud pracujeme nad reálnými skaláry, jsou Q i R re- álné. Důkaz. V geometrické formulaci potřebujeme dokázat, že pro každé zobrazení φ : Kn → Km s maticí A ve standardních bazích můžeme zvolit novou ortonormální bázi na Km tak, aby potom φ mělo horní trojúhelníkovou matici. Uvažme obrazy φ(e1), . . . , φ(en) ∈ Km vektorů standardní ortonormální báze, vyberme z nich maximální lineárně nezávislý systém v1, . . . , vk takovým způsobem, že vypouštěné závislé vektory jsou vždy lineární kombinací předchozích vektorů, a doplňme jej do báze v1, . . . , vm. Nechť u1, . . . , um je ortonormální báze Km vzniklá GrammSchmidtovou ortogonalizací tohoto systému vektorů. Nyní pro každé ei je φ(ei) buď jedno z vj , j ≤ i, nebo je lineární kombinací v1, . . . , vi−1, proto ve vyjádření φ(ei) v bázi u vystupují pouze vektory u1, . . . , ui. Zobrazení φ má proto ve standardní bázi na Kn a ortonormální bázi u na Km horní trojúhelníkovou matici R. Přechod k bázi u na Rm odpovídá násobení ortogonální maticí Q zleva, tj. R = QA, ekvivalentně A = Q∗ R. Závěrem této části textu si všimněme mimořádně užitečné a důležité aplikace našich výsledků pro přibližné numerické výpočty. 162 2. MARKOVOVY PROCESY Analogicky stanovíme postupně relativní četnosti dvojic aA a aa v potomstvu ve tvarech ab + bc + 2ac + b2 2 a c2 + bc + b2 4 . Na tento proces můžeme nahlížet jako na zobrazení T , které transformuje vektor (a, b, c)T . Platí T :   a b c   →   a2 + ab + b2 /4 ab + bc + 2ac + b2 /2 c2 + bc + b2 /4   . Podotkněme, že za definiční obor (a pochopitelně i obor hodnot) T vlastně bereme pouze vektory   a b c   , kde a, b, c ∈ [0, 1], a + b + c = 1. Chtěli bychom zadat operaci T pomocí násobení vektoru (a, b, c)T jistou konstantní maticí. To však očividně není možné (zobrazení T není lineární). Nejedná se tedy o Markovův proces a nelze zjednodušit určování, co se stane po velmi dlouhé době, jako v předešlých případech. Můžeme ale vypočítat, co se stane, když aplikujeme zobrazení T dvakrát po sobě. Ve druhém kroku dostáváme T :   a2 + ab + b2 /4 ab + bc + 2ac + b2 /2 c2 + bc + b2 /4   →   t1 2 t2 2 t3 2   , kde t1 2 = ( a2 + ab + b2 4 )2 + ( a2 + ab + b2 4 ) ( ab + bc + 2ac + b2 2 ) + 1 4 ( ab + bc + 2ac + b2 2 )2 , t2 2 = ( a2 + ab + b2 4 ) ( ab + bc + 2ac + b2 2 ) + + ( ab + bc + 2ac + b2 2 ) ( c2 + bc + b2 4 ) + + 2 ( a2 + ab + b2 4 ) ( c2 + bc + b2 4 ) + 1 2 ( ab + bc + 2ac + b2 2 )2 , t3 2 = ( c2 + bc + b2 4 )2 + ( ab + bc + 2ac + b2 2 ) ( c2 + bc + b2 4 ) + 1 4 ( ab + bc + 2ac + b2 2 )2 . Lze ukázat (využitím a + b + c = 1), že t1 2 = a2 +ab + b2 4 , t2 2 = ab +bc +2ac + b2 2 , t3 2 = c2 +bc + b2 4 , CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET 3.43. Definice. Nechť A je reálná matice typu m/n a nechť A = USV ∗ , S = ( D 0 0 0 ) je její singulární rozklad (zejména D je invertibilní). Matici A(−1) := V S′ U∗ , S′ = ( D−1 0 0 0 ) nazýváme pseudoinverzní matice k matici A. Jak ukazuje následující věta, je pseudoinverze důležité zobecnění pojmu inverzní matice. 3.44. Věta. Nechť A je reálná nebo komplexní matice typu m/n. Pak pro její pseudoinverzní matici platí: (1) Je-li A invertibilní (zejména tedy čtvercová), pak A(−1) = A−1 . (2) pro pseudoinverzi A(−1) platí, že A(−1) A i AA(−1) jsou hermiteovské (v reálném případě) symetrické a AA(−1) A = A, A(−1) AA(−1) = A(−1) . (3) Je-li A matice systému lineárních rovnic Ax = b, s pravou stranou b ∈ Km , pak vektor y = A(−1) b ∈ Kn minimalizuje velikost ∥Ax − b∥ pro všechny vektory x ∈ Kn . Důkaz. (1): Je-li A invertibilní, pak je matice S = U∗ AV také invertibilní a přímo z definice je S′ = S−1 . Odtud vyplývá A(−1) A = AA(−1) = E. (2): Přímým výpočtem dostáváme SS′ S = S a S′ SS′ = S′ , proto AA(−1) A = USV ∗ V S′ U∗ USV ∗ = USS′ SV ∗ = USV ∗ = A a analogicky pro druhou rovnost. Dále (AA(−1) )∗ = (USS′ U∗ )∗ = U(S′ )∗ S∗ U∗ = U(SS′ )∗ U∗ = USS′ U∗ = AA(−1) a podobně se ukáže (A(−1) A)∗ = A(−1) A. (3): Uvažme zobrazení φ : Kn → Km , x → Ax, a přímé součty Kn = (Ker φ)⊥ ⊕ Ker φ, Km = Im φ ⊕ (Im φ)⊥ . Zúžené zobrazení ˜φ := φ|(Ker φ)⊥ : (Ker φ)⊥ → Im φ je lineární isomorfismus. Zvolíme-li vhodně ortonormální báze na (Ker φ)⊥ a Im φ a doplníme je na ortonormální báze na celých prostorech, bude mít φ matici S a ˜φ matici D z věty o singulárním rozkladu. Pro dané b ∈ Km je bod z ∈ Im φ minimalizující vzdálenost ∥b − z∥ (tj. realizující vzdálenost od podprostoru ρ(b, Im φ)) právě komponenta z = b1 rozkladu b = b1 + b2, b1 ∈ Im φ, b2 ∈ (Im φ)⊥ . Přitom ale ve zvolené bázi je zobrazení φ(−1) , původně zadané ve standardních bazích pseudoinverzí A(−1) , dáno maticí S′ z věty o singulárním rozkladu, zejména je φ(−1) (Im φ) = (Ker φ)⊥ a D−1 maticí zúžení φ(−1) | Im φ a φ(−1) |(Im φ)⊥ je nulové. Je tedy skutečně φ ◦ φ(−1) (b) = φ(φ(−1) (z)) = z a důkaz je ukončen. 163 tj. T :   a2 + ab + b2 /4 ab + bc + 2ac + b2 /2 c2 + bc + b2 /4   →   a2 + ab + b2 /4 ab + bc + 2ac + b2 /2 c2 + bc + b2 /4   . Získali jsme tak překvapivý výsledek, že dalším aplikováním transformace T se vektor obdržený v prvním kroku nezmění. To znamená, že výskyt uvažovaných dvojic alel je po libovolně dlouhé době totožný jako v první generaci potomstva. Pro velkou populaci jsme tak dokázali, že evoluční vývoj by se realizoval během jediné generace, kdyby nedocházelo k mutacím nebo k selekci. 3.37. Nechť jsou dány dvě urny, které obsahují dohromady n bílých a n černých koulí. V pravidelných časových intervalech je z obou uren vylosována jedna koule a přemístěna do druhé urny, přičemž počet koulí v obou urnách je na začátku (a tedy po celou dobu) právě n. Zadejte tento Markovův proces pravděpodobnostní maticí přechodu T . Řešení. Tento příklad se používá ve fyzice jako model prolínání dvou nestlačitelných kapalin (již v roce 1769 ho zavedl D. Bernoulli) nebo analogicky jako model difúze plynů. Stavy 0, 1, . . . , n budou odpovídat kupř. počtu bílých koulí v jedné pevně zvolené urně. Tento údaj totiž současně zadává, kolik černých koulí je ve zvolené urně (všechny ostatní koule jsou pak ve druhé z uren). Pokud v jistém kroku dojde ke změně stavu j ∈ {1, . . . , n} na j − 1, znamená to, že ze zvolené urny byla vytažena bílá koule a z druhé černá. To se stane s pravděpodob- ností j n · j n = j2 n2 . Přechodu ze stavu j ∈ {0, . . . , n−1} do j +1 odpovídá vytažení černé koule ze zvolené urny a bílé z té druhé s pravděpodobností n − j n · n − j n = (n − j)2 n2 . Soustava zůstane ve stavu j ∈ {1, . . . , n−1}, jestliže z obou uren byly vytaženy koule stejné barvy, což má pravděpodobnost j n · n − j n + n − j n · j n = 2j (n − j) n2 . Dodejme, že ze stavu 0 se nutně (s pravděpodobností 1) přechází do stavu 1 a že ze stavu n se s jistotou přechází do stavu n − 1. Uvážením výše uvedeného dostáváme hledanou matici T = 1 n2                0 1 0 · · · 0 0 0 n2 2 · 1(n − 1) 22 ... 0 0 0 0 (n − 1)2 2 · 2(n − 2) ... 0 0 0 ... ... ... ... ... ... ... 0 0 0 ... 2 · (n − 2)2 (n − 1)2 0 0 0 0 ... 22 2 · (n − 1)1 n2 0 0 0 · · · 0 1 0                5. ROZKLADY MATIC A PSEUDOINVERZE Lze také ukázat, že matice A(−1) minimalizuje výraz ∥AA(−1) − E∥2 tj. součet kvadrátů všech prvků uvedené matice. 3.45. Lineární regrese. Aproximační vlastnost (3) předchozí věty je velice užitečná v případech, kdy máme najít co nejlepší přiblížení (neexistujícího) řešení přeurčeného systému Ax = b, kde A je reálná matice typu m/n a m je větší než n. Např. máme experimentem dáno mnoho naměřených reálných hodnot bj a chceme najít lineární kombinaci několika funkcí fi, která bude co nejlépe aproximovat hodnoty bj . Skutečné hodnoty zvolených funkcí v bodech yj ∈ R zadají matici aij = fj (yi), jejíž sloupce jsou dány hodnotami jednotlivých funkcí fj v uvažovaných bodech, a naším úkolem je tedy určit koeficienty xj ∈ R tak, aby součet kvadrátů odchylek od skutečných hodnot m∑ i=1 (bi − ( n∑ j=1 xj fj (yi)))2 = m∑ i=1 (bi − ( n∑ j=1 aij xj ))2 byla minimální. Jinými slovy, hledáme lineární kombinaci funkcí fi takovou, abychom „dobře“ proložili zadané hodnoty bi. Díky předchozí větě jsou hledané optimální koeficienty A(−1) b. Abychom měli konkrétnější představu, uvažujme pouze dvě funkce f1(x) = x, f2(x) = x2 a předpokládejme, že „naměřené hodnoty“ jejich neznámé kombinace g(x) = y1x +y2x2 v celočíselných hodnotách pro x mezi 1 a 10 jsou bT = (1.44 10.64 4.48 14.56 31.12 39.20 54.88 71.28 85.92 104.16). Tento vektor vzniknul výpočtem hodnot x + x2 v daných bodech posunutých o náhodné hodnoty v rozmezí ±8. Matice A = (bij ) je tedy v našem případě rovna AT = ( 1 2 3 4 5 6 7 8 9 10 1 4 9 16 25 36 49 64 81 100 ) a hledané koeficienty v kombinaci jsou y = A(−1) · b = ( 0.61 0.99 ) . Výsledné proložení je možné dobře vidět na obrázku, kde zeleně jsou proloženy zadané hodnoty b lomenou čarou, zatímco červený je graf příslušné kombinace g. Výpočty byly provedeny v systému Maple pomocí příkazu leastsqrs(B,b). Pokud jste s Maplem (nebo jiným podobným softwarem) spřáteleni, zkuste si zaexperimentovat s podobnými úlohami. 164 2. MARKOVOVY PROCESY pro pořadí stavů 0, 1, . . . , n. Při užití tohoto modelu ve fyzice nás samozřejmě zajímá složení uren po uplynutí určité doby (po daném počtu výměn v závislosti na předešlém složení uren). Bude-li počáteční stav např. 0, můžeme pomocí mocnin matice T sledovat, s jakou pravděpodobností přibývají ve zvolené urně bílé koule. Také lze potvrdit očekávaný výsledek, že počáteční rozdělení koulí bude ovlivňovat jejich rozdělení po delší době zanedbatelným způsobem. Kdybychom jednotlivé koule očíslovali, místo výběru po jedné kouli z uren vylosovali nějaké z čísel 1, 2, . . . , 2n a kouli, jejíž číslo bylo vytaženo, přemístili do druhé urny, obdrželi bychom Markovův proces se stavy 0, 1, . . . , 2n (počet koulí ve zvolené urně), kdy se tak už nerozlišuje barva koulí. Tento Markovův řetězec je rovněž ve fyzice důležitý. (P. a T. Ehrenfestovi jej zavedli v roce 1907.) Používá se jako model výměny tepla mezi dvěma izolovanými tělesy (teplota je reprezentována počtem koulí, tělesa urnami). 3.38. Nechť n ∈ N osob hraje tzv. tichou poštu. Pro jednoduchost předpokládejte, že první osoba zašeptá druhé právě jedno (libovolně zvolené) ze slov „ano“, „ne“. Druhá osoba pak potichu řekne třetí osobě to ze slov „ano“, „ne“, o kterém si myslí, že ho řekla první osoba. Takto to pokračuje až k n-té osobě. Jestliže pravděpodobnost toho, že při libovolném předání se zamění (nechtě, úmyslně) šířené slovo na to druhé, je p ∈ (0, 1), stanovte pro velká n ∈ N pravděpodobnost, že n-tá osoba určí správně slovo zvolené první osobou. Řešení. Na tuto úlohu lze nahlížet jako na Markovův řetězec se dvěma stavy nazvanými Ano a Ne, kdy řekneme, že proces je ve stavu Ano v čase m ∈ N, pokud si m-tá osoba bude myslet, že předávané slovo je „ano“. Pro pořadí stavů Ano, Ne je pravděpodobnostní matice pře- chodu T = ( 1 − p p p 1 − p ) . Součin matice T m−1 a pravděpodobnostního vektoru počáteční volby první osoby potom udává pravděpodobnosti toho, co si bude myslet mtá osoba. Mocniny této matice ovšem počítat nemusíme, neboť všechny prvky matice T jsou kladná čísla. Navíc tato matice je dvojnásobně stochastická. Víme tudíž, že pro velká n ∈ N bude pravděpodobnostní vektor blízký vektoru (1/2, 1/2)T . Pravděpodobnost, že n-tá osoba řekne „ano“, je proto přibližně stejná jako pravděpodobnost, že řekne „ne“, a to nezávisle na tom, pro které slovo se rozhodla první osoba. Pro velký počet zúčastněných tak platí, že zhruba polovina z nich uslyší „ano“ (zopakujme, že nezávisle na tom, které slovo bylo na začátku vybráno). CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET 6420 100 80 60 x 40 20 10 0 8 165 Pro úplnost zjistěme, jak by úloha dopadla, kdybychom předpokládali, že pravděpodobnost záměny „ano“ na „ne“ je u libovolné osoby p ∈ (0, 1) a pravděpodobnost záměny „ne“ na „ano“ je obecně odlišné q ∈ (0, 1). V tomto případě pro stejné pořadí stavů dostáváme pravděpodobnostní matici přechodu T = ( 1 − p q p 1 − q ) , která vede (pro velká n ∈ N) k pravděpodobnostnímu vektoru blízkému vektoru ( q p + q , p p + q )T , což kupř. plyne z vyjádření matice T n = 1 p + q [( q q p p ) + (1 − p − q)n ( p −q −p q )] . Rovněž tentokrát při dostatečném počtu lidí nezáleželo na volbě slova, kterou učinila první osoba. Stručně řečeno, v tomto modelu platí, že nezáleží na původním rozhodnutí, protože o tom, jakou informaci si lidé předávají, rozhodují oni sami; přesněji řečeno, lidé sami rozhodují o četnosti výskytu „ano“ a „ne“, pokud je jich dostatečný počet (a chybí-li jakékoli ověřování). Doplňme ještě, že výše uvedený závěr byl experimentálně ověřen. V psychologických pokusech byl mj. jedinec opakovaně vystaven vjemu, který šlo vnímat dvěma různými způsoby, a to v časových intervalech zaručujících, aby si subjekt pamatoval předešlý vjem. Viz např. „T. Havránek a kol.: Matematika pro biologické a lékařské vědy, Praha, Academia 1981“, kde je uveden experiment, v němž je zábleskem osvětlován v pevných časových odstupech nejednoznačný obraz (třeba náčrt krychle vnímatelný jako nadhled i podhled). Takový proces je totiž Markovovým řetězcem s maticí přechodu ( 1 − p q p 1 − q ) , kde p, q ∈ (0, 1). 3.39. V jisté hře si můžete vybrat jednoho ze dvou soupeřů. Pravděpodobnost, že porazíte lepšího, je 1/4, zatímco horšího ze soupeřů porazíte s pravděpodobností 1/2. Soupeři ale nejsou rozlišeni, a tak nevíte, který z nich je ten lepší. Čeká Vás velké množství her (pro každou můžete zvolit jiného soupeře) a samozřejmě chcete dosáhnout celkově co největšího podílu vítězných her. Uvažte tyto dvě strategie: 1. Pro první hru si vyberete soupeře náhodně. Pokud nějakou hru vyhrajete, pokračujete se stejným soupeřem; jestliže ji prohrajete, změníte pro další hru soupeře. 2. Pro první dvě hry si vyberete (jednoho) soupeře náhodně. Dále se řídíte výsledkem předchozích dvou her, kdy na další 5. ROZKLADY MATIC A PSEUDOINVERZE 166 2. MARKOVOVY PROCESY dvě hry změníte soupeře, právě když obě předchozí prohra- jete. Kterou ze strategií (moudře) zvolíte? Řešení. Obě strategie jsou vlastně Markovovým řetězcem. Pro jednoduchost horšího ze soupeřů označujme jako osobu A a lepšího ze soupeřů jako osobu B. V prvním případě pro stavy „hra s osobou A“, „hra s osobou B“ (a toto jejich pořadí) dostáváme pravděpodobnostní matici přechodu ( 1/2 3/4 1/2 1/4 ) . Tato matice má všechny prvky kladné, a proto stačí najít pravděpodobnostní vektor x∞, který přísluší vlastnímu číslu 1. Platí x∞ = ( 3 5 , 2 5 )T . Jeho složky odpovídají pravděpodobnostem, že po dlouhé řadě her bude soupeřem osoba A, resp. B. Lze tedy očekávat, že 60 % her bude hráno proti horšímu ze soupeřů. Neboť 2 5 = 3 5 · 1 2 + 2 5 · 1 4 , vítězných her bude kolem 40 %. Pro druhou strategii zaveďme stavy „dvě hry po sobě s osobou A“ a „dvě hry po sobě s osobou B“, které vedou na pravděpodobnostní matici přechodu ( 3/4 9/16 1/4 7/16 ) . Snadno určíme, že nyní je x∞ = ( 9 13 , 4 13 )T . Proti horšímu ze soupeřů by se tak hrálo (9/4)krát častěji než proti lepšímu z nich. Připomeňme, že pro první strategii to bylo (3/2)krát častěji. Druhá strategie je proto výhodnější. Ještě poznamenejme, že při druhé strategii bude přibližně 42,3 % her vítězných. Stačí totiž vy- číslit 0, 423 . = 11 26 = 9 13 · 1 2 + 4 13 · 1 4 . 3.40. Petr se pravidelně setkává se svým kamarádem. Je ovšem „proslulý“ svou nedochvilností. Snaží se ale změnit, a proto platí, že v polovině případů přijde včas a v jedné desetině případů dokonce ještě dříve, pokud na minulé setkání přišel pozdě. Jestliže minule přišel včas nebo dříve, než měl přijít, vrátí se ke své „bezstarostnosti“ a s pravděpodobností 0,8 dorazí pozdě a pouze s pravděpodobností 0,2 včas. Jaké je pravděpodobnost, že na dvacáté setkání přijde pozdě, když na jedenácté přišel včas? CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET 167 Řešení. Zřejmě se jedná o Markovův proces se stavy „Petr přijde pozdě“, „Petr přijde včas“, „Petr přijde dříve“ a s pravděpodobnostní maticí přechodu (pro uvedené pořadí stavů) T =   0, 4 0, 8 0, 8 0, 5 0, 2 0, 2 0, 1 0 0   . Jedenácté setkání je určeno pravděpodobnostním vektorem (0, 1, 0)T (s jistotou víme, že Petr přišel včas). Dvacátému setkání pak odpovídá pravděpodobnostní vektor T 9 ·   0 1 0   =   0, 571 578 368 0, 371 316 224 0, 057 105 408   . Hledaná pravděpodobnost je tudíž 0, 571 578 368 (přesně). Dodejme, že je T 9 =   0, 571 316 224 0, 571 578 368 0, 571 578 368 0, 371 512 832 0, 371 316 224 0, 371 316 224 0, 057 170 944 0, 057 105 408 0, 057 105 408   . Odtud vidíme, jak málo záleží na tom, zda přišel na jedenácté setkáni pozdě (první sloupec), včas nebo dříve (druhý a současně třetí sloupec). 3.41. Dva studenti A a B tráví každé pondělní odpoledne hraním jisté počítačové hry o to, kdo z nich večer zaplatí společnou útratu v restauraci. Hra může rovněž skončit remízou, kdy večer oba platí právě polovinu útraty. Výsledek předešlé hry částečně ovlivňuje hru následující. Pokud tedy před týdnem vyhrál student A, potom s pravděpodobností 3/4 vyhraje opět a s pravděpodobností 1/4 skončí hra remízou. Remíza se opakuje s pravděpodobností 2/3 a s pravděpodobností 1/3 vyhraje ve hře následující po remíze student B. Pokud před týdnem vyhrál student B, pak s pravděpodobností 1/2 své vítězství zopakuje a s pravděpodobností 1/4 vyhraje student A. Nalezněte pravděpodobnost, že dnes bude každý platit polovinu útraty, jestliže první hru před velmi dlouhou dobou vyhrál student A. Řešení. Vlastně je zadán Markovův proces se stavy „vyhraje student A“, „hra skončí remízou“, „vyhraje student B“ (v tomto pořadí) pravděpodobnostní maticí přechodu T =   3/4 0 1/4 1/4 2/3 1/4 0 1/3 1/2   . Chceme najít pravděpodobnost přechodu z prvního stavu do druhého po velkém počtu n ∈ N kroků (týdnů). Matice T je regulární, protože T 2 =   9/16 1/12 5/16 17/48 19/36 17/48 1/12 7/18 1/3   . 5. ROZKLADY MATIC A PSEUDOINVERZE 168 2. MARKOVOVY PROCESY Stačí tak najít vlastní pravděpodobnostní vektor x∞ matice T příslušný vlastnímu číslu 1. Snadno lze spočítat, že x∞ = ( 2 7 , 3 7 , 2 7 )T . Víme, že vektor x∞ se jen velmi málo liší od pravděpodobnostního vektoru pro velká n a téměř nezávisí na počátečním stavu, tj. pro velká n ∈ N můžeme klást T n ≈   2/7 2/7 2/7 3/7 3/7 3/7 2/7 2/7 2/7   . Hledaná pravděpodobnost je prvkem této matice na druhé pozici v prvním sloupci (je druhou složkou vektoru x∞). Poměrně rychle jsme nalezli výsledek 3/7. 3.42. Které z matic A = ( 0 1/7 1 6/7 ) , B =   1/2 0 1/3 0 1 1/2 1/2 0 1/6   , C =   0 1 0 1/4 0 1/2 3/4 0 1/2   , D =     1/3 1/2 0 0 1/2 1/3 0 0 0 1/6 1/6 1/3 1/6 0 5/6 2/3     , E =     0 1 0 0 0 0 0 1 1 0 0 0 0 0 1 0     jsou regulární? Řešení. Neboť A2 = ( 1/7 6/49 6/7 43/49 ) , C3 =   3/8 1/4 1/4 1/4 3/8 1/4 3/8 3/8 1/2   , matice A a C jsou regulární; a neboť   1/2 0 1/3 0 1 1/2 1/2 0 1/6   ·   0 1 0   =   0 1 0   , bude prostřední sloupec matice Bn vždy (pro n ∈ N) vektorem (0, 1, 0)T , tj. matice B nemůže být regulární. Součin     1/3 1/2 0 0 1/2 1/3 0 0 0 1/6 1/6 1/3 1/6 0 5/6 2/3     ·     0 0 a b     =     0 0 a/6 + b/3 5a/6 + 2b/3     , a, b ∈ R implikuje, že matice D2 bude mít v pravém horním rohu nulovou dvourozměrnou (čtvercovou) submatici. Opakováním této implikace dostáváme, že stejnou vlastnost mají matice D3 = D · D2 , D4 = D · D3 , . . . , Dn = D · Dn−1 , . . . , tudíž matice D není regulární. Matice E je permutační (v každém řádku a sloupci má právě jeden nenulový prvek, a to 1). Není obtížné si uvědomit, že mocniny permutační matice jsou opět permutační matice. Matice E proto také není regulární. To lze rovněž ověřit výpočtem mocnin E2 , E3 , E4 . Matice E4 je totiž jednotková. CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET 169 3.43. Dva hráči A, B hrají o peníze opakovaně jistou hru, která může skončit pouze vítězstvím jednoho z hráčů. Pravděpodobnost výhry hráče A je v každé jednotlivé hře p ∈ [0, 1/2) a oba sází vždy (v libovolné hře) jen 1 Kč, tj. po každé hře s pravděpodobností p dá 1 Kč hráč B hráči A a s pravděpodobností 1−p naopak 1 Kč dá hráč A hráči B. Hrají ovšem tak dlouho, dokud jeden z nich nepřijde o všechny peníze. Jestliže má hráč A na začátku x Kč a hráč B má y Kč, určete pravděpodobnost, že hráč A vše prohraje. Řešení. Tato úloha se nazývá Ruinování hráče. Jedná se o speciální Markovův řetězec (viz také příklad Mlsný hazardér) s mnoha důležitými aplikacemi. Hledaná pravděpodobnost činí (3.8) 1 − ( p 1−p )y 1 − ( p 1−p )x+y . Povšimněme si, jaká je tato hodnota pro konkrétní volby p, x, y. Kdyby hráč B chtěl mít téměř jistotu a požadoval, aby pravděpodobnost, že hráč A s ním prohraje 1 000 000 Kč, byla alespoň 0,999, potom stačí, aby měl 346 Kč, je-li p = 0, 495 (či 1 727 Kč, je-li p = 0, 499). Proto je ve velkých kasinech možné, aby „vášniví“ hráči mohli hrát téměř spravedlivé hry. 3.44. V rámci jisté společnosti fungují dvě navzájem si konkurující oddělení. Vedení společnosti se rozhodlo, že každý týden bude poměřovat relativní (vzhledem k počtu zaměstnanců) zisky dosažené těmito dvěma odděleními. Do oddělení, které bude úspěšnější, pak budou přeřazeni dva pracovníci z druhého oddělení. Tento proces má probíhat tak dlouho, až jedno z oddělení zanikne. Získali jste zaměstnání v této společnosti a můžete si vybrat jedno z těchto dvou oddělení, kde budete pracovat. Chcete si zvolit to, které nebude v důsledku vnitropodnikové konkurence zrušeno. Jaká bude Vaše volba, když jedno oddělení má nyní 40 zaměstnanců, druhé 10 a když odhadujete, že to v současnosti menší z nich bude mít větší relativní zisky v 54 % pří- padů? 3.45. Student na koleji je značně společensky unaven (v důsledku toho není schopen plně vnímat smyslové podněty a koordinovat své pohyby). V tomto stavu se přesto rozhodne, že na právě probíhající večírek pozve známou, která má pokoj na jednom konci chodby. Na opačném konci chodby však bydlí někdo, koho pozvat rozhodně nehodlá. Je ovšem natolik „unaven“, že rozhodnutí udělat krok zvoleným směrem se mu podaří realizovat pouze v 53 ze 100 pokusů (ve zbylých 47 jde přesně na opačnou stranu). Za předpokladů, že vyjde v polovině chodby a že vzdálenost k oběma dveřím na koncích chodby 5. ROZKLADY MATIC A PSEUDOINVERZE 170 2. MARKOVOVY PROCESY odpovídá jeho 20 krokům, stanovte pravděpodobnost, že nejdříve dorazí ke správným dveřím. 3.46. Vyvraťte nebo dokažte: • Nechť A je čtvercová matice n × n. Pak je matice AT A je symetrická. • Nechť čtvercová matice A má pouze kladné reálné vlastní hodnoty. Pak je A symetrická. 3.47. Nalezněte LU-rozklad následující matice:   −2 1 0 −4 4 2 −6 1 −1   Řešení.   1 0 0 2 1 0 3 −1 1     −2 1 0 0 2 2 0 0 1   Nejprve vynásobíme matice odpovídající Gaussově eliminaci, dostáváme tak pro původní matici A, XA = U, kde X je dolní trojúhelníková daná zmíněným součinem, U horní trojúhelníková. Z této rovnosti máme A = X−1 U, což je hledaný rozklad (musíme tedy spočítat inverzi k X). 3.48. Nalezněte LU-rozklad matice   1 1 0 1 −1 2 − 1 −1  . CHAPTER 3. LINÁRNÍ MODELY A MATICOVÝ POČET 171 Řešení cvičení 3.9. xn = 1 √ 21 ( 3 + √ 21 2 )n − 1 √ 21 ( 3 − √ 21 2 )n . 3.10. xn = 2 √ 3 sin(n · (π/6)) − 4 cos(n · (π/6)). 3.11. xn = −3(−1)n − 2 cos(n · (2π/3)) − 2 √ 3 sin(n · ((2π/3)). 3.12. xn = (−1)n(−2n2 + 8n − 7). 3.17. Leslieho matice daného modelu je (úmrtnost v první skupině označíme a)   0 2 2 a 0 0 0 1 0   . Podmínka stagnace populace odpovídá tomu, že matice má vlastní hodnotu 1, neboli polynom λ3 − 2aλ − 2a má mít kořen 1, t.j a = 1/4. 3.21. (5 6 1 5 1 6 4 5 ) . Matice má dominantní vlastní hodnotu 1, příslušný vlastní vektor je (6 5 , 1). Protože je vlastní hodnota dominantní, tak se poměr diváků se ustálí na poměru 6 : 5. 3.28. Stejně jako v (3.27) skončí hra po třech sázkách. Jsou tedy opět všechny mocniny A, počínaje A3 shodné. A100 = A3 =       1 7/8 3/4 1/2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1/8 1/4 1/2 1       3.44. Můžeme využít výsledku úlohy označované jako Ruinování hráče. Pravděpodobnost, že zanikne to oddělení, které má nyní 40 zaměstnanců, je podle tohoto příkladu rovna 1 − ( 0,46 1−0,46 )5 1 − ( 0,46 1−0,46 )25 . = 0, 56. Stačilo dosadit p = 1 − 0, 54, y = 10/2 a x = 40/2 do (3.8). Prozíravější je tedy zvolit v tuto chvíli menší oddělení. 3.45. Znovu se jedná o speciální případ Ruinování hráče. Stačí zadání vhodně přeformulovat. Pro p = 0, 47, y = 20 a x = 20 z (3.8) plyne výsledek 0, 917 . = 1 − ( 0,47 1−0,47 )20 1 − ( 0,47 1−0,47 )40 . 3.46. • Tvrzení je pravdivé. (B := AT A, bij = (i-tý řádek AT ) · (j-tý sloupec A)= bji = (j-tý řádek AT ) · (i-tý sloupec A)=(j-tý sloupec A) · (i-tý řádek AT ) • Tvrzení zřejmě neplatí. Uvažte např. A = ( 1 1 0 1 ) 3.48.   1 0 0 1 −2 0 0 1 1     1 1 0 0 1 −1 0 0 0   KAPITOLA 4 Analytická geometrie poloha, incidence, projekce? – a zase skončíme u matic... Vrátíme se teď k úlohám elementární geometrie z podobného pohledu, jako když jsme zkoumali polohy bodů v rovině v 5. části první kapitoly, viz 1.23. Budeme se nejprve zajímat o vlastnosti objektů vymezených pomocí bodů, přímek, rovin apod. Podstatné přitom bude vyjasnění, které vlastnosti závisí či nezávisí na pojmu velikosti vektorů. V další části pak použijeme lineární algebru pro studium objektů, které už lineárně definované nejsou. Opět přitom budeme potřebovat trochu více maticového počtu. Výsledky budou naprosto zásadní později při diskusi technik pro optimalizace, tj. hledání extrémů funčkních hodnot. Projektivní rozšíření afinních prostorů nám v závěru kapitoly ukáže, jak lze překvapivě dosáhnout zjednodušení i stability algoritmických postupů typických pro práci s počítačovou grafikou. 1. Afinní a euklideovská geometrie Když jsme si ujasňovali dopady obecné teorie na systémy rovnic v první části předchozí kapitoly, zjistili jsme v ostavci 3.1, že všechna řešení nehomogenních systémů rovnic sice netvoří vektorové podprostory, vždy ale vznikají tak, že k jednomu jedinému řešení přičteme celý vektorový prostor řešení příslušné homogenní soustavy. Naopak, rozdíl dvou řešení nehomogenní soustavy je vždy řešením homogenní. Obdobně se chovají lineární difereční rovnice, jak jsme viděli již v odstavci 3.11. Návod na teoretické uchopení takové situace dává již diskuse geometrie roviny, viz odstavec 1.25 a dále. Tam jsme totiž popisovali přímky a body jako množiny řešení systémů lineárních rovnic. Přímka pro nás pak byla „jednorozměrným“ prostorem, přestože její body byly popisovány dvěmi souřadnicemi. Parametricky jsme ji zadávali tak, že k jednomu bodu (tj. dvojici souřadnic) jsme přičítali násobky pevně zvoleného směrového vektoru. Stejně budeme postupovat i teď v libovolné dimenzi. Standardní afinní prostor 4.1. Afinní prostory. Standarní afinní prostor An je množina všech bodů v Rn = An spolu s operací, kterou k bodu A = (a1, . . . , an) ∈ An a vektoru 172 KAPITOLA 4 Analytická geometrie 1. Afinní geometrie 4.1. Napište parametrické vyjádření přímky určené rovnicemi x − 2y + z = 2, 2x + y − z = 5 v R3 . Řešení. Zřejmě postačuje vyřešit uvedenou soustavu rovnic. Můžeme ale postupovat také odlišně. Potřebujeme totiž najít nenulový (směrový) vektor, který bude kolmý na (normálové) vektory (1, −2, 1), (2, 1, −1). Vektorový součin (1, −2, 1) × (2, 1, −1) = (1, 3, 5) ovšem takový vektor dává. Všimneme-li si, že např. uspořádaná trojice (x, y, z) = (2, −1, −2) vyhovuje dané soustavě, dostaneme výsledek [2, −1, −2] + t (1, 3, 5) , t ∈ R. 4.2. Rovinu ϱ : [0, 3, 2, 5] + t (1, 0, 1, 0) + s (2, −1, −2, 2) , t, s ∈ R ve čtyřrozměrném euklidovském prostoru zadejte implicitně. Řešení. Úkolem je najít soustavu lineárních rovnic čtyř proměnných x, y, z, u (čtyři proměnné jsou dány dimenzí prostoru), jíž budou vyhovovat právě souřadnice bodů uvedené roviny. Poznamenejme, že hledaná soustava bude obsahovat 2 = 4−2 lineárně nezávislé rovnice. Příklad vyřešíme tzv. eliminací parametrů. Body [x, y, z, u] ∈ ϱ splňují x = t + 2s, y = 3 − s, z = 2 + t − 2s, u = 5 + 2s, přičemž t, s ∈ R. Odtud můžeme ihned přejít k maticovému zápisu     1 2 −1 0 0 0 0 0 −1 0 −1 0 0 3 1 −2 0 0 −1 0 2 0 2 0 0 0 −1 5     , CHAPTER 4. ANALYTICKÁ GEOMETRIE v = (v1, . . . , vn) ∈ Rn = V přiřadíme bod A + v = (a1 + v1, . . . , an + vn) ∈ Rn = An. Tyto operace splňují následující tři vlastnosti: (1) A + 0 = A pro všechny body A ∈ An a nulový vektor 0 ∈ V (2) A+(v+w) = (A+v)+w pro všechny vektory v, w ∈ V , A ∈ An (3) pro každé dva body A, B ∈ An existuje právě jeden vektor v ∈ V takový, že A + v = B. Značíme jej B − A, někdy také ⃗AB. Vektorový prostor Rn nazýváme zaměření afinního prostoru An. Všimněme si několika formálních nebezpečí. Používáme stejný symbol „+“ pro dvě různé operace: přičtení vektoru ze zaměření k bodu v afinním prostoru, ale také sčítání vektorů v zaměření V = Rn . Také nezavádíme zvláštní písmena pro samotnou množinu bodů afinního prostoru, tj. An pro nás představuje jak samotnou množinu bodů, tak i celou strukturu definující afinní prostor. Proč vlastně chceme rozlišovat množinu bodů prostoru An od jeho zaměření V , když se jedná jakoby o stejné Rn ? Jde o velice podstatný formální krok k pochopení geometrie v Rn : Geometrické objekty jako přímky, body, roviny apod. nejsou totiž přímo závislé na vektorové struktuře na množině Rn a už vůbec ne na tom, že pracujeme s n–ticemi skalárů. Potřebujeme jen umět říci, co to znamená pohybovat se „rovně v daném směru“. K tomu právě potřebujeme na jedné straně vnímat třeba rovinu jako neohraničenou desku bez zvolených souřadnic, ale s možností posunout se o zadaný vektor. Když přejdeme navíc k takovému abstraktnímu pohledu, budeme umět diskutovat „rovinnou geometrii“ pro dvourozměrné podprostory, tj. roviny ve vícerozměrných prostorech, „prostorovou“ pro třírozměrné atd., aniž bychom museli přímo manipulovat k–ticemi souřadnic. Tento pohled je zachycen v následující definici: 4.2. Definice. Afinním prostorem A se zaměřením V rozumíme množinu bodů P, spolu se zobrazením P × V → P, (A, v) → A + v, splňujícím vlastnosti (1)–(3) výše. Pro libovolný pevně zvolený vektor v ∈ V je tak definováno posunutí τv : A → A jako zúžené zobrazení τv : P ≃ P × {v} → P, A → A + v. Dimenzí afinního prostoru A rozumíme dimenzi jeho za- měření. Nadále nebudeme rozlišovat A a P v označení. 173 kde první dva sloupce jsou směrové vektory roviny, za svislou čarou následuje záporně vzatá jednotková matice a za druhou svislou čarou jsou souřadnice bodu [0, 3, 2, 5]. Tento přepis vzniká tak, že na výše uvedenou soustavu rovnic nahlížíme jako na soustavu rovnic pro neznámé t, s, x, y, z, u a všechny členy přitom převádíme na jednu stranu rovnic. Získanou matici převedeme pomocí elementárních řádkových transformací do tvaru, kdy před první svislou čarou bude maximální možný počet nulových řádků. Přičtením (−1)násobku prvního a současně (−4)násobku druhého řádku ke třetímu řádku a dvojnásobku druhého ke čtvrtému řádku dostáváme     1 2 −1 0 0 0 0 0 −1 0 −1 0 0 3 1 −2 0 0 −1 0 2 0 2 0 0 0 −1 5     ∼ ∼     1 2 −1 0 0 0 0 0 −1 0 −1 0 0 3 0 0 1 4 −1 0 −10 0 0 0 −2 0 −1 11     . Odkud plyne výsledek x + 4y − z − 10 = 0, −2y − u + 11 = 0. Koeficienty za první svislou čarou v řádcích, které jsou před touto svislou čarou nulové, určují totiž koeficienty obecných rovnic roviny. Upozorněme, že kdybychom např. přepsali soustavu rovnic do matice     1 0 0 0 1 2 0 0 1 0 0 0 −1 3 0 0 1 0 1 −2 2 0 0 0 1 0 2 5     , která odpovídá situaci, kdy proměnné x, y, z, u zůstávají na levé straně rovnic, totožná úprava     1 0 0 0 1 2 0 0 1 0 0 0 −1 3 0 0 1 0 1 −2 2 0 0 0 1 0 2 5     ∼     1 0 0 0 1 2 0 0 1 0 0 0 −1 3 −1 −4 1 0 0 0 −10 0 2 0 1 0 0 11     dává výsledek ve tvaru −x − 4y + z = −10, 2y + u = 11. Jinak řečeno, při přepisování soustavy do matice je nutné zohledňovat, zda svislá čára odděluje levou stranu rovnic od pravé (či nikoliv). Nabízí se, že metoda eliminace parametrů může být zdlouhavá a že se při jejím použití lze snadno dopustit chyb(y). V tomto příkladu jsme přitom hledali pouze dva lineárně nezávislé normálové vektory, tj. vektory kolmé na vektory (1, 0, 1, 0), (2, −1, −2, 2). Pokud bychom si 1. AFINNÍ A EUKLIDEOVSKÁ GEOMETRIE Z axiomů okamžitě plyne pro libovolné body A, B, C v afinním prostoru A A − A = 0 ∈ V(4) B − A = −(A − B)(5) (C − B) + (B − A) = (C − A).(6) Skutečně, (4) vyplývá z toho, že A + 0 = 0 a takový vektor musí být jednoznačný (první a třetí definiční vlastnost). Postupným přičtením B − A a A − B k A (v uvedeném pořadí), zjevně dostaneme podle druhé definiční vlastnosti opět A, tedy jsme přičetli nulový vektor a to dokazuje (5). Obdobně z platnosti (2) a jednoznačnosti vyplývá (6). Všimněme si, že volba jednoho pevného bodu A0 ∈ A nám určuje bijekci mezi V a A. Při volbě pevné báze u ve V tak dostáváme pro každý bod A ∈ A jednoznačné vyjádření A = A0 + x1u1 + · · · + xnun. Hovoříme o afinní soustavě souřadnic (A0; u1, . . . , un) zadané počátkem afinní souřadné soustavy A0 a bazí zaměření u. Hovoříme také o afinním repéru (A0, u). Slovy můžeme shrnout situaci takto: Afinní souřadnice bodu A v soustavě (A0, u) jsou souřadnicemi vektoru A−A0 v bázi u zaměření V . Volba afinního souřadného systému ztotožňuje nrozměrný afinní prostor A se standardním afinním prostorem An. 4.3. Afinní podprostory. Jestliže si vybereme v A jen body, které budou mít některé předem vybrané souřadnice nulové (třeba poslední jednu). Dostaneme opět množinu, která se bude chovat jako afinní prostor. Takto budeme skutečně parametricky popisovat tzv. afinní podprostory ve smyslu následující definice. Definice. Neprázdná podmnožina Q ⊂ A afinního prostoru A se zaměřením V se nazývá afinní podprostor v A, je-li podmnožina W = {B − A; A, B ∈ Q} ⊂ V vektorovým podprostorem a pro libovolné A ∈ Q, v ∈ W je A + v ∈ Q. Je podstatné mít obě podmínky zahrnuty v definici, protože je snadné najít příklady podmnožin, které budou splňovat první, ale nikoliv druhou. Přemýšlejte např. o přímce v rovině s vyjmutým jedním bodem. Pro libovolnou množinu bodů M ⊂ A v afinním prostoru se zaměřením V definujeme vektorový podprostor Z(M) = ⟨{B − A; B, A ∈ M}⟩ ⊂ V všech vektorů generovaných rozdíly bodů z M. Zejména je V = Z(A) a každý afinní podprostor Q ⊂ A splňuje sám axiomy afinního prostoru se zaměřením Z(Q). Přímo z definic je také zřejmé, že průnik libovolné množiny afinních podprostorů je buď opět afinní podprostor nebo prázdná množina. Afinní podprostor ⟨M⟩ v A generovaný neprázdnou podmnožinou M ⊂ A je průnikem všech afinních podprostorů, které obsahují všechny body podmnožiny M. 174 1. AFINNÍ GEOMETRIE uvědomili, že takovými vektory jsou např. (0, 2, 0, 1), (−1, 0, 1, 2), dosazením x = 0, y = 3, z = 2, u = 5 do rovnic 2y + u = a, −x + z + 2u = b bychom obdrželi a = 11, b = 12, následně hledané implicitní vyjá- dření 2y + u = 11, −x + z + 2u = 12. 4.3. Nalezněte parametrické vyjádření roviny procházející body A = [2, 1, 1], B = [3, 4, 5], C = [4, −2, 3]. Poté parametricky vyjádřete otevřenou polorovinu obsahující bod C a vymezenou přímkou zadanou body A, B. Řešení. K parametrickému vyjádření roviny potřebujeme jeden bod ležící v této rovině a dva směrové (lineárně nezávislé) vektory. Stačí zvolit bod A a vektory B − A = (1, 3, 4) a C − A = (2, −3, 2), které jsou očividně lineárně nezávislé. Bod [x, y, z] náleží do dané roviny právě tehdy, když existují čísla t, s ∈ R, pro která je x = 2 + 1 · t + 2 · s, y = 1 + 3 · t − 3 · s, z = 1 + 4 · t + 2 · s; tj. hledané parametrické vyjádření roviny je [2, 1, 1] + t (1, 3, 4) + s (2, −3, 2) , t, s ∈ R. Volba s = 0 zjevně dává přímku, která prochází body A, B. Pro t = 0, s ≥ 0 dostáváme polopřímku začínající v bodě A a procházející bodem C. Libovolně pevně zvolené t ∈ R a měnné s ≥ 0 pak zadávají polopřímku s počátkem na hraniční přímce a s body v polorovině, ve které se nachází bod C. To znamená, že hledanou otevřenou polorovinu můžeme vyjádřit parametricky takto [2, 1, 1] + t (1, 3, 4) + s (2, −3, 2) , t ∈ R, s > 0. 4.4. Určete vzájemnou polohu přímek p : [1, 0, 3] + t (2, −1, −3) , t ∈ R, q : [1, 1, 3] + s (1, −1, −2) , s ∈ R. Řešení. Hledejme společné body zadaných přímek (průnik podprostorů). Dostáváme soustavu 1 + 2t = 1 + s, 0 − t = 1 − s, 3 − 3t = 3 − 2s. Z prvních dvou rovnic vyplývá, že t = 1, s = 2. To ovšem nevyhovuje třetí rovnici. Soustava tak nemá řešení. Neboť směrový vektor CHAPTER 4. ANALYTICKÁ GEOMETRIE Afinní podprostory si můžeme pěkně popsat pomocí jejich zaměření, jakmile si zvolíme jeden jejich bod A0 ∈ M v generující množině bodů M. Skutečně, dostáváme ⟨M⟩ = {A0 + v; v ∈ Z(M) ⊂ Z(A)}, tj. pro generování afinního podprostoru vezmeme vektorový podprostor Z(M) v zaměření generovaný všemi rozdíly bodů z M a ten pak přičteme k libovolnému z nich. Hovoříme také o afinním obalu množiny bodů M v A. Naopak, kdykoliv zvolíme podprostor U v zaměření Z(A) a jeden pevný bod A ∈ A, pak podmnožina A + U vzniklá všemi možnými součty jediného bodu A se všemi vektory v U je afinní podprostor. Takový postup vede k pojmu parametrizace podprostorů: Nechť Q = A + Z(Q) je afinní podprostor v An a (u1, . . . , uk) je báze Z(Q) ⊂ Rn . Pak vyjádření podprostoru Q = {A + t1u1 + · · · + tkuk; t1, . . . , tk ∈ R} nazýváme parametrický popis podprostoru Q. Již jsme viděli jinou možnost zadávání afinních podprostorů: Jestliže máme zvoleny afinní souřadnice, pak lze zaměření podprostoru popsat pomocí homogenního systému lineárních rovnic v těchto souřadnicích. Dosazením souřadnic jednoho bodu našeho podprostoru Q do získaného systému rovnic dostaneme pravou stranu nehomogenního systému se stejnou maticí a celý podprostor Q je pak právě množinou řešení tohoto systému. Zadání podprostoru Q systémem rovnic v daných souřadnicích nazýváme implicitní popis podprostoru Q. Následující obecná věta říká, že takto umíme ve skutečnosti zadat všechny afinní podprostory a tím také ukazuje geometrickou podstatu vlastností množiny všech řešení systémů lineárních rovnic. 4.4. Věta. Nechť (A0; u) je afinní souřadný systém v nrozměrném afinním prostoru A. Afinní podprostory dimenze k v A, vyjádřené v daných souřadnicích, jsou právě množiny řešení řešitelných systémů n − k lineárně nezávislých lineárních rovnic v n proměnných. Důkaz. Uvažujme libovolný řešitelný systém n−k lineárně nezávislých rovnic αi(x) = bi, bi ∈ R, i = 1, . . . , n−k. Je-li A = (a1, . . . , an)T ∈ Rn libovolné pevně zvolené řešení tohoto (nehomogenního) systému rovnic a je-li U ⊂ Rn vektorový podprostor všech řešení zhomogenizovaného systému αi(x) = 0, pak dimenze U je k a podmnožina všech řešení daného systému je tvaru {B; B = A + (y1, . . . , yn)T , y = (y1 . . . , yn)T ∈ U} ⊂ Rn , viz. 3.1. Příslušný afinní podprostor je tím popsán parametricky ve výchozích souřadnicích (A0; u). Naopak, uvažme libovolný afinní podprostor Q ⊂ An a zvolme nějaký jeho bod B za počátek afinního souřadného systému (B, v) pro afinní prostor A. Protože Q = B +Z(Q), potřebujeme popsat zaměření podprostoru Q jako podprostor řešení homogenního systému rovnic. Zvolme tedy bázi v na Z(A) tak, aby prvních k vektorů tvořilo bázi Z(Q). Pak v 175 (2, −1, −3) přímky p není násobkem směrového vektoru (1, −1, −2) přímky q, přímky nejsou rovnoběžné. Jedná se proto o mimoběžky. 4.5. Pro jaká čísla a ∈ R jsou přímky p : [4, −4, 8] + t (2, 1, −4) , t ∈ R, q : [a, 6, −5] + s (1, −3, 3) , s ∈ R různoběžné? Řešení. Přímky jsou různoběžné tehdy a jenom tehdy, když má sou- stava 4 + 2t = a + s, −4 + t = 6 − 3s, 8 − 4t = −5 + 3s právě 1 řešení. V maticovém zápisu řešíme (první sloupec odpovídá proměnné t, druhý pak s)   2 −1 a − 4 1 3 10 −4 −3 −13   ∼   1 3 10 2 −1 a − 4 −4 −3 −13   ∼   1 3 10 0 −7 a − 24 0 1 3   . Vidíme, že soustava má právě 1 řešení tehdy a jenom tehdy, když je druhý řádek násobkem třetího. To je splněno pouze pro a = 3. Dodejme, že průsečíkem je v tomto případě bod [6, −3, 4]. 4.6. V R3 stanovte vzájemnou polohu přímky p zadané implicitně rovnicemi x + y − z = 4, x − 2y + z = −3 a roviny ϱ : y = 2x − 1. Řešení. Normálový vektor ϱ je (2, −1, 0) (uvažte zápis ϱ : 2x − y + 0z = 1). Lze postřehnout, že platí (1, 1, −1) + (1, −2, 1) = (2, −1, 0), tj. že normálový vektor roviny ϱ je lineární kombinací normálových vektorů p. Zaměření přímky (zadané nenulovým směrovým vektorem kolmým na uvedené dva normálové vektory) je proto podprostorem zaměření roviny ϱ (směrový vektor přímky je nutně kolmý na vektor (2, −1, 0)). Lehce jsme zjistili, že přímka p je rovnoběžná s rovinou ϱ. Zajímá nás, zda se protínají (zda p leží v ϱ). Soustava rovnic x + y − z = 4, x − 2y + z = −3, 2x − y = 1 má nekonečně mnoho řešení, neboť sečtením prvních dvou rovnic dostaneme právě třetí z rovnic. Přímka p tak musí ležet v rovině ϱ. 1. AFINNÍ A EUKLIDEOVSKÁ GEOMETRIE těchto souřadnicích jsou vektory v ∈ Z(Q) dány rovnostmi αj (v) = 0, j = k + 1, . . . , n, kde αi jsou lineární formy z tzv. duální báze k v, tj. funkce přiřazení jednotlivých souřadnic v naší bázi v. Náš vektorový podprostor Z(Q) dimenze k v nrozměrném Rn je tedy skutečně dán jako řešení homogenního systému n − k nezávislých rovnic. Popis zvoleného afinního podprostoru ve vybraném souřadném systému (A0; u) je proto dán systémem homogenních lineárních rovnic. Zbývá nám se vypořádat důsledky přechodu z původního zadaného souřadného systému (A; u) do našeho přizpůsobeného (B; v). Z obecné úvahy o transformacích souřadnic v následujícím odstavci vyplyne, že výsledný popis podprostoru bude opět pomocí systému rovnic, tentokrát ale už obecně nehomogenních. 4.5. Transformace souřadnic. Dvě libovolně zvolené afinní soustavy souřadnic (A0, u), (B0, v) se obecně liší posunutím počátku o vektor (B0 −A0) a jinou bazí zaměření. Transformační rovnice tedy vyčteme ze vztahu pro obecný bod X ∈ A X = B0+x′ 1 v1+· · ·+x′ n vn = B0+(A0−B0)+x1u1+· · ·+xnun. Označme y = (y1, . . . , yn)T sloupec souřadnic vektoru (A0 − B0) v bázi v a M = (aij ) buď matice vyjadřující bázi u prostřednictvím báze v. Potom x′ 1 = y1 + a11x1 + · · · + a1nxn ... x′ n = yn + an1x1 + · · · + annxn tj. maticově x′ = y + M · x. Jako příklad si můžeme spočítat dopad takové změny báze na vyjádření řešení systémů rovnic. Nechť v souřadnicích (A0; u) má systém rovnic tvar S · x = b s maticí systému S. Pak S · x = S · M−1 · (y + M · x) − S · M−1 ·y = b. Proto v nových výše uvažovaných souřadnicích (B0; v) bude mít náš systém rovnic tvar (S · M−1 ) · x′ = b′ = b + (S · M−1 ) · y. To plně dokončuje důkaz předchozí věty. 4.6. Příklady afinních podprostorů. (1) Jednorozměrný (standardní) afinní prostor je množina všech bodů reálné přímky A1. Její zaměření je jednorozměrný vektorový prostor R (a nosná množina také R). Afinní souřadnice dostaneme volbou počátku a měřítka (tj. báze ve vektorovém prostoru R). Všechny vlastní afinní podprostory jsou 0-rozměrné, jsou to právě všechny body reálné přímky R. (2) Dvourozměrný (standardní) afinní prostor je množina 176 1. AFINNÍ GEOMETRIE 4.7. Nalezněte průnik podprostorů Q1 a Q2, je-li Q1 : [4, −5, 1, −2] + t1 (3, 5, 4, 2) + t2 (2, 4, 5, 1) + t3 (0, 3, 1, 2) , Q2 : [4, 4, 4, 4] + s1 (0, −6, −2, −4) + s2 (−1, −5, −3, −3) , kde t1, t2, t3, s1, s2 ∈ R. Řešení. Bod X = [x1, x2, x3, x4] ∈ R4 náleží do Q1 ∩Q2 právě tehdy, když je     x1 x2 x3 x4     =     4 −5 1 −2     + t1     3 5 4 2     + t2     2 4 5 1     + t3     0 3 1 2     pro nějaká čísla t1, t2, t3 ∈ R a současně když je     x1 x2 x3 x4     =     4 4 4 4     + s1     0 −6 −2 −4     + s2     −1 −5 −3 −3     pro nějaká s1, s2 ∈ R. Porovnáním získáváme t1     3 5 4 2     + t2     2 4 5 1     + t3     0 3 1 2     =     4 − 4 4 + 5 4 − 1 4 + 2     + s1     0 −6 −2 −4     + s2     −1 −5 −3 −3     . Při maticovém zápisu (pro pořadí proměnných t1, t2, t3, s1, s2 a po převodu vektorů u s1 a s2 na levou stranu) řešme pomocí řádkových ope- rací     3 2 0 0 1 0 5 4 3 6 5 9 4 5 1 2 3 3 2 1 2 4 3 6     ∼     3 2 0 0 1 0 0 2 9 18 10 27 0 7 3 6 5 9 0 −1 6 12 7 18     ∼ · · · ∼     3 0 0 0 0 0 0 2 0 0 0 0 0 0 1 2 0 3 0 0 0 0 1 0     . Odtud vidíme, že t1 = t2 = s2 = 0 a pro s1 = t ∈ R je t3 = 3 − 2t. Podotkněme, že k určení Q1 ∩ Q2 stačilo znát buď t1, t2, t3 nebo s1, s2. Vraťme se nyní k vyjádření     x1 x2 x3 x4     =     4 4 4 4     + s1     0 −6 −2 −4     + s2     −1 −5 −3 −3     =     4 4 4 4     + t     0 −6 −2 −4     . Průnikem zadaných podprostorů je tedy přímka (s = −2t) [4, 4, 4, 4] + s (0, 3, 1, 2) , s ∈ R. Pro kontrolu rovněž dosaďme     x1 x2 x3 x4     =     4 −5 1 −2     + t1     3 5 4 2     + t2     2 4 5 1     + t3     0 3 1 2     CHAPTER 4. ANALYTICKÁ GEOMETRIE všech bodů prostoru A2 se zaměřením R2 . (Nosnou množinou je R2 .) Afinní souřadnice dostaneme volbou počátku a dvou nezávislých vektorů (směrů a měřítek). Vlastní afinní podprostory jsou pak všechny body a přímky v rovině (0-rozměrné a 1-rozměrné). Přímky přitom jednoznačně zadáme jejich jedním bodem a jedním generátorem zaměření (tzv. parametrický popis přímky). (3) Trojrozměrný (standardní) afinní prostor je množina všech bodů prostoru A3 se zaměřením R3 . Afinní souřadnice dostaneme volbou počátku a tří nezávislých vektorů (směrů a měřítek). Vlastní afinní podprostory jsou pak všechny body, přímky a roviny (0-rozměrné, 1-rozměrné a 2-rozměrné). (4) Podprostor všech řešení jedné lineární rovnice a · x = b pro neznámý bod [x1, . . . , xn] ∈ An, známý nenulový vektor koeficientů (a1, . . . , an) a skalár b ∈ R je afinní podprostor dimenze n − 1 (říkáme také, že je kodimenze 1), tj. tzv. nadrovina v An. 4.7. Afinní kombinace bodů. Nechť A0, . . . , Ak jsou body v afinním prostoru A. Jejich afinní obal ⟨{A0 . . . , Ak}⟩ můžeme zapsat jako {A0 + t1(A1 − A0) + · · · + tk(Ak − A0); t1, . . . , tk ∈ R} a v libovolných afinních souřadnicích (tj. Ai je vyjádřen sloupcem skalárů) můžeme tutéž množinu zapsat jako ⟨A0, . . . , Ak⟩ = {t0A0+t1A1+· · ·+tkAk; ti ∈ R, k∑ i=0 ti = 1}. Obecně výrazy t0A0 + t1A1 + · · · + tkAk s koeficienty splňu- jícícmi ∑k i=0 ti = 1 rozumíme body A0 + ∑k i=1 ti(Ai − A0) a nazýváme je afinní kombinace bodů. Body A0 . . . , Ak jsou v obecné poloze, jestliže generují k-rozměný podprostor. Z našich definic je vidět, že to nastane právě, když pro kterýkoliv z nich platí, že vektory vzniklé pomocí rozdílů tohoto pevného s ostatními jsou lineárně nezávislé. Všimněme si také, že zadání posloupnosti dim A bodů v obecné poloze je ekvivalentní zadání afinního repéru se středem v prvním z nich. Afinní kombinace je obdobná konstrukce pro body afinního prostoru jako byla lineární kombinace pro vektorové prostory. Skutečně, afinní podprostor generovaný body A0 . . . , Ak je roven množině všech afinních kombinací svých generátorů. Můžeme však nyní dobře zobecnit i pojem „mezi dvěma body na přímce“. V dvojrozměrném případě tomu odopovídá vnitřek trojúhelníku. Obecně budeme postupovat takto: 4.8. Simplexy. Nechť A0, . . . , Ak je k + 1 bodů afinního prostoru A v obecné poloze. k–rozměrný simplex = (A0, . . . , Ak) generovaný těmito body je definován jako množina všech afinních kombinací bodů Ai s pouze nezápornými koeficienty, tzn. = {t0A0 + t1A1 + · · · + tkAk; ti ∈ [0, 1] ⊂ R, k∑ i=0 ti = 1}. 177 =     4 −5 1 −2     + (3 − 2t)     0 3 1 2     =     4 4 4 4     + t     0 −6 −2 −4     . 4.8. Dokažte, že pro každé n ∈ N a pro libovolná kladná čísla x1, x2, . . . , xn ∈ R platí n2 ≤ ( 1 x1 + 1 x2 + · · · + 1 xn ) · (x1 + x2 + · · · + xn) . Poté uveďte, kdy nastává rovnost. Řešení. Postačuje uvážit Cauchyovu nerovnost | u · v | ≤ || u || || v || v euklidovském prostoru Rn pro vektory u = ( 1 √ x1 , 1 √ x2 , . . . , 1 √ xn ) , v = (√ x1, √ x2, . . . , √ xn ) . Takto dostaneme (4.1) n ≤ √ 1 x1 + 1 x2 + · · · + 1 xn · √ x1 + x2 + · · · + xn. Dokazovanou nerovnost potom obdržíme umocněním (4.1). Dále víme, že Cauchyova nerovnost přejde v rovnost, právě když bude vektor u násobkem vektoru v, což již implikuje x1 = x2 = · · · = xn. 4.9. Nalezněte bod A přímky p : x + 2y + z − 1 = 0, 3x − y + 4z − 29 = 0, který má stejnou vzdálenost od bodů B = [3, 11, 4], C = [−5, −13, −2]. Řešení. Nejprve vyjádříme přímku p parametricky tak, že vyřešíme soustavu rovnic x + 2y + z = 1, 3x − y + 4z = 29. Soustavu zapíšeme rozšířenou maticí a upravíme ( 1 2 1 1 3 −1 4 29 ) ∼ ( 1 2 1 1 0 −7 1 26 ) ∼ ( 1 0 9/7 59/7 0 1 −1/7 −26/7 ) . Tím dostáváme vyjádření p : [ 59 7 , − 26 7 , 0 ] + t ( − 9 7 , 1 7 , 1 ) , t ∈ R. Odkud substitucí t = 7s + 26 plyne p : [−25, 0, 26] + s (−9, 1, 7) , s ∈ R. 1. AFINNÍ A EUKLIDEOVSKÁ GEOMETRIE Jednorozměrný simplex je úsečka, dvourozměrný trojúhelník, nula–rozměrný bod. Všimněme si, že každý k–rozměrný simplex má právě k + 1 stěn, které jsou postupně zadány rovnicemi ti = 0, i = 0, . . . , k. Přímo z definice je vidět, že jde opět o (k − 1)–rozměrné simplexy. Hovoříme o hranici simplexu. Např. trojúhelník má za svou hranici tři hrany, každá z nich pak dva body. Zadání podprostoru jako množiny afinních kombinací bodů v obecné poloze je ekvivalentní parametrickému popisu. Obdobně pracujeme s parametrickými popisy simplexů. 4.9. Konvexní množiny. Podmnožina M afinního prostoru se nazývá konvexní, jestliže s každými svými dvěma body A, B obsahuje i celou úsečku (A, B). Přímo z definice je vidět, že každá konvexní množina obsahuje s každými k + 1 body v obecné poloze i celý jimi definovaný simplex (dokažte si formálně podrobně!). Konvexními množinami jsou např. (1) prázdná podmnožina (2) afinní podprostory (3) úsečky, polopřímky p = {P + t · v; t ≥ 0}, (4) obecněji k– rozměrné poloprostory α = {P + t1 · v1 + · · · + tk · vk; t1, . . . , tk ∈ R, tk ≥ 0}, (5)) úhly v dvojrozměrných podprostorech β = {P +t1 ·v1 + t2 · v2; t1 ≥ 0, t2 ≥ 0}, atd. Přímo z definice také plyne, že průnik libovolného systému konvexních množin je opět konvexní. Průnik všech konvexních množin obsahujících danou množinu M nazýváme konvexní obal K(M) množiny M. Věta. Konvexní obal libovolné podmnožiny M ⊂ A je K(M) = {t1A1 + · · · + tsAs; s∑ i=1 ti = 1, ti ≥ 0, Ai ∈ M} Důkaz. Označme S množinu všech afinních kombinací na pravé straně dokazované rovnosti. Nejprve ověříme, že je S konvexní. Zvolme tedy dvě sady parametrů ti, i = 1, .., s1, t′ j , j = 1, . . . , s2 s požadovanými vlastnosti. Bez újmy na obecnosti můžeme předpokládat, že s1 = s2 a že v obou kombinacích vystupují stejné body z M (jinak prostě přidáme sčítance s nulovými koeficienty). Uvažme libovolný bod úsečky zadané takto získanými body: ϵ(t1A1 +· · ·+tsAs)+(1−ϵ)(t′ 1 A1 +· · ·+t′ s As), 0 ≤ ϵ ≤ 1. Zřejmě jsou opět všechny v S. Zbývá ukázat, že konvexní obal bodů A1, . . . , As nemůže být menší než S. Samotné body Ai odpovídají volbě parametrů tj = 0 pro všechny j ̸= i a ti = 1. Předpokládejme, že tvrzení platí pro všechny množiny s nejvýše s − 1 body. To znamená, že konvexní obal bodů A1, . . . , As−1 je (podle předpokladu) tvořen právě těmi kombinacemi z pravé strany dokazované rovnosti, kde ts = 0. Uvažme nyní 178 1. AFINNÍ GEOMETRIE Bod A obdržíme volbou jistého s ∈ R. Přitom vektory A − B = (−28 − 9s, −11 + s, 22 + 7s) , A − C = (−20 − 9s, 13 + s, 28 + 7s) mají mít stejnou délku, tj. má platit √ (−28 − 9s)2 + (−11 + s)2 + (22 + 7s)2 = √ (−20 − 9s)2 + (13 + s)2 + (28 + 7s)2 , resp. (−28 − 9s)2 + (−11 + s)2 + (22 + 7s)2 = (−20 − 9s)2 + (13 + s)2 + (28 + 7s)2 . Úpravou poslední rovnice získáme s = −3. Je tak A = [−25, 0, 26] − 3 (−9, 1, 7) = [2, −3, 5]. 4.10. V euklidovském prostoru R4 stanovte vzdálenost bodu A = [2, −5, 1, 4] od podprostoru U : 4x1 −2x2 −3x3 −2x4 +12 = 0, 2x1 −x2 −2x3 −2x4 +9 = 0. Řešení. Nejdříve nalezneme libovolný bod podprostoru U (řešení soustavy). Např. je B = [0, 3, 0, 3] ∈ U. Víme, že vzdálenost A od U se rovná velikosti kolmého průmětu vektoru A−B do ortogonálního doplňku zaměření podprostoru U. Ortogonální doplněk zaměření U ovšem známe (zadává tento podprostor) – jako množinu (lineárních kombinací normálových vektorů) V := {t (4, −2, −3, −2) + s (2, −1, −2, −2) ; t, s ∈ R}. Potřebujeme najít kolmý průmět PA−B vektoru A − B do V , který náleží do V , a proto je PA−B = a (4, −2, −3, −2) + b (2, −1, −2, −2) pro jisté hodnoty a, b ∈ R. Zjevně musí platit (A − B − PA−B) ⊥ V , tedy ((A − B) − PA−B) ⊥ (4, −2, −3, −2) , ((A − B) − PA−B) ⊥ (2, −1, −2, −2) . Dosazením za A − B a PA−B odsud vyplývá (((2, −8, 1, 1) − a (4, −2, −3, −2) − b (2, −1, −2, −2)) · (4, −2, −3, −2)) = 0, (((2, −8, 1, 1) − a (4, −2, −3, −2) − b (2, −1, −2, −2)) · (2, −1, −2, −2)) = 0; CHAPTER 4. ANALYTICKÁ GEOMETRIE libovolný bod A = t1A1 + · · · + tsAs ∈ S, ts ̸= 1, a afinní kombinace ϵ(t1A1 +· · ·+ts−1As−1)+(1−ϵ(1−ts))As, 0 ≤ ϵ ≤ 1 1−ts . Jde o úsečku s krajními body určenými parametry ϵ = 0 (bod As) a ϵ = 1/(1 − ts) (bod v konvexním obalu bodů A1, . . . , As−1). Bod A je vnitřním bodem této úsečky s parametrem ϵ = 1. Konvexní obaly konečných množin bodů se nazývají konvexní mnohostěny. Jsou-li definující body A0, . . . , Ak konvexního mnohostěnu v obecné poloze, dostáváme právě krozměrný simplex. V případě simplexu je vyjádření jeho bodů ve tvaru afinní kombinace definujících vrcholů jedno- značné. Zvláštním příkladem jsou konvexní mnohostěny generované jedním bodem a konečně mnoha vektory: Nechť u1, . . . , uk, jsou libovolné vektory v zaměření Rn , A ∈ An je libovolný bod. Rovnoběžnostěn Pk(A; u1, . . . , uk) ⊂ An je množina Pk(A; u1, . . . , uk) = {A + c1u1 + · · · + ckuk; 0 ≤ ci ≤ 1}. Jsou-li vektory u1, . . . , uk nezávislé, hovoříme o krozměrném rovnoběžnostěnu Pk(A; u1, . . . , uk) ⊂ An. Z definice je zřejmé, že rovnoběžnostěny jsou konvexní. Ve skutečnosti jde o konvexní obaly jejich vrcholů. 4.10. Příklady standardních afinních úloh. (1) K podprostoru zadanému implicitně nalézt parametrický popis a nao- pak: Nalezením partikulárního řešení nehomogenního systému a fundamentálního řešení zhomogenizovaného systému rovnic získáme (v souřadnicích, ve kterých byly rovnice zadány) právě hledaný parametrický popis. Naopak, zapíšemeli parametrický popis v souřadnicích, můžeme volné parametry t1, . . . , tk vyeliminovat a získáme právě rovnice zadávající daný podprostor implicitně. (2) Nalézt podprostor generovaný několika podprostory Q1, . . . , Qs (obecně různých dimenzí, např. v R3 nalézt rovinu danou bodem a přímkou, třemi body apod.) a zadat jej implicitně či parametricky: Výsledný podprostor Q je vždy určen jedním pevně zvoleným bodem Ai v každém z nich a součtem všech zaměření. Např. Q = A1 + (Z({A1, . . . , Ak}) + Z(Q1) + · · · + Z(Qs)). Pokud jsou podprostory zadány implicitně, je možné je nejdříve převést na parametrický tvar. V konkrétních situacích bývají funkční i jiné postupy. Všimněme si, že obecně je skutečně nutné využít jednoho bodu z každého podprostoru. Např. dvě paralelní přímky v rovině vygenerují celou rovinu, ale sdílí totéž jednorozměrné zaměření. (3) Nalézt průnik podprostorů Q1, . . . , Qs: 179 tj. ((2, −8, 1, 1) · (4, −2, −3, −2)) − a ((4, −2, −3, −2) · (4, −2, −3, −2)) − b ((2, −1, −2, −2) · (4, −2, −3, −2)) = 0, ((2, −8, 1, 1) · (2, −1, −2, −2)) − a ((4, −2, −3, −2) · (2, −1, −2, −2)) − b ((2, −1, −2, −2) · (2, −1, −2, −2)) = 0. Vyčíslíme-li tyto skalární součiny, obdržíme soustavu 19 − 33a − 20b = 0, 8 − 20a − 13b = 0, která má jediné řešení a = 3, b = −4. Je tudíž PA−B = 3 (4, −2, −3, −2) − 4 (2, −1, −2, −2) = (4, −2, −1, 2) , přičemž || PA−B || = √ 42 + (−2)2 + (−1)2 + 22 = 5. Připomeňme, že vzdálenost A od U je rovna || PA−B || = 5. 4.11. Spočtěte vzdálenost v bodu [0, 0, 6, 0] od vektorového podpro- storu U : [0, 0, 0, 0]+t1 (1, 0, 1, 1)+t2 (2, 1, 1, 0)+t3 (1, −1, 2, 3) , t1, t2, t3 ∈ R prostoru R4 . Řešení. Úlohu budeme řešit postupem založeným na tzv. problému nejmenších čtverců. Vektory generující U napíšeme do sloupců matice A =     1 2 1 0 1 −1 1 1 2 1 0 3     a bod [0, 0, 6, 0] nahradíme jemu odpovídajícím vektorem b = (0, 0, 6, 0)T . Budeme řešit soustavu A · x = b, tj. soustavu lineárních rovnic x1 + 2x2 + x3 = 0, x2 − x3 = 0, x1 + x2 + 2x3 = 6, x1 + 3x3 = 0, právě metodou nejmenších čtverců. (Upozorněme, že tato soustava nemá řešení – jinak by vzdálenost byla rovna 0.) Systém A·x = b vynásobíme zleva maticí AT . Rozšířená matice soustavy AT ·A·x = AT ·b pak je   3 3 6 6 3 6 3 6 6 3 15 12   . 1. AFINNÍ A EUKLIDEOVSKÁ GEOMETRIE Pokud jsou zadány v implicitním tvaru, stačí sjednotit všechny rovnice do jednoho systému (a případně vynechat lineárně závislé). Pokud je vzniklý systém neřešitelný, je průnik prázdný. V opačném případě získáme implicitní popis afinního podprostoru, který je hledaným průnikem. Pokud máme dány parametrické tvary, můžeme také hledat přímo společné body jako řešení vhodných rovnic, podobně jako při hledání průniků vektorových podprostorů. Získáme tak přímo opět parametrický popis. Pokud je podprostorů více než dva, musíme průnik hledat postupně. Máme-li jeden prostor zadaný parametricky a ostatní implicitně, stačí dosadit parametrizované souřadnice a řešit výsledný systém rovnic. (4) Nalezení příčky mimoběžek p, q v A3 procházející daným bodem nebo mající předem daný směr (tj. zaměření): Příčkou rozumíme přímku, která má neprázdný průnik s oběmi mimoběžkami. Výsledná příčka r tedy bude jednorozměrným afinním podprostorem. Pokud máme zadán jeho bod A ∈ r, pak afinní podprostor generovaný p a A je buď přímka (A ∈ p) nebo rovina (A /∈ p). V prvém případě máme nekonečně mnoho řešení, jedno pro každý bod z q, v druhém stačí najít průnik B roviny ⟨p ∪ A⟩ s q a r = ⟨{A, B}⟩. Pokud je průnik prázdný, úloha nemá řešení, v případě že q ⊂ ⟨p∪A⟩, máme opět nekonečně mnoho řešení, a pokud je průnik jednoprvkový, dostáváme právě jedno řešení. Máme-li místo bodu dán směr u ∈ Rn , tj. zaměření r, pak uvažujeme opět podprostor Q generovaný p a zaměřením Z(p) + ⟨u⟩ ⊂ Rn . Opět, pokud q ⊂ Q, máme nekonečně mnoho řešení, jinak uvážíme průnik Q s q a úlohu dokončíme stejně jako v předchozím případě. Řešení mnoha dalších standardních geometrických úloh spočívá v používání výše uvedených kroků. 4.11. Afinní zobrazení. Zobrazení f : A → B mezi afinními prostory nazýváme afinní zobrazení, jestliže mezi jejich zaměřeními existuje lineání zobrazení φ : Z(A) → Z(B) takové, že pro všechny A ∈ A, v ∈ Z(A) platí f (A + v) = f (A) + φ(v). Zobrazení f a φ jsou jednoznačně zadána touto vlastnostní a libovolně zvolenými obrazy (dim A + 1) bodů v obecné poloze. Pro libovolnou afinní kombinaci bodů t0A0+· · ·+tsAs ∈ A pak dostaneme f (t0A0 + · · · + tsAs) = = f (A0 + t1(A1 − A0) + · · · + ts(As − A0)) = f (A0) + t1φ(A1 − A0) + · · · + tsφ(As − A0) = t0f (A0) + t1f (A1) + · · · + tsf (As). Naopak, pokud pro nějaké zobrazení platí, že zachovává afinní kombinace, můžeme použít speciální případ kombinace dvou vektorů s koeficienty t0 = 0 a t1 = 1 pro definici zobrazení φ mezi zaměřeními. Pak lze číst předchozí výpočet 180 1. AFINNÍ GEOMETRIE Pomocí elementárních řádkových transformací ji postupně převedeme na schodovitý tvar   3 3 6 6 3 6 3 6 6 3 15 12   ∼   3 3 6 6 0 3 −3 0 0 −3 3 0   ∼   1 1 2 2 0 1 −1 0 0 0 0 0   . Provedeme-li ještě zpětnou eliminaci   1 1 2 2 0 1 −1 0 0 0 0 0   ∼   1 0 3 2 0 1 −1 0 0 0 0 0   , můžeme ihned napsat řešení x = (2 − 3t, t, t) T , t ∈ R. Dodejme, že existence nekonečně mnoha řešení je zapříčiněna nadbytečností třetího ze zadávajících vektorů podprostoru U, neboť je 3 (1, 0, 1, 1) − (2, 1, 1, 0) = (1, −1, 2, 3) . Libovolná (t ∈ R) lineární kombinace (2 − 3t) (1, 0, 1, 1) + t (2, 1, 1, 0) + t (1, −1, 2, 3) = (2, 0, 2, 2) však odpovídá bodu [2, 0, 2, 2] podprostoru U, který je nejblíže bodu [0, 0, 6, 0]. Pro hledanou vzdálenost proto platí v = || [2, 0, 2, 2] − [0, 0, 6, 0] || = √ 22 + 0 + (−4)2 + 22 = 2 √ 6. 4.12. Nechť je dána krychle ABCDEFGH (při obvyklém významu zápisu, tedy vektory E−A, F −B, G−C, H −D jsou kolmé na rovinu určenou vrcholy A, B, C, D) v euklidovském prostoru R3 . Vypočtěte odchylku φ vektorů F − A a H − A. Řešení. Tento příklad jsme již jednou řešili pomocí vzorce z definice odchylky. Nyní se zkusme zamyslet. Uvažované body A, F, H jsou vrcholy trojúhelníku, jehož všechny strany jsou úhlopříčkami stěn krychle. Jedná se tudíž o rovnostranný trojúhelník. Odtud plyne, že φ = π/3. 4.13. Označme S střed hrany AB krychle ABCDEFGH (v obvyklém označení). Určete kosinus odchylky přímek ES a BG. Řešení. Vzhledem k tomu, že homotetie (stejnolehlost) je podobným zobrazením, tj. zachovává úhly, můžeme předpokládat, že krychle má hranu velikosti 1. Umístíme-li navíc bod A do počátku souřadné soustavy a body B, resp. E do bodů o souřadnicích [1, 0, 0], resp. [0, 0, 1], pak mají zbylé uvažované body následující souřadnice: S = [1/2, 0, 0], G = [1, 1, 1], tedy vektor ES = (1/2, 0, −1) a BG = (0, 1, 1). Pro hledaný kosinus odchylky φ tedy máme cos(φ) = (1/2, 0, −1) · (0, 1, 1) ∥(1/2, 0, −1)∥ ∥(0, 1, 1)∥ = √ 2 √ 5 CHAPTER 4. ANALYTICKÁ GEOMETRIE v opačném pořadí a ověřit korektnost i linearitu φ a zjistíme, že se jedná o afinní zobrazení. Platí proto: Věta. Afinní zobrazení jsou právě ta zobrazení, která zachovávají afinní kombinace bodů. Volbou afinních souřadnic (A0, u) na A a (B0, v) na B dostáváme souřadné vyjádření afinního zobrazení f : A → B. Přímo z definice je zřejmé, že stačí vyjádřit obraz f (A0) počátku souřadnic v A v souřadnicích na B, tj. vyjádřit vektor f (A0) − B0 v bázi v jako sloupec souřadnic y0 a vše ostatní je pak určeno násobením maticí zobrazení φ ve zvolených bazích a přičtením výsledku. Každé afinní zobrazení tedy v souřadnicích vypadá takto: x → y0 + Y · x, kde y0 je jako výše a Y je matice zobrazení φ. Transformace afinních souřadnic odpovídá, obdobně jako u lineárních zobrazení, vyjádření identického zobrazení v zvolených afinních repérech. Změna souřadného vyjádření afinního zobrazení v důsledku změny bazí se snadno spočte pomocí násobení a sčítání. Skutečně, při změně báze na definičním oboru daném posunutím w a maticí M (od staré k nové), a na oboru hodnot posunutím w a maticí N (od nové ke staré) dostáváme y′ = z + N · y = z + N · (y0 + Y · x) = (z + N · y0 + N · Y · w) + (N · Y · M) · x′ . 4.12. Euklidovské bodové prostory. Zatím jsme pro naše elementární geometrické úvahy nepotřebovali pojem vzdálenosti nebo velikosti. V mnoha praktických úlohách ale velikost vektorů a odchylka vektorů, tak jak jsme je zavedli na samém konci třetí části druhé kapitoly (viz 2.39 a dále), hrají podstatnou roli. Ve skutečnosti se ale dodatečné informace týkají opravdu jen vektorů v zaměření, takže nám nezbývá mnoho práce: Definice. Standardní bodový euklidovský prostor En je afinní prostor An, jehož zaměřením je standardní euklidovský prostor Rn se skalárním součinem ⟨x, y⟩ = yT · x. Kartézská souřadná soustava je afinní souřadná soustava (A0; u) s ortonormální bazí u. Vzdálenost bodů A, B ∈ En definujeme jako velikost vektoru ∥B − A∥, budeme ji značit ρ(A, B). Euklidovské podprostory v En jsou afinní podprostory jejichž zaměření uvažujeme spolu se zúženými skalárními sou- činy. Bodovým euklidovským prostorem E dimenze n pak obecně rozumíme afinní prostor, jehož zaměření je reálný n– rozměrný euklidovský vektorový prostor. Pojem kartézské souřadné soustavy má opět jasný smysl. Každá volba takové souřadné soustavy ovšem zadává ztotožnění E se standardním prostorem En. Proto se budeme v dalším, bez újmy 181 . 4.14. V reálné rovině nalezněte přímku, která prochází bodem [−3, 0] a s přímkou p : √ 3x + 3y + 5 = 0 svírá úhel 60 ◦ . Řešení. Nejprve si uvědomme, že podmínkám úlohy musí vyhovovat právě dvě přímky. Obecná rovnice přímky v rovině má tvar ax + by + c = 0, přičemž lze volit a2 + b2 = 1. Nalezněme tedy taková čísla a, b, c ∈ R, aby byly splněny uvedené podmínky. Dosadíme-li x = −3, y = 0 do této rovnice (přímka má procházet bodem [−3, 0]), dostaneme c = 3a. Podmínka, že přímka má svírat úhel 60 ◦ s přímkou p, potom dává 1 2 = cos 60 ◦ = √ 3a + 3b √ 12 , tj. √ 3 = √ 3a + 3b . Další úpravou obdržíme ±1 = a + √ 3b a umocněním 1 = a2 + 3b2 + 2 √ 3ab. Využijeme-li a2 + b2 = 1, získáme 0 = 2b2 + 2 √ 3ab, tj. 0 = b ( b + √ 3a ) . Celkem tak máme možnosti (připomeňme, že c = 3a a a2 + b2 = 1) a = ±1, b = 0, c = ±3; a = ± 1 2 , b = ∓ √ 3 2 , c = ± 3 2 . Snadno se ověří, že těmito koeficienty určené přímky x + 3 = 0, 1 2 x − √ 3 2 y + 3 2 = 0 zadání skutečně vyhovují. 4.15. Určete obecnou rovnici všech rovin, které svírají odchylku 60◦ s rovinou x+y+z−1 = 0 a obsahují přímku p : [1, 0, 0]+t (1, 1, 0). 4.16. Určete odchylku přímky p zadané implicitně rovnicemi x + 3y + z = 0, −x − y + z = 0 od roviny ϱ : x + y + 2z + 1 = 0. Řešení. Vidíme, že normálový vektor roviny ϱ je (1, 1, 2). Sečtení rovnic zadávajících přímku p při opsání první z nich dává x + 3y + z = 0, 2y + 2z = 0. Odsud plyne, že y = −z a x = 2z. Vektor (2, −1, 1) je proto směrovým vektorem přímky p; jinak řečeno, můžeme zapsat (p očividně prochází počátkem) p : [0, 0, 0] + t (2, −1, 1) , t ∈ R. 1. AFINNÍ A EUKLIDEOVSKÁ GEOMETRIE na obecnosti, zabývat hlavně standardními euklidovskými prostory a jejich podprostory. Z geometrického pohledu mají jednoduché vlastnosti skalárního součinu, jako jsou trojúhelníková nerovnost, Cauchyova nerovnost, Besselova nerovnost apod., odvozené ve čtvrté části předchozí kapitoly, viz 3.22, velmi užitečné přímé důsledky: 4.13. Věta. Pro body A, B, C ∈ En platí (1) ρ(A, B) = ρ(B, A) (2) ρ(A, B) = 0 právě, když A = B (3) ρ(A, B) + ρ(B, C) ≥ ρ(A, C) (4) V každé kartézké souřadné soustavě (A0; e) mají body A = A0 + a1e1 + · · · + anen, B = A0 + b1e1 + · · · + bnen vzdálenost √∑n i=1(ai − bi)2. (5) Je–li dán bod A a podprostor Q v En, pak existuje bod P ∈ Q minimalizující vzdálenosti bodů Q od A. Vzdálenost bodů A a P je rovna velikosti kolmého průmětu vektoru A − B do Z(Q)⊥ pro libovolný B ∈ Q. (6) Obecněji, pro podprostory R a Q v En existují bod P ∈ Q a Q ∈ R minimalizující vzdálenosti bodů B ∈ Q a A ∈ R. Vzdálenost bodů Q a P je rovna velikosti kolmého průmětu vektoru A − B do Z(Q)⊥ pro libovolné body B ∈ Q a A ∈ R. Důkaz. První tři vlastnosti vyplývají přímo z vlastností velikosti vektorů v prostorech se skalárním součinem, čtvrtá plyne přímo z vyjádření skalárního součinu v libovolné ortonormální bázi. Podívejme se na vztah pro minimalizaci vzdleností ρ(A, B) pro B ∈ Q. Vektor A − B se jednoznačně rozkládá na A − B = u1 + u2, u1 ∈ Z(Q), u2 ∈ Z(Q)⊥ . Přitom u2 nezávisí na volbě B ∈ Q, protože případná změna bodu B se projeví přičtením vektoru ze Z(Q). Nyní zvolme P = A+(−u2) = B+u1 ∈ Q. Dostáváme ∥A − B∥2 = ∥u1∥2 + ∥u2∥2 ≥ ∥u2∥2 = ∥A − P ∥. Odtud již vyplývá, že nejmenší možné vzdálenosti je skutečně dosaženo, a to právě pro náš bod P . Vypočtená vzdálenost je skutečně ∥u2∥. Obdobně ukážeme obecný výsledek. Pro volbu libovolných bodů A ∈ R a B ∈ Q je jejich rozdíl dán jako součet vektorů u1 ∈ Z(R) + Z(Q) a u2 ∈ (Z(R) + Z(Q))⊥ , přičemž komponenta u2 nezávisí na volbě bodů. Přičtením vhodných vektorů ze zaměření R a Q zjevně obdržíme body A′ a B′ , jejichž vzdálenost je právě ∥u2∥. Rozšíříme nyní náš stručný přehled elementárních úloh v analytické geometrii. 4.14. Příklady standardních úloh. (1) Najděte vzdálenost bodu A ∈ En od podprostoru Q ⊂ En: Postup při řešení je dán ve větě 4.13. (2) V E2 veďte bodem A přímku q svírající s danou přímkou p daný úhel: 182 1. AFINNÍ GEOMETRIE Pro úhel φ vektorů (1, 1, 2), (2, −1, 1) platí cos φ = 2 − 1 + 2 √ 6 · √ 6 = 1 2 . Je tedy φ = 60 ◦ . To je ovšem velikost úhlu, který svírá směrový vektor p s normálovým vektorem ϱ. Hledaný úhel je doplňkem tohoto úhlu, a tak je výsledek 30 ◦ = 90 ◦ − 60 ◦ . 4.17. Spočtěte objem rovnoběžnostěnu v R3 s podstavou v rovině z = 0 a s hranami zadanými dvojicemi vrcholů [0, 0, 0], [−2, 3, 0]; [0, 0, 0], [4, 1, 0] a [0, 0, 0], [5, 7, 3]. Řešení. Rovnoběžnostěn je zadán vektory (4, 1, 0), (−2, 3, 0), (5, 7, 3). Víme, že jeho objem je roven determinantu 4 −2 5 1 3 7 0 0 3 = 3 4 −2 1 3 = 3 · 14 = 42. Doplňme, že při změnách pořadí vektorů bychom obdrželi výsledek ±42, neboť determinant udává orientovaný objem rovnoběžnostěnu. Ještě poznamenejme, že objem rovnoběžnostěnu by se dle výpočtu determinantu nezměnil, pokud by třetí vektor byl [a, b, 3] pro libovolná čísla a, b ∈ R. Jeho objem pochopitelně závisí pouze na kolmé vzdálenosti rovin dolní a horní podstavy a jejich obsahu 4 −2 1 3 = 14. 4.18. Zjistěte, zda leží body [0, 2, 1], [−1, 2, 0], [−2, 5, 2] a [0, 5, 4] z R3 v jedné rovině. Řešení. Libovolná dvojice zadaných bodů z afinního prostoru R3 určuje vektor (viz definice afinního prostoru; jeho souřadnice jsou dány po složkách rozdíly souřadnic daných dvou bodů). To, že dané čtyři body leží v rovině je ekvivalentní tomu, že jsou tři vektory dané jedním vybraným bodem a vždy jedním ze tří zbylých lineárně závislé. Vybereme např. bod [0, 2, 1] (na výběru nezáleží), pak uvažujeme vektory [0, 2, 1]−[−1, 2, 0] = (1, 0, 1), [0, 2, 1]−[−2, 5, 2] = (2, −3, −1) a [0, 2, 1] − [0, 5, 4] = (0, −3, −3). Vidíme, že součet dvojnásobku prvního vektoru a třetího vektoru je roven druhému vektoru, vektory jsou tedy lineárně závislé (jinak má taky matice, jejíž řádky jsou tvořeny souřadnicemi daných vektorů, hodnost nižší než tři; v tomto případě se tedy jedná o matici   1 0 1 2 −3 −1 0 −3 −3   , která má hodnost dva). Dané body tedy leží v rovině. CHAPTER 4. ANALYTICKÁ GEOMETRIE Připoměňme, že na úrovni rovinné geometrie jsme s odchylkami vektorů již pracovali (viz např. 2.42). Najdeme vektor u ∈ R2 ležící v zaměření přímky q a zvolíme vektor v mající od u zadanou odchylku. Hledaná přímka je dána bodem A a zaměřením ⟨v⟩. Úloha má dvě nebo jedno řešení. (3) Spočtěte patu kolmice vedené bodem na danou přímku: Postup je uveden v důkazu předposledního bodu věty 4.13. (4) V E3 určete vzdálenost dvou přímek p, q: Zvolíme libovolně jeden bod z každé přímky, A ∈ p, B ∈ q. Komponenta vektoru A−B v ortogonálním doplňku (Z(p) + Z(q))⊥ má velikost rovnu vzdálenosti p a q. (5) V E3 najděte osu dvou mimoběžek p a q: Osou zde rozumíme příčku, která realizuje nejmenší možnou vzdálenost daných mimoběžek pomocí bodů průniku. Opět lze postup dovodit z důkazu věty 4.13 (poslední bod). Nechť η je podprostor generovaný jedním bodem A ∈ p a součtem Z(p) + (Z(p) + Z(q))⊥ . Pokud nejsou přímky p a q rovnoběžné, půjde o rovinu. Pak průnik η ∩ q spolu se zaměřením (Z(p) + Z(q))⊥ dávají parametrický popis hledané osy. Pokud jsou přímky rovnoběžné, bude mít úloha nekonečně mnoho řešení. 4.15. Odchylky. Stejně jako vzdálenost, i řada dalších geometrických pojmů jako odchylky, orientace, objem apod. je v bodových prostorech En zaváděna prostřednictvím vhodných pojmů ve vektorových euklidovských prostorech. Připoměňme, že odchylku dvou vektorů jsme definovali na konci třetí části druhé kapitoly, viz 2.42. Skutečně, z Cauchyovy nerovnosti plyne 0 ≤ |u·v| ∥u∥∥v∥ ≤ 1, měla tedy smysl definice odchylky φ(u, v) vektorů u, v ∈ V v reálném vektorovém prostoru se skalárním součinem vzta- hem cos φ(u, v) = u · v ∥u∥∥v∥ , 0 ≤ φ(u, v) ≤ 2π. To je zcela v souladu s praxí v dvourozměrném euklidovském prostoru R2 a naší filozofií, že pojem týkající se dvou věktorů je ve své podstatě záležitostí dvourozměrné geometrie. Ve vícerozměrných prostorech je proto odchylka dvou vektorů vždy měřena v rovině, kterou tyto vektory generují (nebo je nula) a náš definiční vztah odpovídá zvyklostem ve všech di- menzích. V libovolném reálném vektorovém prostoru se skalárním součinem přímo z definic plyne ∥u − v∥2 = ∥u∥2 + ∥v∥2 − 2(u · v) = ∥u∥2 + ∥v∥2 − 2∥u∥∥v∥ cos φ(u, v). To je patrně dobře známá kosinová věta z rovinné geometrie. Dále platí pro každou ortonormální bázi e zaměření V a nenulový vektor u ∈ V vztah ∥u∥2 = ∑ i |u·ei|2 . Podělením této rovnice číslem ∥u∥2 dostáváme 1 = ∑ i (cos φ(u, ei))2 , 183 4.19. Na kolik částí mohou dělit prostor (R3 ) tři roviny? Pro každou možnost popište odpovídající případ. 4.20. Rozhodněte, zda leží bod [2, 1, 0] uvnitř konvexního obalu bodů [0, 2, 1], [1, 0, 1], [3, −2, −1], [−1, 0, 1]. Řešení. Sestavíme nehomogenní lin. soustavu, pro koeficienty t1, t2, t3, t4, afinní kombinace daných bodů, která dává první bod (jsou určeny jednozačně, pokud dané body neleží v rovině).     0 1 3 −1 2 0 −2 0 1 1 −1 1 1 1 1 1         t1 t2 t3 t4     =     2 1 0 1     . Poslední rovnice udává, že jde o afinní kombinaci. Jejím řešením dostáváme (t1, t2, t3, t4) = (1, 0, 1/2, −1/2), nejedná se tedy o konvexní kombinaci. (nelze odvodit pomocí projekcí na jednotlivé osy). 4.21. Určete odchylku rovin σ : [1, 0, 2] + (1, −1, 1)t + (0, 1, −2)s ρ : [3, 3, 3] + (1, −2, 0)t + (0, 1, 1)s Řešení. Průsečnice má směrový vektor (1, −1, 1), kolmá rovina na ni má pak s danými rovinami průniky generované vektory (1, 0, −1) a (0, 1, 1). Tyto jednorozměrné podprostory svírají úhel 60◦ . 4.22. Je dán rovnoběžník [0, 0, 1], [2, 1, 1], [3, 3, 1], [1, 2, 1]. Určete bod X na přímce p : [0, 0, 1] + (1, 1, 1)t tak, aby rovnoběžnostěn určený daným rovnoběžníkem a bodem X měl objem 1. Řešení. Sestavíme determinant udávající objem rovnoběžnostěnu při pohyblivém bodu X: t t t 2 1 0 1 2 0 . Podmínka, že má být roven jedné dává t = 1/3. 4.23. Je dána krychle ABCDA′ B′ C′ D′ (ve standardním označení, tj. ABCD a A′ B′ C′ D′ jsou stěny, AA′ pak hrana). Určete odchylku vektorů AB′ a AD′ . Řešení. Uvažujme krychli o hraně 1 a umístěme ji v R3 tak, že bod A bude mít ve standardní bázi souřadnice [0, 0, 0], bod B pak souřadnice [1, 0, 0] a bod C souřadnice [1, 1, 0]. Potom má bod B′ souřadnice [1, 0, 1] a bod D′ souřadnice [0, 1, 1]. Pro vyšetřované vektory tedy můžeme psát AB′ = B′ −A = [1, 0, 1]−[0, 0, 0] = (1, 0, 1), AD′ = D′ − A = [0, 1, 1] − [0, 0, 0] = (0, 1, 1). Podle definice odchylky φ těchto vektorů je pak cos(φ) = (1, 0, 1) · (0, 1, 1) ∥ (1, 0, 1) ∥∥ (0, 1, 1) ∥ = 1 2 , 1. AFINNÍ A EUKLIDEOVSKÁ GEOMETRIE což je obvyklé tvrzení o směrových kosinech φ(u, ei) vektoru u. Z definice odchylek vektorů nyní můžeme dovodit rozumné definice pro odchylky obecných podprostorů v libovolném euklidovském vektorovém prostoru. Je přitom třeba rozhodnutí, jak se stavět k případům, kdy podprostory mají netriviální průnik. Např. za odchylku dvou přímek budeme chtít patrně brát menší ze dvou možných úhlů, u dvou nerovnoběžných rovin v R3 nebudeme chtít slyšet, že mají odchylku nula, protože mají společný alespoň jeden směr: 4.16. Definice. Nechť U1, U2 jsou konečněrozměrné podprostory v euklidovském vektorovém prostoru V libovolné dimenze. Odchylka podprostorů U1, U2 je reálné číslo α = φ(U1, U2) ∈ [0, π 2 ] splňující: (1) Je-li dim U1 = dim U2 = 1, U1 = ⟨u⟩, U2 = ⟨v⟩, pak cos α = |u.v| ∥u∥∥v∥ . (2) Jsou-li dimenze U1, U2 kladné a U1 ∩ U2 = {0}, pak je odchylka minimem všech odchylek jednorozměrných podprostorů α = min{φ(⟨u⟩, ⟨v⟩); 0 ̸= u ∈ U1, 0 ̸= v ∈ U2}. Ukážeme v zápětí, že takové minimum skutečně vždy existuje. (3) Je-li U1 ⊂ U2 nebo U2 ⊂ U1 (zejména je-li jeden z nich nulový), je α = 0. (4) Je-li U1 ∩ U2 ̸= {0} a U1 ̸= U1 ∩ U2 ̸= U2, pak α = φ(U1 ∩ (U1 ∩ U2)⊥ , U2 ∩ (U1 ∩ U2)⊥ ). Odchylka podprostorů Q1, Q2 v bodovém euklidovském prostoru En se definuje jako odchylka jejich zaměření Z(Q1), Z(Q2). Všimněme si, že odchylka je vždy dobře definována, zejména v posledním případě je (U1 ∩ (U1 ∩ U2)⊥ ) ∩ (U2 ∩ (U1 ∩ U2)⊥ ) = {0} můžeme tedy opravdu odchylku určit podle bodu (2). Všimněme si také, že v případě U1 ∩U2 = {0}, jsou U1 a U2 kolmé podle našich dřívějších definic právě, když jejich odchylka je π/2. Pokud však mají netriviální průnik, nemohou být kolmé v dřívějším smyslu. Ke korektosti definice zbývá ukázat, že ve skutečnosti vždy existují vektory u ∈ U1, v ∈ U2, pro které nabývá výraz pro odchylku požadovaného minima. Nejdříve speciální případ: 4.17. Lemma. Nechť v je vektor v euklidovském prostoru V a U ⊂ V libovolný podprostor. Označme v1 ∈ U, v2 ∈ U⊥ (jednoznačně určené) komponenty vektoru v, tj. v = v1 + v2. Pak pro odchylku φ podprostoru generovaného v od U platí cos φ(⟨v⟩, U) = cos φ(⟨v⟩, ⟨v1⟩) = ∥v1∥ ∥v∥ . 184 1. AFINNÍ GEOMETRIE tedy φ = 60◦ . 4.24. Parametricky vyjádřete průnik následujících rovin v R3 : σ : 2x + 3y − z + 1 = 0 a ρ : x − 2y + 5 = 0. 4.25. Najděte příčku přímek (úsečku, jejíž jeden koncový bod leží na jedné z přímek, druhý pak na druhé z nich) p : [1, 1, 1] + t(2, 1, 0), q : [2, 2, 0] + t(1, 1, 1), takovou, že přímka jí určená prochází bodem [1, 0, 0]. 4.26. Určete osu mimoběžek p : [3, 0, 3] + (0, 1, 2)t q : [0, −1, −2] + (1, 2, 3)t. 4.27. Nalezněte osu mimoběžek p : [1, 1, 1] + t(2, 1, 0), q : [2, 2, 0] + t(1, 1, 1). 4.28. Určete patu kolmice spuštěné z bodu [0, 0, 7] na rovinu ρ : [0, 5, 3] + (1, 2, 1)t + (−2, 1, 1)s. 4.29. Napište matici B afinního zobrazení f daného ve standardní bázi v R2 jako f (x1, x2) = ( 2 1 0 1 ) ( x1 x2 ) + ( 1 1 ) souřadné soustavě dané bází u = {(1, 1), (−1, 1)} a počátkem [2, 0]. Řešení. Matice přechodu od dané báze u ke standardní bázi k je ( 1 −1 1 1 ) . Matici zobrazení v bázi ([2, 0], u) získáme tak, že nejprve transformujeme souřadnice priklané v bázi ([2, 0], u) na souřadnice ve standardní bázi, tedy v bázi ([0, 0], (1, 0), (0, 1)), poté aplikujeme matici zobrazení f ve standardní bázi a na závěr výsledek transformujeme zpět do souřadnic v bázi ([2, 0], u). Transformační rovnice přechodu od suouřadnic y1, y2 v bázi ([2, 0], u) k souřadnicím x1, x2 v standardní bázi jsou ( x1 x2 ) = ( 1 −1 1 1 ) ( y1 y2 ) + ( 2 0 ) . Odtud máme, že ( y1 y2 ) = ( 1 −1 1 1 )−1 (( x1 x2 ) − ( 2 0 ) . ) = ( 1 2 1 2 −1 2 1 2 ) ( x1 x2 ) + ( −1 1 ) . CHAPTER 4. ANALYTICKÁ GEOMETRIE Důkaz. Pro všechny vektory u ∈ U platí díky Cauchyově nerovnosti |u · v| ∥u∥∥v∥ = |u · (v1 + v2)| ∥u∥∥v∥ = |u · v1| ∥u∥∥v∥ ≤ ∥u∥∥v1∥ ∥u∥∥v∥ = ∥v1∥ ∥v∥ = ∥v1∥2 ∥v∥∥v1∥ = |v1 · v| ∥v∥∥v1∥ . Odtud plyne cos φ(⟨v⟩, ⟨u⟩) ≤ cos φ(⟨v⟩, ⟨v1⟩) = ∥v1∥ ∥v∥ a námi nalezený vektor v1 tedy představuje největší možnou hodnotu pro kosinus úhlu mezi všemi volbami vektorů z U. Protože je funkce cos na intervalu [0, π 2 ] klesající, dostáváme tak nejmenší možný úhel a tvrzení je dokázané. 4.18. Výpočet odchylek. Postupu v předchozím lemmatu můžeme rozumět tak, že jednorozměrný podprostor generovaný vektorem v kolmo promítneme do podprostoru U a podíváme se, jak moc se obrazy zmenšují. Podle toho pak poznáme odchylku. Podobný postup použijeme ve vyšších dimenzích také. Potíž je přitom ale s rozpoznáním, které směry nám svými průměty odchylku skutečně prozradí. V našem předchozím případě to můžeme dobře vidět, pokud nešikovně budeme promítat větší prostor U do jednorozměrného ⟨v⟩ a pak kolmo zpět do U. Zjistíme, že odchylku poznáme podle směru vlastního vektoru takového zobrazení, jeho vlastní číslo bude kvadrátem příslušného kosinu úhlu. Uvažujme tedy dva obecné podprostory U1, U2 v euklidovském vektorovém prostoru V , předpokládejme U1∩U2 = {0}, a zvolme pevně ortonormální báze e, a e′ celého prostoru V tak, aby U1 = ⟨e1, . . . , ek⟩, U2 = ⟨e′ 1, . . . , e′ l⟩. Uvažujme kolmý průmět φ prostoru V na U2, jeho zúžení na U1 budeme opět značit φ : U1 → U2. Zobrazení ψ : U2 → U1 nechť vznikne podobně z kolmého průmětu na U1. Tato zobrazení mají v bazích (e1, . . . , ek) a (e′ 1, . . . , e′ l) matice A =    e1 · e′ 1 . . . ek · e′ 1 ... ... e1 · e′ l . . . ek · e′ l    , B =    e′ 1 · e1 . . . e′ l · e1 ... ... e′ 1 · ek . . . e′ l · ek    Protože jde o skalární součiny na reálném vektorovém prostoru, platí ei · e′ j = e′ j · ei pro všechny indexy i, j a proto zejména platí B = AT . Složené zobrazení ψ ◦ φ : U1 → U1 má tedy symetrickou pozitivně semidefinitní matici AT A a ψ je zobrazení adjungované k φ. Viděli jsme, že každé takové zobrazení má pouze nezáporná reálná vlastní čísla a že má ve vhodné ortonormální bázi diagonální matici s těmito vlastními čísly na diagonále, viz 3.25 a 3.27. Nyní můžeme odvodit obecný postup pro výpočet odchylky α = φ(U1, U2). Věta. V předchozím označení nechť λ je největší vlastní hodnota matice AT A. Pak cos2 α = λ 185 Pro matici zobrazení pak dostáváme B = ( 1 2 1 2 −1 2 1 2 ) [( 2 1 0 1 ) (( 1 −1 1 1 ) + ( 2 0 )) + ( 1 1 )] + ( −1 1 ) = ( 2 0 −1 1 ) + ( 2 −1 ) 4.30. Mějme dánu standardní souřadnou soustavu v trojrozměrném Eukleidovském prostoru. Agent K sídlí v bodě S o souřadnicích [0, 1, 2] a ústředí mu přidělilo pro používání souřadnou soustavu s počátkem S a bází {(1, 1, 0), (−1, 0, 1), (0, 1, 2)}. Agent Sokol bydlí domě D na kótě [1, 1, 1] a používá souřadnou soustavu s bází {(0, 0, 1), (−1, 1, 2), (1, 0, 1)}. Agent K žádá Sokola o schůzku v cihelně, která leží podle jeho souřadné soustavy v bodě [1, 1, 0]. Kam má přijít Sokol (podle jeho souřadnic)? Řešení. Matice přechodu od báze agenta K k Sokolově bázi (při stejných počátcích) je T =   −4 2 −1 1 0 1 2 −1 1   Vektor (0, 1, 2) má tedy souřadnice T · (0, 1, 2)T = (0, 2, 1)T , posunutím počátku (přičteme vektor (−1, 0, 1)) dostáváme výsledek (−1, 2, 2). 2. Eukleidovská geometrie 4.31. Určete vzdálenost přímek v R3 . p : [1, −1, 0] + t(−1, 2, 3), a q : [2, 5, −1] + t(−1, −2, 1). Řešení. Vzdálenost je dána jako velikost kolmého průmětu libovolné příčky (spojnice) daných přímek do ortogonálního doplňku vektorového podprostoru generovaného jejich zaměřeními. Tento ortogonální doplňek zjistíme například pomocí vektorového součinu: ⟨(−1, 2, 3), (−1, −2, 1)⟩⊥ = ⟨(−1, 2, 3)×(−1, −2, 1)⟩ = ⟨(8, −2, 4)⟩ = ⟨(4, −1, 2)⟩ Spojnicí daných přímek je například úsečka [1, −1, 0][2, 5, −1], promítneme tedy vektor [1, −1, 0] − [2, 5, −1] = (−1, −6, 1). Pro vzdálenost přímek pak dostáváme: ρ(p, q) = |(−1, −6, 1) · (4, −1, 2)| ∥(4, −1, 2)∥ = 4 √ 21 . 1. AFINNÍ A EUKLIDEOVSKÁ GEOMETRIE Důkaz. Nechť u ∈ U1 je vlastní vektor zobrazení ψ ◦ φ příslušný největší vlastní hodnotě λ. Uvažme všechna vlastní čísla λ1, . . . , λk (včetně násobnosti) a nechť u = (u1, . . . , un) je příslušná ortonormální báze U1 z vlastních vektorů. Můžeme přímo předpokládat, že λ = λ1, u = u1. Potřebujeme ukázat, že odchylka libovolného v ∈ U1 od U2 je nejméně tak velká jako odchylka u od U2. Tzn. že kosinus příslušného úhlu nesmí být větší. Podle předchozího lemmatu stačí diskutovat odchylku u a φ(u) ∈ U2 a přitom víme, že ∥u∥ = 1. Zvolme tedy v ∈ U1, v = a1u1 + · · · + akuk, ∑k i=1 a2 i = ∥v∥2 = 1. Pak ∥φ(v)∥2 = φ(v) · φ(v) = (ψ ◦ φ(v)) · v ≤ ∥ψ ◦ φ(v)∥∥v∥ = ∥ψ ◦ φ(v)∥. Předchozí lemma navíc dává i vzorec pro odchylku α vektoru v od podprostoru U2 cos α = ∥φ(v)∥ ∥v∥ = ∥φ(v)∥. Protože jsme zvolili za λ1 největší z vlastních hodnot a součet kvadrátů souřadnic a2 i je jedna, dostáváme (cos α)2 = ∥φ(v)∥2 ≤ ∥ψ ◦ φ(v)∥ = k∑ i=1 (λiai)2 = = λ2 1 + k∑ i=1 a2 i (λ2 i − λ2 1) ≤ √ λ2 1. Při v = u dostáváme ovšem přesně ∥φ(v)∥2 = λ2 1∥v∥2 = λ2 a tedy odchylka dosahuje pro tento vektor minimální možné hodnoty. Tím je věta dokázána. 4.19. Počítání objemu. S náznakem počítání objemu jsme se již setkali v rovinné geometrii v konci páté části první kapitoly (viz 1.34). Zjistili jsme přitom, že že podstatným pojmem je přitom tzv. orientace, kterou jsme si mohli představit jako rozhodnutí, zda se na naši rovinu R2 díváme zhora či zezdola. Rozdíl je přitom v pořadí standardních bázových vektorů e1 a e2 na jednotkové kružnici. Stejně postupujeme obecně. Říkáme, že dvě báze u a v reálného vektorového prostoru V určují stejnou orientaci, jestliže má matice přechodu mezi nimi kladný determinant. Formálněji vzato, orientací reálného vektorového prostoru V tedy rozumíme třídu ekvivalence bazí u vzhledem k ekvivalenci, kterou jsme pomocí znaménka determinantu právě zavedli. Ekvivalentním bazím v tomto smyslu také říkáme souhlasné se zvolenou orientací. Přímo z definice pak vyplývá, že na každém vektorovém prostoru jsou právě dvě orientace. Z každé souhlasné báze získáme snadno nesouhlasnou pomocí libovolné matice přechodu se záporným determinantem. Vektorový prostor se zvolenou orientací nazýváme orientovaný vektorový prostor. 186 2. EUKLEIDOVSKÁ GEOMETRIE 4.32. V euklidovském prostoru R5 stanovte vzdálenost rovin ϱ1 : [7, 2, 7, −1, 1] + t1 (1, 0, −1, 0, 0) + s1 (0, 1, 0, 0, −1) , t1, s1 ∈ R, ϱ2 : [2, 4, 7, −4, 2] + t2 (1, 1, 1, 0, 1) + s2 (0, −2, 0, 0, 3) , t2, s2 ∈ R a poté vzdálenost rovin σ1 : [0, 1, 2, 0, 0] + p1 (2, 1, 0, 0, 1) + q1 (−2, 0, 1, 1, 0) , p1, q1 ∈ R, σ2 : [3, −1, 7, 7, 3] + p2 (2, 2, 4, 0, 3) + q2 (2, 0, 0, −2, −1) , p2, q2 ∈ R. Řešení. Případ ϱ1, ϱ2. Nejprve určíme ortogonální doplněk součtu zaměření zadaných dvou rovin tak, e směrové vektory rovin napí eme do řádků matice a tuto matici pomocí elementárních řádkových transformací převedeme na schodovitý tvar. Tím dostaneme     1 0 −1 0 0 0 1 0 0 −1 1 1 1 0 1 0 −2 0 0 3     ∼ · · · ∼     1 0 −1 0 0 0 1 0 0 −1 0 0 1 0 1 0 0 0 0 1     . Hledaný ortogonální doplněk tak je ⟨(0, 0, 0, 1, 0)⟩. (Pochopitelně bylo očividné, e vektor (0, 0, 0, 1, 0) nále í do uva ovaného ortogonálního doplňku. Úpravou na schodovitý tvar jsme v ak zjistili, e ortogonální doplněk je jednodimenzionální.) Vzdálenost rovin je rovna velikosti kolmého průmětu vektoru A1 − A2 do podprostoru ⟨(0, 0, 0, 1, 0)⟩ pro libovolné body A1 ∈ ϱ1, A2 ∈ ϱ2. Zvolme kupř. A1 = [7, 2, 7, −1, 1], A2 = [2, 4, 7, −4, 2]. Zřejmě je kolmý průmět A1 − A2 = (5, −2, 0, 3, −1) do ⟨(0, 0, 0, 1, 0)⟩ roven (0, 0, 0, 3, 0). Velikost vektoru (0, 0, 0, 3, 0) dává výslednou vzdálenost 3. Případ σ1, σ2. Součet zaměření rovin σ1, σ2 je generován směrovými vektory. Označme je u1 = (2, 1, 0, 0, 1) , u2 = (−2, 0, 1, 1, 0) , v1 = (2, 2, 4, 0, 3) , v2 = (2, 0, 0, −2, −1) . Nalezněme body X1 ∈ σ1, X2 ∈ σ2, ve kterých se vzdálenost rovin σ1, σ2 realizuje. Víme, e je X1 − X2 = [0, 1, 2, 0, 0] − [3, −1, 7, 7, 3] + p1u1 + q1u2 − p2v1 − q2v2 = (−3, 2, −5, −7, −3) + p1u1 + q1u2 − p2v1 − q2v2 a e má platit ⟨ X1 − X2, u1 ⟩ = 0, ⟨ X1 − X2, u2 ⟩ = 0, ⟨ X1 − X2, v1 ⟩ = 0, ⟨ X1 − X2, v2 ⟩ = 0, tj. ⟨ (−3, 2, −5, −7, −3), u1 ⟩ + p1 ⟨ u1, u1 ⟩ + q1 ⟨ u2, u1 ⟩ − p2 ⟨ v1, u1 ⟩ − q2 ⟨ v2, u1 ⟩ = 0, CHAPTER 4. ANALYTICKÁ GEOMETRIE Orientovaný (bodový) euklidovský prostor je euklidovský bodový prostor, jehož zaměření je orientované. V dalším budeme uvažovat standardní En spolu s orientací zadanou standardní bazí Rn . Nechť u1, . . . , uk, jsou libovolné vektory v zaměření Rn , A ∈ En je libovolný bod. Rovnoběžnostěn Pk(A; u1, . . . , uk) ⊂ En jsme definovali jako příklad konvexní množiny Pk(A; u1, . . . , uk) = {A + c1u1 + · · · + ckuk; 0 ≤ ci ≤ 1}. Jsou-li vektory u1, . . . , uk nezávislé, hovoříme o k– rozměrném rovnoběžnostěnu Pk(A; u1 . . . , uk) ⊂ En. Pro dané vektory u1, . . . , uk máme k dispozici také rovnoběžnostěny menších dimenzí P1(A; u1), . . . , Pk(A; u1, . . . , uk) v euklidovských podprostorech A + ⟨u1⟩, . . . , A + ⟨u1, . . . , uk⟩. Jsou-li u1, . . . , uk lineárně závislé definujeme objem Vol Pk = 0. Jinak uvažujeme jako při Grammově–Schmidtově ortogona- lizaci ⟨u1, . . . , uk⟩ = ⟨u1, . . . , uk−1⟩⊕⟨u1, . . . , uk−1⟩⊥ ∩⟨u1, . . . , uk⟩. V tomto rozkladu se uk jednoznačně vyjádří jako uk = u′ k + ek kde ek ⊥ ⟨u1, . . . , uk−1⟩. Absolutní hodnotu objemu rovnoběžnostěnu definujeme induktivně tak, abychom naplnili představu, že jde o součin objemu „základny“ a „výšky“: | Vol |P1(A; u1) = ∥u1∥ | Vol |Pk(A; u1, . . . , uk) = ∥ek∥| Vol |Pk−1(A; u1, . . . , uk−1). Je-li u1, . . . , un báze souhlasná s orientací V , definujeme (orientovaný) objem rovnoběžnostěnu Vol Pk(A; u1, . . . , un) = | Vol |Pk(A; u1, . . . , un), v případě neosuhlasné báze klademe Vol Pk(A; u1, . . . , un) = −| Vol |Pk(A; u1, . . . , un). Následující tvrzení objasňuje naše dřívější poznámky, že determinant je v jistém smyslu nástroj vyjadřující objem. První tvrzení totiž říká právě, že na k–rozměrném prostoru dostaneme objem rovnoběžnostěnu nataženého na k vektorů tak, že jejich souřadnice (v ortonormální bázi) napíšeme do sloupců matice a spočteme determinant. Výrazu ve druhém tvrzení se říká Grammův determinant. Jeho výhoda je, že je zcela nezávislý na volbě báze a zejména se s ním proto lépe pracuje v případě k menšího než je dimenze celého prostoru. Věta. Nechť Q ⊂ En je euklidovský podprostor a nechť (e1, . . . , ek) je jeho ortonormální báze. Pak pro libovolné vektory u1, . . . , uk ∈ Z(Q) a A ∈ Q platí 187 ⟨ (−3, 2, −5, −7, −3), u2 ⟩ + p1 ⟨ u1, u2 ⟩ + q1 ⟨ u2, u2 ⟩ − p2 ⟨ v1, u2 ⟩ − q2 ⟨ v2, u2 ⟩ = 0, ⟨ (−3, 2, −5, −7, −3), v1 ⟩ + p1 ⟨ u1, v1 ⟩ + q1 ⟨ u2, v1 ⟩ − p2 ⟨ v1, v1 ⟩ − q2 ⟨ v2, v1 ⟩ = 0, ⟨ (−3, 2, −5, −7, −3), v2 ⟩ + p1 ⟨ u1, v2 ⟩ + q1 ⟨ u2, v2 ⟩ − p2 ⟨ v1, v2 ⟩ − q2 ⟨ v2, v2 ⟩ = 0. Vyčíslením těchto skalárních součinů získáváme soustavu lineárních rovnic 6p1 − 4q1 − 9p2 − 3q2 = 7, −4p1 + 6q1 + 6q2 = 6, 9p1 − 33p2 − q2 = 31, 3p1 − 6q1 − p2 − 9q2 = −11, kterou vyře íme pomocí řádkových transformací v maticovém zápisu     6 −4 −9 −3 7 −4 6 0 6 6 9 0 −33 −1 31 3 −6 −1 −9 −11     ∼ · · · ∼     1 0 0 0 0 0 1 0 0 −1 0 0 1 0 −1 0 0 0 1 2     . Ře ením této soustavy je tedy čtveřice (p1, q1, p2, q2) = (0, −1, −1, 2). Určili jsme X1−X2 = (−3, 2, −5, −7, −3)−u2+v1−2v2 = (−3, 4, −2, −4, 2). Velikost vektoru (−3, 4, −2, −4, 2) a současně vzdálenost rovin σ1, σ2 činí 7 = √ (−3)2 + 42 + (−2)2 + (−4)2 + 22. Vzdálenost ϱ1 od ϱ2 jsme určovali odli ným způsobem ne vzdálenost σ1 od σ2. Uvedené metody jsme samozřejmě mohli pou ít v obou případech. Zkusme znovu vypočítat vzdálenost rovin σ1, σ2 postupem pou itým k vyčíslení vzdálenosti rovin ϱ1, ϱ2. Hledejme tedy ortogonální doplněk vektorového podprostoru generovaného vektory (2, 1, 0, 0, 1) , (−2, 0, 1, 1, 0) , (2, 2, 4, 0, 3) , (2, 0, 0, −2, −1) . Snadno získáme    2 1 0 0 1 −2 0 1 1 0 2 2 4 0 3 2 0 0 −2 −1     ∼ · · · ∼     1 0 0 0 3/2 0 1 0 0 −2 0 0 1 0 1 0 0 0 1 2     , odkud dostáváme ortogonální doplněk ⟨(−3/2, 2, −1, −2, 1)⟩, příp. jej raději zapi me jako ⟨(3, −4, 2, 4, −2)⟩. Připomeňme, e vzdálenost σ1 vůči σ2 se rovná velikosti kolmého průmětu vektoru (rozdílu libovolného bodu σ1 a libovolného bodu σ2) 1. AFINNÍ A EUKLIDEOVSKÁ GEOMETRIE (1) Vol Pk(A; u1, . . . , uk) = det    u1 · e1 . . . uk · e1 ... ... u1 · ek . . . uk · ek    (2) (Vol Pk(A; u1, . . . , uk))2 = det    u1 · u1 . . . uk · u1 ... ... u1 · uk . . . uk · uk    Důkaz. Matice A =    u1 · e1 . . . uk · e1 ... ... u1 · ek . . . uk · ek    má ve sloupcích souřadnice vektorů u1, . . . , uk ve zvolené ortonormální bázi. Platí |A|2 = |A||A| = |AT ||A| = |AT A| = det    u1 · u1 . . . uk · u1 ... ... u1 · uk . . . uk · uk    . Vidíme tedy, že pokud platí (1), platí i (2). Přímo z definice je neorientovaný objem roven součinu | Vol |Pk(A; u1, . . . , uk) = ∥v1∥∥v2∥ . . . ∥vk∥, kde v1 = u1, v2 = u2 + a2 1v1, . . . , vk = uk + ak 1v1 + · · · + ak k−1vk−1 je výsledek Grammova-Schmidtova ortogonalizačního procesu. Je tedy (Vol Pk(A; u1, . . . , uk))2 = det    v1 · v1 0 . . . 0 ... ... 0 0 . . . vk · vk    = det    v1 · v1 . . . vk · v1 ... ... v1 · vk . . . vk · vk    . Označme B matici jejíž sloupce jsou souřadnice vektorů v1, . . . , vk v ortonormální bázi e. Protože v1, . . . , vk vznikly z u1, . . . , uk jako obrazy v lineární transformaci s horní trojúhelníkovou maticí C s jedničkami na diagonále, je B = CA a |B| = |C||A| = |A|. Pak ovšem |A|2 = |B|2 = |A||A|, proto Vol Pk(A; u1, . . . , uk) = ±|A|. Přitom pokud jsou vektory u1, . . . , uk závislé vyjde objem nulový, pokud jsou nezávislé, pak znaménko determinantu je kladné právě když je báze u1, . . . , uk kompatibilní s orientací danou bazí e. V geometrické formulaci dostáváme jako velice důžitý důsledek následující tvrzení: 4.20. Důsledek. Pro každé lineární zobrazení φ : V → V euklidovského vektorového prostoru V je det φ roven (orientovanému) objemu obrazu rovnoběžnostěnu určeného vektory ortonormální báze. Obecněji, obraz rovnoběžnostěnu P určeného libovolnými dim V vektory má objem roven det φ– násobku původního objemu. 188 2. EUKLEIDOVSKÁ GEOMETRIE u = (3, −2, 5, 7, 3) = [3, −1, 7, 7, 3] − [0, 1, 2, 0, 0] do tohoto ortogonálního doplňku. Označme zmíněný kolmý průmět u symbolem pu a polo me v = (3, −4, 2, 4, −2). Zřejmě je pu = a · v pro nějaké a ∈ R a má platit ⟨ u − pu, v ⟩ = 0, tj. ⟨ u, v ⟩ − a ⟨ v, v ⟩ = 0. Vyčíslení dává 49 − a · 49 = 0. Je tudí pu = 1 · v = v a vzdálenost rovin σ1, σ2 je rovna || pu || = √ 32 + (−4)2 + 22 + 42 + (−2)2 = 7. Ukázalo se, e výpočet vzdálenosti pomocí ortogonálního doplňku součtu zaměření byl v přede lém příkladu „rychlej í cestou k výsledku“. Pro roviny ϱ1 a ϱ2 tomu bude nepochybně stejně. Druhá metoda ov em dává body, ve kterých se vzdálenost realizuje (body, kde si jsou roviny nejblí e). Nalezněme proto s její pomocí takové body v případě rovin ϱ1, ϱ2. Označme u1 = (1, 0, −1, 0, 0) , u2 = (0, 1, 0, 0, −1) , v1 = (1, 1, 1, 0, 1) , v2 = (0, −2, 0, 0, 3) . Body X1 ∈ ϱ1, X2 ∈ ϱ2, ve kterých se vzdálenost rovin realizuje, mů eme vyjádřit jako X1 = [7, 2, 7, −1, 1] + t1u1 + s1u2, X2 = [2, 4, 7, −4, 2] + t2v1 + s2v2, a tedy X1 − X2 = [7, 2, 7, −1, 1] − [2, 4, 7, −4, 2] + t1u1 + s1u2 − t2v1 − s2v2 = (5, −2, 0, 3, −1) + t1u1 + s1u2 − t2v1 − s2v2. Skalární součiny ⟨ X1 − X2, u1 ⟩ = 0, ⟨ X1 − X2, u2 ⟩ = 0, ⟨ X1 − X2, v1 ⟩ = 0, ⟨ X1 − X2, v2 ⟩ = 0 pak vedou na soustavu lineárních rovnic 2t1 = −5, 2s1 + 5s2 = 1, −4t2 − s2 = −2, −5s1 − t2 − 13s2 = −1 s jediným ře ením t1 = −5/2, s1 = 41/2, t2 = 5/2, s2 = −8. Získali jsem tak X1 = [7, 2, 7, −1, 1] − 5 2 u1 + 41 2 u2 = [ 9 2 , 45 2 , 19 2 , −1, − 39 2 ] , X2 = [2, 4, 7, −4, 2] + 5 2 v1 − 8v2 = [ 9 2 , 45 2 , 19 2 , −4, − 39 2 ] . Nyní ji snadno ověříme, e vzdálenost bodů X1, X2 (a současně vzdálenost rovin ϱ1, ϱ2) je || X1 − X2 || = || (0, 0, 0, 3, 0) || = 3. CHAPTER 4. ANALYTICKÁ GEOMETRIE 4.21. Vnější a vektorový součin vektorů. Předchozí úvahy úzce souvisí s tzv. vnějším tensorovým součinem vektorů. Nebudeme zacházet podrobně do této technicky poněkud nepřehledné oblasti, ale zmíníme alespoň případ vnějšího součinu n = dim V vektorů u1, . . . , un ∈ V . Nechť (u1j , . . . , unj )T jsou souřadná vyjádření vektorů uj v nějaké pevně zvolené ortonormální bázi V a M nechť je matice s prvky (uij ). Pak determinant |M| nezávisí na volbě báze a jeho hodnotu nazýváme vnějším součinem vektorů u1, . . . , un a značíme [u1, . . . , un]. Vnější součin je tedy právě orientovaný objem příslušného rovnoběžnostěnu, viz 4.19. Přímo z definice nyní vyplývají užitečné vlastnosti vnějšího součinu (1) Zobrazení (u1, . . . , un) → [u1, . . . , un] je antisymetrické n–lineární zobrazení. Tzn., že je lineární ve všech argumentech a výměna dvou argumentů se vždy projeví změnou znaménka výsledku. (2) Vnější součin je nulový právě, když jsou vektory u1, . . . , un lineárně závislé (3) Vektory u1, . . . , un tvoří kladnou bázi právě, když je jejich vnější součin kladný. V technických aplikacích ve R3 se často používá velmi úzce související operace, tzv. vektorový součin, který dvojici vektorů přiřazuje vektor třetí. Uvažme obecný euklidovský vektorový prostor V dimenze n ≥ 2 a vektory u1, . . . , un−1 ∈ V . Dosadímeli těchto n − 1 vektorů jako prvních n − 1 argumentů n– lineárníhho zobrazení definovaného pomocí determinantu při výpočtu objemu výše, pak nám zbude jeden volný argument, tj. lineární forma na V . Protože však máme k dispozici skalární součin, odpovídá každá lineární forma právě jednomu vektoru. Tento vektor v ∈ V nazveme vektorový součin vektorů u1, . . . , un−1, tj. pro každý vektor w ∈ V platí ⟨v, w⟩ = [u1, . . . , un−1, w]. Značíme v = u1 × . . . × un−1. Jsou-li v nějaké ortonormální bázi souřadnice našich vektorů v = (y1, . . . , yn)T , w = (x1, . . . , xn)T a uj = (u1j , . . . unj )T , naše definice má vyjádření y1x1 + · · · + ynxn = u11 . . . u1(n−1) x1 ... ... ... un1 . . . un(n−1) xn. Odtud je přímo vidět, že vektor v je zadán jednoznačně a jeho souřadnice spočteme formálním rozvojem tohoto determinantu podle posledního sloupce. Zároveň jsou přímo z definice očekávatelné následující vlastnosti vektorového sou- činu: Věta. Pro vektorový součin v = u1 × . . . × un−1 platí (1) v ∈ ⟨u1, . . . , un−1⟩⊥ (2) v je nenulový vektor právě, když jsou vektory u1, . . . , un−1 lineárně nezávislé 189 4.33. Najděte průnik kolmé roviny spuštěné z bodu A = [1, 2, 3, 4] ∈ R4 na rovinu ϱ : [1, 0, 1, 0] + (1, 2, −1, −2)s + (1, 0, 0, 1)t, s, t ∈ R. Řešení. Nalezněme nejprve kolmou rovinu k ϱ. Její zaměření bude kolmé na zaměření ϱ, pro vektory (a, b, c, d) patřící do jejího zaměření dostáváme tedy soustavu rovnic (a, b, c, d) · (1, 2, −1, −2) = 0 ≡ a + 2b − c − 2d = 0 (a, b, c, d) · (1, 0, 0, 1) = 0 ≡ a + d = 0. Jejím řešením je dvojdimenzionální vektorový prostor ⟨(0, 1, 2, 0), (−1, 0, −3, 1)⟩. Rovina τ kolmá k rovině ϱ procházející bodem A má tedy parametrické vyjádření τ : [1, 2, 3, 4] + (0, 1, 2, 0)u + (−1, 0, −3, 1)v, u, v ∈ R. Průnik rovin potom můžeme získat pomocí obou parametrických vyjádření. Pro parametry popisující průnik tedy dostáváme soustavu rov- nic: 1 + s + t = 1 − v 2s = 2 + u 1 − s = 3 + 2u − 3v −2s + t = 4 + v, která má jediné řešení (musí tomu tak být, protože sloupce matice soustavy jsou dány lineárně nezávislými vektory zaměření obou rovin) s = −8/19, t = 34/19, u = −54/19, v = −26/19. Dosazením hodnot parametrů s a t do parametrického vyjádření roviny ϱ pak dostaneme souřadnice průniku [45/19, −16/19, 11/19, 18/19] (stejný výsledek pochopitelně obdržíme, dosadíme-li hodnoty parametrů u a v do parametrického vyjádření roviny τ). 4.34. Bodem [1, 2] ∈ R2 veďte přímku, která má odchylku 30◦ od přímky p : [0, 1] + t(1, 1). Řešení. Odchylka dvou přímek je dána úhlem, který svírají jejich směrové vektory. Stačí tedy najít směrový vektor v hledané přímky. Ten získáme například rotací směrového vektoru přímky p o 30◦ . Matice rotace o 30◦ je ( cos 30◦ − sin 30◦ sin 30◦ cos 30◦ ) = (√ 3 2 −1 2 1 2 √ 3 2 ) . Hledaný vektor v je tedy v = (√ 3 2 −1 2 1 2 √ 3 2 ) ( 1 1 ) = (√ 3 2 − 1 2√ 3 2 + 1 2 ) . 2. GEOMETRIE KVADRATICKÝCH FOREM (3) velikost ∥v∥ vektorového součinu je rovna absolutní hodnotě objemu rovnoběžníku P(0; u1, . . . , un−1) (4) (u1, . . . , un−1, v) je souhlasná báze orientovaného euklidovského prostoru V . Důkaz. První tvrzení plyne přímo z definičního vztahu pro v, protože dosazením libovolného vektoru uj za w máme nalevo skalární součin v · uj a napravo determinant s dvěma shodnými sloupci. Hodnost matice s n − 1 sloupci uj je dána maximální velikostí nenulového minoru. Minory, které zadávají souřadnice vektorového součinu jsou stupně n−1 a tím je dokázáno tvrzení (2). Jsou-li vektory u1, . . . , un−1 závislé, pak platí i (3). Nechť jsou tedy nezávislé, v je jejich vektorový součin a zvolme libovolnou ortonormální bázi (e1, . . . , en−1) prostoru ⟨u1, . . . , un−1⟩. Z již dokázáného vyplývá, že existuje nějaký násobek (1/α)v, 0 ̸= α ∈ R, takový, že (e1, . . . , ek, (1/α)v) je ortonormální báze celého V . Souřadnice našich vektorů v této bázi jsou uj = (u1j , . . . , u(n−1)j , 0)T , v = (0, . . . , 0, α)T . Proto je vnější součin [u1, . . . , un−1, v] roven (viz. definice vektorového součinu) [u1, . . . , un−1, v] = u11 . . . u1(n−1) 0 ... ... ... u(n−1)1 . . . u(n−1)(n−1) 0 0 . . . 0 α = ⟨v, v⟩ = α2 . Rozvojem determinantu podle posledního sloupce zároveň obdržíme α2 = α Vol P(0; u1, . . . , in−1). Odtud už vyplývají obě zbylá tvrzení věty. 2. Geometrie kvadratických forem V analytické geometrii roviny jsou po přímkách jako další nejjednodušší křivky na řadě tzv. kuželosečky. Jsou v kartézkých souřadnicích zadány kvadratickými rovnicemi a podle koeficientů poznáme, zda jde o kružnici, elipsu, parabolu nebo hyperbolu, případně ještě může jít o dvě přímky nebo bod (degenerované případy). Uvidíme, že naše nástroje umožní vcelku účinnou klasifikaci takovýchto objektů v libovolných konečných dimenzích i práci s nimi. 4.22. Kvadriky v En. V analogii k rovnicím kuželoseček v rovině začneme poznámkami o objektech v euklidovských bodových prostorech, které jsou v dané ortnonormální bázi zadány kvadratickými rovnicemi, hovoříme o kvadrikách. 190 2. EUKLEIDOVSKÁ GEOMETRIE Rotovat jsme mohli i v opačném smyslu. Hledaná přímka (jedna ze dvou možných) má tedy parametrické vyjádření [1, 2] + (√ 3 2 − 1 2 , √ 3 2 + 1 2 ) t. 4.35. Určete cos α, kde α je odchylka dvou sousedních stěn pravidelného osmistěnu (těleso, jehož stěny tvoří osm rovnostranných trojúhel- níků). Řešení. Odchylky libovolných dvou sousedních stěn jsou ze symetrie osmistěnu shodné. Rovněž tak nezáleží na jeho velikosti. Uvažujme osmistěn s délkou hrany 1, který je umístěn do standardní kartézské souřadné soustavy v R3 tak, že jeho těžiště je v bodě [0, 0, 0]. Jeho vrcholy jsou pak v bodech A = [ √ 2 2 , 0, 0], B = [0, √ 2 2 , 0], C = [− √ 2 2 , 0, 0], D = [0, − √ 2 2 , 0], E = [0, 0, − √ 2 2 ] a F = [0, 0, √ 2 2 ]. Určeme odchylku stěn CDF a BCF. Ta je dána odchylkou vektorů kolmých na jejich průnik a ležících v daných stěnách, tedy vekorů kolmých na CF. Těmi jsou vektory dané výškami z bodů D, resp. F na stranu CF v trojúhelnících CDF, resp. BCF. Výšky v rovostranném trojúhelníku splývají s těžnicemi, jedná se tedy o úsečky SD a SB, kde S je střed strany CF. Protože známe souřadnice bodů C a F, má bod S souřadnice [− √ 2 4 , 0, √ 2 4 ] a pro vektory máme SD = ( √ 2 4 , − √ 2 2 , − √ 2 4 ) a SB = ( √ 2 4 , √ 2 2 , − √ 2 4 ). Celkem cos α = ( √ 2 4 , − √ 2 2 , − √ 2 4 ) · ( √ 2 4 , √ 2 2 , − √ 2 4 ) ∥( √ 2 4 , − √ 2 2 , − √ 2 4 )∥∥( √ 2 4 , √ 2 2 , − √ 2 4 )∥ = − 1 3 . Je tedy α . = 132◦ . 4.36. V bodovém euklidovském prostoru R5 vypočtěte odchylku φ podprostorů U, V , jestli e je (a) U : [3, 5, 1, 7, 2] + t (1, 0, 2, −2, 1) , t ∈ R, V : [0, 1, 0, 0, 0] + s (2, 0, −2, 1, −1) , s ∈ R; (b) U : [4, 1, 1, 0, 1] + t (2, 0, 0, 2, 1) , t ∈ R, V : x1 + x2 + x3 + x5 = 7; (c) U : 2x1 − x2 + 2x3 + x5 = 3, V : x1 + 2x2 + 2x3 + x5 = −1; (d) U : [0, 1, 1, 0, 0] + t (0, 0, 0, 1, −1) , t ∈ R, V : [1, 0, 1, 1, 1] + r (1, −1, 2, 1, 0) + s (0, 1, 3, 2, 0) +p (1, 0, 0, 1, 0)+q (1, 3, 1, 0, 0) , r, s, p, q ∈ R; (e) U : [0, 2, 5, 0, 0] + t (2, 1, 3, 5, 3) + s (0, 3, 1, 4, −2) + r (1, 2, 4, 0, 3) , t, s, r ∈ R, CHAPTER 4. ANALYTICKÁ GEOMETRIE Zvolme v En pevně kartézskou souřadnou soustavu (tj. bod a ortonormální bázi zaměření) a uvažme obecnou kvadratickou rovnici pro souřadnice (x1, . . . , xn)T bodů A ∈ En n∑ i,j=1 aij xixj + n∑ i=1 2aixi + a = 0, kde bez újmy na obecnosti můžeme rovnou předpokládat symetrii aij = aji . Tuto rovnici můžeme zapsat jako f (u) + g(u)+a = 0 pro kvadratickou formu f (tj. zúžení symetrické bilineární formy F na dvojice stejných argumentů), lineární formu g a skalár a ∈ R a předpokládáme že alespoň jeden z koeficientů aij je nenulový (jinak by se jednalo o lineární rovnici popisující euklidovský podprostor). Začněme s kvadratickou částí, tj. bilineární symetrickou formou f : Rn × Rn → R. Stejně dobře můžeme přemýšlet o obecné symetrické bilineární formě na libovolném vektorovém prostoru. Pro libovolnou bázi na tomto vektorovém prostoru bude hodnota f (x) na vektoru x = x1e1+· · ·+xnen dána vztahem f (x) = F(x, x) = ∑ i,j xixj F(ei, ej ) = xT · A · x kde A = (aij ) je symetrická matice s prvky aij = F(ei, ej ). Takovýmto zobrazením f říkáme kvadratické formy a výše uvedený vzorec pro hodnotu formy s použitím zvolených souřadnic se nazývá analytický tvar formy. Jestliže změníme bázi ei na jinou bázi e′ 1, . . . , e′ n, dostaneme pro stejný vektor jiné souřadnice x = S · x′ (zde S je příslušná matice přechodu) a tedy f (x) = (S · x′ )T · A · (S · x′ ) = (x′ )T · (ST · A · S) · x′ . Předpokládejme opět, že je na našem vektorovém prostoru zadán skalární součin. Předchozí výpočet pak můžeme shrnout slovy, že matice bilineární formy F a tedy i kvadratické formy f se transformuje při změně souřadnic způsobem, který pro ortogonální změny souřadnic splývá s transformací matic zobrazení (skutečně, pak je S−1 = ST ). Tento výsledek můžeme intepretovat také jako následující pozoro- vání: Tvrzení. Nechť V je reálný vektorový prostor se skalárním součinem. Pak vztah φ → F, F(u, u) = ⟨φ(u), u⟩ zadává bijekci mezi symetrickými lineárními zobrazeními a kvadratickými formami na V . Důkaz. Skutečně, bilineární forma s pevně zadaným druhým argumentem je lineární formou αu = F( , u) a v přítomnosti skalárního součinu je nutně dána vztahem α(u)(v) = v · w pro vhodný vektor w. Klademe φ(u) = w. Přímo ze vztahu v souřadnicích výše pak vyplývá, že φ je lineární zobrazení s maticí A. Je tedy samoadjungované. 191 V : [0, 0, 0, 0, 0] + p (−1, 1, 1, −5, 0) + q (1, 5, 1, 13, −4) , p, q ∈ R; (f) U : [1, 1, 1, 1, 1] + t (1, 0, 1, 1, 1) + s (1, 0, 0, 1, 1) , t, s ∈ R, V : [1, 1, 1, 1, 1] + p (1, 1, 1, 1, 1) + q (1, 1, 0, 1, 1) + r (1, 1, 0, 1, 0) , p, q, r ∈ R. Řešení. Nejdříve připomeňme, že odchylka afinních podprostorů je definována jako odchylka jejich zaměření, a proto při počítání φ nezohledňujeme posunutí vyjádřená přičtením bodu (příp. pravé strany soustav rovnic). Varianta (a). Neboť oba podprostory U a V jsou jednodimenzionální, odchylka φ ∈ [0, π/2] je dána vzorcem cos φ = | (1,0,2,−2,1)·(2,0,−2,1,−1) | || (1,0,2,−2,1) ||·|| (2,0,−2,1,−1) || = 5√ 10· √ 10 . Je tedy cos φ = 1/2, tj. φ = π/3. Varianta (b). Známe směrový vektor (2, 0, 0, 2, 1) podprostoru U a normálový vektor (1, 1, 1, 0, 1) podprostoru V . Snadno můžeme stanovit úhel ψ = π/3, který svírají, a to ze vztahu cos ψ = (2,0,0,2,1)·(1,1,1,0,1) || (2,0,0,2,1) ||·|| (1,1,1,0,1) || = 3 3·2 . Nyní si stačí uvědomit, e je φ = π/2 − ψ = π/6 (odchylka φ je doplňkem úhlu ψ). Varianta (c). Nadroviny U a V jsou zadány pomocí normálových vektorů u = (2, −1, 2, 0, 1) a v = (1, 2, 2, 0, 1). Zřejmě je odchylka φ rovna úhlu, který svírají přímky se směrovými vektory u a v. Platí tudí (viz variantu (a)) cos φ = | (2,−1,2,0,1)·(1,2,2,0,1) | || (2,−1,2,0,1) ||·|| (1,2,2,0,1) || = 1 2 , tj. φ = π 3 . Varianta (d). Označme u = (0, 0, 0, 1, −1) , v1 = (1, −1, 2, 1, 0) , v2 = (0, 1, 3, 2, 0) , v3 = (1, 0, 0, 1, 0) , v4 = (1, 3, 1, 0, 0) a jako pu označme ortogonální projekci (kolmý průmět) vektoru u do zaměření podprostoru V (do vektorového podprostoru generovaného vektory v1, v2, v3, v4). Určíme-li pu, ze vzorce (4.2) cos φ = || pu || || u || pak toti obdr íme φ ∈ [0, π/2]. Víme, e pu = av1 + bv2 + cv3 + dv4 pro jisté hodnoty a, b, c, d ∈ R a e má být ⟨ pu − u, v1 ⟩ = 0, ⟨ pu − u, v2 ⟩ = 0, ⟨ pu − u, v3 ⟩ = 0, ⟨ pu − u, v4 ⟩ = 0. Odtud ji (dosazením za pu) plyne systém lineárních rovnic 2. GEOMETRIE KVADRATICKÝCH FOREM Z tohoto tvrzení vyplývá okamžitý důsledek, že pro každou kvadratickou formu f existuje ortonormální báze zaměření, ve které má f diagonální matici (a diagonální hodnoty jsou jednoznačně určeny až na pořadí). Předpokládejme tedy přímo rovnici ve tvaru n∑ i=1 λix2 i + n∑ i=1 bixi + b = 0. V dalším kroku pro souřadnice xi s λi ̸= 0 provedeme doplnění do čtverců, které „pohltí“ kvadráty i lineární členy týchž neznámých (tzv. Lagrangeův algoritmus, kterému se budeme obecněji věnovat níže) . Tak nám zůstanou nejvýše ty neznámé, pro které byl jejich koeficient u kvadrátu nulový, a získáme tvar n∑ i=1 λi(xi − pi)2 + n∑ j splňující λj = 0 bj xj + c = 0. To odpovídá posunutí počátku souřadnic o vektor se souřadnicemi pi a zároveň volbě báze zaměření tak, abychom dostali požadovaný diagonální tvar v kvadratické části. Ve výše odvozeném ztotožnění forem s symetrickými zobrazeními to znamená, že φ je diagonální na ortogonálním doplňku svého jádra. Pokud nám opravdu zůstaly nějaké lineární členy, můžeme upravit ortonormální bázi zaměření na jádru zobrazení φ tak, aby odpovídající lineární forma byla násobkem prvního prvku duální báze. Umíme tedy již dosáhnout výsledného tvaru k∑ i=1 λiy2 i + byk+1 + c = 0, kde k je hodnost matice kvadratické formy f . Pokud je b ̸= 0, můžeme ještě další změnou počátku dosáhnout vynulování konstanty c v rovnici. Celkem si tedy shrňme, že lineární člen se může (ale nemusí) objevit jen pokud je hodnost f menší než n, c ∈ R může být nenulové pouze když je b = 0. Výsledné rovnice nazýváme kanonickými analytickými tvary kvadrik. 4.23. Případ E2. Pro ilustraci předchozího postupu projděme celou diskusi ještě jednou pro nejjednodušší případ netriviální dimenze. Původní rovnice má tvar a11x2 + a22y2 + 2a12xy + a1x + a2y + a = 0. Volbou vhodné báze zaměření a následným doplněním čtverců dosáhneme tvaru (opět používáme stejného značení x, y pro nové souřadnice): a11x2 + a22y2 + a1x + a2y + a = 0 kde ai může být nenulové pouze v případě, že aii je nulové. Posledním krokem obecného postupu, tj. v dimenzi n = 2 jen případnou volbou posunutí, dosáhneme právě jedné z rovnic: 192 2. EUKLEIDOVSKÁ GEOMETRIE 7a + 7b + 2c = 1, 7a + 14b + 2c + 6d = 2, 2a + 2b + 2c + d = 1, 6b + c + 11d = 0. Ře ením této soustavy je (a, b, c, d) = (−8/19, 7/19, 13/19, −5/19), a tak pu = − 8 19 v1 + 7 19 v2 + 13 19 v3 − 5 19 v4 = (0, 0, 0, 1, 0) , cos φ = || (0, 0, 0, 1, 0) || || (0, 0, 0, 1, −1) || = 1 √ 2 = √ 2 2 . Je tedy φ = π/4. Varianta (e). Stanovme průnik zaměření uvedených podprostorů. Vektor (x1, x2, x3, x4, x5) nale í do zaměření U, právě kdy je (x1, x2, x3, x4, x5) = t (2, 1, 3, 5, 3) + s (0, 3, 1, 4, −2) + r (1, 2, 4, 0, 3) pro jistá t, s, r ∈ R, a současně (x1, x2, x3, x4, x5) ∈ V (V je svým zaměřením) tehdy a jenom tehdy, kdy je (x1, x2, x3, x4, x5) = p (−1, 1, 1, −5, 0) + q (1, 5, 1, 13, −4) pro jistá p, q ∈ R. Hledejme proto taková t, s, r, p, q ∈ R, aby platilo t (2, 1, 3, 5, 3) + s (0, 3, 1, 4, −2) + r (1, 2, 4, 0, 3) = p (−1, 1, 1, −5, 0) + q (1, 5, 1, 13, −4). Jedná se o homogenní soustavu rovnic, kterou mů eme ře it v maticovém zápisu její levé strany (při pořadí proměnných t, s, r, p, q)       2 0 1 1 −1 1 3 2 −1 −5 3 1 4 −1 −1 5 4 0 5 −13 3 −2 3 0 4       ∼ · · · ∼       1 3 2 −1 −5 0 2 1 −1 −3 0 0 1 −1 1 0 0 0 0 0 0 0 0 0 0       . Ukázalo se, e vektory zadávající podprostor V jsou lineární kombinací vektorů ze zaměření podprostoru U. To ov em znamená, e V je podmno inou zaměření U, a tudíž je φ = 0. Varianta (f). Opět nalezněme průnik zaměření U a V . Analogicky jako v předešlé variantě hledejme čísla t, s, p, q, r ∈ R, pro která je t (1, 0, 1, 1, 1) + s (1, 0, 0, 1, 1) = p (1, 1, 1, 1, 1) + q (1, 1, 0, 1, 1) + r (1, 1, 0, 1, 0) . Řešením této soustavy je (t, s, p, q, r) = (−a, a, −a, a, 0), a ∈ R. Do průniku Z(U) ∩ Z(V ) zaměření U a V tak náleží právě vektory (0, 0, −a, 0, 0) = −a (1, 0, 1, 1, 1) + a (1, 0, 0, 1, 1) = −a (1, 1, 1, 1, 1) + a (1, 1, 0, 1, 1) + 0 (1, 1, 0, 1, 0) , kde a ∈ R, tj. Z(U) ∩ Z(V ) je podprostorem generovaným vektorem (0, 0, 1, 0, 0) a jeho ortogonální doplněk (Z(U) ∩ Z(V ))⊥ je zjevně generován vektory CHAPTER 4. ANALYTICKÁ GEOMETRIE 0 = x2 /a2 + y2 /b2 + 1 prázdná množina 0 = x2 /a2 + y2 /b2 − 1 elipsa 0 = x2 /a2 − y2 /b2 − 1 hyperbola 0 = x2 /a2 − 2py parabola 0 = x2 /a2 + y2 /b2 bod 0 = x2 /a2 − y2 /b2 2 různoběžné přímky 0 = x2 − a2 2 rovnoběžné přímky 0 = x2 2 splývající přímky 0 = x2 + a2 prázdná množina Počátek kartézkých souřadnic je středem zkoumané kuželosečky, nalezená ortonormální báze zaměření zadává směr poloos, výsledné koeficienty a, b pak dávají velikosti poloos v nedegenerovaných směrech. 4.24. Afinní pohled. V předchozích dvou odstavcích jsme hledali podstatné vlastnosti a standardizované analytické popisy objektů zadávaných v euklidovských prostorech kvadratickými rovnicemi. Hledali jsme přitom co nejjednodušší rovnice v mezích daných volností výběru kartézských souřadnic. Geometrická formulace našeho výsledku pak může být taková, že pro dva různé objekty – kvadriky, zadané v obecně různých kartézských souřadnicích, existuje euklidovská transformace na En (tj. afinní bijektivní zobrazení zachovávající velikosti) tehdy a jen tehdy, pokud výše uvedený algoritmus vede na stejný analytický tvar, až na pořadí souřadnic. Navíc můžeme při našem postupu přímo získat kartézské souřadnice, kterých jsou naše objekty dány výslednými kanonickými tvary, a tím i explicitní vyjádření euklidovské transformace, která naše objekty na sebe převádí (jak víme bude vždy složena z operací posunutí, otočení a zrcadlení vůči nadrovině). Pochopitelně se můžeme ptát, do jaké míry umíme podobnou věc v afinních prostorech s volností výběru jakékoliv afinní souřadné soustavy. Např. v rovině to bude znamenat, že neumíme rozlišit kružnici od elipsy, samozřejmě bychom ale měli odlišit hyperbolu a všechny ostatní typy kuželoseček. Hlavně ale splynou mezi sebou všechny hyperboly atd. Ukážeme si hlavní rozdíl postupu na kvadratických formách a k záležitosti se pak ještě vrátíme ve třetí části této kapitoly. Uvažme nějakou kvadratickou formu f na vektorovém prostoru V a její analytické vyjádření f (u) = xT Ax vzhledem ke zvolené bázi na V . Pro vektor u = x1u1 +· · ·+xnun pak také zapisujeme formu f ve tvaru f (x1, n) = ∑ ij aij xixj , V předchozích odstavcích jsme již s využitím skalárního součinu ukázali, že pro vhodnou bázi bude matice A diagonální, tj. že pro příslušnou symetrickou formu F bude platit F(ui, uj ) = 0 při i ̸= j. Každou takovou bázi nazýváme polární báze kvadratické formy f . Samozřejmě si pro takový účel můžeme vždy skalární součin vybrat. Dokážeme 193 (1, 0, 0, 0, 0) , (0, 1, 0, 0, 0) , (0, 0, 0, 1, 0) , (0, 0, 0, 0, 1) . Zvlá tě dostáváme Z(U) ∩ Z(V ) ̸= {0}, Z(U) ∩ Z(V ) ̸= Z(U), Z(U) ∩ Z(V ) ̸= Z(V ). Odchylka φ je tedy definována jako odchylka podprostorů Z(U) ∩ (Z(U) ∩ Z(V ))⊥ a Z(V ) ∩ (Z(U) ∩ Z(V ))⊥ . Dále je vidět, e je Z(U) ∩ (Z(U) ∩ Z(V ))⊥ = ⟨ (1, 0, 0, 1, 1) ⟩ , Z(V ) ∩ (Z(U) ∩ Z(V ))⊥ = ⟨ (1, 1, 0, 1, 1) , (1, 1, 0, 1, 0) ⟩ . Postačuje totiž vyjádřit Z(U) jako lineární kombinaci vektorů (0, 0, 1, 0, 0) , (1, 0, 0, 1, 1) a podprostor Z(V ) pomocí vektorů (0, 0, 1, 0, 0) , (1, 1, 0, 1, 1) , (1, 1, 0, 1, 0) . Protože dimenze prostoru Z(U)∩(Z(U)∩Z(V ))⊥ je 1, můžeme pou ít vzorec (4.2), kde u = (1, 0, 0, 1, 1) a pu je kolmá projekce u do Z(V ) ∩ (Z(U) ∩ Z(V ))⊥ . Má být pu = a (1, 1, 0, 1, 1) + b (1, 1, 0, 1, 0) a má platit ⟨ pu − u, (1, 1, 0, 1, 1) ⟩ = 0, ⟨ pu − u, (1, 1, 0, 1, 0) ⟩ = 0, což vede na soustavu rovnic 4a + 3b = 3, 3a + 3b = 2 s jediným řešením a = 1, b = −1/3. Tímto jsme určili pu = (2 3 , 2 3 , 0, 2 3 , 1 ) a z (4.2) již plyne cos φ = || (2/3,2/3,0,2/3,1) || || (1,0,0,1,1) || = √ 7 3 , tj. φ . = 0, 49 (≈ 28 ◦ ) . 4.37. Jsou dány vektory u = (u1, u2, u3) a v = (v1, v2, v3). Doplňte je třetím jednotkovým vektorem tak, aby rovnoběžnostěn daný těmito třemi vektory měl co největší objem. Řešení. Označme hledaný jednotkový vektor jako t = (t1, t2, t3). Podle Tvrzení ?? je objem rovnoběžnostěnu P3(0; u, v, t) dán jako abolutní hodnota determinantu u1 v1 t1 u2 v2 t2 u3 v3 t3 = t1 t2 t3 u1 u2 u3 v1 v2 v3 = t · (u × v) ≤ ∥t∥∥u × v∥ = ∥u × v∥. Použité znaménko nerovnosti vyplývá z Cauchyovy nerovnosti, přičemž víme, že rovnost nastává právě pro t = c(u × v), c ∈ R. Velikost objemu hledaného rovnoběžnostěnu tedy může být maximálne 2. GEOMETRIE KVADRATICKÝCH FOREM si ale toto tvrzení znovu bez využití skalárních součinů tak, že získáme daleko jednodušší algoritmus na to, jak takovou polární bázi najít mezi všemi bazemi. Tím se zároveň dovíme podstatné informace o afinních vlastnostech kvadratických forem. Nasledující věta bývá v literatuře uváděna pod názvem Lagrangeův algoritmus. Věta. Nechť V je reálný vektorový prostor dimenze n, f : V → R kvadratická forma. Pak na V existuje polární báze pro f . Důkaz. (1) Nechť A je matice f v bázi u = (u1, . . . , un) na V a předpokládejme a11 ̸= 0. Pak můžeme psát f (x1, . . . , xn) = a11x2 1 + 2a12x1x2 + · · · + a22x2 2 + . . . = a−1 11 (a11x1 + a12x2 + · · · + a1nxn)2 + členy neobsahující x1 Provedeme tedy transformaci souřadnic (tj. změnu báze) tak, aby v nových souřadnicích bylo x′ 1 = a11x1 + a12x2 + · · · + a1nxn, x′ 2 = x2, . . . , x′ n = xn. To odpovídá nové bázi (spočtěte si jako cvičení příslušnou matici přechodu!) v1 = a−1 11 u1, v2 = u2 − a−1 11 a12u1, . . . , vn = un − a−1 11 a1nu1 a tak jak lze očekávat, v nové bázi bude příslušná symetrická bilinerání forma splňovat g(v1, vi) = 0 pro všechny i > 0 (přepočtěte!). Má tedy f v nových souřadnicích analytický tvar a−1 11 x′ 1 2 +h, kde h je kvadratická forma nezávislá na proměnné x1. Z technických důvodů bývá lepší zvolit v nové bázi v1 = u1, opět dostaneme výraz f = f1 + h, kde f1 závisí pouze na x′ 1 , zatímco v h se x′ 1 nevyskytuje. Přitom pak g(v1, v1) = a11. (2) Předpokládejme, že po provedení kroku (1) dostaneme pro h matici (řádu o jedničku menšího) s koeficientem u x′ 2 2 různým od nuly. Pak můžeme zopakovat přesně stejný postup a získáme vyjádření f = f1+f2+h, kde v h vystupují pouze proměnné s indexem větším než dvě. Tak můžeme postupovat tak dlouho, až buď provedeme n−1 kroků a získáme diagonální tvar, nebo v řekněme i-tém kroku bude prvek aii dosud získané matice nulový. (3) Nastane-li poslední možnost, ale přitom existuje jiný prvek ajj ̸= 0 s j > i, pak stačí přehodit i-tý prvek báze s j-tým a pokračovat podle předešlého postupu. (4) Předpokládejme, že jsme narazili na situaci ajj = 0 pro všechny j ≥ i. Pokud přitom neexistuje ani žádný jiný prvek ajk ̸= 0 s j ≥ i, k ≥ i, pak jsme již úplně hotovi neboť jsme již dosáhli diagonální matici. Předpokládejme, že ajk ̸= 0. Použijeme pak transformaci vj = uj + uk, ostatní vektory báze ponecháme (tj. x′ k = xk − xj , ostatní zůstávají). Pak h(vj , vj ) = h(uj , uj ) + h(uk, uk) + 2h(uk, uj ) = 2ajk ̸= 0 a můžeme pokračovat podle postupu v (1). 194 2. EUKLEIDOVSKÁ GEOMETRIE rovna velikosti obsahu rovnoběžníka daného vektory u, v (tj. velikosti vektoru (u × v)). Rovnost nastane právě když t = ± (u × v) ∥(u × v)∥ . Nechť f : R3 → R, f (x1, x2, x3) = 3x2 1 + 2x1x2 + x2 2 + 4x2x3 + 6x2 3 . Její matice je A =   3 1 0 1 1 2 0 2 6   . Podle bodu (1) algoritmu provedeme úpravy f (x1, x2, x3) = 1 3 (3x1 + x2)2 + 2 3 x2 2 + 4x2x3 + 6x2 3 = 1 3 y2 1 + 3 2 ( 2 3 y2 + 2y3)2 = 1 3 z2 1 + 3 2 z2 2 a vidíme, že forma má hodnost 2 a matice přechodu do příslušné polární báze w se získá posbíráním provedených transformací: z3 = y3 = x3, z2 = 2 3 y2 + 2y3 = 2 3 x2 + 2x3, z1 = y1 = 3x1 + x2 Pokud by ale např. f (x1, x2, x3) = 2x1x3 + x2 2 , tj. matice je A =   0 0 1 0 1 0 1 0 0   , pak hned v prvním kroku můžeme přehodit proměnné: y1 = x2, y2 = x1, y3 = x3. Aplikace kroku (1) je pak triviální (nejsou tu žádné společné členy), pro další krok ale nastane situace z bodu (4). Zavedeme tedy transformaci z1 = y1, z2 = y2, z3 = y3 − y2. Pak f (x1, x2, x3) = z2 1 + 2z2(z3 + z2) = z2 1 + 1 2 (2z2 + z3)2 − 1 2 z2 3. Matici přechodu do příslušné polární báze opět dostaneme posbíráním jednotlivých transformací (tj. vynásobením jednotlivých dílčích matic přechodu). 4.38. Nalezněte polární bázi kvadratické formy f : R3 → R, která je ve standardní bázi dána předpisem f (x1, x2, x3) = x1x2 + x1x3. CHAPTER 4. ANALYTICKÁ GEOMETRIE 4.25. Afinní klasifikace kvadratických forem. Po výpočtu polární báze Lagrangeovým algoritmem můžeme ještě vylepšit bázové vektory pomocí násobení skalárem tak, aby v příslušném analytickém vyjádření naší formy vystupovaly v roli koeficientů u kvadrátů jednotlivých souřadnic pouze skaláry 1, −1 a 0. Následující věta o setrvačnosti říká navíc, že počet jedniček a mínus jedniček nezávisí na našich volbách v průběhu algoritmu. Tyto počty nyzýváme signaturou kvadratické formy. Opět tedy dostáváme úplný popis kvadratických forem ve smyslu, že dvě takové formy jsou převoditelná jedna na druhou pomocí afinní transformace tehdy a jen tehdy, když mají stejnou signaturu. Věta. Pro každou nenulovou kvadratickou formu hodnosti r na reálném vektorovém prostoru V existuje celé číslo 0 ≤ p ≤ r a r nezávislých lineárních forem φ1, . . . , φr ∈ V ∗ takových, že f (u) = (φ1(u))2 +· · ·+(φp(u))2 −(φp+1(u))2 −· · ·−(φr(u))2 . Jinak řečeno, existuje polární báze, ve které má f analytické vyjádření f (x1, . . . , xn) = x2 1 + · · · + x2 p − x2 p+1 − · · · − x2 r . Počet p kladných diagonálních koeficientů v matici dané kvadratické formy nezávisí na volbě polární báze. Dvě symetrické matice A, B dimenze n jsou maticemi téže kvadratické formy v různých bazích právě, když mají stejnou hodnost a když matice příslušných forem v polární bázi mají stejný počet kladných koeficientů. Důkaz. Lagrangeovým algoritmem obdržíme f (x1, . . . , xn) = λ1x2 1 +· · ·+λrx2 r , λi ̸= 0, v jisté bázi na V . Předpokládejme navíc, že právě prvních p koeficientů λi je kladných. Pak transformace y1 = √ λ1x1, . . . , yp = √ λpxp, yp+1 = √ −λp+1xp+1, . . . , yr = √ −λrxr, yr+1 = xr+1 , . . . , yn = xn již vede na požadovaný tvar. Formy φi pak jsou právě formy z duální báze ve V ∗ k získané polární bázi. Musíme ale ještě ukázat, že p nezávisí na našem postupu. Přepokládejme, že se nám podařilo najít vyjádření téže formy f v polárních bazích u, v, tj. f (x1, . . . , xn) = x2 1 + · · · + x2 p − x2 p+1 − · · · − x2 r f (y1, . . . , yn) = y2 1 + · · · + y2 q − y2 q+1 − · · · − y2 r a označme podprostor generovaný prvními p vektory prvé báze P = ⟨u1, . . . , up⟩, a obdobně Q = ⟨vq+1 , . . . , vn⟩. Pak pro každý u ∈ P je f (u) > 0 zatímco pro v ∈ Q je f (v) ≤ 0. Nutně tedy platí P ∩ Q = {0} a proto dim P + dim Q ≤ n. Odtud plyne p + (n − q) ≤ n, tj. p ≤ q. Opačnou volbou podprostorů však získáme i q ≤ p. Je tedy p nezávislé na volbě polární báze. Pak ovšem pro dvě matice se stejnou hodností a stejným počtem kladných koeficientů v diagonálním tvaru příslušné kvadratické formy získáme stejný analytický tvar. Při diskusi symetrických zobrazení jsme hovořili o definitních a semidefitních zobrazeních. Tatáž diskuse má jasný 195 Řešení. Aplikací uvedeného Lagrangeova algoritmu dostáváme: f (x1, x2, x3) = 2x1x2 + x2x3 provedeme substituci podle bodu (4) algoritmu y2 = x2 − x1, y1 = x1, y3 = x3 = 2x1(x1 + y2) + (x1 + y2)x3 = 2x2 1 + 2x1y2 + x1x3 + y2x3 = = 1 2 (2x1 + y2 + 1 2 x3)2 − 1 2 y2 2 − 1 8 x2 3 + y2x3 = substituce y1 = 2x1 + y2 + 1 2 x3 = 1 2 y2 1 − 1 2 y2 2 − 1 8 x2 3 + y2x3 = 1 2 y2 1 − 2( 1 2 y2 − 1 2 x3)2 + 3 8 x2 3 = substituce y3 = 1 2 y2 − 1 2 x3 = 1 2 y2 1 − 2y2 3 + 3 8 x2 3 . V souřadnicích y1, y3, x3 má tedy daná kvadratická forma diagonální tvar, to znamená že báze příslušná těmto souřadnicím je polární bází dané kvadratické formy. Pokud ji máme vyjádřit musíme získat matici přechodu od této polární báze ke standardní bázi. Z definice matice přechodu jsou pak její sloupce bázovými vektory polární bázi. Matici přechodu získáme tak, že buď vyjádříme staré proměnné (x1, x2, x3) pomocí nových proměnných (y1, y3, x3), nebo ekvivalentně vyjádříme nové proměnné pomocí starých (což jde jednodušeji), pak ale musíme spočítat inverzní matici. Máme y1 = 2x1 + y2 + 1 2 x3 = 2x1 + (x2 − x1) + 1 2 x3 a y3 = 1 2 y2 − 1 2 x3 = −1 2 x1 + 1 2 x3 − 1 2 x3. Matice přechodu od standardní báze ke zvolené polární je tedy T =   2 1 1 2 −1 2 1 2 −1 2 0 0 1   . Pro inverzní matici pak máme T −1   1 3 −2 3 −1 2 1 3 4 3 1 2 0 0 1   . Jedna z polárních bazí dané kvadratické formy je tedy například báze {(1/3, 1/3, 0), (−2/3, 4/3, 0), (−1/2, 1/2, 1)}. 4.39. Určete typ kuželosečky dané rovnicí: 3x2 1 − 3x1x2 + x2 − 1 = 0. Řešení. Pomocí algoritmu úpravy na čtverec postupně dostáváme: 3x2 1 − 3x1x2 + x2 − 1 = 1 3 (3x1 − 3 2 x2)2 − 3 4 x2 2 + x2 − 1 = = 1 3 y2 1 − 4 3 ( 3 4 x2 − 1 2 )2 + 1 3 − 1 = = 1 2 y2 1 − 4 3 y2 2 − 2 3 . Podle uvedeného seznamu kuželoseček se tedy jedná o hyperbolu. 3. PROJEKTIVNÍ GEOMETRIE smysl i pro symetrické bilineární formy a kvadratické formy. Kvadratickou formu f forma na reálném vektorovém prostoru V nazýváme (1) positivně definitní, je-li f (u) > 0 pro všechny u ̸= 0 (2) positivně semidefinitní, je-li f (u) ≥ 0 pro všechny u ∈ V (3) negativně definitní, je-li f (u) < 0 pro všechny u ̸= 0 (4) negativně semidefinitní, je-li f (u) ≤ 0 pro všechny u ∈ V (5) indefinitní, je-li f (u) > 0 a f (v) < 0 pro vhodné u, v ∈ V . Stejné názvy používáme i pro symetrické reálné matice, jsouli maticemi patřičných kvadratických forem. Signaturou symetrické matice pak rozumíme signaturu příslušné kvadratické formy. 3. Projektivní geometrie V mnoha elementárních textech o analytické geometrii autoři končí afinními a euklidovskými objekty popsanými výše. Na mnoho praktických úloh euklidovská nebo afinní geometrie stačí, na jiné bohužel ale nikoliv. Tak třeba při zpracovávání obrazu z kamery nejsou zachovávány úhly a rovnoběžné přímky se mohou (ale nemusí) protínat. Dalším dobrým důvodem pro hledání širšího rámce geometrických úloh a úvah je požadovaná robustnost a jednoduchost numerických operací. Daleko jednodušší jsou totiž operace prováděné prostým násobením matic a velice těžko se totiž od sebe odlišují malinké úhly od nulových, proto je lepší mít nástroje, které takové odlišení nevyžadují. Základní ideou projektivní geometrie je rozšíření afinních prostorů o body v nekonečnu způsobem, který bude dobře umožňovat manipulace s lineárními objekty typu bodů, přímek, rovin, projekcí, apod. 4.26. Projektivní rozšíření afinní roviny. Začneme tím nejjednodušším zajímavým případem, geometrií v rovině. Jestliže si body roviny A2 představíme jako rovinu z = 1 v R3 , pak každý bod P naší afinní roviny představuje vektor u = (x, y, 1) ∈ R3 a tím i jednorozměrný podprostor ⟨u⟩ ⊂ R3 . Naopak, skoro každý podprostor v R3 protíná naši rovinu v právě jednom bodě P a jednotlivé vektory takového podprostoru jsou dány souřadnicemi (x, y, z) jednoznačně, až na společný skalární násobek. Žádný průnik s naší rovinou nebudou mít pouze podprostory s body o souřadnicích (x, y, 0). Projektivní rovina P2 je množina všech jednorozměrných podprostorů v R3 . Homogenní souřadnice bodu P = (x : y : z) v projektivní rovině jsou trojice reálných čísel určené až na společný skalární násobek a alespoň jedno z nich musí být nenulové. Přímka v projektivní rovině je definována jako množina jednorozměrných podprostorů (tj. bodů v P2) 196 2. EUKLEIDOVSKÁ GEOMETRIE 4.40. Určete rovnici kuželosečky (a poté její typ), která prochází body [−2, −4], [8, −4], [0, −2] , [0, −6] , [6, −2] . Řešení. Do obecné rovnice kuželosečky a11x2 + a22y2 + 2a12xy + a1x + a2y + a = 0 postupně dosadíme souřadnice zadaných bodů. Takto obdržíme sou- stavu 4a11 + 16a22 + 16a12 − 2a1 − 4a2 + a = 0, 64a11 + 16a22 − 64a12 + 8a1 − 4a2 + a = 0, 4a22 − 2a2 + a = 0, 36a22 − 6a2 + a = 0, 36a11 + 4a22 − 24a12 + 6a1 − 2a2 + a = 0. V maticovém zápisu provedeme úpravy       4 16 16 −2 −4 1 64 16 −64 8 −4 1 0 4 0 0 −2 1 0 36 0 0 −6 1 36 4 −24 6 −2 1       ∼ · · · ∼       4 16 16 −2 −4 1 0 4 0 0 −2 1 0 0 64 −8 12 −9 0 0 0 24 −36 27 0 0 0 0 3 −2       ∼ · · · ∼       48 0 0 0 0 −1 0 12 0 0 0 −1 0 0 64 0 0 0 0 0 0 24 0 3 0 0 0 0 3 −2       . Hodnotu a můžeme zvolit. Zvolíme-li a = 48, dostaneme a11 = 1, a22 = 4, a12 = 0, a1 = −6, a2 = 32. Kuželosečka má tudíž rovnici x2 + 4y2 − 6x + 32y + 48 = 0. V této rovnici doplníme výrazy x2 − 6x, 4y2 + 32y na druhé mocniny dvojčlenů, což dává (x − 3)2 + 4(y + 4)2 − 25 = 0, resp. (x − 3)2 52 + (y + 4)2 (5 2 )2 − 1 = 0. Vidíme, že se jedná o elipsu se středem v bodě [3, −4]. CHAPTER 4. ANALYTICKÁ GEOMETRIE Příklad. V afinním prostoru R2 uvažujme dvě přímky L1 : y − x − 1 = 0 a L2 : y − x + 1 = 0. Jestliže budeme body přímek L1 a L2 chápat jako konečné body v projektivním prostoru P2, budou zjevně jejich homogenní souřadnice (x : y : z) splňovat rovnice L1 : y − x − z = 0, L2 : y − x + z = 0. Podívejme se, jak budou rovnice těchto přímek vypadat v souřadnicích v afinní rovině, která bude dána jako y = 1. Za tím účelem stačí dosadit y = 1 do předchozích rovnic: L′ 1 : 1 − x − z = 0, L′ 2 : 1 − x + z = 0 Nyní jsou „nekonečné“ body naší původní afinní roviny dány vztahem z = 0 a vidíme, že naše přímky L′ 1 a L′ 2 se protínají v bodě (1, 1, 0). To odpovídá geometrické představě, že rovnoběžné přímky L1, L2 v afinní rovině se protínají v nekonečnu (a to v bodě (1 : 1 : 0)). 4.27. Projektivní prostory a transformace. Postup z roviny se přirozeným způsobem zobecňuje na každou konečnou dimenzi. Volbou libovolné afinní nadroviny An ve vektorovém prostoru Rn+1 , která neprochází počátkem, můžeme ztotožnit body P ∈ An s jednorozměrnými podprostory, které tyto generují. Zbylé jednorozměrné podprostory vyplní rovinu rovnoběžnou s An a říkáme jim „nekonečné body“ v projektivním rozšíření Pn afinní roviny An. Zjevně je vždy množina nekonečných bodů v Pn projektivním prostorem dimenze o jedničku nižším. Abstraktněji hovoříme o projektivizaci vektorového prostoru: pro libovolný vektorový prostor V dimenze n + 1 definujeme P(V ) = {P ⊂ V ; P je jednorozměrný vektorový podprostor}. Volbou libovolné báze u ve V dostáváme tzv. homogenní souřadnice na P(V ) tak, že pro P ∈ P(V ) použijeme jeho libovolný nenulový vektor u ∈ V a souřadnice tohoto vektoru v bázi u. Afinní přímka má tedy ve svém projektivním rozšíření pouze jediný bod (oba konce se „potkají“ v nekonečnu a projektivní přímka vypadá jako kružnice), projektivní rovina má projektivní přímku nekonečných bodů atd. Při zvolených homogenních souřadnicích je možné jednu z jejich hodnot zafixovat na jedničku (tj. vyloučíme všechny body projektivního prostoru s touto souřadnicí nulovou) a získáme tak vložení n–rozměrného afinního prostoru An ⊂ P(V ). To je přesně konstrukce, kterou jsme použili v opačném směru v příkladu projektivní roviny. Každé prosté lineární zobrazení τ : V1 → V2 mezi vektorovými prostory samozřejmě zobrazuje jednorozměrné podprostory na jednorozměrné podprostory. Tím vzniká zobrazení na projektivizacích T : P(V1) → P(V2). Takovým zobrazením říkáme projektivní zobrazení. Jinak řečeno, projektivní zobrazení je takové zobrazení mezi projektivními prostory, že v každé soustavě homogenních souřadnic na definičním oboru i obrazu je toto zobrazení zadáno násobením vhodnou maticí. Obecněji, pokud naše pomocné lineární zobrazení není prosté, definuje projektivní zobrazení pouze mimo 197 4.41. Pomocí doplnění na čtverce vyjádřete kvadriku −x2 + 3y2 + z2 + 6xy − 4z = 0 ve tvaru, ze kterého lze vyčíst její typ. Řešení. Všechny členy obsahující x připojíme k −x2 a provedeme doplnění na čtverec. Tím získáme −(x − 3y)2 + 9y2 + 3y2 + z2 − 4z = 0. Žádné „nežádoucí“ členy obsahující y nemáme, a proto postup opakujeme pro proměnnou z, což dává −(x − 3y)2 + 12y2 + (z − 2)2 − 4 = 0. Odtud plyne, že existuje transformace proměnných, při které obdržíme (rovnici můžeme nejdříve vydělit 4) rovnici −¯x2 + ¯y2 + ¯z2 − 1 = 0. 3. PROJEKTIVNÍ GEOMETRIE svoje jádro, tj. na bodech, jejichž homogenní souřadnice se nezobrazují na nulu. 4.28. Perspektivní projekce. Velmi dobře jsou výhody projektivní geometrie vidět na perspektivní projekci R3 → R2 . Bod (X, Y, Z) „reálného světa“ se promítá na bod (x, y) na průmětně takto: x = −f X Z , y = −f Y Z . To je nejen nelineární formule, ale navíc při Z malém bude velice problematická přesnost výpočtů. Při rozšíření této transformace na zobrazení P3 → P2 dostáváme zobrazení (X : Y : Z : W) → (x : y : z) = (−f X : −f Y : Z), tj. popsané prostou lineární formulí   x y z   =   −f 0 0 0 0 −f 0 0 0 0 1 0   ·     X Y Z W     Tento jednoduchý výraz zadává perspektivní projekci pro všechny konečné body v R3 ⊂ P3, které dosazujeme jako výrazy s W = 1. Navíc jsme odstranili problémy s body, jejichž obraz leží v nekonečnu. Skutečně, je–li Z-ová souřadnice skutečného bodu scény blízká nule, bude hodnota třetí homogenní souřadnice obrazu mít souřadnici blízkou nule, tj. bude představovat bod blízký nekonečnu. 4.29. Afinní a projektivní transformace. Invertibilní projektivní zobrazení projektivního prostoru Pn na sebe odpovídají v homogenních souřadnicích invertibilním maticím dimenze n + 1. Dvě takové matice zadávají stejnou projektivní transformaci právě, když se liší o konstantní násobek. Jestliže si zvolíme první souřadnici jako tu, jejíž nulovost určuje nekonečné body, budou transformace, které zachovávají konečné body, dány maticemi, jejichž první řádek musí být až na první člen nulový. Jestliže budeme chtít přejít do afinních souřadnic konečných bodů, tj. zafixujeme si hodnotu první souřadnice na jedničku, musí být první prvek na prvním řádku být také rovný jedné. Matice projektivních transformací zachovávajících konečné body tedy mají tvar:      1 0 · · · 0 b1 a11 · · · a1n ... ... bn an1 · · · ann      kde b = (b1, . . . , bn)T ∈ Rn a A = (aij ) je invertibilní matice dimenze n. Působení takové matice na vektoru (1, x1, . . . , xn) je právě obecná afinní transformace. 4.30. Projektivní klasifikace kvadrik. Závěrem ještě poznámka o složitějších objektech studovaných v afinní geometrii nejlépe prostřednictvím projektivních rozšíření. Jestliže popíšeme kvadriku v afinních souřadnicích pomocí obecné 198 2. EUKLEIDOVSKÁ GEOMETRIE Volná strana CHAPTER 4. ANALYTICKÁ GEOMETRIE kvadratické rovnice, viz výše, jejím přepsáním v homogenních souřadnicích dostaneme vždy výlučně homogenní výraz, jehož všechny členy jsou druhého řádu. Důvod je ten, že pouze takové homogenní výrazy budou mít pro homogenní souřadnice smysl nezávisle na zvoleném konstantním násobku souřadnic (x0, x1, . . . , xn). Hledáme tedy takový, jehož zúžením na afinní souřadnice, tj. dosazením x0 = 1, získáme původní výraz. To je ale mimořádně jednoduché, prostě dopíšeme dostatek x0 ke všem výrazům – žádny ke kvadratickým členům, jedno k lineárním a x2 0 ke konstantnímu členu. Získáme tak dobře definovanou kvadratickou formu na našem pomocném vektorovém prostoru Rn+1 , ale jsme už vůči libovolné volbě báze klasifikovali. Zkuste si samostatně převést tuto klasifikaci do projektivní i afinní podoby. (Hezké a náročné cvičení na závěr semestru!) 199 Volná strana 3. PROJEKTIVNÍ GEOMETRIE 200 2. EUKLEIDOVSKÁ GEOMETRIE Řešení cvičení 4.15. Pro normálový vektor (a, b, c) hledaných rovin máme rovnice a + b = 0 (kolmost na p) a volbou a = −b = 1 (vektor (0, 0, 1) nevyhovuje podmínkám, takže vhodným pronásobením můžeme dosáhnout podmínky a = −b = 1) pak dostáváme z podmínky pro odchylku c √ 3 √ 2+c2 = 1 2 , celkem pak hledané rovnice přímek jsou x − y ± √ 6 − 1 = 0. 4.19. 2, 3, 4, 6, 7, 8. Polohy rovin, které realizují dané počty si rozmyslete samostatně. 4.24. Přímka (2t, t, 7t) + [−5, 0, −9]. 4.25. Hledaný bod v q najdeme jako průnik přímky q s rovinou [1, 1, 1] + t(2, 1, 0) + s(0, 1, 1). Jde o úsečku s krajními body [5, 5, 3] ∈ q, [7/3, 5/3, 1] ∈ p. 4.26. Úsečka ([2, 3, 4], [3, 1, 5]). 4.27. [3, 2, 1][8/3, 8/3, 2/3]. 4.28. (−1, 3, 2). KAPITOLA 5 Zřízení ZOO jaké funkce potřebujeme pro naše modely? – pořádný zvěřinec... V této kapitole začneme budovat nástroje umožňujících modelování závislostí, které nejsou ani lineární ani diskrétní. S takovou potřebou se často setkáme, když popisujeme systém vyvíjející se v čase a to ne jen v několika vybraných okamžicích, ale „souvisle“, tj. pro všechny možné okamžiky. Někdy je to přímo záměr či potřeba (třeba ve fyzikálních modelech klasické mechaniky), jindy je to vhodné přiblížení diskrétního modelu (třeba u ekonomických, chemických nebo biologických modelů). Klíčovým pojmem budou stále funkce. Čím větší třídu funkcí připustíme, tím obtížnější bude vybudovat nástroje pro naši práci. Když ale bude různých typů funkcí málo, nebudeme patrně umět budovat dobré modely pro reálné situace vůbec. Cílem následujících dvou kapitol bude proto explicitně zavést několik typů elementárních funkcí, implicitně popsat daleko více funkcí a vybudovat standardní nástroje pro práci s nimi. Souhrnně se tomu říká diferenciální a integrální počet jedné proměnné. Zatímco dosud jsme se spíše pohybovali v oblasti matematiky nazývané algebra, nyní se pouštíme do tzv. matematické analýzy. 1. Interpolace polynomy V předchozích kapitolách jsme pracovali často s posloupnostmi hodnot reálných nebo komplexních čísel, tj. se skalárními funkcemi N → K nebo Z → K, kde K byl zvolený číselný obor. Případně jsme pracovali s posloupnostmi vektorů nad reálnými nebo komplexními čísly. Připomeňme si diskusi z odstavce 1.4, kde jsme přemýšleli nad způsoby, jak pracovat se skalárními funkcemi. Na této diskusi není třeba nic doplňovat a rádi bychom (pro začátek) uměli pracovat s funkcemi R → R (reálné funkce reálné proměnné) nebo R → C (komplexní funkce reálné proměnné), případně funkcemi Q → Q (funkce jedné racionální proměnné s racionálními hodnotami) apod. Většinou půjdou naše závěry snadno rozšířit na případy s vektorovými hodnotami nad stejnými skaláry, ve výkladu se ale zpravidla omezíme jen na případ reálných a komplexních čísel. Začneme od nejednodušších funkcí, které umíme zadat explicitně pomocí konečně mnoha algebraických operací se skaláry. 201 KAPITOLA 5 Zřízení ZOO 3. Interpolace polynomy Na úvod této kapitoly se budeme snažit odhadnout funkce pomocí polynomů. Předpokládejme, že o neznámé funkci máme pouze kusé informace, totiž její hodnoty v několika bodech, popřípadě i hodnoty její první či druhé derivace v těchto bodech. Budeme se snažit najít polynom (co nejmenšího stupně) splňující tyto závislosti. 5.1. Nalezněte polynom P splňující následující podmínky: P(2) = 1, P(3) = 0, P(4) = −1, P(5) = 6. Řešení. Řešíme buď přímo, t.j. sestavením soustavy čtyř lineárních rovnic o čtyřech neznámých. Předpokládáme polynom ve tvaru a3x3 + a2x2 + a1x1 + a0. Víme, že polynom stupně nejvýše tři splňující podmínky v zadání je dán jednoznačně. a0 + 2a1 + 4a2 + 8a3 = 1 a0 + 3a1 + 9a2 + 27a3 = 0 a0 + 4a1 + 16a2 + 64a3 = −1 a0 + 5a1 + 25a2 + 125a3 = 6. Každá rovnice vznikla z jedné z podmínek v zadání. Druhou možností je vytvořit hledaný polynom pomocí fundamentálních Lagrangeových polynomů: P(x) = 1 · (x − 3)(x − 4)(x − 5) (2 − 3)(2 − 4)(2 − 5) + 0 · (. . . ) + = (−1) · (x − 2)(x − 3)(x − 5) (4 − 2)(4 − 3)(4 − 5) + 6 · (x − 2)(x − 3)(x − 4) (5 − 2)(5 − 3)(5 − 4) = = 4 3 z3 − 12z2 + 101 3 z − 29. Koeficienty tohoto polynomu jsou samozřejmě jediným řešením výše sestavené soustavy lineárních rovnic. 5.2. Nalezněte polynom P splňující následující podmínky: P(1 + i) = i, P(2) = 1, P(3) = −i. 1. INTERPOLACE POLYNOMY 5.1. Polynomy. Skaláry umíme sčítat a násobit a tyto operace splňují řadu vlastností, které jsme vyjmenovali už v odstavcích 1.1 a 1.3. Když připustíme konečný počet těchto operací, přičemž jednu proměnnou ponecháme jako neznámou a další vstupující skaláry budou pevně zvolené, dostáváme tzv. polynomy: Polynomy Polynomem nad okruhem skalárů K rozumíme zobrazení f : K → K dané výrazem f (x) = anxn + an−1xn−1 + · · · + a1x + a0, kde ai, i = 0, . . . , n, jsou pevně zadané skaláry, násobení je znázorněno prostým zřetězením symbolů a „+“ označuje sčítání. Pokud je an ̸= 0, říkáme, že polynom f je stupně n. Stupeň nulového polynomu není definován. Skaláry ai označujeme jako koeficienty polynomu f . Polynomy stupně nula jsou právě konstantní nenulová zobrazení x → a0. V algebře jsou častěji polynomy definovány jako formální výrazy uvedeného tvaru f (x), tj. jako posloupnosti koeficientů a0, a1, . . . s konečně mnoha nenulovými prvky. V zápětí si ale ukážeme, že v analýze budou oba přístupy ekvivalentní. Je snadné ověřit, že polynomy nad okruhem skalárů tvoří opět okruh, kde násobení a sčítání je dáno operacemi v původním okruhu K pomocí hodnot polynomů, tzn. (f · g)(x) = f (x) · g(x), (f + g)(x) = f (x) + g(x), kde nalevo a napravo musíme správně interpretovat příslušné operace v okruhu polynomů a v samotném okruhu skalárů. 5.2. Dělení polynomů se zbytkem. Jak jsme již zmínili, budeme v dalším pracovat výhradně s poli skalárů Q, R nebo C. Pro všechna pole skalárů však platí Tvrzení (O dělení polynomů se zbytkem). Pro libovolné polynomy f stupně n a g stupně m, existují jednoznačně určené polynomy q a r takové, že f = q · g + r a přitom je stupeň r menší než m nebo je r = 0. Důkaz. Začněme jednoznačností. Předpokládejme, že máme dvě požadovaná vyjádření polynomu f s polynomy g, g′ , r a r′ , tj. platí f = q · g + r = q′ · g + r′ . Pak také odečtením dostaneme 0 = (q − q′ ) · g + (r − r′ ). Jestliže q = q′ , pak také r = r′ . Je-li q ̸= q′ , pak člen s nejvyšším stupněm v (q−q′ )·g nemůže být vykompenzován r − r′ , což vede na spor. Dokázali jsme tedy jednoznačnost výsledku dělení, pokud existuje. Zbývá dokázat, že umíme polynom f vždy napsat požadovaným způsobem. Pokud by stupeň g byl větší než stupeň f , pak můžeme rovnou psát f = 0 · g + f . Předpokládejme proto n ≥ m a dokažme tvrzení indukcí přes stupeň f . 202 3. INTERPOLACE POLYNOMY 5.3. Nalezněte polynom P splňující následující podmínky: P(1) = 0, P′ (1) = 1, P(2) = 3, P ′ (2) = 3. Řešení. Opět ukážeme dvě možnosti řešení. Dané podmínky určují čtyři lineární rovnice pro koeficienty hledaného polynomu. Budeme-li hledat polynom třetího stupně, dostáváme tedy přesně tolik rovnic, kolik je neznámých koeficientů polynomu (nechť např. P(x) = a3x3 + a2x2 + a1x + a0): P(1) = (a3 + a2 + a1 + a0 = 0, P ′ (1) = 3a3 + 2a2 + a1 = 1, P(2) = 8a3 + 4a2 + 2a1 + a0 = 3, P ′ (2) = 12a3 + 4a2 + a1 = 3. Vyřešením tohoto systému obdžíme polynom P(x) = −2x3 +10x2 − 13x + 5. Jiné řešení. Použijeme fundamentální Hermiteovy polynomy: h1 1(x) = ( 1 − 2 0 + (−1) (x − 1) ) (2 − x)2 = (2x − 1)(x − 2)2 , h1 2(x) = (5 − 2x)(x − 1)2 , h2 1(x) = (x − 1)(x − 2)2 , h2 2(x) = (x − 2)(x − 1)2 . Celkem P(x) = 0·h1 1(x)+3·h1 2(x)+1·h2 1(x)+3·h2 2(x) = −2x3 +10x2 −13x+5. 5.4. Určete polynom P(x) co nejmenšího stupně splňující podmínky P(1) = 1, P(2) = 28, P(0) = 2, P ′ (0) = 1, P ′ (1) = 9. 5.5. Určete polynom P(x) co nejmenšího stupně splňující podmínky P(0) = 0, P(1) = 4, P(−1) = −2, P ′ (0) = 1, P ′ (1) = 7. 5.6. Určete polynom P(x) co nejmenšího stupně splňující podmínky P(0) = −1, P(1) = −1, P ′ (−1) = 10, P ′ (0) = −1, P ′ (1) = 6. 5.7. Nalezněte přirozený splajn S, který splňuje podmínky S(−1) = 0, S(0) = 1, S(1) = 0. Řešení. Hledaný přirozený splajn bude složen ze dvou kubických polynomů, jednoho, řekněme S1, pro interval ⟨−1, 0⟩, druhého, řekněme S2 pro interval ⟨0, 1⟩. Slůvko „přirozený“ navíc určuje, že hodnoty druhých derivací polynomů S1, resp. S2, budou nulové v bodě CHAPTER 5. ZŘÍZENÍ ZOO Pokud je f polynom stupně nula, je tvrzení zřejmé. Přepokládejme tedy, že tvrzení platí pro stupně menší než n > 0 a uvažme výraz h(x) = f (x) − an bm xn−m g(x). Buď je h(x) přímo nulový polynom a pak máme, co jsme hledali, nebo jde o polynom nižšího stupně a tedy jej již umíme napsat potřebným způsobem h(x) = q · g + r a tedy také f (x) = h(x) + an bm xn−m g(x) = (q + an bm xn−m )g(x) + r a tvrzení je dokázáno. Je-li pro nějaký prvek b ∈ K hodnota f (b) = 0, pak to znamená, že v podílu f (x) = q(x)(x−b)+r musí být r = 0. Jinak by totiž nebylo možné dosáhnout f (b) = q(b) · 0 + r, kde stupeň r je nulový. Říkáme, že b je kořen polynomu f . Stupeň q je pak právě n−1. Pokud má q opět kořen, můžeme pokračovat a po nejvýše n krocích dojdeme ke konstatnímu polynomu. Dokázali jsme tedy, že každý nenulový polynom nad polem K má nejvýše tolik kořenů, kolik je jeho stupeň. Odtud již snadno dovodíme i následující pozorování: Důsledek. Je-li K pole s nekonečně mnoha prvky, pak dva polynomy f a g jsou si rovny jako zobrazení, právě když mají shodné koeficienty. Důkaz. Předpokládejme f = g, tj. f − g = 0, jako zobrazení. Polynom (f − g)(x) tedy má nekonečně mnoho kořenů, což je možné pouze tehdy, je-li nulovým polynomem. Uvědomme si, že u konečných polí samozřejmě takové tvrzení neplatí. Jednoduchým příkladem je např. polynom x2 + x nad Z2, který představuje nulové zobrazení. 5.3. Interpolační polynom. Častá praktická úloha vyžaduje stanovení počítatelné formule pro funkci, pro kterou máme zadány hodnoty v předem daných bodech x0, . . . , xn. Pokud by šlo o nulové hodnoty, umíme přímo zadat polynom stupně n + 1 f (x) = (x − x0)(x − x1) . . . (x − xn), který bude mít nulové hodnoty právě v těchto bodech a nikde jinde. To ale není jediná odpověď, protože požadovanou vlastnost má i nulový polynom. Ten je přitom jediný s touto vlastností ve vektorovém prostoru polynomů stupně nejvýše n. Obdobně to dopadne i v obecném případě: Interpolační polynomy Nechť K je nekonečné pole skalárů. Interpolační polynom f pro množinu po dvou různých bodů x0, . . . , xn ∈ K a předepsaných hodnot y0, . . . , yn ∈ K je polynom stupně nejvýše n nebo nulový polynom, který splňuje f (xi) = yi pro všechna i = 0, 1, . . . , n. Věta. Pro každou množinu n + 1 po dvou různých bodů x0, . . . , xn ∈ K a předepsaných hodnot y0, . . . , yn ∈ K existuje právě jeden interpolační polynom f . 203 −1, resp. 1. Díky předepsané společné hodnotě v bodě 0 víme že absolutní člen obou polynomů je 1, ze symetrie úlohy plyne, že společná hodnota první derivace v bodě 0 je nulová. Můžeme tedy psát S1(x) = ax3 +bx2 +1 a S2(x) = cx3 +bx2 +1, pro neznámé reálné parametry a, b, c a d. Dosazením těchto tvarů do čtyř podmínek S′ 1 (0) = S′ 2 (0) = 0 a S1"(−1) = S2"(1) = 0 dostáváme čtyři lineární rovnice pro tyto parametry. Jejich vyřešením pak S1(x) = −1 2 x3 − 3 2 x2 + 1, S2(x) = 1 2 x3 − 3 2 x2 + 1. Celkem tedy S(x) = { −1 2 x3 − 3 2 x2 + 1 prox ∈ ⟨−1, 0⟩ 1 2 x3 − 3 2 x2 + 1 prox ∈ ⟨0, 1⟩ 4. Spojité funkce 5.8. Načrtněte následující podmnožiny v C i) {z ∈ C| |z − 1| = |z + 1|} ii) {z ∈ C| 1 ≤ |z − i| ≤ 2} iii) {z ∈ C| Re(z2 ) = 1} iv) {z ∈ C| Re(1 z ) < 1 2 } Řešení. • imaginární osa • mezikruží okolo i • hyperbola a2 − b2 = 1. • vnějšek jednotkového kruhu se středem v 1. 5.9. Nalezněte hromadné, izolované, hraniční a vnitřní body množin N, Q, X = {x ∈ R; 0 ≤ x < 1} v R. Řešení. Množina N. Pro libovolné n ∈ N očividně platí O1 (n) ∩ N = (n − 1, n + 1) ∩ N = {n}. Existuje tedy okolí bodu n ∈ N v R, které obsahuje pouze jeden prvek množiny N (pochopitelně právě uvažované n), tj. každý bod n ∈ N je izolovaný. Množina vnitřních bodů je proto prázdná (je-li bod izolovaný, nemůže být vnitřní). Bod a ∈ R je pak hromadným bodem A 1. INTERPOLACE POLYNOMY Důkaz. Začněme jednodušší částí, tj. jednoznačností. Jsou-li f a g dva interpolační polynomy se stejnými definičními hodnotami, pak je jejich rozdíl polynomem stupně n, který má n + 1 kořenů, a proto je f − g = 0. Zbývá existence. Označme si prozatím neznámé koeficienty polynomu f stupně n f = anxn + · · · + a1x + a0. Dosazením požadovaných hodnot dostaneme systém n + 1 rovnic pro stejný počet neznámých koeficientů ai a0 + x0a1 + · · · + (x0)n an = y0 ... a0 + xna1 + · · · + (xn)n an = yn. Existenci řešení tohoto systému rovnic můžeme snadno ukázat přímou konstrukcí patřičného polynomu pomocí tzv. Lagrangeových polynomů pro dané body x0, . . . , xn, viz. další odstavec textu níže. Nyní ale důkaz dokončíme pomocí jednoduchých znalostí z lineární algebry. Tento systém lineárních rovnic má totiž právě jedno řešení pokud je determinant jeho matice invertibilní skalár, tj. pokud je nenulový (viz 3.1 a 2.22). Měli bychom tedy vyšetřit tzv. Vandermondův determinant V (x0, . . . , xn) = det      1 x0 (x0)2 . . . (x0)n 1 x1 (x1)2 . . . (x1)n ... ... ... ... ... 1 xn (xn)2 . . . (xn)n      . Protože jsme ale už ověřili, že pro nulové pravé strany existuje řešení právě jedno, víme, že tento determinant nenulový být musí. Protože polynomy jsou jako zobrazení stejné, právě když mají stejné koeficienty, věta je dokázána. 5.4. Užití interpolací. Na první pohled se může zdát, že reálné nebo případně racionální polynomy, tj. polynomiálně zadané funkce R → R nebo Q → Q, tvoří hezkou velikou třídu funkcí jedné proměnné. Můžeme jimi proložit jakékoliv sady předem zadaných hodnot. Navíc se zdají být snadno vyjádřitelné, takže by s jejich pomocí mělo být dobře možné počítat i hodnoty těchto funkcí pro jakoukoliv hodnotu proměnné. Při pokusu o praktické využití v tomto směru ovšem narazíme hned na několik problémů. Prvním z nich je potřeba rychle vyjádřit polynom, kterým zadaná data proložíme. Pro řešení výše diskutovaného systému rovnic totiž budeme obecně potřebovat čas úměrný třetí mocnině počtu bodů, což při objemnějších datech je jistě těžko přijatelné. Podobným problémem je pomalé vyčíslení hodnoty polynomu vysokého stupně v zadaném bodě. Obojí 204 4. SPOJITÉ FUNKCE právě tehdy, když každé jeho okolí obsahuje nekonečně mnoho bodů A. Ovšem množina O1 (a) ∩ N = (a − 1, a + 1) ∩ N, přičemž a ∈ R, je konečná, z čehož plyne, že N hromadné body nemá. To, že tato množina je konečná, dále implikuje δb := inf n∈N | b − n | = inf n∈O1(b)∩N | b − n | > 0 pro b ∈ R N. Odsud máme Oδb (b) ∩ N = ∅, tj. žádné b ∈ R N není hraničním bodem N. Současně víme, že každý bod dané množiny, který není vnitřním bodem, je nutně jejím hraničním bodem. Množina hraničních bodů tak obsahuje N. Shrneme-li to, množina hraničních bodů N je N. Množina Q. Racionální čísla tvoří tzv. hustou podmnožinu množiny všech reálných čísel. To znamená, že ke každému reálnému číslu konverguje posloupnost racionálních čísel (představme si např. nekonečný desetinný rozvoj reálného čísla a jemu odpovídající posloupnost, kdy v následujícím členu přidáváme další cifru rozvoje). O této posloupnosti lze navíc předpokládat, že všechny její členy jsou navzájem různé (na poslední pozici konečného desetinného rozvoje se můžeme záměrně dopouštět chyby nebo kupř. číslu 1 přiřadíme desetinný rozvoj 0, 999 . . . apod.). Množina hromadných bodů Q v R je proto celé R a každý bod x ∈ R Q je hraniční. Zvláště dostáváme, že libovolné δ-okolí Oδ ( p q ) = ( p q − δ, p q + δ ) , kde p, q ∈ Z, q ̸= 0, racionálního čísla p/q musí obsahovat nekonečně mnoho racionálních čísel, což dává neexistenci izolovaných bodů. Číslo √ 2/10n není racionální pro žádné n ∈ N. Předpokladem opaku (opět p, q ∈ Z, q ̸= 0) √ 2 10n = p q , tj. √ 2 = 10n p q , totiž okamžitě obdržíme spor – o číslu √ 2 víme, že není racionální. Libovolné okolí racionálního čísla p/q tak zároveň obsahuje nekonečně mnoho reálných čísel p/q + √ 2/10n (n ∈ N), která nejsou racionální (množina Q jako těleso je uzavřená vzhledem k odečítání). Všechny body p/q ∈ Q jsou tudíž rovněž hraniční a vnitřní body množina Q nemá. Množina X = [0, 1). Nechť a ∈ [0, 1) je zvoleno libovolně. Posloupnosti se členy (pro dostatečně velká n ∈ N) a + 1 n , 1 − 1 n ⊂ [0, 1) zjevně konvergují po řadě k hodnotám a, 1. Snadno jsme tak ukázali, že množina hromadných bodů obsahuje interval [0, 1]. Jiné hromadné body neexistují: pro jakékoli b /∈ [0, 1] existuje δ > 0 takové, že Oδ (b) ∩ [0, 1] = ∅ (pro b < 0 postačuje položit δ = −b a pro b > 1 CHAPTER 5. ZŘÍZENÍ ZOO lze částečně obejít tak, že zvolíme vhodné vyjádření intepolačního polynomu (tj. vybereme lepší bázi příslušného vektorového prostoru všech polynomů stupně nejvýše k, než je ta nejobvyklejší 1, x, x2 , . . . , xn ). Ukážeme si pouze jediný příklad takového postupu: Lagrangeovy interpolační polynomy Lagrangeův interpolační polynom snadno zapíšeme pomocí tzv. elemntárních Lagrangeových polynomů ℓi stupně n s vlastnostmi ℓi(xj ) = { 1 i = j 0 i ̸= j . Zřejmě musí být tyto polynomy až na konstantu rovny výrazům (x − x0) . . . (x − xi−1)(x − xi+1) . . . (x − xn) a proto ℓi(x) = ∏ j̸=i (x − xj ) ∏ j̸=i (xi − xj ) . Hledaný Lagrangeův interpolační polynom je pak dán vzta- hem f (x) = y0ℓ0(x) + y1ℓ1(x) + · · · + ynℓn(x). Použití Lagrangeových polynomů je obzvlášť efektivní, když opakovaně prokládáme zadané hodnoty závislé proměnné yi pro stále stejné hodnoty nezávislé proměnné xi. Pak totiž máme elementární polynomy ℓi předem připraveny. Toto vyjádření má nevýhodu ve velké citlivosti na nepřesnosti výpočtu při malých rozdílech zadaných hodnot xi, protože se v něm těmito rozdíly dělí. Další nepříjemností je velice špatná stabilita hodnot reálných nebo racionálních polynomů při zvětšující se hodnotě proměnné. Brzy budeme mít nástroje na přesný popis kvalitativního chování funkcí, nicméně i bez nich je zřejmé, že podle znaménka koeficientu u nejvyšší mocniny polynomu se hodnoty velice rychle při rostoucím x vydají buď do plus nebo mínus nekonečna. Ani toto znaménko koeficientu u nejvyššího stupně se ale u interpolačního polynomu při malých změnách prokládaných hodnot nechová stabilně. Názorně to vidíme na dvou obrázcích, kde je proloženo jedenáct hodnot funkce sin(x) s různými malými náhodnými změnami hodnot. Zelenou barvou je vynesena aproximovaná funkce, kolečka jsou malinko posunuté hodnoty a červeně je vynesen jednoznačně zadaný interpolační polynom. Zatímco uvnitř intervalu je aproximace vcelku dobrá, stabilita na okrajích je otřesná. 205 potom δ = b − 1). Protože každý bod intervalu [0, 1) je hromadným bodem, množina izolovaných bodů je prázdná. Pro a ∈ (0, 1) označme menší z kladných čísel a, 1 − a jako δa. Uvážíme-li Oδa (a) = (a − δa, a + δa) ⊆ (0, 1), a ∈ (0, 1), vidíme, že libovolný bod intervalu (0, 1) je vnitřním bodem intervalu [0, 1). Pro každé δ ∈ (0, 1) je Oδ (0) ∩ [0, 1) = (−δ, δ) ∩ [0, 1) = [0, δ), Oδ (1) ∩ [0, 1) = (1 − δ, 1 + δ) ∩ [0, 1) = (1 − δ, 1), tj. každé δ-okolí bodu 0 obsahuje jisté body intervalu [0, 1) a hodnoty z intervalu (−δ, 0) a každé δ-okolí bodu 1 má neprázdný průnik s intervaly [0, 1), [1, 1 + δ). Body 0 a 1 jsou tedy hraničními body. Celkem jsme zjistili, že množina všech vnitřních bodů odpovídá intervalu (0, 1) a množina hraničních bodů je {0, 1}. Stačí si uvědomit, že bod nemůže být současně vnitřní a hraniční a že hraniční bod musí být izolovaný, nebo hromadný. V následujících příkladech se budeme zabývat výpočtem limit posloupností, tedy tím, jak posloupnosti „vypadají v nekonečnu“. Tj. pokud bychom chtěli předepsat n-tý člen posloupnosti pro hodně velké n, tak nám jej limita posloupnosti (pokud existuje) velmi dobře přiblíží. 5.10. Spočítejte následující limity posloupností: i) lim n→∞ 2n2+3n+1 n+1 , ii) lim n→∞ 2n2+3n+1 3n2+n+1 , iii) lim n→∞ n+1 2n2+3n+1 , iv) limn→−∞ 2n−2−n 2n+2−n , v) lim n→∞ √ 4n2+n n , vi) lim n→∞ √ 4n2 + n − 2n. Řešení. i) lim n→∞ 2n2+3n+1 n+1 = lim n→∞ 2n+3+ 1 n 1+ 1 n = ∞. ii) lim n→∞ 2n2+3n+1 3n2+n+1 = lim n→∞ 2+ 3 n + 1 n2 3+ 1 n + 1 n2 = 2 3 . iii) lim n→∞ n+1 2n2+3n+1 = lim n→∞ 1+ 1 n 2n+3+ 1 n = 1 ∞ = 0. iv) lim n→−∞ 2n − 2−n 2n + 2−n = lim n→−∞ 2n 2−n − 1 2n 2−n + 1 = −1 v) Podle věty o třech limitách (5.20): ∀n ∈ N : √ 4n2 n < √ 4n2+n n < √ 4n2+n+ 1 16 n . Dále pak lim n→∞ √ 4n2 n = lim n→∞ 2n n = 2, lim n→∞ √ 4n2+n+ 1 16 n = lim n→∞ 2n+ 1 4 n = 2. Tedy i lim n→∞ √ 4n2+n n = 2. 1. INTERPOLACE POLYNOMY -4 x 2 4 1 2 0 -1 0 -2 -2 -4 x 2 4 1 2 0 -1 0 -2 -2 Kolem interpolačních polynomů existuje bohatá teorie. dát nějaké další odkazy 5.5. Poznámka. Numerická nestabilita způsobená případnou blízkostí (některých) z bodů xi je dobře viditelná i na systému rovnic z důkazu Věty 5.3. Při řešení systémů lineárních rovnic totiž nestabilita do značné míry souvisí s velikostí determinantu matice systému, tj. v našem případě Vandermondova determinantu. Ten umíme vcelku snadno přímo spočíst: Lemma. Pro posloupnost po dvou různých skalárů x0, . . . , xn ∈ K platí V (x0, . . . , xn) = n∏ i>k=0 (xi − xk). Důkaz. Vztah dokážeme indukcí přes počet bodů xi. Evidentně je správný pro n = 1 (a pro n = 0 je úloha nezajímavá). Předpokládejme, že výsledek je správný pro n − 1, tj. V (x0, . . . , xn−1) = n−1∏ i>k=0 (xi − xk). Nyní považujme hodnoty x0, . . . , xn−1 za pevné a hodnotu xn ponechme jako volnou proměnnou. Rozvojem determinantu podle posledního řádku (viz ??) obdržíme hledaný determinant jako polynom (5.1) V (x0, . . . , xn) = (xn)n V (x0, . . . , xn−1) − (xn)n−1 · · · . Toto je polynom stupně n, protože víme, že jeho koeficient u (xn)n je nenulový dle indukčního předpokladu. Přitom bude zjevně nulový při dosazení kterékoliv hodnoty xn = xi pro i < n, protože bude v takovém případě obsahovat původní determinant dva stejné řádky. Náš polynom tedy bude dělitelný výrazem (xn − x0)(xn − x1) · · · (xn − xn−1), který má sám již stupeň n. Odtud vyplývá, že celý Vandermondův determinant coby polynom v proměnné xn musí být tomuto výrazu roven až na konstantní násobek, tj. V (x0, . . . , xn) = c · (xn − x0)(xn − x1) · · · (xn − xn−1). Porovnáním koeficientů u nejvyšší mocniny v (5.1) a tomto výrazu dostáváme c = V (x0, . . . , xn−1) 206 4. SPOJITÉ FUNKCE vi) lim n→∞ √ 4n2 + n − 2n = lim n→∞ ( √ 4n2 + n − 2n)( √ 4n2 + n + 2n) √ 4n2 + n + 2n = lim n→∞ n √ 4n2 + n + 2n = = lim n→∞ 1 √ 4n2+n n + 2 = 1 4 5.11. Buď c ∈ R+ (kladné reálné číslo). Ukážeme, že lim n→∞ n √ c = 1. Řešení. Uvažme nejprve c > 1. Vzhledem k tomu, že funkce n √ c je vzhledem k n klesající a její hodnoty jsou stále větší než 1, tak musí mít posloupnost n √ c limitu a tou je infimum jejich členů. Předpokládejme, že by tato limita byla větší než 1, řekněme 1 + ε, kde ε > 0. Pak by podle definice limity byly všechny hodnoty dané posloupnosti od jistého m menší než 1+ε + ε2 4 , t.j. zejména m √ c < 1+ε + eps2 4 . Potom by však 2m √ c = √ m √ c < √ 1 + ε + ε2 4 = 1 + ε 2 < 1 + ε, což je spor s tím, že 1 + ε je infimem dané posloupnosti. 5.12. Stanovte lim n→∞ n √ n. Řešení. Zřejmě je n √ n ≥ 1, n ∈ N. Můžeme tedy položit n √ n = 1 + an pro jistá čísla an ≥ 0, n ∈ N. Užitím binomické věty získáváme n = (1 + an)n = 1 + ( n 1 ) an + ( n 2 ) a2 n + · · · + an n, n ≥ 2 (n ∈ N). Odsud plyne odhad (všechna čísla an jsou nezáporná) n ≥ ( n 2 ) a2 n = n (n − 1) 2 a2 n, n ≥ 2 (n ∈ N), tj. po úpravě máme 0 ≤ an ≤ √ 2 n − 1 , n ≥ 2 (n ∈ N). Podle Věty o třech limitách je 0 = lim n→∞ 0 ≤ lim n→∞ an ≤ lim n→∞ √ 2 n − 1 = 0. Obdrželi jsme tak výsledek lim n→∞ n √ n = lim n→∞ (1 + an) = 1 + 0 = 1. Poznamenejme, že další užití Věty o třech limitách mj. dává 1 = lim n→∞ 1 ≤ lim n→∞ n √ c ≤ lim n→∞ n √ n = 1 pro libovolné reálné číslo c ≥ 1. CHAPTER 5. ZŘÍZENÍ ZOO a tím je důkaz lemmatu ukončen. Opět tedy vidíme, že determinant bude velmi malý, pokud jsou malé vzdálenosti bodů xi. 5.6. Derivace polynomů. Zjistili jsme, že hodnoty polynomů s rostoucí proměnnou rychle míří k nekonečným hodnotám (viz také obrázky). Proto je zřejmé, že polynomy nemohou nikdy vhodně popisovat jakékoliv periodicky se opakující děje (jako jsou např. hodnoty goniometrických funkcí). Mohlo by se ale zdát, že podstatně lepší výsledky budeme alespoň mezi body xi dosahovat, když si budeme kromě hodnot funkce hlídat, jak rychle naše funkce v daných bodech rostou. Za tímto účelem zavedeme (prozatím spíše intuitivně) pojem derivace pro polynomy. Můžeme přitom pracovat opět s reálnými, komplexními nebo racionálními polynomy. Rychlost růstu v bodě x ∈ R pro reálný polynom f (x) dobře vyjadřují podíly (5.2) f (x + x) − f (x) x a protože umíme spočíst (nad libovolným okruhem) (x+ x)k = xk +kxk−1 x+· · ·+ (k l ) xl ( x)k−l +· · ·+( x)k , dostaneme pro polynom f (x) = anxn +· · ·+a0 výše vedený podíl ve tvaru f (x + x) − f (x) x = an nxn−1 x + · · · + ( x)k x + · · · + a1 x x = nanxn−1 + (n − 1)an−1xn−2 + · · · + a1 + x(. . . ) kde výraz v závorce je polynomiálně závislý na x. Evidentně pro hodnoty x velice blízké nule dostaneme hodnotu libovolně blízkou následujícícmu výrazu: Derivace polynomů Derivací polynomu f (x) = anxn + · · · + a0 podle proměnné x rozumíme polynom f ′ (x) = nanxn−1 + (n − 1)an−1xn−2 + · · · + a1. Z definice je jasné, že právě hodnota f ′ (x0) derivace polynomu nám dává dobré přiblížení jeho chování v okolí bodu x0. Přesněji řečeno, přímky y = f (x0 + x) − f (x0) x (x − x0) + f (x0), tj. sečny grafu polynomu procházející body [x0, f (x0)] a [x0 + x, f (x0 + x)] se, se zmenšujícím se x, přibližují přímce y = f ′ (x0)(x − x0) + f (x0), což tedy musí být tečna grafu polynomu f . Hovoříme o lineárním přiblížení polynomu f jeho tečnou. Derivace polynomů je lineární zobrazení, které přiřazuje polynomům stupně nejvýše n polynomy stupně nejvýše n−1. 207 Nyní přejděme k určování limit funkcí. 5.13. Spočítejte (a) lim x→π/3 sin x; (b) lim x→2 x2 + x − 6 x2 − 3x + 2 ; (c) lim x→+∞ ( arccos 1 x + 1 )3 ; (d) lim x→−∞ arctg 1 x , lim x→−∞ arctg x4 , lim x→−∞ arctg (sin x) . Řešení. Případ (a). Připomeňme, že funkce je spojitá v jistém bodě, když je v tomto bodě její limita rovna funkční hodnotě. O funkci y = sin x však víme, že je spojitá na R. Dostáváme tak lim x→π/3 sin x = sin π 3 = √ 3 2 . Případ (b). Přímé dosazení x = 2 dává nulový čitatel i jmenovatel. Přesto je příklad velmi snadno řešitelný. Jednoduché krácení lim x→2 x2 + x − 6 x2 − 3x + 2 = lim x→2 (x − 2) (x + 3) (x − 2) (x − 1) = lim x→2 x + 3 x − 1 = 2 + 3 2 − 1 = 5 totiž vedlo ke správnému výsledku (díky spojitosti obdržené funkce v bodě x0 = 2). Uvědomme si zde, že limitu můžeme počítat pouze z funkčních hodnot v libovolně malém okolí daného bodu x0 a že přitom limita nezávisí na hodnotě přímo v tomto bodě. Při počítání limit tedy můžeme využívat krácení a rozšiřování výrazů, které nemění hodnoty uvažované funkce v libovolně zvoleném ryzím okolí bodu x0. Případ (c). Dvojnásobná záměna pořadí limity a vnější funkce převádí původní limitu na ( arccos ( lim x→+∞ 1 x + 1 ))3 . Lehce určíme, že lim x→+∞ 1 x + 1 = 0. Neboť je funkce y = arccos x spojitá v bodě 0, ve kterém nabývá hodnoty π/2, a funkce y = x3 je spojitá v bodě π/2, platí lim x→+∞ ( arccos 1 x + 1 )3 = ( arccos ( lim x→+∞ 1 x + 1 ))3 = (π 2 )3 . Případ (d). Funkce y = arctg x má vlastnosti „užitečné při počítání limit“ – je spojitá a prostá (rostoucí) na celé reálné ose. Tyto vlastnosti 1. INTERPOLACE POLYNOMY Iterací této operace dostáváme druhé derivace f ′′ , třetí derivace f (3) a obecně po k–násobném opakování polynom f (k) stupně n − k. Po n + 1 derivacích je výsledkem nulový polynom. Toto lineárním zobrazení je příkladem tzv. cyklického nilpotentního zobrazení, která jsou podrobněji rozebírána v odstavci 3.28 o nilpotentních zobrazeních. 5.7. Hermiteův interpolační problém. Uvažme opět m+1 po dvou různých reálných hodnot x0, . . . , xm, tj. xi ̸= xj pro všechna i ̸= j. Budeme chtít zase prokládat pomocí polynomů předem dané hodnoty, tentokrát ale budeme vedle hodnot předepisovat i první derivace. Tj. předpíšeme yi a y′ i pro všechna i. Hledáme polynom f , který bude nabývat těchto předepsaných hodnot a derivací. Zcela analogicky jako u interpolace pouhých hodnot obdržíme pro neznámé koeficienty polynomu f (x) = anxn + · · · + a0 systém 2(m + 1)rovnic a0 + x0a1 + · · · + (x0)n an = y0 ... a0 + xma1 + · · · + (xm)n an = ym a1 + 2x0a2 + · · · + n(x0)n−1 an = y′ 0 ... a1 + 2xma2 + · · · + n(xm)n−1 an = y′ m . Opět bychom mohli ověřit, že při volbě n = 2m + 1 bude determinant tohoto systému rovnic nenulový a tudíž bude existovat právě jedno řešení. Nicméně, obdobně ke konstrukci Lagrangeova polynomu lze zkonstruovat takový polynom f přímo. Prostě si vytvoříme jednu sadu polynomů s hodnotami nula nebo jedna jak u derivací tak u hodnot, abychom jejich jednoduchou lineární kombinací uměli dosáhnout potřebné hodnoty. Ověření následující definice a tvrzení necháme na čtenáři: Hermiteův interpolační polynom Hermiteův interpolační polynom definujeme pomocí fundamentálních Hermiteových polynomů: h1 i (x) = [ 1 − ℓ′′ (xi) ℓ′(xi) (x − xi) ] (ℓi(x))2 h2 i (x) = (x − xi) (ℓi(x))2 , kde ℓ(x) = ∏n i=1(x − xi). Tyto polynomy splňují: h1 i (xj ) = δ j i = { 1 pro i = j 0 pro i ̸= j (h1 i )′ (xj ) = 0 h2 i (xj ) = 0 (h2 i )′ (xj ) = δ j i 208 4. SPOJITÉ FUNKCE vždy (bez dalších podmínek či omezení) umožňují vnořit vyšetřovanou limitu do argumentu takové reálné funkce. Proto uvažujme arctg ( lim x→−∞ 1 x ) , arctg ( lim x→−∞ x4 ) , arctg ( lim x→−∞ sin x ) . Zřejmě je lim x→−∞ 1 x = 0, lim x→−∞ x4 = +∞ a limita limx→−∞ sin x neexistuje, což již implikuje lim x→−∞ arctg 1 x = arctg 0 = 0, lim x→−∞ arctg x4 = lim y→+∞ arctg y = π 2 a neexistenci poslední limity. 5.14. Vyčíslete limitu lim n→∞ (√ 2 · 4 √ 2 · 8 √ 2 · · · 2n√ 2 ) . Řešení. Ke stanovení limity postačuje její členy vyjádřit ve tvaru 2 1 2 · 2 1 4 · 2 1 8 · · · 2 1 2n = 2 1 2 + 1 4 + 1 8 +···+ 1 2n . Dostáváme tak lim n→∞ (√ 2 · 4 √ 2 · 8 √ 2 · · · 2n√ 2 ) = lim n→∞ 2 1 2 + 1 4 + 1 8 +···+ 1 2n = 2 lim n→∞ ( 1 2 + 1 4 + 1 8 +···+ 1 2n ) = 2 ∞∑ n=1 1 2n . Ze známého vzorce pro součet geometrické řady ∞∑ n=0 ( 1 2 )n = 2, tj. ∞∑ n=1 1 2n = ∞∑ n=0 ( 1 2 )n − ( 1 2 )0 = 2 − 1 = 1, plyne výsledek lim n→∞ (√ 2 · 4 √ 2 · 8 √ 2 · · · 2n√ 2 ) = 21 = 2. 5.15. Určete limitu lim x→0 1 − cos x x2 sin(x2) Řešení. lim x→0 1 − cos x x2 sin(x2) = lim x→0 2 sin2 (x 2 ) x2 sin(x2) = = lim x→0 1 2 sin2 (x 2 ) (x 2 )2 sin(x2) = = 1 2 ( lim x→0 sin (x 2 ) x 2 )2 · lim x→0 1 sin2 (x2) = 1 2 · ∞ = ∞. Předchozí výpočet je nutné chápat „odzadu“. Protože existují limity na pravé straně (ať už vlastní či nevlastní) a výraz 1 2 ·∞ má smysl CHAPTER 5. ZŘÍZENÍ ZOO a proto je Hermiteův interpolační polynom dán výrazem f (x) = k∑ i=1 ( yih1 i (xi) + y′ i h2 i (xi) ) . 5.8. Příklady Hermiteových polynomů. Úplně nejjednodušší případ je zadání hodnoty a derivace v jediném bodě. Tím určíme beze zbytku polynom stupně jedna f (x) = f (x0) + f ′ (x0)(x − x0) tj. právě rovnici přímky zadané hodnotou a směrnicí v bodě x0. Když zadáme hodnotu a derivaci ve dvou bodech, tj. y0 = f (x0), y′ 0 = f ′ (x0), y1 = f (x1), y′ 1 = f ′ (x1) pro dva různé body xi, dostaneme ještě pořád snadno počítatelný problém. Ukažme si jej ve zjednodušeném provedení, kdy x0 = 0, x1 = 1. Pak matice systému a její inverze budou A =     0 0 0 1 1 1 1 1 0 0 1 0 3 2 1 0     , A−1 =     2 −2 1 1 −3 3 −2 −1 0 0 1 0 1 0 0 0     . Přímým vynásobením A · (y0, y1, y′ 0 , y′ 1 )T pak vyjde vektor koeficientů (a3, a2, a1, a0)T polynomu f , tj. f (x) = (2y0 − 2y1 + y′ 0 + y′ 1 )x3 + (−3y0 + 3y1 − 2y′ 0 − y′ 1 )x2 + y′ 0 x + y0. 5.9. Interpolace splajny. Obdobně můžeme předepisovat libovolný konečný počet derivací v jednotlivých bodech a vhodnou volbou stupně polynomu obdržíme vždy jednoznačné interpolace. Nebudeme zde uvádět podrobnosti. Bohužel, u všech těchto interpolací pořád zůstávají problémy zmíněné už v případě jednoduchých interpolací hodnot – složitost výpočtů a nestabilita. Použití derivací však podbízí jednoduché vylepšení metodiky: Jak jsme viděli na obrázcích demonstrujících nestabilitu interpolace jedním polynomem dostatečně vysokého stupně, malé lokální změny hodnot zapřičiňovaly dramatické celkové změny chování výsledného polynomu. Nabízí se tedy využití malých polynomiálních kousků nízkých stupňů, které ale musíme umět rozumně navazovat. Nejjednodušší je propojení vždy dvou sousedních bodů lineárním polynomem. Tak se nejčastěji zobrazují data. Z pohledu derivací to znamená, že budou na jednotlivých úsecích konstantní a pak se skokem změní. O něco sofistikovanější možností je předepsat v každém bodě hodnotu a derivaci, tj. pro dva body budeme mít 4 hodnoty a jednoznačně tím určíme Hermiteův polynom 3. stupně, viz výše. Tento polynom pak můžeme použít pro všechny hodnoty nezávislé proměnné mezi krajními hodnotami x0 < x1. Hovoříme o intervalu [x0, x1]. Takové polynomiální příblížení po kouskách už bude mít tu vlastnost, že první derivace na sebe budou navazovat. 209 (viz Poznámka za větou (5.21)), existuje i původní limita. Kdybychom původní limitu rozdělili na součin limit lim x→0 (1 − cos(x) · lim x→0 1 x2 sin(x2) , jednalo by se o součin typu 0 · ∞, tedy nedefinovaný výraz, a o původní limitě bychom nemohli říci nic (zejména ne to, že neexistuje!). 5.16. Určete následující limity: i) lim x→2 x − 2 √ x2 − 4 , ii) lim x→0 sin (sin(x)) x , iii) lim x→0 sin2 (x) x , iv) lim x→0 e 1 x . Řešení. i) lim x→2 x − 2 √ x2 − 4 = lim x→2 x − 2 √ (x − 2)(x + 2) = lim x→2 √ x − 2 √ x + 2 = 0 4 = 0. ii) lim x→2 x − 2 √ x2 − 4 (5.26) = lim y→0 sin y y = 1, kde jsme využili toho, že lim x→0 sin(x) = 0. iii) lim x→0 sin2 (x) x = lim x→0 sin(x) · lim x→0 sin x x = 0 · 1 = 0, opět původní limita existuje, protože existují obě limity na pravé straně rovnosti a jejich součin je definován. iv) Při výpočtu této limity musíme být obezřetní, protože obě jednostranné limity v bodě nula existují, jejich hodnoty se však liší, zkoumaná limita tedy neexistuje: lim x→0+ e 1 x = elimx→0+ 1 x = e∞ = ∞, lim x→0− e 1 x = elimx→0− 1 x = e−∞ = 0. 1. INTERPOLACE POLYNOMY V praxi ale není pouhé navazování první derivace dostatečné a navíc při naměřených datech nemíváme hodnoty derivací k dispozici. Přímo se proto vnucuje pokus využívat pouze zadané hodnoty ve dvou sousedních bodech, ale požadovat zároveň rovnost prvních i druhých derivací u sousedních kousků polynomů třetího stupně. To totiž bude znamenat stejné množství rovnic a neznámých a pravděpodobně tedy i obdobnou praktickou řešitelnost problému: Kubické splajny Nechť x0 < x1 < · · · < xn jsou reálné hodnoty, ve kterých jsou zadány požadované hodnoty y0, . . . , yn. Kubickým interpolačním splajnem pro toto zadání je funkce S : R → R, která splňuje následující podmínky: • zúžení S na interval [xi−1, xi] je polynom Si nejvýše třetího stupně, i = 1, . . . , n • Si(xi−1) = yi−1 a Si(xi) = yi pro všechny i = 1, . . . n, • S′ i (xi) = S′ i+1 (xi) pro všechny i = 1, . . . , n − 1, • S′′ i (xi) = S′′ i+1 (xi) pro všechny i = 1, . . . , n − 1. Kubický splajn1 pro n + 1 bodů sestává z n kubických polynomů, tj. máme k dispozici 4n volných parametrů (první definiční podmínka). Další podmínky přitom zadávají 2n + (n − 1) + (n − 1) rovností, tj. dva parametry zůstávají volné. Při praktickém použití se dodávají předpisy pro derivace v krajních bodech, tzv. úplný splajn, nebo jsou tyto zadány jako nula, tzv. přirozený splajn. Výpočet celého splajnu už není bohužel tak jednoduchý jako u nezávislých výpočtů Hermiteových polynomů třetího stupně, protože data se prolínají vždy mezi sousedními intervaly. Při vhodném uspořádání se však dosáhne matice systému, která má nenulové prvky prakticky jen ve třech diagonálách, a pro takové existují vhodné numerické postupy, které umožní splajn počítat také v čase úměrném počtu bodů. Pro srovnání se podívejme na interpolaci stejných dat jako v případě Lagrangeova polynomu, nyní pomocí splajnů: 0 -4 0 -0,5 2 -1 1 -2 4 x 0,5 0 -4 -0,5 x 2 -1 1 0 0,5 4-2 1Ošklivé české slovo „splajn“ vzniklo fonetickým přepisem anglického ekvivalentu „spline“, který znamenal tvárné pravítko užívané inženýry pro kreslení křivek. 210 4. SPOJITÉ FUNKCE 5.17. Určete (a) lim x→2 x + 2 (x − 2)6 ; (b) lim x→2 x + 2 (x − 2)5 ; (c) lim x→+∞ ( 2 + 1 x )1 x ; (d) lim x→+∞ x−x . Řešení. V tomto příkladu se budeme věnovat tzv. neurčitým výrazům. Přesněji řečeno, budeme se zabývat situacemi, kdy se o ně nejedná. Čtenáři doporučujeme, aby neurčité výrazy vnímal jako pojem pomocný, který mu má pouze usnadnit orientování se při prvním počítání limit, neboť obdržený neurčitý výraz pouze znamená, že jsme „nic nezjistili“. Víme, že limita součtu je součet limit, limita součinu je součin limit a že limita podílu je podíl limit, pokud jednotlivé limity existují a nezískáme-li některý z výrazů ∞ − ∞, 0 · ∞, 0/0, ∞/∞, o kterých právě hovoříme jako o neurčitých. Pro úplnost dodejme, že tato pravidla můžeme kombinovat (pro limity všech složek určené současně) a že za neurčitý výraz pak považujeme také ten, jenž obsahuje alespoň jeden neurčitý výraz. Např. tedy výrazy −∞+∞ = ∞−∞, −∞ 3 + ∞ = − ∞ ∞ , 0 (−∞)3 + ∞ = 0·(∞ − ∞)−1 označujeme jako neurčité a o výrazech −∞ − ∞, 0 3 + ∞ , 0 (−∞)3 − ∞ můžeme říci, že jsou „určité“ (pro ně jsme schopni ihned příslušnou limitu stanovit – výrazy odpovídají po řadě hodnotám −∞, 0, 0). V případě (a) podíl limit čitatele a jmenovatele dává výraz 4/0. Zápis, ve kterém dělíme nulou, je sám o sobě přinejmenším nežádoucí (později bychom se mu měli být schopni vyvarovat). Přesto nám umožní stanovit výsledek: nejedná se o neurčitý výraz. Všimněme si, že jmenovatel se blíží k nule zprava (pro x ̸= 2 je (x − 2)6 > 0). To zapisujeme jako 4/+0. Čitatel a jmenovatel tak mají stejné znaménko v jistém ryzím okolí bodu x0 = 2 a lze říci, že jmenovatel je v limitě „nekonečněkrát menší“ než čitatel, tj. lim x→2 x + 2 (x − 2)6 = +∞, což odpovídá položení 4/ + 0 = +∞ (podobně se klade 4/ − 0 = −∞). CHAPTER 5. ZŘÍZENÍ ZOO 2. Reálná čísla a limitní procesy Je důležité mít dostatečně velkou zásobu funkcí, se kterými bude možné možné vyjadřovat všechny běžné závislosti, zároveň ale musí být výběr šikovně omezen, abychom uměli vybudovat nějaké univerzální a hlavně účinné nástroje pro práci s nimi. Ve skutečnosti se budeme muset hned z kraje soustředit na to, jak vůbec hodnoty funkcí definovat, když pomocí konečně mnoha násobení a sčítání dostáváme jen polynomy a navíc skutečně počítat umíme jen s čísly racionálními. S těmi ale nevystačíme ani při počítání odmocnin, protože už √ 2 racionální číslo není. Prvním naším krokem tedy musí být pořádné zavedení tzv. limitních procesů, tj. dáme přesný obsah tvrzením, že se nějaké hodnoty blíží jejich hodnotě limitní. Všimněme si také, že výraznou vlastností polynomů je jejich „spojitá“ závislost hodnot na nezávislé proměnné. Intuitivně řečeno, když dostatečně málo změníme x, určitě se nám moc nezmění ani hodnota f (x). Takové chování naopak nemáme u po částech konstantních funkcí f : R → R v okolí „skoků“. Např. u tzv. Heavisideovy funkce f (x) =    0 pro všechny x < 0 1/2 pro x = 0 1 pro všechny x > 0 taková „nespojitost“ nastane pro x = 0. Začneme formalizací takovýchto intuitivních výroků. 5.10. Reálná čísla. Prozatím jsme docela dobře vystačili s algebraickými vlastnostmi reálných čísel, které říkaly, že R je pole. Už jsme ale používali i relaci uspořádání reálných čísel, kterou značíme „≤“ (viz odstavec 1.38). Vlastnosti (axiomy) reálných čísel, včetně souvislostí uspořádání a ostatních relací, jsou srhnuty v následující tabulce. Dělící čáry naznačují, jak axiomy postupně zaručují, že jsou reálná čísla komutativní grupou vůči sčítání, že R \ {0} je komutativní grupa vůči násobení, R je pole, množina R spolu s operacemi +, · a s relací uspořádání je tzv. uspořádané pole a konečně poslednímu axiomu můžeme rozumět tak, že R je „dostatečně husté“, tj. nechybí nám tam body, jako např. chybí √ 2 v číslech racionálních. Axiomy reálných čísel 211 Při určování druhé limity lze postupovat analogicky. Protože čísla a ∈ R a a5 mají stejná znaménka, dostáváme lim x→2+ x + 2 (x − 2)5 = +∞ ̸= −∞ = lim x→2− x + 2 (x − 2)5 , tj. oboustranná limita neexistuje. Tomu odpovídá zápis 4/ ± 0 (nebo obecnější a/ ± 0, a ̸= 0, a ∈ R∗ ), který je „určitým výrazem“. Při důsledném oddělování symbolů +0 a −0 od ±0 vždy a/±0 pro a ̸= 0 znamená, že limita neexistuje. Případy (c), (d). Je-li f (x) > 0 pro všechna uvažovaná x ∈ R, platí f (x)g(x) = eln ( f (x)g(x) ) = eg(x)·ln f (x) . Využijeme-li toho, že exponenciální funkce je spojitá a prostá na reálné přímce, můžeme nahradit limitu lim x→x0 f (x)g(x) za e lim x→x0 (g(x)·ln f (x)) . Připomeňme, že jedna z těchto limit existuje právě tehdy, když existuje druhá; a doplňme lim x→x0 (g(x) · ln f (x)) = a ∈ R ⇒ lim x→x0 f (x)g(x) = ea , lim x→x0 (g(x) · ln f (x)) = +∞ ⇒ lim x→x0 f (x)g(x) = +∞, lim x→x0 (g(x) · ln f (x)) = −∞ ⇒ lim x→x0 f (x)g(x) = 0. Můžeme tudíž psát lim x→x0 f (x)g(x) = e lim x→x0 g(x)· lim x→x0 ln f (x) , jestliže obě limity vpravo existují a neobdržíme-li neurčitý výraz 0 · ∞. Není obtížné si uvědomit, že tento neurčitý výraz lze získat pouze ve třech případech odpovídajících zbylým neurčitým výrazům 00 ; ∞0 ; 1∞ , kdy postupně je lim x→x0 f (x) = 0 a lim x→x0 g(x) = 0; lim x→x0 f (x) = +∞ a lim x→x0 g(x) = 0; lim x→x0 f (x) = 1 a lim x→x0 g(x) = ±∞. V ostatních případech nám tedy znalost (a pochopitelně existence) li- mit lim x→x0 f (x), lim x→x0 g(x) umožňuje uvést výsledek (při dodefinování některých zápisů) lim x→x0 f (x)g(x) = ( lim x→x0 f (x) ) lim x→x0 g(x) . Protože lim x→+∞ ( 2 + 1 x ) = 2, lim x→+∞ 1 x = 0, lim x→+∞ x = +∞, 2. REÁLNÁ ČÍSLA A LIMITNÍ PROCESY (R1) (a + b) + c = a + (b + c), pro všechny a, b, c ∈ R (R2) a + b = b + a, pro všechny a, b ∈ R (R3) existuje prvek 0 ∈ R takový, že pro všechny a ∈ R platí a + 0 = a (R4) pro všechny a ∈ R existuje opačný prvek (−a) ∈ R takový, že platí a + (−a) = 0 (R5) a · b) · c = a · (b · c), pro všechny a, b, c ∈ R (R6) a · b = b · a pro všechny a, b ∈ R (R7) existuje prvek 1 ∈ R takový, že pro všechny a ∈ R platí 1 · a = a (R8) pro každý a ∈ R, a ̸= 0 existuje inverzní prvek a−1 ∈ R takový, že platí a · a−1 = 1 (R9) a · (b + c) = a · b + a · c, pro všechny a, b, c ∈ R (R10) relace ≤ je úplné uspořádání, tj. reflexivní, antisymetrická, tranzitivní a úplná relace na R (R11) pro všechny a, b, c ∈ R platí, že z a ≤ b vyplývá také a + c ≤ b + c (R12) pro všechny a, b ∈ R, a > 0, b > 0, platí také a · b > 0 (R13) každá neprázdná ohraničená množina A ⊂ R má supremum. Pojem supremum musíme ale také zavést pořádně. Má smysl pro každou uspořádanou množinu, tj. množinu s pevně zadanou relací uspořádání, a budeme se s ním takto i později setkávat ve více algebraických souvislostech. Připomeňme, že v obecné úrovni je uspořádáním jakákoliv binární relace na množině, která má vlastnosti reflexivity, antisymetrie a tranzitivity, viz odstavec 1.38. Supremum a infimum na uspořádaných množinách Definice. Uvažme podmnožinu A ⊂ B v uspořádané množině B. Horní závorou množiny A je každý prvek b ∈ B, pro který platí, že b ≥ a pro všechny a ∈ A. Obdobně definujeme dolní závory množiny A jako prvky b ∈ A takové, že b ≤ a pro všechny a ∈ A. Nejmenší horní závora podmnožiny A, pokud existuje, se nazývá supremum této podmnožiny a značíme ji sup A. Obdobně, největší dolní závora, pokud existuje, se nazývá infimum, píšeme inf A. Posledním axiomem v naší tabulce vlastností reálných čísel tedy předpokládáme, že pro každou množinu reálných čísel A platí, že pokud existuje nějaké číslo a větší nebo rovno než všechna x ∈ A, pak existuje také nejmenší takové číslo a. Např. volbou A = {x ∈ Q, x2 < 2} dosteneme jako supremum sup A právě √ 2. Okamžitým důsledkem je také existence infim pro každou zdola ohraničenou množinu reálných čísel (stačí si všimnout, že obrácením znaménka všech čísel zaměníme suprema a infima). 212 4. SPOJITÉ FUNKCE je lim x→+∞ ( 2 + 1 x )1 x = 20 = 1; lim x→+∞ x−x = lim x→+∞ ( 1 x )x = 0 nebo lim x→+∞ x−x = lim x→+∞ ( xx )−1 = 0. Poslední výsledek pak bychom mohli vyjádřit zápisem 0∞ = 0 či ∞∞ = ∞, ∞−1 = 0 (zdůrazněme, že se nejedná o neurčité vý- razy). Přestože jsme kladli důraz na to, aby čtenář raději upřednostňoval úvahy o limitním chování funkcí před škatulkováním výrazů na určité a neurčité (a tyto pojmy vnímal jen jako pomocné), je snad dobře patrný důvod, proč se budeme nadále zabývat především neurčitými vý- razy. 5.18. Vypočítejte lim x→+∞ sin x + πx2 2 cos x − 1 − x2 ; lim x→+∞ 3x+1 + x5 − 4x 3x + 2x + x2 ; lim x→+∞ 4x − 8x6 − 2x − 167 3x − 45x − √ 11πx+12 ; lim x→+∞ √ x − sin3 x + x arctg x √ 1 + 2x + x2 . Řešení. Vydělíme-li v případě první z limit čitatele i jmenovatele polynomem x2 , obdržíme lim x→+∞ sin x + πx2 2 cos x − 1 − x2 = lim x→+∞ sin x x2 + π 2 cos x−1 x2 − 1 . Ohraničenost výrazů | sin x | ≤ 1, | 2 cos x − 1 | ≤ 3 pro x ∈ R a x2 → +∞ pro x → +∞ pak dávají výsledek lim x→+∞ sin x x2 + π 2 cos x−1 x2 − 1 = 0 + π 0 − 1 = −π. V předešlé úvaze jsme vlastně použili Větu o třech limitách a zápis c/∞ = 0 platný pro c ∈ R (nebo přímo ohr./∞ = 0, kde „ohr.“ značí ohraničenou funkci). Tento postup lze zobecnit. Pro limitu tvaru lim x→x0 f1(x) + f2(x) + · · · + fm(x) g1(x) + g2(x) + · · · + gn(x) , CHAPTER 5. ZŘÍZENÍ ZOO Pro formální výstavbu další teorie ale potřebujeme vědět, zda námi požadované vlastnosti reálných čísel lze realizovat, tj. zda existuje taková množina R s operacemi a relací uspořádání, které všech třináct axiomů skutečně splňují. Zatím jsem zkonstruovali korektně jen čísla racionální, která tvoří uspořádané pole, tj. splňují axiomy (R1) – (R12), což si čtenář jistě snadno ověří. Ve skutečnosti lze reálná čísla nejen zkonstruovat, ale také lze ukázat, že až na izomorfismus to jde jediným způsobem. Pro naši potřebu vystačíme s intuitivní představou reálné přímky. Jednoznačnost proto nebudeme diskutovat vůbec a existenci jen naznačíme v dalších odstavcích. 5.11. Komplexní rovina. Připomeňme, že komplexní čísla jsou dána jako dvojice reálných čísel, které jsme zvyklí zapisovat jako z = re z + i im z. Dobrou představou o komplexních číslech je proto rovina C = R2 . Se sčítáním a násobením splňuje pole komplexních čísel axiomy (R1)–(R9), není na nich ale žádným rozumným způsobem definováno uspořádání, které by naplnilo axiomy (R10)– R(13). Nicméně s nimi budeme také pracovat a již dříve jsme viděli, že rozšíření skalárů na komplexní čísla je často pro výpočty mimořádně užitečné. Důležitou operací na komplexních čísel je tzv. konjugace. Je to zrcadlení podle přímky reálných čísel, tj. obrácení znaménka u imaginární složky. Značíme ji pruhem nad daným číslem z ∈ C, ¯z = re z − i im z. Protože je pro z = x + iy z · ¯z = (x + iy)(x − iy) = x2 + y2 , zadává nám tento výraz právě kvadrát vzdálenosti komplexního čísla od nuly. Odmocnině z tohoto reálného nezáporného čísla říkáme absolutní hodnota komplexního čísla z, píšeme (5.3) |z|2 = z · ¯z Absolutní hodnotu máme definovánu také na každém uspořádaném poli skalárů, prostě definujeme absolutní hodnotu |a| takto |a| = { a je-li a ≥ 0 −a je-li a < 0. Samozřejmě platí pro každá dvě čísla a, b ∈ K (5.4) |a + b| ≤ |a| + |b|. Této vlastnosti říkáme trojúhelníková nerovnost a splňuje ji také absolutní hodnota komplexních čísel definovaná výše. Zejména pro pole racionálních a reálných čísel, která jsou podmonožinami v komplexní rovině zjevně obě definice absolutní hodnoty splývají. 213 přičemž lim x→x0 fi(x) f1(x) = 0, i ∈ {2, . . . , m}, lim x→x0 gi(x) g1(x) = 0, i ∈ {2, . . . , n}, platí lim x→x0 f1(x) + f2(x) + · · · + fm(x) g1(x) + g2(x) + · · · + gn(x) = lim x→x0 f1(x) g1(x) , pokud limita na pravé straně existuje. Je přitom výhodné si uvědomit (třetí z limit lze určit např. pomocí l’Hospitalova pravidla, se kterým se seznámíme později), že lim x→+∞ c xα = 0, lim x→+∞ xα xβ = 0, lim x→+∞ xβ ax = 0, lim x→+∞ ax bx = 0 pro c ∈ R, 0 < α < β, 1 < a < b. Odtud ihned plyne lim x→+∞ 3x+1 + x5 − 4x 3x + 2x + x2 = lim x→+∞ 3 · 3x 3x = 3; lim x→+∞ 4x − 8x6 − 2x − 167 3x − 45x − √ 11πx+12 = lim x→+∞ 4x − √ 11π12 · πx = −∞. Uvědomíme-li si, že je lim x→+∞ arctg x = π 2 ≥ 1, stejně snadno dostaneme lim x→+∞ √ x − sin3 x + x arctg x √ 1 + 2x + x2 = lim x→+∞ x arctg x √ x2 = lim x→+∞ arctg x = π 2 . 5.19. Vyčíslete limity lim n→∞ ( 1 1 · 2 + 1 2 · 3 + 1 3 · 4 + · · · + 1 (n − 1) · n ) ; lim n→∞ ( 1 √ n2 + 1 + 1 √ n2 + 2 + · · · + 1 √ n2 + n ) . Řešení. Neboť pro každé přirozené číslo k ≥ 2 je (provádíme tzv. rozklad na parciální zlomky – budeme jej probírat u integrování racionálních lomených funkcí) 1 (k − 1) k = 1 k − 1 − 1 k , platí lim n→∞ ( 1 1 · 2 + 1 2 · 3 + 1 3 · 4 + · · · + 1 (n − 1) · n ) = lim n→∞ ( 1 1 − 1 2 + 1 2 − 1 3 + 1 3 − 1 4 + · · · + 1 n − 1 − 1 n ) = lim n→∞ ( 1 − 1 n ) = 1. 2. REÁLNÁ ČÍSLA A LIMITNÍ PROCESY 5.12. Konvergence posloupností. V dalších odstavcích budeme pracovat s některým z číslených oborů K racionálních, reálných nebo komplexních čísel. V tomto kontextu je tedy třeba chápat absolutní hodnotu a skutečnost, že ve všech případech platí trojúhelníková nerovnost. Cauchyovské posloupnosti Uvažme libovolnou posloupnost čísel a0, a1, . . . v K takovou, že pro libolné pevně zvolené kladné číslo ϵ > 0 platí pro všechny dvojice prvků ai, aj posloupnosti, až na konečně mnoho výjimek (které závisí na volbě ϵ), |ai − aj | < ϵ. Jinak řečeno, pro každé pevné ϵ > 0 existuje index N takový, že předcházející nerovnost platí pro všechna i, j > N. Takové posloupnosti prvků se říká Cauchyovská posloupnost. Intuitivně jistě cítíme, že buď jsou v takové posloupnosti všechny prvky stejné až na konečně mnoho z nich (pak bude od určitého indexu N počínaje vždy |ai − aj | = 0) nebo se taková posloupnost „hromadí“ k nějaké hodnotě. Dobře je to představitelné v komplexní rovině: ať vybereme jakkoliv malý kruh (o poloměru ϵ), tak se nám jej u Cauchyovské posloupnosti vždy musí podařit položit do komplexní roviny tak, že zakryje všechny body nekonečné posloupnosti ai, až na konečně mnoho z nich. Můžeme si pak představit, že postupným zmenšováním se kruh smrští až do jediné hodnoty a. Pokud by taková hodnota a ∈ K pro Cauchyovskou posloupnost skutečně existovala, očekávali bychom od ní patrně následující vlastnost konvergence: Konvergující posloupnost Jestliže pro posloupnost čísel a0, a1, · · · ∈ K, pevně zvolené číslo a ∈ K a pro libovolné kladné reálné číslo ϵ platí pro všechny i, až na konečně mnoho výjimek (závisejících na volbě ϵ), |ai − a| < ϵ, říkáme, že posloupnost ai, i = 0, 1, . . . , konverguje k hodnotě a. Číslu a také říkáme limita posloupnosti ai, i = 0, 1, . . . . Jestliže nějaká posloupnost ai ∈ K, i = 0, 1, . . . , konverguje k číslu a ∈ K, pak pro každé pevně zvolené kladné ϵ víme, že |ai − a| < ϵ pro všechna i větší než vhodné N ∈ N. Pak ovšem, díky trojúhelníkové nerovnosti, pro každou dvojici indexů i, j ≥ N dostáváme |ai −aj | = |ai −aN +aN −aj | < |ai −aN |+|aN −aj | < 2ϵ. Dokázali jsme tedy: Lemma. Každá konvergující posloupnost čísel je Cauchyov- ská. 214 4. SPOJITÉ FUNKCE Poznamenejme, že stanovení této limity je důležité: určuje součet jedné z tzv. teleskopických řad (se kterou pracoval již Johann I. Ber- noulli). Ke stanovení druhé limity využijeme Větu o třech limitách. Od- hady 1 √ n2 + 1 +· · ·+ 1 √ n2 + n ≥ 1 √ n2 + n +· · ·+ 1 √ n2 + n = n √ n2 + n , 1 √ n2 + 1 +· · ·+ 1 √ n2 + n ≤ 1 √ n2 + 1 +· · ·+ 1 √ n2 + 1 = n √ n2 + 1 pro n ∈ N dávají lim n→∞ n √ n2 + n ≤ lim n→∞ ( 1 √ n2 + 1 + · · · + 1 √ n2 + n ) ≤ lim n→∞ n √ n2 + 1 . Protože lim n→∞ n √ n2 + n = lim n→∞ n √ n2 = 1, lim n→∞ n √ n2 + 1 = lim n→∞ n √ n2 = 1, je rovněž lim n→∞ ( 1 √ n2 + 1 + 1 √ n2 + 2 + · · · + 1 √ n2 + n ) = 1. 5.20. Spočtěte (a) lim x→0 √ 1 + x − √ 1 − x x ; (b) lim x→π/4 cos x − sin x cos (2x) ; (c) lim x→+∞ ( 3 √ x4 ( 3 √ x2 + 2x + 3 − 3 √ x2 + 2x + 2 )) . Řešení. Všechny uvedené limity vypočítáme pomocí vhodného rozšíření zadaného výrazu. V případě první limity vynásobíme čitatele i jmenovatele výrazem √ 1 + x + √ 1 − x a využijeme známého vztahu (a − b) (a + b) = a2 − b2 . Takto ob- držíme lim x→0 √ 1 + x − √ 1 − x x = lim x→0 (1 + x) − (1 − x) x (√ 1 + x + √ 1 − x ) = lim x→0 2 √ 1 + x + √ 1 − x = 2 √ 1 + √ 1 = 1. CHAPTER 5. ZŘÍZENÍ ZOO V poli racionálních čísel se ovšem může snadno stát, že pro Cauchyovské posloupnosti příslušná hodnota a neexistuje. Např. číslo √ 2 můžeme libovolně přesně přiblížit racionálními čísly ai, dostaneme tedy konvergentní posloupnost s limitou √ 2, ale samotná limita již není racionální. Uspořádaná pole skalárů, ve kterém všechny Caychyovské posloupnosti konvergují, se nazývají úplná. Následující tvrzení říká, že axiom (R13) takové chování reálných čísel zaručuje: Věta. Každá Cauchyovská posloupnost reálných čísel ai konverguje k reálné hodnotě a ∈ R. Důkaz. Každá Cauchyovská posloupnost je zjevně ohraničená množina, protože pro libovolnou volbu ϵ ohraničíme všechny členy posloupnosti až na konečně mnoho z nich. Definujme si množinu B všech reálných čísel x, pro které platí x < aj pro všechny prvky aj posloupnosti, až na konečně mnoho z nich. Zřejmě má B horní závoru, tudíž podle axiomu (R13) má i supremum. Definujme a = sup B. Nyní pro nějaké pevně zvolené ϵ > 0 zvolme N takové, aby |ai − aj | < ϵ pro všechny i, j ≥ N. Zejména tedy aj > aN − ϵ a aj < aN + ϵ pro všechny indexy j > N, takže aN −ϵ patří do B, zatímco aN +ϵ už nikoliv. Souhrnně z toho dostáváme, že |a −aN | ≤ ϵ, a proto také |a − aj | ≤ |a − aN | + |aN − aj | ≤ 2ϵ pro všechny j > N. To ale značí právě, že a je limitou uvažované posloupnosti. Důsledek. Každá Cauchyovská posloupnost komplexních čísel zi konverguje k nějakému komplexnímu číslu z. Důkaz. Pišme zi = ai + i bi. Protože je |ai − aj |2 ≤ |zi − zj |2 a podobně i pro hodnoty bi, jsou obě posloupnosti reálných čísel ai a bi Cauchyovské. Existují tedy jejich limity a resp. b a snadno ověříme, že z = a + i b je limitou pro posloupnost zi. 5.13. Poznámka. Předchozí diskuse nám dává návod na jeden z možných postupů, jak korektně vybudovat reálná čísla. Postupujeme podobně jako při zúplňování přirozených čísel na celá (abychom přidali opačné hodnoty) a celých na racionální (abychom přidali podíly nenulových čísel). Tentokrát k racionálním číslům „přidáme“ limity všech Cauchyovských po- sloupností. Skutečně se podbízí zavést vhodně relaci ekvivalence na množině všech Cauchyovských posloupností racionálních čísel tak, že dvě Cauchyovské posloupnosti jsou ekvivalentní, když jejich sloučením do jediné posloupnosti (např. tak, že první posloupnost bude představovat liché, zatímco druhá sudé členy výsledné posloupnosti) obdržíme opět posloupcitace nějakého zdroje, případně alternativní možnosti zavedení reálných čísel nost Cauchyovskou. Nebudeme zde podrobně ověřovat, že jde o ekvivalenci, ani zavádět operace násobení a sčítání, ani dokazovat, že všechny požadované axiomy skutečně dojdou 215 Podobně vypočítáme lim x→π/4 cos x − sin x cos (2x) = lim x→π/4 (cos x + sin x) (cos x − sin x) (cos x + sin x) cos (2x) = lim x→π/4 cos2 x − sin2 x (cos x + sin x) cos (2x) = lim x→π/4 1 cos x + sin x = 1 √ 2 2 + √ 2 2 = √ 2 2 . U provedeného krácení připomeňme identitu cos (2x) = cos2 x − sin2 x, x ∈ R. Abychom mohli při určování poslední limity použít (a − b) ( a2 + ab + b2 ) = a3 − b3 , k rozšíření potřebujeme výraz 3 √ ( x2 + 2x + 3 )2 + 3 √ x2 + 2x + 3· 3 √ x2 + 2x + 2+ 3 √ ( x2 + 2x + 2 )2 , který odpovídá a2 + ab + b2 , resp. volíme a = 3 √ x2 + 2x + 3, b = 3 √ x2 + 2x + 2. Tímto rozšířením převedeme limitu ze zadání na lim x→+∞ 3 √ x4 (( x2 + 2x + 3 ) − ( x2 + 2x + 2 )) 3 √( x2 + 2x + 3 )2 + 3 √ x2 + 2x + 3 · 3 √ x2 + 2x + 2 + 3 √( x2 + 2x + 2 )2 , tj. lim x→+∞ 3 √ x4 3 √( x2 + 2x + 3 )2 + 3 √ x2 + 2x + 3 · 3 √ x2 + 2x + 2 + 3 √( x2 + 2x + 2 )2 . Poslední limitu umíme snadno vyčíslit. Víme totiž, že je určena pouze jedním členem v čitateli a jedním ve jmenovateli, a to axp pro největší p (v tomto případě je uvažovaný člen ve jmenovateli rozdělen na několik sčítanců). Platí tudíž lim x→+∞ 3 √ x4 3 √( x2 + 2x + 3 )2 + 3 √ x2 + 2x + 3 · 3 √ x2 + 2x + 2 + 3 √( x2 + 2x + 2 )2 = lim x→+∞ 3 √ x4 3 √( x2 )2 + 3 √ x2 · 3 √ x2 + 3 √( x2 )2 = lim x→+∞ 3 √ x4 3 3 √ x4 = 1 3 . Celkem tak je lim x→+∞ ( 3 √ x4 ( 3 √ x2 + 2x + 3 − 3 √ x2 + 2x + 2 )) = 1 3 . 2. REÁLNÁ ČÍSLA A LIMITNÍ PROCESY naplnění. Není to ale složité počínání. Složitější ambicí je dokázat, že axiomy (R1)–(R13) definují reálné čísla v jistém smyslu jednoznačně. 5.14. Otevřené a uzavřené množiny. Pro další práci s reálnými nebo komplexními čísly budeme potřebovat podrobnější pochopení pojmů jako blízkost, omezenost, konvergence apod. Hromadné body množiny Uvažme jakoukoliv množinu A bodů v K a předpokládejme, že posloupnost a0, a1, . . . je vybraná z prvků A. Pokud konverguje k hodnotě a ∈ K a navíc je nekonečně mnoho bodů ai ∈ A různých od a, nazýváme a hromadný bod množiny A. Hromadné body podmnožiny A racionálních, reálných nebo komplexních čísel jsou tedy ta čísla, která jsou limitami posloupností čísel z A. Všimněme si, že hromadný bod množiny do ní nemusí patřit. Uzavřené množiny Uzavřená podmnožina v K je taková, která obsahuje i všechny své hromadné body. Typickou uzavřenou množinou je tzv. uzavřený interval [a, b] = {x ∈ R, a ≤ x ≤ b} reálných čísel. Zde a je reálné číslo nebo hraniční hodnota chybí a píšeme a = −∞ (mínus nekonečno) a podobně b > a je reálné číslo nebo +∞. Uzavřené množiny jsou tedy ty, které v sobě mají i vše, k čemu umí „dokonvergovat“. Uzavřenou množinu bude tvořit např. posloupnost reálných čísel bez hromadného bodu nebo posloupnost s konečným počtem hromadných bodů spolu s těmito body. Uzavřený je také např. jednotkový kruh v rovině komplexních čísel včetně hraniční kružnice. Snadno ověříme, že libovolný průnik a libovolné konečné sjednocení uzavřených množin opět uzavřená množina. Skutečně, pokud všechny body nějaké posloupnosti patří do průniku našeho systému množin, pak jistě patří do každé z nich a proto do každé z nich patří i všechny hromadné body. Pokud bychom ale chtěli totéž říci o obecném sjednocení systému množin Ai, pak bychom neuspěli, protože např. jednobodové množiny jsou zjevně uzavřené, ale z nich utvořená posloupnost bodů už uzavřená nebývá. Pokud ale jde o konečné sjednocení množin a hromadný bod nějaké posloupnosti ležící v tomto sjednocení, pak takový hromadný bod musí být hromadným bodem i vybrané podposloupnosti, která ale už bude celá v jedné z našich množin. Každá je ale uzavřená, takže i hromadný bod do ní a tedy i celého sjednocení patří. 216 4. SPOJITÉ FUNKCE 5.21. Pro libovolné n ∈ N určete limitu lim x→0 (1 + 2nx)n − (1 + nx)2n x2 . Řešení. Podle binomické věty je (1 + 2nx)n = 1 + ( n 1 ) 2nx + ( n 2 ) (2nx)2 + P (x) x3 , x ∈ R, (1 + nx)2n = 1 + ( 2n 1 ) nx + ( 2n 2 ) (nx)2 + Q (x) x3 , x ∈ R pro jisté polynomy P , Q. Raději vyzdvihněme, že předchozí vyjádření skutečně platí pro všechna n ∈ N. Pro n = 1 si stačí uvědomit, že klademe (1 2 ) = 0 a že polynomy P , Q mohou být identicky rovny nule. Dostáváme tedy (1 + 2nx)n = 1 + 2n2 x + 2n3 (n − 1) x2 + P (x) x3 , x ∈ R, (1 + nx)2n = 1 + 2n2 x + n3 (2n − 1) x2 + Q (x) x3 , x ∈ R. Pouhé dosazení a jednoduché úpravy již dávají lim x→0 (1 + 2nx)n − (1 + nx)2n x2 = lim x→0 ( 2n3 (n − 1) − n3 (2n − 1) ) x2 + (P(x) − Q(x)) x3 x2 = lim x→0 ( −n3 + (P(x) − Q(x)) x ) = −n3 + 0 = −n3 . 5.22. Spočítejte lim x→π/4 (tg x)tg (2x) . Řešení. Limity typu 1±∞ (jako je v zadání) lze počítat podle vzorce lim x→x0 f (x)g(x) = e lim x→x0 ((f (x)−1)g(x)) , jestliže limita na pravé straně existuje a f (x) ̸= 1 pro x z jistého ryzího okolí bodu x0 ∈ R. Určeme proto lim x→π/4 ((tg x − 1) tg (2x)) = lim x→π/4 (( sin x cos x − 1 ) sin (2x) cos (2x) ) = lim x→π/4 ( sin x − cos x cos x · 2 sin x cos x cos2 x − sin2 x ) = lim x→π/4 − 2 sin x cos x + sin x = − 2 √ 2 2 √ 2 2 + √ 2 2 = −1. Odtud máme lim x→π/4 (tg x)tg (2x) = 1 e . Doplňme, že použitý vzorec platí obecněji pro „typ 1cokoli “, tj. bez kladení jakýchkoli podmínek týkajících se limity limx→x0 g(x), která tak ani nemusí existovat. CHAPTER 5. ZŘÍZENÍ ZOO Otevřené množiny a okolí bodů Otevřená množina v K je taková množina, jejíž doplněk je uzavřenou množinou. Okolím bodu a ∈ K nazýváme libovolnou otevřenou množinu O, která a obsahuje. Je-li okolí definované jako Oδ(a) = {x ∈ K, |x − a| < δ} pro kladné číslo δ, hovoříme o δ-okolí bodu a. Všimněme si, že pro libovolnou množinu A je a ∈ K hromadným bodem A, právě když v libovolném okolí a leží také alespoň jeden bod b ∈ A, b ̸= a. Lemma. Množina čísel A ⊂ K je otevřená, právě když každý její bod a ∈ A do ní patří i s nějakým svým okolím. Důkaz. Nechť je A otevřená a a ∈ A. Kdyby neexistovalo žádné okolí bodu a uvnitř A, musela by existovat posloupnost an /∈ A, |a − an| ≤ 1/n. Pak je ovšem a ∈ A hromadným bodem množiny K\A, což není možné, protože doplněk A je uzavřený. Naopak předpokládejme, že každé a ∈ A leží v A i s nějakým svým okolím. To přirozeně zabraňuje, aby nějaký hromadný bod b pro množinu K\A ležel v A. Je proto K\A uzavřená a tedy je A otevřená. Z právě dokázaného lemmatu okamžitě vyplývá, že je libovolné sjednocení otevřených množin opět otevřenou množinou a že každý konečný průnik otevřených množin je opět otevřená množina. Typickou otevřenou množinou reálných čísel je otevřený interval (a, b) = {x ∈ R, a < x < b}, kde pro hraniční hodnoty máme stejné možnosti jako výše. Jde o ohraničenou množinu právě, když jsou obě meze intervalu konečná čísla. V případě reálných čísel jsou δ–okolí právě otevřené intervaly o délce 2δ s a uprostřed. V komplexní rovině je δ– okolí kruh o poloměru δ se středem v a. 5.15. Ohraničené a kompaktní množiny čísel. Uzvřené a otevřené množiny představují základní pojmy tzv. topologie. Aniž bychom zacházeli do hlubších podrobností a souvislostí, seznámili jsme se právě s topologií reálné přímky a topologií komplexní roviny. Velice užitečné budou i následující pojmy: Ohraničené a kompaktní množiny Množina A racionálních, reálných nebo komplexních čísel se nazývá ohraničená, jestliže exituje kladné reálné číslo r takové, že |z| ≤ r pro všechny čísla z ∈ A. V opačném případě je neohraničená. Ohraničená a uzavřená množina se nazývá kompaktní. 217 5.23. Ukažte, že je lim x→0 sin x x = 1. Řešení. Uvažujme jednotkovou čtvrtkružnici v prvním kvadrantu a její bod [cos x, sin x], x ∈ (0, π/2). Délka kruhového oblouku mezi body [cos x, sin x] a [1, 0] je rovna x. Zřejmě tedy je sin x < x, x ∈ ( 0, π 2 ) . Hodnotu tg x potom vyjadřuje délka úsečky s krajními body [1, sin x/ cos x] a [1, 0]. Vidíme, že je (příp. si nakreslete obrázek) x < tg x, x ∈ ( 0, π 2 ) . Tato nerovnost rovněž vyplývá z toho, že trojúhelník s vrcholy [0, 0], [1, 0], [1, tg x] má očividně větší obsah než uvažovaná kruhová výseč. Dohromady jsme získali sin x < x < sin x cos x , x ∈ ( 0, π 2 ) , tj. 1 < x sin x < 1 cos x , x ∈ ( 0, π 2 ) , 1 > sin x x > cos x, x ∈ ( 0, π 2 ) . Z Věty o třech limitách nyní plynou nerovnosti 1 = lim x→0+ 1 ≥ lim x→0+ sin x x ≥ lim x→0+ cos x = cos 0 = 1. Dokázali jsme tak, že lim x→0+ sin x x = 1. Funkce y = (sin x)/x definovaná pro x ̸= 0 je ovšem sudá, a tudíž je lim x→0− sin x x = lim x→0+ sin x x = 1. Protože obě jednostranné limity existují a jsou si rovny, existuje oboustranná limita a platí pro ni lim x→0 sin x x = lim x→0± sin x x = 1. Poznamenejme ještě, že uvedenou limitu šlo velmi snadno vyčíslit za pomoci l’Hospitalova pravidla. 5.24. Stanovte limity lim n→∞ ( n n + 1 )n , lim n→∞ ( 1 + 1 n2 )n , lim n→∞ ( 1 − 1 n )n2 ; lim x→0 sin2 x x , lim x→0 x sin2 x , lim x→0 arcsin x x ; lim x→0 3 tg2 x 5 x2 , lim x→0 sin (3x) sin (5x) , lim x→0 tg (3x) sin (5x) ; 2. REÁLNÁ ČÍSLA A LIMITNÍ PROCESY Uzavřené konečné intervaly reálných čísel jsou typickým příkladem množin kompaktních. Přidejme ještě několik topologických pojmů, které nám umožní účinné vyjadřování: Vnitřním bodem množiny A reálných nebo komplexních čísel nazveme takový bod, který do A patří i s nějakým svým okolím. Hraniční bodem množiny A rozumíme takový bod, jehož každé okolí má neprázdný průnik jak s A tak s doplňkem R\A. Hraniční bod tedy může, ale nemusí patřit do samotné množiny A. Otevřené pokrytí množiny A je takový systém otevřených množin Ui, i ∈ I, že jejich sjednocení obsahuje celé A. Izolovaným bodem množiny A rozumíme bod a ∈ A, který má okolí, jehož průnik s A je právě jednobodová množina {a}. 5.16. Věta. Pro podmnožiny A reálných čísel platí: (1) neprázdná množina A je otevřená, právě když je sjednocením nejvýše spočetného systému otevřených intervalů, (2) každý bod a ∈ A je buď vnitřní nebo hraniční, (3) každý hraniční bod množiny A je buď izolovaným nebo hromadným bodem A, (4) A je kompaktní, právě když každá v ní obsažená nekonečná posloupnost má podposloupnost konvergující k bodu v A, (5) A je kompaktní, právě když každé její otevřené pokrytí obsahuje konečné pokrytí. 218 4. SPOJITÉ FUNKCE lim x→0 e5x − e2x x , lim x→0 e5x − e−x sin (2x) . Řešení. Při určování těchto limit využijeme znalosti limit (a ∈ R) lim n→∞ ( 1 + a n )n = ea ; lim x→0 sin x x = 1; lim x→0 ex − 1 x = 1. Víme tedy, že je e−1 = lim n→∞ ( 1 − 1 n )n = lim n→∞ ( n − 1 n )n . Substituce m = n − 1 dává lim n→∞ ( n − 1 n )n = lim m→∞ ( m m + 1 )m+1 = lim m→∞ ( m m + 1 )m · lim m→∞ m m + 1 . Celkem máme e−1 = lim m→∞ ( m m + 1 )m · lim m→∞ m m + 1 . Druhá z limit je zjevně rovna 1. Když změníme označení (nahradíme n za m), můžeme napsat výsledek e−1 = lim n→∞ ( n n + 1 )n . Dále platí lim n→∞ ( 1 + 1 n2 )n = lim n→∞ ( 1 + 1 n2 )n2 n = lim n→∞ (( 1 + 1 n2 )n2 )1 n = e0 = 1 a lim n→∞ ( 1 − 1 n )n2 = lim n→∞ (( 1 − 1 n )n)n = 0. Upozorněme, že první z předešlých vyčíslení vyplývá z limit lim n→∞ ( 1 + 1 n2 )n2 = lim m→∞ ( 1 + 1 m )m = e, lim n→∞ 1 n = 0 a druhé potom z lim n→∞ ( 1 − 1 n )n = e−1 , lim n→∞ n = +∞, přičemž klademe e−∞ = 0 (zápis označuje limx→−∞ ex = 0 – jedná se o určitý výraz). Snadno lze získat lim x→0 sin2 x x = lim x→0 sin x · lim x→0 sin x x = 0 · 1 = 0. Zřejmě je lim x→0 x sin x = 1−1 = 1 a limita lim x→0 1 sin x CHAPTER 5. ZŘÍZENÍ ZOO Důkaz. (1) Zjevně je každá otevřená množina sjednocením nějakých okolí svých bodů, tj. otevřených intervalů. Jde tedy pouze o to, jestli nám jich vždy stačí spočetně mnoho. Zkusme tedy najít „co největší“ intervaly. Řekneme, že body a, b ∈ A jsou v relaci, jestliže celý otevřený interval (min{a, b}, max{a, b}) je podmnožinou v A. To je zjevně relace ekvivalence (otevřený interval (a, a) je prázdná množina a ta je podmnožinou, symetrie relace i tranzitivita jsou zřejmé). Třídy této ekvivalence budou zjevně intervaly, které budou navíc po dvou disjunktní. Každý z těchto intervalů jistě musí obsahovat nějaké racionální číslo a tyto musí být různé. Všech racionálních čísel je ale spočetně mnoho, proto máme tvrzení dokázané. (2) Přímo z definic vyplývá, že bod nemůže být vnitřní a hraniční zároveň. Nechť tedy a ∈ A není vnitřní. Pak ovšem existuje posloupnost bodů ai /∈ A s hromadným bodem a. Zároveň a patří do každého svého okolí. Proto je a hraniční. (3) Předpokládejme, že a ∈ A je hraniční a není izolovaný. Pak stejně jako v argumentaci předchozího odstavce existují body ai, tentokrát uvnitř A, jejichž hromadným bodem je a. (4) Předpokládejme, že je A kompaktní, tj. uzavřená a ohraničená, a uvažme nějakou nekonečnou posloupnost bodů ai ∈ A. Tato podmnožina má jistě supremum b i infimum a (nebo můžeme zvolit libovolnou horní a dolní závoru množiny A). Rozdělme nyní interval [a, b] přesně na dvě poloviny [a, 1 2 (b − a)] a [1 2 (b − a), b]. V alespoň jedné z nich musí být nekonečně mnoho prvků ai. Vyberme takovou polovinu, jeden z prvků v ní obsažených a následně tento interval opět rozdělme uvažovaný interval na poloviny. Znovu vybereme tu polovinu, kde je nekonečně mnoho prvků posloupnosti a vybereme si jeden z nich. Tímto způsobem dostaneme posloupnost, která bude Cauchyovská (dokažte si detailně – vyžaduje si jen pozorné hraní s odhady, podobně jako výše). O Cauchyovských posloupnostech ovšem už víme, že mají vždy hromadné body nebo jsou konstantní až na konečně mnoho výjimek. Existuje tedy podposloupnost s námi hledanou limitou. Z uzavřenosti A zase vyplývá, že námi nalezený bod musí opět ležet v A. Opačně, jestliže každá v A obsažená nekonečná podmnožina má hromadný bod v A, znamená to, že všechny hromadné body jsou v A a tedy je A uzavřená. Pokud by nebyla množina A zároveň ohraničená, uměli bychom najít posloupnost stále rostoucí nebo klesající s rozdíly dvou po sobě jdoucích čísel třeba alespoň 1. Taková posloupnost bodů z A ale nemůže mít hromadný bod vůbec. (5) Nejprve se věnujme snadnější implikaci, tj. předpokládejme, že z každého otevřeného pokrytí lze vybrat konečné a dokazujme, že pak A je uzavřená i ohraničená. Jistě lze A pokrýt spočetným systémem intervalů In = (n−2, n+2), n ∈ Z, a jakýkoliv výběr konečně mnoha z nich říká, že je množina A ohraničená. 219 neexistuje (zapisujeme 1/ ± 0). Kdybychom tedy k výpočtu limity lim x→0 x sin2 x užili pravidla o limitě součinu, obdrželi bychom 1 · 1/ ± 0 = 1/ ± 0. To znamená, že tato limita neexistuje (opět jde o určitý výraz). Ke stanovení lim x→0 arcsin x x použijeme identitu x = sin (arcsin x) platnou pro x ∈ (−1, 1), tj. v jistém okolí bodu 0. Pomocí substituce y = arcsin x dostáváme lim x→0 arcsin x x = lim x→0 arcsin x sin (arcsin x) = lim y→0 y sin y = 1. Poznamenejme, že y → 0 plyne z dosazení x = 0 do y = arcsin x a ze spojitosti této funkce v počátku (to také zaručuje, že jsme tuto substituci mohli „bez obav“ zavést). Ihned vidíme, že je lim x→0 3 tg2 x 5 x2 = lim x→0 ( 3 5 · sin x x · sin x x · 1 cos2 x ) = 3 5 · lim x→0 sin x x · lim x→0 sin x x · lim x→0 1 cos2 x = 3 5 · 1 · 1 · 1 = 3 5 . Vhodné rozšíření a substituce dávají lim x→0 sin (3x) sin (5x) = lim x→0 ( sin (3x) 3x · 5x sin (5x) · 3 5 ) = lim x→0 sin (3x) 3x · lim x→0 5x sin (5x) · 3 5 = lim y→0 sin y y · lim z→0 z sin z · 3 5 = 1 · 1 · 3 5 = 3 5 . Pomocí předešlého výsledku pak lehce spočítáme lim x→0 tg (3x) sin (5x) = lim x→0 ( sin (3x) sin (5x) · 1 cos (3x) ) = lim x→0 sin (3x) sin (5x) · lim x→0 1 cos (3x) = 3 5 · 1 = 3 5 . Podobně můžeme stanovit lim x→0 e5x − e2x x = lim x→0 ( e2x e(5−2)x − 1 (5 − 2)x (5 − 2) ) = lim x→0 e2x · lim x→0 e3x − 1 3x · 3 = e0 · lim y→0 ey − 1 y · 3 = 1 · 1 · 3 = 3 2. REÁLNÁ ČÍSLA A LIMITNÍ PROCESY Předpokládejme nyní, že a ∈ R \ A je hromadným bodem posloupnosti ai ∈ A a předpokládejme rovnou, že |a − an| < 1 n (jinak bychom mohli vybrat takovou podposloupnost). Množiny Jn = R \ [a − 1 n , a + 1 n ] pro všechny n ∈ N, n > 0, jsou sjednocení dvou otevřených intervalů a jistě také pokrývají naši množinu A. Protože je možné vybrat konečné pokrytí A, bod a je uvnitř doplňku R \ A včetně nějakého svého okolí a není tedy hromadným bodem. Proto musí být všechny hromadné body A opět v A a tato množina je i uzavřená. Opačný směr důkazu je založený na existenci a vlastnostech suprema. Předpokládejme, že je A kompaktní a že je dáno nějaké její otevřené pokrytí C. Z předchozího je zjevné, že v A existují největší a nejmenší prvek, které jsou zároveň rovny b = sup A a a = inf A. Označme si teď „nejzašší mez“, pro kterou ještě půjde konečné pokrytí z C vybrat, tj. definujeme množinu B = {x ∈ [a, b], existuje výběr konečného pokrytí [a, x] ∩ A}. Evidentně a ∈ B, jde tedy o neprázdnou zhora ohraničenou množinu a existuje proto c = sup B. Jde nám o to dokázat, že ve skutečnosti musí být c = b. Argumentace je trochu nepřehledná, dokud si ji nenačrtneme na obrázku, podstata je ale snadná: Víme, že a ≤ c ≤ b, předpokládejme tedy chvíli, že c < b. Protože je R \ A otevřená, pro c /∈ A existuje okolí bodu c obsažené v [a, b] a zároveň disjunktní s A. To by ale vylučovalo možnost c = sup B. Zbývá tedy v takovém případě c ∈ A a tedy je i nějaké okolí O bodu c v otevřeném pokrytí C. Zvolme si body p < c < q v O. Opět nyní bude existovat konečné pokrytí pro [a, q] ∩ A. To ale značí, že q > c leží v B, což není možné. Původní volba c < b tedy vedla ke sporu, což dokazuje požadovanou rovnost b = c. Nyní ale s pomocí okolí b, které patří do C umíme najít konečné pokrytí v C pro celé A. 5.17. Limity funkcí a posloupností. Pro diskusi limit je vhodné rozšířit množinu reálných čísel R o dvě nekonečné hodnoty ±∞, tak jak jsme to už dělali při označování intervalů. Okolím nekonečna rozumíme interval (a, ∞), resp. (−∞, a) je okolí −∞. Pojem hromadného bodu množin rozšiřujeme tak, že ∞ je hromadným bodem množiny A ⊂ R jestliže každé okolí ∞ s ní má neprázdný průnik, tj. jestliže je A zhora neohraničená. Obdobně pro −∞. Hovoříme o nevlastních hromadných bodech množiny A. 220 4. SPOJITÉ FUNKCE a rovněž lim x→0 e5x − e−x sin (2x) = lim x→0 ( e5x − 1 sin (2x) − e−x − 1 sin (2x) ) = lim x→0 ( e5x − 1 5x · 2x sin (2x) · 5 2 − e−x − 1 −x · 2x sin (2x) · ( − 1 2 )) = lim x→0 e5x − 1 5x · lim x→0 2x sin (2x) · 5 2 − lim x→0 e−x − 1 −x · lim x→0 2x sin (2x) · ( − 1 2 ) = lim u→0 eu − 1 u · lim z→0 z sin z · 5 2 − lim v→0 ev − 1 v · lim z→0 z sin z · ( − 1 2 ) = 5 2 + 1 2 = 3. 5.25. Vypočtěte limity lim x→0 1 − cos (2x) x sin x ; lim x→0 1 − cos x x2 . Řešení. Spojením dříve prezentovaných postupů s jedním důležitým výsledkem lim x→0 sin x x = 1 snadno získáváme lim x→0 1 − cos (2x) x sin x = lim x→0 1 − ( cos2 x − sin2 x ) x sin x = lim x→0 ( 1 − cos2 x ) + sin2 x x sin x = lim x→0 2 sin2 x x sin x = lim x→0 2 sin x x = 2; resp. lim x→0 1 − cos x x2 = lim x→0 ( 1 − cos x x2 · 1 + cos x 1 + cos x ) = lim x→0 1 − cos2 x x2 (1 + cos x) = lim x→0 sin2 x x2 (1 + cos x) = ( lim x→0 sin x x )2 · lim x→0 1 1 + cos x = 1 2 . Dodejme, že jsme také mohli hned využít vyjádření 1 − cos (2x) = 2 sin2 x, x ∈ R. 5.26. Bez použití Věty o třech limitách dokažte, že funkce R(x) = { x, x ∈ {1 n ; n ∈ N } ; 0, x ∈ R {1 n ; n ∈ N } je spojitá v bodě 0. Řešení. Funkce R je spojitá v bodě 0, právě když je lim x→0 R(x) = R(0) = 0. Z definice limity ukážeme, že tato limita se skutečně rovná 0. Při „obvyklém“ značení je a = 0, x0 = 0. Nechť δ > 0 je nadále libovolné. Pro jakékoli x ∈ (−δ, δ) je R(x) = 0, nebo R(x) = x, a tudíž (v obou CHAPTER 5. ZŘÍZENÍ ZOO „počítání se nekonečny“ Zavádíme i pravidla pro počítání s formálně přidanými hodnotami ±∞ a pro libovolná „konečná“ čísla a ∈ R: a + ∞ = ∞ a − ∞ = −∞ a · ∞ = ∞, je-li a > 0 a · ∞ = −∞, je-li a < 0 Následující definice pokrývá mnoho případů limitních procesů a bude třeba ji zvládnout dokonale. Jednotlivými případy se budeme podrobně zabývat v zápětí. Reálné a komplexní limity Definice. Uvažme libovolnou podmnožinu A ⊂ R a reálnou funkci f : A → R, případně komplexní funkci f : A → C, definovanou na A. Uvažme dále hromadný bod x0 množiny A (tj. buď reálné číslo nebo případně ±∞). Říkáme, že f má v x0 limitu a ∈ R (nebo a ∈ C) a píšeme lim x→x0 f (x) = a, jestliže pro každé okolí O(a) bodu a lze najít okolí O(x0) bodu x0 takové, že pro všechny x ∈ A ∩ (O(x0) \ {x0}) je f (x) ∈ O(a). Limita reálné funkce se nazývá nevlastní, jestliže je a = ±∞, V opačném případě se nazává vlastní. Je důležité si všimnout, že hodnota f v bodě x0 v definici nevystupuje a f v tomto hromadném bodě vůbec nemusí být definována (a v případě nevlastního hromadného bodu ani nemůže)! Také je zřejmé, že nevlastní limity komplexních funkcí nejsou definovány. 5.18. Nejčastější varianty definičních oborů. Naše definice limity pokrývá zdánlivě velice rozdílné koncepty: (1) Limity posloupností. Jestliže je A = N, tj. funkce f je definována pouze pro přirozená čísla, hovoříme o limitách posloupností reálných nebo komplexních čísel. Jediným hromadným bodem definičního oboru A je pak ∞ a zpravidla píšeme hodnoty poslounosti f (n) = an a limitu ve tvaru lim n→∞ an = a. Podle definice to pak znamená, že pro každé okolí O(a) limitní hodnoty a existuje index N ∈ N takový, že an ∈ O(a) pro všechny n ≥ N. Ve skutečnosti jsme tedy v tomto speciálním případě přeformulovali definici konvergence posloupnosti (viz 5.12). Přidali jsme pouze možnost nevlastních limit. Říkáme také, že posloupnost an konverguje k a. Přímo z naší definice pro komplexní hodnoty je opět vidět, že komplexní posloupnost má limitu a, právě když reálné 221 případech) dostáváme R(x) ∈ (−δ, δ). Jinými slovy, vezmeme-li libovolné δ-okolí (−δ, δ) hodnoty a a přiřadíme-li mu (−δ, δ) (jako okolí bodu x0), pak pro každé x ∈ (−δ, δ) (z uvažovaného okolí x0) platí, že R(x) ∈ (−δ, δ) (zde na interval (−δ, δ) nahlížíme jako na okolí a). To odpovídá znění definice limity (nemuseli jsme ani požadovat, aby bylo x ̸= x0). Uvažovaná funkce R se nazývá Riemannova funkce (proto označení R). V literatuře se ovšem uvádí v různých modifikacích. Např. o funkci f (x) =    1, x ∈ Z; 1 q , x = p q ∈ Q pro nesoudělná p, q ∈ Z a q > 1; 0, x /∈ Q se „často“ hovoří jako o Riemannově. 5.27. Dodefinujte funkci f (x) = ( x2 − 1 ) sin 2x − 1 x2 − 1 , x ̸= ±1 (x ∈ R) v bodech −1, 1 tak, aby byla spojitá na R. Řešení. Daná funkce je spojitá ve všech bodech svého definičního oboru. V bodech −1, 1 bude spojitá, právě když položíme f (−1) := lim x→−1 ( ( x2 − 1 ) sin 2x − 1 x2 − 1 ) , f (1) := lim x→1 ( ( x2 − 1 ) sin 2x − 1 x2 − 1 ) . Pokud by jedna z těchto limit neexistovala (příp. byla nevlastní), funkci by nešlo spojitě dodefinovat. Očividně je sin 2x − 1 x2 − 1 ≤ 1, x ̸= ±1 (x ∈ R), odkud plyne − x2 − 1 ≤ f (x) ≤ x2 − 1 , x ̸= ±1 (x ∈ R). Protože lim x→±1 x2 − 1 = 0, z Věty o třech limitách již dostáváme výsledek f (±1) := 0. 5.28. Ověřte, že je limita (a) lim x→0 sin (2x) − 2 sin x 2ex − x2 − 2x − 2 typu 0 0 ; (b) lim x→0+ ln x cotg x typu ∞ ∞ ; (c) lim x→1+ ( x x − 1 − 1 ln x ) typu ∞ − ∞; (d) lim x→1+ (ln (x − 1) · ln x) typu 0 · ∞; 2. REÁLNÁ ČÍSLA A LIMITNÍ PROCESY části ai konvergují k re a a zároveň imaginární části konvergují k im a. (2) Limita funkce ve vnitřním bodě intervalu. Jestliže je f definována na intervalu A = (a, b) a x0 je vnitřním bodem intervalu, hovoříme o limitě funkce ve vnitřním bodě jejího definičního oboru. Podívejme se, proč je důležité v definici požadovat f (x) ∈ O(a) pouze pro body x ̸= x0 i v tomto případě. Vezměme jako příklad funkci f : R → R f (x) = { 0 je-li x ̸= 0 1 je-li x = 0. Pak zjevně limita v nule je dobře definována a v souladu s naším očekáváním bude limx→0 = 0, přestože f (0) = 1 do malých okolí limitní hodnoty 0 nepatří. (3) Limity zprava a zleva. Je-li A = [a, b] ohraničený interval a x0 = a nebo x0 = b, hovoříme o limitě zprava, resp. zleva, v hraničním bodě definičního oboru funkce f . Jestliže je ale bod x0 vnitřním bodem, můžeme pro účely výpočtu limity definiční obor zúžit na [x0, b] nebo [a, x0]. Výsledným limitám pak říkáme limita zprava, resp. limita zleva pro funkci f v bodě x0. Označujeme ji výrazem limx→x+ 0 f (x), resp. limx→x− 0 f (x). Jako příklad nám může sloužit limita zprava a zleva v x0 = 0 pro Heavisideovu funkci h z úvodu této části. Evidentně je lim x→0+ h(x) = 1, lim x→0− h(x) = 0. Limita limx→0 f (x) přitom neexistuje. Přímo z našich definic je zjevné, že limita ve vnitřním bodu definičního oboru libovolné reálné funkce f existuje, právě když existují limity zprava i zleva a jsou si rovny. 5.19. Další příklady limit. (1) Limita komplexní funkce f : A → C existuje tehdy a jen tehdy, jestliže existují limity její reálné a imaginární části. V takovém případě je pak lim x→x0 f (x) = lim x→x0 (re f (x)) + i lim x→x0 (im f (x)). Důkaz je přímočarý a vychází přímo z definice vzdáleností a okolí bodů v komplexní rovině. Skutečně, příslušnost do δ–okolí komplexní hodnoty z je zajištěna pomocí reálných (1/ √ 2)δ–okolí reálné a imaginární složky z. Odtud již tvrzení bezprostředně vyplývá. (2) Nechť f je reálný nebo komplexní polynom. Pak pro každý bod x ∈ R je lim x→x0 f (x) = f (x0). Skutečně, je-li f (x) = anxn + · · · + a0, pak roznásobením (x0 + δ)k = xk 0 + kδxk−1 0 + · · · + δk a dosazením pro k = 0, . . . , n vidíme, že volbou dostatečně malého δ se hodnotou libovolně blízko přiblížíme f (x0). (3) Uvažme nyní docela ošklivou funkci definovanou na celé reálné přímce f (x) = { 1 je-li x ∈ Q 0 jestliže x /∈ Q. 222 4. SPOJITÉ FUNKCE (e) lim x→0+ (cotg x) 1 ln x typu ∞0 ; (f) lim x→0 ( sin x x ) 1 x2 typu 1∞ ; (g) lim x→1− ( cos πx 2 )ln x typu 00 . Poté ji spočtěte užitím l’Hospitalova pravidla. Řešení. Bezprostředně můžeme potvrdit, že je (a) lim x→0 (sin (2x) − 2 sin x) = 0 − 0 = 0, lim x→0 ( 2ex − x2 − 2x − 2 ) = 2 − 0 − 0 − 2 = 0; (b) lim x→0+ ln x = −∞, lim x→0+ cotg x = +∞; (c) lim x→1+ x x − 1 = +∞, lim x→1+ 1 ln x = +∞; (d) lim x→1+ ln x = 0, lim x→1+ ln (x − 1) = −∞; (e) lim x→0+ cotg x = +∞, lim x→0+ 1 ln x = 0; (f) lim x→0 sin x x = 1, lim x→0 1 x2 = +∞; (g) lim x→1− cos πx 2 = 0, lim x→1− ln x = 0. Případ (a). Aplikování l’Hospitalova pravidla převádí limitu lim x→0 sin (2x) − 2 sin x 2ex − x2 − 2x − 2 na limitu lim x→0 2 cos (2x) − 2 cos x 2ex − 2x − 2 , která je ovšem typu 0/0. Dalšími dvěma aplikacemi l’Hospitalova pravidla dostáváme lim x→0 −4 sin (2x) + 2 sin x 2ex − 2 a (výše uvedená limita je opět typu 0/0) lim x→0 −8 cos (2x) + 2 cos x 2ex = −8 + 2 2 = −3. Celkem tak máme (vrátíme se k původní limitě) lim x→0 sin (2x) − 2 sin x 2ex − x2 − 2x − 2 = −3. CHAPTER 5. ZŘÍZENÍ ZOO Přímo z deifnice je zjevné, že tato funkce nemá limitu v žádném bodě (dokonce ani zleva nebo zprava). (4) Následující funkce je ještě záludnější, než jsme viděli v předchozím případě. Funkce f : R → R je definována takto: f (x) = { 1 q jestliže x = p q ∈ Q, p a q nesoudělná 0 jestliže x /∈ Q Zjevně tato funkce má limitu ve všech iracionálních reálných bodech x a to rovnu své hodnotě f (x) = 0, zatímco v racionálních bodech neexistují ani jednostranné limity zprava a zleva. Důkaz přenecháváme jako cvičení. 5.20. Věta (O třech limitách). Buďte f , g, h reálné funkce se shodným definičním oborem A a takové, že existuje okolí hromadného bodu x0 ∈ R definičního oboru, kde platí f (x) ≤ g(x) ≤ h(x). Pak pokud existují limity lim x→x0 f (x) = f0, lim x→x0 h(x) = h0 a navíc f0 = h0, pak také existuje limita lim x→x0 g(x) = g0 a platí g0 = f0 = h0. Důkaz. Z definice limity, pro libovolné ε > 0 existuje okolí O bodu x0, ve kterém jsou pro x ̸= x0 hodnoty f (x), h(x) ∈ (g0 − ε, g0 + ε). Z podmínky f (x) ≤ g(x) ≤ h(x) vyplývá, že i g(x) ∈ (g0 − ε, g0 + ε), tedy limx→x0 g(x) = g0. Drobnou modifikací předchozího postupu si čtenář doplní i argumentaci pro nevlastní hodnoty limit. Všimněme si, že věta dává možnost výpočtu limit pro všechny typy diskutované výše, tj. limity posloupností, limity funkcí ve vnitřních bodech, jednostranné limity atd. 5.21. Věta. Nechť A ⊂ R je definiční obor reálných nebo komplexních funkcí f a g, x0 nechť je hromadný bod A a existují limity lim x→x0 f (x) = a ∈ R, lim x→x0 g(x) = b ∈ R. Potom: (1) limita a je určena jednoznačně, (2) limita součtu f + g existuje a platí lim x→x0 (f (x) + g(x)) = a + b, (3) limita součinu f · g existuje a platí lim x→x0 (f (x) · g(x)) = a · b, (4) pokud navíc b ̸= 0, pak limita podílu f/g existuje a platí lim x→x0 f (x) g(x) = a b . 223 Dodejme, že opakované užití l’Hospitalova pravidla v jednom příkladu je běžné. Nadále budeme klást, že se limity podílů derivací získané l’Hospitalovým pravidlem přímo rovnají původním limitám podílů. Takto si můžeme počínat, pokud obdržené limity na pravých stranách budou existovat, tj. o platnosti zápisů se vlastně budeme přesvědčovat doda- tečně. Případ (b). Tentokráte derivování čitatele a jmenovatele dává lim x→0+ ln x cotg x = lim x→0+ 1 x −1 sin2 x = lim x→0+ − sin2 x x . Poslední limitu umíme snadno určit (dokonce ji známe). Z lim x→0+ − sin x = 0, lim x→0+ sin x x = 1 plyne výsledek 0 = 0 · 1. Také jsme mohli znovu použít l’Hospitalovo pravidlo (nyní pro výraz 0/0) se ziskem lim x→0+ − sin2 x x = lim x→0+ −2 · sin x · cos x 1 = −2 · 0 · 1 1 = 0. Případ (c). Pouze převodem na společného jmenovatele lim x→1+ ( x x − 1 − 1 ln x ) = lim x→1+ x ln x − (x − 1) (x − 1) ln x jsme obdrželi typ 0/0. Je lim x→1+ x ln x − (x − 1) (x − 1) ln x = lim x→1+ ln x + x x − 1 x−1 x + ln x = lim x→1+ ln x 1 − 1 x + ln x . Máme podíl 0/0, pro který (opět dle l’Hospitalova pravidla) platí lim x→1+ ln x 1 − 1 x + ln x = lim x→1+ 1 x 1 x2 + 1 x = 1 1 + 1 = 1 2 . Návratem k původní limitě zapíšeme výsledek lim x→1+ ( x x − 1 − 1 ln x ) = 1 2 . Případ (d). Uvedený výraz převedeme na typ ∞/∞ (přesněji řečeno, na typ −∞/∞) vytvořením zlomku lim x→1+ (ln (x − 1) · ln x) = lim x→1+ ln (x − 1) 1 ln x . Podle l’Hospitalova pravidla je lim x→1+ ln (x − 1) 1 ln x = lim x→1+ 1 x−1 − 1 ln2 x · 1 x = lim x→1+ −x ln2 x x − 1 . Pro tento neurčitý výraz (typu 0/0) lze pokračovat l’Hospitalovým pravidlem a stanovit lim x→1+ −x ln2 x x − 1 = lim x→1+ −ln2 x − 2x ln x · 1 x 1 = − 0 + 0 1 = 0. 2. REÁLNÁ ČÍSLA A LIMITNÍ PROCESY Důkaz. (1) Předpokládejme, že a a a′ jsou dvě hodnoty limity limx→x0 f (x). Pokud je a ̸= a′ , pak existují disjunktní okolí O(a) a O(a′ ). Pro dostatečně malá okolí x0 ale mají hodnoty f ležet v obou naráz, což je spor. Proto je a = a′ . (2) Zvolme si nějaké okolí a + b, třeba O2ϵ(a + b). Pro dostatečně malé okolí x0 a x ̸= x0 bude jak f (x), tak g(x) v ϵ–okolích bodů a a b. Proto jejich součet bude v 2ϵ–okolí kýžené hodnoty a + b. Tím je důkaz ukončen pro konečné limity, případ nevlastních limit je zcela obdobný. (3) Podobně postupujeme u součinu s Oϵ2 (ab). Pro malá okolí x0 se nám hodnoty f i g trefí do ϵ–okolí hodnot a a b. Proto jejich součin bude v požadovaném ϵ2 –okolí. (4) Podobný postup ponechán jako cvičení. Poznámka. Podrobnějším sledováním důkazů jednotlivých bodů věty můžeme její tvrzení rozšířit i na některé nekonečné hodnoty limit: V prvém případě je zapotřebí, aby buď alespoň jedna z limit byla konečná nebo aby obě měly stejné znaménko. Pak opět platí že limita součtu je součet limit s konvencemi z 5.17. Případ „∞ − ∞“ ale není zahrnut. V druhém případě může být jedna z limit nekonečná a druhá nenulová. Pak opět platí, že limita součinu je součin limit. Případ „0 · (±∞)“ není ale zahrnut. V případě podílu může být a ∈ R a b = ±∞, kdy výsledek limity bude nula, nebo a = ±∞ a b ∈ R, kde výsledek bude ±∞ podle znamének čitatele a jmenovatele. Případ „∞ ∞ “ není zahrnut. Zdůrazněme, že naše věta jako speciální případ pokrývá také odpovídající tvrzení o konvergenci posloupností i o limitách zprava a zleva funkcí definovaných na intervalu. Pro úvahy o limitách bývá technicky užitečný i následující jednoduchý důsledek definic, který uvádí do souvislosti limity posloupností a funkcí obecně. 5.22. Důsledek. Uvažme reálnou nebo komplexní funkci f definovanou na množině A ⊂ R a hromadný bod x0 množiny A. Funkce f má v bodě x0 limitu y právě, když pro každou posloupnost bodů xn ∈ A konvergující k x0 a různých od x0 má i posloupnost hodnot f (xn) limitu y. Důkaz. Předpokládejme nejprve, že limita f v bodě x0 je skutečně y. Pak pro libovolné okolí V bodu y musí existovat okolí V bodu x0 takové, že pro všechny x ∈ V ∩ A, x ̸= x0, je f (x) ∈ U. Pro každou posloupnost xn → x0 bodů různých od x0 ale budou pro všechna n větší než vhodné N i všechny body xn ∈ V . Budou tedy posloupnosti hodnot f (xn) konvergovat k hodnotě y. Předpokládejme naopak, že funkce f nekonverguje k y při x → x0. Pak pro nějaké okolí U hodnoty y existuje posloupnost bodů xm ̸= x0 v A, které jsou bližší k x0 než 1/m a přitom hodnota f (xm) nepatří do U. Tím jsme zkonstruovali posloupnost bodů z A různých od x0, pro které hodnoty f (xn) nekonvergují k y a důkaz je ukončen. 224 4. SPOJITÉ FUNKCE Případy (e), (f), (g). Protože lim x→0+ (cotg x) 1 ln x = e lim x→0+ ln(cotg x) ln x ; lim x→0 ( sin x x ) 1 x2 = e lim x→0 ln sin x x x2 ; lim x→1− ( cos πx 2 )ln x = e lim x→1− ( ln x·ln ( cos πx 2 )) , postačuje vypočítat limity uvedené v argumentu exponenciální funkce. Pomocí l’Hospitalova pravidla a jednoduchých úprav získáváme lim x→0+ ln (cotg x) ln x = [ typ +∞ −∞ ] = lim x→0+ 1 cotg x · −1 sin2 x 1 x = lim x→0+ −x cos x · sin x = [ typ 0 0 ] = lim x→0+ −1 cos2 x − sin2 x = −1 1 − 0 = −1; lim x→0 ln sin x x x2 = [ typ 0 0 ] = lim x→0 x sin x · x cos x−sin x x2 2x = lim x→0 x cos x − sin x 2x2 sin x = [ typ 0 0 ] = lim x→0 cos x − x sin x − cos x 4x sin x + 2x2 cos x = lim x→0 − sin x 4 sin x + 2x cos x = [ typ 0 0 ] = lim x→0 − cos x 4 cos x + 2 cos x − 2x sin x = −1 4 + 2 − 0 = − 1 6 , a tudíž lim x→0+ (cotg x) 1 ln x = e−1 = 1 e ; lim x→0 ( sin x x ) 1 x2 = e− 1 6 = 1 6 √ e . Obdobně lze postupovat při určování poslední limity. Platí lim x→1− ( ln x · ln ( cos πx 2 )) = lim x→1− ln ( cos πx 2 ) 1 ln x = [ typ −∞ −∞ = ∞ ∞ ] = lim x→1− 1 cos πx 2 ( − sin πx 2 ) π 2 − 1 ln2 x · 1 x = π 2 lim x→1− x sin πx 2 · ln2 x cos πx 2 . Neboť je tento výraz typu 0/0, mohli bychom pokračovat l’Hospitalovým pravidlem; místo toho ale přejdeme od lim x→1− x sin πx 2 · ln2 x cos πx 2 k součinu limit lim x→1− ( x sin πx 2 ) · lim x→1− ln2 x cos πx 2 = 1 · lim x→1− ln2 x cos πx 2 . Teprve nyní aplikujeme l’Hospitalovo pravidlo pro lim x→1− ln2 x cos πx 2 = [ typ 0 0 ] = lim x→1− 2 ln x · 1 x ( −π 2 ) sin πx 2 = 0 −π 2 = 0. CHAPTER 5. ZŘÍZENÍ ZOO Spojitost funkcí Definice. Nyní máme nachystány nástroje na korektní formulaci vlastnosti spojitosti, se kterou jsme dříve intuitivně nakládali u polynomů. Nechť f je reálná nebo komplexní funkce definovaná na intervalu A ⊂ R. Říkáme, že f je spojitá v bodě x0 ∈ A, jestliže je lim x→x0 f (x) = f (x0). Funkce f je spojitá na A, jestliže je spojitá ve ve všech bodech x0 ∈ A. Všiměme si, že pro hraniční body intervalu A říká naše definice, že f v nich má hodnotu rovnou limitě zleva, resp. zprava. Říkáme, že je v takovém bodě spojitá zprava, resp. zleva. Již jsme také viděli, že každý polynom je spojitou funkcí na celém R, viz 5.19(2). Potkali jsme také funkci, která je spojitá v iracionálních reálných číslech a nemá žádné limity v číslech racionálních, viz 5.19(4). Z předchozí věty 5.21 o vlastnostech limit okamžitě vyplývá většina následujících tvrzení 5.23. Věta. Nechť f a g jsou spojité funkce na intervalu A. Pak (1) součet f + g je spojitá funkce (2) součin f · g je spojitá funkce (3) pokud navíc g(x0) ̸= 0, pak podíl f/g je dobře definován v nějakém okolí x0 a je spojitý v x0. (4) pokud spojitá funkce h je definována na okolí hodnoty f (x0), pak složená funkce h ◦ f je definována na okolí bodu x0 a je v bodě x0 spojitá. Důkaz. Tvrzení (1) a (2) jsou zřejmá, doplnit důkaz potřebujeme u tvrzení (3). Jestliže je g(x0) ̸= 0, pak také celé ϵ–okolí čísla g(x0) neobsahuje nulu pro dostatečně malé ϵ > 0. Ze spojitosti g pak vyplývá, že na dostatečně malém δ–okolí bodu x0 bude g nenulové a podíl f/g tam bude tedy dobře definován. Pak bude ovšem i spojitý v x0 podle předchozí věty. (4) Zvolme nějaké okolí O hodnoty h(f (x0)). Ze spojitosti h k němu existuje okolí O′ bodu f (x0), které je celé zobrazeno funkcí h do O. Do tohoto okolí O′ spojité zobrazení f zobrazí dostatečně malé okolí bodu x0. To je ale právě definiční vlastnost spojitosti a důkaz je ukončen. Nyní si vcelku snadno můžeme odvodit zásadní souvislosti spojitých zobrazení a topologie reálných čísel: 5.24. Věta. Nechť f : R → R je spojitá funkce. Pak (1) vzor f −1 (U) každé otevřené množiny je otevřená množina, (2) vzor f −1 (W) každé uzavřené množiny je uzavřená množina, 225 Celkem máme lim x→1− ( ln x · ln ( cos πx 2 )) = π 2 · 1 · 0 = 0, tj. lim x→1− ( cos πx 2 )ln x = e0 = 1. 5.29. Určete lim x→0 ( cotg x − 1 x ) . Řešení. Uvědomíme-li si, že je lim x→0+ cotg x = +∞, lim x→0+ 1 x = +∞, lim x→0− cotg x = −∞, lim x→0− 1 x = −∞, vidíme, že v případě obou jednostranných limit dostáváme typ ∞−∞. Můžeme tedy uvažovat najednou oboustrannou limitu. Funkci kotangens zapíšeme jako podíl kosinu a sinu a zlomky převedeme na společného jmenovatele, tj. lim x→0 ( cotg x − 1 x ) = lim x→0 x cos x − sin x x sin x . Obdrželi jsme výraz 0/0, pro který platí (podle l’Hospitalova pravidla) lim x→0 x cos x − sin x x sin x = lim x→0 cos x − x sin x − cos x sin x + x cos x = lim x→0 −x sin x sin x + x cos x . Druhým použitím l’Hospitalova pravidla pro typ 0/0 pak již dosta- neme lim x→0 −x sin x sin x + x cos x = lim x→0 − sin x − x cos x cos x + cos x − x sin x = 0 − 0 1 + 1 − 0 = 0. 5.30. Vyčíslete lim x→+∞ ln x x , lim x→0+ x ln 1 x , lim x→0+ x e 1 x ; lim x→0− x e− 1 x , lim x→0 e − 1 x2 x100 , lim x→+∞ (ln x − x) ; lim x→+∞ x x + ln x · cos x , lim x→+∞ 3 √ x + 1 5 √ x + 3 , lim x→+∞ x √ x2 + 1 . Řešení. Snadno lze zjistit (např. n-násobným užitím l’Hospitalova pravidla), že pro libovolné n ∈ N je lim x→+∞ xn ex = 0, tj. lim x→+∞ ex xn = +∞. Z Věty o třech limitách potom pro reálná čísla a > 0 ihned plyne zobecnění lim x→+∞ xa ex = 0, tj. lim x→+∞ ex xa = +∞. 2. REÁLNÁ ČÍSLA A LIMITNÍ PROCESY (3) obraz f (K) každé kompaktní množiny je kompaktní množina, (4) na libovolné kompaktní množině K dosahuje spojité zobrazení maxima a minima. Důkaz. (1) Uvažme nějaký bod x0 ∈ f −1 (U). Nějaké okolí O hodnoty f (x0) je celé v U, protože je U otevřená. Pak ovšem existuje okolí O′ bodu x0, které se celé zobrazí do O, patří tedy do vzoru. Každý bod vzoru je tedy vnitřní a tím je důkaz ukončený. (2) Uvažme nějaký hromadný bod x0 vzoru f −1 (W) a nějakou posloupnost xi, f (xi) ∈ W, která k němu konverguje. Ze spojitosti f nyní zjevně vyplývá, že f (xi) konverguje k f (x0), a protože je W uzavřená, musí i f (x0) ∈ W. Zřejmě jsou tedy všechny hromadné body vzoru W ve W také obsaženy. (3) Zvolme libovolné otevřené pokrytí f (K). Vzory jednotlivých intervalů budou sjednoceními otevřených intervalů a tedy také vytvoří pokrytí množiny K. Z něho lze vybrat konečné pokrytí a proto nám stačilo konečně mnoho odpovídajících obrazů k pokrytí původní množiny f (K). (4) Protože je obrazem kompaktní množiny opět kompaktní množina, musí být obraz ohraničený a zároveň musí obsahovat svoje supremum i infimum. Odtud ale vyplývá, že tyto musí být zároveň maximem a minimem hodnot. 5.25. Důsledek. Nechť f : R → R je spojitá. Potom (1) obraz každého intervalu je opět interval (2) f na uzavřeném intervalu [a, b] nabývá všech hodnot mezi svou maximální a minimální hodnotou. Důkaz. (1) Uvažme nějaký interval A (a ponechme stranou, jestli je A uzavřený nebo otevřený, ať už zleva nebo zprava) a předpokládejme, že existuje bod y ∈ R takový, že f (A) obsahuje body menší i větší než y, ale y /∈ f (A). Znamená to tedy, že pro otevřené množiny B1 = (−∞, y) a B2 = (y, ∞) jejich vzory A1 = f −1 (B1) a A2 = f −1 (B2) pokrývají A. Tyto množiny jsou přitom opět otevřené, jsou disjunktní a obě mají neprázdný průnik s A. Nutně tedy musí existovat bod x ∈ A, který neleží v B1, je ale jejím hromadným bodem. Musí však ležet v B2 a to u disjunktních otevřených množin není možné. Dokázali jsme tedy, že pokud nějaký bod y nepatří do obrazu intervalu, musí být všechny hodnoty buď zároveň větší nebo zároveň menší. Odtud vyplývá, že obrazem bude opět interval. Všimněme si, že jeho krajní body mohou a nemusí do obrazu patřit. (2) Toto tvrzení je přímým důsledkem předchozího, protože obrazem uzavřeného intervalu musí být opět uzavřený interval. Na závěr naší úvodní diskuse spojitosti funkcí uvedeme ještě tvrzení, která jsou užitečným nástrojem při počítání li- mit. 5.26. Věta (O limitě složené funkce). Nechť f , g : R → R jsou funkce, limx→a f (x) = b. 226 4. SPOJITÉ FUNKCE Uvážíme-li, že grafy funkcí y = ex a y = ln x (inverzní funkce k y = ex ) jsou symetrické vzhledem k přímce y = x, víme dále lim x→+∞ ln x x = 0, tj. lim x→+∞ x ln x = +∞. Získali jsme tak první výsledek. Ten přitom dává rovněž l’Hospitalovo pravidlo, podle kterého je lim x→+∞ ln x x = lim x→+∞ 1 x 1 = lim x→+∞ 1 x = 0. Upozorněme, že l’Hospitalovo pravidlo lze použít k vyčíslení každé z dalších pěti uvedených limit. Je ovšem možné určit tyto limity jednoduššími způsoby. Např. substituce y = 1/x vede na lim x→0+ x ln 1 x = lim y→+∞ ln y y = 0; lim x→0+ x e 1 x = lim y→+∞ ey y = +∞. Samozřejmě x → 0+ dává y = 1/x → +∞ (píšeme 1/ + 0 = +∞). Pomocí substitucí u = −1/x, v = 1/x2 po řadě dostáváme lim x→0− x e− 1 x = lim u→+∞ − eu u = −∞; lim x→0 e − 1 x2 x100 = lim v→+∞ v50 ev = 0, přičemž x → 0− odpovídá u = −1/x → +∞ (píšeme −1/ − 0 = +∞) a x → 0 potom v = 1/x2 → +∞ (znovu 1/ + 0 = +∞). Již dříve jsme také objasnili, že platí lim x→+∞ (ln x − x) = lim x→+∞ −x = −∞. Případné pochyby snad rozptýlí limita lim x→+∞ ln x − x ln x = lim x→+∞ ( 1 − x ln x ) = −∞, která dokazuje, že při zmenšení absolutní hodnoty uvažovaného výrazu (aniž by došlo ke změně znaménka) stále výraz v absolutní hodnotě roste nade všechny meze. Stejně snadno umíme určit lim x→+∞ x x + ln x · cos x = lim x→+∞ x x = 1; lim x→+∞ 3 √ x + 1 5 √ x + 3 = lim x→+∞ 3 √ x 5 √ x = +∞; lim x→+∞ x √ x2 + 1 = lim x→+∞ x √ x2 = 1. Viděli jsme, že l’Hospitalovo pravidlo nemusí být nejlepší metodou výpočtu limity jednoho z typů 0/0, ∞/∞. Na předchozích třech příkladech lze ilustrovat, že jej ani nelze vždy (pro neurčité výrazy) aplikovat. Kdybychom jej použili k řešení prvního z nich, obdrželi bychom CHAPTER 5. ZŘÍZENÍ ZOO (1) Pokud je g je spojitá v b, potom lim x→a g (f (x)) = g ( lim x→a f (x) ) = g(b). (2) Jestliže existuje limita limy→b g(y), potom lim x→a g (f (x)) = lim y→b g(y). Důkaz. Je podobný jako ve větě 5.23(4). Z existence limity g v bodě b vyplývá, že pro jakékoliv okolí V této limity umíme najít dostatečně malé okolí U bodu b, na kterém jsou už hodnoty g ve V . Pokud ale f má bod b jako limitu v bodě a, pak se do U trefíme všemi hodnotami f pro dostatečně malé okolí a, což ověřuje druhé tvrzení. První pak je přímým důsledkem druhého. 5.27. Kdo už je v ZOO. Začali jsme budovat náš zvířetník funkcí s polynomy a s funkcemi, které se z nich dají vyrobit „po částech“. Zároveň jsme dovodili spoustu vlastností pro patrně obrovskou třídu spojitých funkcí, nemáme ale zatím moc prakticky zvladatelných příkladů. Jako další si prohlédneme pořádněji podíly polynomů. Nechť f a g jsou dva polynomy, které mohou mít i komplexní hodnoty (tj. připouštíme výrazy anxn +· · ·+a0 s komplexními ai ∈ C, ale dosazujeme jen reálné hodnoty za x). Funkce h : R \ {x ∈ R, g(x) = 0} → C, h(x) = f (x) g(x) je dobře definována ve všech reálných bodech kromě kořenů polynomu g. Takové funkce nazýváme racionální funkce. Z věty 5.23 vyplývá, že racionální funkce jsou spojité ve všech bodech svého definičního oboru. V bodech, kde definovány nejsou mohou mít • konečnou limitu, když jde o společný kořen obou polynomů f a g (v tomto případě rozšířením jejich definice o limitní hodnotu v tomto bodě dostaneme funkci i v tomto bodě spojitou) • nekonečnou limitu, když limity zprava a zleva v tomto bodě jsou stejné • různé nekonečné limity zprava a zleva. Názorně je možné tuto situaci vidět na obrázku, který ukazuje hodnoty funkce h(x) = (x − 0.05a)(x − 2 − 0.2a)(x − 5) x(x − 2)(x − 4) pro hodnoty a = 0 (obrázek vlevo tedy vlastně zobrazuje racionální funkci (x − 5)/(x − 4)) a pro a = 5/3. 227 pro x > 0 podíl 1 1 + cos x x − ln x · sin x = x x + cos x − x ln x · sin x , který je složitější než původní. Dokonce pro x → +∞ limitu nemá. Není tedy splněn jeden z předpokladů l’Hospitalova pravidla. Ve druhém případě pak (libovolný počet opakovaných) použití l’Hospitalova pravidla vede na neurčité výrazy. Pro poslední limitu nás l’Hospitalovo pravidlo vrátí do zadání: dává nejdříve zlomek 1 2x 2 √ x2+1 = √ x2 + 1 x a následně 2x 2 √ x2+1 1 = x √ x2 + 1 . Odsud můžeme odvodit, že limita je rovna 1 (hledáme nezápornou hodnotu a ∈ R takovou, aby platilo a = a−1 ), pouze když dříve dokážeme, že vůbec existuje. 5.31. Určete suprema a infima množin A = (−3, 0]∪(1, π)∪{6}; B = { (−1)n n2 ; n ∈ N } ; C = (−9, 9)∩Q v R. 5.32. Nalezněte sup A a inf A pro A = { n + (−1)n n ; n ∈ N } ⊂ R. 5.33. Je-li N = {1, 2, . . . , n, . . . }, M = { − 1 n ; n ∈ N } , J = (0, 2]∪[3, 5] {4}, stanovte inf N, sup M, inf J a sup J v R. 5.34. Napište příklad množiny M ⊂ R, která nemá v R infimum, ale má zde supremum; a udejte příklad množiny N ⊂ R, která nemá v R supremum, ale má zde infimum. 5.35. Uveďte podmnožinu X množiny R, pro kterou je sup X ≤ inf X. 5.36. Udejte příklad množin A, B, C ⊆ R takových, aby platilo A∩B = ∅, A∩C = ∅, B∩C = ∅, sup A = inf B = inf C = sup C. 5.37. Z definice limity dokažte, že je lim x→0 ( x3 − 2 ) = −2. 2. REÁLNÁ ČÍSLA A LIMITNÍ PROCESY y x 6 5 4 2 4 0 -2 3 -4 -6 210-1 a=0. y x 6 5 4 2 4 0 -2 3 -4 -6 210-1 a=1.6667 5.28. Funkce mocninné a exponenciální. Polynomy jsou pomocí sčítání a násobení skaláry seskládány z jednoduchých mocninných funkcí x → xn s přirozených číslem n = 0, 1, 2, . . . . Samozřejmý smysl má také funkce x → x−1 pro všechny x ̸= 0. Tuto definici teď rozšíříme na obecnou mocninnou funkci xa s libovolným a ∈ R. Budeme vycházet z vlastností mocnin a odmocnin, které patrně považujeme za samozřejmé. Pro záporné celé číslo −a proto definujeme x−a = (xa )−1 = (x−1 )a . Dále jistě chceme, aby ze vztahu bn = x pro n ∈ N vyplývalo že b je n–tou odmocninou z x, tj. b = x 1 n . Je třeba ale ověřit, že taková b skutečně existují. Z bionomického rozkladu mocniny dvojčlenu je vidět, že funkce y → yn je pro y > 0 stále rostoucí. Předpokládejme x > 0 a uvažujme množinu B = {y ∈ R, y > 0, yn ≤ x}. To je zřejmě zhora ohraničená množina a zvolíme b = sup B. O mocninné funkci s přirozeným n již víme, že je to funkce spojitá, snadno tedy ověříme. že skutečně platí bn = x. Skutečně, určitě je bn ≤ x a kdyby platila ostrá nerovnost, našli bychom jistě i y s hodnotou b < yn < x, což nutně znamená i b < y a tedy jde o spor s definicí suprema. Konečně, pro hodnoty a ∈ R a x > 1, si povšimněme, že jde pro racionální a o striktně rostoucí výraz (pro větší a je vždy větší výsledek). Proto klademe xa = sup{xy , y ∈ Q, y ≤ a}. Pro 0 < x < 1 buď definujeme analogicky (je třeba si jen pohrát s nerovnítky) nebo klademe přímo xa = (1 x )−a . Pro x = 1 je pak 1a = 1 pro libovolné a. Obecnou mocninnou funkci x → xa máme tedy dobře definovanou pro všechny x ∈ [0, ∞) a a ∈ R. Naši konstrukci ale můžeme také číst následujícím způsobem: Pro každé pevné reálné c > 0 existuje dobře definovaná funkce na celém R, y → cy . Této funkci říkáme exponenciální funkce o základu c. Vlastnosti, které jsme použili při definici mocninné a exponenciální funkce f (y) = cy , tj. c = f (1), lze shrnout do jediné rovnosti pro libovolné reálné kladné x a y: f (x + y) = f (x) · f (y) 228 4. SPOJITÉ FUNKCE 5.38. Z definice limity určete lim x→−1 (1 + x)2 − 3 2 , tj. mj. napište δ(ε)-předpis jako v minulém příkladu. 5.39. Ukažte z definice limity, že lim x→−∞ 3 (x − 2)4 2 = +∞. 5.40. Stanovte lim n→∞ ( 1 n2 + 2 n2 + · · · + n − 2 n2 + n − 1 n2 ) . 5.41. Vypočítejte lim n→∞ √ n3 − 11n2 + 2 + 5 √ n7 − 2n5 − n3 − n + sin2 n 2 − 3 √ 5n4 + 2n3 + 5 . 5.42. Vyčíslete limitu lim n→∞ n! + (n − 2)! − (n − 4)! n50 + n! − (n − 1)! . 5.43. Udejte příklad posloupností majících nevlastní limity se členy xn, yn, n ∈ N, pro které je lim n→∞ (xn + yn) = 1, lim n→∞ ( xn y2 n ) = +∞. 5.44. Napište všechny hromadné body posloupnosti dané členy an = (−1)n 2n √ 4n2 + 5n + 3 , n ∈ N. 5.45. Spočtěte lim sup n→∞ an a lim inf n→∞ an, je-li an = n2 + 4n − 5 n2 + 9 sin2 nπ 4 , n ∈ N. 5.46. Vyčíslete lim inf n→∞ ( (−1)n ( 1 + 1 n )n + sin nπ 4 ) . 5.47. Určete obě jednostranné limity lim x→0+ arctg 1 x , lim x→0− arctg 1 x . CHAPTER 5. ZŘÍZENÍ ZOO společně s požadavkem spojitosti. Skutečně, pro y = 0 dostáváme z této rovnosti f (0) = 1, odtud pak 1 = f (0) = f (x−x) = f (x)·(f (x))−1 a konečně pro přirozené n je zjevně f (nx) = (f (x))n . Takto jsme již jednoznačně určili hodnoty xa pro všechny x > 0 a a ∈ Q a požadavkem spojitosti byla již funkce určena všude. Zejména tedy pro exponenciální funkci platí známé vztahy (5.5) ax · ay = ax+y , (ax )y = ax·y . Na obrázcích vidíme funkce x → ax a x → xb pro jednu konkrétní hodnotu a = 2.5167 a b = 4.5833. 20 0 0 -2-4 y b 100 4 80 60 2 40 a=2.5167 a 32,5 y 2 100 80 1,5 60 40 1 20 0 0,5 b=4.5833 5.29. Logaritmické funkce. Viděli jsme právě, že exponenciální funkce f (x) = ax je pro a > 1 stále rostoucí a pro 0 < a < 1 je stále klesající. V obou případech tedy existuje k f (x) funkce inverzní f −1 (x) kterou nazýváme logaritmickou funkcí se základem a. Píšeme lna(x) a definiční vztah tedy je ln(ax ) = x. Rovnosti (5.5) jsou proto ekvivalentní vztahům lna(x · y) = lna(x) + lna(y), lna(xy ) = y · lna(x). Logaritmické funkce jsou definovány jen pro kladné hodnoty argumentu a jsou pro základ a > 1 rostoucí, pro základ 0 < a < 1 klesající na celém definičním oboru. Pro každé a je lna(1) = 0. Brzy uvidíme, že obzvlášť důležitou hodnotou pro a je tzv. Eulerovo číslo e, viz odstavec 5.41. Funkci lne(x) nazýváme přirozeným logaritmem a základ e v označení vynecháváme. tj. píšeme prostě ln(x). 3. Derivace U polynomů jsme již v odstavci 5.6 diskutovali, jak popisovat jednoduše velikost růstu hodnot polynomu kolem daného bodu jeho definičního oboru. Tehdy jsme pozorovali podíl (5.2), který vyjadřoval směrnici sečny mezi body [x, f (x)] ∈ R2 a [x + x, f (x + x)] ∈ R2 pro (malý) přírůstek x nezávisle proměnné. Tehdejší úvaha funguje zrovna stejně pro libovolnou reálnou nebo komplexní funkci f , jen musíme místo intuitivního „zmenšování“ přírůstku x pracovat s pojmem limity. 229 Na základě výsledku rozhodněte o existenci limity lim x→0 arctg 1 x . 5.48. Existuje některá z limit lim x→0 sin x x3 , lim x→0 5x4 + 1 x ? 5.49. Vypočtěte limitu lim x→0 tg x − sin x sin3 x . 5.50. Vyčíslete lim x→π/6 2 sin3 x + 7 sin2 x + 2 sin x − 3 2 sin3 x + 3 sin2 x − 8 sin x + 3 . 5.51. Pro libovolné m, n ∈ N určete lim x→1 xm − 1 xn − 1 . 5.52. Vyčíslete lim x→+∞ (√ x2 + x − x ) . 5.53. Stanovte lim x→+∞ ( x √ 1 + x2 − x2 ) . 5.54. Vypočítejte lim x→0 √ 2 − √ 1 + cos x sin2 x . 5.55. Vyčíslete lim x→0 sin (4x) √ x + 1 − 1 . 5.56. Spočtěte lim x→0− √ 1 + tg x − √ 1 − tg x sin x . 5.57. Stanovte lim x→−∞ 2x + √ 1 + x2 − x9 − 7x5 + 44x2 3x + 5 √ 6x6 + x2 − 18x5 − 592x4 . 3. DERIVACE Uvádíme definici pro vlastní i nevlastní derivace, tj. připouštíme i nekonečné hodnoty. Všimněte si, že na rozdíl od limity funkce, u derivace v daném bodě x0 je nutné, aby byla sama funkce v tomto bodě definovaná. Derivace funkce jedné reálné proměnné 5.30. Definice. Nechť f je reálná nebo komplexní funkce definovaná na intervalu A ⊂ R a x0 ∈ A. Jestliže existuje limita lim x→x0 f (x) − f (x0) x − x0 = a pak řídáme, že f má v bodě x0 derivaci a. Hodnotu derivace zapisujeme jako f ′ (x0) nebo df dx (x0), případně a = d dx f (x0). Derivace reálné funkce je vlastní, resp. nevlastní, když je takovou příslušná limita. Jednostranné derivace (tj. derivaci zprava a zleva) definujeme zcela stejně pomocí limity zprava a zleva. S derivacemi se vcelku snadno počítá, dá nám ale dost práce korektně odvodit derivace i některých z funkcí, které už v našem zvěřinci máme. Proto s předstihem vsunujeme do textu souhrnnou tabulku, jak derivace pro několik z nich vychází. V posledním sloupci je odkaz na odstavec, kde se dá údaj skutečně i s úplným výkladem najít. Všimněme si také, že inverzní funkce k řadě z našich funkcí sice neumíme přímo vyjádřit elementárním způsobem, přesto ale budeme umět počítat jejich derivace, viz. 5.34 Některé derivace funkcí funkce definiční obor derivace polynomy f (x) celé R f ′ (x) je opět po- lynom 5.6 kubické splajny h(x) celé R h′ (x) je opět splajn 5.9 racionální funkce f (x)/g(x) celé R kromě kořenů jmenovatele g racionální funkce: f ′(x)g(x)−f (x)g′(x) g(x)2 5.33 mocninné funkce f (x) = xa interval (0, ∞) f ′ (x) = axa−1 ?? exponenciála f (x) = ax , a > 0, a ̸= 1 celé R f ′ (x) = ln(a) · ax ?? logaritmus f (x) = lna(x), a > 0, a ̸= 1 interval (0, ∞) f ′ (x) = (ln(a))−1 · 1 x ?? Z formulace definice lze očekávat, že f ′ (x0) bude umožňovat dobře aproximovat danou funkci pomocí přímky y = f (x0) + f ′ (x0)(x − x0). 230 4. SPOJITÉ FUNKCE 5.58. Nechť limx→−∞ f (x) = 0. Je pravda, že limx→−∞(f (x) · g(x)) = 0 pro každou rostoucí funkci g : R → R? 5.59. V jakých bodech x ∈ R je funkce y = cos ( arctg ( 12x21 + 11 · ecos(x+2)−x3 −11 − x12 )) +sin (sin (sin (sin x))) s maximálním definičním oborem spojitá? 5.60. Rozhodněte, zda je funkce f (x) =    x, x < 0; 0, 0 ≤ x < 1; x, x = 1; 0, 1 < x < 2; x, 2 ≤ x ≤ 3; 1 x−3 , x > 3 spojitá; spojitá zleva; spojitá zprava v bodech −π, 0, 1, 2, 3, π. 5.61. Dodefinujte funkci f (x) = arctg ( 1 + 5 x2 ) · sin2 x5 , x ∈ R {0} pro x = 0 tak, aby byla v tomto bodě spojitá. 5.62. Uveďte p ∈ R, pro které je funkce f (x) = sin (6x) 3x , x ∈ R {0}; f (0) = p spojitá v počátku. 5.63. Zvolte reálnou hodnotu a tak, aby funkce h (x) = x4 − 1 x − 1 , x > 1; h (x) = a, x ≤ 1 byla spojitá v R. 5.64. Libovolným způsobem ověřte, že je lim x→0 ex − 1 x = 1. 5.65. Vypočtěte lim x→0+ sin8 x x3 ; lim x→−∞ sin8 x x3 . 5.66. Určete limitu lim n→∞ ( n n + 5 )2n−1 . 5.67. Spočítejte lim x→0− sin x − x x3 . CHAPTER 5. ZŘÍZENÍ ZOO Takto lze snad vnímat následující lemma, které říká, že nahrazením konstantního koeficientu f ′ (x0) ve vyjádření přímky spojitou funkcí dostaneme přímo hodnoty f . Odchylka hodnot ψ(x) na okolí bodu x0 od hodnoty ψ(x0) pak přímo říká, jak se liší směrnice sečen a tečny v bodě x0. Lemma. Reálná nebo komplexní funkce má v bodě x0 vlastní derivaci, právě když existuje na nějakém okolí O(x0) funkce ψ spojitá v x0 a taková, že pro všechny x ∈ O(x0) platí f (x) = f (x0) + ψ(x)(x − x0). Navíc pak vždy ψ(x0) = f ′ (x0) a sama funkce f je v bodě x0 spojitá. Důkaz. Nejprve předpokládejme, že f ′ (x0) je vlastní derivace. Pokud má ψ existovat, má jistě pro všechny x ∈ O \ {x0} tvar ψ(x) = (f (x) − f (x0))/(x − x0). V bodě x0 naopak definujme hodnotu derivací f ′ (x0). Pak jistě lim x→x0 ψ(x) = f ′ (x0) = ψ(x0) jak je požadováno. Naopak, jestliže taková funkce ψ existuje, tentýž postup vypočte její limitu v x0. Proto existuje i f ′ (x0) a je ψ(x0) rovna. Z vyjádření f pomocí spojitých funkcí je zřejmé, že je sama spojitá v bodě x0. 5.31. Geometrický význam derivace. Předchozí lemma lze názorně vysvětlit geometricky a tím popsat smysl derivace. Říká totiž, že na grafu funkce y = f (x), tj. na příslušné křivce v rovině se souřadnicemi x a y, poznáme, zda existuje derivace podle toho, jestli se spojitě mění hodnota směrnice sečny procházející body [x0, f (x0)] a [x, f (x)]. Pokud ano, pak limitní hodnota této směrnice je hodnotou derivace. Rostoucí a klesající funkce Důsledek. Má-li reálná funkce f v bodě x0 ∈ R derivaci f ′ (x0) > 0, pak pro nějaké okolí O(x0) platí f (b) > f (a) pro všechny body a, b ∈ O(x0), b > a. Je-li derivace f ′ (x0) < 0, pak naopak pro nějaké okolí O(x0) platí f (b) < f (a) pro všechny body a, b ∈ O(x0), b > a. Důkaz. Uvažme prvý případ. Pak podle předchozího lematu platí f (x) = f (x0) + ψ(x)(x − x0) a ψ(x0) > 0. Protože je ale ψ v x0 spojitá, musí existovat okolí O(x0), na kterém bude ψ(x) > 0. Pak ale s rostoucím x nutně poroste i hodnota f (x). Stejná argumentace ověří i tvrzení se zápornou derivací. 231 5.68. Vyčíslete limitu lim x→1− ( (1 − x) tg πx 2 ) . 5.69. Stanovte lim x→ π 2 − ((π 2 − x ) tg x ) . 5.70. Pomocí l’Hospitalova pravidla určete lim x→+∞ (( 3 1 x − 2 1 x ) x ) . 5.71. Vypočtěte lim x→1 ( 1 2 ln x − 1 x2 − 1 ) . 5.72. Užitím l’Hospitalova pravidla spočtěte limitu lim x→+∞ ( cos 2 x )x2 . 5.73. Doplňte lim x→0 (1 − cos x)sin x = . . . 5.74. Určete následující dvě limity lim x→0+ x α ln x , lim x→+∞ x α ln x , přičemž α ∈ R je libovolné. 5. Řady 5.75. Sečtěte řadu (a) ∞∑ n=1 ( 1√ n − 1√ n+1 ) ; (b) ∞∑ n=0 5 3n ; (c) ∞∑ n=1 ( 3 42n−1 + 2 42n ) ; (d) ∞∑ n=1 n 3n ; (e) ∞∑ n=0 1 (3n+1)(3n+4) . Řešení. Případ (a). Podle definice je součet řady 3. DERIVACE Funkce, které mají vlastnost f (b) > f (a) kdykoliv b > a pro nějaké okolí bodu x0 se nazývají rostoucí v bodě x0. Funkce rostoucí ve všech bodech nějakého intervalu se nazývá rostoucí na intervalu. Podobně je funkce klesající v bodu, resp. klesající na intervalu, jestliže f (b) < f (a) kdykoliv je a < b. Náš důsledek tedy říká, že funkce která má v bodě nenulovou konečnou derivaci je v tomto bodě buď rostoucí nebo klesající podle znaménka této derivace. Jako ilustraci jednoduchého použití vztahu derivace k růstu hodnot funkce se podívejme na existenci inverzí polynomů. Protože polynomy jen zřídka jsou výhradně rostoucí nebo klesající funkce, nemůžeme očekávat, že by k nim existovaly globálně definované inverzní funkce. Naopak ovšem inverzní funkce k polynomu f existují na každém intervalu mezi kořeny derivace f ′ , tj. tam kde derivace polynomu je nenulová a nemění znaménko. Tyto inverzní funkce nebudou nikdy polynomy, až na případ polynomů stupně jedna, kdy z rovnice y = ax + b spočteme přímo x = 1 a (y − b). U polynomu druhého řádu obdobně y = ax2 + bx + c vede k formuli x = −b ± √ b2 − 4a(c − y) 2a , a inverze tedy existuje (a je dána touto formulí) jen pro x na intervalech (−∞, − b 2a ), (− b 2a , ∞). Pro práci s inverzními funkcemi k polynomům nevystačíme s dosavadními funkcemi a dostáváme v našem zvířetníku nové přírůstky. 5.32. Pravidla pro počítání derivací. Uveďme si nyní několik základních tvrzení o výpočtech derivací. Říkají nám, jak dobře se snáší operace derivování s algebraickými operacemi sčítání a násobení na reálných nebo komplexních funkcích. Poslední z pravidel pak umožňuje efektivní výpočet derivace složených funkcí a říkává se mu „chain rule“. Intuitivně jim můžeme všem velice snadno rozumět, když si derivaci funkce y = f (x) představíme jako podíl přírůstků závislé proměnné y a nezávislé proměnné x: f ′ = y x . Samozřejmě pak při y = h(x) = f (x) + g(x) je přírůstek y dán součtem přírůstků f a g a přírůstek závislé proměnné zůstává stejný. Je tedy derivace součtu součtem derivací. U součinu musíme být malinko pozornější. Pro y = f (x)g(x) je přírůstek y = f (x + x)g(x + x) − f (x)g(x) = f (x + x)(g(x + x) − g(x)) + (f (x + x) − f (x))g(x) 232 5. ŘADY ∞∑ n=1 ( 1√ n − 1√ n+1 ) = lim n→∞ (( 1√ 1 − 1√ 2 ) + ( 1√ 2 − 1√ 3 ) + · · · + ( 1√ n − 1√ n+1 )) = lim n→∞ ( 1 + ( − 1√ 2 + 1√ 2 ) + · · · + ( − 1√ n + 1√ n ) − 1√ n+1 ) = 1. Případ (b). Zjevně se jedná o pětinásobek konvergentní geometrické řady s kvocientem q = 1/3, a tudíž je ∞∑ n=0 5 3n = 5 ∞∑ n=0 (1 3 )n = 5 · 1 1− 1 3 = 15 2 . Případ (c). Platí (při substituci m = n − 1) ∞∑ n=1 ( 3 42n−1 + 2 42n ) = 3 4 ∞∑ n=1 ( 1 42n−2 ) + 2 16 ∞∑ n=1 ( 1 42n−2 ) = (3 4 + 2 16 ) ∞∑ m=0 1 42m = 14 16 ∞∑ m=0 ( 1 16 )m = 14 16 · 1 1− 1 16 = 14 15 . Řadu lineárních kombinací jsme zde vyjádřili jako lineární kombinaci řad (přesněji řečeno, jako součet řad s vytknutím konstant), což je platná úprava, pokud obdržené řady jsou absolutně konvergentní. Případ (d). Z částečného součtu sn = 1 3 + 2 32 + 3 33 + · · · + n 3n , n ∈ N bezprostředně získáváme sn 3 = 1 32 + 2 33 + · · · + n−1 3n + n 3n+1 , n ∈ N. Je tedy sn − sn 3 = 1 3 + 1 32 + 1 33 + · · · + 1 3n − n 3n+1 , n ∈ N. Protože lim n→∞ n 3n+1 = 0, dostáváme ∞∑ n=1 n 3n = lim n→∞ 3 2 ( sn − sn 3 ) = 3 2 lim n→∞ n∑ k=1 1 3k = 3 2 ∞∑ k=1 (1 3 )k = 3 2 ( 1 1− 1 3 − 1 ) = 3 4 . Případ (e). Stačí použít vyjádření (jde o tzv. rozklad na parciální zlomky) 1 (3n+1)(3n+4) = 1 3 · 1 3n+1 − 1 3 · 1 3n+4 , n ∈ N ∪ {0}, které dává ∞∑ n=0 1 (3n+1)(3n+4) = lim n→∞ 1 3 ( 1 − 1 4 + 1 4 − 1 7 + 1 7 − 1 10 + · · · + 1 3n+1 − 1 3n+4 ) = lim n→∞ 1 3 ( 1 − 1 3n+4 ) = 1 3 . 5.76. Sierpińského koberec. Jednotkový čtverec se rozdělí na devět shodných čtverců a odstraní se prostřední čtverec. Každý ze zbývajících čtverců se znovu rozdělí na devět shodných čtverců a odstraní se prostřední čtverec. Určete obsah zbylého obrazce po prodloužení tohoto postupu do nekonečna. CHAPTER 5. ZŘÍZENÍ ZOO Nyní ale když budeme zmenšovat přírůstek x, jde vlastně o výpočet limity součtu součinů a o tom už víme, že jej lze počítat jako součet součinů limit. Proto z naší formulky lze očkávat pro derivaci součinu fg výraz fg′ + f ′ g, kterému se říká Leibnitzovo pravidlo. Ještě zajímavější je to pro derivaci složené funkce g = h◦f , kde definiční obor funkce z = h(y) obsahuje obor hodnot funkce y = f (x). Opět vypsáním přírůstků dostáváme g′ = z x = z y y x . Můžeme tedy očekávat, že pravidlo pro výpočet bude (h ◦ f )′ (x) = h′ (f (x))f ′ (x). Podáme nyní korektní formulace a důkaz: Pravidla pro derivování Věta. Nechť f a g jsou reálné nebo komplexní funkce definované na okolí bodu x0 ∈ R a mající v tomto bodě vlastní derivaci. Potom (1) pro každé reálné nebo komplexní číslo c má funkce x → c · f (x) derivaci v x0 a platí (cf )′ (x0) = c(f ′ (x0)), (2) funkce f + g má v x0 derivaci a platí (f + g)′ (x0) = f ′ (x0) + g′ (x0), (3) funkce f · g má v x0 derivaci a platí (f · g)′ (x0) = f ′ (x0)g(x0) + f (x0)g′ (x0). (4) Je-li dále h funkce definovaná na okolí obrazu y0 = f (x0), která má derivaci v bodě y0, má také složená funkce h ◦ f derivaci v bodě x0 a platí (h ◦ f )′ (x0) = h′ (f (x0)) · f ′ (x0). Důkaz. (1) a (2) Přímé použití věty o součtech a součinech limit funkcí dává výsledek. (3) Přepíšeme vztah pro podíl přírůstků, který jsme zmínili před formulací věty, takto (fg)(x) − (fg)(x0) x − x0 = f (x) g(x) − g(x0) x − x0 + f (x) − f (x0) x − x0 g(x0). Limita tohoto výrazu pro x → x0 dá právě požadovaný výsledek, protože je funkce f spojitá v x0. (4) Podle lematu 5.30 existují funkce ψ a φ spojité v bodech x0 a y0 = f (x0) takové, že h(y) = h(y0)+φ(y)(y−y0), f (x) = f (x0)+ψ(x)(x−x0) na nějakých okolích x0 a y0. Navíc pro ně platí ψ(x0) = f ′ (x0) a φ(y0) = h′ (y0). Pak ovšem také platí h(f (x)) − h(f (x0)) = φ(f (x))(f (x) − f (x0)) = φ(f (x))ψ(x)(x − x0) pro x z okolí bodu x0. Součin φ(f (x))ψ(x) je ovšem spojitá funkce v x0 a její hodnota v bodě x0 je právě požadovaná derivace složené funkce, opět podle lemmatu 5.30. 233 Řešení. V prvním kroku se odstraní 1 čtverec o obsahu 1/9. Ve druhém kroku se odstraní 8 čtverců o obsahu 9−2 , tj. o celkovém obsahu 8·9−2 . V každé další iteraci se odstraní osminásobek počtu čtverců z předešlého kroku, přičemž obsah každého z nich je devítinou obsahu 1 čtverce z předchozího kroku. Součet obsahů všech odstraněných čtverců je 1 9 + 8 92 + 82 93 + · · · = ∞∑ n=0 8n 9n+1 . Obsah zbylého obrazce (tzv. Sierpińského koberce) tak činí 1 − ∞∑ n=0 8n 9n+1 = 1 − 1 9 ∞∑ n=0 (8 9 )n = 1 − 1 9 · 1 1− 8 9 = 0. 5.77. Ověřte, že platí ∞∑ n=1 1 n2 < ∞∑ n=0 1 2n . Řešení. Ihned je vidět, že 1 ≤ 1, 1 22 + 1 32 < 2 · 1 22 = 1 2 , 1 42 + 1 52 + 1 62 + 1 72 < 4 · 1 42 = 1 4 , resp. obecný odhad 1 (2n)2 + · · · + 1 (2n+1−1)2 < 2n · 1 (2n)2 = 1 2n , n ∈ N. Odsud (porovnáním členů obou řad) dostáváme zadanou nerovnost, z níž mj. plyne absolutní konvergence řady ∑∞ n=1 1 n2 . Ještě upřesněme, že je ∞∑ n=1 1 n2 = π2 6 < 2 = ∞∑ n=0 1 2n . 5.78. Vyšetřete konvergenci řady ∞∑ n=1 ln n+1 n . Řešení. Pokusme se uvedenou řadu sečíst. Platí ∞∑ n=1 ln n+1 n = lim n→∞ ( ln 2 1 + ln 3 2 + ln 4 3 + · · · + ln n+1 n ) = lim n→∞ ln 2·3·4···(n+1) 1·2·3···n = lim n→∞ ln (n + 1) = +∞. Řada tudíž diverguje k +∞. 5.79. Prokažte, že řady ∞∑ n=0 arctg n2+2n+3 √ n+4 n+1 ; ∞∑ n=1 3n+1 n3+n2−n nekonvergují. Řešení. Protože lim n→∞ arctg n2+2n+3 √ n+4 n+1 = lim n→∞ arctg n2 n = π 2 a 3. DERIVACE Derivace podílu 5.33. Důsledek. Nechť f a g jsou reálné funkce, která mají v bodě x0 vlastní derivace a g(x0) ̸= 0. Pak pro funkci h(x) = f (x)(g(x))−1 platí h′ (x0) = ( f g )′ (x0) = f ′ (x0)g(x0) − f (x0)g′ (x0) (g(x0))2 . Důkaz. Dokážeme si nejprve speciální případ vzorce pro h(x) = x−1 . Přímo z definice derivace dostáváme h′ (x) = lim x→0 1 x+ x − 1 x x = lim x→0 x − x − x x(x2 + x x) = lim x→0 −1 x2 + x x a z pravidel pro počítání limit okamžitě plyne h′ (x0) = −x−2 . Nyní pravidlo pro derivaci složené funkce říká, že (g−1 )′ = −g−2 · g′ , a konečně pravidlo pro derivaci součinu nám dává právě (f/g)′ = (f · g−1 )′ = f ′ g−1 − fg−2 g′ = f ′ g − gf ′ g2 . 5.34. Derivace inverzních funkcí. V odstavci 1.36 jsme při obecné diskusi relací a zobrazení formulovali pojem inverzní funkce. Pokud k dané funkci f : R → R inverzní funkce f −1 existuje (nezaměňujme značení s funkcí x → (f (x))−1 ), pak je dána jednoznačně kterýmkoliv ze vztahů f −1 ◦ f = idR, f ◦ f −1 = idR, a druhý již pak platí také. Pokud je f definováno na podmnožině A ⊂ R a f (A) = B, je existence f −1 podmíněna stejnými vztahy s identickými zobrazeními idA resp. idB na pravých stranách. Pokud bychom věděli, že pro diferencovatelnou funkci f je i f −1 diferencovatelná, pravidlo pro derivaci složené funkce nám okamžitě říká 1 = (id)′ (x) = (f −1 ◦ f )′ (x) = (f −1 )′ (f (x)) · f ′ (x) a tedy pak přímo víme vzorec (zjevně f ′ (x) v takovém případě nemůže být nulové) Derivace inverzní funkce (5.6) (f −1 )′ (f (x)) = 1 f ′(x) . 234 5. ŘADY lim n→∞ 3n+1 n3+n2−n = lim n→∞ 3n n3 = +∞, není splněna nutná podmínka konvergence lim n→∞ an = 0 řady ∑∞ n=n0 an. 5.80. Jaký je součet řady ∞∑ n=2 1 n√ ln n ? Řešení. Z nerovností (uvažte graf přirozeného logaritmu) 1 ≤ ln n ≤ n, n ≥ 3, n ∈ N plyne n √ 1 ≤ n √ ln n ≤ n √ n, n ≥ 3, n ∈ N. Podle Věty o třech limitách je lim n→∞ n √ ln n = 1, tj. lim n→∞ 1 n√ ln n = 1. Řada tedy není konvergentní. Neboť má nezáporné členy, musí divergovat k +∞. 5.81. Zjistěte, zda řada (a) ∞∑ n=0 1 (n+1)·3n ; (b) ∞∑ n=1 n2+1 n3 ; (c) ∞∑ n=1 1 n−ln n konverguje. Řešení. Všechny tři uvedené řady mají nezáporné členy, a tak mohou v jednotlivých variantách nastat jen dvě možnosti – součet je konečný, součet je roven +∞. Platí (a) ∞∑ n=0 1 (n+1)·3n ≤ ∞∑ n=0 (1 3 )n = 1 1− 1 3 < +∞; (b) ∞∑ n=1 n2+1 n3 ≥ ∞∑ n=1 n2 n3 = ∞∑ n=1 1 n = +∞; (c) ∞∑ n=1 1 n−ln n ≥ ∞∑ n=1 1 n = +∞. Odtud plyne, že řada (a) konverguje; (b) diverguje k +∞; (c) diverguje k +∞. 5.82. Aplikací podílového (tzv. d’Alembertova) kritéria určete, jestli nekonečná řada (a) ∞∑ n=1 2n·(n+1)3 3n ; (b) ∞∑ n=1 6n n! ; (c) ∞∑ n=1 nn n2·n! konverguje. Řešení. Protože (an ≥ 0 pro všechna n) CHAPTER 5. ZŘÍZENÍ ZOO To dobře odpovídá intuitivní představě, že pro y = f (x) je přibližně f ′ = y x zatímco pro x = f −1 (y) je to přibližně (f −1 )′ (y) = x y . Takto skutečně můžeme derivace inverzních funkcí počítat: Věta. Je-li f diferencovatelná reálná funkce na okolí bodu x0 a v tomto bodě f ′ (x0) ̸= 0, pak existuje na nějakém okolí bodu y0 = f (x0) funkce f −1 inverzní k f a platí vztah (5.6). Důkaz. Nejprve si povšimněme, že nenulovost derivace znamená, že na nějakém okolí je naše funkce f buď ostře rostoucí nebo klesající, viz důsledek 5.31. Proto na nějakém okolí nutně existuje inverzní funkce. Protože je obrazem ohraničeného uzavřeného intervalu ve spojité funkci opět uzavřený interval, nutně je také pro každou otevřenou množinu U v definičním oboru f i obraz f (U) otevřený. Pak ale přímo z definice spojitosti pomocí okolí je pak tato inverzní funkce také spojitá. Pro odvození našeho tvrzení nyní postačí pozorně znovu pročíst důkaz čtvrtého tvrzení věty 5.32. Jen volíme f místo funkce h a f −1 místo f a místo předpokladu existence derivací pro obě funkce víme, že funkce složená je diferencovatelná (a víme, že její derivace je identita): Skutečně, podle lematu 5.30 existuje funkce ψ spojitá v bodě y0 taková, že f (y) − f (y0) = φ(y)(y − y0), na nějakém okolí y0. Navíc pro ni platí φ(y0) = f ′ (y0). Pak ovšem po dosazení y = f −1 (x) také platí x − x0 = φ(f −1 (x))(f −1 (x) − f −1 (x0)), pro x z nějakého okolí O(x0) bodu x0. Dále platí f −1 (x0) = y0 a protože je f buď ostře rostoucí nebo klesající, je φ(f −1 (x)) ̸= 0 pro všechny x ∈ O(x0) \ {x0}. Můžeme tedy psát f −1 (x) − f −1 (x0) x − x0 = 1 φ(f −1(x)) ̸= 0, pro všechny x ∈ O(x0) \ {x0}. Pravá strana tohoto výrazu je spojitá v bodě x0 a limita je rovna φ(y0) = (f ′ (y0))−1 , proto i limita levé strany existuje a je rovna témuž výrazu. 5.35. Derivace mocninné, exponenciální a logaritmické funkce. Obecnou mocninou funkci není tak snadné zderivovat, i když jsme už prozradili, že vzorec (5.7) (xa )′ = axa−1 známý pro přirozená a bude platit i pro obecné a. Odvodit tento vzorec však můžeme snadno s pomocí vztahu pro derivaci exponenciální funkce a logaritmické funkce: (xa )′ = (ea ln x )′ = ea ln x (a ln x)′ = axa−1 . Podívejme se teď na exponenciály f (x) = ax . Pokud existuje derivace ax ve všech bodech x, bude jistě platit f ′ (x) = lim x→0 ax+ x − ax x = ax lim x→0 a x − 1 x = f ′ (0)ax . 235 (a) lim n→∞ an+1 an = lim n→∞ 2n+1·(n+2)3·3n 3n+1·2n·(n+1)3 = lim n→∞ 2(n+2)3 3(n+1)3 = lim n→∞ 2n3 3n3 = 2 3 < 1; (b) lim n→∞ an+1 an = lim n→∞ ( 6n+1 (n+1)! · n! 6n ) = lim n→∞ 6 n+1 = 0 < 1; (c) lim n→∞ an+1 an = lim n→∞ ( (n+1)n+1 (n+1)2·(n+1)! · n2·n! nn ) = lim n→∞ n2 (n+1)2 · lim n→∞ (n+1)n nn = lim n→∞ n2 n2 · lim n→∞ ( 1 + 1 n )n = 1 · e > 1, řada (a) konverguje; (b) konverguje; (c) nekonverguje (diverguje k +∞). 5.83. Aplikací odmocninového (tzv. Cauchyova) kritéria určete, jestli nekonečná řada (a) ∞∑ n=1 1 lnn(n+1) ; (b) ∞∑ n=1 ( n+1 n )n2 n3·3n ; (c) ∞∑ n=1 arcsinn 2n 2n konverguje. Řešení. Opět máme řady s nezápornými členy, přičemž je (a) lim n→∞ n √ an = lim n→∞ 1 ln(n+1) = 0 < 1; (b) lim n→∞ n √ an = lim n→∞ ( n+1 n )n n√ n3·3 = lim n→∞ ( 1+ 1 n )n 3 ( lim n→∞ n√ n )3 = e 3 < 1; (c) lim n→∞ n √ an = lim n→∞ arcsin 2n 2n = arcsin 0 = 0 < 1. To znamená, že všechny zadané řady konvergují. 5.84. Rozhodněte, zda řada (a) ∞∑ n=1 (−1)n ln ( 1 + 1 2n ) ; (b) ∞∑ n=1 (−2)n2 n! ; (c) ∞∑ n=1 (−3)n (6+(−1)n)n konverguje. Řešení. Případ (a). Podle l’Hospitalova pravidla je lim x→+∞ ln ( 1+ 1 2x ) 1 2x = lim x→+∞ 1 1+ 1 2x ( 1+ 1 2x )′ ( 1 2x )′ = lim x→+∞ 1 1+ 1 2x = 1, a proto platí 0 < ln ( 1 + 1 2n ) ≤ 2 2n pro všechna dostatečně velká n ∈ N. Ovšem o řadě ∑∞ n=1 2 2n víme, že je konvergentní. Musí tak být ∞∑ n=1 ln ( 1 + 1 2n ) < +∞, tj. řada v zadání konverguje (absolutně). Případ (b). Podílové kritérium dává 3. DERIVACE Naopak, pokud existuje derivace v nule, pak tento výpočet ověřuje existenci derivace v kterémkoliv bodě a dává její hodnotu. Zároveň jsme ověřili platnost téhož vztahu pro derivace zprava a zleva. Bude nám to ještě dlouho trvat, než ověříme (viz 5.42, 5.47 a ??), že derivace exponenciálních funkcí skutečně existují. Již teď si ale všimněme, že jsou to tedy zvláštní případy funkcí, jejichž derivace jsou úměrné hodnotám s konstantním koeficientem úměrnosti. Zároveň uvidíme, že existuje obzvlášť užitečný základ e, tzv. Eulerovo číslo, pro které bude derivace v nule rovna jedné. Zjevně pak (ax )′ = (eln(a)x )′ = ln(a)(eln(a)x ) = ln(a) · ax . Z definičního vztahu pro přirozený logaritmus eln x = x snadno spočteme podle pravidla pro derivaci složené funkce (užíváme již, že ex je rovno své derivaci, a také definiční vztah pro logaritmus): (5.8) (ln)′ (y) = (ln)′ (ex ) = 1 (ex)′ = 1 ex = 1 y . 5.36. Věty o střední hodnotě diferencovatelné funkce. Než se pustíme do dalšího tématu na naší pouti za různorodými definicemi funkcí, odvodíme ještě několik jednoduchých výsledků o derivacích. Všechny jsou velice snadno intuitivně jasné z přiložených obrázků a důkazy vlastně jen rozepisují vizuální představu. Věta. Nechť funkce f : R → R je spojitá na konečném uzavřeném intervalu [a, b] a diferencovatelná uvnitř tohoto intervalu. Jestliže platí f (a) = f (b), pak existuje c ∈ (a, b) takové, že f ′ (c) = 0. Důkaz. Protože je funkce f spojitá na uzavřeném intervalu (tj. kompaktní množině), má na něm maximum a minimum. Pokud by maximum i minimum mělo stejnou hodnotu f (a) = f (b), pak by funkce f byla konstantní a tedy i její derivace by byla nulová ve všech bodech intervalu (a, b). Předpokládejme tedy, že buď maximum nebo mimimum je jiné a nechť nastává jedno z nich ve vnitřním bodě c. Pak ovšem není možné, aby v c bylo f ′ (c) ̸= 0, protože to by v tomto bodě byla byla funkce f buď rostoucí nebo klesající (viz 5.31) a jistě by tedy v okolí bodu c nabývala větších i menších hodnot, než je f (c). Právě dokázanému tvrzení se říká Rolleova věta. Z ní snadno vyplývá následující důsledek, známý jako věta o střední hodnotě. 5.37. Věta. Nechť funkce f : R → R je spojitá na intervalu [a, b] a diferencovatelná uvnitř tohoto intervalu. Pak existuje c ∈ (a, b) takové, že f ′ (c) = f (b) − f (a) b − a . 236 5. ŘADY lim n→∞ an+1 an = lim n→∞ 2(n+1)2 ·n! (n+1)!·2n2 = lim n→∞ 22n+1 n+1 = lim n→∞ 2·4n n+1 = +∞. Řada tedy nekonverguje. Případ (c). Nyní použijeme obecnou verzi odmocninového kritéria lim sup n→∞ n √ | an | = lim sup n→∞ 3 6+(−1)n = 3 5 < 1, z níž plyne (absolutní) konvergence řady. 5.85. Libovolným způsobem dojděte k rozhodnutí o konvergenci alternující řady (a) ∞∑ n=1 (−1)n n2+3n−1 (3n−2)2 ; (b) ∞∑ n=1 (−1)n−1 3n4−3n3+9n−1 (5n3−2)·4n . Řešení. Případ (a). Z toho, že je lim n→∞ n2+3n−1 (3n−2)2 = lim n→∞ n2 9n2 = 1 9 ̸= 0, ihned vyplývá neexistence limity lim n→∞ ( (−1)n n2+3n−1 (3n−2)2 ) . Řada tudíž nekonverguje (není splněna nutná podmínka konvergence). Případ (b). Viděli jsme, že při použití podílového (nebo odmocninového) kritéria polynomy v čitateli ani jmenovateli členů řady neovlivňují hodnotu počítané limity. Uvažujme tedy řadu ∞∑ n=1 (−1)n−1 1 4n , pro kterou je lim n→∞ an+1 an = 1 4 < 1. To ovšem znamená, že rovněž původní řada je (absolutně) konver- gentní. 5.86. Konverguje řada ∞∑ n=1 (−1)n+1 arctg 2√ 3n ? Řešení. Posloupnost { 2/ √ 3n } n∈N je zřejmě klesající a funkce y = arctg x rostoucí (na celé reálné ose), a tudíž posloupnost{ arctg ( 2/ √ 3n )} n∈N je klesající. Je tedy zadána alternující řada splňující, že posloupnost absolutních hodnot jejích členů je klesající. Taková alternující řada konverguje, právě když posloupnost jejích členů konverguje k 0 (tzv. Leibnizovo kritérium), což je ovšem splněno: lim n→∞ arctg 2√ 3n = arctg 0 = 0, tj. lim n→∞ ( (−1)n+1 arctg 2√ 3n ) = 0. CHAPTER 5. ZŘÍZENÍ ZOO Důkaz. Důkaz je prostým zápisem geometrického významu tvrzení: k sečně mezi body [a, f (a)] a [b, f (b)] existuje tečna, která je s ní rovnoběžná (namalujte si obrázek). Rovnice naší sečny je y = g(x) = f (a) + f (b) − f (a) b − a (x − a). Rozdíl h(x) = f (x)−g(x) udává vzdálenost grafu od sečny (v hodnotách y). Jistě platí h(a) = h(b) a h′ (x) = f ′ (x) − f (b) − f (a) b − a . Podle předchozí věty existuje bod c, ve kterém je h′ (c) = 0. Větu o střední hodnotě můžeme také přepsat ve tvaru: (5.9) f (b) = f (a) + f ′ (c)(b − a). V případě parametricky zadané křivky v rovině, tj. dvojice funkcí y = f (t), x = g(t), je stejný výsledek o existenci rovnoběžné tečny k sečně krajními body popsán takto: Důsledek. Nechť funkce y = f (t) a x = g(t) jsou spojité na intervalu [a, b] a diferencovatelné uvnitř tohoto intervalu a g′ (t) ̸= 0 pro všechny t ∈ (a, b). Pak existuje bod c ∈ (a, b) takový, že platí f (b) − f (a) g(b) − g(a) = f ′ (c) g′(c) . Důkaz. Opět spoléháme na použití Rolleovy věty. Položíme proto h(t) = (f (b) − f (a))g(t) − (g(b) − g(a))f (t). Nyní h(a) = f (b)g(a) − f (a)g(b), h(b) = f (b)g(a) − f (a)g(b), takže existuje c ∈ (a, b) takový, že h′ (c) = 0. Protože je g′ (c) ̸= 0, dostáváme právě požadovaný vztah. Podobná úvaha jako v posledním tvrzení vede k mimořádně užitečnému nástroji pro počítání limit podílu funkcí. Tvrzení je znám jako L’Hospitalovo pravidlo: 5.38. Věta. Předpokládejme, že f a g jsou funkce diferencovatelné v okolí bodu x0 ∈ R, ne však nutně v bodě x0 samotném, a nechť existují limity lim x→x0 f (x) = 0, lim x→x0 g(x) = 0. Jestliže existuje limita lim x→x0 f ′ (x) g′(x) pak existuje i limita lim x→x0 f (x) g(x) a jsou si rovny. 237 5.87. Zjistěte, jestli řada (a) ∞∑ n=1 sin n n2 ; (b) ∞∑ n=1 cos(πn) 3√ n2 konverguje absolutně, příp. neabsolutně (relativně), nebo nekonver- guje. Řešení. Případ (a). Ukázat, že tato řada konverguje absolutně, je snadné. Např. je ∞∑ n=1 sin n n2 ≤ ∞∑ n=1 1 n2 < ∞∑ n=0 1 2n = 2, přičemž druhou nerovnost jsme dokázali dříve. Případ (b). Je vidět, že cos (πn) = (−1)n , n ∈ N. Máme tedy alternující řadu, jejíž posloupnost členů v absolutní hodnotě je klesající. Proto z limity lim n→∞ 1 3√ n2 = 0 již plyne, že řada konverguje. Zároveň však je ∞∑ n=1 cos(πn) 3√ n2 = ∞∑ n=1 1 3√ n2 ≥ ∞∑ n=1 1 n = +∞. Řada tak konverguje neabsolutně. 5.88. Sečtěte řadu (a) ∞∑ n=1 ( 1√ n − 1√ n+1 ) ; (b) ∞∑ n=0 5 3n ; (c) ∞∑ n=1 ( 3 42n−1 + 2 42n ) ; (d) ∞∑ n=1 n 3n ; (e) ∞∑ n=0 1 (3n+1)(3n+4) . Řešení. Případ (a). Podle definice je součet řady ∞∑ n=1 ( 1√ n − 1√ n+1 ) = lim n→∞ (( 1√ 1 − 1√ 2 ) + ( 1√ 2 − 1√ 3 ) + · · · + ( 1√ n − 1√ n+1 )) = lim n→∞ ( 1 + ( − 1√ 2 + 1√ 2 ) + · · · + ( − 1√ n + 1√ n ) − 1√ n+1 ) = 1. Případ (b). Zjevně se jedná o pětinásobek konvergentní geometrické řady s kvocientem q = 1/3, a tudíž je ∞∑ n=0 5 3n = 5 ∞∑ n=0 (1 3 )n = 5 · 1 1− 1 3 = 15 2 . Případ (c). Platí (při substituci m = n − 1) ∞∑ n=1 ( 3 42n−1 + 2 42n ) = 3 4 ∞∑ n=1 ( 1 42n−2 ) + 2 16 ∞∑ n=1 ( 1 42n−2 ) = (3 4 + 2 16 ) ∞∑ m=0 1 42m = 14 16 ∞∑ m=0 ( 1 16 )m = 14 16 · 1 1− 1 16 = 14 15 . 3. DERIVACE Důkaz. Bez újmy na obecnosti můžeme předpokládat, že v x0 mají funkce f a g nulovou hodnotu. Výsledek je opět jednoduše představitelný pomocí obrázku. Uvažujme body [g(x), f (x)] ∈ R2 parametrizované proměnnou x. Podíl hodnot pak odpovídá směrnici sečny mezi body [0, 0] a [f (x), g(x)]. Zároveň víme, že podíl derivací odpovídá směrnici tečny v příslušném bodě. Z existence limity směrnic tečen tedy chceme dovodit existenci limity směrnic sečen. Technicky lze využít věty o střední hodnotě v parametrickém tvaru. Předně si uvědomme, že v tvrzení věty implicitně předpokládáme existenci výrazu f ′ (x)/g′ (x) na nějakém okolí x0 (kromě bodu x0 samotného), zejména tedy pro dostatečně blízké body c k x0 bude g′ (c) ̸= 0.2 Díky větě o střední hodnotě nyní lim x→x0 f (x) g(x) = lim x→x0 f (x) − f (x0) g(x) − g(x0) = lim x→x0 f ′ (cx) g′(cx) , kde cx je číslo mezi x0 a x, závislé na x. Z existence limity lim x→x0 f ′ (x) g′(x) vyplývá, že stejnou hodnotu bude mít i limita libovolné posloupnosti vzniklé dosazením hodnot x = xn jdoucích k x0 do f ′ (x)/g′ (x). Zejména tedy můžeme dosadit jakoukoliv posloupnost cxn pro xn → x0 a proto bude existovat i limita lim x→x0 f ′ (cx) g′(cx) a poslední dvě limity zjevně budou mít stejnou hodnotu. Dokázali jsme tedy, že naše hledaná limita existuje a má také stejnou hodnotu. Z důkazu věty je samozřejmé, že její tvrzení platí i pro jednostranné limity. 5.39. Důsledky. L’Hospitalovo pravidlo můžeme jednoduše rozšířit i pro limity v nevlastních bodech ±∞ a pro případ nevlastních hodnot limit. Je-li, např. lim x→∞ f (x) = 0, lim x→∞ g(x) = 0, potom je limx→0+ f (1/x) = 0 a limx→0+ g(1/x) = 0. Zároveň z existence limity podílu derivací v nekonečnu dostaneme lim x→0+ (f (1/x))′ (g(1/x))′ = lim x→0+ f ′ (1/x)(−1/x2 ) g′(1/x)(−1/x2) = lim x→0+ f ′ (1/x) g′(1/x) = lim x→∞ f ′ (x) g′(x) . 2Pro samu existenci limity v obecném smyslu to vždy nutné není, nicméně pro tvrzení L’Hospitalovy věty je to potřebné. Podrobnou diskusi je možné najít (vygooglovat) v populárním článku „R. P. Boas, Counterexamples to L’Hôpital’s Rule, The American Mathematical Monthly, October 1986, Volume 93, Number 8, pp. 644–645.“ 238 5. ŘADY Řadu lineárních kombinací jsme zde vyjádřili jako lineární kombinaci řad (přesněji řečeno, jako součet řad s vytknutím konstant), což je platná úprava, pokud obdržené řady jsou absolutně konvergentní. Případ (d). Z částečného součtu sn = 1 3 + 2 32 + 3 33 + · · · + n 3n , n ∈ N bezprostředně získáváme sn 3 = 1 32 + 2 33 + · · · + n−1 3n + n 3n+1 , n ∈ N. Je tedy sn − sn 3 = 1 3 + 1 32 + 1 33 + · · · + 1 3n − n 3n+1 , n ∈ N. Protože lim n→∞ n 3n+1 = 0, dostáváme ∞∑ n=1 n 3n = lim n→∞ 3 2 ( sn − sn 3 ) = 3 2 lim n→∞ n∑ k=1 1 3k = 3 2 ∞∑ k=1 (1 3 )k = 3 2 ( 1 1− 1 3 − 1 ) = 3 4 . Případ (e). Stačí použít vyjádření (jde o tzv. rozklad na parciální zlomky) 1 (3n+1)(3n+4) = 1 3 · 1 3n+1 − 1 3 · 1 3n+4 , n ∈ N ∪ {0}, které dává ∞∑ n=0 1 (3n+1)(3n+4) = lim n→∞ 1 3 ( 1 − 1 4 + 1 4 − 1 7 + 1 7 − 1 10 + · · · + 1 3n+1 − 1 3n+4 ) = lim n→∞ 1 3 ( 1 − 1 3n+4 ) = 1 3 . 5.89. Sierpińského koberec. Jednotkový čtverec se rozdělí na devět shodných čtverců a odstraní se prostřední čtverec. Každý ze zbývajících čtverců se znovu rozdělí na devět shodných čtverců a odstraní se prostřední čtverec. Určete obsah zbylého obrazce po prodloužení tohoto postupu do nekonečna. Řešení. V prvním kroku se odstraní 1 čtverec o obsahu 1/9. Ve druhém kroku se odstraní 8 čtverců o obsahu 9−2 , tj. o celkovém obsahu 8·9−2 . V každé další iteraci se odstraní osminásobek počtu čtverců z předešlého kroku, přičemž obsah každého z nich je devítinou obsahu 1 čtverce z předchozího kroku. Součet obsahů všech odstraněných čtverců je 1 9 + 8 92 + 82 93 + · · · = ∞∑ n=0 8n 9n+1 . Obsah zbylého obrazce (tzv. Sierpińského koberce) tak činí 1 − ∞∑ n=0 8n 9n+1 = 1 − 1 9 ∞∑ n=0 (8 9 )n = 1 − 1 9 · 1 1− 8 9 = 0. CHAPTER 5. ZŘÍZENÍ ZOO Použitím předchozí věty tedy dostáváme, že v tomto případě bude existovat i limita podílu lim x→∞ f (x) g(x) = lim x→0+ f (1/x) g(1/x) = lim x→∞ f ′ (x) g′(x) . Ještě jednodušší je postup při výpočtu limity v případě, kdy lim x→x0 f (x) = ±∞, lim x→x0 g(x) = ±∞. Stačí totiž psát lim x→x0 f (x) g(x) = lim x→x0 1/g(x) 1/f (x) , což je již případ pro použití L’Hospitalova pravidla z předchozí věty. Lze ale i dokázat, že L’Hospitalovo pravidlo platí ve stejné formě pro nevlastní limity: Věta. Nechť f a g jsou funkce diferencovatelné v okolí bodu x0 ∈ R, ne však nutně v bodě x0 samotném, a nechť existují limity limx→x0 f (x) = ±∞ a limx→x0 g(x) = ±∞. Jestliže existuje limita lim x→x0 f ′ (x) g′(x) pak existuje i limita lim x→x0 f (x) g(x) a jsou si rovny. Důkaz. Opět lze vyjít z věty o střední hodnotě. Základem je vyjádření podílu tak, abychom dostali do hry derivaci: f (x) g(x) = f (x) f (x) − f (y) · f (x) − f (y) g(x) − g(y) · g(x) − g(y) g(x) kde y volíme nějaký pevný ze zvoleného okolí x0 a x necháme blížit k x0. Protože jsou limity f i g v x0 nekonečné, můžeme jistě předpokládat, že rozdíly hodnot v x a y jsou u obou funkcí při pevném y nenulové. Pomocí věty o střední hodnotě můžeme nyní nahradit prostřední zlomek podílem derivací ve vhodném bodě c mezi x a y a výraz ve zkoumané limitě dostává tvar f (x) g(x) = 1 − g(y) g(x) 1 − f (y) f (x) · f ′ (c) g′(c) , kde c závisí na x i y. Při pevném y a x jdoucím k x0 jde první zlomek zjevně k jedničce. Když zároveň budeme y přibližovat k x0, bude se nám druhý zlomek libovolně přesně blížit k limitní hodnotě podílu derivací. 5.40. Příklad použití. Vhodnými úpravami sledovaných výrazů lze využít L’Hospitalova pravidla také na výrazy typu ∞ − ∞, 1∞ , 0 · ∞ apod. Zpravidla jde o prosté přepsání výrazů nebo o využití nějaké hladké funkce, např. exponenciální. příklady budou jistě hodjně v druhé části textu, včetně takových jako je zaprocentován 239 5.90. Ověřte, že platí ∞∑ n=1 1 n2 < ∞∑ n=0 1 2n . Řešení. Ihned je vidět, že 1 ≤ 1, 1 22 + 1 32 < 2 · 1 22 = 1 2 , 1 42 + 1 52 + 1 62 + 1 72 < 4 · 1 42 = 1 4 , resp. obecný odhad 1 (2n)2 + · · · + 1 (2n+1−1)2 < 2n · 1 (2n)2 = 1 2n , n ∈ N. Odsud (porovnáním členů obou řad) dostáváme zadanou nerovnost, z níž mj. plyne absolutní konvergence řady ∑∞ n=1 1 n2 . Ještě upřesněme, že je ∞∑ n=1 1 n2 = π2 6 < 2 = ∞∑ n=0 1 2n . 5.91. Vyšetřete konvergenci řady ∞∑ n=1 ln n+1 n . Řešení. Pokusme se uvedenou řadu sečíst. Platí ∞∑ n=1 ln n+1 n = lim n→∞ ( ln 2 1 + ln 3 2 + ln 4 3 + · · · + ln n+1 n ) = lim n→∞ ln 2·3·4···(n+1) 1·2·3···n = lim n→∞ ln (n + 1) = +∞. Řada tudíž diverguje k +∞. 5.92. Prokažte, že řady ∞∑ n=0 arctg n2+2n+3 √ n+4 n+1 ; ∞∑ n=1 3n+1 n3+n2−n nekonvergují. Řešení. Protože lim n→∞ arctg n2+2n+3 √ n+4 n+1 = lim n→∞ arctg n2 n = π 2 a lim n→∞ 3n+1 n3+n2−n = lim n→∞ 3n n3 = +∞, není splněna nutná podmínka konvergence lim n→∞ an = 0 řady ∑∞ n=n0 an. 5.93. Jaký je součet řady ∞∑ n=2 1 n√ ln n ? Řešení. Z nerovností (uvažte graf přirozeného logaritmu) 1 ≤ ln n ≤ n, n ≥ 3, n ∈ N plyne n √ 1 ≤ n √ ln n ≤ n √ n, n ≥ 3, n ∈ N. Podle Věty o třech limitách (5.20) je lim n→∞ n √ ln n = 1, tj. lim n→∞ 1 n√ ln n = 1. 4. MOCNINNÉ ŘADY Ukážeme si pro ilustraci takového postupu souvislost aritmetického a geometrického průměru z n nezáporných hodnot xi. Aritmetický průměr M1 (x1, . . . , xn) = x1 + · · · + xn n je speciálním případem tzv. mocninného průměru stupně r: Mr (x1, . . . , xn) = ( xr 1 + · · · + xr n n )1 r . Speciální hodnota M−1 se nazývá harmonický průměr. Spočtěme si nyní limitní hodnotu Mr pro r jdoucí k nule. Za tímto účelem spočteme limitu pomocí L’Hospitalova pravidla (jde o výraz 0/0 a derivujeme podle r, zatímco xi jsou při výpočtu konstantní parametry). Následující výpočet, ve kterém užíváme pravidla pro derivování složených funkcí a znalosti hodnot derivace mocninné funkce, musíme číst odzadu. Z existence poslední limity plyne existence předposlední a její hodnota atd. lim r→0 ln(Mr (x1, . . . , xn)) = lim r→0 ln(1 n (xr 1 + · · · + xr n )) r = lim r→0 xr 1 ln x1+···+xr n ln xn n xr 1+···+xr n n = ln x1 + · · · + ln xn n = ln n √ x1 · · · · · xn. Odtud tedy je přímo vidět, že lim r→0 Mr (x1, . . . , xn) = n √ x1 . . . xn, což je hodnota známá pod názvem geometrický průměr. 4. Mocninné řady 5.41. Jak se počítá ex . Kromě sčítání a násobení už umíme také počítat s limitami posloupností. Podbízí se proto přibližovat nepolynomiální funkce pomocí posloupností spočítatelných hodnot. Když se takto podíváme na funkci ex , hledáme vlastně funkci, jejíž okamžitý přírůstek je v každém bodě roven hodnotě této funkce. To si můžeme dobře představit jako úžasné úročení vkladu se sazbou rovnou okamžité hodnotě. Když budeme roční sazbu úroku realizovat jednou za měsíc, za den, za hodinu atd., budeme pro vklad x dostávat výsledné hodnoty ( 1 + x 12 )12 , ( 1 + x 365 )365 , ( 1 + x 8760 )8760 , . . . Dalo by se tedy tušit, že bude platit: ex = lim n→∞ ( 1 + x n )n . Zároveň tušíme, že čím jemněji budeme postupovat při úročení, tím vyšší bude výnos, takže by posloupnost čísel na pravé straně měla být rostoucí. 240 5. ŘADY Řada tedy není konvergentní. Neboť má nezáporné členy, musí divergovat k +∞. 5.94. Zjistěte, zda řada (a) ∞∑ n=0 1 (n+1)·3n ; (b) ∞∑ n=1 n2+1 n3 ; (c) ∞∑ n=1 1 n−ln n konverguje. Řešení. Všechny tři uvedené řady mají nezáporné členy, a tak mohou v jednotlivých variantách nastat jen dvě možnosti – součet je konečný, součet je roven +∞. Platí (a) ∞∑ n=0 1 (n+1)·3n ≤ ∞∑ n=0 (1 3 )n = 1 1− 1 3 < +∞; (b) ∞∑ n=1 n2+1 n3 ≥ ∞∑ n=1 n2 n3 = ∞∑ n=1 1 n = +∞; (c) ∞∑ n=1 1 n−ln n ≥ ∞∑ n=1 1 n = +∞. Odtud plyne, že řada (a) konverguje; (b) diverguje k +∞; (c) diverguje k +∞. 5.95. Aplikací podílového (tzv. d’Alembertova) kritéria určete, jestli nekonečná řada (a) ∞∑ n=1 2n·(n+1)3 3n ; (b) ∞∑ n=1 6n n! ; (c) ∞∑ n=1 nn n2·n! konverguje. Řešení. Protože (an ≥ 0 pro všechna n) (a) lim n→∞ an+1 an = lim n→∞ 2n+1·(n+2)3·3n 3n+1·2n·(n+1)3 = lim n→∞ 2(n+2)3 3(n+1)3 = lim n→∞ 2n3 3n3 = 2 3 < 1; (b) lim n→∞ an+1 an = lim n→∞ ( 6n+1 (n+1)! · n! 6n ) = lim n→∞ 6 n+1 = 0 < 1; (c) lim n→∞ an+1 an = lim n→∞ ( (n+1)n+1 (n+1)2·(n+1)! · n2·n! nn ) = lim n→∞ n2 (n+1)2 · lim n→∞ (n+1)n nn = lim n→∞ n2 n2 · lim n→∞ ( 1 + 1 n )n = 1 · e > 1, řada (a) konverguje; (b) konverguje; (c) nekonverguje (diverguje k +∞). 5.96. Aplikací odmocninového (tzv. Cauchyova) kritéria určete, jestli nekonečná řada (a) ∞∑ n=1 1 lnn(n+1) ; (b) ∞∑ n=1 ( n+1 n )n2 n3·3n ; CHAPTER 5. ZŘÍZENÍ ZOO Podívejme se tedy podrobně na číselnou posloupnost an = ( 1 + 1 n )n . Z binomického rozvoje je zřejmé, že pro každé kladné číslo b a přirozené n platí (1+b)n > 1+nb, dostáváme proto pro dva po sobě jdoucí členy naší posloupnosti podíl (1 + 1 n )n (1 + 1 n−1 )n−1 = (n2 − 1)n n n2n(n − 1) = ( 1 − 1 n2 )n n n − 1 > (1 − 1 n ) n n − 1 = 1. Je tedy naše posloupnost skutečně rostoucí. Zároveň stejným výpočtem ověříme, že posloupnost čísel bn = ( 1 + 1 n )n+1 = ( 1 + 1 n ) ( 1 + 1 n )n je klesající a jistě je bn > an. Posloupnost an je tedy zhora ohraničená a rostoucí a proto je její limita dána jejím supremem. Zároveň vidíme, že je tato limita rovna také limitě klesající posloupnosti bn). Tato limita proto zadává jedno z nejdůležitějších čísel v matematice (vedle nuly, jedničky a Ludolfova čísla π), Eulerovo číslo e. Je tedy e = lim n→∞ ( 1 + 1 n )n . 5.42. Mocninná řada pro ex . Exponenciální funkci jsme definovali jako jedinou spojitou funkci splňující f (1) = e a f (x + y) = f (x) · f (y). Základ e máme vyjádřen jako limitu posloupnosti čísel an, nutně tedy je ex = lim n→∞ (an)x . Počítejme nyní pro jednoduchost s kladným x. Jestliže v hodnotách an z minulého odstavce zaměníme n za n/x, opět dostatneme stejnou limitu a proto také e = lim n→∞ ( 1 + x n )n x , ex = lim n→∞ ( 1 + x n )n . Označme si n-tý člen této posloupnosti un(x) = (1 + x/n)n a vyjádřeme si jej pomocí bionomické věty: (5.10) un(x) = 1 + n x n + n(n − 1)x2 2!n2 + · · · + n!xn n!nn = 1 + x + x2 2! ( 1 − 1 n ) + x3 3! ( 1 − 1 n ) ( 1 − 2 n ) + . . . + xn n! ( 1 − 1 n ) ( 1 − 2 n ) . . . ( 1 − n − 1 n ) . 241 (c) ∞∑ n=1 arcsinn 2n 2n konverguje. Řešení. Opět máme řady s nezápornými členy, přičemž je (a) lim n→∞ n √ an = lim n→∞ 1 ln(n+1) = 0 < 1; (b) lim n→∞ n √ an = lim n→∞ ( n+1 n )n n√ n3·3 = lim n→∞ ( 1+ 1 n )n 3 ( lim n→∞ n√ n )3 = e 3 < 1; (c) lim n→∞ n √ an = lim n→∞ arcsin 2n 2n = arcsin 0 = 0 < 1. To znamená, že všechny zadané řady konvergují. 5.97. Rozhodněte, zda řada (a) ∞∑ n=1 (−1)n ln ( 1 + 1 2n ) ; (b) ∞∑ n=1 (−2)n2 n! ; (c) ∞∑ n=1 (−3)n (6+(−1)n)n konverguje. Řešení. Případ (a). Podle l’Hospitalova pravidla je lim x→+∞ ln ( 1+ 1 2x ) 1 2x = lim x→+∞ 1 1+ 1 2x ( 1+ 1 2x )′ ( 1 2x )′ = lim x→+∞ 1 1+ 1 2x = 1, a proto platí 0 < ln ( 1 + 1 2n ) ≤ 2 2n pro všechna dostatečně velká n ∈ N. Ovšem o řadě ∑∞ n=1 2 2n víme, že je konvergentní. Musí tak být ∞∑ n=1 ln ( 1 + 1 2n ) < +∞, tj. řada v zadání konverguje (absolutně). Případ (b). Podílové kritérium dává lim n→∞ an+1 an = lim n→∞ 2(n+1)2 ·n! (n+1)!·2n2 = lim n→∞ 22n+1 n+1 = lim n→∞ 2·4n n+1 = +∞. Řada tedy nekonverguje. Případ (c). Nyní použijeme obecnou verzi odmocninového kritéria lim sup n→∞ n √ | an | = lim sup n→∞ 3 6+(−1)n = 3 5 < 1, z níž plyne (absolutní) konvergence řady. 5.98. Libovolným způsobem dojděte k rozhodnutí o konvergenci alternující řady (a) ∞∑ n=1 (−1)n n2+3n−1 (3n−2)2 ; (b) ∞∑ n=1 (−1)n−1 3n4−3n3+9n−1 (5n3−2)·4n . Řešení. Případ (a). Z toho, že je lim n→∞ n2+3n−1 (3n−2)2 = lim n→∞ n2 9n2 = 1 9 ̸= 0, ihned vyplývá neexistence limity 4. MOCNINNÉ ŘADY Protože jsou všechny závorky v součinech menší než jedna, dostáváme také un(x) < vn(x) = n∑ j=0 1 j! xj . Podívejme se nyní na formální nekonečný součet (5.11) ∞∑ j=0 cj = ∞∑ j=0 1 j! xj tj. vn(x) je právě součet prvních n členů v tomto formálním nekonečném výrazu. Podíl dvou po sobě jdoucích členů v řadě je cj+1 /cj = x/(n + 1). Pro každé pevné x tedy existuje N ∈ N takové, že cj+1 /cj < 1/2 pro všechny j ≥ N. Pro takto velké j je ovšem cj+1 < 1 2 cj < 2−(j−N+1) cN . To ale znamená, že částečné součty prvních n členů v našem formálním součtu jsou shora ohraničeny součty vn < N−1∑ j=0 1 j! xj + 1 N! xN n−N∑ j=0 1 2j . Protože pro každé q platí (1−q)(1+q+· · ·+qk ) = 1−qk+1 , můžeme hodnoty vn také odhadnout vn < N−1∑ j=0 1 j! xj + 2 N! xN (1 − 2−n+N−1 ) Limita výrazů na pravé straně pro n jdoucí do nekonečna proto jistě existuje a proto existuje i limita rostoucí posloupnosti vn. Nyní si prohlédněme pozorněji posloupnost čísel un, jejíž limitou je ex . Budeme uvažovat n > N pro nějaké pevné N (hodně velké) a zvolíme si k < N pevné (docela malé). Pak pro dostatečně velká N umíme součet prvních k členů ve vyjádření uN v (5.10) aproximovat libovolně přesně výrazem vk. Protože je tato část součtu uN ostře menší než uN samotné, musí posloupnost un konvergovat k téže limitě jako poslounost vn. Dokázali jsme tedy: Mocninná řada pro ex Věta. Exponenciální funkce je pro každé x ∈ R vyjádřena jako limita částečných součtů ve výrazu ex = 1 + x + 1 2! x2 + · · · + 1 n! xn + · · · = ∞∑ n=0 1 n! xn . 5.43. Číselné řady. Při dovození mimořádně důležitého tvrzení o funkci ex jsme mimoděk pracovali s několika užitečnými pojmy a nástroji. Sformulujeme si je nyní obecněji: 242 5. ŘADY lim n→∞ ( (−1)n n2+3n−1 (3n−2)2 ) . Řada tudíž nekonverguje (není splněna nutná podmínka konvergence). Případ (b). Viděli jsme, že při použití podílového (nebo odmocninového) kritéria polynomy v čitateli ani jmenovateli členů řady neovlivňují hodnotu počítané limity. Uvažujme tedy řadu ∞∑ n=1 (−1)n−1 1 4n , pro kterou je lim n→∞ an+1 an = 1 4 < 1. To ovšem znamená, že rovněž původní řada je (absolutně) konver- gentní. 5.99. Konverguje řada ∞∑ n=1 (−1)n+1 arctg 2√ 3n ? Řešení. Posloupnost { 2/ √ 3n } n∈N je zřejmě klesající a funkce y = arctg x rostoucí (na celé reálné ose), a tudíž posloupnost{ arctg ( 2/ √ 3n )} n∈N je klesající. Je tedy zadána alternující řada splňující, že posloupnost absolutních hodnot jejích členů je klesající. Taková alternující řada konverguje, právě když posloupnost jejích členů konverguje k 0 (tzv. Leibnizovo kritérium), což je ovšem splněno: lim n→∞ arctg 2√ 3n = arctg 0 = 0, tj. lim n→∞ ( (−1)n+1 arctg 2√ 3n ) = 0. 5.100. Zjistěte, jestli řada (a) ∞∑ n=1 sin n n2 ; (b) ∞∑ n=1 cos(πn) 3√ n2 konverguje absolutně, příp. neabsolutně (relativně), nebo nekonver- guje. Řešení. Případ (a). Ukázat, že tato řada konverguje absolutně, je snadné. Např. je ∞∑ n=1 sin n n2 ≤ ∞∑ n=1 1 n2 < ∞∑ n=0 1 2n = 2, přičemž druhou nerovnost jsme dokázali dříve. Případ (b). Je vidět, že cos (πn) = (−1)n , n ∈ N. Máme tedy alternující řadu, jejíž posloupnost členů v absolutní hodnotě je klesající. Proto z limity CHAPTER 5. ZŘÍZENÍ ZOO Číselné nekonečné řady Definice. Nekonečná řada čísel je výraz ∞∑ n=0 an = a0 + a1 + a2 + · · · + ak + . . . , kde an jsou reálná nebo komplexní čísla. Posloupnost částečných součtů je dána svými členy sk = ∑k n=0 an a říkáme, že řada konverguje a je rovna s, jestliže existuje konečná limita částečných součtů s = lim k→∞ sn. Jestliže posloupnost částečných součtů řady má nevlastní limitu, říkáme že řada diverguje k ∞ nebo −∞. K tomu, aby posloupnost částečných součtů sn konvergovala, je nutné a stačí, aby byla Cauchyovská. Tzn. že |sm − sn| = |an+1 + · · · + am| musí být libovolně malé pro dostatečně velká m > n. Protože je |an+1| + · · · + |am| > |an+1 + · · · + am|, vyplývá z konvergence řady ∑∞ k=0 |an| i konvergence řady∑∞ k=0 an. Absolutně konvergentní řady Říkáme, že řada ∑∞ k=0 an konverguje absolutně, jestliže konverguje řada ∑∞ n=0 |an|. Absolutní konvergenci jsme zavedli, protože se často daleko snadněji ověřuje, zároveň ale následující věta ukazuje, že se v případě aboslutně konvergentních řad i jednoduché algebraické operace chovají všechny velice dobře: 5.44. Věta. Nechť S = ∑∞ n=0 an a T = ∑∞ n=0 bn jsou dvě absolutně konvergentní řady. Pak (1) jejich součet absolutně konverguje k součtu S + T = ∞∑ n=0 an + ∞∑ n=0 bn = ∞∑ n=0 (an + bn), (2) jejich rozdíl absolutně konverguje k rozdílu S − T = ∞∑ n=0 an − ∞∑ n=0 bn = ∞∑ n=0 (an − bn), (3) jejich součin absolutně konverguje k součinu S · T = ( ∞∑ n=0 an ) · ( ∞∑ n=0 bn ) = ∞∑ n=0 ( n∑ k=0 an−kbk ) . 243 lim n→∞ 1 3√ n2 = 0 již plyne, že řada konverguje. Zároveň však je ∞∑ n=1 cos(πn) 3√ n2 = ∞∑ n=1 1 3√ n2 ≥ ∞∑ n=1 1 n = +∞. Řada tak konverguje neabsolutně. 5.101. Ukažte, že tzv. harmonická řada ∞∑ i=1 1 i diverguje. Řešení. Pro libovolné přirozené k je součet prvních 2k členů řady větší než k/2: 1 + 1 2 > 1 2 + 1 3 + 1 4 > 1 4 + 1 4 = 1 2 + 1 5 + 1 6 + 1 7 + 1 8 > 1 8 + 1 8 + 1 8 + 1 8 = 1 2 + . . . , součet členů od 2l + 1 do 2l+1 je totiž vždy větší než 2l -krát (jejich počet) číslo 1/2l (nejmenší z nich), což je dohromady 1/2. 5.102. Rozhodněte o následujících řadách, jestli konvergují či diver- gují: i) ∞∑ n=1 2n n ii) ∞∑ n=1 1√ n iii) ∞∑ n=1 1 n·2100000 iv) ∞∑ n=1 1 (1+i)n Řešení. i) Budeme zkoumat konvergenci podílovým kritériem: lim n→∞ an+1 an = lim n→∞ 2n+1 n+1 2n n = lim n→∞ 2(n + 1) n = 2 > 1, řada tedy diverguje. ii) Odhadneme řadu ze spodu: víme, že pro libovolné přirozené n platí 1 n ≤ 1√ n . Pro posloupnost částečných součtů sn zkoumané řady a posloupnost částečných součtů harmonické řady s′ n tedy platí: sn = n∑ i=1 1 √ n ≥ n∑ i=1 1 n = s′ n . A protože harmonická řada diverguje (viz předchozí příklad), diverguje i její posloupnost částečných součtů {s′ n }∞ n=1, tedy diverguje i posloupnost částečných součtů {sn}∞ n=1, tedy diverguje i zadaná posloupnost. iii) Diverguje, jedná se o násobek harmonické řady. 4. MOCNINNÉ ŘADY Důkaz. První i druhé tvrzení jsou bezprostředním důsledkem obdobných vlastností limit. Třetí tvrzení vyžaduje větší pozornost. Označme si cn = n∑ k=0 an−kbk. Z předpokladů a podle pravidel pro limitu součinu posloupností dostáváme ( k∑ n=0 an ) · ( k∑ n=0 bn ) → ( ∞∑ n=0 an ) · ( ∞∑ n=0 bn ) . Máme tedy dokázat, že 0 = lim k→∞ (( k∑ n=0 an ) · ( k∑ n=0 bn ) − k∑ n=0 ck ) . Porovnejme si nyní výrazy ( k∑ n=0 an ) · ( k∑ n=0 bn ) = ∑ 0≤i,j≤k aibj , cn = ∑ i+j=n 0≤i,j≤k aibj , k∑ n=0 cn = ∑ i+j≤k 0≤i,j≤k aibj . Dostáváme tedy odhad ( k∑ n=0 an ) · ( k∑ n=0 bn ) − k∑ n=0 cn = ∑ i+j>k 0≤i,j≤k aibj ≤ ∑ i+j>k 0≤i,j≤k |aibj |. K odhadu posledního výrazu nám poslouží jednoduchý trik: aby mohl být součet idexů větší než k, musí být alespoň jeden z nich větší než k/2. Jistě tedy výraz nezmenšíme, když do něj přidáme více členů, tj. vezmeme všechny jako v součinu a odebereme pouze ty, u kterých jsou oba nejvýše k/2. ∑ i+j>k 0≤i,j≤k |aibj | ≤ ∑ 0≤i,j≤k |aibj | − ∑ 0≤i,j≤k/2 |aibj |. Oba výrazy v rozdílu jsou ale částečné součty pro součin S · T , mají tedy také stejnou limitu a proto jejich rozdíl jde k nule. Další věta uvádí podmínky, pomocí kterých umíme ověřit konvergenci řad. 5.45. Věta. Nechť S = ∑∞ n=0 an je nekonečná řada reálných nebo komplexních čísel. (1) Jestliže S konverguje, pak limn→∞ an = 0. (2) Předpokládejme, že existuje limita podílů po sobě jdoucích členů řady a platí lim n→∞ an+1 an = q. Pak řada S konverguje absolutně při |q| < 1 a nekonverguje při |q| > 1. Při |q| = 1 může řada konvergovat ale nemusí. 244 5. ŘADY iv) Jedná se o geometrickou řadu s koeficientem 1 1+i , ta bude konvergovat, bude-li absolutní hodnota koeficientu menší než 1. Víme, že | 1 1 + i | = | 1 − i 2 | = | 1 2 − 1 2 i| = √ 1 4 + 1 4 = √ 2 2 < 1, řada tedy konverguje a umíme ji dokonce sečíst: ∞∑ n=1 1 (1 + i)n = 1 1 − 1 1+i = 1 + i i = 1 − i. 5.103. Do čtverce o délce strany a > 0 je vepsán čtverec, jehož strany jsou spojnicemi středů stran zadaného čtverce. Do vepsaného čtverce je stejným způsobem vepsán další čtverec atd. Stanovte součet obsahů a součet obvodů všech těchto (nekonečně mnoha) čtverců. 5.104. Nechť je dána posloupnost řádků půlkruhů, přičemž v n-tém řádku je 2n půlkruhů o poloměru 2−n pro každé n ∈ N. Jaký bude obsah libovolného obrazce složeného ze všech těchto půlkruhů, když nebudou umístěny přes sebe? 5.105. Vyřešte rovnici 1 − tg x + tg2 x − tg3 x + tg4 x − tg5 x + · · · = tg 2x tg 2x+1 . 5.106. Vyčíslete ∞∑ n=1 ( 1 2n−1 + 2 3n−1 ) . 5.107. Sečtěte ∞∑ n=1 5n √ n2 + 2n + 1. 5.108. Dokažte konvergenci a nalezněte součet řady ∞∑ n=1 3n+2n 6n . 5.109. Stanovte součet řady (a) ∞∑ n=1 2n−1 2n ; (b) ∞∑ n=0 n+1 3n . 5.110. Sečtěte 1 1·3 + 1 3·5 + 1 5·7 + · · · = ∞∑ n=1 1 (2n−1)(2n+1) . 5.111. Pomocí rozkladu na parciální zlomky vyčíslete (a) ∞∑ n=2 1 n2−1 ; (b) ∞∑ n=1 1 n3+3n2+2n . 5.112. Sečtěte konvergentní řadu CHAPTER 5. ZŘÍZENÍ ZOO (3) Jestliže existuje limita lim n→∞ n √ |an| = q, pak při q < 1 řada konverguje absolutně, zatímco při q > 1 diverguje. Je-li q = 1, může konvergovat i diver- govat. Důkaz. (1) Jestliže limn→∞ an neexistuje nebo je nenulová, exituje pro dostatečně malé číslo ϵ > 0 nekonečně mnoho členů ak s |ak| > ϵ. Zároveň tedy musí mezi nimi existovat nekončeně mnoho kladných nebo nekonečně mnoho záporných. Pak ovšem při přidání kteréhokoliv z nich do částečného součtu dostáváme rozdíl dvou po sobě jdoucích sn a sn+1 o velikosti alespoň ϵ. Posloupnost částečných součtů proto nemůže být Cauchyovská a tedy ani konvergentní. (2) Protože chceme dokazovat absolutní konvergenci, můžeme rovnou předpokládat ai > 0. Důkaz jsme pro speciální hodnotu q = 1/2 provedli při dovození hodnoty ex pomocí řady. Uvažme nyní q < r < 1 pro nějaké reálné r. Z existence limity podílů dovodíme pro všechna j větší než dostatečně veliké N aj+1 < r · aj ≤ r(j−N+1) aN . To ale znamená, že částečné součty sn jsou pro velká n > N shora ohraničeny součty sn < N∑ j=0 aj + aN n−N∑ j=0 rj = N∑ j=0 aj + 1 − rn−N+1 1 − r . Protože 0 < r < 1, je množina všech částečných součtů shora ohraničená rostoucí posloupnost a proto je její limitou její supremum. Při hodnotě q > r > 1 použijeme obdobný postup, ale z existence limity podílu q hned na začátku odvodíme aj+1 > r · aj ≥ r(j−N+1) aN . To ale znamená, že částečné součty prvních sn jsou zdola ohraničeny součty sn > N∑ j=0 aj + aN n−N∑ j=0 rj . Při r > 1 tento výraz poroste s rostoucím n nad všechny meze a proto ani naše řada nemůže konvergovat. (3) Důkaz je zde velmi podobný předchozímu případu. Z existence limity q < 1 vyplývá, že pro každé q < r < 1 existuje N takové, že pro všechny n > N platí n √ |an| < r. Umocněním pak dostáváme |an| < rn , takže jsme opět v situaci, kdy srovnáváme s geometrickou řadou. Důkaz se proto dokončí stejně jako v případě podílového testu. V důkazu druhého i třetího tvrzení jsme využívali slabšího tvrzení, než je existecne limity. Potřebovali jsme pro studované posloupnosti nezáporných výrazů pouze tvrzení, že od určitého indexu už budou větší nebo menší než dané číslo. 245 ∞∑ n=0 1 4n2−1 . 5.113. Určete součet řady ∞∑ n=1 1 n2+3n . 5.114. V závislosti na s := ∞∑ n=1 (−1)n−1 n = 1 − 1 2 + 1 3 − 1 4 + 1 5 − 1 6 + 1 7 − 1 8 + · · · vyjádřete součty řad ( 1 − 1 2 − 1 4 ) + (1 3 − 1 6 − 1 8 ) + · · · ; ( 1 + 1 3 − 1 2 ) + (1 5 + 1 7 − 1 4 ) + · · · , které z výše uvedené řady vznikly přerovnáním (tj. změnou pořadí členů). 5.115. Zjistěte, zda řada ∞∑ n=0 2n+(−2)n 5n konverguje. 5.116. Dokažte následující tvrzení: Jestliže řada ∑∞ n=0 an konverguje, pak je lim n→∞ sin (3an + π) = 0. 5.117. Pro jaké hodnoty α ∈ R; β ∈ Z; γ ∈ R {0} řady ∞∑ n=120 e−αn n ; ∞∑ n=240 βn·n! nn ; ∞∑ n=360 n γ n konvergují? 5.118. Rozhodněte, zda řada ∞∑ n=21 (−1)n n8−5n6+2n 2n konverguje absolutně, konverguje neabsolutně (relativně), nebo nekon- verguje. 5.119. Zjistěte, jestli je limita lim n→∞ ( 1 n2 + 2 n2 + · · · + n−1 n2 ) vlastní. Upozorněme, že k tomu nelze využít součtů ∞∑ n=1 1 n2 = π2 6 , ∞∑ n=2 n−1 n2 = +∞. 5.120. Najděte všechna reálná čísla A ≥ 0, pro která řada ∞∑ n=1 (−1)n ln ( 1 + A2n ) konverguje. 5.121. Zopakujme, že harmonická řada diverguje; tj. platí ∞∑ n=1 1 n = +∞. Rozhodněte, zda také řada 4. MOCNINNÉ ŘADY K takovému odhadu nám ale postačí pro danou posloupnost bn uvažovat s každým indexem n supremum hodnot členů s indexy vyššími. Tato suprema vždy existují a budou tvořit nerostoucí posloupnost. Její infimum pak označujeme jako limes superior dané posloupnosti a značíme lim sup n→∞ bn. Výhodou je, že limes superior vždy existuje, můžeme proto předchozí výsledek (aniž bychom měnili důkaz) přeformulovat v silnější podobě: Důsledek. Nechť S = ∑∞ n=0 an je nekonečná řada reálných nebo komplexních čísel. (1) Je-li q = lim sup n→∞ an+1 an , pak řada S konverguje absolutně při q < 1 a nekonverguje při q > 1. Při q = 1 může řada konvergovat ale nemusí. (2) Je-li q = lim sup n→∞ n √ |an|, pak při q < 1 řada konverguje absolutně, zatímco při q > 1 diverguje. Je-li q = 1, může konvergovat i diver- govat. 5.46. Mocninné řady. Jestliže máme místo posloupnosti čísel an k dispozici posloupnost funkcí fn(x) se stejným definičním oborem A, můžeme bod po bodu použít definici součtu číselné řady a dostáváme pojem součtu řady funkcí S(x) = ∞∑ n=0 fn(x). Konvergence mocninné řady Mocninná řada je dána výrazem S(x) = ∞∑ n=0 anxn . Řekneme, že S(x) má poloměr konvergence ρ ≥ 0, jestliže S(x) konverguje pro každé x splňující |x| < ρ a diverguje při |x| > ρ. 5.47. Vlastnosti mocninných řad. Ačkoliv na podstatnou část důkazu následující věty si budeme muset počkat až na konec příští kapitoly, zformulujeme si základní vlastnosti mocninných řad hned: 246 5. ŘADY 1 1 + · · · + 1 9 + 1 11 + · · · + 1 19 + 1 21 + · · · + 1 29 + · · · · · · + 1 91 + · · · + 1 99 + 1 111 + · · · + 1 119 + 1 121 + · · · diverguje. 5.122. Udejte příklad divergentních číselných řad ∑∞ n=1 an, ∑∞ n=1 bn s kladnými členy, pro které řada ∑∞ n=1 (3an − 2bn) absolutně konver- guje. 5.123. Zjistěte, zda jednotlivé řady ∞∑ n=1 (−1)n (n!)2 (2n)! ; ∞∑ n=1 (−1)n n7−n4+n n8+2n6+n konvergují absolutně, konvergují neabsolutně, či nekonvergují. 5.124. Konverguje řada ∞∑ n=1 (−1)n+1 3√ n+ 5√ n+1 n+ 5√ n ? 5.125. Nalezněte hodnoty parametru p ∈ R, pro které řada ∞∑ n=1 (−1)n sinn p n konverguje. 5.126. Určete poloměr konvergence r mocninné řady ∞∑ n=0 22n·n! (2n)! xn . 5.127. Stanovte poloměr konvergence pro ∑∞ n=1 2 √ n xn . 5.128. Bez počítání uveďte poloměr konvergence mocninné řady ∞∑ n=1 5 n·3n−1 xn−1 . 5.129. Nalezněte obor konvergence mocninné řady ∞∑ n=1 √ n+1 3 √ n xn . 5.130. Určete, pro jaká x ∈ R řada ∞∑ n=1 (−3)n √ n4+2n3+111 (x − 2)n konverguje. 5.131. Je pro libovolnou posloupnost reálných čísel {an}∞ n=0 poloměr konvergence mocninných řad ∞∑ n=0 an xn , ∞∑ n=1 an−1 n xn stejný? 5.132. Rozhodněte o platnosti implikací: (a) Pokud existuje vlastní limita lim n→∞ 3n √ a2 n, pak mocninná řada ∞∑ n=1 an(x − x0)n konverguje absolutně alespoň ve dvou různých bodech x. CHAPTER 5. ZŘÍZENÍ ZOO Absolutní konvergence a diferencování člen po členu Věta. Nechť S(x) = ∑∞ n=0 anxn je mocninná řada a existuje limita ρ = lim n→∞ n √ |an|. Pak je poloměr konvergece řady S roven r = ρ−1 . Mocninná řada S(x) konverguje na na celém svém intervalu konvergence absolutně a je na něm spojitá (včetně krajních bodů, pokud v nich konverguje také) a existuje její derivace, S′ (x) = ∞∑ n=1 nanxn−1 . Důkaz. Pro ověření absolutní konvergence řady můžeme pro každou pevnou hodnotu x použít odmocninový test z věty 5.45(3). Počítáme přitom lim n→∞ n √ |anxn| = ρx a řada konverguje abosultně, resp. diverguje, jestliže je tato limita různá od 1. Odtud plyne, že skutečně konverguje pro |x| < r a diverguje pro |x| > r. Tvrzení o spojitosti a derivaci dokážeme později v obecnějším kontextu, viz ??–??. Všimněme si také, že můžeme při důkazu konvergence použít silnější variantu odmocninového testu a tedy lze poloměr konvergence r pro každou mocninnou řadu přímo zadat fomulí r−1 = lim sup n→∞ n √ |an|. 5.48. Poznámky. Pokud koeficienty řady velmi rychle rostou, např. an = nn , pak je r−1 = ∞, tj. poloměr konvergence je nula. Skutečně taková řada pak konverguje pouze v jediném bodě x = 0. Podíváme se na konvergenci mocninných řad S(x) = ∞∑ n=0 xn , T (x) = ∞∑ n=1 1 n xn včetně krajních bodů příslušného intervalu. První příklad je geometrická řada, kterou jsme se zabývali již dříve, a její součet je pro všechny x s |x| < 1 S(x) = 1 1 − x , zatímco |x| > 1 zaručuje divergenci. Pro x = 1 dostáváme také zjevně divergentní řadu 1 + 1 + 1 + . . . s nekonečným součtem, při x = −1 jde o řadu 1−1+1−. . . , jejíž částečné součty nemají limitu vůbec. 247 (b) Z neabsolutní konvergence řad ∑∞ n=1 an, ∑∞ n=1 bn plyne, že rovněž řada ∑∞ n=1(6an − 5bn) konverguje. (c) Jestliže pro číselnou řadu ∑∞ n=0 an je lim n→∞ a2 n = 0, pak tato řada konverguje. (d) Pokud řada ∑∞ n=1 a2 n konverguje, potom řada ∞∑ n=1 an n konverguje absolutně. 5.133. Vyčíslete cos π 10 s chybou menší než 10−5 . 5.134. Pro konvergentní řadu ∞∑ n=0 (−1)n √ n+100 odhadněte chybu aproximace jejího součtu částečným součtem s9 999. 5.135. Bez počítání derivací uveďte Taylorův polynom 4. stupně se středem v bodě x0 = 0 funkce f (x) = cos x − 2 sin x − ln (1 + x) , x ∈ (−1, 1). Poté rozhodněte, zda je graf funkce f v okolí bodu [0, 1] nad tečnou, pod tečnou. 5.136. Rozviňte funkci y = 1 3−2x , x ∈ ( −3 2 , 3 2 ) v Taylorovu řadu se středem v počátku. 5.137. Funkci y = ex definovanou na celé reálné přímce vyjádřete jako nekonečný polynom se členy tvaru an(x − 1)n a funkci y = 2x definovanou na R vyjádřete jako nekonečný polynom se členy anxn . 5.138. Nalezněte funkci f , k níž pro x ∈ R konverguje posloupnost funkcí fn(x) = n2x3 n2x2+1 , n ∈ N. Je tato konvergence stejnoměrná na R? 5.139. Konverguje řada ∞∑ n=1 n x n4+x2 , kde x ∈ R, stejnoměrně na celé reálné ose? 5.140. Z Taylorova rozvoje se středem v počátku funkce y = sin x získejte pomocí derivace Taylorův rozvoj funkce y = cos x. 5.141. Odhadněte (a) kosinus deseti stupňů s přesností alespoň 10−5 ; (b) určitý integrál ∫ 1/2 0 dx x4+1 s přesností alespoň 10−3 . 5.142. Určete mocninný rozvoj se středem v bodě x0 = 0 funkce 4. MOCNINNÉ ŘADY Věta 5.45(2) ukazuje, že poloměr konvergence druhého příkladu je také jedna, protože existuje lim n→∞ 1 n+1 xn+1 1 n xn = x lim n→∞ n n + 1 = x Pro x = 1 tu dostaneme divergentní řadu 1 + 1 2 + 1 3 + . . . , protože umíme odhadnout částečné součty tak, že vždy postupně pro k = 1, 2, 3, . . . , sečteme 2k−1 po sobě jdoucích členů 1/2k−1 , . . . , 1/(2k − 1) a nahradíme všechny 2−k . Do spodního odhadu tedy každá taková část přispěje 1/2 a odhad tedy roste nad všechny meze. Naopak, řada T (−1) = −1 + 1 2 − 1 3 + . . . konverguje. Vyplývá to z obecnějšího platného tvrzení, které ukážeme až v příští kapitole. 5.49. Komplexní exponenciála a goniometrické funkce. S mocninnými řadami nám do našeho společenství funkcí přibyla spousta nových příkladů hladkých funkcí, tj. funkcí libovolněkrát diferencovatelných na celém svém definičním oboru. Podobně jako polynomy mají všechny tyto přírůstky do zvěřince navíc vlastnost, že jsou ve skutečnosti zadány vztahem, který definuje funkci C → C. Skutečně, naše úvahy o absolutní konvergenci jsou bezezbytku platné i pro komplexní číselné řady. Proto mocninné řady budou na celém kruhu v komplexní rovině se středem v počátku a poloměrem r představovat konvergentní číselné řady komplexních čísel. Pohrejme si chvíli s nejvýznamnějším a prvním naším příkladem, exponenciálou ex = 1 + x + 1 2 x2 + · · · + 1 n! xn + . . . . Tato mocninnná řada má poloměr konvergence nekonečný a dobře proto definuje hladkou funkci pro všechna komplexní čísla x. Její hodnoty jsou limitami hodnot (komplexních) polynomů s reálnými koeficienty a každý polynom je zcela určený konečně mnoha svými hodnotami. Zejména tedy jsou hodnoty mocninných řad i v komplexním oboru zcela určeny jejich hodnotami na reálných argumentech x. Proto i pro komplexní exponenciálu musí platit i obvyklé vztahy, které jsme pro reálné hodnoty proměnné x již odvodili. Zejména tedy platí ex+y = ex · ey , viz vztah (5.5) a věta 5.44(3). Dosaďme si hodnoty x = i · t, kde i ∈ C je imaginární jednotka, t ∈ R libovolné. eit = 1 + it − 1 2 t2 − i 1 3! t3 + 1 4! t4 + i 1 5! t5 − . . . a zjevně tedy je komplexně konjugované číslo k z = eit číslo ¯z = e−it . Proto |z|2 = z · ¯z = eit · e−it = e0 = 1 a všechny hodnoty z = eit leží na jednotkové kružnici v komplexní rovině. 248 5. ŘADY f (x) = x∫ 0 et2 dt, x ∈ R. 5.143. Najděte analytickou funkci, jejíž Taylorova řada je x − 1 3 x3 + 1 5 x5 − 1 7 x7 + · · · , přičemž x ∈ [−1, 1]. 5.144. Ze znalosti součtu geometrické řady odvoďte Taylorovu řadu funkce y = 1 5+2x se středem v počátku. Poté určete její poloměr konvergence. 5.145. Užitím integrálního kritéria nalezněte hodnoty a > 0, pro které řada ∞∑ n=1 1 na konverguje. 5.146. Pro jaká x ∈ R řada ∞∑ n=1 ln(n!) nx konverguje? 5.147. Rozhodněte, zda řada ∞∑ n=1 (−1)n−1 tg 1 n √ n konverguje absolutně, příp. relativně, nebo zda diverguje k +∞, resp. k −∞, či nic z toho (říkáme, že osciluje). 5.148. Stanovte součet číselné řady ∞∑ n=1 1 n·3n pomocí součtu vhodné mocninné řady. 5.149. Pro x ∈ (−1, 1) sečtěte x − 4x2 + 9x3 − 16x4 + · · · 5.150. Je-li | x | < 1, určete součet řady (a) ∞∑ n=1 1 2n−1 x2n−1 ; (b) ∞∑ n=1 n2 xn−1 . 5.151. Spočtěte ∞∑ n=1 2n−1 (−2)n−1 pomocí součtu mocninné řady ∞∑ n=0 (−1)n (2n + 1) x2n pro jisté x ∈ (−1, 1). 5.152. Pro x ∈ R sečtěte řadu CHAPTER 5. ZŘÍZENÍ ZOO Reálné a imaginární složky bodů na jednotkové kružnici jsme popisovali pomocí goniometrických funkcí cos θ a sin θ, kde θ je patřičný úhel. Derivací parametrického popisu bodů kružnice, t → eit dostáváme vektory „rychlostí“, které budou dány výrazem (pokud zatím nevěříme derivování mocninných řad člen po členu, lze také zderivovat zvlášť reálnou a imaginární složku) t → ( eit )′ = i · eit a jejich velikost proto také bude pořád jednotková. Odtud lze tušit, že celou kružnici oběhneme po dosažení hodnoty parametru rovného délce oblouku, tj. 2π (i když k pořádné definici délky křivky budeme potřebovat integrální počet). Tímto postupem skutečně definujeme Ludolfovo číslo π — je to délka poloviny jednotkové kružnice v euklidovském R2 . Můžeme se ale nyní aspoň částečně ujistit pohledem na nejmenší kladné kořeny reálné části částečných součtů naší řady, tj. příslušných polynomů. Již při řádu deset nám vyjde číslo π přesně na 5 desetinných míst. Dostali jsem tedy přímou definici goniometrických funkcí pomocí mocninných řad: cos t = re eit = 1 − 1 2 t2 + 1 4! t4 − 1 6! t6 + · · · + (−1)k 1 (2k)! t2k + . . . sin t = im eit = t − 1 3! t3 + 1 5! t5 − 1 7! t7 + · · · + (−1)k 1 (2k + 1)! t2k+1 + . . . Ilustraci konvergence řady pro funkci cos je vidět na obrázku. Jde o graf příslušného polynomu stupně 68. Při postupném vykreslení částečných součtů je vidět, že aproximace v okolí nuly je velice dobrá a prakticky beze změn. S rostoucím řádem se pak zlepšuje i dále od počátku. y t~ 1,5 30 1 0,5 20 0 -0,5 10 -1 -1,5 0-10-20-30 Přímo z definice vyplývá známý vztah eit e−it = sin2 t + cos2 t = 1 a také z derivace (eit )′ = i eit vidíme, že (sin t)′ = cos t, (cos t)′ = − sin t. Tento výsledek lze samozřejmě ověřit přímo derivací našich řad člen po členu. 249 ∞∑ n=0 1 2n·n! x3n+1 . 6. Mocninné řady V předchozí podkapitole jsme zkoumali, jestli lze přiřadit smysl součtu nekonečně mnoha čísel. Nyní se budeme zajímat o to, jaký může mít význam součet nekonečně mnoha funkcí. Pokud se omezíme 5.153. Určete poloměr konvergence následujících mocninných řad: i) ∞∑ n=1 2n n xn ii) ∞∑ n=1 1 (1+i)n xn Řešení. i) r = 1 lim sup n→∞ an+1 an = 1 2 , viz úloha ??. Daná mocniná řada tedy konverguje pro reálná x ∈ (−1 2 , 1 2 ), případně pro komplexní |x| < 1 2 . Všimněme si, že řada je divergentní pro x = 1 2 (jde o harmonickou řadu) a naopak konverguje pro x = −1 2 (alternující harmonická řada). Rozhodnout o konvergenci pro libovoné x ležící v komplexní rovině na kružnici o poloměru 1 2 je těžší otázka a přesahuje rámec našeho kurzu. ii) Opět díky přechozímu příkladu víme, že lim sup n→∞ n √ 1 (1 + i)n = lim sup n→∞ 1 1 + i = √ 2 2 . je tedy poloměr konvergence dané mocninné řady r = √ 2. 5.154. Sečtěte: 2 + 1 + 2 2! + 1 3! + 2 4! + 1 5! + 2 6! + · · · Řešení. Porovnáme-li tvar součtu s rozvojem funkcí sinh a cosh do mocninných řad, dostáváme výsledek sinh(1) + 2 cosh(1) . 4. MOCNINNÉ ŘADY Označme t0 nejmenší kladné číslo, pro které je e−it0 = − eit0 , tj. první kladný nulový bod funkce cos t. Podle naší definice Ludolfova čísla je t0 = 1 2 π. Pak kvadrát této hodnoty je ei2t0 = e−i2t0 = (e−it0 )2 a jde tedy o nulový bod funkce sin t. Samozřejmě přitom platí pro libovolné t ei(4kt0+t) = (eit0 )4k · eit = 1 · eit . Jsou tedy obě goniometrické funkce sin a cos periodické s periodou 2π. Z našich definic je přitom vidět, že je to nejmenší jejich perioda. Nyní můžeme snadno odvodit všechny obvyklé vztahy mezi goniometrickými funkcemi. Uvedeme na ukázku několik z nich. Nejprve si všimněme, že definice vlastně říká cos t = 1 2 (eit + e−it )(5.12) sin t = 1 2i (eit − e−it ).(5.13) Součin těchto funkcí jde tedy vyjádřit jako sin t cos t = 1 4i (eit − e−it )(eit + e−it ) = 1 4i (ei2t − e−i2t ) = 1 2 sin 2t. Dále můžeme využít naši znalost derivací: cos 2t = ( 1 2 sin 2t)′ = (sin t cos t)′ = cos2 t − sin2 t. Vlastnosti dalších goniometrických funkcí tg t = sin t cos t , cotg t = (tg t)−1 se snadno odvodí z jejich definice a pravidel pro derivování. Grafy funkcí sinus, cosinus, tangens a cotangens jsou na obrázcích (postupně červený a zelený vlevo, červený a zelený vpravo): 1 x 0,5 0 10-5 -0,5 5 -1 0-10 x 3210-1-2 y -3 10 5 0 -5 -10 Cyklometrické funkce jsou inverzní ke goniometrickým. Protože jsou goniometrické funkce všechny periodické s periodou 2π, jsou jejich inverze definované vždy jen v rámci jedné periody a to ještě jen na části, kdy je daná funkce buď rostoucí nebo klesající. Jsou to funkce arcsin = sin−1 250 6. MOCNINNÉ ŘADY 5.155. Určete poloměr konvergence r mocninné řady (a) ∞∑ n=1 (−1)n+1 n·8n xn ; (b) ∞∑ n=1 (−4n)n xn ; (c) ∞∑ n=1 ( 1 + 1 n )n2 xn ; (d) ∞∑ n=1 n5 (2+(−1)n)n xn . Řešení. Platí (a) lim n→∞ n √ | an | = lim n→∞ 1 n√ n·8 = 1 8 ; (b) lim n→∞ n √ | an | = lim n→∞ 4n = +∞; (c) lim n→∞ n √ | an | = lim n→∞ ( 1 + 1 n )n = e; (d) lim sup n→∞ n √ | an | = lim sup n→∞ n√ n5 2+(−1)n = lim sup n→∞ ( n√ n )5 2+(−1)n = 1. Proto je poloměr konvergence (a) r = 8, (b) r = 0, (c) r = 1/e, (d) r = 1. 5.156. Stanovte poloměr konvergence r mocninné řady ∞∑ n=1 ein 3 √ n3+n·3n 3 √ n4+2n3+1·πn (x − 2)n . Řešení. Poloměr konvergence libovolné mocninné řady se nezmění, pokud posuneme její střed nebo nahradíme koeficienty členů tak, že se nezmění jejich absolutní hodnota. Určeme tedy poloměr konvergence řady ∞∑ n=1 3 √ n3+n·3n 3 √ n4+2n3+1·πn xn . Protože lim n→∞ n √ na = ( lim n→∞ n √ n )a = 1 pro a > 0, můžeme dále přejít k řadě ∞∑ n=1 3n πn xn se stejným poloměrem konvergence r = π/3. 5.157. Nalezněte přibližnou hodnotu čísla sin 1◦ s chybou ostře menší než 10−10 . Řešení. Víme, že je sin x = x − 1 3! x3 + 1 5! x5 − 1 7! x7 + · · · = ∞∑ n=0 (−1)n (2n+1)! x2n+1 , x ∈ R. Dosadíme-li x = π/180, pak částečné součty řady vpravo budou aproximacemi sin 1◦ . Zbývá určit počet členů, které je třeba sečíst, aby chyba byla prokazatelně menší než 10−10 . Číselná řada π 180 − 1 3! ( π 180 )3 + 1 5! ( π 180 )5 − 1 7! ( π 180 )7 + · · · = ∞∑ n=0 (−1)n (2n+1)! ( π 180 )2n+1 CHAPTER 5. ZŘÍZENÍ ZOO s definičním oborem [−1, 1] a oborem hodnot [−π/2, π/2]. Dále arccos = cos−1 s definičním oborem [−1, 1] a oborem hodnot [0, π], viz obrázek vlevo. 3 2 1 0 -1 x 10,50-0,5-1 3 2 1 x 0 -1 1050-5-10 Zbývají ještě funkce (zobrazené na obrázku vpravo) arctg = tg−1 s definičním oborem [−∞, ∞] a oborem hodnot [−π/2, π/2] a konečně arccotg = cotg−1 s definičním oborem [−∞, ∞] a oborem hodnot [0, π]. Velice často se také využívají tzv. hyperbolické funkce sinh x = 1 2 (ex − e−x ), cosh x = 1 2 (ex + e−x ). Název naznačuje, že by funkce mohly mít něco společného s hyperbolou. Přímý výpočet dává (druhé mocniny se v roznásobených dvojčlenech všechny odečtou a zůstanou smíšené členy) (cosh x)2 − (sinh x)2 = 2 1 2 (ex e−x ) = 1. Body [cosh t, sinh t] ∈ R2 tedy skutečně parametricky popisují hyperbolu v rovině. Pro hyperbolické funkce lze snadno odvodit podobné identity jako pro funkce goniometrické. Mimo jiné je přímo z definice snadno vidět (dosazením do vztahů (5.12) a (5.13)) cosh x = cos(ix), i sinh x = sin(ix). 5.50. Poznámky. (1) Jestliže mocninnou řadu S(x) vyjádříme s posunutou hodnotou proměnné x o konstantní posuv x0, dostaneme funkci T (x) = S(x − x0). Jestliže je ρ poloměr konveregence S, bude T dobře definovaná na intervalu (x0 − ρ, x0 + ρ). Říkáme, že T je mocninná řada se středem v x0. Mocninné řady proto můžeme přímo definovat takto: S(x) = ∞∑ n=0 an(x − x0)n , 251 je alternující s vlastností, že posloupnost absolutních hodnot jejích členů je klesající. Pokud libovolnou takovou konvergentní řadu nahradíme jejím částečným součtem, chyba, jíž se tím dopustíme, bude menší než absolutní hodnota prvního členu uvažované řady nezahrnutého do částečného součtu. (Důkaz tohoto tvrzení uvádět nebudeme.) Chyba aproximace sin 1◦ ≈ π 180 − π3 1803·3! je tak menší než π5 1805·5! < 10−10 . 4. MOCNINNÉ ŘADY kde x0 je libovolné pevně zvolené reálné číslo. Všechny naše předchozí úvahy jsou pořád platné, jen je třeba mít na paměti, že se vztahují k bodu x0. Zejména tedy taková řada konverguje na intervalu (x0 − ρ, x0 + ρ), kde ρ je její poloměr konvergence. Dále platí, že má-li mocninná řada y = T (x) hodnoty v intervalu, kde je dobře definována řada S(y), potom i hodnoty funkce S ◦ T jsou vyjádřeny mocninnou řadou, kterou dostaneme formálním dosazením y = T (x) za y do S(y). (2) Jakmile máme k dispozici mocninné řady s obecným středem, lze docela přímočaře počítat koeficienty mocninných řad zadávajících inverzní funkce. Nebudeme zde uvádět seznam formulí, snadno se k nim dostaneme například v Maplu procedurou „series“. Pro ilustraci se podívejme alespoň na dva příklady: Viděli jsme, že ex = 1 + x + 1 2 x2 + 1 6 x3 + 1 24 x4 + . . . . Protože je e0 = 1, budeme hledat pro inverzní funkci ln x mocninnou řadu se středem v x = 1, tj. ln x = a0+a1(x−1)+a2(x−1)2 +a3(x−1)3 +a4(x−1)4 +. . . . Využijeme tedy rovnosti x = eln x a přeskupením koeficientů podle mocnin x dosazením dostaneme: x = a0 + a1 ( x + 1 2 x2 + 1 6 x3 + 1 24 x4 + . . . ) + a2 ( x + 1 2 x2 + . . . )2 + a3 ( x + 1 2 x2 + . . . )3 + . . . = a0 + a1x + ( 1 2 a1 + a2 ) x2 + ( 1 6 a1 + a2 + a3 ) x3 + ( 1 24 a1 + ( 1 4 + 2 6 ) a2 + 3 2 a3 + a4 ) x4 + . . . . Porovnáním koeficientů u stejných mocnin nalevo a napravo a0 = 0, a1 = 1, a2 = − 1 2 , a3 = 1 3 , a4 = − 1 4 , . . . což skutečně odpovídá platnému výrazu (ověříme později): ln x = ∞∑ n=1 (−1)n−1 n (x − 1)n . Podobně si můžeme pohrát s řadou sin t = t − 1 3! t3 + 1 5! t5 − 1 7! t7 + . . . a zatím neznámou řadou pro její inverzi (všimněme si, že počítáme opět se středem v nule, protože je sin 0 = 0) arcsin t = a0 + a1t + a2t2 + a3t3 + a4t4 + . . . . 252 6. MOCNINNÉ ŘADY Řešení cvičení 5.2. P(x) = (−3 5 − 4 5 i)x2 + (2 + 3i)x − 3 5 − 14 5 i. 5.4. x4 + 2x3 − x2 + x − 2. 5.5. x4 + 2x3 − 2x2 + x + 2. 5.6. x4 + 3x3 − 3x2 − x − 1. 5.31. Platí sup A = 6, inf A = −3; sup B = 1 4 , inf B = −1; sup C = 9, inf C = −9. 5.32. Lehce lze ukázat, že sup A = 3 2 , inf A = 0. 5.33. Zřejmě je inf N = 1, sup M = 0, inf J = 0, sup J = 5. 5.34. Lze položit kupř. M := Z N; N := N. 5.35. Uvažte jakoukoli jednoprvkovou množinu X ⊂ R. 5.36. Množina C musí být jednoprvková. Nechť je tedy např. C = {0}. Nyní můžeme zvolit A = (−1, 0), B = (0, 1). 5.37. Pro každé ε > 0 stačí ε-okolí bodu −2 přiřadit δ-okolí bodu 0 předpisem ε → δ, δ = ε, přičemž bez újmy na obecnosti lze požadovat, aby ε ≤ 1. Pokud by totiž bylo ε > 1, lze položit δ = 1. 5.38. Existence limity a rovnost lim x→−1 (1 + x)2 − 3 2 = − 3 2 např. opět plyne z volby δ := ε pro ε ∈ (0, 1). 5.39. Neboť − (x − 2)4 < x pro x < 0, dostáváme 3 (x − 2)4 /2 > −x pro x < 0. 5.40. Platí lim n→∞ ( 1 n2 + 2 n2 + · · · + n − 2 n2 + n − 1 n2 ) = lim n→∞ ( 1 + n − 1 n2 · n − 1 2 ) = 1 2 . 5.41. Snadno lze ukázat, že lim n→∞ √ n3 − 11n2 + 2 + 5 √ n7 − 2n5 − n3 − n + sin2 n 2 − 3 √ 5n4 + 2n3 + 5 = −∞. 5.42. Limita je rovna 1. 5.43. Kupř. lze položit xn := n, yn := −n + 1, n ∈ N. 5.44. Správná odpověď je ±1. CHAPTER 5. ZŘÍZENÍ ZOO Opět dosazením dostáváme t = a0 + a1 ( t − 1 3! t3 + 1 5! t5 + . . . ) + a2 ( t − 1 3! t3 + 1 5! t5 + . . . )2 + . . . = a0 + a1t + a2t2 + ( − 1 6 a1 + a3 ) t3+ ( − 2 6 a2 + a4 ) t4 + ( 1 120 a1 − 3 6 a3 + a5 ) t5 + . . . a proto arcsin t = t + 1 6 t3 + 3 40 t5 + . . . . (3) Všimněme si také, že kdybychom hned zpočátku uvěřili, že funkci ex můžeme napsat jako mocninnou řadu se středem v nule a že se mocninné řady derivují člen po členu, pak bychom snadno obrdrželi diferenční rovnici pro koeficienty an. Víme totiž (xn+1 )′ = (n + 1)xn a proto z našeho požadavku, že exponenciála má mít v každém bodě derivaci rovnou své hodnotě, vyplývá an+1 = 1 n+1 an, a0 = 1 a odtud už je jasné, že an = 1 n! . 253 5.45. Výsledek je lim sup n→∞ an = 1, lim inf n→∞ an = 0. 5.46. Platí lim inf n→∞ ( (−1)n ( 1 + 1 n )n + sin nπ 4 ) = −e − √ 2 2 . 5.47. Neboť lim x→0+ arctg 1 x = π 2 , lim x→0− arctg 1 x = − π 2 , uvažovaná oboustranná limita neexistuje. 5.48. První z limit je rovna +∞, druhá neexistuje. 5.49. Limitu lze spočítat více způsoby. Nabízí se např. lim x→0 tg x − sin x sin3 x = lim x→0 ( tg x − sin x sin3 x · cotg x cotg x ) = lim x→0 1 − cos x cos x · sin2 x = lim x→0 1 − cos x cos x ( 1 − cos2 x ) = lim x→0 1 cos x (1 + cos x) = 1 2 . 5.50. Platí lim x→π/6 2 sin3 x + 7 sin2 x + 2 sin x − 3 2 sin3 x + 3 sin2 x − 8 sin x + 3 = lim x→π/6 sin x + 1 sin x − 1 = −3. 5.51. Je lim x→1 xm − 1 xn − 1 = m n . 5.52. Po rozšíření výrazem √ x2 + x + x √ x2 + x + x lze lehce dostat lim x→+∞ (√ x2 + x − x ) = 1 2 . 5.53. Platí lim x→+∞ ( x √ 1 + x2 − x2 ) = 1 2 . 5.54. Je lim x→0 √ 2 − √ 1 + cos x sin2 x = √ 2 8 . 5.55. Rozšířením zlomku ze zadání je možné obdržet lim x→0 sin (4x) √ x + 1 − 1 = 8. 5.56. Platí lim x→0− √ 1 + tg x − √ 1 − tg x sin x = 1. 4. MOCNINNÉ ŘADY 254 6. MOCNINNÉ ŘADY 5.57. Zřejmě je lim x→−∞ 2x + √ 1 + x2 − x9 − 7x5 + 44x2 3x + 5 √ 6x6 + x2 − 18x5 − 592x4 = 7 18 . 5.58. Výrok není pravdivý. Uvažte kupř. f (x) := 1 x , x ∈ (−∞, 0); g(x) := x, x ∈ R. 5.59. Uvedená funkce je spojitá na celém R. 5.60. V bodech −π, 0, π je spojitá; v bodě 2 je spojitá pouze zprava a v bodě 3 pouze zleva; v bodě 1 není spojitá ani z jedné strany. 5.61. Je nutné položit f (0) := 0. 5.62. Funkce je spojitá právě pro p = 2. 5.63. Správná odpověď je a = 4. 5.64. Limitu lze snadno určit např. pomocí l’Hospitalova pravidla. 5.65. Je lim x→0+ sin8 x x3 = lim x→−∞ sin8 x x3 = 0. 5.66. lim n→∞ ( n n + 5 )2n−1 = e−10 . 5.67. Trojnásobné použití l’Hospitalova pravidla dává lim x→0− sin x − x x3 = − 1 6 . 5.68. 2/π. 5.69. lim x→ π 2 − ((π 2 − x ) tg x ) = 1. 5.70. lim x→+∞ (( 3 1 x − 2 1 x ) x ) = ln 3 2 . 5.71. 1/2. 5.72. Platí lim x→+∞ ( cos 2 x )x2 = e−2 . 5.73. Dvojnásobnou aplikací l’Hospitalova pravidla lze obdržet lim x→0 (1 − cos x)sin x = e0 = 1. 5.74. V obou případech je výsledek eα. 5.103. 2a2; 4a ( 2 + √ 2 ) . 5.104. π/2. 5.105. x = π 6 + kπ, x = 5π 6 + kπ, k ∈ Z. 5.106. 5. 5.107. +∞. 5.108. 3/2. CHAPTER 5. ZŘÍZENÍ ZOO 255 5.109. (a) 3; (b) 9/4. 5.110. 1/2. 5.111. (a) 3/4; (b) 1/4. 5.112. −1/2. 5.113. 11/18. 5.114. s/2; 3s/2 (s = ln 2). 5.115. Konverguje. 5.116. Postačuje uvážit nutnou podmínku konvergence limn→∞ an = 0. 5.117. α > 0; β ∈ {−2, −1, 0, 1, 2}; γ ∈ (−∞, −1) ∪ (1, +∞). 5.118. Konverguje absolutně. 5.119. Limita je rovna 1/2. 5.120. A ∈ [0, 1). 5.121. Součet uvedené řady je konečný – řada konverguje. 5.122. Např. an = n/3, bn = n/2, n ∈ N. 5.123. První řada konverguje absolutně; druhá neabsolutně. 5.124. Ano. 5.125. p ∈ R. 5.126. r = +∞. 5.127. 1. 5.128. 3. 5.129. [−1, 1]. 5.130. x ∈ [ 2 − 1 3 , 2 + 1 3 ] . 5.131. Ano. 5.132. (a) Platí. (b) Neplatí. (c) Neplatí. (d) Platí. 5.133. 1 − π2 102·2 + π4 104·4! . 5.134. Chyba náleží do intervalu (0, 1/200). 5.135. 1 − 3x + 7 24 x4; nad tečnou. 5.136. 1 3 ∑∞ n=0 2n 3n xn . 5.137. ∑∞ n=0 e n! (x − 1)n; ∑∞ n=0 lnn 2 n! xn. 5.138. f (x) = x, x ∈ R; ano. 5.139. Nikoli. 5.140. ∑∞ n=0 (−1)n (2n)! x2n . 5.141. (a) 1 − π2 182·2! + π4 184·4! ; (b) 1 2 − 1 5·25 . 5.142. ∑∞ n=0 1 (2n+1) n! x2n+1 . 5.143. y = arctg x. 5.144. Právě pro x ∈ ( −5 2 , 5 2 ) je 1 5+2x = 1 5 ∞∑ n=0 ( −2 5 )n xn. 5.145. a > 1. 5.146. x > 2. 5.147. Konverguje absolutně. 4. MOCNINNÉ ŘADY 256 6. MOCNINNÉ ŘADY 5.148. ln (3/2). 5.149. x(1−x) (1+x)3 . 5.150. (a) 1 2 ln 1+x 1−x ; (b) 1+x (1−x)3 . 5.151. 2/9. 5.152. x e x3 2 .