Drsná matematika Martin Panák, Jan Slovák a „autorský kolektiv" Projekt netradiční základní učebnice matematiky pro studenty přírodních věd, informatiky, ekonomie apod., přibližující podstatnou část matematiky v rozsahu čtyř semestrálních přednášek. Text by měl být dokončen a vydán v roce 2013. Práce na učebnici jsou podpořeny projektem Univerzitní výuka matematiky v měnícím se světě (CZ. 1.07/2.2.00/15.0203) ^ £3 (D MINISTERSTVO ŠKOLSTVÍ, OPVaHlávínl V^^^J? MLÁDEŽE A TĚLOVÝCHOVY pro konkurancMchopnost <4líA* INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ evropský sociální fond V ČR EVROPSKÁ UNIE ii Obsah Kapitola 1. Krůčky k matematickým problémům 1 1. Čísla a funkce 1 2. Kombinatorické veličiny 6 3. Diferenční rovnice 10 4. Pravděpodobnost 14 5. Geometrie v rovině 23 6. Relace a zobrazení 37 Kapitola 2. Elementární lineárni algebra 43 1. Vektory a matice 43 2. Determinanty 55 3. Vektorové prostory a lineárni zobrazení 63 4. Vlastnosti lineárních zobrazení 80 Kapitola 3. Linární modely a maticový počet 87 1. Lineárni procesy 87 2. Diferenční rovnice 89 3. Iterované lineárni procesy 95 4. Více maticového počtu 104 5. Rozklady matic a pseudoinverze 123 Kapitola 4. Analytická geometrie 130 1. Afmní a euklideovská geometrie 130 2. Geometrie kvadratických forem 148 3. Projektivní geometrie 154 Kapitola 5. Zřízení ZOO 158 1. Interpolace polynomy 158 2. Reálná čísla a limitní procesy 167 3. Derivace 185 4. Mocninné řady 196 Kapitola 6. Diferenciální a integrální počet 210 1. Derivování 210 2. Integrování 226 3. Nekonečné řady 246 Kapitola 7. Spojité modely 260 1. Aproximace pomocí Fourierových řad 260 2. Integrální operátory 266 Kapitola 8. Spojité modely s více proměnnými 273 1. Funkce a zobrazení na W 273 2. Integrování podruhé 305 3. Diferenciální operátory 320 4. Poznámky o numerických metodách 332 Kapitola 9. Kombinatorické metody 335 iii CHAPTER 0. OBSAH 1. Grafy a algoritmy 335 2. Aplikace kombinatorických postupů 358 Kapitola 10. Algebraické struktury a techniky 385 1. Grupy 385 2. Okruhy polynomů a tělesa 404 3. Uspořádané mnoiny a Booleovská algebra 420 4. Kódy a ifry 428 Kapitola 11. Statistické metody 437 1. Pravděpodobnost 439 2. Popisná statistika 463 3. Matematická statistika 463 4. Poznámky o některých aplikacích 464 iv CHAPTER 0. OBSAH Předmluva Příprava této učebnice byla motivována přednáškami pro informatické obory na Masarykově univerzitě, kde je celý program založen na precizním matematickém přístupu. Chtěli jsme proto rychle, ale zároveň pořádně, pokrýt zhruba tolik matematických metod, jako je obvyklé u větších kurzů v klasických technických oborech opřených o matematické metody. Zároveň jsme ale nechtěli rezignovat na úplný a matematicky korektní výklad. Chtěli jsme vedle sebe vyložit i obtížnější partie matematiky a spoustu elementárních i obtížnějších konkrétních příkladů, jak s uvedenými postupy ve skutečnosti pracovat. Nechtěli jsme přitom za čtenáře řešit, v jakém pořadí a kolik „teorie" či „praxe" pročítat. Z těchto podnětů vznikl dvousloupcový formát s oddělenými teoretickými úvahami a praktickými postupy, který kopíruje i skutečné rozdělení výkladu na přednáškách na „teoretické přednášky" a „demonstrovaná cvičení". Snažíme se tím vyjít vstříc jak čtenářům, kteří si napřed chtějí procvičit postupy při řešení úloh a teprve pak přemýšlet, proč a jak algoritmy fungují, tak těm druhým, kteří si napřed chtějí dělat jasno o tom proč a jak věci fungují a pak případně zkouší počítat příklady. Zároveň tím snad zbavujeme čtenáře stresu, že by měl přečíst úplně vše. Naopak, měl by mít radost z brouzdání textem a prožitku objevování vlastní cestičky. Text se přitom v obou svých částech snaží prezentovat standardní výklad matematiky s akcentem na smysl a obsah představovaných matematických metod. Řešené úlohy procvičují základní pojmy, ale zároveň se snažíme dávat co nejlepší příklady užití matematických modelů. Teoretický text je prezentován dosti kompaktním způsobem, mnoho prostoru je ponecháno pro dořešení podrobností čtenáři. Uváděné příklady se snaží pokrýt celou škálu složitosti, od banálních až po perličky ke skutečnému přemýšlení. Studenti navíc řešili a odevzdávali každý týden zadávané příklady. Čtenářům bychom rádi pomohli: • přesně formulovat definice základních pojmů a dokazovat jednoduchá matematická tvrzení, • vnímat obsah i přibližně formulovaných závislostí, vlastností a výhledů použití matematických nástrojů, • vstřebat návody na užívání matematických modelů a osvojit si jejich využití. K těmto ambiciózním cílům nelze dojít lehce a pro většinu lidí to znamená hledat si vlastní cestu s tápáním různými směry (s potřebným překonáváním odporu či nechutě). I proto je celý výklad strukturován tak, aby se pojmy a postupy vždy několikrát vracely s postupně rostoucí složitostí a šíří diskuse. v CHAPTER 0. OBSAH Jsme si vědomi, že se tento postup může jevit jako chaotický. Domníváme se ale, že dává mnohem lepší šanci na pochopení u těch, kteří vytrvají. Vstup do matematiky je skoro pro každého obtížný — pokud už „víme", nechce se nám přemýšlet, pokud „nevíme", je to ještě horší. Jediný spolehlivý postup pro orientaci v matematice je hledat porozumnění v mnoha pokusech a hledat je při četbě v různých zdrojích. Určitě nepovažujeme tento text za dostatečný jediný zdroj pro každého. Doufáme, že může být dobrým začátkem a případně i dlouhodobým pomocníkem, zvláště pro ty, kdo se k jednotlivým částem budou znovu a znovu vracet. Pro ulehčení vícekolového přístupu ke čtení je text doprovázen emotivně laděnými ikonkami, které snad nejen oživí obvyklou strohou strukturu matematického textu, ale naznačí čtenáři, kde by složitější text měl být čten pozorněji, ale určitě ne přeskakován, případně kde by bylo možná lépe náročné pasáže přinejmenším napoprvé vůbec nečíst. Volba jednotlivých ikonek samozřejmě odráží hlavně pocity autorů. Přesto by postupně mohly být dobrým vodítkem pro čtenáře. Velice zhruba řečeno, používáme ikonky varující před pracností/složitostí/náročností, např. Další označují ne úplně pohodovou zdlouhavost práce a potřebu trpělivosti či nadhledu, jako jsou tyto A konečně máme také ikonky vyjadřující pohodu nebo radost ze hry, třeba následující Snažili jsme se sloupce s příklady sepsat tak, aby byly čitelné prakticky víceméně samostatně. Bez ambicí pohrát si s hlubšími důvody, proč uváděné postupy fungují, (nebo s prostým cílem „projít s písemkou") by mělo skoro stačit probírat se jen příklady. Definice pojmů či popisy jejich vlastností používaných při řešení příkladů jsou v teoretickém sloupci zpravidla vyznačeny, aby o ně bylo možno snadno pohledem zavadit. Souvislost řešených příkladů s paralelně studovanou teorií je přitom spíše volná, snažili jsme ale ulehčit přeskakování „z teorie do praxe a zpět" co nejvíce. Obsahově je celá učebnice ovlivněna představou, že pro praktické využití jsou vlastně skoro vždy podstatné metody tzv. diskrétní matematiky, zatímco tzv. spojité modely jsou matematicky dobře uchopitelná přiblížení veskrze diskrétního světa kolem nás. Počítat koneckonců stejně umíme vždy jen CHAPTER 0. OBSAH s konečně mnoha racionálními čísly naráz. Bez spojité matematiky si lze ale těžko dobře představit koncepty jako konvergence procesu k limitnímu stavu nebo robustnost výpočtu. Bylo by bez ní také obtížné pracovat s odhady chyb při numerických procesech. Všechna témata a velmi podstatnou část textu jsme v létech 2005 - 2012 ověřovali při výuce studentů informatiky a později i matematiky na Masarykově univerzitě. Paralelně jsme přitom vytvořili také podklady pro praktické semináře matematického modelování a numerických metod. V nich se studenti, věnují skutečnému využití výpočtových nástrojů a modelů. Závěrem tohoto stručného představení stručně shrneme obsah celé učebnice. Samozřejmě předpokládáme, že si každý čtenář, případně přednášející, vybere témata a jejich pořadí. Pokusíme se proto zároveň vymezit bloky, se kterými lze takto nezávisle zacházet. Úvodní motivační kapitola se snaží ilustrovat několik y přístupů k matematickému popisu problémů. Začínáme nejjednoduššími funkcemi (základní kombinatorické vzorce). Pak naznačujeme jak pracovat se závislostmi zadanými pomocí okamžitých změn (jednoduché diferenční rovnice), užití kombinatoriky a množinové algebry diskutujeme prostřednictvím konečné klasické pravděpodobnosti. Předvádíme maticový počet pro jednoduché úlohy rovinné geometrie (práce s pojmem pozice a transformace) a závěrem vše trochu zformalizujeme {relace, uspořádní, ekvivalence). Nenechte se zde uvrhnout do chaotického zmatku rychlým střídáním témat — cílem je nashromáždit něco málo netriviálních námětů k přemýšlení í a hledání jejich souvislostí i použití, ještě než zabředneme do úrovně problémů a teorií složitějších. Ke všem tématům této úvodní kapitoly se časem vrátíme. Další dvě kapitoly jsou věnovány základům počtu, který ,jf' ,. umožňuje práci s vícerozměrnými daty i grafikou. Jde o postupy tzv. lineární algebry, které jsou základem a konečným výpočetním nástrojem pro většinu ' matematických modelů. Nejprve probíráme jednoduché postupy pro práci s vektory a maticemi, třetí kapitola je pak věnována aplikacím maticového počtu v různých lineárních modelech (systémy lineárních rovnic, lineární procesy, lineární diferenční rovnice, Markovovy procesy, lineární regrese). Čtvrtá kapitola pak ilustruje použití maticového počtu v geometrických úlohách. Dozvíme se něco málo o afinní, euklidovské a projektivní geometrii. V tomto okamžiku přerušíme diskusi diskrétních modelů a přejdeme ke spojitým. Chceme co nejná-zorněji ukázat, že základní ideje, jak s funkcemi pracovat, bývají jednoduché. Stručně řečeno, velmi jednoduché úvahy spojené s popisem okamžitých změn sledovaných veličin umožňují dělat závěry pro jejich celkové Vil CHAPTER 0. OBSAH chování. Složitosti se pojí skoro výhradně se zvládnutím rozumně velké třídy funkcí, pro které mají naše postupy být použitelné. Začínáme proto kapitolou, kde diskutujeme jaké funkce potřebujeme pro nelineární modely. Po polynomech a splajnech postupně diskutujeme pojmy spojitosti, limity posloupností a funkcí a. derivace Ifár*^*-^-- funkcí, připomeneme všechny základní elementární funkce a závěrem se seznámíme s mocninnými řadami. Tím je připravena půda pro klasický diferenciální a integrální počet. Ten prezentujeme v kapitole šesté s důrazem na co nejpřímočařejší pochopení souvislostí limitních procesů, integračních procesů a aproximací. Sedmá kapitola se věnuje náznakům aplikací a snaží se co nejvíce připomínat analogie k postupům m, jednoduché lineární algebry z minulého semestru. Místo lineárních zobrazení mezi konečně rozměrnými vektorovými prostory tak pracujeme s lineárními operacemi mezi nekonečně rozměrnými vektorovými prostory funkcí, definovanými buď integrálními nebo diferenciálními operátory. Zatímco studium diferenciální rovnic necháváme na později, zde studujeme nejprve aproximace funkcí s pomocí vzdálenosti definované integrálem (tzv. Fourierovy řady). Pak se věnujeme souvislostem s některými integrálními operátory (např. konvoluce) a integrálními transformacemi (zejména Fourirerova transformace). Po cestě si neodpustíme ilustraci obecného principu, že spojité modely jsou zpravidla ideovým podkladem a zároveň dobrou aproximací pro modely diskrétní. Poslouží nám k tomu stručné nahlédnutí na problematiky tzv. waweletů a diskrétní Fourierovy transformace. hodVéodbývaľ V osmé kapitole pokračujeme v našem stručném nastínění - texty ještě 1.1^1 .. ^ * . 1y vůbec nejsou analytických spojitých metod, tentokrát pro mo-:.) dely s mnoha proměnnými. Nejprve rozšime základní postupy a výsledky týkající se derivací na 7 v^tv v /• 7 ^ 7^7 stále více se mi funkce více proměnných, vcetne funkci zadaných m představa, implicitně a tzv. vázaných extrémů. Hned poté rozšíříme teorii ™ě^]°0m9 integrování o tzv. násobné integrály. Poté se věnujeme stručně mít PravděPo-modelům opřeným o známou změnu našich objektů, tj. dife- statistika renciálním rovnicím a malinko naznačíme obdobné problémy (Martinuv návrh) a pak v variační. Závěrem této kapitoly se pak stručně věnujeme nu-grafech, sítích merickým přiblížením a odhadům. šifrách^! s Devátá kapitola směřuje zpět do světa diskrétních metod, pravděpodob-Zabýváme se v ní základními pojmy poznatky aplikacích teorie grafů a jejich využitím v praktických pro- J^"^10 by blémech (např. prohledávání do šířky a hloubky, semestru . . s7 ✓ j s " ' i , , i shrnulo zbytek minimální pokrývající kostry, toky v sítích, hry analýzy a popisované stromy). Závěrem uvádíme pár poznámek o vy-Právě. statistiku, tvořujících funkcích, poslední Předposlední kapitola se zabývá nejprve obecnými al- ^^fy by' ;i(f,i ,, gebraickými strukturami s důrazem na teorii grup. Věnujeme se ale i jiným strukturám a soustředíme se na aplikace, které směřujeme na velmi aktuální ' oblasti kódování a šifrování. vin CHAPTER 0. OBSAH bubák j e tady Poslední jedenáctá kapitola je věnována matematické dočasně 1V 111 ^- o kvůli autorovi, pravdepododobnosti a statistice. Seznámíme nikoiivkvuii se s pojmy pravděpodobnostní prostor, hustota sl°ž^osti pravděpodobnosti, normální rozdělení, střední hodnota, medián, kvantil, rozptyl, příklady diskrétních a spojitých rozdělení a budeme se náznakem věnovat statistickému zpracování dat. Pořádné poděkování všem zúčastněným, kteří nebudou přímo v autorském kolektivu, studentům apod. ??. ??. 2013, kolektiv autorů ix KAPITOLA 1 Krůčky k matematickým problémům „hodnota, změna, poloha " — co to je a jak to uchopit? Cílem první kapitoly je uvést čtenáře do fascinujícího světa matematického myšlení. Vybíráme si k tomu co nej-konkrétnější příklady modelování reálných situací pomocí abstraktních objektů a souvislostí. Zároveň projdeme několik témat a postupů, ke kterým se postupně budeme vracet a v závěru kapitoly se budeme chvíli věnovat samotnému jazyku matematiky (se kterým budeme jinak zacházet spíše intuitivně). O co jednodušší jsou východiska a objekty, se kterými zde budeme pracovat, o to složitější je pochopit do důsledku jemnosti použitých nástrojů a postupů. Většinou je možné proniknout k podstatě věcí teprve v jejich souvislostech. Proto je také představujeme hned z několika pohledů zároveň. Přecházení od tématu k tématu se možná bude zdát jako zmatečné, ale to se jistě postupně spraví při našich návratech k jednotlivým úvahám a pojmům v pozdějších kapitolách. Název kapitoly lze chápat i jako nabádání k trpělivosti. I nejjednodušší úlohy a úvahy budou snadné jen pro ty, kteří už podobné řešili (a půjde pro ně jen o opakování znalosti ze střední školy). K postupnému poznání a ovládnutí matematického myšlení vede jen pozvolná a spletitá cesta. Začneme s tím nejjednodušším: obyčejnými čísly. 1. Čísla a funkce Lidé odjakživa chtějí mít jasno „kolik" něčeho je, případně „za kolik" to je, „jak dlouho" něco trvá apod. Výsledkem takových úvah je většinou nějaké „číslo". Za číslo přitom považujeme něco, co umíme sčítat a násobit a splňuje to obvyklé zákonitosti, ať už všechny nebo jen některé. Například výsledek sčítání nezávisí na pořadí, v jakém čísla sčítáme, máme k dispozici číslo nula, které přičtením výsledek nezmění, číslo jedna, kterým můžeme násobit, aniž bychom změnili výsledek, apod. Nejjednodušším příkladem jsou tzv. čísla přirozená, budeme je značit N = {0, 1, 2, 3, ...}. Všimněme si, že jsme mezi přirozená čísla vzali i nulu, jak je obvyklé zvláště v informatice. Počítat „jedna, dvě, tři, ..." se učí děti už ve školce. O něco později se setkáváme s čísly celými Z = {..., —2, — 1, 0, 1, 2, ...} a nakonec si zvykneme na i 1. ČÍSLMWmNKEEŮČKY K MATEMATICKÝM PROBLÉMŮM desetinná čísla a víme, co znamená 1.19-násobek ceny díky 19% dani z přidané hodnoty. 1.1 1.1. Vlastnosti čísel. Abychom mohli s čísly pracovat opravdu, musíme se jejich definici a vlastnostem věnovat pořádněji. V matematice se těm základním tvrzením o vlastnostech objektů, jejichž platnost předpokládáme, aniž bychom se zabývali jejich dokazovaním, říká axiomy. Vhodná volba axiomů předurčuje jak dosah z nich vycházející teorie, tak její použitelnost v matematických modelech skutečnosti. Vlastnosti sčítání: (KG1) (a + b) + c = a + (b + c), pro všechna a, b, c (KG2) a + b = b + a, pro všechna a, b (KG3) existuje 0 taková, že pro všechna a platí a + 0 = a (KG4) pro všechna a existuje b takové, že a + b = 0 Vlastnostem (KG1) - (KG4) říkáme vlastnosti komutativní grupy. Jsou to po řadě asociativita, komutativita, existence neutrálního prvku (říkáme u sčítání také nulového prvku), existence inverzního prvku (říkáme u sčítání také opačného prvku k a a značíme ho —a). Vlastnosti násobení: (01) (a ■ b) ■ c = a ■ (b ■ c), pro všechny a, b, c (02) a ■ b = b ■ a, pro všechny a, b (03) existuje prvek 1 takový, že pro všechny a platí 1 • a = a (04) a ■ (b + c) = a ■ b + a ■ c, pro všechny a, b, c. Vlastnosti (01)-(04) se postupně nazývají asociativita, komutativita, existence jednotkového prvku a distributivita sčítání vůči násobení. Množiny s operacemi +, • a vlastnostmi (KG1)-(KG4), (01)-(04) se nazývají komutativní okruhy. Další vlastnosti násobení: (P) pro každé a ^ O existuje b takové, že a ■ b = 1. (01) je-li a ■ b = O, potom buď a = O nebo b = 0. Vlastnost (P) se nazývá existence inverzního prvku vzhledem k násobení (tento prvek se pak značí a-1) a vlastnost (01) říká, že neexistují „dělitelé nuly". Vlastnosti skalárů Uvedli jsme si základní vlastnosti operací sčítání a násobení pro naše počty s čísly, která píšeme jako písmena a, b, c, .... Obě tyto operace fungují tak, že vezmeme dvě čísla a, b a aplikací sčítání nebo násobení dostaneme výsledné hodnoty a + b a a ■ b. Vlastnosti těchto operací budeme soustavně využívat, aniž bychom museli přesně vědět, s jakými objekty skutečně 2 CHAPTER 1. KRŮČKY K MATEMATICKÝM ÉÍSIBLÉMŮMKCE pracujeme. Tak se dostaneme k obecným matematickým nástrojům, je však vždy dobré mít představu o typických příkladech. Celá čísla Z jsou dobrým příkladem komutativní grupy, přirozená čísla nikoliv, protože nesplňují (KG4) (a případně neobsahují neutrální prvek, pokud někdo nulu do N nezahrnuje). Když komutativní okruh navíc splňuje i vlastnost (P), hovoříme o poli (často také o komutativním tělese). Poslední uvedená vlastnost (Ol) je automaticky splněna, pokud platí (P). Opačně to ovšem neplatí a tak říkáme, že vlastnost (Ol) je slabší než (P). Např. okruh celých čísel Z nesplňuje (P), ale splňuje (Ol). Hovoříme v takovém případě 0 oboru integrity. Všimněme si, že množina všech nenulových prvků v poli společně s operací násobení splňuje (Ol), (02), (03), (P), a je proto také komutativní grupa. Jen se místo sčítání mluví o násobení. Jako příklad můžeme vzít všechna nenulová reálná čísla. Prvky nějaké množiny s operacemi + a • splňujícími (ne nutně všechny) výše uvedené vlastnosti (tj. komutativní okruh, obor integrity, pole) budeme nazývat skaláry. Budeme pro ně vesměs užívat malá latinská písmena ze začátku nebo konce abecedy. Všechny vlastnosti (KG1)-(KG4), (01)-(04), (P), (01) z našich úvah je třeba brát jako axiomatickou definici příslušných matematických pojmů. Pro naše potřeby bude stačit si průběžně uvědomovat, že při dalších diskusích budeme důsledně používat pouze tyto vlastnosti skalárů a že 1 naše výsledky proto budou platné pro všechny objekty s těmito vlastnostmi. V tomto je pravá síla matematických teorií - nejsou platné jen pro konkrétní řešený příklad. Naopak, při rozumné výstavbě mají vždy univerzální použití. Budeme se snažit tento aspekt zdůrazňovat, přestože naše ambice mohou být v rámci daného rozsahu učebnice jen velice skromné. 1.2. Existence skalárů. K tomu, aby ale skutečně bylo možné budovat matematickou teorii, je třeba ověřit, že takové objekty mohou existovat. Pro pořádek si proto budeme postupně ukazovat, jak je možné zkonstruovat základní číselné obory. Pro konstrukci přirozených čísel začneme s předpokladem, že víme, co jsou to množiny. Prázdnou množinu si označíme 0 a definujeme (1.1) O := 0, n + 1 := n U {n} , neboli O := 0, 1 := {0}, 2 := {O, 1}, ...,n + 1 := {O, 1, ..., n}. Tímto zápisem říkáme, že pokud už máme definovaná všechna čísla O, 1, 2, ... n, pak číslo n + 1 definujeme jako množinu všech předchozích čísel. Přirozená čísla takto ztotožňujeme s počty prvků konkrétních množin. Číslo n je množina, která má n prvků a dvě přirozená čísla a, b jsou stejná, právě když příslušné množiny 3 1. ČÍSLMWmNKEEŮČKY K MATEMATICKÝM PROBLÉMŮM mají stejně prvků. V teorii množin se místo slovního spojení „počet prvků množiny" používá pojem „mohutnost množiny". Tento pojem má smysl (narozdíl od toho předchozího) i pro nekonečné množiny. Na první pohled je také vidět obvyklá definice uspořádání přirozených čísel podle velikosti (o číslu a řekneme, že je ostře menší než b tehdy a jen tehdy, když a ^ b a a c b jako množina). Dalším formálním krokem by měla být definice sčítání a násobení a důkaz všech základních vlastnostní přirozených čísel, včetně výše uvedených axiomů komutativního okruhu. Snadno lze např. ukázat, že každá podmnožina v N má nejmenší prvek a spoustu dalších vlastností o kterých zpravidla už dávno nepřemýšlíme a máme je za samozřejmé. Nebudeme se tu konstrukcí číselných oborů zabývat podrobně a předpokládáme, že čtenář čísla racionální (Q), reálná (M) a komplexní (C) důvěrně zná. Občas budeme jen připomínat teoretické i praktické souvislosti při dalším výkladu. Podrobně bude konstrukce racionálních čísel z přirozených diskutována v 1.40. Konstrukci reálných čísel bude vhodné zmínit při studiu limitních procesů později a již dříve budeme z různých algebraických pohledů zkoumat čísla komplexní. Navíc, jak je v matematice obvyklé, budeme místo s čísly manipulovat s písmeny abecedy, případně jinými znaky, ať už jejich hodnota je nebo není předem známá. 4 CHAPTER 1. KRŮČKY K MATEMATICKÝM ÉÍSIBLÉMŮMKCE Skalární funkce. Často pracujeme s číselnou hodnotou, která není dána jako konkrétní číslo. Místo toho něco víme o závislosti naší hodnoty na hodnotách jiných. Formálně píšeme, že hodnota y = f (x) naší „závislé" proměnné veličiny y je dána „nezávislou" veličinou x. Přitom můžeme znalost / brát formálně (prostě je to nějaká, blíže nespecifikovaná, závislost) nebo operačně, tj. f(x) je dáno vzorcem poskládaným z (prozatím si představme konečně mnoha) známých operací. Pokud je hodnotou skalár, hovoříme o skalární funkci. Každá funkce je definována na nějaké množině, mluvíme o definičním oboru funkce, a množina všech hodnot je pak tzv. obor hodnot funkce. Také mohou být ale hodnoty funkce / dány pouze přibližně nebo s jistou pravděpodobností. Smyslem matematických úvah pak bývá z neformálního popisu závislostí najít explicitní vzorce pro funkce, které je popisují, nebo aspoň explicitní vyjádření pro konkrétní hodnoty závislých proměnných, případně jejich přiblížení. Podle typu úlohy a cíle pracujeme: • s přesným a konečným výrazem • s nekonečným výrazem • s přiblížením neznámé funkce známým odhadem (většinou s vyčíslenou možnou chybou) • s odhadem hodnot s vyčíslením jejich pravděpodobnosti apod. Skalární funkcí je např. roční mzda pracovníka nějaké firmy (hodnoty nezávislé veličiny, tj. definiční obor funkce, jsou jednotliví pracovníci x z množiny všech sledovaných pracovníků, f(x) je jejich roční mzda za dané období). Stejně tak můžeme sledovat měsíční mzdu konkrétního pracovníka v čase (nezávislou hodnotou je čas v měsících, závislou příjem v jednom každém měsíci). Jiným příkladem je třeba plocha obrazce v rovině, objem tělesa v prostoru, rychlost konkrétního auta v čase atd. Dovedeme si jistě představit, že ve všech uvedených případech může být hodnota dána nějakou volně popsanou souvislostí nebo naměřena přibližně nebo odhadnuta atd. 1.4. Operačně definované funkce. Funkce můžeme mít dány výčtem jejich hodnot - např. ve firmě je , ^ , Jen konečně mnoho zaměstnanců a umíme sesta--e vit tabulku s jejich aktuálními měsíčními platy. Častěji ale máme místo hodnot pravidla, jak k hodnotám dojít. I Důležitou skalární funkcí na přirozených číslech jefakto-' riál, který definujeme vztahy /(0) = 1, f(n)=n-f(n-l) pro n = 1,2, .... Píšeme f (jí) = n \ a definice zjevně zna- mená n \ = n ■ (n — 1) • • • 1. Funkce faktoriál 5 2. KOMWmWQRIKMĚál^tČJmTEMATICKÝM PROBLÉMŮM 1. 4 Naše definice funkce faktoriál říká, jak se změní hodnota /(«), když změníme hodnotu n o jedničku. Vzorec pro n\ již explicitně říká, kolik to je doopravdy. V tomto případě to není příliš efektivní vzorec, protože se jeho složitost zvětšuje s rostoucím n, lepší ale těžko hledat. Podívejme se ještě na obyčejné sčítání přirozených čísel jako na operačně definovanou skalární funkci. Definičním oborem je množina všech dvojic (a, b) přirozených čísel. Definujeme a+b j ako výsledek procedury, ve které k a několikrát po sobě přičítáme 1. Tak jsme vlastně obecně a + 1 definovali v rovnicích (1.1). Při každém přičtení odebereme z b největší prvek a postupujeme tak, dokud není b prázdná (tj. b se postupně zmenšuje o jedničku a v každém kroku nám říká, kolik ještě zbývá přičíst). Je evidentní, že takto definované sčítání sice je dáno (iterativním) vzorcem, postup ale není vhodný pro praktické počítání. Tak tomu bude v našem výkladu často - teoreticky korektní definice pojmu či operace neznamená, že úkony s nimi spojené jsou efektivně vykonavatelné. Právě k tomu budeme postupně rozvíjet celé teorie, abychom praktické nástroje získávali. Co se týče přirozených čísel, od školky je umíme sčítat zpaměti a rychle (pokud jsou malá), pro větší známe ze základní školy algoritmus písemného sčítání a s velkými si poradí počítače (pokud nejsou příliš velká). 2. Kombinatorické veličiny Typickým „kombinatorickým" problémem je napočítat, kolika různými způsoby se může něco stát. Např. kolika způsoby lze vybrat v samoobsluze dva různé sendviče z dané nabídky? Myslíme si přitom, že jsou všechny sendviče v regálu po dvou různé nebo rozlišujeme jen různé typy sendvičů? Připouštíme pak, že si také můžeme vzít dva stejné? Nepřeberně takových otázek máme u karetních a jiných her. 1.5. Permutace. Jestliže z množiny n předmětů vytváříme nějaké pořadí jejich prvků, máme pro volbu prvního prvku n možností, další je volen z n — 1 možností atd., až nám nakonec zbude jediný poslední prvek. Zjevně tedy je na dané konečné množině S s n prvky právě n! různých pořadí. Procesu uspořádávání prvků množiny S říkáme permutace prvků množiny S. Výsledkem permutace je pak vždy nějaké pořadí prvků. Jestliže si předem prvky v S očíslujeme, tj. ztotožníme si 5 s množinou S = {1, ..., n} n přirozených čísel, pak permutace odpovídají možným pořadím čísel od jedné do n. Máme tedy příklad jednoduché matematické věty a naši předchozí diskusi je možné považovat za její důkaz: Tvrzení. Počet p(n) různých pořadí na konečné množině s n prvky je dán známou funkcí faktoriál: el. la | (1.2) p(n)=n\ Počet permutací na konečné množině J 6 CHAPTERL KRŮČKY KMATEMmEWmawmÉÉMŮlČINY 1.4a 1.6. Kombinace a variace. Dalším jednoduchým příkla- dem hodnoty určené vzorcem jsou tzv. kombinační čísla, která vyjadřují, kolika způsoby lze vybrat k různých rozlišitelných předmětů z množiny n předmětů. Zjevně máme n(n - 1) • • • (n - k + 1) možných výsledků postupného výběru našich k prvků, přitom ale stejnou výslednou &-tici dostaneme v k! různých pořadích. Pokud nám záleží i na pořadí vybrané &-tice prvků, hovoříme o variaci k—tého stupně. Jak jsme si právě ověřili, počet kombinací a variací udávají následující vzorce, které také nejsou pro výpočet moc efektivní při velikých kun, protože obsahují výrazy pro fak-toriály. i Tvrze Tvrzení. Pro počet c(n, k) kombinací k-tého stupně z n prvků, kde 0 < k < n, platí eTTT| (1.3) (n\ n(n — 1)...(« — k + 1) n\ c(n, k) 0 k(k-l)..A (n-k)\k Pro počet v(n,k) variací platí el ,2a | (1.4) v(n, k) = n(n - 1) •••(«- k + 1) pro všechny 0 < k < n (a nula jinak). J Kombinace a variace Kombinační číslo čteme ,ji nad k" a nazýváme ho také někdy binomickým číslem. Tento název čísla dostala od tzv. binomického rozvoje, tj. roznásobení n-té mocniny dvojčlenu. Počítáme-li totiž (a + b)n, bude koeficient u mocniny akb"~k pro každé 0 < k < n roven právě počtu možností, jak vybrat &-tici z n závorek v součinu (ty, kde bereme do výsledku a). Platí proto Ir— n V / k un~k el.3 | (1.5) {a+b)n =2_l\i )a a všimněme si, že pro odvození jsme potřebovali pouze dis-tributivitu, komutativitu a asociativitu násobení a sčítání. Formule (1.5) proto platí v každém komutativním okruhu. Jako další jednoduchou ukázku, jak vypadá matematický důkaz si odvoďme několik jednoduchých tvrzení o kombinačních číslech. Pro zjednodušení formulací definujme (nk) = 0, kdykoliv je buď A: < 0 nebo k > n. 1. 5 I 1.7. Tvrzení. Pro všechna přirozená čísla k a n platí a) g) = c-j (2) Cl) = g) + Ui) (3) ZLo g) =2" (4) s;=0*g)=b2"-1- 7 2. KOMWmWQRIKMĚál^tČJmTEMATICKÝM PROBLÉMŮM Důkaz. První tvrzení je zjevné přímo z formule (1.3). Jestliže vyčíslíme pravou stranu z tvrzení (2), dostáváme 0/ n \ n\ n\ + \k + 1 / k\(n-k)\ + (k + l)!(n - k - 1)! _ (Jk + 1)«! + (n - *)n! (* + l)!(n -*)! _ (n + 1)! ~ (ik + l)!(n - ik)! což je ale levá strana tohoto tvrzení. Tvrzení (3) dokážeme tzv. matematickou indukcí. Tento JStfl tyP důkazu je vhodný právě pro tvrzení, která říkají, že něco má platit pro všechna přirozená čísla n. Matematická indukce se skládá ze dvou kroků. V prvním se tvrzení dokáže pro n = 0 (popřípadě n = 1 nebo další hodnoty n). V druhém, tzv. indukčním, kroku předpokládáme, že tvrzení platí pro nějaké n (a všechny předešlé hodnoty), a za pomoci tohoto předpokladu dokážeme, že tvrzení platí i pro n + 1. Dohromady z toho pak vyvodíme, že tvrzení platí pro všechna přirozená n. Tvrzení (3) zjevně platí pro n = 0, protože (|J) = 1 = 2°. (Stejně tak je přímo vidět i pro n = 1.) Předpokládejme, že platí pro nějaké n a spočtěme příslušnou sumu pro n + 1 s využitím tvrzení (2) i (3). Dostaneme z("r)-z[G:M)] k=0 X 7 k=0 LX ' \ / -I Všimněme si, že vzorec (3) udává počet všech podmnožin «-prvkové množiny, neboť Q je počet všech jejích ^-prvkových podmnožin. Všimněme si také, že tvrzení (3) plyne přímo z (1.5) volbou a = b = 1. Tvrzení (4) dokážeme opět matematickou indukcí, podobně jako (3). Zjevně platí pro n = 0, čímž je hotov první krok. Indukční předoklad říká, že (4) platí pro nějaké n. Spočtěme nyní příslušnou sumu pro n + 1 s využitím tvrzení (2) a indukčního předpokladu. Dostaneme ^+1,(")+SH*) = 2" + n2n~l + n2n~l = (n + 1)2". Tím je proveden indukční krok, a tvrzení je dokázáno pro všechna přirozená n. □ 8 CHAPTERL KRŮČKY KMATEMmEWmawmÉÉMŮlČINY Druhá vlastnost z našeho tvrzení umožňuje sestavit všechna kombinační čísla do tzv. Pascalova trojúhelníku, kde každé číslo obdržíme jako součet dvou bezprostředně nad ním ležících sousedů: n = 0 n = 1 n = 2 n = 3 n = 4 n = 5 1 1 1 1 5 10 10 5 1 1.6 Všimněme si, že v jednotlivých řádcích máme právě koeficienty u jednotlivých mocnin z výrazu (1.5), např. poslední uvedený řádek říká (a + b)5 = a5 + 5a4b + \0a3b2 + \0a2b3 + 5ab4 + b5. 1.8. Výběr s opakováním. Pořadí n prvků, z nichž mezi některými nerozlišujeme, nazýváme permutace s opakovaním. Nechť je mezi n danými prvky p\ prvků prvního druhu, p2 prvků druhého druhu, ..., Pk prvků &-tého druhu, p\ + p2 + ■ ■ ■ + Pk = n, potom počet pořadí těchto prvků s opakováním budeme značit P(pi,...,pk). Podobně jako u permutací a kombinací bez opakování, pro výběr prvního z nich máme n možností, pro další n — 1 a tak dále, až po poslední, který zbude. Přitom ale za stejná považujeme pořadí nerozlišitelných objektů. Těch je pro každou skupinku o p{ objektech právě pt\, takže zřejmě platí r p(pi,...,pk) p\\---pú Permutace s opakováním Volný výběr k prvků z n možností, včetně pořadí, nazýváme variace k-tého stupně s opakováním, jejich počet budeme značit V(n,k). Volný výběr v tomto případě znamená, že předpokládáme, že stále máme pro výběr stejně možností, např. díky tomu, že vybrané prvky před dalším výběrem vracíme nebo třeba házíme pořád stejnou kostkou. Zřejmě platí r V (n, k) =nk. Variace s opakováním Pokud nás výběr zajímá bez zohlednění pořadí, hovoříme o kombinacích s opakováním a pro jejich počet píšeme C(n,k). Zde se na první pohled nezdá tak jednoduché, jak výsledný počet zjistit. Důkaz následující věty je pro matematiku typický - podaří se nám nový problém převést na problém jiný, který jsme už dříve zvládli. V našem případě je to převedení na problém standardních kombinací bez opakování: 9 3. rwFMfíMĚNí. mrnkřm k matematickým problémům Věta. Počet kombinací s opakováním k-té třídy z n prvků je \ pro všechny k > O a n > 1 J C (n, k) Kombinace s opakováním Důkaz. Důkaz je opřen o trik (jednoduchý, jakmile ho pochopíme). Uvedeme dva různé postupy. Představme si nejprve, že taháme postupně karty z balíku n různých karet a abychom mohli případně některou z nich vytáhnout vícekrát, přidáme si k balíku ještě k — 1 různých žolíků (alespoň jednou určitě chceme jednu z původních karet). Řekněme, že postupně vytáhneme r původních karet a s žolíků, tj. r +s = k. Zdá se, že bychom měli vymyslet postup, jak z těch s žolíků poznat, které karty nám zastupují. Ve skutečnosti nám ale stačí diskuse počtů možností takových voleb. K tomu můžeme použít matematickou indukci a předpokládat, že dokazovaná věta platí pro menší argumenty než jsou n a k. Skutečně, potřebujeme obsáhnout kombinace s-té třídy s opakováním z pouze r původních karet, což dává (r+k~r~1) = C71)' c°ž Je právě počet kombinací 5-tého stupně (bez opakování) ze všech žolíků. Tím je věta dokázána. Druhý přístup (bez matematické indukce): Na množině S = {au ..., a„}, ze které vybíráme kombinace, si zafixujeme uvedené pořadí prvků a pro naše volby prvků z 5 si připravíme n přihrádek, do kterých si již předem dáme v námi zvoleném pořadí po právě jednom prvku z S. Jednotlivé volby xt e S přidáváme do přihrádky, která již tento prvek obsahuje. Nyní si uvědomme, že pro rozpoznání původní kombinace nám stačí vědět, kolik je prvků v jednotlivých přihrádkách. Například, a I bbb I cc \ d ~ * | * * * | ** | *, vypovídá o volbě b, b, c z množiny S = {a, b, c, d}. V obecném případě výběru k prvků z n možných tedy máme řetězec n + k znaků a počet C(n,k) je roven počtu možných umístění přihrádek | mezi jednotlivé znaky. To odpovídá výběru n — 1 pozic z n + k — 1 možných. Protože je /n+k-í\ ( n+k-í \ /n + k-í\ V k )~\n + k-l-k)~ \ n-1 ) je věta dokázána i podruhé. □ 3. Diferenční rovnice V předchozích odstavcích jsme viděli vzorce, které zadávaly hodnotu skalární funkce definované na přirozených 10 chapter i. krůčky k matemAncmímRměMmmwicE číslech (faktoriál) nebo dvojicích čísel (binomická čísla) pomocí předcházejících hodnot. Zatímco v odstavci 1.5 jsou kombinační čísla definována přímo spočítatelným výrazem, lze rozumět vztahům v 1.8 také tak, že místo hodnoty naší funkce zadáváme její změnu při odpovídající změně nezávislé proměnné. Takto se skutečně velice často postupuje při matematické formulaci modelů, které popisují reálné systémy v ekonomice, biologii apod. My si tu povšimneme jen několika jednoduchých případů a budeme se k této tématice postupně vracet. 1.9. Lineární diferenční rovnice prvního řádu. Obecnou diferenční rovnicí prvního řádu rozumíme výraz f(n + 1) = F(n, /(«)), kde F je známá skalární funkce závislá na dvojicích přirozených čísel. Známe-li „počáteční" hodnotu /(O), můžeme spočítat /(l) = F(0, /(O)), poté f (2) = /(l)) atd. Tímto postupným způsobem můžeme tedy nakonec spočítat hodnotu f (jí) pro libovolné n e N. Všimněme si, že tato úvaha je podobná konstrukci přirozených čísel z prázdné množiny nebo principu matematické indukce. Jako příklad může sloužit definiční formule pro faktoriál, tj- (n + 1)! = (n + 1) -n\ Vidíme, že skutečně vztah pro f (n + 1) závisí na n i na hodnotě f(n). Dalším obzvlášť jednoduchým příkladem je f(n) = c pro nějaký pevný skalár C a všechna n a tzv. lineární diferenční rovnice (1.6) f(n + \)=a •/(«)+ b, kde a ^ 0, a b jsou známé skaláry. Takovou diferenční rovnici umíme snadno řešit, je-li b = 0. Pak se totiž jedná o dobře známou rekurentní definici geometrické posloupnosti a platí /(l) = a/(0), f (2) = af(l) = a2f(0) atd. Máme tedy pro všechna n f (n) = anf(0). To je např. vztah pro tzv. Malthusiánský model populačního růstu, který vychází z představy, že za zvolený časový interval vzroste populace s konstantní úměrou a vůči předchozímu stavu. Dokážeme si obecný výsledek pro rovnice prvního řádu, které se podobají lineárním, ale připouští proměnné koeficienty a a b, (1.7) f(n + l)=an. f(n)+bn. Nejdříve se ale zamysleme, co mohou takové rovnice popisovat. Lineární diferenční rovnici (1.6) můžeme pěkně interpretovat jako matematický model pro spoření nebo splácení 11 3. rwFMfíMĚNí. mrnkřm k matematickým problémům úvěru s pevnou úrokovou mírou a a pevnou splátkou b (tyto dva případy se liší pouze znaménkem u parametru b). S proměnnými parametry dostáváme obdobný model, {5; ovšem s proměnlivými jak úroky, tak splátkami. í'í$Í^^ Můžeme si představit třeba n jako počet měsíců, ^» y~ a„ bude vyjadřovat úrokovou míru v měsíci n, 3%^» - b„ příslušnou splátku v měsíci n. Neděste se zdánlivě složitého sčítání a násobení v následujícím výsledku. Jde o typický příklad technického matematického tvrzení, kdy těžké je „uhodnout", jak zní. Naopak důkaz je už pak jen docela snadné cvičení na základní vlastnosti skalárů a matematickou indukci. Skutečně zajímavé jsou teprve důsledky, viz 1.11 níže. Ve formulaci používáme vedle obvyklých znaků pro součet X také obdobné znaky pro součin Yl- V dalším budeme vždy používat také konvenci, že pokud u součtu je množina uvedených indexů prázdná, pak je součet nula, zatímco u součinu je ve stejném případě výsledek jedna. 1.10. Tvrzení. Obecné řešení diferenční rovnice (1.7) prvního řádu s počáteční podmínkou f(0) = yoje dáno vztahem (n—l \ n—2 / n—1 naí \bj+b„-l. i=o / j=o y=i+i Důkaz. Tvrzení dokážeme matematickou indukcí. Zjevně tvrzení platí pro n = 1, kdy se jedná právě o definiční vztah /(l) = a0y0 + b0. Předpokládáme-li, že tvrzení platí pro nějaké pevně zvolené n, můžeme snadno spočíst: (/n-l \ n-2 I n-l \ (nai) ^°+s í nai i bj+bn~i \i=0 / 7=0 \i=j + l J + bn \ n—l j n a>i ) b j + bn, (n \ n—l j n 11«)»+z n Z=0 / 7=0 \í'=7 + l 7 + 1 jak se přímo vidí roznásobením výrazů. □ Opět si všimněme, že jsme pro důkaz nepotřebovali o použitých skalárech nic víc než vlastnosti komutativního okruhu. 1. 9 1.11. Důsledek. Obecné řešení lineární diferenční rovnice (1.6) s a ^ 1 a počáteční podmínkou f(0) = y$je ~ěT7f\ (1.9) f(n) = a"y0 + l—^-b. 1 — a Důkaz. Dosazením konstantních hodnot za at a b{ do obecného vzorce (1.8) dostáváme f(n) = any0 + b(l + Yjan-j-\ ^ 7=0 ' 12 chapter i. krůčky k matemAncmímRměMmmwicE Pro vyčíslení součtu součinů v druhém sčítanci si je třeba všimnout, že se jedná o výrazy (1 + a + ■ ■ ■ + an~1)b. Součet této geometrické řady spočteme ze vztahu 1 — a" = (1 — a)(\+a+- ■ ■+an~1) a dostaneme právě požadovaný výsledek. □ Všimněme si, že pro výpočet součtu geometrické řady jsme potřebovali existenci inverze pro nenulové skaláry. To bychom nad celými čísly neuměli. Poslední výsledek tedy platí pro pole skalárů a můžeme jej bez problému použít pro lineární diferenční rovnice, kde koeficienty a, b a počáteční podmínka /(O) = yo jsou racionální, reálné nebo komplexní, ale také nad okruhem zbytkových tříd 1,k s prvočíselným k (zbytkové třídy budeme definovat v odstavci 1.41). Pozoruhodné je, že ve skutečnosti vzorec (1.9) platí i s celočíselnými koeficienty a počáteční podmínkou. Pak totiž předem víme, že všechny f (ji) budou také celočíselné, a celá čísla jsou podmnožinou v číslech racionálních. Musí proto tady to asi není „ šikovné — nutne nas vzorec dávat ta správna celočíselná reseni. příklady na Při pozornějším pohledu na důkaz je zřejmé, že 1 — a" je zhyf-°vetiídy L J L J J J snad budou v vždy dělitelné 1 — a, takže nás poslední pozorování nemělo druhém překvapit. Nicméně je vidět, že třeba nad skaláry ze Z4 a třeba ^^n^iépe a = 3 už neuspějeme, protože pak 1 — a = 2 je dělitelem bybyi°iz r J r r J tohoto udélat nuly. příklad a odtud to přesunout 2_ (nebo úplně 1.12. Nelineární příklad. Vraťme se na chvíli k rovnici prv-vypustlt) nŕho řádu (1.6), kterou jsme použili na velice primitivní model populačního růstu závisející přímo úměrně na okamžité velikosti populace p. Na první pohled je zřejmé, že takový model vede při úměře a > 1 k příliš rychlému a hlavně neomezenému růstu. Realističtější model bude mít takto úměrnou změnu populace Ap(n) = p(n + 1) — p(n) jen při malých hodnotách p, tj. Ap/p ~ r > 0. Pokud tedy budeme chtít nechat růst populaci o 5% za období při malém p, budeme r volit 0, 05. Při určité limitní hodnotě p = k > 0 ale naopak už populace neroste a při ještě větších už klesá (třeba protože zdroje pro její obživu jsou omezené, jedinci ve veliké populaci si navzájem překáží apod.). Předpokládejme, že právě hodnoty y„ = Ap(n)/p(n) se v závislosti na p(n) mění lineárně. Graficky si tedy tuto závislost můžeme představit jako přímku v rovině proměnných p a y, která prochází body [0, r] (tj. při p = 0 máme y = r) a [k, 0] (což dává druhou podmínku, že při p = k se populace nemění). Položíme proto r y = -gP + r- Dosazením y„ za y a p (n) za p dostáváme p (n + 1) - p (n) r - =--P (n) + r, p(n) kľk 13 4. PBMfflĚEQWOENOŘKY K MATEMATICKÝM PROBLÉMŮM tj. roznásobením dostáváme diferenční rovnici prvního řádu (kde hodnota p(n) vystupuje v první i v druhé mocnině) el.7a| (1.10) p(n + 1) = p(n)(l - ^p(n) +r). K Zkuste si promyslet nebo vyzkoušet chování tohoto modelu pro různé hodnoty r a K. Na obrázku je průběh hodnot pro parametry r = 0, 05 (tj. pěti-procentní nárůst v ideálním stavu), K = 100 (tj. zdroje limitují hodnotu na 100 jedinců) a p(0) jsou dva jedinci. 100- 0 50 100 150 200 Y Všimněme si, že počáteční přibližně exponenciální růst se skutečně později zlomí a hodnota se postupně blíží kýženému limitu 100 jedinců. Pro p blízké jedné a K daleko větší než r bude pravá strana rovnice (1.10) přibližně p(n)(\ + r), tzn. chování je obdobné Malthusiánskému modelu. Naopak při p přibližně K bude pravá strana přibližně p(n). Pro větší počáteční hodnoty p než K budou hodnoty klesat, pro menší než K růst, takže systém bude zpravidla postupně oscilovat kolem hodnoty K. 4. Pravděpodobnost Teď se podíváme na jiný obvyklý případ skalárních hodnot funkcí - sledované hodnoty často nejsou známy ani explicitně vzorcem, ani implicitně nějakým popisem. Jsou výsledkem nějaké nahodilosti a my se snažíme popsat s jakou pravděpodobností nastane ta či ona možnost. 1.12 | 1.13. Co je pravděpodobnost? Jako jednoduchý příklad může sloužit obvyklé házení kostkou se šesti stěnami s označeními 1, 2, 3, 4, 5, 6. Pokud popisujeme matematický model takového házení „poctivou" kostkou, budeme očekávat a tudíž i předepisovat, že každá ze stran padá stejně často. Slovy to vyjadřujeme „každá předem vybraná stěna padne s pravděpodobností Pokud ale si třeba sami nožíkem vyrobíme takovou kostku z kusu dřeva, je jisté, že skutečné relativní četnosti výsledků 14 CHAPTER 1. KRŮČKY K MATEMATISKFMAMXĚPKĚMŮMOST nebudou stejné. Pak můžeme z velikého počtu pokusů usoudit na relativní četnosti jednotlivých výsledků hodů a tyto ustanovit jako pravděpodobnosti v našem matematickém popisu. Nicméně při sebevětším počtu pokusů nemůžeme vyloučit možnost, že se náhodou povedla velice nepravděpodobná kombinace výsledků a že jsme proto náš matematický model skutečnosti pro naši kostku nevybrali dobře. V dalším budeme pracovat s abstraktním matematickým popisem pravděpodobnosti v nejjednoduším přiblížení. To, do jaké míry je takový popis adekvátní pro konkrétní pokusy či jiný problém, je záležitostí mimo samotnou matematiku. To ale neznamená, že by se takovým přemýšlením neměli zabývat matematikové (nejspíše ve spolupráci s jinými experty). Později se vrátíme k pravděpodobnosti coby teorii popisující chování nahodilých procesů nebo i plně determinovaných dějů, kde ovšem neznáme přesně všechny určující parametry. Matematická statistika pak umožňuje posuzovat, do jaké míry lze očekávat, že vybraný model je ve shodě s realitou, resp. umožňuje určit parametry modelu tak, aby docházelo k co nejlepší shodě s pozorováním a zároveň umí odhadnout míru spolehlivosti zvoleného modelu. K matematické pravděpodobnosti i statistice ovšem budeme potřebovat dosti rozsáhlý matematický aparát, který budeme mezitím několik semestrů budovat. Na příkladu naší neumělé kostky si to můžeme představit tak, že v teorii pravděpodobnosti budeme pracovat s parametry p i pro pravděpodobnost jednotlivých hodnot stran a budeme požadovat pouze aby všechny tyto pravděpodobnosti byly nezáporné a jejich součet byl Pl + P2 + P3 + P4 + P5 + P6 = 1- Při volbě konkrétních hodnot p{ pro konkrétní kostku pak v matematické statistice budeme schopni odhadnout s jakou spolehlivostí tento model naší kostce odpovídá. Naším skromným cílem je teď pouze naznačit, jak abs-jt7A traktně zachytit pravděpodobnostní úvahy ve for-$'---') malizovaných matematických objektech. Násle-/ 2jj* \ dující odstavce tak budou ve své podstatě pou-hými cvičeními v jednoduchých operacích nad množinami a jednoduché kombinatorice (tj. výpočtech počtu možností, jak mohou být splněny dané podmínky kladené na konečné množiny prvků). 1.13 | 1.14. Náhodné jevy. Budeme pracovat s neprázdnou pevně zvolenou množinou Q všech možných výsledků, kterou nazýváme základní prostor. Pro jednoduchost bude pro nás Q konečná množina s prvky a>i, ..., a>„, představujícími jednotlivé možné výsledky. Každá podmnožina AcSÍ představuje možný jev. Systém podmnožin A základního prostoru se nazývá jevové pole, jestliže • Q e A (tj. základní prostor, je jevem), • je-li A, B e A, pak A \ B e A (tj. pro každé dva jevy je jevem i jejich množinový rozdíl), 15 4. PBMfflĚEQWOENOŘKY K MATEMATICKÝM PROBLÉMŮM • jsou-li A, B e A, pak A U B e A (tj. pro každé dva jevy je jevem i jejich sjednocení). Zjevně je i komplement Ac = £2 \ A jevu A jevem, který nazýváme opačný jev k jevu A. Průnik dvou jevů je opět jevem, protože pro každé dvě podmnožiny A, B c £2 platí A \ (Q. \ B) = A n B. Slovy se tak dá jevové pole charakterizovat jako systém podmnožin (konečného) základního prostoru uzavřený na průniky, sjednocení a rozdíly. Jednotlivé množiny A e A nazýváme náhodné jevy (vzhledem k .4). Pro naše házení kostkou je Q = {1,2, 3, 4, 5, 6} a jevové poleje tvořeno všemi podmnožinami množiny Q. Např. náhodný jev {1, 3, 5} pak interpretujeme jako „padne liché číslo". Něco málo terminologie, která by měla dále připomínat souvislosti s popisem skutečných modelů: • celý základní prostor Q se nazývá jistý jev, prázdná podmnožina 0 e A se nazývá nemožný jev, • jednoprvkové podmnožiny {&>} c £2 se nazývají elementární jevy, • společné nastoupení jevů A;, i e /, odpovídá jevu níe/A;-, nastoupení alespoň jednoho zjevů At, i e /, odpovídá jevu U;e/A;, • A, S e „4 jsou neslučitelné jevy, je-li A n S = 0, • jev A má za důsledek jev S, když A c S, Přestavte si příklady všech uvedených pojmů pro jevový prostor popisující házení kostkou nebo obdobně pro házení mincí! 1.15. Definice. Pravděpodobnostní prostor je trojice (Q, A, P), kde A je jevové pole podmnožin (konečného) základního prostoru Q, na kterém je definována skalární funkce P : A -> M s následujícími vlastnostmi: • P je nezáporná, tj. P (A) > 0 pro všechny jevy A, 16 CHAPTER 1. KRŮČKY K MATEMATISKFMAMXĚPKĚMŮMOST • P je aditivní, tj. P (A U B) = P (A) + P (B), kdykoliv je A,B eAaADB = 0, • pravděpodobnost jistého jevu je 1, tj. P (Q) = 1. Funkci P nazývame pravděpodobností na jevovém poli A. Zjevně je okamžitým důsledkem našich definic řada prostých ale užitečných tvrzení. Např. pro všechny jevy platí P(AC) = 1 - P(A). Dále můžeme matematickou indukcí snadno rozšířit aditiv-nost na jakýkoliv konečný počet vzájemně neslučitelných jevů Ai cfl,i£ /, tj. P(UieIAi) = YJP(Ai), i El kdykoliv A; n Aj = 0, pro všechna i ^ j, i, j e /. 1.16. Definice. Nechť Q je konečný základní prostor a nechť jevové pole A je právě systém všech podmnožin v £2. Klasická pravděpodobnost je pravděpodobnostní prostor (Q, A, P) s pravděpodobnostní funkcí P:A^R, P(A) = —, kde | A\ značí počet prvků množiny A e A. Zjevně takto zadaná funkce skutečně definuje pravděpodobnost, ověřte si samostatně všechny požadované axiomy. 1.17. Sčítání pravděpodobností. U neslučitelných jevů je sčítání pravděpodobností pro výskyt alespoň jednoho z nich přímo požadováno v základní definici pravděpodobnosti. Obecně je sčítání pravděpodobností pro výskyty jevů složité. Problém totiž je, že pokud jsou jevy slučitelné, částečně máme v součtu pravděpodobností započteny příznivé výskyty vícekrát. Nejjednodušší je si nejprve představit situci se dvěma slučitelnými jevy A, B. Uvažme nejprve klasickou pravděpodobnost, kde jde vlastně o počítání prvků v podmnožinách. Pravděpodobnost výskytu alespoň jednoho z nich, tj. pravděpodobnost jejich sjednocení, je dána vztahem (1.11) P (A U B) = P(A) + P(B) - P(A n B) protože ty prvky, které patří do množiny Ai B, jsme nejprve započetli dvakrát a tak je musíme jednou odečíst. Tentýž výsledek dostaneme i pro obecnou pravděpodobnost P na nějakém jevovém poli. Protože A n B a A \ B jsou nezávislé jevy, P (A) = P(A \B) + P(A n B), podobně pro B, ale také máme P (A US) = P (A \B) + P(B \A) + P(A n B). Dosazením za pravděpodobnosti množinových rozdílů dostáváme opět vztah (1.11). 17 4. PBMfflĚEQWOENOŘKY K MATEMATICKÝM PROBLÉMŮM Následující věta je přímým promítnutím tzv. kombinatorického principu inkluze a exkluze do naší >, konečné pravděpodobnosti a říká, jakým způsobem vícenásobné započítávání výsledků kompenzovat v obecném případě. Jde patrně o dobrý příklad matematického tvrzení, kde nejtěžší je najít dobrou formulaci a pak se dá říci, že (intuitivně) je tvrzení zřejmé. Na obrázku j e situace znázorněna pro tři množiny A, B,C a pro klasickou pravděpodobnost. Jednoduše šrafované oblasti v prostém součtu máme dvakrát, dvojitě šrafované třikrát. Pak ty jednoduše šrafované jednou odečteme, přitom ty dvojitě šrafované opět třikrát odečteme, proto je tam nakonec ještě jednou započteme. Obecně, díky aditivní vlastnosti pravděpodobnosti, si můžeme představit, že každý jev rozložíme na elementární (tj. jednobodové) jevy, jakkoliv ve skutečnosti nemusí jednoprvkové podmnožiny do uvažovaného jevového pole patřit. Pak je pravděpodobnost každého jevu dána součtem pravděpodobností jednotlivých elementárních jevů do něj patřících a můžeme při vyjádření pravděpodobnosti nastoupení alespoň jednoho zjevů takto: sečteme všechny pravděpodobnosti výsledků pro všechna A; zvlášť, pak ovšem musíme odečíst ty, které tam jsou započteny dvakrát (tj. prvky v průnicích dvou). Teď si ovšem dovolujeme odečíst příliš mnoho tam, kde ve skutečnosti byly prvky třikrát, tj. korigujeme přičtením pravděpodobností ze třetího členu, atd. 1.16 Věta. Buďte A\, ..., A^ e A libovolné jevy na základním prostoru £2 s jevovým polem A Pak platí k k-l k P(Uf=1Ať) = £ P(At) - £ £ P(Ať n Aj) i — l i — k-2 k-l k + IZ I PiADAjDA,) Z = l j=i+l t=j+\ + (-i/-1P(A,nA2n...n4). 18 CHAPTER 1. KRŮČKY K MATEMATISKFMAMXĚPKĚMŮMOST Důkaz. Aby se výše naznačený postup stal důkazem, je zapotřebí si ujasnit, že skutečně všechny korekce, tak jak jsou popsány, jsou skutečně s koeficienty jedna. Místo toho můžeme snáze dát dohromady formálnější důkaz matematickou indukcí přes počet k jevů, jejichž pravděpodobnosti sčítáme. Zkuste si průběžně porovnávat oba postupy, mělo by to vést k vyjasnění, co to znamená „dokázat" a co „porozumět". Pro k = 1 tvrzení zjevně platí, vztah pro k = 2 je totožný s rovností (1.11) a tu jsme pro obecné pravděpodobnostní funkce již dokázali také. Předpokládejme tedy, že věta platí pro všechny počty množin až do pevně zvoleného k > 1. Nyní můžeme pracovat v indukčním kroku se vztahem pro k +1 jevů, když sjednocení prvních k jevů bereme jako A ve vzorci (1.11) výše, zatímco zbývající jev hraje roli B: P(dlZlAd = P((uf=1Ať) UAjt+O = Z((-iy+1 Z P(Ahr\---r\Ai])\ 7 = 1 ^ 1<í'i < — 0, potom P(Al n A2) = P(A2)P(Al\A2) = P(Al)P(A2\Al). Všechna tato čísla vyjadřují pravděpodobnost toho, že nastanou oba jevy A\ i A2, jenom jinými způsoby. Například v posledním případě nejprve sledujeme, zda nastane první jev. Potom za předpokladu, že ten první nastal, sledujeme zda nastane i ten druhý. Podobně, pro tři jevy Ai, A2, A3 splňující P(Ai n A2 n A3) > 0, dostaneme P(A1 n A2 n A3) = JP(A1)JP(A2|A1)JP(A3|A1 n A2). Slovy to lze opět popsat tak, že pravděpodobnost výskytu všech tří jevů zároveň můžeme spočítat tak, že se nejprve zabýváme výskytem pouze prvního z nich, potom druhého za předpokladu, že první už nastal a naposledy třetího za předpokladu, že oba předešlé jevy již nastaly. Máme-li obecný počet k jevů A\, ..., Ak splňujících P(Ai n • • • n Ak) > 0, pak věta říká následující: P(Alf). ■ .f)Ak) = P(Al)P(A2\Al). ■ ■P(Ak\Alr\- ■ -DA^). 21 4. PBMfflĚEQWOENOŘKY K MATEMATICKÝM PROBLÉMŮM Skutečně, dle předpokladu jsou i pravděpodobnosti všech průniků, které jsou brány ve výrazu za hypotézy, nenulové. Pokrácením čitatelů a jmenovatelů získáme i napravo právě pravděpodobnost jevu odpovídajícího průniku všech uvažovaných jevů. 1.21. Geometrická pravděpodobnost. V praktických problémech se často setkáváme s daleko složitějšími modely, kde základní prostor není konečnou množinou. Nemáme momentálně k dispozici ani základní nástroje pro dostatečné zobecnění pojmu pravděpodobnosti, nicméně můžeme uvést alespoň jednoduchou ilustraci. Uvažme rovinu M2 dvojic reálných čísel a v ní podmnožinu Q se známým obsahem vol Q (symbol „vol" je od anglického „volume", tj. obsah/objem). Příkladem může sloužit třeba jednotkový čtverec. Náhodné jevy budou reprezentovány podmnožinami A c £2 a za jevové pole A bereme nějaký vhodný systém podmnožin, u kterých umíme určit jejich obsah. Nastoupení nebo nenastoupení jevu je dáno výběrem bodu v Q, kterým se trefíme nebo netrefíme do množiny reprezentuj ící j ev A. Uvažme jako příklad problém, kdy náhodně vybereme dvě hodnoty a < b v intervalu [0, 1] C M. Všechny hodnoty a i b jsou stejně pravděpodobné a otázka zní „jaká je pravděpodobnost, že interval (a, b) bude mít velikost alespoň jedna polovina?". Volba čísel a, b je volbou libovolného bodu [a, b] ve vnitřku trojúhelníku Q s hraničními vrcholy [0, 0], [0, 1], [1, 1] (viz obrázek). Úlohu si můžeme představit jako popis problému, kdy se hodně unavený účastník večírku nad ránem pokouší dvěma řezy rozdělit párek na tři díly pro sebe a své dva kamarády. Jaká je pravděpodobnost, že se na někoho dostane aspoň půlka? Odpověď je docela jednoduchá: Podobně jako u klasické pravděpodobnosti definujeme pravděpodobnostní funkci P : A -» M vztahem vol A P (A) =-, vol £2 22 CHAPTER 1. KRŮČKY K MATEMAT3.C&ÍMWRWIEÉWŮW1NĚ kde A jsou podmnožiny v rovině, které odpovídají námi vybraným jevům. Potřebujeme tedy znát plochu podmnožiny, která odpovídá bodům s b > a + j, tj. vnitřku trojúhelníku A ohraničeného vrcholy [0, j], [0, 1], [j, 1]. Evidentně dostáváme P (A) = i. Zkuste si samostatně odpovědět na otázku „pro jakou požadovanou minimální délku intervalu (a, b) dostaneme pravděpodobnost jedna polovina?". 1.20a| 1.22. Metody Monte Carlo. Jednou z účinných výpočetních metod přibližných hodnot je naopak simulace známé takovéto pravděpodobnosti pomocí relativní četnosti nastoupení vhodně zvoleného jevu. Např. známá formule pro obsah kruhu o daném poloměru říká, že obsah jednotkového kruhu je roven právě konstantě 7T = 3, 1415..., která vyjadřuje poměr obsahu kruhu a druhé mocniny jeho poloměru. (Tady si také povšimněme východiska, které jsme nedokázali - proč by měl být obsah kruhu roven konstantnímu násobku druhé mocniny poloměru? Matematicky to budeme umět ukázat, až zvládneme tzv. integrování. Experimentálně si to ale můžeme ověřit níže uvedeným postupem s různými velikostmi strany čtverce.) Pokud zvolíme za Q jednotkový čtverec a za A průnik Q a jednotkového kruhu se středem v počátku, pak vol A = ^n. Máme-li tedy spolehlivý generátor náhodných čísel mezi nulou a jedničkou a počítáme relativní četnosti, jak často bude vzdálenost bodu [a, b] (určeného vygenerovanou dvojicí a, b) od počátku menší než jedna, tj. a2 + b2 < 1, pak výsledek bude při velkém počtu pokusů s velikou jistotou dobře aproximovat číslo ^jt. Numerickým postupům založeným na tomto principu se říká metody Monte Carlo. 5. Geometrie v rovině V posledních odstavcích jsme intuitivně používali elementární pojmy z geometrie reálné roviny. Teď budeme podrobněji zkoumat, jak se vypořádá-5 vat s potřebou popisovat „polohu v rovině", resp. dávat do souvislostí polohy různých bodů roviny. Nástrojem k tomu budou opět zobrazení, tentokrát to ale budou velice speciální pravidla přiřazující dvojicím hodnot (x, y) dvojice (w, z) = F(x, y). Zároveň půjde o předzvěst úvah z oblasti matematiky, které se říká lineární algebra a kterou se budeme podrobně zabývat v dalších třech kapitolách. 1.23 1.23. Vektorový prostor M2. Podívejme se na „rovinu" jakožto na množinu dvojic reálných čísel (x, y) e M2. Budeme jim říkat vektory v M2. Pro takové vektory umíme definovat sčítání „po složkách", tj. pro vektory u = (x, y) a 23 5. (muMwmiR. vkuiWmř k matematickým problémům v = (x', y O klademe u +v = (x + x',y + /)■ Protože pro jednotlivé složky platí všechny vlastnosti komutativní grupy, evidentně budou tyto vlastnosti platit i pro naše nové sčítání vektorů. Zejména tedy máme tzv. nulový vektor 0 = (0, 0), jehož přičtením k jakémukoliv vektoru v dostaneme opět vektor v. Záměrně teď používáme tentýž symbol 0 pro vektor i jeho skalární složky — z kontextu je vždy jasné, jakou „nulu" máme kdy na mysli. Dále definujeme násobení vektorů a skalárů tak, že pro a e M a v = (x, y) e M2 klademe a ■ v = (ax, ay). Zpravidla budeme znak • vynechávat a pouhé zřetězení znaků a v bude označovat skalární násobek vektoru. Přímo se ověří další vlastnosti pro násobení skaláry a, b a sčítání vektorů u, v, např. a (u + v) = a u+a v, (a+b)u = a u+bu, a(b u) = (ab)u, kde opět používáme stejný znak plus pro sčítání vektorů i skalárů. Tyto operace si můžeme dobře představit, jestliže uvažujeme vektory v jako šipky začínající v počátku 0 = [0, 0] a končící v bodě [x, y] v rovině. Takové šipky pak můžeme přikládat jednu za druhou a to přesně odpovídá sčítání vektorů. Násobení skalárem a pak odpovídá natažení dané šipky na a-násobek. Nyní můžeme udělat podstatný krok: jestliže si zapamatujeme dva významné vektory e\ = (1, 0) ae2 = (0, 1), pak každý jiný vektor dostaneme jako u = (x, y) = x e\ + y e^. Výrazu napravo říkáme lineární kombinace vektoru e\ a e^. Dvojici vektorů e = (e\, e2) říkáme báze vektorového prostoru M2. 24 CHAPTER 1. KRŮČKY K MATEMAT3.C&ÍMWRWIEÉWŮW1NĚ Jestliže si ale vybereme jiné dva vektory u,v, které nejsou jeden násobek druhého, tj. jinou bázi v M2, budeme moci udělat totéž. Lineární kombinace w = x u + y v nám pro všechny různé dvojice (x, y) dá právě všechny vektory w v rovině. Nakonec můžeme nahlížet vektory jako naše šipky v abstraktní poloze, tj. zapomeneme na ztotožnění bodů v rovině s dvojicemi čísel. Jenom budou ff^V naše šipky všechny „upoutány" v bodě 0, který ^Ifr^ípK-i-- je zároveň nulovým vektorem. Zůstanou nám operace sčítání a násobení skaláry a teprve volbou báze e\,ei ztotožníme naši rovinu šipek s M2. 1.24. Afinní rovina. Když si pevně vyvolíme nějaký vektor u e M2, můžeme jej přičítat (tj. coby šipku přikládat) k libovolnému bodu P = [x, y]. Máme tak tedy s pevným vektorem definované posunutí, které každý bod roviny P zobrazí na P + u. Zkusme teď úplně zapomenout na souřadnice a vnímat celou rovinu jako množinu, na které fungují naše posunutí. Takovou množinu A = M2 si můžeme představit z pohledu pozorovatele, který sedí v některém pevně zvoleném místě (můžeme mu říkat třeba bod O = [x0, y$] e M2). Předpokládejme, že ji vnímá jako nekonečnou desku bez jakýchkoliv zvolených měřítek a popisů a jenom ví, co to znamená posunout se o libovolný násobek nějakého vektoru uel2. Takové rovině budeme říkat „afinní rovina". Aby mohl vidět kolem sebe „dvojice reálných čísel", musí si vybrat nějaký bod E\, kterému řekne „bod [1,0]" a jiný bod Ei, kterému začne říkat „bod [0, 1]". Jinými slovy, zvolí si bázi e\ = (1, 0), e2 = (0, 1) mezi vektory posunutí. Do všech ostatních se pak dostane tak, že poskočí „a-krát ve směru e\" a pak „b-kiát ve směru e2" a takovému bodu bude říkat „bod [a, b]". Pokud to bude dělat obvyklým způsobem, nebude výsledek záviset na pořadí, tzn. může také napřed jít b-kiát ve směru e2 a pak teprve ve směru e\. 25 5. (mUMWEHR. VmílMMŘ K MATEMATICKÝM PROBLÉMŮM To, co jsme popsali, se nazývá volba (afinního) souřadného systému v rovině, bod O je jeho počátkem, a obecně každý bod P roviny je ztotožněn s dvojicí čísel [a,b], kterou také budeme psát jako posunutí P — O. Budeme dále pracovat v pevně zvolených souřadnicích, tj. s dvojicemi reálných čísel, ale pro lepší orientaci budeme vektory zapisovat s kulatými závorkami místo hranatých u souřadnic bodů v afinní rovině. 1.24 1.25. Přímky v rovině. Když se náš pozorovatel umí posou-í ■ „ vat o libovolný násobek pevného vektoru, pak také ví, co je to přímka. Je to podmnožina p c A v rovině taková, že ' existují bod O a nenulový vektor v takové, že p = {P e A; P — O = t ■ v, t e R}. Popišme si P = P (t) e p ve zvolených souřadnicích s volbou v = (a, x(t) = x0 + a ■ t, y(t) = y0+ p ■ t. Protože vektor v = (a, f3) je nenulový, musí být aspoň jedno z čísel a, j6 různé od nuly. Když pro určitost předpokládáme, že třeba a / O, pak vyloučíme t z parametrického vyjádření pro x a y a jednoduchým výpočtem dostaneme -j0x + ay = -fíx0 + ay0. To je obecná rovnice přímky el. 12 (1.13) ax + by = c, se známým vztahem dvojice čísel (a, b) = (—f3, a) a směrového vektoru přímky v = (a, f3) el.13 (1.14) aa + bfi = 0. 26 CHAPTER 1. KRŮČKY K MATEMATZC&ÍMWmimEÉWŮWINĚ el. 14 1.25 1 ^ Výraz nalevo v rovnici přímky (1.13) můžeme vidět jako skalární funkci F závislou na bodech v rovině a s hodnotami v M, samu rovnici pak jako požada-r"'srw -iJm T ve^ na JeJí hodnotu. Časem uvidíme, že vektor (a, b) je v tomto případě právě směrem, ve kterém F nejrychleji roste. Proto bude směr kolmý na (a, b) právě tím směrem, ve kterém zůstává naše funkce F konstantní. Konstanta c pak určuje, kterou ze všech rovnoběžných přímek rovnice určuje. Mějme nyní dvě přímky p a q a ptejme se po jejich průniku p n q. Ten bude popsán jako bod, splňující obě rovnice přímek současně. Pišme je takto ax + by = r (1-15) , , cx + a y = s. Opět můžeme levou stranu vnímat jako přiřazení, které každé dvojici souřadnic [x, y] bodů P v rovině přiřadí vektor hodnot dvou skalárních funkcí F\ a Fj_ daných levými stranami jednotlivých rovnic (1.15). Můžeme tedy naše rovnice napsat jako jediný vztah F (v) = w, kde F je přiřazení, které vektor v popisující polohu obecného bodu v rovině (v našich souřadnicích) zobrazí na vektor zadaný levou stranou rovnic, a požadujeme, aby se toto zobrazení strefilo do předem zadané hodnoty w = (r, s). 1.26. Lineární zobrazení a matice. Přiřazení F, se kterými %, jsme pracovali při popisu průniku přímek, mají jednu velice podstatnou společnou vlastnost: ISg-r respektují operace sčítání a násobení s vektory a skaláry, tj. respektují lineární kombinace: a ■ F (v) + b p2 F(w) F (a ■ v + b ■ w) pro všechny a, b e M, v, w e M2. Říkáme, že F je lineárni zobrazení z M2 do M2, a píšeme F : M2 -> M2. Slovy lze podmínku také vyjádřit tak, že lineární kombinace vektorů se zobrazuje na tutéž lineární kombinaci jejich obrazů, tj. lineární zobrazení jsou ta zobrazení, která zachovávají lineární kombinace. 27 5. (muMwmiR. vkuiMmř k matematickým problémům Se stejným chováním jsme se setkali i v rovnici (1.13) pro přímku, kde šlo o lineární zobrazení F : M2 -» M a jeho předepsanou hodnotu c. To je také důvodem, proč jsou hodnoty zobrazení z = F(x, y) na obrázku vyobrazeny jako rovina v M3. Stručně budeme zapisovat taková zobrazení pomocí tzv. matic a jejich násobení. Maticí rozumíme obdélníkové schéma skalárů, např. (a nebo v = \ \ , c d) \y) hovoříme o (čtvercové) matici a a (sloupcovém) vektoru v. Jejich násobení definujeme takto: (a b\ /x\ íax + by\ c d J \y) \cx +dy) Podobně, můžeme místo vektoru v zprava násobit jinou maticí b stejného rozměru jako je A. Prostě aplikujeme předchozí formule po jednotlivých sloupcích matice b a obrdržíme jako výsledek opět čtvercovou matici. Neumíme násobit vektor v zprava maticí A protože nám nevychází počty skalárů na řádcích v s počty skalárů ve sloupcích A. Umíme však napsat vektor * v w do řádku skalárů (tzv. transponovaný vektor) wT = (a b) a ten zprava našimi maticemi A nebo vektory v již násobit umíme. Snadno ověříme tzv. asociativitu násobení (propočítejte pro obecné matice A, b a. vektor v detailně): (A ■ b) ■ v = A ■ (b ■ v). Místo vektoru v můžeme samozřejmě psát i libovolnou matici C správného rozměru. Stejně snadno je vidět i distributivita A-(b + C) = A-b + A-C, neplatí však komutativita a existují „dělitelé nuly". Např. /O 1\ /O 0\ _ /O 1\ /O 0\ /O 1\ _ /O 0\ [p o)\o 1/ vo °/'V° v'\0 °) ~ \° °)' Zejména vidíme, že násobení vektorů pevnou maticí zadává linerání zobrazení, a naopak, pomocí hodnot lineárního zobrazení F na dvou pevných vektorech báze už dostaneme celé příslušné zobrazení. Body v rovině jsou tedy obecně vzory hodnot lineárních zobrazení F roviny do roviny, přímky jsou obecně vzory hodnot lineárních zobrazení z roviny do reálné přímky M. S maticemi a vektory umíme rovnice pro přímky a body psát T W ;) o o a ■ v = ^ ,111 = 1 \ = u. Samozřejmě, ve zvláštních situacích tomu tak být nemusí. Tak třeba průnikem dvou stejných přímek je opět sama přímka (a vzorem vhodné hodnoty pro takové lineární zobrazení bude celá přímka), nulové zobrazení má za vzor nuly celou rovinu. 28 CHAPTER 1. KRŮČKY K MATEMAT3.C&ÍMWRWIEÉWŮW1NĚ V prvém případě to poznáme tak, že jsou nalevo v rovnicích (1.15) stejné výrazy až na skalární násobek (nebo jinak řečeno, řádky matice A jsou stejné až na skalární násobek). V takovém případě buď nebude v průniku příslušných přímek žádný bod (rovnoběžné různé přímky) nebo tam budou všechny body přímky (stejné přímky). Tuto podmínku může vyjádřit tak, že poměry a/c nb/d musí být stejné, neboli el. 15 | (1.16) ad-bc = 0. Všimněme si, že toto vyjádření už zahrnuje i případy, kdy c nebo d je nulové. 1.25a 1.25b 1.27. Determinant matice. Výrazu nalevo v (1.16) říkáme determinant matice A a píšeme pro něj det A a b c d ad — bc. Naši diskusi teď můžeme vyjádřit takto: Tvrzení. Determinant je skalární funkce det A definovaná na všech maticích A a rovnice A-v = u je jednoznačně řešitelná, právě když je det A / O. Zkuste promyslet, že pro tuto úvahu bylo podstatné, že \A pracujeme s polem skalárů. Například nad celými čísly obecně neplatí. Když prostě spočteme řešení rovnic s celočíselnými koeficienty (tj. matice A má pouze celočíselné vstupy), tak toto řešení celočíselné být nemusí. 1.28. Afinní zobrazení. Podíváme se, jak maticová symbolika umožňuje pracovat s jednoduchými zobrazeními v afinní rovině. Viděli jsme, že násobením maticí je dáno linerání zobrazení. Posunutí v afinní rovině M2 o pevný vektor t = (r, s) e M2 umíme v maticové formě také snadno zapsat: '-CH+-CK)-(;:0- Jestliže k výsledku lineárního zobrazení ještě dovolíme přičíst pevný vektor t = (r, s), pak naše zobrazení bude mít tvar O/ax + by + r\ h> A-v + t = , . , • \cx +dy + s) Takto jsou popsána právě všechna tzv. afinní zobrazení roviny do sebe. Taková zobrazení nám umožní přepočítávání souřad-vx nic vzniklých různými volbami počátků a bází % směrů pro posunutí. Co se stane, když náš pozorovatel z odstavce 1.23 bude tutéž rovinu shlížet z jiného bodu nebo si aspoň vybere jiné body E\, E2? Zkuste si promyslet, že na úrovni souřadnic to skutečně bude právě změna realizovaná pomocí afinního zobrazení. Časem budeme vidět obecné důvody, proč tomu tak je ve všech dimenzích. 29 5. (mUMWEHR. VmílMMŘ K MATEMATICKÝM PROBLÉMŮM 1.26 1.29. Euklidovská rovina. Přidejme nyní schopnost našeho pozorovatele vidět vzdálenosti. Např. může věřit obvyklému vzorci pro velikost vektoru v = (a, b) \\v\\ = Va2 + b2 v jím zvolených afinních souřadnicích. Okamžitě pak můžeme definovat pojmy jako jsou úhel a otočení v rovině. Jednoduše si to můžeme představit takto: náš člověk se <řgg^ rozhodne o nějakých bodech E\ a E2, že jsou ■^y^^^t °d něj ve vzdálenosti jedna, a zároveň si řekne, i^4Jgíg_- že jsou na sebe kolmé. Vzdálenosti ve směrech souřadných os pak jsou dány příslušným poměrem, obecně používá Euklidovu (nebo Pythagorovu) větu. Odtud vyjde právě výše uvedený vzorec. Náš pozorovatel roviny může samozřejmě postupovat i jinak. Může použít nějaký standard pro skutečné měření vzdálenosti bodů P a Q v rovině a říci, že to je právě velikost vektoru Q — P, který potřebujeme na posunutí z P do Q. Pak si vybere nějaký z vektorů, které skutečně mají velikost 1 a třeba pomocí trojúhelníku o stranách s velikostmi 3, 4 a 5 zkonstruuje kolmý vektor o velikosti jedna a dále pokračuje jako výše. 30 CHAPTER 1. KRŮČKY K MATEMAT3.C&ÍMWRWIEÉWŮW1NĚ Euklidovská rovina je afinní rovina s výše zavedeným pojmem vzdálenosti. 1.30. Uhel vektorů. Jak jsme již používali při diskusi komplexních čísel coby bodů v rovině, tzv. goniometrická funkce cos

M2 lze vcelku snadno uhádnout: Je-li totiž výsledkem matice se sloupci (a, c) a (b,d), pak první sloupec dostaneme násobením této matice s prvním vektorem báze (1, 0) a druhý je vyčíslením na druhém vektoru báze (0, 1). 31 5. (mUMWEHR. VmílMMŘ K MATEMATICKÝM PROBLÉMŮM Z obrázku je proto vidět, že pro rotaci o úhel \jj proti směru hodinových ruček jsou v matici sloupce (a A/l\_/cosiA (a b\ /0\ _ /- sin f\ \c d)[p)~\smÝ) \c d) \\) ~ \ cos V / Směr proti směru hodinových ruček označujeme jako kladný směr rotace, opačný je pak záporný. Proto dostáváme tvrzení: Rotace o předem daný úhel \jj v kladném směru kolem počátku souřadnic je dána maticí R^: /cos ý — sin i/A /x\ ^ ysini/^ cos ý ) \y) Matice rotace Nyní, když už víme, jak vypadá matice otočení v rovině, můžeme ověřit, že otočení zachovává vzdálenosti a úhly (definované předešlým vzorcem). Označíme-li obraz vektoru v jako v'=(V'x\=R -v = (v*cos^ ~ vysinÝ \y'y J ^ \yx sin Ý + vy cos Ý a podobně w' = Rf-w, pak lze snadno přepočítat, že opravdu platí llw'11 = NI V'XW'X + V'yw'y = VXWX + VyWy. Předchozí výraz lze pomocí vektorů a matic napsat následovně (Rý ■ w)T(Rf ■ v) = wTv. Transponovaný vektor (R^ ■ w)T je roven wT ■ R^, kde je tzv. transponovaná matice k matici R^,. To je matice, jejíž řádky tvoří sloupce původní matice a sloupce naopak tvoří řádky původní matice. Vidíme tedy, že matice otočení splňují 32 CHAPTER 1. KRŮČKY K MATEMATZC&ÍMWmimEÉWŮWINĚ vztah ■ Rý = I, matice / (někdy píšeme prostě 1 a máme tím na mysli jednotku v okruhu matic), je tzv. jednotková matice Tím jsme odvodili pozoruhodné tvrzení — matice F s vlastností, že F ■ Rý = I (budeme takové říkat inverzní matice k matici rotace R^) je maticí transponovanou k původní. To je logické, neboť inverzní zobrazení k rotaci o úhel ý je opět rotace, ale o úhel —ý, tj. inverzní matice RL je rovna matici R. Vsi cos(-sin(- — sin(—ý) cos(-ý) )( cos ý sin ý \ y— sin ý cos ý) Pokud bychom chtěli zapsat rotaci kolem jiného bodu O + w, P = [wx w ,], opět pomocí matice, snadno napíšeme potřebný vzorec pomocí posunutí: ? Stačí si k tomu uvědomit, že můžeme místo rotace kolem daného bodu P napřed posunout P do našeho počátku, pak provést rotaci a pak udělat opačné posunutí, kterým celou rovinu vrátíme tam, kde měla celou dobu být, viz obrázek. Počítejme tedy -0 W Rý ■ (v -w) + w w) (cosý(x ~ wx) — sini/^y sin V^(x — wx) + cos Ý(y - - Wy) + WX Wy)) + Wy 1.32. Zrcadlení. Dalším dobře známým příkladem zobra-!Í?K zení, která zachovávají velikosti, je tzv. zrcadlení vzhledem kpřímce. Opět nám bude stačit popsat zrcadlení vzhledem k přímkám procházejícím 14 počátkem O a ostatní se z nich odvodí pomocí posunutí, resp. rotací. Hledejme tedy matici zrcadlení vzhledem k přímce s jednotkovým směrovým vektorem v svírajícím úhel ý s vektorem (1,0). Nejprve si uvědomme, že Z0 C -°0 33 5. (mUMWEHR. VKUIMMR K MATEMATICKÝM PROBLÉMŮM Obecně můžeme každou přímku otočit do směru vektoru (1,0) a tedy zapsat obecnou matici zrcadlení jako Z'ý = Rý • Zq ■ R-ý, kdy nejprve otočíme maticí přímku do „nulové" polohy, odzrcadlíme maticí Zo a vrátíme zpět otočením R f. Můžeme proto (díky asociativitě násobení matic) spočíst: cos ý sin ý cos ý sin ý Vsi — sin ý cos ý sin ý — cos ý )-(í -°0-( )/ cos ý sin i/A y— sin ý cos ý) ''cos2 ý — sin2 Ý ^ 2 sin ý cos Videos 21/f sinlÝ isin2i^ —cos2ý cos l/f - sin ý cos i/r 2 sin ý cos i/r -(cos2 i/r — sin2 ý) cos i/r sin ý - sin i/r cos yfr j sin i/fs ) ) Použili jsme přitom obvyklé součtové vzorce pro goniometrické funkce. Povšimněme si také, že Z^ • Z0 je dáno: sin 2^ sin 21/f - cos2ý )-C -°0-( cos2ý — sin2i/fN sin 21/f cos2ý Toto pozorování lze zakreslit a zformulovat následovně 34 CHAPTER 1. KRŮČKY K MATEMAT3.C&ÍMWRWIEÉWĚW1NĚ Tvrzení. Otočení o úhel ý obdržíme následným provedením dvou zrcadlení vzhledem ke směrům, které spolu svírají úhel Pokud umíme odůvodnit předchozí tvrzení ryze y geometrickou úvahou (zkuste si zahrát na „syntetického geometra"), dokázali jsme právě standardní vzorce pro goniometrické funkce dvojnásobného úhlu. Hlubší je následující rekapitulace předchozích úvah (skoro si můžeme říci, že už umíme dokázat skutečně zajímavý matematický výsledek): 1.33. Věta. Lineární zobrazení euklidovské roviny je složeno z jednoho nebo více zrcadlení, právě když je dáno maticí R splňující i ab + cd = 0, a2 + c2 = b2 + d2 = 1. To nastane, právě když toto zobrazení zachovává velikosti. Otočením je takové zobrazení přitom právě tehdy, když je determinant matice R roven jedné, což odpovídá sudému počtu zrcadlení. Při lichém počtu zrcadlení je determinant roven —1. Zobrazení zachovávající velikosti Důkaz. Zkusme napřed spočíst, jak může vypadat obecně matice A, když příslušné zob-WLJ&^xf razení zachovává velikosti. Tj. máme zobrazení O(a b\ /x\ fax+by\ ^ \c d)' \y) = \cx + dy)-Zachování velikosti tedy znamená, že pro všechna x a v je x2 + y2 = (ax + by)2 + (cx + dy)2 = = (a2 + c2)x2 + (b2 + d2)y2 + 2(ab + cd)xy. Protože má tato rovnost platit pro všechna x a v, musí si být rovny koeficienty u jednotlivých mocnin x2, y2 a xy na pravé i levé straně. Tím jsme spočetli, že rovnosti kladené na matici R v prvním tvrzení dokazované věty jsou ekvivalentní vlastnosti, že příslušné zobrazení zachovává velikosti. Díky vztahu a2 + c2 = 1 můžeme předpokládat, že a = cos cp a c = sin cp pro vhodný úhel cp. Jakmile takto zvolíme první sloupec matice i?, až na násobek nám vztah ab + cd = 0 určuje i druhý sloupec. Zároveň ale víme, že i velikost vektoru ve druhém sloupci je jedna a dostáváme tedy právě dvě možnosti pro matici R: (cos cp — sin cp\ /cos cp sin cp \ úncp cos

pro určování pozice bodu vůči orientovaným úsečkám. r\Enř Orientovanou úsečkou rozumíme dva body v rovině ifí' 1 M.2 s určeným pořadím. Můžeme šiji představit jako šipku od prvého k druhému bodu. Taková orientovaná úsečka nám rozděluje rovinu na dvě poloroviny, říkejme jim „levou" a „pravou". Pro daný bod chceme poznat, jestli je v té levé nebo pravé. Takové úlohy často potkáváme v počítačové grafice při řešení viditelnosti objektů. Pro zjednodušení si zde jen představme, že úsečku „je vidět" z bodů nalevo a není vidět z těch napravo. Máme-li dán nějaký bod C, spočtěme orientovanou plochu příslušného trojúhelníku zadaného vektory A — C a B — C. Pokud jsme s bodem C nalevo od úsečky, pak při obvyklé kladné orientaci proti směru hodinových ruček bude vektor A —C dříve než ten druhý a proto výsledná plocha (tj. hodnota determinantu matice jejímiž sloupci jsou tyto dva vektory) bude kladná. Naopak, při opačné poloze bude výsledkem záporná hodnota determinantu a podle záporné hodnoty determinantu zjistíme, že je náš bod od úsečky napravo. Uvedený jednoduchý postup je skutečně často využíván pro testování polohy při standardních úlohách v 2D grafice. V této závěrečné části úvodní motivační kapitoly se vrá-fiv tíme k formálnímu popisu matematických struk-tur, budeme se je ale průběžně snažit ilustrovat / 'f Y na již známých příkladech. Zároveň můžeme tuto ■^^-^rdé. část brát jako cvičení ve formálním přístupu k objektům a konceptům matematiky. 1.36. Relace mezi množinami. Nejprve potřebujeme definovat kartézský součin A x B dvou množin A a B. Je to množina všech uspořádaných dvojic (a, b) takových, že a e A a. b e B. Binární relací mezi množinami A a S pak rozumíme libovolnou podmnožinu R kartézského součinu A x B. Často píšeme a ~R b pro vyjádření skutečnosti, že (a, b) e R, tj. že body a e A a b e B jsou v relaci R. 6. Relace a zobrazení 37 6. REHMBEERTDBmŮÉKÝ K MATEMATICKÝM PROBLÉMŮM Definičním oborem relace je podmnožina Z) c A, D = {a e A; 3b e B, (a, b) e R}. Slovy vyjádřené, je to množina prvků a z množiny A takových, že existuje prvek b z množiny B tak, že (a, b) patří do relace R. Stručněji, jsou to takové prvky z A, které mají obraz v B. Podobně oborem hodnot relace je podmnožina I c 5, / = {ŔeB;3aeA,(íi,fe)e/?), to znamená takové prvky v 5, které mají vzor v A. Speciálním případem relace mezi množinami je zobrazení íji ,ry z množiny A do množiny B. Je to případ, kdy <\ Pro každý prvek definičního oboru relace exis-; tuje právě jeden prvek z oboru hodnot, který je s ním v relaci. Nám známým případem zobrazení jsou všechny skalární funkce, kde oborem hodnot zobrazení je množina skalárů, třeba celých nebo reálných čísel. Pro zobrazení zpravidla používáme značení, které jsme také u skalárních f uncí zavedli. Píšeme /:DCA^/CS, f (a) = b pro vyjádření skutečnosti, že (a, b) patří do relace, a říkáme, že b je hodnotou zobrazení / v bodě a. Dále říkáme, že / je • zobrazení množiny A do množiny B, jestliže je D = A, • zobrazení množiny A na množinu B, jestliže je D = A a I = B, často také surjektivnízobrazení • prosté (často také injektivní zobrazení), jestliže je D = A a pro každé bel existuje právě jeden vzor a e A, f (a) = b. Vyjádření zobrazení / : A -» B jakožto relace /cAxS, f = {(a, f (a)); a e A} známe také pod názvem graf zobrazení f. 0: ttorAfs^ tnvY^Vl č>V)oC Ol— **** k 38 CHAPTER 1. KRŮČKY K MATEMAT6CEĚMMHDBEÉMÉM,ENÍ 1.31 1.37. Skládání relací a funkcí. U zobrazení je jasná koncepce, jak se skládají. Máme-li dvě zobrazení f : A ^ B a. g : B -» C, pak jejich složení g o f : A -» C je definováno (g o f)(a) = g(f(a)). Ve značení používaném pro relace totéž můžeme zapsat jako /cAxS, / = {(a, f (a)); a e A} g^BxC, g = {(b,g(b)y,beB} gof^AxC, gof = {(a,g(f(a)))-aeA}. Zcela obdobně definujeme skládání relací, v předchozích ^jg, vztazích jen doplníme existenční kvantifikátory, '■) tj. musíme uvažovat všechny „vzory" a všechny /^*ť&04 „obrazy". Uvažme relace R c A x B, S c flfofW > B x C. Potom 5 o i? c A x C, 5 o i? = {(o, c); 36 e S, (a, ŕ) e i?, (ŕ, c) e 5}. Zvláštním případem relace je identické zobrazení idA = {(a, a) e A x A; a e A] na množině A. Je neutrální vzhledem ke skládání s každou relací s definičním oborem nebo oborem hodnot A. Pro každou relaci i? c A x S definujeme inverzní relaci R-1 = {(b, a); (a, b) e R} c B x A. Pozor, u zobrazení, je stejný pojem užíván ve specifičtější situaci. Samozřejmě, že existuje pro každé zobrazení jeho invezní relace, ta však nemusí být zobrazením. Zcela logicky proto hovoříme o existenci inverzního zobrazení, pokud každý 39 6. REHMBEERTDBmŮÉKÝ K MATEMATICKÝM PROBLÉMŮM prvek b e B je obrazem pro právě jeden vzor v A. V takovém případě je samozřejmě inverzní zobrazení právě inverzní relací. Všimněme si, že složením zobrazení a jeho inverzního zobrazení (pokud obě existují) vždy vznikne identické obražení, u obecných relací tomu tak být nemusí. 1.32 | 1.38. Relace na množině. V případě A = B hovoříme o relaci na množině A. Říkáme, že relace R je: • reflexivní, pokud idA c R, tj. (a, a) e R pro všechny a e A, • symetrická, pokud R~l = i?, tj. pokud (a,b) e R, pak i (b, a) e R, • antisymetrická, pokud R~l n R c idA, tj. pokud (a, ŕ) e i? a zároveň (b, a) e i?, pak a = b, • tranzitivní, pokud R o R c i?, tj. pokud z (a, b) € R a. (b, c) e R vyplývá i (a, c) e i?. Relace se nazývá ekvivalence, pokud je současně reflexivní, symetrická i tranzitivní. Relace se nazývá uspořádání jestliže je reflexivní, tranzitivní a antisymetrická. Relaci uspořádání obvykle značíme symbolem <, tj. skutečnost, že prvek a je v relaci s prvkem b značíme a < b. Zde je dobré si uvědomit, že relace <, tj. „býti ostře menší než", mezi reálnými (racionálními, celými, přirozenými) čísly není relace uspořádání, protože není reflexivní. Dobrým příkladem uspořádání je inkluze. Uvažme množinu 2A všech podmnožin konečné množiny A (značení je speciálním případem obvyklé notace BA pro množinu všech zobrazení z A do B; prvky množiny 2A jsou tedy zobrazení A -» {0, 1}, které "říkají", zda určitý prvek je či není v dané podmnožině) a na ní relaci X c Z danou vlastností „být podmnožinou". Evidentně jsou splněny všechny tři vlastnosti pro uspořádání: skutečně, je-li X c Y a zároveň Y c X musí být nutně množiny X a Y stejné. Je-li X c Y c Z je také XcZa také reflexivita je zřejmá. Říkáme, že uspořádání < na množině A je úplné, když pro každé dva prvky a, b e A platí, že jsou srovnatelné, tj. buď a < ŕ nebo b < a. Všimněme si, že ne všechny dvojice (X, Y) podmnožin v A jsou srovnatelné v tomto smyslu. Přesněji, pokud je v A více než jeden prvek, existují podmnožiny X a.Y, kdy není ani X c Y ani Y c X. Připomeňme rekurentní definici přirozených čísel N = {0,1,2, 3,...}, kde 0 = 0, n + 1 = {0, 1,2, ...,«}. Na této množině N definujeme relaci < následovně: m < n, právě když m e n nebo m = n. Evidentně jde o úplné uspořádání. Např. 2 < 4, protože 2 = {0, {0}} s {0, {0}, {0, {0}}, {0, {0}, {0, {0}}}} = 4. 40 CHAPTER 1. KRŮČKY K MATEMAT6CEĚMMHDSEÉMÉM,ENÍ Jinak řečeno, samotná rekurentní definice zadává vztah n < n + 1 a tranzitivně pak n < k pro všechna k, která jsou tímto postupem definována později. 1.33 | 1.39. Rozklad podle ekvivalence. Každá ekvivalence R na množině A zadává zároveň rozklad množiny A >, na podmnožiny vzájemně ekvivalentních prvků, tzv. třídy ekvivalence. Pro libovolné a e A uvažujeme třídu (množinu) prvků, které jsou ekvivalentní s prvkem a, tj. Ra = {b e A; (a,b) e R}. Často budeme psát pro Ra prostě [a], je-li z kontextu zřejmé, o kterou ekvivalenci jde. Zjevně Ra = Rh, právě když (a, b) e R a každá taková třída ekvivalence je tedy reprezentována kterýmkoliv svým prvkem, tzv. reprezentantem. Zároveň Ra ľ\ Rh ^ 0, právě když Ra = Rb,t\. třídy ekvivalence jsou po dvou disjunktní. Konečně, A = Daej^Ra, tj. celá množina A se skutečně rozloží na jednotlivé třídy. Můžeme také třídám rozkladu rozumět tak, že třídu [a] vnímáme jako prvek a „až na ekvivalenci". 1. 34 1.40. Konstrukce celých a racionálních čísel. Na přirozených číslech umíme sice sčítat a víme, že přičtením nuly se číslo nezmění. Umíme i definovat odečítání, při něm ale jen někdy existuje výsledek v množině N. Základní ideou konstrukce celých čísel z přirozených je tedy přidat k nim chybějící rozdíly. To můžeme udělat tak, že místo výsledku odečítání budeme pracovat s uspořádanými dvojicemi čísel, které nám samozřejmě vždy výsledek dobře reprezentují. Zbývá jen dobře definovat, kdy jsou (z hlediska výsledku odečítání) takové dvojice ekvivalentní. Potřebný vztah tedy je: (a,b) ~ (a',b') <í=^ a-b=a'-b' <í=^ a+b' = a'+b. Všimněme si, že zatímco výrazy v prostřední rovnosti v přirozených číslech neumíme, výrazy vpravo už ano. Snadno ověříme, že skutečně jde o ekvivalenci a její třídy označíme jako celá čísla Z. Na nich definujeme operaci sčítání (a s ní i odečítání) pomocí reprezentantů. Např. [(a,b)] + [(c,d)] = [(a+c,b + d)], což zjevně nezávisí na výběru reprezentantů. Lze si přitom vždy volit reprezentanty (a, 0) pro kladná čísla a reprezentanty (0, a) pro čísla záporná, se kterými se nám bude patrně počítat nejlépe. Tento jednoduchý příklad ukazuje, jak důležité je umět nahlížet na třídy ekvivalence jako na celistvý objekt a soustředit se na vlastnosti těchto objektů, nikoliv formální popisy jejich konstrukcí. Ty jsou však důležité k ověření, že takové objekty vůbec existují. 41 6. REHMBEERTDBmĚÉKÝ K MATEMATICKÝM PROBLÉMŮM 1.35 U celých čísel nám už platí všechny vlastnosti skalárů (KG1)-(KG4) a (01)-(04), viz odstavce 1.1 a 1.3. Pro násobení je neutrálním prvkem jednička, ale pro všechna čísla a různá od nuly a jedničky neumíme najít číslo a-1 s vlastností a ■ a~l = 1, tzn. chybí nám inverzní prvky pro násobení. Zároveň si povšimněme, že platí vlastnost oboru integrity (Ol), viz 1.3, tzn. je-li součin dvou čísel nulový, musí být alespoň jedno z nich nula. Díky poslední jmenované vlastnosti můžeme zkonstruovat racionální čísla Q přidáním všech chybějících inverzí zcela obdobným způsobem, jak jsme konstruovali Z z množiny N. Na množině uspořádaných dvojic (p, q), q ^ 0, celých čísel definujeme relaci ~ tak, jak očekáváme, že se mají chovat podíly p Iq: (p,q) ~ (p',q') p/q = p'/q' p-q' = p'-q- Opět neumíme očekávané chování v prostřední rovnosti v množině Z formulovat, nicméně rovnost na pravé straně ano. Zjevně jde o dobře definovanou relaci ekvivalence (ověřte podrobnosti!) a racionální čísla jsou pak její třídy ekvivalence. Když budeme formálně psát p/q místo dvojic (p, q), budeme definovat operace násobení a sčítání právě pomocí formulí, které nám jsou jistě dobře známy. 1.41. Zbytkové třídy. Jiným dobrým a jednoduchým přfkla-t!S\^ dem jsou tzv. zbytkové třídy celých čísel. Pro ,'"S^-yfi^ pevně zvolené přirozené číslo k definujeme ekvi-^ _ valenci ~k tak, že dvě čísla a, b e Z jsou ekvi-- valentní, jestliže jejich zbytek po dělení číslem k je stejný. Výslednou množinu tříd ekvivalence označujeme Zjfc. Nejjednodušší je tato procedura pro k = 2. To dostáváme Z2 = {0, 1}, kde nula reprezentuje sudá čísla, zatímco jednička čísla lichá. Opět lze snadno zjistit, že pomocí reprezentantů můžeme koerektně definovat násobení a sčítání na každém Z*. Věta. Zbytkové třídy Z* jsou komutativním tělesem skalárů (tj. splňují i vlastnost (P) z odstavce 1.3), právě když je k prvočíslo. Pokud k prvočíslem není, obsahuje Z vždy dělitele nuly, není proto ani obor integrity. Důkaz. Okamžitě je vidět druhé tvrzení — jestliže x ■ y = k pro přirozená čísla x, y, pak samozřejmě je výsledek násobení příslušných tříd [x] ■ [v] nulový. Naopak, jsou-li x a k nesoudělná, existují podle tzv. Bez-outovy rovnosti, kterou dovodíme později (viz ??) přirozená čísla a a b splňující a x + b k = 1, což pro odpovídající třídy ekvivalence dává [a] ■ [x] + [0] = [a] ■ [x] = [1] a proto je [a] inverzním prvkem k [x]. □ 42 KAPITOLA 2 Elementární lineární algebra V minulé kapitole jsme se snad rozehřáli s relativně jednoduchými úlohami, k jejichž řešení nebylo potřeba složitých nástrojů. Vystačili jsme si přitom se sčítáním a násobením skalárů. V této a dalších kapitolách se postupně budeme věnovat jednotlivým tématům souvisleji. Hned tři kapitoly budou věnovány nástrojům pro práci s daty, kdy operace spočívají v obzvlášť jednoduchých úkonech se skaláry, jen je těch skalárů povíce naráz. Hovoříme o „lineárních objektech" a „lineární algebře". Jakkoliv to teď může vypadat jako hodně speciální nástroj, uvidíme později, že složitější objekty a závislosti stejně studujeme hlavně pomocí jejich „lineárních přiblížení". V této kapitole budeme pracovat přímo s konečnými posloupnostmi skalárů. Takové se objevují v praktických úlohách všude, kde máme objekty popisovány pomocí několika parametrů. Nedělejme si přitom problémy s představou, jak vypadá prostor s více než třemi „souřadnicemi". Smiřme se se skutečností, že malovat si budeme umět jednu, dvě nebo tři dimenze, ale představovat ty obrázky mohou jakýkoliv jiný počet. A když budeme sledovat jakýkoliv parametr u třeba 500 studentů (např. jejich váhu nebo věk), budou naše data mít hned zrovna 500 položek a budeme s nimi chtít pracovat. Naším cílem bude vytvořit nástroje, které budou dobře fungovat nezávisle na skutečném počtu těchto položek. Také se neděsme slovních spojení jako pole či okruh skalárů K. Prostě si můžeme představit jakýkoliv konkrétní číselný obor. Okruhy skalárů pak zahrnují i celá čísla Z a všechny zbytkové třídy, zatímco mezi poli jsou pouze M, Q, C a zbytkové třídy 1,k s prvočíselným k. Zvláštní je mezi nimi Z2, kde ze vztahu x = —x nemůžeme usoudit, že x = 0, zatímco u všech ostatních číselných oborů tomu tak je. Většinou se o vektorech hovoří pouze ve spojení s poli skalárů, protože obecná teorie je při existenci neivertibilních nenulových skalárů nesrovnatelně složitější. Jen v prvních dvou částech této kapitoly budeme pracovat s vektory a maticemi v kontextu konečných poslouností skalárů a tam bude zajímavé si i třeba případu celých čísel povšimnout. Bude přitom snad pěkně vidět, jak silné výsledky lze důslednným formálním uvažováním odvodit. _. 1. Vektory a matice 2. 1 | 2.1. Vektory nad skaláry. Prozatím budeme vektorem rozumět uspořádanou n-tici skalárů z K, kde pevně zvolené neN budeme nazývat dimenzí. 43 1. VEKTOmmmiEICE elementární lineární algebra Skaláry umíme sčítat a násobit. Vektory budeme také sčítat, násobit však vektor budeme umět jen skalárem. To odpovídá představě, kterou jsme již viděli v rovině M2, kde sčítání odpovídalo skládání vektorů coby šipek vycházejících z počátku a násobení skalárem pak jejich patřičnému natahování. Násobení vektoru u = (a\, ... ,an) skalárem b tedy definujeme tak, že každý prvek n-tice u vynásobíme stejným skalárem b a také sčítání vektorů definujeme po složkách.. To znamená u + v = {a\, ..., an) + (b\, ..., b„) = {a\ + b\, ..., b ■ u = b • (cl\, ..., a„) = (b • a\, ... ,b • a„). Základní operace s vektory Pro sčítání vektorů a násobení vektorů skaláry budeme používat stále stejné symboly jako u skalárů samotných, tj. symboly plus a buď tečku nebo prosté zřetězení znaků. Konvence zápisu vektorů. Nebudeme, na rozdíl od mnoha jiných učebnic, v textu používat pro vektory žádné speciální značení a ponecháváme na čtenáři, aby udržoval svoji pozornost přemýšlením o kontextu. Pro skaláry ale spíše budeme používat písmena ze začátku abecedy a pro vektory od konce (prostředek nám zůstane na indexy proměných či komponent a také pro sčítací indexy v součtech). Často budeme požadovat, aby skaláry byly z nějakého pole, viz 1.1, ale v této kapitole budeme vesměs pracovat s operacemi, které tento přepoklad nepotřebují. V literatuře se pak většinou místo o vektorových prostorech hovoří o modulech nad okruhy. U obecné teorie se ale v příští kapitole již zcela omezíme na pole skalárů. Pro sčítání vektorů v W zjevně platí (KG1)-(KG4) s nulovým prvkem 0 = (0.....0)eK". Schválně zde používáme i pro nulový prvek stejný symbol jako pro nulový prvek skalárů. Pro všechny vektory v, w e K" a skaláry a, b e K platí (VI) a ■ (v + w) = a ■ v + a ■ w (V2) (a + b) ■ v = a ■ v + b ■ v (V3) a ■ (b ■ v) = (a ■ b) ■ v (V4) 1 • v = v Vlastnosti vektorů Vlastnosti vektorů (V1)-(V4) se pro W snadno ověří pro kterýkoliv okruh skalárů K, protože při ověřování vždy používáme pro jednotlivé souřadnice vektorů pouze vlastnosti skalárů uvedené v 1.1 a 1.3. 44 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ AMMERW A MATICE Budeme takto pracovat např. s '. (Zk)n,n = 1,2,3, .... y, ale také Z", 2.2. Matice nad skaláry. O něco složitějším objektem, který budeme při práci s vektory používat, jsou matice. Maticí typu m/n nad skaláry K rozumíme obdélníkové schéma /fln «12 ... «1« \ «21 a22 ■ ■ ■ a2n \j2m\ am2 ■ ■ ■ @mn J kde ciij e K pro všechny 1 < i < m, 1 < j < n. Matici A s prvky dij značíme také A = (atj). Vektory (au, ai2, ..., aín) e W nazýváme (i-té) řádky matice A, i = 1, ..., m, vektory (a\j, a2j, nazýváme (7—té) sloupce matice A, j = 1, I Matice nad skaláry @mj) ^ n. Matici můžeme také chápat jako zobrazení A : {1, ...,m} x {1, ...,n} K, kde A(i, j) = aij. Matice typu 1/n nebo n/1 jsou vlastně právě vektory v K". I obecné matice lze chápat jako vektory v Km'n, prostě zapomeneme na řádkování. Zejména tedy je definováno sčítání matic a násobení matic skaláry: A + B = {ciij + bij), a ■ A = (a ■ a^) kde A = (flij), B = (bij), a e K. Matice — A = (—«ý) se nazývá matice opačná k matici A a matice /O ... 0\ 0 = : : v° ••• V se nazývá nulová matice. Zapomenutím řádkování tak získáme následující tvrzení, že matice jsou jen specificky zapsané vektory: Tvrzení. Předpisy pro A + B, a ■ A, —A, 0 zadávají na množině všech matic typu m/n operace sčítání a násobení skaláry splňující axiomy (VI )—(V4). 2.3. Matice a rovnice. Velmi častý nástroj pro popis nějakých matematických modelů jsou systémy lineárních rovnic. Právě matice lze vhodně využít pro jejich zápis. Uvažme následující systém m rovnic v n proměnných: «11X1 + «12X2 + ^21-^1 + d22x2 + -\- a2nxn "i- ^m2-^2 "i- ' ' ' "i- ^mn-^n — bm. Posloupnost x\, ..., xn lze chápat jako vektor proměnných, tj. sloupec v matici typu n/1, a podobně hodnoty b\, ...,&„ 45 1. VEKTOmmmiEICE ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA můžeme vnímat jako vektor m a to opět jako jediný sloupec v matici typu n/1. Systém rovnic lze pak formálně psát ve tvaru A ■ x = u takto: (an ... aln\ /xA (bA 2.4 2.5 \am\ . . . amnJ J \bn J Původní rovnice nyní obdržíme tak, že vždy bereme řádky z A a sčítáme součiny odpovídajících komponent. To znamená, že skutečně jako z-tý prvek výsledného vektoru získáme a zápis A ■ x = u dává skutečně původní systém lineárních rovnic. V rovině, tj. pro vektory dimenze 2, jsme už zavedli takovýto počet a viděli jsme, že s ním lze pracovat velice efektivně (viz 1.26). Nyní budeme postupovat obecněji a zavedeme všechny nástroje již známé z roviny pro všechny dimenze n. 2.4. Součin matic. Násobení matic je definována pouze, když to rozměry sloupců a řádků v maticích dovolí: Pro libovolnou matici A = (a^) typu m/n nad okruhem skalárů K a libovolnou matici B = (bjk) typu n/q nad K' definujeme jejich součin C = A ■ B = (cik) jako matici typu m/q s prvky Cik n ■ 'S^aijbjk, pro libovolné \ 1 proto netvoří obor integrity, zejména tedy nejsou ani (nekomutativním) tělesem. Důkaz. Asociativita násobení - (01): Protože skaláry jsou asociativní, distributivní i komutativní, můžeme pro tři matice A = (aij) typu m/n, B = (bjk) typu n/p a C = (cu) typu p/q spočíst A ■ B j & (A - B) ■ C = y^J^aij.bj^.CkA = iy^^ajj.bjk.Ckij ^ k j ' \j,k ' A - (B - C) = i^aij-iYbjk.Cki)) = iy^^ajj.bjk.Ckij. ^ j k ' \j,k ' Všimněme si, že jsme při výpočtu vycházeli z toho, že je jedno v jakém pořadí uvedené součty a součiny provádíme, tj. využívali jsme podstatně našich vlastností skalárů. Velmi snadno vidíme, že násobení jednotkovou maticí má skutečně vlastnost jednotkového prvku: /l 0 ••• 0\ 0 1 ••• 0 A-E Clim\ &mm J \o o E-A Zbývá distributivita násobení a sčítání. Opět díky distri-butivitě skalárů snadno spočteme pro matice A = (a^) typu m/n, B = (bjk) typu n/p, C = (cjk) typu n/p, D = (dk[) typu p/q A-(B + C) yZ.aij(bJk + Cjk)) j A-B +A-C (B + O-D ( ^(bJk + Cjk)dkl j ^ k ' ((^bj.du) + (^cjkdkl)j = BD + CD \ 7, Ir ' k k Jak jsme již viděli v 1.26, dvě matice dimenze 2 nemusí komutovat: /i o\ /o iwo i\ \o o)\o o) \o o) (o i\ /i o\ = /o o\ \0 0J'\0 o) \o o) Tím jsme získali zároveň protipříklad na platnost (02) i (01). Pro matice typu 1/1 ovšem oba axiomy samozřejmě platí, protože je mají samy skaláry a pro větší matice získáme protipříklady snadno tak, že právě uvedené matice umístíme do levého horního rohu příslušných čtvercových schémat a doplníme nulami. (Ověřte si sami!) □ 47 1. VEKTOmmmiEICE ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA 2.6 V důkazu jsme vlastně pracovali s maticemi obecnějšího typu, dokázali jsme tedy příslušné vlastnosti obecněji: Důsledek. Násobení matic je asociativní a distributivní, tj. I A ■ (B ■ C) = (A ■ B) ■ C A-(B + C) = A-B + A-C, kdykoliv jsou všechny uvedené operace definovány. Jednotková matice je neutrálním prvkem pro násobení zleva i zprava. Asociativita a distributivita násobení matic ic J 2.6. Inverzní matice. Se skaláry umíme počítat tak, že z rovnosti út-x = b umíme vyjádřit x = a~l -b, kdykoliv inverze k a existuje. Podobně bychom to chtěli umět i s maticemi, máme ale problém, jak poznat, zda taková existuje, a jak ji spočítat. Říkáme, že B je matice inverzní k matici A, když A ■ B = B ■ A = E. Píšeme pak B = A-1 a je samozřejmé, že obě matice musí mít tutéž dimenzi n. Matici, k níž existuje matice inverzní, říkáme invertibilní matice. Pokud A~l a B~l existují, pak existuje i inverze k součinu A ■ B (A ■ B)'1 = B~l ■ A-1. Je totiž, díky právě dokázané asociativitě násobení, • A-1) • (A • B) B~l ■ (A-1 ■ A) ■ B (A-B)- (B~l ■ A-1) = A ■ (B ■ B~l) ■ A-1 : E E. Protože s maticemi umíme počítat podobně jako se skaláry, jen mají složitější chování, mohou nám skutečně hodně pomoci s řešením systémů lineárních rovnic: Jestliže vyjádříme soustavu n rovnic pro n neznámých součinem matic A • x \bm) a jestliže existuje matice inverzní k matici A, pak lze násobit zleva A-1 a dostaneme A • x = E • x x, tj. hledané řešení. Naopak rozepsáním podmínky A • A-1 = E pro neznámé skaláry v hledané matici A-1 dostaneme n systémů lineárních rovnic se stejnou maticí na levé straně a různými vektory napravo. 48 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ MEMIERW A MATICE 2.7. Ekvivalentní úpravy matic. Zkusme se praktičtěji zorientovat v předchozí úvaze o systémech rovnic a jejich maticích. Samozřejmě nás nalezení inverzní matice stojí jisté úsilí - větší než přímé vyřešení rovnice. Podstatné však je, že pokud máme mnohokrát za sebou řešit systémy se stejnou maticí A ale různými pravými stranami u, pak se nám nalezení A-1 opravdu hodně vyplatí. Z hlediska řešení systémů rovnic A ■ x = u je jistě přirozené považovat za ekvivalentní matice A a vektory u, které zadávají systémy rovnic se stejným řešením. Zkusme se teď zamyslet nad možnostmi, jak zjednodušovat matici A tak, abychom se k řešení blížili. Začneme jednoduchými manipulacemi s řádky rovnic, které řešení ovlivňovat nebudou, a stejným způsobem pak můžeme upravovat i vektor napravo. Když se nám u čtvercové matice podaří vlevo dostat systém s jednotkovou maticí, bude napravo řešení původního systému. Pokud při našem postupu nějaké řádky úplně vypadnou (při úpravách se vynulují), bude to také dávat další přímé informace o řešení. Naše jednoduché úpravy jsou: • záměna dvou řádků • vynásobení vybraného řádku nenulovým skalárem • přičtení řádku k jinému řádku. Těmto operacím říkáme řádkové elementární transformace. Je zjevné, že odpovídající operace na úrovni rovnic v systému skutečně nemohou změnit množinu všech jeho řešení. Analogicky, sloupcové elementární transformace matic jsou • záměna dvou sloupců • vynásobení vybraného sloupce nenulovým skalárem • přičtení sloupce k jinému sloupci, ty však nezachovávají řešení příslušných rovnic, protože mezi sebou míchají samotné proměnné. Systematicky můžeme použít elementární řádkové úpravy k postupné eliminaci proměnných. Postup je algoritmický a většinou se mu říká Gausova eliminace proměnných. Tvrzení. Nenulovou matici nad libovolným okruhem skalárů K lze konečně mnoha elementárními řádkovými transformacemi převést na tzv. (řádkově) schodovitý tvar: • Je-li aij = 0 a všechny předchozí prvky na i-tém řádku jsou také nulové, potom a^ = 0 pro všechna k > i • je-li ci(i-\)j první nenulový prvek na (i — \)-ním řádku, pak aij = 0. Řádkové elementární transformace Gaussova eliminace proměnných 49 1. VEKTOmmmiEICE ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Důkaz. Matice v řádkově schodovitém tvaru vypadá takto /O ... 0 aij 0 ... 0 0 0 ......... V ...... d\m\ <^2k ■ ■ ■ ^2m 0 alp ... / a matice může, ale nemusí, končit několika nulovými řádky. K převodu libovolné matice můžeme použít jednoduchý algoritmus, kterým se postupně, řádek za řádkem, blížíme k výslednému schodovitému tvaru: (1) Záměnou řádků docílíme, že v prvním řádku bude v prv-| ním nenulovém sloupci nenulový prvek, nechť je to j-tý sloupec. (2) Pro i = 2, ..., vynásobením prvního řádku prvkem atj, z-tého řádku prvkem a\j a odečtením vynulujeme prvek ciij na i-tém řádku. (3) Opakovanou aplikací bodů (1) a (2), vždy pro dosud neupravený zbytek řádků a sloupců v získané matici dospějeme po konečném počtu kroků k požadovanému tvaru. Algoritmus Gaussovy eliminace J Tím je tvrzení dokázáno □ Uvedený postup je skutečně právě obvyklá eliminace proměnných v systémech lineárních rovnic. Poznámka. Gaussovu eliminaci jsme sformulovali pro obecné skaláry z nějakého okruhu. Zdá se být přirozené, že ve schodovitém tvaru ještě vynásobením vhodnými skaláry dosáhneme jednotkových koeficientů na výsledné nenulové „diagonále" nad nulami v matici a dopočítáme řešení. To ale pro obecné skaláry nepůjde, představte si třeba celá čísla Z. Pro řešení systémů rovnic nemá ale vůbec uvedený postup rozumný smysl, když jsou mezi skaláry dělitelé nuly. Promyslete si pečlivě rozdíl mezi K = Z, K = M a případně Z2 nebo Z3. 2.8. Poznámka. V dalším budeme už pracovat jen s polem skalárů P, každý nenulový skalár je tedy invertibilní. Všimněme si, že elementární řádkové (resp. sloupcové) transformace odpovídají vynásobením zleva (resp. zprava) následujícími maticemi: 50 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ AMMERW A MATICE (1) Přehození z-tého a 7-tého řádku (resp. sloupce) \ /l 0 o '•. o V 1/ (2) Vynásobení z-tého řádku (resp. sloupce) skalárem a: í1 \ 1 a 1 V V (3) Sečtení z-tého řádku (resp. sloupce) s 7-tým: /l 0 o '•. \ 1/ Toto prostinké pozorování je ve skutečnosti velice podstatné, protože součin invertibilních matic je invertibilní a všechny elementární transformace jsou nad polem skalárů invertibilní. Pro libovolnou matici A tedy dostaneme násobením vhodnou invertibilní maticí P = Pk ■ ■ ■ P\ zleva (postupné násobení k maticemi zleva) její ekvivalentní řádkový schodovitý tvar A' = P ■ A. Jestliže obecně aplikujeme tentýž eliminační postup na sloupce, dostaneme z každé matice B její sloucový schodovitý tvar B' vynásobením vhodnou invertibilní maticí Q = Q1 • • • Qi ■ Pokud ale začneme s maticí B = A' v řádkově schodovitém tvaru, eliminuje takový postup pouze všechny dosud nenulové prvky mimo diagonálu matice a závěrem lze ještě i tyto elementárními operacemi změnit na jedničky. Celkem jsme tedy ověřili důležitý výsledek, ke kterému se budeme mnohokrát vracet: 2.9. Věta. Pro každou matici A typu m/n nad polem skalárů K existují čtvercové invertibilní matice P dimenze m a Q dimenze n takové, že matice P -Ajev řádkově schodovitém 51 1. VEKTOmmmiEICE ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA tvaru a 2 .10 2 .10a ŕ ■ . 0 " °\ 0 . . 1 0 ... . .. 0 0 . . 0 1 0 . .. 0 0 . . 0 0 0 . .. 0 v / P A-Q 2.10. Algoritmus pro výpočet inverzní matice. V předchozích úvahách jsme se dostali prakticky k úplnému algoritmu pro výpočet inverzní matice. Během jednoduchého níže uvedeného postupu buďzjistíme, že inverze neexistuje, nebo bude inverze spočtena. I nadále pracujeme nad polem skalárů. Ekvivalentní řádkové transformace se čtvercovou maticí A dimenze n vedou k matici P' takové, že matice P' ■ A bude v řádkově schodovitém tvaru. Přitom může (ale nemusí) být jeden nebo více posledních řádků nulových. Jestliže má existovat inverzní matice k A, pak existuje i inverzní matice k P' ■ A. Jestliže však je poslední řádek v P' ■ A nulový, bude nulový i poslední řádek v P' ■ A ■ B pro jakoukoliv matici B dimenze n. Existence takového nulového řádku ve výsledku (řádkové) Gaussovy eliminace tedy vylučuje existenci A~l. Předpokládejme nyní, že A~l existuje. Podle předchozího, nalezneme řádkově schodovitý tvar bez nulového řádku, tzn. že všechny diagonální prvky v P' ■ A jsou nenulové. Pak ovšem pokračováním eliminace pomocí řádkových elementárních transformací od pravého dolního rohu zpět a vynormováním diagonálních prvků na jedničky získáme jednotkovou matici E. Jinými slovy, najdeme další invertibilní matici P" takovou, že pro P = P" ■ P' platí P ■ A = E. Výměnou řádkových a sloupcových transformací lze za předpokladu existence A~l stejným postupem najít Q takovou, že A ■ Q = E. Odtud P = p . E = P ■ (A ■ Q) = (P ■ A) ■ Q = Q. To ale znamená, že jsme nalezli hledanou inverzní matici A~1 = P = Q k matici A. Prakticky tedy můžeme postupovat takto: Vedle sebe napíšeme původní matici A a jednotkovou matici E, matici A upravujeme řádkovými elementárními' úpravami nejprve na schodovitý tvar, potom tzv. zpětnou eliminací na diagonální matici a v té násobíme řádky inverzními prvky z K. Tytéž úpravy postupně prováděné s E vedou právě k hledané matici A~l. Pokud tento algoritmus narazí na vynulování celého řádku v původní matici, znamená to, že matice inverzní neexistuje. Výpočet inverzní matice J 2.11. Závislost řádků a sloupců a hodnost matice. V předchozích úvahách a počtech s maticemi jsme stále pracovali se sčítáním řádků nebo sloupců coby vektorů, spolu s jejich násobením skaláry. Takové operaci říkáme lineární 52 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ MEMIERW A MATICE kombinace. V abstraktním pojetí se k operacím s vektory vrátíme za chvíli v 2.23, bude ale užitečné pochopit podstatu už nyní. Lineární kombinací řádků (nebo sloupců) matice A = (ciij) typu m/n rozumíme výraz a\uix + • • • + ajluik, kde at jsou skaláry, u j = ..., «,■„) jsou řádky (nebo u j = (a\j, ..., amj) jsou sloupce) matice A. Jestliže existuje lineární kombinace daných řádků s alespoň jedním nenulovým skalárním koeficientem, jejímž výsledkem je nulový řádek, říkáme, že jsou lineárně závislé. V opačném případě, tj. když jedinou možnost jak získat nulový řádek je vynásobení výhradně nulovými skaláry, jsou lineárně nezávislé. Obdobně definujeme lineárně závislé a nezávislé sloupce matice. Předchozí výsledky o Gausově eliminaci můžeme teď intepretovat tak, že počet výsledných nenulových „schodů" v řádkově nebo sloupcově schodovitém tvaruje vždy roven počtu lineárně nezávislých řádků matice, resp. počtu lineárně nezávislých sloupců matice. Označme Eh matici z věty 2.9 s h jedničkami na diagonále a předpokládejme, že dvěma různými postupy dostaneme různá h' < h. Pak ovšem podle našeho postupu budou existovat také invertibilní matice P a Q takové, že P-Eh,-Q = Eh. V součinu Ehi ■ Q bude více nulových řádků ve spodní části matice, než kolik má být jedniček v Eh a přitom se k nim máme dostat už jen řádkovými transformacemi. Zvýšit počet lineárně nezávislých řádků ale pomocí elementárních řdá-kových transformací nelze. Proto je počet jedniček v matici P ■ A ■ Q ve větě 2.9 nezávislý na volbě našeho postupu eliminace a je roven jak počtu lineárně nezávislých řádků v A, tak počtu lineárně nezávislých sloupců v A. Tomuto číslu říkáme hodnost matice a značíme je h (A). Zapamatujme si výsledné tvrzení: Věta. Nechť A je matice typu m/n nad polem skalárů K. Matice A má stejný počet h( A) Unárně nezávislých řádků a lineárně nezávislých sloupců. Zejména je hodnost vždy nejvýše rovna menšímu z rozměrů matice A. Algoristmus pro výpočet inverzních matic také říká, že čtvercová matice A dimenze m má inverzi právě, když je její hodnost rovna počtu řádků m. 2 .10b | 2.12. Matice jako zobrazení. Zcela stejně, jak jsme s maticemi pracovali v geometrii roviny, viz 1.29, můžeme každou čtvercovou matici A interpretovat jako zobrazení A:K"^K", i^A-i. Díky distributivnosti násobení matic je zřejmé, jak jsou zobrazovány lineární kombinace vektorů takovými zobrazeními: A ■ (ax + b y) = a A ■ x + b A ■ y. Přímo z definice je také vidět (díky asociatívnosti násobení matic), že skládání zobrazení odpovídá skládání matic. Invertibilní matice tedy odpovídají bijektivním zobrazením. 53 1. VEKTOmmmiEICE ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA 2.11 Z tohoto pohledu je velice zajímavá věta 2.9. Můžeme ji číst tak, že hodnost matice určuje, jak velký je obraz celého W v tomto zobrazení. Skutečně, je-li A = P ■ J ■ Q s maticí J s k jedničkami jako v 2.9, pak invertibilní Q napřed jen bijektivně „zamíchá" n-rozměrné vektory v W, matice J pak „zkopíruje" prvních k souřadnic a vynuluje n — k zbývajících. Tento „^-rozměrný" obraz už pak následně násobení invertibilní P nemůže zvětšit. K pojmům dimenze, lineární nezávislost apod. se vrátíme ve třetí části této kapitoly. 2.13. Matice rotací v M3. Nyní si jako ilustraci najdeme popis rotací v M3. Nejprve si napíšeme matice zobrazení rotací o úhel cp postupně kolem os x, y, z v M3. Při rotaci libovolného bodu kolem dané osy (řekněme x), se příslušná souřadnice daného bodu nemění, v rovině dané dvěma zbylými osami pak již je rotace dána známou maticí typu 2/2. Postupně tedy dostáváme následující matice — rotace kolem osy z: 0\ 0 rotace kolem osy y: coscp 0 sin

4 _V2 2 V_2 2 0 1 4 3 4 V6 4 o\ 0 1 /l o V_6 \ 4 » _ Vě 4 j_ 2 0 1 2 V3 2 o \ VJ 2 J_ 2 /VI V_2 2 2 _ V_2 V2 n 2 2 U V 0 0 i 2. Determinanty V páté části první kapitoly jsme viděli, že pro čtvercové matice dimenze 2 nad reálnými čísly existuje skalární funkce det, která matici přiřadí nenulové číslo právě, když existuje její inverze. Neříkali jsme to sice stejnými slovy, ale snadno si to ověříte (viz odstavce počínaje 1.26 a vzorec (1.16)). Determinant byl užitečný i jinak, viz 1.33 a 1.34, kde jsme si volnou úvahou odvodili, že obsah rovnoběžníka by měl být lineárně závislý na každém ze dvou vektorů definujících rovnoběžník a že je užitečné zároveň požadovat změnu znaménka při změně pořadí těchto vektorů. Protože tyto vlastnosti měl, až na pevný skalární násobek, jedině determinant, odvodili jsme, že je obsah dán právě takto. Nyní uvidíme, že podobně lze postupovat v každé konečné dimenzi. V této části budeme pracovat s libovolnými skaláry K a maticemi nad těmito skaláry. Naše výsledky o determinantech tedy budou vesměs platit pro všechny komutativní okruhy, zejména tedy třeba pro celočíslené matice. 2 .10c| 2.14. Definice determinantu. Připomeňme, že bijektivní zobrazení množiny X na sebe se nazývá permutace množiny X, viz 1.7. Je-li X = {1,2,...,«}, lze permutace zapsat pomocí výsledného pořadí ve formě tabulky: / 1 2 ... n \a(\) a (2) ... a(n) Prvek x e X se nazývá samodružným bodem permutace a, je-li o(x) = x. Permutace a taková, že existují právě dva různé prvky x,y e X s a(x) = y a a (z) = z pro všechna ostatní z e X se nazývá transpozice, značíme ji (x, y). Samozřejmě pro takovou transpozici platí také er (y) = x, odtud název. V dimenzi dva byl vzorec pro determinant jednoduchý -vezmeme všechny možné součiny dvou prvků, po jednom z každého sloupce a řádku matice, opatříme je znaménkem tak, aby při přehození dvou sloupců došlo ke změně celkového znaménka, a výrazy všechny (tj. oba) sečteme: , det A = ad — bc. 55 2. DETERMJNAIRTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA 2 .13a Obecně, uvažujme čtvercové matice A = (atj) dimenze n nad K. Vzorec pro determinant matice A bude také poskládány ze všech možných součinů prvků z jednotlivých řádků a sloupců: Determinant matice A je skalár det A = | A| definovaný I vztahem ' |A| = ^ Sgn(or)útlfr(1) • a2a(2) ■ ■■dnain) tre£„ kde £„ je množina všech možných permutací na{1,...,«}a znaménko sgn pro každou permutaci a ještě musíme popsat. Každý z výrazů Sgn( o(b). Permutace a se nazývá sudá (resp. lichá), obsahuje-li sudý (resp. lichý) počet inverzí. Parita permutace a je (_i)P°cetinverzi a značíme ji sgn (a). Tolik tedy definice znamének našich členů deter-mintu, chceme ale vědět, jak s paritou počítat. Z následujícího tvrzení o permutacích už je jasně vidět, že Saarusovo pravidlo skutečně počítá determinant v dimenzi 3. Věta. Na množině X = {1,2, ... ,n} je právě n\ různých permutací. Tyto lze seřadit do posloupnosti tak, že každé dvě po sobě jdoucí se liší právě jednou transpozicí a každá trans-pozice mění paritu. Lze při tom začít libovolnou permutací. Důkaz. Pro jednoprvkové a dvouprvkové X tvrzení samozřejmě platí. Budeme postupovat indukcí přes dimenzi. 56 CHAPTER 2. ELEMENTÁRNÍ LINEÁRNÍ AŽGBEKERMINANTY Předpokládejme, že tvrzení platí pro všechny množiny s n — 1 prvky a uvažme permutaci o(l) = a\, ..., o(n) = an. Podle indukčního předpokladu všechny permutace, které mají na posledním místě an, dostaneme z tohoto pořadí postupným prováděním transpozic. Přitom jich bude (n — 1)!. V posledním z nich prohodíme a(n) — &n zä některý z prvků, který dosud nebyl na posledním místě, a znovu uspořádáme všechny permutace s tímto vybraným prvkem na posledním místě do posloupnosti s požadovanými vlastnostmi. Po n-násobné aplikaci tohoto postupu získáme n(n — 1) = n\ zaručeně různých permutací, tzn. všechny, právě předepsaným způsobem. Všimněme si, že poslední věta dokazovaného tvrzení se nezdá příliš důležitá pro jeho využití. Je však velice důležitou částí postupu v našem důkazu indukcí přes počet prvků. Zbývá tvrzení věty o paritách. Uvažme pořadí (ai,..., ai,ai+i, ...,n), ve kterém je r inverzí. Pak zjevně je v pořadí (ai,..., ai+i,ai ...,n) buď r — 1 nebo r + 1 inverzí. Každou transpozici o,-) lze přitom získat postupným provedením (j — i) + (j — i — 1) = 2(j — 0 — 1 transpozic sousedních prvků. Proto se provedením libovolné transpozice parita permutace změní. Navíc již víme, že všechny permutace lze získat prováděním transpozic. □ Zjistili jsme, že provedení libovolné transpozice změní paritu permutace a že každé pořadí čísel {1,2,...,«} lze získat postupnými transpozicemi sousedních prvků. Dokázali jsme proto: Důsledek. Na každé konečné množině X = {1, ... ,n} s n prvky, n > 1, je právě ^n \ sudých a \ lichých permutací. Jestliže složíme dvě permutace za sebou, znamená to provést napřed všechny transpozice tvořící první a pak druhou. Proto pro libovolné permutace a, n : X -> X platí sgníer o n) = sgn(er) • sgn(/j) a proto také sgnío-"1) = sgn(o-). 2 .13b | 2.16. Rozklad permutace na cykly. Dobrým nástrojem pro praktickou práci s permutacemi je jejich rozklad na tzv. cykly. I Permutace a na množině X = {\, ...,«} se nazývá cyk-* lus délky k, jestliže je možné najít prvky a\, ... ,ak e X, 2 < k < n takové, že er(a;) = ai+\, i = 1, 1, za- tímco a (ak) = a\ a ostatní prvky v X jsou pro a samodružné. Cykly délky dva jsou právě transpozice. Každá permutace je složením cyklů. Cykly sudé délky mají paritu — 1, cykly liché délky mají paritu 1. j Cykly 57 2. DETERMJNAIRTER 2. ELEMENTÁRNÍ LINEÁRNÍ ALGEBRA Poslední tvrzení musíme ještě dokázat. Jestliže definujeme pro danou permutaci a relaci R tak, že dva prvky x, y e X jsou v relaci právě když ar(x) = y pro nějakou iteraci permutace a, pak zjevně jde o relaci ekvivalence. Protože je X konečná množina, musí pro nějaké i být al(x) = x. Jestliže zvolíme jednu třídu ekvivalence {x, a(x), ... ,al~l(x)} c X a ostatní prvky definujeme jako samodružné, dostáváme cyklus. Evidentně je pak celá původní permutace X složením všech těchto cyklů a je jedno v jakém pořadí cykly skládáme. Pro určení parity si nyní stačí povšimnout, že cykly sudé délky lze napsat jako lichý počet transpozic, proto mají paritu — 1. Obdobně cyklus liché délky dostaneme ze sudého počtu transpozic a proto mají paritu 1. 2 .12 | 2.17. Jednoduché vlastnosti determinantu. Poznání vlastností permutací a jejich parit z předchozích odstavců nám teď umožní rychle odvodit základní vlastnosti detemrintů. Pro každou matici A = (útý) typu m/n nad skaláry z K definujeme matici transponovanou k A. Jde o matici AT = (a-j) s prvky a[- = aji, která je typu n/m. Čtvercová matice A s vlastností A = AT se nazývá symetrická. Jestliže platí A = —AT, pak se A nazývá antisymet-rická. Věta. Pro každou čtvercovou matici A = (a^-) platí (1) \AT\ = \A\, (2) Je-li jeden řádek v A tvořen nulovými prvky z K, pak \A\ = 0, (3) Jestliže matice B vznikla z A výměnou dvou řádků, pak \A\ = -\B\, (4) Jestliže matice B vznikla z A vynásobením řádku skalárem íieK, pak \B\ = a \A\, (5) Jsou-li prvky k-tého řádku v A tvaru a^ = c^j + by a všechny ostatní řádky v maticích A, B = (bij), C = jsou stejné, pak \A\ = \B\ + \C\, (6) Determinant \A\ se nezmění, přičteme-li k libovolnému řádku A lineární kombinaci ostatních řádků. Jednoduché vlastnosti determinantů Důkaz. (1) Členy determinantů \A\ a \AT\ jsou v bi-jektivní korespondenci. Členu sgn(er)útiCT(i) • ^(2) • • •«n■ CL\ = «2 = • • • = ak = 0. Posloupnost vektorů v\, ..., vk nazveme lineárně nezávislou jestliže v\, ..., vk jsou po dvou různé a {v\, ..., vk} je lineárně nezávislá. Množina M vektorů je lineárně závislá, jestliže není lineárně nezávislá. I Lineární kombinace a nezávislost Přímo z definice pak vyplývá, že neprázdná podmnožina M vektorů ve vektorovém prostoru nad polem skalárů K je závislá právě, když je jeden z jejích vektorů vyjádřitelný jako lineární kombinace ostatních. Skutečně, alespoň jeden koeficient ve výrazu musí být nenulový a protože jsme nad polem skalárů, můžeme jím podělit a vyjádřit tak u něj stojící vektor pomocí ostatních. Každá podmnožina lineárně nezávislé množiny M je samozřejmě také lineárně nezávislá (požadujeme stejné podmínky na méně vektorů). Stejně snadno vidíme, že M c V je lineárně nezávislá právě tehdy, když každá konečná podmnožina v M je lineárně nezávislá. 2 .18 | 2.25. Generátory a podprostory. Podmnožina M c V se nazývá vektorovým podprostorem jestliže spolu se zúženými operacemi sčítání a násobení skaláry je sama vektorovým prostorem. Tzn. požadujeme Va, b € K, Vi;, w € M, a ■ v + b ■ w € M. Rozeberme si hned několik příkladů: Prostor m-tic skalárů W" se sčítáním a násobením po složkách je vektorový prostor nad M, ale také vektorový prostor nad Q. Např. pro m = 2, jsou vektory (1, 0), (0, 1) e M2 lineárně nezávislé, protože z a ■ (1,0) + b ■ (0, 1) = (0,0) plyne a = b = 0. Dále, vektory (1,0), (72, 0) e R2 jsou lineárně závislé nad R, protože V2 -(1,0) = (V2, 0), ovšem nad Q jsou lineárně nezávislé! Nad R tedy tyto dva vektory „generují" jednorozměrný podprostor, zatímco nad Q je dvourozměrný. Polynomy stupně nejvýše m tvoří vektorový prostor Mm[x]. Polynomy můžeme chápat jako zobrazení / : R -> R a sčítání a násobení skaláry definujeme takto: (/ + g)(x) = f(x) + g(x), (a ■ f)(x) = a ■ f (x). Polynomy všech stupňů také tvoří vektorový prostor MqoM a Mm[x] c Rn[x] je vektorový podprostor pro všechna m < n < oo. Podprostory jsou také např. všechny sudé polynomy nebo liché polynomy, tj. splňující f(-x) = ±f(x). Úplně analogicky jako u polynomů můžeme definovat strukturu vektorového prostoru na množině všech zobrazení 65 3. VEKTORmÉHmFSTOEEEMENEÁRMEDm^tíMLGEBRA R M. nebo všech zobrazení M V libovolné pevné zvolené množiny M do vektorového prostoru V. Protože podmínka v definici podprostoru obsahuje pouze univerzální kvantifikátory, je jistě průnik podprostorů opět podprostor. Snadno to ověříme i přímo: Nechť Wi,i e I, jsou vektorové podprostory ve V, a, b e K, u, v e níe/ W/. Pak pro všechny i e I, a ■ u + b ■ v e W{, to ale znamená, že a ■ u + b ■ v e níe/ W/. Zejména je tedy podprostorem průnik všech podprostorů W C V, které obsahují předem danou množinu vektorů M c y. Říkáme, že takto M generuje podprostor (M), nebo že prvky M jsou generátory podprostoru (M). Zformulujme opět několik jednoduchých tvrzení o generování podprostorů: Tvrzení. Pro každou podmnožinu M c V platí (1) (M) = {«i •«! + ••• + ak ■ uk; k e N, at e K, u j e M, j = 1,...,*}; (2) M = (M) právě když M je vektorový podprostor; (3) jestliže N C M pak (N) C (M) je vektorový podprostor; (4) (0) = {0} C V, triviálni podprostor. Důkaz. (1) Množina všech lineárních kombinací a\Ui + ■ ■ ■ + akuk na pravé straně (1) je jistě vektorový podprostor a samozřejmě obsahuje M. Naopak, každá z jednotlivých lineárních kombinací nutně musí být v (M) a první tvrzení je dokázáno. Tvrzení (2) vyplývá okamžitě z (1) a z definice vektorového podprostoru a obdobně je z prvního tvrzení zřejmé i tvrzení třetí. Konečně, nejmenší vektorový podprostor je {0}, protože prázdnou množinu obsahují všechny podprostory a každý z nich obsahuje 0. □ 2.26. Součty podprostorů. Když už máme představu o generátorech a jimi vytvářených podprostorech, měli bychom rozumět i možnostem, jak několik podprostorů může vytvářet celý vektorový prostor V. Nechť V i, i e I, jsou podprostory ve V. Pak podprostor generovaný jejich sjednocením, tj. (Uíe/V/), nazýváme součtem podprostorů Ví. Značíme X/e/ ^- Zejména pro Vidíme jsme, že každý prvek v uvažovaném součtu podprostorů můžeme vyjádřit jako lineární kombinaci vektorů z podprostorů V,. Protože však je sčítání vektorů komutativní, lze k sobě poskládat členy patřící do stejného podprostoru a pro konečný součet k podprostorů tak dostáváme Vi + V2 + ■ ■ ■ + Vk = {vl + ■ ■ ■ + vk; Vi e V/, i = 1, ..., k). Součet W = Vi + ■ ■ ■ + Vk C V se nazývá přímý součet podprostorů, jsou-li průniky všech dvojic triviální, tj. V, D 2.19 Vi,..., Vi C V, Vi+-" + Vjt = (ViUV2U...UVjt). Součty podprostorů 66 CHAPTER ŽVEMEmwmRmĎWEA^RmME^mRAZOBRAZENÍ 2 .19a 2.20 V j = {0} pro všechny i ^ j. Ukážeme, že v takovém případě lze každý vektor w e W napsat právě jedním způsobem jako součet w = vi -\-----\-vk, kde Vi e V/. Skutečně, pokud by tento vektor šlo zároveň vyjádřit, jako w = v[ + ■ ■ ■ + v'k, potom 0 = w - w = (vi - v[) H-----\-(vk - v'k). Pokud bude vt — v- první nenulový člen na pravé straně, pak tento vektor z V, umíme vyjádřit pomocí vektorů z ostatních podprostorů. To je ale ve sporu s předpokladem, že Ví má se všemi ostatními nulový průnik. Jedinou možností tedy je, že všechny vektory na pravé straně jsou nulové a tedy je rozklad wjednoznačný. Pro přímé součty podprostorů píšeme w = vl®---®vk = ®tlvi. 2.27. Báze. Nyní máme vše připravené pochopení minimálních množin generátorů tak, jak jsme to dělali v rovnině M2. I Podmnožina M c V se nazývá báze vektorového pro-' storu V, jestliže (M) = V a M je lineárně nezávislá. Vektorový prostor, který má konečnou bázi nazýváme konečněrozměrný, mohutnost báze nazýváme dimenzí V. Nemá-li V konečnou bázi, říkáme, že V je ne-konečněrozměrný. Píšeme dim V = k, k e N, případně k = oo. J Báze vektorových prostorů Všimněme si, že triviální podprostor je generován prázdnou množinou, která je "prázdnou"bazí. Má tedy triviální podprostor dimenzi nulovou. Bázi ^-rozměrného prostoru budeme obvykle zapisovat jako &-tici v = (vi ..., vk) bázových vektorů. Jde tu především o zavedení konvence: U konečněrozměrných podprostorů budeme totiž vždy uvažovat bázi včetně zadaného pořadí prvků i když jsme to takto, striktně vzato, nedefinovali. Zjevně, je-li (vi, ..., vn) bazí V, je celý prostor V přímým součtem jednorozměrných podprostorů V = („!)©...©(„„). Okamžitým důsledkem výše odvozené jednoznačnosti rozkladu jakéhokoliv vektoru ve V do komponent v přímém součtu dává jednoznačné vyjádření W = X\V\ + • • • + xnvn a dovoluje nám tedy po volbě báze opět vidět vektory jako ři-tici skalárů. K tomuto pohledu se vrátíme v zápětí v odstavci 2.31, jak jen dokončíme diskusi existence bazí a součtů podprostorů v obecné poloze. 2.28. Věta. Z libovolné konečné množiny generátorů vektorového prostoru V lze vybrat bázi. Každá báze V má přitom stejný počet prvků. 67 3. VEKTORmÉHmFSTOEEEMENEÁRMEDm^tíMLGEBRA Důkaz. První tvrzení ukážeme snadno indukcí přes počet generátorů k. Jedině nulový podprostor nepotřebuje žádný generátor a tedy umíme vybrat prázdnou bázi. Naopak, nulový vektor vybrat nesmíme (generátory by byly lineárně závislé) a nic jiného už v podprostoru není. Abychom měli indukční krok přirozenější, probereme ještě přímo případ k = 1. Máme V = ({v}) a v ^ 0 protože {v} je lineárně nezávislá množina vektorů. Pak je ovšem {v} zároveň báze V. Předpokládejme, že tvrzení platí pro k = n, a uvažme V = (vi, ..., vn+\). Jsou-li v\, ..., vn+\ lineárně nezávislé, pak tvoří bázi. V opačném případě existuje index i takový, že Vi = a\V\ -\-----h cii-iVi-i + ai+ivi+i H-----h an+ivn+i. Pak ovšem V = (v\, ..., vi+\, ..., vn+\) a již umíme vybrat bázi (podle indukčního předpokladu). Zbývá ověřit, že báze mají vždy stejný počet prvků. Uvažujme bázi (v\, ... ,vn) prostoru V a libovolný nenulový vektor u = a\Vi + ■ ■ ■ + anvn e V s at 0 pro jisté i. Pak Ví = — (u-(aiVi-\-----hflí-iľí-i +ai+ivi+i -\-----\-a„v„)) cii a proto také {u,v\, ..., vi+\, ... ,vn) = V. Jistě je to opět báze, protože vektory v\, ..., , vi+\, ... ,vn byly nezávislé, takže kdyby přidáním u vznikly lineárně závislé vektory, pak by u bylo jejich lineární kombinací, ale to by znamenalo V = (VU Vi-u vi + 1, vn), což není možné. Takže už víme, že pro libovolný nenulový vektor u e V existuje i, 1 < i < n, takové, že (u, v\, ..., Vi-i, vi+\, ..., v„) je opět báze V. Dále budeme místo jednoho vektoru u uvažovat lineárně nezávislou množinu u\, ..., uk a budeme postupně přidávat u\, U2, ..., vždy výměnou za vhodné t>; podle předchozího postupu. Je třeba pouze ověřit, že takové v i vždy bude existovat (tj. že se nebudou vektory u vyměňovat vzájemně). Předpokládejme tedy, že již máme umístěné u\, ..., ui. Pak uí+i se jistě vyjádří jako lineární kombinace těchto vektorů a zbylých v j. Pokud by pouze koeficienty uiíi, byly nenulové, znamenalo by to, že již samy vektory u\, ..., uí+i byly lineárně závislé, což je ve sporu s našimi předpoklady. Pro každé k < n tak po k krocích získáme bázi ve které z původní došlo k výměně k vektorů za nové. Pokud by k > n, pak již v n-tém kroku obdržíme bázi vybranou z nových vektorů Ui, což znamená, že tyto nemohou být lineárně nezávislé. Zejména tedy není možné, aby dvě báze měly různý počet prvků. □ Ve skutečnosti jsme dokázali silnější tvrzení, tzv. Steinit-zovu větu o výměně, která říká, že pro každou konečnou bázi y_ a každý systém lineárně nezávislých vektorů ve V umíme 68 CHAPTER ŽVE^mmwmRmĎWEA^RmME^mRAZOBRAZENÍ najít podmnožinu bázových vektorů vt, po jejichž záměně za zadané nové vektory opět dostaneme bázi. 2.29. Důsledky Steinitzovy věty o výměně. Díky možnosti volně volit a vyměňovat bázové vektory můžeme okamžitě dovodit pěkné (a intuitivně snad také očekávané) vlastnosti bazí vektorových prostorů: Tvrzení. (1) Každé dvě báze konečněrozměrného vektorového prostoru mají stejný počet vektorů, tzn. že naše definice dimenze nezávisí na volbě báze. (2) Má-li V konečnou bázi, lze každou lineárně nezávislou množinu doplnit do báze. (3) Báze konečněrozměrných vektorových prostorů jsou právě maximální lineárně nezávislé množiny. (4) Báze prostoru s konečnou dimenzí jsou právě minimální množiny generátorů. Malinko složitější, ale nyní snadno zvládnutelná, je situace kolem dimenzí podprostorů a jejich součtů: Důsledek. Nechť W, W\, W2 C V jsou podprostory v prostoru konečné dimenze. Pak platí (1) dim W < dim V (2) V = W právě když dim V = dim W (3) dim Wi + dim W2 = dim(Wi + W2) + dim(Wi n W2). Důkaz. Zbývá dokázat pouze poslední tvrzení. To je zřejmé, pokud je dimenze jednoho z prostorů nulová. Předpokládejme tedy dim W\ = r ^ 0, dim W2 = s ^ 0 a nechť (w\ ..., wt) je báze W\ n W2 (nebo prázdná množina, pokud je průnik triviální). Podle Steinitzovy věty o výměně lze tuto bázi doplnit na bázi (w\, ... ,wt,ut+i ... ,ur) pro W\ a bázi (wi...,wt, vt+i, ...,vs) pro W2. Vektory Wi, wt, ut + í, ...,ur, vt + í ...,vs jistě generují W\ + W2. Ukážeme, že jsou přitom lineárně nezávislé. Nechť tedy fliWiH-----\-atwt+bt+iut+i-\-----\-brur+ct+ivt+i-\-----\-csvs = 0 Pak nutně - (ct+i ■ vt+i H-----h cs ■ vs) = = a\ ■ w\ + • • • + at ■ wt + bt+\ ■ ut+\ + • • • + br ■ ur musí patřit do W2 n Wi. To ale má za následek, že bt+1 = ■■■ = br =0, protože tak jsem doplňovali naše báze. Pak ovšem i a\ ■ wi H-----h at ■ wt + ct+í ■ vt+i H-----h cs ■ vs = 0 a protože příslušné vektory tvoří bázi W2, jsou všechny koeficienty nulové. Tvrzení (3) se nyní ověří přímým počítáním generátorů. □ 69 3. VEKTOROMÉJIWMiT.OEEEMBNľÁRNÍ ZBIEMWIWLGEBRA 2.21 2 .22 2.30. Příklady. (1) K" má (jako vektorový prostor nad K) dimenzi n. Bazí je např. n-tice vektoru ((1,0, ...,0), (0, 1,...,0)...,(0, ...,0, 1)). Tuto bázi nazýváme standardní báze v K". V případě konečného pole skalárů, např. 1,k, má celý vektorový prostor W jen konečný počet prvků. Kolik? (2) C jako vektorový prostor nad M má dimenzi 2, bázi tvoří např. čísla la/. (3) Km[jc], tj. prostor polynomů stupně nejvýše m, má dimenzi m + 1, bazí je např. posloupnost 1, x, x2, ..., xm. Vektorový prostor všech polynomů K[x] má dimenzi oo, umíme však ještě stále najít bázi (i když s nekonečně mnoha prvky): 1, x, x2, .... (4) Vektorový prostor M nad Q má dimenzi oo a nemá spočetnou bázi. (5) Vektorový prostor všech zobrazení / : M -» M má také dimenzi oo a nemá spočetnou bázi. 2.31. Souřadnice vektorů. Když je množina {vi, ..., vn} c V báze, můžeme každý vektor w e V vyjádřit jako lineární kombinaci v = a\V\ + ■ ■ ■ + anvn. Předpokládejme, že to uděláme dvěma způsoby: w = a\V\ + • • • + anvn = b\V\ + • • • + bnvn. Potom ale 0 = (ai - bi) ■ vi H-----h (a„ - b„) ■ v„ a proto a{ = b{ pro všechna / = 1, ..., n. Lze tedy každý vektor zadat právě jediným způsobem jako lineární kombinaci bázových vektorů. Koeficienty této jediné lineární kombinace vyjadřující daný vektor w e V ve zvolené bázi v_ = (vi, ..., vn) se nazývají souřadnice vektoru w v této bázi. Kdykoliv budeme mluvit o souřadnicích (a\, ... ,an) vektoru w, které vyjadřujeme jako posloupnost, musíme mít pevně zvolenu i posloupnost bázových vektorů v = (vi, ..., vn). Jakkoliv jsme tedy báze zavedli jako minimální množiny generátorů, ve skutečnosti s nimi budeme pracovat jako s posloupnostmi. Přiřazení, které vektoru u = a\V\ + ■ ■ ■ + a„v„ přiřadí jeho souřadnice v bázi v, budeme značit stejným symbolem ' v: V ^ W. Má tyto vlastnosti: (1) v(u + w) = v(u) + v(w); Vm, w e V (2) v(a ■ u) = a ■ v(u); Va eK,V« e V. Přiřazení souřadnic vektorům J Všimněme si, že operace na levých a pravých stranách těchto rovnic nejsou totožné, naopak, jde o operace na různých vektorových prostorech! Při této příležitosti se také můžeme zamyslet nad obecným případem báze M (možná nekonečněrozměrného) prostoru V. Báze pak nemusí být spočetná, pořád ale ještě můžeme definovat zobrazení M : V -> KM (tj. souřadnice vektoru jsou zobrazení z M do I). 70 CHAPTER 2VE^mmwmRmĎWEÁyRmMEÁmRAZ0BRAZENÍ Uvedené vlastnosti přiřazení souřadnic jsme viděli už dříve u zobrazení, kterým jsme v geometrii roviny říkali lineární (zachovávaly naši lineární strukturu v rovině). Než se budeme věnovat podrobněji závislosti souřadnic na volbě báze, podíváme se obecněji na pojem linearity zobrazení. 2.32. Lineární zobrazení. Pro zcela obecné vektorové prostory, konečné i nekonečné dimenze, definujeme pojem „linearity" takto: Nechť V aW jsou vektorové prostory nad týmž polem skalárů K. Zobrazení / : V -» W se nazývá lineární zobrazení (homomorfismus) jestliže platí: (1) f(u + v) = f(u) + f(v), Vu,veV (2) f (a ■ u) = a ■ f(u), Va ěK,¥uě V. Definice lineárních zobrazení Samozřejmě, že jsme taková zobrazení již viděli ve formě násobení matic: K" b x h» A ■ x e Km s maticí typu m/n nad K. Obraz Im / := f (V) C W je vždy vektorový podprostor, protože lineární kombinace obrazů /(«;) je obrazem lineární kombinace vektorů u i se stejnými koeficienty. Stejně tak je vektorovým podprostorem množina všech vektorů Ker / := /_1({0}) c V, protože lineární kombinace nulových obrazů bude vždy zase nulovým vektorem. Nazývá se jádro lineárního zobrazení f. Lineární zobrazení, které je bijekcí nazýváme izomorfis-mus. Podobně jako u abstraktní definice vektorových prostorů, opět je třeba ověřit zdánlivě samozřejmá tvrzení vyplývající z axiomů: Tvrzení. Nechť f : V -» W je lineární zobrazení. Pro všechny vektory u,u\, ... ,uk e V, a\, ..., ak e K platí: (1) /(O) = 0 (2) f(-u) = -f(u) (3) f(ai -wi H-----\-ak ■ uk) = ax ■ f(ux) H-----\-ak- f (uk) (4) pro každý vektorový podprostor V\ C V je jeho obraz f(V\) vektorový podprostor ve W. (5) Pro každý podprostor W\ C W je množina f~1(W\) = {v e V; f (v) e W\] vektorový podprostor ve V. Důkaz. Počítáme s využitím axiomů a definic a již dokázaných výsledků (dohledejte si případně samostatně!): /(O) = f(u -u) = /((l - 1) • u) = 0 • f(u) = 0 f(-u) = /((-l) • u) = (-1) • f(u) = -f(u). Vlastnost (3) se ověří snadno z definičního vztahu pro dva sčítance indukcí přes počet sčítanců. Z platnosti (3) nyní plyne, že {f{V\)) = f{V\), je to tedy vektorový podprostor. Je-li naopak f(u) e W\ a f (v) e W\, pak pro libovolné skaláry bude i f (a -u +b ■ v) = a ■ f(u) + b ■ f (v) e W\. □ 71 3. VEKTORmÉHmFSTOEEEMENEÁRMEDm^tíMLGEBRA 2.33. Jednoduché důsledky. (1) Složení g o f : V -» Z dvou lineárních zobrazení / : V ^ W a. g : W^Zje opět lineární zobrazení. (2) Lineární zobrazení / : V -» W je izomorfismus právě když Im / = W a Ker / = {0} C V. Inverzní zobrazení k izomorfismu je opět izomorfismus. (3) Pro libovolné podprostory V\, V2 C V a lineární zobrazení / : V -» W platí /(Vi + V2) = /(Vi) + f(V2), /(Vinv2)c/(Vi)n/(v2). (4) Zobrazení „přiřazení souřadnic" m : y -» K" dané libovolně zvolenou bází u = (u\,...,un) vektorového prostoru V je izomorfismus. (5) Dva konečněrozměrné vektorové prostory jsou izomorfní právě když mají stejnou dimenzi. (6) Složení dvou izomorfismu je izomorfismus. Důkaz. Ověření prvního tvrzení je velmi snadné cvičení. Pro druhé si uvědomme, že je-li / lineární bijekce, pak w = f~l(au + bv) právě, když f(w) = au+bv = f (a ■ f~l(u) + b ■ f-\v)). Je tedy také w = af~l(u) + bf~l(v) a tedy je inverze k lineární bijekci opět lineární zobrazení. Dále, / je surjektivní právě, když Im / = W a pokud Ker / = {0}, pak f (u) = f (v) zaručuje f(u — v) = 0, tj. u = v. Je tedy v tom případě / injektivní. Další tvrzení se dokáže snadno přímo z definic. Najděte si protipříklad, že v dokazované inkluzi opravdu nemusí nastat rovnost! Zbývající body jsou již zřejmé. □ 2.34. Opět souřadnice. Uvažujme libovolné vektorové prostory V a W nad K s dim V = n, dim W = m a mějme lineární zobrazení / : V -> W. Pro každou volbu bází « = («!,..., un) na V, v_ = (vi, ..., vn) na W, máme k dispozici příslušná přiřazení souřadnic a celou situaci několika právě zmíněných zobrazení zachycuje následující diagram: Spodní šipka je definována zbylými třemi, tj. jako zobrazení jde o složení fu,v = vo f ou~\ Přitom je každé lineární zobrazení jednoznačně určeno svými hodnotami na libovolné množině generátorů, zejména tedy 72 CHAPTER ^/EMEmwmRmĎWEA^RmME^mRAZOBRAZENÍ na vektorech báze u. Označme f(ux) = an ■ vi + a2\ ■ v2 -\-----h amivm f(u2) =a12-v1+a22-v2-\-----h am2vm f(un) = a\n ■ v\ + a2n ■ v2 + ■ ■ ■ + amnvm tj. skaláry atj tvoří matici A, kde sloupce jsou souřadnice hodnot f(uj) zobrazení / na bázových vektorech vyjádření v bázi y_ na cílovém prostoru W. Pro obecný vektor u = x\U\ + • • • + xnun e V spočteme (vzpomeňme, že sčítání vektorů je komutativní a distributivní vůči násobení skaláry) f(u) = xif{u{) H-----\-xnf(un) = x\{a\\V\ + ■ ■ ■ + am\vm) + • • • + xn(a\nv\ + • • • + amnvm) = (x\a\i + • • • + xna\n)v\ + • • • + (x\ami + • • • + xnamn)vm Pomocí násobení matic lze nyní velice snadno a přehledně zapsat hodnoty zobrazení fu,v(w) definovaného jednoznačně předchozím diagramem. Připomeňme si, že vektory v W chápeme jako sloupce, tj. matice typu r/1 fu,v(u(w)) = v(f(w)) = A ■ u(w). Matici A nazýváme maticí zobrazení f v bázích u, v. Naopak, máme-li pevně zvoleny báze na V i W, pak každá volba matice A typu m/n zadává jednoznačně lineární zobrazení W -> W" a tedy i zobrazení / : V -> W. Máme-li tedy zvoleny báze prostorů VaW, odpovídá každé volbě matice typu m/n právě jedno lineární zobrazení ľ^-ffa ukázali jsme bijekci mezi maticemi příslušného rozměru a lineárními zobrazeními V -> W. 2.35. Matice přechodu mezi souřadnicemi. Jestliže za V i W zvolíme tentýž prostor, ale s různými bázemi, a za / identické zobrazení, vyjadřuje postup z předchozího odstavce vektory báze u v souřadnicích vzhledem k v. Označme výslednou matici T. Když pak zadáme vektor u U = X\U\ -\- ' ' ' -\- Xnlln v souřadnicích vzhledem ku a dosadíme za «; jejich vyjádření pomocí vektorů z v, obdržíme souřadné vyjádření x = (xi, ..., xn) téhož vektoru v bázi v. Stačí k tomu přesklá-dat pořadí sčítanců a vyjádřit skaláry u jednotlivých vektorů báze. Ve skutečnosti teď děláme totéž, co v předchozím odstavci pro speciální případ identického zobrazení idy na vektorovém prostoru V. Matice tohoto identického zobrazení je T a tedy nutně musí naznačený přímý výpočet dát x = T ■ x. Situace se zobrazena na diagramu: 73 3. VEKTORmÉHmFSTOEEEMENEÁRMEDm^tíMLGEBRA 2.26 Výslednou matici T nazýváme matice přechodu od báze u vektorového prostoru V k bázi v téhož prostoru. Přímo z definice vyplývá: Tvrzení. Matici T přechodu od báze u k bázi v získáme tak, \ že souřadnice vektorů báze u v bázi v napíšeme do sloupců matice T. Výpočet matice přechodu J Funkce matice přechodu je taková, že známe-li souřadnice x vektoru v bázi u, pak jeho souřadnice v bázi v se obdrží vynásobením sloupce x maticí přechodu (zleva). Protože inverzní zobrazení k identickému je opět totéž identické zobrazení, je matice přechodu vždy invertibilní a její inverze je právě matice přechodu opačným směrem, tj. od báze v k bázi u. 2.36. Více souřadnic. Nyní si ukážeme, jak se skládají souřadná vyjádření lineárních zobrazení. Uvažme ještě další vektorový prostor Z nad K dimenze k s bází w, lineární zobrazení g : W -» Z a označme příslušnou matici g^^. V f W fu,v 8v,ui Složení g o f na horním řádku odpovídá matici zobrazení -» Kk dole a přímo spočteme (píšeme A pro matici / a B pro matici g ve zvolených bazích): 8v,w o fu,v(x) = wogov~1ovofou~ = B ■ (A ■ x) = (B ■ A) ■ x (g O f)u,w(x) pro všechny x e K". Skládání obražení tedy odpovídá násobení příslušných matic. Všimněte si také, že isomorfismy odpovídají právě invertibilním maticím. Stejný postup nám dává odpověď na otázku, jak se změní matice zobrazení, změníme-li báze na definičním oboru i oboru hodnot: V V W fu,v_ W kde T je matice přechodu od w' k u a S je matice přechodu od i/ k v_. Je-li tedy A původní matice zobrazení, bude nová dána jako A' = S^AT. Ve speciálním případě lineárního zobrazení f : V -> V, tj. zobrazení má stejný prostor V jako definiční obor i obor hodnot, vyjadřujeme zpravidla / pomocí jediné báze u prostoru V. Pak tedy přechod k nové bázi w' s maticí předchodu T od m' k u bude znamenat změnu matice zobrazení na A' = T~1AT. 74 CHAPTER ^/EMEmwmRmĎWEA^RmME^mRAZOBRAZENÍ 2.37. Lineární formy. Obzvlášť jednoduchým a zároveň důležitým případem lineárních zobrazení jsou tzv. lineární formy. Jde o lineární zobrazení z vektorového prostoru V nad polem skalárů K do skalárů K. Jsou-li dány souřadnice na V, je přiřazení jednotlivé i-té souřadnice vektorům právě takovou lineární formou. Přesněji řečeno, pro každou volbu báze v_= (v\, ... ,vn) máme k dispozici lineární formy v* : V -» K takové, že v*(vj) = 8'j, tj. nula pro různé indexy i a j a jednička pro stejné. Vektorový prostor všech lineárních forem na V značíme V* a říkáme mu duální prostor vektorovému prostoru V. Předpokládejme nyní, že prostor V má konečnou dimenzi n. Bázi V* sestavenou z přiřazování jednotlivých souřadnic jako výše nazýváme duální báze. Skutečně se jedná o bázi prostoru V*, protože jsou tyto formy zjevně lineárně nezávislé (prověřte si!) a je-li a libovolná forma, pak platí pro každý vektor u = x\v\ + ■ ■ ■ + x„v„ a(u) = x\a(v\) + • • • + x„a(v„) = a(vi)v*(u) H-----h a(v„)v*(u) a je tedy a lineární kombinací forem v*. Při pevně zvolené bázi {1} na jednorozměrném prostoru skalárů K jsou s každou volbou báze y_ na V lineární formy a ztotožněny s maticemi typu l/n, tj. s řádky y. Právě komponenty těchto řádků jsou souřadnicemi obecných lineárních forem v duální bázi v_*. Vyčíslení takové formy na vektoru je pak dáno vynásobením příslušného řádkového vektoru y se sloupcem souřadnic x vektoru u e V v bázi v: ot(u) = y - x = yxxx -\-----h ynxn. Zejména tedy vidíme, že pro každý konečněrozměrný prostor V je V* izomorfní prostoru V. Realizace takového izomor-fismu je dána např. naší volbou duální báze k zvolené bázi na V. U nekonečně rozměrného prostoru se věci mají jinak. Např. už nejjednodušší příklad prostoru všech polynomů K[x] v jedné proměnné je vektorovým prostorem se spočetnou bazí s prvky vt = x1 a stejně jako výše můžeme definovat lineárně nezávislé formy v*. Jakýkoliv formální nekonečný součet X/^o aivf Je nyní dobře definovanou lineární formou na K[x], protože bude vyčíslován vždy pouze na konečné lineární kombinaci bázových polynomů x1, i = 0, 1, 2, .... Spočetná množina všech v* tedy není bazí. Ve skutečnosti lze ukázat, že tento duální prostor ani spočetnou bázi mít nemůže. 2.38. Multilineární formy. Podobně budeme pracovat i se zobrazeními ze součinu k kopií vektorového prostoru V do skalárů, která jsou lineární v každém ze svých k argumentů. Hovoříme o k-lineárních formách. Budeme se často setkávat s bilineárními formami, tj. případem a : V x V —> K, kde 75 3. VEKTORmÉHmFSTOEEEMENEÁRMEDm^ÉMLGEBRA pro jakékoliv vektory u, v, w, z a skaláry a, b, c ad platí a(au + bv, cw + d z) = cic a(u, w) + ada(u, z) + bca(v, w) + bda(v, z). Pokud navíc platí a(u, w) = a(w, u), hovoříme o symetrické bilineárníformě. Již v dimenzi 2 jsme zavedli determinant jako bilineární antisymetrickou formu, tj. takovou, kde místo druhé rovnosti výše platí a(u, w) = —a(w, u). Obecně víme z věty 2.17, že je determinant možno nahlížet jako n-lineární antisymetrickou formu. Jako u lineárních zobrazení je zřejmé, že každá /c-lineární forma je úplně určena svými hodnotami na všech /c-ticích bázových prvků v pevné bázi. V analogii k lineárním zobrazením tyto hodnoty můžeme vnímat jako /c-rozměrné analogie matic. Ukážeme si to v případě k = 2, kde půjde doopravdy o matice, jak jsme je zavedli. Jestliže zvolíme bázi u na V a definujeme pro danou bilineární formu a skaláry atj = , uj), pak zjevně dostaneme pro vektory v, w se souřadnicemi x a y (jakožto sloupce souřadnic) n a(v, w) = ^ aijXtyj =yT ■ A-x, íj=i kde A je matice A = (flý). Matice bilineární formy Přímo z definice matice bilinerání formy je vidět, že forma je symetrická nebo antisymetrická právě, když má tutéž vlastnost její matice. 2 .28 | 2.39. Skalární součin a velikost vektorů. V geometrii roviny M2 jsme již pracovali nejen s bázemi a lineárními zobrazeními, ale také s velikostí vektorů a jejich úhly. Pro zavedení těchto pojmů jsme použili souřadného vyjádření pro velikost v = (x,y): \\v\\=Jx2 + y2, zatímco úhel

|| = 0 právě, když v = 0. Z našich úvah je také vidět, že v Euklidovské rovině jsou dva vektory kolmé právě, když je jejich skalární součin nulový. 76 CHAPTER ^/E^mmwmRmĎWEA^RmME^mRAZOBRAZENÍ Analogicky budeme postupovat v obecném případě reálného vektorového prostoru, tj. uvažujeme nyní pouze vektorové prostory nad reálnými skaláry M. Skalární součin na vektorovém prostoru V nad reálnými čísly je bilineární symetrická forma ( , ) : V x V -» M taková, že (v, v) > 0 a ||i>||2 = (v, v) = 0 pouze při v = 0. Číslu ||u|| říkáme velikost vektoru v. Vektory v a w e V se nazývají ortogonální, jestliže (v, w) = 0. Vektor v se nazývá normovaný, jestliže ||t>|| = 1. Báze prostoru V složená z ortogonálních vektorů se nazývá ortogonální báze. Jsou-li bázové vektory navíc i normované, je to ortonormální báze. J Skalární součin Pro skalární součin se často používá také obvyklé tečky, tj. (u,v) = u ■ v. Z kontextu je pak třeba poznat, zda jde o součin dvou vektorů (tedy výsledkem je skalár) nebo něco jiného (stejně jsme značili součin matic a také někdy součin skalárů). Jak jsme viděli v minulém odstavci, bilineární formy jsou v souřadnicích dány svojí maticí. Zvolíme-li si tedy bázi u, je skalární součin plně určen svými hodnotami na dvojicích bázových vektorů. Označme si tedy Sij = (Ui, Uj). Pak ze symetričnosti skalárního součinu plyne Síj = s jí a z lineárnosti součinu v každém z argumentů dostáváme: x — iy na dvourozměrném reálném prostoru R2 ~ Cv bázi (1, /). Toto je lineární zobrazení dvourozměrného reálného vektorového prostoru C, nikoliv však jednorozměrného komplexního prostoru C. Matice D je maticí rotace o pravý úhel ve standardní bázi a na první pohled je vidět, že žádný jednorozměrný podprostor není zobrazením zachováván. Taková rotace je bijekcí roviny na sebe, proto jistě umíme najít (různé) báze na definičním oboru a oboru hodnot, ve kterých bude jeho maticí jednotková matice E (prostě vezmeme jakoukoliv bázi na definičním oboru a její obraz na oboru 80 CHAPTER 2. ELEMENmmáMNEVMNMMmmMOBRAZENÍ hodnot). Neumíme ale v tomto případě totéž s jednou bází na definičním oboru i oboru hodnot. Zkusme však uvažovat matici D jako matici zobrazení g : C2 -» C2 ve standardní bázi komplexního vektorového prostoru C2. Pak umíme najít vektory u = (i, 1), v = (1, z), pro které bude platit *<"> = (? "o1)'(0=ŕ'M,5(i;) = (i "oO'O) To ale znamená, že v bázi (u, v) na C2 má zobrazení g matici K -i-v. a povšimněme si, že tato komplexní analogie k případu matice C má na diagonále prvky ±a, a = cos(jjt) + i sin(^jt). Jinými slovy, argument v goniometrickém tvaru tohoto komplexního čísla udává úhel otočení. Navíc, můžeme si označit reálnou a imaginární část vektoru u takto xu + iyu = Re u -\- i Im u C)+'(ó) a zúžení komplexního zobrazení g na reálný vektorový pod-prostor generovaný vektory xu a iyu (tj. násobení komplexní jednotkou i) je právě otočení o úhel ^jt. 2.44. Vlastní čísla a vlastní vektory zobrazení. Klíčem k popisu zobrazení v předchozích příkladech byly odpovědi na otázku „jaké jsou vektory splňující rovnici f(u) = a ■ «?" pro nějaké skaláry a. Zvolme tedy pevně lineární zobrazní / : V -> V na vektorovém prostoru dimenze n nad skaláry K. Jestliže si představíme takovou rovnost zapsanou v souřadnicích, tj. s využitím matice zobrazení A v nějakých bazích, jde o výraz A ■ x — a ■ x = (A — a ■ E) ■ x = 0. Z předchozího víme, že taková soustava rovnic má jediné řešení x = 0, pokud je matice A — a E invertibilní. My tedy chceme najít takové hodnoty aeK, pro které naopak A —a E invertibilní není, a nutnou a dostatečnou podmínkou je (viz Věta 2.22) (2.3) det(A -a-E)=0. Jestliže považujeme k = a za proměnnou v předchozí skalární rovnici, hledáme ve skutečnosti kořeny polynomu stupně n. Jak jsme viděli v případě matice D výše, kořeny mohou, ale nemusí existovat podle volby pole skalárů K. I Skaláry a vyhovující rovnici f(u)=a-u pro nenulový ' vektor m e V nazýváme vlastní čísla zobrazení f, příslušné vektory u pak vlastní vektory zobrazení f. J Vlastní čísla a vlastní vektory lineárního zobrazení 81 4. VLASTNamHlERÁWMfflMMŔmÉNÍNEÁRNÍ ALGEBRA Z definice vlastních čísel je zřejmé, že jejich výpočet nemůže záviset na volbě báze a tedy matice zobrazení /. Skutečně, jako přímý důsledek trasformačních vlastností z 2.36 a Cauchyovy věty 2.19 pro výpočet determinantu součinu dostáváme jinou volbou souřadnic matici A' = P~1AP s invertibilní maticí P a \P~1AP - XE\ = \P~1AP - P~1XEP\ = \P~\A-kE)P\ = IP-^IKA-^NPI protože násobení skalárů je komutativní a = li5!-1. Obdobnou terminologii používáme i pro matice. Pro ma-l tici A dimenze n nad K nazýváme polynom | A—X E | ě K„[á] ' charakteristický polynom matice A. Kořeny tohoto polynomu jsou vlastní hodnoty matice A. Je-li A matice zobrazení / : V -» V v jisté bázi, pak | A—X E\ nazýváme také charakteristický polynom zobrazení f. Charaktersitický polynom matice a obražení J Protože je charakteristický polynom zobrazení / : V -» V nezávislý na volbě báze V, jsou i jeho koeficienty u jednotlivých mocnin proměnné X skaláry vyjadřující vlastnosti zobrazení /, tj. nemohou záviset na naší volbě báze. Zejména jako jednoduché cvičení na počítání determinantů vyjádříme koeficienty u nejvyšších a nejnižších mocnin (předpokládáme dim V = n): \A-X-E\ = (-l)"A" + (-l)"-1(fln+- • ■+ann)-X"-1 + - ■ - + \A\-k° Součet diagonálních členů matice se nazývá stopa matice, značíme ji TrA, stopa zobrazení je definována j ako stopa jeho matice v libovolné bázi. 2.30a 2.45. Věta. Vlastní vektory lineárního zobrazení f : V -» V příslušné různým vlastním hodnotám jsou lineárně nezávislé. Důkaz. Nechť a\, ..., ak jsou různé vlastní hodnoty zobrazení / a u i, ..., Uk vlastní vektory s těmito vlastními hodnotami. Důkaz provedeme indukcí přes počet lineárně nezávislých vektorů mezi zvolenými. Předpokládejme, že u\, ..., ui jsou lineárně nezávislé a ul+i = c;«; je jejich lineární kombinací. Alespoň i = 1 lze zvolit, protože vlastní vektory jsou nenulové. Pak ovšem ai+x ■ ui+x = Y.i= -1 Cll+l • Ci ■ Ui, tj. I l l f(ul+1) = ^al+1 -Ct -ut = •/(«/) = -at -ut. i — l i — l i — l Odečtením druhého a čtvrtého výrazu v rovnostech dostáváme 0 = ~ai)'ci ~ui- Všechny rozdíly vlastních hodnot jsou však nenulové a alespoň jeden koeficient q je nenulový. To je spor s předpokládanou nezávislostí takže i vektor ul+i musí být lineárně nezávislý na předchozích. □ Na právě dokázané tvrzení se můžeme podívat z pohledu rozkladu lineárního zobrazení / na součet nejjednodušších možných zobrazení, které budou vždy představovat projekci na invariantní jednorozměrný podprostor v rozkladu celého 82 CHAPTER 2. ELEMENmmáMNEVMNMMmmMOBRAZENÍ 2 .44 e2 . 3a 2.36 prostoru V na přímý součet jednotlivých vlastních podpro-storů, následovanou vynásobením příslušným vlastním číslem. Navíc lze tento rozklad na vlastní podprostory snadno spočíst: Důsledek. Jestliže existuje n navzájem různých kořenů út; charakteristického polynomu zobrazení f : V -» V, na n—rozměrném prostoru V, pak existuje rozklad V na přímý součet vlastních podprostorů dimenze 1. To znamená, že existuje báze V složená výhradně z vlastních vektorů a v této bázi má f diagonální matici. Tato báze je určená jednoznačně až na pořadí prvků. Příslušnou bázi (vyjádřenou v souřadnicích vzhledem k libovolně zvolené bázi V) obdržíme řešením n systémů homogenních lineárních rovnic o n neznámých s maticemi (A — at ■ E), kde A je matice f ve zvolené bázi. ' Báze z vlastních vektorů 2.46. Invariantní podprostory. Každý vlastní vektor v zobrazení / : V -» V generuje podprostor (v) C V, který je zobrazením / zachováván. Obecněji říkáme, že podprostor W C V je invariantní podprostor pro zobrazení / Jestliže platí f(W) C W. Jestliže je V konečněrozměrný vektorový prostor a vybereme nějakou bázi (ui, ..., uk) podprostorů W, můžeme ji vždy doplnit na bázi (u\, ..., uk, uk+i, un) celého V a v každé takové bázi má naše zobrazení matici A tvaru (2.4) (o S) kde B je čtvercová matice dimenze k, D je čtvercová matice dimenze n — k a C je matice typu n/(n — k). Naopak, jestliže existuje v nějaké bázi matice zobrazení / tvaru (2.4), je W = (u\, ..., uk) invariantní podprostor zobrazení /. Pochopitelně bude v naší matici zobrazení (2.4) sub-matice C nulová právě tehdy, když bude i podprostor (uk+i, ..., un) generovaný doplněnými vektory báze invariantní. Z tohoto pohledu jsou vlastní podprostory lineárního zobrazení extrémní případy invariantních podsprostorů a zejména v případě existence n = dim V různých vlastních čísel zobrazení / dostáváme rozklad V na přímý součet n vlastních podprostorů. V příslušné bázi z vlastních vektorů má pak naše zobrazení diagonální tvar s vlastními čísly na diagonále. 2.47. Ortogonální zobrazení. Podívejme se teď na speciální případ zobrazení / : V -> W mezi prostory se skalárními součiny, která zachovávají velikosti pro všechny vektory u e V. I Lineární zobrazení / : V —> W mezi prostory se skalár-' ním součinem se nazývá ortogonální zobrazení, jesltiže pro všechny u e V (f (u), f (u)) = (u, u). 83 4. VLASTNamHlERÁRlMfflMMŔmÉNÍNEÁRM ALGEBRA Dennice ortogonálních zobrazení Z linearity / a ze symetrie skalárního součinu vyplývá pro všechny dvojice vektorů rovnost (f(u+v), f(u+v)) = (f(u), f(u)) + (f(v), f(v))+2(f(u), f (v)). Proto všechny ortogonální zobrazení splňují i zdánlivě silnější požadavek, aby (f(u),f(v)) = (u,v), pro všechny vektory u, v e V. V úvodní diskusi o geometrii v rovině jsme ve Větě 1.33 dokázali, že lineární zobrazení M2 -» M2 zachovává velikosti vektorů právě, když jeho matice ve standardní bázi (a ta je ortonormální vzhledem ke standardnímu skalárnímu součinu) splňuje AT ■ A = E, tj. A-1 = AT. Obecně, ortogonální zobrazení musí vždycky být in-jektivní, protože podmínka (f(u), f(u)) = 0 znamená i (u, u) = 0 a tedy u = 0. Je tedy vždy v takovém případě dimenze oboru hodnot alespoň taková, jako je dimenze definičního oboru /. Pak ovšem je dimenze obrazu rovna dimenzi oboru hodnot a bez újmy na obecnost můžeme rovnou předpokládat, že jsou stejné a / : V -» V (pokud by nebyly, doplníme ortonormální bázi na oboru hodnot na bázi cílového prostoru a matice zobrazení bude čtvercovou maticí A doplněnou nulami na potřebnou velikost). Naše podmínka pro matici ortogonálního zobrazení v ortonormální bázi pak říká pro všechny vektory x a v v prostoru W toto: (A • x)T ■ (A • y) = xT ■ (AT ■ A) • y = xT ■ y. Speciálními volbami vektorů standardní báze za x a v dostaneme přímo, že AT ■ A = E, tedy tentýž výsledek jako v dimenzi dvě. Dokázali jsme tak následující tvrzení: Věta. Nechť V je reálný vektorový prostor se skalárním součinem a f : V —> V je lineární zobrazení. Pak f je ortogonální právě, když v některé ortonormální bázi (a pak už všech) má matici A splňující AT = A-1. Matice ortogonálních zobrazení Důkaz. Skutečně, jestliže zachovává / velikosti, musí mít uvedenou vlastnost v každé ortonormální bázi. Naopak, předchozí výpočet ukazuje, že vlastnost matice v jedné bázi už zaručuje zachovávání velikostí. □ Maticím splňujícím AT = A~l se říká ortogonální matice. Důsledkem této věty je také popis všech matic přechodu S mezi ortonormálními bázemi. Každá totiž musí zadávat zobrazení K" -> K" zachovávající velikosti a splňují tady také 84 CHAPTER 2. ELEMENmmáMNEVMNMMmmMOBRAZENÍ právě podmínku S~l = ST. Při přechodu od jedné ortonormální báze ke druhé se tedy matice (ortogonálního) zobrazení mění podle vztahu A' = STAS. 2.48. Rozklad ortogonálního zobrazení. Podívejme se nyní podrobněji na vlastní vektory a vlastní čísla ortogonálních zobrazení na vektorovém prostoru V se skalárním součinem. Uvažme pevně zvolené ortogonální zobrazení / : V -» V s maticí A v nějaké ortonormální bázi a zkusme postupovat obdobně jako s maticí rotace D v příkladu 2.43. Nejprve se ale podívejme obecně na invariantní podpro-story ortogonálních zobrazení a jejich ortogonální doplňky. Jestliže pro libovolný podprostor W C V a ortogonální zobrazení/ : V -» V platí f(W) C W, pak také platí pro všechny v e W\we W (f(v), w) = (f(v), f o f-Hw)) = (v, f-\w)) = 0 protože i f~l(w) e W. To ale znamená, že také f(WL) C WL. Dokázali jsme tedy jednoduché, ale velice důležité tvrzení: Tvrzení. Ortogonální doplněk k invariantnímu podprostoru je také invariantní. Kdyby byla vlastní čísla ortogonálního zobrazení reálná, zaručovalo by už toto tvrzení, že bude vždy existovat báze V z vlastních vektorů. Skutečně, zúžení f na ortogonální doplněk invariantního podprostoru je opět ortogonální zobrazení, takže můžeme do báze přibírat jeden vlastní vektor za druhým, až dostaneme celý rozklad V. Nicméně většinou nejsou vlastní čísla ortogonálních zobrazení reálná. Musíme si proto pomoci opět výletem do komplexních vektorových prostorů. Sformulujeme rovnou výsledek: Věta. Nechť f : V —> V je ortogonální zobrazení na prostoru se skalárním součinem. Pak všechny kořeny charakteristického polynomu f mají velikost jedna a existuje rozklad V na jednorozměrné vlastní podprostory odpovídající vlastním číslům X = ±1 a dvourozměrné podprostory P^i, na kterých působí f rotací o úhel rovný argumentu komplexního čísla X. Všchny tyto různé podprostory jsou po dvou ortogonální. Rozklad ortogonálních zobrazení Náznak důkazu. Jestliže budeme považovat ortogonální matici A za matici lineárního zobrazení na komplexním prostoru C" (která je jen shodou okolností reálná), bude zaručeně existovat právě n (koplexních) kořenů charakteristického polynomu, včetně jejich algebraické násobnosti. Navíc, protože charakteristický polynom zobrazení bude mít výhradně reálné koeficienty, budou tyto kořeny buď reálné, nebo půjde o dvojice komplexně sdružených kořenů k a k. Příslušné vlastní vektory v C" k takové dvojici komplexně sdružených vlastních čísel budou řešením dvou komplexně 85 4. VLASTNamHlERÁWMfflMMŔmÉNÍNEÁRNÍ ALGEBRA sdružených systémů homogenních lineárních rovnic, neboť příslušné matice systémů rovnic jsou celé reálné, až na samotná dosazená vlastní čísla. Evidentně proto budou také řešení těchto systémů komplexně sdružené vektory. Označme vx, stejně jako v případě rotace v 2.43, vlastní vektor příslušný k vlastnímu číslu k = a + i/3, f3 ^ 0. Reálný vektorový podprostor Px generovaný reálnou a imaginární částí xx = re vx, y x = im vx je zjevně invariantní vůči násobení maticí A a dostáváme A ■ xi = axi — j3yx, A ■ yx = ayx + fixx. To ale neznamená nic jiného, než že zúžení našeho zobrazení na Px je dáno složením rotace o argument vlastní honoty k (úhel arccos -===) s násobením velikostí vlastní hodnoty k (skalárem a2 + /?2). Protože naše zobrazení zachovává velikosti, musí být velikost vlastní hodnoty k rovna jedné. Společně s předchozími úvahami jsme tedy dokázali úplný popis všech ortogonálních zobrazení ve větě. □ K důkazu se ještě vrátíme v kapitole třetí, když budeme studovat komplexní rozšíření euklidovských vektorových prostorů, viz 3.23. Poznámka. Specielně v dimenzi tři musí být alespoň jedno vlastní číslo ±1, protože je trojka liché číslo. Pak ovšem příslušný vlastní podprostor je osou rotace trojrozměrného prostoru o úhel daný argumentem dalších vlastních čísel. Zkuste si rozmyslet, jak poznat, kterým směrem jde rotace a také, že vlastní číslo —1 znamená ještě dodatečnou symetrii podle roviny kolmé na osu rotace. K diskusi vlastností matic a lineárních zobrazení se budeme vracet. Před pokračováním obecné teorie si ukážeme několik aplikací, ještě ale uzavřeme naši diskusi obecnou definicí: 2.32 2.49. Definice. Spektrum lineárního zobrazení f : V -» V \ (resp. matice) je posloupnost kořenů charakteristického polynomu zobrazení /, včetně násobností. Algebraickou násobností vlastní hodnoty rozumíme její násobnost jakožto kořenu charakteristického polynomu, geometrická násobnost vlastní hodnoty je dimenze příslušného podprostoru vlastních vektorů. Spektrálním poloměrem lineárního zobrazení (matice) je největší z absolutní hodnot vlastních čísel. Spektrum lineárního zobrazení J V této terminologii můžeme naše výsledky o ortogonálních zobrazeních zformulovat tak, že jejich spektra jsou vždy celá podmnožinou jednotkové kružnice v komplexní rovině. To znamená, že v reálné části spektra mohou být pouze hodnoty ±1, jejichž algebraické a geometrické násobnosti jsou stejné. Komplexní hodnoty spektra pak odpovídají rotacím ve vhodných dvourozměrných podprostorech. 86 KAPITOLA 3 Linární modely a maticový počet Máme už vybudován docela slušný balíček nástrojů a tak je na čase, abychom si maticový počet zkusili použít. Na docela jednoduchých úlohách uvidíme, že teorie nám umožňuje kvalitativní i kvantitativní analýzy a někdy i překvapivě snadno vede k výsledkům. Jakkoliv se může zdát, že předpoklad linearity vztahů mezi veličinami je příliš omezující, v reálných úlohách naopak často právě lineární závislosti buď vystupují přímo nebo je skutečný proces výsledkem iterace mnoha lineárních kroků, V této kapitole proto neprve zrekapitulujeme nej jednodušší případ, kdy celý proces je popsán jediným lineárním zobrazením. O co méně tady bude nové teorie, tím více snad bude zajímavé, jak takové modely vznikají v různých oblastech využití matematických nástrojů. Poté se vrátíme k tzv. lineárním diferenčním rovnicím, které lze chápat buďjako rekurentně definované funkce nebo také jako specifický případ lineárního interovaného procesu. Právě těm bude věnována část třetí, kde si ukážeme, k jakým kouzlům vede pochopení vlastností vlastních hodnot matic. Na matice (resp. lineární zobrazení) se také někdy rádi díváme jako na objekty, se kterými bychom rádi pracovali tak, jak to umíme se skaláry. To hodně souvisí i s tak zvanými rozklady matic, které jsou potřebné pro numerické zvládnutí matičkového počtu co nejrobustnějším způsobem. 1. Lineární procesy 3.1. Struktura řešení systému lineárních rovnic. Jednoduché lineární procesy jsou dány lineárními zobrazeními cp : V -» W na vektorových prostorech. Jak si jistě umíme představit, vektor v € V může představovat stav nějakého námi sledovaného systému, zatímco cp(v) pak dá výsledek po uskutečněném procesu. Pokud chceme dosáhnout předem daného výsledku b e W takového jednorázového procesu, řešíme problém cp(x) = b pro neznámý vektor x a známý vektor b. V pevně zvolených souřadnicích pak máme matici A zobrazení cp a souřadné vyjádření vektoru b. Jak jsme si povšimnuli už v úvodu druhé kapitoly, množina všech řešení tzv. homogenní úlohy A ■ x = 0 je vektorovým podprostorem. Pokud je dimenze V konečná, řekněme n, a dimenze obrazu zobrazení cp je k, pak řešením této soustavy pomocí 87 1. LINEÉEMPRmGESMNÁRNÍ MODELY A MATICOVÝ POČET převodu na řádkově schodovitý tvar (viz 2.7) zjistíme, že dimenze podprostoru všech řešení je právě n — k. Skutečně, protože sloupce matice zobrazení jsou právě obrazy bázových vektorů, je v matici systému právě k lineárně nezávislých sloupců a tedy i stejný počet lineárně nezávislých řádků. Proto nám zůstane při převodu na řádkový schodovitý tvar právě n — k nulových řádků. Při řešení systému rovnic nám tak zůstane právě n — k volných parametrů a dosazením vždy jednoho z nich s hodnotou jedna a vynulováním ostatních získáme právě n — k lineárně nezávislých řešení. Všechna řešení jsou pak dána právě všemi lineárními kombinacemi těchto n — k řešení. Každé takové (n — /c)-tici řešení říkáme fundamentální systém řešení daného homogenního systému rovnic. Dokázali jsme: Věta. Množina všech řešení homogenního systému rovnic A ■ x = 0 pro n proměnných s maticí A hodnosti k je vektorovým pod-prostorem v W dimenze n — k. Každá báze tohoto podprostoru tvoří fundamentální systém řešení daného homogenního systému. 3.2. Nehomogenní systémy rovnic. Uvažme nyní obecný systém rovnic A ■ x = b. Znovu si uvědomme, že sloupce matice A jsou ve skutečnosti obrazy vektorů standardní báze v W v lineárním zobrazení cp odpovídajícím matici A. Pokud má existovat řešení, musí být b v obrazu cp a tedy musí být lineární kombinací sloupců v A. Jestliže tedy rozšíříme matici A o sloupec b, můžeme, ale nemusíme, také zvětšit počet lineárně nezávislých sloupců a tedy i řádků. Pokud se tento počet zvětší, pak b v obrazu není a tedy systém rovnic nemůže mít řešení. Jestliže ale naopak máme stejný počet nezávislých řádků i po přidání sloupce b k matici A, znamená to, že sloupec b musí být lineární kombinací sloupců matice A. Koeficienty takové kombinace jsou právě řešení našeho systému rovnic. Uvažme nyní dvě pevně zvolená řešení x a v našeho systému a nějaké řešení z systému homogenního se stejnou maticí. Pak zjevně A-(x-y)=b-b = 0 A ■ (x + z) = 0 + b = b. Můžeme proto shrnout: 3.3. Věta. Řešení nehomogenního systému lineárních rovnic A ■ x = b existuje právě, když přidáním sloupce b k matici A nezvýšíme počet lineárně nezávislých řádků. V takovém případě je prostor všech řešení dán všemy součty jednoho pevně zvoleného partikulárního řešení systému a všech řešení 3 2a 3 2b systému homogenního se stejnou maticí. 3.4. ??? ... následuje výklad několika modelů založených na systémech rovnic / lineární procesy, může být 4-5 stran ... 3.5. ??? ... 88 CHAPTER 3. LINÁRNÍ MODELY A MAimmÉFÓÉĚRVVNICE 2. Diferenční rovnice Diferenčními rovnicemi jsme se stručně zabývali již v první kapitole, byť pouze těmi prvního řádu.Nyní si ukážeme obecnou teorii pro lineární rovnice s konstantními koeficienty, která poskytuje nejen velmi praktické nástroje, ale je také pěknou ilustrací pro koncepty vektorových podprostorů a lineárních zobrazení. 3.6. Definice. Homogenní lineární diferenční rovnice řádu k je dána výrazem aoxn + a\xn-\ + ■ ■ ■ + akxn_k =0, a$ ^ 0 ak ^ 0, kde koeficienty at jsou skaláry, které mohou případně i záviset na n. Říkáme také, že taková rovnost zadává homogenní lineární rekurenci řádu k a často zapisujeme hledanou posloupnost jako funkci Cl\ ak *n = /(«) =--f(n - 1)------f(n - k). Řešením této rovnice nazýváme posloupnost skalárů xt, pro všechna i e N, případně i e Z, které vyhovují rovnici s libovolným pevným n. Homogenní lineární diferenční rovnice řádu k Libovolným zadáním k po sobě jdoucích hodnot x; jsou určeny i všechny ostatní hodnoty jednoznačně. Skutečně, pracujeme nad polem skalárů, takže hodnoty a0 i ak jsou inverti-bilní a proto z definičního vztahu lze vždy spočíst hodnotu xn ze známých ostatních hodnot a stejně tak pro xn_k. Indukcí tedy okamžitě dokážeme, že lze jednoznačně dopočíst všechny hodnoty jak pro kladná tak pro záporná celá n. Prostor všech nekonečných posloupností x; je vektorový prostor, kde sčítání i násobení skaláry je dáno po složkách. Přímo z definice je zjevné, že součet dvou řešení homogenní lineární rovnice nebo skalární násobek řešení je opět řešení. Stejně jako u homogenních systémů lineárních tedy vidíme, že množina všech řešení je vektorový podprostor. Počáteční podmínka na hodnoty řešení je dána jako k-rozměrný vektor v Kk. Součtu počátečních podmínek odpovídá součet příslušných řešení a obdobně se skalárními násobky. Dále si všimněme, že dosazením nul a jedniček do zadávaných počástečních k hodnot snadno získáme k lineárně nezávislých řešení naší rovnice. Jakkoliv jsou tedy zkoumané vektory nekonečné posloupnosti skalárů, samotný prostor všech řešení je konečněrozměrný, předem víme, že jeho dimenze bude rovna řádu rovnice k, a umíme snadno určit bázi všech těchto řešení. Opět hovoříme o fundamentálním systému řešení a všechna ostatní řešení jsou právě jejich lineární kombinace. 3.7. Řešení homogenních rekurenci s konstantními koeficienty. Těžko bychom hledali univerzální postup, jak hledat 89 2. DIFERHNěMROVEIlSÉRNI MODELY A MATICOVÝ POČET řešení obecných homogenních lineárních diferenčních rovnic, tj. přímo spočítatelný výraz pro obecné řešení xn. V praktických modelech ale velice často vystupují rovnice, kde jsou koeficienty konstantní. V tomto přípdě se daří uhodnout vhodnou formu řešení a skutečně se nám podaří najít k lineárně nezávislých možností. Tím budeme mít problém vyřešený, protože všechny ostatní budou jejich lineární kombinací. Pro jednoduchost začneme rovnicemi druhého řádu. Takové potkáváme obzvlášť často v praktických problémech, kde se vyskytují vztahy závisející na dvou předchozích hodnotách. Lineární diferenční rovnicí druhého řádu s konstantními koeficienty tedy rozumíme předpis el.8 | (3.1) f(n + 2) = a ■ f(n + 1) +b ■ f(n) +c, kde a,b, c jsou známé skalární koeficienty. Např. v populačních modelech můžeme zohlednit, že jedinci v populaci dospívají a pořádně se rozmnožují až o dvě období později (tj. přispívají k hodnotě f(n + 2) násobkem b ■ f (n) s kladným b > 1), zatímco nedospělí jedinci vysílí a zničí část dospělé populace (tj. koeficient a může být i záporný). Navíc si je třeba někdo pěstuje a průběžně si ujídá konstantní počet c < 0. Speciálním takovým příkladem s c = 0 je např. Fibo-nacciho posloupnost čísel y0, yi, ..., kde yn+2 = y„+i + y„. Jestliže při řešení matematického problému nemáme žádný nový nápad, vždy můžeme zkusit, do jaké míry funguje známé řešení podobných úloh. Zkusme proto dosadit do rovnice (3.1) s koeficientem c = 0 podobné řešení jako u rovnic lineárních, tj. f (jí) = X" pro nějaké skalární X. Dosazením dostáváme X"+2 - aXn+1 - bX" = X"(X2 -aX-b) =0. Tento vztah bude platit buď pro X = 0 nebo při volbě hodnot Xl = i(a +Va2 +4b), X2 = \^{a - ja2 +4b). Zjistili jsme tedy, že skutečně opět taková řešení fungují, jen musíme vhodně zvolit skalár X. To nám ale nestačí, protože my chceme najít řešení pro jakékoliv počáteční hodnoty /(O) a f(l), a zatím jsme našli jen dvě konkrétní posloupnosti splňující danou rovnici (a nebo dokonce jen jednu, pokud je ^2 = ^l)- Jak jsem již dovodili i u zcela obecných lineárních rekurencí, součet dvou řešení fi(n) a f2(n) naší rovnice f(n +2) — a ■ f(n + 1) — b ■ f (n) = Oje zjevně opět řešením téže rovnice a totéž platí pro konstatní násobky řešení. Naše dvě konkrétní řešení proto poskytují daleko obecnější řešení f(n) = dXl + C2X\ pro libovolné skaláry C\ a C2 a pro jednoznačné vyřešení konkrétní úlohy se zadanými počátečními hodnotami /(O) a f (1) nám zbývá jen najít příslušné konstanty C\ a C2. (A také si musíme ujasnit, zda to pro všechny počáteční hodnoty půjde). 90 CHAPTER 3. LINÁRNÍ MODELY A MAimmÉFÓÉĚHOVNICE 3.8. Volba skalárů. Ukažme si, jak to může fungovat alespoň na jednom příkladě. Soustředíme se přitom na problém, že kořeny charakteristického polynomu nevychází obecně ve stejném oboru skalárů, jako jsou koeficienty v rovnici. 1 y0 = 2, yi = 0. V našem případě je tedy Ai_2 = ^(1 ± V3) a zjevně y0 = Ci + C2 = 2 yi = ici(l + V3) + ic2(l->/3) je splněno pro právě jednu volbu těchto konstant. Přímým výpočtem C\ = 1 — |V3, C2 = 1 + |V3 a naše úloha má jediné řešení f(n) = (1 - i V3)^(l + 73)" + (1 + i V3)^(l - 73)" Všimněme si, že i když nalezená řešení pro rovnice s celočíselnými koeficienty vypadají složitě a jsou vyjádřena pomocí iracionálních (případně komplexních) čísel, o samotném řešení dopředu víme, že je celočíselné též. Bez tohoto „úkroku" do většího oboru skalárů bychom ovšem obecné řešení napsat neuměli. S podobnými jevy se budeme potkávat velice často. Obecné řešení nám také umožňuje bez přímého vyčíslo vání konstant diskutovat kvalitativní chování posloupnosti čísel f(n), tj. zda se budou s rostoucím n blížit k nějaké pevné hodnotě nebo budou oscilovat v nějakém rozsahu nebo utečou do neomezených kladných nebo záporných hodnot. 3.9. Obecný případ homogenních rekurencí s konstantními koeficienty. Zkusme nyní stejně jako v případě druhého řádu dosadit volbu xn = k" pro nějaký ( zatím neznámý) skalár k do obecné homogenní rovnice z definice 3.6. Dostáváme pro každé n podmínku kn-k(a0kk + air'1 ...+ak)=0 což znamená, že buď k = 0 nebo je k kořenem tzv. charakteristického polynomu v závorce. Charakteristický polynom ale už není závislý na n. Předpokládejme, že má charakteristický polynom k různých kořenů ki,...,kk. Můžeme za tímto účelem i rozšířit uvažované pole skalárů, např. Q na M nebo M na C, protože výsledkem výpočtu pak stejně budou řešení, která opět zůstanou v původním poli díky samotné rovnici. Každý z kořenů nám dává jedno možné řešení Abychom byli uspokojeni, potřebujeme k lineárně nezávislých řešení. K tomu nám postačí ověřit nezávislost dosazením k hodnot pro n = 0, ..., k — 1 pro k možností k{. Dostaneme tzv. Vandermondovu matici a je pěkným (ale ne úplně snadným) 91 2. DIFEEEMěWROVEISÉRNIMODELY A MATICOVÝ POČET cvičením spočíst, že pro všechna k a jakékoliv /c-tice různých ki je determinant takovéto matice nenulový, viz ??. To ale znamená, že zvolená řešení jsou lineárně nezávislá. Nalezli jsme tedy fundamentální systém řešení homogenní diferenční rovnice v případě, že všechny kořeny jejího charakteristického polynomu jsou po dvou různé. Uvažme nyní násobný kořen k a dosaďme do definiční rovnice předpokládané řešení xn = nk". Dostáváme podmínku a0nkn H----+ak(n- k)kn~k = 0. Tuto podmínku je možné přepsat pomocí tzv. derivace polynomu, kterou značíme apostrofem: k(a0kn + ■ ■ ■ + akk"-ky =0 a hned na začátku kapitoly páté uvidíme, že kořen polynomu / je vícenásobný právě, když je kořenem i jeho derivace /'. Naše podmínka je tedy splněna. Při vyšší násobnosti i kořenu charakteristického polynomu můžeme postupovat obdobně a využijeme skutečnosti, že £-násobný kořen je kořenem všech derivací polynomu až do i — 1 včetně. Derivace přitom postupně vypadají takto: f(k) = a0kn + ■■■+ akk"-k f'(k) = aonk"-1 +■■■ + ak(n - k)kn-k~l f"(k) = a0n(n - l)kn~2 + ■■■ + ak(n - k)(n -k- \)kn~k f(l+1) = a0n...(n- í)kn~1-1 + ... + ak(n -k)...(n-k- l)kn-k-l~x Podívejme se na případ trojnásobného kořenu k a hledejme řešení ve tvaru n2kn. Dosazením do definiční podmínky dostaneme rovnost a0n2kn + ---+ak(n- k)2kn~k = 0. Zjevně je levá strana rovna výrazu k2 f"(k) +kf'(k) a protože je k kořenem obou derivací, je podmínka splněna. Indukcí snadno dokážeme, že i obecnou podmínku pro hledané řešení ve tvaru xn = nlkn, a0nlkn + ... ak(n - kfkn~k = 0, dostaneme jako vhodnou lineární kombinaci derivací charakteristického polynomu začínající kl+l f{l+l) + ^kli(i + l)fW + ... a dostali jsme se tedy blízko k úplnému důkazu následující: Věta. Každá homogenní lineární diferenční rovnice řádu k nad libovolným číselným oborem K obsaženým v komplexních číslech K má za množinu všech řešení k—rozměrný vektorový prostor generovaný posloupnostmi x„ = nlkn, kde k jsou (komplexní) kořeny charakteristického polynomu a mocniny l probíhají všechna přirozená čísla od nuly až do násobnosti příslušného kořenu k. 92 CHAPTER 3. UNÁRNÍ MODELY A MAimmÉFÓÉĚRVVNICE Důkaz. Výše použité vztahy násobnosti kořenů a derivací uvidíme později, a nebudeme tu dokazovat tvrzení, že každý komplexní polynom má právě tolik kořenů, včetně násobnosti, jaký má stupeň. Zbývá tedy ještě dokázat, že nalezená &-tice řešení je lineárně nezávislá. I v tomto případě lze induktivně dokázat nenulovost příslušného determinantu, jako jsme zmiňovali u toho Vandermondova výše. □ 3.12 | 3.10. Reálné báze řešení reálných differenčních rovnic. Pro rovnice s reálnými koeficienty povedou reálné počáteční podmínky vždy na reálná řešení. Přesto ale budou příslušná fundamentální řešení z právě odvozené věty často existovat pouze v oboru komplexním. Zkusme proto najít jiné generátory, se kterými se nám bude pracovat lépe. Potože jsou koeficienty charakteristického polynomu reálné, každý jeho kořen bude buď také reálný nebo musí kořeny vystupovat po dvou komplexně združených. Jestliže si řešení popíšeme v goniometrickém tvaru jako X" = |A|"(cosř2(/> + i sinncp) X" = \X\n (cos n(p — i sinncj)), okamžitě je vidět, že jejich součtem a rozdílem dostáváme jiná dvě lineárně nezávislá řešení xn = \X\" cosn(f>, yn = \X\nsinn(p. Difereční rovnice se velmi často vyskytují jako model dynamiky nějakého systému. Pěkným tématem na přemýšlení je proto souvislost absolutních hodnot jednotlivých kořenů a stabilizace řešení, buď všech nebo v závislosti na počátečních podmínkách. Nepůjdeme zde do podrobností, protože teprve v páté kapitole budeme probírat pojem konvergence hodnot k nějaké hodnotě limitní apod., jistě je tu ale prostor pro zajímavé numerické experimenty např. s oscilacemi vhodných populačních nebo ekonomických modelů. 3.13 | 3.11. Nehomogenní lineární diferenční rovnice. Stejně jako u systémů lineárních rovnic můžeme dostat všechna řešení nehomogenních lineárních diferenčních rovnic a0(n)x„ +ai(n)x„_i -\-----h ak(n)x„_k = b(n), kde koeficienty at a b jsou skaláry, které mohou záviset na n, aa0(n) ak(n) ^ 0. Postupujeme tak, že najdeme jedno řešení a přičteme celý vektorový prostor dimenze k řešení odpovídajících systémů homogenních. Skutečně takto dostáváme řešení a protože je rozdíl dvou řešení nehomogenní rovnice zjevně řešením homogenní, dostáváme takto řešení všechna. U systémů lineárních rovnic se mohlo stát, že nemusel vůbec mít řešení. To u našich diferenčních rovnic možné není. Zato ale bývá nesnadné nalézt to jedno potřebné partikulární řešení nehomogenního systému, pokud je chování skalárních koeficientů v rovnici složité. Omezíme se tu na jediný případ, kdy příslušný homogenní systém má koeficienty konstantní a b(n) je polynom stupně s. 93 2. DIFERHNěMROVEIlSÉRNI MODELY A MATICOVÝ POČET Řešení pak lze hledat ve tvaru polynomu x„ = q?o + u\n + • • • + asns s neznámými koeficienty at, i = 1, ..., s. Dosazením do diferenční rovnice a porovnáním koeficientů u jednotlivých mocnin n dostaneme systém s + 1 rovnic pro s + 1 proměnných a{. Pokud má tento systém řešení, našli jsme řešení našeho původního problému. Pokud řešení nemá, může stačit zvětšit stupeň s hledaného polynomu. Např. rovnice xn— x„ _2 = 2 nemůže mít konstantní řešení, ale dosazením x„ = q?o + a\n dostáváme řešení a\ = 1 (a koeficient q?o může být libovolný) a proto je obecné řešení naší rovnice xn = Ci +C2(-1)" +n. Všimněme si, že skutečně matice příslušného systému rovnic doPlnit_ pro polynom nižšího stupně nula je nulová a rovnice 0 • a0 = 2 diskusi nemá řešení. řešitelnosti pomoci 3.14 variace 3.12. Lineární filtry. Uvažujme nyní nekonečné posloup-konstant " nosti X = (...,x_ř7,x_ř7_(_i,...,x_i, JCq, X\, . . . , Xn, . . . ) a budeme, podobně jako u systémů lineárních rovnic, pracovat s operací T, která zobrazí celou posloupnost x na posloupnost z = Tx se členy zn = ciQXn + a\xn-\ + • • • + a\xn-\. S posloupnostmi x můžeme opět pracovat jako s vektory vzhledem ke sčítání i násobení skaláry po složkách. Pouze bude tento velký vektorový prostor nekonečněrozměrný. Naše zobrazení T je zjevně lineárním zobrazením na takovém vektorovém prostoru. Posloupnosti si představme jako diskrétní hodnoty nějakého signálu, odečítané zpravidla ve velmi krátkých časových jednotkách, operace T pak může být filtrem, který signál zpracovává. Bude nás zajímat, jak odhadnout vlastnosti, které takový „filtr" bude mít. Signály jsou velice často ze své podstaty dány součtem několika částí, které jsou samy o sobě víceméně periodické. Z naší definice je ale zřejmé, že periodické posloupnosti xn, tj. posloupnosti splňující pro nějaké pevné přirozené číslo p budou mít i periodické obrazy z = T x Zn+p = a0xn+p + a\xn-\+p + ' ' ' + akxn-k+p = ClQXn + a\X„-i + • • • + a^Xn-k = Zn se stejnou periodou p. Pro pevně zvolenou operaci T nás bude zajímat, které vstupní periodické posloupnosti zůstanou přibližně stejné (případně až na násobek) a které budou utlumeny na nulové hodnoty. 94 CHAPTER 3. UNÁRNÍ MGDEIMK)MWľÉnĹIMÉÉRWEHROCESY V druhém případě tedy hledáme jádro našeho lineárního zobrazení T. To je ale dáno právě homogenní diferenční rovnicí aoxn + a\xn-\ + ■ ■ ■ + a^Xn-i =0, a$ 7^ 0 ak 7^ 0, kterou jsme se naučili řešit. 3.13. Spatný equalizer. Jako příklad uvažujme velmi jednoduchý lineární filtr zadaný rovnicí Zn (Tx)„ — Xn+2 + x„. Výsledky takového zpracování signálu jsou naznačeny na následujících čtyřech obrázcích pro postupně se zvyšující frekvenci periodického signálu x„ = cos(cpn). Červený je původní signál, zelený je výsledek po zpracování filtrem. Nerovnoměrnosti křivek jsou důsledkem nepřesného kreslení, oba signály jsou samozřejmě rovnoměrnými sinusovkami. Všimněme si, že v oblastech, kde je výsledný signál přibližně stejně silný jako původní, dochází k dramatickému doplni( posuvu fáze signálu. Levné equalizery skutečně podobně podrobný . ~ c výpočet spatné funguji. /0^ocí uvedených , nástrojů 3. Iterované lineární procesy 3.14. Iterované procesy. V praktických modelech se často setkáváme se situací, kdy je vývoj systému v jednom časovém období dán lineárním procesem, zajímáme se ale o chování systému po mnoha iteracích. Často přitom samotný lineární proces zůstává pořád stejný, z pohledu našeho matematického modelu tedy nejde o nic jiného než opakované násobení stavového vektoru stále stejnou maticí. Zatímco pro řešení systémů lineárních rovnic jsme potřebovali jen minumum znalostí o vlastnostech lineárních 95 3. ITERCmĚmEINEÁmWMfflĎmWELY A MATICOVÝ POČET 3 .17 zobrazení, k pochopení chování iterovaného systému budeme účelně používat znalosti vlastních čísel, vlastností vlastních vektorů a další strukturní výsledky. V jistém smyslu se pohybujeme v podobném prostředí jako u lineárních rekurencí a skutečně můžeme náš popis filtrů v minulých odstavcích takto také popsat. Představme si, že pracujeme se zvukem a uchováváme si stavový vektor ^n-k+1 ) všech hodnot od aktuální až po poslední, kterou ještě v našem lineárních filtru zpracováváme. V jednom (ve vzorkovací frekveci audio signálu mimořádně krátkém) časovém intervalu pak přejdeme ke stavovému vektoru Y„ +i i xn-k+2), kde první hodnota xn+\ = a\xn + ■ ■ ■ + akx„_k+i je spočtena jako u homogenních diferenčních rovnic, ostatní si jen posunujeme o jednu pozici a poslední zapomeneme. Příslušná čtvercová matice řádu k, splňující Yn+\ = A-Yn, bude vypadat takto: 1 0 0 1 \0 0 O-k-l 0 ak\ 0 0 0 1 0/ Pro takovou jednoduchou matici jsme si odvodili explicitní postup pro úplné řešení otázky, jak vypadá formule pro řešení. Obecně to tak snadno nepůjde ani pro velice podobné systémy. Jedním z typických případů je studium dynamiky populací v různých biologických systémech. Všimněme si také, že vcelku pochopitelně má matice A za charakteristický polynom právě p (k) = kk — aikk~l — ■ ■ -—ak (snadno dovodíme pomocí rozvoje podle posledního sloupce a rekurencí). To je snadno vysvětlitelné přímo, protože řešení xn = k", k 0 vlastně nyní znamená, že matice A vynásobením převede vlastní vektor (kk, ..., k)T na jeho A-násobek. Musí být tedy k vlastním číslem matice A. 3.15. Model růstu populací. Představme si, že zkoumáme nějaký systém jednotlivců (pěstovaná zvířata, hmyz, buněčné kultury apod.) rozdělený do m skupin (třeba podle stáří, fází vývoje hmyzu apod.). Stav X„ je tedy dán vektorem X„ — («i závisejícím na okamžiku ř„, ve kterém systém pozorujeme. Lineární model vývoje takového systému je dán maticí A dimenze n, která zadává změnu vektoru Xn na Xn+i = A ■ Xn při přírůstku času z tk na tk+i. 96 CHAPTER 3. UNÁRNÍ MGDEIMK)MWľÉnĹIMÉÉRWEHROCESY Uvažujme jako příklad tzv. Leslieho model růstu, ve kterém vystupuje matice I fl h h ■■■ fm-l fm\ ti 0 0 ... o o 0 r2 0 ... 0 0 A = 0 0 r3 ' • - 0 0 ' \0 0 0 ... rm_! 0/ jejíž parametry jsou svázány s vývojem populace rozdělené do m věkových skupin tak, že /) označuje relativní plodnost příslušné věkové skupiny (ve sledovaném časovém skoku vznikne z N jedinců v i-té skupině /) N jedinců nových, tj. ve skupině první), zatímco r; je relativní úmrtnost i-té skupiny během jednoho období. Pochopitelně lze použít takový model s libovolným počtem věkových skupin. Všechny koeficienty jsou tedy nezáporná reálná čísla a čísla r jsou mezi nulou a jedničkou (a pokud jsou všechna rovna jedné, jde vlastně o lineární rekurenci s konstantními koeficienty). Než se pustíme do obecnější teorie, trochu si pohrajeme s tímto konkrétním modelem. Přímým výpočtem pomocí Laplaceova rozvoje podle posledního sloupce spočteme charakteristický polynom pm (k) matice A pro model s m skupinami: pm(k) = det(A-kE) = -Apm_1(A)+(-l)m_1/mr1 ... rm_i. Vcelku snadno dovodíme indukcí, že tento charakteristický polynom má tvar PmW = (—l)m(Am — a{km 1 — ••• — am-{k — am) s vesměs nezápornými koeficienty a\, ... ,am, pokud jsou všechny prámetry r; a /) kladné. Např. je vždy am = f m t\ ■ ■ ■ tm — 1 - Zkusme kvalitativně odhadnout rozložení kořenů polynomu pm, detaily budeme umět přesně vysvětlit a ověřit až po absolvování příslušných partií tzv. matematické analýzy v kapitole páté a později. Vyjádříme si pm(\) = ±\m(l-q(\)) kdeg(A) = aik~l + - ■ ■+amk~m je ostře klesající a nezáporná funkce pro k > 0. Evidentně bude proto existovat právě jedno kladné k, pro které bude q(k) = 1 a tedy také pm(k) = 0. Jinými slovy, pro každou Leslieho matici existuje právě jedno kladné reálné vlastní číslo. Pro skutečné Leslieho modely populací bývají všechny koeficienty r; i /_,■ mezi nulou a jedničkou a typicky nastává situace, kdy jediné reálné vlastní číslo k\ je větší nebo rovno jedné, zatímco absolutní hodnoty ostatních vlastních čísel jsou ostře menší než jedna. Jestliže začneme s libovolnýmn stavovým vektorem X, který bude dán jako součet vlastních vektorů X = X\ + ■ ■ ■ + Xm 97 3. ITERCmĚmEINEÁmWMfflĎMWELY A MATICOVÝ POČET s vlastními hodnotami kt, pak při iteracích dostáváme Ak ■ X = k\X\ + ... kkmXm, takže za předpokladu, že \kt\ < 1 pro všechna / > 2, budou všechny komponenty ve vlastních podprostorech velmi rychle mizet, kromě kompomenty k\X*. Rozložení populace do věkových skupin se tak budou rychle blížit poměrům komponent vlastního vektoru k dominantnímu vlastnímu číslu ki- Například pro matici (uvědomme si význam jednotlivých koeficientů, jsou převzaty z modelu pro chov ovcí, tj. hodnoty r zahrnují jak přirozený úhyn tak případné aktivity chovatelů na jatkách) / o 0.95 0 0 V 0 0.2 0.8 0.6 0\ 0 0 0.8 0 0 0 0 0 0 0.7 0 0 0 0 0.6 0/ 3.1E vyjdou vlastní hodnoty přibližně 1.03, 0, -0.5, -0,27 + 0.74/, -0.27 -0.74/ s velikostmi 1.03, 0, 0.5, 0.78, 0.78 a vlastní vektor příslušný dominantnímu vlastnímu číslu je přibližně x = (30 27 21 14 8). Zvolili jsme rovnou jediný vlastní vektor se součtem souřadnic rovným stu, zadává nám proto přímo výsledné procentní rozložení populace. Pokud bychom chtěli místo tříprocentního celkového růstu populace setrvalý stav a předsevzali si ujídat více ovce třeba z druhé věkové skupiny, řešili bychom úlohu, o kolik máme zmenšit r2, aby bylo dominantní vlastní číslo rovno jedné. 3.16. Matice s nezápornými prvky. Reálné matice, které nemají žádné záporné prvky mají velmi speciální vlastnosti, holiíio^ochu Zároveň jsou skutečně časté v praktických modelech. Na-hlsto™: J L J vlastne jen značíme proto teď proto tzv. Perronovu-Frobeniovu teorii, naznačíme část ' f ' ~ • výsledků která se pravé takovým maticím venuje. penona,k Začneme definicí několika pojmů, abychom mohli naše Frobeniově obecnější úvahy vůbec formulovat, situaci se vůbec nedopra- Definice. Za kladnou matici budeme považovat takovou čtver-1 covou matici A, jejíž všechny prvky jsou reálné a ostře kladné. Primitivní matice je pak taková čtvercová matice A, jejíž nějaká mocnina A* je kladná. Kladné a primitivní matice J 98 chapter 3. unární mgdeimk)MWľÉnĹIMÉÉRWEHROCESY Připomeňme, že spektrálním poloměrem matice a nazý-váme maximum absolutních hodnot všech jejích (komplexních) vlastních čísel. Spektrálním poloměrem lineárního zobrazení na (konečněrozměrném) vektorovém prostoru rozumíme spektrální poloměr jeho matice v některé bázi. Normou 2 matice AeK" nebo vektoru x e w rozumíme součet absolutních hodnot všech jejich prvků. U vektorů x píšeme pro jejich normu \x\. Následující výsledek je mimořádně užitečný a snad i dobře srozumitelný. Jeho důkaz se svou náročností dosti vymyká této učebnici, uvádíme ale alespoň jeho stručný nástin. Pokud by čtenář měl problém s plynulým čtení nástinu důkazu, doporučujeme jej přeskočit. Věta (Perronova). Jestliže je a primitivní matice se spektrálním poloměrem lei, pak je k jednoduchým kořenem charakteristického polynomu matice a, který je ostře větší než absolutní hodnota kteréhokoliv jiného vlastního čísla matice a. k vlastnímu číslu k navíc existuje vlastní vektor x s výhradně kladnými prvky x;-. inspirováno materiálem na Náznak důkazu. V důkazu se budeme opírat o intu- vízbhttp://www-ici elementární geometrie. Částečně budeme použité kon-users math umd edu & ť ~mmb/475/spec.pdf cepty upřesňovat už v analytické geometrii ve čtvrté kapitole, některé analytické aspekty budeme studovat podrobněji v kapitolách páté a později, přesné důkazy některých analytických kroků v této učebnici nepodáme vůbec. Snad budou následující úvahy nejen osvětlovat dokazovaný teorém, ale budou také samy o sobě motivací pro naše další studium geometrie i matematické analýzy. Začneme docela srozumitelně znějícím pomocným lemmatem: Lemma. Uvažme libovolný mnohostěn p obsahující počátek 0 e w1. Jestliže nějaká iterace lineárního zobrazení ý '■ w -» w zobrazuje p do jeho vnitřku, pak je spektrální poloměr zobrazení ý ostře menší nezjedná. Uvažme matici a zobrazení ý ve standardní bázi. Protože vlastní čísla ak jsou k-té mocniny vlastních čísel matice a, můžeme rovnou bez újmy na obecnosti předpokládat, že samotné zobrazení ý již zobrazuje p do vnitřku p. Zjevně tedy nemůže mít ý žádnout vlastní hodnotu s absolutní hodnotou větší než jedna. Důkaz dále povedeme sporem. Předpokládejme, že existuje vlastní hodnota k s |A| = 1. Máme tedy dvě možnosti. Buďje kk = 1 pro vhodné k nebo takové k neexistuje. Obrazem f je uzavřená množina (to znamená, že pokud se body v obrazu budou hromadit k nějakému bodu y v w, bude y opět v obrazu) a hranici p tento obraz vůbec nepro-tíná. Nemůže tedy mít ý pevný bod na hranici p ani nemůže existovat žádný bod na hranici, ke kterému by se mohly libovolně blížit body v obrazu. První argument vylučuje, že by nějaká mocnina k byla jedničkou, protože to by takový pevný bod na hranici p jistě existoval. Ve zbývajícím případě jistě existuje dvourozměrný podprostor w C M", na nějž se ý zužuje coby rotace o iracionální argument a jistě existuje bod 99 3. ITERGfflmWEE^AÍRMMMĎWWELY A MATICOVÝ POČET y v průniku W s hranicí P. Pak by ale byl bod y libovolně přesně přiblížen body z množiny ý"(y) při průchodu přes všechny iterace a tedy by musel sám být také v obrazu. Došli jsme tedy ke sporu a lemma je ověřeno. Nyní se dáme do důkazu Perronovy věty. Naším prvním krokem bude ověření existence vlastního vektoru, který má všechny prvky kladné. Uvažme za tím účelem tzv. standardní simplex S = {x = (x\, ..., xn)T, \x\ = 1, Xi > 0, i = 1, ..., n}. Protože všechny prvky v matici A jsou nezáporné, obraz A ■ x bude mít samé nezáporné souřadnice stejně jako x a alespoň jedna z nich bude vždy nenulová. Zobrazení x h-» \A ■ x\~l(A ■ x) proto zobrazuje S do sebe, Toto zobrazení S ^ S splňuje všechny předpoklady tzv. Browerovy věty o pevném bodě a proto existuje vektor j e S takový, že je tímto zobrazením zobrazen sám na sebe. To ale znamená, že A ■ y = X y, X = \A ■ y\ a našli jsme vlastní vektor, který leží v S. Protože ale má nějaká mocnina Ak podle našeho předpokladu samé kladné prvky a samozřejmě je také Ak ■ y = Xky, všechny souřadnice vektoru y jsou ostře kladné (tj. leží ve vnitřku 5) a X > 0. Abychom dokázali zbytek věty, budeme uvažovat zobrazení zadané maticí A ve výhodnější bázi a navíc ho vynásobíme konstantou A-1: B = X~l(Y~l -A-Y), kde Y je diagonální matice se souřadnicemi yt vektoru y na diagonále. Evidentně je B také primitivní matice a navíc je vektor z = (1, - - -, l)r jejím vlastním vektorem. Jestliže nyní dokážeme, že \i = 1 je jednoduchým kořenem charakteristického polynomu matice B a všechny ostatní kořeny mají absolutní hodnotu ostře menší než jedna, bude Perronova věta dokázána. K tomu se nám teď bude hodit dříve dokázané pomocné lemma. Uvažujme matici B jako matici lineárního zobrazení, které zobrazuje řádkové vektory « = («1,..., un) \-> u ■ B = v, tj. pomocí násobení zprava. Díky tomu, žejez = (1, \)T vlastním vektorem matice B, je součet souřadnic řádkového vektoru v n n X Uibi> = ZMi: =!' i,j = l i = l kdykoliv je m e 5. Proto toto zobrazení zobrazuje simplex S na sebe a má také jistě v S vlastní (řádkový) vektor w s vlastní hodnotou jedna (pevný bod, opět dle Browerovy věty). Protože nějaká mocnina Bk obsahuje samé ostře pozitivní prvky, je nutně obraz simplexu S v k-té iteraci zobrazení daného B uvnitř 5. To už jsme blízko použití našeho lematu, které jsme si pro důkaz připravili. 100 CHAPTER 3. LINÁRNÍ MGDEIMK)MWľÉnĹIMÉÉRWEHROCESY Budeme i nadále pracovat s řádkovými vektory a označme si P posunutí simplexu S do počátku pomocí vlastního vektoru w, který jsme právě našli, tj. P = —w + S. Evidentně je P mnohostěn obsahující počátek a vektorový podprostor ľ Cl" generovaný f je invariantní vůči násobení maticí B násobením řádkových vektorů zprava. Zúžení našeho zobrazení na P tedy splňuje předpoklady pomocného lemmatu a proto nutně musí být všechny jeho vlastní hodnoty v absolutní hodnotě menší než jedna. Ještě se musíme vypořádat se skutečností, že právě uvažované zobrazení je dáno násobením řádkových vektorů zprava maticí B (zatímco nás původně zajímalo chování zobrazení, daného B pomocí násobení sloupcových vektorů zleva). To je ale ekvivalentní násobení transponovaných sloupcových vektorů transponovanou maticí B obvyklým způsobem zleva. Dokázali jsem tedy vlastně potřebné tvrzení o vlastních číslech pro matici transponovanou k naší matici B. Transponování ale vlastní čísla nemění. Dimenze prostoru V je přitom n — 1, takže důkaz věty je ukončen. □ 3.17. Jednoduché důsledky. Následující velice užitečné tvrzení má při znalosti Perronovy věty až překvapivě jednoduchý důkaz a ukazuje, jak silná je vlastnost primitívnosti matice zobrazení. Důsledek. Jestliže A = (a^) je primitivní matice a x e W1 její vlastní vektor se samými nezápornými souřadnicemi a vlastní hodnotou k, pak k > Oje spektrální poloměr A. Navíc platí Důkaz. Uvažme vlastní vektor x z dokazovaného tvrzení. Protože je A primitivní, můžeme zvolit pevně k tak, aby Ak už měla samé positivní prvky a pak je samozřejmě i Ak ■ x = kkx vektor se samými ostře kladnými souřadnicemi. Nutně proto je k > 0. Z Perronovy věty víme, že spektrální poloměr \i je vlastním číslem a zvolme takový vlastní vektor y k \i, že rozdíl x — y má samé kladné souřadnice. Potom nutně pro všechny mocniny n ale zároveň platí k < fi. Odtud již vyplývá k = fi. Zbývá odhad spektrálního poloměru pomocí minima a maxima součtů jednotlivých sloupců matice. Označme je bmin a bmax, zvolme za x vektor se součtem souřadnic jedna a n n 0 < A" ■ (x - y) = k"x - n"y, 101 3. ITERCmĚmEINEÁRWňmáiMWELY A MATICOVÝ POČET 3.20 počítejme: n n y auxj = z ^=^ n / n k n "k = ^ í ^ íí/j I x j < ^ bmaxXj = bmax j=i \-=i ' j=i n / n k n ^ = y, i y, a-ij i x j > bminxj = bmin 7 = 1 ^ = 1 ' 7 = 1 □ Všimněme si, že např. všechny Leslieho matice z 3.15, kde jsou všechny uvažované koeficienty ft a r,- ostře kladné, jsou primitivní a tedy na ně můžeme plně použít právě odvozené výsledky. Perronova-Frobeniova věta je zobecněním Perronovy věty na obecnější matice, které tu nebudeme uvádět. Další informace lze najít např. v ??. 3.18. Markovovy řetězce. Velice častý a zajímavý případ lineárních procesů se samými nezápornými prvky v matici je matematický model systému, který se může nacházet v m různých stavech s různou pravděpodobností. V jistém okamžiku je systém ve stavu i s pravděpodobností x; a k přechodu z možného stavu i do stavu j dojde s pravděpodobností ř;j. Můžeme tedy proces zapsat takto: V čase n je systém popsán pravděpodobnostním vektorem xn = ..., um(n))T. To znamená, že všechny komponenty vektoru x jsou reálná nezáporná čísla a jejich součet je roven jedné. Komponenty udávají rozdělení pravděpodobnosti jednotlivých možností stavů systému. Rozdělení pravděpodobností pro čas n + 1 bude dáno vynásobením pravděpodobnostní maticí přechodu T = (fy), tj. xn_|_i = T • xn. Protože předpokládáme, že vektor x zachycuje všechny možné stavy a proto s celkovou pravděpodobností jedna přejde opět do některého z nich, budou všechny sloupce matice T tvořeny také pravděpodobnostními vektory. Takovému procesu říkáme (diskrétní) Markovův proces. Všimněme si, že každý pravděpodobnostní vektor x je skutečně Markovovým procesem zobrazen na vektor se součtem souřadnic jedna: i,j Nyní můžeme v plné síle použít Perronovu-Frobeniovu teorii. Protože je součet řádků matice T vždy roven vektoru (1, ..., 1), je zcela elementárně vidět, že matice T — E je singulární a jednička proto bude zaručeně vlastním číslem matice T. Pokud je navíc T primitivní matice (tj. např. když jsou všechny prvky nenulové), z Důsledku 3.17 víme, že je 102 CHAPTER 3. LINÁRNÍ MGDEIMK)MWľÉnĹIMÉÉRWEHROCESY jednička jednoduchým kořenem charakteristického polynomu a všechny ostatní mají absolutní hodnotu ostře menší než jedna. Věta. Markovovy procesy s maticí, která nemá žádné nulové prvky nebo jejíž některá mocnina má tuto vlastnost, splňují: • existuje jediný vlastní vektor x^ pro vlastní číslo 1, který je pravděpodobnostní • iterace Tkxq se blíží k vektoru xm pro jakýkoliv počáteční pravděpodobnostní vektor xq. Důkaz. První tvrzení vyplývá přímo z kladnosti souřadnic vlastního vektoru dovozené v Perronově větě. Pokud jsou algebraické a geometrické násobnosti vlastních čísel matice T stejné, pak druhé tvrzení okamžitě vyplývá z toho, že absolutní hodnoty všech ostatních vlastních čísel musí být ostře menší než jedna. Skutečně, za uvedeného před-poladu na vlastní čísla lze každý počáteční vektor xq napsat jako součet vlastních vektorů matice T a při iterovaném působení matice T na počátečním vektoru xq všechny komponenty rychle vymizí, kromě té jediné s vlastním číslem 1. Ve skutečnosti ale i při různé algebraické a geometrické násobnosti vlastních čísel dojdeme ke stejnému závěru pomocí podrobnějšího studia tzv. kořenových podprostorů pro maticí T, ke kterým se dostaneme v souvislosti s tzv. Jordánovým rozkladem ještě v této kapitole, viz poznámka ??. □ 3.19. Iterace stochastických matic. Matice Markovových procesů, tj. matice jejichž všechny sloupce mají součet svých komponent roven jedné se nazývají stochastické matice. Standardní úlohy spojené s Markovovými procesy zahrnují odpovědi na otázky po očekávané střední době přechodu mezi předem určenými stavy systému apod. Momentálně nejsme 1 j j j r j vymazat na řešení těchto úloh připraveni, vrátíme se ale k této tématice příslib, pokud , v .. to nenastane, a později. nahradit Přeformulujeme předchozí větu do jednoduchého, ale asi odkazemd° J r J literatury docela překvapivého důsledku. Konvergencí k limitní matici v následuj cím tvrzení myslíme skutečnost, že když si předem určíme možnou chybu e > 0, tak najdeme hranici na počet iterací k po níž už všechny komponenty uvedené matice se od té limitní budou lišit o méně než e. Důsledek. Nechť T je primitivní stochastická matice z Mar-kovova procesu a Xoo je stochastický vlastní vektor k dominantnímu číslu 1 jako ve větě výše. Pak iterace Tk konvergují k limitní matici Too, jejíž všechny sloupce jsou rovny x^. Nyní se ještě na rozlučku s Markovovými procesy zamyslíme se nad problémem, zda existují pro daný systém stavy, do kterých se má systém tendenci dostat a setrvat v nich. O stavu systému řekneme, že je přechodový, jestliže v něm systém setrvává s pravděpodobností ostře menší než jedna. Za absorbční označíme stav, ve kterém systém setrvává s pravděpodobností 1, a do kterého se lze dostat s nenulovou pravděpodobností z kteréhokoliv z přechodových stavů. Konečně, Markovův řetězec Xn je absorpční, jestliže jsou jeho všechny jeho stavy buď absorpční nebo přechodové. 103 4. VÍCEGMmZEWÉHHFÁWVÍMODELY A MATICOVÝ POČET Je-li v absorpčním Markovově řetězci prvních r stavů systému absorpčních, pro stochastickou matici T systému to znamená, že se rozpadá na „blokově" horní trojúhelníkový tvar kde E je jednotková matice, jejíž rozměr je dán počtem absorpčních stavů, zatímco R je kladná matice a Q nezáporná. V každém případě iteracemi této matice budeme pořád dostávat stejný blok nulových hodnot v levém dolním bloku a tedy zcela jistě nebude primitivní, např. I o takových maticích lze získat hodně informací pomocí plné Perronovy-Frobeniovy teorie a se znalostí pravděpodobnosti a statistiky také odhadovat střední doby, po kterých se systém dostane do jedhodo z abosrpčních stavů apod. Na vcelku praktických příkladech jsme viděli, že porozumění vnitřní struktuře matic a jejim vlastnostem je silným nástrojem pro konkrétní výpočty nebo analýzy. Ještě více to platí pro efektivitu numerického počítání s maticemi. Proto se budeme zase chvíli věnovat abstraktní teorii. Budeme přitom zkoumat další speciální typy lineárních zobrazení na vektorových prostorech ale také obecný případ, kdy je struktura zobrazení popsána tzv. Jordánovou větou. 3.20. Unitární prostory a zobrazení. Už jsme si zvykli, že je užitečné pracovat rovnou v číselném oboru komplexních čísel a to i v případě, kdy nás zajímají jen reálné objekty. Navíc v mnohých oblastech jsou komplexní vektorové prostory nutnou součástí úvah. Jasným příkladem je například tzv. kvantové počítání, které se stalo velmi akční oblastí teoretické informatiky, přestože kvantové počítače zatím zkonstruovány ve funkční podobě nebyly. Proto navážeme na ortogonální zobrazení a matice z konce druhé kapitoly následující definicí: Definice. Unitární prostor je komplexní vektorový prostor V spolu se zobrazením V x V -» C, (u, v) h-» u ■ v, které splňuje pro všechny vektory u,v,w e V a skaláry a e C (1) u ■ v = v ■ u (zde pruh značí komplexní konjugaci) (2) (au) ■ v = a(u ■ v) (3) (u + v) ■ w = u ■ w + v ■ w (4) je-li íí / O, pak u ■ u > 0 (zejména je výraz reálný). Toto zobrazení nazýváme skalární součin na V. Reálné číslo y/v ■ v nazýváme velikostí vektoru v a vektor je normovaný, jestliže má velikost jedna. Vektory u a. v nazýváme ortogonální, jestliže je jejich skalární součin nulový, bázi sestavenou z po dvou ortogonálních a normovaných vektorů nazýváme ortonormální báze V. 4. Více maticového počtu 3.30 104 CHAPTER 3. L1NÁWÍ MODEMMMMMXNVmÉHZFPOČTU Unitární prostory Na první pohled jde o rozšíření definice euklidovských vektorových prostorů do komplexního oboru. Nadále budeme také používat alternativní značení (u,v) pro sklaární součin vektorů u a. v. Zcela stejně jako v reálném oboru také okamžitě z definice vyplývají násludující jednoduché vlastnosti skalárního součinu pro všechny vektory ve V a skaláry v C: u ■ u e M u ■ u = 0 právě tehdy, když u = 0 u ■ (av) = ä(u ■ v) u ■ (v + w) = u ■ v + u ■ w u ■ 0 = 0 • u = 0 (X0*"*) ' E Vj) = ^atbjiui ■ v j), i j i J kde poslední rovnost platí pro všechny konečné lineární kombinace. Podrobné ověření je skutečně jednoduchým cvičením, např. první vztah plyne okamžitě z definiční vlastnosti (1). Standardním příkladem skalárního součinu na komplexním prostoru C" je (xi, ..., xn)T ■ (yi, xn)T = xiýi H-----Yxnýn. Díky konjugování souřadnic druhého argumentu toto zobrazení splňuje všechny požadované vlastnosti. Prostor C" s tímto skalárním součinem budeme nazývat standardní unitární prostor v dimenzi n. Maticově můžeme tento skalární součin psát jako x ■ y = ýT ■ x. Zcela obdobně jako u euklidovských prostorů a ortogonálních zobrazení budou důležitá lineárních zobrazení, která respektují skalární součiny. I Lineární zobrazení

W mezi unitárními prostory ' se nazývá unitární zobrazení, jestliže pro všechny vektory u, v e V platí u ■ v = cp(u) ■ cp(v). I Unitární isomorfismus je bijektivní unitární zobrazení. I Unitární zobrazení 3.21. Vlastnosti prostorů se skalárním součinem. Ve stručné diskusi euklidovských prostorů v předchozí kapitole jsme už některé jednoduché vlastnosti prostorů se skalárním součinem odvodili, důkazy v komplexním oboru jsou velmi podobné. V dalším budeme pracovat s reálnými i komplexními prostory zároveň a budeme psát K pro M nebo C, v reálném případě je konjugace prostě identické zobrazení (tak jak skutečně zúžení konjugace na reálnou přímku v komplexní rovině je). Stejně jako u reálných prostorů definujeme obecně pro libovolný vektorový podprostor U C V v prostoru se skalárním součinem jeho ortogonální doplněk U1' = {v € V; u ■ v = 0 pro všechny u e U}, 105 4. VÍCEGMmZEWÉHHFÁWVÍMODELY A MATICOVÝ POČET což je zjevně také vektorový podprostor v V. Budeme v dalším pracovat prakticky pouze s konečněrozměrnými unitárními nebo euklidovskými prostory. Řada našich výsledků ale má přirozené rozšíření pro tzv. Hilbertovy prostory, což jsou jisté nekonečněrozměrné prostory se skalárním součinem, ke kterým se aspoň stručně vrátíme později. Tvrzení. Pro každý konečněrozměrný prostor V dimenze n se skalárním součinem platí: (1) Ve V existuje ortonormální báze. (2) Každý systém nenulových ortogonálních vektorů ve V je lineárně nezávislý a lze jej doplnit do ortogonální báze. (3) Pro každý systém lineárně nezávislých vektorů ..., iik) existuje ortonormální báze (v\, ..., v„) taková, že její vektory postupně generují stejné podpro-story jako vektory uj, tzn. (v\, ... ,Vi) = (u\ ..., Uj), 1 < i < k. (4) Je-li (u\, ..., u„) ortonormální báze V, pak souřadnice každého vektoru u e V jsou vyjádřeny vztahem U = (u ■ U\)U\ + ••• + («• u„)u„. (5) V libovolné ortonormální bázi má skalární součin souřadný tvar u ■ v = x ■ y = xxýx H-----\-xnýn kde x a y jsou sloupce souřadnic vektorů u a v ve zvolené bázi. Zejména je tedy každý n—rozměrný prostor se skalárním součinem izomorfní standardnímu euklidovskému W nebo unitárnímu C". (6) Ortogonální součet unitárních podprostorů V\ + ■ ■ ■ + V\ ve V je vždy přímý součet. (7) Je-li A C V libovolná podmnožina, pak A1- C V je vektorový (tedy i unitární) podprostor a (A-1)1- C V je právě podprostor generovaný A. Navíc platí V = (A) © A-K (8) V je ortogonálním součtem n jednorozměrných unitárních podprostorů. Důkaz. (1),(2),(3): Daný systém vektorů nejprve doplníme do libovolné báze (u\, ... ,un) vektorového prostoru V a spustíme na ni Grammovu-Schmidtovu ortogonalizaci z 2.41. Tak získáme ortogonální bázi s vlastnostmi požadovanými v (3). Přitom ale z algoritmu Grammovy-Schmidtovy ortogonali-zace vyplývá, že pokud již původních k vektorů tvořilo ortogonální systém vektorů, pak v průběhu ortogonalizace zůstanou nezměněny. Dokázali jsme tedy zároeveň i (2) a (1). (4) : Je-li u = cl\U\ + • • • + a„u„, pak u-Ui = at(ui ■ u i) H-----\-a„(u„ ■ ut) = a;||w;||2 = at (5) : Podobně spočteme pro u = x\U\ + • • • + xnun, v = yi«i H-----h ynun u-v = (xi«iH-----\-xnun)-(yiUi-\-----\-y„un) = x\ýi-\-----\-xnýn. (6) : Potřebujeme ukázat, že pro libovolnou dvojici Ví, V) ze zadaných podprostorů je jejich průnik triviální. Je-li však 106 CHAPTER 3. L1NÁWÍ MODEMMMMMXNýmÉiffiPOČTU u e Ví a zároveň u e V j, pak je u _L m, tj. u ■ u = 0. To je ale možné pouze pro nulový vektor u e V. (7) : Nechť u,v e a"1. Pak (au + bv) ■ w = 0 pro všechny u> e a, a, ŕ e K (z distributivity skalárního součinu). Tím jsme ověřili, že A1- je unitární podprostor ve V. Nechť (vi, ..., vk) je nějaká báze (a), vybraná z prvků a, («1,..., mj-) ortonormální báze vzniklá z Grammovy-Schmidtovy ortogonalizace vektorů (v\, ..., vk). Doplňme ji na ortonormální bázi celého V (obojí existuje podle již dokázaných částí věty). Protože se jedná o ortogonální bázi, je nutně {uk+\, ..., un) = (u\, ..., Uk)1- = A1- a a c (uk+i, ..., u,,)1- (jak plyne z vyjádření souřadnic v ortonormální bázi). Je-li u _L (uk+\, ..., un), pak u je nutně lineární kombinací vektorů u \, ... ,uk, to je ale právě tehdy, když je lineární kombinací vektorů v\, ..., vk, což je ekvivalentní příslušnosti u do (a). (8) : Je pouze ekvivalentní formulací existence ortonormální báze. □ 3.22. Důležité vlastnosti velikosti. Nyní máme vše připraveno pro základní vlastnosti spojené s naší definicí velikostí vektorů. Hovoříme také o normě definované skalárním součinem. Všimněme si také, že všechna tvrzení se týkají vždy konečných množin vektorů a jejich platnost proto nezávisí na dimenzi prostoru V, ve kterém se vše odehrává. Věta. Pro libovolné vektory u, v v prostoru V se skalárním součinem platí (1) || m +1; || < || m || + || ľ || Přitom rovnost nastane právě, když jsou u a v lineárně závislé. (trojúhelníková nerovnost) (2) \u-v\ < || u || || i; || Přitom rovnost nastane právě, když j sou u a v lineárně závislé. (Cauchyova nerovnost) (3) pro každý ortonormální systém vektorů (e\, ..., ek) platí INI2 > \u -ei|2 + ••• + \u -ek\2 (Besselova nerovnost). (4) Pro ortonormální systém vektorů (e\, ..., ek) je vektor u v podprostoru e (e\, ..., ek) právě když (Parsevalova rovnost) (5) Pro ortonormální systém vektorů (e\, ... ,ek) au e V je vektor w = (u ■ ||2 > \u ■ v\2 a rovnost nastane právě tehdy, když w = 0, tj. když jsou u a v lineárně závislé. (1) : Opět stačí počítat \\u + v\\2 = \\u\\2 + \\v\\2 + u - v + v-u = IN|2 + N|2 + 2Re(M-i;) < ||M||2 + |MI2 + 2|M.i;| < |N|2 + |M|2 + 2|N||MI = (INI + NI)2 Protože se přitom jedná o kladná reálná čísla, je opravdu ||w + i;|| < ||u || + || v\\. Navíc, při rovnosti musí nastat rovnost ve všech předchozích nerovnostech, to však je ekvivalentní podmínce, že u a v jsou lineárně závislé (podle předchozí části důkazu). (3), (4): Nechť (e\, ..., ek) je ortonormální systém vektorů. Doplníme jej do ortonormální báze (e\, ..., en) (to vždy jde podle předchozí věty). Pak, opět podle předchozí věty, je pro každý vektor u e V n n k INI2 = ^(u ■ ediu—ě-) = Jjw .gť|2 > Jjw .gť|2 i — l i — l i — l To je ale právě dokazovaná Besselova nerovnost. Přitom rovnost může nastat právě tehdy, když u ■ et =0 pro všechny i > k, a to dokazuje Parsevalovu rovnost. (5): Zvolme libovolný v e (e\, ..., ek) a doplňme daný ortonormální systém na ortonormální bázi (e\, ..., en). Nechť («i, ..., un) a (x\, ..., xk, 0, ..., 0) jsou souřadnice uauv této bázi. Pak ||h-i;||2 = \ui-xi\2-\-----\-\uk- xk\2 + \uk+x\2 -\-----h|«„|2 a tento výraz je zjevně minimalizován při volbě jednotlivých vektorů x\ = u\, ..., xk = uk. □ 3.23. Vlastnosti unitárních zobrazení. Vlastnosti ortogonálních zobrazení mají přímočarou obdobu v komplexním oboru. Můžeme je snadno zformulovat a dokázat společně: Tvrzení. Uvažme lineární zobrazení (endomorfismus) cp : V —> V na prostoru se skalárním součinem. Pak jsou následující podmínky ekvivalentní: (!) (p je unitární nebo ortogonální transformace (2) cp je lineární isomorfismus a pro každé u, v e V platí cp(u) ■ v = u ■ (p~l(v) (3) matice A zobrazení cp v libovolné ortonormální bázi splňuje A-1 = AT (pro euklidovské prostory to znamená A"1 = AT) (4) matice A zobrazení cp v některé ortonormální bázi splňuje A"1 =ÁT (5) řádky matice A zobrazení cp v ortonormální bázi tvoří ortonormální bázi prostoru W se standardním skalárním součinem (6) sloupce matice A zobrazení cp v ortonormální bázi tvoří ortonormální bázi prostoru W se standardním skalárním součinem 108 CHAPTER 3. L1NÁWÍ MODEMMMMMXNVmÉMTPOČTU Důkaz. (1) =>■ (2): Zobrazení cp je prosté, proto musí býtina. Platí přitom cp(u)-v = cp(u)-cp(cp~l(v)) = u-cp~l(v). (2) =>■ (3): Standardní skalární součin je v W vždy dán pro sloupce x, y skalárů výrazem x ■ y = xTEý, kde E je jednotková matice. Vlastnost (2) tedy znamená, že matice A zobrazení

- (4): Je-li AT = A-1 v některé ortonormální bázi, pak to zaručuje platnost podmínky (2) (cp(u) ■ v = (Ax)TEý = xTEA~ly = u ■ (p~l(v)) a tedy i (3). (4) =>■ (5) Dokazované tvrzení je vyjádřeno prostřednictvím matice A zobrazení

■ (6): Protože pro determinant platí |ArA| = \E\ = |AAr| = |A||A| = 1, existuje inverzní matice A-1. Přitom je AATA = A, proto i ATA = E což vyjadřuje právě (6). (6) =>■ (1): Ve vybrané ortonormální bázi je (p(u) ■ (p{v) = iAx)TiAy) = xATÄý = xTĚý = xTý kde x a. y jsou sloupce souřadnic vektorů u a. v. Tím je zaručeno zachovávání skalárního součinu. □ Charakterizace z předchozí věty si zaslouží několik poznámek. Matice A e Mat„(K) s vlastností A-1 = ÄT se nazývají unitární matice pro komplexní skaláry (a v případě M jsme jim již říkali ortogonální matice). Z definiční vlastnosti plyne, že součin unitárních (resp. ortogonálních) matic je unitární (resp. ortogonální), stejně pro inverze. Unitární matice tedy tvoří podgrupu U in) c Mat„(C), ortogonální matice tvoří podgrupu O in) c Mat„(M). Hovoříme o unitární grupě a o ortogonální grupě. Jednoduchý výpočet 1 =det£ = det(AÄr) = detAdetA = |detA|2 ukazuje, že determinant unitární matice má vždy velikost rovnu jedné, v případě reálných skalárů pak determinant musí být ±1. Dále, je-li Ax = kx pro unitární či ortogonální matici, pak (Ax) • (Ax) = x • x = |A|2(x • x). Proto jsou vlastní hodnoty ortogonálních matic v reálném oboru rovny ±1, vlastní hodnoty unitárních matic jsou vždy komplexní jednotky v komplexní rovině. Stejně jako u ortogonálních zobrazení také docela snadno ověříme, že ortogonální doplňky k invariantním podpro-storům vzhledem k unitárnímu (p : V -> V jsou vždy také invariatní. Skutečně, je-li (piU) cU,ueUave U1-libovolné, pak (piv) -(pi(p~\u)) = v -(p~\u). Protože je zúžení (p\V také unitární, musí to tedy být bijekce, zejména je (p~liu) e U. Pak ovšem (piv) ■ u = 0, protože v e U^-. To znamená, že i (piv) e U^-. Odtud ovšem v komplexním oboru okamžitě dotáváme užitečný 109 4. VÍCEGMmZEWÉHHFÁWVÍMODELY A MATICOVÝ POČET 3.34 Důsledek. Nechť cp : V -» V je unitární zobrazení komplexních vektorových prostorů. Pak je V ortogonálním součtem jednorozměrných vlastních podprostorů. Důkaz. Jistě existuje alespoň jeden vlastní vektor v e V. Pak je zúžení cp na invariantní podprostor (v)1- opět unitární a jistě má opět nějaký vlastní vektor. Po n takovýchto krocích obdržíme hledanou ortogonální bázi z vlastních vektorů. Po vynormování vektorů získáme ortonormální bázi. □ Nyní už je možné snadno pochopit detaily důkazu spektrálního rozkladu ortogonálního zobrazení z 2.48 na konci druhé kapitoly — reálnou matici ortogonálního zobrazení interpretujeme jako matici unitárního zobrazení na komplexním rozšíření euklidovského prostoru a pečlivě sledujeme důsledky struktury kořenů reálného charakteristického polynomu nad komplexním oborem. Automaticky přitom dostáváme invariantní dvourozměrné podprostory zadané dvojicemi komplexně sdružených vlastních čísel a tedy příslušné rotace pro zúžené původní reálné zobrazení. 3.24. Duální a adjungovaná zobrazení. Při diskusi vektorových prostorů a lineárních zobrazení jsme již ve druhé kapitole letmo zmínili duální vektorový prostor V* všech lineárních forem na vektorovém prosotru V, viz 2.37. Pro každé lineární zobrazení mezi vektorovými prostory Ý '■ V -» W můžeme přirozeně definovat zobrazení ý* : W* -» V* vztahem (v, ý*(a)) = (\jr(y), a), kde ( , ) značí vyčíslení formy (druhý argument) na vektoru (první argument), v e V a a e W* jsou libovolné. Zvolme si báze v na V, w na W a matici A pro zobrazení ý v těchto bazích. Pak snadno spočteme v duálních bazích matici zobrazení ý* v příslušných duálních bazí na duálních prostorech. Skutečně, definiční vztah říká, že pokud bychom reprezentovali vektory z W* v souřadnicích jako řádky skalárů, pak je zobrazení ý* je dáno toutéž maticí jako ý, pokud jí násobíme řádkové vektory zprava: h\ (ý(v), a) = ((*!, ..., a„) ■ A ■ : ={v,f*{a)). w To znamená, že maticí duálního zobrazení ý* je transponovaná matice AT, protože a ■ A = (AT ■ aT)T. Předpokládejme nadále, že se pohybujeme ve vektorovém prostoru se skalárním součinem. Jestliže tedy zvolíme pevně jeden vektor v € V, dosazování vektorů za druhý argument ve skalárním součinu nám dává zobrazení V -> V* = Hom(V, K) V 3 V i—> (w i—> (v, w) g K). Podmínka nedegenerovanosti skalárního součinu nám zaručuje, že toto zobrazení je bijekcí. Zároveň víme, že jde skutečně o lineární zobrazení nad komplexními nebo reálnými skaláry, protože jsme pevně zvolili druhý argument. 110 CHAPTER 3. UNÁRNÍ MODEMNMMMKHltmRÍEIPOČTU Na první pohled je vidět, že vektory ortonormální báze jsou takto zobrazeny na formy tvořící bázi duální, a každý vektor můžeme prostřednictvím skalárního součinu chápat také jako lineární formu. V případě vektorových prostorů se skalárním součinem proto převádí naše ztotožnění vektorového prostoru se svým duálem také duální zobrazení ý* na zobrazení ý* : W -» V zadané formulí kde stejným značením závorek nyní myslíme skalární součin. Tomuto zobrazení se říká adjungované zobrazení k \jr. Ekvivalentně lze brát poslední vztah za definici zobrazení ý*, např. dosazením všech dvojic vektorů ortonormální báze za vektory u a. v dostáváme přímo všechny hodnoty matice zobrazení Ý*. Předchozí výpočet pro duální zobrazení v souřadnicích nyní můžeme zopakovat, pouze musíme mít na paměti, že v ortonormálních bazích na unitárních prostorech vystupují souřadnice druhého argumentu konjugované: Vidíme proto, že je-li A matice zobrazení \jj v ortonormální bázi, pak matice adjungovaného zobrazení ý* je matice transponovaná a konjugovaná, kterou značíme A* = AT. Zvláštním případem lineárních zobrazení jsou tedy ty, které jsou rovny svému adjungovanému zobrazení: ý* = ý. Takovým zobrazením říkáme samoadjungovaná. Ekvivalentně můžeme říci, že jsou to ta zobrazení, jejichž matice A v jedné a tedy ve všech ortonormálních bazích splňují A = A*. V případě euklidovských prostorů jsou samoadjungovaná zobrazení tedy ta, která mají v některé ortonormální bázi (a pak už všech) symetrickou matici. Často se jim proto říká symetrické matice a symetrická zobrazení. V komplexním oboru se maticím splňujícím A = A* říká hermiteovské matice. Všimněme si, že hermiteovské matice tvoří reálný vektorový podprostor v prostoru všech komplexních matic, není však podprostorem v komplexním oboru. Poznámka. Obzvlášť zajímavý je v této souvislosti následující postřeh. Jestliže hermiteovskou matici A vynásobíme imaginární jednotkou, dostáváme matici B = i A, která má vlastnost B* = i ÄT = —B. Takovým maticím říkáme anti-hermiteovské. Tak jako je tedy každá reálná matice součtem své symetrické a antisymetrické části (ý(u), v) = (u, ý*(v)), {fiv), w) = (wi, ..., w„) ■ A ■ 1 A = - 111 4. VÍCEGMmZEWÉHHFÁWVÍMODELY A MATICOVÝ POČET je v koplexním oboru obdobně A=l-(A + A*)+l-(A- A*), tj. můžeme vyjádřit každou komplexní matici právě jedním způsobem jako součet A = B + iC s hermiteovskými maticemi B a C. Jde o obdobu rozkladu komplexního čísla na reálnou a ryze imaginární komponentu. V řeši lineárních zobrazení to tedy znamená, že každý komplexní lineární automorfismus můžeme takto jednoznačně vyjádřit pomocí dvou samoadjungovaných zobrazení. 3.25. Spektrální rozklad samoadjungovaných zobrazení. Uvažujme samoadjungované zobrazení ý : ľs maticí A v nějaké ortonormální bázi a zkusme postupovat obdobně jako v 2.48. Opět se nejprve obecně podíváme na invariantní podprostory samoadjungovaných zobrazení a jejich ortogonální doplňky. Jestliže pro libovolný podprostor w C v a samoadjungované zobrazení ý '■ V ~* V platí ý(W) C W, pak také platí pro všechny v e WL, w e W To ale znamená, že také ^(W-1) C W^. Uvažme nyní matici A samoadjungovaného zobrazení v nějaké ortonormální bázi a A • x = kx pro nějaký vlastní vektor x e C". Dostáváme k{x, x) = {Ax, x) = {x, Ax) = k{x, x). Kladným reálným číslem (x, x) můžeme krátit a proto musí být k = k, tj. vlastní čísla jsou vždy reálná. Komplexních kořenů má charakteristický polynom det(A — kE) tolik, kolik je dimenze čtvercové matice A, a všechny jsou ve skutečnosti reálné. Dokázali jsme tak důležitý obecný výsledek: Tvrzení. Ortogonální doplněk k invariantnímu podprostoru pro samoadjungované zobrazení je také invariantní. Navíc jsou všechna vlastní čísla samoadjungované matice A vždy reálná. Ze samotné definice je zřejmé, že zúžení samoadjungovaného zobrazení na invariantní podprostor je opět samoadjungované. Předchozí tvrzení nám tedy zaručuje, že bude vždy existovat báze v z vlastních vektorů. Skutečně, zúžení ý na ortogonální doplněk invariantního podprostoru je opět ortogonální zobrazení, takže můžeme do báze přibírat jeden vlastní vektor za druhým, až dostaneme celý rozklad v. Vlastní vektory příslušející různým vlastním číslům jsou navíc kolmé, protože z rovností ý(u) = ku, ifr(v) = ijlv vyplývá k{u, v) = (ý(u), v) = {u, ý (v)) = fi(u, v). Obvykle bývá náš výsledek formulován pomocí projekcí na vlastní podprostory. O projektoru P : v -> v říkáme, že je kolmý, je-li Im P _L Ker P. Dva kolmé projektory P, Q jsou vzájemně kolmé, je-li Im P _L Im Q. 112 CHAPTER 3. UNÁRNÍMODEM A?MMMMY(Ž(FmÍETPOČTU Věta (O spektrálním rozkladu). Pro každé samoadjungované zobrazení \js : V ^ V na vektorovém prostoru se skalárním součinem existuje ortonormální báze z vlastních vektorů. Jsou-li X\, ..., Xk všechna různá vlastní čísla f a P\, ..., Pk příslušné kolmé a navzájem kolmé projektory na vlastnípod-prostory, pak f = XlPl +... + xkPk. Dimenze obrazů těchto projektorů je přitom vždy rovna algebraické násobnosti vlastních čísel 3.26. Ortogonální diagonalizace. Zamysleme se, jak vypadají zobrazení, pro která lze najít ortonormální bázi jako v předchozí větě o spektrálním rozkladu se nazývají normální. Pro euklidovský případ je to snadné: diagonální matice jsou zejména symetrické, jedná se tedy právě o samoadjungovaná zobrazení. Jako důsledek získáváme tvrzení, že ortogonální zobrazení euklidovského prostoru do sebe je ortogonálně di-agonalizovatelné právě, když je zároveň samoadjungované (jsou to právě ta samoadjungovaná zobrazení s vlastními hodnotami ±1). U komplexních unitárních prostorů je situace složitější. Uvažme libovolné lineární zobrazení cp : V -» V unitárního prostoru a nechť cp = ý + "7 je (Jecmoznačně daný) rozklad cp na hermiteovskou a antihermiteovskou část. Má-li cp ve vhodné ortonormální bázi diagonální matici D, pak D = re Z) + /imD, kde reálná a imaginární část jsou právě matice Ý a r) (plyne z jednoznačnosti rozkladu). Zejména tedy platí ýoi) = no\j/&cpocp* = cp* o cp. Zobrazení cp : V —> V s poslední uvedenou vlastností se nazývají normální. Vzájemné souvislosti ukazuje následující věta (pokračujeme ve značení tohoto odstavce): Tvrzení. Následující podmínky jsou ekvivalentní: (1) cp je ortogonálně diagonalizovatelné (2) cp* o cp = cp o cp* (tj. cp je normální zobrazení) (3) Ý 0 f\ = f\ 0 Ý (4) Pro matici A = (a^) zobrazení cp v nějaké ortonormální bázi a jejích m = dim V vlastních čísel A; platí Z,,KI2 = 2£i I** I2- Stručný důkaz. Implikaci (1) =>■ (2) jsme již diskutovali. (2) <^ (3): Stačí provést přímý výpočet cpcp* = (ý + if])(Ý — i ví) = Ý2 + ??2 + ~ Ýn) (p*(p = (ý — in)(Ý + i ví) = Ý2 + ??2 + iiÝ1! ~ nÝ) Odečtením dostaneme 2i(r)ý — Ývi)- (2) =>■ (1): Nechť u e V je vlastní vektor normálního zobrazení . (4): Výraz . \atj|2 je právě stopa matice AA*, to je matice zobrazení

0 pro všechny vektory x. Navíc zjevně B* = (A* - A)* = A* ■ A = B. 114 CHAPTER 3. L1NÁWÍ MODEMMMMMXNVmÉMTPOČTU Hermiteovských maticím B s takovou vlastností říkáme pozitivně semidefinitní a pokud nastane nulová hodnota pouze pro x = 0, pak jim říkáme pozitivně definitní. Obdobně hovoříme o pozitive definitních a a positivně semidefinitních zobrazeních ý : V -» V. Pro každé pozitivně semidefinitní zobrazení ý '■ v ~* V umíme najít jeho odmocninu, tj. zobrazení r] takové, že r) o r) = ý. Nejjednodušeji to uvidíme v ortonormální bázi, ve které bude mít ý diagonální matici. Taková podle našich předchozích úvah vždy existuje a matice A zobrazení i/r v ní bude mít na diagonále nezáporná reálná vlastní čísla zobrazení ý. Kdyby totiž bylo některé z nich záporné, nebyla by splněna podmínka nezápornosti již pro některý z bázových vektorů. Pak ovšem stačí definovat zobrazení r] pomocí matice B s odmocninami příslušných vlastních čísel na diagonále. 3.28. Spektra a nilpotentní zobrazení. Na závěr této části se vrátíme k otázce, jak se mohou chovat lineární zobrazení v úplné obecnosti. Budeme i nadále pracovat s reálnými nebo komplexními vektorovými prostory. Připomeňme, že spektrum lineárního zobrazení f : V -» V je posloupnost kořenů charakteristického polynomu zobrazení /, včetně násobností. Algebraickou násobností vlastní hodnoty rozumíme její násobnost jako kořenu charakteristického polynomu, geometrická násobnost vlastní hodnoty je dimenze příslušného podprostoru vlastních vektorů. Lineární zobrazení / : V -» V se nazývá nilpotentní, jestliže existuje celé číslo k > 1 takové, že iterované zobrazení /* je identicky nulové. Nejmenší číslo k s touto vlastností se nazývá stupněm nilpotentnosti zobrazení /. Zobrazení / : V -» V se nazývá cyklické, jestliže existuje báze (u\, ..., u„) prostoru V taková, že f(u\) = 0 a /(«/) = pro všechna i = 2, ..., n. Jinými slovy, matice / v této bázi je tvaru /O 1 0 0 0 1 v : Je-li f (v) = a ■ v, pak pro každé přirozené k je fk(v) = ak ■ v. Zejména tedy může spektrum nilpotentního zobrazení obsahovat pouze nulový skalár (a ten tam vždy je). Přímo z definice plyne, že každé cyklické zobrazení je nilpotentní, navíc je jeho stupeň nilpotentnosti roven dimenzi prostoru V. Operátor derivování na polynomech, D(xk) = kxk~l, je příkladem cyklického zobrazení na Kn [x] pro libovolné n. Kupodivu to platí i naopak a každé nilpotentní zobrazení je přímým součtem cyklických. Důkaz tohoto tvrzení nám dá hodně práce, proto napřed zformulujeme další výsledky a pak se teprve dáme do technické práce. Ve výsledné větě o Jordánově rozkladu v vystupují vektorové (pod)prostory a lineární zobrazení na nich s jediným vlastním číslem k a 115 4. VÍCEGMmZEWÉHHFÁWVÍMODELY A MATICOVÝ POČET maticí (k 1 0 1 O k o J = \o o o v Takovýmto maticím (a odpovídajícím invariantním podpro-storům) se říká Jordánův blok. Věta (Jordánova věta o kanonickém tvaru). Nechť V je vektorový prostor dimenze n a f : V -» V je lineární zobrazení s n vlastními čísly včetně algebraických násobností. Pak existuje jednoznačný rozklad prostoru V na přímý součet podprostorů takových, že f (Ví) C Ví, zúžení f na každé Ví má jediné vlastní číslo a zúžení f — A, • id na Ví je bud'cyklické nebo nulové zobrazení. Věta tedy říká, že ve vhodné bázi má každé lineární zobrazení blokově diagonální tvar s Jordánovými bloky podél diagonály. Celkový počet jedniček nad diagonálou v takovém tvaru je roven rozdílu mezi celkovou algebraickou a geometrickou násobností vlastních čísel. Všimněme si, že jsme tuto větu plně dokázali v případech, kdy jsou všechna vlastní čísla různá nebo když jsou geometrické a algebraické násobnosti vlastních čísel stejné. Také jsme ji plně dokázali pro unitární a samoadjungovaná zobrazení. Také si všimněme, že v situaci, kdy jsou vlastní hodnoty v absolutní hodnotě menší než jedna, opakované působení lineárního zobrazení na jakémkoliv vektoru v z jednoho z podprostorů V; ve větě vede k rychlému zmenšování všech jeho souřadnic nad všechny meze. Skutečně, předpokládejme pro jednoduchost, že na celém V; je naše zobrazení cyklické, příslušná vlastní hodnota je k a v\, ..., vi nechť je příslušná báze. Pak podmínka z věty říká, že/(v2) = kv2+vi, f2(vj) = k2v2 + kvi + kvi, a podobně pro ostatní vt a vyšší mocniny. V každém případě při iterování dostáváme stále vyšší a vyšší mocniny k u všech nenulových komponent. Zbytek této části je věnován důkazu Jordánovy věty a několika k tomu potřebným pojmům. Je výrazně obtížnější než dosavadní text a čtenář jej může případně přeskočit až do začátku 5. části této kapitoly. 3.29. Kořenové prostory. Na příkladech jsme viděli, že vlastní podprostory popisují dostatečně geometrické vlastnosti jen některých lineárních zobrazení. Zavedeme nyní jemnější nástroj, tzv. kořenové podprostory. Definice. Nenulový vektor w e V se nazývá kořenovým vektorem lineárního zobrazení cp : V -» V, jestliže existuje a e K a celé číslo k > 0 takové, že (cp — a ■ iáv)k(u) = 0, tj. &-tá iterace uvedeného zobrazení zobrazuje u na nulu. Množinu všech kořenových vektorů příslušných k pevnému skaláru k doplněnou o nulový vektor nazýváme kořenovým prostorem příslušným ke skaláru k e K, značíme TZx- V = V r © • • • © Vk 3.37 116 CHAPTER 3. L1NÁWÍ MODEMMMMMXNVmÉMTPOČTU Je-li u kořenový vektor a k z definice je vybráno nejmenší možné, pak (cp — a ■ idy)*_1(w) je vlastní vektor s vlastní hodnotou a. Je tedy TZx = {0} pro všechny skaláry k, které neleží ve spektru zobrazení cp. Tvrzení. Pro lineární zobrazení cp V -» V platí (1) Pro každé k e Kj'e IZi C V vektorový podprostor. (2) Pro každé k, fi e K je IZi invariantní vzhledem k lineárnímu zobrazení (cp — fi ■ idy), zejména tedy je IZi invariantní vzhledem k cp. (3) Je-li fi ^ k, pak (cp — fi ■ idy)|^ je invertibilní. (4) Zobrazení (cp — k ■ idy)|^ je nilpotentní. Důkaz. (1) Ověření vlastností vektorového podprostoru je jednoduché a ponecháváme jej čtenáři. (2) Předpokládejme, že (cp — k ■ idy)*(m) = 0 a uvažme v = (cp — \jl ■ idy)(w). Pak (cp-k.iávf(v) = = (cp — k ■ iáv)k((cp - k ■ idy) + (k - n) ■ idy)(w) = (cp — k ■ idy)*+1(«) + (k - fi) ■ (cp - k ■ idv)k(u) = o (3) Je-li u € Ker(cp — n ■ idy)|^, pak (cp — k-Ídy)(«) = (cp — fl-Ídy)(«) + (fl — k)-U = (fl — k) ■ U Odtud 0 = (cp — k ■ idy)* (m) = (p, — k)k ■ u a je tedy nutně u = 0 pro k (4) Zvolme bázi e\, ..., ep podprostoru TZx- Protože podle definice existují čísla k,^taková, že ( V/U, (pV/u(v + U)= (p(v) + U s maticí D v indukované bázi uk+\ + U, ..., u„ + U na V/U. (2) Charakteristický polynom (fy/u dělí charakteristický polynom (p. Důkaz. Pro v, w e V, u e U, a e K máme (piv + u) e (piv) + U (protože U je invariantní), ((p(v) + U) + i(piw) + U) = (piv + w) + U a a ■ {(p{v) + U) = a ■ (piv) + U = (pia ■ v) + U (protože (p je lineární), je tedy zobrazení (Pv/u dobře definované a lineární. Navíc je přímo z definice matice zobrazení patrné, že matice (py/u v indukované bázi na V/ U je právě matice D (při počítání obrazů bázových prvků nám koeficienty z matice C přispívají pouze do třídy U). Charakteristický polynom indukovaného zobrazení (py/u je tedy \D — k-E\, zatímco charakteristický polynom původního zobrazení^je \ A — X ■ E\ = \B — X ■ E\\D — X ■ E\. □ Důsledek. Nechť V je vektorový prostor nad K dimenze n a nechť (p : V —> V je lineární zobrazení, jehož spektrum obsahuje n prvků (tj. všechny kořeny charakteristického polynomu leží v K a počítáme je včetně násobnosti). Pak existuje posloupnost invariantních podprostoru {0} = Vo C V\ C • • • C V„ = V s dimenzemi dim V;- = /. V bázi u\, ..., u„ prostom V takové, že Vi = (u\, ..., Ui), má (p horní trojúhelníkovou matici: Ai ••• *\ V o ... \nJ kde X\, ..., X„ je posloupnost prvků spektra. Důkaz. Konstrukci podprostoru V, provedeme induktivně. Nechť ki, ..., kn jsou prvky ve spektru zobrazení (u + Vk) e V/Vk. To znamená, že v každé třídě rozkladu V/Vk existuje právě jeden vektor z V^. Skutečně, tuto vlastnost má faktorový prostor podle libovolného podprostorů v unitárním prostoru - pokud u, v e jsou v jedné třídě, pak jejich rozdíl patří do Vk n V^, tedy jsou stejné. Můžeme tedy jako reprezentanta uk+i nalezené třídy, tedy vlastního vektoru (Pv/vk> zvolit právě vektor z V^. Touto modifikací dojdeme k ortogonální bázi s vlastnostmi požadovanými v tvrzení o triangulovatelnosti. Proto existuje i taková ortonormální báze: Důsledek (Schurova věta o ortogonální triangulovatelnosti). Nechť cp : V —> V je libovolné lineární zobrazení (reálného nebo komplexního) unitárního prostoru s m = dim V vlastními hodnotami (včetně násobonosti). Pak existuje ortonormální báze prostoru V taková, že cp v ní má horní trojúhelníkovou matici s vlastními čísly X\, ..., Xm na diagonále. 119 4. VÍCEGMmZEWÉHHFÁWVÍMODELY A MATICOVÝ POČET 3.37d 3.3Í 3.33. Věta. Nechť cp V -» V je lineární zobrazení. Součet kořenových prostorů příslušných různým vlastním hodnotám XV ..., Xk je přímý. Navíc je pro každou vlastní hodnotu X dimenze podprostoru TZx rovna její algebraické násobnosti. Důkaz. Důkaz provedeme indukcí přes počet k kořenových prostorů. Předpokládejme, že tvrzení vždy platí pro méně než k prostorů a že pro vektory u i e TZxx , ... ,uk e TZxk platí u\ + •• -+uk =0. Pro vhodné j pak( V, jehož celé spektrum je v K, je V = TZxl © • • • © TZxn přímým součtem kořenových podprostoru. Zvolíme-li vhodně báze těchto podprostoru, pak cp má v této bázi blokově diagonální tvar s horními trojúhelníkovými maticemi v blocích a vlastními hodnotami na diagonále. 3.34. Nilpotentní a cyklická zobrazení. Nyní již máme skoro vše připraveno pro diskusi kanonických tvarů matic. Zbývá jen vyjasnit vztah mezi cyklickými a nilpotentními zobrazeními a poskládat dohromady již připravené výsledky. Věta. Nechť cp V —> V je nilpotentní lineární zobrazení. Pak existuje rozklad V na přímý součet podprostoru V = V\ © • • • © Vk takových, že zúžení cp na kterýkoliv z nich je cyklické. Důkaz. Ověření je docela jednoduché a spočívá v konstrukci takové báze prostoru V, že akce zobrazení cp na bázových vektorech přímo ukazuje rozklad na cyklická zobrazení. Postup bude ale poněkud zdlouhavý. 120 CHAPTER 3. LINÁRNÍMODEM A?MMMMY(Ž(FmÍETPOČTU Nechť k je stupeň nilpotentnosti zobrazení cp a označme Pi = im((p'), i = 0, ..., k, tzn. {0} = Pk C Pjt-i C • • • C Pi C Po = V. Vyberme libovolnou bázi e\~l, ..., &kp~\ prostoru Pk-\, kde pk_i > 0 je dimenze Pk-i - Z definice plyne, že Pk_\ c Ker (p, tj. vždy ■ ■ ■ > ePk^ k-2 k-2 k-2 k-2 i ' ■ ■ ■' »-r M-i+ľ ■ ■ ■' »-2 prostoru Pk-2. Navíc jsou obrazy přidaných bázových prvků v Pk-\, nutně tedy musejí být lineárními kombinacemi bázových prvků e\~l, ..., ek~\- Můžeme proto zaměnit zvolené vektory ek~2i+l, ..., ek~22 vektory ek~2 — (p(ek~2). Tím docílíme, že doplněné vektory do báze Pk_2 patří do jádra zobrazení n. Odtud plyne, že pokud matice J zobrazení cp obsahuje dk (k) Jordánových bloků řádu k s vlastní hodnotou k, pak defekt matice (J — k ■ E)1 je di(k) + 2d2(k) + . ..ldt(k) + ídl+l(k) + ... Odtud spočítáme n - n(k) = di(k) + 2d2(k) H----+ Id^k) + ldí+x{k) + ... dk(k) = rk_i(k) - 2rk(k) + rk+l(k) (kde poslední řádek vznikne kombinací předchozího pro hodnoty l = k - 1, k, k + 1). 3.36. Poznámka. Důkaz věty o existenci Jordánova kanonického tvaru byl sice konstruktivní, nedává nám ale dokonale efektivní algoritmický postup pro jejich hledání. Nyní shrneme již odvozený postup explicitního výpočtu báze, v níž má dané zobrazení cp V -> V matici v kanonickém Jordánově tvaru. (1) Najdeme kořeny charakteristického polynomu. (2) Jestliže jich je méně než n = dim V, včetně násobností, kanonický tvar neexistuje. (3) Je-li n lineárně nezávislých vlastních vektorů, získáme bázi V z vlastních vektorů a v ní má cp diagonální matici. (4) Nechť A je vlastní hodnota s geometrickou násobností menší než algebraickou a v\, ..., vk nechť jsou příslušné vlastní vektory. To by měly být vektory na horním okraji schématu z důkazu věty 3.34, je ovšem nutné najít vhodnou bázi aplikacemi iterací cp — k ■ idy. Zároveň přitom zjistíme ve kterém řádku se vektory nacházejí a najdeme lineárně nezávislá řešení u>; rovnic (cp — k id)(x) = vt z řádků pod nimi. Postup opakujeme iterativně (tj. pro u>; atd.). Najdeme tak „řetízky" bázových vektorů zadávajících podprostory, kde cp — k id je cyklické. 122 chapter 3. LiNÁmím&Emimimm^TtmimmjNVERZE Postup je praktický pro matice, kde násobnosti vlastních hodnot jsou malé, nebo aspoň diskutované stupně nilpotentnosti jsou malé. Např. pro matici 12 0 1\ A = 0 2 1 \0 0 2/ dostaneme dvourozměrný podprostor vlastních vektorů ((1,0,0), (0,1,0)). Potřebujeme proto najít řešení rovnic (A — 2E)x = (a, b, 0)T pro vhodné konstanty a, b. Tento systém je ovšem řešitelný pouze pro a = b a jedno z možných řešení je v = (0, 0, 1), a = b = 1. Celá hledaná báze pak je (1, 1, 0), (0, 0, 1), (1, 0, 0). Všimněme si, že jsme měli spoustu voleb a bazí s požadovanými vlastnostmi je tedy mnoho. 5. Rozklady matic a pseudoinverze V minulé části jsme s soustředili na geometrický popis struktury zobrazení. Teď naše výsledky přeložíme do jazyku tzv. rozkladů matic, což je obzvlášť důležité téma pro numerické postupy a maticový počet obecně. I při počítání s reálnými čísly užíváme pro zjednodušení rozklady na součiny. Nejjednodušším je vyjádření každého reálného čísla jednoznačně ve tvaru a = sgn(út) • \a\, tj. jako součin znaménka a abolutní hodnoty. V dalším textu si uvedeme stručně přehled několika takových rozkladů pro různé typy matic, které bývají nesmírně užitečné při numerických výpočtech s maticemi. Například jsme vhodný rozklad pro pozitivně semidefmitní symetrické matice využili v odstavci 3.27 pro konstrukci odmocniny z matice. 3.40 | 3.37. LU-rozklad. Začneme přeformulováním několika výsledků, které jsme už dávno odvodili. V odstavcích 2.7 a 2.8 jsme upravovali matice nad skaláry z libovolného pole na řádkový schodovitý tvar. K tomu jsme používali elementární úpravy, které spočívaly v postupném násobení naší matice invertibilními dolními trojúhelníkovými maticemi Pt, které postihovaly přičítání násobků řádků pod právě zpravováva-ným. Předpokládejme pro jednoduchost, že naše matice A je čtvercová a že při Gausově eliminaci nejsme nuceni přehazovat řádky a proto všechny naše matice Pt mohou být dolní trojúhelníkové s jedničkami na diagonálách. Konečně, stačí si povšimnout, že inverzní matice k takovýmto Pt jsou opět dolní trojúhelníkové s jedničkami na diagonálách a dostáváme U = P ■ A = Pk ■ ■ ■ Pi ■ A kde U je horní trojúhelníková matice a tedy A = L ■ U kde L je dolní trojúhelníková matice s jedničkami na diagonále a U je horní trojúhelníková. Tomuto rozkladu se říká LU-rozklad matice A. 123 5. RozKiJMPmmmajj^máiMowmKz^MATicovÝpočet V případě obecné matice můžeme při Gausově eliminaci na řádkově schodovitý tvar potřebovat navíc permutace řádků, někdy i sloupců matice. Pak dostáváme obecněji A = P ■ L ■ U ■ Q, kde P a. Q jsou nějaké permutační matice. 3.41 3.38. Poznámky. Přímým důsledkem Gausovy eliminace bylo také zjištění, že až na volbu vhodných bází na definičním oboru a oboru hodnot je každé zobrazení / : V -» W zadáno maticí v blokově diagonálním tvaru s jednotkovou matici, s rozměrem daným dimenzí obrazu /, a s nulovými bloky všude kolem. To lze přeformulovat takto: Každou matici A typu m/n nad polem skalárů K lze rozložit na součin kde P a Q jsou vhodné invertibilní matice. Pro čtvercové matice jsme v 3.28 ukázali při diskusi vlastností lineárních zobrazení / : V -» V na komplexních vektorových prostorech, že každou čtvercovou matici A dimenze m umíme rozložit na součin A = P ■ B ■ P~l kde B je blokově diagonální s Jordánovými bloky příslušnými k vlastním číslům na diagonále. Skutečně jde o pouhé přepsání Jordánovy věty, protože násobení maticí P a její inverzí z opačných stran odpovídá v tomto přípaě právě změně báze na vektorovém prostoru V a citovaná věta říká, že ve vhodné bázi má každé zobrazení Jordánův kanonický tvar. Obdodně jsme tedy při diskusi samoadjungovaných zobrazení dokázali, že pro reálné symetrické nebo komplexní Hermiteovské matice existuje vždy rozklad na součin A = P ■ B ■ P*, kde B je diagonální matice se všemi (vždy reálnými) vlastními čísly na diagonále, včetně násobností. Skutečně, jde opět o součin s maticemi vystihující změnu báze, nicméně připouštíme nyní pouze změny mezi mezi ortonormálními bázemi a proto i matice přechodu P musí být ortogonální. Odtud P'1 = P*. Pro reálná ortogonální zobrazení jsme odvodili obdobné vyjádření jako u symetrických, pouze naše B bude blokově diagonální s bloky rozměru dva nebo jedna vyjadřujícími buď rotaci nebo zrcadlení nebo identitu vzhledem k příslušným podprostorům. 3.39. Věta o singulárním rozkladu. Nyní se vrátíme k obecným lineárním zobrazením mezi (obecně různými) vektorovými prostory. Jestliže na nich je definován skalární součin a omezíme se přitom na ortonormální báze, musíme postupovat o hodně rafinovaněji, než v případě bazí libovolných Věta. Nechť A je libovolná matice typu m/n nad reálnými nebo komplexními skaláry. Pak existují čtvercové unitární 124 chapter 3. LiNÁmím&Emimimm^TtmimmjNVERZE matice u a V dimenzí m a n, a reálná diagonální matice s nezápornými prvky D dimenze r, r < min{m, n}, takové, ze a r je hodnost matice a a*. Přitom je s určena jednoznačně až na pořadí prvků a prvky diagonální matice D jsou druhé odmocniny vlastních čísel n, můžeme aplikovat předchozí část důkazu na matici a*. Odtud pak přímo plyne požadované tvrzení. Pokud pracujeme nad reálnými skaláry, jsou všechny naše kroky v důkazu výše také realizovány v reálném oboru. □ Tento důkaz věty o singulárním rozkladu je konstruktivní a můžeme jej opravdu použít pro výpočet unitárních, resp. ortogonálních, matic u, V a diagonálních nenulových prvků matice s. 3.40. Geometrická interpretace singulárního rozkladu. Diagonálním hodnotám matice D z předchozí věty se říká singulární hodnoty matice a. Přeformulujme si tuto větu v reálném případě geometričtěji. Pro příslušné lineární zobrazení cp : W -> W" mají singulární hodnoty skutečně jednoduchý geometrický význam: Nechť k c M" je jednotková sféra pro standardní skalární a = b = v*a*av = (av)*(av). 3.43 125 5. RozKiiMPmmmajj^máiMowmKz^MATicovÝpočet součin. Obrazem cp(K) pak vždy bude (případně degenerovaný) m-rozměrný elipsoid. Singulární čísla matice A jsou přitom velikosti hlavních poloos a věta navíc říká, že původní sféra vždy připouští ortogonální sdružené průměry, jejichž obrazem budou právě všechny poloosy tohoto elipsoidu. Pro čtvercové matice je vidět, že A je invertibilní právě, když všechna singulární čísla jsou nenulová. Poměr největšího a nejmenšího singulárního čísla je důležitým parametrem pro robustnost řady numerických výpočtů s maticemi, např. pro výpočet inverzní matice. Poznamejme také, že existují rychlé metody výpočtů, resp. odhadů, vlastních čísel, proto je se singulárním rozkladem velmi efektivně pracovat. 3.41. Věta o polárním rozkladu. Věta o singulárním rozkladu je východiskem pro mnoho mimořádně užitečných nástrojů. Uvažujme nyní nad několika přímými důsledky (které samy o sobě jsou dosti netriviální). Tvrzení věty říká pro libovolnou matici A, ať už reálnou nebo komplexní, A = USW* s diagonální S s nezápornými reálnými čísly na diagonále a unitárními U, W. Pak ovšem také A = USU*UW* a pojmenujme si matice P = USU*, V = UW*. První z nich, P je hermiteovská (v reálném případě symetrická) a pozitivně semidefinitní, protože jde jen o zápis zobrazení s reálnou diagonální maticí S v jiné ortonormální bázi, zatímco V je coby součin dvou unitárních opět unitární (v reálném případě ortogonální). Navíc A* = WSU* a tedy AA* = USSU* = P2 a naše matice P je vlastně odmocninou ze snadno spočítatelné hermiteovské matice A A*. Předpokládejme, že A = P V = QU jsou dva takové rozklady matice A na součin positivně semidefinitní hermiteovské a unitární matice a předpokládejme, že A je invertibilní. Pak ovšem je AA* = PVV*P = P2 = QUU*Q = Q2 pozitivně definitní a proto jsou matice Q = P = V AA* jednoznačně určené a invertibilní. Pak ovšem také U = V = P~lA. Beze zbytku jsme tedy odvodili velice užitečnou analogii rozkladu reálného čísla na znaménko (ortogonální matice v případě dimenze jedna jsou právě ±1) a absolutní hodnotu (matice P, ke které umíme odmocninu). Věta (Věta o polárním rozkladu). Každou čtvercovou komplexní matici A dimenze n lze vždy vyjádřit ve tvaru A = P-V, kde P je hermiteovská a positivně definitní čtvercová matice též,e dimenz,e a V je unitární. Přitom P = V AA*. Je-li A invertibilní, je rozklad jednoznačný a V = (VAA*)_1A. Pokud pracujeme nad reálnými skaláry, je P symetrická a V ortogonální. Když budeme tutéž větu aplikovat na A* místo A, dostaneme tentýž výsledek, ovšem s obráceným pořadím hermite-ovských a unitárních matic. Matice v příslušných pravých a levých rozkladech budou samozřejmě obecně různé. V komplexním případě je analogie s rozkladem čísel ještě zábavnější — pozitivně semidefinitní P hraje opět roli absolutní hodnoty komplexního čísla, unitární matice V pak 126 chapter 3. LiNÁmím&Emimimm^TtmimmjNVERZE má jednoznačné vyjádření jako součet V = Vr + i V, s hermiteovkými Vr a V, s vlastností V2 + V f = e, tj. dostáváme plnou analogii goniometrického tvaru komplexních čísel (viz závěrečná poznámka v 3.26). Všimněme si ale, že ve vícerozměrném případě je podstané, v jakém pořadí tento „goniometrický tvar" matice píšeme. Jde to oběma způsoby, výsledky jsou ale obecně různé. Pro řadu praktických aplikací bývá rychlejší použití tzv. QR rozkladu matic, který je obdobou Schurovy věty o ortogonální triangulaci: 3.42. Věta. Pro každou komplexní matici a typu m/n existuje unitární matice Q a horní trojúhelníková matice R takové, Že a = QTR. Pokud pracujeme nad reálnými skaláry, jsou Q i R reálné. Důkaz. V geometrické formulaci potřebujeme dokázat, že pro každé zobrazení

- (^xjfj(yi)))2 = 2> " (Z%^))2 í=i j=i í=i j=i byla minimální. Jinými slovy, hledáme lineární kombinaci funkcí f i takovou, abychom „dobře" proložili zadané hodnoty bi. Díky předchozí větě jsou hledané optimální koeficienty A^b. Abychom měli konkrétnější představu, uvažujme pouze dvě funkce f\(x) = x, f2(x) = x2 a předpokládejme, že „naměřené hodnoty" jejich neznámé kombinace g(x) = y\x+ y2x2 v celočíselných hodnotách pro x mezi 1 a 10 jsou bT = (1.44 10.644.4814.5631.1239.2054.8871.28 85.92104.16). Tento vektor vzniknul výpočtem hodnot x + x2 v daných bodech posunutých o náhodné hodnoty v rozmezí ±8. Matice a = (bij) je tedy v našem případě rovna t _ (l 2 3 4 5 6 7 8 9 10 \ \1 4 9 16 25 36 49 64 81 100/ a hledané koeficienty v kombinaci jsou = P- Výsledné proložení je možné dobře vidět na obrázku, kde zeleně jsou proloženy zadané hodnoty b lomenou čarou, zatímco červený je graf příslušné kombinace g. Výpočty byly provedeny v systému Maple pomocí příkazu leastsqrs(B,b). Pokud jste s Maplem (nebo jiným podobným softwarem) spřáteleni, zkuste si zaexperimentovat s podobnými úlohami. 0 2 4 6 8 10 x 129 KAPITOLA 4 Analytická geometrie poloha, incidence, projekce? — a zase skončíme u matic... Vrátíme se teď k úlohám elementární geometrie z podobného pohledu, jako když jsme zkoumali polohy bodů v rovině v 5. části první kapitoly, viz 1.23. Budeme se nejprve zajímat o vlastnosti objektů vymezených pomocí bodů, přímek, rovin apod. Podstatné přitom bude vyjasnění, které vlastnosti závisí či nezávisí na pojmu velikosti vektorů. V další části pak použijeme lineární algebru pro studium objektů, které už lineárně definované nejsou. Opět přitom budeme potřebovat trochu více maticového počtu. Výsledky budou naprosto zásadní později při diskusi technik pro optimalizace, tj. hledání extrémů funčkních hodnot. Projektivní rozšíření afinních prostorů nám v závěru kapitoly ukáže, jak lze překvapivě dosáhnout zjednodušení i stability algoritmických postupů typických pro práci s počítačovou grafikou. 1. Afinní a euklideovská geometrie Když jsme si ujasňovali dopady obecné teorie na systémy rovnic v první části předchozí kapitoly, zjistili jsme v ostavci 3.1, že všechna řešení nehomogenních systémů rovnic sice netvoří vektorové podprostory, vždy ale vznikají tak, že k jednomu jedinému řešení přičteme celý vektorový prostor řešení příslušné homogenní soustavy. Naopak, rozdíl dvou řešení nehomogenní soustavy je vždy řešením homogenní. Obdobně se chovají lineární difereční rovnice, jak jsme viděli již v odstavci 3.11. Návod na teoretické uchopení takové situace dává již diskuse geometrie roviny, viz odstavec 1.25 a dále. Tam jsme totiž popisovali přímky a body jako množiny řešení systémů lineárních rovnic. Přímka pro nás pak byla „jednorozměrným" prostorem, přestože její body byly popisovány dvěmi souřadnicemi. Parametricky jsme ji zadávali tak, že k jednomu bodu (tj. dvojici souřadnic) jsme přičítali násobky pevně zvoleného směrového vektoru. Stejně budeme postupovat i teď v libovolné dimenzi. 4.1. Afinní prostory. Standarní afinní prostor A„ je množina všech bodů v W = A„ spolu s operací, kterou k bodu A = {a\,...,an) e A„ a vektoru v = (vi, ..., vn) e W = V přiřadíme bod A + v = (ai + vi, ..., a„ + v„) e R" = A„. 130 CHAPTER 4. ANAEYMEEÁmE(EMETMimOVSKÁ GEOMETRIE Tyto operace splňují následující tři vlastnosti: (1) A + 0 = A pro všechny body A e A„ a nulový vektor 0 e y (2) A + (v+w) = (A+v) + w pro všechny vektory v, w e V, A e A„ (3) pro každé dva body A, B e „4„ existuje právě jeden vektor v e V takový, že A + v = B. Značíme jej B — A, někdy také AB. Vektorový prostor W nazýváme zaměření afinního prostoru Standardní afinní prostor Všimněme si několika formálních nebezpečí. Používáme stejný symbol „+" pro dvě různé operace: přičtení vektoru ze zaměření k bodu v afinním prostoru, ale také sčítání vektorů v zaměření V = W. Také nezavádíme zvláštní písmena pro samotnou množinu bodů afinního prostoru, tj. A„ pro nás představuje jak samotnou množinu bodů, tak i celou strukturu definující afinní prostor. Proč vlastně chceme rozlišovat množinu bodů prostoru A„ od jeho zaměření V, když se jedná jakoby o stejné W? Jde o velice podstatný formální krok k pochopení geometrie vK": Geometrické objekty jako přímky, body, roviny apod. nejsou totiž přímo závislé na vektorové struktuře na množině W a už vůbec ne na tom, že pracujeme s n-ticemi skalárů. Potřebujeme jen umět říci, co to znamená pohybovat se „rovně v daném směru". K tomu právě potřebujeme na jedné straně vnímat třeba rovinu jako neohraničenou desku bez zvolených souřadnic, ale s možností posunout se o zadaný vektor. Když přejdeme navíc k takovému abstraktnímu pohledu, budeme umět diskutovat „rovinnou geometrii" pro dvourozměrné podprostory, tj. roviny ve vícerozměrných prostorech, „prostorovou" pro třírozměrné atd., aniž bychom museli přímo manipulovat &-ticemi souřadnic. Tento pohled je zachycen v následující definici: 4.2. Definice. Afinním prostorem A se zaměřením V rozumíme množinu bodů V, spolu se zobrazením V x V V, (A, v) A + v, splňujícím vlastnosti (l)-(3) výše. Pro libovolný pevně zvolený vektor v e V je tak definováno posunutí rv : A —> „4 jako zúžené zobrazení i„:P-Pxjt)^P, A A + v. Dimenzí afinního prostoru A rozumíme dimenzi jeho zaměření. Nadále nebudeme rozlišovat A a V v označení. 131 1. AFINNÍ A EUKLIĽXEBXPKÉRjEOMMERMCKÁ GEOMETRIE Z axiomů okamžitě plyne pro libovolné body A, B,C v afinním prostoru A (4) A - A = 0 e V (5) B - A = -(A - B) (6) (C — B) + (B — A) = (C — A). Skutečně, (4) vyplývá z toho, že A + 0 = 0 a takový vektor musí být jednoznačný (první a třetí definiční vlastnost). Postupným přičtením B — A a. A — 5 k A (v uvedeném pořadí), zjevně dostaneme podle druhé definiční vlastnosti opět A, tedy jsme přičetli nulový vektor a to dokazuje (5). Obdobně z platnosti (2) a jednoznačnosti vyplývá (6). Všimněme si, že volba jednoho pevného bodu A0 e A nám určuje bijekci mezi V a. A. Při volbě pevné báze u ve V tak dostáváme pro každý bod A e A jednoznačné vyjádření A = Aq + x\u\ + • • • + x„u„. Hovoříme o afinní soustavě souřadnic (Aq; u\, ... ,u„) zadané počátkem afinní souřadné soustavy Aq a bazí zaměření u. Hovoříme také o afinním repéru (Aq, u). Slovy můžeme shrnout situaci takto: Afinní souřadnice bodu A v soustavě (A0, u) jsou souřadnicemi vektoru A — A0 v bázi u zaměření V. Volba afinního souřadného systému ztotožňuje n-rozměrný afinní prostor A se standardním afinním prostorem A 4.3. Afinní podprostory. Jestliže si vybereme v „4. jen body, které budou mít některé předem vybrané souřadnice nulové (třeba poslední jednu). Dostaneme opět množinu, která se bude chovat jako afinní prostor. Takto budeme skutečně parametricky popisovat tzv. afinní podprostory ve smyslu následující definice. Definice. Neprázdná podmnožina Q C A afinního prostoru A se zaměřením V se nazývá afinní podprostor v A, je-li podmnožina W = {B — A; A, B e Q} c V vektorovým podprostorem a pro libovolné A e Q, w e f jeA + w e Q. Je podstatné mít obě podmínky zahrnuty v definici, protože je snadné najít příklady podmnožin, které budou splňovat první, ale nikoliv druhou. Přemýšlejte např. o přímce v rovině s vyjmutým jedním bodem. Pro libovolnou množinu bodů M c A v afinním prostoru se zaměřením V definujeme vektorový podprostor Z(M) = {{B - A; B, A e M}) c V všech vektorů generovaných rozdíly bodů z M. Zejména je V = Z (A) a každý afinní podprostor Q c A splňuje sám axiomy afinního prostoru se zaměřením Z(Q). Přímo z definic je také zřejmé, že průnik libovolné množiny afinních podprostorů je buď opět afinní podprostor nebo prázdná množina. Afinní podprostor (M) v A generovaný neprázdnou podmnožinou M c A je průnikem všech afinních podprostorů, které obsahují všechny body podmnožiny M. 132 CHAPTER 4. ANAEYMEEÁmE(EMETMimOVSKÁ GEOMETRIE Afinní podprostory si můžeme pěkně popsat pomocí jejich zaměření, jakmile si zvolíme jeden jejich bod A0 e M v generující množině bodů M. Skutečně, dostáváme (M) = {A0 + v; v e Z(M) c Z(A)},tj. pro generování afinního pod-prostoru vezmeme vektorový podprostor Z(M) v zaměření generovaný všemi rozdíly bodů z M a ten pak přičteme k libovolnému z nich. Hovoříme také o afinním obalu množiny bodů M y A. Naopak, kdykoliv zvolíme podprostor U v zaměření Z(A) a jeden pevný bod A e A, pak podmnožina A + U vzniklá všemi možnými součty jediného bodu A se všemi vektory v U je afinní podprostor. Takový postup vede k pojmu parametrizace podprostorů: Nechť Q = A + Z(Q) je afinní podprostor v A„ a (u\, ..., uk) je báze Z(Q) c W. Pak vyjádření podprostorů Q = {A + tlUl + ■■■ + tkuk; tu...,tkeR} nazýváme parametrický popis podprostorů Q. Již jsme viděli jinou možnost zadávání afinních podprostorů: Jestliže máme zvoleny afinní souřadnice, pak lze zaměření podprostorů popsat pomocí homogenního systému lineárních rovnic v těchto souřadnicích. Dosazením souřadnic jednoho bodu našeho podprostorů Q do získaného systému rovnic dostaneme pravou stranu nehomogenního systému se stejnou maticí a celý podprostor Q je pak právě množinou řešení tohoto systému. Zadání podprostorů Q systémem rovnic v daných souřadnicích nazýváme implicitní popis podprostorů Q. Následující obecná věta říká, že takto umíme ve skutečnosti zadat všechny afinní podprostory a tím také ukazuje geometrickou podstatu vlastností množiny všech řešení systémů lineárních rovnic. 4.4. Věta. Nechť (Aq, u) je afinní souřadný systém v n-rozměrném afinním prostoru A. Afinní podprostory dimenze k v A, vyjádřené v daných souřadnicích, jsou právě množiny řešení řešitelných systémů n — k lineárně nezávislých lineárních rovnic v n proměnných. Důkaz. Uvažujme libovolný řešitelný systém n — k lineárně nezávislých rovnic a, (x) = bi,bt el,i = 1, ..., n — k. Je-li A = (íii,...,íi„)ľel" libovolné pevně zvolené řešení tohoto (nehomogenního) systému rovnic a je-li U C M" vektorový podprostor všech řešení zhomogenizovaného systému cti (x) = 0, pak dimenze U je k a podmnožina všech řešení daného systému je tvaru {B; B = A + (yi, ..., y„)T, y = (yi ..., yn)T e U} C M", viz. 3.1. Příslušný afinní podprostor je tím popsán parametricky ve výchozích souřadnicích (A0; u). Naopak, uvažme libovolný afinní podprostor Q c A„ a zvolme nějaký jeho bod B za počátek afinního souřadného systému (B,v) pro afinní prostor A. Protože Q = B + Z (Q), potřebujeme popsat zaměření podprostorů Q jako podprostor řešení homogenního systému rovnic. Zvolme tedy bázi v na Z (A) tak, aby prvních k vektorů tvořilo bázi Z(Q). Pak v 133 1. AFINNÍ A EUKUDEBXPKÉIGEQMMEMECKÁ GEOMETRIE těchto souřadnicích jsou vektory v e Z (Q) dány rovnostmi a j (v) = 0, j = k + 1, ..., n, kde cti jsou lineární formy z tzv. duální báze k v, tj. funkce přiřazení jednotlivých souřadnic v naší bázi v_. Náš vektorový podprostor Z(Q) dimenze /c v n-rozměrném W je tedy skutečně dán jako řešení homogenního systému n — k nezávislých rovnic. Popis zvoleného afinního podprostoru ve vybraném souřadném systému (A0; u) je proto dán systémem homogenních lineárních rovnic. Zbývá nám se vypořádat důsledky přechodu z původního zadaného souřadného systému (A; u) do našeho přizpůsobeného (B; v). Z obecné úvahy o transformacích souřadnic v následujícím odstavci vyplyne, že výsledný popis podprostoru bude opět pomocí systému rovnic, tentokrát ale už obecně nehomogenních. □ 4.5. Transformace souřadnic. Dvě libovolně zvolené afinní soustavy souřadnic (A0,w), (B0,v) se obecně liší posunutím počátku o vektor (S0 — A0) a jinou bazí zaměření. Transformační rovnice tedy vyčteme ze vztahu pro obecný bod X e A X = B0+x[vi-\-----\-x'nv„ = Bo+(A0-Bo)+xiUi-\-----\-xnu, Označme y = (vi, ..., y„)T sloupec souřadnic vektoru (A0— B0) v bázi v a M = (a^-) buď matice vyjadřující bázi u prostřednictvím báze v_. Potom x'l = yi + allxl + • • • + a\nxn xn = yn -\- cin\X\ -\- ■ ■ ■ -\- cinnxn tj. maticově x' = y + M ■ x. Jako příklad si můžeme spočítat dopad takové změny báze na vyjádření řešení systémů rovnic. Nechť v souřadnicích (A0; u) má systém rovnic tvar S ■ x = b s maticí systému S. Pak S ■ x = S ■ M"1 ■ (y + M ■ x) — S ■ M~l ■ y = b. Proto v nových výše uvažovaných souřadnicích (B0; v) bude mít náš systém rovnic tvar (5 • M~l) .x' = b' = b + (S- M~l) ■ y. To plně dokončuje důkaz předchozí věty. 4.6. Příklady afinních podprostoru. (1) Jednorozměrný (standardní) afinní prostor je množina všech bodů reálné přímky A\ ■ Její zaměření je jednorozměrný vektorový prostor M (a nosná množina také M). Afinní souřadnice dostaneme volbou počátku a měřítka (tj. báze ve vektorovém prostoru M). Všechny vlastní afinní podprostory jsou 0-rozměrné, jsou to právě všechny body reálné přímky M. (2) Dvourozměrný (standardní) afinní prostor je množina všech bodů prostoru A2 se zaměřením M2. (Nosnou množinou je M2.) Afinní souřadnice dostaneme volbou počátku a dvou 134 CHAPTER 4. ANAEYMEEÁmE(EMETMimOVSKÁ GEOMETRIE nezávislých vektorů (směrů a měřítek). Vlastní afinní podpro-story jsou pak všechny body a přímky v rovině (0-rozměrné a 1-rozměrné). Přímky přitom jednoznačně zadáme jejich jedním bodem a jedním generátorem zaměření (tzv. parametrický popis přímky). (3) Trojrozměrný (standardní) afinní prostor je množina všech bodů prostoru a3 se zaměřením M3. Afinní souřadnice dostaneme volbou počátku a tří nezávislých vektorů (směrů a měřítek). Vlastní afinní podprostory jsou pak všechny body, přímky a roviny (0-rozměrné, 1-rozměrné a 2-rozměrné). (4) Podprostor všech řešení jedné lineární rovnice a ■ x = b pro neznámý bod \x\, ..., xn] e A„, známý nenulový vektor koeficientů (a\, ... ,a„) & skalár b e M je afinní podprostor dimenze n — 1 (říkáme také, že je kodimenze 1), tj. tzv. nadro-vina v An. 4.7. Afinní kombinace bodů. Nechť A0, ..., Ak jsou body v afinním prostoru A. Jejich afinní obal ({A0 ..., Ak}) můžeme zapsat jako {A0 + ři(Ai - A0) + • • • + tk(Ak - A0); h, ... ,tk el) a v libovolných afinních souřadnicích (tj. A; je vyjádřen sloupcem skalárů) můžeme tutéž množinu zapsat jako k (A0,...,Ak) = {ŕ0A0+ŕiAi+- • ■+tkAk; h e R, ^ř;- = 1}. z=o Obecně výrazy ř0A0 +1\ A\ + ■ ■ ■ + tkAk s koeficienty splňují- cícmi X^=oř' = 1 rozumíme body A0 + Xí=i ř* i^-i ~ ^0) a nazýváme je afinní kombinace bodů. Body A0 ..., Ak jsou v obecné poloze, jestliže generují /c-rozměný podprostor. Z našich definic je vidět, že to nastane právě, když pro kterýkoliv z nich platí, že vektory vzniklé pomocí rozdílů tohoto pevného s ostatními jsou lineárně nezávislé. Všimněme si také, že zadání posloupnosti dim A bodů v obecné poloze je ekvivalentní zadání afinního repéru se středem v prvním z nich. Afinní kombinace je obdobná konstrukce pro body afinního prostoru jako byla lineární kombinace pro vektorové prostory. Skutečně, afinní podprostor generovaný body A0 ..., Ak je roven množině všech afinních kombinací svých generátorů. Můžeme však nyní dobře zobecnit i pojem „mezi dvěma body na přímce". V dvojrozměrném případě tomu odopovídá vnitřek trojúhelníku. Obecně budeme postupovat takto: 4.8. Simplexy. Nechť A0, ..., Ak je k + 1 bodů afinního prostoru A v obecné poloze, /c-rozměrný simplex A = A(A0, ..., Ak) generovaný těmito body je definován jako množina všech afinních kombinací bodů A; s pouze nezápornými koeficienty, tzn. k A = {f0Ao + Mi+ ••• + **A*; U e [0, 1] c R, = 1}. 135 1. AFINNÍ A EUKUDEBXPKÉRjEQMMERMCKÁ GEOMETRIE Jednorozměrný simplex je úsečka, dvourozměrný trojúhelník, nula-rozměrný bod. Všimněme si, že každý ^-rozměrný simplex má právě k + 1 stěn, které jsou postupně zadány rovnicemi ř; = 0, i = 0, ..., k. Přímo z definice je vidět, že jde opět o (k — l)-rozměrné simplexy. Hovoříme o hranici simplexu. Např. trojúhelník má za svou hranici tři hrany, každá z nich pak dva body. Zadání podprostoru jako množiny afinních kombinací bodů v obecné poloze je ekvivalentní parametrickému popisu. Obdobně pracujeme s parametrickými popisy simplexů. 4 . 7 | 4.9. Konvexní množiny. Podmnožina M afinního prostoru se nazývá konvexní, jestliže s každými svými dvěma body A, B obsahuje i celou úsečku A(A, B). Přímo z definice je vidět, že každá konvexní množina obsahuje s každými k + 1 body v obecné poloze i celý jimi definovaný simplex (dokažte si formálně podrobně!). Konvexními množinami jsou např. (1) prázdná podmnožina (2) afinní podprostory (3) úsečky, polopřímky p = {P + t ■ v; ŕ > 0}, (4) obecněji k- rozměrné poloprostory a = {P + t\ ■ v\ + ■■■ + tk-vk; ři.....el, tk > 0}, (5) ) úhly v dvojrozměrných podprostorech /3 = {P +1\ ■ v\ + h ■ V2\ h > 0, h > 0}, atd. Přímo z definice také plyne, že průnik libovolného systému konvexních množin je opět konvexní. Průnik všech konvexních množin obsahujících danou množinu M nazýváme konvexní obal K(M) množiny M. Věta. Konvexní obal libovolné podmnožiny M C A je s K(M) = {t1A1 + ■■■ + tsAs; Y,ti = L ^ > 0, At e M] i = l Důkaz. Označme S množinu všech afinních kombinací na pravé straně dokazované rovnosti. Nejprve ověříme, že je S konvexní. Zvolme tedy dvě sady parametrů ti, i = 1, ..,s\,ť-, 7 = 1, ..., «2 s požadovanými vlastnosti. Bez újmy na obecnosti můžeme předpokládat, že si = s2 a že v obou kombinacích vystupují stejné body z M (jinak prostě přidáme sčítance s nulovými koeficienty). Uvažme libovolný bod úsečky zadané takto získanými body: e(tlAl + --- + tsAs) + (l-e)(ťlAl+--- + ťsAs), 0 < e < 1. Zřejmě jsou opět všechny v S. Zbývá ukázat, že konvexní obal bodů A\, ..., As nemůže být menší než S. Samotné body A; odpovídají volbě parametrů t j = 0 pro všechny ji a t,■ = 1. Předpokládejme, že tvrzení platí pro všechny množiny s nejvýše s — 1 body. To znamená, že konvexní obal bodů A\, ..., As_i je (podle předpokladu) tvořen právě těmi kombinacemi z pravé strany dokazované rovnosti, kde ts = 0. Uvažme nyní libovolný bod A = t\A\ + ■ ■ ■ + ts As e 5, ts 1, a afinní kombinace + - •• + *,_! As_i) + (1 -e(l -řs))As, 0 p(A,C) (4) V každé kartézké souřadné soustavě (Aq, e) mají body A = A0+aiei-\-----\-anen, 5=A0+6ičH-----Ybnen vzdálenost yXľ=i(až ~~ ^')2- (5) Je—li dán bod A a podprostor Q v £„, pak existuje bod f e Q minimalizující vzdálenosti bodů Q od A. Vzdálenost bodů A a P je rovna velikosti kolmého průmětu vektoru A — B do Z(Q)1- pro libovolný B e Q. (6) Obecněji, pro podprostory !ZaQv£„ existují bod f e Q a Q e 1Z minimalizující vzdálenosti bodů B e Q a A e 1Z. Vzdálenost bodů Q a P je rovna velikosti kolmého průmětu vektoru A — B do Z (Q)1- pro libovolné body B e QaAeTZ. Důkaz. První tři vlastnosti vyplývají přímo z vlastností velikosti vektorů v prostorech se skalárním součinem, čtvrtá plyne přímo z vyjádření skalárního součinu v libovolné ortonormální bázi. Podívejme se na vztah pro minimalizaci vzdleností p (A, B) pro B e Q. Vektor A — B se jednoznačně rozkládá na A — B = u\ + u2, u\ e Z(Q), u2 e Z(Q)L. Přitom u2 nezávisí na volbě B e Q, protože případná změna bodu B se projeví přičtením vektoru ze Z(Q). NynízvolmeP = A + (—u2) = B + ui e Q. Dostáváme ||A-S||2 = ||Ml||2 + ||M2||2>||M2||2 = ||A-P||. Odtud již vyplývá, že nejmenší možné vzdálenosti je skutečně dosaženo, a to právě pro náš bod P. Vypočtená vzdálenost je skutečně ||«2ll- Obdobně ukážeme obecný výsledek. Pro volbu libovolných bodů A e Kafi e Qje jejich rozdíl dán jako součet vektorů^ e Z(K)+Z(Q) au2 e (Z(n)+Z(Q))L,přičemž komponenta u2 nezávisí na volbě bodů. Přičtením vhodných vektorů ze zaměření 1Z a Q zjevně obdržíme body A' a B', jejichž vzdálenost je právě || u2\\. □ Rozšíříme nyní náš stručný přehled elementárních úloh v analytické geometrii. 4.14. Příklady standardních úloh. (1) Najděte vzdálenost bodu A e £n odpodprostoru Q C £„: Postup při řešení je dán ve větě 4.13. (2) V £2 veďte bodem A přímku q svírající s danou přímkou p daný úhel: Připomeňme, že na úrovni rovinné geometrie jsme s odchylkami vektorů již pracovali (viz např. 2.42). Najdeme vektor u e M2 ležící v zaměření přímky q a zvolíme vektor v 140 CHAPTER 4. ANABYTKEEmÉE(EMETMmOVSKÁ GEOMETRIE mající od u zadanou odchylku. Hledaná přímka je dána bodem A a zaměřením (v). Úloha má dvě nebo jedno řešení. (3) Spočtěte patu kolmice vedené bodem na danou přímku: Postup je uveden v důkazu předposledního bodu věty 4.13. (4) V měla tedy smysl definice odchylky cp(u, v) vektorů u, v e ľv reálném vektorovém prostoru se skalárním součinem vztahem u ■ v cos(p(u, v) =-, 0 < cp(u, v) < 2jz. INI NI To je zcela v souladu s praxí v dvourozměrném euklidovském prostoru M2 a naší filozofií, že pojem týkající se dvou vektorů je ve své podstatě záležitostí dvourozměrné geometrie. Ve vícerozměrných prostorech je proto odchylka dvou vektorů vždy měřena v rovině, kterou tyto vektory generují (nebo je nula) a náš definiční vztah odpovídá zvyklostem ve všech dimenzích. V libovolném reálném vektorovém prostoru se skalárním součinem přímo z definic plyne ||M-u||2 = ||M||2 + N|2-2(M.u) = |N|2 + N|2-2|NINI coscp(u,v). To je patrně dobře známá kosinová věta z rovinné geometrie. Dále platí pro každou ortonormální bázi e zaměření V a nenulový vektor u e V vztah \\u ||2 = \u ■ e, \2. Podělením této rovnice číslem ||«||2 dostáváme 1 = ^(cos^w,^-))2, což je obvyklé tvrzení o směrových kosinech cp(u, e{) vektoru u. 141 1. AFINNÍ A EUKLIDEBXPKÉIGEQMMmmCKÁ GEOMETRIE Z definice odchylek vektorů nyní můžeme dovodit rozumné definice pro odchylky obecných podprostorů v libovolném euklidovském vektorovém prostoru. Je přitom třeba rozhodnutí, jak se stavět k případům, kdy podprostory mají netriviální průnik. Např. za odchylku dvou přímek budeme chtít patrně brát menší ze dvou možných úhlů, u dvou nerov-noběžných rovin v M3 nebudeme chtít slyšet, že mají odchylku nula, protože mají společný alespoň jeden směr: 4.16 4.16. Definice. Nechť U\, U2 jsou konečněrozměrné podprostory v euklidovském vektorovém prostoru V libovolné dimenze. Odchylka podprostorů U\, U2 je reálné číslo a = V2. Zobrazení^ : u2 —> U\ nechť vznikne podobně z kolmého průmětu na U\. Tato zobrazení mají v bazích (e\, ..., ek) a (e\, ..., e[) matice / u\ má tedy symetrickou pozitivně semidefmitní matici at a a ý je zobrazení adjun-gované k cp. Viděli jsme, že každé takové zobrazení má pouze nezáporná reálná vlastní čísla a že má ve vhodné ortonormální bázi diagonální matici s těmito vlastními čísly na diagonále, viz 3.25 a 3.27. Nyní můžeme odvodit obecný postup pro výpočet odchylky a = (p{u\, ř/2). Věta. V předchozím označení nechť X je největší vlastní hodnota matice at a. Pak cos2 a = X 143 1. AFINNÍ A EUKUĽXEBXPKÉRjEQMMERMCKÁ GEOMETRIE 4.21 Důkaz. Nechť u e ř71 je vlastní vektor zobrazení ý o cp příslušný největší vlastní hodnotě k. Uvažme všechna vlastní čísla k\, ..., kk (včetně násobnosti) a nechť u = (u\, ..., un) je příslušná ortonormální báze U\ z vlastních vektorů. Můžeme přímo předpokládat, že A = k\,u = u\. Potřebujeme ukázat, že odchylka libovolného v e U\ od ř/2 je nejméně tak velká jako odchylka u od ř/2. Tzn. že kosinus příslušného úhlu nesmí být větší. Podle předchozího lemmatu stačí diskutovat odchylku u a cp(u) e ř/2 a přitom víme, že ||w|| = 1. Zvolme tedy v e U\, v = a\U\ + • • • + akuk, ZLi^2= bll2 = 1-Pak || V euklidovského vektorového prostoru V je det cp roven (orientovanému ) objemu obrazu rovnoběžnostěnu určeného vektory ortonormální báze. Obecněji, obraz rovnoběžnostěnu V určeného libovolnými dim V vektory má objem roven det cp— násobku původního objemu. 146 CHAPTER 4. ANABYTKEEmÉE(EMETMmOVSKÁ GEOMETRIE 4 .21a 4.21. Vnější a vektorový součin vektorů. Předchozí úvahy úzce souvisí s tzv. vnějším tensorovým součinem vektorů. Nebudeme zacházet podrobně do této technicky poněkud nepřehledné oblasti, ale zmíníme alespoň případ vnějšího součinu n = dim V vektorů u\, ..., un e V. Nechť (u\j, ..., u„j)T jsou souřadná vyjádření vektorů iij v nějaké pevně zvolené ortonormální bázi V a. M nechť je matice s prvky Pak determinant \M\ nezávisí na volbě báze a jeho hodnotu nazýváme vnějším součinem vektorů u\, ..., un a značíme \u\, ..., «„]. Vnější součin je tedy právě orientovaný objem příslušného rovnoběžnostěnu, viz 4.19. Přímo z definice nyní vyplývají užitečné vlastnosti vnějšího součinu (1) Zobrazení (u\, ..., un) h-» \u\, ..., un] je antisymet-rické n-lineární zobrazení. Tzn., že je lineární ve všech argumentech a výměna dvou argumentů se vždy projeví změnou znaménka výsledku. (2) Vnější součin je nulový právě, když jsou vektory «i,...,m„ lineárně závislé (3) Vektory u\, ... ,un tvoří kladnou bázi právě, když je jejich vnější součin kladný. V technických aplikacích ve M3 se často používá velmi úzce související operace, tzv. vektorový součin, který dvojici vektorů přiřazuje vektor třetí. Uvažme obecný euklidovský vektorový prostor V di-menzerc > 2 a vektory «i, ..., w„_i e V. Dosadíme-li těchto n — 1 vektorů jako prvních n — 1 argumentů «-lineárníhho zobrazení definovaného pomocí determinantu při výpočtu objemu výše, pak nám zbude jeden volný argument, tj. lineární forma na V. Protože však máme k dispozici skalární součin, odpovídá každá lineární forma právě jednomu vektoru. Tento vektor v e V nazveme vektorový součin vektorů Mi, ..., m„_i, tj. pro každý vektor w e V platí (V, W) =[«!,..., M„_i, W]. Značíme v = u\ x ... x u„-\. Jsou-li v nějaké ortonormální bázi souřadnice našich vektorů v = (vi, ..., y„)T, w = (x\, ..., x„)T a uj = (uij, ... u„j)T, naše definice má vyjádření yixi H-----h ynxn Un ■■■ Wl(n-l) Xl lnl ■ ■ ■ "«(« — 1) Xfi. Odtud je přímo vidět, že vektor v je zadán jednoznačně a jeho souřadnice spočteme formálním rozvojem tohoto determinantu podle posledního sloupce. Zároveň jsou přímo z definice očekávatelné následující vlastnosti vektorového součinu: Věta. Pro vektorový součin v = u\ x ... x w„_i platí (1) v e («!, ..., Un-i)1- 147 2. GEOMETRIE KVAEľmmmÝmAimmMICKÁ GEOMETRIE (2) v je nenulový vektor právě, kdyžjsou vektory u\, ..., u„_\ lineárně nezávislé (3) velikost \\v\\ vektorového součinu je rovna absolutní hodnotě objemu rovnoběžníku V(0; u\, ..., w„_i) (4) (u\, ..., w„_i, v) je souhlasná báze orientovaného euklidovského prostom V. Důkaz. První tvrzení plyne přímo z definičního vztahu pro v, protože dosazením libovolného vektoru u j za w máme nalevo skalární součin v ■ u j a napravo determinant s dvěma shodnými sloupci. Hodnost matice s n — 1 sloupci w7 je dána maximální velikostí nenulového minoru. Minory, které zadávají souřadnice vektorového součinu jsou stupně n — 1 a tím je dokázáno tvrzení (2). Jsou-li vektory u\, ... ,un-\ závislé, pak platí i (3). Nechť jsou tedy nezávislé, v je jejich vektorový součin a zvolme libovolnou ortonormální bázi (e\, ..., e„_i) prostoru (u\, ..., m„_i). Z již dokázaného vyplývá, že existuje nějaký násobek (\/a)v, 0 / a e 1, takový, že (e\, ..., ek, (\/a)v) je ortonormální báze celého V. Souřadnice našich vektorů v této bázi jsou u j = (uij, W(„-i)7-, 0)T, v = (0, ..., 0, a)T. Proto je vnější součin \u\, ..., m„_i, v] roven (viz. definice vektorového součinu) . . . , H„_i, v] Un ■■■ Hl(n-l) "(n-l)l • • • "(«-l)(«-l) 0 0 ... 0 a = {v, v) = a2. Rozvojem determinantu podle posledního sloupce zároveň obdržíme a2 = a VolP(0; uu z'„_i). Odtud už vyplývají obě zbylá tvrzení věty. □ 2. Geometrie kvadratických forem V analytické geometrii roviny jsou po přímkách jako další nejjednodušší křivky na řadě tzv. kuželosečky. Jsou v kartéz-kých souřadnicích zadány kvadratickými rovnicemi a podle koeficientů poznáme, zda jde o kružnici, elipsu, parabolu nebo hyperbolu, případně ještě může jít o dvě přímky nebo bod (degenerované případy). Uvidíme, že naše nástroje umožní vcelku účinnou klasifikaci takovýchto objektů v libovolných konečných dimenzích i práci s nimi. 4.22. Kvadriky v £„. V analogii k rovnicím kuželoseček v rovině začneme poznámkami o objektech v euklidovských bodových prostorech, které jsou v dané ortnonormální bázi zadány kvadratickými rovnicemi, hovoříme o kvadrikách. 148 CHAPTER 4. ANALTTmOMW&MESMDRATICKÝCH FOREM Zvolme v £„ pevně kartézskou souřadnou soustavu (tj. bod a ortonormální bázi zaměření) a uvažme obecnou kvadratickou rovnici pro souřadnice (jci, ... ,xn)T bodů A e £„ kde bez újmy na obecnosti můžeme rovnou předpokládat symetrii atj = a ji. Tuto rovnici můžeme zapsat jako f(u) + g(u) + a = 0 pro kvadratickou formu / (tj. zúžení symetrické bilineární formy F na dvojice stejných argumentů), lineární formu g a skalár a e M a předpokládáme že alespoň jeden z koeficientů atj je nenulový (jinak by se jednalo o lineární rovnici popisující euklidovský podprostor). Začněme s kvadratickou částí, tj. bilineární symetrickou formou / : W x W -» M.. Stejně dobře můžeme přemýšlet o obecné symetrické bilineární formě na libovolném vektorovém prostoru. Pro libovolnou bázi na tomto vektorovém prostoru bude hodnota f(x) na vektoru x = x\e\ + • • • +xnen dána vztahem f(x) = F(x, x) = ^^XiXjF\ei, ej) = xT ■ A ■ x kde A = (ciij) je symetrická matice s prvky atj = F(ei, ej). Takovýmto zobrazením / říkáme kvadratické formy a výše uvedený vzorec pro hodnotu formy s použitím zvolených souřadnic se nazývá analytický tvar formy. Jestliže změníme bázi 6i na jinou bázi e[, ... ,e'n, dostaneme pro stejný vektor jiné souřadnice x = S-x' (zde S je příslušná matice přechodu) a tedy f(x) = (S ■ x')T ■ A ■ (S ■ x') = (x')T ■ (ST ■ A ■ S) ■ x'. Předpokládejme opět, že je na našem vektorovém prostoru zadán skalární součin. Předchozí výpočet pak můžeme shrnout slovy, že matice bilineární formy F a tedy i kvadratické formy / se transformuje při změně souřadnic způsobem, který pro ortogonální změny souřadnic splývá s transformací matic zobrazení (skutečně, pak je 5_1 = ST). Tento výsledek můžeme intepretovat také jako následující pozorování: Tvrzení. Nechť V je reálný vektorový prostor se skalárním součinem. Pak vztah zadává bijekci mezi symetrickými lineárními zobrazeními a kvadratickými formami na V. Důkaz. Skutečně, bilineární forma s pevně zadaným druhým argumentem je lineární formou au = F( , u) a v přítomnosti skalárního součinu je nutně dána vztahem a(u)(v) = v ■ w pro vhodný vektor w. Klademe 0 (přepočtěte!). Má tedy / v nových souřadnicích analytický tvar a^x[2 + h, kde h je kvadratická forma nezávislá na proměnné x\. Z technických důvodů bývá lepší zvolit v nové bázi v\ = u 1, opět dostaneme výraz f = f\+h, kde f\ závisí pouze na x[, zatímco v h se x [ nevyskytuje. Přitom pak g{v\, v\) = a\\. (2) Předpokládejme, že po provedení kroku (1) dostaneme pro h matici (řádu o jedničku menšího) s koeficientem u x'22 různým od nuly. Pak můžeme zopakovat přesně stejný postup a získáme vyjádření / = f\ + f2 + h, kde v h vystupují pouze proměnné s indexem větším než dvě. Tak můžeme postupovat tak dlouho, až buď provedeme n — 1 kroků a získáme diagonální tvar, nebo v řekněme i-tém kroku bude prvek au dosud získané matice nulový. (3) Nastane-li poslední možnost, ale přitom existuje jiný prvek cijj 7^ 0 s j > i, pak stačí přehodit i-tý prvek báze s 7-tým a pokračovat podle předešlého postupu. (4) Předpokládejme, že jsme narazili na situaci cijj = 0 pro všechny j > i. Pokud přitom neexistuje ani žádný jiný prvek ajk 7^ 0 s j > i, k > i, pak jsme již úplně hotovi neboť jsme již dosáhli diagonální matici. Předpokládejme, že ajk 7^ 0. Použijeme pak transformaci v j = u j + uk, ostatní vektory báze ponecháme (tj. x'k = xk — Xj, ostatní zůstávají). Pak h(vj, Vj) = h(uj, Uj) + h(uk, uk) + 2h(uk, uj) = 2ajk 7^ 0 a můžeme pokračovat podle postupu v (1). □ 4.25. Afinní klasifikace kvadratických forem. Po výpočtu polární báze Lagrangeovým algoritmem můžeme ještě vylepšit bázové vektory pomocí násobení skalárem tak, aby v příslušném analytickém vyjádření naší formy vystupovaly v 152 CHAPTER 4. ANALTTmOMW&MESMDRATICKÝCH FOREM roli koeficientů u kvadrátů jednotlivých souřadnic pouze skaláry 1, —1 a 0. Následující věta o setrvačnosti říká navíc, že počet jedniček a mínus jedniček nezávisí na našich volbách v průběhu algoritmu. Tyto počty nyzýváme signaturou kvadratické formy. Opět tedy dostáváme úplný popis kvadratických forem ve smyslu, že dvě takové formy jsou převoditelná jedna na druhou pomocí afinní transformace tehdy a jen tehdy, když mají stejnou signaturu. Věta. Pro každou nenulovou kvadratickou formu hodnosti r na reálném vektorovém prostoru V existuje celé číslo 0 < p < r a r nezávislých lineárních forem 0 zatímco pro v e Q]&f(v) < 0. Nutně tedy platí P n Q = {0} a proto dim P + dim Q < n. Odtud plyne p + (n — q) < n, t), p < q. Opačnou volbou podprostorů však získáme i q < p. Je tedy p nezávislé na volbě polární báze. Pak ovšem pro dvě matice se stejnou hodností a stejným počtem kladných koeficientů v diagonálním tvaru příslušné kvadratické formy získáme stejný analytický tvar. □ Při diskusi symetrických zobrazení jsme hovořili o defi-nitních a semidefitních zobrazeních. Tatáž diskuse má jasný smysl i pro symetrické bilineární formy a kvadratické formy. Kvadratickou formu / forma na reálném vektorovém prostoru V nazýváme 153 3. PROJEKTIVNÍ GEOMEFEER 4. ANALYTICKÁ GEOMETRIE (1) positivně definitní, je-li f(u) > o pro všechny íí / o (2) positivněsemidefinitní, je-li /(u) > 0 pro všechny m e V (3) negativně definitní, je-li /(«) < 0 pro všechny « / O (4) negativně semidefinitní, je-li /(«) < 0 pro všechny u e V (5) indefinitní, je-li /(«) > 0 a /(u) < 0 pro vhodné w, i; e V. Stejné názvy používáme i pro symetrické reálné matice, jsou-li maticemi patřičných kvadratických forem. Signaturou symetrické matice pak rozumíme signaturu příslušné kvadratické formy. 3. Projektivní geometrie V mnoha elementárních textech o analytické geometrii autoři končí afinními a euklidovskými objekty popsanými výše. Na mnoho praktických úloh euklidovská nebo afinní geometrie stačí, na jiné bohužel ale nikoliv. Tak třeba při zpracovávání obrazu z kamery nejsou zachovávány úhly a rovnoběžné přímky se mohou (ale nemusí) protínat. Dalším dobrým důvodem pro hledání širšího rámce geometrických úloh a úvah je požadovaná robustnost a jednoduchost numerických operací. Daleko jednodušší jsou totiž operace prováděné prostým násobením matic a velice těžko se totiž od sebe odlišují malinké úhly od nulových, proto je lepší mít nástroje, které takové odlišení nevyžadují. Základní ideou projektivní geometrie je rozšíření afinních prostorů o body v nekonečnu způsobem, který bude dobře umožňovat manipulace s lineárními objekty typu bodů, přímek, rovin, projekcí, apod. 4.26. Projektivní rozšíření afinní roviny. Začneme tím nejjednodušším zajímavým případem, geometrií v rovině. Jestliže si body roviny A2 představíme jako rovinu z = 1 v V?, pak každý bod P naší afinní roviny představuje vektor m = (x, y, 1) e M3 a tím i jednorozměrný podprostor (u) c M3. Naopak, skoro každý podprostor v M3 protíná naši rovinu v právě jednom bodě P a jednotlivé vektory takového podprostoru jsou dány souřadnicemi (x, y, z) jednoznačně, až na společný skalární násobek. Žádný průnik s naší rovinou nebudou mít pouze podprostory s body o souřadnicích (x,y,Q). Projektivní rovina V2 je množina všech jednorozměrných podprostorů v M3. Homogenní souřadnice bodu P = (x : y : z) v projektivní rovině jsou trojice reálných čísel určené až na společný skalární násobek a alespoň jedno z nich musí být nenulové. Přímka v projektivní rovině je definována jako množina jednorozměrných podprostorů (tj. bodů v V2) Příklad. V afinním prostoru M2 uvažujme dvě přímky L\ : y — x — 1 = 0 a L2 : y — jc + 1 = 0. Jestliže budeme body přímek L\ a L2 chápat jako konečné body v projektivním prostoru "P2, budou zjevně jejich homogenní souřadnice (x : y : z) splňovat rovnice Li : y - x - z = 0, L2 : y - x + z = 0. 154 CHAPTER 4. ANALYTICKÁ GE&MEHWUEKTIVNÍ GEOMETRIE Podívejme se, jak budou rovnice těchto přímek vypadat v souřadnicích v afinní rovině, která bude dána jako y = 1. Za tím účelem stačí dosadit y = 1 do předchozích rovnic: L[:l-x-z = 0, L'2 : 1 - x + z = 0 Nyní jsou „nekonečné" body naší původní afinní roviny dány vztahem z = 0 a vidíme, že naše přímky L\ a U2 se protínají v bodě (1, 1,0). To odpovídá geometrické představě, že rovnoběžné přímky L\, L2 v afinní rovině se protínají v nekonečnu (a to v bodě (1 : 1 : 0)). 4.27. Projektivní prostory a transformace. Postup z roviny se přirozeným způsobem zobecňuje na každou konečnou dimenzi. Volbou libovolné afinní nadroviny A„ ve vektorovém prostoru W+1, která neprochází počátkem, můžeme ztotožnit body P e A„ s jednorozměrnými podprostory, které tyto generují. Zbylé jednorozměrné podprostory vyplní rovinu rovnoběžnou s A„ a říkáme jim „nekonečné body" v projektivním rozšíření V„ afinní roviny A„. Zjevně je vždy množina nekonečných bodů v V„ projektivním prostorem dimenze o jedničku nižším. Abstraktněji hovoříme o projektivizaci vektorového prostoru: pro libovolný vektorový prostor V dimenze n + 1 definujeme V (V) = {PcV; P je jednorozměrný vektorový podprostor}. Volbou libovolné báze w ve V dostáváme tzv. homogenní souřadnice na V(V) tak, že pro P e V(V) použijeme jeho libovolný nenulový vektor u e V a souřadnice tohoto vektoru v bázi u. Afinní přímka má tedy ve svém projektivním rozšíření pouze jediný bod (oba konce se „potkají" v nekonečnu a projektivní přímka vypadá jako kružnice), projektivní rovina má projektivní přímku nekonečných bodů atd. Při zvolených homogenních souřadnicích je možné jednu z jejich hodnot zafixovat na jedničku (tj. vyloučíme všechny body projektivního prostoru s touto souřadnicí nulovou) a získáme tak vložení n-rozměrného afinního prostoru A„ C V(V). To je přesně konstrukce, kterou j sme použili v opačném směru v příkladu projektivní roviny. Každé prosté lineární zobrazení r : V\ -» V2 mezi vektorovými prostory samozřejmě zobrazuje jednorozměrné podprostory na jednorozměrné podprostory. Tím vzniká zobrazení na projektivizacích T : V{V\) -» ViVj). Takovým zobrazením říkáme projektivní zobrazení. Jinak řečeno, projektivní zobrazení je takové zobrazení mezi projektivními prostory, že v každé soustavě homogenních souřadnic na definičním oboru i obrazu je toto zobrazení zadáno násobením vhodnou maticí. Obecněji, pokud naše pomocné lineární zobrazení není prosté, definuje projektivní zobrazení pouze mimo svoje jádro, tj. na bodech, jejichž homogenní souřadnice se nezobrazují na nulu. 4.28. Perspektivní projekce. Velmi dobře j sou výhody projektivní geometrie vidět na perspektivní projekci M3 -> M2. Bod (X, Y, Z) „reálného světa" se promítá na bod (x, y) na 155 3. PROJEKTIVNÍ GEOMEFEER 4. ANALYTICKÁ GEOMETRIE průmětně takto: X Y -/-> y = -f-- Z Z To je nejen nelineární formule, ale navíc při Z malém bude velice problematická přesnost výpočtů. Při rozšíření této transformace na zobrazení V3 -» V2 dostáváme zobrazení (X : Y : Z : W) h» (x : y : z) = (—fX : — fY : Z), tj. popsané prostou lineární formulí Y Z W Tento jednoduchý výraz zadává perspektivní projekci pro všechny konečné body vi3 c v3, které dosazujeme jako výrazy s W = 1. Navíc jsme odstranili problémy s body, jejichž obraz leží v nekonečnu. Skutečně, je-li Z-ová souřadnice skutečného bodu scény blízká nule, bude hodnota třetí homogenní souřadnice obrazu mít souřadnici blízkou nule, tj. bude představovat bod blízký nekonečnu. 4.29. Afinní a projektivní transformace. Invertibilní projektivní zobrazení projektivního prostoru V„ na sebe odpovídají v homogenních souřadnicích invertibilním maticím dimenze n + 1. Dvě takové matice zadávají stejnou projektivní transformaci právě, když se liší o konstantní násobek. Jestliže si zvolíme první souřadnici jako tu, jejíž nulovost určuje nekonečné body, budou transformace, které zachovávají konečné body, dány maticemi, jejichž první řádek musí být až na první člen nulový. Jestliže budeme chtít přejít do afinních souřadnic konečných bodů, tj. zafixujeme si hodnotu první souřadnice na jedničku, musí být první prvek na prvním řádku být také rovný jedné. Matice projektivních transformací zachovávajících konečné body tedy mají tvar: /l 0 ••• 0\ au -.. a\n \bn cin\ • • • ann J kde b = (bi, ..., b„)T e M." a A = (a^-) je invertibilní matice dimenze n. Působení takové matice na vektoru (1, x\, ..., xn) je právě obecná afinní transformace. 4.30. Projektivní klasifikace kvadrik. Závěrem ještě poznámka o složitějších objektech studovaných v afinní geometrii nejlépe prostřednictvím projektivních rozšíření. Jestliže popíšeme kvadriku v afinních souřadnicích pomocí obecné kvadratické rovnice, viz výše, jejím přepsáním v homogenních souřadnicích dostaneme vždy výlučně homogenní výraz, jehož všechny členy jsou druhého řádu. Důvod je ten, že pouze takové homogenní výrazy budou mít pro homogenní souřadnice smysl nezávisle na zvoleném konstantním násobku souřadnic (x0, x\, ..., xn). Hledáme tedy takový, jehož zúžením na afinní souřadnice, tj. dosazením x0 = 1, 156 CHAPTER 4. ANALYTICKÁ GE&MEHMJEKT1VNÍ GEOMETRIE získame původní výraz. To je ale mimořádně jednoduché, prostě dopíšeme dostatek x0 ke všem výrazům - žádny ke kvadratickým členům, jedno k lineárním a x2, ke konstantnímu členu. Získáme tak dobře definovanou kvadratickou formu na našem pomocném vektorovém prostoru W+1, ale jsme už vůči libovolné volbě báze klasifikovali. Zkuste si samostatně převést tuto klasifikaci do projektivní i afinní podoby. (Hezké a náročné cvičení na závěr semestru!) 157