Vysoká škola báňská ­ Technická univerzita Ostrava Fakulta elektrotechniky a informatiky LINEÁRNÍ ALGEBRA Zdeněk Dostál 2000 Ostrava Úvod Skriptum z lineární algebry, které právě dostáváte do rukou, obsahuje látku přednášky ,,Lineární algebra určené pro studenty Fakulty elektrotechniky a informatiky VŠB Technické univerzity Ostrava s hlubším zájmem o teoretické obory inženýrského studia. Cílem skript je uvést čtenáře do studia lineární algebry a seznámit jej se základními pojmy tak, aby mohl pochopit jejich úlohu při řešení technických problémů. Lineární algebra je jedním ze základních kamenů matematického vzdělání moderního inženýra, neboť se zabývá jak konkretními výpočetními postupy, tak abstraktními pojmy, jejichž zvládnutí je užitečné pro popis technických problémů. Kdo zvládne základní pojmy tak, že bude vědět jak spolu souvisí, jaký mají význam pro počítání a pro formulaci technických problémů, pro toho bude mnohem snadnější nejen další studium, ale i sledování rozvoje zvoleného oboru. Ve výkladu mají významné místo důkazy. Jejich cílem je zejména ukázat čtenáři úvahy, které vedou často od drobných pozorování k pojmům a závěrům, které jsou důležité pro aplikace. Studium důkazů tak rozvíjí všeobecnou schopnost analyzovat a řešit problémy. Do skripta je zařazena také méně tradiční látka, jako některé rozklady nebo elementární úvod do principů variačních metod. Autora k tomu vedlo přesvědčení, že tato látka není o nic těžší než tradiční látka lineární algebry, jako třeba teorie determinantů, avšak zpřístupňuje čtenáři pojmy, které se využívají v současných metodách řešení technických problémů. Jako příklady uveďme bilineární formy, které jsou základním prostředkem pro variační formulaci rovnic elektromagnetického pole nebo rovnic rovnováhy, na níž je založeno jejich řešení pomocí prakticky jakéhokoliv moderního software, nebo singulární rozklad, který lze využít mimo jiné při implementaci vyhledávačů. Do textu byla zařazena i látka, která bývá tradičně součástí numerických metod, jako trojúhelníkové rozklady a jejich použití. Zde byla dána přednost výkladu ,,od problému k řešení , který se zdá být pro technické školy přirozený. Navíc byla technika rozkladů využita i v řadě důkazů, takže ji pozorný čtenář může dobře pochopit. Rád bych na tomto místě poděkoval všem, kteří se na vzniku skripta přímo či nepřímo podíleli, a to zejména ing. Jiřímu Kubicovi, který napsal převážnou část skripta včetně obrázků v TEXu, paní P.Frélichové za konečnou redakci skript, RNDr. L. Šindelovi, který četl pečlivě všechny verse rukopisu, a paní ing.M.Litschmannové za pomoc s první kapitolou. Díky za četné připomínky patří i doc.ing.N.Častové, CSc., doc.RNDr.J.Vlčkovi,CSc. a Mgr. V. Vondrákovi. Za omezení počtu chyb děkuji též RNDr.L.Teskové,CSc ze ZČU v Plzni. Za všechny další zdroje inspirace a radosti z práce bych rád poděkoval prof. RNDr. Ivo Markovi, DrSc. z MFF UK/ČVUT Praha za přispění k pocitu, že lineární algebra je nejen důležitá disciplina, ale také zajímavá švanda. 2 Část I Matice a řešení soustav lineárních rovnic 1. Zobrazení a lineární rovnice 2. Úpravy a řešení soustav lineárních rovnic 3. Aritmetické vektory 4. Matice a vektorové operace 5. Násobení a transponování matic 6. Inverzní matice 7. Trojúhelníkový rozklad 1. Zobrazení a lineární rovnice Soustavy lineárních algebraických rovnic často vznikají při řešení praktických problémů. V této úvodní kapitole si nejprve odvodíme soustavu lineárních rovnic, kterou můžeme považovat za matematický model elektrického obvodu. Potom si připomeneme pojem zobrazení a ukážeme si různé interpretace řešení výsledné soustavy. Úvodní příklad nám bude v dalším výkladu sloužit k ilustraci a motivaci zavedení některých nových pojmů. 1.1 Elektrický obvod se zdrojem a spotřebiči Uvažujme elektrický obvod na obr. 1.1 se zadanými odpory spotřebičů R1, R2, R3, R4. K odvození rovnic pro neznámé potenciály x1, x2, x3, s jejichž pomocí můžeme vypočítat neznámé hodnoty napětí na spotřebičích U1, U2, U3, U4 a hodnoty proudů procházejících spotřebiči I1, I2, I3, I4, použijeme základní fyzikální zákony a následující konvence: (i) Jeden uzel, v našem případě uzel 3, je uzeměn, tedy x3 = 0. (ii) Hodnota napětí na spotřebiči je dáno rozdílem potenciálů na jeho svorkách (např. U2 = x2 - x1). (iii) Proud ve směru šipky má kladnou hodnotu. (iv) Hodnoty napětí i proudu mohou být kladné i záporné. Proud se zápornou hodnotou má směr opačný, než je jeho směr vyznačený ve schématu. Obdobně záporná hodnota napětí charakterizuje skutečný pokles potenciálu v opačném směru. R1 x1 R2 U1 I1 x3 x2 R4R3 U4U3 U2 I4I3I2 10 A 1 2 3 Obr. 1.1: Modelový elektrický obvod se zdrojem a spotřebiči. V dalším textu si postupně vyjádříme napětí a proudy pomocí potenciálů a pro proudy vyjádřené vztahy obsahující potenciály si napíšeme Kirchhoffův zákon proudů. Poznámka: Pokud jste se (zatím) s elektrickými obvody nespřátelili, můžete se na následující předpisy či rovnice dívat jako na zadaná zobrazení. 5 Kapitola 1. Zobrazení a lineární rovnice 1.2 Vztah mezi napětími a potenciály Hodnoty napětí na spotřebičích jsou dány podle obr. 1.1 následujícím předpisem: U1 = x1 - x3 U2 = - x1 + x2 U3 = x2 - x3 U4 = x2 - x3 (1.1) Je to předpis, který každé trojici potenciálů x1, x2, x3 přiřazuje čtveřici hodnot napětí U1, U2, U3, U4. Snadno se zjistí, že pro některé hodnoty napětí neexistují potenciály (např. pro U3 = U4). Ani když potenciály k hodnotám napětí existují, nejsou určeny jednoznačně: Jsou-li rovnice (1.1) splněny pro x1, x2, x3, pak jsou splněny i pro x1 + c, x2 + c, x3 + c, kde c je libovolné reálné číslo. Jednoznačnost však bude zaručena, pokud přidáme rovnici x3 = 0. 1.3 Zobrazení Předpis (1.1) je zvláštním případem jednoho ze základních matematických pojmů. Definice: Zobrazení f : U V množiny U do množiny V je předpis, který každému prvku množiny U přiřazuje nějaký prvek množiny V. Množina U se nazývá definiční obor zobrazení f, množina V se nazývá obor hodnot zobrazení f. Zobrazení f se nazývá zobrazení na množinu V, jestliže každý prvek množiny V je obrazem nějakého prvku množiny U. Jestliže mají každé dva různé prvky množiny U různé obrazy, nazývá se zobrazení f prosté. Zobrazení, které je současně prosté a na (množinu), se nazývá vzájemně jednoznačné. Předpis (1.1) tedy můžeme považovat za zobrazení, jehož definičním oborem je množina všech trojic reálných čísel x1, x2, x3 a oborem hodnot je množina všech čtveřic reálných čísel U1, U2, U3, U4. Jak jsme si ukázali výše, toto zobrazení není ani prosté ani na (množinu všech uspořádaných čtveřic), takže není vzájemně jednoznačné. 1.4 Proud a napětí Vztah mezi hodnotami proudu a napětí je dán Ohmovým zákonem: I1 = 1 R1 U1 I2 = 1 R2 U2 I3 = 1 R3 U3 I4 = 1 R4 U4 (1.2) 6 1.5 Kirchhoffův zákon proudů Předpis (1.2) zřejmě definuje prosté, vzájemně jednoznačné zobrazení (alespoň za přirozeného předpokladu Ri > 0). Nás však zajímá vyjádření hodnot proudů pomocí potenciálů, které získáme, když dosadíme vztahy (1.2) do (1.1): I1 = 1 R1 x1 - 1 R1 x3 I2 = - 1 R2 x1 + 1 R2 x2 I3 = 1 R3 x2 - 1 R3 x3 I4 = 1 R4 x2 - 1 R4 x3 (1.3) 1.5 Kirchhoffův zákon proudů Kirchhoffův zákon proudů tvrdí, že součet proudů v uzlu je nula. V našem případě dostaneme postupně: Uzel 1 : -I1 + I2 = 0 (1.4.a) Uzel 2 : - I2 - I3 - I4 = -10 (1.4.b) Uzel 3 : I1 + I3 + I4 = 10 (1.4.c) Pokud I1, I2, I3, I4 splňují první dvě rovnice, pak zřejmě splňují i třetí, neboť tato je součtem prvních dvou s opačným znaménkem. Třetí rovnice tedy nenese žádnou novou informaci a lze ji vynechat. Dosadíme-li do rovnic (1.4.a) a (1.4.b) výrazy pro potenciály (1.3), dostaneme po úpravě: - 1 R1 + 1 R2 x1 + 1 R2 x2 + 1 R1 x3 = 0 1 R2 x1 - 1 R2 + 1 R3 + 1 R4 x2 + 1 R3 + 1 R4 x3 = -10 (1.5) Zvolíme-li R1 = R2 = R3 = R4 = 1 a vezmeme-li v úvahu, že x3 = 0, dostaneme soustavu: -2x1 + x2 = 0 x1 - 3x2 = -10 (1.6) Soustava se nazývá lineární, protože neobsahuje mocniny ani součiny neznámých. Jak se dá očekávat z fyzikálního významu úlohy, soustavu (1.6) splňuje jediná dvojice potenciálů x1, x2. Matematické argumenty si ukážeme později. 1.6 Interpretace řešení soustavy rovnic Řešení soustavy (1.6) může být interpretováno zcela nezávisle na původní úloze. První interpretaci dostaneme, když se na soustavu (1.6) budeme dívat po řádcích. Jednotlivé rovnice jsou vlastně rovnicemi přímek a úkolem je najít jejich průsečík, jak je 7 Kapitola 1. Zobrazení a lineární rovnice x2 4 -10 0 2 x1 103 21 -=- xx 02 21 =+- xx Obr. 1.2: Geometrické znázornění soustavy (1.6) po řádcích. to znázorněno na obr. 1.2. Jelikož přímky mají různé směrnice, je zřejmé, že průsečík existuje. Pro souřadnice průsečíku platí x1 = 2, x2 = 4. Snadno si ověříme, že splňují soustavu rovnic (1.6). Na soustavu (1.6) se však můžeme také dívat po sloupcích. V tomto případě je naším úkolem najít x1 a x2 tak, aby se x1-násobek vektoru -2 1 sečtený s x2-násobkem vektoru 1 -3 rovnal vektoru 0 -10 . Číselné řešení je ovšem totéž, neboť 2 -2 1 + 4 1 -3 = 0 -10 . Soustavu rovnic (1.6) lze popsat i pomocí zobrazení A : R2 x1 x2 -2x1 + x2 x1 - 3x2 R2 , kde R2 značí množinu všech uspořádaných dvojic reálných čísel. Označíme-li si x = x1 x2 , b = 0 -10 , pak úloha najít řešení rovnice (1.1) je ekvivalentní úloze najít x R2 tak, aby A(x) = b. (1.7) Soustava rovnic (1.6) má řešení, právě když b H(A), kde H(A) je obor hodnot zobrazení A. Jestliže b H(A) a A je prosté zobrazení, pak soustava rovnic (1.6) má jediné řešení. 8 1.6 Interpretace řešení soustavy rovnic 2 1 1 4-4 -2 -3 -10 -12 2 ¤ - 1 2 4 § ¨ - 3 1 Obr. 1.3: Sloupcová interpretace soustavy (1.6). Příklady k procvičení: Cvičení 1.1. Nechť je zadána mechanická soustava sestávající ze tří pružin a dvou těles jako na obrázku 1.4. Najděte rovnice pro posunutí u1, u2, víte-li, že: * Prodloužení i-té pružiny je dáno vztahem li = ui - ui-1. * u0 = u3 = 0. * Síla yi v natažené i-té pružině splňuje Hookův zákon yi = cili. Vertikální pružina tedy působí na dolní těleso silou -yi a na horní těleso silou yi. * Součet sil působících na každé těleso je nula. To lze vyjádřit také tak, že hmotnost fi = mig i-tého tělesa je vyrovnána odporem pružin. Síla fi (kladná je orientována dolů) natahuje i-tou pružinu a stlačuje pružinu i + 1, takže platí fi = yi - yi+1. Nápověda: Postupujte analogicky jako u elektrického obvodu z obr. 1.1. 9 Kapitola 1. Zobrazení a lineární rovnice u0=0 m2 c2 u2 m1 c1 u1 c3 u3=0 Obr. 1.4: Soustava pružin. 10 2. Úpravy a řešení soustav lineárních rovnic V této kapitole se budeme zabývat řešením obecné soustavy lineárních rovnic, tj. úlohy najít x1, . . . , xn tak, aby pro daná čísla aij a bi, i = 1, . . . , m, j = 1, . . . , n platilo a11x1 + . . . + a1nxn = b1 ... ... ... am1x1 + . . . + amnxn = bm (2.1) Součástí této úlohy je rozhodnout, zda vůbec nějaké řešení dané soustavy existuje, kolik jich je a co o nich lze říci v případě, že je jich nekonečně mnoho. Konkrétním případem soustavy (2.1) je soustava (1.6), jejímž řešením jsou neznámé potenciály obvodu na obr. 1.1. Seznámíme se zde zejména s velmi účinnou metodou řešení soustavy (2.1), jejíž objev je připisován významnému německému matematikovi K.F.Gaussovi (1777­ 1855). V Číně však byla tato metoda známa nejméně 180 let před naším letopočtem pod jménem fang cheng. 2.1 Ekvivalentní úpravy Základní myšlenka řešení soustavy lineárních rovnic spočívá v nahrazení dané soustavy jinou soustavou, která má stejné řešení a je jednodušší. V případě dvou rovnic o dvou neznámých je jednodušší taková soustava, která obsahuje alespoň jednu rovnici s jedinou neznámou, neboť takovou rovnici už můžeme řešit nezávisle na druhé rovnici. Novou soustavu můžeme dostat postupným použitím tzv. ekvivalentních úprav zvolených tak, aby řešení původní soustavy bylo i řešením soustavy upravené: (E1) Vzájemná výměna libovolných dvou rovnic soustavy. (E2) Násobení obou stran některé rovnice soustavy nenulovým číslem. (E3) Přičtení násobku některé rovnice soustavy k jiné rovnici. Vhodná úprava soustavy -2x1 + x2 = 0 (2.2.a) x1 - 3x2 = -10 (2.2.b) je například vynásobení rovnice (2.2.b) dvěma, podle pravidla (E2), a přičtení rovnice (2.2.a) k upravené rovnici (2.2.b), v souladu s pravidlem (E3). Upravená soustava bude mít tvar -2x1 + x2 = 0 (2.3.a) - 5x2 = -20 (2.3.b) Z rovnice (2.3.b) vypočteme x2 = 4 a po dosazení do rovnice (2.3.a) dostaneme -2x1 + 4 = 0, (2.4) 11 Kapitola 2. Úpravy a řešení soustav lineárních rovnic odkud x1 = 2. Dosazením do (2.2) si ověříme, že jsme opravdu získali řešení soustavy (2.2). Ekvivalentní úpravy mají tu vlastnost, že jejich pomocí můžeme z upravené soustavy získat zpět původní soustavu. Například soustavu (2.2) můžeme dostat ze soustavy (2.3) tak, že rovnici (2.3.a) odečteme od rovnice (2.3.b) a takto upravenou rovnici (2.3.b) vynásobíme číslem 1 2. Obecně platí: * Jestliže soustava S vznikla ze soustavy S vzájemnou výměnou i-té a j-té rovnice podle pravidla (E1), pak tatáž úprava použitá na S nás přivede zpět k S. * Jestliže soustava S vznikla ze soustavy S násobením i-tého řádku nenulovým číslem podle pravidla (E2), pak násobením téhož řádku soustavy S číslem 1 obdržíme zpátky soustavu S. * Jestliže soustava S vznikla ze soustavy S přičtením -násobku i-té rovnice k j-té rovnici (i = j), pak přičtení (-)-násobku i-té rovnice soustavy S k j-té rovnici soustavy S vede opět k S. Dvě soustavy lineárních rovnic nazýváme ekvivalentní soustavy, jestliže jednu z nich lze získat z druhé ekvivalentními úpravami. Jelikož řešení původní soustavy je také řešením upravené soustavy a upravenou soustavu můžeme ekvivalentními úpravami převést na původní soustavu, platí následující věta. Věta: Jsou-li dvě soustavy lineárních rovnic ekvivalentní, potom mají stejné řešení. 2.2 Maticový zápis Při úpravě rovnic si můžeme ušetřit práci, když nebudeme opisovat neznámé. Soustavě rovnic (2.1) bude v tomto úsporném zápisu odpovídat tabulka a11 . . . a1n b1 ... ... ... ... am1 . . . amn bm , (2.5) kterou nazýváme rozšířená matice soustavy (2.1). Část tabulky bez posledního sloupce se nazývá matice soustavy (2.1). Poslední sloupec se nazývá pravá strana soustavy. Pokud budeme mluvit o tabulce, jako je matice soustavy, bez odkazu na soustavu, budeme ji nazývat stručně matice. Ekvivalentním úpravám soustavy rovnic odpovídají operace s řádky rozšířené matice soustavy, které nazýváme elementární (řádkové) operace: (e1) Vzájemná výměna libovolných dvou řádků. (e2) Násobení některého řádku nenulovým číslem. (e3) Přičtení násobku některého řádku k jinému řádku. Máme-li dvě matice, z nichž jedna vznikla z druhé pomocí elementárních řádkových operací, říkáme, že matice jsou řádkově ekvivalentní. Větu 2.1 si můžeme vyjádřit pomocí nových pojmů. 12 2.3 Úprava na schodový tvar Věta: Mají-li dvě soustavy lineárních rovnic řádkově ekvivalentní rozšířené matice, potom mají stejné řešení. Úpravu soustavy (2.2) na (2.3) můžeme zapsat pomocí elementárních operací ve tvaru -2 1 0 1 -3 -10 2r2 + r1 -2 1 0 0 -5 -20 . (2.6) 2.3 Úprava na schodový tvar Podívejme se, jak můžeme pomocí elementárních řádkových operací převést matici (2.5) na tzv. schodový tvar, tj. na tvar, v němž jsou první nenulové prvky řádků zvané vedoucí prvky uspořádány jako schody klesající zleva doprava. Požaduje se přitom, aby vedoucí prvky nebyly nad sebou a aby všechny případné nulové řádky byly dole. Příkladem matice ve schodovém tvaru je pravá matice ve výrazu (2.6) nebo matice A = 2 0 2 0 0 2 , B = 0 2 2 0 0 2 0 0 0 , C = 0 3 2 0 0 0 0 0 0 . Při úpravě matice využijeme pozorování, že je-li v matici (2.5) prvek aij nenulový, pak vynásobíme-li i-tý řádek této matice číslem -akj/aij a přičteme-li ho ke k-tému řádku, bude mít upravená matice v k-tém řádku a j-tém sloupci prvek akj + (-akj/aij) aij = 0. (2.7) Pokud je prvek a11 nenulový, lze takto transformovat matici (2.1) na tvar a11 a12 . . . a1n b1 0 a1 22 . . . a1 2n b1 2 ... ... ... ... ... 0 a1 m2 . . . a1 mn b1 m . Pokud bude také prvek a1 22 nenulový, můžeme obdobně dosáhnout pomocí elementárních řádkových operací, aby i pod ním byly v upravené matici nuly. Bude-li pokaždé ai-1 ii = 0, dostaneme nakonec matici (2.8) ve schodovém tvaru s nenulovými prvky a11, a1 22, . . . , ak-1 kk . a11 a12 . . . a1k . . . a1n b1 0 a1 22 . . . a1 2k . . . a1 2n b1 2 ... ... ... ... ... 0 0 ak-1 kk . . . ak-1 kn bk-1 k 0 0 . . . 0 . . . 0 bk k+1 0 0 . . . 0 . . . 0 0 ... ... ... ... ... 0 0 . . . 0 . . . 0 0 . (2.8) 13 Kapitola 2. Úpravy a řešení soustav lineárních rovnic Rozložení nenulových prvků v levé části upravené matice soustavy připomíná trojúhelník, proto říkáme, že matice je v trojúhelníkovém tvaru. Úpravu na trojúhelníkový tvar lze provést i v případě, že pokaždé, když ai-1 ii = 0, je možno nalézt prvek ai-1 ji = 0, j > i. Stačí vzájemně vyměnit před úpravou i-tý a j-tý řádek. Každou matici však nelze elementárními řádkovými úpravami převést na trojúhelníkový tvar. Kdyby byl například celý první sloupec nulový, nebyli bychom schopni žádnou řádkovou úpravou zajistit, aby se do levého horního rohu upravené matice dostal nenulový prvek. V takovém případě bychom přešli na úpravu prvního nenulového sloupce. Obdobně bychom postupovali i při úpravě dalších řádků. Nedospěli bychom však k matici (2.8), ale k obecnější matici ve schodovém tvaru. Varování: Z našich úvah vyplývá, že postupným prováděním ekvivalentních úprav dostaneme soustavu, která má stejné řešení jako původní soustava. Neprovádíme-li následnou úpravu na upravené matici, můžeme se dopustit chyby. Například úpravami 1 1 1 1 2 1 1 0 r2 - r3 2 0 1 1 r3 - r2 1 1 1 1 0 1 0 -1 0 -1 0 1 r3 + r2 1 1 1 1 0 1 0 -1 0 0 0 0 dostaneme rozšířenou matici soustavy, která má jiné řešení než soustava odpovídající původní matici soustavy. Této chybě se můžeme vyhnout tak, že vybereme některý pevně zvolený řádek, který neupravíme, ale použijeme ho k úpravě ostatních řádků. Například úpravy 1 1 1 1 2 1 1 0 r2 - 2r1 2 0 1 1 r3 - 2r1 1 1 1 1 0 -1 -1 -2 0 -2 -1 -1 r3 - 2r2 1 1 1 1 0 -1 -1 2 0 0 1 3 jsou ekvivalentní. 2.4 Zpětná substituce Nyní si ukážeme, jak získat řešení soustavy s maticí ve schodovém tvaru. Budeme rozlišovat tři případy: * Jestliže poslední nenulový řádek rozšířené matice soustavy má nenulový pouze poslední prvek bk k+1, pak tomuto řádku odpovídá rovnice 0 = bk k+1, která nemá pro bk k+1 = 0 řešení. V tomto případě tedy daná soustava nemá řešení. * Jestliže rozšířená matice má trojúhelníkový tvar (2.8) s k = n, bn n+1 = 0 a ai-1 ii = 0, i = 1, . . . , n, pak n-tá rovnice má tvar an-1 nn xn = bn-1 n , ze které snadno vypočteme xn. Po dosazení do předchozích rovnic zbude v (n - 1)-ní rovnici jediná neznámá, kterou také snadno vypočteme. Budeme-li takto postupovat dále, určíme snadno jediné řešení soustavy. 14 2.5 Gaussova eliminace * Jestliže rozšířená matice má obecný schodový tvar, pak z každé rovnice soustavy vyjádříme neznámou, která odpovídá vedoucímu prvku. Postupným dosazováním od posledního řádku dostaneme vzorce pro neznámé odpovídající vedoucím prvkům vyjádřené pomocí neznámých na pravé straně. V tomto případě má soustava nekonečně mnoho řešení. 2.5 Gaussova eliminace Výpočetní postup pro řešení soustav lineárních rovnic, se kterým jsme se právě seznámili se nazývá Gaussova eliminace. První krok, redukce na schodový tvar, se při řešení soustav nazývá dopředná redukce, zatímco řešení soustavy se schodovou maticí se nazývá zpětná substituce. Příklad 2.1. Soustava s jediným řešením. Řešme soustavu 2x2 + 3x3 = 2 x2 + x3 = 0 x1 + x3 = 4 (2.9) Řešení: Ekvivalentními řádkovými úpravami dostaneme postupně 0 2 3 2 r3 0 1 1 0 1 0 1 4 r1 1 0 1 4 0 1 1 0 0 2 3 2 r3 - 2r2 1 0 1 4 0 1 1 0 0 0 1 2 . (2.10) Řešením rovnic, které odpovídají matici napravo, dostaneme postupně x3 = 2, x2 = = -x3 = -2, x1 = 4 - x3 = 2, což je jediné řešení naší soustavy (2.9). Příklad 2.2. Soustava, která má nekonečně mnoho řešení. Řešme soustavu x1 + x2 + x3 = 1 x1 - x3 = 1 x2 + 2x3 = 0 (2.11) Řešení: Ekvivalentními úpravami dostaneme postupně 1 1 1 1 1 0 -1 1 r2 - r1 0 1 2 0 1 1 1 1 0 -1 -2 0 0 1 2 0 r3 + r2 1 1 1 1 0 -1 -2 0 0 0 0 0 . Poslední matice je rozšířenou maticí soustavy x1 + x2 + x3 = 1 - x2 - 2x3 = 0 0 = 0 (2.12) Poslední rovnice nenese žádnou informaci. Z předposlední rovnice vypočteme x2 pomocí x3, tj. x2 = -2x3. Po dosazení za x2 do první rovnice dostaneme x1 = 1 + x3. Soustava má tedy nekonečně mnoho řešení ve tvaru x3 libovolné, x2 = -2x3, x1 = 1 + x3. Můžeme je zapsat také pomocí libovolného parametru p ve tvaru x3 = p, x2 = -2p, x1 = 1 + p. 15 Kapitola 2. Úpravy a řešení soustav lineárních rovnic Poznámka: Má-li soustava nekonečně mnoho řešení, je množina řešení určena jednoznačně, nikoliv však její parametrizace, tj. analytický tvar. Například x2 = p, x3 = -1 2p a x1 = -1 2p + 1 je jiný tvar téhož řešení. Příklad 2.3. Soustava, která nemá řešení. Řešme soustavu 2x1 + x2 = 2 x1 + 2x2 - x3 = 1 4x1 + 5x2 - 2x3 = -1 (2.13) Řešení: Ekvivalentními úpravami rozšířené matice soustavy dostaneme postupně 2 1 0 2 1 2 -1 1 2r2 - r1 4 5 -2 -1 r3 - 2r1 2 1 0 2 0 3 -2 0 0 3 -2 -5 r3 - r2 2 1 0 2 0 3 -2 0 0 0 0 -5 . Poslední rovnici 0x1 +0x2 +0x3 = -5 nelze splnit žádnou volbou x1, x2, x3. Soustava proto nemá řešení. 2.6 Gauss-Jordanova metoda Při ekvivalentních úpravách se nemusíme zastavit u schodového tvaru. Jestliže podělíme každý řádek (tj. prvky každého řádku) vedoucím prvkem a pomocí transformace (2.7) upravíme matici dále tak, aby i nad vedoucím prvkem každého řádku byly nuly, dostaneme matici v normovaném schodovém tvaru. Gauss-Jordanova metoda se od Gaussovy eliminace liší tím, že se při dopředné redukci upraví rozšířená matice soustavy na normovaný schodový tvar místo na schodový tvar. Zpětná substituce je pak snadnější a nemusí se provádět od poslední rovnice. Například dodatečnou úpravou rozšířené matice soustavy (2.10) dostaneme 1 0 1 4 r1 - r3 0 1 1 0 r2 - r3 0 0 1 2 1 0 0 2 0 1 0 -2 0 0 1 2 . Řešení soustavy se nachází v posledním sloupci matice vpravo, neboť rovnice, které odpovídají rozšířené matici soustavy napravo, jsou x1 = 2, x2 = -2 a x3 = 2. 2.7 Pracnost řešení Gaussova eliminace je velmi efektivní metoda pro ruční řešení malých soustav a pro počítačové řešení soustav stovek až tisíců rovnic. Metoda je velmi efektivní i pro počítačové řešení větších soustav se speciální strukturou rozložení nenulových prvků, která usnadňuje dopřednou redukci soustavy. Pro rozsáhlejší soustavy existují efektivnější metody, které se rozvíjejí i v současné době. Pracnost řešení soustavy metodou Gaussovy eliminace lze výstižně charakterizovat počtem násobení. Přímým výpočtem lze ověřit, že pro m = n vyžaduje dopředná redukce 1 6(2n + 1)(n + 1)n násobení, zatímco zpětná substituce vyžaduje asi 1 2n(n - 1) násobení. Pro velká n přitom platí 1 6 (2n + 1)(n + 1)n 1 3 n3 a 1 2 n(n - 1) 1 2 n2 . Dopředná redukce je tedy podstatně pracnější než zpětná substituce. 16 2.7 Pracnost řešení Příklady k procvičení: Cvičení 2.1. Zdůvodněte, proč není žádná z matic A = 0 1 0 1 , B = 0 0 1 1 , C = 0 1 1 1 , D = 0 1 1 0 ve schodovém tvaru. Cvičení 2.2. Najděte schodový tvar matic A, B, C, D ze cvičení 2.1. Cvičení 2.3. Najděte všechna řešení soustavy 2x1 - x2 + x3 - x4 = 1 x1 + 2x2 - x3 + x4 = 2 x1 - 3x2 + 2x3 - 2x4 = -1 Cvičení 2.4. Řešte soustavu x1 + x2 = 0 x1 + 2x2 + x3 = 0 x2 + 2x3 = 4 a) pomocí Gaussovy eliminace. b) pomocí Gauss­Jordanovy metody. 17 3. Aritmetické vektory V rovnicích, které popisují elektrický obvod na obr. 1.1, se vyskytují skupiny veličin, jako je x1, x2, x3 nebo I1, I2, I3, I4, kterým lze připsat společný fyzikální význam; zde potenciály nebo proudy obvodu z obr. 1.1. V této kapitole budeme zkoumat, jak se s takovými skupinami manipuluje vcelku, což nám umožní jednodušším způsobem zapsat vztahy podobné těm, kterými jsme se zabývali v předcházejících kapitolách, aniž bychom měli před sebou stále všechny detaily. To nás přivede k aritmetickým vektorům a operacím s nimi. 3.1 Aritmetické vektory n-rozměrný aritmetický vektor je uspořádaná n-tice čísel, jejíž prvky se nazývají složky. Tyto uspořádané n-tice budeme zapisovat do hranatých závorek do řádků nebo sloupců. Například vektor proudů obvodu z obr. 1.1 můžeme definovat předpisem i = = [I1, I2, I3, I4]. Aritmetický vektor je určen svými složkami. Jestliže v je aritmetický vektor, pak i-tou složku vektoru v budeme značit [v]i (např. [i]1 = I1). Počet složek aritmetického vektoru nazýváme jeho rozměrem nebo též dimenzí. Například vektor u = [1, 2] je dvourozměrný vektor, i je čtyřrozměrný. Dva aritmetické vektory u a v považujeme za stejné (píšeme u = v), jestliže mají stejnou dimenzi n a stejné odpovídající složky, tj. [u]1 = [v]1, . . . , [u]n = [v]n. Vektory u a v, které nejsou stejné, jsou různé (píšeme u = v). Jestliže tedy u = [1, 2] a v = [2, 1], pak [u]1 = 1, [v]1 = 2, takže u = v. Dvourozměrné nebo třírozměrné aritmerické vektory si můžeme znázornit v dané kartézské soustavě souřadnic šipkami vedoucími od počátku do bodů, které mají stejné souřadnice jako příslušné vektory. Tyto šipky se také nazývají polohové vektory příslušných bodů. Jelikož všechny šipky vychází z jednoho bodu, nazývají se také vázané vektory. Každý aritmetický vektor u dimenze dvě nebo tři definuje zobrazení posunutí pu, které každý bod A posune do polohy pu(A) tak jako na obr. 3.1. Každý aritmerický vektor dimenze dvě nebo tři si tedy můžeme představit také jako zobrazení posunutí. Zobrazení pu je určeno libovolnou rovnoběžně přenesenou kopií polohového vektoru u s počátkem v kterémkoliv bodu. Rovnoběžné kopie vektoru u můžeme proto považovat za různé reprezentace jednoho a téhož aritmetického vektoru. V takovém případě mluvíme o volných vektorech. Aritmetické vektory dimenze vyšší než tři si nemůžeme představit jako šipky. Můžeme si je však představovat jako funkce definované na indexech složek, jako na obr. 3.2. Součin skaláru (čísla) a aritmetického vektoru u = [u1, . . . , un] je vektor u definovaný předpisem u = [u1, . . . , un]. (3.1) Pro složky u tedy platí [u]i = [u]i, i = 1, . . . , n, (3.2) například 3[1, 2] = [3 1, 3 2] = [3, 6], 3[1, 2] 1 = 3 1 = 3, 3[1, 2] 2 = 3 2 = 6. 18 3.1 Aritmetické vektory 0 1 2 u pu(A) A Obr. 3.1: Volné a vázané vektory. 0 1 2 1 2 3 4 Obr. 3.2: Znázornění vektoru w = [1, 2, 1, 2]. 0 u v u+v A u vu+v a) Vázané vektory b) Volné vektory Obr. 3.3: Součet vektorů. Součet aritmetických vektorů u = [u1, . . . , un] a v = [v1, . . . , vn] stejné dimenze 19 Kapitola 3. Aritmetické vektory je vektor u + v definovaný předpisem u + v = [u1 + v1, . . . , un + vn]. (3.3) Pro složky u + v tedy platí [u + v]i = [u]i + [v]i, i = 1, . . . , n, (3.4) například [1, 2] + [2, 3] = [1 + 2, 2 + 3] = [3, 5], [1, 2] + [2, 3] 1 = 1 + 2 = 3, [1, 2] + [2, 3] 2 = 2 + 3 = 5. Součet dvourozměrných nebo třírozměrných aritmetických vektorů lze znázornit jako na obr. 3.3. Snadno se ověří, že pro libovolná čísla , a vektory u,v,w stejné dimenze platí: u + (v + w) = (u + v) + w (3.5.a) u + v = v + u (3.5.b) (u + v) = u + v (3.5.c) ( + )u = u + u (3.5.d) (u) = ()u (3.5.e) 1u = u (3.5.f) Důkazy těchto tvrzení se provádí po složkách s využitím definic a vlastností čísel. Například vztah (3.5.f) dokážeme pomocí vztahu (3.2) a vlastnosti čísla 1. Pro libovolnou složku i dostaneme [1u]i = 1[u]i = [u]i, (3.6) což dokazuje (3.5.f). Nové pojmy nám umožňují alternativní zápis vztahů z 1. kapitoly. Například vztah (1.1) lze zapsat ve tvaru U1 U2 U3 U4 = x1 1 -1 0 0 + x2 0 1 1 1 + x3 -1 0 -1 -1 . (3.7) 3.2 Nulový a opačný vektor Při počítání s vektory má zvláštní úlohu vektor o = [0, . . . , 0], který se nazývá nulový vektor, neboť má při sčítání vektorů stejnou úlohu jako číslo nula při sčítání čísel. Nulový vektor dimenze n budeme značit on nebo o, když lze určit n z předpokladu, že výraz, ve kterém se vyskytuje, má smysl. Je-li u libovolný n-rozměrný vektor, pak nulový vektor dimenze n je jediný nulový vektor o, který splňuje u + o = u. (3.8) 20 3.2 Nulový a opačný vektor Je-li vektor u = [u1, . . . , un] libovolný aritmetický vektor, pak se vektor -u = [-u1, . . . , -un] = (-1)u (3.9) nazývá opačný vektor k vektoru u. Opačný vektor je jediný vektor, který splňuje u + (-u) = o. (3.10) Jestliže u a v jsou libovolné aritmetické vektory stejné dimenze, pak jediný vektor x, který splňuje u + x = v (3.11) lze zapsat ve tvaru x = v + (-u) = (-u) + v. (3.12) Poznámka: V rovnici (3.12) jsme se vyhli zápisu x = v - u, protože se v něm vyskytuje rozdíl aritmetických vektorů, který jsme si zatím nedefinovali. Mohli bychom to ovšem snadno dohnat předpisem v - u = v + (-u). (3.13) Příklady k procvičení: Cvičení 3.1. Vypočtěte, případně označte výrazy, které nejsou definovány: a) 3 [1, 2] b) [1, 2] + [3, 4] c) [1, 2] + [1, 2, 3] Cvičení 3.2. Nechť tři pracovníci P1, P2, P3 mají hodinové mzdy 50, 80 a 120 Kč v pracovní dny a 60, 100 a 150 Kč v sobotu a v neděli. Označme si p = [50, 80, 120], s = [60, 100, 150]. a) Vyčíslete 40[p]1 a [40p + 8s]2. b) Jaký je význam 40[p]1 ve slovním vyjádření? c) Jaký je význam [40p + 8s]2 ve slovním vyjádření? Cvičení 3.3. Nechť u = [1, 2] a v = [2, 4]. Vypočtěte vektor, který splňuje u + x = = v. Cvičení 3.4. Dokažte vztah (3.5.a). 21 4. Matice a vektorové operace Při sdružování informací do složitějších celků se nemusíme zastavit u aritmetických vektorů. Například tři sloupcové vektory na pravé straně výrazu (3.7) obsahují informaci o spojení uzlů sítě z obrázku 1.1, takže spojení uzlů sítě je popsáno tabulkou C = 1 0 -1 -1 1 0 0 1 -1 0 1 -1 . (4.1) Podobné tabulky vznikají v mnoha dalších situacích, s nimiž se postupně seznámíme. Nejsou pro nás úplnou novinkou, neboť jsme je v části 2.2 použili ke stručnému zápisu soustav rovnic a zavedli jsme si pro ně název matice. Nyní budeme matice považovat za svébytné matematické objekty a naučíme se s nimi počítat. V této kapitole se omezíme na rozšíření operací sčítání a násobení skalárem na matice. 4.1 Definice a označení Nechť jsou dány prvky a11, a12, . . . , amn z dané množiny F, jejíž prvky lze sčítat a násobit obdobně jako čísla. Prvky množiny F nazýváme také skaláry. Matice typu (m, n) (stručně m × n matice) je obdélníková tabulka A = a11 . . . a1n ... ... ... am1 . . . amn , která má mn prvků aij uspořádaných do m řádků rA i a n sloupců sA j , takže A = rA 1 ... rA m = sA 1 , . . . , sA n , rA i = ai1, . . . , ain , sA j = a1j ... amj . Stručně píšeme též A = [aij]. Množinu všech matic typu (m, n) s prvky z množiny F budeme značit Fm,n. Jestliže m = n, pak se A nazývá čtvercová matice řádu n. Matici typu (1, n) nazýváme řádkovým vektorem řádu n, matici typu (m, 1) nazýváme sloupcovým vektorem řádu m. Kromě řádků a sloupců matice A je význačnou částí matice její diagonála tvořená prvky a11, . . . , ass, s = min{m, n}. Diagonála matice C z (4.1) je tedy tvořena prvky 1, 1, -1. Matice obvykle značíme velkými písmeny, která mohou být vysázena tučně. Prvek v i-tém řádku a j-tém sloupci matice A budeme značit [A]ij, takže pro matici C z (4.1) platí [C]21 = -1. Množinu F, která obsahuje prvky matice budeme v případě potřeby 22 4.2 Násobení matice skalárem a sčítání matic specifikovat příslušným přídavným jménem, takže budeme mluvit o reálných maticích, komplexních maticích, polynomiálních maticích atd. Dvě matice A a B považujeme za stejné (píšeme A = B), jestliže jsou stejného typu a mají stejné odpovídající prvky, tj. [A]ij = [B]ij. Matice A a B, které nejsou stejné, jsou různé (píšeme A = B). Například 1 2 = [1, 2], 1 2 3 4 = 2 1 3 4 . 4.2 Násobení matice skalárem a sčítání matic Operace sčítání a násobení číslem (skalárem), které jsme si zavedli pro aritmetické vektory, můžeme přirozeně rozšířit na matice. Součin skaláru a matice A je matice A stejného typu jako A definovaná předpisem [A]ij = [A]ij. (4.2) Například 2 1 2 2 1 = 2 4 4 2 . Obdobně součet matic A a B stejného typu je matice A + B stejného typu jako A a B definovaná předpisem [A + B]ij = [A]ij + [B]ij. (4.3) Například 1 2 2 1 + 0 3 -3 0 = 1 5 -1 1 Pro ilustraci smyslu právě zavedených operací s maticemi označme L a P matice doby letu a časových nároků na dopravu z centra města na letiště a zpět v minutách mezi městy Ostravou (O), Prahou (P) a Brnem (B). L = O P B O 0 50 40 P 50 0 30 B 40 30 0 , P = O P B O 0 100 100 P 100 0 100 B 100 100 0 . Pak matice T = L + P obsahuje čas potřebný na cestu mezi uvažovanými městy v minutách. V matici 1 60T je tentýž čas v hodinách. Jelikož obě nové operace jsou definovány po složkách, obdobně jako odpovídající operace pro aritmetické vektory, platí pro jakékoliv číselné matice A, B, C stejného typu a pro libovolné skaláry , vztahy obdobné vztahům (3.5): A + (B + C) = (A + B) + C (4.4.a) A + B = B + A (4.4.b) (A + B) = A + B (4.4.c) ( + )A = A + A (4.4.d) (A) = ()A (4.4.e) 1A = A (4.4.f) 23 Kapitola 4. Matice a vektorové operace 4.3 Nulová matice a odečítání matic Při sčítání matic má obdobnou úlohu jako nula při sčítání čísel nebo nulový vektor při sčítání vektorů nulová matice O = 0 . . . 0 ... ... ... 0 . . . 0 , jejíž všechny prvky jsou nuly. Snadno se ověří, že pro libovolnou matici A a nulovou matici stejného typu platí [A + O]ij = [A]ij + [O]ij = [A]ij + 0 = [A]ij, takže A + O = A. (4.5) Nulovou matici typu (m, n) značíme také Omn, avšak indexy obvykle vynecháváme, když je lze určit z předpokladu, že daný maticový výraz má smysl. Obdobně, jako jsme si zavedli po složkách opačný vektor, můžeme ke každé číselné matici A definovat matici opačnou -A předpisem [-A]ij = (-1)A ij = -[A]ij, (4.6) takže platí A + (-A) = O (4.7.a) -A = (-1)A (4.7.b) Jestliže matice A a B jsou libovolné matice stejného typu, pak jedinou matici X, která splňuje A + X = B, lze zapsat ve tvaru X = B + (-A) = (-A) + B. (4.8) Pro stručnější psaní výrazů, jako je (4.8), definujeme odečítání matic nebo též rozdíl matic předpisem A - B = A + (-B). 4.4 Matice rozdělené na bloky V některých případech je výhodné rozdělit danou matici pomocí vhodně zvolených horizontálních či vertikálních čar na menší matice, zvané též submatice nebo bloky. Například následující matici typu (3, 4) můžeme rozdělit na čtyři bloky A = 1 0 1 2 2 1 3 1 5 4 0 1 = C D E F . (4.9) 24 4.4 Matice rozdělené na bloky Matice, jejichž prvky jsou uspořádány do bloků, nazýváme blokové matice. Rozdělení na bloky je užitečné při odvozování vztahů, ve kterých figurují části matice, a při manipulaci s velkými maticemi, neboť ty mohou být postupně prováděny po blocích. Například, je-li matice B typu (3, 4) rozdělena na bloky P, Q, R, S, stejně jako matice A z (4.9), pak A = C D E F , A + B = C D E F + P Q R S = C + P D + Q E + R F + S . Pro blokové matice používáme obdobnou terminologii jako pro běžné matice, takže mluvíme o blokové diagonále nebo o blokových řádcích. Například matice 1 3 0 2 4 0 0 0 6 má nenulové pouze diagonální bloky. Příklady k procvičení: Cvičení 4.1. Určete, pro které dvojice následujících matic lze vypočítat součet: A = 1 2 3 4 , B = 1 2 3 4 0 1 , C = 2 0 0 0 Cvičení 4.2. Určete, pro která x, y, z je splněna maticová rovnost x 1 1 y + 1 0 0 1 = 0 z z 1 . Cvičení 4.3. Obchodní síť má 3 prodejny, které prodávají 2 produkty spotřební elektroniky. Předpokládejme, že odbyt v prvním a druhém pololetí je zapsán do matic P a D typu (3, 2) tak, že v i-tém řádku a j-tém sloupci je prodej j-tého produktu v i-té prodejně. Nechť P = 120 100 80 120 100 80 , D = 140 120 100 100 160 180 . a) Vypočtěte S = P + D a A = 1 2(P + D). b) Jaký je význam prvků [S]21 a [A]21? Cvičení 4.4. Dokažte vztah (4.4.a). 25 5. Násobení a transponování matic 5.1 Násobení matice a vektoru Znovu se vraťme ke vztahu (3.7). Jeho pravá strana je sestavena ze složek vektoru x = x1 x2 x3 a ze sloupců matice C z (4.1). Takový výraz budeme považovat za součin Cx matice C a sloupcového vektoru x, takže Cx = x1sC 1 + x2sC 2 + x3sC 3. Obecně definujeme součin matice A = [aij] typu (m, n) a sloupcového vektoru x = [xi] dimenze n předpisem y = Ax = x1sA 1 + . . . + xnsA n. (5.1) Rozepsáním definice (5.1) po složkách dostaneme [y]i = [Ax]i = ai1x1 + . . . + ainxn = rA i x. (5.2) Toto pravidlo si můžeme znázornit pomocí: y yi = A ai1 . . . ain ---- x x1 . . . xn (5.3) Jako příklady násobení matice a vektoru si uveďme a11 a12 a21 a22 x1 x2 = a11x1 + a12x2 a21x1 + a22x2 , 2 1 0 -1 3 1 1 2 3 = 2 1 + 1 2 + 0 3 -1 1 + 3 2 + 1 3 = 4 8 . Pro libovolné matice A, B typu (m, n), n-rozměrné vektory u, v a skalár platí: A(u) = (Au) = (A)u (5.4.a) A(u + v) = Au + Av (5.4.b) (A + B)u = Au + Bu (5.4.c) 26 5.2 Násobení matic Rovnosti (5.4) se dokazují po složkách. Tím se vlastně redukují na důkaz tvrzení pro matice typu (1, n). Například s použitím definic a vlastností sčítání a násobení čísel dostáváme A(u + v) i = rA i (u + v) = ai1(u1 + v1) + . . . + ain(un + vn) = = (ai1u1 + . . . + ainun) + (ai1v1 + . . . + ainvn) = = rA i u + rA i v = [Au]i + [Av]i, což dokazuje (5.4.b). Pomocí součinu matice a vektoru si můžeme stručně zapsat vztahy mezi napětím, potenciály a proudy obvodu z obr. 1.1. Označme si u = U1 U2 U3 U4 , x = x1 x2 x3 , i = I1 I2 I3 I4 , c = 0 -10 10 , C = 1 0 -1 -1 1 0 0 1 -1 0 1 -1 , C = 1 -1 0 0 0 1 1 1 -1 0 -1 -1 , D = R-1 1 0 0 0 0 R-1 2 0 0 0 0 R-1 3 0 0 0 0 R-1 4 . (5.5) Potom (1.1), (1.2) a (1.4) lze zapsat postupně ve tvaru u = Cx, i = Du a (-C ) i = c. Postupným dosazením s použitím -C = (-1)C dostaneme -C D(Cx) = c. (5.6) Specifikací matice D, dosazením x3 = 0 a vynecháním poslední složky vektorů na obou stranách rovnice (5.6) dostaneme výraz ekvivalentní (1.5). 5.2 Násobení matic Ačkoliv jsou koeficienty rovnice (1.5) plně určeny maticemi C, D a C, výraz (5.6) nám je umožňuje vypočítat pouze s pomocí neznámých potenciálů x1, x2, x3. Naším cílem teď bude toto omezení překonat. Podívejme se nejprve podrobněji na výraz D(Cx). S použitím (5.4) dostaneme D(Cx) = D x1sC 1 + x2sC 2 + x3sC 3 = x1DsC 1 + x2DsC 2 + x3DsC 3 , odkud s pomocí nového označení DC = DsC 1 , DsC 2 , DsC 3 (5.7) 27 Kapitola 5. Násobení a transponování matic a definice součinu matice a vektoru (5.1) dostaneme D(Cx) = (DC)x. Vztah (5.7) je vzorem obecné definice součinu matic. Jestliže A je matice typu (m, p) a B je matice typu (p, n), pak součin matic A a B je matice AB typu (m, n) definovaná předpisem AB = AsB 1 , . . . , AsB n . (5.8) Rozepíšeme-li si tuto definici po složkách, dostaneme [AB]ij = ai1b1j + . . . + aipbpj = rA i sB j (5.9) a AB = rA 1 sB 1 . . . rA 1 sB n ... ... ... rA msB 1 . . . rA msB n = rA 1 B ... rA mB . (5.10) Při odvození rovnosti (5.10) jsme pro každý řádek použili definici (5.8) s tím, že za levou matici jsme si postupně dosazovali řádky matice A. Pravidlo pro násobení matic lze také znázornit pomocí AB [AB]ij = A ai1 . . . aip ---- B b1j . . . bpj . Jako příklady násobení matic si uveďme a11 a12 a21 a22 b11 b12 b21 b22 = a11b11 + a12b21 a11b12 + a12b22 a21b11 + a22b21 a21b12 + a22b22 , 2 1 0 -1 -2 3 1 2 0 1 = 2 1 + 1 0 2 2 + 1 1 0 1 - 1 0 0 2 - 1 1 -2 1 + 3 0 -2 2 + 3 1 = 2 5 0 -1 -2 -1 . Povšimněme si, že definice součinu dvou matic je zvolena tak, aby platilo A(Bx) = (AB)x (5.11) pro libovolné matice A, B a sloupcový vektor x, pro které má alespoň jeden z výrazů význam. Levou stranu rovnice (5.6) tedy můžeme zapsat ve tvaru součinu matice a vektoru x, neboť -C D(Cx) = -(C D)(Cx) = - (C D)C x. Na možnost vynechání vnitřních závorek se podíváme v článku 5.3. 28 5.3 Pravidla pro násobení matic 5.3 Pravidla pro násobení matic Z definice (5.8) vyplývá, že pro součin matic platí obdobná pravidla jako pro násobení matice a vektoru (5.4), takže pro skalár a matice A, B, C platí A(B) = (AB) = (A)B (5.12.a) A(B + C) = AB + AC (5.12.b) (A + B)C = AC + BC, (5.12.c) kdykoliv jsou příslušné výrazy definovány. Tato pravidla připomínají známá aritmetická pravidla pro počítání s čísly. Pro násobení matice A typu (m, p), matice B typu (p, q) a matice C typu (q, n) platí také asociativní zákon A(BC) = (AB)C, (5.13) neboť podle definice součinu matic a (5.11) A(BC) = A BsC 1 , . . . , BsC n = A(BsC 1 ), . . . , A(BsC n ) = = (AB)sC 1 , . . . , (AB)sC n = (AB)C. Z asociativního zákona (5.13) plyne, že výsledek součinu tří matic nezávisí na rozmístění závorek, které proto můžeme vynechat. Indukcí lze dokázat obdobné tvrzení i pro součin více než tří matic. Odtud speciálně vyplývá, že mocnina čtvercové matice Ak = AA A k je definována jednoznačně v tom smyslu, že nezáleží na ,,uzávorkování při jejím vyčíslení. Odtud bezprostředně plyne Ak+l = AA A AA A = AkAl. k l S použitím asociativního zákona můžeme upravit levou stranu rovnice (5.6) na -(C DC)x = c. Stojí za povšimnutí, že tento vztah nám umožňuje vyčíslit matici soustavy nezávisle na x, zatímco (5.6) nám umožňoval pouze ověřit, zda pro dané x platí příslušná rovnost. Úlohu jedničky při násobení matic má jednotková matice I = 1 0 . . . 0 0 1 . . . 0 ... ... ... ... 0 0 . . . 1 . 29 Kapitola 5. Násobení a transponování matic Jednotkovou matici řádu n značíme také In, avšak index obvykle vynecháváme, když ho můžeme určit z předpokladu, že daný maticový výraz má smysl. Jestliže A je libovolná matice, pak pro jednotkové matice příslušné dimenze platí AI = A (5.14.a) IA = A. (5.14.b) Například A i ai1 . . . aij . . . ain 1 j n I 1 1 0 ... ... j 1 ... ... n 0 1 j = aij. (5.15) Zatím jsme si ukázali pravidla pro počítání s maticemi, která jsou obdobná pravidlům pro počítání s čísly. To nás však nesmí vést k ukvapenému závěru, že se s maticemi počítá úplně stejně jako s čísly. Například pro A = 1 2 3 4 , B = 0 1 0 0 platí AB = 1 2 3 4 0 1 0 0 = 0 1 0 3 , BA = 0 1 0 0 1 2 3 4 = 3 4 0 0 , (5.16) takže AB = BA. Navíc platí B2 = 0 1 0 0 0 1 0 0 = O. (5.17) Pro násobení matic tedy neplatí komutativní zákon a mocnina nenulové matice může být nulová matice! 5.4 Transponované matice Porovnáme-li matice C a C v (5.5), zjistíme, že řádky matice C jsou tvořeny sloupci matice C a obráceně. Matici takto vytvořenou z dané matice nazýváme maticí transponovanou. Formálněji, k dané matici A typu (m, n) definujeme matici transponovanou A typu (n, m) předpisem A ij = A ji . (5.18) Například 1 2 3 4 5 6 = 1 4 2 5 3 6 . 30 5.5 Násobení a transponování blokových matic Snadno se ověří po složkách, že pro matice stejného typu platí: (A + B) = A + B (5.19.a) (A) = A (5.19.b) Například (A + B) ij = [A + B]ji = [A]ji + [B]ji = [A ]ij + [B ]ij. Jestliže je A matice typu (m, p) a B je matice typu (p, n), pak platí: (AB) = B A (!) (5.20) Na první pohled překvapivá identita plyne z toho, že transponováním se vymění řádky se sloupci, takže (AB) ij = [AB]ji = rA j sB i = sB i rA j = B A ij . 5.5 Násobení a transponování blokových matic Již v části 4.4 jsme viděli, že blokové matice lze sčítat podle stejných pravidel po prvcích i blocích. Ještě důležitější však je, že i pravidlo pro násobení matic lze pro blokové matice s vhodnou strukturou uplatnit po blocích. Například rovnost a11 a12 a13 a21 a22 a23 a31 a32 a33 x1 x2 x3 = (a11x1 + a12x2) + a13x3 (a21x1 + a22x2) + a23x3 (a31x1 + a32x2) + a33x3 můžeme zapsat pomocí označení B C D E = a11 a12 a13 a21 a22 a23 a31 a32 a33 a y z = x1 x2 x3 (5.21) ve tvaru B C D E y z = By + Cz Dy + Ez . Příklad lze zobecnit na vyčíslení součinu libovolných blokových matic. Jestliže A = A11 . . . A1p ... ... ... Am1 . . . Anp , B = B11 . . . B1n ... ... ... Bp1 . . . Bpn jsou dvě blokové matice rozdělené na bloky tak, že počet sloupců bloků Aik je stejný jako počet řádků bloků Bkj, pak se libovolný blok Cij součinu AB vyčíslí podle pravidla Cij = Ai1B1j + . . . + AipBpj. (5.22) Pravidlo pro transponování blokových matic lze snadno pochopit, když si prohlédneme, jak se transponují blokový vektor a bloková matice (5.21). Dostaneme y z = x1 x2 x3 = y z B C D E = a11 a21 a31 a12 a22 a32 a13 a23 a33 = B D C E . (5.23) Obecnou blokovou matici tedy transponujeme tak, že zaměníme řádky se sloupci a každý blok navíc transponujeme. 31 Kapitola 5. Násobení a transponování matic Příklady k procvičení: Cvičení 5.1. Nechť M = 3 0 0 1 , P = 0 1 1 0 , G = 1 0 3 1 , A = 1 2 3 4 . Vypočtěte MA, AM, PA, AP, AG, GA. Popište výsledky v termínech operací s řádky či sloupci matic. Cvičení 5.2. Vypočtěte CC pro matice ze vztahu (5.5) a porovnejte výsledek s maticí soustavy (1.5). 32 6. Inverzní matice V této kapitole se vrátíme k řešení soustav lineárních rovnic, avšak elementární úpravy z oddílu 2.2 budeme zapisovat pomocí maticových operací. Získáme tak nejen nový pohled na známé algoritmy, ale postupně se seznámíme s maticí, která se chová vzhledem k násobení matic jako převrácené nenulové číslo vzhledem k násobení čísel. 6.1 Maticový zápis elementárních úprav Nejprve si všimněme, že násobení maticí zleva lze popsat jako manipulaci s řádky násobené matice. Například pro matice T = [tij] a A = [aij] řádu dvě platí TA = t11 t12 t21 t22 rA 1 rA 2 = t11rA 1 + t12rA 2 t21rA 1 + t22rA 2 . (6.1) Vhodnou volbou T pak můžeme dosáhnout toho, aby matice A = TA byla právě maticí, která vznikne z A zvolenou elementární úpravou. Například matice T = 0 1 1 0 provede výměnu 1. a 2. řádku, tedy elementární úpravu (e1) z oddílu 2.2. K nalezení všech matic, které realizují elementární úpravy z 2.2, tedy výměnu řádků, násobení řádku nenulovým číslem a přičtení násobku některého řádku k jinému, stačí provést tyto úpravy na jednotkové matici I. Jestliže T je matice, která realizuje některou elementární transformaci, tj. A = TA vznikne z A nějakou pevně zvolenou elementární transformací, pak také I = TI = T vznikne z jednotkové matice I toutéž transformací. Například výměnu řádků v matici typu (2, n) realizuje matice, kterou dostaneme z jednotkové matice výměnou příslušných řádků, tedy 1 0 r2 0 1 r1 0 1 1 0 = I = T. Skutečně, 0 1 1 0 1 2 3 4 5 6 = 4 5 6 1 2 3 . Pro elementární úpravy matic typu n × m dostaneme následující tři matice řádu n: (r1) Výměna i-tého a j-tého řádku. I = i j 1 . . . 0 . . . 0 . . . 0 ... ... ... ... ... i 0 . . . 1 . . . 0 . . . 0 rj ... ... ... ... ... j 0 . . . 0 . . . 1 . . . 0 ri ... ... ... ... ... 0 . . . 0 . . . 0 . . . 1 i j 1 . . . 0 . . . 0 . . . 0 ... ... ... ... ... i 0 . . . 0 . . . 1 . . . 0 ... ... ... ... ... j 0 . . . 1 . . . 0 . . . 0 ... ... ... ... ... 0 . . . 0 . . . 0 . . . 1 = Pij (6.2) 33 Kapitola 6. Inverzní matice (r2) Násobení i-tého řádku nenulovým číslem . I = 1 . . . 0 . . . 0 ... ... ... ... i 0 . . . 1 . . . 0 ri ... ... ... ... 0 . . . 0 . . . 1 1 . . . 0 . . . 0 ... ... ... ... 0 . . . . . . 0 ... ... ... ... 0 . . . 0 . . . 1 = Mi() (6.3) (r3) Přičtení násobku i-tého řádku k j-tému řádku. I = i j 1 . . . 0 . . . 0 . . . 0 ... ... ... ... ... i 0 . . . 1 . . . 0 . . . 0 ... ... ... ... ... j 0 . . . 0 . . . 1 . . . 0 rj + ri ... ... ... ... ... 0 . . . 0 . . . 0 . . . 1 i j 1 . . . 0 . . . 0 . . . 0 ... ... ... ... ... i 0 . . . 1 . . . 0 . . . 0 ... ... ... ... ... j 0 . . . . . . 1 . . . 0 ... ... ... ... ... 0 . . . 0 . . . 0 . . . 1 = Gij() (6.4) Matice Pij se nazývá elementární permutační matice, zatímco Gij() se nazývá matice Gaussovy transformace. 6.2 Inverzní matice Definice: Nechť A je čtvercová matice. Jestliže existuje matice B tak, že AB = BA = I, (6.5) pak se matice B nazývá inverzní maticí k matici A. Čtvercová matice, ke které existuje inverzní matice, se nazývá regulární. V opačném případě takovou matici nazýváme singulární. Věta: Ke každé regulární matici A existuje právě jedna inverzní matice. Důkaz: Nechť A je regulární a nechť B1, B2 jsou inverzní matice k matici A, takže platí AB1 = I a B2A = I. (6.6) Vynásobíme-li první rovnost zleva maticí B2 a druhou rovnici zprava B1, dostaneme B2 = B2AB1 = B1. (6.7) Jedinou inverzní matici k dané regulární matici A budeme nadále značit A-1. V obecném případě je poměrně obtížné rozhodnout, je-li daná matice regulární nebo singulární. Jestliže však má daná matice celý řádek nulový, pak je určitě singulární, neboť má-li matice A nulový řádek a je-li B libovolná matice, pak platí AB = . . . . . 0 . . . 0 . . . . . = I. (6.8) 34 6.3 Elementární úpravy a regularita 6.3 Elementární úpravy a regularita Nyní si ukážeme, že elementárními úpravami se zachovává regularita matic. Nejprve si všimneme, že jsou-li matice A, B regulární, potom je také matice AB regulární a platí (AB)-1 = B-1A-1, (6.9) neboť ABB-1A-1 = B-1A-1AB = I. Vztah (6.9) lze pomocí matematické indukce zobecnit na (A1 Ak)-1 = A-1 k A-1 1 . (6.10) Dále si všimneme, že matice elementárních transformací jsou regulární. Příslušné inverzní matice najdeme tak, že sestrojíme matice ekvivalentních úprav, které převádí upravenou soustavu na původní a jsou popsány na konci oddílu 2.1. Dostaneme vzorce P-1 ij = Pij, M-1 i () = Mi(-1 ) pro = 0, G-1 ij () = Gij(-). (6.11) K matici každé elementární transformace T tedy existuje inverzní matice T-1. Jestliže matice A vznikne z regulární matice A elementárními řádkovými úpravami, pak A = Tk T1A a z (6.10) dostaneme A -1 = A-1T-1 1 T-1 k , tedy A je regulární. 6.4 Výpočet inverzní matice Věta: Nechť A je čtvercová matice řádu n. Pak rovnice AX = I (6.12) má jediné řešení X právě tehdy, když A je regulární. V tom případě platí X = A-1. Důkaz: Jestliže A je regulární, pak přenásobením obou stran rovnice (6.12) zleva maticí A-1 dostaneme X = A-1. Obráceně, jestliže rovnice AX = I má jediné řešení, pak rozšířenou matici A I je možno pomocí ekvivalentních řádkových úprav převést na tvar I B . Podle pravidel z oddílu 6.1 potom existují elementární matice transformací T1, . . . , Tk tak, že pro matici T = Tk T1 platí T A I = I B . (6.13) Roznásobíme-li matice vlevo podle pravidla o násobení blokových matic (5.22), dostaneme porovnáním obou částí rozšířené matice TA = I, T = B, (6.14) BA = I. (6.15) Jelikož matice I B vznikla z A I ekvivalentními řádkovými úpravami, má rovnice (6.12) jediné řešení X, které je řešením soustavy IX = B, tedy X = B a AB = I. 35 Kapitola 6. Inverzní matice Právě dokázaná věta redukuje výpočet inverzní matice na řešení rovnice (6.12) s několika pravými stranami. Příklad 6.1. Zjistěte, zda existuje inverzní matice k matici A = 2 -1 -1 2 . (6.16) Jestliže ano, vypočtěte A-1. Řešení: Postupnou úpravou rozšířené matice pro soustavu AX = I dostaneme A I = 2 -1 1 0 -1 2 0 1 r2 + 1 2r1 2 -1 1 0 r1 + 2 3r2 0 3 2 1 2 1 2 0 4 3 2 3 1 2r1 0 3 2 1 2 1 2 3r2 1 0 2 3 1 3 0 1 1 3 2 3 = I A-1 . Matice A je tedy regulární a platí A-1 = 1 3 2 1 1 2 . (6.17) 6.5 Inverzní matice a řešení soustav Nechť A je daná regulární matice. Vynásobíme-li soustavu Ax = b maticí A-1 zleva, dostaneme x = A-1 (Ax) = A-1 b. Odtud a z jednoznačnosti inverzní matice vyplývá důležitá věta: Věta: Nechť A je regulární matice a nechť b je sloupcový vektor stejného řádu. Pak má soustava Ax = b jediné řešení x = A-1b. Příklad 6.2. Najděte řešení soustavy 2x1 - x2 = 1 -x1 + 2x2 = 2 (6.18) pomocí inverzní matice. Řešení: Soustavu (6.18) lze zapsat maticově ve tvaru 2 -1 -1 2 x1 x2 = 1 2 . S využitím výsledku (6.17) příkladu 6.1 dostaneme x1 x2 = 1 3 2 1 1 2 1 2 = 1 3 4 5 . 36 6.6 Vyčíslení výrazů s inverzní maticí 6.6 Vyčíslení výrazů s inverzní maticí Při vyčíslení výrazů s inverzní maticí je většinou výhodné vyhnout se explicitnímu vyjádření inverzní matice tím, že se vyčíslení součinu inverzní matice s vektorem či maticí převede na řešení soustavy lineárních rovnic. Příklad 6.3. Nechť A = 2 -1 -2 2 , B = 1 2 3 4 , b = 1 1 . Vyčíslete A-1Bb. Řešení: Nejprve vypočteme vektor c = Bb = 3 7 . Vektor x = A-1c je jediným řešením rovnice Ax = c, kterou vyřešíme Gaussovou eliminací 2 -1 3 -2 2 7 r1 + r2 2 -1 3 0 1 10 , odkud x1 = 13 2 , x2 = 10. Tedy A-1 Bb = 13 2 10 . Poznámka: Násobení matic je sice asociativní, takže platí (A-1 B)b = A-1 (Bb), avšak pracnost vyčíslení obou výrazů je rozdílná! 6.7 Použití inverzní matice Rozborem počtu operací zjistíme, že k výpočtu inverzní matice řádu n je třeba asi n3 násobení. Srovnáme-li toto číslo s počtem násobení potřebným k řešení soustavy Gaussovou eliminací uvedeným v oddílu 2.7, dojdeme k závěru, že se inverzní matici nevyplatí používat pro řešení jedné soustavy rovnic, avšak může se vyplatit při řešení soustavy s větším počtem pravých stran, neboť je-li inverzní matice k dispozici, je pak k vlastnímu řešení zapotřebí pouze n2 operací. V kapitole 7 si však ukážeme algoritmus, se kterým lze dosáhnout stejného výsledku za nejméně polovičních nákladů na přípravu řešení. Inverzní matice je tedy spíš důležitý teoretický nástroj pro řešení technických problémů než prostředek k efektivnímu provádění numerických výpočtů. 37 Kapitola 6. Inverzní matice Příklady k procvičení: Cvičení 6.1. Napište matice P23, M2(3) a G23(4) (viz oddíl 6.1) pro elementární transformace matic, které mají 3 řádky a ověřte si jejich účinek na matici A = 1 2 2 4 4 8 . Cvičení 6.2. Vypište matice elementárních transformací, které realizují elementární úpravy v příkladu 6.1. Cvičení 6.3. Nechť L = 1 0 0 1 2 0 1 2 3 a U = L . Vypočtěte L-1, U-1 a rozhodněte, zda L -1 = L-1 . Cvičení 6.4. Vypočtěte A-1 pro A = 2 1 0 1 2 1 0 1 2 . Povšimněte si zaplnění inversní matice nenulovými prvky ve srovnání s původní maticí. Cvičení 6.5. Dokažte, že pro libovolnou regulární matici A platí A -1 = A-1 . Nápověda: Stačí ověřit, že A-1 A = I. 38 7. Trojúhelníkový rozklad Pokračováním úvah z kapitoly 6 si nyní ukážeme, že každou regulární matici můžeme zapsat jako součin tří matic, pro které se snadno řeší soustavy lineárních rovnic. Narozdíl od kapitoly 6 nevystačíme s řádkovými úpravami, ale budeme potřebovat také výměny sloupců. 7.1 Permutační matice Matice P se nazývá permutační matice, je-li možno P získat z jednotkové matice I stejného typu postupnou výměnou řádků. Jelikož výměnu i-tého a j-tého řádku dané matice můžeme provést tak, že tuto matici vynásobíme zleva elementární permutační maticí Pij (viz. (6.2)), je možno každou permutační matici P zapsat ve tvaru P = Pikjk Pi1j1I = Pikjk Pi1j1. (7.1) Například matici P = 0 1 0 0 0 1 1 0 0 můžeme získat z jednotkové matice výměnami I = 1 0 0 r3 0 1 0 0 0 1 r1 0 0 1 r2 0 1 0 r1 1 0 0 0 1 0 0 0 1 1 0 0 = P, takže P můžeme zapsat ve tvaru P = P12P13I = P12P13. Z rozkladu (7.1), ze zřejmé rovnosti Pij = P ij, dále z P-1 ij = Pij (viz. (6.11)) a pomocí (5.20) dostaneme pro P ve tvaru (7.1) PP = Pikjk Pi1j1(Pikjk Pi1j1) = Pikjk Pi1j1P i1j1 P ikjk = Pikjk Pi1j1Pi1j1 Pikjk = I, takže P-1 = P . (7.2) Elementární permutační matice Pij můžeme také použít k výměně i-tého a j-tého sloupce. K tomu stačí násobit maticí Pij zprava. Například vynásobíme-li matici A = [aij] řádu 2 maticí P12 zprava, dostaneme AP12 = a11 a12 a21 a22 0 1 1 0 = a12 a11 a22 a21 = sA 2 , sA 1 . K odvození obecného pravidla můžeme použít transponování. 39 Kapitola 7. Trojúhelníkový rozklad 7.2 Trojúhelníkové matice Čtvercová matice L(U) se nazývá dolní (horní) trojúhelníková matice, jestliže má nad (pod) diagonálou všechny prvky nulové. Pro prvky lij dané dolní trojúhelníkové matice L tedy platí lij = 0 pro i < j, zatímco pro prvky uij dané horní trojúhelníkové matice U platí uij = 0 pro i > j. Matice L je tedy dolní trojúhelníková, právě když L je horní trojúhelníková matice. Snadno se ověří, že součin dvou trojúhelníkových matic stejného typu je trojúhelníková matice téhož typu. Jsou-li například L = [lij] a M = [mij] dvě dolní trojúhelníkové matice a i < j, pak [LM]ij = li1m1j + . . . + linmnj = li1 0 + . . . + lii 0 + 0 mi i+1 + . . . + 0 min = 0, takže LM je také dolní trojúhelníková matice. Budeme potřebovat ještě jedno méně zřejmé pozorování. Věta: Nechť L = [lij] je čtvercová dolní trojúhelníková matice s nenulovými diagonálními prvky. Pak L je regulární a L-1 je dolní trojúhelníková matice. Důkaz: Je-li L dolní trojúhelníková matice s nenulovými prvky na diagonále, pak existují matice elementárních operací Tp = Gipjp(p) s ip > jp, případně Tp = Mip(l-1 ipip ) tak, že pro matici T = Tk T1 platí T L I = I B . Porovnáním levých částí příslušných matic dostaneme TL = I. Podle věty 6.4 tedy platí L = T-1, odkud LT = I a T = L-1. Jelikož všechny matice Ti jsou dolní trojúhelníkové, je také matice L-1 = T = Tk T1 dolní trojúhelníková matice. 7.3 Trojúhelníkový (LU) rozklad Věta: (o existenci LU rozkladu). Nechť A je regulární čtvercová matice. Pak existuje dolní trojúhelníková matice L, horní trojúhelníková matice U a permutační matice P tak, že AP = LU. (7.3) Matice L, U jsou regulární. Důkaz: Nechť A = [aij] je čtvercová matice řádu n. Z regulárnosti matice A a z (6.8) plyne, že existuje i1 tak, že a1i1 = 0, takže A = AP1i1 má v levém horním rohu nenulový prvek a11 = a1i1. Nyní si všimněme, že první krok úpravy matice A, který známe z Gaussovy elimimace, můžeme zapsat ve tvaru L1AP1i1 = A1, (7.4) 40 7.4 Výpočet LU rozkladu kde A1 = a11 a12 . . . a1n 0 a1 22 . . . a1 2n ... ... ... ... 0 a1 n2 . . . a1 nn = a1 11 a1 12 . . . a1 1n 0 a1 22 . . . a1 2n ... ... ... ... 0 a1 n2 . . . a1 nn (7.5) a L1 = G1n(-an1/a11) G12(-a21/a11) (7.6) je dolní trojúhelníková matice, neboť je vyjádřena jako součin dolních trojúhelníkových matic. Matice A1 je zřejmě součinem regulárních matic, takže podle (6.10) je A1 také regulární a existuje 2 i2 tak, že a1 2i2 = 0. Matice A1 = A1P2i2 má tedy nenulový prvek a22 a stejný první sloupec jako matice A1. Opakováním tohoto postupu dosáhneme toho, že LAP = U, (7.7) kde U = an-1 11 an-1 12 . . . an-1 1n 0 an-1 22 . . . an-1 2n ... ... ... ... 0 0 . . . an-1 nn = An-1 (7.8) a P = P1i1 Pn-1 in-1, L = Ln-1 L1. (7.9) Zřejmě P je permutační matice a L je dolní trojúhelníková matice, neboť každá matice Li je součinem dolních trojúhelníkových matic Gij(-ai-1 ji /ai-1 ii ) s i < j. Přenásobíme-li (7.7) zleva maticí L = L-1, dostaneme AP = LU. Matice L je podle věty 7.2 regulární dolní trojúhelníková matice, neboť je inverzní k dolní trojúhelníkové matici L, a matice P je zřejmě permutační matice. Jelikož matice Ai jsou regulární, je podle (7.8) také matice U regulární. Vyjádření matice ve tvaru součinu (7.3) se nazývá LU rozklad podle počátečních písmen anglických slov Lower (dolní) a Upper (horní). Přenásobíme-li (7.3) zprava maticí P = P, dostaneme vyjádření A ve tvaru A = LUP (7.10) s permutační maticí P. Matice L, U a P nejsou určeny jednoznačně. 7.4 Výpočet LU rozkladu Rozbor důkazu věty o existenci trojúhelníkového rozkladu nám dává návod k instruktivnímu výpočtu tohoto rozkladu. Stačí postupně upravovat matici A I na tvar U L obdobně, jako jsme to dělali ve 2. kapitole, avšak bez použití výměny řádků. Tím dosáhneme toho, že matice L bude dolní trojúhelníková. Je-li to nutné, provádíme místo výměny řádků výměny sloupců, které neprovádíme jen na matici A, ale také zvlášť na další jednotkové matici, která se postupně transformuje na P. Dolní trojúhelníkovou matici L dostaneme inverzí matice L, tedy s pomocí elementárních řádkových operací, které převedou matici L I na I L . 41 Kapitola 7. Trojúhelníkový rozklad Příklad 7.1. Najděte trojúhelníkový rozklad matice A = 0 -1 2 -1 2 -1 2 -1 0 . (7.11) Řešení: * Sledování výměn sloupců: I = 1 0 0 0 1 0 0 0 1 s3 s1 0 0 1 0 1 0 1 0 0 = P = P * Úprava A I U L : A I = A I 0 -1 2 1 0 0 -1 2 -1 0 1 0 2 -1 0 0 0 1 s3 s1 2 -1 0 1 0 0 -1 2 -1 0 1 0 2r2 + r1 0 -1 2 0 0 1 2 -1 0 1 0 0 0 3 -2 1 2 0 0 -1 2 0 0 1 3r3 + r2 U L 2 -1 0 1 0 0 0 3 -2 1 2 0 0 0 4 1 2 3 = = U L * Úprava L I I L : L I = L I 1 0 0 1 0 0 1 2 0 0 1 0 r2 - r1 1 2 3 0 0 1 r3 - r1 1 0 0 1 0 0 0 2 0 -1 1 0 0 2 3 -1 0 1 r3 - r2 1 0 0 1 0 0 0 2 0 -1 1 0 1 2r2 0 0 3 0 -1 1 1 3r3 I L 1 0 0 1 0 0 0 1 0 -1 2 1 2 0 0 0 1 0 -1 3 1 3 = I L * Odtud L = 1 0 0 -1 2 1 2 0 0 -1 3 1 3 , U = 2 -1 0 0 3 -2 0 0 4 , P = 0 0 1 0 1 0 1 0 0 . (7.12) 42 7.5 Řešení soustav pomocí LU rozkladu Přímým výpočtem si můžeme ověřit, že platí AP = LU a A = LUP. 7.5 Řešení soustav pomocí LU rozkladu Řešení soustav pomocí trojúhelníkového rozkladu spočívá v postupném řešení soustav s maticemi L, U a P. Jestliže tedy A = LUP, pak místo soustavy Ax = b budeme řešit soustavu L U Px = b tak, že postupně vyřešíme Lz = b, Uy = z, Px = y. (7.13) Příklad 7.2. Využijte rozkladu (7.12) matice (7.11) k řešení soustavy: -x2 + 2x3 = 1 -x1 + 2x2 - x3 = 1 2x1 - x2 = 1 Řešení: Nejprve řešíme soustavu Lz = b, tedy z1 = 1 -1 2z1 + 1 2z2 = 1 - 1 3z2 + 1 3z3 = 1, odkud z1 = 1, z2 = 3, z3 = 6. Potom vyřešíme soustavu Uy = z, tedy 2y1 - y2 = 1 3y2 - 2y3 = 3 4y3 = 6. Odtud y1 = 3 2, y2 = 2, y3 = 3 2. Konečně určíme x ,,řešením Px = y nebo z x = Py, takže x1 = 3 2, x2 = 2, x3 = 3 2. Poznámka: Pokud hodláme použít LU rozklad k řešení soustav, není třeba vyčíslit matici L explicitně. Vystačíme totiž s maticí L = L-1, s jejíž pomocí vypočítáme z v (7.13) ze vztahu z = Lb. 43 Kapitola 7. Trojúhelníkový rozklad 7.6 Použití LU rozkladu Lze ukázat, že k výpočtu LU rozkladu čtvercové matice A řádu n stačí asi 1 2n3 násobení, což je asi polovina počtu násobení potřebného k výpočtu inverzní matice. Máme-li LU rozklad, můžeme získat řešení soustavy Ax = b pomocí n2 násobení, stejně jako u inverzní matice. Použití LU rozkladu je tedy efektivnější nástroj pro řešení soustav lineárních rovnic s více pravými stranami než inverzní matice. Tento rozdíl se může ještě drasticky zvětšit, má-li matice A mnoho nulových prvků, neboť při úpravě se trojúhelníkové faktory zaplňují nenulovými prvky méně než inverzní matice. Trojúhelníkový rozklad je také důležitý nástroj teorie matic. Příklady k procvičení: Cvičení 7.1. Najděte LU rozklad symetrické matice A = 2 -1 0 -1 2 -1 0 -1 2 a porovnejte rozložení nul v obou trojúhelníkových faktorech a v matici A. Cvičení 7.2. Využijte rozkladu z předchozího cvičení k řešení soustavy 2x1 - x2 = 1 -x1 + 2x2 - x3 = 1 - x2 + 2x3 = 2. 44 Část II Vektorové prostory 8. Algebraické operace a struktury 9. Vektorové prostory 10. Lineární nezávislost a báze 11. Souřadnice 12. Dimenze a řešení soustav 8. Algebraické operace a struktury V předchozích kapitolách jsme se seznámili s různými pravidly, které dvěma prvkům jedné množiny přiřazují nějaký prvek téže množiny. Jako příklad uveďme sčítání aritmetických vektorů nebo násobení čtvercových matic. Ukazuje se, že tato pravidla mají některé vlastnosti, které lze studovat společně bez ohledu na objekty, kterých se týkají, a že výsledky tohoto studia lze pak aplikovat na řešení nejrůznějších konkrétních problémů. Pro studium těchto pravidel si nejprve zavedeme abstraktní pojem operace, a pak si rozebereme některé vlastnosti, které operace může mít. Nakonec se seznámíme s některými algebraickými strukturami, což je abstrakce umožňující pochopit obecné zákonitosti počítání s nejrůznějšími objekty, jako například s čísly, maticemi nebo zobrazeními. 8.1 Algebraické operace Definice: (Binární) algebraická operace na neprázdné množině A je zobrazení : A × A (a, b) a b A. Operace na množině A tedy každé uspořádané dvojici (a, b) A × A prvků a, b A přiřazuje jednoznačně určený prvek a b A. Jako příklad algebraické operace si uveďme sčítání + definované na množině reálných čísel R, které například dvojici (2, 3) R × R přiřazuje prvek 2 + 3 = 5 R. Jiné příklady algebraických operací jsou sčítání reálných aritmetických vektorů stejné dimenze nebo násobení komplexních čtvercových matic stejného řádu. Důležitý příklad algebraické operace je skládání zobrazení definované na množině všech zobrazení Z(A) dané množiny A do sebe. Tato operace přiřazuje každé uspořádané dvojici zobrazení (f, g) Z(A) × Z(A) složené zobrazení f g Z(A) definované pro každé x A předpisem (f g)(x) = f g(x) . Jestliže například f Z(R) a g Z(R) jsou definovány předpisem f(x) = x2 a g(x) = = x2 + 1, pak (f g)(x) = f g(x) = x2 + 1 2 . Všimněme si, že násobení aritmetického vektoru skalárem není operací na množině v našem smyslu, neboť nepřiřazuje vektor dvojici vektorů, ale skaláru a vektoru. 8.2 Asociativní operace Definice: Algebraická operace na množině A je asociativní, jestliže pro libovolné prvky a, b, c množiny A platí a (b c) = (a b) c. (8.1) Operace sčítání a násobení čísel jsou dobře známé asociativní operace, stejně jako sčítání aritmetických vektorů stejné dimenze nebo násobení čtvercových matic stejného 47 Kapitola 8. Algebraické operace a struktury řádu. Také operace skládání zobrazení množiny A do sebe je asociativní, neboť podle definice složeného zobrazení platí pro každé x A a f, g, h Z(A) (f g) h (x) = f g h(x) = f g h(x) , f (g h) (x) = f (g h)(x) = f g h(x) , takže (f g) h (x) = f (g h) (x). Poslední rovnost znamená, že zobrazení f (g h) i (f g) h přiřazují každému x A tentýž prvek, takže platí f (g h) = (f g) h. Operace definovaná na množině všech přirozených čísel N předpisem : N × N (a, b) ab N není asociativní, neboť 2 (3 2) = 2(32 ) = 29 a (2 3) 2 = 23 2 = 26 . Je-li asociativní operace na množině A, pak lze u výrazu (8.1) vynechat závorky. Výraz a b c lze potom vyčíslit buď jako (a b) c nebo a (b c). Dá se dokázat, že pro asociativní operace není potřeba používat závorky vůbec. Například pro každou asociativní operaci platí (a b) c d = a b (c d) , neboť (a b) c d = a (b c) d = a (b c) d = a b (c d) . 8.3 Komutativní operace Definice: Algebraická operace na množině A se nazývá komutativní, jestliže pro každé a, b A platí a b = b a. Příklady komutativních operací jsou sčítání čísel, aritmetických vektorů stejné dimenze nebo matic stejného typu. Naopak násobení čtvercových matic řádu většího než jedna není komutativní, jak je patrné z příkladu (5.16). Snadno se můžeme přesvědčit, že ani operace definovaná v oddílu 8.2 není komutativní, neboť 2 3 = 23 = 32 = 3 2. Pokud je počet prvků množiny A větší než jedna, není ani operace skládání zobrazení množiny A do sebe komutativní. Jestliže totiž v dané množině A existují prvky a, b A, a = b, pak například pro zobrazení f : A x a a g : A x b a pro každé x A platí (f g)(x) = a = b = (g f)(x), tedy f g = g f. 48 8.4 Neutrální prvek 8.4 Neutrální prvek Definice: Prvek e A nazýváme neutrálním prvkem vzhledem k operaci definované na množině A, jestliže pro každé a A platí a e = e a = a. Například prvek 0 je neutrálním prvkem vzhledem ke sčítání reálných nebo komplexních čísel. Prvek 1 je zase neutrálním prvkem vzhledem k násobení reálných nebo komplexních čísel. Jednotková matice I daného řádu je neutrálním prvkem vzhledem k násobení čtvercových matic stejného řádu. Existuje také neutrální prvek vzhledem k operaci skládání všech zobrazení množiny A do sebe. Je jím identické zobrazení idA množiny A, neboť pro každé f : A A a x A platí idA f (x) = idA f(x) = f(x), f idA (x) = f idA(x) = f(x), takže f = f idA = idA f. Poznámka: Neutrální prvek musí splňovat obě rovnosti uvedené v definici. Například pro výše uvedenou operaci umocňování přirozených čísel platí a 1 = a, avšak 1 a = 1, takže 1 není neutrálním prvkem vzhledem k operaci . Na první pohled není jasné, jestli nemůže být více neutrálních prvků vzhledem k nějaké operaci. Následující věta dává úplnou odpověď na tuto otázku. Věta: Nechť je algebraická operace na množině A a nechť e1, e2 A jsou neutrální prvky vzhledem k operaci . Potom e1 = e2. Důkaz: Podle definice neutrálního prvku e1 = e1 e2 = e2. 8.5 Inverzní prvek Definice: Nechť je algebraická operace na množině A, nechť e A je neutrální prvek vzhledem k a nechť a A. Prvek b A nazýváme levým inverzním prvkem k prvku a, jestliže b a = e, pravým inverzním prvkem k prvku a, jestliže a b = e, a inverzním prvkem k prvku a, jestliže a b = b a = e. 49 Kapitola 8. Algebraické operace a struktury Pro každé reálné číslo a R je -a inverzní prvek vzhledem ke sčítání, neboť 0 je neutrální prvek vzhledem ke sčítání a (-a)+a = a+(-a) = 0. Ke každé regulární matici A existuje také inverzní prvek vzhledem k násobení matic. Je jím inverzní matice A-1, neboť jednotková matice I je neutrálním prvkem vzhledem k násobení matic a A-1A = = AA-1 = I. Naopak k prvku 0 neexistuje inverzní prvek ani vzhledem k násobení reálných čísel, ani vzhledem k násobení komplexních čísel, neboť rovnice 0 x = 1 nemá žádné reálné ani komplexní řešení. Podívejme se nyní na inverzní prvky vzhledem ke skládání zobrazení množiny A do sebe. Nechť f, g Z(A). Jestliže f g = idA, potom f je zobrazení na A, neboť libovolný prvek a A lze vyjádřit ve tvaru a = idA(a) = (f g)(a) = f g(a) , tedy jako obraz prvku g(a) A při zobrazení f. Zobrazení g je přitom nutně prosté, neboť pro libovolné a, b A by z g(a) = g(b) plynulo a = idA(a) = (f g)(a) = f g(a) = f g(b) = (f g)(b) = idA(b) = b. Zobrazení f Z(A) má tedy inverzní zobrazení ve smyslu definice inverzního prvku 8.5, právě když f je vzájemně jednoznačné. Poznámka: Pokud je A nekonečná množina, existují v Z(A) prvky, které mají jen levý nebo pravý inverzní prvek, ale nemají inverzní prvek. Například zobrazení f : N k k + 1 N a g : N k max{k - 1, 1} N splňují g f = id, neboť pro k N (g f)(k) = g f(k) = g(k + 1) = k = id(k), avšak (f g)(1) = f g(1) = f(1) = 2, takže f g = id. 8.6 Grupa Množina spolu s jednou či více operacemi, které splňují předepsané vlastnosti, tvoří algebraickou strukturu. Zde se seznámíme s důležitou algebraickou strukturou s jednou operací, která se nazývá grupa. Grupy se v matematice objevily při studiu teorie čísel, v geometrii a při řešení algebraických rovnic. Netriviální technické aplikace využívající poznatků o struktuře grup zahrnují kódování nebo krystalografii. Definice: Množina G s operací se nazývá grupa, jestliže: (G1) je asociativní operace na G. (G2) Existuje e G tak, že pro každé a G platí a e = e a = a. (G3) Ke každému a G existuje prvek b G tak, že a b = b a = e. Grupa je tedy určena uspořádanou trojicí (G, , e), kde G je množina, je asociativní operace na G, a e G je neutrální prvek vzhledem k operaci . 50 8.6 Grupa Jako příklady grup nám mohou sloužit (R, +, 0) a (C \ {0}, , 1). Regulární čtvercové matice stejného řádu tvoří vzhledem k násobení matic také grupu, jejíž jednotkový prvek je identická matice I. Snadno se ověří, že pokud A má více než jeden prvek, pak Z(A), , id netvoří grupu, avšak podmnožina Z(A) sestávající ze všech vzájemně jednoznačných zobrazení grupu tvoří. Obdobně jako u jednotkového prvku vzniká otázka, zda k některému prvku nemůže existovat více než jeden inverzní prvek. Vyjasníme si tento problém současně s otázkami týkajícími se řešení rovnic. Věta: Nechť (G, , e) je grupa. Potom platí následující tvrzení: (i) Ke každému prvku a G existuje právě jeden inverzní prvek a-1. (ii) Nechť a, b, c G. Jestliže a b = a c nebo b a = c a, pak b = c. (iii) Nechť a, b G. Potom existuje jediné x G tak, že platí a x = b a jediné y G tak, že y a = b. Důkaz: (i) Nechť a, b, c G, a b = b a = e a a c = c a = e. Pak b = b e = b (a c) = (b a) c = e c = c. (ii) Nechť a, b, c G a třeba a b = a c. Pak a-1 (a b) = a-1 (a c). Upravíme-li obě strany rovnice použitím asociativity, dostaneme (a-1 a) b = (a-1 a) c. Výraz v závorce je ovšem neutrální prvek, takže výsledkem je b = e b = e c = c. (iii) Nechť a, b G. Pro x = a-1 b platí a x = a (a-1 b) = (a a-1 ) b = e b = b, takže x = a-1 b je řešením rovnice a x = b. Nechť x1 a x2 jsou řešení rovnice a x = b, tj. a x1 = b a a x2 = b. Pak platí a x1 = a x2 a podle tvrzení (ii) tedy x1 = x2. Cvičení 8.1. Nechť (G, , e) je grupa a nechť a, b G. Ověřte, že (ab)-1 = b-1a-1. S pojmem grupa jsou spojeny některé konvence v terminologii a v označení. Grupa (G, , e) se nazývá komutativní, jestliže je operace komutativní. Operace v komutativní grupě se často označuje znaménkem +, i když se může jednat o úplně jinou operaci než sčítání čísel. Při takovém zápisu, který nazýváme aditivní, mluvíme místo o neutrálním prvku o nulovém prvku, který také označujeme pomocí nuly. Při této konvenci se inverzní prvek k prvku a zapisuje -a. Znak operace se také často zapisuje pomocí tečky nebo se v příslušných výrazech zcela vynechává. V takovém případě mluvíme o multiplikativním zápisu, neutrální prvek značíme jedničkou a inverzní prvek k prvku a značíme 1 a nebo a-1. Někdy se také používá názvu aditivní grupa pro grupu zapsanou v aditivním zápisu a multiplikativní grupa pro grupu zapsanou v multiplikativním zápisu. 51 Kapitola 8. Algebraické operace a struktury 8.7 Komutativní těleso Nyní se seznámíme s algebraickou strukturou se dvěma operacemi, které mají obdobné vlastnosti jako sčítání a násobení na některých číselných množinách. Definice: Komutativní těleso (T, +, 0, , 1) je množina, na níž jsou definovány dvě binární algebraické operace + a , které splňují následující axiomy: (T1) (T, +, 0) je komutativní grupa. (T2) (T \ {0}, , 1) je komutativní grupa. (T3) Pro každé a, b, c T platí distributivní zákon a(b + c) = ab + ac. (T4) 0 = 1. Množina všech reálných čísel spolu s operacemi sčítání a násobení je tedy těleso, stejně jako množina všech komplexních čísel C spolu s operacemi sčítání a násobení. V některých aplikacích, jako například v kódování, se můžete setkat s konečnými tělesy. Nejjednodušším příkladem je těleso ({0, 1}, +, 0, , 1) s operacemi, které jsou definovány tabulkami: + 0 1 0 0 1 1 1 0 0 1 0 0 0 1 0 1 I pro obecné těleso lze dokázat některé další vlastnosti, které platí pro počítání s čísly. Například v tělese platí 0 1 = 0, neboť 0 = 1 + (-1) = 1 1 + (-1) 1 = 1 + (-1) 1 = 0 1. Vzhledem k tomu, že v dalším výkladu budeme pracovat jen s tělesy reálných a komplexních čísel, budeme používat známá pravidla pro násobení a sčítání bez důkazů. 52 9. Vektorové prostory Ve 3. kapitole jsme se seznámili s aritmetickými vektory, které jsme si ve zvláštních případech mohli znázornit šipkami, takže jsme si je byli schopni představit. Pro aritmetické vektory jsme definovali skládání (sčítání) a násobení skalárem, které splňovaly určitá pravidla. Nyní si pojem vektoru zobecníme ještě více, takže náš nový pojem vektoru bude zahrnovat nejen aritmetické vektory a tím i ,,staré známé šipky , ale také jiné objekty, jako například matice a funkce. Ukazuje se, že alespoň v matematice není podstatné to, co konkrétně považujeme za vektory, ale jaká pravidla splňují operace s nimi. Rozšíření pojmu vektoru nám bude sloužit jako opora naší intuice. 9.1 Vektorový prostor Definice: Vektorový prostor nad komutativním tělesem (T, +, 0, , 1) je komutativní grupa (V, +, o) a zobrazení T × V (, v) v V, které nazýváme násobení skalárem, přičemž pro libovolné , T a u, v V platí: (V1) (u + v) = u + v (V2) ( + )u = u + u (V3) (u) = ()u (V4) 1u = u V definici vektorového prostoru má znak + dva různé významy, které však vždy dokážeme rozlišit podle operandů. Prvky tělesa T nazýváme skaláry, prvky grupy V vektory. Jestliže T = R, mluvíme o reálném vektorovém prostoru, jestliže T = = C, mluvíme o komplexním vektorovém prostoru. V dalším výkladu budeme předpokládat, pokud nebude uvedeno jinak, že T je těleso reálných čísel, nebo těleso komplexních čísel. Pokud budeme dále stručně mluvit jen o vektorovém prostoru, budeme předpokládat, že skaláry jsou prvky jednoho z uvedených číselných těles. Příklad 9.1. Reálné aritmetické vektory daného řádu n se sčítáním vektorů a s násobením skalárem po složkách tvoří reálný vektorový prostor. Jeho nulový prvek je o = = [0, . . . , 0], pro a = [a1, . . . , an] je inverzním prvkem -a = [-a1, . . . , -an]. Pro n = 1 je množina skalárů i vektorů stejná. Příklad 9.2. Množina F všech reálných funkcí s operací + definovanou pro každé reálné x rovností (f + g)(x) = f(x) + g(x) a s násobením skalárem, které pro každé R a f F definuje funkci f F rovností (f)(x) = f(x), tvoří reálný vektorový prostor. Nulový prvek o tohoto prostoru je dán předpisem o(x) = 0, prvek opačný k f je definován pomocí (-f)(x) = -f(x). 53 Kapitola 9. Vektorové prostory 0 0.2 0.4 0.6 0.8 1 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 x y y = g(x) y = f(x) y = f(x) + g(x) Obr. 9.1: Součet funkcí f(x) = 1 4x2 + 1 8 a g(x) = 1 2 definovaných na intervalu [0,1]. 9.2 Rovnosti odvozené z axiomů Axiomy vektorového prostoru jsou vybrány tak, aby pro abstraktní vektory platila všechna tvrzení, která jsou zřejmá pro šipky. Některá taková tvrzení si na ukázku dokážeme v následující větě. Věta: Nechť V je vektorový prostor s nulovým prvkem o, u V a nechť je libovolný skalár. Pak platí následující rovnosti: (i) 0u = o (9.1) (ii) o = o (9.2) (iii) (-1)u = -u (9.3) Důkaz: Bez bližší specifikace budeme používat vlastnosti tělesa a použití axiomů grupy nebo axiomů vektorového prostoru vyznačíme odkazy nad rovnostmi. (i) 0u (G2) = 0u + o (G3) = 0u + 0u + -(0u) (G1) = (0u + 0u) + -(0u) = (V 2) = (0 + 0)u + -(0u) = 0u + -(0u) (G3) = o. (ii) Použijeme-li (i) pro u = o, dostaneme 0o = o, takže o = (0o) (V 3) = (0)o = 0o = o. (iii) u + (-1)u (V 4) = 1u + (-1)u (V 2) = 1 + (-1) u = 0u (i) = o. 54 9.3 Podprostory 9.3 Podprostory Definice: Neprázdná množina U V je podprostorem vektorového prostoru V, jestliže U je vektorový prostor vzhledem ke sčítání vektorů a násobení skalárem v prostoru V. K tomu, aby U V byl podprostorem vektorového prostoru V stačí, aby U byla uzavřená vzhledem ke sčítání vektorů a násobení skalárem, tedy aby pro libovolné dva prvky u, v U a pro libovolný skalár platilo u + v U a u U. Z posledního předpokladu totiž plyne 0u U i (-1)u U, takže podle (9.1) a (9.3) také nulový prvek o = 0u i opačný prvek -u = (-1)u patří do U, přičemž je zřejmé, že ostatní axiomy vektorového prostoru jsou splněny. Příklad 9.3. Nechť p je pevně zvolená přímka v prostoru procházející zvoleným počátkem souřadnic. Pak množina všech polohových vektorů bodů na přímce p tvoří podprostor vektorového prostoru všech vázaných vektorů v prostoru. Příklad 9.4. Pro dané k 1 je množina Pk všech mnohočlenů stupně menšího než k podprostorem vektorového prostoru F z příkladu 9.2. Příklad 9.5. Nechť V je libovolný prostor. Pak O = {o} je podprostorem V, neboť o + o = o a podle (9.2) platí pro libovolný skalár , že o = o. Vektorový prostor O je nejmenší podprostor daného vektorového prostoru a nazývá se nulovým podprostorem. Příklad 9.6. Nechť S = {v1, . . . , vk} je konečná množina vektorů vektorového prostoru V. Není těžké ověřit, že množina všech vektorů, které lze zapsat ve tvaru u = 1v1 + . . . + kvk, (9.4) je podprostorem vektorového prostoru V, který nazýváme lineární obal množiny S. Lineární obal dané množiny vektorů S značíme S . Příklad 9.7. Jestliže p1(x) = 1 a p2(x) = x jsou dva mnohočleny, které považujeme za prvky vektorového prostoru P všech reálných mnohočlenů, pak P2 = p1, p2 je podprostor P tvořený všemi lineárními mnohočleny. Jestliže p3 = p1 + p2, pak zřejmě p1, p2 = p1, p2, p3 . 9.4 Součet a průnik podprostorů Pro libovolné dva podprostory U, V daného vektorového prostoru W můžeme vytvořit průnik podprostorů U V a součet podprostorů U + V = {u + v : u U, v V}. Průnik podprostorů není nikdy prázdný, neboť do něho vždy patří nulový prvek. Věta: Nechť U, V jsou podprostory vektorového prostoru W. Pak U V i U + V jsou podprostory W. 55 Kapitola 9. Vektorové prostory Důkaz: Nechť u, v U V, tedy u U, u V, v U a v V. Jelikož U a V jsou podprostory téhož prostoru, platí u + v U a u + v V, tedy u + v U V, a pro libovolný skalár platí také u U i u V, takže u U V. Důkaz, že U + V je podprostorem W je obdobný. Jestliže průnik podprostorů U, V daného vektorového prostoru W je nulový podprostor O, pak se součet U + V nazývá direktní (přímý) součet podprostorů a značí se U V. Direktní součet je tedy definován jen pro některé podprostory W. Důležitou vlastností direktního součtu podprostorů je to, že každý prvek w U V lze vyjádřit jednoznačně ve tvaru w = u + v s u U a v V. Skutečně, nechť platí w = u1 + v1 = u2 + v2. Potom o = w - w = (u1 + v1) - (u2 + v2), tedy u1 - u2 = v2 - v1. To však znamená, že vektory u1 - u2 i v1 - v2 patří do U V, takže podle definice direktního součtu jsou oba vektory nulové a platí u1 = u2, v1 = v2. 9.5 Vektory v matematice a ve fyzice V této kapitole jsme si zavedli nový pojem vektoru, který je zobecněním pojmu vektor, tak jak se používá například ve fyzice. To, že používáme stejný název, tedy vektor, nás nesmí vést k domněnce, že se jedná v podstatě o jedno a totéž. Naše abstraktní vektory rozhodně nejsou veličiny, které mají velikost a směr. Co je velikost funkce, která je prvkem prostoru F ? Ani veličina, která má velikost a směr, nemusí být vektorem v takovém smyslu. Představme si křižovatku, z níž lze vyjet čtyřmi směry. Známe-li průměrný počet aut, která projedou křižovatkou v každém směru v nějakém pevném časovém období, můžeme definovat v každém směru veličiny, které budou mít směr příslušného výjezdu z křižovatky a jejichž velikost bude rovna průměrmému počtu aut, které v tomto směru ve sledovaném období vyjely. Pro tyto veličiny, které mají velikost i směr, lze těžko smysluplně definovat skládání vektorů, které by splňovalo axiomy vektorového prostoru. Ve zvláštních případech však lze dát našim novým pojmům stejný smysl, jako mají ve fyzice nebo v geometrii. Řešení úloh, ve kterých se vyskytují abstraktní vektory, například funkce, si tak někdy můžeme usnadnit tím, že si představíme řešení obdobného problému se šipkami. Příklady k procvičení: Cvičení 9.1. Dokažte, že lineární obal S množiny S = {v1, . . . , vk} vektorů vektorového prostoru V z příkladu 9.6 tvoří vektorový prostor. Cvičení 9.2. Nechť F0 je množina všech reálných funkcí f, které splňují f(0) = 0. Dokažte, že F0 je podprostorem vektorového prostoru F z příkladu 9.2. 56 10. Lineární nezávislost a báze Pro vektory, které jsme zavedli v kapitole 9, zavedeme obdobu některých pojmů známých z analytické geometrie, jako jsou kolineárnost (rovnoběžnost) dvou vektorů nebo komplanárnost (možnost umístění ve stejné rovině) tří vektorů. Vystačíme přitom pouze s vlastnostmi vektorového prostoru, zejména se obejdeme bez úhlů. Nakonec si zavedeme pojem báze, který má pro vektorový prostor obdobný význam jako soustava souřadnic v geometrii. 10.1 Závislé a nezávislé vektory První nový pojem, který si zde zavedeme, je obdobou vlastnosti, kterou mají dva volné vektory, lze-li je umístit na jednu přímku, nebo tři volné vektory, lze-li je umístit do společné roviny. Definice: Neprázdná konečná množina vektorů S = {v1, . . . , vk} vektorového prostoru V je lineárně nezávislá, jestliže rovnice 1v1 + . . . + kvk = o (10.1) má jediné řešení 1 = . . . = k = 0. Jestliže S = {v1, . . . , vk} je nezávislá, říkáme také, že vektory v1, . . . , vk jsou nezávislé. Má-li rovnice (10.1) i jiné řešení, pak říkáme, že S je lineárně závislá a vektory v1, . . . , vk jsou závislé. Geometrický význam lineární závislosti pro dvourozměrné vázané vektory je na obr. 10.1. Příklad 10.1. Jestliže v1 = [2, -1, 0], v2 = [1, 2, 5] a v3 = [7, -1, 5], pak množina vektorů S = {v1, v2, v3} je lineárně závislá, neboť 3v1 + v2 - v3 = o. Příklad 10.2. Mnohočleny p1(x) = 1 - x, p2(x) = 5 + 3x - 2x2 a p3(x) = = 1 + 3x - x2 tvoří lineárně závislou množinu v P3, neboť pro každé x R platí 3p1(x) - p2(x) + 2p3(x) = 0, tj. 3p1 - p2 + 2p3 = o. Příklad 10.3. Vektory e1 = [1, 0, 0], e2 = [0, 1, 0] a e3 = [0, 0, 1] tvoří lineárně nezávislou množinu reálných třírozměrných aritmetických vektorů, neboť z 1e1 +2e2 + + 3e3 = o plyne 1 = 0, 2 = 0, 3 = 0. Poznámka: Závislost či nezávislost množiny vektorů závisí na množině skalárů. Například považujeme-li V = C za reálný vektorový prostor, pak jsou komplexní jednotka i a 1 nezávislé, neboť pro libovolná reálná čísla 1, 2 plyne z 1i + 21 = 0, že 1 = 2 = 0. Pokud však tutéž množinu, tedy V = C, považujme za komplexní vektorový prostor, plyne z (-1)i + i1 = o, že i a 1 jsou závislé! 57 Kapitola 10. Lineární nezávislost a báze o u v w 3 w = -w 1u 2v o 1u = u 2v = -u v 1u + 2v + 3 w = o 1u + 2v = o Obr. 10.1: Lineárně závislé vektory v R2. 10.2 Lineární kombinace a závislost Na obr. 10.1 vlevo vidíme trojici závislých vektorů u, v, w. Současně je naznačeno, že vektor w lze vyjádřit jako součet násobků vektorů u a v. Součet násobků vektorů se bude v dalším výkladu vyskytovat tak často, že si pro něj zavedeme samostatný název. Vektor v z vektorového prostoru V budeme nazývat lineární kombinací vektorů v1, . . . , vk V, jestliže existují skaláry 1, . . . , k tak, že v = 1v1 + . . . + kvk. Například mnohočlen p1 z vektorového prostoru P1 všech lineárních reálných mnohočlenů, který je definován předpisem p1(x) = x, je lineární kombinací mnohočlenů p2(x) = x + 1 a p3(x) = x + 2, neboť pro libovolné reálné x platí p1(x) = x = 2(x + 1) - (x + 2) = 2p2(x) - p3(x), takže p1 = 2p2 - p3. Věta: Konečná množina nenulových vektorů S = {v1, . . . , vm} je lineárně závislá, právě když existuje k 2 tak, že vektor vk je lineární kombinací vektorů v1, . . . , vk-1. Důkaz: Nechť S je množina nenulových lineárně závislých vektorů. Uvažujme množiny S1 = {v1}, S2 = {v1, v2}, . . . , Sm = {v1, . . . , vm} a nechť Sk je nejmenší množina vektorů, které jsou lineárně závislé, takže platí 1v1 + . . . + kvk = o (10.2) a některý z koeficientů 1, . . . , k je nenulový. Pak k 2, neboť S1 je zřejmě nezávislá množina vektorů, a k = 0, neboť jinak by Sk-1 byla lineárně závislá. Rovnici (10.2) můžeme tedy upravit pomocí axiomů vektorového prostoru na tvar vk = -1 k v1 + . . . + -k-1 k vk-1. 58 10.3 Postačující podmínky pro nezávislost funkcí Obráceně, jestliže pro 2 k m platí vk = 1v1 + . . . + k-1vk-1, pak -(1v1) - . . . - (k-1vk-1) + 1vk + 0vk+1 + . . . + 0vm = o, takže Sm je lineárně závislá, neboť koeficient 1 u vk je nenulový. 10.3 Postačující podmínky pro nezávislost funkcí Nechť S = {f1, . . . , fk} je konečná množina reálných funkcí vektorového prostoru F z příkladu 9.2. Podle definice je S nezávislá právě tehdy, když pro libovolné koeficienty 1, . . . , k plyne z 1f1(x) + . . . + kfk(x) = 0 (10.3) pro všechna x R, že 1 = . . . = k = 0. Ověření podmínky (10.3) pro všechna x R však vyžaduje dosazení nekonečně mnoha čísel do levé strany rovnosti, což může být v obecném případě neproveditelné. Přesto lze s trochou štěstí nezávislost množiny S poznat. První postup vychází z pozorování, že dosadíme-li v (10.3) za x postupně různá čísla x1, . . . , xk, dostaneme soustavu k lineárních rovnic o k neznámých 1, . . . , k ve tvaru: 1f1(x1) + . . . + kfk(x1) = 0 ... . . . ... ... 1f1(xk) + . . . + kfk(xk) = 0 (10.4) Pokud má tato soustava regulární matici, plyne odsud, že 1 = . . . = k = 0 a S je nezávislá množina. Druhý postup vychází z pozorování, že pokud platí pro nějaké x R rovnost (10.3), zůstane tato rovnost v platnosti i po derivování. Pro pevně zvolené číslo x tak dostaneme pro 1, . . . , k soustavu 1f (0) 1 (x) + . . . + kf (0) k (x) = 0 ... . . . ... ... 1f (k-1) 1 (x) + . . . + kf (k-1) k (x) = 0 (10.5) Pokud má tato soustava regulární matici, plyne odsud, že 1 = . . . = k = 0 a S je nezávislá množina. Matice této soustavy se vyskytuje ve více aplikacích a nazývá se Wronského matice. Příklad 10.4. Rozhodněte, zda jsou mocniny x, x2 a x3 lineárně nezávislé. 59 Kapitola 10. Lineární nezávislost a báze Řešení 1: Zvolíme si body x1 = 1, x2 = 2 a x3 = 3, které postupně dosadíme do funkcí f1(x) = x, f2(x) = x2, f3(x) = x3, a vytvoříme soustavu (10.3). Dostaneme: 1 + 2 + 3 = 0 21 + 42 + 83 = 0 31 + 92 + 273 = 0 (10.6) Matici této soustavy převedeme na schodový tvar. Dostaneme 1 1 1 2 4 8 r2 - 2r1 3 9 27 r3 - 3r1 1 1 1 0 2 6 0 6 24 r3 - 3r2 1 1 1 0 2 6 0 0 6 . Matice soustavy je regulární, takže soustava (10.6) má jen nulové řešení 1 = 2 = 3 =0. Funkce x, x2 a x3 jsou tedy lineárně nezávislé. Řešení 2: Vypočteme první a druhou derivaci funkcí f1(x) = x, f2(x) = x2, f3(x) = = x3 v bodě 1 a vytvoříme Wronského matici, kterou převedeme na schodový tvar. Dostaneme 1 1 1 1 2 3 r2 - r1 0 2 6 1 1 1 0 1 2 0 2 6 r3 - 2r2 1 1 1 0 1 2 0 0 2 . Matice je tedy regulární, z čehož opět vyplývá, že funkce x, x2 a x3 jsou lineárně nezá- vislé. Poznámka: Pokud by nám vyšlo, že výsledná matice není regulární, nemohli bychom učinit žádný závěr. K tomu, abychom mohli prohlásit, že uvažované funkce jsou závislé, bychom museli vyzkoušet v prvním případě všechny trojice reálných čísel x1, x2, x3, ve druhém případě všechna x R. Singulární matici bychom dostali například při volbě x1 = 0 nebo x = 0. 10.4 Báze vektorového prostoru Pojem báze, který si zavedeme v tomto oddílu, nám umožní popsat vektory pomocí skalárů. Ve svých důsledcích to vede k redukci úloh, v nichž se mohou vyskytovat libovolné vektory, na úlohy, v nichž se objevují pouze vektory báze a čísla. Definice: Konečná množina E vektorů vektorového prostoru V je báze vektorového prostoru V, jestliže (i) E je nezávislá. (ii) Každý vektor v V lze vyjádřit jako lineární kombinaci vektorů E. Příklad 10.5. Vektory e1 = [1, 0, 0], e2 = [0, 1, 0], e3 = [0, 0, 1] tvoří bázi V = R3. Jakýkoli vektor v = [v1, v2, v3] tohoto prostoru lze vyjádřit ve tvaru v = = v1e1 + v2e2 + v3e3. Báze E = (e1, e2, e3) je zvláštním případem standardní báze Rn, která je tvořena řádky či sloupci jednotkové matice In. 60 10.4 Báze vektorového prostoru Příklad 10.6. Mnohočleny p1(x) = 1 a p2(x) = x tvoří bázi vektorového prostoru P2. Každý mnohočlen p(x) = a0 + a1x lze zapsat ve tvaru p = a0p1 + a1p2. Mnohočleny zde považujeme za reálné funkce definované na celé reálné ose. Nechť a0p1 + a1p2 = o, tj. a0 + a1x = 0 pro všechna x. Pro x = 0 dostáváme a0 + a1 0 = 0, odkud a0 = 0, a pro x = 1 pak z a1 1 = 0 dostaneme a1 = 0, takže p1 a p2 jsou nezávislé. Příklad 10.7. Nechť L4 je množina všech spojitých funkcí l na intervalu [0, 1], které splňují l(0) = 0 a které jsou lineární na intervalech [0, 1 4], [1 4, 1 2], [1 2, 3 4], [3 4, 1]. Potom funkce 1, 2, 3, 4 z obr. 10.2 tvoří bázi L4. 0 x y 1 1 0,5 4 0 x y 1 1 0,5 3 0 x y 1 1 0,5 2 0 x y 1 1 0,5 1 0 x y 1 1 0,5 4321 4 3 2 1 4 1 )( +++=xl xxl =)( Obr. 10.2: Po částech lineární funkce. Poznámka: Ne každý vektorový prostor má bázi ve smyslu naší definice. Například neexistuje žádná konečná množina reálných funkcí, jejichž lineární kombinací by bylo možno vyjádřit libovolnou reálnou funkci. 61 11. Souřadnice V kapitole 10 jsme si zavedli pojem báze, který nyní využijeme k definování souřadnic. Pak si ukážeme, jak lze pomocí souřadnic převést úlohy s abstraktními vektory na úlohy s aritmetickými vektory, s nimiž umíme číselně počítat. 11.1 Souřadnice vektoru Definice: Nechť E = (e1, . . . , en) je uspořádaná báze vektorů vektorového prostoru V. Nechť v V. Potom čísla v1, . . . , vn, pro která platí v = v1e1 + . . . + vnen, nazýváme souřadnice vektoru v v bázi E. Například libovolný aritmetický vektor v = [v1, v2, v3] má ve standardní bázi E = (e1, e2, e3) z příkladu 9.7 souřadnice v1, v2, v3, neboť [v1, v2, v3] = v1[1, 0, 0] + v2[0, 1, 0] + v3[0, 0, 1]. Mnohočlen p(x) = x + 2 má v bázi P = (p1, p2) z příkladu 9.7, kde p1(x) = 1 a p2(x) = x, souřadnice 2, 1, neboť p(x) = x + 2 = 2p1(x) + 1p2(x). Souřadnice závisí nejen na zvolené bázi, ale i na očíslování vektorů báze. Například v = [1, 2] má v bázi E = (e1, e2), kde e1 = [1, 0] a e2 = [0, 1], první souřadnici 1, avšak pokud e1 = [0, 1] a e2 = [1, 0], potom má tentýž vektor první souřadnici 2. Následující věta říká, že souřadnice daného vektoru jsou určeny jednoznačně. Věta: Nechť E = (e1, . . . , en) je uspořádaná báze vektorového prostoru V a nechť x1, . . . , xn a y1, . . . , yn jsou souřadnice vektoru v V v bázi E. Pak x1 = y1, . . . , xn = = yn. Důkaz: Nechť E = (e1, . . . , en) je báze a v = x1e1 + . . . + xnen = y1e1 + . . . + ynen. Pak o = v + (-1)v = x1e1 + . . . + xnen + (-1)(y1e1 + . . . + ynen) = = (x1 - y1)e1 + . . . + (xn - yn)en. Jelikož vektory báze jsou nezávislé, plyne odtud x1 = y1, . . . , xn = yn. Souřadnice každého vektoru v V jsou v dané bázi E určeny jednoznačně. Budeme je zapisovat také do aritmetického vektoru, který se nazývá souřadnicový vektor a značí se [v]E. 62 11.2 Použití souřadnic Příklad 11.1. Libovolný aritmetický vektor v = [v1, v2, v3] má v bázi E = (e1, e2, e3) z příkladu 9.7 souřadnicový vektor [v]E = [v1, v2, v3]. Příklad 11.2. Mnohočlen p(x) = x + 2 má v bázi P = (p1, p2) z příkladu 10.6 souřadnicový vektor [p]P = [2, 1]. Příklad 11.3. Libovolná po částech lineární funkce l vektorového prostoru L4 z příkladu 10.7 má v bázi E = (1, 2, 3, 4) souřadnicový vektor [l]E = l(1 4), l(1 2), l(3 4), l(1) . 11.2 Použití souřadnic Pomocí souřadnic můžeme převést úlohy s vektory, které lze popsat pomocí lineárních kombinací bázových vektorů daného vektorového prostoru, na úlohy s aritmetickými vektory. Použijeme toho, že zobrazení, které každému vektoru přiřazuje jeho souřadnicový vektor v dané bázi E, převádí součet vektorů na součet souřadnicových vektorů, tedy [u + v]E = [u]E + [v]E , (11.1) a násobení vektoru skalárem na násobení příslušného souřadnicového vektoru, tedy [u]E = [u]E . (11.2) Obě rovnosti lze ověřit přímo z definice souřadnic. Například jsou-li u1, . . . , un souřadnice vektoru u v bázi E=(e1, . . . , en), tedy u = u1e1 + . . . + unen, pak u = u1e1 + . . . + unen, odkud [u]E = [u]E . Při řešení úloh s lineárními kombinacemi vektorů, například máme-li vyjádřit nějaký vektor jako lineární kombinaci jiných vektorů nebo máme-li rozhodnout, zda je nějaká množina vektorů nezávislá, postupujeme následovně: * Zvolíme si takovou bázi E daného vektorového prostoru, ve které lze všechny vektory snadno vyjádřit. * Najdeme souřadnicové vektory všech vektorů, které se vyskytují v popisu problému. * Řešíme úlohu, kterou dostaneme z původní úlohy záměnou všech vektorů za souřadnicové vektory. Postup ovšem předpokládá, že máme k dispozici vhodnou bázi, což nemusí být vždycky splněno. 63 Kapitola 11. Souřadnice Příklad 11.4. Najděte souřadnice mnohočlenu p(x) = x2-1 v bázi P = (p1, p2, p3), kde p1(x) = 1, p2(x) = x + 1, p3(x) = x2 + x + 1. Řešení: * Zvolíme si bázi E = (e1, e2, e3), kde e1(x) = 1, e2(x) = x, e3(x) = x2. * Najdeme souřadnice vektorů p, p1, p2, p3 v bázi E. Dostaneme [p]E = [-1, 0, 1], [p1]E = [1, 0, 0], [p2]E = [1, 1, 0], [p3]E = [1, 1, 1]. * Řešíme soustavu [p]E = x1 [p1]E + x2 [p2]E + x3 [p3]E . Rozepsáním této rovnice po složkách dostaneme soustavu -1 = x1 + x2 + x3 0 = x2 + x3 1 = x3, která má řešení x1 = -1, x2 = -1, x3 = 1. Snadno ověříme, že opravdu platí p = -p1 - p2 + p3. Příklad 11.5. Rozhodněte, zda jsou mnohočleny p1(x) = x2 + x + 1, p2(x) = x2 + 2x + 1, p3(x) = x2 + x + 2 závislé nebo nezávislé. Řešení: * Zvolíme si stejnou bázi E = (e1, e2, e3) jako v příkladu 11.4, tj. e1(x) = 1, e2(x) = x, e3(x) = x2. * Najdeme souřadnice vektorů p1, p2, p3 v bázi E. Dostaneme [p1]E = [1, 1, 1], [p2]E = [1, 2, 1], [p3]E = [2, 1, 1]. * Řešíme soustavu x1 [p1]E + x2 [p2]E + x3 [p3]E = o. Rozepsáním po složkách dostaneme soustavu: x1 + x2 + 2x3 = 0 x1 + 2x2 + x3 = 0 x1 + x2 + x3 = 0 (11.3) Úpravou rozšířené matice soustavy dostaneme 1 1 2 0 1 2 1 0 r2 - r1 1 1 1 0 r3 - r1 1 1 1 0 0 1 -1 0 0 0 -1 0 . Odtud vidíme, že soustava (11.3) má jediné řešení x1 = 0, x2 = 0, x3 = 0. Mnohočleny p1, p2, p3 jsou tedy lineárně nezávislé. 64 12. Dimenze a řešení soustav Vektory v rovině (prostoru) považujeme za dvourozměrné (třírozměrné), neboť k určení každého vektoru je třeba dvou (tří) souřadnic. Jelikož počet souřadnic je stejný jako počet vektorů příslušné báze, nabízí se okamžité zobecnění rozměru (dimenze) na vektorové prostory. Než tak učiníme, ukážeme si, že všechny báze jednoho vektorového prostoru mají stejný počet vektorů. Potom si ukážeme souvislost mezi novým pojmem dimenze a řešitelností obecných lineárních soustav. 12.1 Dimenze vektorového prostoru Věta: Nechť V = e1, . . . , en je vektorový prostor z příkladu 9.6 a nechť f1, . . . , fm jsou nezávislé vektory prostoru V. Pak m n. Důkaz: Nechť platí předpoklady věty a m > n. Jelikož V = e1, . . . , en a f1 V, lze f1 vyjádřit jako lineární kombinaci vektorů báze, takže vektory f1, e1, . . . , en jsou závislé podle věty 10.2. Podle téže věty však existuje k tak, že ek je lineární kombinací vektorů f1, e1, . . . , ek-1. Odtud snadno plyne, že každý vektor prostoru V lze vyjádřit jako lineární kombinaci vektorů f1, e1, . . . , ek-1, ek+1, . . . , en. Jestliže tento postup zopakujeme s tím, že vezmeme v úvahu nezávislost vektorů f1 a f2, ukáže se, že každý vektor prostoru V lze vyjádřit jako kombinaci f1, f2 a některých n - 2 vektorů vybraných z původní báze (e1, . . . , en). Kdyby m > n, dostali bychom výše uvedeným postupem po vyškrtání všech n vektorů báze (e1, . . . , en), že každý vektor prostoru V lze vyjádřit pomocí vektorů f1, . . . , fn. Tak bychom však mohli vyjádřit fn+1 jako kombinaci f1, . . . , fn, což je ve sporu s předpokladem, že f1, . . . , fm jsou nezávislé. Platí tedy m n. Z právě dokázané věty ihned plyne, že je-li (e1, . . . , en) báze prostoru V a jsou-li f1, . . . , fm nezávislé, pak m n. Má-li tedy nějaký vektorový prostor V bázi, pak počet vektorů této báze je maximálním počtem nezávislých vektorů prostoru V a počet vektorů v různých bázích téhož vektorového prostoru je stejný. Definice: Maximální počet nezávislých vektorů vektorového prostoru V nazýváme dimenzí prostoru V a značíme ji dim V. Má-li vektorový prostor bázi, je jeho dimenze rovna počtu vektorů báze a mluvíme o konečněrozměrném prostoru. Podle naší definice platí dim{o} = 0. Nemá-li nenulový vektorový prostor bázi, mluvíme o nekonečněrozměrném prostoru. Nový pojem dimenze je v souladu s pojmem dimenze, který jsme si zavedli pro aritmetické vektory, neboť vektory e1 = [1, 0, . . . , 0], . . . , en = [0, . . . , 0, 1] tvoří bázi prostoru n-rozměrných aritmetických vektorů. Pojem dimenze nemusí však být plně v souladu s naší intuicí. Například komplexní prostor V = C je jednorozměrný, neboť jeho bázi tvoří jakékoliv nenulové číslo. 65 Kapitola 12. Dimenze a řešení soustav 12.2 Dimenze a vyjádření vektoru jako lineární kombinace S pomocí pojmu dimenze lze popsat řešitelnost úlohy nalézt vyjádření vektoru jako lineární kombinace jiných vektorů. Věta: Nechť b, a1, . . . , ak jsou vektory vektorového prostoru V. Označme si A = {a1, . . . , ak}. Pak platí následující tvrzení: (i) Vektor b lze vyjádřit jako lineární kombinaci vektorů a1, . . . , ak, právě když dim b, a1, . . . , ak = dim A . (12.1) (ii) Jestliže platí (12.1) a A je nezávislá množina vektorů, pak lze vektor b vyjádřit jediným způsobem jako lineární kombinaci vektorů a1, . . . , ak. (iii) Jestliže platí (12.1) a A je závislá množina vektorů, pak lze vektor b vyjádřit nekonečně mnoha způsoby jako lineární kombinaci vektorů a1, . . . , ak. V této kombinaci lze zvolit některých d = k - dim A koeficientů libovolně. Důkaz: (i) Jestliže a1 = . . . = ak = o, je tvrzení triviální. Předpokládejme tedy, že některý z vektorů a1, . . . , ak je různý od nuly. Pak postupným vyškrtáváním vektorů, které jsou kombinací ostatních, vybereme z a1, . . . , ak nějakou bázi E prostoru A . Bez újmy na obecnosti můžeme předpokládat, že E = (a1, . . . , as). Jestliže b nelze vyjádřit jako kombinaci vektorů báze E, pak (b, a1, . . . , as) tvoří bázi b, a1, . . . , ak a platí dim b, a1, . . . , ak = s + 1 = s = dim A . Naopak, jestliže b lze vyjádřit jako kombinaci a1, . . . , as, pak E je báze A i b, a1, . . . , ak a platí dim A = s = dim b, a1, . . . , ak . (ii) Jestliže platí (12.1) a A je nezávislá množina vektorů, pak (a1, . . . , ak) tvoří bázi A a podle (i) lze vektor b vyjádřit jako lineární kombinaci vektorů a1, . . . , ak. Podle věty z oddílu 11.1 jsou koeficienty lineární kombinace určeny jednoznačně. (iii) Nechť platí (12.1). Předpokládejme opět, že E = (a1, . . . , as) tvoří bázi A a s < k. Podle (i) platí b A , takže pro libovolné s+1, . . . , k platí také b - s+1as+1 - . . . - kak A . Existuje tedy 1, . . . , s tak, že b - s+1as+1 - . . . - kak = 1a1 + . . . + sas. Vektor b lze tedy vyjádřit ve tvaru b = 1a1 + . . . + kak s libovolnými s+1, . . . , k. Počet těchto koeficientů splňuje d = k - s = k - dim A . 66 12.3 Řádkový prostor a řádková hodnost Právě dokázaná věta obsahuje odpověď na otázku, kdy má soustava lineárních rovnic řešení, kdy má jediné řešení a kdy má nekonečně mnoho řešení, a to v termínech dimenze lineárních obalů sloupců matice soustavy a pravé strany. Stačí si za vektory ai dosadit sloupce sA i matice soustavy A a za b dosadit vektor pravé strany. Věta však nedává nijaký návod, jak dimenzi prostoru sloupců zjistit. To je předmětem následujících odstavců. 12.3 Řádkový prostor a řádková hodnost Důležitým krokem k lepšímu pochopení otázek řešitelnosti rovnic je současné studium obalů řádků i sloupců matice soustavy. Tento postup nám umožní zejména využít známou techniku elementárních řádkových operací. Zde se budeme zabývat lineárním obalem R(A) = rA 1 , . . . , rA m řádků rA i dané matice A typu (m, n), který nazýváme řádkovým prostorem matice A. Zejména si všimneme, že R(A) se nemění elementárními řádkovými operacemi, a proto platí následující věta. Věta: Nechť matice A a B jsou řádkově ekvivalentní. Pak R(A) = R(B). (12.2) Dimenze R(A) se nazývá též řádková hodnost matice A, elementární řádkové operace ji nemění a snadno ji určíme ze schodového tvaru matice A, neboť počet nenulových řádků matice ve schodovém či normovaném schodovém tvaru je zřejmě roven její řádkové hodnosti. Příklad 12.1. Určete řádkovou hodnost matice A = 1 -1 1 1 1 0 -1 1 0 1 -2 0 . (12.3) Řešení: Elementárními řádkovými úpravani dostaneme postupně 1 -1 1 1 1 0 -1 1 r2 - r1 0 1 -2 0 1 -1 1 1 0 1 -2 0 0 1 -2 0 r3 - r2 1 -1 1 1 r1 + r2 0 1 -2 0 0 0 0 0 1 0 -1 1 0 1 -2 0 0 0 0 0 . Řádková hodnost matice A je tedy rovna dvěma. Poznámka: V příkladu jsme matici upravili až na normovaný schodový tvar, aby bylo vidět zcela triviálně, že nenulové řádky jsou nezávislé. Je však zřejmé, že jsme se mohli spokojit i se schodovým tvarem matice. 67 Kapitola 12. Dimenze a řešení soustav 12.4 Sloupcová hodnost matice Nyní se budeme zabývat lineárním obalem S(A) = sA 1 , . . . , sA n sloupců dané matice A typu (m, n), který se také nazývá sloupcový prostor matice A. Dimenze S(A) se nazývá sloupcová hodnost matice A. Co se dá říct o sloupcové hodnosti matice, která vznikla z dané matice pomocí elementárních řádkových úprav? Odpověď je o něco komplikovanější než u řádkových prostorů. Porovnáme-li totiž například matici A = 1 -1 1 1 1 0 -1 1 0 1 -2 0 (12.4) z příkladu 12.1 s jejím normovaným schodovým tvarem B = 1 0 -1 1 0 1 -2 0 0 0 0 0 , (12.5) zjistíme, že sloupcové prostory obou matic jsou různé, neboť například sA 2 S(B). Přesto platí následující věta. Věta: Nechť matice A a B jsou řádkově ekvivalentní. Pak dim S(A) = dim S(B). Důkaz: Jestliže matice A a B typu (m, n) jsou řádkově ekvivalentní, pak jsou také rozšířené matice A o a B o řádkově ekvivalentní. Odtud podle věty 2.2 x1sA 1 + . . . + xnsA n = o, právě když x1sB 1 + . . . + xnsB n = o. Zde vidíme, že sloupce sA i1 , . . . , sA ik jsou nezávislé, právě když sloupce sB i1 , . . . , sB ik jsou nezávislé. Důkaz nám ukazuje, jak nalézt bázi sloupcového prostoru dané matice A. U matice ve schodovém tvaru je báze zřejmě tvořena sloupci obsahujícími vedoucí prvky řádků a sloupce matice A s týmiž indexy tvoří pak bázi S(A). Příklad 12.2. Báze sloupcového prostoru matice B z (12.5) je tvořena sloupci sB 1 = 1 0 0 , sB 2 = 0 1 0 . První dva sloupce sA 1 = 1 1 0 , sA 2 = -1 0 1 , matice A proto tvoří bázi S(A), neboť A a B jsou řádkově ekvivalentní. 68 12.5 Hodnost a řešitelnost soustav 12.5 Hodnost a řešitelnost soustav Hlavním důsledkem vět 12.3 a 12.4 je to, že řádková hodnost matice se rovná sloupcové hodnosti matice. Věty totiž říkají, že elementární řádkové operace zachovávají obě hodnosti, a pro matice v normovaném schodovém tvaru je rovnost řádkové a sloupcové hodnosti matice zřejmá. Budeme proto mluvit stručně o hodnosti matice. Hodnost matice A budeme značit h(A). Nyní můžeme zformulovat hlavní výsledek o řešitelnosti lineárních soustav, který se nazývá Frobeniova věta. Věta: Nechť A je matice typu (m, n) a nechť b je m-rozměrný sloupcový vektor. Potom platí následující tvrzení: (i) Soustava Ax = b (12.6) má řešení, právě když h(A) = h A b . (12.7) (ii) Jestliže platí (12.7) a h(A) = n, potom má soustava (12.6) jediné řešení. (iii) Jestliže platí (12.7) a h(A) < n, potom má soustava (12.6) nekonečně mnoho řešení. V řešení lze zvolit některých d = n - h(A) složek libovolně. Důkaz: Věta je speciálním případem věty 12.2 pro ai = sA i . Ukázali jsme také, že dimenze sloupcových prostorů můžeme nahradit hodnostmi. 12.6 Hodnost a regularita Pojem hodnosti nám umožňuje zformulovat novou charakteristiku regulární matice. Věta: Čtvercová matice A řádu n je regulární, právě když h(A) = n. Důkaz: Nechť A je čtvercová matice řádu n. Jestliže A má hodnost n, potom podle věty 12.5 má každá soustava Ax = sI k jediné řešení, takže i soustava AX=I má jediné řešení. Podle věty 6.4 je proto matice A regulární. Obráceně, jestliže A je regulární, potom pro livovolný sloupcový vektor y a x = A-1y platí y = AA-1 y = A(A-1 y) = Ax = x1sA 1 + . . . + xnsA n, takže A má sloupcovou hodnost n. 69 Kapitola 12. Dimenze a řešení soustav 12.7 Hodnost matice a počítačová aritmetika Pojem hodnosti předpokládá přesnou aritmetiku, neboť nepatrná změna matice může způsobit změnu její hodnosti. Například matice A = 1 1 10-99 10-99 a B = 1 1 10-98 10-99 se liší jen velmi málo, avšak h(A) = 1 a h(B) = 2. Pokud jsou koeficienty matice výsledkem měření, nemá proto často vůbec smysl hovořit o hodnosti matice. Pro takové aplikace, stejně jako pro počítačové řešení soustav, byla proto vypracována teorie založená na jiných pojmech, se kterou se seznámíme později. Poznamenejme ještě, že při zjišťování hodnosti na počítači je nutno vyhnout se zaokrouhlovacím chybám. Příklady k procvičení: Cvičení 12.1. Určete hodnost matice A = 1 -1 1 1 1 0 -1 1 3 -2 1 3 . Cvičení 12.2. Nalezněte libovolnou bázi sloupcového prostoru S(A) matice A z příkladu 12.1. 70 Část III Lineární a multilineární zobrazení 13. Lineární zobrazení 14. Lineární zobrazení a matice 15. Bilineární formy 16. Kvadratické formy 17. Kongruence symetrických a diagonálních matic 18. Skalární součin a ortogonalita 19. Variační metody a metoda nejmenších čtverců 13. Lineární zobrazení Řadu fyzikálních zákonů či přibližných experimentálních závislostí lze z matematického hlediska charakterizovat jako přímou úměrnost. Například Ohmův zákon říká, že proud I je při konstantním odporu R přímo úměrný napětí U, což můžeme zapsat ve tvaru I(U) = 1 R U. Snadno si ověříme, že funkce I zobrazuje součet argumentů na součet jejich obrazů a skalární násobek argumentu na příslušný násobek jeho obrazu, tak jako funkce f na obr. 13.1. To však je vlastnost, která má smysl pro zobrazení jakéhokoliv vektorového prostoru do jiného vektorového prostoru. Zde se seznámíme se základními vlastnostmi těchto speciálních zobrazení, která mají velký význam v matematice, fyzice, inženýrství, společenských vědách i v ekonomii. y=f(x) u v u+v u x f(u) f(v) f(u)+ f(v) f(u) y Obr. 13.1: Lineární zobrazení. 13.1 Definice a příklady lineárních zobrazení Definice: Nechť U, V jsou vektorové prostory. Zobrazení A : U V se nazývá lineární zobrazení (operátor), jestliže pro každé dva vektory u, v U a skalár platí: (i) A(u + v) = A(u) + A(v) (ii) A(u) = A(u) Lineární zobrazení U U se často nazývá lineární transformace. Množinu všech lineárních zobrazení vektorového prostoru U do vektorového prostoru V budeme značit L(U, V). Místo L(U, U) budeme psát stručně L(U). V některých aplikacích jsou důležité lineární zobrazení vektorového prostoru U do R, které se nazývají lineární formy nebo lineární funkcionály. 73 Kapitola 13. Lineární zobrazení Příklad 13.1. Funkce y = ax je lineární transformace R pro libovolné pevně zvolené a R, neboť a(u + v) = au + av a a(u) = au pro libovolná čísla u, v a . Příklad 13.2. Funkce f : y = 2x + 1 není lineární transformace R, neboť f(2 + 2) = f(4) = 9 = 10 = f(2) + f(2). Příklad 13.3. Je-li A libovolná reálná m × n matice, Rn,1(Rm,1) prostor všech sloupcových aritmetických vektorů dimenze n(m), pak je A : Rn,1 x Ax Rm,1 lineární zobrazení, neboť pro libovolné vektory x a y platí podle (5.4) A(x + y) = Ax + Ay a A(x) = Ax. Příklad 13.4. Zobrazení D : P p p P, které každému mnohočlenu p přiřadí jeho derivaci p, je lineární zobrazení prostoru všech mnohočlenů P do sebe, neboť pro libovolné reálné mnohočleny p, q, skalár a reálné x platí p(x) + q(x) = p (x) + q (x) a p(x) = p (x). 13.2 Elementární vlastnosti lineárního zobrazení Nechť U, V jsou vektorové prostory. Z definice 13.1 bezprostředně plyne, že pro libovolné lineární zobrazení A L(U, V) a v U platí A(o) = A(0 o) = 0 A(o) = o A(-v) = A (-1) v = (-1) A(v) = -A(v). Jestliže A L(U, V), pak pro libovolné skaláry 1, . . . , n a vektory v1, . . . , vn prostoru U platí A(1v1 + . . . + nvn) = 1A(v1) + . . . + nA(vn), (13.1) neboť A(1v1 + . . . + nvn) = A 1v1 + (2v2 + . . . + nvn) = = A(1v1) + A(2v2 + . . . + nvn) = = 1A(v1) + A(2v2 + . . . + nvn) = . . . = = 1A(v1) + . . . + nA(vn). Z této rovnosti je vidět důležitou vlastnost lineárních zobrazení definovaných na prostorech konečné dimenze, a to že jsou úplně určeny obrazy vektorů libovolné báze, tedy obrazy konečného počtu vektorů. 74 13.3 Nulový prostor a obor hodnot 13.3 Nulový prostor a obor hodnot Definice: Nechť U, V jsou vektorové prostory a nechť A L(U, V). Pak nulový prostor (jádro) N(A) zobrazení A je množina vzorů o, t.j. N(A) = {u U : A(u) = o}. Jestliže u, v N(A), t.j. A(u) = o, A(v) = o, a je-li je libovolný skalár, pak platí A(u + v) = A(u) + A(v) = o a A(u) = A(u) = o, takže N(A) je podprostorem U. Obdobnou vlastnost má i obor hodnot H(A) lineárního zobrazení A. Jestliže u = = A(x), v = A(y) a je skalár, pak u + v = A(x) + A(y) = A(x + y) a u = A(x) = A(x), takže H(A) je podprostorem vektorového prostoru V. Pomocí nulového prostoru můžeme popsat strukturu řešení abstraktní operátorové rovnice. Věta: Nechť U, V jsou vektorové prostory, nechť A L(U, V) a nechť A(x0) = b. Potom libovolné řešení x rovnice A(x) = b lze zapsat ve tvaru x = x0 + n, kde n N(A). Důkaz: Nechť A(x) = b. Potom platí A(x - x0) = A(x) - A(x0) = b - b = o, takže vektor n = x - x0 patří do jádra N(A) a x = x0 + n. Důsledek: Lineární zobrazení A je prosté, právě když N(A) = {o}. Máme-li tedy rozhodnout, zda je dané lineární zobrazení prosté, stačí vyšetřit vzor nulového vektoru. Je to zvláštní vlastnost lineárního zobrazení, neboť u obecného zobrazení by bylo nutno vyšetřit vzory všech vektorů v oboru hodnot. 13.4 Hodnost a defekt zobrazení Definice: Nechť U, V jsou vektorové prostory konečné dimenze a nechť A L(U, V). Pak hodnost h(A) zobrazení A definujeme jako dimenzi H(A) a defekt d(A) zobrazení A definujeme jako dimenzi N(A). Věta: Nechť U, V jsou vektorové prostory konečné dimenze a nechť A L(U, V). Potom h(A) + d(A) = dim(U). (13.2) 75 Kapitola 13. Lineární zobrazení Důkaz: V důkazu se musíme především vypořádat se skutečností, že N(A) a H(A) mohou být podprostory různých prostorů. Nechť (h1, . . . , hm) je báze H(A) a nechť (n1, . . . , nk) je báze N(A). Označme si v1, . . . , vm libovolné vzory h1, . . . , hm, takže platí A(v1) = h1, . . . , A(vm) = hm. Ukážeme, že vektory (v1, . . . , vm, n1, . . . , nk) tvoří bázi U. Nechť platí 1v1 + . . . + mvm + 1n1 + . . . + knk = o (13.3) Pak také A(1v1 + . . . + mvm + 1n1 + . . . + knk) = o, takže s využitím linearity A a definice vektorů vi a ni dostaneme 1h1 + . . . + mhm = o. Jelikož vektory (h1, . . . , hm) tvoří podle předpokladu bázi H(A), jsou nezávislé, takže 1 = 2 = . . . = m = 0. Po dosazení do (13.3) tedy platí 1n1 + . . . + knk = o. Poněvadž jsou vektory n1, . . . , nk také nezávislé, plyne odtud 1 = . . . = k = 0. Vektory v1, . . . , vm, n1, . . . , nk jsou tedy nezávislé. Nechť nyní x U je libovolný vektor. Pak A(x) H(A) a existuje 1, . . . , m tak, že platí A(x) = 1h1 + . . . + mhm. Označme si y = 1v1 + . . . + mvm, takže A(y) = A(x), a zapišme si x ve tvaru x = y + (x - y). Jelikož A(x - y) = A(x) - A(y) = o, platí x - y N(A) a tedy x - y = 1n1 + . . . + knk. Vektor x lze potom vyjádřit ve tvaru x = 1v1 + . . . + mvm + 1n1 + . . . + knk. Vektory (v1, . . . , vm, n1, . . . , nk) tedy tvoří bázi U, takže platí m + k = dim(U), t.j. h(A) + d(A) = dim(U). Důsledek: Lineární transformace A : V V definovaná na vektorovém prostoru konečné dimenze V je zobrazení na V, právě když A je prosté zobrazení. 76 13.5 Součet zobrazení a násobení skalárem 13.5 Součet zobrazení a násobení skalárem Definice: Nechť U a V jsou libovolné vektorové prostory. Pro libovolná zobrazení A, B L(U, V) a skalár můžeme definovat součet zobrazení A + B předpisem (A + B)(u) = A(u) + B(u) a součin skaláru a zobrazení A předpisem (A)(u) = A(u) . Snadno se ověří, že A + B i A jsou lineární zobrazení. Například (A + B)(u) = A(u) + B(u) = A(u) + B(u) = A(u) + B(u) = = (A + B)(u) . Také nulové zobrazení O L(U, V), které každému u U přiřazuje nulový prvek o prostoru V, je lineární, neboť například O(u + v) = o = o + o = O(u) + O(v). Snadno lze ukázat, že L(U, V) tvoří vzhledem k právě definovanému sčítání zobrazení a násobení zobrazení skalárem vektorový prostor, jehož nulový prvek je právě definované nulové zobrazení. 13.6 Skládání lineárních zobrazení Definice: Nechť U, V a W jsou vektorové prostory a nechť A : U V a B : V W jsou zadaná lineární zobrazení. Pak lze definovat složené zobrazení (součin zobrazení) BA : U W předpisem (BA)(u) = B A(u) . Pořadí, ve kterém se zapisují faktory složeného zobrazení, je důležité a opačné k pořadí, ve kterém se definiční výraz vyhodnocuje. To naznačuje určitou nevhodnost zvyku psát argument do závorky za označení zobrazení. Složené zobrazení je také lineární, neboť: (BA)(u) = B A(u) = B A(u) = B A(u) = (BA)(u) (BA)(u + v) = B A(u + v) = B A(u) + A(v) = B A(u) + B A(v) = = (BA)(u) + (BA)(v) Pro skládání zobrazení lze odvodit obdobné vztahy jako rovnosti (5.12) a (5.13) pro násobení matic. Je-li libovolný skalár a jsou-li A, B, C libovolná lineární zobrazení, pro která mají následující výrazy smysl, potom 77 Kapitola 13. Lineární zobrazení A(B) = (AB) = (A)B (13.4.a) A(B + C) = AB + AC (13.4.b) (A + B)C = AC + BC (13.4.c) A(BC) = (AB)C (13.4.d) 13.7 Mnohočleny v lineárních transformacích Jelikož skládání zobrazení je podle (13.4.d) asociativní, můžeme při skládání zobrazení vynechat závorky. Pro libovolnou lineární transformaci A : U U a kladné celé číslo m tak můžeme definovat mocninu lineární transformace předpisem Am = AA A, m přičemž platí Am+n = Am An . Poznamenejme, že pro dvě lineární transformace A a B vektorového prostoru U do sebe nemusí platit (AB)m = AmBm. Snadno se ověří, že identita I definovaná na prostoru U je lineární a pro libovolné A L(U) splňuje AI = IA = A. Jestliže p je libovolný mnohočlen definovaný vztahem p(x) = a0 + a1x + . . . + anxn , pak můžeme pro každé A L(U) definovat p(A) = a0I + a1A + . . . + anAn . Jestliže D je například derivace na prostoru P všech mnohočlenů a p(x) = x2 - 1, pak p(D) = D2 - I, takže pro každý mnohočlen q P platí p(D)(q) = q - q. Všechna pravidla pro úpravu mnohočlenů jedné proměnné platí i pro mnohočleny jedné lineární transformace, neboť jsou odvozeny ze vztahů, které platí pro čísla i pro lineární transformace. Tak například z rovnosti x2 - 1 = (x - 1)(x + 1) dostaneme po dosazení D za x rovnost D2 - I = (D - I)(D + I), kterou si můžeme ověřit rozepsáním (D - I)(D + I)(p) = (D - I) (D + I)p = (D - I)(p + p) = = (p + p) - (p + p) = p - p = (D2 - I)(p). 78 13.8 Princip superpozice a inverze lineárních zobrazení 13.8 Princip superpozice a inverze lineárních zobrazení Mnoho technických problémů lze zformulovat jako úlohu najít pro dané lineární zobrazení A : U V a pro b V vektor x U tak, aby platilo A(x) = b. (13.5) Například úlohu najít neznámé potenciály v 1. kapitole můžeme zapsat ve tvaru A(x) = b, kde x = x1 x2 , b = 0 -10 a A(x) = -2 1 1 -3 x1 x2 . Obdobně lze zapsat podmínky pro průhyb y struny zatížené silou s jednotkovou hustotou, nataženou jednotkovou silou a uchycenou v bodech o souřadnicích 0 a 1 jako úlohu najít mnohočlen y tak, aby platilo: -y(x) = 1 pro x (0, 1) (13.6.a) y(0) = y(1) = 0 (13.6.b) Označíme-li si P prostor všech reálných mnohočlenů, P0 jeho podprostor, do kterého patří všechny mnohočleny p, které splňují p(0) = p(1) = 0, a položíme-li b(x) = 1, pak b P a zobrazení definované předpisem A(p) = -p je lineární zobrazení patřící do L(P0, P). Úloha najít mnohočlen y tak, aby platilo (13.6) je tedy ekvivalentní úloze najít y P0 tak, aby A(y) = b. Předpokládejme nyní, že známe například řešení x1 a x2 rovnice (13.5) pro dvě pravé strany b1 a b2, tedy že platí A(x1) = b1 a A(x2) = b2, a že navíc platí b = b1 + b2. Pak můžeme určit řešení x rovnice (13.5) pouhým sečtením x1 a x2, neboť pro x = x1 + x2 platí A(x) = A(x1 + x2) = A(x1) + A(x2) = b1 + b2 = b. Tomuto jednoduchému důsledku vlastností lineárních zobrazení se říká princip super- pozice. V našich příkladech lze najít fyzikální interpretaci principu superpozice pro obě úlohy. Stačí si uvědomit, že například u první úlohy je v pravé straně uchována informace o zdroji proudu a že neznámé jsou potenciály. Princip superpozice vyjadřuje také následující tvrzení. 79 Kapitola 13. Lineární zobrazení Věta: Nechť A : U V je vzájemně jednoznačné lineární zobrazení vektorového prostoru U na vektorový prostor V. Pak existuje A-1, které je rovněž lineární zobrazení. Důkaz: Inverzní zobrazení A-1 existuje pro každé vzájemně jednoznačné zobrazení. Nechť u = A(x), v = A(y), tedy x = A-1(u) a y = A-1(v), a nechť je libovolný skalár. Potom A-1 (u + v) = A-1 A(x) + A(y) = A-1 A(x + y) = x + y = = A-1 (u) + A-1 (v), A-1 (u) = A-1 A(x) = A-1 A(x) = x = A-1 (u). Příklady k procvičení: Cvičení 13.1. Nechť F je vektorový prostor všech reálných funkcí z příkladu 9.2. Ověřte, že zobrazení, které každé funkci f F přiřazuje f(0) R, je lineární funkcionál. Cvičení 13.2. Nechť V je vektorový prostor dimenze n. Dokažte s pomocí věty 13.4, že defekt jakéhokoliv lineárního funkcionálu definovaného na V je roven n - 1. Cvičení 13.3. Ověřte rovnosti (13.4). 80 14. Lineární zobrazení a matice V této kapitole se budeme věnovat lineárním zobrazením prostorů aritmetických vektorů, která jsou definována pomocí součinu matice a vektoru tak jako v příkladu 13.3. Ukážeme si, že tak lze představit nejen každé lineární zobrazení prostoru aritmetických vektorů, ale s pomocí souřadnic dokonce každé lineární zobrazení vektorových prostorů konečné dimenze. Nové pojmy také využijeme k alternativní prezentaci teorie řešitelnosti soustav lineárních rovnic. 14.1 Maticový zápis lineárních zobrazení Rm do Rn Jak lze popsat všechna lineární zobrazení Rm do Rn? Nechť S = (sI 1, . . . , sI m) je standardní báze prostoru Rm,1 všech sloupcových aritmetických vektorů dimenze m, která je tvořena sloupci jednotkové matice Im. Nechť A : Rm,1 Rn,1 je libovolné lineární zobrazení a nechť obrazy sloupcových vektorů sI 1, . . . , sI m jsou sloupcové vektory A(sI 1) = a11 ... an1 , . . . , A(sI m) = a1m ... anm . Jelikož libovolný vektor x Rm,1 lze zapsat ve tvaru x = x1sI 1 + . . . + xmsI m, lze A(x) zapsat pomocí A(x) = A(x1sI 1 + . . . + xmsI m) = x1A(sI 1) + . . . + xmA(sI m) = Ax, kde A = A(sI 1), . . . , A(sI m) = [aij] . Platí tedy následující věta. Věta: Nechť A : Rm,1 Rn,1 je libovolné lineární zobrazení. Pak existuje matice A typu (n, m) tak, že pro libovolné x Rm,1 platí A(x) = Ax. Lineární zobrazení A : Rm,1 x Ax Rn,1 se často ztotožňuje s maticí A a o matici A se mluví jako o lineárním zobrazení. V tomto smyslu budeme i my používat pojmy obor hodnot matice A, nulový prostor matice A, nebo defekt matice A. Pojmy, které jsme si doposud zavedli jsou v souladu s touto konvencí. Například obor hodnot H(A) každé matice A je totožný s jejím sloupcovým prostorem S(A), takže pro hodnosti matice a zobrazení platí h(A) = h(A). 81 Kapitola 14. Lineární zobrazení a matice 14.2 Určení báze nulového prostoru matice Bázi nulového prostoru matice tvoří jakákoliv maximální množina nezávislých řešení soustavy Ax = o, kterou najdeme tak, že matici A převedeme na schodový tvar a za neznámé, které nejsou ve sloupcích s vedoucími prvky, budeme postupně dosazovat například řádky jednotkové matice. Získaná řešení pak zapíšeme do sloupců. Postup je v podstatě totožný s postupem řešení soustav rovnic s nekonečnou množinou řešení, který byl popsán v článku 2.4, avšak s pomocí nových pojmů můžeme lépe pochopit strukturu řešení. Příklad 14.1. Určete bázi nulového prostoru matice A = 1 1 2 3 1 1 1 3 2 2 2 6 . Řešení: Nejprve upravíme matici A pomocí řádkových úprav na schodový tvar A = 1 1 2 3 1 1 1 3 r2 - r1 2 2 2 6 r3 - 2r1 1 1 2 3 0 0 -1 0 0 0 -2 0 r3 - 2r2 1 1 2 3 0 0 -1 0 0 0 0 0 . Odtud h(A) = 2 (počet nenulových řádků) a d(A) = 4 - 2 = 2. Bázi N(A) tedy tvoří jakékoliv dva nezávislé vektory, jejichž složky řeší soustavu x1 + x2 + 2x3 + 3x4 = 0 - x3 = 0. (14.1) Vypočteme je tak, že za x2 a x4 dosadíme postupně například složky e1 = 1 0 , e2 = = 0 1 a vypočteme x1 = -1, x3 = 0 a x1 = -3, x3 = 0. Bázi nulového prostoru tedy tvoří vektory n1 = -1 1 0 0 , n2 = -3 0 0 1 . Jestliže lze matici A typu (m, n), m < n rozdělit na bloky tak, že A = B C a B je regulární, lze najít vzorec pro matici N typu (n, n - m), jejíž sloupce tvoří bázi N(A). V souladu s výše uvedeným výkladem budeme hledat N ve tvaru: N = n - m X m I n - m 82 14.3 Matice jako lineární zobrazení a soustavy rovnic Po rozepsání levé strany rovnice AN = O s využitím blokové struktury a po vynásobení zleva maticí B-1 dostaneme B-1 B C X I = O, odkud X + B-1 C = O. Odtud X = -B-1C a N = -B-1C I . 14.3 Matice jako lineární zobrazení a soustavy rovnic Díváme-li se na matici A jako na lineární zobrazení A : x Ax, můžeme využít dosavadních výsledků o lineárních zobrazeních k alternativnímu výkladu teorie řešitelnosti lineárních soustav z článku 12.5. Například přeložíme-li tvrzení (i) do termínů zobrazení, zjistíme, že vyjadřuje zřejmou skutečnost, že soustava lineárních rovnic má řešení, pravě když pravá strana patří do oboru hodnot matice soustavy. Tvrzení (ii) zase vyplývá z důsledku 13.3, podle něhož je řešení jediné, jestliže N(A) = {o}, tedy defekt d(A) = 0, což je podle (13.2) ekvivalentní h(A) = n, kde n je počet neznámých. Tvrzení (iii) lze dokonce prohloubit. Věta: Nechť A je matice typu (m, n) pro kterou platí d(A) > 0, nechť b je mrozměrný sloupcový vektor, nechť Ax0 = b a nechť (n1, . . . , nd) je báze N(A). Potom libovolné řešení soustavy Ax = b může být zapsáno ve tvaru x = x0 + 1n1 + . . . + dnd. (14.2) Důkaz: Podle věty 13.3 lze libovolné řešení soustavy (13.5) zapsat ve tvaru x = = x0 + n, kde n N(A). Jelikož vektory n1, . . . , nd tvoří bázi N(A), lze n zapsat ve tvaru (14.2). Příklad 14.2. Najděte všechna řešení soustavy x1 + x2 + 2x3 + 3x4 = 0 x1 + x2 + x3 + 3x4 = 1 2x1 + 2x2 + 2x3 + 6x4 = 2 (14.3) ve tvaru (14.2). Řešení: Rozšířenou matici soustavy nejprve upravíme na schodový tvar A b = 1 1 2 3 0 1 1 1 3 1 r2 - r1 2 2 2 6 2 r3 - 2r1 1 1 2 3 0 0 0 -1 0 1 0 0 -2 0 2 r3 - 2r2 1 1 2 3 0 0 0 -1 0 1 0 0 0 0 0 . 83 Kapitola 14. Lineární zobrazení a matice Z něho dostaneme částečné řešení x0 soustavy (14.3) řešením soustavy x1 + x2 + 2x3 + 3x4 = 0 - x3 = 1 (14.4) tak, že položíme například x2 = 0 a x4 = 0. Dostaneme x1 = 2, x3 = -1. Jelikož matice soustavy je stejná jako matice A v příkladu 14.1, můžeme pomocí řešení tohoto příkladu napsat libovolné řešení soustavy (14.3) pomocí parametrů 1, 2 ve tvaru x = 2 0 -1 0 + 1 -1 1 0 0 + 2 -3 0 0 1 . 14.4 Definice matice lineárního zobrazení V článku 14.1 jsme si ukázali, že libovolné lineární zobrazení Rm do Rn lze popsat pomocí vhodné matice. Nyní si ukážeme, že pomocí matic můžeme popsat libovolné zobrazení prostorů konečné dimenze. Použijeme k tomu báze definičního oboru a oboru hodnot. Pro stručnost budeme v celém článku předpokládat, že U a V jsou dva vektorové prostory konečné dimenze s bázemi E = (e1, . . . , em) a F = (f1, . . . , fn). Definice: Nechť A : U V je lineární zobrazení. Pak můžeme vektory A(e1), ..., A(em) vyjádřit jako lineární kombinace vektorů f1, . . . , fn ve tvaru: A(e1) = a11f1 + . . . + an1fn ... ... . . . ... A(em) = a1mf1 + . . . + anmfn Matici [A]E,F = a11 . . . a1m ... ... ... an1 . . . anm nazýváme maticí lineárního zobrazení A vzhledem k bázím (E, F). Jestliže U = = V a E = F, pak budeme mluvit o matici lineární transformace vzhledem k bázi E a místo [A]E,E budeme psát stručně [A]E. Indexy prvků aij jsou zvoleny tak, aby pro každé lineární zobrazení A : U V platilo [A]E,F = [A(e1)]F , . . . , [A(em)]F , (14.5) obdobně jako v článku 14.1, kde byly E i F standardní báze. Z této rovnosti a z vlastností souřadnic (11.1) a (11.2) plyne pro libovolný skalár , případně pro libovolné další lineární zobrazení B : U V, že [A]E,F = [A]E,F , (14.6) [A + B]E,F = [A]E,F + [B]E,F . (14.7) 84 14.5 Souřadnice obrazu vektoru Příklad 14.3. Nechť P3 je vektorový prostor všech mnohočlenů nejvýše druhého stupně s bází E = (e1, e2, e3), kde e1, e2, e3 jsou mnohočleny e1(x) = 1, e2(x) = x a e3(x) = x2. Najděte matici derivace D : P3 p p P3. Řešení: Nejdříve najdeme souřadnice D(e1), D(e2) a D(e3) v bázi E. Jelikož D(e1)(x) = 0, D(e2)(x) = 1 a D(e3)(x) = 2x, můžeme napsat přímo: 0 = 0 1 + 0 x + 0 x2 1 = 1 1 + 0 x + 0 x2 2x = 0 1 + 2 x + 0 x2 Souřadnice D(e1), D(e2) a D(e3) tvoří zřejmě koeficienty na řádcích, které zapíšeme do sloupců a dostaneme [D]E = 0 1 0 0 0 2 0 0 0 . 14.5 Souřadnice obrazu vektoru Předpokládejme nyní, že U a V jsou dva vektorové prostory konečné dimenze s bázemi E = (e1, . . . , em) a F = (f1, . . . , fn), že A : U V je lineární zobrazení, x U a [x]E = x1 ... xm . Potom s pomocí definice lineárního zobrazení, vztahů (11.1), (11.2) a definice součinu matice a vektoru odvodíme postupně [A(x)]F = [A(x1e1 + . . . + xmem)]F = [x1A(e1) + . . . + xmA(em)]F = = x1 [A(e1)]F + . . . + xm [A(em)]F = [A(e1)]F , . . . , [A(em)]F [x]E = = [A]E,F [x]E , tedy [A(x)]F = [A]E,F [x]E . (14.8) Poznámka: Je-li U = V a E = F, má (14.8) tvar [A(x)]E = [A]E [x]E . (14.9) Příklad 14.4. S využitím řešení příkladu 14.3 vypočtěte souřadnice derivace libovolného mnohočlenu p nejvýše druhého stupně pomocí souřadnic p v bázi E = (e1, e2, e3), e1(x) = 1, e2(x) = x, e3(x) = x2. 85 Kapitola 14. Lineární zobrazení a matice Řešení: Mnohočlen p(x) = ax2 + bx + c má v bázi E souřadnice [p]E = c b a . Jelikož jsme si v příkladu 14.3 ukázali, že derivace D má v bázi E matici [D]E = 0 1 0 0 0 2 0 0 0 , platí p E = [Dp]E = [D]E [p]E = 0 1 0 0 0 2 0 0 0 c b a = b 2a 0 . 14.6 Matice složeného zobrazení Nechť U je vektorový prostor konečné dimenze s bází E = (e1, . . . , en) a nechť A : U U a B : U U jsou lineární transformace. Pak s použitím vztahu (14.8) a definice součinu matic (5.8) odvodíme [AB]E = [(AB)(e1)]E , . . . , [(AB)(en)]E = A B(e1) E , . . . , A B(en) E = = [A]E [B(e1)]E , . . . , [A]E [B(en)]E = [A]E [B(e1)]E , . . . , [B(en)]E = = [A]E [B]E [e1]E , . . . , [B]E [en]E = [A]E [B]E sI 1, . . . , sI n = = [A]E [B]E I = [A]E [B]E . Platí tedy [AB]E = [A]E [B]E . (14.10) Při odvození jsme použili toho, že souřadnice jednotlivých vektorů báze v téže bázi jsou prvky příslušného sloupce jednotkové matice. Příklad 14.5. S využitím řešení příkladu 14.3 vypočtěte matici druhé derivace D2 = = DD na prostoru P3 všech mnohočlenů nejvýše druhého stupně v bázi E = (e1, e2, e3), e1(x) = 1, e2(x) = x, e3(x) = x2. Řešení: V příkladu 14.3 jsme si ukázali, že derivace D má v bázi E = (e1, e2, e3) matici [D]E = 0 1 0 0 0 2 0 0 0 . Podle (14.10) tedy D2 E = [DD]E = [D]E [D]E = = 0 1 0 0 0 2 0 0 0 0 1 0 0 0 2 0 0 0 = 0 0 2 0 0 0 0 0 0 . 86 14.7 Změna báze 14.7 Změna báze Nyní se budeme zabývat otázkou, jak se změní souřadnice vektoru a matice lineárního zobrazení při změně báze. Nechť U je vektorový prostor konečné dimenze a nechť E = (e1, ..., en) a F = = (f1, ..., fn) jsou dvě báze U. Nechť A : U U je libovolné lineární zobrazení a nechť C : U U je lineární zobrazení, které každému vektoru ei báze E přiřazuje vektor C(ei) = fi. Zobrazení C tedy zobrazuje bázi E na bázi F, takže podle důsledku 13.4 je C prosté a existuje C-1. Nejprve si ukážeme, jak se změní souřadnice xi libovolného vektoru x při přechodu od báze E k bázi F a obráceně. K tomu si stačí všimnout, že z x = x1e1 + . . . + xnen plyne C(x) = x1f1 + . . . + xnfn, takže [C(x)]F = [x]E . Pomocí (14.9) odtud dostaneme [C]F [x]F = [x]E , odkud s použitím označení T = [C]-1 F = C-1 F dostaneme [x]F = T [x]E . (14.11) Matice T se nazývá matice zpětného přechodu od nové báze F k bázi E. Nyní můžeme hledat vztah mezi [A]E a [A]F . Platí [A]F = [A(f1)]F , . . . , [A(fn)]F = T [A(f1)]E , . . . , T [A(fn)]E = = T [A(f1)]E , . . . , [A(fn)]E = T [A]E [f1]E , . . . , [A]E [fn]E = = T [A]E T-1 [f1]F , . . . , T-1 [fn]F = T [A]ET-1 sI 1, . . . , sI n = = T [A]ET-1 . Platí tedy [A]F = T [A]ET-1 . (14.12) Místo matice T můžeme uvažovat matici přechodu S = [C]E od původní báze E k bázi F. Mezi maticí zpětného přechodu T a maticí přechodu S platí vztah TS = T [C(e1)]E , . . . , [C(en)]E = T [f1]E , . . . , T [fn]E = [f1]F , . . . , [fn]F = I, takže T = S-1. Dosazením do (14.11) dostaneme po úpravě [x]E = S [x]F . (14.13) Povšimněme si, že názvy matice přechodu a matice zpětného přechodu se vztahují k popisu změny báze, nikoliv k popisu změny souřadnic. 87 Kapitola 14. Lineární zobrazení a matice 14.8 Podobnost matic Výše uvedená rovnost (14.12) je motivací pro nový pojem. Definice: Čtvercové matice A a B stejného řádu jsou podobné, jestliže existuje regulární matice T tak, že A = TBT-1 . Úvahy článku 14.7 můžeme shrnout pomocí nového pojmu do stručné věty. Věta: Matice dané lineární transformace v různých bázích jsou podobné. Dá se dokázat i tvrzení, že jsou-li matice podobné, pak jsou maticemi nějaké lineární transformace v různých bázích. Jelikož podstatné charakteristiky lineárních transformací (například hodnost nebo defekt) nezávisí na bázi prostoru, dá se očekávat, že podobné matice budou mít podstatné charakteristiky shodné. Připomeňme, že o vektoru se ze souřadnic nedovíme obecně více než to, je-li nulový nebo nenulový. Snadno lze dokázat, že každá matice je podobná sama sobě, že je-li A podobná B a B podobná C, pak A je také podobná C, a konečně je-li A podobná B, pak je i B podobná A. Například poslední tvrzení vyplývá z ekvivalence rovností A = TBT-1 a B = T-1AT. 88 15. Bilineární formy V 1. kapitole jsme si sestavili soustavu rovnic (1.6) pro neznámé potenciály x1, x2 obvodu z obr. 1.1. Soustava lineárních rovnic však není jedinou možností, jak popsat elektrický obvod nebo jiný lineární problém. Ukazuje se, že někdy je výhodné přejít k jiné formulaci, která v našem případě spočívá v sečtení obou rovnic soustavy vynásobených postupně ,,virtuálními (myšlenými) potenciály y1, y2 tak, že dostaneme -2x1y1 + x1y2 + x2y1 - 3x2y2 = -10y2. (15.1) Úloha najít řešení x1, x2 soustavy (1.6) je pak ekvivalentní úloze najít x1, x2 tak, aby rovnost (15.1) platila pro všechna y1, y2. Výraz na levé straně rovnice (15.1) můžeme považovat za funkci dvou proměnných aritmetických vektorů x = [x1, x2] a y = [y1, y2], která je při jednom zafixovaném argumentu lineární ve druhém argumentu. To však je vlastnost, která má smysl pro každou funkci dvou argumentů z vektorového prostoru. Ukazuje se, že takové funkce jsou nepostradatelným nástrojem pro vyjádření fyzikálních zákonů ve formě vhodné pro numerické řešení technických problémů pomocí takzvaných variačních metod. V tomto textu je využijeme ke studiu geometrie vektorového prostoru. 15.1 Definice a příklady Definice: Nechť V je reálný vektorový prostor. Zobrazení B : V × V R se nazývá bilineární forma, jestliže pro libovolné u, v, w V a R platí: (B1) B(u + v, w) = B(u, w) + B(v, w) (B2) B(u, v) = B(u, v) (B3) B(u, v + w) = B(u, v) + B(u, w) (B4) B(u, v) = B(u, v) Bilineární funkce je tedy při zvolené hodnotě jedné proměnné lineární funkcí druhé proměnné. Můžeme ji považovat za zobecnění funkce z = axy dvou proměnných x a y na vektorové prostory. Příklad 15.1. Na prostoru V = R3 sloupcových vektorů dimenze 3 si definujeme formu B předpisem, který každé dvojici vektorů x = [xi] a y = [yi] přiřazuje B(x, y) = x y = x1y1 + x2y2 + x3y3. (15.2) Interpretujeme-li x jako sílu a y jako dráhu, pak B(x, y) je práce konaná silou x po dráze y. Snadno se ověří, že B je bilineární forma. Příklad 15.2. Nechť A = [aij] je daná reálná čtvercová matice řádu 2. Pak zobrazení, které každé dvojici sloupcových vektorů druhého řádu x = [xi] a y = [yi] přiřazuje B(x, y) = x Ay = a11x1y1 + a12x1y2 + a21x2y1 + a22x2y2, (15.3) je bilineární forma. 89 Kapitola 15. Bilineární formy Příklad 15.3. Nechť F je vektorový prostor všech reálných funkcí. Pak předpis, který každé dvojici funkcí f F a g F přiřazuje B(f, g) = f(1)g(1) + f(2)g(2), (15.4) definuje bilineární formu. 15.2 Klasifikace bilineárních forem Nechť V je libovolný vektorový prostor. Bilineární forma B se nazývá symetrická, jestliže pro libovolné vektory u, v V platí B(u, v) = B(v, u) (15.5) a antisymetrická, jestliže B(u, v) = -B(v, u). (15.6) Antisymetrické formy lze ekvivalentně charakterizovat též rovností B(u, u) = 0 (15.7) pro libovolné u V. Skutečně, platí-li (15.7), pak B(u + v, u + v) = B(u, v) + B(v, u) = 0, odkud dostaneme (15.6). Obráceně z (15.6) plyne B(u, u) = -B(u, u), tedy platí (15.7). Bilineární formy (15.2) a (15.4) jsou zřejmě symetrické, zatímco forma (15.3) je symetrická, právě když A = A. Bilineární forma (15.3) bude antisymetrická, právě když A = -A, což splňuje například matice 0 1 -1 0 . Bilineární forma (15.3) s touto maticí splňuje B(x, y) = x1y2 - x2y1 = -(y1x2 - y2x1) = -B(y, x). Každou bilineární formu můžeme vyjádřit ve tvaru součtu symetrické a antisymetrické formy, neboť B(u, v) = 1 2 B(u, v) + B(v, u) + 1 2 B(u, v) - B(v, u) . (15.8) Bilineární formy BS(u, v) = 1 2 B(u, v) + B(v, u) a BA(u, v) = 1 2 B(u, v) - B(v, u) splňují BS(u, v) = BS(v, u) a BA(u, v) = -BA(v, u). Formy BS a BA se nazývají po řadě symetrická část a antisymetrická část bilineární formy B. 90 15.3 Matice bilineární formy 15.3 Matice bilineární formy Nechť V je vektorový prostor s bází E = (e1, . . . , en) a nechť B je bilineární forma na V. Nechť x, y V jsou dva vektory, které lze zapsat pomocí souřadnic ve tvaru x = x1e1 + . . . + xnen, y = y1e1 + . . . + ynen. Pak B(x, y) = B(x1e1 + . . . + xnen, y) = x1B(e1, y) + . . . + xnB(en, y) = = x1, . . . , xn B(e1, y) ... B(en, y) = x1, . . . , xn B(e1, y1e1 + . . . + ynen) ... B(en, y1e1 + . . . + ynen) = = x1, . . . , xn B(e1, e1)y1 + . . . + B(e1, en)yn ... B(en, e1)y1 + . . . + B(en, en)yn = = x1, . . . , xn B(e1, e1) . . . B(e1, en) ... B(en, e1) . . . B(en, en) y1 ... yn , což můžeme pomocí označení [B]E = [B(ei, ej)] zapsat stručně ve tvaru B(x, y) = [x] E [B]E [y]E . (15.9) Matici [B]E nazýváme maticí bilineární formy B v bázi E. Příklad 15.4. Najděte matici bilineární formy (15.4) definované na prostoru P2 všech mnohočlenů nejvýše druhého stupně v bázi E = (e1, e2, e3), kde e1(x) = 1, e2(x) = = x, e3(x) = x2. Výsledek využijte k vyčíslení B(p, q) pro p(x) = 1 - x a q(x) = x2 - x. Řešení: Podle vztahu (15.4) vypočteme postupně: B(e1, e1) = e1(1)e1(1) + e1(2)e1(2) = 1 1 + 1 1 = 2 B(e1, e2) = e1(1)e2(1) + e1(2)e2(2) = 1 1 + 1 2 = 3 B(e1, e3) = e1(1)e3(1) + e1(2)e3(2) = 1 1 + 1 4 = 5 B(e2, e2) = e2(1)e2(1) + e2(2)e2(2) = 1 1 + 2 2 = 5 B(e2, e3) = e2(1)e3(1) + e2(2)e3(2) = 1 1 + 2 4 = 9 B(e3, e3) = e3(1)e3(1) + e3(2)e3(2) = 1 1 + 4 4 = 17 Ostatní prvky matice formy dopočteme ze symetrie B(ei, ej) = ei(1)ej(1) + ei(2)ej(2) = ej(1)ei(1) + ej(2)ei(2) = B(ej, ei), takže [B]E = 2 3 5 3 5 9 5 9 17 . 91 Kapitola 15. Bilineární formy Jelikož [p]E = 1 -1 0 a [q]E = 0 -1 1 , platí B(p, q) = 1 -1 0 2 3 5 3 5 9 5 9 17 0 -1 1 = 1 -1 0 2 4 8 = -2. 15.4 Matice symetrické formy Věta: Nechť B je bilineární forma na vektorovém prostoru V konečné dimenze. Pak B je symetrická, právě když matice B v libovolné bázi E prostoru V splňuje [B]E = [B] E. (15.10) Důkaz: Je-li B symetrická bilineární forma, pak B(ei, ej) = B(ej, ei) a vztah (15.10) platí. Obráceně, nechť platí (15.10). Pak podle (15.9) pro libovolné vektory x, y V platí B(x, y) = [x] E [B]E [y]E = [x] E [B]E [y]E = [y] E [B] E [x]E = [y] E [B]E [x]E = = B(y, x), takže forma B je symetrická. Matice A, která splňuje A = A, se nazývá symetrická matice, takže větu lze zformulovat stručně také tak, že bilineární forma na prostoru konečné dimenze je symetrická, právě když má v libovolné bázi symetrickou matici. 15.5 Změna matice bilineární formy při změně báze Nechť U je vektorový prostor konečné dimenze a nechť E = (e1, ..., en) a F = = (f1, ..., fn) jsou dvě báze U. Nechť S je matice přechodu od báze E k nové bázi F, takže pro libovolný vektor x U platí podle (14.13) [x]E = S [x]F . S použitím (15.9) dostaneme pro libovolné dva vektory x, y U a bilineární formu B na U [x] F [B]F [y]F = B(x, y) = [x] E [B]E [y]E = [x] F S [B]E S [y]F . Zvolíme-li x = fi a y = fj, snadno si ověříme, že prvky v i-tém řádku a j-tém sloupci matic [B]F a S[B]E S jsou stejné, tedy [B]F = S [B]E S. (15.11) Odtud dostaneme s použitím matice zpětného přechodu T = S-1 od báze F k bázi E [B]E = T [B]F T. (15.12) 92 15.6 Kongruentní matice 15.6 Kongruentní matice Výše uvedená rovnost (15.11) je motivací pro nový pojem. Definice: Čtvercová matice A je kongruentní s maticí B, jestliže existuje regulární matice T tak, že A = T BT. Úvahy předchozího článku můžeme shrnout pomocí nového pojmu do následující věty. Věta: Matice dané bilineární formy v různých bázích jsou kongruentní. Je možno dokázat i tvrzení, že jsou-li matice kongruentní, pak jsou maticemi nějaké bilineární formy v různých bázích. Jelikož podstatné vlastnosti bilineárních forem (například symetrie) nezávisí na bázi prostoru, dá se očekávat, že kongruentní matice budou mít podstatné charakteristiky shodné. Snadno lze také dokázat, že každá matice je kongruentní sama se sebou, že je-li A kongruentní s B a B kongruentní s C, pak A je také kongruentní s C, a konečně je-li A kongruentní s B, pak je i B kongruentní s A. Například je-li A kongruentní s B, pak po přenásobení rovnosti A = TBT zleva T- = (T)-1 a zprava T-1 dostaneme B = T-AT-1 . Matice B je tedy kongruentní s A, neboť si můžeme snadno ověřit, že platí T- = (T-1). 93 16. Kvadratické formy Dosadíme-li do bilineární formy za oba argumenty tentýž vektor, dostaneme speciální funkci jedné vektorové proměnné. Například pro y1 = x1 a y2 = x2 dostaneme na levé straně rovnice (15.1) funkci jedné vektorové proměnné x = [x1, x2] ve tvaru Q(x) = -2x2 1 + 2x1x2 - 3x2 2. (16.1) Ukazuje se, že takové speciální funkce mohou v některých důležitých případech nahradit původní bilineární formu. Přechod ke skalární funkci jedné vektorové proměnné je základem takzvaných energetických metod řešení technických problémů a usnadňuje řešení některých dalších úloh, jak si v tomto textu ukážeme například na řešení nekonzistentních soustav. 16.1 Definice a příklady Definice: Nechť V je vektorový prostor a nechť B je bilineární forma na V. Zobrazení QB definované pro libovolné x V předpisem QB(x) = B(x, x) se nazývá kvadratická forma příslušná bilineární formě B. Kvadratickou formou budeme stručně nazývat zobrazení Q definované na V, pro které existuje bilineární forma B na V tak, že Q = QB. Kvadratickou formu můžeme považovat za zobecnění funkce y = ax2 na vektorové prostory. Příklad 16.1. Na prostoru V = R3 sloupcových vektorů dimenze 3 je definováno zobrazení Q, které každému vektoru x = [xi] přiřazuje Q(x) = x x = x2 1 + x2 2 + x2 3, (16.2) což je kvadratická forma příslušná bilineární formě definované rovností (15.2). Interpretujeme-li x jako polohový vektor, pak Q(x) je druhá mocnina jeho délky. Příklad 16.2. Nechť A = [aij] je daná reálná čtvercová matice řádu 2. Pak zobrazení, které každému sloupcovému vektoru x = [xi] dimenze dvě přiřazuje Q(x) = x Ax = a11x2 1 + (a12 + a21)x1x2 + a22x2 2 (16.3) je kvadratická forma příslušná bilineární formě definované rovností (15.3). Příklad 16.3. Nechť F je prostor všech reálných funkcí. Pak předpis, který každé funkci f F přiřazuje Q(f) = f(1)2 + f(2)2 , (16.4) definuje kvadratickou formu příslušnou bilineární formě definované rovností (15.4). 94 16.2 Základní vlastnosti 16.2 Základní vlastnosti Nechť V je reálný vektorový prostor. Jelikož pro každou bilineární formu B na V, x V a reálné platí B(x, x) = 2B(x, x), platí pro každou kvadratickou formu Q na V, x V a reálné rovnost Q(x) = 2 Q(x). (16.5) Odtud bezprostředně plyne, že Q(o) = Q(0 o) = 0 a že obor hodnot H(Q) každé kvadratické formy Q obsahuje s každým číslem i jeho nezáporné násobky. Obor hodnot nulové kvadratické formy definované předpisem Q(x) = 0 obsahuje pouze číslo 0. Pro každou bilineární formu B na V a libovolné x, y V platí také B(x + y, x + y) = B(x, x) + B(x, y) + B(y, x) + B(y, y), takže BS (x, y) = 1 2 B(x, y) + B(y, x) = 1 2 QB(x + y) - QB(x) - QB(y) . (16.6) Jelikož pro libovolnou symetrickou bilineární formu B na V platí B = BS, plyne z (16.6), že každá symetrická bilineární forma B na V je plně určena svou kvadratickou formou. Při studiu kvadratických forem se můžeme omezit na kvadratické formy příslušné symetrickým bilineárním formám, neboť pro libovolnou bilineární formu B na V a x V platí QB(x) = BS (x, x). (16.7) 16.3 Matice kvadratické formy Nechť V je vektorový prostor konečné dimenze s bází E = (e1, . . . , en) a nechť Q je daná kvadratická forma příslušná bilineární formě B. Pak můžeme pro libovolný vektor x V vyčíslit hodnotu Q(x) pomocí jeho souřadnic a matice bilineární formy B vzhledem k bázi E ze vztahu Q(x) = B(x, x) = [x] E [B]E [x]E , který dostaneme z (15.9). Je proto přirozené považovat matici [B]E za matici kvadratické formy Q příslušné bilineární formě B v bázi E. Podle (16.7) však kvadratická forma příslušná B přísluší též symetrické části BS bilineární formy B. Jelikož matice libovolné symetrické formy v dané bázi je symetrická, je výhodné definovat matici kvadratické formy QB příslušné k bilineární formě B jako symetrickou matici [QB] = BS . (16.8) Při studiu matic kvadratických forem se tedy můžeme omezit na symetrické matice. 95 Kapitola 16. Kvadratické formy 16.4 Diagonální tvar matice kvadratické formy Jedním z důležitých problémů při studiu kvadratických forem je určit, jakých hodnot může nabývat daná kvadratická forma. Na tuto otázku můžeme snadno odpovědět, máme-li matici kvadratické formy v diagonálním tvaru, neboť pak se hodnota kvadratické formy v daném vektoru vypočte jako součet druhých mocnin souřadnic tohoto vektoru, tedy kladných čísel, násobených diagonálními prvky. Tak například hned vidíme, že kvadratická forma (16.2) nabývá kladné hodnoty pro libovolný vektor x = o. Není-li matice kvadratické formy v diagonálním tvaru, nemůžeme obvykle najít její obor hodnot bezprostředně, avšak můžeme se pokusit upravit formu na tvar, ze kterého lze obor hodnot poznat. Například doplňováním čtverců formy Q definované rovností (16.1) dostaneme pro x = [x1, x2] Q(x) = -2x2 1 + 2x1x2 - 3x2 2 = -2 x2 1 - 2x1( 1 2 x2) + ( 1 2 x2)2 + 1 2 x2 2 - 3x2 2 = = -2(x1 - 1 2 x2)2 - 5 2 x2 2, (16.9) takže Q(x) < 0 pro x = o. Úpravu, kterou jsme použili při redukci Q na lineární kombinaci mocnin, můžeme popsat jako změnu báze. Zapíšeme-li si substituci y1 = x1 - 1 2x2, y2 = x2 ve tvaru y = Tx s x = x1 x2 , y = y1 y2 , T = 1 -1 2 0 1 a všimneme-li si, že x = [x]S, kde S = (sI 1, sI 2) je standardní báze R2, pak můžeme považovat y za souřadnice x v nové bázi E = (e1, e2), která je určena maticí zpětného přechodu T od E k S. Podle (15.12) tedy platí [Q]S = T [Q]ET, což si můžeme ověřit také vyhodnocením rovnosti -2 1 1 -3 = 1 0 -1 2 1 -2 0 0 -5 2 1 -1 2 0 1 . K matici zpětného přechodu T můžeme určit matici přechodu S od báze S k bázi E S = T-1 = 1 1 2 0 1 , kterou můžeme také zapsat ve tvaru S = [C]S pomocí matice lineárního zobrazení C zobrazujícího bázi S na novou bázi E. Odtud e1 = [e1]S = [C]S sI 1 = 1 1 2 0 1 1 0 = 1 0 e2 = [e2]S = [C]S sI 2 = 1 1 2 0 1 0 1 = 1 2 1 . 96 16.5 Kvadratické formy v R2 Jelikož Q je kvadratická forma příslušná symetrické bilineární formě B(x, y) = -2x1y1 + x1y2 + x2y1 - 3x2y2, můžeme ověřit výpočtem, že B(e1, e1) = -2, B(e1, e2) = B(e2, e1) = 0, B(e2, e2) = - 5 2 , tedy [Q]E = [QB]E = -2 0 0 -5 2 . 16.5 Kvadratické formy v R2 Libovolnou kvadratickou formu na R2 můžeme zapsat buďto pomocí složek ve tvaru Q(x) = ax2 1 + 2bx1x2 + cx2 2, (16.10) nebo maticově ve tvaru Q(x) = x Ax, x = x1 x2 , A = a b b c . Matici A přitom můžeme považovat za matici Q ve standardní bází S = (sI 1, sI 2). Budeme se zabývat otázkou, na jaký tvar lze redukovat matici A přechodem ke vhodné nové bázi. Pro zjednodušení výkladu se omezíme na hledání redukovaného tvaru vhodného násobku formy Q, takže pro nenulovou formu můžeme předpokládat, že některý nenulový koeficient formy Q je roven jedné. Předpokládejme nejprve, že a = 1, takže doplněním čtverců můžeme upravit (16.10) na tvar Q(x) = x2 1 + 2x1(bx2) + (bx2)2 + (c - b2 )x2 2 = (x1 + bx2)2 + (c - b2 )x2 2. (16.11) Budeme rozlišovat dva případy. Jestliže c - b2 = 0, pak pomocí substituce y1 = x1 + bx2, y2 = |c - b2|x2 (16.12) dostaneme jeden z tvarů Q(x) = y2 1 + y2 2, Q(x) = y2 1 - y2 2. Zapíšeme-li si substituci (16.12) v maticovém tvaru y = Tx s x = x1 x2 , y = y1 y2 , T = 1 b 0 |c - b2| , můžeme provedenou úpravu zapsat též v maticovém tvaru Q(x) = x Ax = x T DTx = y Dy, (16.13) 97 Kapitola 16. Kvadratické formy kde D je jedna z matic D1 = 1 0 0 1 , D2 = 1 0 0 -1 . (16.14) Matici T přitom můžeme považovat za matici zpětného přechodu od nové báze E ke standardní bázi S, takže platí y = [x]E = T [x]S = Tx, [Q]E = D, Q(x) = [x] E [Q]E [x]E = y Dy. Jestliže c - b2 = 0, pak pomocí substituce y1 = x1 + bx2, y2 = x2 dostaneme Q(x) = y2 1. Zapíšeme-li si tuto substituci opět v maticovém tvaru s T = 1 b 0 1 , můžeme provedenou úpravu zapsat též v maticovém tvaru (16.13) s D = 1 0 0 0 . (16.15) Ukazuje se, že každá nenulová kvadratická forma (nebo její násobek) má ve vhodné bázi jednu z matic (16.14) nebo (16.15). Pro a = 0 a c = 0 stačí zopakovat předchozí úvahy s tím, že zaměníme a s c a x1 s x2. Pokud a = c = 0, pak pro vhodný násobek Q bude b = 1/2. Položíme-li x1 = y1 + y2, x2 = y1 - y2, (16.16) dostaneme Q(x) = y2 1 - y2 2. Odtud najdeme transformaci y1 = 1 2 (x1 + x2), y1 = 1 2 (x1 - x2), kterou můžeme považovat za přechod k souřadnicím v nové bázi s maticí zpětného pře- chodu T = 1 2 1 1 1 -1 . Přímým výpočtem si lze ověřit, že platí (16.13) s maticí D = D2 z (16.14). Zahrneme-li do našich úvah i nulovou kvadratickou formu, dojdeme k závěru, že každou kvadratickou formu na R2 můžeme redukovat vhodnou substitucí či přechodem k jiné bázi na jeden z tvarů Q1(x) = x2 1 + x2 2, Q2(x) = x2 1 - x2 2, Q3(x) = x2 1, Q4(x) = 0, který lze identifikovat z hodnot, jichž může nabývat forma Q na množině R2\{o}. Každý z těchto tvarů má charakteristický název, který je uveden na obr. 16.1 spolu se znázorněním grafu z = Q(x). 98 16.6 Pozitivně definitní kvadratické formy -2 0 2 -2 0 2 x Q(x) x1 x2 z b) Hyperbolická forma ( ) 2 2 2 1 xxQ -=x 2 2 2 1 xxz -= -2 0 2 -2 0 2x Q(x) x1 x2 z c) Parabolická forma ( ) 2 1xQ =x 2 1xz = -2 0 2 -2 0 2 x x1x2 z d) Nulová forma ( ) 0=xQ z = 0 0 2 -2 0 2 x Q(x) x1 x2 z a) Eliptická forma ( ) 2 2 2 1 xxQ +=x 2 2 2 1 xxz += Obr. 16.1: Kvadratické formy na R2. 16.6 Pozitivně definitní kvadratické formy Mimořádný význam v aplikacích mají kvadratické formy, jejichž obor hodnot tvoří nezáporná čísla, takže je lze považovat za zobecnění eliptické a parabolické formy z obr. 16.1. Definice: Kvadratická forma Q na vektorovém prostoru V se nazývá pozitivně definitní, jestliže pro libovolné x V, x = o platí Q(x) > 0. Jestliže pro libovolné x V platí Q(x) 0, pak se Q nazývá pozitivně semidefinitní. Příklad 16.4. Kvadratická forma (16.2) je pozitivně definitní. Příklad 16.5. Kvadratická forma q = -Q, kde Q je definována rovností (16.1), je pozitivně definitní. Vyplývá to z úpravy formy na tvar (16.8). Příklad 16.6. Kvadratická forma (16.4) také nabývá pouze nezáporných hodnot, avšak Q(f) = 0 například pro nenulovou funkci f(x) = (x - 1)(x - 2). Kvadratická forma (16.4) je proto pouze pozitivně semidefinitní. 99 Kapitola 16. Kvadratické formy Je-li V je vektorový prostor konečné dimenze s bází E a je-li Q je pozitivně definitní kvadratická forma, pak pro libovolné x = o platí [x]E = o a Q(x) = [x] E [Q]E [x]E > 0. (16.17) Nerovnost (16.17), kterou splňuje matice pozitivně definitní kvadratické formy, má smysl pro každou symetrickou matici A, kterou budeme nazývat pozitivně definitní, jestliže pro každý sloupcový vektor x = o platí xAx > 0, a pozitivně semidefinitní, jestliže xAx 0 pro libovolný sloupcový vektor x. Kvadratická forma je tedy pozitivně definitní (semidefinitní), právě když je její matice v libovolné bázi pozitivně definitní (semidefi- nitní). Každá pozitivně definitní matice má kladnou diagonálu. Skutečně, je-li A = [aij] pozitivně definitní matice, pak pro libovolný sloupec s = sI i jednotkové matice platí 0 < s As = aii. Je-li D diagonální matice s diagonálními prvky d1, . . . , dn a x = [xi], pak x Dx = d1x2 1 + . . . + dnx2 n. Matice D je tedy pozitivně definitní, právě když d1 > 0, . . . , dn > 0. Jelikož pozitivní definitnost je vlastnost kvadratické formy, která se přenáší na matice kvadratické formy, plyne odtud, že symetrická matice kongruentní s diagonální maticí je pozitivně definitní, právě když tato diagonální matice má kladné diagonální prvky. Obdobné tvrzení platí i pro pozitivně semidefinitní matice. S dalšími vlastnostmi pozitivně definitních matic se budeme seznamovat postupně v dalších kapitolách. 100 17. Kongruence symetrických a diagonálních matic V článku 15.6 jsme si zavedli pro symetrické matice relaci kongruence a ukázali jsme si, že jakékoliv kongruentní matice můžeme považovat za souřadnice téže kvadratické formy v různých bázích. Pro kvadratické formy na prostoru dimenze dvě jsme si dokonce dokázali, že mezi symetrickými maticemi dané kvadratické formy v různých bázích je vždy diagonální matice, přičemž počet jejích kladných či záporných prvků nezávisí na volbě báze. V této kapitole si tyto výsledky zobecníme a ukážeme si efektivní výpočetní postupy pro nalezení diagonální matice, která je kongruentní s danou symetrickou maticí. 17.1 Diagonální redukce pozitivně definitní matice Pro další studium kongruencí použijeme elementární řádkové operace a jejich maticový zápis. Novinkou však bude to, že ke každé elementární operaci budeme následně uvažovat její sloupcovou variantu a místo o elementárních operacích budeme mluvit o elementárních kongruencích. Je-li tedy T matice některé elementární operace s řádky čtvercové matice A (viz článek 6.1), pak matici upravenou příslušnou elementární kongruencí lze zapsat ve tvaru TAT . Spojíme-li toto pozorování s postupy, které jsme používali při studiu LU rozkladů, snadno dokážeme následující tvrzení, které lze použít k ověření pozitivní definitnosti matice nebo k řešení soustav s pozitivně definitní maticí. Věta: Nechť A je pozitivně definitní matice. Pak existuje regulární dolní trojúhelníková matice L a diagonální matice D s kladnou diagonálou tak, že LAL = D. (17.1) Důkaz: Nechť A = [aij] je daná pozitivně definitní matice řádu n. V článku 16.6 jsme si ukázali, že každá pozitivně definitní matice má kladné diagonální prvky, takže a11 > 0. S pomocí maticového zápisu elementárních operací najdeme, stejně jako v důkazu věty 7.3, dolní trojúhelníkovou matici L1, pro kterou platí L1A = a11 a12 . . . a1n 0 a1 22 . . . a1 2n ... ... ... ... 0 a1 n2 . . . a1 nn . (17.2) Jelikož A je symetrická, plyne odtud, že matice (L1A) = AL1 má stejný první sloupec jako A, takže L1AL1 = a11 o o A1 , (17.3) kde A1 = a1 22 . . . a1 2n ... ... ... a1 n2 . . . a1 nn . 101 Kapitola 17. Kongruence symetrických a diagonálních matic Matice A1 je však nejen symetrická, jak je patrné z (17.3), nýbrž i pozitivně definitní, neboť pro každý vektor x = 0 y , kde y = o, platí 0 < x L1AL1 x = y A1y. Opakováním tohoto postupu najdeme dolní trojúhelníkové matice L2, . . . , Ln-1 tak, že pro L = Ln-1 L1 platí (17.1). Jelikož L je součin regulárních dolních trojúhelníkových matic, je L, podle článku 7.2, také dolní trojúhelníková matice. Důkaz je založen na mírné modifikaci postupu uvedeného v článku 7.4 a dává nám současně návod, jak L a D nalézt. Příklad 17.1. Najděte diagonální matici D, která je kongruentní s pozitivně definitní maticí A = 2 -1 0 -1 2 -1 0 -1 2 . (17.4) Řešení: Matici A upravíme spolu s jednotkovou maticí na horní trojúhelníkovou matici. Dostaneme: A I = 2 -1 0 1 0 0 -1 2 -1 0 1 0 r2 + 1 2r1 0 -1 2 0 0 1 2 -1 0 1 0 0 0 3 2 -1 1 2 1 0 0 -1 2 0 0 1 r3 + 2 3r2 2 -1 0 1 0 0 0 3 2 -1 1 2 1 0 0 0 4 3 1 3 2 3 1 Snadno si ověříme, že pro L = 1 0 0 1 2 1 0 1 3 2 3 1 , D = 2 0 0 0 3 2 0 0 0 4 3 (17.5) platí LAL = 1 0 0 1 2 1 0 1 3 2 3 1 2 -1 0 -1 2 -1 0 -1 2 1 1 2 1 3 0 1 2 3 0 0 1 = D. 102 17.2 LDL rozklad a řešení soustav s pozitivně definitní maticí 17.2 LDL rozklad a řešení soustav s pozitivně definitní maticí Rozklad (17.1) je základem efektivních algoritmů pro řešení soustav s pozitivně definitními maticemi, neboť je ekvivalentní rozkladům A-1 = L D-1 L nebo A = LDL , L = L-1 . (17.6) Příklad 17.2. Využijte řešení příkladu 17.1 k řešení soustavy: 2x1 - x2 = 1 -x1 + 2x2 - x3 = 0 -x2 + 2x3 = 1 (17.7) Řešení: Matice soustavy A je dána rovností (17.4), takže pro L a D definované rovností (17.5) platí LAL = D a A = L-1DL-. Označíme-li si b pravou stranu soustavy (17.7), můžeme si vyjádřit její řešení ve tvaru x = A-1 b = L D-1 (Lb) = 1 1 2 1 3 0 1 2 3 0 0 1 1 2 0 0 0 2 3 0 0 0 3 4 1 0 0 1 2 1 0 1 3 2 3 1 1 0 1 = 1 1 1 . Soustava (17.7) má tedy řešení x1 = 1, x2 = 1, x3 = 1. 17.3 Kongruence symetrické a diagonální matice Doplněním důkazu věty 17.1 můžeme dokázat, že každá symetrická matice je kongruentní s diagonální maticí. Věta: Nechť A = [aij] je symetrická matice. Pak existuje regulární matice T a diagonální matice D tak, že TAT = D. (17.8) Důkaz: Nechť A = [aij] je symetrická matice řádu n. Jestliže a11 = 0 a některý mimodiagonální prvek ai1 = a1i je nenulový, pak přičtením nebo odečtením i-tého řádku k prvnímu řádku a následným provedením obdobné operace se sloupci můžeme dostat do levého horního rohu nenulový prvek. Můžeme se o tom přesvědčit úpravou 1 i 1 0 a1i r1 + ri i ai1 aii 1 i 1 ai1 a1i + aii i ai1 aii s1 + si 1 i 1 2ai1 + 2aii a1i + aii i ai1 + aii aii , kde jsme pro přehlednost vynechali řádky a sloupce matice A, které neovlivní prvek v levém horním rohu upravené matice, a dosazením = 1 nebo = -1. Maticový zápis takové úpravy má tvar A = [aij] = G1AG 1, 103 Kapitola 17. Kongruence symetrických a diagonálních matic kde a11 = 0 a G1 je matice tvaru (6.4), která při násobení zleva realizuje přičtení prvního řádku k i-tému řádku nebo odečtení prvního řádku od i-tého řádku, tedy G1 = Gi1(1) nebo G1 = Gi1(-1). Pokud a11 = 0, pak položíme G1 = I a A = A = G1AG 1. Jelikož a11 = 0, pak najdeme, stejně jako v článku 17.1, dolní trojúhelníkovou matici L1 tak, že L1 AL1 = a11 o o A1 . Pro T1 = L1G1 tedy platí T1AT 1 = a11 o o A1 . Celý postup můžeme opakovat, nejprve s maticí A1, k postupné eliminaci mimodiagonálních prvků, až po n - 1 krocích dostaneme pro T = Tn-1 T1 rovnost (17.8). Důkaz věty ukazuje, jak lze najít diagonální matici, která je kongruentní s danou symetrickou maticí. Příklad 17.3. Najděte regulární matici T a diagonální matici D tak, aby pro matici A = 0 1 0 1 0 1 0 1 0 platilo TAT = D. Řešení: Matici A nejprve upravíme na diagonální tvar pomocí elementárních kongruencí. Dostaneme postupně: 0 1 0 r1 + r2 1 0 1 0 1 0 1 1 1 1 0 1 0 1 0 s1 + s2 2 1 1 1 0 1 r2 - 1 2r1 1 1 0 r3 - 1 2r1 2 1 1 0 -1 2 1 2 0 1 2 -1 2 s2 - 1 2s1 s3 - 1 2s1 2 0 0 0 -1 2 1 2 0 1 2 -1 2 r3 + r2 2 0 0 0 -1 2 1 2 0 0 0 s2 + s3 104 17.4 Zákon setrvačnosti kvadratických forem 2 0 0 0 -1 2 0 0 0 0 Matici T najdeme tak, že řádkové operace, které jsme použili k úpravě A, postupně provedeme na jednotkové matici. Dostaneme tak 1 0 0 r1 + r2 0 1 0 0 0 1 1 1 0 0 1 0 r2 - 1 2r1 0 0 1 r3 - 1 2r1 1 1 0 -1 2 1 2 0 -1 2 -1 2 1 r3 + r2 1 1 0 -1 2 1 2 0 -1 0 1 = T. Snadno si ověříme, že platí TAT = 2 0 0 0 -1 2 0 0 0 0 = D. Důsledek: Nechť Q je libovolná kvadratická forma na vektorovém prostoru konečné dimenze. Pak existuje báze F prostoru V tak, že [Q]F je diagonální. Důkaz: Nechť E je libovolná báze prostoru V. Jelikož [Q]E je symetrická matice, existuje podle věty 17.3 regulární matice S tak, že S [Q]E S = D, kde D je diagonální matice. To však je pro S = S ekvivalentní vztahu S[Q]E S = D. Je-li F báze V definovaná maticí přechodu S, pak podle (15.12) platí [Q]F = S[Q]E S = D. 17.4 Zákon setrvačnosti kvadratických forem Následující věta nám říká, že kongruence zachovává i počet kladných, záporných a nulových prvků na diagonále. Poznamenejme, že toto tvrzení jsme si už ukázali pro pozitivně definitní matice a symetrické matice řádu dvě. Věta: Nechť D a E jsou diagonální matice řádu n s diagonálami d1, . . . , dn a e1, . . . , en. Nechť T je regulární a D = TET. Pak počet kladných, záporných i nulových prvků na diagonálách obou matic je shodný. Důkaz: Jelikož násobení regulární maticí zachovává hodnost matice, můžeme předpokládat, že obě matice mají stejný počet h nenulových prvků. Budeme také předpokládat, že diagonály jsou uspořádány tak, že d1 > 0, . . . , dp > 0, dp+1 < 0, . . . , dh < 0, 105 Kapitola 17. Kongruence symetrických a diagonálních matic e1 > 0, . . . , eq > 0, eq+1 < 0, . . . , eh < 0. V opačném případě je přeuspořádáme pomocí elementárních kongruencí odvozených z výměny řádků. Dále budeme předpokládat, že T je regulární matice taková, že D = T ET. (17.9) Kdyby p < q, pak by existovalo řešení x soustavy rovnic x1 = 0, . . . , xp = 0, rT q+1x = 0, . . . , rT h x = 0, které má některou z prvních h složek nenulovou, neboť podle předpokladu je rovnic méně než h. Musí to být zřejmě některá ze složek xp+1, . . . xh, takže platí x Dx < 0, x T ETx 0, což je spor s (17.9). 106 18. Skalární součin a ortogonalita Až doposud jsme se v souvislosti s vektorovými prostory nezabývali velikostí vektorů ani úhly mezi vektory. Napravíme to v této kapitole, kde si zavedeme kosinus úhlu i délku vektorů pomocí bilineární formy a naznačíme možnosti jejich využití. 0 v2 v1 v x2 u2 u1 x1 u 1 2 Obr. 18.1: Úhel vektorů. 18.1 Definice skalárního součinu Jak rozšířit pojem úhlu (či spíše kosinu úhlu) vektorů a délky vektoru na obecný vektorový prostor nám napoví obr. 18.1. Pro kosinus úhlu vektorů u a v platí cos = cos(2 - 1) = cos 1 cos 2 + sin 1 sin 2 = = u1 u2 1 + u2 2 v1 v2 1 + v2 2 + u2 u2 1 + u2 2 v2 v2 1 + v2 2 , zatímco pro délky u , v vektorů u a v platí u = u2 1 + u2 2 a v = v2 1 + v2 2. Prohlédneme-li si oba vzorce, můžeme si všimnout, že obě veličiny, které chceme zobecnit, tedy délka vektoru i kosinus úhlu vektorů, můžeme vyjádřit pomocí jediné symetrické pozitivně definitní bilineární formy (u, v) = u1v1 + u2v2, (18.1) které budeme dále říkat euklidovský skalární součin. S jeho pomocí můžeme vyjádřit jak kosinus úhlu vektorů u, v v R2, tak délku u pomocí vzorců cos = (u, v) (u, u) (v, v) , u = (u, u). (18.2) Vzorce (18.2) mají po zadání bilineární formy smysl pro vektory libovolného vektorového prostoru. To vede k následující definici. 107 Kapitola 18. Skalární součin a ortogonalita Definice: Skalární součin na reálném vektorovém prostoru V je bilineární symetrická pozitivně definitní forma na V. Označíme-li si (u, v) skalární součin vektorů u, v, platí tedy pro jakékoliv vektory u, v, w a R: (S1) (u + v, w) = (u, w) + (v, w) (S2) (u, v) = (u, v) (S3) (u, v) = (v, u) (S4) (u, u) > 0 pro u = o Příklady skalárních součinů na různých vektorových prostorech jsou v článku 16.6. 18.2 Norma vektoru Pokud použijeme vzorec (18.2) pro zavedení délky vektoru pomocí skalárního součinu, bude podle axiomu (S4) zřejmé, že délka vyjde kladná pro nenulový vektor, avšak nebude hned jasné, zda je taková definice v souladu s dalšími vlastnostmi, které obvykle připisujeme délce vektoru. Ukazuje se, že pro aplikace jsou hlavní vlastnosti, které si zformulujeme v následující definici normy vektoru, kterou můžeme považovat za rozšíření délky vektoru z R2 na obecný vektorový prostor. Normu můžeme považovat také za zobecnění absolutní hodnoty reálného nebo komplexního čísla. Definice: Nechť V je vektorový prostor. Zobrazení, které každému vektoru v V přiřazuje nezáporné reálné číslo v , se nazývá norma, jestliže pro každé u, v V a libovolný skalár platí: (N1) u + v u + v (N2) u = || u (N3) u = 0, právě když u = o Příklad 18.1. Předpis u = max{|u1|, |u2|} definuje normu na R2. Množina vektorů s normou menší nebo rovnou 1 je na obr. 18.2. 18.3 Norma indukovaná skalárním součinem V tomto článku si ukážeme, že předpis (18.2) definuje normu ve smyslu odstavce 18.2. Použijeme při tom následující nerovnost. Věta: (Schwarzova nerovnost). Nechť V je reálný vektorový prostor se skalárním součinem. Pak pro každé dva vektory u, v V platí (u, v)2 (u, u)(v, v). (18.3) Rovnost nastane, právě když jsou u, v závislé. 108 18.3 Norma indukovaná skalárním součinem x1 x2 1 v Obr. 18.2: Množina vektorů v 1. Důkaz: Tvrzení je zřejmé, je-li některý z vektorů nulový. Předpokládejme proto, že v = o, a všimněme si, že pro každé dva vektory u, v platí 0 (u + v, u + v) = (u, u) + 2(u, v) + 2 (v, v). Zvolíme-li si = (u, v) (v, v) , dostaneme po úpravě 0 (u, u) (u, v)2 (v, v) , odkud po vynásobení obou stran nerovnosti (v, v) a jednoduché úpravě dostaneme (18.3). Rovnost nastane, jen když (u + v, u + v) = 0, t.j. 1 u + v = o. Z (18.3) plyne, že ani ve vektorovém prostoru nepřevýší absolutní hodnota kosinu úhlu hodnotu 1. Důsledek: Nechť V je vektorový prostor se skalárním součinem a nechť je pro každý vektor v V definováno v = (v, v). Pak pro každé dva vektory u, v V platí u + v u + v (18.4) a zobrazení v v je norma na V. Důkaz: S použitím axiomů skalárního součinu s Schwarzovy nerovnosti dostaneme u + v 2 = (u + v, u + v) = (u, u) + 2(u, v) + (v, v) u 2 + 2 u v + v 2 = ( u + v )2 , takže platí (18.4). Platnost zbývajících dvou axiomů normy je bezprostředním důsledkem axiomů skalárního součinu. 109 Kapitola 18. Skalární součin a ortogonalita Norma definovaná předpisem v = (v, v) se nazývá eukleidovská norma. 18.4 Ortogonální množiny vektorů Definice ortogonality vektorů je motivována známou skutečností, že dva polohové vektory v rovině či prostoru jsou ortogonální, právě když je kosinus jejich úhlu roven nule. Definice: Nechť V je vektorový prostor se skalárním součinem. Množina vektorů E = {e1, . . . , ek} je ortogonální, právě když (ei, ej) = 0 pro i = j. Jestliže navíc (ei, ei) = 1 pro všechna i = 1, . . . , k, pak je E ortonormální. Množina všech vektorů x V, které jsou ortogonální k dané množině vektorů U, se nazývá ortogonální doplněk U (vzhledem k množině V) a značí se U. Je-li E = {e1, . . . , ek} ortogonální množina nenulových vektorů, pak je E nezávislá, neboť po skalárním vynásobení rovnosti x1e1 + . . . + xkek = o vektorem ei E dostaneme (ei, x1e1 + . . . + xkek) = (ei, o), odkud pomocí axiomů skalárního součinu získáme xi(ei, ei) = 0, tedy xi = 0. Obdobným způsobem můžeme vypočítat souřadnice libovolného vektoru x daného vektorového prostoru V v ortogonální bázi E = (e1, . . . , en), neboť z rovnosti x = x1e1 + . . . + xkek dostaneme po skalárním vynásobení obou stran vektorem ei E a úpravě, že xi = (ei, x) (ei, ei) . (18.5) Nemusíme tedy řešit žádnou soustavu rovnic. Neméně snadné je vypočítat eukleidovskou normu x ze souřadnic [x]E, neboť (x, x) = (x1e1 + . . . + xnen, x1e1 + . . . + xnen) = x2 1 + . . . + x2 n. (18.6) Ortogonální soustavy vektorů mají rozsáhlé uplatnění například při analýze signálů, při ekonomickém uchovávání rozsáhlých dat i v matematice. Následující věta popisuje doplněk oboru hodnot matice. Věta: Nechť A je libovolná matice. Pak N(A) je ortogonální doplněk H(A). 110 18.4 Ortogonální množiny vektorů Důkaz: Nechť x H(A) a y N(A). Pak Ay = o a x lze vyjádřit ve tvaru x = Az. Platí tedy x y = (Az) y = z A y = 0, takže množiny N(A) a H(A) jsou ortogonální. Pro matici A typu (m, n) odtud snadno plyne h(A) + d(A) m, takže podle (13.2) platí h(A) h(A). Poslední nerovnost však platí i když nahradíme matici A maticí k ní transponovanou, takže h(A) = h(A) a h(A) + d(A) = h(A) + d(A) = m, takže N(A) je ortogonální doplněk H(A). Příklad 18.2. Nechť e1(x) = x a e2(x) = 1 - x jsou dvě lineární funkce vektorového prostoru P2 všech lineárních funkcí se skalárním součinem definovaným rovností (p, q) = p(0)q(0) + p(1)q(1). (18.7) Snadno se ověří, že předpis (18.7) skutečně definuje skalární součin na P2 a že E = (e1, e2) tvoří ortonormální bázi P2, neboť (e1, e2) = 0(1 - 0) + 1(1 - 1) = 0, (e1, e1) = 1, (e2, e2) = 1. Pak libovolnou lineární funkci e(x) = a + bx můžeme vyjádřit ve tvaru e = 1e1 + 2e2, kde 1 = (e, e1) = e(0) e1(0) + e(1) e1(1) = e(1) = a + b 2 = (e, e2) = e(0) e2(0) + e(1) e2(1) = e(0) = a. Snadno si ověříme, že skutečně platí a + bx = (a + b)x + a(1 - x). Příklad 18.3. Nechť V je vektorový prostor všech po částech konstantních funkcí na intervalu (0, 8], které mají skoky v celých číslech, v nichž jsou spojité zleva. Na tomto prostoru definujeme skalární součin předpisem (f, g) = 8 0 f(x)g(x) dx = f(1)g(1) + f(2)g(2) + . . . + f(8)g(8). Snadno se ukáže, že vektory Haarovy báze H = (h1, . . . , h8), viz obr. 18.3, jsou ortogonální. Vektory jsou uspořádány podle délky intervalu, na kterém jsou nenulové. Takto zvolená báze nám umožňuje analyzovat frekvenci změn funkce. Například podle (18.5) je [f]H 8 = (h8, f) (h8, h8) = f(8) - f(7) 2 , odkud lze usoudit, že velké poslední souřadnice charakterizují častou změnu funkce. 111 Kapitola 18. Skalární součin a ortogonalita 1 -1 1 2 3 4 5 6 7 8 x h1 0 1 -1 1 2 3 4 5 6 7 8 x h2 0 1 -1 1 2 3 4 5 6 7 8 x h3 0 h5 1 -1 1 2 3 4 5 6 7 8 x0 1 -1 1 2 3 4 5 6 7 8 x h4 0 1 -1 1 2 3 4 5 6 7 8 x h6 0 1 -1 1 2 3 4 5 6 7 8 x h8 0 1 -1 1 2 3 4 5 6 7 8 x h7 0 Obr. 18.3: Haarova báze. 18.5 Schmidtův ortogonalizační proces Kde vzít ortogonální bázi? V tomto článku si ukážeme, že z každé báze F = = (f1, . . . , fn) prostoru V lze sestavit ortogonální bázi E = (e1, . . . , en), která má tu vlastnost, že každý vektor ei je lineární kombinací vektorů f1, . . . , fi. Na začátku si všimneme, že f1 = o, a položíme e1 = f1. Předpokládejme, že máme ortogonální vektory e1, . . . , ek takové, že pro každé i {1, . . . , k} je vektor ei lineární kombinací vektorů f1, . . . , fi. Najdeme koeficienty 1, . . . , k tak, aby ek+1 = fk+1 - 1e1 - . . . - kek byl ortogonální k e1, . . . , ek. Jelikož pro i {1, . . . , k} by mělo platit 0 = (ek+1, ei) = (fk+1 - 1e1 - . . . - kek, ei) = (fk+1, ei) - i ei 2 , stačí položit i = (fk+1, ei)/ ei 2. Vektor ek+1 je zřejmě nenulový, neboť jej můžeme vyjádřit jako lineární kombinaci vektorů f1, . . . , fk+1 s koeficientem 1 u fk+1. Právě popsaný algoritmus se nazývá Schmidtův ortogonalizační proces. Normalizací vektorů báze E = (e1, . . . , en) dostaneme ortonormální bázi G = (g1, . . . , gn) s vektory g1 = e1 e1 , . . . , gn = en en . 112 18.6 Ortogonální matice Příklad 18.4. Nechť A = 2 -1 0 -1 2 -1 0 -1 2 . Najděte ortogonální bázi R3 vzhledem ke skalárnímu součinu (x, y)A = x Ay. Řešení: Bázi sestavíme Schmidtovým ortonormalizačním procesem ze standardní báze S = (sI 1, sI 2, sI 3). ˇ e1 = sI 1 = 1 0 0 . * Položíme e2 = sI 2 - e1 a určíme aby platilo 0 = (e1, e2)A = e 1AsI 2 - e 1Ae1 = -1 - 2, odkud = -1 2 a e2 = 1 2 1 0 . * Položíme e3 = sI 3 - 1e1 - 2e2 a určíme 1, 2 aby platilo 0 = (e1, e3)A = e 1AsI 3 - 1e 1Ae1 = -21, 0 = (e2, e3)A = e 2AsI 3 - 2e 2Ae2 = -1 - 3 22. Řešením této soustavy dostaneme 1 = 0, 2 = -2 3 a e3 = 1 3 2 3 1 . 18.6 Ortogonální matice Čtvercová matice U, která splňuje UU = I, se nazývá ortogonální matice. Ortogonální matice má tedy ortonormální sloupce a splňuje U-1 = U. Následující věta nám říká, že násobení ortogonální maticí zachovává délky i úhly vektorů. 113 Kapitola 18. Skalární součin a ortogonalita Věta: Nechť U je čtvercová matice řádu n. Pak jsou následující tvrzení ekvivalentní: (i) U U = I. (ii) Pro všechny sloupcové vektory x řádu n platí (Ux) (Ux) = x x. (iii) Pro všechmy sloupcové vektory x, y řádu n platí (Ux) (Uy) = x y. Důkaz: Z (i) plyne (ii). Z UU = I plyne (Ux) (Ux) = x U Ux = x x. Z (ii) plyne (iii). Ověří se použitím (16.6) a předpokladu. Z (iii) plyne (i). Z předpokladu dostaneme pro sloupce si, sj jednotkové matice U U ij = s i U Usj = (Usi) Usj = s i sj = s i Isj = [I]ij . Ortogonální matice se uplatní v numerických metodách, neboť jejich inverzní matice lze získat transponováním a jejich násobením se nezesilují zaokrouhlovací chyby. Příklady k procvičení: Cvičení 18.1. Určete pomocí Schmidtova ortogonalizačního procesu ortonormální bázi (e1, e2, e3) lineárního obalu vektorů v1 = [1, 1, 1, 1], v2 = [0, 1, 1, 1], v3 = [1, 0, 1, 1] a najděte souřadnice vektorů v1, v2, v3 v bázi (e1, e2, e3). Cvičení 18.2. Ověřte, že matice U() = cos() sin() - sin() cos() je ortogonální. Popište geometricky účinek násobení maticí U(). Cvičení 18.3. Využijte báze (e1, e2, e3) z příkladu 18.4 k řešení soustavy 2x1 - x2 = 1 -x1 + 2x2 - x3 = 1 - x2 + 2x3 = 1 Řešení hledejte ve tvaru lineární kombinace vektorů e1, e2, e3. 114 19. Variační metody a metoda nejmenších čtverců V této kapitole se seznámíme s výsledky, které dávájí do souvislosti teorii lineárních zobrazení a bilineárních a kvadratických forem. Zobecnění těchto výsledků je základem moderních metod řešení rovnic, které popisují elektromagnetické, silové nebo deformační pole. Zde je použijeme k analýze soustav rovnic, které nemají řešení, s cílem naznačit zvídavému čtenáři užitečnost zavedených pojmů. 19.1 Variační princip Věta: Nechť A je symetrická pozitivně definitní matice řádu n, takže předpis (x, y)A = x Ay (19.1) definuje skalární součin na Rn. Nechť b, x Rn a nechť b značí lineární funkci definovanou předpisem b(x) = b x. (19.2) Pak jsou následující tvrzení ekvivalentní: (i) Ax = b. (ii) (x, y)A = b(y) pro všechna y Rn. (iii) x je jediný vektor Rn takový, že pro libovolné x Rn platí q(x) q(x), (19.3) kde q(x) = 1 2 (x, x)A - b(x). (19.4) Důkaz: Z (i) plyne (ii). Jestliže x splňuje rovnost (i), pak ji splňuje i po přenásobení y zleva, takže platí (ii). Z (ii) plyne (iii). Označíme-li si h = x - x, pak q(x) - q(x) = 1 2 (x + h, x + h)A - b(x + h) - 1 2 (x, x)A + b(x) = = 1 2 (h, h)A + (x, h)A - b(h). Jestliže tedy (x, y)A = b(y) pro libovolné y Rn, plyne z právě odvozené rovnosti, že q(x) - q(x) = 1 2 (h, h)A 0, neboť skalární součin je nezáporný. Jelikož z (h, h)A = 0 plyne h = o, je tím dokázáno i tvrzení o jednoznačnosti. Z (iii) plyne (i). Nechť platí (19.3) a Ay = b. Již jsme si dokázali, že pro všechna x Rn platí q(y) q(x). Z jednoznačnosti minima pak dostaneme x = y, tedy Ax = b. 115 Kapitola 19. Variační metody a metoda nejmenších čtverců 19.2 Metoda nejmenších čtverců Nechť A je matice typu (m, n) a nechť b Rm. Budeme se zabývat otázkou, jak najít x tak, aby rovnice Ax = b byla co nejlépe splněna, a to i v případě, že její přesné řešení neexistuje. Taková úloha může vzniknout například při opakovaném měření některé fyzikální veličiny x. Jestliže například naměříme x1 = 20, x2 = 20, x3 = 17, dostaneme pro x rovnice x = 20 x = 20 x = 17 (19.5) které nemají řešení, přestože jsme přesvědčeni, že veličina x reálně existuje. Naší snahou bude určit x tak, aby vyhovovalo rovnicím (19.5) v určitém smyslu co nejlépe. Zavedeme si označení r(x) = Ax - b pro reziduum rovnice Ax = b, jejíž řešení je ekvivalentní nalezení x, pro které r(x) = o. Snaze najít x, které splňuje co nejlépe rovnici Ax = b, tedy odpovídá požadavek, aby reziduum r(x) bylo malé, tedy aby minimalizovalo vhodnou normu r(x). Z výpočetního hlediska se ukazuje nejjednodušší minimalizovat eukleidovskou normu r = rr. Podmínku pro minimum v případě matice A s nezávislými sloupci si odvodíme pomocí věty 19.1. Věta: Nechť A je obdélníková matice typu (m, n) s hodností n. Nechť m n a b Rm. Pak minimum Ax - b na Rn je dosaženo v řešení normální rovnice A Ax = A b. (19.6) Důkaz: Pro Eukleidovskou normu rezidua r(x) = Ax - b platí r(x) 2 = (Ax - b) (Ax - b) = x (A A)x - 2 A b x + b b. (19.7) Jelikož matice A má nezávislé sloupce, plyne z x = o, že Ax = o a x (A A)x = Ax 2 > 0, takže AA je symetrická pozitivně definitní matice. K dokončení důkazu stačí označit b(x) = A b x, (x, x)AA = x (A A)x a použít větu (19.1) k nalezení rovnice pro minimum r(x) 2 = (x, x)AA - 2b(x) + b b. 116 19.2 Metoda nejmenších čtverců S(A) Ax b -r(b) Obr. 19.1: Geometrický význam metody nejmenších čtverců. Poznámka: Řešení x normální rovnice splňuje A(Ax - b) = o, tedy r(x) je ortogonální ke sloupcovému prostoru S(A). Zapíšeme-li si vektor b ve tvaru b = Ax - r(x), snadno zjistíme, že Ax je ze všech bodů S(A) nejblíže k b a r(x) je chyba ortogonální k S(A). Metoda současně minimalizuje mocninu normy chyby, která je určena součtem čtverců složek r(x). Odtud pochází název metoda nejmenších čtverců. Geometrický význam metody nejmenších čtverců ilustruje obr. 19.1. Příklad 19.1. Najděte x1, x2 tak, aby byly rovnice x1 + x2 = 0 2x1 + x2 = 4 3x1 + x2 = 4 (19.8) splněny co nejlépe ve smyslu eukleidovské normy rezidua. Řešení: Označíme-li A matici soustavy (19.8) a b její pravou stranu, vypočteme, že A A = 1 2 3 1 1 1 1 1 2 1 3 1 = 14 6 6 3 , A b = 1 2 3 1 1 1 0 4 4 = 20 8 , 117 Kapitola 19. Variační metody a metoda nejmenších čtverců takže x je řešením soustavy: 14x1 + 6x2 = 20 6x1 + 3x2 = 8 Odtud vypočteme x1 = 2, x2 = -4 3. Řešení definuje přímku o rovnici y = 2t - 4 3, která minimalizuje součet čtverců odchylek ri předepsaných hodnot, jak je to vyznačeno na obr. 19.2. t y 1 2 30 1 2 3 4 5 -1 r1 r2 r3 3 4 2 -= ty min2 3 2 2 2 1 ++ rrr Obr. 19.2: Metoda nejmenších čtverců. 19.3 Aproximace a projektory V aplikacích se často vyskytuje úloha najít k danému vektoru v vektorového prostoru V vektor u, který patří do podprostoru U V a který je k v nejbližší v dané normě. Pro V = Rn, podprostor U zadaný bází tvořenou sloupci matice A Rn,m a eukleidovskou normu je řešení této úlohy snadným důsledkem věty 19.2, neboť souřadnice x = [u]A v bázi A = (sA 1 , . . . , sA m) splňují normálovou rovnici (19.6), odkud x = A A -1 A v, u = A A A -1 A v. Násobení maticí P = A A A -1 A tedy každému vektoru přiřadí nejbližší vektor u S(A). Matice P se nazývá ortogonální projektor na S(A), neboť zobrazení v Pv má podobné vlastnosti jako ortogonální projekce na osu souřadnic z obr. 19.3. Například pro libovolný vektor v platí P2 v = A A A -1 A A A A -1 A v = A A A -1 A u = Pv, 118 19.3 Aproximace a projektory (v - Pv) Pv = v Pv - v P2 v = v Pv - v Pv = o. Vektor Pv je nejlepší aproximací (přiblížením) k vektoru v z podprostoru U ve smyslu Eukleidovské normy. x x-Px U y = Px = P(Px) Obr. 19.3: Projekce. Příklad 19.2. Nechť u = 1 2 3 , v = 1 1 1 . Najděte pomocí projektoru násobek ^v = v vektoru v, který je nejbližší vektoru u. Řešení: Pro naši úlohu P = v v v -1 v , ^v = Pu = 1 1 1 1 1 1 1 1 1 -1 1 1 1 1 2 3 = 2 2 2 . Příklady k procvičení: Cvičení 19.1. Najděte řešení soustavy (19.5) metodou nejmenších čtverců. Cvičení 19.2. Zjednodušte vzorec pro řešení soustavy Ux = b metodou nejmenších čtverců v případě, že U je ortogonální matice. 119 Část IV Determinanty 20. Induktivní definice determinantu 21. Determinant a antisymetrické formy 22. Determinant a inverzní matice 20. Induktivní definice determinantu Snaha o nalezení vzorce pro řešení soustav lineárních rovnic vedla k zavedení funkce jejich koeficientů, která se nazývá determinant. Determinant má mnoho vlastností, které se uplatní v teorii a při číselném řešení některých problémů formulovaných pomocí malých matic. Pomocí determinantů lze například zformulovat kritéria pro testování pozitivní definitnosti nebo regulárnosti matic. S použitím determinantů se budeme seznamovat postupně. Mnoho problémů, jejichž řešení lze explicitně popsat pomocí determinantů, však lze řešit efektivněji bez jejich použití. 20.1 Explicitní řešení malých soustav Abychom získali představu o struktuře vzorců pro řešení soustavy n lineárních rovnic o n neznámých, odvodíme si tyto vzorce pro n = 1, 2, 3. Pro n = 1 dostaneme pro a11 = 0 elementárně a11x1 = b1, x1 = b1 a11 . (20.1) Pro n = 2 budeme řešit soustavu a11x1 + a12x2 = b1 a21x1 + a22x2 = b2. (20.2) Úpravami, které nepoužívají dělení, dostaneme a11 a12 b1 a21 a22 b2 a22r1 - a12r2 a11 a12 b1 a11a22 - a12a21 0 b1a22 - a12b2 (20.3) a11 a12 b1 a21 a22 b2 a11r2 - a21r1 a11 a12 b1 0 a11a22 - a12a21 a11b2 - b1a21 , (20.4) odkud pro a11a22 - a12a21 = 0 dostaneme x1 = b1a22 - a12b2 a11a22 - a12a21 , x2 = a11b2 - b1a21 a11a22 - a12a21 . (20.5) Obdobně, avšak pracněji, bychom mohli odvodit řešení soustavy a11x1 + a12x2 + a13x3 = b1 a21x1 + a22x2 + a23x3 = b2 a31x1 + a32x2 + a33x3 = b3. (20.6) Dostali bychom například vzorec x1 = (a22a33 - a23a32)b1 + (a13a32 - a12a33)b2 + (a12a23 - a13a22)b3 a11(a22a33 - a23a32) + a12(a23a31 - a21a33) + a13(a21a32 - a31a22) , (20.7) který má také smysl pouze pro nenulový jmenovatel. 123 Kapitola 20. Induktivní definice determinantu Nyní si všimněme, že ve všech třech případech lze čitatele i jmenovatele vyjádřit pomocí jedné funkce matice. Nejjednodušší je to pro n = 1, kdy stačí označit si formálně det a = a = a, (20.8) takže řešení (20.1) lze zapsat ve tvaru x1 = b1 a11 . (20.9) Pro n = 2 si označme det a b c d = a b c d = ad - bc = a d - b c . (20.10) Řešení soustavy (20.5) lze zapsat za pomocí tohoto označení ve tvaru x1 = b1 a12 b2 a22 /d, x2 = a11 b1 a21 b2 /d, (20.11) kde d = a11a22 - a12a21 = a11 a12 a21 a22 = a11 a11 a12 a21 a22 - a12 a11 a12 a21 a22 (20.12) Konečně pro n = 3 si zaveďme označení det a11 a12 a13 a21 a22 a23 a31 a32 a33 = a11 a12 a13 a21 a22 a23 a31 a32 a33 = = a11(a22a33 - a23a32) - a12(a21a33 - a23a31) + a13(a21a32 - a22a31) = = a11 a11 a12 a13 a21 a22 a23 a31 a32 a33 - a12 a11 a12 a13 a21 a22 a23 a31 a32 a33 + a13 a11 a12 a13 a21 a22 a23 a31 a32 a33 = = a11 a22 a23 a32 a33 - a12 a21 a23 a31 a33 + a13 a21 a22 a31 a32 (20.13) Řešení x1 lze pak zapsat ve tvaru x1 = b1 a12 a13 b2 a22 a23 b3 a32 a33 /d, d = a11 a12 a13 a21 a22 a23 a31 a32 a33 . (20.14) Vzorce (20.8), (20.10) a (20.13) nám tedy definují funkce matic, s jejichž pomocí můžeme napsat vzorce pro řešení soustav (20.1), (20.2) a (20.6). Tyto vzorce nám dávají i určité vodítko k obecné definici determinantu, který zde chápeme jako funkci matice, s jejíž pomocí můžeme zapsat vzorec pro řešení soustavy lineárních rovnic. 124 20.2 Induktivní definice determinantu 20.2 Induktivní definice determinantu Pro každou čtvercovou matici A = aij , nechť MA ij značí matici, která vznikne vyškrtnutím jejího i-tého řádku a j-tého sloupce. Matice MA ij se nazývá minor matice A příslušný k dvojici indexů (i, j). Například A = 1 2 3 4 5 6 7 8 9 , MA 12 = 1 2 3 4 5 6 7 8 9 = 4 6 7 9 . Definice: Nechť A = aij je čtvercová matice řádu n s reálnými nebo komplexními prvky. Determinant matice A je číslo, které značíme det A nebo A a vypočteme jej podle následujících pravidel: (D1) Je-li n = 1, pak det A = det a11 = a11. (D2) Předpokládejme, že n > 1 a že umíme určit determinant libovolné čtvercové matice řádu n - 1. Pak det A = a11 MA 11 - a12 MA 12 + a13 MA 13 - . . . + (-1)n+1 a1n MA 1n (20.15) Determinant matice je tedy funkce prvků matice, která je definováma explicitně pro n = 1 a pro n > 1 je definována pomocí pravidla, které definuje determinant matice řádu n pomocí determinantů řádu n - 1. Výpočet determinantu matice n-tého řádu se tedy pomocí pravidla (D2) redukuje napřed na výpočty determinantů matice řádu n - 1, pak se výpočet determinantu každé matice řádu n-1 redukuje pomocí téhož pravidla na výpočty determinantů matic řádu n-2, až se problém redukuje na výpočty determinantů matic prvního řádu, které se určí podle pravidla (D1). Například 1 2 3 1 -1 2 -1 2 1 = 1 -1 2 2 1 - 2 1 2 -1 1 + 3 1 -1 -1 2 = -8. Pro obecnou dolní trojúhelníkovou matici L = lij si můžeme odvodit, že determinant L je roven součinu diagonálních prvků matice L, neboť l11 0 . . . 0 l21 l22 . . . 0 ... ... ... ... ln1 ln2 . . . lnn = l11 l22 0 . . . 0 l32 l33 . . . 0 ... ... ... ... ln2 ln3 . . . lnn = . . . = l11 lnn. (20.16) Odtud speciálně plyne det I = 1. (20.17) Pro mírné zpřehlednění zápisu vzorce (20.15) si definujme algebraický doplněk matice A příslušný k dvojici indexů (i, j) předpisem Aij = (-1)i+j MA ij . Vzorec (20.15) lze pak přepsat ve tvaru det A = a11A11 + . . . + a1nA1n. (20.18) 125 Kapitola 20. Induktivní definice determinantu 20.3 Výpočetní náročnost Determinant matice n-tého řádu počítaný podle pravidla (D2) vyžaduje vyčíslení součtu n součinů čísel a determinantů matic řádu n - 1. Použijeme-li pravidlo (D2) na determinanty řádu n - 1, dostaneme, že vyčíslení determinantu matice n-tého řádu vyžaduje vyčíslení součtu n(n - 1) součinů dvou čísel a determinantů řádu n - 2. Opakováním tohoto postupu zjistíme, že vyčíslení determinantu matice n-tého řádu vyžaduje n! sčítanců tvořených součiny n čísel, tj. celkem (n - 1)n! součinů. To je číslo tak obrovské, že vyčíslení determinantů řádu 30 podle induktivní definice by na počítači s bilionem (1012) operací za vteřinu trvalo biliony let! Naštěstí se sotva vyskytne potřeba počítat determinanty tak velkých matic (na rozdíl od řešení soustav). Navíc existují efektivnější postupy výpočtu determinantů, s nimiž se postupně seznámíne. 126 21. Determinant a antisymetrické formy V této kapitole se seznámíme s vlastnostmi determinantu, které nám umožní pochopit souvislosti s některými známými pojmy, zejména s lineárními funkcionály a bilineárními formami. Budou nás přitom zajímat zejména ty vlastnosti determinantu, které se objeví, když se na determinant budeme dívat jako na funkci celých řádků matice. Abychom se vyhnuli nepřehledným zápisům manipulací s řádky matice A, budeme označovat hvězdičkou * submatice A, které se manipulací nezúčastní. 21.1 Linearita v prvním řádku Lemma: Nechť A = [aij] a B = [bij] jsou čtvercové matice, které se liší nanejvýš v prvním řádku, a je libovolný skalár. Pak rA 1 = det A a rA 1 + rB 1 = det A + det B. (21.1) Důkaz: Podle definice determinantu platí rA 1 = a11 . . . a1n a21 . . . a2n ... ... ... an1 . . . ann = a11A11 + . . . + a1nA1n = det A a rA 1 + rB 1 = a11 + b11 . . . a1n + b1n a21 . . . a2n ... ... ... an1 . . . ann = (a11 + b11)A11 + . . . + (a1n + b1n)A1n = = (a11A11 + . . . + a1nA1n) + (b11A11 + . . . + b1nA1n) = det A + det B. 21.2 Antisymetrie v prvních dvou řádcích Lemma: Nechť A=[aij] je čtvercová matice řádu n 2. Pak det A = rA 1 rA 2 = - rA 2 rA 1 . (21.2) Důkaz: Pro n = 2 platí rA 1 rA 2 = a11 a12 a21 a22 = a11a22 - a12a21 = -(a21a12 - a22a11) = - rA 2 rA 1 . Důkaz pro obecnější případ se provede rozepsáním determinantů minorů v (20.15) a vhodnou úpravou. Úplný důkaz je však komplikovaný. 127 Kapitola 21. Determinant a antisymetrické formy 21.3 Antisymetrie v libovolné dvojici řádků Věta: Nechť A = [aij] je čtvercová matice řádu n 2, nechť i < j a nechť B = [bij] je matice, která vznikla z matice A vzájemnou výměnou i-tého a j-tého řádku. Pak det A = rA i i rA j j = - rA j i rA i j = - det B. (21.3) Důkaz: Důkaz provedeme indukcí. Pro n = 2 tvrzení platí podle lemmatu 21.2. Abychom tvrzení dokázali pro n > 2, předpokládejme, že (21.3) platí pro matice řádu 2, . . . , n - 1 a že 1 i < j n. Rozepišme si det A podle definice na tvar det A = a11|MA 11| - a12|MA 12| + . . . + (-1)n+1 a1n|MA 1n|. Budeme rozlišovat dva případy: 1. Pro 1 < i tvrzení platí, neboť každá submatice MB 1k vznikne podle předpokladu z MA 1k výměnou příslušných řádků, takže pomocí indukčního předpokladu a a11 = = b11, . . . , a1n = b1n dostaneme det B = b11|MB 11| - b12|MB 12| + . . . + (-1)n+1 b1n|MB 1n| = = a11 -|MA 11| - a12 -|MA 12| + . . . + (-1)n+1 a1n -|MA 1n| = - det A. 2. Jestliže i = 1, pak pomocí dokázaného tvrzení a lemmatu 21.2 dostaneme postupně det B = rA j 1 rA 2 2 rA 1 j = - rA j 1 rA 1 2 rA 2 j = rA 1 1 rA j 2 rA 2 j = - rA 1 1 rA 2 2 rA j j = - det A. 21.4 Linearita v libovolném řádku Věta: Nechť A a B jsou čtvercové matice, které mají stejné řádky s výjimkou k-tého. Pak pro libovolné platí k rA k = det A a k rA k + rB k = det A + det B. (21.4) Důkaz: Pro k = 1 jsme tvrzení dokázali lemmatem 21.1. 128 21.4 Linearita v libovolném řádku Pro k > 1 dostaneme postupným použitím věty 21.3 a lemmatu 21.1 rA 1 1 rA k k = - rA k 1 rA 1 k = - rA k 1 rA 1 k = rA 1 1 rA k k = det A a rA 1 1 rA k + rB k k = - rA k + rB k 1 rA 1 k = - rA k 1 rA 1 k - rB k 1 rB 1 k = det A + det B. Věty 21.3 a 21.4 můžeme shrnout tvrzením, že determinant je antisymetrická bilineární forma libovolné dvojice řádků matice. Důsledek: Nechť A je libovolná čtvercová matice: (i) Má-li A dva stejné řádky, pak det A = 0. (ii) Má-li A nulový řádek, pak det A = 0. (iii) Je-li B čtvercová matice, která má stejné řádky jako A s výjimkou k-tého, a rB k = rA k + rA l , k = l, pak det A = det B. (iv) Jsou-li řádky A lineárně závislé, pak det A = 0. Důkaz: (i) Jestliže v matici A vyměníme dva stejné řádky, matice se nezmění, avšak podle věty 21.4 dostaneme det A = - det A. Odtud det A = 0. (ii) Nechť rA i = o. Pak s použitím věty 21.3 dostaneme det A = o i = 0 o i = 0 o = 0. (iii) Podle vět 21.3 a 21.4 platí det B = rA l l rA k + rA l k = rA l l rA k k + rA l l rA l k = rA l l rA k k + rA l l rA l k = det A. 129 Kapitola 21. Determinant a antisymetrické formy (iv) Jsou-li řádky matice A lineárně závislé, pak podle věty 10.2 existuje index i a koeficienty 1, . . . , i-1 tak, že rA i = 1rA 1 + . . . + i-1rA i-1. Odtud rA i - 1rA 1 - . . . - i-1rA i-1 = o, takže podle (iii) a (ii) platí det A = rA i i = rA i - 1rA 1 i = . . . = = rA i - 1rA 1 - . . . - i-1rA i-1 i = o i = 0. 21.5 Výpočet hodnoty determinantu V článcích 21.3 a 21.4 jsme si ukázali, že elementární řádkové úpravy ovlivňují velmi jednoduše hodnotu determinantu. Přičtení násobku některého řádku k jinému ji nezmění vůbec, vzájemná výměna dvou řádků změní její znaménko a vynásobení řádku skalárem ji vynásobí tímto skalárem. Elementární řádkové úpravy matice proto můžeme využít k převodu matice na speciální tvar vhodný pro výpočet determinantu. Pro nás je to prozatím dolní trojúhelníková matice, jejíž determinant je podle (20.16) roven součinu diagonálních prvků. Brzy uvidíme, že stejně se vypočte i determinant horní trojúhelníkové matice. Příklad 21.1. 3 2 1 r1 + r3 2 0 2 r2 + 2r3 3 1 -1 = 6 3 0 8 2 0 3 1 -1 = 2 6 3 0 r1 - 3r2 4 1 0 3 1 -1 = 2 -6 0 0 4 1 0 3 1 -1 = = 2 (-6) 1 (-1) = 12 Příklad 21.2. 0 1 1 1 0 1 r3 1 1 0 r2 = 0 1 1 r1 - r3 1 1 0 1 0 1 = -1 1 0 r1 - r2 1 1 0 1 0 1 = -2 0 0 1 1 0 1 0 1 = = -(-2) 1 1 = 2 130 21.6 Determinant součinu matic 21.6 Determinant součinu matic Věta: Nechť A a B jsou čtvercové matice řádu n. Pak det(AB) = det A det B. Důkaz: Předpokládejme nejprve, že A je diagonální, tedy A = d1 0 . . . 0 0 d2 . . . 0 ... ... ... ... 0 0 . . . dn . Pak det(AB) = d1rB 1 ... dnrB n = d1 dn det B = det A det B. Je-li A libovolná regulární matice, pak existuje posloupnost T1, . . . , Tk sestávající z l elementárních permutačních matic (6.2) a k - l Gaussových transformací (6.4), která splňuje Tk T1A = d1 0 . . . 0 0 d2 . . . 0 ... ... ... ... 0 0 . . . dn = D. Jelikož násobení Gaussovou transformací realizuje přičtení některého řádku k jinému a násobení permutací realizuje výměnu řádků, platí det(AB) = (-1)l det(Tk T1AB) = (-1)l det(DB) = (-1)l det D det B = = (-1)l det(Tk T1A) det B = (-1)l (-1)l det A det B = det A det B. Je-li konečně A singulární, pak A má závislé řádky a existuje posloupnost T1, . . . , Tk Gaussových transformací tak, že matice Tk T1A má nulový řádek. Pak má však nulový řádek i matice Tk T1AB a podle důsledku (ii) z článku 21.4 platí det(AB) = det(Tk T1AB) = 0. Příklady k procvičení: Cvičení 21.1. Dokažte, že pro libovolnou čtvercovou matici A řádu n a skalár platí det(A) = n det A. 131 Kapitola 21. Determinant a antisymetrické formy Cvičení 21.2. Vypočtěte: a) 0 1 2 1 0 2 1 2 0 b) 0 1 2 1 0 3 1 2 0 Cvičení 21.3. Ověřte, že B(x, y) = x1 x2 x3 y1 y2 y3 1 2 3 je antisymetrická bilineární forma definovaná pro reálné aritmetické vektory x = [x1, x2, x3] a y = [y1, y2, y3]. 132 22. Determinant a inverzní matice Spojením induktivní definice determinantu s výsledky předchozí kapitoly dostaneme vztahy, jejichž maticová interpretace vede ke vzorcům pro inverzní matici a řešení soustav. Snadno odvodíme i některé další vlastnosti determinantů. Budeme přitom používat stejné konvence jako v kapitole 21. 22.1 Rozvoj determinantu podle prvků libovolného řádku Věta: Jestliže A = [aij] je čtvercová matice řádu n > 1, pak pro libovolný index k platí det A = ak1Ak1 + . . . + aknAkn. (22.1) Důkaz: Pro libovolné k dostaneme postupnou výměnou původně k-tého řádku s řádkem bezprostředně nad ním det A = rA 1 1 rA 2 2 ... rA k-1 k - 1 rA k k = - rA 1 1 rA 2 2 ... rA k k - 1 rA k-1 k = . . . = (-1)k-1 rA k 1 rA 1 2 ... rA k-2 k - 1 rA k-1 k = = (-1)k-1 ak1|MA k1| - ak2|MA k2| + . . . + (-1)n+1 |MA kn| = = (-1)k+1 ak1|MA k1| + . . . + (-1)k+n |MA kn| = = ak1Ak1 + . . . + aknAkn. Důsledek: Nechť A = [aij] je čtvercová matice řádu n > 1. (i) Jsou-li k, l dva různé indexy řádků matice A, pak ak1Al1 + . . . + aknAln = 0. (22.2) (ii) Je-li A trojúhelníková matice, pak det A = a11 ann. (22.3) Důkaz: (i) Povšimněme si, že hodnota Ali vůbec nezávisí na l-tém řádku matice A. Platí tedy ak1Al1 + . . . + aknAln = rA k k rA k l = 0. 133 Kapitola 22. Determinant a inverzní matice (ii) Je-li A dolní trojúhelníková matice, platí (22.3) podle (20.15). Je-li A horní trojúhelníková matice, pak opakovaným použitím (22.1) dostaneme postupně det A = a11 a12 . . . a1n 0 a22 . . . a2n ... ... ... ... 0 0 . . . ann = ann a11 a12 . . . a1 n-1 0 a22 . . . a2 n-1 ... ... ... ... 0 0 . . . an-1 n-1 = . . . = a11a22 ann. 22.2 Adjungovaná a inverzní matice Abychom si mohli zapsat rovnosti (22.1) a (22.2) maticově, zavedeme si nejprve nový pojem. Definice: Nechť A je libovolná čtvercová matice řádu n > 1. Pak adjungovaná matice A k matici A je čtvercová matice stejného řádu definovaná předpisem A = A11 . . . An1 ... ... ... A1n . . . Ann . (22.4) Příklad 22.1. Pro matici A = 3 2 1 2 0 2 3 1 -1 (22.5) platí A11 = 0 2 1 -1 = -2, A12 = 2 2 3 -1 = -(-2 - 6) = 8, A13 = 2 0 3 1 = 2, A21 = 2 1 1 -1 = -(-2 - 1) = 3, A22 = 3 1 3 -1 = -3 - 3 = -6, A23 = 3 2 3 1 = 3, A31 = 2 1 0 2 = 4, A32 = 3 1 2 2 = -4, A33 = 3 2 2 0 = -4, takže A = -2 3 4 8 -6 -4 2 3 -4 . (22.6) 134 22.3 Determinant transponované matice Věta: Nechť A je čtvercová regulární matice řádu n > 1. Pak det A = 0 a A-1 = 1 det A A. (22.7) Důkaz: Je-li A čtvercová regulární matice, pak existuje posloupnost elementárních řádkových operací, která převede A na jednotkovou matici I. Jelikož determinant matice upravené elementární transformace se může od determinantu původní matice lišit jen nenulovým násobkem a det I = 1, platí det A = 0. Nyní si povšimněme, že (22.1) a (22.2) můžeme zapsat maticově pomocí adjungované matice ve tvaru AA = (det A) I. Odtud A 1 det A A = I. Příklad 22.2. Pro matici A definovanou rovností (22.5) dostaneme s využitím (22.6) 3 2 1 2 0 2 3 1 -1 -1 = 1 12 -2 3 4 8 -6 -4 2 3 -4 = -1 6 1 4 1 3 2 3 -1 2 -1 3 1 6 1 4 -1 3 . Správnost výsledku si můžeme ověřit vynásobením. Důsledek: Matice A je regulární, právě když det A = 0. Důkaz: Je-li A singulární, pak má závislé sloupce, takže podle důsledku (iv) části 21.4 platí det A = 0. Obrácené tvrzení plyne z právě dokázané věty. 22.3 Determinant transponované matice Věta: Nechť A je čtvercová matice. Pak det A = det A. (22.8) Důkaz: Podle článku 7.1 lze každou permutační matici P vyjádřit ve tvaru P = P1 Pk součinu elementárních permutačních matic Pi, které jsou symetrické, takže P = Pk P1 a det P = |Pk| |P1| = det P. 135 Kapitola 22. Determinant a inverzní matice Jelikož transponování nemění diagonálu matice a determinant trojúhelníkové matice je podle důsledku (ii) článku 22.1 roven součinu jejích diagonálních prvků, platí (22.8) také pro každou trojúhelníkovou matici. Jestliže je A obecná čtvercová matice, pak podle věty 7.3 o LUP rozkladu existují dolní trojúhelníková matice L, horní trojúhelníková matice U a permutační matice P tak, že A = LUP. S použitím věty o součinu determinantů 21.6 odtud plyne det A = det(P U L ) = |P ||U ||L | = |L||U||P| = det(LUP) = det A. 22.4 Determinant jako funkce sloupců Ze vztahu (22.8) vyplývá, že determinant považovaný za funkci sloupců má stejné vlastnosti jako determinant považovaný za funkci řádků. Například determinant je antisymetrická bilineární forma libovolné dvojice sloupců matice. Způsob odvození si budeme ilustrovat na důkazu následující věty o rozvoji determinantu podle sloupců, kterou upotřebíme v článku 22.5. Věta: Nechť A je čtvercová matice řádu n > 1. Pak pro i = 1, . . . , n platí det A = a1iA1i + . . . + aniAni. (22.9) Důkaz: S použitím věty 22.3 dostaneme det A = det A = a11 . . . an1 ... ... a1i . . . ani ... ... a1n . . . ann = = (-1)i+1 a1i|M 1i| + . . . + (-1)i+n ani|M ni| = = (-1)i+1 a1i|M1i| + . . . + (-1)i+n ani|Mni| = = a1iA1i + . . . + aniAni. 22.5 Cramerovy vzorce pro řešení soustav Použijeme-li vzorec (22.6) pro inverzní matici k řešení soustavy Ax = b (22.10) s regulární čtvercovou maticí A řádu n > 1, dostaneme pro složky xi řešení x vzorce xi = A-1 b i = 1 det A (A1ib1 + . . . + Anibn). (22.11) 136 22.6 Použití Cramerových vzorců Povšimneme-li si, obdobně jako při odvození (22.2), že minory příslušné k prvkům itého sloupce neobsahují prvky i-tého sloupce, můžeme výraz v kulaté závorce (22.11) považovat za rozvoj determinantu matice Ab i = i b = i sA 1 . . . sA i-1 b sA i+1 . . . sA n , (22.12) která vznikne z A záměnou i-tého sloupce za b podle i-tého sloupce. Výrazy xi = det Ab i det A , i = 1, . . . , n (22.13) se nazývají Cramerovy vzorce. Jejich speciální případy jsme si odvodili elementárními výpočty v kapitole 20. Příklad 22.3. Najděte řešení soustavy 3x1 + 2x2 + x3 = 6 2x1 + 2x3 = 0 3x1 - x2 - x3 = 0 (22.14) pomocí Cramerových vzorců. Řešení: Postupně vypočteme determinant matice soustavy |A| = 3 2 1 2 0 2 3 -1 -1 = 12 a čitatele Kramerových vzorců |Ab 1| = 6 2 1 0 0 2 0 -1 -1 = 12, |Ab 2| = 3 6 1 2 0 2 3 0 -1 = 48, |Ab 3| = 3 2 6 2 0 0 3 -1 0 = -12 Odtud x1 = |Ab 1| det A = 1, x2 = |Ab 2| det A = 4, x3 = |Ab 3| det A = -1. 22.6 Použití Cramerových vzorců Cramerovy vzorce, které jsme si odvodili v kapitole 22.5, lze považovat za úplné řešení soustavy lineárních rovnic v tom smyslu, že ho redukují na vyčíslení součtů a součinů, prakticky dosazení do vzorečku. To je užitečné zejména v případech, kdy potřebujeme vyjádřit řešení malé soustavy s proměnnými koeficienty. Jelikož se k efektivnímu výpočtu determinantu číselné matice obvykle vyplatí upravit matici na trojúhelníkový tvar, který lze přímo použít k řešení soustavy, lze si jen těžko představit efektivní využití Cramerových vzorců k řešení rovnic s číselnými koeficienty. Obdobné úvahy platí i pro vzorce pro výpočet inverzní matice. 137 Kapitola 22. Determinant a inverzní matice Příklady k procvičení: Cvičení 22.1. Vypočtěte: 1 2 3 4 1 0 2 -1 0 1 2 0 1 0 1 2 a) rozvojem podle třetího řádku. b) rozvojem podle druhého sloupce. Cvičení 22.2. Vyjádřete řešení soustavy (p + 2)x1 - x2 = 1 -x1 + 2x2 = 1 v závislosti na parametru p 0. K řešení použijte: a) vzorce pro inverzní matici. b) Kramerovy vzorce. Cvičení 22.3. Najděte nenulové řešení soustavy 2x1 + 3x2 - x3 = 0 x1 - x2 + x3 = 0 s využitím věty 22.1 a vzorce (22.2). Nápověda: Povšimněte si, že když opíšete kteroukoliv rovnici ještě jednou, získáte soustavu, jejíž determinant je roven nule. Cvičení 22.4. Rozhodněte pomocí determinantu, zda má soustava x1 - x2 - x3 = 1 -x1 + x2 - x3 = 0 -x1 - x2 + x3 = 1 jediné řešení. 138 Část V Úvod do spektrální teorie 23. Vlastní čísla a vektory 24. Spektrální rozklad symetrické matice 25. Důsledky spektrálního rozkladu 26. Jordanova forma matice 23. Vlastní čísla a vektory Lineární transformace A obvykle nezobrazí daný vektor e na jeho násobek, takže e a Ae jsou typicky nezávislé vektory. Výjimečně se však může stát, že existuje číslo tak, že Ae = e. Ukazuje se, že takové dvojice a e jsou velmi důležité pro pochopení lineárních transformací a matic. V aplikacích se s nimi setkáme například při studiu stability systémů, při analýze kmitání a při numerickém řešení rovnic rovnováhy či elektrického pole. 23.1 Vlastní čísla a vektory Definice: Nechť A L(V) je lineární transformace definovaná na vektorovém prostoru V. Jestliže existuje nenulový vektor e V a skalár tak, že Ae = e, (23.1) pak se nazývá vlastní číslo transformace A, e se nazývá vlastní vektor příslušný k a (, e) se nazývá vlastní dvojice transformace A. Rovnost (23.1) si můžeme zapsat pomocí identity ve tvaru (A - I)e = o, (23.2) takže je vlastním číslem A, právě když A - I není prosté zobrazení, a vlastní vektory A příslušné k jsou prvky jádra A - I. Množina všech vlastních čísel A L(V) je podmnožinou množiny (A) všech skalárů , pro které neexistuje (A - I)-1. Množina (A) se nazývá spektrum transformace A a pro transformace prostorů konečné dimenze je totožná s množinou všech vlastních čísel A. Slovo ,,spektrum znamená ,,duch a vystihuje skutečnost, že spektrum na matici není vidět, avšak s jeho pomocí se mnohé vlastnosti matic snadno vyloží, obdobně jako hýbání stolu na spiritistické seanci pomocí nějakého ducha. Je tu ovšem i rozdíl ­ pokud se něco dovíme o spektru matice, pomůže nám to řešit konkretní úlohy. Obr. 23.1: Matice a její spektrum. Příklad 23.1. Nechť A = 1 0 0 2 . 141 Kapitola 23. Vlastní čísla a vektory Pak vektory standardní báze s1, s2 jsou vlastní vektory matice A odpovídající po řadě vlastním číslům 1 a 2, neboť 1 0 0 2 1 0 = 1 1 0 a 1 0 0 2 0 1 = 2 0 1 . Vyjádříme-li si vektor x ve tvaru x = x1s1 + x2s2, můžeme si Ax vyjádřit ve tvaru Ax = 1 x1s1 + 2 x2s2. Příklad 23.2. Nechť F je prostor všech reálných funkcí, které mají všechny derivace spojité. Označíme-li si D zobrazení, které každé funkci f přiřazuje její derivaci f, pak exponenciální funkce f(x) = ex splňuje Df(x) = f (x) = ex = f(x). Každé reálné číslo je tedy vlastním číslem D. Označíme-li si g(x) = sin(x), pak -D2 g(x) = -g (x) = 2 sin(x) = 2 g(x), takže každé nezáporné číslo je vlastním číslem -D2. Příklad 23.3. Nechť V je libovolný vektorový prostor a I je identické zobrazení definované na V. Pak pro každý vektor v V platí Iv = 1 v, takže každý nenulový vektor je vlastním vektorem identity odpovídající vlastnímu číslu 1 a (I) = {1}. 23.2 Charakteristický mnohočlen a spektrum Je-li A čtvercová matice, tak násobení maticí A - I není podle článku 13.4 prosté zobrazení, právě když A - I je singulární. Podle důsledku 22.2 tedy skalár (A), právě když det(A - I) = 0. Výraz det(A - I) se nazývá charakteristický mnohočlen matice A a každé vlastní číslo (A) je kořenem charakteristické rovnice |A - I| = 0. (23.3) Násobnost vlastního čísla jako kořene rovnice (23.3) se nazývá algebraická násob- nost. Podle takzvané základní věty algebry má každá algebraická rovnice s komplexními koeficienty alespoň jeden komplexní kořen. Odtud vyplývá, že každá čtvercová matice považovaná za transformaci komplexního prostoru má neprázdné spektrum. 142 23.3 Neprázdnost spektra transformace Ukazuje se, že komplexní kořeny charakteristické rovnice mohou mít význam pro pochopení vlastností reálných matic, které obvykle vznikají při formulaci technických problémů. V dalším výkladu proto budeme uvažovat pouze komplexní vektorové prostory a komplexní matice. Připomeňme, že reálnou matici považujeme za zvláštní případ komplexní matice. Řešením charakteristické rovnice můžeme vypočítat vlastní čísla a k nim příslušné vlastní vektory malých matic. Například vlastní čísla matice A = 2 1 1 2 vypočteme řešením rovnice det(A - I) = 2 - 1 1 2 - = 2 - 4 + 3 = 0, odkud 1 = 3, 2 = 1. Vlastní vektory matice A vypočteme postupně řešením soustav 1 : -x1 +x2 = 0 2 : x1 + x2 = 0 x1 -x2 = 0 x1 + x2 = 0, odkud e1 = 1 1 a e2 = 1 -1 . Snadno si ověříme, že 2 1 1 2 1 1 = 3 1 1 , 2 1 1 2 1 -1 = 1 1 -1 . 23.3 Neprázdnost spektra transformace Věta: Nechť A L(V) je lineární transformace komplexního prostoru V konečné dimenze. Pak (A) = . Důkaz: Nechť F = (f1, . . . , fn) je báze V. Jelikož matice A = [A]F má neprázdné spektrum, podle článku 23.2, existuje C a sloupcový vektor x = [xi] tak, že Ax = x. Označme si e = x1f1 + . . . + xnfn, takže [e]F = x. Pak [Ae]F = [A]F [e]F = Ax = x = [e]F = [e]F , takže Ae = e a (A). 143 Kapitola 23. Vlastní čísla a vektory 23.4 Invariantnost vzhledem k podobnosti Vzhledem k tomu, že podobné matice lze považovat za matice téhož zobrazení v různých bázích, dá se očekávat, že podstatné charakteristiky podobných matic budou stejné. Nechť A je libovolná čtvercová matice a nechť Ae = e. (23.4) Po přenásobení (23.4) libovolnou regulární maticí T dostaneme TAe = Te, odtud TAT-1 (Te) = (Te). Odtud plyne, že podobné matice mají stejná vlastní čísla. Podobnost zachovává nejen spektrum, ale i charakteristický mnohočlen. Skutečně, použitím věty 21.6 o součinu determinantů a jednoduchými úpravami dostaneme det(TAT-1 - I) = |TAT-1 - TIT-1 | = |T(A - I)T-1 | = |T||A - I||T-1 | = = det(A - I), takže podobné matice mají stejný charakteristický mnohočlen. 23.5 Součet a součin vlastních čísel I když jsme si řekli, že spektrum není na matici obvykle vidět, neznamená to, že na matici není vidět žádná informace o spektru. Ukážeme si to podrobnějším rozborem charakteristické rovnice. Pomocí matematické indukce a induktivní definice determinantu lze dokázat, že pro čtvercovou matici A = [aij] n-tého řádu platí det(A - I) = (a11 - ) (ann - ) + pn-2(), (23.5) kde pn-2 je mnohočlen řádu nejvýše n - 2. Charakteristický mnohočlen (23.5) můžeme dále upravit na tvar det(A - I) = (-)n + (a11 + . . . + ann)(-)n-1 + qn-2(), (23.6) s mnohočlenem qn-2 stupně nejvýše n - 2. Jelikož charakteristický mnohočlen (23.5) je mnohočlen n-tého stupně, můžeme ho také vyjádřit pomocí základní věty algebry ve tvaru součinu kořenových činitelů det(A - I) = (1 - ) (n - ) = = (-)n + (1 + . . . + n)(-)n-1 + . . . + 1 n. (23.7) Po dosazení = 0 do (23.7) dostaneme det A = 1 n (23.8) a porovnáním koeficientů u (-)n-1 v (23.6) a (23.7) a11 + . . . + ann = 1 + . . . + n. (23.9) Součet diagonálních prvků matice se nazývá stopa matice. 144 23.6 Lokalizace vlastních čísel Příklad 23.4. Určete součet a součin vlastních čísel matice A = 2 1 1 2 . Řešení: Nechť 1, 2 jsou vlastní čísla matice A. Pak 1 + 2 = 2 + 2 = 4 12 = 4 - 1 = 3. 23.6 Lokalizace vlastních čísel Při řešení některých úloh není nutné mít úplnou informaci o spektru, ale stačí jen určit část komplexní roviny, kde se spektrum nachází. Například najdeme-li část komplexní roviny, která obsahuje spektrum dané matice A a neobsahuje nulu, budeme mít, podle (23.8), zaručeno, že A je regulární. Z tohoto důvodu je užitečná následující věta. Věta: (Geršgorin). Nechť A = [aij] je čtvercová komplexní matice řádu n a nechť ri = |ai1| + . . . + |aii| + . . . + |ain| a Si = {x C : |x - aii| ri}, kde stříška nad symbolem značí jeho vynechání. Pak (A) S1 . . . Sn. Důkaz: Nechť Ax = x, x = [xi] a x = o. Pak ai1x1 + . . . + aiixi + . . . + ainxn = xi, odkud převedením členu aiixi na pravou stranu dostaneme ai1x1 + . . . + aiixi + . . . + ainxn = ( - aii)xi. Pomocí vlastností absolutní hodnoty tak snadno ověříme, že platí |ai1||x1| + . . . + |aii||xi| + . . . + |ain||xn| | - aii||xi|. (23.10) Nechť i je takové, že |xi| = max j |xj|. Jelikož |xi| > 0, platí |xj|/|xi| 1. (23.11) Vydělíme-li rovnost (23.10) |xi|, dostaneme s použitím (23.11) |ai1| + . . . + |aii| + . . . + |ain| | - aii|, tedy Si. Příklad 23.5. Pomocí Geršgorinovy věty najděte co nejmenší část komplexní roviny, která obsahuje spektrum matice A = 2 i 0 1 3 1 1 i 4 . Řešení: r1 = |i| + |0| = 1, r2 = 1 + 1 = 2, r3 = 1 + |i| = 2. Odtud S1 = = {x C : |x - 2| 1}, S2 = {x C : |x - 3| 2}, S3 = {x C : |x - 4| 2}, takže (A) S1 S2 S3. Část komplexní roviny obsahující (A) je na obr. 23.2, kde je vyšrafována oblast obsahující (A). Z obrázku 23.2 plyne, že 0 (A), takže matice A je regulární. 145 Kapitola 23. Vlastní čísla a vektory Im Re5 61 2 3 4 i 2i 0 Obr. 23.2: Spektrum matice. Příklady k procvičení: Cvičení 23.1. Najděte všechna vlastní čísla a vlastní vektory matic: a) A = 3 1 0 0 2 1 0 0 1 b) B = 2 1 0 0 1 1 0 0 1 c) C = 0 1 0 0 0 1 0 0 0 Cvičení 23.2. Najděte všechna vlastní čísla matice A = 1 0 0 0 5 4 0 4 5 . Cvičení 23.3. Nechť A = 5 4 4 5 . Vypočtěte vlastní čísla matic A, A2, A-1. Cvičení 23.4. Nechť A je libovolná regulární matice s vlastním číslem . Dokažte: a) 2 (A2). b) -1 (A-1). c) 2 + 2 + 1 (A2 + 2A + I). Cvičení 23.5. Nechť A = 2i 1 0 -1 4i 1 1 1 4 . a) Vypočtěte součet a součin vlastních čísel matice A. b) Znázorněte část komplexní roviny, která podle Geršgorinovy věty obsahuje (A). 146 24. Spektrální rozklad symetrické matice V kapitole 23 jsme viděli, že obrazy vlastních vektorů jsou určeny vlastními čísly, které splňují některé podivuhodné relace. Nyní si ukážeme, že z vlastních vektorů symetrické matice můžeme sestavit ortonormální bázi. Toto tvrzení je snad to nejdůležitější, co se dá říct o symetrických maticích. 24.1 Spektrum symetrické matice Věta: Nechť A je reálná symetrická matice. Pak (A) R. Důkaz: Předpokládejme, že je komplexní vlastní číslo reálné symetrické matice A = [aij] řádu n, jemuž přísluší vlastní vektor e = [ei], takže Ae = e. (24.1) Pak pro komplexně sdružené s a vektor e = [ej] se složkami ej komplexně sdruženými s ej platí, podle pravidla o součinu komplexně sdružených čísel, že [Ae]i = ai1e1 + . . . + ainen = ai1e1 + . . . + ainen = ei = ei = e i pro každý index i, takže Ae = e. (24.2) Přenásobíme-li nyní rovnici (24.1) zleva e a rovnici (24.2) zleva e, dostaneme e Ae = e e = |e1|2 + . . . + |en|2 , eAe = ee = |e1|2 + . . . + |en|2 , odkud s pomocí e Ae = e Ae = e Ae snadno odvodíme = . 24.2 Vlastní vektory reálné symetrické matice Věta: Vlastní vektory reálné symetrické matice A odpovídající různým vlastním číslům jsou ortogonální. Důkaz: Předpokládejme, že = jsou vlastní čísla matice A, kterým odpovídají vlastní vektory e a f, takže Ae = e a Af = f. (24.3) Přenásobíme-li rovnice (24.3) postupně zleva f a e, dostaneme f Ae = f e a e Af = e f, odkud s pomocí f Ae = f Ae e Af a f e = f e = e f plyne f e = f e. (24.4) Pro = tedy musí platit fe = 0. 147 Kapitola 24. Spektrální rozklad symetrické matice Poznámka: Vlastní vektory libovolně blízkých matic se mohou výrazně lišit. Například matice A = 1 + 0 0 0 1 - 0 0 0 2 má, až na skalární násobky, pouze tři nezávislé vlastní vektory tvořené sloupci matice I3, avšak jakýkoli sloupcový vektor, který je lineární kombinací prvních dvou sloupců jednotkové matice I3, je vlastním vektorem matice A0. Výpočet vlastních vektorů odpovídajících blízkým vlastním číslům proto může být významně ovlivněn zaokrouhlovacími chybami. Je však možné dokázat, že vlastní čísla blízkých matic jsou si také blízká. 24.3 Invariantní podprostory Definice: Nechť U je podprostorem vektorového prostoru V a nechť A L(V). Jestliže A(U) U, pak se U nazývá invariantní podprostor A a zúžení A|U transformace A na U definované předpisem A|U : U u Au U je také lineární transformace U. Příklad 24.1. Nechť A = 5 -4 0 -4 5 0 0 0 1 . Pak U = {x R3 : [x]3 = 0} a V = {x R3 : [x]1 = [x]2 = 0} jsou invariantní podprostory A. Příklad 24.2. Nechť A je čtvercová matice, (A) a N = N(A - I). Pak pro každý vektor u N platí (A - I)Au = (A2 - A)u = A(A - I)u = Ao = o, takže N je invariantní podprostor A. Jelikož u N(A - I), právě když Au = u, platí A|N = I|N. (24.5) Věta: Nechť U je invariantní podprostor reálné symetrické matice A dimenze n. Pak U = {v Rn : v u = 0 pro všechna u U} je invariantní podprostor U. 148 24.4 Spektrální rozklad reálné symetrické matice Důkaz: Nechť U je invariantní podprostor matice A, u U a v U, takže vu = 0. Pak (Av) u = v (Au) = v u = 0. Dokázat, že U je vektorový prostor, ponecháváme jako cvičení. V dalším výkladu budeme potřebovat ještě jedno snadné pozorování. Lemma: Nechť U a W jsou invariantní podprostory A L(V). Pak U +W a U W jsou invariantní podprostory A. Důkaz: Jestliže U a W jsou invariantní podprostory A, v = u + w, u U a w W, pak Au U, Aw W a Av = A(u + w) = Au + Aw U + W. Obdobně se dokáže i druhé tvrzení. Důsledek: Nechť e1, . . . , ek jsou vlastní vektory matice A. Pak U = e1, . . . , ek i U jsou invariantní podprostory A. Poznámka: I když vlastní vektory mohou být velmi citlivé na drobné změny matice, snadno se ověří, že obdobné tvrzení neplatí pro invariantní podprostory tvořené obalem vlastních vektorů izolovaného shluku vlastních čísel symetrické matice. 24.4 Spektrální rozklad reálné symetrické matice Věta: Nechť A je reálná symetrická matice. Pak existuje ortogonální matice U a diagonální matice D tak, že A = U DU. (24.6) Řádky rU i matice U jsou transponované ortonormální vlastní vektory matice A příslušné vlastním číslům i = [D]ii. Důkaz: Nechť e1 je vlastní vektor matice A řádu n. Pak E2 = e1 je podle věty 24.3 invariantní podprostor A, takže podle věty 23.3 existuje vlastní vektor e2 transformace A|E2, který je ovšem také vlastní vektor A ortogonální k e1. Z e1 a e2 vytvoříme invariantní podprostory e1, e2 a E3 = e1, e2 = e1 e2 . Opakováním postupu pro E3 = e1, e2 , . . . , En = e1, . . . , en-1 dostaneme postupně ortogonální vlastní vektory e3, . . . , en. Sestavíme-li z normalizovaných vlastních vektorů matici U = [e1, . . . , en], dostaneme UAU = U[Ae1, . . . , Aen] = e 1 ... e n [1e1, . . . , nen] = 1 0 . . . 0 0 2 . . . 0 ... ... ... ... 0 0 . . . n , odkud po přenásobení U zleva a U zprava dostaneme s použitím U = U-1 rovnost (24.6). 149 Kapitola 24. Spektrální rozklad symetrické matice Příklad 24.3. Nechť A = 5 4 4 5 . Pak A má vlastní čísla 1 = 9, 2 = 1, kterým odpovídají vlastní vektory e1 = 1 1 a e2 = 1 -1 . Jelikož e1 = e 1e1 = 2 a e2 = e 2e2 = 2, můžeme sestavit z normalizovaných vlastních vektorů matici U = e 1/ e1 e 2/ e2 = 1 2 1 2 1 2 - 1 2 = 1 2 1 1 1 -1 . Snadno si ověříme, že A = 1 2 1 1 1 -1 9 0 0 1 1 2 1 1 1 -1 . 24.5 Geometrie spektrálního rozkladu Jelikož z vlastních vektorů symetrické matice A lze sestavit ortonormální bázi prostoru sloupcových vektorů stejné dimeze jako A, lze si účinek A představit tak, že roztahuje, zkracuje a případně překlápí složku každého vektoru rovnoběžnou s vlastním vektorem ei v závislosti na jeho vlastním čísle i, tak jako na obr. 24.1. Odtud plyne, že pro obsah P obrazu libovolného obrazce o původním obsahu P při zobrazení x Ax bude platit P = | det A|P. (24.7) Kružnice se přitom zobrazí na elipsu s hlavními osami |1|, |2| tak jako na obr. 24.2. Obdobné úvahy platí i pro prostorové útvary a lze jim dát smysl i v prostorech vyšší dimenze. 24.6 Extremální vlastnosti vlastních čísel Jelikož pro jednotkové vektory platí xx = 1, lze z předchozích úvah, zejména z obrázku 24.2, očekávat, že extrémní hodnoty výrazu xAx pro xx = 1 bude v případě symetrické matice dosaženo v příslušných vlastních vektorech. Dokážeme si toto tvrzení konkrétněji. Věta: Nechť 1 . . . n jsou vzestupně uspořádaná vlastní čísla symetrické matice A. Pak 1 = min xx=1 x Ax a n = max xx=1 x Ax. 150 24.6 Extremální vlastnosti vlastních čísel e1 e2 1e1 2e2 x Ax o Obr. 24.1: Účinek zobrazení x Ax. e1 e2 1e1 2e2 o Obr. 24.2: Obsah obrazu kruhu při zobrazení x Ax. 151 Kapitola 24. Spektrální rozklad symetrické matice Důkaz: Nechť A = UDU je spektrální rozklad matice A. Pak platí (Ux) Ux = x U Ux = x x, takže max xx=1 x Ax = max xx=1 x U DUx = max{(Ux) DUx : (Ux) Ux = 1} = = max yy=1 y Dy = max yy=1 1y2 1 + . . . + ny2 n max yy=1 ny y = n. Přímým výpočtem si lze ověřit, že maxima je dosaženo ve vlastním vektoru příslušném k n. Obdobně se dokáže i tvrzení o minimu. Příklady k procvičení: Cvičení 24.1. a) Nechť A, U, V značí matici z příkladu 24.1 a její invariantní podprostory. Najděte matici zúžení A|U v bázi E = (s1, s2), s1 = 1 0 0 , s2 = 0 1 0 . b) Najděte (A|U) a (A|V). c) Najděte spektrální rozklad matice A. Cvičení 24.2. Tenzor T = 11 12 21 22 lze považovat za zobrazení, které každému vektoru n přiřazuje vektor Tn, který určuje sílu působící na úsečku délky d = nn určenou normálou n. Najděte vzorec pro maximální a minimální sílu působící na jednotkovou úsečku. 152 25. Důsledky spektrálního rozkladu 25.1 Lokalizace spektra pomocí kongruence Věta o spektrálním rozkladu 24.4 říká, že každá symetrická matice A je současně podobná a kongruentní s diagonální maticí D mající na diagonále spektrum (A) matice A. Jelikož podobnost zachovává spektrum matice, kongruence zachovává znaménka diagonálních prvků a pozitivní definitnost či semidefinitnost diagonální matice poznáme podle diagonálních prvků, platí, že symetrická matice A je pozitivně definitní (semidefinitní), právě když má kladné (nezáporné) spektrum (A). Větu o spektrálním rozkladu můžeme použít též jako základní teoretický nástroj k odvození postupu pro určení počtu vlastních čísel symetrické matice v daném intervalu nebo na polopřímce. Postupem uvedeným v článku 17.3 totiž můžeme najít poměrně snadno diagonální matici E, která je kongruentní s maticí D ze spektrálního rozkladu. Podle zákona setrvačnosti kvadratických forem 17.4 však mají matice D a E stejný počet kladných, záporných a nulových diagonálních prvků, takže podle diagonály E můžeme určit počet kladných, záporných a nulových prvků (A). Jelikož z Ae = e plyne (A - cI)e = ( - c)e, můžeme použitím téhož postupu na matici A - cI zjistit počet vlastních čísel A, která jsou větší než c, menší než c, nebo se rovnají c. Jednoduchou modifikací tohoto postupu můžeme určit, kolik vlastních čísel je v daném intervalu. Příklad 25.1. Určete, zda má matice A = 0 1 0 1 1 1 0 1 0 nějaké vlastní číslo větší než 2. Řešení: Matice A má vlastní číslo větší než 2 právě tehdy, když má matice A - 2I nějaké kladné vlastní číslo. Postupnou úpravou dostaneme A - 2I = -2 1 0 1 -1 1 r2 + 1 2r1 0 1 -2 -2 1 0 0 -1 2 1 0 1 -2 s2 + 1 2s1 -2 0 0 0 -1 2 1 0 1 -2 r3 + 2r2 -2 0 0 0 -1 2 1 0 0 0 s3 + 2s2 -2 0 0 0 -1 2 0 0 0 0 . Jelikož 0 (A - 2I), platí 2 (A), avšak žádné vlastní číslo A není větší než 2. 153 Kapitola 25. Důsledky spektrálního rozkladu 25.2 Sylvesterovo kritérium pozitivní definitnosti Spojíme-li pozorování předchozích odstavců s našimi znalostmi determinantů a kongruence, můžeme dokázat podmínku pro pozitivní definitnost matice pomocí determi- nantů. Věta: (Sylvester). Nechť A = [aij] je čtvercová matice a nechť Ai = a11 . . . a1i ... ... ... ai1 . . . aii , i = 1, . . . , n. Pak matice A je pozitivně definitní, právě když det Ai > 0, i = 1, . . . , n. Důkaz: Je-li matice A pozitivně definitní, pak je pozitivně definitní i každá její submatice Ai, neboť pro libovolný nenulový vektor y řádu i a x = y on-i platí 0 < xAx = yAiy. Pozitivně definitní matice však mají podle odstavce 25.1 kladná vlastní čísla, takže i jejich součin, rovnající se det Ai, je kladný. Nechť obráceně det Ai > 0 pro i = 1, . . . , n. Pak speciálně a11 = det A1 > 0, takže stejně jako v důkazu věty 17.1 najdeme matici L1 tak, že platí L1AL1 = a11 o o A1 . Nyní si připomeňme, že L1 lze zapsat obdobným předpisem jako (7.6) pomocí součinu matic, jejichž násobením se realizuje přičtení násobku prvního řádku nebo sloupce násobené matice k jinému řádku nebo sloupci téže matice. To však znamená, že násobení maticí L1 zleva ani násobení maticí L1 zprava nemění determinanty matic Ai. Specielně odtud vyplývá, že pro prvek a1 22 v levém horním rohu matice A1 platí det A2 = a11a1 22 > 0, takže a1 22 je kladný. Opakováním tohoto postupu nakonec lze ukázat, že matice A je kongruentní s diagonální maticí s kladnými čísly na diagonále, tedy že A je pozitivně definitní. Poznámka: Pro Sylvesterovo kritérium platí to, co bylo řečeno o determinantech obecně. Pro rozhodnutí o pozitivní definitnosti větší matice je vhodnější použít LDL rozkladu (viz článek 17.2). 154 25.3 Skalární funkce symetrické matice 25.3 Skalární funkce symetrické matice V článku 13.7 jsme si ukázali, že do jakéhokoliv mnohočlenu můžeme ,,dosadit lineární transformace tak, že výsledek nezáleží na konkrétním zápisu mnohočlenu, takže mnohočleny lineární transformace můžeme upravovat obdobně jako skalární mnohočleny. Pro mnohé aplikace je však důležité umět dosazovat alespoň symetrické matice do funkcí, které jsou obecnější než mnohočlen, ovšem tak, aby byla splněna pravidla, která jsou nezbytná k počítání s maticovými funkcemi. Definice: Nechť A je symetrická matice řádu n a nechť FA je množina všech reálných funkcí definovaných na jejím spektru (A). Zobrazení, které každé funkci f FA přiřazuje symetrickou matici f(A) řádu n, definuje skalární funkce matice A, jestliže pro libovolné funkce f, g FA a identitu idR platí: (F1) idR(A) = A. (F2) (f + g)(A) = f(A) + g(A). (F3) (f g)(A) = f(A) g(A). (F4) Jestliže f(x) x pro x (A), pak f(A) je pozitivně semidefinitní. Snadno se ověří, že skalární funkce diagonální matice D = 1 0 . . . 0 0 2 . . . 0 ... ... ... ... 0 0 . . . n můžeme definovat předpisem f(D) = f(1) 0 . . . 0 0 f(2) . . . 0 ... ... ... ... 0 0 . . . f(n) , (25.1) který má smysl pro libovolnou reálnou funkci f definovanou na (D) = {1, . . . , n}. Pro libovolnou čtvercovou matici A se spektrálním rozkladem A = UDU pak předpis f(A) = U f(D)U (25.2) definuje skalární funkci matice A pro každou reálnou funkci definovanou na (A). Například pro funkce f a g definované na (A) platí (f g)(A) = U (f g)(D)U = U f(D)g(D)U = U f(D)UU g(D)U = f(A)g(A). Porovnáme-li (25.2) s větou o spektrálním rozkladu 24.4, snadno zjistíme, že (A), právě když f() f(A) , což se dá vyjádřit stručně ve tvaru f(A) = f (A) . (25.3) Příklad 25.2. Pro matici A = 5 4 4 5 vypočtěte A. 155 Kapitola 25. Důsledky spektrálního rozkladu Řešení: Podle příkladu 24.3 platí A = U DU, kde D = 9 0 0 1 a U = 1 2 1 1 1 -1 . Odtud A = U DU = 1 2 1 1 1 -1 3 0 0 1 1 1 1 -1 = 1 2 1 1 1 -1 3 3 1 -1 = = 2 1 1 2 . Přímým výpočtem si můžeme ověřit, že 2 1 1 2 2 1 1 2 = 5 4 4 5 . 25.4 Polární rozklad I když spektrální rozklad platí jen pro symetrické matice, můžeme s jeho pomocí lépe pochopit i obecnější matice. Věta: Nechť A je libovolná čtvercová matice. Pak existuje symetrická pozitivně semidefinitní matice B = AA a ortogonální matice U tak, že A = UB. (25.4) Rozklad (25.4) se nazývá polární rozklad. Důkaz: Omezíme se pro jednoduchost jen na případ regulární matice A. Kdyby rozklad (25.4) existoval, pak by platilo A A = BU UB = B2 . Matice B2 = AA je pozitivně definitní, neboť pomocí regularity A dostaneme pro x = o, že x B2 x = x A Ax = (Ax) Ax = Ax 2 > 0. Podle úvahy v článku 25.1 má tedy AA kladné spektrum, takže existuje odmocnina z AA a B = AA. Z (25.4) dostaneme U = AB-1 , odkud UU = AB-1 B-1 A = A(A A)-1 A = AA-1 A- A = I, takže U je ortogonální. Z (25.3) také plyne, že B je pozitivně definitní. 156 25.5 Geometrický význam determinantu Poznámka: Má-li matice A tak malé prvky, že prvky A2 jsou zanedbatelné ve srovnání s A, pak můžeme najít přibližný polární rozklad matice I + A pomocí I + A . = I + 1 2 (A + A ) I + 1 2 (A - A ) . Matice B = I + 1 2(A + A) je zřejmě symetrická, pozitivně definitní, zatímco U = I + + 1 2(A - A) je, až na zanedbatelnou chybu, ortogonální, neboť U U = I + 1 2 (A - A) I + 1 2 (A - A ) = I - 1 4 (A - A)2 . = I. Přibližný polární rozklad se používá například v lineární pružnosti k definici tenzoru deformace. Využívá se přitom toho, že matice D = 1 2(A + A), která charakterizuje deformaci tělesa vzhledem k referenční konfiguraci, závisí lineárně na A. 25.5 Geometrický význam determinantu Porovnáním věty o polárním rozkladu 25.4 s článkem 25.3 vyplývá, že zobrazení x Ax definované libovolnou čtvercovou maticí změní libovolnou plochu P na plochu P = | det AA| P. (25.5) Pomocí věty o součinu determinantů 21.6 a o determinantu transponované matice 22.3 dostaneme | det AA|2 = | det AA det AA| = | det AA AA| = = | det A A| = | det A det A| = | det A|2 , odkud po dosazení do (25.5) vychází P = | det A| P. (25.6) Příklad 25.3. Najděte vzorec pro plochu P rovnoběžníka určeného vektory u = u1 u2 , v = v1 v2 . s2 v u=As1 A A s1 v=As2 u Obr. 25.1: Plocha rovnoběžníka. 157 Kapitola 25. Důsledky spektrálního rozkladu Řešení: Povšimněme si napřed, že u = u, v 1 0 , v = u, v 0 1 . Rovnoběžník určený vektory u, v je tedy možno považovat za obraz jednotkového čtverce určeného vektory standardní báze s1 = 1 0 , s2 = 0 1 při zobrazení x Ax s maticí A = u, v . Platí tedy P = | det A| 1 = | det u1 v1 u2 v2 |. (25.7) Příklad 25.4. Určete objem V čtyřstěnu s vrcholy určenými polohovými vektory o a u = u1 u2 u3 , v = v1 v2 v3 , w = w1 w2 w3 , tak jako na obr. 25.2. e1 e2 e3 u v w Obr. 25.2: Objem čtyřstěnu. 158 25.6 Singulární rozklad a podmíněnost matice Řešení: Objem čtyřstěnu určeného nulovým vektorem a jednotkovými vektory standardní báze je roven 1/6. Čtyřstěn s vrcholy o, u, v, w můžeme považovat za obraz čtyřstěnu určeného vrcholem a jednotkovými vektory standardní báze při zobrazení x Ax s maticí A = u, v, w , takže V = 1 6 | det u1 v1 w1 u2 v2 w2 u3 v3 w3 |. (25.8) 25.6 Singulární rozklad a podmíněnost matice Další důležitý rozklad je jednoduchým důsledkem vět o polárním a spektrálním roz- kladu. Věta: Nechť A je libovolná čtvercová matice. Pak existují ortogonální matice U, V a diagonální matice S = 1 0 . . . 0 0 2 . . . 0 ... ... ... ... 0 0 . . . n , (25.9) na jejíž diagonále jsou vlastní čísla matice AA tak, že A = U SV. (25.10) Rozklad (25.10) se nazývá singulární rozklad a vlastní čísla matice AA se nazývají singulární čísla matice A. Důkaz: Podle věty o polárním rozkladu 25.4 existuje ortogonální matice W a pozitivně definitní matice B = AA tak, že A = WB. (25.11) Podle věty o spektrálním rozkladu 24.4 existuje ortogonální matice V tak, že pro matici (25.9) se singulárními čísly matice A na diagonále platí B = V SV. Nahradíme-li tímto výrazem B v (25.11) a označíme-li si U = VW , dostaneme A = WV SV = VW SV = U SV a U U = WV VW = I. 159 Kapitola 25. Důsledky spektrálního rozkladu Věta o singulárním rozkladu říká, že lineární zobrazení x Ax s libovolnou čtvercovu maticí A si můžeme představit jako složení zobrazení ,,otočení x Vx, ,,roztažení ve směru os realizovaného zobrazením x Sx a dalšího ,,otočení x Ux. Právě singulární čísla tedy definují změnu délky vektorů. Z toho vyplývá, že matice je singulární, právě když nejmenší singulární číslo min je nulové. Z těchto úvah je také patrné, že nenulová matice je blízká singulární matici, právě když je min mnohem menší než největší singulární číslo max. Pro regulární matici A charakterizuje číslo (A) = max/min 1 míru regularity matice A a nazývá se číslo podmíněnosti matice A. Číslo podmíněnosti lze vypočítat pomocí numerických metod. Poznámka: Jelikož matice je singulární, právě když je její determinant nulový, mohlo by se zdát, že kvantitativní mírou regularity matice by mohl být její determinant. Příklad matice A = 0.1 I100, která má inverzi A-1 = 10 I100 a det A = 10-100 však ukazuje, že determinant není vhodná kvantitativní míra regularity matice! 25.7 Pseudoinverzní matice I když k singulární čtvercové matici A neexistuje inverzní matice, můžeme pomocí singulárního rozkladu 25.6 A = U SV, S = 1 0 . . . 0 0 2 . . . 0 ... ... ... ... 0 0 . . . n , definovat matici A+ = V S+ U, (25.12) kde S+ je diagonální matice s diagonálními prvky + i splňujícími + i = -1 i pro i = 0 a + i = 0 pro i = 0, která v některém smyslu nahrazuje neexistující inverzní matici. Snadno se ověří, že takto definovaná matice splňuje Moore­Penroseovy podmínky: (MP1) AA+ A = A (MP2) A+AA+ = A+ (MP3) AA+ = AA+ (MP4) A+A = A+A Je-li A čtvercová matice, pak xLS = A+ b (25.13) splňuje normálovou rovnici A AxLS = V SUU SVV S+ Ub = V SUb = A b, 160 25.7 Pseudoinverzní matice takže pro libovolný vektor h platí A xLS + h - b 2 = AxLS - b 2 + 2h A AxLS - A b + Ah 2 = AxLS - b 2 + Ah 2 AxLS - b 2 . Vektor xLS tedy minimalizuje Ay - b , čili řeší rovnici Ax = b (25.14) ve smyslu nejmenších čtverců. Jelikož poslední nerovnost přejde v rovnost jen když je splněno Ah = o, lze libovolné řešení rovnice (25.14) ve smyslu nejmenších čtverců zapsat ve tvaru x = xLS + n, n N(A). Z (MP2) a (MP3) dále dostaneme xLS = A+ b = A+ AA+ b = A+ A A+ b = A A+ A+ b, tedy xLS patří do oboru hodnot H(A) matice A. Libovolný vektor n z nulového prostoru N(A) matice A je však podle věty 18.4 ortogonální k H(A) a tedy i k xLS. Pro vektor x = xLS + n, n N(A) tedy platí x 2 = xLS + n 2 = xLS 2 + n 2 xLS 2 , takže vektor xLS nejen řeší rovnici (25.14) ve smyslu nejmenších čtverců, ale má ze všech řešení nejmenší normu. 161 26. Jordanova forma matice Jak víme ze 14. kapitoly, matici můžeme považovat za reprezentaci lineární transformace prostoru konečné dimenze v dané bázi a matice téže transformace v různých bázích jsou si podobné. Vzniká tak otázka, na jaký tvar lze vhodným výběrem báze redukovat matici lineární transformace. Odpověď je jednoduchá v případě, že existuje báze prostoru sestávající z vlastních vektorů, takže dostaneme diagonální matici. V této kapitole se budeme zabývat obecným případem. Vzhledem k tomu, že vlastní čísla reálné matice mohou být komplexní, budeme do konce kapitoly uvažovat výhradně komplexní matice a vektorové prostory. 26.1 Jordanova forma matice s jedním vlastním vektorem V článku 23.3 jsme si dokázali, že každá matice má alespoň jeden vlastní vektor. Víc jich mít nemusí. Například matice A = 2 1 1 0 2 1 0 0 2 má jediné vlastní číslo = 2, avšak soustava (A - I)x = 0 1 1 0 0 1 0 0 0 x1 x2 x3 = o má, až na skalární násobek, jediné řešení e1 = 1 0 0 . Ukazuje se, že vektor e1 lze doplnit vektory e2, e3 do báze, v níž má lineární zobrazení A : x Ax speciální tvar. K jejich nalezení si povšimneme, že existuje e2 tak, že e1 = (A - 2I)e2. V našem případě najdeme e2 řešením x2 +x3 = 1 x3 = 0, odkud e2 = 0 1 0 . Podobně najdeme vektor e3 = 0 -1 1 , 162 26.2 Jordanova forma obecné matice který splňuje e2 = (A - 2I)e3. Platí tedy Ae1 = 2e1 Ae2 = e1 + 2e2 Ae3 = e2 + 2e3, takže matice zobrazení A : x Ax v bázi E = (e1, e2, e3) je dána předpisem [A]E = 2 1 0 0 2 1 0 0 2 . Podobným způsobem lze dokázat, že je-li A libovolná čtvercová matice s jediným vlastním vektorem e1 odpovídajícím vlastnímu číslu , pak e1 lze doplnit do báze tak, že zobrazení A : x Ax má v E matici J = 1 0 . . . 0 0 1 . . . 0 ... ... ... ... ... 0 0 0 ... 1 0 0 0 . . . . Matice J se nazývá Jordanův blok příslušný k vlastnímu číslu . Připomeňme, že za Jordanův blok řádu jedna považujeme matici řádu jedna s vlastním číslem na diagonále. 26.2 Jordanova forma obecné matice Je-li A libovolná čtvercová matice, pak lze dokázat, i když to není snadné, že existují nezávislé vlastní vektory e1, . . . , ek příslušné k vlastním číslům 1, . . . , k, které lze v případě potřeby doplnit do báze E vektory eil splňujícími eil = (A - iI)lei, a to tak, že zobrazení A : x Ax má v E blokově diagonální matici s Jordanovými bloky Ji na diagonále. Platí tedy následující věta. Věta: Nechť A je libovolná čtvercová matice, která má k nezávislých vlastních vektorů příslušných k vlastním číslům 1, . . . , k. Pak existuje regulární matice T tak, že A = T-1 JT, kde J = J1 O . . . O O J2 . . . O ... ... ... ... O O . . . Jn . 163 Kapitola 26. Jordanova forma matice Počet Jordanových bloků J matice A příslušných je roven počtu nezávislých vlastních vektorů příslušných k a nazývá se geometrická násobnost vlastního čísla . Geometrická násobnost je také rovna defektu matice A - I. Z naší definice je zřejmé, že algebraická násobnost jakéhokoliv vlastního čísla není menší než jeho geometrická ná- sobnost. Struktura Jordanovy formy matice je určena defekty dil = d(A - iI)l. K pochopení pravidla si připomeňme, že podobné matice mají stejný defekt a že defekt blokově diagonální matice je roven součtu defektů jejích diagonálních bloků. Stačí tedy sledovat defekty mocnin jednoho Jordanova bloku N = Ji - iI řádu m matice A - iI, který má tvar N = 0 1 0 . . . 0 0 0 1 . . . 0 ... ... ... ... ... 0 0 0 ... 1 0 0 0 . . . 0 . Násobení maticí N si můžeme představit tak, že se vynechá první řádek, ostatní řádky se posunou nahoru a poslední řádek se vyplní nulami. Proto Np = O pro p m a pro p < m platí, že defekt matice Np je právě o jedničku menší než defekt matice Np+1. Zavedeme-li tedy označení wi1 = di1, wi2 = di2 - di1, wi3 = di3 - di2, . . ., pak wil bude celkový počet Jordanových bloků řádu nejméně l s vlastním číslem i. Čísla wil se nazývají Weyrovy charakteristiky matice podle vynikajícího profesora matematiky na české technice Eduarda Weyra (1852-1903). Například nenulové Weyrovy charakteristiky matice 2 1 0 0 0 2 0 0 0 0 2 1 0 0 0 2 odpovídající vlastnímu číslu 1 = 2 jsou w11 = 2, w12 = 2, což odpovídá tomu, že matice má dva Jordanovy bloky řádu nejméně jedna a dva Jordanovy bloky řádu nejméně 2. 26.3 Mocnina matice Jako příklad použití Jordanovy formy se budeme zabývat studiem mocnin matice. Začneme Jordanovým blokem J = I + N řádu m, kde N = J-I je, jako v odstavci 26.2, matice s nulovými prvky kromě jedniček nad diagonálou. Pak J2 = (I + N)2 = 2 I + 2N + N2 = 2 2 1 0 . . . 0 0 2 2 1 . . . 0 ... ... ... ... ... ... 0 0 0 ... ... 1 0 0 0 0 ... 2 0 0 0 0 . . . 2 . 164 26.4 Význam Jordanovy formy Podobně J3 = (I + N)3 = 3 I + 32 N + 3N2 + N3 . Obecněji dostaneme s použitím binomické věty Jk = (I + N)k = k I + k 1 k-1 N + . . . + k k Nk , což můžeme pomocí Nm = O upravit pro k > m na tvar Jk = k I + k 1 k-1 N + . . . + k m - 1 k-m+1 Nm-1 . Dále si všimněme, že platí | k i k-i | = k(k - 1) (k - i + 1) 1 i ||k-i ki ||k-i , a že lim k ki k-i = 0, právě když || < 1. Prvky matice Jk proto konvergují k nule pro k , právě když || < 1. Je-li však A libovolná čtvercová matice, pak existuje regulární matice T a blokově diagonální matice J s Jordanovými bloky na diagonále tak, že A = T-1 JT. Jelikož Ak = T-1 JTT-1 JT T-1 JT = T-1 Jk T a Jk = Jk 1 O . . . O O Jk 2 . . . O ... ... ... ... O O . . . Jk p , dostáváme odtud tvrzení, že prvky libovolné matice Ak konvergují k nule pro k , právě když spektrální poloměr (A) = max{|| : (A)} je menší než 1. Toto tvrzení je důležité pro studium iteračních procesů. 26.4 Význam Jordanovy formy Jordanova forma má velký význam pro teorii, neboť umožňuje redukovat úlohy s obecnými maticemi na úlohy s Jordanovými bloky, jak jsme to viděli v odstavci 26.3. Umožňuje nám například definovat skalární funkce libovolné matice. Početní využití Jordanovy formy je však velmi omezené, neboť je numericky nestabilní. Například matice A = 2 - 1 1 0 2 + 1 0 0 2 165 Kapitola 26. Jordanova forma matice má pro libovolné = 0 tři různá vlastní čísla, takže její Jordanův tvar je J = 2 - 0 0 0 2 + 0 0 0 2 , zatímco J0 = 2 1 0 0 2 1 0 0 2 . 166 Část VI Analytická geometrie 27. Přímky, roviny a metrické úlohy 28. Kvadratické plochy 27. Přímky, roviny a metrické úlohy V závěrečných kapitolách si ukážeme použití aparátu lineární algebry k formulaci a řešení úloh analytické geometrie, což je oblast matematiky, která se zabývá studiem geometrických objektů charakterizovaných číselnými množinami. Budeme přitom vycházet z vlastností trojrozměrného eukleidovského prostoru E3, jehož základní vlastnosti budeme považovat za známé. 27.1 Eukleidovský prostor Při studiu geometrie lze vystačit s vektorovými prostory, jak jsme se ostatně mohli přesvědčit při odvození vzorců pro objemy těles v 25. kapitole. Ukazuje se však, že pro řešení některých úloh je vhodnější uvažovat algebraické struktury s vektory i body. Definice: Nechť je dán vektorový prostor V se skalárním součinem, množina bodů E a zobrazení E × E (A, B) -- AB V. Množina E se nazývá eukleidovský bodový prostor se zaměřením V, jestliže platí: (A1) Ke každému A E a v V existuje jediný bod B E tak, že -- AB = v. (A2) Pro libovolné body A, B, C E platí -- AC = -- AB + -- BC. Slovo ,,eukleidovský připomíná řeckého matematika Eukleida ze 4. století před naším letopočtem, který v třinácti dílech Základů rozpracoval deduktivní metodu řešení problémů. Z axiómů lze odvodit rovnosti, které odpovídají naší intuici. Například -- AA = o, (27.1) neboť pro daný bod A E existuje podle (A1) k libovolnému v V bod B E tak, že v = -- AB, a z komutativity operace sčítání vektorů a (A2) plyne, že v + -- AA = -- AA + v = -- AA + -- AB = -- AB = v. Obdobně lze dokázat, že pro libovolné body A, B E platí -- AB = - -- BA. (27.2) V následujícím výkladu budeme uvažovat trojrozměrný eukleidovský bodový prostor E3, za jehož zaměření budeme považovat množinu všech volných vektorů. Každé uspořádané dvojici bodů A, B E3 přiřadíme volný vektor, který je určen orientovanou úsečkou s počátečním bodem A a koncovým bodem B. 169 Kapitola 27. Přímky, roviny a metrické úlohy Zvolíme-li si libovolný bod O E3 a ortonormální bázi E = (e1, e2, e3) zaměření E3, pak zobrazení E3 A -- OA E R3 bude každému bodu A přiřazovat jednoznačně aritmetický vektor. Bod O se nazývá počátek soustavy souřadnic a čtveřice (O, e1, e2, e3) kartézská soustava souřadnic E3. S její pomocí můžeme E3 i jeho zaměření ztotožnit s prostorem třírozměrných aritmetických vektorů se standardním skalárním součinem definovaným předpisem (u, v) = u1v1 + u2v2 + u3v3. (27.3) Abychom mohli jednoznačně definovat nové operace v původním eukleidovském bodovém prostoru pomocí souřadnic, musíme specifikovat tzv. orientaci soustavy souřadnic. V dalším budeme používat výhradně pravotočivé soustavy souřadnic, jejichž bázové vektory lze umístit (bez vykloubení prstů) po řadě ve směru palce, ukazováku a prostředníku pravé ruky, jako na obr. 27.1. e2 e1 e3 O Obr. 27.1: Pravotočivá soustava souřadnic. 27.2 Přímky v E3 Nechť A E3 je zadaný bod a u E3 zadaný nenulový vektor. Pak přímka p procházející bodem A se směrem u je množina p = {A + tu : t R}. Rozepíšeme-li si tento zápis po složkách, dostaneme pro body X = [X1, X2, X3] přímky p procházející bodem A = [A1, A2, A3] ve směru u = [u1, u2, u3] tzv. parametrické rovnice přímky X1 = A1 + tu1 X2 = A2 + tu2 X3 = A3 + tu3, kde t R se nazývá parametr. 170 27.2 Přímky v E3 Příklad 27.1. Přímka, která prochází body A = [1, 2, 0] a B = [3, 2, 1], má směr u = -- AB = -- AO + -- OB = -- OB - -- OA = B - A, takže její parametrická rovnice má tvar: X1 = 1 + 2t X2 = 2 X3 = t Pro t = 0 dostaneme X = A, pro t = 1 dostaneme X = B. Nechť p a q jsou přímky zadané předpisy p = {A + tu : t R} a q = {B + sv : s R}. Budeme se zabývat jejich vzájemnou polohou. Přímky p a q nemají žádný společný bod, právě když soustava A + tu = B + sv nemá řešení, což nastane, právě když h[u, v] < h[u, v, -- AB ]. (27.4) Platí-li (27.4) a h[u, v] = 2, pak jsou p a q mimoběžné. Když platí (27.4) a h[u, v] = 1, pak jsou p a q rovnoběžné. Přímky p a q mají alespoň jeden společný bod, právě když h[u, v] = h[u, v, -- AB ]. (27.5) Platí-li (27.5) a h[u, v] = 2, pak p a q leží ve stejné rovině a mají společný jediný bod, takže jsou různoběžné. Když platí (27.5) a h[u, v] = 1, pak jsou p a q totožné. 171 Kapitola 27. Přímky, roviny a metrické úlohy 27.3 Roviny v E3 Nechť A je zadaný bod a n je zadaný nenulový vektor. Pak rovina procházející bodem A s normálovým vektorem n je množina r = {X E3 : (n, -- AX ) = 0}. Rozepíšeme-li si tuto definici po složkách, dostaneme pro body X = [X1, X2, X3] roviny r procházející bodem A = [A1, A2, A3] s normálovým vektorem n = [n1, n2, n3] normálovou rovnici roviny n1(X1 - A1) + n2(X2 - A2) + n3(X3 - A3) = 0 (27.6) nebo obecnou rovnici roviny aX1 + bX2 + cX3 + d = 0, (27.7) kde a = n1, b = n2, c = n3 a d = -n1A1 - n2A2 - n3A3. Koeficienty u neznámých v obou rovnicích jsou tedy složky normálového vektoru roviny, zatímco absolutní člen d nemá přímý geometrický význam. Je-li dán bod A a dva nezávislé vektory u, v, pak r = {A + tu + sv : t, s R} definuje rovinu procházející body A, A + u a A + v. Rozepíšeme-li si tento zápis po složkách, dostaneme pro body X = [X1, X2, X3] roviny r parametrické rovnice roviny X1 = A1 + tu1 + sv1 X2 = A2 + tu2 + sv2 X3 = A3 + tu3 + sv3, v nichž můžeme snadno identifikovat souřadnice bodu A i vektorů u, v. Bod X je bodem roviny r, právě když -- AX je lineární kombinací u a v, což nastane, právě když det X1 - A1 X2 - A2 X3 - A3 u1 u2 u3 v1 v2 v3 = 0. Rozvojem determinantu podle prvního řádku dostaneme normálovou rovnici roviny (27.6) s n = [n1, n2, n3], kde n1 = u2 u3 v2 v3 , n2 = u1 u3 v1 v3 , n3 = u1 u2 v1 v2 . Abychom mohli vyšetřit vzájemnou polohu dvou rovin, označme si r a s roviny r = {X E3 : ( -- AX, n) = 0} a s = {X E3 : ( -- BX, m) = 0}. 172 27.4 Vektorový součin Roviny r a s nemají žádný společný bod, právě když soustava (n, -- AX ) = 0 a (m, -- BX ) = 0 nemá žádné řešení. Rozepíšeme-li si rovnice soustavy na tvar n1X1 + n2X2 + n3X3 = n1A1 + n2A2 + n3A3 m1X1 + m2X2 + m3X3 = m1B1 + m2B2 + m3B3, lze ověřit, že to může nastat, jen když h[m, n] = 1 a (m, -- AB ) = 0. V tomto případě jsou roviny rovnoběžné, ale různé. Jestliže h[m, n] = 2, pak roviny r a s jsou různoběžné a mají společnou přímku, jejíž směrový vektor je ortogonální k m a n. Jestliže h[m, n] = 1 a (m, -- AB ) = 0, pak jsou roviny r a s totožné. Podobně můžeme podat výčet možností vzájemné polohy přímky p procházející bodem A se směrem u a roviny r procházející bodem B s normálovým vektorem n. Snadno se ověří, že přímka p má jediný společný bod s r, právě když (n, u) = 0. (27.8) Jestliže neplatí (27.8), pak lze rozlišit dva případy. Buď je přímka p rovnoběžná s r, ale neleží v r, což nastane když (n, u) = 0 a (n, -- AB ) = 0, nebo p leží v r, což nastane, když (n, u) = 0 a (n, -- AB ) = 0. 27.4 Vektorový součin Nechť u = [u1, u2, u3] a v = [v1, v2, v3] jsou dva vektory. Pak jakýkoliv vektor w, který je ortogonální k u i v splňuje rovnice: u1w1 + u2w2 + u3w3 = 0 v1w1 + v2w2 + v3w3 = 0 (27.9) 173 Kapitola 27. Přímky, roviny a metrické úlohy Soustava (27.9) má však stejné řešení jako soustava u1w1 + u2w2 + u3w3 = 0 u1w1 + u2w2 + u3w3 = 0 v1w1 + v2w2 + v3w3 = 0, jejíž determinant splňuje det u1 u2 u3 u1 u2 u3 v1 v2 v3 = u1 u2 u3 v2 v3 - u2 u1 u3 v1 v3 + u3 u1 u2 v1 v2 = 0, i jako soustava v1w1 + v2w2 + v3w3 = 0 u1w1 + u2w2 + u3w3 = 0 v1w1 + v2w2 + v3w3 = 0, jejíž determinant splňuje det v1 v2 v3 u1 u2 u3 v1 v2 v3 = v1 u2 u3 v2 v3 - v2 u1 u3 v1 v3 + v3 u1 u2 v1 v2 = 0. Vzorce w1 = u2 u3 v2 v3 , w2 = u1 u3 v1 v3 , w3 = u1 u2 v1 v2 (27.10) tedy definují složky vektoru w = [w1, w2, w3], který je kolmý k u i v. Budeme ho značit w = u × v a nazývat vektorový součin vektorů u a v. Vzorce (27.10) si můžeme zapamatovat pomocí mnemotechnického zápisu u × v = e1 e2 e3 u1 u2 u3 v1 v2 v3 . (27.11) Jelikož u1 u2 u3 v1 v2 v3 w1 w2 w3 = w1 u2 u3 v2 v3 - w2 u1 u3 v1 v3 + w3 u1 u2 v1 v2 = w2 1 + w2 2 + w2 3, má rovnoběžnostěn na obr. 27.2 objem V = u1 v1 w1 u2 v2 w2 u3 v3 w3 = u1 u2 u3 v1 v2 v3 w1 w2 w3 = w2 1 + w2 2 + w2 3 = w 2 . 174 27.4 Vektorový součin u v w=u×v P O Obr. 27.2: Vektorový součin. Poněvadž má uvažovaný rovnoběžnostěn výšku w a plochu základny P = u v sin , (27.12) kde je odchylka přímek procházejících počátkem O se směrovými vektory u, v, platí P = w . (27.13) Lze ukázat, že vektory (u, v, w) tvoří kladně orientovanou bázi zaměření E3. Z (27.12) a (27.13) plynou ihned vzorce pro plochu rovnoběžníka či trojúhelníka v E3. Například plocha P trojúhelníka určeného body A, B, C E3 je dána vzorcem P = 1 2 -- AB × -- AC . (27.14) Je-li a nenulový vektor, pak můžeme definovat zobrazení A : x a × x. (27.15) Jsou-li e1 = [1, 0, 0], e2 = [0, 1, 0] a e3 = [0, 1, 0], pak podle (27.11) platí: Ae1 = a × e1 = e1 e2 e3 a1 a2 a3 1 0 0 = a3e2 - a2e3 Ae2 = a × e2 = e1 e2 e3 a1 a2 a3 0 1 0 = - a3e1 + a1e3 Ae3 = a × e3 = e1 e2 e3 a1 a2 a3 0 0 1 = a2e1 - a1e2 175 Kapitola 27. Přímky, roviny a metrické úlohy Pro matici A v bázi E = (e1, e2, e3) tedy platí [A]E = 0 -a3 a2 a3 0 -a1 -a2 a1 0 . Matice [A]E je antisymetrická matice, takže matice U = I + [A]E splňuje UU = (I + [A]E)(I - [A]E) = I - [A]E [A] E . Zobrazení x x+a×x proto pro malé a zachovává, až na veličiny srovnatelné s a 2, úhly i délky vektorů, takže ho lze považovat za otočení okolo a o úhel a , a zobrazení x a × x pro libovolný vektor a přiřazuje každému x vektor, který můžeme považovat podle obr. 27.3 za vektor rychlosti otáčení x kolem a s úhlovou rychlostí a , a to ve směru, který je v souladu s kladnou orientací trojice (a, x, a × x). a x a×x Obr. 27.3: Rychlost otáčení. 27.5 Určení některých úhlů Jsou-li u, v dva nenulové vektory, pak odchylka vektorů u, v je úhel [0, ], který splňuje vztah cos = (u, v) u v . Odchylka přímek p a q se směrovými vektory u a v se definuje jeko nejmenší odchylka dvou vektorů, které lze umístit na p nebo q, takže splňuje cos = |(u, v)| u v . Obdobně se definuje odchylka přímky p se směrovým vektorem u a roviny r s normálovým vektorem n. Můžeme ji vypočítat pomocí odchylky přímky p a libovolné jiné přímky se směrovým vektorem n ze vztahu sin = cos 2 - = |(n, u)| n u . Odchylka dvou rovin, což je nejmenší úhel dvou přímek, z nichž každá leží v jedné z rovin, vyjádříme snadno pomocí jejich normálových vektorů n1, n2 a vztahu cos = |(n1, n2)| n1 n2 . 176 27.6 Některé metrické úlohy 27.6 Některé metrické úlohy K určení vzdálenosti d bodu M od roviny r = {X E3 : ( -- AX, n) = 0} stačí najít průmět vektoru -- AM do normálového směru n. Platí tedy d = |( -- AM, n)| n . Vzdálenost d bodu M od přímky p procházející bodem A se směrem u určíme s pomocí obr. 27.5. Z P = u × -- AM a P = u d dostaneme snadno d = u × -- AM u . Obdobně určíme i nejkratší vzdálenost dvou mimoběžek p a q, kde p = {A + tu : t R} a q = {B + tv : t R}. Podle obr. 27.6 platí pro objem V rovnoběžnostěnu určeného hranami -- AB, u, v V = | det -- AB, u, v | = P d, zatímco pro plochu P jeho základny platí P = u × v . Odtud d = V P = | det -- AB, u, v | u × v . n AM M r d {A Obr. 27.4: Vzdálenost bodu od roviny. 177 Kapitola 27. Přímky, roviny a metrické úlohy p A P M u d Obr. 27.5: Vzdálenost bodu od přímky. A B p q V P u v d Obr. 27.6: Vzdálenost (příčka) dvou mimoběžek. 178 28. Kvadratické plochy V této kapitole se budeme zabývat kvadratickými plochami, čili kvadrikami, které jsou popsány rovnicemi s kvadratickými formami. Tak jako v kapitole 27, omezíme se na kvadratické plochy v prostoru E3. Budeme také předpokládat, že v E3 je zadána soustava souřadnic (O, e1, e2, e3), s jejíž pomocí můžeme body E3 ztotožnit s třírozměrnými aritmetickými vektory, stejně jako vektory zaměření E3. 28.1 Kanonický tvar kvadratické formy Nechť A je symetrická čtvercová matice řádu tři, nechť b = [bi] je třírozměrný sloupcový vektor a nechť c je reálné číslo. Kvadratická plocha q je množina všech bodů, jejichž souřadnice X splňují rovnici X AX + 2b X + c = 0. (28.1) Kvadratická forma Q(X) = XAX se nazývá kvadratický člen rovnice kvadratické plochy, lineární forma (X) = 2bX se nazývá lineární člen a c se nazývá absolutní člen rovnice kvadratické plochy. Tak, jak je rovnice (28.1) napsána, není vyloučeno, že jí nevyhovuje žádný bod E3. V některých případech se proto uvažují i komplexní řešení. My se však omezíme jen na reálná řešení (28.1), která mohou být ztotožněna s body E3. Podobně, jako nemá absolutní člen rovnice roviny bezprostřední geometrický význam, nemají ani prvky matice A či vektoru b obecně žádnou bezprostřední geometrickou interpretaci. Naším prvním krokem proto bude nalezení takového tvaru rovnice kvadratické plochy, jejíž koeficienty mají geometrický význam. Jelikož matice A je symetrická, existuje podle věty o spektrálním rozkladu 24.4 ortogonální matice Q tak, že A = QDQ, kde D je diagonální matice s vlastními čísly i matice A na diagonále. Po dosazení do (28.1) dostaneme X Q DQX + 2b X + c = 0. (28.2) Povšimneme-li si, že 2b X = 2(Qb) QX, můžeme pomocí substituce Y = QX přepsat (28.2) na tvar Y DY + 2(Qb) Y + c = 0. (28.3) Podle úvah z článku 14.7 můžeme (28.3) považovat za definici téže kvadratické plochy jako (28.1) v jiné kartézské soustavě souřadnic (O, f1, f2, f3). Položme b = Qb a rozepišme si (28.3) na tvar 1Y 2 1 + 2Y 2 2 + 3Y 2 3 + 2b1Y1 + 2b2Y2 + 2b3Y3 + c = 0. (28.4) Nyní si všimněme, že pokud i = 0, pak iY 2 i + 2biYi = i Y 2 i + 2 bi i Yi + b2 i 2 i - b2 i 2 i = i Yi + bi i 2 - b2 i 2 i . 179 Kapitola 28. Kvadratické plochy Pomocí vhodné substituce tak můžeme zapsat každou kvadratickou plochu definovanou kvadratickou formou hodnosti 3 ve tvaru 1Z2 1 + 2Z2 2 + 3Z2 3 = d (28.5) a každou kvadratickou plochu definovanou kvadratickou formou hodnosti 2 ve tvaru 1Z2 1 + 2Z2 2 + cZ3 = d. (28.6) Lze ukázat, že každou kvadratickou plochu definovanou kvadratickou formou hodnosti 1 můžeme zapsat ve tvaru 1Z2 1 + cZ2 = d. (28.7) Substituce typu Zi = Yi + ci lze interpretovat jako přechod od soustavy (O, f1, f2, f3) k soustavě (O, f1, f2, f3), kde v původní soustavě -- OO = [c1, c2, c3]. 28.2 Kvadratické plochy v kanonickém tvaru Zatímco ve tvarech (28.5), (28.6) a (28.7) jsou zachovány vlastní čísla kvadratické formy, která definuje kvadratickou plochu, pro znázornění je vhodnější převést kvadratickou formu na kanonický tvar, v němž lze připsat všem koeficientům geometrický význam související s řezy kvadratické plochy souřadnicovými rovinami. Omezíme se zde na stručný výčet kanonických tvarů důležitějších ploch a jejich řezů. Čtenáři doporučujeme doplnit výčet obrázky. Souřadnice bodů kvadrik budeme značit v analytické geometrii obvyklým x, y, z. (i) Elipsoid x2 a2 + y2 b2 + z2 c2 = 1, a > 0, b > 0, c > 0. Řezy elipsoidu souřadnicovými rovinami představují elipsy. Pokud a = b = c, dostaneme kulovou plochu. (ii) Jednodílný hyperboloid x2 a2 + y2 b2 - z2 c2 = 1, a > 0, b > 0, c > 0. Řezem rovinou z = 0 dostaneme elipsu s poloosami a, b, zatímco řezy zbývajícími souřadnicovými rovinami dostaneme hyperboly. (iii) Dvojdílný hyperboloid x2 a2 - y2 b2 - z2 c2 = 1, a > 0, b > 0, c > 0. Rovina z = 0 odděluje oba díly dvojdílného hyperboloidu. Řezy zbývajícími souřadnicovými rovinami jsou hyperboly. 180 28.2 Kvadratické plochy v kanonickém tvaru (iv) Eliptický paraboloid x2 a2 + y2 b2 - 2pz = 0, a > 0, b > 0, p = 0. V rovině z = 0 leží jediný bod, řezy zbývajícími souřadnicovými rovinami jsou paraboly. (v) Hyperbolický paraboloid x2 a2 - y2 b2 - 2pz = 0, a > 0, b > 0, p = 0. Řezem v rovině z = 0 dostaneme dvě přímky, řezy zbývajícími souřadnicovými rovinami jsou paraboly. (vi) Eliptická kuželová plocha x2 a2 + y2 b2 - z2 c2 = 0, a > 0, b > 0, c > 0. Řez rovinou z = 0 je bod, řezy zbývajícími souřadnicovými rovinami tvoří různo- běžky. (vii) Eliptická válcová plocha x2 a2 + y2 b2 = 1, a > 0, b > 0. Řez libovolnou rovinou z = c je elipsa s výše uvedenou rovnicí. (viii) Parabolická válcová plocha x2 = 2py, p = 0. Řez libovolnou rovinou z = c je parabola s výše uvedenou rovnicí. (ix) Hyperbolická válcová plocha x2 a2 - y2 b2 = 1, a > 0, b > 0. Řez libovolnou rovinou z = c je hyperbola s výše uvedenou rovnicí. 181 Seznam literatury Existuje rozsáhlá literatura věnovaná lineární algebře. Omezíme se zde na minimum poměrně přístupných titulů. Skripta M. Demlová, B. Pondělíček: Úvod do algebry, ČVUT Praha 1996. Knihy v češtině L. Bican: Lineární algebra, SNTL Praha 1979. O. Borůvka: Základy teorie matic, Academia Praha 1971. B. Budinský, J. Charvát: Matematika I, SNTL Praha 1987. V. Havel, J. Holenda: Lineární algebra, SNTL/ALFA Praha 1984. J. Schmidtmayer: Maticový počet a jeho použití v technice, SNTL Praha 1967. M. Zahradník, L. Motl: Pěstujeme lineární algebru, Karolinum Praha 1998. Též na http://www.kolej.mff.cuni.cz/ lmotm275/skripta/ Monografie F. R. Gantmacher: Teoria matric, Nauka Moskva 1967 (anglický překlad Chelsea, New York 1959). G. Golub, Ch. van Loan: Matrix Computations, The John Hopkins University Press, London 1991. 182 Seznam definic Definice 1.3 ­ Zobrazení . . . . . . . . . . . . . . . . . . . . . . . . 6 Definice 6.2 ­ Inverzní matice . . . . . . . . . . . . . . . . . . . . . . 34 Definice 8.1 ­ Algebraické operace . . . . . . . . . . . . . . . . . . . . 47 Definice 8.2 ­ Asociativní operace . . . . . . . . . . . . . . . . . . . . 47 Definice 8.3 ­ Komutativní operace . . . . . . . . . . . . . . . . . . . 48 Definice 8.4 ­ Neutrální prvek . . . . . . . . . . . . . . . . . . . . . 49 Definice 8.5 ­ Inverzní prvek . . . . . . . . . . . . . . . . . . . . . . 50 Definice 8.6 ­ Grupa . . . . . . . . . . . . . . . . . . . . . . . . . 51 Definice 8.7 ­ Komutativní těleso . . . . . . . . . . . . . . . . . . . . 52 Definice 9.1 ­ Vektorový prostor . . . . . . . . . . . . . . . . . . . . 53 Definice 9.3 ­ Podprostor . . . . . . . . . . . . . . . . . . . . . . . 55 Definice 10.1 ­ Lineárně nezávislé vektory . . . . . . . . . . . . . . . . 57 Definice 10.4 ­ Báze vektorového prostoru . . . . . . . . . . . . . . . . 60 Definice 11.1 ­ Souřadnice vektoru . . . . . . . . . . . . . . . . . . . 62 Definice 12.1 ­ Dimenze vektorového prostoru . . . . . . . . . . . . . . . 65 Definice 13.1 ­ Lineární zobrazení . . . . . . . . . . . . . . . . . . . . 74 Definice 13.3 ­ Nulový prostor . . . . . . . . . . . . . . . . . . . . . 75 Definice 13.4 ­ Hodnost a defekt zobrazení . . . . . . . . . . . . . . . . 75 Definice 13.5 ­ Součet zobrazení a násobení skalárem . . . . . . . . . . . 77 Definice 13.6 ­ Skládání lineárních zobrazení . . . . . . . . . . . . . . . 77 Definice 14.4 ­ Matice lineárního zobrazení . . . . . . . . . . . . . . . . 84 Definice 14.8 ­ Podobné matice . . . . . . . . . . . . . . . . . . . . . 88 Definice 15.1 ­ Bilineární forma . . . . . . . . . . . . . . . . . . . . . 89 Definice 15.6 ­ Kongruentní matice . . . . . . . . . . . . . . . . . . . 93 Definice 16.1 ­ Kvadratická forma . . . . . . . . . . . . . . . . . . . . 94 Definice 16.6 ­ Pozitivně definitní kvadratické formy . . . . . . . . . . . . 99 Definice 18.1 ­ Skalární součin . . . . . . . . . . . . . . . . . . . . . 108 Definice 18.2 ­ Norma vektoru . . . . . . . . . . . . . . . . . . . . . 108 Definice 18.4 ­ Ortogonální množina vektorů . . . . . . . . . . . . . . . 110 Definice 20.2 ­ Determinant matice . . . . . . . . . . . . . . . . . . . 125 Definice 22.2 ­ Adjungovaná matice . . . . . . . . . . . . . . . . . . . 134 Definice 23.1 ­ Vlastní čísla a vektory . . . . . . . . . . . . . . . . . . 141 Definice 24.3 ­ Invariantní podprostory . . . . . . . . . . . . . . . . . 148 Definice 25.3 ­ Skalární funkce symetrické matice . . . . . . . . . . . . . 155 Definice 27.1 ­ Eukleidovský prostor . . . . . . . . . . . . . . . . . . . 169 183 Obsah Úvod 2 Část I. Matice a řešení soustav lineárních rovnic 1. Zobrazení a lineární rovnice 5 1.1 Elektrický obvod se zdrojem a spotřebiči . . . . . . . . . . . . . . 5 1.2 Vztah mezi napětími a potenciály . . . . . . . . . . . . . . . . . 6 1.3 Zobrazení . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.4 Proud a napětí . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.5 Kirchhoffův zákon proudů . . . . . . . . . . . . . . . . . . . . 7 1.6 Interpretace řešení soustavy rovnic . . . . . . . . . . . . . . . . . 7 2. Úpravy a řešení soustav lineárních rovnic 11 2.1 Ekvivalentní úpravy . . . . . . . . . . . . . . . . . . . . . . . 11 2.2 Maticový zápis . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.3 Úprava na schodový tvar . . . . . . . . . . . . . . . . . . . . . 13 2.4 Zpětná substituce . . . . . . . . . . . . . . . . . . . . . . . . 14 2.5 Gaussova eliminace . . . . . . . . . . . . . . . . . . . . . . . 15 2.6 Gauss-Jordanova metoda . . . . . . . . . . . . . . . . . . . . . 16 2.7 Pracnost řešení . . . . . . . . . . . . . . . . . . . . . . . . . 16 3. Aritmetické vektory 18 3.1 Aritmetické vektory . . . . . . . . . . . . . . . . . . . . . . . 18 3.2 Nulový a opačný vektor . . . . . . . . . . . . . . . . . . . . . 20 4. Matice a vektorové operace 22 4.1 Definice a označení . . . . . . . . . . . . . . . . . . . . . . . 22 4.2 Násobení matice skalárem a sčítání matic . . . . . . . . . . . . . . 23 4.3 Nulová matice a odečítání matic . . . . . . . . . . . . . . . . . . 24 4.4 Matice rozdělené na bloky . . . . . . . . . . . . . . . . . . . . 24 5. Násobení a transponování matic 26 5.1 Násobení matice a vektoru . . . . . . . . . . . . . . . . . . . . 26 5.2 Násobení matic . . . . . . . . . . . . . . . . . . . . . . . . . 27 5.3 Pravidla pro násobení matic . . . . . . . . . . . . . . . . . . . 29 5.4 Transponované matice . . . . . . . . . . . . . . . . . . . . . . 30 5.5 Násobení a transponování blokových matic . . . . . . . . . . . . . 31 6. Inverzní matice 33 6.1 Maticový zápis elementárních úprav . . . . . . . . . . . . . . . . 33 6.2 Inverzní matice . . . . . . . . . . . . . . . . . . . . . . . . . 34 6.3 Elementární úpravy a regularita . . . . . . . . . . . . . . . . . . 35 6.4 Výpočet inverzní matice . . . . . . . . . . . . . . . . . . . . . 35 6.5 Inverzní matice a řešení soustav . . . . . . . . . . . . . . . . . . 36 6.6 Vyčíslení výrazů s inverzní maticí . . . . . . . . . . . . . . . . . 37 6.7 Použití inverzní matice . . . . . . . . . . . . . . . . . . . . . . 37 184 7. Trojúhelníkový rozklad 39 7.1 Permutační matice . . . . . . . . . . . . . . . . . . . . . . . 39 7.2 Trojúhelníkové matice . . . . . . . . . . . . . . . . . . . . . . 40 7.3 Trojúhelníkový (LU) rozklad . . . . . . . . . . . . . . . . . . . 40 7.4 Výpočet LU rozkladu . . . . . . . . . . . . . . . . . . . . . . 41 7.5 Řešení soustav pomocí LU rozkladu . . . . . . . . . . . . . . . . 43 7.6 Použití LU rozkladu . . . . . . . . . . . . . . . . . . . . . . . 44 Část II. Vektorové prostory 8. Algebraické operace a struktury 47 8.1 Algebraické operace . . . . . . . . . . . . . . . . . . . . . . . 47 8.2 Asociativní operace . . . . . . . . . . . . . . . . . . . . . . . 47 8.3 Komutativní operace . . . . . . . . . . . . . . . . . . . . . . . 48 8.4 Neutrální prvek . . . . . . . . . . . . . . . . . . . . . . . . . 49 8.5 Inverzní prvek . . . . . . . . . . . . . . . . . . . . . . . . . 49 8.6 Grupa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 8.7 Komutativní těleso . . . . . . . . . . . . . . . . . . . . . . . 52 9. Vektorové prostory 53 9.1 Vektorový prostor . . . . . . . . . . . . . . . . . . . . . . . . 53 9.2 Rovnosti odvozené z axiomů . . . . . . . . . . . . . . . . . . . 54 9.3 Podprostory . . . . . . . . . . . . . . . . . . . . . . . . . . 55 9.4 Součet a průnik podprostorů . . . . . . . . . . . . . . . . . . . 55 9.5 Vektory v matematice a ve fyzice . . . . . . . . . . . . . . . . . 56 10. Lineární nezávislost a báze 57 10.1 Závislé a nezávislé vektory . . . . . . . . . . . . . . . . . . . . 57 10.2 Lineární kombinace a závislost . . . . . . . . . . . . . . . . . . 58 10.3 Postačující podmínky pro nezávislost funkcí . . . . . . . . . . . . . 59 10.4 Báze vektorového prostoru . . . . . . . . . . . . . . . . . . . . 60 11. Souřadnice 62 11.1 Souřadnice vektoru . . . . . . . . . . . . . . . . . . . . . . . 62 11.2 Použití souřadnic . . . . . . . . . . . . . . . . . . . . . . . . 63 12. Dimenze a řešení soustav 65 12.1 Dimenze vektorového prostoru . . . . . . . . . . . . . . . . . . . 65 12.2 Dimenze a vyjádření vektoru jako lineární kombinace . . . . . . . . . 66 12.3 Řádkový prostor a řádková hodnost . . . . . . . . . . . . . . . . 67 12.4 Sloupcová hodnost matice . . . . . . . . . . . . . . . . . . . . 68 12.5 Hodnost a řešitelnost soustav . . . . . . . . . . . . . . . . . . . 69 12.6 Hodnost a regularita . . . . . . . . . . . . . . . . . . . . . . . 69 12.7 Hodnost matice a počítačová aritmetika . . . . . . . . . . . . . . 70 185 Část III. Lineární a multilineární zobrazení 13. Lineární zobrazení 73 13.1 Definice a příklady lineárních zobrazení . . . . . . . . . . . . . . . 73 13.2 Elementární vlastnosti lineárního zobrazení . . . . . . . . . . . . . 74 13.3 Nulový prostor a obor hodnot . . . . . . . . . . . . . . . . . . . 75 13.4 Hodnost a defekt zobrazení . . . . . . . . . . . . . . . . . . . . 75 13.5 Součet zobrazení a násobení skalárem . . . . . . . . . . . . . . . 77 13.6 Skládání lineárních zobrazení . . . . . . . . . . . . . . . . . . . 77 13.7 Mnohočleny v lineárních transformacích . . . . . . . . . . . . . . 78 13.8 Princip superpozice a inverze lineárních zobrazení . . . . . . . . . . 79 14. Lineární zobrazení a matice 81 14.1 Maticový zápis lineárních zobrazení Rm do Rn . . . . . . . . . . . . 81 14.2 Určení báze nulového prostoru matice . . . . . . . . . . . . . . . 82 14.3 Matice jako lineární zobrazení a soustavy rovnic . . . . . . . . . . . 83 14.4 Definice matice lineárního zobrazení . . . . . . . . . . . . . . . . 84 14.5 Souřadnice obrazu vektoru . . . . . . . . . . . . . . . . . . . . 85 14.6 Matice složeného zobrazení . . . . . . . . . . . . . . . . . . . . 86 14.7 Změna báze . . . . . . . . . . . . . . . . . . . . . . . . . . 87 14.8 Podobnost matic . . . . . . . . . . . . . . . . . . . . . . . . 88 15. Bilineární formy 89 15.1 Definice a příklady . . . . . . . . . . . . . . . . . . . . . . . 89 15.2 Klasifikace bilineárních forem . . . . . . . . . . . . . . . . . . . 90 15.3 Matice bilineární formy . . . . . . . . . . . . . . . . . . . . . 91 15.4 Matice symetrické formy . . . . . . . . . . . . . . . . . . . . . 92 15.5 Změna matice bilineární formy při změně báze . . . . . . . . . . . . 92 15.6 Kongruentní matice . . . . . . . . . . . . . . . . . . . . . . . 93 16. Kvadratické formy 94 16.1 Definice a příklady . . . . . . . . . . . . . . . . . . . . . . . 94 16.2 Základní vlastnosti . . . . . . . . . . . . . . . . . . . . . . . 95 16.3 Matice kvadratické formy . . . . . . . . . . . . . . . . . . . . . 95 16.4 Diagonální tvar matice kvadratické formy . . . . . . . . . . . . . . 96 16.5 Kvadratické formy v R2 . . . . . . . . . . . . . . . . . . . . . 97 16.6 Pozitivně definitní kvadratické formy . . . . . . . . . . . . . . . . 99 17. Kongruence symetrických a diagonálních matic 101 17.1 Diagonální redukce pozitivně definitní matice . . . . . . . . . . . . 101 17.2 LDL rozklad a řešení soustav s pozitivně definitní maticí . . . . . . . 103 17.3 Kongruence symetrické a diagonální matice . . . . . . . . . . . . . 103 17.4 Zákon setrvačnosti kvadratických forem . . . . . . . . . . . . . . . 105 18. Skalární součin a ortogonalita 107 18.1 Definice skalárního součinu . . . . . . . . . . . . . . . . . . . . 107 18.2 Norma vektoru . . . . . . . . . . . . . . . . . . . . . . . . . 108 186 18.3 Norma indukovaná skalárním součinem . . . . . . . . . . . . . . . 108 18.4 Ortogonální množiny vektorů . . . . . . . . . . . . . . . . . . . 110 18.5 Schmidtův ortogonalizační proces . . . . . . . . . . . . . . . . . 112 18.6 Ortogonální matice . . . . . . . . . . . . . . . . . . . . . . . 113 19. Variační metody a metoda nejmenších čtverců 115 19.1 Variační princip . . . . . . . . . . . . . . . . . . . . . . . . . 115 19.2 Metoda nejmenších čtverců . . . . . . . . . . . . . . . . . . . . 116 19.3 Aproximace a projektory . . . . . . . . . . . . . . . . . . . . . 118 Část IV. Determinanty 20. Induktivní definice determinantu 123 20.1 Explicitní řešení malých soustav . . . . . . . . . . . . . . . . . . 123 20.2 Induktivní definice determinantu . . . . . . . . . . . . . . . . . 125 20.3 Výpočetní náročnost . . . . . . . . . . . . . . . . . . . . . . . 126 21. Determinant a antisymetrické formy 127 21.1 Linearita v prvním řádku . . . . . . . . . . . . . . . . . . . . . 127 21.2 Antisymetrie v prvních dvou řádcích . . . . . . . . . . . . . . . . 127 21.3 Antisymetrie v libovolné dvojici řádků . . . . . . . . . . . . . . . 128 21.4 Linearita v libovolném řádku . . . . . . . . . . . . . . . . . . . 128 21.5 Výpočet hodnoty determinantu . . . . . . . . . . . . . . . . . . 130 21.6 Determinant součinu matic . . . . . . . . . . . . . . . . . . . . 131 22. Determinant a inverzní matice 133 22.1 Rozvoj determinantu podle prvků libovolného řádku . . . . . . . . . 133 22.2 Adjungovaná a inverzní matice . . . . . . . . . . . . . . . . . . 134 22.3 Determinant transponované matice . . . . . . . . . . . . . . . . 135 22.4 Determinant jako funkce sloupců . . . . . . . . . . . . . . . . . 136 22.5 Cramerovy vzorce pro řešení soustav . . . . . . . . . . . . . . . . 136 22.6 Použití Cramerových vzorců . . . . . . . . . . . . . . . . . . . 137 Část V. Úvod do spektrální teorie 23. Vlastní čísla a vektory 141 23.1 Vlastní čísla a vektory . . . . . . . . . . . . . . . . . . . . . . 141 23.2 Charakteristický mnohočlen a spektrum . . . . . . . . . . . . . . 142 23.3 Neprázdnost spektra transformace . . . . . . . . . . . . . . . . . 143 23.4 Invariantnost vzhledem k podobnosti . . . . . . . . . . . . . . . . 144 23.5 Součet a součin vlastních čísel . . . . . . . . . . . . . . . . . . . 144 23.6 Lokalizace vlastních čísel . . . . . . . . . . . . . . . . . . . . . 145 24. Spektrální rozklad symetrické matice 147 24.1 Spektrum symetrické matice . . . . . . . . . . . . . . . . . . . 147 24.2 Vlastní vektory reálné symetrické matice . . . . . . . . . . . . . . 147 187 24.3 Invariantní podprostory . . . . . . . . . . . . . . . . . . . . . 148 24.4 Spektrální rozklad reálné symetrické matice . . . . . . . . . . . . . 149 24.5 Geometrie spektrálního rozkladu . . . . . . . . . . . . . . . . . . 150 24.6 Extremální vlastnosti vlastních čísel . . . . . . . . . . . . . . . . 150 25. Důsledky spektrálního rozkladu 153 25.1 Lokalizace spektra pomocí kongruence . . . . . . . . . . . . . . . 153 25.2 Sylvesterovo kritérium pozitivní definitnosti . . . . . . . . . . . . . 154 25.3 Skalární funkce symetrické matice . . . . . . . . . . . . . . . . . 155 25.4 Polární rozklad . . . . . . . . . . . . . . . . . . . . . . . . . 156 25.5 Geometrický význam determinantu . . . . . . . . . . . . . . . . 157 25.6 Singulární rozklad a podmíněnost matice . . . . . . . . . . . . . . 159 25.7 Pseudoinverzní matice . . . . . . . . . . . . . . . . . . . . . . 160 26. Jordanova forma matice 162 26.1 Jordanova forma matice s jedním vlastním vektorem . . . . . . . . . 162 26.2 Jordanova forma obecné matice . . . . . . . . . . . . . . . . . . 163 26.3 Mocnina matice . . . . . . . . . . . . . . . . . . . . . . . . . 164 26.4 Význam Jordanovy formy . . . . . . . . . . . . . . . . . . . . 165 Část VI. Analytická geometrie 27. Přímky, roviny a metrické úlohy 169 27.1 Eukleidovský prostor . . . . . . . . . . . . . . . . . . . . . . . 169 27.2 Přímky v E3 . . . . . . . . . . . . . . . . . . . . . . . . . . 170 27.3 Roviny v E3 . . . . . . . . . . . . . . . . . . . . . . . . . . 172 27.4 Vektorový součin . . . . . . . . . . . . . . . . . . . . . . . . 173 27.5 Určení některých úhlů . . . . . . . . . . . . . . . . . . . . . . 176 27.6 Některé metrické úlohy . . . . . . . . . . . . . . . . . . . . . . 177 28. Kvadratické plochy 179 28.1 Kanonický tvar kvadratické formy . . . . . . . . . . . . . . . . . 179 28.2 Kvadratické plochy v kanonickém tvaru . . . . . . . . . . . . . . . 180 Seznam literatury 182 Seznam definic 183 Obsah 184 188