Skalární součin a dualita Kolmé projekce Rozklad ortogonálních zobrazení Matematika I – 7b Vlastnosti lineárních zobrazení Jan Slovák Masarykova univerzita, Fakulta informatiky 31. 10. 2012 Skalární součin a dualita Kolmé projekce Rozklad ortogonálních zobrazení Obsah přednášky 1 Skalární součin a dualita 2 Kolmé projekce 3 Rozklad ortogonálních zobrazení Skalární součin a dualita Kolmé projekce Rozklad ortogonálních zobrazení Duální prostory a zobrazení, skalární součin – připomenutí Množina všech lineárních forem na daném prostoru V je opět vektorový prostor, značíme jej V ∗. Pokud je V konečněrozměrný, je V ∗ izomorfní prostoru V . Realizace takového izomorfismu je dána např. volbou tzv. duální báze k zvolené bázi na V , jejímiž prvky αi jsou právě formy zadávající i-tou souřadnici. Sesquilineární formy jsou takové formy α na komplexním vektorovém prostoru, které jsou lineární nad R, zatímco pro komplexní a platí α(av) = ¯aα(v). Definition (Unitární vektorový prostor) Skalární součin na (komplexním) vektorovém prostoru V je forma , : V × V → R, která je lineární v prvním argumentu, u, v = v, u , v, v ≥ 0 a nulová hodnota nastává pouze při v = 0. Pro skalární součin se často používá také obvyklé tečky, tj. u, v = u · v. Skalární součin a dualita Kolmé projekce Rozklad ortogonálních zobrazení Ortonormální báze - připomenutí Definition Vektory v a w ∈ V se nazývají ortogonální, jestliže v, w = 0. Vektor v se nazývá normovaný, jestliže v = 1. Báze prostoru V složená z ortogonálních vektorů se nazývá ortogonální báze. Jsou-li bázové vektory navíc i normované, je to ortonormální báze. Theorem Skalární součin je v každé ortonormální bázi dán výrazem x, y = xT · ¯y. V obecné bázi V existuje symetrická matice S taková, že x, y = xT · S · ¯y. Grammova-Schmidtova ortogonalizace vždy dá ortonormální báze. Skalární součin a dualita Kolmé projekce Rozklad ortogonálních zobrazení Jestliže zvolíme pevně jeden vektor v ∈ V , dosazování vektorů za druhý argument ve skalárním součinu nám dává zobrazení V → V ∗ = Hom(V , R) V v → (w → v, w ∈ R). Nedegenerovanosti skalárního součinu zaručuje, že je to bijekce. Je vidět, že vektory ortonormální báze jsou zobrazeny na formy tvořící bázi duální. Lieární f : V → W zadává tzv. duální zobrazení f ∗ : W ∗ → V ∗ mezi formami, definované pro všechny w∗ ∈ W ∗, v ∈ V f ∗ (w∗ )(v) = w∗ (f (v)). V libovolných bazích na V a W a jejich duálních bazích na V ∗ a W ∗ pak tentýž definiční vztah má tvar (píšeme ˜A pro matici zobrazení f ∗, xT souřadnice formy w∗, y souřadnice v) (˜AxT ) · y = xT · (A · y) a proto duální zobrazení má v duálních bazích matici AT . Skalární součin a dualita Kolmé projekce Rozklad ortogonálních zobrazení V případě vektorových prostorů se skalárním součinem (reálné nebo komplexní), převádí výše uvedené bijekce duální zobrazení f ∗ na tobrazení f ∗ : W → V zadané vztahem f (u), v = u, f ∗ (v) a tomuto zobrazení se říká adjungované zobrazení k f . Předchozí výpočet v souřadnicích pro symetrická zobrazení nám ve skutečnosti sdělil, že je-li A matice zobrazení f v ortonormální bázi, pak matice adjungovaného zobrazení f ∗ je matice konjugovaná a transponovaná A∗ := ¯AT . Zobrazením f : V → V , která jsou rovna svým adjungovaným zobrazením f ∗, se říká samoadjungovaná. Skalární součin a dualita Kolmé projekce Rozklad ortogonálních zobrazení Lineární zobrazení f : V → V se nazývá projekce, jestliže platí f ◦ f = f . V takovém případě je pro každý vektor v ∈ V v = f (v) + (v − f (v)) ∈ Im(f ) + Ker(f ) = V a je-li v ∈ Im(f ) a f (v) = 0, pak je i v = 0. Je tedy přechozí součet podprostorů přímý. Říkáme, že f je projekce na podprostor W = Im(f ) podél podprostoru U = Ker(f ). Slovy se dá projekce popsat přirozeně takto: rozložíme daný vektor na komponentu ve W a v U a tu druhou zapomeneme. Skalární součin a dualita Kolmé projekce Rozklad ortogonálních zobrazení Předpokládejme nyní, že na V je definován skalární součin. Pro každý pevně zvolený podprostor W ⊂ V definujeme jeho ortogonální doplněk W ⊥ = {u ∈ V ; u, v = 0 pro všechny v ∈ W }. Přímo z definice je zjevné, že W ⊥ je vektorový podprostor. Jestliže W ⊂ V má bázi (u1, . . . , uk) je podmínka pro W ⊥ dána jako k homogenních rovnic pro n proměnných. Bude tedy mít W ⊥ dimenzi alespoň n − k. Zároveň ale u ∈ W ∩ W ⊥ znamená u, u = 0 a tedy i u = 0 podle definice skalárního součinu. Zřejmě je tedy vždy V = W ⊕ W ⊥ . Každý podprostor W = V definuje kolmou projekci na W . Je to projekce na W podél W ⊥. Skalární součin a dualita Kolmé projekce Rozklad ortogonálních zobrazení Pokud máme zadán podprostor W ⊂ V a jeho ortonormální bázi (e1, . . . , ek), jde ji jistě doplnit na ortonormální bázi (e1, . . . , en) celého V . Kolmá projekce obecného vektoru v ∈ V do W pak bude dána vztahem v → e1, v e1 + · · · + ek, v ek. Pro kolmou projekci nám tedy stačí znát jen ortonormání bázi podprostoru W , na nejž promítáme. Povšimněme si také, že obecně jsou projekce f na podprostor W podél U a projekce g na U podél W svázány vztahem g = idV −f . Je tedy u kolmých projekcí na daný podprostor W vždy výhodnější počítat ortonormální bázi toho z dvojice W , W ⊥, který má menší dimenzi. Skalární součin a dualita Kolmé projekce Rozklad ortogonálních zobrazení Ortogonální a unitární zobrazení - připomenutí Zobrazení f : V → W , které zachovává velikosti pro všechny vektory u ∈ V , se nazývá ortogonální zobrazení. Požadujeme tedy f (u), f (u) = u, u . Z linearity f a symetrie skalárního součinu plyne f (u + v), f (u + v) = f (u), f (u) + f (v), f (v) + 2 f (u), f (v) , je tedy ekvivalentní podmínkou i zdánlivě silnější požadavek, aby f (u), f (v) = u, v , pro všechny vektory u, v ∈ V . Skalární součin a dualita Kolmé projekce Rozklad ortogonálních zobrazení Obecně, ortogonální zobrazení musí vždycky být injektivní, protože podmínka f (u), f (u) = 0 znamená i u, u = 0 a tedy u = 0. Je tedy vždy v takovém případě dimenze oboru hodnot alespoň taková, jako je dimenze definičního oboru f . Bez újmy na obecnosti proto můžeme rovnou předpokládat, že jsou stejné a f : V → V (pokud by nebyly, doplníme ortonormální bázi na oboru hodnot). Matice ortogonálního zobrazení v ortonormální bázi splňuje pro všechny vektory x a y v prostoru Kn: (A · x)T · (¯A · ¯y) = xT · (AT · ¯A) · ¯y = xT · ¯y. Speciálními volbami vektorů standardní báze za x a y dostaneme přímo, že ¯AT · A = E, tedy tentýž výsledek jako v reálné dimenzi 2! Skalární součin a dualita Kolmé projekce Rozklad ortogonálních zobrazení Dokázali jsme tak následující tvrzení: Theorem Nechť V je reálný nebo komplexní vektorový prostor se skalárním součinem a f : V → V je lineární zobrazení. Pak f je ortogonální právě, když v některé ortonormální bázi (a pak už všech) má matici A splňující ¯AT = A−1. Skutečně, jestliže zachovává f velikosti, musí mít uvedenou vlastnost v každé ortonormální bázi. Naopak, předchozí výpočet ukazuje, že vlastnost matice v jedné bázi už zaručuje zachovávání velikostí. Skalární součin a dualita Kolmé projekce Rozklad ortogonálních zobrazení Důsledkem této věty je také popis všech matic přechodu S mezi ortonormálními bázemi. Každá totiž musí zadávat zobrazení Kn → Kn zachovávající velikosti a splňují tedy také právě podmínku S−1 = ¯ST . Při přechodu od jedné ortonormální báze ke druhé se tedy matice ortogonálního/unitárního zobrazení mění podle vztahu (v reálném případě je S∗ = ST ) A = S∗ AS. Skalární součin a dualita Kolmé projekce Rozklad ortogonálních zobrazení Invariantní podprostory Nechť f : V → V je lineární a předpokládejme, že pro nějaký podprostor W ⊂ V platí f (W ) ⊂ W . Říkáme, že W je invariantní podprostor pro zobrazení f . Jestliže je V konečněrozměrné a vybereme nějakou bázi (u1, . . . , uk) podprostoru W , můžeme ji vždy doplnit na bázi (u1, . . . , un) celého V a v každé takové bázi má naše zobrazení matici A tvaru A = B C 0 D (1) kde B je čtvercová matice dimenze k, D je čtvercová matice dimenze n − k a C je matice typu n/(n − k). Naopak, jestliže existuje v nějaké bázi matice zobrazení f tvaru (1), je W = u1, . . . , uk invariantní podprostor zobrazení f . Skalární součin a dualita Kolmé projekce Rozklad ortogonálních zobrazení Extrémní případy jsme viděli při hledání báze z vlastních vektorů. V případě existence n různých vlastních čísel zobrazení f jsme dostali rozklad V na přímý součet n vlastních podprostorů a v bazích z vlastních vektorů má naše zobrazení diagonální tvar s vlastními čísly na diagonále. Zároveň jsme viděli dva různé příklady důvodů, proč zobrazení diagonální matici mít nemusí. První souvisel s nilpotentními zobrazeními, druhý s rotacemi v dvourozměrných podprostorech. Skalární součin a dualita Kolmé projekce Rozklad ortogonálních zobrazení Rozklad ortogonálního/unitárního zobrazení Nechť je zobrazení f : V → V ortogonální, s maticí A v nějaké ortonormální bázi. Jestliže pro libovolný podprostor W ⊂ V a ortogonální zobrazení f : V → V platí f (W ) ⊂ W , pak také platí pro všechny v ∈ W ⊥, w ∈ W f (v), w = f (v), f ◦ f −1 (w) = v, f −1 (w) = 0 protože i f −1(w) ∈ W . To ale znamená, že také f (W ⊥) ⊂ W ⊥. Theorem Ortogonální doplněk k invariantnímu podprostoru je také invariantní. Skalární součin a dualita Kolmé projekce Rozklad ortogonálních zobrazení Pro unitární prostory už toto tvrzení zaručuje existenci báze z vlastních vektorů! Skutečně, zúžení unitárního zobrazení f na ortogonální doplněk invariantního podprostoru je opět unitární zobrazení, takže můžeme do báze přibírat jeden vlastní vektor za druhým, až dostaneme celý rozklad V . Kdyby byla vlastní čísla ortogonálního, dostali bychom stejný výsledek také. Nicméně většinou nejsou vlastní čísla ortogonálních zorbazení reálná. Musíme si proto pomoci opět výletem do komplexních vektorových prostorů. Theorem Nechť f : V → V je ortogonální zobrazení na prostoru se skalárním součinem. Pak všechny kořeny charakteristického polynomu f mají velikost jedna a existuje rozklad V na jednorozměrné vlastní podprostory odpovídající vlastním číslům λ = ±1 a dvourozměrné podprostory Pλ,¯λ, na kterých působí f rotací o úhel rovný argumentu komplexního čísla λ. Všechny tyto různé podprostory jsou po dvou ortogonální. Skalární součin a dualita Kolmé projekce Rozklad ortogonálních zobrazení Náznak důkazu Jestliže považujeme matici A za matici lineárního zobrazení na komplexním prostoru Cn (která je jen shodou okolností reálná), budeme mít právě n kořenů charakteristického polynomu, včetně jejich algebraické násobnosti. Navíc, protože charakteristický polynom zobrazení bude mít výhradně reálné koeficienty, budou tyto kořeny buď reálné, nebo půjde o dvojice komplexně sdružených kořenů λ a ¯λ. Příslušné vlastní vektory v Cn k takové dvojici vektorů budou také komplexně sdružené, protože budou řešením dvou komplexně sdružených systémů lineárních rovnic. Skalární součin a dualita Kolmé projekce Rozklad ortogonálních zobrazení Označme vλ vlastní vektor příslušný k vlastnímu číslu λ = α + iβ, β = 0. Reálný vektorový podprostor Pλ generovaný reálnou a imaginární částí xλ = re vλ, yλ = im vλ je zjevně invariantní vůči násobení maticí A a dostáváme A · xλ = αxλ − βyλ, A · yλ = αyλ + βxλ. To ale neznamená nic jiného, než že zúžení našeho zobrazení na Pλ je dáno složením rotace o argument vlastní hodnoty λ (úhel arccos α√ α2+β2 ) s násobením velikostí vlastní hodnoty λ (skalárem α2 + β2). Protože naše zobrazení zachovává velikosti, musí být velikost vlastní hodnoty λ rovna jedné. Skalární součin a dualita Kolmé projekce Rozklad ortogonálních zobrazení Example V dimenzi tři má charakteristický polynom alespoň jeden reálný kořen, kterým musí být buď jednička nebo mínus jednička. Další dva musí být opět ±1 nebo dva komplexně sdružené nereálné. V posledním případě zadává vlastní vektor odpovídající reálnému vlastnímu číslu osu rotace o argument vlastního čísla druhého. Pokud je reálné vlastní číslo −1, bude navíc ještě uplatněno zrcadlení podle roviny rotace. Uvažme tedy zobrazení s maticí ve standardní bázi f : R3 → R3 , A =   0 0 1 0 1 0 −1 0 0   . Dostaneme polynom −λ3 + λ2 − λ + 1 = −(λ − 1)(λ2 + 1) s kořeny λ1 = 1, λ = i a ¯λ = −i. Pochopitelně matice zadává rotaci o devadesát stupnů podle osy y.