Ortogonální pod oooooooooo Matematika I - 9. přednáška Euklidovské prostory, skalární součin Michal Bulant Masarykova univerzita Fakulta informatiky 1. 4. 2009 □ S Obsah přednášky Q Euklidovské prostory Q Vektorové prostory se skalárním součinem Ortogonální podmnožiny a podprostory • Ortogonální matice • Gram-Schmidtův ortogonalizační proces □ s Doporučene zdroje • Martin Panák, Jan Slovák - Drsná matematika, e-text. • Roman Hilscher - MB101, e-text. • Slidy z přednášek a democvičeni □ s - Doporučene zdroje • Martin Panák, Jan Slovák - Drsná matematika, e-text. • Roman Hilscher - MB101, e-text. • Slidy z přednášek a democvičení • Pavel Horák, Úvod do lineárni algebry, MU Brno, skripta (http://www.math.muni.cz/~horak) • Luboš Motl, Miloš Zahradník, Pěstujeme lineární algebru, 3. vydání, Univerzita Karlova v Praze, Karolinum, 348 stran (elektronické vydání také na http://www.kolej.mff.cuni.cz/~lmotm275/skripta/). Plan přednášky Q Euklidovské prostory :ory se skalárním Ortogonální podmnožiny a podprostory • Ortogonální matice • Gram-Schmidtův ortogonalizační proces n S - = -E -00*0 Euklidovské prostory Do vektorového prostoru (Rn, +, •) nyní doplníme další strukturu, abychom dokázali odvodit více informací např. o vzájemné poloze vektorů, podprostoru, délce, vzdálenosti, úhlech, atd. Budeme zkoumat otázky typu • Jak daleko leží nějaký bod od podprostoru? Euklidovské prostory Do vektorového prostoru (Rn, +, •) nyní doplníme další strukturu, abychom dokázali odvodit více informací např. o vzájemné poloze vektorů, podprostoru, délce, vzdálenosti, úhlech, atd. Budeme zkoumat otázky typu • Jak daleko leží nějaký bod od podprostoru? • Který bod v podprostoru je nejblíže k nějakému zvolenému bodu (který leží mimo tento podprostor)? Skalární součin Již dříve jsme definovali skalární součin dvou vektorů u, v G M" jako číslo u ■ v = U\ ví -\--------\- unvn. (To lze zapsat i pomocí maticového násobení jako uT ■ v, pokud chápeme vektory v R" jako sloupcové vektory.) Evidentně platí vztah symetrie u ■ v = v ■ u. □ s - Skalární součin Již dříve jsme definovali skalární součin dvou vektorů u, v G R" jako číslo u ■ v = U\ ví -\--------\- unvn. (To lze zapsat i pomocí maticového násobení jako uT ■ v, pokud chápeme vektory v R" jako sloupcové vektory.) Evidentně platí vztah symetrie u ■ v = v ■ u. Vektorový prostor R" s výše uvedeným skalárním součinem nazýváme Euklidovský (vektorový) prostor. Délka (též norma) vektoru u G R" je pak definována jako V u ■ u ui + + < Ortogonální pod oooooooooo Úhel mezi dvěma nenulovými vektory u, 1/ e K" je číslo ip G [0,7r] splňující u ■ v = \\u\\ \\v\\ cosíp, tj. cos

^. Rovnost přitom nastává, jsou-li zmíněné vektory lineárně závislé, tj. je-li x = 2t,y = 4ř, t G R, odkud t = ^ a (x,y) = (^, ^). □ S Kolmost vektoru Definice Řekneme, že vektory u a v jsou navzájem kolmé (též ortogonální), pokud je jejich skalární součin roven nule, tj. pokud u ■ v = 0. Píšeme u _L v. To zřejmě nastane pokud je jeden z těchto vektorů nulový vektor OgR" nebo pokud svírají tyto vektory pravý úhel, tj. cosip = 0. Kolmost vektoru Definice Řekneme, že vektory u a v jsou navzájem kolmé (též ortogonální), pokud je jejich skalární součin roven nule, tj. pokud u ■ v = 0. Píšeme u _L v. To zřejmě nastane pokud je jeden z těchto vektorů nulový vektor OgR" nebo pokud svírají tyto vektory pravý úhel, tj. cosip = 0. Příklad Kolmost vektoru Definice Řekneme, že vektory u a v jsou navzájem kolmé (též ortogonální), pokud je jejich skalární součin roven nule, tj. pokud u ■ v = 0. Píšeme u _L v. To zřejmě nastane pokud je jeden z těchto vektorů nulový vektor OgR" nebo pokud svírají tyto vektory pravý úhel, tj. cosip = 0. Příklad (a) Nulový vektor 0 G M" je kolmý na libovolný vektor u G (b) Vektory (2, -1) a (1,2) jsou kolmé. Kolmost vektoru Definice Řekneme, že vektory u a v jsou navzájem kolmé (též ortogonální), pokud je jejich skalární součin roven nule, tj. pokud u ■ v = 0. Píšeme u _L v. To zřejmě nastane pokud je jeden z těchto vektorů nulový vektor OgR" nebo pokud svírají tyto vektory pravý úhel, tj. cosip = 0. Příklad (a) Nulový vektor 0 G M" je kolmý na libovolný vektor u G I (b) Vektory (2, -1) a (1,2) jsou kolmé. (c) Vektory standardní báze e = (ei,..., e„) jsou navzájem kolmé, tj. e; _L e,- pro / ^ j. Kolmost vektoru Definice Řekneme, že vektory u a v jsou navzájem kolmé (též ortogonální), pokud je jejich skalární součin roven nule, tj. pokud u ■ v = 0. Píšeme u _L v. To zřejmě nastane pokud je jeden z těchto vektorů nulový vektor OgR" nebo pokud svírají tyto vektory pravý úhel, tj. cosip = 0. Příklad (a) Nulový vektor 0 G M" je kolmý na libovolný vektor u G M". (b) Vektory (2, -1) a (1,2) jsou kolmé. (c) Vektory standardní báze e = (ei,..., e„) jsou navzájem kolmé, tj. e; _L e,- pro / ^ j. (d) Normálový vektor N roviny p C R3 je kolmý na tuto rovinu, tj. na všechny vektory u ležící v rovině p. •t IS Kolmost podprostoru prostoru R" definujeme stejně jako kolmost jednotlivých vektorů, jen musí být příslušný skalární součin nulový pro všechny vektory z daných podprostoru. Definice Podprostory X a Y prostoru R" jsou navzájem kolmé (též ortogonální), pokud u _L v (tj. u ■ v = 0) pro všechny vektory u G X, v E Y. Definice Je-li Y podprostor Euklidovského prostoru R", potom se množina Y := {u G R", u -L v pro všechny vektory v G Y] nazýva ortogonální komplement (doplněk) podprostoru Y (v prostoru R"). Y1- je tedy množina všech vektorů, které jsou kolmé na všechny vektory v podprostoru Y. □ s Definice Je-li Y podprostor Euklidovského prostoru R", potom se množina Y± := {u G R", u -L v pro všechn y vektory v G Y] nazývá ortogoná ní komplement (doplněk) podprostoru Y (v prostoru R"). Y je tedy množina všech vektorů, které jsou kolmé na všechny vektory v podprostoru Y. Příklad ^ (a) Pro V = ■ nazýváme skalární součin (též vnitřní součin z angl. inner product) na prostoru V, pokud má následující vlastnosti: (i) je tzv. pozitivně definitní, tj. (u, u) > 0, přičemž (u, u) = 0 <ř» u = 0, (ii) je symetrické, tj. (u, v) = (v, u), (iii) je lineární v první složce, tj. {a • u + b • v, w) = a. {u, w) + b. {v, w). Ortogonální pod oooooooooo Příklad (a) V prostoru R" můžeme zvolit n (u, v) := u ■ v = 2_\ ui vi (obvyklý skalární součin), ;=i případně pro pevně zvolená kladná čísla w\,... ,wn lze n (u, v) := y^ wi Ui v/ (skalární součin s vahou w\,..., wn). ;=i -/'j Ortogonální pod oooooooooo Příklad (a) V prostoru R" můžeme zvolit n (u, v) := u ■ v = 2_\ ui vi (obvyklý skalární součin), ;=i případně pro pevně zvolená kladná čísla w\,... ,wn lze n (u, v) := y^ wi Ui v/ (skalární součin s vahou w\,..., wn). ;=i (b) V prostoru Matmxn můžeme zvolit m n ;=i 7=1 Tj. vynásobíme prvky na stejných pozicích a výsledné součiny sečteme. Ortogonální pod oooooooooo Příklad (c) viz později v MB102 - v prostoru C[a, b] spojitých funkcí na intervalu [a, b] můžeme zvolit {f,g)-=J f(x)g(x)dx, případně pro vážený spojitou funkcí w{x) > 0. Ortogonální pod oooooooooo Příklad (c) viz později v MB102 - v prostoru C[a, b] spojitých funkcí na intervalu [a, b] můžeme zvolit (f,g) f(x) g(x) dx, případně pro vážený spojitou funkcí w{x) > 0. (d) Zvolme n + 1 různých bodů xo,xi, ...,x„Gl Potom v prostoru polynomů stupně nejvýše n můžeme zvolit (P,q) := J^p(x/)(7(x/). ;=o Případně opět váženo wq, w\, ..., wn. Ortogonální pod oooooooooo Příklad (c) viz později v MB102 - v prostoru C[a, b] spojitých funkcí na intervalu [a, b] můžeme zvolit (f,g) f (x) g(x) dx, případně pro vážený spojitou funkcí w{x) > 0. (d) Zvolme n + 1 různých bodů xo,xi, ...,x„Gl Potom v prostoru polynomů stupně nejvýše n můžeme zvolit n (P,q) := J^p(x/)(7(x/). Případně opět váženo m/o, wi,..., wn. (e) Na vektorovém prostoru všech funkcí f : R —> R skalární součin definovat nelze. (Dokonce zde nelze definovat ani normu, tj. prostor není ani tzv. normovaný prostor, viz dále.) Délka (norma) vektoru Definice Skalární součin (•,•) definuje přirozeným způsobem normu (též délku) každého vektoru u e V předpisem: VWüJ- □ s Délka (norma) vektoru Definice Skalární součin (•,•) definuje přirozeným způsobem normu (též délku) každého vektoru u e V předpisem: VWüJ- Příklad (a) V prostoru R" s obvyklým skalárním součinem je kde u = (xi,...,x„). Ml = V(u,u) = \lxl H------^xn> Tuto normu budeme nazývat Euklidovská norma prostoru a značit s indexem 2, tj. "2 *í + + Xn2. Ortogonální pod oooooooooo Příklad (b) Tzv. Frobeniova norma v prostoru MatmXn je definována jako ;=i 7=1 □ s Ortogonální pod oooooooooo Příklad (b) Tzv. Frobeniova norma v prostoru MatmXn je definována jako ;=i 7=1 (c) viz MB102 - tzv. /2-norma v prostoru C[a, b] je definována jako \f\\L*-=yfWJ) = \lfaf2(x)dx. □ s - = -=. -o<\(y Ortogonální pod oooooooooo Podobně jako v prostoru R" i v libovolném vektorovém prostoru se skalárním součinem platí Cauchyova nerovnost. Věta (Cauchy-Schwarzova) Je-li V vektorový prostor se skalárním součinem, potom pro libovolné dva vektory u, v G V platí \(u,v)\ < \\u\\ \\v\\, přičemž rovnost nastane právě když jsou vektory u a v lineárně závislé (tj. jeden z nich je násobkem toho druhého). □ s Ortogonální pod oooooooooo Podobně jako v prostoru R" i v libovolném vektorovém prostoru se skalárním součinem platí Cauchyova nerovnost. Věta (Cauchy-Schwarzova) Je-li V vektorový prostor se skalárním součinem, potom pro libovolné dva vektory u, v G V platí \(u,v)\ < \\u\\ \\v\\, přičemž rovnost nastane právě když jsou vektory u a v lineárně závislé (tj. jeden z nich je násobkem toho druhého). Definice Na základě Cauchyovy nerovnosti definujeme úhel (též odchylka) mezi dvěma vektory u a v jako číslo

■ R nazýváme norma (též délka), pokud má následující vlastnosti: (i) je tzv. pozitivně definitní, tj. INI — 0, přičemž 0 & u = 0, (ii) je pozitivně homogenní, tj. ||a.u|| = |a|.||u||, (iii) splňuje trojúhelníkovou nerovnost, tj. ||u + v\\ < \\u\\ + \\v\\. Ortogonální pod oooooooooo Norma na prostoru V tedy přiřazuje každému vektoru u G V (objektům z prostoru V) reálné číslo ||u||. Ověřte si, že norma definovaná pomocí skalárního součinu splňuje výše uvedené vlastnosti normy. Jak uvidíme níže, na některých vektorových prostorech lze definovat více (i nekonečně mnoho) různých norem || • ||, zatímco na jiných prostorech normu vůbec definovat nelze. Vektorový prostor V, na kterém je definována (nějaká) norma pak nazýváme normovaný vektorový prostor. □ s Ortogonální pod oooooooooo Norma na prostoru V tedy přiřazuje každému vektoru u G V (objektům z prostoru V) reálné číslo ||u||. Ověřte si, že norma definovaná pomocí skalárního součinu splňuje výše uvedené vlastnosti normy. Jak uvidíme níže, na některých vektorových prostorech lze definovat více (i nekonečně mnoho) různých norem || • ||, zatímco na jiných prostorech normu vůbec definovat nelze. Vektorový prostor V, na kterém je definována (nějaká) norma pak nazýváme normovaný vektorový prostor. Viděli jsme některé normy, které jsou na daném vektorovém prostoru indukovány skalárním součinem. Následující příklady jsou také normy na příslušných prostorech (ale tyto normy už nejsou indukovány skalárním součinem). □ s Ortogonální pod oooooooooo Příklad O V prostoru R" můžeme definovat např. následující normy: pro iy = (xi,...,xn)eMn Hli:=El tzv. 1-norma, ;=i \uWoo := max x; tzv. stemomerna norma, Kir J=i tzv. p-norma (pro p > 1). Norma || • H2 uvedená v předchozím příkladu je speciálním případem p-normy pro p = 2. Jako jediná je odvozena ze skalárního součinu. Norma || • ||i je zřejmě také p-norma pro p = 1. V prostorech s normou || • ||p s p 7^ 2 ale např. neplatí Pythagorova věta. Obdobně lze p-normu nebo stejnoměrnou normu definovat i pro prostor matic nebo spojitých funkcí. :ory se skalárním Ortogonální podmnožiny a podprostory • Ortogonální matice • Gram-Schmidtův ortogonalizační proces Ortogonální pod oooooooooo Ortogonální množina vektorů Definice Nechť V je vektorový prostor se skalárním součinem (•, •). Množina vektorů {u\,..., Uk} C V se nazývá ortogonální množina vektorů, pokud u\ _L Uj pro všechny indexy / ^ j. □ s Ortogonální pod oooooooooo Ortogonální množina vektorů Definice Nechť V je vektorový prostor se skalárním součinem (•, •). Množina vektorů {u\,..., Uk} C V se nazývá ortogonální množina vektorů, pokud u\ _L Uj pro všechny indexy / ^ j. Nechi V je vektorový prostor se skalárním součinem (■, ■). Potom jsou nenulové vektory v libovolné ortogonální množině prostoru V lineárně nezávislé. □ s Ortogonální pod oooooooooo Ortogonální množina vektorů Definice Nechť V je vektorový prostor se skalárním součinem (•, •). Množina vektorů {u\,..., Uk} C V se nazývá ortogonální množina vektorů, pokud u\ _L Uj pro všechny indexy / ^ j. Nechi V je vektorový prostor se skalárním součinem (■, ■). Potom jsou nenulové vektory v libovolné ortogonální množině prostoru V lineárně nezávislé. Důkaz. Snadný: je-li {u\,..., Uk} C V ortogonální, pak z a\ u\ + ■ ■ ■ + 3k Uk = 0 dostaneme skalárním vynásobením s vektorem Uj (pro libovolné j) a\ (ui, Uj)-\--------h aj {uj, Uj)-\--------h ak {uk, uj) = (0, uj) = 0, a tedy a-, \\u;\\2 = 0, odkud a-, = 0. D Ortogonální pod oooooooooo Definice Ortogonální množina vektorů {u\,..., Uk} C V se nazývá ortonormální množina, pokud mají všechny vektory u-, velikost 1, ti. Ikll = 1. □ S Ortogonální pod oooooooooo Definice Ortogonální množina vektorů {u\,..., Uk} C V se nazývá ortonormální množina, pokud mají všechny vektory u-, velikost 1, ti. Ikll = 1. Poznámka Zřejmě platí jednoduché tvrzení, že z každé ortogonální množiny lze vytvořit množinu ortonormální, protože stačí každý vektor znormalizovat, tj. místo množiny {u\,..., Uk} C V vzít množinu "i Ul,..., \uk\ Uk □ s Ortogonální pod oooooooooo Příklad (Fourierova analýza) Ve vektorovém prostoru C[—L, L] uvažujme skalární součin 1 fL 1 (f,g) := — \ f(x) -g{x) dx tj. váhová funkce je w{x) = -. L J-L L Potom množina funkcí rmx rmx {-=, cos — , sin—, n = 1,2,3,...) V2 tvoří ortonormální množinu. □ s Ortogonální pod oooooooooo Ortonormální báze Proč je výhodné pracovat ve vektorovém prostoru se skalárním součinem s ortonormální bází ukazují následující tvrzení. Je-li ti = (ui,..., un) ortonormální báze vektorového prostoru V, potom jsou souřadnice libovolného vektoru w G V v bázi li dány pomocí skalárního součinu vektoru w s bázovými vektory u,, tj. Mu = (ai,...,an)T, kde 3i (w,uí), V/ = l,.... n. □ s - Ortogonální pod oooooooooo Ortonormální báze Proč je výhodné pracovat ve vektorovém prostoru se skalárním součinem s ortonormální bází ukazují následující tvrzení. Je-li ti = (ui,..., un) ortonormální báze vektorového prostoru V, potom jsou souřadnice libovolného vektoru w G V v bázi li dány pomocí skalárního součinu vektoru w s bázovými vektory u,, tj. [w\u_ = (ai,...,an)T, kde 3i (w,uí), V/ = l,...,n. Důsledek Skalární součin dvou libovolných vektorů v, w G V, kde dim V = n, je roven skalárnímu součinu vektorů jejich souřadnic (v R"J vzhledem k nějaké ortonormální bázi li prostoru V, tj. {v,w)V = {[v]u,[w]u)s.n. Ortogonální matice Definice Čtvercová matice Q řádu sloupce tvoří ortonormální QTQ = n je ortogonální množinu vektorů /, tj. Q-1 = matice vR", -QT. , pokud její tj. pokud platí < □ s Ortogonální matice Definice Čtvercová matice Q řádu sloupce tvoří ortonormální QTQ = n je ortogonální množinu vektorů /, tj. Q-1 = matice vR", -QT. , pokud její tj. pokud platí Poznámka Ze vztahu QTQ = I plyne, že každá ortogonální matice je regulární a že determinant každé ortogonální matice je buď 1 nebo —1, neboť 1 = 1/1 = \QTQ\ = |Qr|.|Q| = |Q|2. Ortogonální o«oooooo Příklad (a) Matice rotace vťo úhel ip v kladném směru Q cos (p — s\np s\np cos p je ortogonální matice a tedy platí Q-1 = QT = ( cosip siniP\ s\r\p cosp) ' Ortogonální o«oooooo Příklad (a) Matice rotace vťo úhel ip v kladném směru Q cos (p — s\np s\np cos p je ortogonální matice a tedy platí Q"1 = QT = (b) Tzv. permutační matice jsou ortogonální, např. cosp s\np -sin(/? cosp 0 1 1 0 1 0 0\ /O 0 1 0 0 1, 0 10 0 1 0/ \1 0 0 /O 0 0 1\ 0 10 0 10 0 0 \o 0 1 o/ Permutační matice vzniknou z jednotkové matice / tak, že se r\röh^7/-iii löir r^HU\/ ínůhn cl/~ii i r\/-ö í B Je-li Q ortogonální matice řádu n, potom platí {Qx, Qy) = -- (x,y) pro všechny vektory x jGR", \\Qxh = z IWI2 pro všechny vektory x G M". Důkaz. Plyne snadno z předchozích tvrzení. □ s - = ■€. -o<\(y Ortogonální pod oo«ooooooo B Je-li Q ortogonální matice řádu n, potom platí {Qx, Qy) = -- (x,y) pro všechny vektory x jgR", \\Qxh = z IWI2 pro všechny vektory x el". Důkaz. Plyne snadno z předchozích tvrzení. Poznámka Z předchozího plyne jako velmi speciální případ intuitivně zřejmé tvrzení, že rotací v R2 se nemění délka vektorů. n S - = -E -00*0 Projekce vektoru na podprostor Necht W je podprostor vektorového prostoru V a necht je dán vektor v E V. Je-li u_ = (u\,... ,Uk) ortonormální báze pod prostoru W, potom má vektor p E W, který je nejblíže k vektoru v, tvar p = a\ ■ u\ H--------Y ak- uk-, Platí tedy, že kde (v,uí), i = l,...,k. Ortogonální pod oooo»ooooo Protože je V = W © W-1, můžeme vektor v napsat jediným způsobem jako součet v = p + w, kde p G W, we W^. Protože jsou bázové vektory u-, G W, je u-, _L w, tj. (uj, w) = 0 V/ = 1,..., k. Ortogonální pod oooo»ooooo Protože je V = W © W-1, můžeme vektor v napsat jediným způsobem jako součet v = p + w, kde p G W, we W^. Protože jsou bázové vektory u-, G W, je u-, _L w, tj. (uj, w) = 0 V/ = 1,..., k. Na druhou stranu, vektor p G W můžeme vyjádřit jako lineární kombinaci bázových vektorů u\,..., u^, tj. p = a1u1-\--------\-akuk, odkud již plyne vztah (v, u i) = (p, u i) + (w, u i) = a\ (ui, u i) H--------h ak (uk, u i) =o a i (uí, u i) a; u; V/ = 1,..., k. Poznámka Z důkazu plyne, že pokud by báze podprostoru 1/1/ nebyla ortonormální, ale jen ortogonální, potom pro koeficienty a,- ve vyjádření projekce p platí a; (v, U i) (v, U i) (u;,U;) \\u;\\2 Tedy projekce p vektoru v na podprostor 1/1/ je pak tvaru (v,ui) , , (v,uk) P = 7--------r • ui + • • • + t--------r • uk. {Ul,Ul) {Uk,Uk) □ s Vzdálenost a odchylka vektoru od podprostoru Definice Číslo v(v, 1/1/) := ||v — p\\ nazýváme vzdálenost vektoru v od podprostoru 1/1/. Odchylka vektoru v od podprostoru 1/1/je definována jako úhel, který svírá vektor v se svou projekcí p na podprostor 1/1/, tj. je to úhel